РОССИЙСКАЯ АКАДЕМИЯ НАУК Институт проблем управления им. В.А. Трапезникова
УПРАВЛЕНИЕ БОЛЬШИМИ СИСТЕМАМИ СБОРНИК ТРУДОВ
Выпуск 11
Общая редакция – Д.А. Новиков
Москва – 2005
УДК 007 ББК 32.81 У 67 У 67
Управление большими системами / Сборник трудов. Выпуск 11. Общая редакция – Д.А. Новиков. М.: ИПУ РАН, 2005. – 126 с.
В сборнике представлены статьи ученых, специализирующихся в области разработки и внедрения моделей
и
методов
управления
социально-
экономическими системами.
Утверждено к печати Редакционным советом Института
Ó ИПУ РАН, 2005
СОДЕРЖАНИЕ Владиславлев П.Н. Выбор оптимального сценария поведения организационных систем............................................................5 Воронина И.Д. Оптимизационная модель факторов деятельности организационной системы........................................................14 Ермаков Н.С., Иващенко А.А. Рефлексивные модели репутации и норм деятельности.................................................................21 Иващенко А.А., Рыбченко Н.Е. Манипулирование в механизмах распределения корпоративных ресурсов...........................................................36 Заложнев А.Ю., Клыков А.Ю. О распределении финансового результата между центром затрат и центрами прибыли…...........……51 Маркаров Д.А. Частная задача оптимизации сроков при управлении проектами........................................................53 Мишин С.П. Оптимальность «конвейерной» иерархии управления...........60 Рожихин П.В. Оценка мощности пространства состояний иерархической структуры........................................................75
3
Старостенко В.В. Об одной игровой модели ценообразования активов на фондовом рынке....................................................................81 Тараканов Ю.М. Проблемы управления безопасностью проекта.....................92 Харитонов И.М. Методология структурного анализа и проектирования (SADT) как инструмент описания системы дистанционного образования.................................................111 СВЕДЕНИЯ ОБ АВТОРАХ....................................................126
4
ВЫБОР ОПТИМАЛЬНОГО СЦЕНАРИЯ ПОВЕДЕНИЯ ОРГАНИЗАЦИОННЫХ СИСТЕМ Владиславлев П.Н. (Институт проблем управления РАН, Москва)
[email protected] Введение В статье решаются задачи формирования базовой сети Петри, построения алгебры событий, инициирующих переходы сети (включая равносильные преобразования событий), разработки метода пометки позиций и переходов базовой сети Петри, формирования множества сценариев поведения системы и выбор среди них оптимального сценария. 1. Базовая сеть Петри В базовой сети Петри [1] позиции f i Î F = { f1 ,..., f m } соответствуют операциям процесса, реализуемого в системе, а переходы t i Î T = {t1 ,..., t m } – событиям (фактам) смены операций. Позиции изображаются кружками, переходы – планками. От кружков к планкам и от планок к кружкам могут проводится направленные дуги. В позицию f i помещается маркер ( fi = 1 ) при выполнении соответствующей операции, маркеры могут перемещаться между позициями в результате «срабатывания» переходов. Если операция не активизирована, то позицию f i оставляем пустой ( f i = 0 ). Размещение маркеров по позициям f i определяет маркировку сети Петри, в базовой сети задается начальная и конечная (конечные) маркировки. Пример базовой сети Петри с начальной маркировкой f 1 = 1 и конечной f 8 = 1 дан на рис.1.
5
f1 f2
f2
f6
t1
t2
t7
f3 t3
t4
f4 f5
f7
t5
f8 t8
Сценарии работы системы
q1 = t1t 2t 7 t8 q2 = t1t3t5t7 t8
t6
q3 = t1t 4t 6t7 t8
Рис. 1. Базовая сеть Петри 2. Алгебра событий События
будем
выражать
булевыми
переменными
si , i Î {1,..., l}, принимающими единичное значение в моменты t si
наступления события и нулевое значение во все остальные моменты времени. Формулы событий строятся на базе выражений вида x1 (=, <, >) x2 , называемых элементарными сравнениями, где
x1 , x2 – числовые переменные, одна из которых может быть константой. Элементарные сравнения связываются в формуле «событийными» отношениями, набор которых (установленный из опыта) приведен в табл.1. В строках табл.1 для отношений И, ИЛИ, НЕ показано, что множества моментов наступления событий-результатов определяются соответственно пересечением, объединением и дополнением аналогичных множеств для исходных событий, {t} – множество всех моментов на временной шкале. Отношения предшествования (следования) отображают ситуацию, когда текущий момент t наступает одновременно или позже (раньше) момента наступления события si (моменты появления событий отмечены жирными точками). Отношение «Интервал» формирует отрезок временной шкалы {t} , ограниченный моментами 6
появления событий s1 и s2 , а отношение «Счет» – отрезок {t} , ограниченный моментами k-го и k+1-го появления si , k = 1,..., p . Наконец, отношение «Задержка» сдвигает момент появления si вправо по временной оси на w единиц. Заметим, что набор базовых отношений (табл. 1) является открытым и может быть дополнен. Таблица 1 Отношения на множестве событий Наименование отношения Логическая связка И (конъюнкция)
Логическая связка ИЛИ (дизъюнкция)
Формальное описание
Временной график
s = s1 Ù s2 {t s } = {t s1 } Ç {t s2 }
s = s1 Ú s2 {t s } = {t s1 } È {t s2 }
s = si
Логическая связка НЕ (отрицание)
{t s } = {t} \ {t si }
Предшествование
Q( si ) : t si £ t
Следование
R( si ) : t si > t I ( s1 / s2 ) :
Интервал
(t s1 £ t) Ù (t < t s2 ) = = Q( s1 ) Ù R( s2 ) 7
Наименование отношения
Формальное описание
Временной график
N k ( si ) : Счет
(t ksi £ t) Ù (t < t ksi+1 )
Задержка
D v ( si ) : t D = t si + v
Над формулами событий можно выполнять равносильные преобразования, приводящие к упрощению моделей поведения систем. «Событийные» отношения, представленные в табл.1, будем интерпретировать как операторы, отображающие булевы переменные si входных событий в булеву переменную s выходного (результирующего) события. Операторная формула – это выражение, полученное путем применения конечного числа раз к переменным si операторов Ù,Ú, , Q, R, I , N , D , согласно табл. 1. Пример операторной формулы: (1) s = ( s1 Ú I ( s1 / s2 ) Ù I ( s1 / s3 )) Ù ( s2 Ú s3 ) 3. Пометка позиций и переходов базовой сети Петри Пометка позиций определяется таблицей (когнитивной картой – табл. 2), строки f i которой соответствуют операциям, а столбцы
y j – показателям, которые изменяются при выполнении операций: уровням достижимости элементарных целей e1 ,..., eN * , затратам финансового ресурса
{
zфин и временного ресурса zврем , т.е.
}
y j Î e1 ,..., eN * , zфин , zврем . В работе принято, что показатели y j изменяются (а именно, возрастают) линейно, для каждой операции bij Î [0,1] , fi со своим коэффициентом линейности характеризующим скорость возрастания. 8
Таблица 2 Коэффициенты зависимости целевых и ресурсных показателей от продолжительности операций
ej
zфин
zврем
e1
e2
e3
e4
f1 f2 f3
+0.5
+1.0
+0.3
+1.0
+0.5
+0.4
+0.5
+0.1
+0.6
+0.3
+0.5
+0.3
+0.1
+0.1
f4 f5
+0.65
+0.7
+0.6
+0.9
+0.6
+0.5
+0.65
+0.7
+0.6
+0.9
+0.6
+0.5
fi
+0.2
f6
+0.1
+0.1
+0.1
f7
+0.1
+0.1
+0.1
f8
+0.1
+0.1
+0.1
На
пересечении
строки
fi
и
столбца
yj
таблицы
проставляется значение коэффициента b ij , задаваемое экспертом. Переходы базовой сети Петри помечаются формулами алгебры событий (раздел 2) на основе метода, исходящего из сопоставления каждого сценария работы системы последовательности переходов на базовой сети Петри, ведущей из ее начальной маркировки в конечную маркировку. Например для базовой сети на рис. 1 имеем три сценария: q1 = t1t 2t7 t8 , q2 = t1t3t5t7 t8 , q3 = t1t 4t6t7 t8 . Для каждого сценария qk для каждого показателя y j строим шкалу изменения значений y j так как показано в табл. 3. На шкале целей
e1 ,..., eN *
наносим
точки
уровней
достижимости,
определяемые оптимальной альтернативой, выбранной при целеполагании [2]; на шкалы zфин , zврем наносим допустимые точки затрат ресурсов. Далее на каждой шкале y j размещаем пометки 9
переходов ti , принадлежащих сценарию qk , в точках, которые по мнению эксперта соответствуют y j в момент срабатывания ti . Таблица 3 К пометке переходов базовой сети Петри
yj qk
e1
e2
e3
e4
zфин
zврем
q1
q2
q3
На основании полученных данных определяются условия срабатывания переходов. Например, для перехода t1 получаем формулу события:
st1 = (e1 ³ 0,6) Ù (e2 ³ 0,3) Ù (e3 ³ 0,5) Ù (e4 ³ 0,5) Ù ( z фин £ 1000) Ù ( z врем £ 500)
где e1 ,..., eN * , zфин , zврем в условных единицах. 10
4. Выбор оптимального сценария Для
каждого
сценария
нарастания показателей
qk = t k1 ,..., t kl
строим
графики
y j на «модельной» шкале времени
t = 0,1,..., T . Графики отображают кусочно-линейные функции. Для начального момента t = 0 принимаем y (0) = 0 . Пусть переход tk1 запускает операцию f h , которая завершается при наступлении события
s (t k2 ) . Переход tk1
срабатывает в момент t k1 . Определим момент t k 2 срабатывания перехода tk 2 . Для этого в системе координат t - y вводим точку
(t k1 , y (t k1 ))
и
из
нее
проводим
линию
y (t) = y (t k1 ) + b h j × (t - tk1 ) , где b h j – коэффициент линейности для операции f h и показателя y j см раздел 3, t ³ t k1 . Момент t k 2 определяется точкой на этой линии, для которой s (t k2 ) = 1 . Процедуру повторяем для t ki следующего перехода сценария qk и т.д. Если сценарий содержит параллельные операции (на рис. 1 сценарий q3 операции f 4 , f 5 ), то соответствующие им участки графика суммируются. Пример графика возрастания показателя y дан на рис. 2. На основе построенных графиков для каждого сценария определяются значения y max (qk ) . j Выбор оптимального сценария производится по критериям достижения максимального уровня целей и минимальных затрат (финансового и временного ресурсов). Для этого формируем интегральные показатели уровня достижимости целей и уровня затрат, соответственно: N*
N **
j =1
r =1
I E = å ue j × we j , I Z = å zr × wr , где ue j – уровень достижимости цели e j , we j – вес цели e j , zr – затраты ресурса r , wr - вес ресурса r . Строим Парето диаграмму 11
IE , IZ . Оптимальным является сценарий для которого I E = max, I Z = min . (рис. 3)
для
сценариев
qk
в
системе
координат
Рис. 2. График возрастания показателя y
Рис. 3. Парето-диаграмма, определяющая выбор оптимального сценария 12
В рассматриваемом примере получаем оптимальный сценарий
q3 = t1t4t6t7t8 . Литература 1. ПИТЕРСОН ДЖ. Теория сетей Петри и моделирование систем. Пер. с англ. М.: Мир, 1984. – 263 с. 2. ЮДИЦКИЙ С.А., ВЛАДИСЛАВДЕВ П.Н. Основы предпроектного анализа организационных систем. М.: Финансы и статистика, 2005. – 128 с.
13
ОПТИМИЗАЦИОННАЯ МОДЕЛЬ ФАКТОРОВ ДЕЯТЕЛЬНОСТИ ОРГАНИЗАЦИОННОЙ СИСТЕМЫ Воронина И.Д. (Волгоградский государственный университет, Волгоград)
[email protected] Введение Динамичность организационных систем (ОС) является наблюдаемым свойством, однако разнообразие типов эмпирических и аналитических моделей социально-экономической динамики говорит скорее о неразвитости ее специфического аналитического и методологического аппарата, нежели о богатстве ее содержания. Препятствием в использовании традиционного аппарата динамики в ОС является наличие в них ряда взаимодействующих (и поэтому изменяющихся) иерархически-сетевых структур: организационной, функциональной, управленческой, и др. В то же время основой наиболее распространенного динамического подхода к ОС – факторного – является неизменность состава и структуры факторов ОС, что неявно предполагает неизменность и всех остальных ее структур (изменение факторной структуры происходит только путем введения в нее внешних управляющих факторов). Кроме того, степень достоверности эмпирической факторной модели существенно понижается отсутствием в ней объективных закономерностей межфакторного взаимодействия и статистически значимого количества достоверных данных. Разновидностью факторного подхода, используемой, в основном, в экономических системах, является теория факторов производства. Ограничением ее результативности является обоснование вида производственной функции (ПФ). Платой за облегчающую математический анализ высокую агрегированность модели (предельную в двухфакторной модели Кобба-Дугласа) является понижение ее реальной полезности. Более тонкий анализ сталкивается с труднопреодолимой проблемой введения универсальной меры большого числа эмпирически определяемых факторов производства и обоснования вида ПФ. 14
1. Факторы деятельности ОС любого масштаба и специфики – от организаций до социумов – имеют главную общую характеристику: их гомеостатической основой является преобразующая деятельность людей, поэтому в них можно выделить специфические факторы – факторы деятельности. Эти факторы, будучи причинами, ресурсами и условиями деятельности, в то же время являются и ее результатами (продуктами). Формируясь в организационно-функциональной структуре ОС, они ее же и формируют. Эту двойственность фактора-ресурса и фактора-продукта деятельности, несущественную в ее единичном акте, можно положить в основу анализа основных (кратковременных – динамических и долговременных – эволюционных) свойств ее самовоспроизводства. Структура факторов деятельности или «Ядро развития» [1, 2] может быть представлена в виде иерархического графа, высший уровень которого образован двумя макрофакторами: трансформационным (TF), и трансакционным (TA), каждый из которых в свою очередь образован факторными тройками следующего уровня. Первый – природным, человеческим, техническим; второй – институциональным, информационным, организационным. Гармоничное сочетание этих факторов или их системное единство приводит к максимальному усвоению каждого из них в продукте и, тем самым, максимизирует эффективность последней в любом ее масштабе – от элементарного единичного акта до воспроизводства социальноэкономической системы в целом. Эта гармоничность или самосогласованность факторной системы, которую условно можно назвать факторным равновесием, является свойством, определяющим в условиях непрерывного изменения факторных элементов – продуктов деятельности – главные закономерности функционирования и развития ОС любого вида и масштаба. Другой закономерностью деятельности ОС вследствие ее открытости является разрушение достигнутого равновесия, поэтому в целом динамику факторов деятельности ОС можно представить как цепь последовательных флуктуаций, уводящих ее из положения факторного равновесия, и релаксаций, возвращающих ее к (уже новому) равновесному состоянию. Факторное равновесие является точкой максимума ПФ в рамках замкнутой модели (постоянной величины общего фактор15
ного ресурса). Поскольку признаком факторного равновесия в замкнутой модели является максимизация ПФ, динамической модели, очевидно, должна предшествовать соответствующая оптимизационная модель. Объективной трудностью является отсутствие (или, во всяком случае, неочевидность) «естественных» оснований для определения состава и универсальной меры факторов деятельности, поэтому представляется разумным вводить их определение на основе «естественных» параметров оптимизационной модели. 2. Система функциональных преобразователей Наличие определяемой внешней институциональной средой объективной меры (стоимости) TF-факторов деятельности ОС не вызывает сомнений, тогда как вопрос о величине ее TA-факторов остается открытым. Для решения этой проблемы в рамках нашей модели отделим деятельность, протекающую в неизменных условиях по заданной неизменной технологии и потому не требующую трансакций (являющихся основой управления), от адаптации этой же деятельности к изменению условий (от управления ею). Это означает, что в нашей модели TA-факторы образуют систему управления, а TF-факторы – собственно производящую часть ОС. Итак, пусть задана единая скалярная мера TF-факторов. Введем понятие функционального преобразователя (ФП), преобразующего совокупность TF-факторов-входов в один из TF-факторов-выходов. Содержательная специфика и технология производства выходной функции предполагаются заданными. Меру входов и выходов согласуем так, что при равенстве входов величина выхода максимальна и равна сумме входов. Участие TA-факторов в деятельности ФП в нашей модели будет определяться его структурой. Простой функциональный элемент. Основным структурным элементом ФП будем считать простой функциональный элемент (ПФЭ), величина выходной функции F которого определяется формулой (1) F = 3 min (Фj) (j = 1, 2, 3),
16
ПФЭ, очевидно, не обеспечивает взаимозаменяемости факторов, и излишки факторных потенциалов утрачиваются. Это происходит из-за отсутствия в его деятельности TA-факторов. Предположим, что невостребованная часть TF-факторов может направляться в другие ПФЭ, что может быть использовано для обеспечения максимальной величины выхода ФП вдали от равновесия путем построения его структуры из ПФЭ. На рис. 1. показаны структурные схемы ПФЭ, ФП-1 и ФП-2, обеспечивающих максимально возможное в замкнутой модели значение выхода ФП, равное сумме входов. (Здесь и далее для наглядности используется двухфакторная модель, что не изменяет качественных результатов моделирования.) Величины оптимальных нормированных «факторных потоков» соответственно равны для ФП-1: АС=ВС=z, AF=1-z, BF=x-z, CF=2z, z=(1-x)/2, x >1/3; для ФП-2: AC=BC=z, AD=CD=2z, DF=4z, BF=x-z, z=(1-x)/6, x>1/7. (Для наглядности симметричная структура заменена односторонней, реализующей один из вариантов неравновесности.) ПФЭ А
1
ФП-1 х
F=2х
В
А
1
ФП-2 х
F=1+х
В
А
1
х
С В
В
С В D В F=1+х
Рис. 1. На рис. 2 показаны сечения F плоскостью постоянной суммы TF-факторов для ПФЭ, ФП-1, ФП-2 и (для сравнения) ПФ КоббаДугласа с показателем ½ . Для ФП-1 и ФП-2 ломаные обозначают верхнюю границу допустимого множества и отвечают случаю оптимальных «факторных потоков».
17
F
ФП-1
ФП-2
ПФ Кобба-Дугласа
ПФЭ
1/7
1/3
1/2
1
Рис. 2. Таким образом, устойчивость максимального выхода ФП при неустойчивости оптимального баланса TF-факторов может быть достигнута за счет усложнения его структуры (вспомогательной деятельности), определения и организации оптимального «потока» TF-факторов на структуре, т.е. – в результате действия системы управления или TА-факторов. (Зависимость от управления – главная характеристика сложного ФП, поскольку, как нетрудно видеть, его минимальное гарантированное значение выхода, начиная с некоторого уровня сложности, при любом сочетании TF-факторов равно нулю.) И наоборот, высокая надежность обеспечения TFфакторов (стабильность внешней среды) приводит к большей эффективности ПФЭ по сравнению с более сложными ФП. В связи с тем, что работа системы управления обеспечивается также TF-факторами, возникает задача их оптимального распределения между производством и управлением для максимизации выхода ФП. Для упрощения модели далее будем использовать оптимизационный принцип минимального гарантированного результата (МГР). Погрешность в величине потока TF-факторов складывается из погрешностей их измерения и реализации. Первую можно связать с величиной информационного фактора вторую – с величиной организационного. Указанные погрешности можно считать обратно пропорциональными величине выходной функции соответствующих специализированных ФП, также построенных по приведенной 18
выше схеме. Учет затрат и погрешностей управления приводит к «опусканию» верхнего основания трапеции («плато» идеального управления) на рис.2, сужению ее основания, появлению «коридора реальных значений», нижняя граница которого, также имеющая вид трапеции, дает оценку МГР. Вариация распределения TFфакторов на производство и управление, а также структуры их ФП приводит к семейству Парето-оптимальных структур и соответствующих оптимальных «факторных потоков». Их схематический вид приведен на рис. 3. F
1
Рис. 3. Дальнейший отбор решений может производиться на основе каких-либо неучтенных критериев, в частности, на основе критериев институциональности внешней среды. В рамках нашей модели внешняя для ОС институциональность проявляет себя, в частности, в зависимости совокупного дохода ФП от его выходной функции, а также в ограничениях ее минимального значения и степени неравновесности TF-факторов (на рис. 3. эти ограничения принимают вид горизонтальной и двух вертикальных линий-ограничителей). Эти критерии производят окончательный отбор множества институциональных и Парето-оптимальных структур ФП. Здесь возникают понятия институциональной сбалансированности внешней среды, допускающей существование решений, и уровня институциональности, при высоком значении которого в число институ19
ционально допустимых попадают наиболее эффективные структуры. Наконец, система управления ФП определяет тип входящих его структуру в него элементов: она может состоять только из ПФЭ или допускать сложные ФП. Это определяет внутреннюю институциональность ОС и влияет на ее динамические характеристики. Моделирование управления ОС, определяющего, в частности, правила изменений ее факторной структуры, является предметом дальнейших исследований. Литература 1. ИНШАКОВ О.В. «Ядро развития» в контексте новой теории факторов производства // Экономическая наука современной России, 2003. С.11 – 25. 2. ВОРОНИНА И.Д., ЕГОРОВ Е.А. Факторный подход к управлению развитием социальных систем регионального уровня // Сборник трудов «Управление большими системами». Выпуск 6. Общ. ред. – Д.А. Новиков. М: ИПУ РАН, 2004. С. 22 – 32.
20
РЕФЛЕКСИВНЫЕ МОДЕЛИ РЕПУТАЦИИ И НОРМ ДЕЯТЕЛЬНОСТИ Н.С. Ермаков, А.А. Иващенко1 (Самарский государственный аэрокосмический университет, Московский физико-технический институт) 1. Введение Настоящая работа посвящена теоретико-игровым моделям репутации и норм деятельности, учитывающих рефлексию участников. Приведем определения основных понятий. Репутация – «создавшееся общее мнение о достоинствах или недостатках коголибо, чего-либо, общественная оценка» [10, c. 431]. Норма – «узаконенное установление, признанный обязательным порядок» [10, c. 338], общепризнанное правило, стандарт, образец поведения. Норма деятельности агента (индивидуального или коллективного) в рамках формальных моделей описывается отображением множества возможных значений существенных параметров во множество действий агента. Качественно говоря, норма определяет, какие действия в каких ситуациях агент выбирает. С этой точки зрения репутацию можно рассматривать как ожидаемую (другими агентами) норму деятельности агента – какого поведения от него ожидают остальные. Репутация оправдывается, если выбор агента в рамках нормы деятельности совпадает с тем, чего от него ожидают остальные. Будем считать, что репутация любого агента в его собственных глазах определяется нормой его деятельности. Обзор моделей репутации и норм деятельности проведен в [3]. В [8] введено понятие рефлексивной игры – игры реальных и фантомных (существующих в сознании других реальных или фантомных агентов представлениях о соответствующем оппоненте) агентов. Исходом этой игры является информационное равновесие – совокупность действий реальных и фантомных агентов, являющихся их наилучшими ответами на выбор оппонентами тех действий, которые тот или иной агент считает рациональными в 1
Статья написана совместно с Д.А. Новиковым.
21
рамках той информированности, которую он приписывает оппонентам. В терминах рефлексивных игр согласованная с интересами агента норма его деятельности должна быть подмножеством множества его действий, входящих в информационное равновесие. Репутацией реального агента можно считать совокупность действий его фантомных "представителей", то есть фантомных агентов первого уровня – его образов в сознании оппонентов. Информационное равновесие называется стабильным [7], если ожидания всех реальных и фантомных агентов оправдываются. Поэтому целесообразно считать, что поведение агента соответствует его репутации (подтверждает его репутацию), если информационное равновесие стабильно. Таким образом, зависимости действий, образующих информационное равновесие, реальных агентов от структур их информированности определяют нормы их деятельности. А зависимости действий фантомных агентов от структур их информированности определяют репутацию реальных и фантомных агентов. Рассмотрим организационную систему [2], состоящую из одного агента и одного центра (описываемая ниже модель допускает непосредственное обобщение на случай нескольких агентов и/или нескольких центров), например – исполнителя и заказчика. Предпочтения агента описываются его целевой функцией f(y, q), где y Î A – действие агента, q Î W – состояние природы. Предпочтения центра описываются его целевой функцией F(y, q) также зависящей от действия агента и состояния природы. 2. Модель рационального поведения Нормой деятельности агента будем считать отображение À: W ® A, ставящее каждому состоянию природы q Î W в соответствие множество (или точку) À(q) Í A. То есть, норма деятельности предписывает агенту при состоянии природы q выбирать действия из множества À(q). Репутацией агента (с точки зрения центра) будем считать отображение Â: W ® A, ставящее каждому состоянию природы q Î W в соответствие множество (или точку) Â(q) Í A. Репутация отражает, каких действий ожидает центр от агента в зависимости от состояния природы. 22
Норма À(×) деятельности агента согласована с его предпочтениями, если (1) " q Î W À(q) Í Pf(q), где Pf (q) = Arg max f(y, q) – множество рационального выбора. yÎ A
Репутация Â(×) агента согласована с предпочтениями центра, если (2) " q Î W Â(q) Í PF(q), где PF(q) = Arg max F(y, q) – множество наиболее предпочтиyÎ A
тельных с точки зрения центра выборов агента. Будем считать, что поведение агента подтверждает его репутацию у центра, если выбираемые им в рамках гипотезы рационального поведения действия соответствуют ожиданиям центра: (3) " q Î W Pf(q) Í Â(q). Если ввести гипотезу благожелательного отношения агента к центру [1], то условие (3) можно ослабить, записав его в виде: (3') " q Î W Pf(q) Ç Â(q) ¹ Æ. Норма деятельности агента согласована с его репутацией, если: (4) " q Î W À(q) Ç Â(q) ¹ Æ. Предпочтения агента и центра согласованы, если (5) " q Î W PF(q) Ç Pf(q) ¹ Æ. Итак, имеем четыре подмножества множества A, зависящих от состояния природы: PF(q) – "предпочтения" центра; Pf(q) – "предпочтения" агента; Â(q) – репутация агента у центра; À(q) – норма деятельности агента. Возможны различные соотношения (в теоретикомножественном смысле – пересечения, вложенности и т.д.) между этими подмножествами: - À(q) Í Pf(q) отражает согласованность нормы деятельности агента с его предпочтениями; - Â(q) Í PF(q) отражает согласованность репутации агента с предпочтениями центра; - Pf(q) Í Â(q) отражает подтвержденность репутации агента; 23
- À(q) Ç Â(q) ¹ Æ отражает согласованность нормы деятельности агента с его репутацией; - PF(q) Ç Pf(q) ¹ Æ отражает согласованность предпочтений агента и центра. Содержательно в рамках модели "заказчик – исполнитель", условие (2) означает, что данный заказчик может обратиться к исполнителю с данной репутацией, а (3) означает, что исполнителю выгодно подтвердить свою репутацию в глазах заказчика. Свойства (1)-(5) не являются независимыми. Так, из (1), (2) и (4) следует (5); из (1) и (3') следует (4); из (1), (2) и (3) следует (4) и (5). Но из (1), (2) и (5) в общем случае не следует ни (3), ни (4). В частном случае репутация агента полностью определяется (совпадает с) нормой его деятельности, то есть " q Î W À(q) = Â(q) и, следовательно, выполнено (4). Тогда из (1) и (2) следует (5), а из (1), (2) и (3) следует, что " q Î W Pf(q) Í PF(q), что является более сильным условием, чем (5). Если и норма деятельности агента, и репутация являются однозначными отображения, то из (4) следует, что они совпадают, из (3) – что множество рационального выбора агента состоит из одной точки, из (1) следует, что эта точка определяется нормой деятельности, а для выполнения условия (5) достаточно выполнения условий (1) и (2). В рассматриваемом случае для существования хотя бы одной согласованной с предпочтениями всех участников нормы деятельности (репутации) агента достаточно, чтобы предпочтения центра и агента были согласованы. 3. Модель ограниченной рациональности Рассмотренные выше определения согласованности нормы деятельности агента с его предпочтениями и согласованности его репутации с предпочтениями центра основывались на гипотезе рационального поведения – предположении о том, что агент выбирает одно из действий, максимизирующих при данном состоянии природы его целевую функцию, а для центра наиболее предпочтительны такие действия агента, которые максимизируют целевую функцию центра. В случае если каждое из множеств PF(q) и Pf(q) состоит из одной точки, то, если выполнено (9), то эти точки совпадают, и согласованная норма совпадает с согласованной репутацией и определяется однозначно. Следовательно, для расширения 24
"свободы для маневра" – расширения множества согласованных норм и множества согласованных репутаций – необходимо ослаблять требования к рациональности поведения соответственно агента и центра. Для этого воспользуемся концепцией ограниченной рациональности [9], в соответствии с которой субъекты выбирают не оптимальные (максимизирующие целевую функцию на допустимом множестве) альтернативы, а рациональные альтернативы, то есть, приводящие к удовлетворяющему субъекта значению его целевой функции. Ряд формальных моделей ограниченной рациональности рассматривался в [4, 5]. Ниже мы приведем две модели ограниченной рациональности. В первой субъект выбирает eоптимальные при заданном q Î W альтернативы, где e ³ 0 выступает в качестве параметра (при e = 0 получаем модель классической рациональности). Во второй модели субъект выбирает альтернативы, обеспечивающие ему при заданном q Î W фиксированный уровень полезности u. Определим множества рационального выбора центра и агента двумя способами: (6) PF(q, e) = {y Î A | F(y, q) ³ max F(y, q) – e}, yÎ A
(7) Pf(q, d) = {y Î A | f(y, q) ³ max f(y, q) – d}, yÎ A
(8) pF(q, u) = {y Î A | F(y, q) ³ u}, (9) pf(q, v) = {y Î A | f(y, q) ³ v}. Определения согласованности при этом будут иметь вид (1)(5) с соответствующей заменой множеств рационального выбора. Дальше возможны различные постановки задач. Рассмотрим сначала задачи (10) e + d ® min , {( e , d ) |"q ÎW PF (q ,e ) Ç P f (q ,d ) ¹ Æ}
(11) u + v ®
max
{( u , v ) |"q ÎW p F (q , u ) Ç p f (q , v ) ¹ Æ}
,
заключающиеся в поиске таких минимальных параметров "потерь" (e, d) или максимальных уровней полезности (u, v) соответственно, что интересы центра и агента согласованы. Решения этих задач могут интерпретироваться как стоимость компромисса [6] между центром и агентом (сумма в целевых функциях используется для получения Парето-эффективного решения). 25
Обозначим: y0(q) = arg max [F(y, q) + f(y, q)], yÎ A
yf(q) = arg max f(y, q), yF(q) = arg max F(y, q), yÎ A
yÎ A
Утверждение 1. Пусть либо функции F(×) и f(×) непрерывны по совокупности переменных, а множества A и W компактны, либо множества A и W конечны. Тогда решение задачи (10) имеет вид: (12) e* = max [F(yF(q), q) – F(y0(q), q)], q ÎW
d* = max [f(yf(q), q) – f(y0(q), q)], q ÎW
а решение задачи (11) имеет вид (13) u* = min F(y0(q), q), q ÎW
v* = min f(y0(q), q). q ÎW
Имея решения задач (10) и (11), можно ставить и решать задачу поиска согласованных нормы деятельности À(×) и репутации Â(×): (14) " q Î W À(q) Í Pf(q, d*), " q Î W Â(q) Í PF(q, e*), " q Î W À(q) Ç Â(q) ¹ Æ. или (15) " q Î W À(q) Í pf(q, v*), " q Î W Â(q) Í pF(q, u*), " q Î W À(q) Ç Â(q) ¹ Æ. Решения задач (14) и (15) существуют (так как в силу утверждения 1 интересы центра и агента согласованы) и обеспечивают Парето-эффективные значения выигрышей центра и агента. 4. Рефлексивная модель В рассмотренной выше модели с двумя участниками – центром и агентом – фактически, имелся один активный субъект – агент, выбирающий собственные действия. Поэтому рассмотрим модель, в которой имеется множество N = {1, 2, …, n} активных агентов. Агент i Î N выбирает действие yi Î Ai, а его целевая функция fi(y, q) зависит от вектора y = (y1, y2, …, yn) действий всех
26
агентов и от состояния природы q Î W, то есть f: A' ´ W ® Â 1, где Ai . A' =
Õ iÎN
Предположим, что информированность агентов описывается информационной структурой I = (I1, I2, …, In), где Ii = (qi, qij, qijk, …), i, j, k Î N, – структура информированности i-го агента, i Î N, qi – его представления о состоянии природы, qij – его представления о представлениях j-го агента, qijk – представления iго агента о том, что j-ый агент думает о представлениях k-го агента и т.д. в общем случае до бесконечности [8]. Если задана структура информированности I, то тем самым задана и структура информированности каждого из агентов (как реальных, так и фантомных – то есть существующих в сознании других реальных и фантомных агентов). Выбор t-агентом, где t – некоторая последовательность индексов из множества N, своего действия xt в рамках гипотезы рационального поведения определяется его структурой информированности It , поэтому, имея эту структуру, можно смоделировать его рассуждения и определить его действие. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию). Поэтому при определении исхода игры необходимо учитывать действия как реальных, так и фантомных агентов. Обозначим S+ – множество всевозможных конечных последовательностей индексов из N, S – объединение S+ с пустой последовательностью, |s| – количество индексов в последовательности s (для пустой последовательности принимается равным нулю). Набор действий xt*, t Î S+, называется информационным равновесием [8], если выполнены следующие условия: 1. структура информированности I имеет конечную сложность n, то есть, дерево I содержит конечный набор попарно различных поддеревьев; 2. "l , m Î S + Il = Im Þ xl* = xm*; 3. " i Î N, " s Î S (16) xs*i Î Arg max f i (qsi , xs*i1 ,..., xs*i ,i -1 , yi , xs*i ,i +1 ,..., xs*i , n ) . y i Î Ai
Структура информированности является бесконечным деревом, отражающим иерархию представлений агентов в рефлексив27
ной игре [8]. Информационное равновесие (16) (как решение рефлексивной игры) существует в случае, если структура информированности конечна. Конечность информационной структуры по своему определению означает не конечность ее дерева, а существование конечного базиса, в рамках которого рассмотрение фантомных агентов, имеющих ту же информированность, что и другие реальные или фантомные агенты, не дает новой информации и поэтому нецелесообразно. Действия, выбираемые реальными и фантомными агентами в рамках информационного равновесия, зависят от структуры их информированности, то есть xs* = xs* (Is), s Î S+. Обозначим ÁW – множество всевозможных n-деревьев, элементы которого принадлежат множеству W. Согласованной нормой деятельности i-го агента (реального) Ài: ÁW ® Ai будем называть отображение Ài(Ii) его информационной структуры Ii во множество допустимых действий Ai (см. также [4]), i Î N. Это отображение (при условии, что целевые функции и допустимые множества всех агентов являются общим знанием) совпадает с отображением xi* (Ii), i Î N. Другими словами, нормой деятельности реального агента будем считать соответствующую компоненту информационного равновесия (эта норма будет согласованной в силу определений согласованной нормы и информационного равновесия – см. выше). То есть, норма деятельности определяет, какие действия выбирает агент в зависимости от своей информированности (в зависимости от той ситуации, в которой он принимает решения). Репутацией sj-агента (фантомного, то есть s Î S+, |s| ³ 1) в глазах реального (при |s| = 1) или фантомного (при |s| ³ 2) sагента будем называть отображение Âsj: ÁW ® Aj его информационной структуры Isj во множество допустимых действий Aj, s Î S+, j Î N. Это отображение (при условии, что целевые функции и допустимые множества всех агентов являются общим знанием) совпадает с отображением xs*j (Isj), s Î S+, j Î N. То есть, репутация определяет, выбора каких действий ожидают от агента другие агенты в зависимости от той информированности, которую 28
они ему приписывают (в зависимости от той ситуации, в которой он с их точки зрения принимает решения). Например, репутация Âij j-го агента в глазах i-го отражает, каких действий xij* ожидает iый агент от j-го. Таким образом, зависимости действий, образующих информационное равновесие (16), реальных агентов от структур их информированности определяют нормы их деятельности. А зависимости действий фантомных агентов от структур их информированности определяют репутацию реальных и фантомных агентов. Приведенное выше определение отражает индивидуальную репутацию агентов. Рассмотрим группу S Í N агентов и предположим, что другие агенты наблюдают агрегированный результат wS = wS(yS), где ys = (yi)i Î S – вектор действий агентов из группы S, yS Î AS = Ai . То есть wS: AS ® WS, где WS – множество возмож-
Õ iÎS
ных агрегированных результатов деятельности группы. Коллективной репутацией группы S в глазах реального (при |s| = 1) или фантомного (при |s| ³ 2) s-агента будем называть отображение ÂsS: (ÁW)|S| ® WS совокупности информационных структур (Isj)j Î S во множество WS допустимых агрегированных результатов деятельности группы S, s Î S+, S Í N. Согласованность репутации с поведением агентов ("оправдываемость" репутации) тесно связана с понятием стабильности информационного равновесия (см. качественное обсуждение выше) [7, 11]. Приведем формальные определения. Напомним, что рефлексивная игра задается кортежем {N, (Ai)i Î N, fi(×)i Î N, I}, где N = {1, 2, …, n} – множество участников игры (игроков, агентов), Ai – множество допустимых действий i-го агента, fi(×): W ´ A’ ® Â1 – его целевая функция, i Î N, I – структура информированности. Дополним эту конструкцию набором функций wi(×): W ´ A’ ® Wi, i Î N, каждая из которых отображает вектор (q, x) в элемент wi некоторого множества Wi. Этот элемент wi и есть то, что i-ый агент наблюдает в результате разыгрывания игры. Функцию wi(×) будем называть функцией наблюдения i-го агента. Будем считать, что функции наблюдения являются общим знанием среди агентов. Если wi(q, y) = (q, y), т. е. Wi = W ´ A’, то i29
ый агент наблюдает как состояние природы, так и действия всех агентов. Если, напротив, множество Wi состоит из одного элемента, то i-ый агент ничего не наблюдает. Пусть в рефлексивной игре существует информационное равновесие xt , t Î S+ (напомним, что t – произвольная непустая конечная последовательность индексов из N). Зафиксируем i Î N и рассмотрим i-го агента. Он ожидает в результате игры пронаблюдать величину wi (qi, xi1, …, xi,i-1, xi, xi,i+1, …, xin). На самом же деле он наблюдает величину wi (q, x1, …, xi-1, xi, xi+1, …, xn). Поэтому требование стабильности для i-агента означает совпадение этих величин, являющихся элементами некоторого множества Wi. Другими словами, для стабильности репутации необходимо, чтобы каждый реальный агент наблюдал ту величину, которую он и ожидал увидеть в силу приписываемой им оппонентам репутации. Но этого мало – для стабильности равновесия (репутации) необходимо чтобы и ij-агент, i, j Î N, наблюдал «нужную» величину. Он ожидает в результате игры пронаблюдать wj (qij, xij1, …, xij,j-1, xij, xij,j+1, …, xijn). На самом же деле (т. е. i-субъективно, ведь ij-агент существует в сознании i-агента) он наблюдает величину wj (qi, xi1, …, xi,j-1, xij, xi,j+1, …, xin). Поэтому требование стабильности для ij-агента означает совпадение этих величин. В общем случае, т. е. для ti-агента, ti Î S+, условие стабильности определяется следующим образом [7, 11]: информационное равновесие xti , ti Î S+, называют стабильным при заданной структуре информированности I , если для любого ti Î S+ выполняется (17) wi (qti, xti1, …, xti,i-1, xti, xti,i+1, …, xtin) = = wi (qt, xt1, …, xt,i-1, xti, xt,i+1, …, xtn). В частном случае, когда функцией наблюдения является вектор действий всех агентов: wi (q, x1,…, xn) = (x1,…, xn), стабильным является информационное равновесие x* = ( xs*i )i ÎN, sÎS, удовлетворяющее следующему соотношению: " i Î N, " s Î S xs*i = xi* , которое означает, что действие любого реального агента совпадает с действием, ожидаемым от него любым другим (реальным или фантомным) агентом. 30
Информационное равновесие, не являющееся стабильным, называют нестабильным. Соответственно, репутацию будем называть оправданной, если она определяется стабильным информационным равновесием. Стабильные информационные равновесия разделяют на два класса – истинные и ложные равновесия. Пусть набор действий xti, ti Î S+, является стабильным информационным равновесием. Будем называть его истинным равновесием, если набор (x1, …, xn) является равновесием в условиях общего знания о состоянии природы q. Из этого определения, в частности, следует, что в условиях общего знания любое информационное равновесие является истинным. Стабильное информационное равновесие, не являющееся истинным, называют ложным. Таким образом, ложное равновесие – это такое стабильное информационное равновесие, которое не является равновесием в случае одинаковой информированности агентов (в условиях общего знания). Соответственно, оправданную репутацию назовем истинной, если она определяется истинным информационным равновесием. Оправданную репутацию, определяемую ложным информационным равновесием, назовем ложной. Таким образом, оправданная репутация может быть как истинной, так и ложной. Результаты исследований свойств стабильности и истинности информационных равновесий можно найти в [7, 11]. Их использование при построении моделей норм деятельности и репутации представляется целесообразным и многообещающим. Некоторые примеры приведены в настоящей работе ниже. Завершая описание рефлексивной модели, рассмотрим следующий вариант взаимной информированности агентов. Пусть с точки зрения i-го агента состояние природы qi Î W является общим знанием. Тогда определения репутации и норм деятельности (с учетом условия (16)) примут вид: (18) " i Î N Ài(qi) Î Arg max fi(qi, Âi1(qi), … y i Î Ai
…, Âi,i-1(qi), yi, Âi,i+1(qi), …, Âin(qi)). (19) " i, j Î N Âij(qi) Î Arg max fj(qi, Âi1(qi), … y j ÎA j
…, Âi,j-1(qi), yj, Âi,j+1(qi), …, Âin(qi)). 31
Если, в частном случае, репутации агентов {Âi(×)} являются общим знанием, то условия (18), (19) примут вид: (20) " i Î N Ài(qi) Î Arg max fi(qi, Â1(qi), … y i Î Ai
…, Âi-1(qi), yi, Âi+1(qi), …, Ân(qi)). (21) " i, j Î N Âj(qi) Î Arg max fj(qi, Â1(qi), … y j ÎA j
…, Âj-1(qi), yj, Âj+1(qi), …, Ân(qi)). В заключение рассмотрим ряд модельных примеров. 5. Примеры Пример 1. Пусть f(y, q) = q y – y2 / 2 r, F(y, q) = q y – y2 / 2 R, y ³ 0, q Î [1/2; 1]. Тогда yf(q) = q r, yF(q) = q R, Pf(q) = {yf(q)}, PF(q) = {yF(q)}. Норма деятельности À(q) = q r является единственной, удовлетворяющей (1), а репутация Â(q) = q R – единственной, удовлетворяющей (2). При этом (3), (4) и (5) выполнено только при r = R. Видно, что согласование в данном случае (когда множество рациональных действий состоит из одной точки) возможно только при полном совпадении интересов центра и агента – получили в некотором смысле вырожденный случай. Исследуем, какие нормы деятельности и репутации окажутся согласованными в рамках моделей ограниченной рациональности. Вычислим y0(q) =
2q R r . Из (12) получаем (максимумы в R+r
(12) достигаются при q = 1):
R ( R - r )2 * r( R - r )2 e = ,d = . 2( R + r ) 2 2( R + r ) 2 *
Значение целевой функции в оптимальном решении задачи (10) равно
( R - r) . Очевидно, оно обращается в ноль при пол2( R + r )
ном совпадении интересов центра и агента (то есть, при R = r). Пусть для определенности R ³ r, тогда Pf(q, d*) = [r (q –
32
R-r R-r ); r (q + )], R+r R+r
PF(q, e*) = [R (q –
R-r R-r ); R (q + )]. R+r R+r
Найдем
R-r R-r ); r (q + )]. R+r R+r 2Rr Видно, что при q = 1 Pf(1, d*) Ç PF(1, e*) = y0(1) = . R+r
(22) Pf(q, d*) Ç PF(q, e*) = [R (q –
Норма деятельности агента и его репутация, удовлетворяющие (14), должны давать непустое пересечение образов, принадлежащее (22). Из (13) получаем: u* =
R2r Rr 2 * , v = . Значение 2( R + r )2 2( R + r )2
целевой функции в оптимальном решении задачи (11) равно
Rr . Минимумы в (13) достигаются при q = 1/2, поэтому при 2( R + r ) полном совпадении интересов центра и агента (то есть, при R = r) оптимум в (11) равен r / 4. Пусть для определенности R ³ r, тогда 2
2
æ R ö æ R ö 2 ÷ ); r (q + q - ç ÷ )], èR+rø èR+rø
pf(q, v*) = [r (q –
q2 -ç
pF(q, u*) = [R (q –
q2 -ç
2
2
æ r ö æ r ö 2 ÷ ); R (q + q - ç ÷ )]. èR+rø èR+rø
Найдем (23) pf(q, v*) Ç pF(q, u*) = 2
2
æ r ö æ R ö 2 = [R (q – q - ç ÷ ; r (q + q - ç ÷ )]. èR+rø èR+rø 2
Норма деятельности агента и его репутация, удовлетворяющие (15), должны давать непустое пересечение образов, принадлежащее (23). Пример 2. Пусть целевая функция агента представляет собой разность между доходом l y, получаемым им от "продажи" центру 33
результатов своей деятельности y ³ 0 по цене l ³ 0, и затратами y2 / 2 q, где q > 0 – эффективность деятельности агента: f(y, q, l) = l y – y2 / 2 q. Целевая функция центра не зависит от параметра q и представляет собой разность между его доходом 2 R y и вознаграждением l y, выплачиваемым агенту: F(y, l) = 2 R y – l y. Рассматривая данную модель как модель стимулирования [6], получим: yf(l, q) = l q, yF(l) = (R / l)2, F(yf(l, q), l) = 2 R lq – l2 q. Максимум функции F(yf(l, q), l) по l ³ 0 достигается при l(q) = (R2 / 4 q)1/3, что приводит к yf(q) = (R q / 2)2/3, yF(q) = (4 R q)2/3. При этом y0(q) = (q R)2/3. Следовательно, если положить À(q) = yf(q), Â(q) = yF(q), то получим, что " q Î W À(q) £ y0(q) £ Â(q), то есть в рамках классической рациональности центра и агента согласованных норм деятельности и репутаций не существует. Модели ограниченной рациональности могут рассматриваться так же, как и в примере 1. 6. Заключение Таким образом, в настоящей работе рассмотрены теоретикоигровые модели репутации и норм деятельности, учитывающие рефлексию агентов. Под нормой деятельности агента понимается правило, предписывающее ему то или иное поведение в зависимости от ситуации. В случае если равновесий игры агентов несколько, норма деятельности определяет, какое равновесие выбирает агент. Репутация является, в некотором смысле, рефлексией над нормой деятельности – она определяет, каких действий от агента ожидают другие агенты в той или иной ситуации. Теоретический анализ свидетельствует, что адекватным инструментом описания репутации и норм деятельности является рефлексивная игра. Зависимость образующих информационное равновесие действий реальных агентов от их представлений о существенных параметрах отражает нормы их деятельности. Зави34
симость образующих информационное равновесие действий фантомных агентов от их представлений о существенных параметрах отражает репутацию их прообразов. Репутация является оправданной, если информационное равновесие стабильно, то есть если ожидания агентов относительно поведения других агентов оправдываются. Литература 1. Бурков В.Н., Новиков Д.А. Идентификация активных систем / Труды международной конференции «Идентификация систем и процессы управления». М.: ИПУ РАН, 2000. С. 101 – 121. 2. Бурков В.Н., Новиков Д.А. Как управлять организациями. М.: Синтег, 2004. – 400 с. 3. Ермаков Н.С., Иващенко А.А., Новиков Д.А. Модели репутации и норм деятельности. М.: ИПУ РАН, 2005. – 63 с. 4. Новиков Д.А. Институциональное управление организационными системами. М.: ИПУ РАН, 2003. – 68 с. 5. Новиков Д.А. Сетевые структуры и организационные системы. М.: ИПУ РАН, 2003. – 108 с. 6. Новиков Д.А. Стимулирование в организационных системах. М.: Синтег, 2003. – 312 с. 7. Новиков Д.А., Чхартишвили А.Г. Прикладные модели информационного управления. М.: ИПУ РАН, 2004. – 130 с. 8. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. М.: Синтег, 2003. – 160 с. 9. Саймон Г. Науки об искусственном. М.: Мир, 1972. – 147 с. 10. Словарь иностранных слов. М.: Русский язык, 1982. 11. Чхартишвили А.Г. Теоретико-игровые модели информационного управления. М.: ПМСОФТ, 2004. – 227 с.
35
МАНИПУЛИРОВАНИЕ В МЕХАНИЗМАХ РАСПРЕДЕЛЕНИЯ КОРПОРАТИВНЫХ РЕСУРСОВ А.А. Иващенко, Н.Е. Рыбченко1 (Московский физико-технический институт) 1. Введение Работы, посвященные проблемам распределения корпоративных ресурсов (финансовых, материальных, человеческих и т.д.), можно разделить на несколько классов. В первый входят исследования, основанные на качественных методах (или использующие элементы оптимизации) и опыте успешного управления корпорациями – см., например [1, 2, 16]. Второй класс составляют работы, посвященные, в основном, управлению финансами, которые в большей степени используют аппарат математического моделирования (исследования операций) для постановки и решения задач распределения корпоративных ресурсов – см., например [8, 9, 11, 25]. Третий класс составляют работы, основанные на теоретико-игровом подходе – см., например [3, 4, 18, 24, 26-34]. В них исследуются механизмы (процедуры принятия управленческих решений) распределения ресурсов, в которых управляющий орган – центр – принимает решения на основании сообщений управляемых субъектов – агентов – о неизвестных ему существенных параметрах (эффективности использования ресурса агентами, понесенными ими затратами и т.д.). Основная задача изучения механизмов распределения ресурса заключается в поиске механизмов, удовлетворяющих заданным требованиям (аксиомам), отражающих представления центра и исследователя операций о том, каким должен быть «хороший» механизм распределения ресурса. Среди требований к механизмам распределения ресурса наиболее часто встречаются следующие: 1) монотонность (по сообщения агентов и количеству распределяемого ресурса); 1
Статья написана совместно с Д.А. Новиковым.
36
2) анонимность (симметричность относительно перестановок агентов); 3) индивидуальная рациональность (выигрыш любого агента – например, разность между «доходом» и затратами – должен быть не меньше, чем при неучастии данного агента в рассматриваемой процедуре); 4) эффективность (получаемое в результате использования механизма распределение ресурса должно быть эффективно по Парето); 5) неманипулируемость (агентам должно быть выгодно сообщать центру достоверную информацию о неизвестных ему параметрах). В настоящей работе рассматривается третий класс задач распределения корпоративных ресурсов, то есть – учитывающих возможность манипулирования информацией. На сегодняшний день известно [7], что манипулируемость процедур принятия решений может быть обусловлена либо стратегическим манипулированием со стороны агентов (искажением ими своих сообщаемых предпочтений [13, 18, 24, 26, 27, 32-34]), либо манипулированием алгоритмом обработки мнений агентов (так называемая теория агенды [15]). В механизмах планирования [19, 24] (принятия центром решений на основании сообщаемой агентами информации) считается, что предпочтения агентов являются для них общим знанием [22], то есть, предпочтения каждого агента известны всем агентам, всем агентам это известно и т.д. до бесконечности. При этом механизм называется неманипулируемым, если каждому агенту, каковы бы ни были его предпочтения, при любой обстановке игры (любых предпочтениях оппонентов) выгодно сообщение достоверной информации о своих предпочтениях. Манипулируемость механизмов распределения ресурса и затрат исследовалась в [4]. Оказывается, что, помимо двух отмеченных выше (стратегическое манипулирование и манипулирование агендой), возможен еще один – третий – вариант манипулирования – информационное манипулирование, то есть манипулирование информацией о предпочтениях оппонентов, которую агенты используют при принятии решений. Общее описание такой модели и некоторые примеры 37
приводятся в [23]. А именно, в упомянутой работе рассматриваются рефлексивные модели поведения агентов в механизмах планирования при условии, что представления агентов о предпочтениях оппонентов описываются точечной структурой информированности [22]. Предлагается концепция рефлексивной неманипулируемости, в соответствии с которой для каждого агента ищется фиксированная обстановка игры (являющаяся информационным равновесием), при которой ему выгодно сообщать достоверную информацию о своих предпочтениях. Анализируются модели рефлексивного управления [21], в которых центр или агенты имеют возможность влиять на представления друг друга о типах оппонентов. Для этих моделей показывается, что субъекты, осуществляющие рефлексивное управление, могут добиться принятия более выгодных для них решений. В настоящей работе предложенный в [23] подход к описанию манипулирования представлениями о предпочтениях оппонентов применяется для задачи принятия решений об относительной важности критериев [17], используемых при распределении корпоративных ресурсов. 2. Модель принятия решений и проблема стратегического манипулирования Рассмотрим модель корпорации – организационную систему (ОС), состоящую из управляющего органа – корпоративного центра – и n управляемых субъектов – агентов (подразделений корпорации). Стратегией i-го агента является сообщение центру некоторой информации si Î Si, i Î N = {1, 2, …, n} – множеству агентов. Центр на основании сообщенной ему информации назначает агентам планы xi = pi(s) Î Xi Í Â 1, где p : S ® X – процедура (механизм) планирования, pi: S ® Xi, i Î N, s = (s1, s2, …, sn) Î S = Si –
Õ x = (x , x , …, x ) Î X = Õ X iÎN
вектор сообщений всех агентов,
1
2
n
i
–
iÎN
вектор планов. Функция предпочтения (целевая функция) агента, отражающая интересы агента в задачах планирования: fi(xi, ri): Xi ´ Â 1 ® Â 1, 38
зависит от соответствующей компоненты назначенного центром плана и параметра ri Î Â 1 – типа агента. Как правило, при исследовании механизмов планирования, то есть в ОС с сообщением информации, вводится предположение, что функции предпочтения агентов однопиковые [19] с точками пика {ri}i Î N, то есть функция fi(xi, ri) непрерывна, строго монотонно возрастает по xi до единственной точки максимума ri и строго монотонно убывает после нее, i Î N. Это предположение означает, что предпочтения агента на множестве допустимых планов таковы, что существует единственное наилучшее для него значение плана – точка пика, степень же предпочтительности остальных планов монотонно убывает по мере удаления от точки пика. Поэтому под типом агента будем понимать точку максимума (идеальную точку, точку пика) его функции предпочтения, то есть наиболее выгодное с его точки зрения значение плана. На момент принятия решений общим знанием для агентов являются: процедура планирования, целевые функции и допустимые множества всех агентов, а также вектор типов r = (r1, r2, …, rn) Î Â n. Центру известны зависимости fi(xi, ×) и множества {Si}i Î N возможных сообщений агентов, но не известны точные значения типов агентов. Последовательность функционирования следующая: центр выбирает процедуру планирования p(s) = (p1(s), p2(s), …, pn(s)) и сообщает ее агентам, агенты при известной процедуре планирования одновременно и независимо сообщают центру информацию {si}, на основании которой и формируются планы. Так как решение, принимаемое центром (назначаемые агентам планы), зависит от сообщаемой агентами информации, последние могут воспользоваться возможностью своего влияния на эти решения, сообщая такую информацию, чтобы получить наиболее выгодные для себя планы. Понятно, что при этом полученная центром информация в общем случае может не быть истинной. Следовательно, возникает проблема манипулирования. Будем считать, что агенты ведут себя некооперативно, выбирая доминантные или равновесные по Нэшу [12] стратегии. Пусть s* – вектор равновесных по Нэшу стратегий (если равновесий несколько, то необходимо ввести соответствие отбора равновесий, 39
позволяющее из любого множества равновесий выбрать единственное): (1) " i Î N, " si Î Si fi(pi( s-* i , si* ), ri) ³ fi(pi( s-* i , si ), ri). Очевидно, точка равновесия в общем случае зависит от вектора типов всех агентов: s* = s*(r) = ( s1* (r), s2* (r), …, sn* (r)). Соответствующим механизму p(×): S ® X прямым механизмом планирования h(×): Â n ® X называется механизм h(r) = p(s*(r)), ставящий в соответствие вектору точек пика агентов вектор планов. Термин «прямой» обусловлен тем, что агенты сообщают непосредственно (прямо) свои точки пика (в исходном – непрямом – механизме p(×) они могли сообщать косвенную информацию s Î S). Если при любых предпочтениях агентов r Î Â n в соответствующем прямом механизме сообщение ими достоверной информации r Î Â n является равновесием Нэша: (2) " r Î Â n, " i Î N, " ~ ri Î Â 1 fi(hi(r), ri) ³ fi(hi(r-i, ~ ri ), ri), то такой механизм называется эквивалентным прямым (неманипулируемым) механизмом. Данное свойство далее будем называть неманипулируемостью. Казалось бы, более сильным, чем (2), является требование того, чтобы сообщение каждым агентом достоверной информации было его доминантной стратегией [12]: r- i , ri), ri) ³ fi(hi( ~ ri Î Â 1, " ~ r- i Î Â n-1 fi(hi( ~ r- i , ~ ri ), ri). (3) " iÎN, " ri, ~ Однако легко видеть, что определения (2) и (3) эквивалентны [24, 28]. То есть, так как в определениях (2) и (3) неманипулируемости механизмов планирования вектор r Î Â n типов агентов является «параметром», то неманипулируемость можно интерпретировать следующим образом: механизм является неманипулируемым, если, каковы бы ни были истинные типы агентов, сообщение достоверной информации является доминантной стратегией каждого из них. Качественное отличие прямых механизмов от непрямых (помимо того, что в первых агенты могут сообщать «косвенную» информацию о своих предпочтениях, существенные свойства которых при однопиковых целевых функциях однозначно описываются точкой пика) заключается в «ограниченности» множеств 40
{Si}i Î N возможных сообщений. Если в равновесии в непрямом монотонном по каждому из сообщений механизме некоторый агент получает план, строго меньший (больший) его точки пика, то в этом равновесии он должен сообщать максимально (минимально) возможную заявку. На этом свойстве равновесия базируются основные результаты исследования неманипулируемости соответствующих прямых механизмов [13, 19, 24, 26, 27, 32] – см. также результаты ниже. Определение неманипулируемости (см. выше) основывалось на концепции равновесия Нэша. В [22] была предложена концепция информационного равновесия, частным случаем которого (соответствующим общему знанию) является равновесие Нэша. Поэтому представляется перспективным анализ неманипулируемости механизмов планирования с точки зрения информационного равновесия, учитывающего информационную рефлексию агентов. 3. Механизмы определения приоритетов Предположим, что лицу, принимающему решения – центру, неизвестны предпочтения агентов (подразделений корпорации), и он просит их сообщить информацию о своих предпочтениях – о приоритетах тех или иных критериев, по которым, например, оценивается эффективность распределения корпоративного ресурса. Если решения, принимаемые на основании агрегированного критерия, затрагивают интересы агентов, то они будут стремиться сообщить такую информацию, чтобы принимались наиболее предпочтительные для них решения. Следовательно, возникает проблема манипулирования информацией. Обозначим: K = {1, 2, ..., k} – множество критериев, k – число критериев. Возьмем произвольный номер критерия (например, k) – назовем этот критерий базовым – и будем рассматривать механизм: p(s): ( Â k+-1 )n ® Â k+-1 , отображающий множество сообщений агентов: s Î ( Â k+-1 )n, s = ||sij||, sij ³ 0, i Î N, j Î K \ {k}, об относительной важности критериев (во сколько раз тот или иной критерий более приоритетен, чем базовый – см. также механизмы согласия в [5, 14]) во множество относительных приоритетов: 41
p = (p1, p2, ..., pk-1) Î Â k+-1 , pj ³ 0. Итак, sij – сообщение i-го агента о том, во сколько раз он считает j-ый критерий более важным, чем базовый, i Î N, j Î K \ {k} [17]. Истинные предпочтения i-го агента – идеальная точка – его субъективные представления об относительной важности критериев (его тип) – обозначим ri = (ri1, ri2, …, rik-1, 1), rij ³ 0, j Î K, i Î N. Центр принимает решения на основании процедуры планирования (механизма принятия решений, механизма агрегирования мнений агентов) – вектор-функции p(×), такой, что pj(s) является относительным приоритетом j-го критерия, j Î K. Относительные (нормированные) приоритеты vij критериев связаны с типами агентов следующим образом: (4) vij = sij / (1 + sij ), j Î K \ {k}, i Î N,
å j ¹k
(5) vik = 1 / (1 +
ås
ij
), i Î N.
j¹k
(6) sij = vij / vik, i Î N, j Î K. Приоритеты (4), (5) удовлетворяют условию нормировки для любых сообщений {sij ³ 0}. Относительно механизма p(×) будем предполагать, что векторфункция p(×): 1) непрерывна по всем переменным; 2) удовлетворяет условию единогласия: если для некоторого j Î K для всех i Î N выполнено sij = aj, то pj(s) = aj. Другими словами, если все агенты сообщают одну и ту же оценку приоритета некоторого критерия, то итоговый приоритет этого критерия должен равняться данной оценке. 3) анонимна, то есть, симметрична относительно перестановок агентов. 4) сепарабельна, то есть pj(s) = pj(s1j, s2j, …, snj), j Î K; 5) монотонна по всем переменным, то есть pj(s1j, s2j, …, snj) не убывает по sij, i Î N, j Î K. Частным является, например, случай, в котором агрегированный критерий эффективности определяется «усреднением» оценок, сообщенных агентами: 42
(7) pj(s) =
1 å sij , j Î K. n iÎN
Опишем теперь предпочтения агентов. Будем считать, что каждый агент заинтересован в том, чтобы итоговое значение приоритетов критериев было как можно ближе к его субъективному мнению. Тогда предпочтения агентов (напомним, что рациональные агенты стремятся максимизировать свои целевые функции [12]) можно описать однопиковыми [19, 32] действительнозначными функциями fi(p(s), ri), возрастающими по мере приближения pj(s) к rij, j Î K, i Î N. Примерами могут служить (8) fi(p(s), ri) = – | p j ( s ) - rij | , i Î N,
å jÎK
или (9) fi(p(s), ri) = –
å (p jÎK
j
( s ) - rij ) 2 , i Î N.
Имея целевые функции и множества допустимых действий (сообщений) агентов, и считая, что они сообщают центру информацию однократно, одновременно и независимо (при условии, что предпочтения агентов являются общим знанием между ними), можно анализировать игру агентов [12]. Обозначим соответствующий механизму p(×) прямой механизм hp(r): ( Â k+-1 )n ® Â k+-1 , то есть hp(r) = p(s*(r)). В [17] для произвольного числа агентов доказаны следующие свойства рассматриваемых механизмов определения приоритетов: механизм p(×) является манипулируемым, механизм hp(×) является неманипулируемым. Таким образом, в упомянутой работе получен ответ на вопрос о стратегической манипулируемости механизма определения приоритетов. Изучим другие виды манипулируемости этого класса механизмов – манипулирования агендой и информационное манипулирование (воздействие на представления агентов на предпочтения оппонентов).
43
4. Манипулирование механизмами определения приоритетов Рассмотрим для исследуемого механизма последовательно эффекты стратегического манипулирования, манипулирования агендой и информационного манипулирования. Стратегическое манипулирование. Охарактеризуем сначала равновесие s*(r) в механизме p(×). Обозначим qj = arg max {rij}, iÎN
j Î K. Утверждение 1 [17]. В механизме hp(×) равновесие имеет следующий вид:
i ¹ qj ìï0, , j ÎK \ {k}, ïî sq j j (r ), i = q j
(10) sij* (r ) = í
где sq j j (r) таково, что pj(0, 0, ..., 0, sq j j ) = rq j j , j Î K \ {k}. При этом hpj(r) = pj(s*(r)) = rq j j , j Î K \ {k}. Справедливость утверждения 1 следует из подстановки (10) в (1) с учетом свойств 1-5 механизма p(×). Содержательно утверждение 1 означает, что приоритет каждого критерия определяется мнением агента, считающего данный критерий наиболее важным. Этого агента, следуя традиции [19, 24], назовем «диктатором». То есть диктатором по j-му критерию является агент с номером qj, j ÎK \ {k}, а выражение (10) характеризует результаты стратегического манипулирования со стороны агентов. Следствие. Механизм hp(×) является неманипулируемым. Манипулирование агендой. До сих пор мы считали, что базовым критерием является k-ый критерий. Возможность выбора базового критерия, которую будем полагать прерогативой центра, отражает манипулирование агендой. Обозначим wij ³ 0, i Î N, j Î K – нормированные истинные приоритеты агентов, wi = (wi1, wi2, ...,wik), w = ||wij||, wij = 1,
å jÎK
i Î N. Если базовым выбран l-ый критерий, то приоритеты агентов можно вычислить следующим образом: 44
(11) rijl = wij / wil, j, l Î K, i Î N. Обозначим q lj = arg max { rijl }, j, l Î K. Из утверждения 1 iÎN
следует, что pj(s (r )) = rq l j , j, l Î K. Получаем следующий резуль*
l
j
тат. Утверждение 2. При манипулировании агендой множество равновесных приоритетов критериев составляет П0(w) = (rq l j ) jÎK .
U
l ÎK
j
Содержательно утверждение 2 означает, что, выбирая, какой критерий назначить базовым, центр может варьировать равновесные вектора приоритетов агентов внутри множества П0(w). Информационное (рефлексивное) манипулирование. Пусть центру известны мнения агентов wij ³ 0, i Î N, j Î K, но никому из них не известны достоверно мнения остальных. Рефлексивное управление (информационное манипулирование) в данной ситуации заключается в формировании у агентов таких структур информированности (представлений о представлениях оппонентов) [21, 22], чтобы сообщаемая ими как субъективное информационное равновесие информация приводила бы к принятию наиболее выгодного для центра решения. Исследуем, каково множество информационных равновесий игры агентов при использовании центром информационного управления. Определим следующие величины: Sij(r): pj(0, 0, ..., 0, Sij) = rij, j Î K, i Î N. Из результатов анализа стратегического манипулирования (см. утверждение 1) следует, что агент, имеющий максимальную оценку по j-му критерию (диктатор), будет сообщать оценку Sij(r), а остальные агенты будут сообщать нулевые оценки приоритета данного критерия, j Î K. Значит, имеются два возможных сообщения каждого агента: если центр убедит агента, что последний является диктатором, то оценка будет Sij(r), в противном случае – нулевая оценка. То есть, справедливо следующее утверждение. Утверждение 3. При информационном манипулировании множество равновесных приоритетов критериев составляет 45
П0(r) =
U p (s)
.
( s ij Î{0 ; S ij ( r )}) iÎN , jÎK
Доказательство утверждения 3. В силу описанной выше структуры равновесия Нэша (см. утверждение 1) в механизме определения приоритетов множество информационных равновесий есть П0(r). Обоснуем, что сообщения агентов, равные нулю или Sij(r) (независимо для каждого агента) составляют максимальное множество равновесий их игры. Для этого достаточно предъявить соответствующую структуру информированности агентов (максимальность этого множества равновесий следует из (10)). Рассмотрим следующие два варианта структуры информированности i-го агента. Первый вариант – агент убежден, что он является диктатором по некоторому критерию j Î K. Для этого достаточно, чтобы он считал, что оценки данного критерия его оппонентами меньше его собственной оценки, и это является для них общим знанием. Данный вариант приводит к тому, что для i-го агента информационным равновесием является сообщение оценки Sij(r) важности j-го критерия. Второй вариант – агент убежден, что не он является диктатором по некоторому критерию. Для этого достаточно, чтобы он считал, что оценка данного критерия хотя бы одним его оппонентом строго больше его собственной оценки, и это является для них общим знанием. Данный вариант приводит к тому, что для i-го агента информационным равновесием является сообщение нулевой оценки важности j-го критерия. Отметим, что может убеждать агентов независимо, что оправдывает вычисление пересечения в определении множества П0(r). Утверждение 3 доказано. В ходе доказательства утверждения 3 было обосновано, что максимальное множество информационных равновесий достигается при формировании центром у агентов структуры информированности глубины два. Так как ранг рефлексии агента на единицу меньше глубины структуры его информированности [22], то получаем, что справедливо следующее утверждение. Утверждение 4. При решении задач информационного манипулирования в механизмах определения приоритетов достаточно ограничиться первым рангом рефлексии агентов. 46
Вычислим следующие величины: Sijl (w) : pj(0, 0, ..., 0, Sij) = rijl , j, l Î K, i Î N. В заключение определим множество равновесных приоритетов критериев при использовании центром одновременно манипулирования агендой и информационного манипулирования: p (s) . П(w) =
U
l ÎK
U
( sij Î{0; S ijl ( r )}) iÎN , jÎK
Очевидно " w П0(w) Í П(w), p(s*(r)) Î П0(r), П0(r) Í П(w), то есть П(w) является максимальным множеством равновесных приоритетов критериев, которых центр может добиться за счет манипулирования. Рассмотрим следующий пример, иллюстрирующий утверждения 1-4. 5. Пример Пусть имеются два агента и три критерия (n = 2, k = 3). Предпочтения агентов (нормированные) таковы: w1 = (0,2; 0,3; 0,5), w2 = (0,1; 0,7; 0,2). Если в качестве базового выбран первый критерий, то r12 = 3/2, r13 = 5/2, r22 = 7, r23 = 2. Получаем в соответствии с утверждением 1: p 1 = (1; 7; 5/2). Если в качестве базового выбран второй критерий, то r11 = 2/3, r13 = 5/3, r21 = 1/7, r23 = 2/7. Получаем в соответствии с утверждением 1: p 2 = (2/3; 1; 5/3). Если в качестве базового выбран третий критерий, то r11 = 2/5, r12 = 3/5, r21 = 1/2, r22 = 7/2. Получаем в соответствии с утверждением 1: p 3 = (1/2; 7/2; 1). Видно, что равновесные приоритеты критериев зависят от того, какой критерий выбран в качестве базового (см. утверждение 2), то есть П0(w) = p 1 È p 2 È p 3. Проиллюстрируем теперь эффект информационного манипулирования со стороны центра. Пусть в качестве базового выбран первый критерий и в качестве процедуры p(×) используется вычисление среднего арифметического сообщений агентов:
47
pj(s) =
1 å sij , j Î K. Тогда Sij(r) = n rij. Значит, имеем четыре n iÎN
варианта определения «равновесного» приоритета, например, второго критерия: p2(0; 0) = 0, p2(9/2; 0) = 3/2, p2(0; 21) = 7 = p2(s*(r)), p2(9/2; 21) = 17/2. 6. Заключение Таким образом, в настоящей работе рассмотрены три вида манипулирования в механизмах определения приоритетов: стратегическое манипулирование со стороны агентов, манипулирование агендой и информационное манипулирование со стороны центра. Охарактеризованы равновесия в рамках стратегического манипулирования (утверждение 1). Показано, что равновесные приоритеты критериев зависят от того, какой критерий выбран в качестве базового (утверждение 2). Определено множество приоритетов, которые могут быть реализованы как «равновесные» в рамках информационного манипулирования (утверждение 3). Доказано, что при решении задач информационного манипулирования в механизмах определения приоритетов достаточно ограничиться первым рангом рефлексии агентов (утверждение 4). Перспективным направлением дальнейших исследований представляется изучение манипулируемости различных видов для других механизмов принятия решений на основании сообщаемой агентами информации (в первую очередь – известных механизмов распределения ресурса, экспертизы, внутрифирменного ценообразования и др.). Литература 1. Балашов В.Г. Модели и методы принятия выгодных финансовых решений. М.: Физматлит, 2003. – 408 с. 2. Балашов В.Г., Ириков В.А. Технологии повышения финансового результата предприятий и корпораций. М.: ПРИОР, 2002.–512 с. 3. Бурков В.Н., Агеев И.А., Баранчикова Е.А., Крюков С.В., Семенов П.И. Механизмы корпоративного управления. М.: ИПУ РАН, 2004. – 109 с.
48
4. Бурков B.H., Горгидзе И.А., Новиков Д.А., Юсупов Б.С. Модели и механизмы распределения затрат и доходов в рыночной экономике. М.: ИПУ РАН. 1997. – 57 с. 5. Бурков В.Н., Грацианский Е.В., Еналеев A.K., Умрихина Е.В. Организационные механизмы управления научно-техническими программами. М.: ИПУ РАН, 1993. – 64 с. 6. Бурков В.Н., Дорохин В.В., Балашов В.Г. Механизмы согласования корпоративных интересов. М.: ИПУ РАН, 2003. – 73 с. 7. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы функционирования социально – экономических систем с сообщением информации // Автоматика и Телемеханика. 1996. № 3. С. 3 – 26. 8. Бурков В.Н., Заложнев А.Ю., Леонтьев С.В., Новиков Д.А. Механизмы финансирования программ регионального развития. М.: ИПУ РАН. 2002. – 64 с. 9. Бурков В.Н., Новиков Д.А. Как управлять проектами. М.: Синтег, 1997. – 188 с. 10. Бурков В.Н., Новиков Д.А. Как управлять организациями. М.: Синтег, 2004. – 400 с. 11. Гламаздин Е.С., Новиков Д.А., Цветков А.В. Механизмы управления корпоративными программами: информационные системы и математические модели. М.: Спутник+, 2001. – 159 с. 12. Губко М.В., Новиков Д.А. Теория игр в управлении организационными системами. М.: Синтег, 2002. – 148 с. 13. Коргин Н.А. Неманипулируемые механизмы обмена в активных системах. М.: ИПУ РАН, 2003. – 126 с. 14. Кузьмицкий А.А., Новиков Д.А. Организационные механизмы управления развитием приоритетных направлений науки и техники. М.: ИПУ РАН, 1993. – 68 с. 15. Лезина З.М. Манипулирование выбором вариантов: теория агенды // Автоматика и телемеханика. 1985. № 4. С. 5 – 22. 16. Масютин С.А. Механизмы корпоративного управления. М: Финстатинформ, 2002. – 236 с. 17. Матвеев А.А., Новиков Д.А., Цветков А.В. Модели и методы управления портфелями проектов. М.: ПМСОФТ, 2005. – 201 с. 18. Мулен Э. Кооперативное принятие решений: аксиомы и модели. М.: Мир, 1991. – 464 с. 49
19. Новиков Д.А., Петраков С.Н. Курс теории активных систем. М.: Синтег, 1999. – 108 с. 20. Новиков Д.А. Теория управления организационными системами: вводный курс. М.: ИПУ РАН, 2004. – 81 с. 21. Новиков Д.А., Чхартишвили А.Г. Прикладные модели информационного управления. М.: ИПУ РАН, 2004. 22. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. М.: Синтег, 2003. – 160 с. 23. Новиков Д.А., Чхартишвили А.Г. Рефлексия в механизмах планирования // Системы управления и информационные технологии. 2004. № 5. С. 27 – 38. 24. Петраков С.Н. Механизмы планирования в активных системах: неманипулируемость и множества диктаторства. М.: ИПУ РАН, 2001. – 135 с. 25. Царев В.В. Оценка экономической эффективности инвестиций. СПб.: Питер, 2004. – 464 с. 26. Barbera S., Masso J., Serizawa S. Strategy-proof voting on compact ranges // Games and Behavior. 1998. Vol. 25. P. 272 – 291. 27. Border K., Jordan J. Straightforward elections, unanimity and phantom voters // Rev. of Economic Studies. 1983. Vol.50. P.153–170. 28. Dasgupta P., Hammond P., Maskin E. The implementation of social choice rules: some general results on incentive compatibility // Review of Economic Studies. 1979. Vol. 46. № 2. P. 185 – 216. 29. Jackson M. Mechanism theory. California Institute of Technology. Working Paper, 2003. – 46 p. 30. Mas-Collel A., Whinston M.D., Green J.R. Microeconomic theory. N.Y.: Oxford Univ. Press, 1995. – 981 p. 31. Moore J. Implementation, contracts and renegotiation in environment with complete information / Advances in Economic Theory. Vol. 1. Cambridge: Cambridge University Press, 1992. P. 182 – 281. 32. Moulin H. On strategy-proofness and single-peakedness // Public Choice. 1980. Vol. 35. P. 437 – 455. 33. Moulin H., Shenker S. Serial cost sharing // Econometrica. 1992. Vol. 60. N 5. P. 1009 – 1037. 34. Sprumont Y. The division problem with single-peaked preferences: a characterization of the uniform allocation rule // Econometrica. 1991. Vol. 59. № 2. P. 509 – 519. 50
О РАСПРЕДЕЛЕНИИ ФИНАНСОВОГО РЕЗУЛЬТАТА МЕЖДУ ЦЕНТРОМ ЗАТРАТ И ЦЕНТРАМИ ПРИБЫЛИ Заложнев А.Ю., Клыков А.Ю. (Институт проблем управления РАН, Москва)
[email protected] В работе [1] представлена внутрифирменная финансовая структура, состоящая из одного центра затрат (“Бюджет” или “Центр”) и нескольких центров прибыли. Основной акцент сделан на проблеме создания заинтересованности центров прибыли в результатах деятельности организации в целом. В настоящей работе основной акцент делается на рассмотрении конкретной реализации процедуры распределения доходов (прибыли) организации в рамках ее финансовой структуры, т.е. процедуры распределения доходов (прибыли), получаемых фирмой среди ее подразделений с учетом финансовой структуры организации. В работе делается предположение, что взаимосвязь между отдельными центрами прибыли является весьма слабой или вовсе отсутствует. Из этого предположения следует, что процедура распределения прибыли между подразделениями может быть редуцирована до процедуры распределения прибыли между одним центром прибыли и единственным центром затрат (Центр). Это, в свою очередь, означает, с одной стороны, отсутствие прямой финансовой зависимости центров друг от друга, а с другой стороны, то, что даже если перераспределение финансового результата между центрами прибыли все-таки существует, то оно осуществляется через Бюджет. Общая схема процедуры распределения дохода от деятельности i-го центра прибыли Di между Бюджетом и центром прибыли может иметь вид, представленный на рисунке 1. Дадим расшифровку обозначений, приведенных на рисунке 1: Di – доход, полученный i-ым центром прибыли; ki(Di) - коэффициент распределения дохода между i-ым центром прибыли и единственным центром затрат (Бюджетом); в соответствии с [1], величина ki является функцией Di; Ni – налоги, уплаченные организацией за расчетный период и относящиеся к деятельности i-го центра при51
были; Bi – накладные расходы (транспорт, связь, организация функционирования), относящиеся к деятельности i-го центра прибыли; Vi – коммерческие расходы (выставки, реклама) по i-му центру прибыли; Ri – расходы по развитию i-го центра прибыли; Zi – зарплата сотрудников i-го центра прибыли за расчетный период; Ai – арендная плата за офисные и складские помещения, занимаемые (используемые) i-ым центром прибыли, включая их охрану; Pi – прибыль, остающаяся в распоряжении i-го центра прибыли; Pc(Di) – прибыль от деятельности i-го центра прибыли, поступающая в бюджет организации. Di ki(Di) -ki*Ni -ki*Bi -ki*Vi -ki*Ri -Zi =Pi
(1-ki(Di))Di -(1-ki)*Ni -(1-ki)*Bi -(1-ki)*Vi -(1-ki)*Ri -Ai =Pc(Di) Рис. 1.
Примечания. 1. Статья “Аренда” в силу входящих в нее расходов на охрану по очевидным причинам оплачивается целиком из Бюджета. 2. Статья “Развитие” в зависимости от принятой внутрифирменной политики в различные периоды времени и в различных ситуациях может целиком ложиться на Бюджет или на соответствующий центр прибыли. Литература 1. Гаспарян Э.Э., Заложнев А.Ю., Клыков А.Ю. Внутрифирменная финансовая структура и финансовые процедуры / Сборник трудов “Управление большими системами”. Выпуск 7. М.: ИПУ РАН, 2004. С. 10 – 16. 52
ЧАСТНАЯ ЗАДАЧА ОПТИМИЗАЦИИ СРОКОВ ПРИ УПРАВЛЕНИИ ПРОЕКТАМИ Маркаров Д.А. (Институт проблем управления РАН, Москва) Введение В соответствии с определением, приведенным в [2], «проект – ограниченное во времени целенаправленное изменение отдельной системы с установленными требованиями к качеству результатов, возможными рамками расхода средств и ресурсов и специфической организацией». На сегодняшний день теория управления проектами (УП) является бурно развивающимся разделом теории управления социально-экономическими системами. Ниже в статье содержится описание частной модели управления проектом по разработке программного обеспечения и решение в ее рамках задачи о минимизации сроков. Постановка задачи Проектом является разработка программного продукта, обладающего функциональностью, необходимой заказчику. Таким образом, выделяются две фазы проекта: сбор информации о требованиях заказчика аналитиком и собственно разработка программного продукта программистом. Человеческие ресурсы заданы, бюджет проекта не учитываем. Полагается, что передача проекта в разработку может быть осуществлена до полного сбора информации о требованиях, но затраты времени на разработку тогда возрастают. Задача минимизации сроков выполнения проекта – это задача поиска момента времени инициация разработки, при которым сроки выполнения будут минимальны. Для формирования модели представим, что проект есть совокупность N требований, которая должна быть полностью выявлена и выполнена. Для выявления аналитику требуется время TY = t Y N , 53
где t Y – время, требующееся на выявление одного требования. Считаем, что интенсивность сбора требований одинакова во время всего выполнения задачи. Аналогично программисту для реализации всего проекта требуется время TW = t W N . Таким образом, при «нормальном» выполнении проекта, когда все требования сначала будут собраны, а затем реализованы, его длительность составит TY + TW . Рассмотрим вариант, в котором реализация проекта начинается до сбора всех требований. Пусть аналитик, собрав K требований из N, передает их на выполнение программисту, а по окончании сбора передает оставшиеся (N – K) требований. Будем считать, что в этом случае на выполнение каждого из первых K требований программисту понадобится то же время t W , что и при обычной работе, а на реализацию каждого из оставшихся (N – ) без потери качества необходимо t W¢ = t W (1 + l )
N-K времени, где l – коэффициент N
«усложнения». Задача заключается в нахождении такого значения K, чтобы общая длительность проекта сократилась по сравнению с «нормальным» выполнением. Решение задачи Итак, из постановки задачи видно, что при досрочной разработке проекта, реализация начинается на ( N - K ) t Y единиц вре-
мени раньше, а программист затратит время Kt W на реализацию первых K требований. Экономия времени DT- = min(( N - K )t Y ; Kt W ) . При этом дополнительно будет затрачено время DT+ = t W l
N -K ( N - K ) . Для того, чтобы K удовN
летворяло условиям задачи, необходимо и достаточно выполнения следующего неравенства: DT- > DT+ . Таким образом, решение задачи сводится к решению двух систем неравенств. Рассмотрим первую, учитывая, что в этом случае DT- = ( N - K )t Y : 54
(1) ( N - K )t Y > t W l (2)
N -K (N - K ) , N
Kt W > ( N - K )t Y .
После преобразования получаем:
N-K tY >l , tW N t K (2*) Y < . tW N - K t Пусть T = Y , при дальнейшем упрощении получаем: tW (1*)
(1**) K > N (1 (2**) K > N
T
l
),
T . 1+ T
Обращаем внимание, что DT- = ( N - K )t Y будет максимально при минимальном K, K не превышает N. Из дальнейшего рассмотрения получаем для этого случая решение:
1 + 4l - 1 T ) Þ N (1 - ) < K < N , 2 l 1 + 4l - 1 T T Î( ; ¥) Þ N ( )< K < N. 2 1+ T T Î (0;
Рассмотрим вторую систему неравенств, учитывая, что в этом случае DT- = Kt W :
N -K (N - K ) , N (4) ( N - K )t Y > Kt W .
(3) Kt W > t W l
После первого преобразования получаем: (3*)
K N-K >l , N-K K
55
tY K . > tW N - K t Пусть T = Y , при дальнейшем преобразовании получаем: tW 2l - 1 (3**) K 2 + KN + N 2 < 0 , l (4*)
(4**) K < N
T . 1+ T
Получаем решение для этого случая:
1 - 2l 2l - 1 2 1 - 2l 2l - 1 2 - ( + ( K Î (( ) - 4N 2 ; ) - 4N 2 ) Ç 2 l 2 l T Ç (0; N )) 1+ T Общее решение будет состоять из объединения решения двух систем. Хотелось бы отдельно отметить, что если у второй системы неравенств существование решения ограничено многими условиями, то у первой оно существует при большом количестве возможных значений параметров. Обобщение модели и задача о существовании решения Мы получили решение для конкретной функции, теперь рассмотрим общую модель. В ней мы поставим задачу нахождения условий, при которых существует решение задачи минимизации сроков проекта, отличное от «нормального» выполнения проекта. Для формирования общей модели представим, что проект есть совокупность N требований, которая должна быть полностью выявлена и выполнена. Пусть эффективность выявления требований аналитиком описывается функцией y(t), причем выявление N требований составляет объем работы Y. Считаем, что эффективность сбора зависит только от времени, затраченного на работу. Аналогично эффективность реализации проекта программистом описы56
вается функцией w( N , K , t ) , где N – общее количество требований, K – количество переданных на реализацию требований. Будем считать, что при «нормальном» выполнении проекта, когда все требования сначала будут собраны, а затем реализованы, программисту потребуется TW времени, а общая длительность составит TY + TW . Формально выпишем ограничения, описывающие задачу, считая t = 0 отдельно для аналитика и программиста в начале выполнения их задач: TY
ò y(t )dt = Y , 0
TW
ò w( N , N , t )dt = W . 0
Рассмотрим вариант, в котором реализация проекта начинается до сбора всех требований. Пусть аналитик, собрав K требований из N, что составило объем работ X и заняло TK времени, передает их на выполнение программисту, а по окончании сбора передает оставшиеся (N – K) требований. Получается следующее: TK
ò y (t )dt = X , 0
TY -TK
ò
w( N , K , t )dt +
TW¢
ò w( N , N , t )dt = W .
TY -TK
0
Определим условия, при которых существует такое K, чтобы общая длительность проекта сократилась по сравнению с «нормальным» выполнением, то есть TW¢ < TW . Рассмотрим граничную ситуацию: TW¢ = TW + TY - TK . Тогда мы имеем: TY -TK
ò 0
w( N , K , t )dt +
TW¢
ò w( N , N , t )dt = W =
TY -TK
57
TY -TK
=
ò
TW
ò w( N , N , t )dt = W
w( N , K , t )dt +
TY -TK
0
Таким образом, условие существования решения задачи можно сформулировать следующим способом: если за время TW сделано больше работы, чем W, то на работу W понадобится меньше времени. Формально это записывается следующим образом: TY -TK
(5)
ò
w( N , K , t )dt +
TW
ò w( N , N , t )dt > W
TY -TK
0
Отсюда следует: TY -TK
ò
w( N , K , t )dt +
TW
ò
w( N , N , t )dt >
TY -TK
0
TW
ò w( N , N , t )dt 0
или TY -TK
TY -TK
0
0
ò w( N , K , t )dt > ò w( N , N , t )dt
Обозначим первообразную по t Ft(t) и ограничим вид функций следующими условиями: w( N , K ,0) = w( N , N ,0) = w( N ,0,0) = 0 , Ft ( w( N , K , t ))(0) = 0 ,
y (0) = 0 , Ft ( y (t ))(0) = 0 . Тогда условие существования решения сведется к следующему:
Ft ( y (t ))(TK ) = X , Ft ( y (t ))(TY ) = Y , Ft ( w( N , K , t ))(TY - TK ) > Ft ( w( N , N , t ))(TY - TK ) . Само
решение будет получено следующим образом: Ft ( y (t ))(TK ) = X , что позволяет нам искать не собственно K, а время TK. Далее:
Ft ( w( N , K , t ))(TY - TK ) - Ft ( w( N , N , t ))(TY - TK ) + + Ft ( w( N , N , t ))(TW¢ ) = W , TW¢ - TK ® min
Таким образом, еще до решения задачи можно определить, существует ли у нее решение. Само решение ищется в каждом конкретном случае исходя из специфики вида функций. 58
Содержательная интерпретация и недостатки модели Решение задачи предполагает предварительную оценку сложности проекта. Выше в статье предлагается математическая модель, в которой оценка уже задана, причем она достоверна (главный недостаток модели). Для заданных функций задача точно решается и приводятся содержательные интерпретации полученных результатов. Содержательно, рассматриваемая при данных ограничениях задача представляет собой выбор оптимального управления проектом, выполняемого внутренним ИТ-отделом компании, задачей которого является максимально быстрое и соответствующее проблемам заказчика (другого отдела компании) решение проблемы по автоматизации деятельности. Предлагаемая модель позволяет оценить различные варианты ведения проекта, нагрузку на людей, выполняющих проект и время, затраченное на выполнение. Дальнейшее развитие модели – оценка оперативного управления проектом в зависимости от изменяющейся оценки сложности, рассмотрение общего вида функций затрат времени, переход к непрерывному случаю. Литература 1. Коновальчук Е.В., Новиков Д.А. Модели и методы оперативного управления проектами. М.: ИПУ РАН, 2004. 2. Воропаев В.И. Управление проектами в России. М.: Аланс, 1995.
59
ОПТИМАЛЬНОСТЬ «КОНВЕЙЕРНОЙ» ИЕРАРХИИ УПРАВЛЕНИЯ Мишин С.П. (Институт проблем управления РАН, Москва)
[email protected] Введение Любая экономическая система состоит из множества организованных некоторым образом сотрудников. Благодаря организации сотрудники действуют на основе определенных процедур и правил (механизмов), что позволяет достичь цели системы. Сотрудники организации специализированы, что повышает их эффективность по сравнению с множеством одиночных (неорганизованных) агентов. Однако взаимодействие сотрудников с различной специализацией должно быть скоординировано для достижения общей цели системы. Это фундаментальная проблема любой организации, поскольку координация требует усилий, направленных на планирование совместной работы, контроль ее результатов, согласование целей отдельных сотрудников и т.д. Для реализации управленческих функций в организации создается иерархия1. С одной стороны, иерархия позволяет снизить издержки взаимодействия сотрудников, например, с помощью планирования и контроля материальных, информационных и других потоков. С другой стороны, реализация управленческих функций требует затрат. В современных экономических системах доля менеджеров, выполняющих только управленческие функции, достигает 40% (см., например, [12]). Поэтому одним из ключевых факторов эффективности экономической системы является оптимальность иерархии, выполняющей управленческие функции с минимальными затратами. 1
Сотрудники на более высоких уровнях иерархии обладают большими правами, чем сотрудники нижних уровней. Это позволяет системе достичь цели даже в случае конфликтов между сотрудниками. 60
В работах [1, 2, 3, 4, 5, 6, 7] рассмотрена достаточно общая математическая модель, позволяющая формально исследовать вопросы оптимальности иерархии. В рамках этой модели в данной работе рассмотрен критерий оптимальности иерархии специального вида – «конвейерной» (последовательной иерархии). Разделы 1 и 2 посвящены краткому описанию модели. В разделе 3 изложен основной результат – достаточное условие оптимальности последовательной иерархии. 1. Менеджеры и иерархии Пусть N={w1,…,wn} – множество исполнителей, которые могут взаимодействовать друг с другом. Через M обозначим конечное множество менеджеров, управляющих взаимодействием исполнителей. Менеджеры необходимы того, чтобы исполнители взаимодействовали друг с другом в соответствии с некоторой технологией. Менеджеры будут обозначаться через m, m' , m' ' , m1 , m2 ,K Î M . У каждого менеджера имеются некоторые «полномочия», в соответствии с которыми он может принимать решения, обязательные для его подчиненных (исполнителей или других менеджеров). Определим подчиненность формально. Пусть V = N È M – все множество сотрудников организации (исполнителей и менеджеров). Тогда определим множество ребер подчиненности E Í V ´ M . Ребро подчиненности (v, m) Î E означает, что сотрудник v Î V непосредственно подчинен менеджеру m Î M . То есть ребро направлено от непосредственного подчиненного к его непосредственному начальнику. Сотрудник v Î V является подчиненным менеджера m Î M (менеджер m является начальником сотрудника v), если существует цепочка ребер подчиненности из v в m. Будем также говорить, что начальник управляет подчиненным, или подчиненный управляется начальником. Теперь можно дать строгое определение иерархии. Определение 1. Ориентированный граф H = ( N È M , E ) с множеством ребер подчиненности E Í ( N È M ) ´ M назовем иерархией, управляющей множеством исполнителей N, если H 61
ацикличен, любой менеджер имеет подчиненных и найдется менеджер, которому подчинены все исполнители. Через W(N ) обозначим множество всевозможных иерархий. Ацикличность означает, что не существует «порочного круга» подчиненности. Определение также исключает ситуации, в которых имеются «менеджеры» без подчиненных, так как это противоречит роли менеджера, который должен управлять некоторыми сотрудниками. Определение требует, чтобы в иерархии был менеджер, который управляет (непосредственно или с помощью других менеджеров) всеми исполнителями. Такой менеджер способен разрешать конфликты между любыми исполнителями. 2.
Подчиненные группы исполнителей и секционная функция затрат. Оптимальные иерархии
Группой исполнителей s Í N назовем любое непустое подмножество множества исполнителей. По определению 1 каждый менеджер имеет по крайней мере одного подчиненного. Начав с любого менеджера m, мы можем двигаться «сверху вниз» к подчиненным менеджера m. В силу ацикличности в конечном итоге придем к подчиненной группе исполнителей. То есть каждому менеджеру m в любой иерархии H подчинена некоторая группа исполнителей s H (m) Í N . Будем также говорить, что менеджер m управляет группой исполнителей sH(m). Ниже в обозначении группы sH(m) мы будем опускать нижний индекс, если ясно о какой иерархии идет речь. Для удобства дальнейшего изложения считаем, что любому исполнителю wÎ N «подчинена» простейшая группа sH(w)={w}, состоящая из самого исполнителя. Также будем говорить, что исполнитель wÎ N «управляет» простейшей группой sH(w)={w}. Очевидно, что для любой иерархии H и любого менеджера m Î M выполнено s H (m) = s H (v1 ) È K È s H (vk ) , где v1,…,vk – все непосредственные подчиненные менеджера m. Для любого подчиненного v менеджера m выполнено s H (v) Í s H (m) . 62
Определение 2. Функцию затрат менеджера m Î M в иерархии H = ( N È M , E) Î W( N ) назовем секционной, если она имеет вид: с(sH(v1),…,sH(vk)), (1) где v1,…,vk – все непосредственные подчиненные менеджера m, sH(v1),…,sH(vk) – группы, управляемые сотрудниками v1,…,vk, c(×) – функция, ставящая в соответствие любому набору групп1 неотрицательное действительное число. Затраты иерархии равны сумме затрат всех ее менеджеров2: c( H ) = åmÎM c( s H (v1 ), K , s H (v k )) . (2) Функцию затрат иерархии (2) также назовем секционной. Иерархию назовем оптимальной, если она минимизирует затраты на множестве W(N ) . Секционная функция затрат иерархии складывается из затрат всех менеджеров, причем затраты каждого менеджера определяются только группами исполнителей (подразделениями организации), которыми управляют непосредственные подчиненные менеджера. Поясним определение секционной функции на примере фрагмента иерархии, изображенного на рисунке 1. Менеджер m управляет группой исполнителей {w1,w2,w3,w4}. При этом m осуществляет управление с помощью двух непосредственно подчиненных менеджеров m1 и m2. Подчиненный m1 управляет группой исполнителей {w1,w2}, а подчиненный m2 управляет группой исполнителей {w3,w4}. Предполагается, что непосредственные подчиненные m1 и m2 справляются со своими обязанностями. В этом случае затраты менеджера m не зависят от того, как именно m1 и m2 управляют подчиненными исполнителями. Например, менеджеры m1 и m2 могут управлять подчиненными исполнителями напрямую или с помощью одного или нескольких подчиненных менеджеров.
1
Функция зависит именно от набора групп sH(v1),…,sH(vk), а не от их порядка. То есть затраты менеджера не зависят от того, в каком порядке пронумерованы его непосредственные подчиненные v1,…,vk. 2 В выражении (2) и ниже одной и той же буквой c (×) обозначается и функция затрат иерархии, и функция затрат менеджера. 63
Это не отразится на затратах менеджера m, так как при «нормальной работе» m управляет напрямую только менеджерами m1 и m2. Согласно определению 2 затраты менеджера зависят только от того, каким образом подчиненная группа исполнителей распределена между непосредственными подчиненными. В рассмотренном примере группа {w1,w2,w3,w4} разделена на две непересекающиеся подгруппы: {w1,w2,w3,w4}={w1,w2} È {w3,w4}, поэтому затраты менеджера m составят с({w1,w2},{w3,w4}). То есть предполагается, что затраты менеджера зависят только от той «секции» («отдела», «звена» и т.п.), которой он управляет непосредственно. На рисунке 1 такая секция состоит из самого менеджера m и его непосредственных подчиненных m1 и m2. От остальной части иерархии затраты менеджера не зависят.
m m1
w1
m2
w2
w3
w4
w5
wn
Рисунок 1. Фрагмент иерархии Кроме того предполагается, что затраты зависят только от объема управленческой работы (например, планирования и контроля), а не от персональных качеств менеджеров. Таким образом, секционная функция не изменяется при перестановке менеджеров, то есть обладает свойством анонимности. В частности это означает, что затраты c({w1,w2},{w3,w4}) менеджера m зависят только от набора групп ({w1,w2},{w3,w4}), а не от того, в каком порядке эти группы записаны (в каком порядке пронумерованы непосредственные подчиненные), то есть c({w1,w2},{w3,w4})=c({w3,w4},{w1,w2}). Кроме анонимности, секционная функция затрат обладает свойством аддитивности, то есть затраты иерархии складываются из затрат менеджеров, каждый из которых управляет одной «секцией» иерархии. 64
Воронин и Мишин (2003), Мишин (2003b) рассмотрели произвольные функции затрат, заданные на некотором множестве иерархий W . Для таких функций удалось обобщить свойства анонимности и аддитивности и доказать, что любая анонимная и аддитивная функция затрат иерархии1 будет секционной. Таким образом, класс секционных функций достаточно широк. В рамках этого класса построены различные модели оптимизации иерархии управления [7], и есть основания полагать, что многие важные эффекты, связанные с иерархиями, могут быть промоделированы с помощью секционных функций. Поэтому важно их изучение и решение задачи об оптимальной иерархии. В данной работе рассмотрено достаточное условие оптимальности иерархии частного вида – «конвейерной» (последовательной) иерархии. 3. Условие оптимальности «конвейерной» иерархии Определение 3. Иерархию назовем последовательной («конвейерной»), если в ней каждый менеджер управляет ровно двумя сотрудниками, хотя бы один из которых является исполнителем. Рассмотрим последовательную иерархию H. Высший менеджер m в H управляет всеми исполнителями: s H ( m) = N . Менеджеру m непосредственно подчинен некоторый исполнитель w' и некоторый менеджер m' , то есть s H (m) = N = s H (m' ) È {w'} . Аналогично, менеджеру m' непосредственно подчинен некоторый исполнитель w' ' и некоторый менеджер m' ' , причем s H (m' ' ) = N \ {w' , w' '} . И так далее. Таким образом, последовательная иерархия имеет вид, приведенный на рисунке 2. На рисунке 2 изображена последовательная иерархия общего вида. В ней исполнители w1,…,wn «расположены» в некотором порядке: сначала исполнитель с номером i1, затем исполнитель с То есть функция c : W ® R+ , отображающая множество иерархий в множество неотрицательных действительных чисел. 65
1
номером i2, и так далее. Здесь (i1,…,in) – некоторая перестановка чисел (1,…,n). То есть в последовательной иерархии имеется n–1 менеджер: M={m1,…,mn-1} (см. рисунок 2). Первый менеджер непосредственно управляет исполнителями wi и wi . Второй 1
2
менеджер непосредственно управляет первым менеджером и исполнителем wi . Третий менеджер непосредственно управляет 3
вторым менеджером и исполнителем wi , и так далее. Высший 4
менеджер mn-1 непосредственно управляет исполнителем wi
n
и
предыдущим менеджером mn-2.
m2
m1
wi
1
wi
2
mn-1
mn-3 mn-2
wi
3
wi
n -2
wi
n -1
wi
n
Рисунок 2. Общий вид последовательной иерархии Интерпретировать последовательную иерархию можно различными способами. Приведем несколько примеров. Менеджеры последовательной иерархии могут выполнять контроль качества конвейерной сборки. Каждый менеджер может контролировать качество деталей, промежуточных узлов или готового изделия. При этом для упрощения контроля (уменьшения затрат) менеджер может использовать результаты предыдущих этапов контроля качества. Например, менеджер m1 может сообщать менеджеру m2 результаты испытаний прочности сварных швов. На основании сообщенных данных менеджер m2 может рассчитать прочность изделия. Без этих данных пришлось бы проводить испытания прочности всего изделия, что привело бы к росту затрат. Таким образом, затраты на контроль качества могут зависеть от порядка, в котором менеджеры контролируют качество работы исполнителей, то есть от перестановки (i1,…,in). Интересна также интерпретация последовательной иерархии как графа обработки информации. Кратко опишем подобные постановки. 66
В работе [11] предложена следующая модель обработки информации менеджерами организации. Предполагается, что по n входам поступает некоторая информация (например, характеризующая состояние организации). Входы можно сопоставить с исполнителями, которые сообщают менеджерам информацию. Менеджеры должны обработать информацию и найти управляющее воздействие, то есть вычислить некоторую функцию. Функция предполагается ассоциативной (например, сложение или взятие минимума). Менеджеры организованы в древовидную иерархию. В результате менеджер получает информацию от непосредственных подчиненных и затрачивает время на вычисление и передачу результата непосредственному начальнику. Затрачиваемое время линейно зависит от числа непосредственных подчиненных. Высший менеджер вычисляет окончательный результат – управляющее воздействие. Каждое дерево характеризуется двумя параметрами – числом менеджеров и временем вычисления воздействия (задержкой). Требуется найти оптимальный баланс между этими параметрами. Например, можно рассматривать функцию затрат от задержки воздействия и от количества менеджеров [10]. Также возможно дополнительное ограничение – информация может поступать периодически. При этом свободные менеджеры могут начинать обработку новой информации в то время, пока остальные менеджеры еще обрабатывают предыдущую информацию. Можно рассматривать задачу построения иерархии с минимальными затратами, которая успевает обрабатывать всю поступающую информацию. Вышеуказанные задачи рассматриваются во многих работах (см., например, [9, 10, 13, 14]. При различных условиях оптимальными будут различные иерархии. В частности, в работе [8] оптимальная иерархия сочетает в себе последовательную иерархию («conveyer belt») и иерархию классического вида, в котором менеджерам следующего уровня подчинены только менеджеры предыдущего уровня. Таким образом, может быть интересна интерпретация последовательной иерархии как графа обработки информации. В последовательной иерархии (см. рисунок 2) сначала свои операции 67
производит первый менеджер, затем второй, и так далее. То есть в каждый момент времени в обработке задействован только один менеджер. Остальные менеджеры в это время простаивают. Итак, последовательная иерархия может соответствовать последовательной обработке информации, поступающей от исполнителей. Подобная иерархия требует большого времени на обработку. Однако последовательная иерархия может справляться с обработкой интенсивного потока информации. Поскольку под обработкой понимается вычисление ассоциативной функции, можно надстраивать любую последовательную иерархию, поскольку для любого порядка исполнителей (i1,i2,…,in) результат вычислений будет одним и тем же. Однако от разных исполнителей может поступать информация, требующая различного времени обработки или затрат на обработку. То есть, последовательная иерархия с минимальными затратами может соответствовать эффективному последовательному вычислению. Рассмотрим задачу поиска последовательной иерархии с минимальными затратами. Во многих частных случаях эта задача решается аналитически (см. [7]). Согласно рисунку 2 последовательная иерархия полностью определяется перестановкой (i1,…,in). Для произвольной секционной функции n! / 2 последовательных иерархий могут иметь различные затраты1. Однако для поиска иерархии с минимальными затратами не требуется сравнивать все эти варианты. В работах [1, 4] построен алгоритм с порядком сложности 2n, позволяющий найти последовательную иерархию с минимальными затратами. Для произвольной секционной функции алгоритм решает задачу за разумное время, если число исполнителей не превышает трех-четырех десятков. С точки зрения структуры обработки информации важна задача построения оптимальной иерархии, вычисляющей не одну, а нескольких функций. Как отмечает Radner [13], в настоящее время 1
Всего имеется n! различных последовательных иерархий. Однако перестановка местами первого и второго исполнителя (см. рисунок 2) не влияет на затраты иерархии. Следовательно, иерархий с различными затратами может быть n!/2. Несложно подобрать секционную функцию, при которой все эти иерархии будут иметь различные затраты. 68
неизвестны методы решения этой задачи. Алгоритм, построенный в работах [1, 4], позволяет находить последовательную иерархию с минимальными затратами, вычисляющую несколько функций (подробнее см. [7]). В работе [7] было введено определение сужающей функции затрат: функция затрат названа сужающей, если для любого менеджера m с непосредственными подчиненными v1,…,vk, k ³ 3 можно без увеличения затрат иерархии переподчинить нескольких сотрудников из v1,…,vk новому менеджеру m1 и непосредственно подчинить m1 менеджеру m. В [7] доказано, что для сужающей функции затрат найдется оптимальная 2-иерархия, в которой у каждого менеджера два непосредственных подчиненных. Рассмотрим ограничение на функцию затрат, при выполнении которого существует оптимальная последовательная иерархия. Это требование сильного сужения. При его выполнении задача об оптимальной иерархии решается вышеуказанным алгоритмом поиска последовательной иерархии с минимальными затратами или аналитически. Приведем формальное определение сильного сужения, а затем поясним его. Определение 4. Сужающую функцию затрат назовем сильно сужающей, если для любых групп s1, s2 из двух или более исполнителей выполнено по крайней мере одно из двух условий: а) для любого w Î s1 : c(s1 , s2 ) ³ c(s1 \ {w}, s2 ) + c((s1 \ {w}) È s2 ,{w}) , b) для любого w Î s 2 : c(s1 , s2 ) ³ c(s1 , s2 \ {w}) + c(s1 È (s2 \ {w}),{w}) . В случае сужающей функции затрат найдется оптимальная 2-иерархия H. Условия a) и b) определения 4 позволяют перестроить H до оптимальной последовательной иерархии. Поясним это перестроение с помощью рисунка 3. Если в 2-иерархии H каждому менеджеру подчинен хотя бы один исполнитель, то это последовательная иерархия (см. определение 3). Иначе рассмотрим менеджера m, которому непосредственно подчинены два других менеджера m1 и m2 (см. рисунок 3a)). Если таких менеджеров несколько, то в качестве m рассмотрим менеджера наиболее низкого уровня. То есть подчиненные менеджеры m1 и m2 непосредственно управляют хотя бы одним исполнителем. На рисунке 3a) менеджер m1 непосредственно управляет 69
исполнителем w¢ и сотрудником v ¢ . Менеджер m2 непосредственно управляет исполнителем w¢¢ и сотрудником v ¢¢ . Свойства сильно сужающей функции (см. определение 4) позволяют без увеличения затрат перестроить иерархию, изображенную на рисунке 3a). Обозначим s1=sH(m1), s2=sH(m2) – группы, подчиненные менеджерам m1 и m2. Тогда сотруднику v ¢ подчинена группа s1 \ {w¢} , сотруднику v ¢¢ подчинена группа s 2 \ {w¢¢} . Если для групп s1 и s2 выполнено условие a) определения 4, то можно перестроить иерархию так, как показано на рисунке 3b). То есть нанять менеджера m3 и непосредственно подчинить ему менеджера m2 и сотрудника v ¢ , а менеджеру m непосредственно подчинить исполнителя w¢ и менеджера m3. До перестроения затраты менеджера m равны с(s1,s2) (левая часть неравенства a) определения 4). После перестроения суммарные затраты менеджеров m3 и m равны c( s1 \ {w¢}, s 2 ) + c(( s1 \ {w¢}) È s 2 , {w¢}) (правая часть неравенства a) определения 4). Затраты остальных менеджеров не изменились. m a)
m
m1
m2 v¢
w¢
m
b)
v¢¢
m3
m1 v¢
m3
c)
m2 v¢¢
m1
m2 v¢
w¢ w¢¢ w¢¢ w¢ Рисунок 3. Перестроение 2-иерархии при сильно сужающей функции
v¢¢ w¢¢
Таким образом, условие a) определения 4 позволило без увеличения затрат непосредственно подчинить менеджеру m исполнителя w' . Аналогично, при выполнении условия b) определения 4 можно без увеличения затрат непосредственно подчинить менеджеру m исполнителя w¢¢ (см. рисунок 3c)). Утверждение 1. Для сильно сужающей функции затрат существует оптимальная последовательная иерархия. 70
Доказательство утверждения 1. Рассмотрим оптимальную 2-иерархию H (которая существует для любой сужающей функции, см. 7). Если в ней некоторые сотрудники v1 и v2 управляют одинаковыми группами, то сотрудника v1 можно переподчинить всем непосредственным начальникам сотрудника v2, а сотрудника v2 удалить. Иерархия при этом останется оптимальной. Итак, считаем, что в H все сотрудники управляют различными группами. Менеджера назовем неправильным, если ему непосредственно подчинены два других менеджера. Если H не содержит неправильных менеджеров, то каждому менеджеру подчинен хотя бы один исполнитель. То есть H – искомая оптимальная последовательная иерархия. Если в H имеются неправильные менеджеры, то будем уменьшать их количество, перестраивая иерархию без увеличения затрат. Рассмотрим неправильного менеджера m, которому подчинены только правильные менеджеры. m имеет двух непосредственных подчиненных m1 и m2. Правильные менеджеры m1 и m2 непосредственно управляют хотя бы одним исполнителем. То есть менеджер m1 непосредственно управляет некоторым исполнителем w¢ и сотрудником v ¢ . Менеджер m2 непосредственно управляет некоторым исполнителем w¢¢ и сотрудником v ¢¢ . Соответствующий фрагмент иерархии выглядит так, как показано на рисунке 3a). Обозначим группы, управляемые менеджерами m1 и m2, через s1=sH(m1) и s2=sH(m2). Сотрудник v ¢ не может управлять исполнителем w ¢ , поскольку в этом случае m1 и v' управляли бы одной и той же группой. То есть s H (v ¢) = s1 \ {w ¢} . Аналогично s H ( v ¢¢) = s 2 \ {w ¢¢} . Если для групп s1 и s2 выполнено условие a) определения 4, то без увеличения затрат можно нанять нового менеджера m3 и непосредственно подчинить ему сотрудников v ¢ и m2. А менеджеру m непосредственно подчинить исполнителя w¢ и менеджера m3. На рисунке 3b) изображен результат перестроения. Новый менеджер управляет группой ( s1 \ {w¢}) È s 2 . До перестроения затраты менеджера m составляли c(s1,s2). В новой иерархии изменились только затраты менеджера m и добавились затраты m3. Таким образом, разница затрат старой и новой иерархии равна 71
c( s1 , s 2 ) - c( s1 \ {w¢}, s 2 ) - c(( s1 \ {w¢}) È s 2 , {w¢}) ³ 0 . Следовательно, затраты не увеличились и полученная иерархия оптимальна. Если для групп s1 и s2 выполнено условие b) определения 4, то можно перестроить иерархию аналогичным образом, непосредственно подчинив менеджеру m исполнителя w¢¢ . На рисунке 3с) изображен результат перестроения. Итак, в случае сильно сужающей функции можно построить оптимальную 2-иерархию, в которой менеджер m будет правильным. В построенной иерархии менеджер m3 может управлять той же группой, что и некоторый менеджер m ¢ . В этом случае менеджеру m можно непосредственно подчинить менеджера m ¢ вместо m3, а менеджера m3 удалить1. Иерархия при этом останется оптимальной, менеджер m останется правильным. Если менеджер m3 был удален или m3 – правильный менеджер, то построена иерархия, в которой на одного неправильного менеджера меньше, чем в исходной иерархии H. Предположим, что в полученной иерархии остался неправильный менеджер m3. В этом случае ему подчинена меньшая группа, чем менеджеру m. То есть вместо неправильного менеджера m появился неправильный менеджер m3, которому подчинена меньшая группа. Можно повторить перестроение, рассматривая менеджера m3 вместо m. Поскольку число исполнителей, подчиненных неправильному менеджеру, постоянно уменьшается, придем в итоге к оптимальной иерархии, в которой на одного неправильного менеджера меньше, чем в исходной иерархии H. Повторяя аналогичные перестроения, будем уменьшать количество неправильных менеджеров. В итоге придем к иерархии без неправильных менеджеров, то есть к искомой оптимальной последовательной иерархии. ■
Утверждение 1 позволяет, проверив для сужающей функции неравенство определения 4, свести задачу об оптимальной иерархии к поиску последовательной иерархии с минималь1
По построению m – единственный непосредственный начальник менеджера m3. Поэтому такое перестроение не изменит групп, которыми управляют менеджеры, оставшиеся в иерархии, и не изменит их затраты. 72
ными затратами. Как указано выше, такая иерархия может быть найдена аналитически или с помощью алгоритмов. Класс сильно сужающих функций значительно уже, чем класс сужающих функций. Однако, в [3, 7] показано что, некоторые функции, интересные с содержательной точки зрения, будут сильно сужающими. Таким образом, утверждение 1 позволяет находить вид оптимальной иерархии для подобных функций затрат. Литература 1. Воронин А. А., Мишин С.П. Алгоритмы поиска оптимальной структуры организационной системы // АиТ. 2002a. №5. С. 120–132. 2. Воронин А. А., Мишин С.П. Моделирование структуры организационной системы. Об алгоритмах поиска оптимального дерева // Вестн. Волг. ун-та. 2001. Сер. 1: Математика. Физика. С. 78–98. 3. Воронин А. А., Мишин С.П. Модель оптимального управления структурными изменениями организационной системы // АиТ. 2002b. №8. С. 136–150. 4. Воронин А.А., Мишин С.П. Оптимальные иерархические структуры. М.: ИПУ РАН, 2003. – 214 с. 5. Мишин С.П. Динамическая задача синтеза оптимальной иерархической структуры // Управление большими системами. Выпуск 3. М.: ИПУ РАН, 2003. С. 55–75. 6. Мишин С.П. Оптимальное стимулирования в многоуровневых иерархических структурах // Автоматика и телемеханика, №5, 2004. С. 96 – 119. 7. Мишин С.П. Оптимальные иерархии управления в экономических системах. М.: ПМСОФТ, 2004. – 205 с. 8. Bolton P., Dewatripont M. (1994) The Firm as a Communication Network. Quarterly Journal of Economics, CIX, pp 809–839. 9. Keren M., Levhari D. (1983) The Internal Organization of the Firm and the Shape of Average Costs. Bell Journal of Economics, 14, pp. 474–486. 10. Keren M., Levhari D. (1989) Decentralization, Aggregation, Con73
11. 12. 13. 14.
74
trol Loss and Costs in a Hierarchical Model of the Firm. Journal of Economic Behavior and Organization, 11, pp 213–236. Marschak T. A., Radner R. (1972) Economic Theory of Teams. New Haven, CT: Yale U. Press. Radner R. (1992) Hierarchy: The Economics of Managing. Journal of Economic Literature, 30, No. 3, pp 1382–1415. Radner R. (1993) The Organization of Decentralized Information Processing. Econometrica, 61, No. 5, pp 1109–1146. Van Zandt T. (1995) Continuous Approximation in the Study of Hierarchies. RAND Journal of Economics, 26, No. 4, pp 575–590.
ОЦЕНКА МОЩНОСТИ ПРОСТРАНСТВА СОСТОЯНИЙ ИЕРАРХИЧЕСКОЙ СТРУКТУРЫ Рожихин П.В.1 (Волгоградский государственный университет, Волгоград) Введение Динамичность организационных систем (ОС) является наблюдаемым свойством, однако разнообразие эмпирических и аналитических моделей организационной динамики говорит скорее о неразвитости соответствующего аналитического аппарата, нежели об их содержательном богатстве. Динамический подход к моделированию больших социально-экономических систем используется достаточно широко в силу их большой динамической определенности, статистической детерминированности и относительной устойчивости тенденций развития. Однако по мере их измельчения традиционный динамический подход становится все менее продуктивным из-за потери ими (регионами, отраслями, организациями, группами и т.п.) самодостаточности, и подчинения случайностям взаимодействия с крупными и детерминированными внешними системами. В их развитии усиливается роль случайностей как внутреннего, так и внешнего происхождения. Особенно трудными для анализа являются модели ОС с переменной структурой. Всякой ОС можно поставить в соответствие ряд взаимосвязанных иерархически-сетевых структур: организационную, функциональную, целевую, управленческую и т.д., при этом вид одной из них может определять правила изменения другой. Попытка решения основной задачи динамики – описания изменений каждой из них во времени – требует адекватного языка описания пространства состояний структур и его топологии, правил изменения состояний, траекторий и т.д. Таким образом, плодотворность динамического подхода к моделированию ОС определяется синхронизацией двух направлений исследований: эмпирического обоснования числа и вида агрегированных гомеостатических функций и синтеза адекватного аналитического аппарата динамики иерархическисетевых структур. 1
Работа выполнена при поддержке гранта 18-2005-а/ВГИ ВолГУ. 75
В настоящей работе представлено решение частной задачи изучения пространства состояний иерархической структуры – оценка мощности его базового подпространства – совокупности деревьев с общими листьями (монодерева) [3]. Эта задача, представляя самостоятельный интерес, в частности характеризует сложность задач управления системами, структуры которых представляются деревьями. 1. Монодерево и число его состояний Мы будем понимать под деревом с корнем r конечный ориентированный граф D=(X,U), удовлетворяющий условиям: 1. из каждой вершины x ¹ r выходит единственная дуга; 2. из r не выходит ни одна дуга; 3. (X,U) не содержит контуров; 4. в каждую вершину D кроме листьев входит не менее двух дуг. Некоторые свойства графов, удовлетворяющих условиям 1-3 были описаны в [1]. В работе [2] достаточно систематично изучались системы, описываемые графами, удовлетворяющими условиям 1-4. Далее в работе будут рассматриваться только деревья в смысле определения, данного выше. Определение. Множество М всех деревьев с общим корнем и листьями назовем монодеревом. Каждый граф этого множества назовем состоянием монодерева. Число листьев монодерева (одинаковое для всех, входящих в него графов) назовем его размерностью. Найдем число состояний монодерева заданной размерности. Обозначим s – размерность монодерева, l (s ) – число различных состояний монодерева размерности s. Очевидно, l (2) = 1 . Также, легко найти l (3) = 4 . Определение. Разбиением целого положительного числа s назовем представление s в виде суммы целых положительных чисел
s = k1 + k 2 + ... + k m , k i > 0 , i = 1, m . Обозначим R(s) множество всех разбиений числа s. Пусть некоторое разбиение числа s состоит из l1 слагаемых, равных k1, l2 слагаемых, равных k2, и так далее lm слагаемых, равных km, то есть 76
s = l1 k1 + l 2 k 2 + ... + l m k m .
Обозначим
такое
разбиение
(k , k ,..., k ) Î R( s ) . Очевидно, любое разбиение числа s можно l1 1
l2 2
lm m
представить в таком виде. Обозначим m (k1l1 , k 2l2 ,..., k mlm ) – количество способов разбиения множества из l1k1 + l2 k 2 + ... + lm k m различных элементов на
l1 + l 2 + ... + l m непересекающихся подмножеств, где l1 подмножеств содержат k1 элементов, l2 подмножеств содержат k2 элементов, и вообще li подмножеств содержат ki элементов, i = 1, m . Кроме того, k i ¹ k j при i ¹ j . Лемма. l l l (1) m (k11 , k 22 ,..., k mm ) =
(l1 k1 + l 2 k 2 + ... + l m k m )! l1 !l 2 !...l m !(k1!) l1 (k 2 !) l2 ...(k m !) lm
Доказательство. Обозначим для краткости n = l1 k1 + l 2 k 2 + ... + l m k m . Требуемое разбиение множества можно провести в два этапа. Сначала разбить множество из n элементов на m непересекающихся подмножеств, где подмножество i содержит l i k i элементов, i = 1, m . Обозначим число способов такого разбиения m 0 . Затем разбить множество из l i k i элементов на li непересекающихся подмножеств, содержащих k i элементов каждое, i = 1, m . Обозначим m i количество способов такого разбиения. Тогда общее число способов разбиения будет равно l l l (*) m (k11 , k 22 ,..., k mm ) = m 0 m1 m 2 ...m m . Найдем m 0 . Первое подмножество можно выбрать C n1 1 способами. После того как первое подмножество выбрано, второе l k подмножество можно выбрать C n2-l21k1 способами. И так далее, lk
после того как выбрано подмножество i - 1 , подмножество i можно lk выбрать C ni-li1k1 -l2 k 2 -...-li -1ki -1 способами. Тогда получим 77
m0 = Cnl k Cnl -kl k ...Cnl -kl k 1 1
2 2
n n
1 1
1 1 -l2 k 2
- ... - l n -1 k n -1
=
n! . (l1k1 )!(l2 k2 )!...(ln kn )!
Найдем m i . Первое подмножество можно выбрать C li ki i спосоk
бами. После того как первое подмножество выбрано, второе подk множество можно выбрать Cli ki i - ki способами. И так далее, после того как выбрано подмножество i - 1 , подмножество i можно выбрать Clki ki i - (i -1) k i способами. Тогда получим
(l l k i )! . В этой величине каждое разбиение ( k i ! ) li множества на подмножества будет учтено l i ! раз, поскольку учиC lki ki i C lki ki i - ki ...C lki ki i -( li -1) ki =
тывался порядок выбора подмножеств. Поэтому
mi =
(l l k i )! . l i ! ( k i !) li
Подставляя найденные значения m 0 и m i ( i = 1, m ) в (*), получим требуемое. Лемма доказана. · Утверждение. Число различных состояний монодерева размерности s ³ 2 равно (2) l ( s ) = å m (k1l1 , k 2l2 ,..., k mlm )(l (k1 ) )l1 (l (k 2 ) )l2 ...(l (k m ) )lm , ( k1l1 , k 2l 2 ,..., k ml m )ÎR ( s )
где сумма взята по всем разбиениям числа s. Доказательство. Предположим, что уже построены всевозможные состояния монодеревьев всех размерностей меньше s и число состояний описывается формулой (2). Построим всевозможные состояния монодерева размерности s. Сначала разобьем множество листьев N на подмножества, мощность которых строго меньше мощности N, всеми возможными способами. Число способов равно m (k1l1 , k 2l2 ,..., k mlm ) . Пусть очередное разбиение состоит из
å
( k1l1 , k 2l 2 ,..., k ml m )ÎR ( s )
подмножеств
N 1 , N 2 ,..., N l1 ,
содержащих
k1
элементов,
N l1 +1 , N l1 + 2 ,..., N l1 +l2 , содержащих k2 элементов, и так далее 78
N l1 + l2 +...+lm -1 +1 , N l1 +l2 +...+ lm -1 + 2 ,..., N l1 + l2 +...+lm -1 + lm , содержащих km элементов. Число таких разбиений m (k1l1 , k 2l2 ,..., k mlm ) . Для каждого множества листьев Ni построим монодерево Mi, i = 1, l1 + l 2 + ... +l m . Размерность каждого монодерева меньше s, поэтому число состояний описывается формулой (1.1). Выберем из каждого монодерева Mi некоторое дерево Di. Из каждого монодерева M 1 , M 2 ,..., M l1 можно выбрать l (k1 ) различных деревьев, из каждого монодерева
M l1 +1 , M l1 + 2 ,..., M l1 + l2 можно выбрать l (k 2 ) различных деревьев и
вообще
из
каждого монодерева M l1 +l2 +...+li -1 +1 , M l1 +l2 +...+li -1 + 2 ,..., M l1 +l2 +...+li -1 +li можно выбрать l (k i )
различных деревьев, i = 1, m . Выбор дерева из любого монодерева не зависит от выбора деревьев из других монодеревьев. Тогда число различных наборов деревьев из монодеревьев
M 1 , M 2 ,..., M l1 +l2 +...+lm равно
(l (k1 ))l (l (k 2 ) )l ...(l (k m ))l 1
2
m
. После
того, как выбран очередной набор деревьев D1 , D 2 ,..., Dl1 + l2 +...+ lm , построим дерево D. Возьмем D1 , D 2 ,..., Dl1 + l2 +...+ lm в качестве поддеревьев дерева D и проведем дугу из корня каждого дерева D1 , D2 ,..., Dl1 + l2 +...+ lm в корень дерева D. Построенное дерево D и будет очередным состоянием монодерева размерности s. Число таких деревьев для заданного разбиения множества листьев N на
подмножества будет равно (l (k1 ) ) 1 (l (k 2 ) ) 2 ...(l (k m ) ) m . Учитывая, что число способов разбиения множества N на подмножества равно m (k1l1 , k 2l2 ,..., k mlm ) , получим для числа состояний l
l
l
å
( k1l1 , k 2l 2 ,..., k ml m )ÎR ( s )
монодеревьев формулу (1.2). Утверждение доказано. Для построения всевозможных разбиений числа можно воспользоваться алгоритмами, изложенными в [4]. В таблице 1 приведены значения для числа состояний монодеревьев малых размерностей.
79
Размерность Число состояний Размерность Число состояний 2 1 8 660 032 3 4 9 12 818 912 4 26 10 282 137 824 5 236 11 6 939 897 856 6 2752 12 188 666 182 784 7 39208 13 2 266 907 739 317 Таблица 1. Число состояний монодерева заданной размерности Заключение Полученные результаты потенциально позволяют оценить мощность виртуального подпространства состояний иерархической структуры. Однако, вычисление числа состояний монодеревьев больших размерностей по формулам (1), (2) практически невозможно. В связи с этим планируется нахождение соответствующих приближенных оценок. Литература 1. БЕРЖ К. Теория графов и ее применения. М.: Иностранная литература, 1962. 2. ВОРОНИН А.А., МИШИН С.П. Оптимальные иерархические структуры. – М.: ИПУ РАН, 2003. – 214 с. 3. ВОРОНИН А.А., РОЖИХИН П.В. Модель структурной динамики иерархических систем / Труды VIII Международной научнопрактической конференции “Системный анализ в проектировании и управлении”. Санкт-Петербург: Нестор, 2004. С. 67 – 68. 4. РЕЙНГОЛЬД Э., НИВЕРГЕЛЬТ Ю., ДЕО Н. Комбинаторные алгоритмы: теория и практика. М.: Мир, 1980.
80
ОБ ОДНОЙ ИГРОВОЙ МОДЕЛИ ЦЕНООБРАЗОВАНИЯ АКТИВОВ НА ФОНДОВОМ РЫНКЕ Старостенко В.В. (Институт проблем управления РАН, Москва)
[email protected] Введение В настоящее время при моделировании ценообразования активов на фондовом рынке наибольшее распространение приобрели два подхода: фундаментальный и технический анализ. Фундаментальный анализ основывается на предположении существования равновесной цены и используется для вычисления справедливой стоимости активов. Неявными предположениями при использовании данного подхода являются гипотеза о полной информированности и рациональности рыночных агентов. Технический анализ состоит в использовании истории торгов на фондовом рынке с целью предсказания будущих значений стоимости активов. В качестве наиболее перспективного направления технического анализа можно выделить эконометрическое моделирование динамики стоимости активов – регрессионный анализ. Данный подход состоит в выборе функциональной зависимости между рыночными переменными, наиболее хорошо согласующейся с реальными данными. Наиболее часто для данной цели используется метод максимального правдоподобия. Однако помимо фундаментального и технического анализа с целью прогнозирования будущей стоимости финансовых активов можно также использовать теоретико-игровой подход. Данный подход основывается на моделировании рынка как активной системы. Игроки – рыночные агенты – формируют спрос на активы на основе своих априорных представлений о ситуации на рынке, а также бюджетных ограничений. В конечном итоге в результате взаимодействия активных агентов на рынке устанавливается цена, балансирующая спрос и предложение актива. 81
Данный подход все более часто используется в работах современных экономистов. Как правило, основной предпосылкой всех данных работ является предположение о типах активных агентов, совершающих действия на фондовом рынке и их структуре информированности. Основы теории рефлексивных игр изложены в [1]. Основополагающей и наиболее широко известной работой в данной области работа Джорджа Сороса «Алхимия Финансов» [2]. Автор высказывает предположение о неверности концепции рыночного равновесия, которая является основной в современной экономической теории и широко используется в фундаментальном анализе. Сорос представляет фондовый рынок как активную систему, в основе функционирования которой лежит понятие рефлексивности. Рефлексивность рынка по Соросу заключается в том, что для каждого агента существуют две функции. Первая функция (активная) представляет собой влияние действий агента на ситуацию на рынке. Вторая функция (когнитивная) представляет собой влияние рынка на действия агента. Таким образом, Сорос утверждает, что рефлексивность является главной характеристикой рынка, которая позволяет моделировать целый ряд процессов, которые невозможно объяснить с использованием стандартного подхода. Ключевыми понятиями здесь являются основной тренд и самоусиливающийся процесс, которые, согласно Соросу определяют динамику стоимости рыночного актива. На основе книги Джорджа Сороса в работе Ф.И. Ерешко [3-5] построена математическая модель, которая связывает две основные переменные фондового рынка: стоимость акции и величину чистой прибыли на одну акцию. Автор моделирует эту связь посредством разностных уравнений. С помощью выбора коэффициентов удавалось получить различные типы динамики стоимости рыночного актива, были также указаны наборы коэффициентов, которые приводят к динамике цены, полностью совпадающей с примерами, описанными Соросом. Основным результатом данной работы является моделирование стоимости активов посредством выбора достаточно небольшого числа коэффициентов. Недостаток модели состоит в том, что она может хорошо описывать динамику лишь в течение очень короткого интервала времени. Для того, чтобы модель описывала рынок в течение продолжительного периода времени необходимо вводить зависимость коэффициентов 82
в модели от времени. Однако, интерпретация коэффициентов в модели крайне затруднительна. На стоимость финансовых активов влияет огромное количество факторов, и редуцирование количества исследуемых факторов до двух вряд ли может быть оправдано. В данной работе используется подход к моделированию фондового рынка как активной системы, в которой присутствуют активные агенты разных типов, обладающие различными представлениями о ситуации на рынке. За основу в работе принята модель американского экономиста А. Шлейфера [7]. В модель фондового рынка вводятся активные агенты, обладающие различными представлениями относительно будущей динамики цен. Рассматриваются два актива, один из которых имеется в ограниченном количестве. Похожие предположения о структуре рынка и информированности рыночных агентов приняты в [6]. Основным результатом работы является выражение в явном виде динамики стоимости этого актива как функции времени в зависимости от параметров модели. 1. Постановка задачи Агенты. Пусть агенты живут два периода времени. В первом периоде они получают единицу денег, которую инвестируют в активы на фондовом рынке. Во втором периоде времени они продают все купленные в первом периоде активы и покупают на вырученные средства потребительские товары. Полезность агентов является функцией вырученных во втором периоде жизни денег и имеет следующий вид: U = -e-g w , где w – количество денег, на которые приобретаются потребительские товары. Агенты имеют одинаковые ожидания относительно динамики цены на активы в последующие моменты времени. Предположим, что имеется два актива: рискованный (unsafe) и безрисковый (safe). Относительно динамики стоимости безрискового актива агенты
p
информированы полностью. Стоимость рискованного актива t с точки зрения агентов следует процессу случайного блуждания и может быть записана в виде: 83
(1) pt +1 = pt + e t +1 , где (2)
e t ~ N (m , s e2 ) .
В действительности же стоимость этого актива определяется рынком таким образом, чтобы уравновесить спрос и предложение актива. В каждом поколении агенты делятся на два типа. Считаем, что каждое поколение состоит из континуума агентов, который моделируется отрезком [0; 1]. Долю l составляют агенты первого типа, которые не обладают полной информацией о структуре рынка. Неосведомленность агентов моделируется тем, что они обладают неправильным представлением относительно того, из каких агентов состоит рынок (не знают о существовании агентов других типов), и предъявляют спрос на актив исходя из максимизации ожидаемой полезности. Долю 1 – l составляют агенты второго типа, которые адекватно информированы о структуре рынка: они понимают, что агенты первого типа составляют рыночную долю l, а также знают о том, что цена товара в каждом периоде времени уравновешивает спрос и предложение на рынке. Активы. Предположим, что первый актив (безрисковый) дает фиксированную доходность r в каждом периоде времени. Предложение данного актива на рынке бесконечно. Второй актив (рискованный) представлен на рынке в ограниченном количестве. Будем считать предложение этого актива равным единице. В каждом периоде времени цена актива определяется из условия баланса спроса и предложения на рынке. Актив второго типа не приносит фиксированной доходности, доходность этого актива определяется лишь изменением его цены. 2. Равновесие Опишем условия, которые определяют баланс на рынке. Выпишем бюджетные ограничения, с которыми сталкиваются агенты: 84
(3) wt +1 = (1 + r ) st + pt +1ut (4) 1 = wt = st + pt ut , где wt – количество денег, которое агент получает в первом периоде жизни ut – количество единиц безрискового актива, которое он покупает st – количество единиц рискованного актива Условие баланса спроса и предложения на рынке рискованного актива может быть записано в следующем виде: 1 2 (5) l1ut + (1 - l1 )ut = 1 Все описанные выше условия вместе с условиями, накладываемыми на действия агентов (решение задачи максимизации ожидаемой полезности) позволяют найти равновесную траекторию цены рискованного актива на рынке. Поэтому рассмотрим поведение агентов. Задача агентов первого типа. Агенты первого типа максимизируют ожидаемую полезность
EtU 1t +1 ® max 1 1
ut , st , с учетом бюджетных ограничений, а также своих представлений относительно будущей динамики цены рискованного актива. Задача агентов второго типа. Агенты второго типа максимизируют ожидаемую полезность
EtU t2+1 ® max 2 2
, с учетом бюджетных ограничений, своих представлений относительно будущей динамики цены рискованного актива, а также условия баланса на рынке, которое не было известно агентам первого типа. ut , st
1 2 (6) lut + (1 - l )ut = 1 . Отметим, что агенты второго типа знают, какую задачу решают агенты первого типа, поэтому они могут решить их задачу максимизации и найти выражения для предъявляемого спроса на рискованный актив. Решение задач агентов. Решим задачу агентов первого типа. Подставляя бюджетные ограничения в задачу максимизации ожидаемой полезности, получаем:
85
{ (7) Et -e
g ((1+ r )(1-ut pt ) +ut pt +1 )
} ® max ut
2
Используем соотношение Ee = e 2 если x ~ N ( m, s ) , а также упростим максимизируемое выражение, исключив из него постоянные множители. После проведения этих операций получим задачу: {m + s }
x
2
1 -g (1 + r )(1 - ut pt ) - g ut pt - g ut m + g 2ut 2s 2 ® min 2 u t (8) решение которой записывается в виде: (9)
ut1opt =
m - pt r gs 2
Проинтерпретируем полученный результат. Решение положительно зависит от переменной m и отрицательно зависит от всех остальных параметров: pt , r , g , s . Результат хорошо соотносится с экономической интуицией. Параметр m представляет собой меру оптимистичности агентов, поэтому чем выше значение этого параметра, тем больший спрос агенты предъявляют на актив, pt – стоимость актива сегодня. Чем выше значение этой переменной, тем ниже спрос на актив. r – доходность безрискового актива, а следовательно и альтернативные издержки от вложения в рискованный актив. Чем выше эти издержки, тем меньше будет спрос на актив. Зависимость решения по g отрицательная, поскольку g представляет собой степень отвращения к риску. Чем выше этот параметр, тем меньше желание агента инвестировать в рискованный актив. s2– мера неопределенности будущей цены. Поскольку агенты избегают риска (функция полезности вогнутая), этот параметр оказывает отрицательное влияние на спрос. Стоит отметить, что спрос на рискованный актив будет 2
положительным только при условии m - pt r > 0 . Это условие говорит о том, что ожидаемое увеличение стоимости рискованного актива должно быть больше того, что агенты могут получить посредством вложения средств в безрисковый актив. Далее мы 86
будем считать, что это условие выполняется, и агенты первого типа предъявляют строго положительный спрос на рискованный актив. Решим задачу агентов второго типа. Из уравнения баланса видно, что агенты второго типа своим выбором спроса на рискованный актив определяют его стоимость в данном периоде времени. Поэтому они могут в явном виде получить функцию стоимости рискованного актива в зависимости от своей заявки и решить задачу максимизации ожидаемой полезности.
l (10)
m - pt r + (1 - l )ut 2 = 1 2 gs m - pt r gs 2 (1 - l )
1- l (11)
ut 2 ( pt ) =
.
Мы получили функцию спроса агентов второго типа на рискованный актив в зависимости от его стоимости. Поскольку эта функция является линейной, введем следующие обозначения и перепишем ее в виде: 2 (12) ut ( pt ) = a + bpt , где
m gs 2 a= (1 - l ) (13) 1- l
l
b= (14)
,
r
gs 2 (1 - l ) .
Эта функция подставляется в задачу оптимизации, решением которой является динамика цены на рискованный актив:
1 -g (1 + r )(1 - ut pt ) - g ut pt - g ut m + g 2ut 2s 2 ® min 2 u t (15) В итоге получается задача 87
-g (1 + r )(1 - (a + bpt ) pt ) - g (a + bpt ) pt 1 -g (a + bpt ) m + g 2 (a + bpt ) 2 s 2 ® min 2 p t (16) Квадратный трехчлен относительно pt имеет вид:
1 pt 2 ( g 2s 2b 2 + g br ) + pt (g ar - g bm + abs 2g 2 ) + const ( pt ) 2 (17) Задача на экстремум имеет решение вида (18)
pt =
bm - ar - abs 2g = const (t ) . (gs 2b 2 + 2br )
После подстановки в параметров a и b получаем: (19)
pt =
m r
-
это
уравнение
выражений
для
gs 2 l r (2 - l ) .
Мы получили выражение для стоимости рискованного актива 2 как функцию от параметров l , g , s , m , r . Стоит отметить, что
зависимость является монотонной по параметрам l , g , s , m , r . Этот результат хорошо согласуется с результатами, полученными в модели А. Шлейфера [7]. Интересным является вывод, что цена актива увеличивается с увеличением доли агентов первого типа (которые обладают меньшим количеством информации) Любопытно также отметить, что цена является положительной функцией от l. Это свидетельствует о том, что чем больше количество слабо информированных агентов, тем более высокая цена в итоге установится. Следует сделать еще одно важное замечание. Поскольку в каждом периоде времени агенты решают одинаковые задачи, и их ожидания относительно будущей динамики стоимости рискованного актива не зависят от того, что они наблюдают в реальности, цена на рискованный актив всегда остается постоянной во времени. В этом заключается основной недостаток модели, который нужно исправлять посредством эндогенизации представлений 2
88
относительно динамики стоимости рискованного актива. Наиболее логичным является предположение о том, что представления агентов относительно динамики цены зависят от того, какие значения стоимости актива наблюдались в прошлом. Рассмотрим модификацию исходной модели, в которой представления агентов относительно будущей цены рискованного актива находятся в зависимости от прошлых значений. Будем считать, что представления агентов описываются следующей зависимостью (20) pt +1 - pt = m + a ( pt - pt -1 ) + e t +1 , где (21) e t +1 – нормально распределенная случайная величина со средним значением 0 и дисперсией s2. Снова рассматривая задачу максимизации ожидаемой полезности агентами первого типа, получаем спрос со стороны этих агентов на рискованный актив в виде (22)
ut1opt =
m + pt (a - r ) - a pt -1 gs 2
Как мы видим, теперь решение является не только функцией цены в данном периоде времени, но также и цены в прошлом периоде. Зная функцию спроса агентов первого типа на рискованный актив, запишем соотношение между ценой на актив и спросом на него со стороны агентов второго типа
1- l (23)
ut 2 ( pt ) =
m + pt (a - r ) - a pt -1 gs 2 (1 - l )
Как и в предыдущем случае, мы можем выразить эту зависимость в виде 2 (24) ut ( pt ) = a + bpt , где
m - a pt -1 gs 2 (1 - l )
1- l a= (25)
89
l (26)
b=
r -a
gs 2 (1 - l )
В итоге получаем уравнение для цены актива, которое является функцией от прошлых значений цены. (27)
pt =
bm - a (r - a ) - ga pt -1b - abs 2g gs 2b 2 + 2b(r - a )
После подстановки в это выражение коэффициентов a и b, получаем уравнение для динамики стоимости рискованного актива в виде (28) pt = A + Bpt -1 , B < 0 Стоит отметить, что при a = 0 получаем решение для случая со статическими ожиданиями. С помощью симуляций при различных параметрах модели получаются следующие виды динамики актива: 2,5 2
1,5
1
0,5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
1,2 1 0,8 0,6 0,4 0,2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
90
1,2 1 0,8 0,6 0,4 0,2 0 1 2 3 4
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
В заключение отметим, что при «улучшении» памяти агентов, т.е. введении в их представления значений стоимости актива в прошлые моменты времени, можно получить колебания более «причудливой» формы. Литература 1. НОВИКОВ Д.А., ЧХАРТИШВИЛИ А.Г. Рефлексивные игры. М.: Синтег, 2003 – 149 с. 2. СОРОС Д. Алхимия финансов. М.: ИНФРА-М, 1999. – 416 с. 3. ЕРЕШКО Ф.И. Моделирование рефлексивных стратегий в управляемых системах. М.: ВЦ РАН, 2001. – 37 С. 4. ЕРЕШКО Ф.И., ЛОХНЫГИНА Ю.В. Исследование моделей рефлексивных стратегий в управляемых системах. М.: ВЦ РАН, 2001. – 37 с. 5. ЕРЕШКО Ф.И., ЛОХНЫГИНА Ю.В. Рефлексивные стратегии в системах управления / Труды Юбилейной международной научнопрактической конференции «Теория активных систем». Общая редакция – В.Н. Бурков, Д.А. Новиков. М.: Синтег, 1999. С. 211 – 213. 6. KYLE A. Continuous Auctions and Insider Trading // Econometrica. 1985. Vol. 53. P. 1315 – 1355. 7. SHLEIFER ANDREI. Inefficient Markets: An Introduction to Behavioral Finance. Oxford University Press, 2000.
91
ПРОБЛЕМЫ УПРАВЛЕНИЯ БЕЗОПАСНОСТЬЮ ПРОЕКТА Тараканов Ю.М. (Московский Государственный Университет Технологий и Управления)
[email protected] Введение: Зачем нужно управлять безопасностью проекта Анализ причин техногенных катастроф в промышленности показывает, что основной причиной случившихся аварий, повлекших человеческие жертвы и разрушения, является недостаточное внимание вопросам, связанным с обеспечением безопасности производства. Особую значимость обеспечение безопасности приобретает при осуществлении проектов, связанных с модернизацией существующего или созданием нового производства, поскольку цель проекта – создание уникального продукта или услуги, отличных в каком-либо контексте от остальных схожих продуктов или услуг. Следовательно, и состав задач, определенных для достижения целей проекта, и пути их решения так же могут быть отличны от ранее применявшихся. Возможность аварий, несчастных случаев – это всегда риск, и поэтому если рассматривать в общем, то управление безопасностью проекта является частью управления риском проекта. При управлении безопасностью проекта используются аналогичные подходы и методы, как и при управлении риском проекта, описанные в [3], [5]. Однако, существуют и некоторые специфические черты, свойственные управлению безопасности, которые в гораздо большей степени проявляются при внедрении проектов в таких областях, как атомная энергетика, химическая промышленность и других, когда последствия аварий несопоставимы с ожидаемой 92
выгодой и, следовательно, обеспечение безопасности1 при внедрении проектов в таких областях является одной из приоритетных задач. В этих случаях следует рассматривать управление безопасностью проекта как отдельную подструктуру управления проектами, основной задачей которой является оценка достаточности существующего уровня безопасности: · здоровья и жизни участников проекта и персонала основного производства, где внедряется проект, · способности оборудования и сооружений, применяемых в проекте или находящихся в зоне внедрения проекта, выполнять проектные функции, · населения и окружающей среды данного региона и систематические действия по его поддержанию и повышению в течении всего времени осуществления проекта. При управлении безопасностью проекта группа (команда) управления проектом, организация, внедряющая проект, и все вовлеченные в проект участники, должны систематически осуществлять комплекс мероприятий, состоящих из: · планирования управления безопасностью проекта, · определения того, в какой области внедрения проекта и какие угрозы вероятнее всего окажут влияние на безопасность проекта (идентификация угроз); · определения значимости каждой из угроз, вероятности их проявления и последствий воздействия, а так же определений требований обеспечения безопасности и оценки уровня безопасности проекта в целом (качественный и количественный анализ безопасности); · определения возможностей и улучшающих шагов для выполнения действий, направленных на выполнение требований обеспечения безопасности или увеличение уровня безопасности при осуществлении поставленных задач проекта, а также ослабления последствий угроз при их проявлении; 1
В данной статье не рассматриваются другие направления обеспечения безопасности при внедрении проекта, например, информационная безопасность и т.п. 93
· ·
действий, направленных на поддержание или увеличение уровня безопасности проекта или ослабления последствий угроз при их проявлении; контроля эффективности выполняемых мероприятий.
Можно выделить, как минимум три черты, присущие управлению безопасностью проекта (в действительности их, конечно, больше) и отличающие его от «классического» понимания управления риском проекта: · Управление риском проекта, как правило, нацелено на выявление и реагирование на угрозы, которые влияют на сроки внедрения, стоимость (затраты, уровень рентабельности) и качество проекта (например, см. стр.7 [1] или стр.817 [2]), в то время как приоритетными задачами управления безопасностью является предупреждение воздействий, которые могут вызвать угрозу здоровью или жизни участников проекта и персонала предприятия (если проект внедряется на действующем предприятии), возможность повреждения или разрушения оборудования и сооружений, применяемых в проекте или находящихся в зоне внедрения проекта, а так же создать угрозу для населения и окружающей среды региона в целом, а в случае проявления угрозы – ответные действия, предусматривающие смягчение воздействия на вышеуказанные объекты. Все действия, направленные на сокращение сроков внедрения проекта, уменьшение затрат и т.п. должны рассматриваться через призму обеспечения безопасности: к каким угрозам это может привести и насколько вероятно проявление таких угроз. · Управлением риском проекта, как правило, занимается группа профессионалов, входящих в команду внедрения проекта, а остальной персонал выполняет их рекомендации, в то время как в управлении безопасностью проекта безопасность обеспечивают не только группа внедрения проекта, но все работники, вовлеченные в проект. · Постоянное стремление группы управления проектом и вовлеченных в него организаций в течении всего срока внедрения проекта осуществлять действия, направленные на повышение безопасности. 94
Управление безопасностью проекта осуществляется через концепцию Культуры безопасности. Термин «Культура безопасности» был впервые использован в атомной энергетике после аварии на Чернобыльской АЭС в «Итоговом докладе Международной консультативной группы по ядерной безопасности о совещании по рассмотрению причин и последствий аварии в Чернобыле», который был опубликован МАГАТЭ в качестве Серии изданий по безопасности, № 75INSAG-1, в 1986 году [4]. В последующие годы концепция Культуры безопасности была развита и в настоящее время является фундаментальным управленческим принципом в атомной энергетике. Принято следующее определение Культуры безопасности: «Культура безопасности – это такой набор характеристик и особенностей деятельности организаций и поведения отдельных лиц, который устанавливает, что проблемам безопасности АЭС, как обладающим высшим приоритетом, уделяется внимание, определяемое их значимостью». Следует отметить, как минимум, две важные составляющие Культуры безопасности: во-первых, каждый работник в полной мере должен осознавать последствия, к которым может привести некачественное или несвоевременное выполнение им своих обязанностей, а во-вторых, обеспечение безопасности при выполнении работ является как для организации в целом, так и для каждого работника осознанным и наивысшим приоритетом. Управление безопасностью проекта должно осуществляться постоянно в течении всего срока осуществления проекта на всех его уровнях организации и этапах выполнения (разработки концепции, планирования, производства работ и завершения проекта) и охватывать все ресурсы проекта (персонал, процедуры, средства внедрения). Стадии управления безопасностью проекта приведены на рис. 1.
95
ПЛАНИРОВАНИЕ УПРАВЛЕНИЯ БЕЗОПАСНОСТЬЮ
ОПРЕДЕЛЕННИЕ ОБЛАСТЕЙ, В КОТОРЫХ БЕЗОПАСНОСТЬ ПРОЕКТА НЕДОСТАТОЧНО ОБЕСПЕЧЕНА, И ИДЕНТИФИКАЦИЯ УГРОЗ
КАЧЕСТВЕННЫЙ И КОЛИЧЕСТВЕННЫЙ АНАЛИЗ БЕЗОПАСНОСТИ: ОПРЕДЕЛЕНИЕ ЗНАЧИМОСТИ КАЖДОЙ ИЗ УГРОЗ, ВЕРОЯТНОСТИ ИХ ПРОЯВЛЕНИЯ И ПОСЛЕДСТВИЙ И ОЦЕНКА БЕЗОПАСНОСТИ ПРОЕКТА В ЦЕЛОМ
ПЛАНИРОВАНИЕ РЕАГИРОВАНИЯ НА УГРОЗЫ: РАЗРАБОТКА МЕТОДОВ И ПРОЦЕДУР ОБЕСПЕЧЕНИЯ И ПОВЫШЕНИЯ УРОВНЯ БЕЗОПАСНОСТИ ПРОЕКТА И РЕАГИРОВАНИЯ НА УГРОЗУ ПРИ ЕЕ ПРОЯВЛЕНИИ
ОСУЩЕСТВЛЕНИЕ ДЕЙСТВИЙ ПО ОБЕСПЕЧЕНИЮ И ПОВЫШЕНИЮ УРОВНЯ БЕЗОПАСНОСТИ ПРОЕКТА И РЕАГИРОВАНИЕ НА УГРОЗУ ПРИ ЕЕ ПРОЯВЛЕНИИ
КОНТРОЛЬ ЭФФЕКТИВНОСТИ ОСУЩЕСТВЛЕННЫХ ДЕЙСТВИЙ НЕТ Действия выполнены в полном объеме и достаточны для обеспечения или повышения безопасности проекта, а влияние угрозы (при ее проявлении) минимизировано
ДА
Систематические действия по идентификации признаков угроз и реагированию на них в период выполнения проекта для обеспечения и повышения уровня безопасности
Рис. 1. Стадии управления безопасностью проекта 96
1.
Планирование управления безопасностью
Команда управления проектом и руководители привлеченных организаций в своей деятельности должны демонстрировать приверженность Культуре безопасности, нацеленность на постоянную разработку и выполнение мероприятий, направленных на повышение безопасности в ходе выполнения проекта. Внутри команды управления проекта и организаций, вовлеченных в проект, должно быть четкое распределение ответственности за обеспечение безопасности проекта на всех его этапах, исключающее дублирований функций, а так же областей, в которых ответственность не определена. Должны быть назначены работники, ответственные оценку уровня безопасности, контроль своевременности и достаточности исполнения корректирующих мероприятий. Руководитель проекта и работники группы управления проектов, ответственные за управление безопасностью проекта, должны осуществлять свою деятельность в тесном контакте с руководством организации, внедряющей проект, и ее работниками, ответственными за обеспечение мер безопасности и выполнение мероприятий в случае чрезвычайных ситуаций (как правило, это начальник Штаба по гражданской защите и чрезвычайным ситуациям, а так же технологический/оперативный персонал, ответственный за безопасную эксплуатацию оборудования и сооружений, на которых внедряется проект или находящихся в зоне его внедрения). Должен быть определен порядок рассмотрения вопросов безопасности (форма рассмотрения (оперативные совещания внутри группы управления проектом с участием/без участия персонала организации, внедряющей проект, время и место встречи). Рассмотренные вопросы, решения и поручения (с определением исполнителя и срока исполнения) должны протоколироваться, а исполнение контролироваться. 2.
Определение областей, в которых безопасность проекта недостаточно обеспечена, и идентификация угроз 97
Качественный анализ безопасности состоит в определении того, в какой области внедрения проекта и какие угрозы наиболее вероятно повлияют на безопасность людей и оборудования, вовлеченных в проект или находящихся в зоне внедрения проекта, а так же населения и окружающей среды того региона, где внедряется проект, и в документировании характеристик каждой из них. В период внедрения проекта идентификация возможных угроз должна выполняться систематически. При анализе областей наиболее вероятного проявления угроз, идентификации самих угроз и последующем анализе их значимости следует учитывать такие факторы, как: · область, в которой внедряется проект, а так же требования нормативных актов, определяющих требования к обеспечению безопасности в данной области, · особенности производства (как правило, большинство проектов внедряются уже в условиях действующего производства) и окружающей среды, · специфика региона, в котором внедряется проект, в том числе возможность влияния внешних угроз (ураганы и другие стихийные бедствия), · организационная структура управления проектом, включая распределение обязанностей в группе управления проектом, а так же ее взаимодействие с заказчиком проекта и другими организациями и отдельными лицами, вовлеченными в проект, · приверженность Культуре безопасности внутри организации, внедряющей проект, и организаций, осуществляющих его внедрение, · достаточность и качество процедур, определяющих требования обеспечения безопасности к внедряемому проекту, · квалификация персонала, задействованного в проекте, в том числе противоаварийная подготовка, · технический уровень оснащенности организаций, участвующих в проекте, и т.п. Идентификация угроз может быть произведена путем определения причин – следствий (что может случиться и к чему это 98
приведет) или следствий – причин (каких последствий надо опасаться и как их можно избежать). Должна оценивается так же вероятность возникновения угрозы и на каком этапе внедрения проекта (при выполнении каких работ) она может проявиться, диапазон возможных последствий, предвидение частоты (т.е. может ли это случиться более одного раза). Важно определить как можно более полно все возможные угрозы на начальном этапе проекта – разработке его концепции, тогда и последующие меры обеспечения безопасности проекта и действия в случае проявления угроз могут быть определены заранее и учтены при разработке и выполнении графика внедрения проекта. При идентификации угроз и последующему реагированию на них полезным является предыдущий опыт членов команды управления проектами и других специалистов, которые имеют необходимые знания и опыт. Результатом идентификации является сформированный список, в котором возможные угрозы классифицируются по источникам их возникновения, области их воздействия (персонал, оборудование и сооружения, население, окружающая среда) и вероятности проявления. 3. Качественный и количественный анализ безопасности: определение значимости каждой из угроз, вероятности их проявления и последствий и оценка безопасности проекта в целом ·
·
Определение значимости угрозы включает: определение значимости и приоритетности (качественный анализ): какие угрозы имеют значительное влияние (например, угроза здоровью или жизни персонала, воздействие на окружающую среду), а какие среднее или незначительное влияние. определение возможных последствий угрозы и оценки их влияния на безопасность работников, способности оборудования и сооружений выполнять проектные функции, а 99
· ·
так же населения и окружающую среду (количественный анализ). Итоговая оценка значимости угрозы зависит от: вероятности угрозы - оценки вероятности наступления события. величины последствий наступления угрозы - оценки ущерба в случае наступления события.
Для анализа путей протекания угроз (аварий) и их последствий используются методы моделирования событий. По результатам итоговой оценки значимости возможных угроз команда управления проектом может исключить из дальнейшего рассмотрения угрозы, влияние которых незначительно, а вероятность возникновения мала. Идентификация и определение значимости угроз являются основанием для: · на первой стадии управления безопасностью проекта: определения требований обеспечения безопасности для всех видов деятельности, необходимых для успешного завершения проекта, выбора наиболее оптимальных путей достижения (в т.ч. и с учетом требований безопасности) целей проекта и принятия концепции безопасности проекта, · на второй - разработки и осуществления действий, направленных на выполнение требований обеспечения безопасности при осуществлении поставленных задач проекта, а в случае аварий - действий по смягчению их последствий. Концепция безопасности проекта должна быть документально оформлена. В определенных случаях концепция безопасности разрабатывается в виде технического обоснования безопасности проекта. На рис. 2 показаны основные действия, выполняемые в рамках управления безопасностью проекта на каждом из этапов его осуществления. В качестве примера приведен процесс внедрения модификации в условиях действующего производства.
100
4. Планирование реагирования на угрозы: разработка мероприятий обеспечения и повышения уровня безопасности проекта и реагирования на угрозу при ее проявлении Разработка мероприятий обеспечения и повышения уровня безопасности проекта включает определение действий, направленных на: · выполнение требований обеспечения безопасности проекта (обеспечение требуемого уровня безопасности), · выявление и устранение признаков угроз (повышение уровня безопасности). Действия по выполнению требований обеспечения безопасности затем включаются в график внедрения проекта. Указанные действия направлены на избежание (предупреждение) угрозы (т.е. уничтожение самой угрозы, обычно путем ликвидации ее причины) либо уменьшение вероятности ее возникновения. При выполнении работ нельзя избежать всех опасностей, но некоторые из них все-таки могут быть устранены либо уменьшены (например, выполнение работ не на действующем, а выведенном в ремонт оборудовании, а использование автоматического оборудования при производстве работ снижает вероятность травмирования работников). При разработке мероприятий реагирования в случае проявления угрозы выделяют следующие пути: · Принятие угрозы – признание последствий. Принятие может быть активным (например, действия персонала в соответствии с аварийными симптомно-ориентированными инструкциями в случае проявления угрозы для смягчения ее последствий) или пассивным (например, увеличение затрат на ликвидацию возможных последствий угрозы). · Снижение ожидаемого ущерба путем уменьшения непосредственно величины ущерба (например, путем страхования). Выполнение требований безопасности проекта и систематические действия по повышению уровня безопасности при обеспечении постоянной готовности к действию в аварийной 101
ситуации – это первостепенные задачи в области управления безопасностью проекта, на решение которых должны быть направлены основные усилия команды управления проектом и всего персонала, вовлеченного в проект. Вышеуказанные мероприятия (или методы) можно подразделить на следующие группы: · Организационные – анализ существующей структуры управления проектом, прав и обязанностей руководителей различных уровней позволяет выделить слабые места в организации производства и обеспечить на требуемом уровне выполнение работниками технологической дисциплины, требований правил промышленной, пожарной и (в зависимости от области внедрения проекта) радиационной безопасности. · Технические – применение новых или альтернативных технологий, современного оборудования и специальной оснастки позволяет не только обеспечить качество работ, сократить сроки внедрения проекта, но и обеспечить безопасность персонала, исключить или уменьшить вероятность повреждения действующего оборудования и воздействие на окружающую среду. · Экономические – страхование, создание резервов, контрактные соглашения и т.п., которые предназначены, в основном, для смягчения последствий наступления угрозы. Планирование возможных угроз Планирование возможных угроз включает описание возможных угроз, влияющих на безопасность в ходе внедрения проекта, и соответствующих действий по выполнению требований безопасности (т.е. избежанию (предупреждению) угрозы либо) или повышения уровня безопасности, а при проявлении угрозы - по ее управлению для смягчения последствий. Данные действия оформляются в виде плана мероприятий (действий) обеспечения безопасности. Составной частью плана являются ответные действия на угрозы в случае их проявления. Оценки затрат на выполнение мероприятий обеспечения безопасности Оценки затрат – это количественные оценки возможных затрат на ресурсы, требуемых для обеспечения или повышения 102
безопасности проекта, а так же для ответных действий при проявлении угрозы. Должна быть подсчитана стоимость всех ресурсов, вовлекаемых в выполнение мероприятий безопасности. Это включает в себя (но этим не ограничивается) следующее: стоимость рабочей силы, стоимость разработки документов, стоимость закупки материалов, механизмов и специальной оснастки, а так же следует учитывать возможность инфляции. В случае недостаточности или отсутствия требуемых ресурсов должны быть определены способы их своевременного привлечения. Оценка продолжительности работ Оценки продолжительности работ, связанных с обеспечением безопасности, включают в себя: 1. Для избежания (предупреждения) угроз или уменьшения вероятности их возникновения: · время, необходимое для выполнения конкретных работ, связанных с обеспечением безопасности (например, монтаж дополнительных конструкций, исключающих опрокидывание или падение оборудования при его монтаже, изготовление и установка защитных экранов, обеспечивающих безопасность персонала или предотвращающих повреждение рядом расположенного действующего оборудования, · увеличение времени на выполнение работ по внедрению проекта в связи с обеспечением безопасных условий труда (например, при определенных условиях производства работ (воздействие электромагнитного или радиационного излучения) или при использовании специальных средств защиты, а так же в случае невозможности одновременного выполнения нескольких работ, если при выполнении одной работы имеется угроза здоровью или жизни работников, выполняющих другую работу), · увеличение времени в связи с выполнением требований безопасности технологии производства (например, невозможность одновременного выполнения двух и более ядерно-опасных работ согласно требованиям ядерной безопасности). 103
Данные оценки внедрения проекта.
учитываются
при
разработке
графика
2. В случае проявления угрозы · определяется продолжительность всех действий и их взаимосвязь в зависимости от путей протекания угрозы с учетом специфики действующего производства и защитных мероприятий, · определяется продолжительность всех действий по устранению последствий угрозы. 5. Действия по обеспечению и повышению уровня безопасности проекта и реагирование на угрозу Выполнение плана мероприятий (действий) обеспечения безопасности с целью реагирования на угрозы по ходу выполнения проекта осуществляется по следующим направлениям: действия выполнению требований безопасности проекта (по избежанию/предупреждению угроз) и предусмотренные графиком внедрения проекта, действия по повышению безопасности, а так же ответные действия по смягчению последствий угрозы в случае ее проявления. Основные (но далеко не полные) действия в рамках выполнения мероприятий обеспечения безопасности проекта на этапе производства работ приведены на рис. 2., где 1)
Концепция
·
сформирована группа специалистов в команде управления проектом, ответственных за управление безопасностью проекта, анализ специфики действующего производства, условий окружающей среды, организации и технологии выполнения работ и т.д. определение возможных угроз (аварий), оценка возможных последствий их проявления, определение требований обеспечения безопасности для всех видов деятельности проекта, выбор наиболее оптимальных (в т.ч. и с учетом требований обеспечения безопасности) способов внедрения модификации, принятие концепции безопасности при внедрении модификации
· · · · ·
104
Обеспечена безопасность при приемочных инспекциях и испытаниях Разработан график внедрения проекта с учетом мероприятий обеспечения безопасности
% вы по л не н и я
100 %
Концепция
Разработана концепция безопасности проекта Планирование
2
3
4
1 Производство 1. Подготовка. 2. Вывод из работы оборудования, систем и сооружений, подлежащих модификации.
Завершение внедрения проекта
3. Производство работ по внедрению проекта. 4. Приемка оборудования, систем, сооружений в работу или (для вновь смонтированных) в эксплуатацию.
Рис. 2 Управление безопасностью на каждом из этапов внедрения проекта (на примере внедрения модификации в условиях действующего производства) 2)
Планирование
·
определение действий по выполнению требований обеспечения безопасности, включая действия по избежанию (предупреждению) возможных угроз при внедрении модификации или управлению ими в случае возникновения, разработка плана мероприятий (действий) обеспечения безопасности при внедрении модификации, включая действия при проявлении угрозы, определение влияния действий по избежанию (предупреждению) угроз на ход работ по внедрению проекта, оценка затрат на выполнение мероприятий обеспечения безопасности, анализ достаточности ресурсов, разработка детального графика внедрения модификации с включением действий по обеспечению безопасности
· · · ·
105
3) Производство 1. · · ·
· · ·
Подготовка в организациях, участвующих во внедрении проекта, назначены работники, осуществляющие координацию и контроль действий по обеспечению безопасности, проведение семинаров по Культуре безопасности анализ организации работ в части обеспечения безопасности (маршруты транспортировки грузов исключают их перемещение над работающим оборудованием, складирование материалов исключает повреждение рядом расположенного оборудования, производство работ исключает угрозу здоровью и жизни персонала и повреждение действующего оборудования и сооружений, находящихся в зоне внедрения проекта, применяемые оборудование и механизмы соответствуют требованиям безопасности и т.д.), разработка процедур производства работ с учетом требований обеспечения безопасности и аварийных симптомно-ориентированных инструкций, их валидация и верификация, обучение персонала безопасным приемам выполнения работ и действиям в аварийных ситуациях, аудит подрядных организаций в части их соответствия принципам Культуры безопасности, и т.д.
2. Вывод из работы оборудования, систем и сооружений, подлежащих модификации · разработка программ безопасного вывода оборудования, систем, сооружений из работы, · обеспечение безопасности при выводе оборудования, систем, сооружений из работы. 3. Производство работ · следование рабочим процедурам, неукоснительное и точное исполнение всех работ, связанных с безопасностью, · систематическое проведение противоаварийных инструктажей и тренировок персонала, · систематические обходы рабочих мест с целью выявления несоответствий при производстве работ, влияющих на безопасность персонала, способность оборудования и сооружений выполнять проектные функции, а так же воздействующих на окружающую среду, · анализ организации внедрения проекта с целью выявления признаков снижения уровня Культуры безопасности, · систематические обсуждения с персоналом, участвующем в проекте, выявленных несоответствий и причин их возникновения, · при наступлении угрозы: управление угрозой с целью смягчения последствий, устранение последствий угрозы, · разработка корректирующих мероприятий и контроль своевременности и достаточности их выполнения, и т.д. 4.
Приемка оборудования, систем, сооружений в работу или (для вновь смонтированных) в эксплуатацию · определение мероприятий по безопасности при разработке программ приемочных инспекций и испытаний оборудования, систем и сооружений, · обеспечение безопасных условий при приемочных инспекциях и испытаниях оборудования, систем и сооружений при вводе в работу, · подтверждение готовности к безопасной работе оборудования, систем и сооружений под нагрузкой.
106
4) Завершение внедрения проекта · · · ·
классификация имевших место угроз, влияющих на безопасность, по источникам их возникновения и областям их действия (персонал, оборудование и сооружения, население, окружающая среда и т.д.), обобщение положительного опыта и несоответствий в части управления безопасностью в ходе внедрения модификации, анализ уровня безопасности при внедрении модификации и извлеченные уроки, подготовка сводного отчета.
Разрабатываемые процедуры должны включать требования обеспечения безопасности при производстве работ для предупреждения угроз и порядок действий в случае, когда возникают признаки проявления угрозы. Так же должны быть разработаны процедуры действия персонала в случаях проявления угрозы (например, аварийные симптомно-ориентированные инструкции), которые описывают исходные события возникновения угрозы, возможные пути развития угрозы, конкретные действия персонала для ослабления ее последствий в зависимости от путей развития, а так же конечное состояние объекта. Если внедрение проекта проводится в условиях действующего производства, то требования вновь разрабатываемых в рамках проекта процедур не должны противоречить требованиям безопасности, установленным процедурами, действующими на предприятии. Подготовка персонала должна обеспечивать понимание работниками принципов Культуры безопасности, а так же следование им при выполнении работ. Одно из главных условий обеспечения безопасности – строгое следование рабочим процедурам, неукоснительное и точное исполнение всех работ, связанных с безопасностью, а так же самоконтроль при производстве работ. Вместе с тем работник должен знать, как действовать в случаях, если выявлены несоответствия в процедурах или при выполнении работ обнаружены отступления от требований процедур. Систематически должны проводится инструктажи персонала в части выполнения требований безопасности при выполнении работ и противоаварийные тренировки для обеспечения уверенности подготовленности персонала к действиям в аварийных ситуациях. 107
При этом, если проект внедряется на действующем предприятии, то программы противоаварийных тренировок проекта должны быть увязаны с существующей системой обеспечения аварийной готовности предприятия или являться ее составной частью, а противоаварийные тренировки должны проводиться совместно персоналом предприятия и персоналом, участвующим во внедрении проекта, для отработки совместных действий в аварийных ситуациях. Персонал должен уметь распознать то событие, которое произошло, с целью применения разработанных методов реагирования. Действия персонала, несоответствующие реальной ситуации, зачастую ведут к усугублению последствий проявления угрозы.
6. Контроль действий
эффективности
осуществленных
Контроль эффективности осуществленных действий имеет важное значение для обеспечения безопасности проекта. Он осуществляется путем проверок и аудитов уровня организации работ в процессе внедрения проекта. Цель данных действий: · выявление признаков снижения Культуры безопасности, которые ведут к увеличению вероятности проявления угрозы, (выявление признаков угрозы), · выявление новых, ранее неидентифицированных угроз, · контроль своевременности и полноты выполнения корректирующих мер и анализ их достаточности. Признаками снижения уровня Культуры безопасности, например, являются: · закрытость команды управления проектом, · дублирование ответственности между различными работниками, либо наличие областей, в которых ответственность не определена, · процедурные несоответствия, · использование неквалифицированного и неопытного персонала, · нечеткое понимание исполнителями поставленных задач, · нарушения требований процедур, 108
· · ·
неадекватное решение проблем, повторяемость проблем, нереализуемость корректирующих мер, и т.д. В случае выявления признаков снижения Культуры безопасности проводится анализ причин их появления и разрабатываются корректирующие мероприятия по устранению данных причин. Должен быть организован контроль своевременности и полноты выполнения мероприятий. В случае выявления новой угрозы повторяется базовый цикл идентификации, определения значимости угрозы и реагирования на угрозу. Важно понимать, что даже самый тщательный и полный анализ не сможет выявить все угрозы своевременно и верно, поэтому контроль и анализ уровня организации работ, проверки и аудиты должны осуществляться систематически. Если угроза проявилась в большей степени, чем ожидалось, то необходимо оценить достаточность ранее планируемых действий реагирования на данную угрозу. По результатам оценки принимается решение о необходимости корректировки плана мероприятий обеспечения безопасности. В случае выявления признаков снижения Культуры безопасности или новых угроз, потребовавших корректирующих действий, а так же в случае проявления угрозы необходимо оценить влияние указанных событий на график работ внедрения проекта и, при необходимости, выполнить его корректировку. 7.
Записи и документирование
Все решения и осуществляемые действия на каждой из стадий управления безопасностью проекта должны документироваться в установленном порядке. Должны быть разработаны процедуры, устанавливающие требования к объему и порядку внесения записей, учету и хранению документов. После завершения проекта проводится сводный анализ обеспечения безопасности в ходе выполнения проекта, который является частью общего отчета о выполнении проекта. 109
Записи должны использоваться для истории и анализа с целью выявления положительного опыта и недостатков, учитываемых как на последующих этапах внедрения проекта, так и при осуществлении новых проектов. Заключение Современный бизнес не может развиваться устойчиво, а внедряемые проекты осуществляться максимально эффективно (минимальные сроки внедрения, наименьшие затраты, максимально достижимая выгода) без выявления, оценки значимости и вероятности проявления воздействующих на них негативных факторов и предупреждения их проявления либо снижения до минимально возможного уровня возможных влияний данных факторов). Профессионализм, в первую очередь, руководителя проекта, а так же команды управления проектом и в целом всего персонала, участвующего во внедрении проекта, в современном деловом мире оценивается по многим параметрам, одним из которых и является подготовленность к возможным угрозам. Следовательно, дальнейшее развитие методов управления безопасностью проекта и эффективное их использование на практике является одной из приоритетных задач для успешного развития производства. Литература 1. БУЯНОВ В.П. Управление рисками (рискология) – М.: Экзамен, 2002. – 384 с. 2. МАЗУР И.И., ШАПИРО В.Д., ОЛЬДЕРОГГЕ Н.Г. Корпоративный менеджмент: Справочник для профессионалов. – М.: Высшая школа, 2003. – 1077 с. 3. Руководство к своду знаний по управлению проектами (PMBOK Guide) Редакция 2000 года: Пер. с английского, 2004 Московское отделение Института Управления Проектами (PMI) 4. Серия изданий по безопасности № 75-INSAG-1 «Итоговый доклад Международной консультативной группы по ядерной безопасности о совещании по рассмотрению причин и последствий аварии в Чернобыле», МАГАТЭ, Вена, 1986 5. KENDRICK T. Identifying and Managing Project Risk // AMACOM, 2003. P. 354. 110
МЕТОДОЛОГИЯ СТРУКТУРНОГО АНАЛИЗА И ПРОЕКТИРОВАНИЯ (SADT) КАК ИНСТРУМЕНТ ОПИСАНИЯ СИСТЕМЫ ДИСТАНЦИОННОГО ОБРАЗОВАНИЯ Харитонов И.М. (НОУ Международный Институт Менеджмента ЛИНК, г. Жуковский)
[email protected] Введение Сегодня в России и странах СНГ открытое дистанционное образование (ОДО) находится на этапе бурного практического и теоретического развития. Сложилось ясное понимание невозможности реформирования отечественного образования без учета происходящего в сфере ОДО. Поэтому растет насущная необходимость разработки теоретических моделей, позволяющих находить пути построения, поддержания и совершенствования систем ОДО. В данной статье рассматривается методология структурного анализа и проектирования SADT (IDEF0) как инструмент описания системы дистанционного образования (СДО) с целью моделирования методами теории управления организационными системами (ТУОС). 1. Системы ОДО Открытое дистанционное профессиональное образование определяется в [10] как новая форма непрерывного многоуровневого образования, · построенная на интеграции образовательной, профессиональной и социальной сред и единстве педагогических и организационных оснований, · функционирующая на основе комплекса взаимосвязанных технологий, обеспечивающих однородное качество во всей дистанционной образовательной сети,
111
· ориентированная на развитие компетентности работающих специалистов посредством решения ими актуальных производственных задач и на развитие организаций через развитие персонала. Поскольку одной из целей развития ОДО является обеспечение единого качества образования на разных территориях, основой его осуществления являются сетевые формы организации деятельности ОДО, называемые реализуемые в виде сетей дистанционного образования (СДО). Это необходимое условие осуществления образовательной деятельности в широком географическом пространстве (что приобретает особое значение в России и СНГ). Определяющими признаками такой сети являются ее следующие особенности (см. [10]): · Масштаб сети учреждений дистанционного профиля должен соответствовать масштабу сети студенческой аудитории. · В условиях разнообразия средств и форм дистанционного обучения контроль за образовательным процессом должен осуществляться и возможен только в сфере качества деятельности преподавателей, предоставляемых учебных материалов, средств обучения. · Полная централизованная система управления образовательной средой даже в рамках одного учебного заведения при широкой сети образовательных центров обладает слабой управляемостью. · Условия открытого пространства, в которое превращается образовательная среда при запуске дистанционных технологий образования, побуждают к выстраиванию между образовательными центрами административных отношений, близких к партнерским, нежели к отношениям типа «подчинение». · Многолетняя практика организации учебного процесса показывает, что при удержании контроля за его качеством контроль за финансовыми и юридическими отношениями может быть выстроен на основании общегосударственных законов. С учетом этих особенностей представляется целесообразной следующая организация образовательного учреждения дистанционного профиля (рис. 1): · Базовое учебное заведение (БУЗ) · Региональные учебные центры (РУЦ) базового учебного заведения. 112
РУЦ
РУЦ
РУЦ
Базовое учебное заведение (БУЗ)
РУЦ
РУЦ
РУЦ
РУЦ
РУЦ
Рис. 1. Схема образовательного учреждения в ОДО Региональные учебные центры и их состав формируются в соответствии с требованиями со стороны рынка труда в регионе, а также с учетом предоставляемых студенту способов и уровней обучения. В качестве региональных центров могут выступать существующие или вновь образующиеся: (а) филиалы базового учебного заведения; (б) представительства базового учебного заведения; (в) самостоятельные образовательные учреждения, состоящие в партнерских отношениях с базовым учебным заведением. Основные принципы и закономерности построения СДО были воплощены Международным Институтом Менеджмента ЛИНК (МИМ ЛИНК), российским негосударственным высшим учебным заведением, пионером дистанционного бизнес-образования в странах СНГ и Балтии. Сеть ЛИНК объединяет около 100 учебных центров, расположенных в городах России и ближнего зарубежья. Ее функционирование базируется на единой технологии обучения, программах и стандартах, разработанных Открытым Университетом (ОУ) Великобритании – стратегическим партнером МИМ ЛИНК. Реализация ОДО на основе сетевого принципа организации образовательного учреждения дистанционного профиля позволяет заложить основания для появления организационно мобильных и контролируемых в отношении качества образования образовательных сетей [10]. Упомянутые выше особенности ОДО и СДО показывают что создание, поддержание и развитие СДО отличается 113
значительной сложностью. Поэтому помимо других методов целесообразно воспользоваться возможностями математического моделирования для изучения и разработки СДО. 2. Математическое моделирование СДО В настоящее время управление СДО в основном рассматривается как «отраслевой» раздел менеджмента, основанный на качественных моделях, обобщающих успешный опыт управления конкретными образовательными системами. Тем не менее, представляет интерес применение формальных количественных моделей для процедур принятия решений по управлению СДО. При их создании целесообразно применить математическое моделирование, предусматривающее разработку формальных моделей СДО, позволяющих описывать их состояние в зависимости от управляющих воздействий и, следовательно, решать задачу управления – поиска таких допустимых управляющих воздействий, которые приведут сеть в требуемое (эффективное с точки зрения органа управления) состояние. Разработка таких моделей позволит создать корректно обоснованные программы развития СДО, во-первых, за счет комплексного учета общих принципов управления сложными системами; вовторых, за счет универсальности описания элементов СДО и применения для управления ими современных экономических и организационных механизмов; в-третьих, за счет четкого формулирования введенных предположений, на основании которых делаются выводы об оптимизации СДО. Существенной особенностью многих моделей и методов управления системами образования (включая и дистанционные) является отсутствие учета активности как управляемых объектов, так и управляющих органов. Поэтому представляет интерес построение таких моделей СДО, в которых элементы рассматриваются как обладающие свойством активности. Это понятие включает в себя свободу выбора своего состояния, а также учет собственных интересов и предпочтений, то есть целенаправленное осуществление выбора состояния, поскольку в противном случае их поведение можно было бы рассматривать как пассивное.
114
3. Теория управления организационными системами Решение данной задачи возможно на основе использования подходов и методов теории управления организационными системами – раздела теории управления социально-экономическими системами, изучающего свойства механизмов и их функционирования, обусловленные проявлениями активности участников системы [3]. Базовое учебное заведение (БУЗ) – «центр»
s
x=p(s)
Y
Региональный учебный центр (РУЦ) – «агент»
Рис. 2. Базовая организационная система Пример простейшей организационной системы (ОС) – двухуровневая иерархическая система. В качестве единственного управляющего органа (центра) на верхнем уровне может рассматриваться базовое учебное заведение (БУЗ), в качестве единственного объекта управления (агента) на нижнем уровне – региональный учебный центр (РУЦ). Пусть r – некоторый параметр (r Î W), определяющий условия деятельности РУЦ, известный ему и принимающий значения из допустимого множества W. БУЗ известно лишь допустимое множество W. РУЦ может сообщить БУЗ оценку s Î W параметра r. При этом в общем случае, s ¹ r, то есть РУЦ имеет возможность искажать информацию (манипулировать данными). На основании полученной информации s от РУЦ, БУЗ выбирает в соответствии с некоторой процедурой планирования p(×) план x = p(s) – желательное с точки зрения БУЗ состояние РУЦ. 115
Получив информацию о плане и зная систему стимулирования, РУЦ выбирает свое состояние y Î A (в общем случае, у ¹ x). Таким образом, s ¹ r и у ¹ x – свойства активности (рис. 2). [2] Модель управления СДО, которая учитывает взаимодействие региональных учебных центров друг с другом, а также взаимодействие всех элементов системы с внешним окружением, может быть создана на основе многоэлементной организационной системы (рис. 3). Такая система состоит из n взаимосвязанных агентов на нижнем уровне (региональных учебных центров), одного центра на верхнем уровне иерархии (базового учебного заведения) и окружающей среды. [2]
БУЗ
РУЦ 1
РУЦ 2
…
РУЦ 3
ОКРУЖАЮЩАЯ СРЕДА
ОКРУЖАЮЩАЯ СРЕДА
ОКРУЖАЮЩАЯ СРЕДА
ОКРУЖАЮЩАЯ СРЕДА
Рис 3. Многоэлементная система дистанционного образования Базовое учебное заведение, выражающее интересы системы в целом, решает задачу выбора таких управляющих воздействий, которые побудили бы региональный учебный центр предпринимать определенные действия (получать результаты, выбирать состояния и т.д.). Такое общее описание организационной системы позволяет охватить широкий спектр задач управления СДО. Здесь применима иерархическая структура организационной системы СДО (рис. 4). Управление по вертикали 1-2-3-4 вырабатывается на основе прогнозирования и обратной связи 9,10,11 и 5,6,7,8. Конечно, данная структура СДО достаточно условна и может быть в каждом конкретном случае уточнена. [2] 116
Базовое учебное заведение 1 8 Кафедра 11 2 7 Региональный Учебный Центр 10 3 6 Тьютор (преподаватель-консультант) 9 4 5 Студент
Рис. 4. Иерархическая система дистанционного образования Выше кратко представлены некоторые простейшие схемы. Позволяя моделировать взаимодействие элементов гораздо более сложных реальных систем дистанционного образования, теория управления организационными системами предоставляет средства решения задач организационного управления СДО. 4. Методология структурного анализа и проектирования SADT В качестве промежуточного этапа разработки модели СДО средствами ТУОС может быть выбрано построение функциональной модели СДО [8]. Для этого применима методология структур-
117
ного анализа и проектирования SADT (Structured Analysis and Design Technique [5]), известная также под обозначением IDEF0. SADT возникла в конце 60-х годов в ходе революции, вызванной структурным программированием. Поставив своей целью описание системы в общем, создатели SADT (прежде всего – Дуглас Т. Росс) изобрели графический язык и набор процедур анализа для понимания системы прежде, чем можно представить себе ее воплощение. Таким образом, SADT обычно применяется на ранних этапах создания системы. Большинство применений связано с системами «человек-машина-компьютер» в бизнесе, производстве, обороне, связи и организации проектирования. SADT получил признание как удобный инструмент для описания бизнес-процессов. SADT-модель дает полное, точное и адекватное описание системы, имеющее конкретное назначение. Это назначение, называемое целью модели, вытекает из формального определения модели в SADT: M есть модель системы S, если M может быть использована для получения ответов на вопросы относительно S с точностью A [5]. Отбор информации для отражения в модели определяется заранее сформулированной целью построения модели и точкой зрения, с которой строится модель. Основной элемент SADT-модели представляет функцию системы (рис. 5). Операция преобразования превращает «входы» в «выходы», в соответствии с «управлением», используя «механизмы» (исполнителей). «Управление»
«Вход»
Операция преобразования
«Выход»
«Механизм»
Рис.5. Элемент, являющийся основой модели SADT
118
Рассмотрим схему, относящуюся к SADT-модели одной из подсистем СДО (рис. 6), функция которой – «оказать услугу обучения студента модулю»: · Система осуществляет преобразование входа (входящая стрелка слева) «поступающий на модуль» в выход (исходящая стрелка справа) «выпускник модуля». · Помимо этого, на вход поступает «кадровый резерв». На выходе – «данные о студенте». · Преобразование входов в выходы осуществляется с помощью механизма (стрелка снизу) – «средства подготовки тьюторов». · Правильное прохождение процесса преобразования входов в выходы с помощью механизмов обеспечивается воздействием управления (стрелки сверху) – «утвержденная версия модуля», «процедуры регистрации на модуль», «нормы по выполнению элементов ОДО», «нормы по проведению аттестации». Более детально устройство этой подсистемы показано на следующей схеме (рис. 7): · «Поступающий на модуль» в результате операции «принять поступающего» преобразуется в «поступившего на модуль». · «Поступивший на модуль» в результате операции «обучить поступившего» преобразуется в «обучившегося на модуле». · «Обучившийся на модуле» в результате операции «аттестовать обученного» преобразуется в «выпускника модуля». Выходы одного элемента могут быть входами или управлениями или механизмами для других элементов. Например, выход элемента «Подготовить комплект материалов модуля» – «материалы модуля» – является механизмом для элементов «обучить поступившего» и «аттестовать обученного», и управлением для элемента «подготовить специалистов по ведению модуля». На схеме показаны два типа обратных связей: · Обратная связь по входу возникает, когда выход одной функции становится входом другой. Например, «неаттестованный студент» (выход операции «аттестовать обученного») поступает на вход той же самой операции (на пересдачу экзамена), на вход операции «обучить поступившего» (на повторное обучение отдельных элементов модуля), или на вход «принять поступающего» (когда требуется полностью заново поступить на модуль).
119
· Обратная связь по управлению возникает, когда выход одной операции является управлением для другой. Например, на данной схеме выход операции «аттестовать обученного» – «ОС (обратная связь) по качеству обучения» – в качестве управления воздействует на операцию «обучить поступившего». Таким образом, следуя выбранной цели и точке зрения, можно построить схему, детализирующую функцию преобразования, изображенную в виде одного элемента (рис. 6). В соответствии с правилами SADT схемы сопровождаются пояснительной документацией в строго структурированном формате. В случае необходимости показанные на схеме (рис. 7) элементы могут быть детализированы далее, образуя древовидную структуру схем. Отношения между отдельными схемами модели задаются стрелками – входами, выходами, управлением, механизмами. В результате SADT-моделирования возможно с требуемой степенью детальности выявить и классифицировать отношения участников СДО, связанные с осуществлением основных процессов ОДО. Затем предполагается выделить задачи организационного управления СДО для последующего математического моделирования методами ТУОС. 5. Задачи организационного управления СДО Совокупность правил, процедур и.т.д., регламентирующих взаимодействие элементов организационной системы, представленных на рис. 3, представляет собой организационный механизм управления СДО. С учетом общности описания задач управления сложными социально-экономическими системами задачи организационного управления СДО могут быть классифицированы следующим образом (см. [2]): 1. Формирование структуры и состава СДО, включая «задачи о назначении» или распределении функций. 2. Оценка эффективности деятельности элементов СДО, т.е. выбора критериев оценки, шкал и процедур. 3. Определение процедуры распределения ресурсов (материальных, финансовых, кадровых, учебных единиц и др.) в управляемой системе – при заданной структуре СДО, а также наличии системы сбора и обработки информации. 120
4. Координация и согласование интересов участников СДО (которые могут не совпадать), то есть разработка системы стимулирования (мотивации). 5. Синтез действенного механизма контроля и оперативного управления, позволяющего отслеживать функционирование управляемой системы в реальном времени и вносить коррективы в случае отклонения ее показателей от запланированных. 6. Управление знаниями Практическая реализация предложенного подхода может столкнуться с рядом трудностей, к которым, помимо чисто «технических» сложностей решения оптимизационных задач, относится необходимость обладания достаточной информацией (не только о системе ОДО) и неготовность многих управленцев пользоваться формальными моделями [7, 8]. Тем не менее, в настоящее время получает признание понятие «управление знаниями» (knowledge management) в сфере СДО – систематическое формирование, обновление и применение знаний с целью максимизации эффективности СДО [6]. Специалисты выделяют неформализованное (tacit knowledge) знание, или «неявное» – личное и зависящее от ситуации и поэтому с трудом поддающееся формализации и распространению. Формализованное (explicit knowledge), или кодифицируемое, знание может быть передано средствами формального, систематического языка [9]. Выбор методологии структурного анализа и проектирования SADT (IDEF0) как инструмента описания системы дистанционного образования (СДО) с целью последующего математического моделирования методами теории управления организационными системами (ТУОС) помогает значительно облегчить преобразование неформализованных знаний у практиков ОДО в строго формализованные знания моделей ТУОС. Кроме того, важно обратить внимание на следующее. Систематизация опыта включает в себя выделение типовых ситуаций и управленческих решений, оптимальных или рациональных для этих ситуаций. Поскольку число возможных ситуаций очень велико, для практических целей не имеет смысла тщательно анализировать все возможные варианты. Целесообразно выделять множества «похожих» ситуаций и использовать одинаковые решения для си121
туаций из одного и того же множества. В теории управления такой подход получил название «унифицированного управления» , а соответствующие управленческие решения – «типовых решений» [4]. Особенности СДО (масштабы сети как в смысле числа РУЦ, так и географической протяженности) располагают к применению «типовых решений» там, где это уместно. Осуществление управления знаниями позволяет как развивать банк типовых решений (на основе неформализованных и формализованных знаний), так и внедрять эти типовые решения в конкретных РУЦ. Заключение Поскольку любая модель основана на наборе определенных предположений, то в качестве перспективных направлений дальнейших исследований следует выделить необходимость дальнейшей разработки формальных моделей управления системами ОДО с тем, чтобы можно было решать задачи управления с учетом специфики реальных систем ОДО. Применение при управлении СДО всего арсенала современной теории управления является необходимым условием повышения обоснованности управленческих решений и, следовательно, эффективности функционирования СДО. Управление знаниями предоставляет практические инструменты интеграции формальных моделей управления СДО в работу реальных организаций СДО. Литература 1. БУРКОВ В.Н., НОВИКОВ Д.А. Как управлять организациями. М.: Синтег, 2004. – 400 с. 2. БУРКОВ В.Н., НОВИКОВ Д.А. Модели и механизмы теории активных систем в управлении качеством подготовки специалистов. М.: ИЦ, 1998. – 158 с. 3. БУРКОВ В.Н., НОВИКОВ Д.А. Теория активных систем: состояние и перспективы. М.: Синтег, 1999 – 128 с. 4. ВАСИЛЬЕВ Д.К., ЗАЛОЖНЕВ А.Ю., НОВИКОВ Д.А., ЦВЕТКОВ А.В. Типовые решения в управлении проектами. М.: ИПУ РАН, 2003. – 84 с.
122
5. МАРКА Д., МАКГОУЭН К. Методология структурного анализа и проектирования (SADT) / Пер. с англ. – М: МетаТехнология, 1993. – 240 с. 6. МИЛЬНЕР Б.З. Управление знаниями. М:ИНФРА-М, 2003. – 178 с. 7. НОВИКОВ Д.А. Модели и механизмы управления развитием региональных образовательных систем. М.: ИПУ РАН, 2001. – 83 с. 8. НОВИКОВ Д.А., ГЛОТОВА Н.П. Модели и механизмы управления образовательными сетями и комплексами. М.: Институт управления образованием РАО, 2004. – 142 с. 9. НОНАКА И., ТАКЕУЧИ Х. Компания – создатель знания. Зарождение и развитие инноваций в японских фирмах / Пер. с англ. – М.:ЗАО «Олимп-Бизнес», 2003. – 384 с. 10. ЩЕННИКОВ С.А. Открытое дистанционное образование. М.: Наука, 2002. – 527 с.
123
USED AT:
AUTHOR: И.Харитонов
DATE: 27.01.05
WORKING
PROJECT: 640/700
REV:
DRAFT
23.02.05
READER
DATE CONTEXT:
TOP
RECOMMENDED NOTES: 1 2 3 4 5 6 7 8 9 10
PUBLICATION
Утвержденная версия модуля
Поступающий на модуль
Процедуры регистрации на модуль
Нормы по проведению аттестации Нормы по выполнению элементов ОДО
Выпускник модуля
Оказать услугу обучения студента модулю Данные о студенте
Кадровый резерв 0
Средства подготовки тьюторов
NODE:
TITLE:
Оказать услугу обучения студента модулю
NUMBER:
A-0
Рис. 6. Элемент «Оказать услугу обучения студента модулю» 124
USED AT:
AUTHOR: И.Харитонов
DATE: 28.01.05
WORKING
PROJECT: 640/700
REV:
DRAFT
23.02.05
READER
DATE CONTEXT:
RECOMMENDED NOTES: 1 2 3 4 5 6 7 8 9 10
Утвержденная версия модуля
PUBLICATION
Нормы по выполнению элементов ОДО
Поступивший на модуль
4
Поступающий на модуль
Нормы по проведению аттестации
ОС по качеству обучения Обучить поступившего
Процедуры регистрации на модуль
A-0
Обучившийся на модуле
Тьютор
Выпускник модуля
Аттестовать обученного
Принять поступающего
5 2
Материалы модуля
Подготовить комплект материалов модуля 1
Кадровый резерв
Данные о студенте
Неаттестованный студент
Подготовить специалистов по ведению модуля
Проверяющий экзамен
3
Средства подготовки тьюторов NODE:
TITLE:
Оказать услугу обучения студента модулю
NUMBER:
A0
Рис. 7. Детализация элемента «Оказать услугу обучения студента модулю» 125
СВЕДЕНИЯ ОБ АВТОРАХ Владиславлев Павел Николаевич – аспирант Института проблем управления РАН, Москва,
[email protected]. Воронина Ирина Дмитриевна – аспирантка Волгоградского государственного университета, Волгоград,
[email protected]. Заложнев Алексей Юрьевич – д.т.н., ведущий научный сотрудник Института проблем управления РАН, Москва,
[email protected]. Ермаков Николай Сергеевич – аспирант Самарского государственного аэрокосмического университета, Самара,
[email protected] Иващенко Андрей Александрович – к.т.н., докторант Московского физико-технического института, Москва,
[email protected]. Маркаров Дмитрий Анатольевич – аспирант Института проблем управления РАН, Москва,
[email protected]. Мишин Сергей Петрович – к.ф.-м.н., старший научный сотрудник Института проблем управления РАН, Москва,
[email protected]. Рожихин Павел Владимирович – аспирант Волгоградского государственного университета, Волгорад,
[email protected]. Рыбченко Никита Евгеньевич – аспирант Московского физикотехнического института, Москва,
[email protected]. Старостенко Василий Владимирович – аспирант Института проблем управления РАН, Москва,
[email protected]. Тараканов Юрий Михайлович – аспирант Московского Государственного Университета Технологий и Управления,
[email protected]. Харитонов Игорь Моисеевич – аспирант Международного института менеджмента ЛИНК, Жуковский,
[email protected]. 126