В. В. Давние, В. И. Тинякова
ПРОГНОЗНЫЕ МОДЕЛИ ЭКСПЕРТНЫХ ПРЕДПОЧТЕНИЙ
Издательство Воронежского государственного университета 2005
УДК 681.3.07.+65.01(075.8) ББК 65.23 Д13 Р е ц е н з е н т ы : д-р экон. наук, проф. Д. В. Соколов (Санкт-Петербургский государственный университет экономики и финансов); д-р физ.-мат. наук, проф. А. Б. Секерин (Орловский государственный университет) Давние, В. В. Прогнозные модели экспертных предпочД13 тений: монография / В. В. Давние, В. И. Тинякова; Во ронеж, гос. ун-т. — Воронеж: Изд-во Воронеж, гос. ун-та, 2005. - 248 с. - ISBN 5-9273-0785-х В монографии исследуются проблемы прогнозирования дан ных нечисловой природы. Обостренный интерес к этим пробле мам определяется прежде всего возросшей в современных усло виях потребностью в прогнозных решениях, для надежного обо снования которых недостаточно фактографической информации и требуется использование экспертных эвристик. Предлагается подход, закладывающий основы прогнозирования в номиналь ных и ранговых шкалах и обеспечивающий возможность прове дения комбинированных прогнозных расчетов. Издание ориентировано на слушателей магистерских про грамм, аспирантов и преподавателей экономических вузов, а также всех, кто интересуется прикладными аспектами математи ческого моделирования социально-экономических процессов с учетом экспертных предпочтений. УДК 681.3.07.+65.01 (075.8) ББК 65.23
ISBN 5-9273-0785-х
© Давние В. В., Тинякова В. И., 2005 © Издательство Воронежского государственного университета, 2005
О Г Л А В Л Е Н И Е Предисловие 5 Г л а в а 1. Субъективные измерения в экономике 7 1.1. Основные понятия теории субъективных измерений 7 1.2. Проблемы субъективных измерений 11 1.3. Шкалы измерений 12 Г л а в а 2. Методы экспертного оценивания 19 2.1. Неопределенность и экспертные оценки 19 2.2. Методы индивидуального и группового экспертного оценивания 24 2.3. Проверка согласованности мнений экспертов 33 Г л а в а 3. Эконометрические модели экспертных предпочтений 47 3.1. Экспертные оценки и модели бинарного выбора 47 3.1.1. Концептуальные основы моделирования экспертных предпочтений 47 3.1.2. Эконометрический подход к построению моделей субъективных предпочтений 50 3.1.3. Принципы формирования псевдовыборочных совокупностей 53 3.1.4. Оценка надежности и согласованности результатов моделирования экспертных предпочтений 57 3.1.5. Предельный анализ моделей субъективных предпочтений 62 3.2. Методы оценивания моделей бинарного выбора 65 3.2.1. Метод максимального правдоподобия 65 3.2.2. Численное решение с помощью метода Ньютона — Рафсона 68 3.2.3. Итерационная схема обобщенного МНК (метод Берксона) 69 3.3. Оценка качества пробит- и логит-моделей 74 3.3.1. Адекватность 74 3.3.2. Статистическая значимость коэффициентов 75 3.3.3. Стандартные ошибки предсказанных вероятностей и предельных эффектов 78 3.3.4. Тесты для проверки линейных гипотез 80 3.4. Эконометрический прогноз экспертных предпочтений в задачах выбора наиболее перспективных сегментов рынка 87 3.5. Модели множественного выбора в экспертном оценивании будущего 100 3.5.1. Мультиномиальная логит-модель множественного выбора 100 3
3.5.2. Модели множественного выбора в задачах оценки инвестиционных проектов 107 3.5.3. Пробит- и логит-модели множественного выбора в ранговых шкалах 113 3.5.4. Преференция условий ведения бизнеса на основе прогнозных рейтинговых решений 117 Г л а в а 4. Экспертные оценки в комбинированных прогнозных расчетах 130 4.1. Мультитрендовая модель с вероятностной оценкой вариантов 131 4.2. Прогнозирование прибыли предприятия с помощью комбинированной модели 137 4.3. Адаптивные модели прогнозирования 145 4.4. Имитационное моделирование на основе адаптивной схемы прогнозных расчетов 153 4.5. Адаптивное моделирование переходных процессов в комбинированных прогнозах 160 Г л а в а 5. Комбинированные прогнозы многомерных процессов 172 5.1. Модель с детерминированным матричным предиктором 172 5.2. Модель с настраиваемым параметром матричного предиктора 176 5.3. Модель с адаптивным матричным предиктором 181 5.4. Матричная модель с разделенными переменными 187 5.5. Вычислительная схема комбинированных прогнозных расчетов для многомерных процессов 189 5.6. Многоуровневое комбинированное прогнозирование основных показателей социально-экономического развития региона 204 Заключение 222 Библиографический список 223 Приложения 228 П р и л о ж е н и е 1. Система основных показателей социальноэкономического развития региона 228 П р и л о ж е н и е 2. Основные показатели социальноэкономического развития Воронежской области за 2000—2002 гг., млн р., в ценах соответствующих лет 232 П р и л о ж е н и е 3. Прогнозные оценки основных показателей социально-экономического развития Воронежской области на 2003 г., млн р 235 П р и л о ж е н и е 4. Прогнозные оценки основных показателей социально-экономического развития Воронежской области на 2004 г., млн р 238 П р и л о ж е н и е 5. Прогнозные оценки основных показателей социально-экономического развития Воронежской области на 2005 г., млн р 241
ПРЕДИСЛОВИЕ Российская экономическая наука проявила особое внимание к проблемам прогнозирования после некоторого переосмысления новых условий хозяйствования. Пришло понимание того, что только прогноз как вероятностное представление о перспективах изучаемого объекта в будущем позволяет менеджерам разных уров ней увидеть основные ориентиры происходящих перемен. Это дает им возможность принимать обоснованные решения, поскольку любое управленческое решение в конечном счете является своеоб разной реакцией на прогнозное представление о будущем управля емого объекта. Кроме того, благодаря прогнозам менеджеры по лучают возможность своевременно оценить опасность рисков и уг роз, а следовательно, принять упреждающие меры для избежания "шока будущего". В настоящее время круг задач прогнозирования существенно расширился. Прогноз стал средством определения основных харак теристик, приоритетов и направлений государственной экономи ческой и социальной политики. Более того, в современных усло виях на федеральном и региональном уровнях прогнозные разработ ки стали доминировать над плановыми. Об этом, в частности, свидетельствует Федеральный закон "О государственном прогнози ровании и программах социально-экономического развития Россий ской Федерации" от 20 июля 1995 г., в котором конституционно закрепляется необходимость в научной разработке прогнозов. Фак тически он ориентирует на усиление прогностической направлен ности всех аналитических документов, разрабатываемых властны ми структурами. Логическим следствием усиления роли прогнозирования в реше нии задач современного управления явилось повышение требований к обоснованности и надежности прогнозных оценок. Применение традиционных методов прогнозирования не обеспечивает необходи мого уровня надежности вследствие неопределенности и отсутствия стабильности в социально-экономическом развитии России. Пре одолеть такой барьер можно только в том случае, если наряду с экстраполяционными методами использовать уникальные знания человека и его внутреннюю информацию, не доступную количе ственным методам. Все это требует новых методов и подходов, по зволяющих не только дополнять прогнозные расчеты экспертными оценками, но и применять на регулярной основе прогнозные мо дели экспертных предпочтений. 5
Монография как раз и вводит в круг проблем построения таких моделей. В ней подробно рассмотрены два направления. Одно из них основано на использовании эконометрических моделей каче ственных переменных, а другое — на инкорпорировании эксперт ных ожиданий в расчетные траектории адаптивно-имитационных моделей прогнозирования. В рамках первого направления детально рассмотрены методы построения и тестирования статистической надежности моделей бинарного и множественного выбора. С их помощью удается понять суть прогнозных расчетов в номинальных и ранговых шкалах, а так же дополнить аппарат анализа нечисловых данных процедурами ис следования предельных эффектов. Особый интерес представляет возможность применения этих моделей для предсказания экспертных предпочтений. Практическую реализацию данной возможности предлагается осуществлять с помощью псевдовыборочных совокуп ностей, при формировании которых эксперты должны руководство ваться специально разработанными для этих целей принципами. Второе направление предусматривает построение прогнозных моделей на основе авторского подхода, заключающегося в реали зации идеи комбинирования с распределенным во времени доми нированием адаптивных принципов и экспертных предпочтений. Такой подход позволяет повысить надежность прогнозных расчетов по коротким и нестабильным временным рядам за счет использо вания максимально возможного объема информации. Все расчеты, иллюстрирующие прикладные возможности пред ложенных моделей, проведены с использованием реальных дан ных, а содержательная интерпретация результатов моделирования имеет практическую направленность. Вклад авторов в подготовку материалов монографии распреде лен следующим образом: В. В. Давние, доктор экономических наук, профессор, — предисловие, главы 2, 3 (3.2; 3.3; 3.5), 4 (4.3; 4.4), 5 (5.1; 5.2; 5.3; 5.4), заключение; В. И. Тинякова, кандидат экономических наук, — предисловие, главы 1, 3 (3.1; 3.4; 3.5), 4 (4.1; 4.2; 4.5), 5 (5.5; 5.6), заключение, приложения. Особую признательность авторы выражают своим коллегам из Во ронежского государственного университета — проректору по науке А. С. Сидоркину, декану экономического факультета В. П. Бо чарову, декану факультета международных отношений О. Н. Беленову, зав. кафедрой экономического анализа и аудита Д. А. Ендовицкому, благодаря поддержке которых монография вышла в свет.
6
ГЛАВА 1 СУБЪЕКТИВНЫЕ ИЗМЕРЕНИЯ В ЭКОНОМИКЕ 1.1. Основные понятия теории субъективных измерений В прогнозных расчетах, как правило, приходится оперировать с тремя типами переменных: количественными, ран говыми и номинальными. Причем эти типы переменных могут быть как исходными данными для построения моделей, так и результатами прогнозирования. Поэтому предварительная обработ ка исходных данных, также как и использование прогнозных оце нок в перспективном анализе, требуют специальных подходов в зависимости от типа переменных. Процедуры сравнения и обра ботки данных в этих подходах со всей очевидностью должны адек ватно учитывать природу и характер исходной и расчетной инфор мации. Причем в отдельных ситуациях сравнение осуществляется только по некоторым свойствам, используемым для установления определенного отношения, в котором находятся сравниваемые объекты. В других же случаях для сравнения используются чис ловые величины, соответствующие ожидаемым свойствам, фактам и т.п. Есть ситуации, когда сравнения можно осуществлять с эталоном (единицей измерения). Разработкой методов и подхо дов, обеспечивающих объективность сравнений в различных ситу ациях, занимается теория измерений [34, 45]. Рассмотрим основные понятия теории измерений. Для этого дадим определение следующим терминам: объект измерения, по казатель (признак), процедуры сравнения. Объектами измерения могут быть предметы, явления, решения. В качестве показателей используются характеристики объектов различной природы (пространственно-временные, физические, физиологические, психологические и др.). Процедуры сравнения включают определенные отношения меж ду объектами и способ сравнения объектов. Так как сравнение количественных данных не вызывает затруднений, то рассмотрим сравнение объектов, не имеющих количественного описания. 7
Сравнение таких объектов, как правило, носит качественный характер: "больше", "меньше", "равны", "лучше", "хуже", "одинаковы", "предпочтительнее" и т.п. Способ сравнения оп ределяет, например, сравнение всех объектов последовательно с одним объектом или сравнение всех объектов друг с другом в произвольной последовательности. Для формального описания множества объектов и отношений между ними вводится понятие эмпирической системы с отноше ниями M={0;R), (1.1) где 0={Ор 02, ..., 0п} — множество объектов; R={Rp R2, ..., RJ — множество отношений. Запись OjRkOj означает, что объект О- находится в отношении Rk к объекту О. Такое отношение называется двухместным (бинар ным). Могут быть трехместные отношения. Реально применяемые отношения обычно обладают определен ным набором свойств. В качестве основных свойств можно на звать следующие: 1) отношение R рефлексивно, если О/RО, истинно; 2) отношение R антирефлексивно, если OjROl ложно; 3) отношение R симметрично, если из О/RO- следует OjRO:, 4) отношение R антисимметрично, если из OtRO- и O^ROj следует 0-=0:, 5) отношение R несимметрично (асимметрично), если из ис тинности OJROJ следует, что ОАО; ложно; 6) отношение R транзитивно, если из ОАО; и OjROk следует 0,ROk, где О., Ор ОкеО; 7) отношение R линейно (связно), если для любых Ор Oj€ О либо OJROJ, либо OjRO- истинно, либо они оба истинны. В практике проведения различных исследований часто ис пользуются отношения, обладающие не всем набором свойств, а только некоторыми из вышеперечисленных. Примерами подоб ных отношений являются отношения, определения которых при водятся ниже. Отношение R называется отношением частичного порядка, если оно рефлексивно, антисимметрично и транзитивно. Отношение R называется отношением линейного порядка, если оно рефлексивно, антисимметрично, транзитивно и связно, т.е. отношение линейного порядка, обладающее свойством связности. 8
Иногда рассматривают отношения строго частичного или линей ного порядка, обладающие свойством антирефлексивности, а так же отношения квазипорядка (предпорядка, почти порядка), не обладающие свойством антисимметричности. Отношение R называется толерантностью, если оно рефлек сивно и симметрично. Отношение R называется эквивалентностью, если оно рефлек сивно, симметрично и транзитивно, т.е. эквивалентность — это толерантность, обладающая свойством транзитивности. Интерес вызывают возможные способы представления резуль татов таких сравнений. В принципе информация об отношени ях может быть задана различными способами. Например, можно перечислить объекты, принадлежащие отношению. Но это не всегда удобно. Более распространен матричный способ представ ления информации об отношениях. Суть задания отношения с помощью такого способа в следу ющем. Строки и столбцы матрицы ||/•.. || отношения R соответству ют элементам всего множества объектов, т.е. матрица квадратная. Иногда матрицу отношений обозначают M(R). Пусть R — отношение частичного или линейного порядка. Тогда, если объект Oj предшествует О, т.е. принадлежит отно шению R, то на пересечении /-й строки и у'-го столбца в матри це отношений ставится 1, в противном случае — 0: 1, если (О,, г =i V
Oj)eR; (К2)
О, если (О,, O^tR.
Аналогично, с помощью матрицы ||/v||, можно задать инфор мацию об отношениях толерантности или эквивалентности. Рассмотрим пример матричного задания отношения частично го порядка. С этой целью элементы матрицы, задающей это от ношение, будем определять в соответствии с правилом 1, если (0(, <3;)е R, (0 ; , О,.)г R; О, если (О., 0,)<£ R, (Оп O.W R; \ •> JJ
-1, если (0„0^ёЯ,
V
J
•)
(L3)
(Oj, 0{)eR.
Пусть для пяти объектов задано отношение частичного порядка. Граф, иллюстрирующий это отношение, изображен на рис. 1.1. 9
о.
Рис. 1.1. Граф, иллюстрирующий отношение частичного порядка
о'4
02
^5
Матрица, содержащая информацию об отношении частичного порядка R, в рассматриваемом случае имеет вид ' 0 1 - 1 0
1 1 1Л 0
11
М(Д) = - 1 0 -1-1
0 0 0 0 0 0
-1-1
0 0 0
Аналогично для линейного порядка элементы матрицы задают ся в соответствии со следующим правилом: 1, если (О,, 0,)еЛ, (О,, О,.) «ЕЛ; 0, если (О,., OJ)GR,
(OJ,
0,)е R;
(1.4)
-1, если (О,.,Оу)g Л, ( о я 0,.)еЛ. Подобные правила без труда можно записать для любого другого отношения. Для того чтобы понять, устанавливает или нет эмпирическая система с отношениями некоторый порядок между изучаемыми объектами, необходимо сравнить полученный порядок с числовой системой. С этой целью наша привычная числовая система представляется некой универсальной с отношениями вида H = (N;S), (1.5) где N — множество действительных чисел; S={SP S2, ..., Sm} — множество отношений между числами ("больше", "меньше", "рав но" и т.д.). Числовая система называется полной, если N есть множество всех действительных чисел. 10
Сравнение эмпирической системы с отношением и числовой системой позволяет осуществить "оцифровку" субъективных изме рений. Ниже рассматриваются проблемы, возникающие при трансформации субъективных измерений в количественные. 1.2. Проблемы субъективных измерений Количественные данные, уже являясь элементами чис ловой системы, не требуют специальных процедур своего число вого представления. Проблемы возникают при обработке нечис ловой информации. Чаще других для ее получения используются экспертные методы. Более подробно технология проведения оп росов экспертов и обработки их мнений будут рассмотрены в сле дующей главе. Здесь же условимся, что данные, полученные эк спертным путем, являются результатом субъективных измерений. Основные проблемы субъективных измерений — проблемы представления и единственности. Поясним смысл этих понятий. Проблема представления заключается в доказательстве того, что для эмпирической системы с отношениями, выбранной с целью измерения определенных свойств объектов, можно построить чис ловую систему с отношениями, описывающую свойства объектов и отношений между ними с помощью чисел. Для того чтобы числовая система сохраняла свойства и отно шения объектов, необходимо, чтобы она была изоморфной или, по крайней мере, гомоморфной эмпирической системе. Две системы с отношениями М = (0; /?,, R2, ...,Rk) и Н = (N; 5,, S2, ...,Sm) называются подобными, если число отношений одинаково (к~т) и местность отношений одинакова (например, Ri и Si — дву местные отношения). Эмпирическая система М = (0; Л,, R2, ..., Rk) изоморфна число вой системе с отношениями Н = (./V; Sv S2, ..., Sm), если эти сис темы подобны и существует взаимнооднозначное отображение (фун кция) / объектов на числовое множество такое, что отношение Rk между объектами существует тогда и только тогда, когда имеет место отношение Sk между числами, являющимися отображением объектов на числовую ось. Например, для двухместных отношений 0,0,0-, существует тогда и только тогда, когда имеет место rSjrn где числа гг- получены отображением объектов г{ — f(O), г. = f(O). Условие взаимной однозначности отображения / является в ряде случаев слишком жестким и не всегда необходимым. Если устранить это условие из предыдущего определения, то приходим к понятию гомоморфизма. И
Проблема единственности заключается в определении всех воз можных способов представления заданной эмпирической системы различными числовыми системами. Эта проблема может быть сформулирована как проблема определения типа шкалы. Описа ние этой проблемы начнем с дефиниции шкалы. Шкалой называется совокупность эмпирической системы, чис ловой системы и отображения, т.е. (М, Я, / ) . Обобщая вышесказанное, можно дать следующее определение понятию "измерение". Измерение — процесс, в ходе которого характеристики объекта измерения получают представление (гомо морфное отображение) в некоторой шкале измерений. Пусть (М, Н, / ) и (М, Н, g) — две шкалы с разными от ображениями. Возникает вопрос о взаимосвязи числовых значе ний, полученных с использованием отображений / и g. Напри мер, если /-. = f(Oj), r'.= g(O) и связь между числами задается функцией ф, т.е. г, — (р(г',) или f(0:)= (p[g(0-)], то функцию ср называют допустимым преобразованием шкалы. Свойства функции (р определяют связи между всеми числовыми системами, выбран ными для описания эмпирической системы. Более того, в зави симости от свойств функции ср определяется тип шкалы, что по зволяет провести классификацию шкал измерений. 1.3. Шкалы измерений Каждая из шкал определяется наличием или отсут ствием четырех характеристик: 1) описание; 2) порядок; 3) рас стояние; 4) начальная точка. Описание шкалы предполагает использование единого способа записи информации, т.е. характеризует составляющие шкалу эле менты, например, степень удовлетворенности ("полностью удов летворен", "в общем, удовлетворен", "скорее, не удовлетворен", "совсем не удовлетворен") или семейное положение ("состою в браке", "не состою в браке"). При этом между данными элемен тами не вводится какая-либо характеристика сравнений, а осуще ствляется только идентификация информации. Порядок характеризует наличие отношений в способах записи информации, наличия крайних точек зрения ("очень нравится", "нравится", "не нравится", "очень не нравится"). При этом преду сматриваются некоторые сравнительные характеристики, позво ляющие, например, упорядочить отношение к предмету исследо вания. 12
Расстояние шкалы — измеряемая величина. Это означает, что оно существует только в тех случаях, когда информация определена количественно, а между описанием информации имеются интерва лы, расстояние между которыми имеет смысловое значение. Начальная точка задает уровень соотношений между элемента ми шкалы. Следует различать начальную точку и точку отсчета. Каждая начальная точка является точкой отсчета, но не каждая точка отсчета может быть начальной. Шкала имеет начальную точку, если она имеет единственное начало отсчета. Приведем краткое описание всех типов шкал, используемых в экономических измерениях и позволяющих результаты любых из мерений представлять в количественном виде. Ш к а л а н а и м е н о в а н и й (иногда ее называют: "но минальная шкала", "шкала классификаций", "категориальная шкала", "ординарная шкала") используется для описания принад лежности объекта к определенному классу. Строится эта шкала по следующему правилу: всем объектам одного и того же класса при сваивается одно и то же число, а объектам разных классов — раз ные числа. Шкала классификаций сохраняет отношение эквивалент ности и различия между объектами. Она обладает свойством сим метричности, т.е. отношения, существующие между градациями х, и х2, имеют место и между х2 и х , , и свойством транзитивности, в соответствии с которым если х, = х2 и х2 = х3, то х, = х3. Однако существует большое число способов присвоения чисел классам эквивалентности объектов. В связи с этим понятие един ственности отображения / состоит для данной шкалы в однознач ности допустимого преобразования ср. Это означает, что если имеются два отображения / и g, т.е. два варианта приписывания классам числовых значений, то эти числовые значения должны быть связаны между собой однозначным преобразованием (р. Та ким образом, шкала наименований единственна с точностью до однозначного преобразования. Номинальная шкала широко используется в маркетинговых исследованиях, например, когда респондента просят выбрать из пронумерованного списка наиболее предпочтительный товар. Во прос и варианты ответов в этом случае могут выглядеть следую щим образом: Какой майонез чаще всего Вы покупаете? 1. "Delmy". 2. "Ряба". 3. "Балтимор" Оливковый. 13
4. "Балтимор" Провансаль. 5. "Моя семья". 6. "Слобода" Оливковый. 1. "Слобода" Провансаль. Другим примером использования шкалы наименований являет ся опрос респондентов с целью анализа их социально-демографи ческих характеристик. В этом случае просьбу-вопрос и возмож ные варианты ответов на него можно выразить так: Назовите Ваш род занятий: 1. Предприниматель, коммерсант. 2. Руководитель фирмы, предприятия. 3. Служащий с высшим образованием. 4. Служащий со средним образованием. 5. Квалифицированный рабочий. 6. Неквалифицированный рабочий. 7. На инвалидности. 8. Домохозяйка. 9. Студент, учащийся. 10. Безработный. Ш к а л а п о р я д к а (или ординальная шкала ранга) при меняется для отражения упорядоченности объектов по одному при знаку или их совокупности. Она широко используется при эксперт ном оценивании, проводимом с целью упорядочения объектов, а также при определении предпочтений покупателей, установлении рейтинга того или иного кандидата, измерении полезности, оценки уровня интеллекта и т.д. Для порядковой шкалы допустимым пре образованием ср является любое монотонное преобразование. Числа в этой шкале отражают только порядок следования объектов и не дают возможности сказать, на сколько и во сколько один объект предпочтительнее другого. Это вызвано тем, что в шкалу поряд ка не вводится расстояние как ее элемент. Порядковая шкала может использоваться для "измерения" кри териев отношения к чему-либо. Например: Определите, пожалуйста, Ваше отношение к продегустирован ному майонезу: 1. Очень хороший майонез, буду покупать. 1. Неплохой майонез, буду покупать. 3. Неплохой майонез, но покупать не буду. 4. Майонез не понравился, покупать не буду. 5. В моей семье никто не ест майонез. 6. Я не ем майонез.
Или: Как Вы оцениваете материальное положение Вашей семьи? 1. Не хватает денег даже на еду. 2. Хватает на еду, но покупать одежду не можем. 3. Хватает на еду и на одежду, но не можем покупать доро гие вещи. 4. Можем иногда покупать дорогие вещи, но не можем купить все, что захотим. 5. Можем позволить себе приобрести все, что захотим. Ш к а л а и н т е р в а л о в используется для отражения величины различия между свойствами объектов. Измерения в этих шкалах в известном смысле более совершенны, чем в порядко вых. Применение шкал интервалов дает возможность не только упорядочить объекты по количеству свойства, но и сравнить меж ду собой разности количеств. Таким образом, исследователю пре доставляется возможность не только указать категорию, к которой относится объект по измеряемому признаку, установить его мес то в ранжированном ряду, но и описать его отличие от других объектов, рассчитав разность (интервал) между соответствующи ми позициями на шкале. Ярким примером использования этого типа шкал является измерение температуры в градусах по Фарен гейту и Цельсию. Что касается экономических показателей, то измеряемыми в интервальной шкале можно считать производительность труда, ликвидность, рентабельность, себестоимость и др. Основное свойство этой шкалы — равенство интервалов. В то же время интервальная шкала может иметь произвольные точки отсчета и масштаб. Допустимым преобразованием является линейное, т.е. эта шкала единственна с точностью до линейного преобразования (р(х) = ах + Ь. В качестве примера использования интервальной шкалы можно привести ситуацию, когда респондента просят оценить в баллах тот или иной товар или какую-либо его характеристику: Оцените, пожалуйста, продегустированный майонез по 10-балль ной шкале: № пробы Балл
№
№
№
Однако не всякую балльную шкалу можно считать шкалой рав ных интервалов. Так, например, для большинства студентов раз15
ница между двойкой и тройкой существенно больше, чем между четверкой и пятеркой, так как получение двойки неизбежно вле чет пересдачу экзамена. Следовательно, данная пятибалльная шкала является порядковой, а не интервальной. Но в общем случае, если нет резких границ между некоторыми оценками, балльную шкалу допустимо рассматривать в качестве интервальной. Ш к а л а о т н о ш е н и й (или пропорциональная шка ла) применяется для измерения массы, длины, веса. В ней числа отражают отношения свойств объектов, т.е. во сколько раз свойство одного объекта превосходит это же свойство другого объекта. Допустимым преобразованием этой шкалы является пре образование подобия ф(х) = ах. Фактически шкала отношений представляет собой частный случай шкалы интервалов при выборе нулевой точки в качестве начала отсчета. Примерами таких шкал являются следующие формулировки вопросов, задаваемых респондентам в процессе проведения мар кетинговых исследований: Пожалуйста, укажите Ваш возраст: лет. Приблизительно укажите, сколько раз за последний месяц Вы делали покупки в дежурном магазине от 20 до 23 ч: 0 12 3 4 5. Другое число раз Ш к а л а р а з н о с т е й используется для измерения свойств объектов при необходимости выражения, на сколько один объект превосходит другой по одному или нескольким признакам. К этой шкале относятся логарифмические и процентные шкалы, а также другие шкалы, задающие безразмерные величины. Шкала разностей является частным случаем шкалы интервалов при выбо ре единичного масштаба. Допустимое преобразование — преобра зование сдвига ф(х) = х + Ь. Пример шкалы разностей — измерение отношения потребите ля к товару с помощью графического изображения: Совершенно не Затрудняюсь Полностью удовлетворен (-2) ответить (0) удовлетворен (2) I 1 1 1 1 Скорее, не Скорее, удовлетворен (-1) удовлетворен (1) Потребителя просят отметить каким-нибудь знаком на данной прямой свое отношение к товару. При обработке этой информа ции она может быть измерена с помощью обыкновенной измери тельной линейки, а затем ее легко привести к разным масштабам. 16
А б с о л ю т н а я ш к а л а является частным случаем шкалы интервалов с нулевой точкой отсчета и единичным масш табом. Допустимое преобразование — тождественное преобразова ние ср(х) = х. Это означает, что существует одно и только одно отображение /, переводящее объекты в числовую систему. Эта шкала является наиболее полной для целей обработки информации. Абсолютную шкалу дают результаты счета. Предположим, что с целью исследования социально-демографических характеристик респондентов был задан вопрос: "Сколько всего человек в Вашей семье, включая Вас и детей, проживают вместе?" и предложены следующие варианты ответов: 1. Один человек. 2. Два человека. 3. Три человека. 4. Четыре человека. 5. Пять человек. 6. Иной ответ. Рассмотрим вопрос о сравнении введенных типов шкал. Назовем тип одной шкалы более высоким, чем тип другой, если совокупность допустимых преобразований второй шкалы включается в совокупность допустимых преобразований первой. Если принять это определение, то между всеми типами шкал можно установить соответствующее отношение порядка. Правда, при этом несравнимыми оказываются шкалы отношений и шка лы разностей: ни одна из соответствующих совокупностей допус тимых преобразований не включается в другую. Частично упоря доченное множество типов шкал и соответствующие им допусти мые преобразования можно представить в виде рис. 1.2. Заметим, что применение в экономике такого многообразия шкал вызвано, по крайней мере, двумя причинами. Суть первой в том, что природа экономических явлений весьма разнообразна, и это, естественно, требует соответствующего разнообразия под ходов и шкал к их измерению. Вторая связана с тем, что не удается обеспечить одну и ту же точность при использовании раз личных подходов к измерению показателей, характеризующих социально-экономические процессы. Объяснение следует искать в неконтролируемости погрешности любых экономических измере ний. Желание же руководствоваться в экономических исследова ниях универсальным подходом и единым критерием точности уто пично. Поэтому точность каждого вида измерения определяют в соответствии с целями этого измерения. Причем нужно помнить, 17
Абсолютные шкалы
Шкалы отношений
ф(х)=ах
Шкалы интервалов
ф(х)=ах + 6
I
Порядковые шкалы (любое монотонное преобразование)
Номинальные шкалы (однозначное преобразование) Рис. 1.2. Отношение частичного порядка между шкалами в зависимо сти от допустимых преобразований (чем выше расположен прямоуголь ник, тем более высокому типу шкал он отвечает) что погрешности измерения не сводятся к арифметическим по грешностям. Скорее, это погрешности инструментария (статисти ческого, экспертного и т.п.), а также всевозможных (случайных и целенаправленных) информационных искажений. Надежность прогнозных расчетов напрямую связана с пробле мами измерения социально-экономических показателей. Известно, что недостаточный уровень точности и неправильный выбор шка лы значительно снижают доверие к прогнозным оценкам. Поэто му решение проблем, связанных с количественным представлени ем характеристик социально-экономических процессов, способ ствует повышению адекватности прогнозных моделей.
ГЛАВА 2 М Е Т О Д Ы ЭКСПЕРТНОГО ОЦЕНИВАНИЯ 2.1. Неопределенность и экспертные оценки Принято считать, что необходимость в экспертных оценках возникает каждый раз, когда отсутствуют тот объем и то качество информации, которые могли бы гарантировать однознач ность результатов принимаемых решений. Это имеет место в тех случаях, когда недостаточно изучена вся совокупность обстоя тельств (либо их, в принципе, нельзя изучить), в которых хозяй ствующий субъект вынужден осуществлять свою управленческую деятельность. По сути, эти обстоятельства представляют собой своеобразные проявления неопределенности. Сама же неопределенность много лика, имеет различную природу и требует специальных подходов для преодоления тех барьеров, которые не позволяют обосновать и оценить рациональность принимаемых решений. Экспертное оценивание как раз и есть один из таких подходов. Несколько сужая круг возможных проблем, будем рассматри вать ситуации, порождаемые так называемой концептуальной не определенностью. Именно с этим видом неопределенности чаще всего приходится иметь дело при разработке прогнозных вариан тов. Ее возникновение обусловлено необходимостью принятия особо сложных решений, имеющих долговременные и далеко иду щие последствия и связанных с нечеткими представлениями о своих собственных и чужих целях, потенциальных возможностях, будущих направлениях развития и т.д. Управленческая деятельность в подобных условиях ориентиро вана, в основном, на принятие прогнозных решений, т.е. реше ний, обоснованных результатами прогнозирования. Следователь но, основным инструментом обоснования рациональности управ ленческой деятельности в рассматриваемых условиях являются прогнозные методы, предполагающие, как известно, использова ние не только экспертной, но и фактографической информации. 19
Кроме того, низкая разрешающая способность экспертов служит серьезным ограничением для повсеместного их применения. В связи с этим возникает естественный вопрос: "Когда и в каких масштабах целесообразно привлекать экспертов к обоснованию прогнозных решений?" Однозначного ответа нет. Все зависит от информационной определенности исследуемой ситуации. Степень этой определен ности (или неопределенности) различна, поэтому и степень ис пользования экспертной информации тоже различна. Более того, авторы отдают себе отчет в том, что получение и обработка эк спертной информации — скорее, искусство, чем наука, в силу чего изложенный ниже подход не может претендовать ни на пол ноту, ни на завершенность. Изложение подхода начнем с группировки и систематизации всех имеющих место при разработке прогнозов ситуаций. В со ответствии с информационной определенностью среди них мож но выделить четыре типа. К первому типу отнесем все ситуации, когда информация об объекте (процессе), необходимая для разработки прогноза, пол ностью отсутствует. Нет аналогов, нет истории, нет представле ния о закономерностях развития, нет рабочих гипотез. Практи чески полностью исключена возможность построения прогнозных моделей. Понятно, что это как раз тот случай, когда без экспер тов не обойтись. Использование их интуиции является единствен ным способом, позволяющим получить представление о будущем. Ко второму типу отнесем ситуации, когда имеется достаточ но полное представление о закономерностях развития объекта: известны факторы, определяющие это развитие, но нет истории, т.е. отсутствует выборочная совокупность, позволяющая проверить достоверность имеющих место предположений. В этом случае, как и в предыдущем, без экспертов не обойтись. С их помощью можно сформировать псевдовыборку и использовать ее для по строения модели, описывающей предполагаемую зависимость. Ситуации третьего типа связывают с проблемами построения прогнозных траекторий долгосрочного развития. Наступает мо мент, когда старые тенденции в развитии исследуемого объекта затухают, а новые, зарождающиеся, могут быть подсказаны толь ко интуицией экспертов. Поэтому для получения достаточно на дежных прогнозных оценок требуется построение специальной прогнозной модели, в которой одновременно используется и фак тографическая, и экспертная информация. 20
Последний, четвертый, тип объединяет те ситуации, когда разработчиков прогноза вполне устраивает тот объем информации, которым они владеют. В силу этого необходимость привлечения экспертов считается нецелесообразной. Все четыре типа ситуаций встречаются в практике социальноэкономического прогнозирования. Однако, как ни странно, про гнозные расчеты ведутся в предположении, что мы имеем дело с ситуациями или первого, или четвертого типа. Скорее всего, это объясняется тем, что в наибольшей степени разработаны методи ки прогнозных расчетов именно для этих двух крайних ситуаций, т.е. чисто экспертные процедуры предсказания для первого типа и различные методы математического моделирования для четвертого. В то же время комбинированные подходы, на наш взгляд, предоставляют прогнозистам более широкие возможности, но прак тически не используются, так как отсутствует доступное изложение соответствующих методов и процедур, не разработано специальное программное обеспечение. Далее будут рассмотрены авторские подходы решения прогнозных задач в рамках ситуаций второго и третьего типов. Надеемся, что у некоторой части читателей они вызовут профессиональный интерес с одновременным желанием провести подобные расчеты в собственных исследованиях. Переходя на формальный язык описания интересующих нас условий, обратимся сначала к формуле, определяющей уровень неопределенности некоторого события с п возможными исходами, каждый из которых может осуществиться с вероятностью />: / = -£/>1 0 § 2 />.
(2.1)
1=1
Своего максимального значения (/ = log2 n) величина / дости гает при равновероятных исходах Pf = [/п. Это как раз тот слу чай, когда об интересующем нас событии ничего не известно, т.е. имеет место полная неопределенность. Формула (2.1) наво дит на мысль, что в терминах теории принятия решений неопре деленность можно понимать как условия риска с равновероятным выбором альтернатив. Такое определение вполне согласуется с интуитивным пониманием неопределенности как ситуации, в которой неизвестны предпочтения любой деятельности. В связи с этим имеет смысл уточнить роль прогнозирования в задачах принятия решений. Для принятия решений в условиях неопределенности разрабо таны методы, которые позволяют действовать рационально и по21
лучать результаты, гарантирующие в некотором смысле успешную деятельность, несмотря на отсутствие предпочтений. По сути, перед прогнозированием стоит та же самая задача — повышение надежности принимаемых решений, но достигается это не за счет рационального выбора, а путем снижения уровня неопределенно сти ситуации, в которой принимается конкретное решение. При чем прогноз должен предшествовать самому акту принятия реше ния, так как снижение уровня неопределенности, как правило, упрощает процедуру рационального выбора. Понятно, что снижение происходит за счет новой информа ции, полученной с помощью методов прогнозирования. Но сле дует предостеречь от ошибочного представления, в соответствии с которым снижение неопределенности достигается только благо даря получению новой информации. Тривиальный пример хоро шо это демонстрирует. Предположим, что в результате дополни тельных исследований выяснилось наличие еще одной равноверо ятной альтернативы. Уровень неопределенности от этой новой информации увеличится и станет равным / = log2 (n + 1). Формально за единицу измерения уровня неопределенности принимается 1 бит: (1Л — — ]па 2 2 , J 2 ° ,2, По сути, он представляет собой то количество информации, ко торое необходимо для того, чтобы случайное событие с двумя равновероятными исходами можно было превратить в достоверное событие (1>
/rf = -1 • log2 (1)-0 • log, (0) = 0 бит (2.3) с заранее известным исходом и, следовательно, нулевым уровнем неопределенности. Для объяснения механизма снижения уровня неопределеннос ти введем следующие обозначения: /0 — естественный (минимально возможный) уровень неопреде ленности интересующего нас события, характеризующий такое его состояние, которое в принципе достижимо, но нам неизвестно; /j— первоначальный уровень неопределенности события, зада ваемый дискретным распределением вероятностей Р{1, Р21, ..., PJ; 12 — конечный уровень неопределенности события, состояние которого описывается уточненным распределением вероятностей р 2
22
р 2
р 2
Тогда разность /, — /0 характеризует максимальный объем информации, который, в принципе, можно получить об интере сующем нас событии, а разность /, — /2 представляет собой тот объем новой информации, который получен от экспертов. Объем недостающей информации определяется величиной /2 — /0. Таким образом, поскольку величина / зависит от вероятностей, то из менение неопределенности происходит благодаря уточнению пер воначального представления о вероятностном распределении воз можностей. Исследование механизма изменения неопределенности позволя ет сформулировать, по крайней мере, два принципа проведения экспертиз: 1) экспертные опросы должны быть ориентированы на полу чение такой информации, которая способствовала бы снижению неопределенности; 2) результаты обработки экспертных опросов не должны носить категоричный характер, поскольку имеют место определенные ограничения, приводящие к погрешностям в оценке событий. Рассмотрим основные группы этих ограничений. 1. Ограниченность объемов доступной информации. Если исклю чить из рассмотрения случаи детерминированных событий (в со временной экономике такие события весьма редки), то для ос тальных, несмотря на использование всей доступной информации и отсутствие ограничений на ее получение, уровень неопределен ности всегда положителен. Другими словами, эксперты не обла дают абсолютными знаниями об интересующем нас событии. 2. Неоднородность информации. Неоднородность возникает в силу того, что каждый эксперт имеет свою собственную точку зрения о событии и уровне ее неопределенности. 3. Двусмысленность. Как следствие нечеткой формулировки вопроса, у экспертов может возникнуть двусмысленность его по нимания, что приведет к явному искажению ответа, так как от вечать он будет не на тот вопрос, который ему был задан. 4. Несовершенство процедуры экспертного опроса. Несовершен ство процедуры приводит к ситуациям, когда в экспертизе участ вуют недостаточно компетентные эксперты либо ответы наиболее компетентных экспертов используются неправильно. Следствием этого является искажение экспертных оценок. 5. Прочие погрешности. Эти погрешности, как правило, несу щественно искажают окончательный результат. Их возникновению 23
способствуют незначительные отклонения от правил, предписы ваемых процедурами экспертного опроса. Обсудив вопросы, связанные с природой неопределенности и принципами использования субъективной информации для сниже ния ее уровня, перейдем к описанию конкретных методов обра ботки результатов экспертных опросов, которые можно применять как непосредственный аппарат решения задач в ситуациях первого типа и как вспомогательный аппарат при решении задач второго и третьего типов. 2.2. Методы индивидуального и группового экспертного оценивания Известные в настоящее время процедуры экспертного оценивания, применяемые для решения прогнозных задач, прак тически не отличаются от тех, которые принято использовать в управленческой деятельности, осуществляемой в условиях неопре деленности. Причем и в управлении, и в прогнозных расчетах, несмотря на большое разнообразие задач, решаемых с привлече нием экспертной информации, в основном используются фор мальные постановки, сводящиеся к классификации и ранжирова нию. Это и естественно, так как довольно низкая разрешающая способность экспертов позволяет получать от них только качествен ную информацию, количественное представление которой возмож но либо в номинальной, либо в ранговой шкале. Действуя как бумеранг, шкала представления результатов, в свою очередь, определяет содержание вопросов, ответы на которые предполага ется получить от экспертов. Например, не следует требовать от экспертов, чтобы они оценили ожидаемый темп инфляции, но их мнение о возможном повышении или снижении этого темпа мо жет оказаться достаточно надежным. Для получения надежной экспертной информации разработаны специальные методы и процедуры: метод комиссий (дискуссии), метод "суда", различные методы анкетирования, метод коллек тивной генерации идей, метод Дельфы. Своеобразие экспертно го подхода в том, что с помощью одного и того же метода мо гут решаться различные задачи, и одна и та же задача может решаться с помощью различных методов. Отсутствие строгих предписаний, рекомендующих, в каких ситуациях, какой из пе речисленных методов является более эффективным, делают выбор того или иного метода для решения конкретной задачи в некото24
рой степени субъективным. Поэтому ниже будут описаны только те, которым в силу определенных причин мы отдаем предпочте ние и которые будут использованы в комбинированных процеду рах. Подробное описание остальных можно найти в [6, 8, 12, 18, 26, 27, 29, 32-34, 40, 47, 49]. Рассмотрение начнем с методов, применяемых для получения решений в ранговой шкале. Задачу классификации можно отдель но не рассматривать, так как она представляет собой частный случай ранжирования, когда нужно упорядочить два объекта. Уровень неопределенности, с которым приходится иметь дело при решении задач ранжирования, достаточно высок, так как для п ранжируемых объектов число возможных исходов п\ В соответ ствии с (2.1) он равен I(n) = log2(« !). Чтобы иметь представле ние об этой величине, приведем несколько ее значений: /(3) = 2,58 бит; /(4) = 4,58 бит; /(10) = 21,79 бит; /(20) = 61,08 бит. Поэтому для ранжирования даже небольшого числа объектов при меняют специальные процедуры, упрощающие работу экспертов. Смысл этих упрощений в том, чтобы снизить уровень неопре деленности решаемой задачи. Достигается это применением мно гоэтапных процедур экспертного оценивания, с помощью которых снижается число возможных альтернатив. Реализация многоэтап ной процедуры предусматривает вначале деление интересующих нас объектов на группы с последующим ранжированием самих групп и объектов внутри каждой группы. Устроенную таким об разом процедуру принято называть "простое ранжирование" [18]. Процедура достаточно проста, но, к сожалению, в результате ее применения часто получаются слишком огрубленные ранжировки. Поэтому, не останавливаясь на подробном описании этой проце дуры, перейдем к рассмотрению более эффективного и чаще дру гих используемого метода парных сравнений. При попарном сравнении объектов удается получить наиболее точное отражение субъективных предпочтений, поскольку на вы бор здесь налагается гораздо меньше ограничений, чем при дру гих видах экспертного оценивания. При этом способе каждый раз эксперту приходится делать выбор всего из двух альтернатив, т.е. решать задачу, уровень неопределенности которой не превышает одного бита. Естественно, это облегчает работу экспертов, но одновременно ставит вопрос о возможно недостаточном объеме информации для получения надежных оценок. Опасения по это му поводу напрасны. Один бит информации требуется при срав нении только одной пары из п объектов, а сравниваемых пар 25
п{п—1)/2 и, следовательно, так как п{п—1)/2 > log2(A2!), то и объем информации, затраченный на решение задачи ранжирова ния, в сумме превосходит тот, который затрачивается при дру гих способах ее решения. Для получения парных сравнений объектов А,- (/ = 1,я) исполь зуется анкетирование, предусматривающее заполнение таблицы, в которой количество строк равно количеству столбцов. Т а б л и ц а 2.1 Матрица парных сравнений Объекты
А,
А2
А
А, А2
а
°,2
a
а
а
°2п
Ая
а
и
2,
i„
22
„,
а
„„
а
п2
Значение элемента, стоящего на пересечении /-й строки и у'-го столбца, определяется по формуле 0,
А
< А,
1, А, 2, А
У А,
(2.4)
В соответствии с (2.4) на пересечении /-й строки и у'-го столб ца должен стоять 0, если объект с номером /, по мнению экспер та, менее значим, чем объект с номером у; должна стоять 1, если объекты равнозначны, и 2, если /-й объект превосходит у'-й. Полностью заполненная таблица представляет собой квадрат ную матрицу А, элементы которой удовлетворяют соотношению а + а и л ~ ^' Метод вычисления весовых коэффициентов, в со ответствии со значениями которых ранжируются объекты, пред ставляет собой итерационную процедуру Ар Г-1
(2.5)
где ро = (1, 1,..., 1)'. Чтобы избежать в процессе итерирования получения чрезвычай но больших весовых значений, компоненты вектора р' на каждом шаге нормируются путем деления на сумму 26
*=?.Pi=lI.auPjrl. '
(2.6)
' j
С учетом нормирующего множителя процедура вычисления ве совых коэффициентов записывается следующим образом:
У
(2.7)
Ее применение приводит к получению весовых коэффициентов pi в виде относительных величин, так как £ л ' = 1. Вычислитель ный процесс продолжается до момента, кбгда весовые коэффи циенты, полученные на двух соседних итерациях, будут незначи тельно отличаться друг от друга, т.е. t-\\
max \р/ - р}
<е,
(2.8)
где е — достаточно малое положительное число, задающее точ ность расчетов. Матрица парных сравнений неотрицательна (а.. > О для любых /', J) и неразложима, т.е. среди номеров строк и столбцов нельзя выделить такие подмножества I и J, что д.. = 0 для всех / е I и J e J. Другими словами, неразложимость матрицы А означает, что любыми перестановками строк и столбцов нельзя ее привес ти к виду А и А12 О А 22.
(2.9)
где А п и А22 — квадратные подматрицы. В соответствии с широко известной теоремой Фробениуса — Перрона у таких матриц максимальное собственное значение яв ляется действительным положительным числом Я, которому отве чает собственный вектор р с положительными компонентами. Причем и собственное число, и собственный вектор получаются в виде предельных значений Я = lim Я';
lim p
(2.10)
представляя, по сути, результат применения итерационной про цедуры. Содержательную интерпретацию итерационной процедуры рас смотрим на простом примере. Пусть требуется оценить степень значимости пяти объектов А,, А., г3> А5- В результате 27
опроса одного из экспертов была получена следующая матрица парных сравнений:
2 0 1 0 0 2 2 0 N (\
0
2 2 1 0 1
0 0 2 1 2
2\
2 1 0
Ч
Последовательность итераций без учета нормирующего множи теля выглядит следующим образом:
ГО
J)
Г709Л 5 21 469 93 4 2 3 ; Р' = 4 ; Р = 18 ; Р = 94 ; Р = 462 5 617 137 29
Гзз^
Л
1
Ч
^94 J
И 62 ,
Итерированная значимость первого порядка р1 (так будем на зывать промежуточные результаты итерационного процесса) пред ставляет собой сумму "очков", набранных каждым объектом в результате экспертного сравнения. Расчеты показали, что одина ковое количество очков набрали А2, А4 и А3, А5. Если предпо чтение устанавливать по итерированной значимости первого поряд ка, то эти пары объектов следует считать одинаково значимыми. Однако, как показывают дальнейшие расчеты, это не так. При подсчете итерированной значимости второго порядка каж дому объекту засчитываются не только собственные "очки", но и те, причем удвоенные, которые набрали проигравшие ему в срав нении. Поэтому очень важно, в сравнении с какими "противни ками" (сильными или слабыми) были заработаны "очки". Эти рассуждения хорошо иллюстрируют очевидные расчеты р 2 2 = 0 - 7 + 1-5 + 2-4 + 0-5 + 2-4 = 21; р2л = 2 - 7 + 2-5 + 0-4 + 1-5 + 0-4 = 29, из которых понятен механизм формирования итерированных пред почтений, обеспечивший превосходство четвертого объекта над вторым. 28
Метод парных сравнений был рассмотрен применительно к обработке результатов опроса одного эксперта. Индивидуальные экспертные оценки имеют право на существование и даже прак тическое использование, но уверенность в их объективности очень низкая. Поэтому предпочтение отдают групповым экспертным оценкам. В простейшем случае за групповую оценку принимают усредненные значения индивидуальных оценок. Применение та кого способа предполагает, что компетентность экспертов, при нимавших участие в экспертизе, одинакова. Подобное предположение следует признать несостоятельным. Нетрудно указать и причины несостоятельности. Во-первых, сформировать однородную группу экспертов практически невоз можно. Во-вторых, однородная группа не всегда обеспечивает высокую объективность результатов экспертизы. Скорее, наоборот: результаты опроса такой группы могут оказаться смещенными, хотя и согласованными. Поэтому рациональный взгляд на эту проблему подсказывает решение, суть которого в том, чтобы при построении групповой оценки не стремиться к созданию однород ной группы, а предусмотреть возможность учитывать компетент ность каждого эксперта. В связи с этим возникает вопрос о про цедуре определения весовых коэффициентов, характеризующих компетентность экспертов. Существует несколько подходов к решению этой задачи. Чаще других используются самооценка и взаимная оценка, строятся также интегральные оценки коэффициентов компетентности по отдельным характеристикам экспертов. В некоторых случаях уро вень компетентности связывают с источниками аргументации, которые используют эксперты при проведении экспертизы. Как правило, это несложные и интуитивно понятные процедуры. Их достаточно подробное описание можно найти в [6, 18]. Поэто му, ограничившись только их упоминанием, перейдем к изложе нию более интересной, на наш взгляд, итерационной процедуры, в которой параллельно уточняются и коэффициенты компетентно сти, и групповая оценка. Пусть опрос группы из т экспертов позволил получить оцен ки значимости п объектов. Результаты опроса представлены в виде прямоугольной табл. 2.2, в каждой строке которой, как нетрудно понять, стоят оценки, полученные соответствующим объектом, а в столбце — оценки, поставленные соответствующим экспертом. 29
Т а б л и ц а 2.2 Результаты опроса группы экспертов Эксперты Объекты А, А,
А„
э,
э2
э
Л. Ри
Ра Рп
Ры Ръ,
Л/
Рп2
р
т
Изложение формальной процедуры итерационного уточнения групповой оценки и коэффициентов компетентности начнем с обозначений: Р — прямоугольная п х т матрица с элементами />.., представ ляющими собой оценки /-го объекта у'-м экспертом; Р = (Р/, Р2> ••• РпУ ~~ в е к т 0 Р групповой оценки; v= (v;, v2, ... vm)' — вектор весовых коэффициентов компе тентности; р,.. — i-я строка матрицы Р; p v — у'-й столбец матрицы Р. В качестве начального приближения весовых коэффициентов компетентности удобно взять вектор V =(У,°, V», ..., Vй )'={]/,
У ,...,
У )',
(2.П)
т равенство компонент которого означает, что эксперты не разли чимы по уровню компетентности. С помощью этого вектора лег ко определяется групповая оценка Р' = v,p., + v2p.2 + • • • +v„p.„, = Pv° (2-12) Затем полученные значения групповой оценки используются для уточнения коэффициентов компетентности. С этой целью строки матрицы Р умножаются на оценки первой итерации р1 и суммируются (2ЛЗ) v 1 =A l .P,.+^P 2 .+ -+A 1 ,.P,,Так как коэффициенты компетентности являются нормирован ными величинами, то и полученный результат необходимо про нормировать, разделив его на сумму 30
Я
= Svy.
(2.14)
y'=i
После нормирования расчеты повторяются в той же последо вательности, образуя таким образом итерационную процедуру параллельных расчетов. В матричной форме эта процедура запи сывается следующим образом: p'=Pv'-';
(2.15)
v'=^[p']'P.
(2.16)
Я
Если в (2.15) подставить (2.16) с измененным порядком со множителей, а в (2.16) подставить (2.15), то окончательно ите рационный процесс записывается в виде р'^РР'р'1;
(2.17)
я' P-Pv'"1.
(2.18) Я' Так как столбцы матрицы Р в силу того, что получены с по мощью метода парных сравнений, неотрицательны, то и сама матрица неотрицательна и, следовательно, неотрицательны мат рицы РР' и Р'Р. Кроме того, можно показать [40], что в случае неразложимости Р они тоже неразложимы. Таким образом, и групповая оценка значимости объектов р, и весовые коэффициенты компетентности экспертов v могут быть получены как характеристические векторы матриц РР' и Р'Р, при чем эти векторы являются предельными величинами v
p=limp'-
v=limv/.
(2.19)
Как и в случае обработки матрицы парных сравнений, расчеты ведутся до достижения заданной точности. Если проводилась само оценка или взаимная оценка компетентности, полученные с помо щью итерационной процедуры результаты могут сравниваться с ними для уточнения общих характеристик экспертной группы. В качестве примера рассмотрим ситуацию, предусматрива ющую вычисление групповой оценки коэффициентов относительной важности, позволяющих сравнивать между собой восемь объектов. Групповая оценка вычисляется по результатам индивидуального оценивания (табл. 2.3). 31
Т а б л и ц а Индивидуальные экспертные оценки
2.3
Эксперты Объекты
1 2 3 4 5 6 7 8
РР'
1
2
3
4
5
6
0,3679 0,1840
0,1840
0,3679 0,1226
0,3679 0,0920
0,3679 0,0920
0,1840 0,1226 0,0613
0,1840 0,1226 0,0736
0,1840 0,3679 0,0920 0,1226 0,0736
0,1226 0,0920
0,3679 0,0920 0,1226
0,0736
0,0736
0,1840 0,0613 0,0920
0,0613 0,0526
0,0613 0,0526
0,0736 0,0460
0,0736 0,0460
0,0526 0,0460
0,0526 0,0613
0,0460
0,0460
0,0526
0,0526
0,0613
0,0460
0,6092 0,3159 0,2820
0,3159 0,3366 0,1467
0,2820 0,1467 0,1335
0,1918 0,1373 0,0903
0,1376 0,0914 0,0643
0,1170 0,0738 0,0547
0,0911 0,0657 0,0423
0,0951 0,0592 0,0447
0,1918 0,1376 0,1170 0,0911 0,0951
0,1373 0,0914 0,0738 0,0657 0,0592
0,0903 0,0643 0,0547 0,0423 0,0447
0,0724 0,0470 0,0396 0,0329 0,0327
0,0470 0,0339 0,0280 0,0227 0,0227
0,0396 0,0280 0,0239 0,0189 0,0190
0,0329 0,0227 0,0189 0,0156 0,0153
0,0327 0,0227 0,0190 0,0153 0,0156
Р'Р =
0,2068 0,1720
0,1720 0,2068
0,2023 0,1534
0,2000 0,1474
0,2000 0,1474
0,1719 0,2067
0,2023 0,2000 0,2000 0,1719
0,1534 0,1474 0,1474 0,2067
0,2068 0,2040 0,2040 0,1531
0,2040 0,2068 0,2064 0,1471
0,2040 0,2064 0,2068 0,1473
0,1531 0,1471 0,1473 0,2068
Р -
32
0,3105 0,1996 0,1445 0,1067 0,0747 0,0627 0,0506 0,0508
;
0,1759 0,1562 0,1717 v - 0,1700 0,1701 0,1561
)
j
2.3. Проверка согласованности мнений экспертов Не вызывает сомнений тезис о том, что групповые экспертные оценки должны отражать согласованное мнение экс пертов. Следовательно, перед формированием групповой оценки необходимо уточнить, можно ли для этих целей использовать полученные в результате опроса индивидуальные оценки. Выяс няется этот вопрос с помощью рангового коэффициента корре ляции и коэффициента конкордации. Эти коэффициенты приме нимы в тех случаях, когда результаты экспертного опроса представимы в ранговой шкале. С помощью рангового коэффициента корреляции устанавливает ся теснота связи между двумя ранжированными рядами, интер претируемая как согласованность мнений двух экспертов. В прак тике анализа согласованности применяются два коэффициента: Спирмена и Кендалла. Ранговый коэффициент корреляции Спирмена определяется формулой, аналогичной обычному коэффициенту корреляции Р
-~ШГ ,
(2-20)
где Кп — величина ковариации между первой и второй ранжи ровками; Dr D2 — дисперсии ранжировок. Ковариация и дисперсии вычисляются по данным ранжировок с использованием известных формул 1 ^12=
" rX(A-i-A)(A-2-/>2);
(2.21)
« - 1 i=i
^=-^ЪРШ-Р^
Р>=-£Р,>
k=l 2
>-
(2-22)
Рассмотрим случай, когда обе ранжировки не содержат связ ных рангов, т.е. когда нет повторяющихся рангов, и мы имеем строгое упорядочивание объектов. В этом случае средний ранг представляет собой сумму натуральных чисел от 1 до п, деленную на п, вне зависимости от порядка, задаваемого ранжировкой, т.е. средние равны между собой: _ _ _ и(и + 1) /г + 1 P = Pi=P2= 7~ = ^ Г ~ ' п-2 2
(
/т тал ' 33
При вычислении дисперсии, если произвести возведение в квад рат, то под знаком суммы будут стоять натуральные числа и их квадраты. Два ранжированных ряда одинаковой длины могут отли чаться друг от друга только перестановкой рангов, но сумма нату ральных чисел и их квадратов не зависит от порядка, в котором расположены слагаемые. Из этого вытекает, что дисперсии любых ранжировок, не имеющих связных рангов, равны между собой: Д=Д =
1 л-1
1 (л + 1)(2л + 1)и - 2р]п + р\п 6 я^1 п(п +1) (2.24) jfc= 1 , 2 12(я-1) 12 Если полученные выражения для Кп и D собрать вместе, под ставив их в (2.20), то выражение для рангового коэффициента корреляции примет следующий вид: 1
12 ^(Рп-Р)(Р1г~Р) п -1 п(п +1) %,
=
12 Х(Р -/>)(Р,- -Р)м 2
(2.25)
Дальнейшее упрощение формулы получается, если использовать легко проверяемое тождество
25>,.,-/>)(/>-,-/*) = ^Рп-РУ-
1(Р,-Р)2-1(Рп-Р,Г--
+
(2.26)
Первые две суммы правой части (2.26) одинаковы и, как нетруд но понять, равны 2(л" - п) (2.27) 1(Рп-рУ- + 1(Рп.-Р)2 = ,=1 ,-=• 12 Заменив в тождестве (2.26) первые две суммы полученной форму лой для их расчета (2.27), можем записать ^(РП-Р)(Р,2-Р) 34
=
(И3-71)
12
1
•Х^Рп-Ра)1*•
i=I
(2.28)
Подставив данное выражение в (2.25), имеем формулу коэффи циента корреляции Спирмена, удобную'для практических расчетов: Г»-3
(2.29) М
^ ~
Возможные значения коэффициента изменяются от — 1 до +1. Из формулы нетрудно понять, что р = 1 в тех случаях, когда ран жировки совпадают, т.е. рп = рааля всех /. Значение р = — 1 по лучается, если ранжировки имеют противоположный порядок. В отличие от предыдущего, это нетривиальный случай, требующий специального рассмотрения. Доказательство основано на подсчете суммы квадратов для нечетного и четного п. Пусть п — нечетное. Тогда Ё ( А , - Р , 2 ) 2 = [ ( - ( « - 1 ) ) 2 + - + И 2 ) + (-22) + 0 + 2 2 +4 2 +... + (,г-1)2] = = 2-2J
11+22+...+
:2-2'
л-1
я+1
=
2-2'
л-П
Гл-1
+1
2(я -1)
+1
я-1
2(я + 1 ) я ( я - 1 ) _ л з _ и
(2.30)
Полученное выражение позволяет сделать вывод, что действи тельно, в случае обратных ранжировок при нечетном числе ран жируемых объектов коэффициент корреляции Спирмена равен — 1. Покажем, что этот же самый результат получается и в слу чае четного числа ранжируемых объектов. Для любого п, в том числе и четного, можно записать очевид ное соотношение (л-1)3-(л-1) и3-л (2.31) (я~ —л)3 3 Пользуясь этим соотношением, сумму квадратов отклонений для четного числа ранжируемых объектов можно представить в виде суммы для нечетного п и добавочного слагаемого
2j(Pn ~ Р-лУ = —г— + К" + 1) -(и +1)] =
•
(2.32)
35
Таким образом, и для четного числа ранжируемых объектов (п + 1 четное) в случае обратных ранжировок коэффициент корре ляции Спирмена равен — 1. Проиллюстрируем расчеты по формуле (2.29) числовым приме ром. Пусть два эксперта провели оценку сравнительной значимос ти семи объектов. Каждому объекту в соответствии с полученной оценкой приписали ранг. Требуется оценить с помощью рангового коэффициента уровень согласованности мнений экспертов. Получен ные ранжировки и промежуточные расчеты приведены в табл. 2.4. Таблица Результаты ранжирования Эксперты
э, э2 Рн-Ра (Р„~Р,2)7
2.4
Объекты А, 2 1 1 1
А, 4 5 -1 1
А, 1 2 -1 1
\ 3 4 -1 1
А, 5 3 2 4
А, 7 6 1 1
А, 6 7 -1 1
Л 10 =0,821. п -п\ 336 Полученная оценка рангового коэффициента корреляции явля ется случайной величиной и, следовательно, необходимо прове рить ее значимость. Для этого определяется порог, ниже которого коэффициент корреляции считается незначимым. Определение порога осуществляется в предположении, что имеет место неза висимость ранжировок, т.е. Н0 : р = 0. При выполнении нульгипотезы отклонения расчетных значений коэффициента корреля ции от нуля носят случайный характер и подчиняются нормаль ному распределению. Только в том случае, если отклонение ока жется очень большим, нуль-гипотеза отвергается, и коэффици ент корреляции считается значимым. Очень большим считается отклонение, превосходящее по величине установленный порог. Для определения порога S используется приближенная формула 8=-
1
Ч>
2
(2.33)
в которой п — количество ранжированных объектов; а — вероят ность, задающая уровень возможной ошибки; у (х) = Ф~'(х) — функция, обратная функции нормального закона распределения. 36
В практических расчетах чаше всего а = 0,05. В аргумент функции вероятность а входит деленной на 2, так как отклоне ния коэффициента корреляции от нуля возможны в обе стороны (двусторонний критерий). Определим пороговое значение для нашего примера 1 1 „Л . 0,05 -440,975) = 0,800. д=-^Ч'\ 1V6 2 2,449 Так как р = 0,821 > 0,800 = 8, то нуль-гипотеза о независи мости экспертных мнений отвергается, а коэффициент корреляции признается значимым. В тех случаях, когда ранжировки содержат связные ранги, коэффициент корреляции корректируется. Прежде чем записать формулу для вычисления коэффициента корреляции, поясним механизм введения связных рангов. Они вводятся в тех случаях, когда в ранжируемой совокупности некото-рые объекты получили одинаковые оценки. Тогда каждому из этих объектов приписывается средняя величина порядковых номе ров, которые должны получить одинаково оцененные объекты. Например, пусть оценивались семь объектов, два из которых при знаны одинаково значимыми. Если их выстроить в порядке зна чимости, то объекты с одинаковой значимостью делят между собой второе и третье места. Так как их нельзя предпочесть друг другу, то каждому из них приписывается средний ранг
r23 =(r 2 + r 3 )/2 = (2 + 3)/2 = 2,5, и последовательность рангов, соответствующая значимости объек тов, выглядит следующим образом: 1; 2,5; 2,5; 4; 5; 6; 7. Расчет скорректированного на наличие связанных рангов коэф фициента корреляции осуществляется по формуле Р = /
+ Г +Г
'
-
,
(2.34)
в которой р — оценка коэффициента ранговой корреляции, рассчи танная в соответствии с (2.29), а величины 7j и Т2 вычисляются по формулам Tt = -з^— XM*i/ - О; Т2 = - J _ 2 * 2 , ( * 2 | . -1) / г -п
i
'
/Г - п i
где ки, k2j — количество повторений в z'-й подпоследовательности связных рангов в оценках 1-го и 2-го экспертов соответственно. 37
Данные для вычисления скорректированного коэффициента ранго вой корреляции с промежуточными расчетами приведены в табл. 2.5. Таблица Данные для вычисления скорректированного коэффициента ранговой корреляции Эксперты
А, 1 2,5 -1,5 2,25
А, 2 1 1 1
э, э, РЯ 'Р.! (Рп-РвУ
А, 4 2,5 1,5 2,25
Объекты А4 5 5 0 0
п -п~~х
А, 5 4 1 1
А, 5 7 -2 4
2.5
А, 7 6 1 1
336
7 1 = ^ - 5 ; M * W - 1 ) = ^7-3-(3-1)=0,054;
п -п i
336
п -rij
336
р + Т.+Т, 0,795 + 0,054 + 0,018 0,866 ^ ' —— = — = = 0,898 7(1 - 7^ )(1 - Г2) yjO, 946 -0,982 0,964 Коэффициент корреляции Кендалла в практических расчетах ис пользуется гораздо реже, чем коэффициент Спирмена. Поэтому, опуская подробный вывод, приведем только окончательную фор мулу для его расчета: р=
т=—
Xsign[ (/>„ - pJX) (рп - pJ2) ],
(2.35)
где п — количество ранжируемых объектов; plk — ранги объектов; 1, х > 0; sign х = - - 1 , х < 0; 0, х = 0. Как нетрудно понять, с помощью коэффициентов ранговой корреляции нельзя установить согласованность между всеми 38
экспертными оценками. Да они и не предназначены для этого. Но с их помощью удается описать структуру согласованности ин дивидуальных оценок. Это описание в виде корреляционной мат рицы может быть использовано как для более детального анали за однородности всей группы экспертов, так и для деления ее на подгруппы, имеющие более высокий уровень согласованности, чем вся группа. В целом согласованность мнений всей группы экспертов при нято оценивать с помощью дисперсионного или энтропийного коэффициентов конкордации. Рассмотрим сначала дисперсионный коэффициент конкордации. Он определяется как отношение дис персии D, отражающей реальный разброс между ранжировками, к величине Dmax, характеризующей максимально возможный раз брос W=-^—. D
(2.36)
max
Будем считать, что результаты ранжирования представлены в табл. 2.4. Тогда дисперсия может быть вычислена по формуле D = -±-t(Pi~P)2>
(2-37)
п -1 /=i т
rae pt = %р& ,
1 п
(/ = 1, л);
Р = -^РГ
При вычислении дисперсии каждый раз приходится вычислять среднее. Чтобы упростить эти вычисления, выразим среднее зна чение через количество оцениваемых объектов п и количество экспертов т, принявших участие в экспертизе. Для этого сначала вычислим сумму рангов, которые приписываются объектам каж дым экспертом: А
и(и + 1)
/=i
^
. ,—
.. . . .
а затем средний ранг представим в удобном для расчетов виде
P = - S S P t f = - I X ^ = - S - L ^ = i -—-• (2-39) 39
Для вычисления максимально возможного значения дисперсии проведем, используя очевидное равенство
2£р,=пр>
(2.40)
преобразование формулы (2.37): I й L -, 1 - :^{pi-P)2=-Lл - 1 /=i п -1
•2P11P,J+»P2
D=
i=\j=i
IPIJ
п-\
(2.41)
-пр
Преобразованная формула позволяет понять, что максимальное значение дисперсии достигается при наибольшем значении перво го члена в квадратных скобках. В свою очередь, наибольшего зна чения этот член достигает в том случае, когда у всех экспертов оценки оказались одинаковыми, т.е. все ранжировки одинаковые. В случае одинаковых ранжировок каждая строка в табл. 2.2 будет содержать одинаковые целые числа (ранги) /, и, следовательно, величину, возводимую в квадрат, можно представить в виде
Х/Л = гт >
(2.42)
7=1
где / — величина среднего ранга, которая для данного случая целая. Теперь величина первого члена в квадратных скобках может быть выражена через пит:
1
1
IPO 7=1
"
/=1
•>
т2(п + 1)(2и + \)п
(2.43)
6
Это максимально возможное значение для случая, когда оцени валось п объектов группой из т экспертов и их точки зрения пол ностью совпали. Если изменится хотя бы одна из ранжировок, то сумма уменьшится. Действительно, перестановка рангов в одной из ранжировок приведет к изменению некоторых / под знаком суммиро вания. Причем если /, < /2, то /, возрастет на величину (/2 — /,)//я, а /2 — уменьшится на эту же величину. Тогда с помощью простых 40
вычислении можно показать, как изменится в целом вся сумма в зависимости от тех изменений, которые произошли с двумя сла гаемыми: /
л
л
,-»
л
-I,
(2.44) т т Из полученного выражения следует, что сумма уменьшается на величину дополнительного слагаемого, которое всегда отрицатель ное. Следовательно, дисперсия имеет максимальное значение только в случае полного совпадения мнений экспертов. Окончательно, подставляя (2.40) в (2.38) и подробно распи сывая р, получаем формулу для вычисления значения максималь ной дисперсии и +•
с +1; + 2
m'(n + l)(2n + Y)n п(п-\)
т~ т'(п'-п) (2.45) 6 4 Щп-1) Когда дисперсия равна нулю, имеет смысл рассматривать слу чай т - п. Именно в этом случае возникает ситуация, когда один и тот же объект оценивается экспертами по-разному, т.е. все п ранжировок разные. А для разных ранжировок первый член в выражении (2.41) равен £>
у
£
YJPH
г
т(т +1) ^
=Е
т2(т + \)2п
(2.46)
При т = п полученное выражение полностью совпадает с вы ражением для пр2 и, следовательно, величина дисперсии в рассматриваемом случае равна нулю. Если ввести обозначение D
где
S
1 •S, га-1
(2.47)
= l 5>, =i
;=i
то коэффициент конкордации можно записать в компактном виде следующим образом: 125 W = (2.48) ч т (п —п) 2 / 3
41
Если в полученных ранжировках есть связные ранги, то коэф фициент конкордации нужно корректировать, так как максималь ное значение дисперсии становится меньше, чем в случае отсут ствия связных рангов. Скорректированный коэффициент конкор дации вычисляется по формуле
W-
™2
3
т (п - п) -m^Tj
(2.49)
где Т — показатель связных рангов в у'-й ранжировке:
Здесь Я, — число групп равных рангов в у'-й ранжировке; пк — число равных рангов в к-к группе связных рангов в ранжировке, полученной от у'-го эксперта. Коэффициент конкордации равен 1 в тех случаях, когда мне ния экспертов по всем объектам полностью совпадают, и равен нулю, когда все ранжировки различны. В остальных случаях его значения удовлетворяют неравенству 0 < W < 1, причем чем бли же это значение к 1, тем теснее связь между ранжировками и надежнее групповая оценка. Коэффициент конкордации, вычисляемый по выведенной фор муле, является, по сути, оценкой истинного значения и пред ставляет собой случайную величину. Естественно, возникает не обходимость в проверке его значимости. Для небольших значений тип разработана специальная таб лица распределения частот [22]. Если число объектов п > 7, то значимость оценки коэффициента конкордации проверяется с помощью критерия х2- Доказано, что величина (150) X2 =Wm(n-l) имеет ^-распределение с v = (и — 1) степенями свободы. Если в некоторых ранжировках есть связные ранги, то для проверки значимости коэффициента конкордации используется статистика 2_ А/
125; /и
тп(п + \)-{п-1У^Т} 42
<2-51)
Проверка значимости коэффициента конкордации гарантирует получение статистически надежных результатов. Рассмотрим числовой пример, иллюстрирующий процедуру вычисления коэффициента конкордации. Исходные данные и промежуточные результаты расчетов приведены в табл. 2.6. Таблица Исходные данные и промежуточные расчеты Объекты 1 2 3 4 5 6 7 8
1 1 2 3 4 5 6 7 8
Эксперты 2 3 4 5 2 1 1 1 1 3 4 4 4 2 2 2 3 6 3 3 5 4 6 5 6 5 5 7 7 8 8 8 8 7 7 6 Сумма
2.6
Сумма Отклонение Квадрат 6 рангов от среднего отклонений 8 2 361 -19 1 15 -12 144 17 4 -10 100 22 3 -5 25 30 5 3 9 7 36 81 9 6 44 17 289 44 8 17 289 квадратов отклонений S 1298
Количество ранжируемых объектов п — 8, количество экспер тов, принявших участие в экспертном опросе, т = 6. Средний ранг равен _ (я + 1)ш (8 + 1)6 _ р= = = 27 • 2 2 Отклонения от среднего и квадраты отклонений представлены в двух последних столбцах таблицы. Используя итог последнего столбца, окончательно получаем 12S 12-1298 = 0,8585. W= 2 т (п-п) 6 2 -(8 3 -8) Для проверки значимости коэффициента конкордации вычис лим статистику хи-квадрат: X2 = Wm(n -1) = 0,8585 -6-(8-1) = 36,0556. Сравнение расчетного значения х2 с табличным %2 = 36,0556> > 14,07 = #2та6л позволяет отвергнуть гипотезу W= 0 и признать, что мнения экспертов согласованы. 43
Энтропийный коэффициент конкордации определяется через ве личину энтропии Не помощью формулы W=l где H = -J^^Pi.log2p. i=I
—, п—
(2.52)
.
./=1
В формуле для вычисления энтропии />.. представляет собой оценку вероятности, с которой /-му объекту приписывается у'-й ранг. Вычисляется эта вероятность как отношение числа экспертов т1р приписавших объекту А(- ранг у, к общему числу экспертов т р„= — •
(2
-53)
т Как известно, максимальное значение энтропии достигается при равновероятном распределении рангов. Если в опросе при нимают участие т экспертов, то в случае равномерного распре деления число экспертов, приписавших /-му объекту у'-й ранг, равно их среднему числу, приходящемуся на один объект, т.е. от.. = т/n. Тогда вероятность определяется с помощью простой формулы р = — = i. (2.54) 4 mn n Подставляя эту вероятность в формулу энтропии, получаем )
Н =-
1
я
т
1
т
£ £ l ° g 2 L = £log 2 л = m\og2n.
(2.55)
Значение энтропийного коэффициента конкордации заключено между нулем и единицей. Если W3 = 0, то это означает, что между ранжировками нет связи. В этом случае ранги равномерно распре делены между объектами и, следовательно, Н = # m a r Противопо ложный случай: W3 = 1 соответствует ситуации, когда все экспер ты идентично оценили значимость объектов, и ранжировки оказа лись совпадающими между собой. При совпадающих ранжировках рк/= 1, а все остальные р0 = 0 (i*k, j*l, i = l,n, j = l,m). Поэто му H = 0 и, следовательно,^ = 1. 44
Процедура вычисления энтропийного коэффициента конкордации более громоздкая, чем дисперсионного. Проиллюстрируем ее основные этапы на данных предыдущего примера. На первом этапе по табл. 2.6 сформируем квадратную матри цу размером п х п с элементами т^, представляющими количество экспертов, приписавших /-му объекту у'-й ранг (табл. 2.7). Т а б л и ц а 2.7 Частоты экспертных предпочтений Объекты
Ранги 1
2
3
4
5
6
7
8
1 2
4 2
2 1
0 1
0 2
0 0
0 0
0 0
0 0
3 4 5
0 0 0
3 0 0
2 1 1
0 0 4
0 1 1
0 0 0
6 7
0 0
0 0
2 1 1
2 2
0
2 0 0
0 0 0 0 3
8
1 4 0 0 0 0
2
3
0 0 0
0
Разделив все элементы этой матрицы на число экспертов III::
Ру= — , (2-56) т получим матрицу, элементы которой есть вероятности, с которыми эксперты присваивают ранги соответствующим объектам (табл. 2.8). Т а б л и ц а 2.8 Вероятности, с которыми эксперты проводят ранжировку объекто Объекты
Ранги 1
2
3
4
5
6
7
8
1 2
0,667 0,333
0,333 0,167
0 0,167
0 0,333
0 0
0 0
0 0
0 0
3 4 5 6 7 8
0 0 0 0 0 0
0,5 0 0 0 0 0
0,167 0,667 0
0,333 0,167 0,167
0 0,167 0,167
0 0 0
0 0 0
0 0 0
0 0 0,667 0,333 0 0
0,333 0,167 0,167
0,333 0,333 0,333
0 0 0 0 0,5 0,5 45
Из матрицы вероятностей применением преобразования htj = -р& log, PiJ (2-57) легко получается матрица энтропийных характеристик полученных ранжировок, представленная соответствующей частью табл. 2.9. Таблица Энтропийные характеристики ранжировок Объекты 1 2 3 4 5 6 7 8
Ранги 1 3 4 5 6 2 0 0 0 0 0,39 0,528 0 0 0,528 0,431 0,431 0,528 0 0 0,5 0,431 0,528 0 0 0 0,431 0 0,39 0,431 0 0 0 0,431 0,39 0,431 0,528 0,528 0 0 0 0 0 0,431 0 0 0 0,431 0 0 Суммарная
7 8 0 0 0 0 0 0 0 0 0 0 0 0,528 0,528 0,5 0,528 0,5 энтроп ия Н
2.9
Сумма 0,918 296 1,918 296 1,459 148 1,251 629 1,251 629 1,584 963 1,459 148 1,459 148 11,302 26
Величина максимальной энтропии для рассматриваемого случая равна tfmax=6.l0g28 Окончательно получаем
= 18-
^ = 1 - ^ = 1 - 1 ^ = 0,6279. #тах 18 Значения дисперсионного и энтропийного коэффициентов кон кордации не совпадают. Причем их значения сближаются по мере увеличения степени согласованности мнений экспертов, т.е. чем ближе к единице, тем меньше различие между ними. Самое боль шое различие между этими коэффициентами имеет место в слу чае, когда эксперты разделились на две группы с полностью про тивоположными точками зрения. По дисперсионному коэффици енту конкордации степень согласованности в этой ситуации будет равна нулю, а по энтропийному — 0,5.
ГЛАВА 3 ЭКОНОМЕТРИЧЕСКИЕ МОДЕЛИ ЭКСПЕРТНЫХ ПРЕДПОЧТЕНИЙ 3.1. Экспертные оценки и модели бинарного выбора 3.1.1. Концептуальные основы моделирования экспертных предпочтений В предыдущих главах достаточно подробно изложен математический аппарат, применяемый в настоящее время (и не без успеха) в различных схемах получения и обработки эксперт ной информации, используемой в задачах обоснования управлен ческих решений. И все же во всех этих схемах, несмотря на их разнообразие, по преимуществу используются методы из одного и того же вышеописанного набора. К этому набору можно доба вить балльное оценивание и простое ранжирование, которые в силу своей распространенности и того, что не приводят к полу чению более надежных оценок, чем метод парных сравнений, не рассматривались среди вышеизложенных. Можно вспомнить и медиану Кемени, процедура нахождения которой достаточно сложна и поэтому редко используется в практике получения груп повых оценок. Однако в каком бы составе мы не рассматривали эти методы, их главная особенность в том, что для числового представления получаемых результатов в основном используются номинальные и ранговые шкалы. Этим и объясняется, на наш взгляд, тот консер ватизм, который утвердился в отношении методов обработки экс пертной информации. Его природа очевидна: низкая разрешающая способность экспертов, которая служит непреодолимым барьером для повышения точности экспертных оценок. Возникает естествен ный вопрос: "Какой смысл в разработке новых подходов и более точных методов, если они из-за указанного барьера не приводят к уточнению финальных результатов?" Трудно возразить этому тези су. И все же смысл есть. Он появляется в тех случаях, когда меняется привычное представление о сути решаемых задач. 47
В качестве примера, демонстрирующего новый взгляд на обра ботку экспертной информации, рассмотрим в фокусе этого взгля да задачу ранжирования показателей по степени их влияния на возможность появления какого-либо события. Эта задача является одной из наиболее распространенных в практике экспертного оце нивания. Ее решение можно получить с помощью любого из рассмотренных методов. Однако несмотря на многообразие мето дов, суть подхода, реализуемого в этих методах, одна — непосред ственное оценивание показателей. Наряду с простотой реализации этот подход имеет и ряд недостатков. Очевидно, что его примене ние имеет смысл только в линейном случае, когда степень влия ния не зависит от структуры оцениваемого набора показателей. В реальных ситуациях все гораздо сложней. Представление о линейном взаимодействии — скорее абстракция, помогающая уп ростить задачу, сделав ее всегда решаемой, но с некоторой ошиб кой, которой можно пренебречь. Логика получения результатов по такой схеме оценивания без учета совместных эффектов вполне объяснима. Решение ищется для конкретной ситуации с фиксиро ванной структурой показателей, которая хотя и не указывается в задании эксперту, но, как правило, присутствует в его представ лениях о решаемой задаче. Но как только структура начинает из меняться, сразу же появляются неучтенные эффекты взаимодей ствия и надежность экспертных оценок резко снижается. Поэтому непосредственное оценивание показателей с предполагаемой линей ной структурой взаимосвязей необходимо заменить более сложным, основанным на модельном представлении структуры, но без услож нения самой процедуры опроса экспертов. При этом модель, от ражающая взаимосвязь между возможностью появления интересу ющего нас события и набором оцениваемых показателей, должна быть, по всей вероятности, нелинейной и, кроме того, эконометрической, так как интерес вызывают не только механизм взаимо действия, но и количественная оценка силы этого взаимодействия, а также желание заменить повторные экспертные опросы прогноз ными оценками. Последнее особенно важно. Именно этой воз можностью не обладают ранее рассмотренные методы. Таким образом, смысл излагаемого здесь подхода в том, что бы экспертную информацию использовать для построения модели, а не для получения самих оценок. Возникает естественный воп рос: "Каким образом экспертная информация может использовать ся для этих целей?" По всей видимости, можно предложить несколько подходов, обеспечивающих реализацию обсуждаемой 48
здесь идеи. Наше предложение заключается в том, чтобы инту ицию и знания экспертов применить для формирования специаль ного набора данных псевдовыборки, по которым оцениваются ко эффициенты модели, имеющей, в отличие от непосредственных экспертных оценок, многоплановое применение: анализ, оценка значимости факторов, прогноз ожидаемых событий и т.п. Есте ственно, это значительно расширяет область практического ис пользования экспертных решений. Реализация данного подхода предполагает введение бинарной переменной со следующим смыслом: _ I \, если, по мнению эксперта, событие должно произойти; J О, в противном случае. Будем считать, что значение этой переменной, характеризу ющей появление интересующего нас события, зависит от оценива емого нами набора показателей xv х2, ... , хт, и существует не которое множество различных вариантов х,, х2, ... , х/( этих на боров х;. = (хп, хп, ... , хш), отличающихся друг от друга все ми или некоторыми своими компонентами (оцениваемыми пока зателями). Предполагается, что у каждого эксперта есть представ ление о том, при реализации каких вариантов ожидаемое собы тие будет иметь место, а при реализации каких — нет. Матема тически это предположение записывается в виде зависимости yf = f(x,,,* / 2 ,...,*,„) + £*, (3-1) где у* — ожидаемое значение бинарной зависимой переменной, которое k-й эксперт связывает с г'-м набором оцениваемых пока зателей; f(xn, ха, ... , xjm) — индексная функция, т.е. функция, принимающая всего два значения: 0 и 1; £,- — ошибка, которую может допустить k-Pi эксперт, оценивая влияние /-го набора на появление ожидаемого события (£,*— случайная переменная со значениями в номинальной шкале: I, 0, -1). Теперь становится понятной реализация основанной на модель ном подходе идеи получения экспертных решений. Сначала в результате целевого опроса экспертов формируется псевдовыбор ка, объединяющая в себе субъективные мнения по поводу инте ресующих нас закономерностей, предпочтений, рейтингов, про гнозных оценок и т.п. Затем по данным псевдовыборки строит ся регрессионная зависимость (3.1), связывающая субъективные мнения с одновременным их усреднением в единую формализо ванную зависимость. Построенная таким образом модель, по 49
сути, является концентрированным выражением обобщенного мнения экспертов по изучаемой проблеме и может использовать ся для анализа и получения всевозможных оценок. Модель в качестве результата опроса, а не разовые экспертные оценки является главной особенностью данного подхода. Благодаря этой особенности удается получить прогнозные оценки экспертных суждений, т.е. оценки субъективного характера относительно тех событий или объектов, о которых эксперты не знали или не имели представления в момент формирования псевдовыборки. Практическая реализация этой процедуры требует рассмотрения целого ряда довольно сложных вопросов: Как построить регрессию на бинарную переменную? Какими способами эксперты должны формировать выборочную совокупность (псевдовыборку) для построения регрессии с бинар ной зависимой переменной? Как оценить компетентность эксперта и адекватность построен ной таким образом модели? Как проверить согласованность мнений опрашиваемой группы экспертов? Как оценить надежность расчетных характеристик, получаемых с помощью регрессии субъективных суждений? Какую содержательную интерпретацию имеют оценки, полу ченные в результате моделирования экспертных предпочтений? Можно ли, а если можно, то как использовать статистические методы для проверки различного рода гипотез, выдвигаемых от носительно оцениваемых параметров и объектов? По сути, в этих вопросах нет ничего нового. Практически все они в той или иной степени присутствуют в задачах прямого эк спертного оценивания, обеспечивая надежность получаемых ре зультатов. Но расчет и анализ характеристик, а также соответ ствующие выводы на их основе в новом подходе отличаются от того, как это делается в традиционном, поэтому требуют специ ального рассмотрения. 3.1.2. Эконометрический подход к построению моделей субъективных предпочтений Решение первого и, очевидно, самого главного во проса, связанного с моделированием субъективных предпочтений, требует построения регрессионного уравнения специального вида. Проблема, которую необходимо преодолеть при реализации это50
го подхода, связана, прежде всего, с тем, что применение ли нейной регрессии у = ХЬ + е (3-2) для рассматриваемого случая не может привести к успеху, так как значения линейной формы xib = b0+blxn+b2xl2 + ••• +bmxim, i = l,n <3J) принадлежат непрерывной количественной шкале, а переменная у, отражающая мнение эксперта, изменяется дискретно, прини мая всего два значения. Поэтому для исследования статистичес кой зависимости между бинарной переменной у и количественны ми данными X рекомендуется строить специальные регрессионные модели. В настоящее время разрабатываются два подхода, позволя ющие строить такие модели. В первом предусматривается постро ение линейных вероятностных моделей, а во втором — нелиней ных, получивших название логит- и пробит-моделей. Нас будут интересовать нелинейные модели. Они позволяют установить за висимость не между переменной у и набором данных X, а меж ду вероятностью того, что /*-е значение бинарной переменной равно 1 при условии х/5 т.е. между Р{у, = 1 |х,.), и линейной фор мой х(Ь. С помощью такого подхода моделирование экспертных предпочтений представляет собой более естественный процесс с хорошо понимаемой содержательной интерпретацией. Однако и в этом случае применение линейной формы вряд ли увенчается успехом, так как значение линейной функции может быть как отрицательным, так и превосходить единицу, что явно не согласуется с возможными значениями вероятности. Поэтому це лесообразно для моделирования величин P{yj = 1 |х() использовать функции, областью значений которых является отрезок [0, 1], а линейная форма х(Ь играет роль аргумента в этих функциях, т.е. должна иметь место модель вида Р{у, = l | x / ) = F(x / b), i = ln •
(3.4)
Чтобы запись модели в такой форме была корректной, функ ция F(^) должна удовлетворять следующим требованиям: О F(z) — монотонно возрастает по z; 2) 0 < F(z) < 1; 3) F(z) -» 1 при z —> °°; 4) F(z) —> 0 при z —> — °°. 51
В практике решения прикладных задач в качестве F, как пра вило, используются две функции. Если такой функцией являет ся стандартная нормальная вероятностная функция распределения Ф(г) = -1= [e'^dx, л/2я: J
(3.5)
—со
то регрессионная зависимость называется пробит-моделью. В слу чае, когда используется логистическая функция
Пг) = —Ц- зависимость называется логит-моделью. Обе функции удовлетворяют всем четырем условиям, сформу лированным выше, и, кроме того, являются симметричными относительно z = О, т.е. Ф(—г) = 1 - Ф(г) и Л(—г) = 1 ~ л(г). Эти свойства значительно упрощают всевозможные преобразова ния тех выражений, в которых используются эти функции. Таким образом, понимая под функцией регрессии зависимость "в среднем" между зависимой и независимыми переменными, можно записать Е(у | х) = 1 • F(xb) + 0 • (1 - F(xb) = F(xb), (3.6) где F (xb) — одна из вышеприведенных функций распределений. Отражая тот факт, что реальная зависимость не всегда совпа дает с математическим ожиданием и, кроме того, ее значения могут отличаться даже на совпадающих наборах значений незави симых переменных, введем в рассмотрение случайную составля ющую е и окончательно запишем yt = ЕСу;|х,) + £; = F(x.b) + £,., i = u-
(37)
Нелинейный характер этих моделей, естественно, по сравне нию с линейными моделями требует применения более сложно го математического аппарата, который, к сожалению, не изло жен на русском языке в форме, доступной для понимания. По этому ниже будет приведено достаточно подробное описание всего комплекса формальных процедур построения и анализа моделей, которые нами используются для прогнозирования субъективных предпочтений. Уровень детализации в изложении материала прак тически исключает в рассуждениях моменты, требующие самосто ятельного восстановления преобразований, пропущенных якобы в 52
силу их очевидности. Это позволит заинтересованным читателям в полном объеме освоить основы математического аппарата эко нометрики качественных переменных. Полученные знания обес печат грамотное восприятие и корректное практическое использо вание результатов моделирования. Однако не следует эту возможность воспринимать как обяза тельный элемент знаний, без которого доступ к практическому применению этого аппарата существенно ограничен. Для тех, кто в большей степени ориентирован на практическое использование предлагаемых здесь методов, вполне достаточно уметь пользоваться одним из статистических пакетов, владеть приемами интерпрета ции результатов моделирования и освоить принципы формирова ния псевдовыборки, к изложению которых мы переходим.
3-1.3- Принципы формирования псевдовыборочных совокупностей Вопрос применения для наших целей моделей бинар ного выбора имеет два аспекта. Один из них связан с методами построения этих моделей. Это тот аспект проблемы, основная на правленность которого — корректное применение математического аппарата, как уже отмечалось, будет со всеми деталями рассмот рен ниже. Другой аспект представляет собой срез информацион ной составляющей, обнажающий проблему формирования специ альных выборочных совокупностей и правомерность их использо вания в процедурах построения эконометрических моделей. Это как раз та проблема, на решение которой должны быть нацеле ны усилия экспертов. Смысл основной задачи, стоящей перед экспертами, формиру ющими псевдовыборку, в том, чтобы на данные выборочного множества перенести собственные представления о механизмах предполагаемых закономерностей между объясняющими переменны ми и ожидаемыми событиями. Тогда, если проведение такой про цедуры было успешным, то по замыслу построенная модель долж на отражать ту закономерность, руководствуясь которой эксперт оценивал степень воздействия выборочных значений на возможные проявления интересующего нас события. Таким образом, главное отличие псевдовыборки от выборки в том, что в ее данных содер жится информация, которую эксперты сумели обнаружить и связат своими субъективными оценками со значениями зависимой переменной. Способы формирования псевдовыборки зависят от смыслово го содержания решаемой задачи. Это не совсем строго формализо53
ванные процедуры, и поэтому для их успешного применения в каждом конкретном случае требуется адаптивное вмешательство. Рассмотрим типовые ситуации, которые возникают в практике анализа и прогнозирования бизнес-процессов. Можно выделить три ситуации, которые отличаются принципами формирования псевдовыборки. В первой ситуации псевдовыборку формируют непосредственно из выборочной совокупности с известными значениями зависимой (дихотомической) и независимых переменных^ Это тот случай, когда взаимосвязь между yt и наборами х,- (/ = 1, п) существует, но эксперты не уверены в абсолютной правомерности и надежности такой связи. Применяя принцип усиления взаимосвязей субъективны ми мнениями, они своими оценками уточняют возможность появ ления соответствующего значения yi при заданном наборе х(. Уточ няющие оценки удобно, хотя и не обязательно, получать в баллах, пользуясь для этого стобалльной шкалой. Таким образом, в резуль тате опроса эксперта каждому наблюдению будет приписано опре деленное количество баллов. Причем чем выше, по мнению экс перта, реальность наблюдаемого значения у. при соответствующем наборе объясняющих переменных хЛ тем больше баллов приписы вается данному наблюдению. Количество баллов удобно интерпре тировать как частоту (число случаев), с которой данное наблюде ние тиражируется в выборочной совокупности. Вторая ситуация, которую мы намерены рассмотреть, преду сматривает случаи, когда выборочное множество состоит только из объясняющих переменных и требуется на основе принципа субъективной идентификации взаимосвязей восстановить значения бинарной зависимой переменной. В соответствии с этим прин ципом эксперт каждому набору объясняющих переменных выбо рочной совокупности ставит в соответствие одно из возможных значений (0 или 1) зависимой переменной. В сформированной таким образом псевдовыборке, как нетрудно понять, содержится информация, отражающая субъективное мне ние по поводу того, какие условия, описываемые объясняющими переменными, благоприятны, а какие неблагоприятны для появ ления некоторого события. Другими словами, экспертами сгенери рованы значения бинарной переменной в зависимости от значений объясняющих переменных. Естественно, модель, построенная по данным так сформированной псевдовыборки, будет являться до вольно грубым приближением к той зависимости, которую экспер ты пытались описать своими предпочтениями в процессе формиро54
вания дискретной зависимой переменной. Поэтому желательно провести некоторые уточнения, используя для этого, например, описанный выше принцип усиления взаимосвязей субъективными мнениями. Как следует из приведенных рассуждений, для получения надеж ных результатов в условиях второй ситуации целесообразно псевдо выборку формировать на основе двух сформулированных здесь прин ципов. Причем использование этих принципов может быть как последовательным, так и параллельным. Последовательное приме нение фактически уже было рассмотрено. Процедура параллельного использования принципов, по сути, приводит к тем же результа там. В ее рамках предполагается, что одновременно с идентифи кацией бинарного значения оценивается и возможная частота по явления идентифицированного значения в выборочной совокупно сти. Для этих целей можно использовать не только балльное оце нивание, как в случае первой ситуации, но и другие процедуры экспертного оценивания. Особенность третьей ситуации в том, что исследуемые объек ты имеют не только описание в виде набора показателей, но и имена. Например, это могут быть города, районы области, фир мы, товары и т.п. Предполагается, что эксперты знакомы с эти ми объектами до такой степени, что способны указать свои пред почтения относительно их использования в определенных целях. В принципе им могут быть известны и показатели, задающие формальное описание объектов. Но вне зависимости от уровня информированности экспертов, вне зависимости от полноты ин формационного описания этих объектов эксперты имеют субъек тивное представление об интегрированной ценности каждого объекта. Это как раз тот случай, когда для формирования псев довыборки следует применять принцип субъективных предпочтений. Если объектов не более двух-трех десятков, то принцип субъек тивных предпочтений удобно реализовать с помощью метода пар ных сравнений, подробное описание которого приводилось в пре дыдущей главе. Причем сравнивать между собой следует объекты, а не их информационные описания. Это значительно упрощает работу экспертов, но только в том случае, если у них действи тельно имеются интегрированные представления об объектах. Формирование значений бинарной переменной осуществляет ся по результатам экспертного опроса, отраженным в матрице парных сравнений. Объектам, которые получили больше полови ны предпочтений в процессе сравнения с другими объектами, 55
приписывается 1, а получившим меньше половины — 0. Одновре менно с формированием массива значений бинарной переменной можно, руководствуясь первым принципом, осуществить усиление предполагаемых связей. Для этого можно использовать или сумму очков, обеспечивших объекту предпочтение, или сумму потерян ных очков. Другими словами, если объекту приписана 1, то дан ные о нем в псевдовыборке повторяются столько раз, сколько он набрал очков при сравнении с другими объектами, а если 0, то число повторений определяется числом потерянных очков. Метод парных сравнений, являясь удобной процедурой форми рования псевдовыборок, не всегда обеспечивает получение ожида емого результата. Поэтому в арсенале исследователя должно быть несколько дополняющих друг друга процедур экспертного опроса, которые в случае необходимости могут комбинироваться при фор мировании одной и той же псевдовыборочной совокупности. Результатом применения вышеописанных принципов является выборочная совокупность следующей структуры: У\
х
\\
х
•••,
х
У2
Х
2\
Х
22>
•••'
х
Уп
Х
п\
Х
п2'
•••'
Х
12>
\т
2т
пт
w
l'>
W
2'
W
n-
где yi — сгенерированное по результатам экспертного опроса зна чение бинарной переменной; хп, xl2,..., xim — набор показате лей, которые, по мнению экспертов, определяют выбор сгенери рованного ими значения бинарной переменной; w;. — определяемая экспертами частота повторяемости /-го наблюдения в выборочной совокупности. Такая форма представления данных выборочной совокупности очень удобна для компьютерной обработки с помощью, напри мер, пакета STATISTICA. Чтобы завершить обсуждение вопроса, связанного с формиро ванием специальных выборочных совокупностей, необходимо про вести обоснование правомерности использования для построения бинарных моделей данных, полученных подобным образом. Фор мально числовые данные псевдовыборки ничем не отличаются от данных выборочной совокупности, полученных в результате ста тистических наблюдений. Более того, элементами псевдовыбор ки зачастую являются сами статистические наблюдения. И поэто56
му в силу того, что на формальном уровне данные этих якобы различных, по сути, выборочных совокупностей можно считать гомогенными, при построении модели не возникает вопросов вычислительного характера, но они сразу же появляются, как только есть необходимость в содержательной интерпретации и проверке статистической значимости результатов моделирования. Правомерность проверки статистической значимости результа тов моделирования по стандартным тестам, описание которых будет дано ниже, гарантируется свойствами случайной составля ющей модели экспертного опроса (3.1). Если ошибки, которые допускает эксперт в своих предпочтениях при формировании псев довыборки, независимы и нормально распределены, то случайная составляющая удовлетворяет необходимым условиям и применение тестов можно считать корректным. Подобные предположения не противоречат возможностям реальных ситуаций. Правда, здесь уместно заметить, что все, о чем мы говорим, имеет смысл толь ко в том случае, если эксперты относятся к своей работе добро совестно. 3-1.4. Оценка надежности и согласованности результатов моделирования экспертных предпочтений Псевдовыборка, сформированная одним из вышеопи санных способов, позволяет построить регрессионную модель, от ражающую механизм субъективного выбора интересующих нас альтернатив. Этот механизм может отражать как индивидуальную точку зрения, так и групповое мнение в зависимости от того, какая процедура использовалась при формировании выборки. Чтобы подобную модель применять в практической деятельности, нужна уверенность в надежности получаемых с ее помощью ре зультатов анализа и прогноза. Надежность при использовании подобного подхода может рождаться только из оценок, свидетель ствующих о компетентности экспертов и согласованности их мне ний. Поэтому в центре дальнейших наших рассуждений будут именно эти вопросы. Естественно, при оценке компетентности и согласованности можно использовать известные процедуры, применяемые в эксперт ных методах прямого оценивания. Это имеет смысл и позволя ет получать некоторые гарантии надежности, но не в полном объеме. Необходимость в дополнительных характеристиках возни57
кает потому, что при реализации рассматриваемого здесь подхо да изменяется представление о содержательном смысле характери стик надежности. Прежде всего это касается компетентности эк сперта. Переходя к рассмотрению компетентности, сразу согласимся с тем, что эксперт имеет право на собственное мнение, отличное от других экспертов. На наш взгляд, оригинальность в оценках не должна снижать компетентность, несмотря на то, что есть точка зрения [40], в соответствии с которой оценка компетентности тем выше, чем ближе индивидуальные оценки к групповым. Но с этой точкой зрения можно согласиться только при условии, что групповые оценки совпадают или почти совпадают с истинными. Вполне возможна ситуация, когда вопреки нашим ожиданиям групповые оценки далеки от истинных значений и заключение о компетентности, сделанное на основе близости индивидуальной оценки к такой групповой, теряет смысл. Независимо от сделанного замечания и не взамен общеприня того подхода введем в рассмотрение еще одну составляющую компетентности. Оценка этой составляющей основана на положе нии, смысл которого в том, что эксперт не может быть компе тентным, если его оценки противоречивы. Возникает естествен ный вопрос: как оценить уровень противоречивости экспертных суждений? Содержательный смысл решаемой здесь задачи позволяет пред ложить следующий подход. Сформированная экспертами псевдо выборка представляет собой данные, которые, по сути, сгенери рованы в соответствии с представлением эксперта о взаимосвязи предпочтений бинарного выбора с факторным пространством. Если модель хорошо подгоняется к этому набору данных, т.е. имеет достаточно высокий индекс отношения правдоподобия (ко эффициент Макфаддена, который далее будет рассмотрен более подробно), то следует признать, что суждения эксперта не про тиворечивы, ему действительно удалось сформировать модель соб ственных суждений, и поэтому он может быть отнесен к группе компетентных специалистов. Для этих же целей можно использовать энтропийный коэффи циент предсказывающих возможностей построенной модели. Этот коэффициент имеет следующий вид:
58
Н = - -jF( X .b)log 2 F( X ,b)-J(l-F(x,b))log 2 (l-F(x,b)) п
(3.8)
Для случая, когда расчетные значения модели в точности со впадают с фактическими значениями дихотомической перемен ной, значение коэффициента равно нулю, т.е. во всех случаях модель обеспечивает безошибочный выбор, не оставляя место для сомнений в пользу альтернативы. Максимальный уровень энтро пии (Н — 1) получается в случае, когда для всех рассмотренных ситуаций j) =F(x,b) = 0,5- Во всех остальных случаях 0 < Н < 1. Величина коэффициента показывает средний уровень неопределен ности в каждом случае бинарного выбора, которая остается по сле построения модели. Случай, когда построенная модель оказывается неадекватной, свидетельствует о некомпетентности эксперта, так как его взгля ды на исследуемую проблему были противоречивы. Механизм, трансформирующий противоречивость взглядов в неадекватность модели, можно представить следующей схемой рассуждений. Противоречивость является следствием неуверенности эксперта в собственных суждениях. В свою очередь, неуверенность нарушает логику, которой он должен придерживаться в процессе реализа ции своих предпочтений на выборочном множестве. В силу этого в сформированной псевдовыборке содержатся данные, слабо со гласованные со значениями бинарной переменной. Несогласован ность исключает возможность восстановления той зависимости, которой якобы пользовался эксперт, формируя псевдовыборку. Таким образом, модель действительно имеет плохую точность в тех случаях, когда псевдовыборка формировалась некомпетент ным образом. Поэтому уровнем адекватности модели имеет смысл измерять компетентность эксперта. Чем выше уровень адекватно сти (коэффициент Макфаддена) или ниже остаточная энтропия (энтропийный коэффициент), тем компетентнее действовал экс перт, распределяя свои предпочтения между наблюдениями выбо рочной совокупности. Переходя к рассмотрению вопроса о согласованности оценок, сразу заметим, что, как и в случае прямого экспертного опроса, в рассматриваемом подходе действует тезис — доверие групповым оценкам выше, чем индивидуальным. Действие тезиса возможно только при согласованности индивидуальных оценок. Следователь но, не любая групповая оценка обладает высокой надежностью. На первый взгляд может показаться, что для проверки согласованнос ти можно воспользоваться двумя подходами: в соответствии с пер вым проверять согласованность до построения модели, в соответ ствии со вторым — после построения по результатам моделирования. 59
От первого подхода сразу нужно отказаться, Дело в том, что псевдовыборка, сформированная с ориентиром на согласованное мнение экспертов, не всегда гарантирует построение адекватной модели. Это бывает в том случае, когда согласованными оказа лись мнения некомпетентных экспертов. Подобная ситуация не возникает в задачах прямого экспертного оценивания. В них ком петентность оценивается либо экзогенно, и тогда она не связана с результатами опроса, либо в зависимости от того, насколько соответствующее индивидуальное мнение похоже на групповое. Второй подход представляет собой авторское решение задачи, в рамках которой проверяется согласованность экспертных сужде ний. Как и в случае прямого экспертного оценивания, в пред лагаемом подходе предусматриваются проверка согласованности мнений двух экспертов и проверка согласованности мнений всей группы экспертов, принявших участие в экспертизе. Обе провер ки основаны на одной и той же идее. Смысл этой идеи в том, что эксперты с близкими мнениями распределяют свои предпоч тения по выборочной совокупности так, что полученные псевдо выборки обеспечивают построение почти идентичных моделей. Таким образом, проверка согласованности сводится к статистичес кой проверке значимости уровня идентичности. Выполнить такую проверку можно несколькими способами. На наш взгляд, наиболее приемлемым следует считать способ, который позволяет не только оценить статистическую значимость, но и получить содержательно интерпретируемую величину, харак теризующую уровень идентичности моделей и, следовательно, уровень согласованности экспертов. В качестве такой величины удобно использовать коэффициент Юла, который измеряет тесноту связи между двумя дихотомическими переменными. Формально с помощью этого коэффициента мы можем оценить тесноту связи между предикторными возможностями двух моделей бинарного выбора. Для этого заполняется таблица сопряженнос ти 2 х 2 следующего вида: Модель 1-го эксперта 1 Коды 0 1 а в 0 с d
Правило заполнения таблицы сопряженности довольно про стое. В верхней левой клеточке стоит число случаев, когда пред60
сказания по обеим моделям совпадали и были равны 1, в ниж ней правой — число случаев, когда обе модели предсказали 0. В остальных клеточках стоит число несовпадающих предсказаний. Коэффициент Юла рассчитывается по формуле ad-be ,, g. ad + be При полном совпадении предсказанных значений qn — 1, и мы наблюдаем случай, когда мнения экспертов идентичны; при qn = —\ мнения экспертов противоположны, а при qn = 0 — независимы. Чем ближе значение коэффициента к 1, тем выше уровень согласованности экспертных мнений. Для проверки групповой согласованности нет подходящего из мерителя. Но можно предложить следующую двухэтапную проце дуру. На первом этапе для каждой пары экспертов вычисляется коэффициент сопряженности Юла, и все эксперты делятся на две группы. В первую группу включаются только те эксперты, по моделям которых предсказанные значения имеют положительную связь между собой. Из коэффициентов сопряженности этой груп пы формируется матрица Яи
Q=
Яи Яп
Яш Ягт
Матрица Q обладает всеми свойствами, необходимыми для того, чтобы с помощью обычной итерационной процедуры вычис лить максимальное собственное значение Я, которое является дей ствительным числом. Тогда в качестве меры, определяющей уро вень согласованности экспертов, можно использовать величину L=^ - =— , (3.10) trQ-1 m-1 в знаменателе которой стоит след матрицы без единицы. Так, определенный коэффициент согласованности будем назы вать характеристическим. Он равен 1, когда между всеми экспер тами группы наблюдается абсолютное согласие, и равен 0, если результаты экспертного опроса статистически независимы. С отбракованной на первом этапе группой экспертов поступа ют точно так же. 61
Окончательно групповая оценка строится только для группы экспертов, имеющих согласованные мнения. Для этого все псев довыборки объединяются в одну, по данным которой строится модель, отражающая групповое экспертное мнение. Ее и реко мендуется использовать в расчетах. 3.1.5. Предельный анализ моделей субъективных предпочтений Предельный анализ факторов модели экспертных предпочтений проводится по схеме предельного анализа бинарной модели. Поэтому вначале изложим все детали предельного анализа бинарной модели, а затем обсудим интерпретацию этих результа тов для случая, когда моделируются экспертные предпочтения. Рассмотрение начнем с линейной модели. В классической теории коэффициенты линейной регрессии интерпретируют как предельные коэффициенты абсолютного ро ста. Принято считать, что k-н коэффициент регрессии показы вает, насколько изменится зависимая переменная (моделируемый показатель), если к-я независимая переменная изменится на еди ницу при условии, что эта единица достаточно мала, а все ос тальные переменные неизменны. Естественно, при построении пробит- и логит-моделей возникает аналогичный вопрос. Предельный анализ с использованием пробит- и логит-моделей в силу их нелинейного характера и вероятностной интерпретации результатов моделирования требует более сложных математических обоснований по сравнению с линейными моделями. Рассмотрим общий случай модели бинарного выбора и запи шем для события yt- условное математическое ожидание E(y,.|x,.) = lF(xi.b) + 0(l-F(x,b))(3-П) Предельный эффект к-го фактора вычисляется в виде первой производной ЭЕ(у,.|х,.) faF(x,.b)3(x,.b) = f(x,.b)b t , (3.12) dxik { Э(х,Ь) dxik где f() — функция плотности, связанная с соответствующим кумулятивным распределением F(). Полученный предельный эффект можно интерпретировать как величину, на которую изменяется вероятность выбора при изме нении фактора на единицу, т.е., по сути, как изменится неопре62
деленность ситуации бинарного выбора. Однако механизм форми рования этой величины не так прост, как в линейной модели, и представляет собой взаимодействие двух составляющих, каждая из которых имеет собственную интерпретацию. Первая составляющая определяется плотностью распределения, которая в предельном эффекте является изменяемой характерис тикой, зависящей от х- Рассмотрим основные механизмы фор мирования этой составляющей и ее содержательную интерпрета цию. Прежде всего обратим внимание на то обстоятельство, что изменение к-й переменной, например в сторону увеличения ее значения, может привести как к увеличению, так и снижению плотности вероятности. Механизм реализации этих изменений начинает действовать с изменения значения линейной формы: Zi = x,b = b0+ bxxn +••• + bkxik +••• + bmxim. (3.13) Изменение линейной формы зависит от величины и знака ко эффициента регрессии Ьк. В свою очередь, изменение плотнос ти вероятности зависит не только от величины, на которую из менилось значение линейной формы, но и от того, где это зна чение расположено на оси z- Если оно лежит в левой половине распределения, то увеличение z приводит к возрастанию плотно сти, если в правой — то к снижению. Это положение хорошо иллюстрирует рис. 3.1.
Рис. 3.1. Изменение плотности вероятности в зависимости от распо ложения значения линейной формы Анализ предельной производительности факторов позволяет обнаружить, что максимально возможная производительность фактора достигается в тех точках, в которых плотность имеет наи большее значение. Интересно, что именно в этих точках ситуа ция бинарного выбора обладает самым высоким уровнем неопре деленности. Это становится совершенно очевидным для логит63
модели, если вспомнить о выражении для плотности и предель ную производительность ее А:-го фактора записать в виде ЭЕ(У |Х )
'
' = F(x,b)(l - F(x,b))b,.
(3.14)
Максимальное значение первой составляющей, которая в дан ном выражении представлена произведением вероятностей, до стигается при F(x;b) = 0,5, т.е. когда имеет место самый высо кий уровень неопределенности. Вторая составляющая менее интересна для анализа. Она рав на постоянной величине и в основном играет роль мультиплика тора, усиливающего или снижающего вклад первой в предельную производительность. Геометрически (см. рис. 3.1) при увеличе нии xik на единицу коэффициент Ьк определяет ширину прямо угольника с высотой f(x(.b), на величину площади которого изме няется вероятность бинарного выбора в условиях, описываемых вектором х(. Так как события бинарного выбора несовместны, то при рас смотрении результатов предельного анализа нужно помнить, что увеличение вероятности возможного появления одного из событий влечет за собой уменьшение на ту же самую величину вероятно сти возможного возникновения альтернативного события. Поэтому если из двух вероятностей увеличивается при изменении xjk та, которая имеет большее значение, то неопределенность выбора снижается; если та, которая имеет меньшее значение, то неопре деленность выбора увеличивается. Переходя к интерпретации результатов моделирования эксперт ных предпочтений, прежде всего попытаемся понять смысл рас четных значений &=F(x,.b)-
(3.15)
С одной стороны, это вероятность возможного появления собы тия, состоящего в том, что yj примет значение, равное 1, а с другой — это характеристика оставшейся в предпочтениях эксперта неопределенности. Действительно, с ее помощью можно вычис лить энтропию Я, =-F(x,.b)log 2 F(x,.b)-(l-F(x 1 .b))log 2 (l-F(x,6)). ( з л 6 ) которая характеризует уровень неопределенности бинарного выбо ра, сохраняемый в точке х,- после экспертного опроса. 64
Предельная производительность фактора, изменяя вероятность выбора, естественно, изменяет и энтропию ситуации, в которой осуществляется выбор. Причем, как упоминалось выше, рост вероятности в одних случаях снижает энтропию, а в других при водит к ее увеличению. Фактически это означает, что для экспер та более важной является информация о ситуации, в которой он будет принимать решение, а не информация о возможном изме нении ситуации. Ситуацию с максимальной энтропией можно понимать как равновесную, смысл которой в том, что эксперт не располагает информацией, позволяющей одну альтернативу предпочесть дру гой. Естественно, что именно в этой ситуации любая информа ция, позволяющая изменить степень предпочтения эксперта, це нится дороже, чем та же самая информация, но в условиях, когда уже сформированы убедительные предпочтения. На основе результатов анализа предельных производительностей легко выстраивается процедура ранжирования факторов по степени их влияния на вероятность появления интересующего нас события (на изменение уровня неопределенности). В основе про цедуры лежит простое соображение. Так как первая составляющая (плотность вероятности) одинакова для всех факторов, то поря док значимости факторов следует определять по абсолютной вели чине коэффициентов бинарной регрессии. Если вспомнить, что в случае линейной модели ранжирование факторов по величине соответствующих коэффициентов регрессии некорректно, то вы вод следует признать неожиданным. Таким образом, предельный анализ модели экспертных пред почтений позволяет оценить влияние факторов на уровень неопре деленности в каждой ситуации бинарного выбора, а также упо рядочить все факторы по степени их влияния на выбор в любой из рассмотренных ситуаций. 3.2. Методы оценивания моделей бинарного выбора 3.2.1. Метод максимального правдоподобия Построение регрессионных моделей с использованием нелинейных зависимостей подобного типа практически исключа ет применение метода наименьших квадратов. Для оценивания моделей бинарного выбора обычно используется метод максималь ного правдоподобия [2]. Применение этого метода осуществляется 65
в предположении, что каждое наблюдение может трактоваться как однократный выбор из распределения Бернулли. Таким образом, модель с вероятностью успеха F(x/b) и независимыми наблюдени ями (эксперты опрашиваются независимо друг от друга) представ ляет собой вероятность совместного появления всей совокупнос ти ожидаемых событий: Wx=yx,Y2=y2,
... Y„=yn)=
n F ( x , b ) n ( l - F ( x ; b ) . (3.17)
Для каждого вектора у, представляющего собой результаты конкретного экспертного опроса, величина вероятности зависит от вектора оцениваемых параметров b и может быть записана как функция правдоподобия L(y,b) = nF(x,.b) v '[l-F(x,b)] 1 - v '.
(3.18)
В данной форме записи множители произведения селектиру ются с помощью компонент вектора у, принимающих всего два значения: 0 или 1. Удобнее и математически проще максимизировать логарифми ческую функцию правдоподобия: lnL = E[y,lnF(x,b) +(l- 3 > / )ln(l-F(x,.b))].
(3.19)
Используя сокращенные записи F; = F(x ( b) и F£(x.b) = f-> вы пишем для логарифмической функции правдоподобия условия максимизации первого порядка:
ain_L= « v f
-f х', = 0 . (l-F,)
(3.20)
Подставляя в полученное выражение логистическое распределе ние, имеем после очевидных преобразований следующую систему уравнений:
Х(х-Л,)х,=0.
(3.21)
/=1
В случае нормального распределения система уравнений име ет вид cHnL
М эь =1 Ф;
66
+ (1_Л)_^_ х'=0.
(1-Ф,)
(3.22)
Введение в рассмотрение переменной qt = 2у. переписать эту систему следующим образом:
1 позволяет
<7,0(tf,x,b) х'=0. (3.23) Ф(?,х,Ь) Полученные системы уравнений нелинейны, и для их решения необходимо применять численные методы. Прежде чем приступить к численному решению, следует убедиться в том, что итерацион ная процедура обеспечивает получение глобального максимума логарифмической функции правдоподобия. Для этого покажем, что данная функция является строго вогнутой, т.е. имеет един ственный максимум. Чтобы убедиться в этом, достаточно показать, что lnF(x) и 1п( 1—F(x)) являются строго вогнутыми. В силу того, что сумма строго вогнутых функций есть строго вогнутая функция, следует, что и логарифмическая функция правдоподобия строго вогнута. Основным признаком строгой вогнутости является отрицатель ность второй производной. Сначала покажем, что этим свойством обладает lnF(x). Последовательно дифференцируя, получаем d(lnF(x)) _ 1 dF(x) _ f(x). dx F(x) dx F(x) d2(lnF(x)) dx
d ( f(x) Л dx F(x)
f'(x)F(x)-F'(x)f(x) F 2 (x)
(3.24)
(3.25)
В соответствии с полученными выражениями для логистичес кой функции имеем d(lnF(x)) dx
Пх) =
<
е~* х а+е~х\2 )
e (1 + е~х)2
1 + е~
(3.26)
е'х(1 + е-хГ -2(1 + е-х)(-е~х)еа + е~х)4 . -2х -е -х +е (\ + е~х)3
(3.27)
67
-е
х
2х
+е
1
(1 + е-у 1 + е" <0. 1 ~(1 + <Г*)Т (3-28) (l + O 2 Строгая вогнутость lnF(x) доказана. Так как (1—F(x)) в случае логистической функции симметрична F(x), то она тоже строго вогнута. Следовательно, логарифмическая функция правдоподо бия, представляющая собой сумму строго вогнутых функций, сама является строго вогнутой, и применение градиентной про цедуры приводит к получению единственного решения. В случае, когда F(x) есть функция нормального распределе ния, результат тот же самый — логарифмическая функция прав доподобия строго вогнута. Таким образом, численное решение системы (3.21) или (3.23) приводит к получению оценок, макси мизирующих соответствующие функции правдоподобия. 2
d (lnF(A-)) _ dx 2
(l + O
3
3-2.2. Численное решение с помощью метода Ньютона — Рафсона Рассмотрим построенную на основе метода Ньютона — Рафсона вычислительную схему решения нелинейной системы уравнений
Э]пЦЬ)
эь Все детали этой схемы будут изложены без уточнения, на осно ве какого распределения была построена функция правдоподобия. Считая левую часть системы (3.29) дифференцируемой векторфункцией (для исследуемых здесь распределений это действительно так), запишем отрезок ряда Тейлора, являющегося линейной аппроксимацией этой функции в окрестности некоторой точки Ь0:
ainL(b) ainL(b) a2inL(b),. . ч
- э ь Г = ~^ьГ + ^МьГ (
о)
"
(130)
Производная по Ь0 обозначает производную по Ь, вычислен ную в точке Ь0. Саму точку Ь0 будем считать начальным прибли жением искомой оценки. Ее значение можно определить как век тор параметров линейной регрессии у = ХЬ + £, (3.31) оцененных с помощью метода наименьших квадратов, т.е. 68
b0=(X'X)~'Xy.
(3.32)
Обозначив произвольную точку окрестности через Ь| и помня, что нашей целью является нахождение такого вектора параметров, кото рый обращает первую производную в ноль, целесообразно записать Э1пЦЬ)
0=
Э21пЦЬ)]
-эьГ + -эмьГ(Ь,-Ьо)-
<133)
Раскрывая круглые скобки и перенося влево член, содержащий Ь,, а затем, умножая обе части уравнения на обратную матрицу, получаем выражение, задающее итерационный процесс нахожде ния искомого решения:
ь ь
'= «-Ьмьг! -»г-
<334)
Вектор Ь, является первой оценкой искомых параметров. Вы числяя значения производных во вновь получаемых точках и про должая итерационный процесс по рекуррентной формуле ь +1=ь
'
[Э21пЦЬА,)1"'Э1пЦЬ,)
*-ГэьэьН — э ^ - '
(3 35)
-
имеем последовательность {Ь^.}. Если предел этой последователь ности равен Ь, то он есть искомое решение системы, так как соотношение
К г к
Ь
2 Ь к Ь[Э 1пЬ(Ь)Г'Э1пЦЬ)
-ЙЕ '«- -ЬЁН ~А-
(зад
имеет смысл при
Э1пЦЬ)^ 0
эь
(3.37)
Следовательно, полученное решение является также и оценкой максимального правдоподобия. 3.2.3. Итерационная схема обобщенного МНК (метод Берксона) В некоторых ситуациях появляется возможность для оценки параметров логит- и пробит-моделей применять метод наи меньших квадратов [16]. Подобная ситуация возникает в случае 69
"повторяющихся" (или группированных) статистических наблюде ний, имеющих структуру вида У,
х
п
У\ < ,
. . х
<2
УГ
Л.
;
9
(3.38) 2 п2 2
2
tf tf
•у
Х
1
к2,
х" х" Л
12
•
21
^22
1»)
•
х" xN " '
. X? ' 2/г
х" х \ . . . xN < n it, В каждой Л-й ф у п п е наборы независимых переменных равны между собой, т.е. х* = х* = ••• = **,. где х* = (*,-,, х* 2 ' . . ., х-т). Фактически имеет место ситуация, когда в выборке присутствуют по нескольку наблюдений зависимой переменной у, соответству ющих одним и тем же значениям объясняющих переменных (либо в группе все наборы объясняющих переменных в силу того, что мало отличаются друг от друга, заменены одним и тем же набо р о м с у с р е д н е н н ы м и з н а ч е н и я м и х ( ). В этом случае ф у н к ц и я правдоподобия приобретает следующий вид: "Л'
s
L(y; b) = ПП{ р ( х * ь >'' [1- F(x*b)]'"v' } =
=п 70
2>< I-F(x*b) F(x*b) M
'•'
(3.39)
Если все пк достаточно велики, то можно вместо максимиза ции логарифмической функции правдоподобия для получения оценок параметров модели применить схему метода взвешенных наименьших квадратов. С этой целью перейдем от исходного на бора наблюдений к наблюдениям вида (ДД.),
/ = 1,2, ...,7V,
(3-4°)
где р =2^у'- / rij— относительная частота события, состоящего в /=' том, что зависимая переменная примет значение, равное едини це, при значениях объясняющих переменных, равных х,. В соответствии с теоремой Бернулли относительная частота Д связана с истинным значением вероятности P{j,-=l|x,.) = F(x;b) неравенством P{|p,.-F(x,.b)j<£}>l-<5,
(3.41)
которое позволяет записать соотношение р{ = F(x,b) + £,. (3.42) Случайная составляющая е1 имеет нулевое математическое ожида ние Е(е,) = 0 и дисперсию, равную D(e,) = F(x / b)(l-F(x,b))/« . Таким образом, соотношение для относительной частоты мож но рассматривать как нелинейную регрессию с гетероскедастичными (т.е. имеющими неравные дисперсии) остатками. Параметры та кой регрессии оцениваются с помощью итерационной вычислитель ной процедуры, минимизирующей взвешенную сумму квадратов i f F ^ b K l - F ^ b ) ) ] - 1 ^ -F(x;b)]2.
(3.43)
Упростить построение нелинейной регрессии можно в том слу чае, если удается подобрать такое преобразование, которое позво ляет заменить нелинейную модель линейной, эквивалентной ис ходной в смысле совпадения оцениваемых параметров. Таким преобразованием является функция F 1 , обратная функции рас пределения вероятности соответствующего закона. Если операцию обращения применить к (3.42), то получается соотношение 5?, =х,.Ь + е,.,
(3.44)
представляющее собой линейную регрессию, обоснованность ко торой приводится ниже. 71
Промежуточное представление при переходе от (3.42) к (3.44) F- 1 (A) = F" 1 (F(x / b) + e / ) (3.45) можно в окрестности точки е = 0 разложить в ряд Тейлора и, ограничившись точностью первого порядка, записать следующим образом: F 4 (A-) = F-1(F(xI.b)) + dF-(F f )
(3.46)
dF
где F (F(x / b)) = x,b, а остаточный член легко преобразуется к виду dF"'(F.)_ dF;
1
1
___ 1
~ dF(F,.) /<Щ. ~ f(x,b) ~ f; •
(3,47)
В преобразованном остаточном члене величина f = f(x-b) рав на значению функции плотности закона распределения вероятно сти F в точке Х-Ь. Введение обозначений y=Y'\p) и £ . = £ . / / позволяет запи сать уравнение регрессии (3.44). Зависимая переменная в этом уравнении представляет собой квантиль уровня pt функции распреде ления F. Случайные составляющие £г- имеют нулевые математические ожидания Е(ё~) = 0 и неравные дисперсии D(£}) = F,(l - F,)//?,- ff. В результате проведенных преобразований задача построения нелинейных логит- и пробит-моделей свелась к оценке параметров линейной функции регрессии с гетероскедастичными остатками. В качестве зависимых переменных в этих функциях регрессии применяются квантили соответствующих распределений. В логитмоделях для расчета квантиля используется функция Й = 1П[А-/(1-Д->],
(3.48)
которая является решением уравнения ez/(l + ez) = pi
(3.49)
относительно z, т.е. действительно находит квантиль уровня р{. В пробит-моделях значения зависимой переменной yi опреде ляются в виде табличных квантилей уровня Pi стандартного нор мального распределения. 72
После преобразования моделей к линейному виду их построение осложняется только гетероскедастичностью остатков е;-. Как извест но, избежать возможного искажения коэффициентов удается путем применения взвешенного метода наименьших квадратов. В каче стве весовых коэффициентов в этом методе используются величи ны, обратные дисперсии соответствующих остатков De}. Для логит-модели весовые коэффициенты определяются из соотношения (') Щ
=
_J_ Det
=
Щf/2 Ц-а-Ц)
=
.dA(x.b) 2 2 2 "' d(»,b) = я,-Л (1-Л,-) Л(х 1 -Ь)(1-Л(х / Ь) Л ; (1-Л г -)
=
= л,.Л,.(1-Л,). (3.50) Таким образом, оценка параметров логит-модели сводится к решению оптимизационной задачи вида Хи^ф-Х/Ь)2 /=i
-*
min,
(3.51)
ь
где у,- рассчитано по формуле (3.48); w(/) определяется в соответ ствии с (3.50). Оценка параметров b пробит-модели сводится к решению этой же оптимизационной задачи, но с другими значениями зависимой пе ременной и другими весовыми коэффициентами. Для пробит-модели значения зависимой переменной yt определяются в виде табличных квантилей уровня pi стандартного нормального распределения, а весовые коэффициенты w- рассчитываются по формуле w\n) =п,.ф 2 (х,Ь)/Ф(х,Ь)(1-Ф(х,.Ь)),
(3.52)
в которой ср — функция плотности, а Ф — функция распределе ния стандартного нормального закона вероятности. При фиксированных значениях весовых коэффициентов w ре шение оптимизационной задачи (3.51) легко получается с помо щью обобщенной процедуры метода наименьших квадратов. Од нако в рассматриваемом случае веса w зависят от оцениваемых параметров Ь, и решение оптимизационной задачи можно полу чить, применив итерационную процедуру. На первом шаге этой процедуры оптимизация (3.51) проводится с помощью обобщен ного метода наименьших квадратов при w = 1. Полученные оцен ки Ь^1' используются для подсчета по соответствующим формулам 73
весовых коэффициентов w' '(b^') или w^p\h( ') в зависимости от модели (логит-модель или пробит-модель). Эти новые коэффици енты применяются в обобщенном методе наименьших квадратов на следующем шаге итерационной процедуры для получения оце нок Ь^ '. Итерационная процедура продолжается до тех пор, пока пересчитанные весовые коэффициенты очередного шага не совпа дут до определенного знака после запятой с весовыми коэффици ентами предыдущего шага. Подобного рода итерационные процедуры применяются во мно гих статистических пакетах. В частности, возможность построения моделей бинарного выбора с использованием итерационной проце дуры реализована, например, в пакетах Eviews и STATISTICA. 3.3. Оценка качества пробит- и логит-моделей 3.3-1 • Адекватность Оценка качества регрессионных моделей с бинарной зависимой переменной осуществляется практически по той же схеме, что и качества обычной линейной регрессии: определяет ся пригодность модели в целом, затем — статистическая значи мость каждого коэффициента модели и, наконец, проверяются гипотезы (если они имеют место) относительно ограничений, которым могут удовлетворять отдельные группы параметров. Пригодность модели в целом (адекватность) определяется с по мощью двух показателей. В качестве первого рассмотрим предло женный Макфадденом (McFadden) индекс отношения правдоподобия тот
1
toLflj)
lnL(60) где InL(b) — максимальное значение логарифмической функции правдоподобия, достигаемое в точке, координаты которой равны оценкам параметров модели b = (b0, bx,..., bm), a lnL(£0) — зна чение логарифмической функции правдоподобия, вычисленное в предположении, что Ьх = Ь2 = ... = Ът = 0. (Во многих пакетах предусмотрен расчет этих значений функции правдоподобия.) Интуиция подсказывает, что значения такого показания долж ны быть заключены между 0 и 1. Действительно, в случае, когда все коэффициенты, кроме Ь0, равны нулю, индекс отношения правдоподобия тоже равен нулю. Если же модель оказалась такой, 74
что ее расчетные значения у = (F(x Ь) в точности совпадают с наблюдаемыми значениями уп т.е. имеют место только случаи или у( = у. =1, или у: = у. = 0 , то индекс LRI = 1. О такой модели принято говорить, что она совершенно согласована. В остальных случаях значение LRI заключено между 0 и 1, причем чем больше совпадений между расчетными и фактическими зна чениями, тем ближе значение индекса к 1. К сожалению, слу чаи, когда значения индекса заключены между нулем и едини цей, не имеют собственной интерпретации. Даже в случае когда построенная модель идентична истинной функции распре деления вероятностей, она не является совершенно согласованной. Второй показатель принято называть псевдо (pseudo) R2. Его расчет осуществляется по формуле j^2 _ j
\ n
2(lnL(b)-rnL(4))) '
(354)
п где п — объем выборки. Как и в случае индекса LRI, псевдо R2 равен 0, когда все коэффициенты модели, кроме Ьф равны нулю. Его значение приближается к 1 по мере того, как увеличивается разность между InL(b) и 1пЦЪ0), но 1 не достигает. Чем ближе к 1 значение псевдо R2, тем точнее модель воспроизводит фактические значе ния бинарной переменной. 3.3.2. Статистическая значимость коэффициентов Проверка статистической значимости отдельных коэф фициентов модели осуществляется с помощью статистики Вальда. Для вычисления ее значения необходимо иметь стандартные ошибки коэффициентов модели. Стандартные ошибки, как и в случае линейной регрессии, определяются по диагональным эле ментам ковариационной матрицы оценок 6. Но прежде чем пе рейти к определению значимости, исследуем вопрос состоятель ности и асимптотической нормальности этих оценок. Известно, что решение любого из уравнений правдоподобия (3.1) или (3.2), даже если оно существует, не обязательно име ет хорошие асимптотические свойства. Желаемые состоятельность и асимптотическая нормальность обеспечены только в том случае, когда выполняются определенные условия, налагаемые на пове75
дение объясняющих переменных в генеральной совокупности. Существуют два подхода к этой проблеме: 1) полагают, что объясняющие переменные являются стохас тическими. Тогда налагаемые на них условия предстают в форме "все х. являются независимыми, одинаково распределенными слу чайными переменными, для которых существуют моменты доста точно высокого порядка"; 2) полагают, что объясняющие переменные фиксированы. В этом случае условия будут следующими: • для зависимой переменной у: существует асимптотическая матрица вариации-ковариации; • значения независимых переменных х. ограничены, т.е. всегда найдутся такие константы т, М; т >— °°, М<^>, что т < х. < М, V/, /'. Если одно из этих условий выполнено, то при достаточно больших п оценка b существует и сходится по вероятности к ис тинному значению Ь. Ковариационная матрица этой оценки рав няется матрице, обратной к информационной матрице Фишера, которая представляет собой математическое ожидание Гессиана, взятое с обратным знаком
V(b) = r' = J-E
Э2 ln(L) ЭЬЭЬ'
(3.55)
Предполагается, что математическое ожидание здесь берется условно по х. Таким образом, при выполнении сформулированных выше условий можно считать, что оценка вектора коэффициентов мо дели, полученная с помощью метода максимального правдоподо бия, является асимптотически нормальной, т.е. (
R V
_- 1 - 1
Э 2 ln(L) -Е ЭЬЭЬ' J
"i
J
Как нетрудно понять, асимптотическая матрица ковариации зависит от неизвестного параметра Ь. Поэтому непосредственное использование ее в практических расчетах исключено. Рекоменда ции здесь те же самые, что и при использовании обычной регрес сии — неизвестные параметры, присутствующие в матрице, сле76
дует заменить соответствующими оценками. Руководствуясь этим общим правилом, можно записать V(b)=
-E
Э21п(Ъ) ЭЬЭЬ'
(3.57) ь=ь
и использовать в практических расчетах не ковариационную мат рицу, а ее оценку. Рассмотрим детально, каким образом может быть получена оценка этой матрицы. Для этого вычислим матрицу вторых про изводных (Гессиан)
Э2 ln(L) _ Э ain(L) ЭЬЭЬ' п
/=1
f'F-f2 F2
дЪ
эь
f'(l-F) + f 2 -X/X/O-JV) (1-F)2
,
(3.58)
где F = F(x,.b) и f = f(x,b). Для получения информационной матрицы Фишера необходи мо Гессиан умножить на —1 и взять математическое ожидание. Используя тот факт, что Е(_у;) = F(x / b), и проведя несложные преобразования, получаем 1=Е
- Э2 In (L) ЭЬЭЬ'
= 2^F(x /
[f(x,b)r
(3.59)
/b)[l-F(x/b)]
Соответственно асимптотическая матрица вариации-ковариации Ь примет вид -1 -1
]aF(x,b)[l-F(x,b)J
(3.60)
а ее оценка равна 2
[f(x,b)] v(b) = r1 = jsF(x,b)[l-F(x,b)]
(3.61)
Корни квадратные из диагональных элементов этой матрицы Sf являются стандартными ошибками соответствующих оценок \)Чкк ъ Их используют для получения статистики Вальда 11
f
b,л
, к=0,
1,
т.
(3.62)
В случае логит-модели, для которой f = F ( l - F ) , матрица Фи шера упрощается: -Э 2 1п(Ь) ЭЬЭЬ'
XFCx^tl-FCx^JxX.
(363)
Кроме того, матрицу Фишера можно представить в более ком пактной и более удобной для расчетов форме. С этой целью обо значим через X матрицу наблюдений за экзогенными перемен ными, дополненную столбцом из единиц и имеющую размер пх(т+\). По-прежнему х(. будет обозначать /-ю строку матрицы наблюдений. Далее через D обозначим диагональную матрицу «-го порядка, у которой /-й элемент диагонали имеет следующий вид: [f(x,b)] 2 (3.64) F(x,b)[i - F(x,b)] Тогда информационная матрица Фишера может быть записана следующим образом: d;; =
_
1=Е
-Э 2 1п(Ь)" = ХТ)Х. ЭЬЭЬ'
(3.65)
Ковариационная матрица в этом случае равна V(b) = (XDX)- 1 . (3.66) Такая форма ковариационной матрицы напоминает обобщенную оценку наименьших квадратов.
3.3.3- Стандартные ошибки вероятностей и предельных
предсказанных эффектов
Расчетные значения F, = F(x,b), получаемые с помо щью оцененных пробит- и логит-моделей, представляют собой ве роятности того, что переменная у примет значение 1 или 0. Воз можные изменения этих вероятностей в зависимости от факторов оцениваются частными предельными эффектами Э F(x,b) f(X-b)b. (3.67) Эх Это именно те характеристики, которые подлежат интерпретации и практическому использованию. Чтобы иметь представление о на-
78
дежности выводов, полученных на основе результатов моделирова ния, необходимо иметь оценки стандартных ошибок этих характе ристик, получить которые можно с помощью дельта-метода [63]. Для расчетной вероятности F, дельта-метод позволяет записать асимптотическую величину стандартной ошибки в виде V( F,) = [Э F(x,b) /ЭЬ]'У(Ь)[Э F(x,b)/дЬ],
(3.68)
где V(b) — асимптотическая ковариационная матрица оценки Ь. Заметим, что доступность практического использования данной формулы гарантируется тем, что асимптотическую ковариацион ную матрицу в ней, следуя рекомендациям предыдущего парагра фа, можно заменить оценкой V(b). Чтобы сделать формулу (3.68) более удобной для расчетов, проведем ее преобразование. С этой целью введем обозначение: Z, = х , Ь . Тогда вектор производных может быть представлен сле дующим образом:
[aF(x,b)/ab] = [aF(x,b)/8zi][3z./ab] = f(x,b)x,. (3.69) Замена в (3.68) вектора производных на (3.69) позволяет запи сать выражение для стандартной ошибки расчетной вероятности F, в более компактной форме: V(F,.) = [f (x,b) ] 2 x,. V(b)x; •
(3.70)
Стандартная ошибка зависит от вектора, по которому рассчи тывалась вероятность. Теперь перейдем к рассмотрению предельных эффектов. Для удобства введем обозначение g =f(xb)b- Тогда асимптотическая ковариационная матрица предельных эффектов может быть запи сана так: V(g,-) - [3g, /3b']V(b)[3g, /ЭЬ']'-
(3-71)
Для дальнейших преобразований матрицу производных предста вим в виде суммы
В полученном выражении вычисление производной дЪ/дЪ' привело к единичной матрице, а вычисление dZj/дЪ'— к векторстроке х(, 79
Для пробит-модели, если учесть, что df/dz = -Z(t>, выражение (3.72) переписывается следующим образом: V(g,)=0 2 [I-(b' X ;)bx,.]V(b)[I-(bX)bx,]'. (3.73) В случае логит-модели плотность вероятности f может быть записана через функцию распределения Л как f=A(l-A). Для краткости будем писать Л, полагая Л = Л(£,•). Дифференцируя это выражение по z, имеем - f =0-2Л)
= (1-2Л)Л(1-Л).
(3.74)
Подставляя выражение (3.74) в (3.72), получаем стандартные ошибки предельных эффектов логит-модели: V(g,) = [A(l-A)] 2 [I + (l-2A)bx,]V(b)[I + (l-2A)x;b']. (3.75) Стандартные ошибки предельных эффектов, так же как и стан дартные ошибки расчетных вероятностей, зависят от вектора эк зогенных переменных. 3-3.4. Тесты для проверки линейных гипотез Описанные выше алгоритмы дают оценки, которые являются асимптотически нормальными при стремлении размера выборки к бесконечности. Асимптотическая нормальность оце нок обеспечивает корректность проверки линейных гипотез от носительно коэффициентов модели. Опорным элементом всех статистик, используемых в этих тестах, является информацион ная матрица Фишера. Способ получения асимптотической оценки этой матрицы был рассмотрен выше, поэтому в даль нейшем изложении предполагается, что матрица Фишера нам известна. Во всех тестах проверяется нулевая гипотеза, формальная за пись которой имеет следующий вид: H 0 :Rb = r, (3.76) где R — матрица размером qx(m + 1), задающая структуру ог раничений; b — вектор тестируемых параметров; г — вектор раз мером q х 1 правой части ограничивающих условий. Все нижерассматриваемые тесты асимптотически эквивалентны и, следовательно, обеспечивают получение одних и тех же выво дов. Поэтому выбор того или иного теста диктуется только кон кретной ситуацией и удобством применения в ней. 80
Тест Вальда. В соответствии с предположением, лежащим в основе теста Вальда, вектор оценок Rb при выполнении нулевой гипотезы должен быть близок к г. В силу асимптотической нормальности b в тех случаях, когда имеет место нулевая гипотеза (Rb = r ) , случайное отклоне ние R b - r нормально распределено, т.е. Rb-r~7V(0,RV(b)R%
(3.77)
где V(b) — матрица вариации-ковариации Ь, вычисляемая как обратная к информационной матрице Фишера. Статистика Вальда в этом случае имеет вид W = (Rb-r)'(RV(b)RT'(Rb-r). (3.78) В силу свойств нормального распределения статистика W имеет распределение с2(<у), и проверка нулевой гипотезы осуществляет ся по правилу \не отвергнуть Н0, если W < ^ 5 % ( ^ ) ; отвергнуть Н0, если W > xls чЛч)Рассмотрим пример, иллюстрирующий технику проверки пред положений относительно коэффициентов модели с помощью теста Вальда. Пусть, например, методом максимального правдо подобия получен вектор оценок b = (b0, by, b2, b3, b4) и требует ся проверить предположение о том, что Ь, =1,5, a b-^ —b4- В этом случае нулевая гипотеза записывается следующим образом: (О 1 О О 0 Л
н„ 0 0 0 1-1
ь,
Ч5Л о
Если проверяется статистическая значимость отдельного коэф фициента модели, например bv то, как нетрудно понять, нуле вая гипотеза записывается в виде , „
'О Н 0 :(0 1 0 0 0)
кьч
= 0,
и статистика Вальда после выполнения всех перемножений оказы вается равной квадрату t-статистики (3.79)
5,2
где 5,2 — соответствующий диагональный элемент матрицы V(b). Есть и другая схема вычисления статистики Вальда. Ее исполь зование удобно в тех случаях, когда проверяется только статисти ческая значимость некоторых коэффициентов, т.е. гипотеза о равенстве их нулю. Будем считать, что независимые переменные упорядочены та ким образом, что проверка этой гипотезы касается первых q ко эффициентов. Для дальнейшего изложения этой схемы разделим вектор коэффициентов на две группы: Ь = ЧО где Ь, — ^-мерный вектор, а Ь2 включает (т — q) элементов. В этом случае проверяется нуль-гипотеза вида Н0: {Ь, = 0}. (3.80) Проверке подвергаются оценки, полученные путем максимиза ции функции правдоподобия 1пЦу; Ь) без каких-либо ограниче ний на оцениваемые коэффициенты модели. Полученные оцен ки, как отмечалось выше, состоятельны и асимптотически нор мальны, т.е. bi
~ N
'b,Yi 'i 11 b2
I 21
112 Л 122
(3.81)
Обращая информационную матрицу, представленную в блочм ном виде, по част частям, получаем для подвектора Ь, матрицу вариации-ковариации Статистика Вальда в этом случае рассчитывается по формуле
w = b;v(b,)-'b, =b;[i11-i12i^i21]b1,
(з.8з>
и нуль-гипотеза отвергается или нет по результатам сравнения с критическим значением %2(д). 82
Особенность теста Вальда в том, что в нем используются оцен ки, которые вычислены без учета ограничений, которые посту лируются в нуль-гипотезе. Это безусловное достоинство теста, так как для его реализации не требуется проведения дополнительных расчетов. Тест отношения правдоподобия. В отличие от процедуры Валь да, реализация этого теста требует расчетов, связанных с макси мизацией функции правдоподобия без учета ограничений и с уче том ограничений на коэффициенты модели. Вектор оценок с учетом ограничений имеет вид К j
(3.84)
где Ь'2 является результатом максимизации InL (у; 0; b2) no b2. Полученная таким образом оценка является состоятельной и асим птотически нормальной: Ьс2 ~ N(b,V22\).
(3.85)
Используемая в тесте статистика основана на сравнении двух оценок максимального правдоподобия, полученных максимизаци ей ограниченной (с учетом ограничений) и неограниченной (без учета ограничений) функций правдоподобия, т.е. LR = - 2 { l n [ L ( y ; b f ) ] - l n [ L ( y ; b ) ] } .
(3.86)
Статистика имеет распределение x2(q). Поэтому решение о том, отвергнуть или нет нулевую гипотезу, принимается аналогич но тому, как это делалось в процедуре Вальда. Тест множителей Лагранжа. Применение этого теста не вызы вает затруднений в случае линейных регрессионных моделей. Там понятно, как определить множители Лагранжа и использовать их для расчета статистики. В случае бинарных моделей определение множителей Лагранжа не совсем простая процедура. Поэтому построение статистики основано на других принципах. Если нулевая гипотеза верна, то две оценки — неограничен ная b и ограниченная Ьс должны быть очень близки. Из этого следует близость уравнений правдоподобия, решение которых по зволило вычислить эти оценки. 83
Причем неограниченная оценка b получена как решение системы уравнений д In (L) (у;Ь) ЭЬ,
Э1п[Цу;Ь)] ЭЬ
= 0,
(3.87)
^ ( y ; b ) до-.
а ограниченная b — как решение той же самой системы, но с учетом ограничения Ь, = 0: aln
Э1п[Цу;0;Ц)] ЭЬ
(L)^-n-KO
ЭЬ,
(у;0;Ь?)
^=)(у;0;ь^)
эь 9
aln
(L)/„.ft.Kc>
ЭЬ,
(у;0;И)
о
(3.88)
Обе системы уравнений представляют собой математические ожидания соответствующих уравнений правдоподобия. Взятие математического ожидания в данном случае эквивалентно замене каждой случайной величины yt ее ожидаемым значением F(x ; b) или F ( x ; b ) соответственно. Причем значения самих производных вычислены в точке Ъ. Для рассматриваемого случая статистика множителей Лагранжа записывается следующим образом: LM =
ain[L(y;b)] /f (1ц~ I12I22I21) ЭЬ,
Э1п[Цу;Ьс)] ЭЬ,
(3.89)
Она является асимптотически эквивалентной статистике Вальда W и статистике отношения правдоподобия LR и имеет распределе ние c2(q). Решение, отвергнуть нулевую гипотезу или нет, при нимается по результатам сравнения с критическим значением х1ъ*(я), т.е. процедура сравнения проводится точно так же, как это описано в тесте Вальда. Можно значительно упростить процедуру расчета статистики множителей Лагранжа, сведя ее к построению регрессионного уравнения. Правда, для этого необходимо провести ряд не совсем простых преобразований, которые приведут к упрощенной схеме. Начнем с того, что [I,,-!,,!^!,,]"1, являясь частью матрицы, обрат84
ной информационной матрице Фишера, позволяет записать стати стику множителей Лагранжа в эквивалентном виде Э1 L M =
"[Ь(у;Ь)] j _ , Э1п[Цу;Ь)] д(ЪсУ
дЪс
(3.90)
Теперь вставим индивидуальные наблюдения в уравнение прав доподобия, которое после этой операции будет записываться как сумма логарифмов
ln[L(y;b)] = 5:in[Z(yI;b)].
(3.91)
Если наблюдения не коррелированы между собой, то можно показать, что информационная матрица Фишера представима в виде произведения производных первого порядка. Первая произ водная равна Э1п[Цу;Ь)]
дь'
=/=i1
у, f/
=
А_Э1п[1,( л ;Ь)]_ /=1
+ (i-j,)
ЭЬ' -f, х, (1-Fj)
(3.92)
Соответственно вторая производная может быть записана как Э21п(Ь) _ Э Э1п(Ь) ЭЬЭЬ' ~ЭЬ f'F-f2
=2
f ( l - F ) + f2
(!->',)
i=i
(1-F)2
(3.93)
Выполним операцию взятия математического ожидания путем замены у: на F(x(b) (yi = F(x,b) + £,.):
f
(1 -F) -('-F>f =i=i1 F g^F2 (1-F)2 В результате проведенного преобразования взаимно уничтожа ются слагаемые, содержащие F : •1 i=i
f2 f2 - F —2- ( 1 - F ) F (1-F)2 85
Если в преобразованном выражении убрать оператор ожида ния, т.е. в числителе снова вернуться к у{
=1 7'F_0^'W 1=1
то получаем выражение, отрицательное значение которого представимо в виде суммы произведений
1
/=1
F2
(1-F) 2
= 1 Л ?- ( 1 _ л ) аЬ)
Л
?" (1 * Л) ^Ь)
(3.94)
Возможность такого представления непосредственно следует из того, что у2 — у. и у,(1 — J,) = 0, а правильность проверяется непосредственным перемножением. Таким образом, имеем состоятельную оценку информационной матрицы Фишера:
^-дЫЩу^ЪПдЫи^у^Ъ)]
(3.95) ,=, дЬ ЭЬ' Используя полученную оценку информационной матрицы, за пишем статистику множителей Лагранжа ь м =
^Э1п[/,(у,,Ь)1 х /=i
ЭЬ'
« _Э1п [/Дз',-; Ь) ] ainC/,-^.; b) ]' ЭЬ' 1=1 эь
-1
x«,31n[/i(Jilb)]
(3.96) ЭЬ ;=1 Упрощенный расчет этой статистики можно осуществить следу ющим образом. Обозначим через G матрицу (размером п х q) из соответствующих значений частных производных первого порядка Э1п[/,.(у,.;Ь)]
(3.97) ЭЬ' и через е я-мерный вектор из единиц. Тогда искусственная ли нейная регрессия (3.98) е = Ga + error 86
с вектором коэффициентов a = (G'G) G e (3.99) может использоваться для расчета статистики LM. Коэффициен ты такой регрессии легко рассчитываются с помощью любого ста тистического пакета, а значение статистики равно сумме расчет ных значений этой регрессии. 3.4. Эконометрический прогноз экспертных предпочтений в задачах выбора наиболее перспективных сегментов рынка В предыдущих параграфах был предложен авторский взгляд на обработку экспертной информации и обоснована идея о возможности построения модели бинарного выбора для прогно зирования субъективных предпочтений. Такую модель можно ис пользовать, например, для решения любых прогнозных задач маркетинга, в которых имеет место выбор из двух альтернатив. Здесь же, преследуя цель продемонстрировать прикладные возмож ности предлагаемой модели, изложим процедуру моделирования вероятностных распределений ожидаемых результатов маркетинго вой деятельности ОАО "Радуга" в районах Воронежской и Курс кой областей. Владельцам этой компании принадлежит сеть супер маркетов, организованных по принципу "Пятерочки", "Магни та", "Перекрестка" и других известных отечественным потребите лям супермаркетов. Результаты маркетинговой деятельности любой торговой ком пании во многом определяются уровнем социально-экономическо го развития районов, на территории которых осуществляется эта деятельность. ОАО "Радуга" в течение 2003 г. функционировала в 18 районах Воронежской области. Экспертным путем было ус тановлено, что наибольшее влияние на результаты деятельности оказали: 1) объем розничного товарооборота на душу населения (тыс. р.); 2) численность населения района (тыс. чел.); 3) уро вень зарегистрированной безработицы (%); 4) темп роста промыш ленного производства в сопоставимых ценах (в % к предшеству ющему периоду). Для построения модели необходимо ввести понятие "успешная деятельность". Под успешной деятельностью будем понимать ста бильное получение прибыли, увеличение товарооборота, откры тие новых торговых точек и т.д. 87
При введенных обозначениях ("1" — "успех" компании на по требительском рынке того или иного района Воронежской облас ти и "О" — напротив, "неуспех") была сформирована табл. 3.1, отражающая взаимосвязь результатов деятельности компании с социально-экономическими показателями районов. В качестве основного источника данных для формирования этой таблицы были использованы статистические сборники, а также публикации федеральных и муниципальных органов власти.
*i
Аннинский Богучарский Бобровский Верхнехавский Грибановский Кантемировский Каширский Нижнедевицкий Новоусманский Острогожский Ольховатский Петропавловский Подгоренский Рамонский Репьевский Россошанский Терновский Эртильский 88
Х
7
9,585
52,747
11,300 5,955 6,603 9,698 7,160 5,643 7,653 5,210 21,081 8,093
40,719 54,162 26,656 39,648 41,808 27,106 24,077 64,275 27,972 25,841 23,414
7,469 3,865 10,815 7,579 14,221 8,138 6,011
29,563 33,230 17,884 31,750 25,696 31,499
х , 1,45 1,6 1,0 2,3
Темп роста промышленного производства в сопоставимых ценах, % к предыдущему году
Уровень заре гистрированной безработицы, %
Численность населения, тыс. чел.
Район
Объем розничного товарооборота на душу населе ния, тыс. р.
Факторы
Показатель успеш ности (1— "успех", 0 — "неуспех")
Т а б л и ц а 3.1 Результаты деятельности ОАО "Радуга" в зависимости от уровня с циально-экономического развития районов Воронежской области в 20
2,1 3,1 2,3
124,6 100,2 85,5 228,4 170,5 92,7 109,0 132,4 213,3 105,6 81,2 111,4
У 1 1 0 0 1 0 0 1 1 1 0 1
1,3 1,6 2,3 0,3 2,0 3,2
143,0 249,6 116,5 105,3 111,8 163,7
0 1 0 1 1 0
1,7 2,8 2,7 1,9 1,9
Х
А
Поскольку ОАО "Радуга" осуществляло свою деятельность на территории указанных районов Воронежской области в течение лишь одного (2003) года, то результаты моделирования, по дан ным табл. 3.1, очевидно, могут вызвать определенные сомнения в своей надежности. Поэтому нами было предложено привлечь к решению поставленной задачи группу экспертов, которые уточни ли "надежность" результата деятельности компании (т.е. указали "вероятность устойчивости", понимаемую как процент случаев успешной/неуспешной деятельности в данных условиях), превра тив, по сути, данные фактических наблюдений в псевдовыборку. Итоги экспертного опроса нашли отражение в последнем столб це табл. 3.2.
Таблица 3.2 Экспертная оценка надежности взаимосвязи показателя успешност с определяющими его факторами Район
У
Аннинский Богучарский Бобровский Верхнехавский Грибановский Канте мировски й Каширский Нижнедевицкий Новоусманский Острогожский Ольховатский Петропавловский
1 1 0 0 1 0 0 1 1 1 0 1
Подгоре некий Рамонский Репьевский Россошанский Терновский Эртильский
0 1 0 1 1 0
х
,
9,585 11,300 5,955 6,603 9,698 7,160 5,643 7,653 5,210 21,081 8,093 7,469 3,865 10,815 7,579 14,221 8,138 6,011
х2
Х
3
52,747
1,45
40,719 54,162 26,656 39,648 41,808 27,106 24,077 64,275 27,972 25,841 23,414
1,6 1,0 2,3
29,563 33,230 17,884 31,750 25,696 31,499
Х
4
1,9 1,9 2,1 3,1 2,3
124,6 100,2 85,5 228,4 170,5 92,7 109,0 132,4 213,3 105,6 81,2 111,4
1,3 1,6 2,3 0,3 2,0 3,2
143,0 249,6 116,5 105,3 111,8 163,7
1,7 2,8 2,7
Экспертная оценка, % 75 60 85 55 90 70 85 80 95 90 40 75 60 95 65 95 45 50
По данным табл. 3.2 и с использованием пакета STATISTICA 6.0 была построена логит-модель. Причем в качестве частоты по явления каждого наблюдения в выборочной совокупности были 89
использованы соответствующие экспертные оценки (последний столбец табл. 3.2). В результате выполнения необходимых действий в указанном статистическом пакете были получены расчетные характеристики модели, которые отражены в табл. 3.3 — 3.5. Т а б л и ц а 3.3 Оценки параметров модели, их стандартные ошибки, статистики Вальда и вероятности
Effect Interc "Var2" "Var3" "Var4"
Var 1 - Parameter estimates (Spreadsheet Воронеж) Distribution: BINOMIAL Link function: LOGIT Level of Column Estimate Standard Wald Stat. P Error Effect 1 -75,9566 9,467 498 64,36655 0,000 000 2 9,1266 1,185 847 59,2309 0,000 000 3 0,3427 0,042 789 64,14358 0,000 000 4 0,607 581 49,98247 0,000 000 -4,2955 5
"Var5" Scale
0,0732 1,0000
0,008 013 0,000 000
83,5)625
0,000 000
Анализ табл. 3.3 позволяет: 1) сделать вывод о том, что полученные оценки коэффициен тов являются статистически значимыми (все стандартные ошибки меньше значений коэффициентов, а все вероятности ошибки меньше 0,05); 2) записать аналитическое выражение для построенной логитмодели: р^.
=
Щ.)=
(1 + g-75,956+9,126xh-
+0,34212;-4,295% +0,073^ } -1 .
(*) При сравнении первого и второго столбцов табл. 3.4 мож но сделать следующий вывод: с достаточным уровнем надежно сти не удалось предсказать результат деятельности компании только для двух случаев, описываемых 4 и 12 наблюдениями. С учетом тиражируемости фактически оказалось, что в 1280 случаев из 1310 удалось получить достаточно надежные пост прогнозные оценки результатов маркетинговой деятельности ОАО "Радуга".
90
Таблица Предсказанные значения
Case 1 2 3
Varl - Predicted Values (Spreadsheet Воронеж) Distribution: BINOMIAL Link function: LOGIT Response Pred. LINEAR Standard Lower CL Value Value Pred. Error 95% 1,000 000 1,000 000 32,4945 4,28734 1,000 000 1,000 000 1,000 000 41,5936 1,000 000 5,53909 0,175682 0,000 000 0,253395 -1,0806 0,23740
3.4
Upper CL 95% 1,000 000 1,000 000 0,350 854
4
0,000 000
0,571 408
0,2876
0,23063
0.458 988
0,676 912
5 6
1,000 000 0,000 000
1,000 000 0,179 268
31,3242 -1,5213
4,08611 0,22834
1,000 000 0,122 512
1,000 000 0,254 685
7
0,000 000
0,000 000
-18,7816
2,30808
0,000 000
0,000 001
8
1,000 000 1,000 000
0,975 275 0,746 225
0,62203 0,21746 16,35 733
0,920 980 0,657 545
0,992 565 0,818 287
1,000 000
3,6749 1,0786 124,7406
1,000 000
1,000 000
-0,6088
0,24 938
0,250 193
0,470 028 0,237 265 0,000 000
9 10 11
0,000 000
1,000 000 0,352 331
12 13
1,000 000 0,000 000
0,184 278 0,000 000
-1,4876 -25,6632
0,16322 3,25375
0,140 938 0,000 000
14
1,000 000
45,5412
5,81938
1,000 000
15 16
0,000 000 1,000 000
1,000 000 0,118 643 1,000 000
1,000 000
0,998 793
0,21585 9,41515 1,03164
0,081 032 1,000 000
17
-2,0053 71,1365 6,7181
1,000 000 0,170 472 1,000 000
0,990 952
0,999 840
18
0,000 000
0,000 006
-12,0596
1,55648
0,000 000
0,000 122
Данные табл. 3.5 позволили оценить пригодность модели в це лом с помощью индекса отношения правдоподобия Макфаддена: 267 565 LR1 = l - i ^ ' =0.694 = 1-1пЦ6 0 ) -875,656
Рассчитанное таким образом значение индекса свидетельству ет об адекватности построенной логит-модели, хотя может пока заться и не очень высоким. Однако нужно помнить, что нас интересует не точность аппроксимации распределения, а предска зание возможности появления самого события (возможность появ ления события считается предсказанной, если расчетная вероят ность выше порогового значения 0,5). 91
Таблица Тест правдоподобия 1-го типа
Effect Intercept "Var2" "Var3"
3.5
Varl - Likelihood Type 1 Test (Spreadsheet Воронеж) Distribution: BINOMIAL Link function: LOGIT Degr. of LogChiP Freedom Li kelihd Square -875,656 0,000 000 -544,209 662,8941 -455,771 176,8766 0,000 000
"Var4"
-436,503
38,5347
0,000 000
"Var5"
-267,565
337,8759
0,000 000
Как известно, одной из наиболее удобных форм представления результатов маркетинговых исследований является их графическое представление. В целом, визуализация позволяет сформировать у лица, принимающего решения, системный взгляд на исследуемую проблему. Эта возможность как раз и заложена в графическом представлении самого решения, которое, по сути, является рас пределением вероятности осуществления успешной или неуспеш ной деятельности. В отличие от анализа состояния дел в отдель ном районе, анализ распределения дает целостное представление об успешных/неуспешных результатах маркетинговой деятельнос ти в целом по области. Кроме того, визуализация результатов вычислительных экспериментов с моделью позволяют проследить за изменениями формы распределения и наметить оптимальные стратегии реализации маркетинговых планов компании. Правда, существуют некоторые ограничения, связанные с возможностью визуального восприятия объектов только в трехмер ном пространстве. Но даже при этом естественном ограничении графическое представление результатов моделирования может ока заться весьма полезным. Для того чтобы иметь возможность построить график в трехмер ном пространстве в зависимости от наиболее значимых показате лей, был проведен экспертный опрос, главной целью которого стал отбор по результатам маркетинговой деятельности в районах двух таких показателей. В результате опроса были выбраны: 1) объем розничного товарооборота на душу населения (тыс. р.); 2) численность населения района (тыс. чел.). Оставшиеся два фактора были зафиксированы на уровне, соответствующем сред ним значениям. Далее по рассчитанным вероятностям сформиро92
вали табл. 3.6, по данным которой была построена диаграмма (рис. 3.2), визуализирующая представление об успешной/неус пешной маркетинговой деятельности ОАО "Радуга". Т а б л и ц а 3.6 Данные для построения профиля вероятностного распределения успешной деятельности в Воронежской области (2003 г.) *.
Х
7
x
i
4
х,Ь
Х
•^расчет
9,585
52,747
1,45
124,6
31,061
11,3
40,719
1,6
100,2
42,591
1 1
5,955
54,162
-1,584
0,1702
26,656
1,0 2,3
85,5
6,603
228,4
-5,0%
0,0061
9,698
39,648
U
170,5
27,603
1
2,8 2,7
92,7
5,180
0,9944
109
-13,704
0
1,9 1,9 2,1 3,1 2,3 1,3
132,4
3,603
0,9735
213,3
-4,918
0,0073
105,6
127,490
1
81,2
8,223
0,9997
111,4
1,696
0,8451
7,16
41,808
5,643
27,106
7,653
24,077
5,21
64,275
21,081
27,972
8,093
25,841
7,469
23,414
3,865
29,563
10,815
33,23
7,579
17,884
14,221
31,75
8,138
25,696
6,011
31,499
Средние значения
143
-29,089
1,6 2,3 0,3 2,0 3,2
249,6
35,598
0 1
116,5
0,805
0,6911
105,3
66,176
1
1,975
135,817
111,8
8,584
0,9998
163,7
-8,839
0,0001
С целью разработки маркетинговой стратегии на 2004 г. по данным табл. 3.6 были получены прогнозные оценки результатов деятельности ОАО "Радуга", представленные в табл. 3.7. Эти прогнозные оценки являются выражением объективных тенденций и субъективных мнений по поводу успешности деятельности. Анализ табл. 3.8 позволяет сделать вывод о том, что в целом Воронежская область (за исключением двух районов — Каширско го и Подгоренского) продолжает оставаться привлекательной для того рода бизнеса, которым занимается ОАО "Радуга". Профиль на рис. 3.3 хорошо иллюстрирует сделанный вывод. Данные для построения этого профиля (табл. 3.9) были подготовлены анало93
гично тому, как это было сделано в случае осуществления пост прогнозных расчетов на 2003 г.
Рис. 3.2. Профиль вероятностного распределения успешной деятельности ОАО "Радуга" в Воронежской области (2003 г.) Т а б л и ц а 3.7 Прогнозные оценки показателей, характеризующих уровень социальноэкономического развития районов Воронежской области в 2004 г. Район 1 Аннинский Богучарский Бобровский Верхнехавский Грибановский Кантемировский Каширский
94
*. 2 11,985 13,626 7,168 7,916 11,458 8,159 6,594
Х
2
3 52,747 40,719 54,162 26,656 39,648 41,808 27,106
х
г 4 1,6 1,6 1,1 2,6 2,1 2,9 4,4
Х
4
5 114,5 102,7 106,5 100,4 126,0 114,1 103,1
1 Нижнедевицкий Новоусманский Острогожский Ольховатский Петропавловский Подгоренский Рамонский Репьевский Россошанский Терновский
2 10,422 6,318 25,753 9,686 9,336 5,104 13,337 9,672 17,869 10,367
Эртильский
8,235
О к о н ч а н и е 4 3 24,077 2,2 1,8 64,275 27,972 2,1 25,841 3,8 23,414 2,8 29,563 1,5 33,230 1,6 17,884 2,4 31,750 0,3 25,696 2,1 3,0 31,499
т а б л . 3.7 5 91,5 102,5 151,18 71,1 82,6 142,5 105,6 102,1 111,5 138,7 90,7
Т а б л и ц а Ожидаемые результаты деятельности ОАО "Радуга" на территории районов Воронежской области в 2004 г. Ожидаемый результат 1 1 1 0,83 1 1 0 1 0,97
Район Аннинский Богучарский Бобровский Верхнехавский Грибанове кий Канте мировс кий Каширский Нижнедевицкий Новоусманский
3.8
Ожидаемый результат 1 1 1 0 1 1 1 1 0,97
Район Острогожский Ольховатский Петропавловский Подгоренский Рамонский Репьевский Россошанский Терновский Эртильский
Т а б л и ц а 3.9 Данные для построения профиля вероятностного распределения успешной деятельности по районам Воронежской области (2004 г.) х
1
Х
2
1
2
11,985
52,747
13,626
40,719
7,168
54,162
*з 3 1,6 1,6 1,1
4
х,Ь
4
5
114,5
49,944
102,7
60,798
6 1 1
106,5
6,466
0,998
Х
-'расчет
95
О к о н ч а н и е 1 2 7,916 26,656 11,458 39,648 41,808 8,159 6,594 27,106 10,422 24,077 6,318 64,275 25,753 27,972 9,686 25,841 23,414 9,336 5,104 29,563 13,337 33,23 17,884 9,672 31,75 17,869 10,367 25,696 8,235 31,499 Средние значения
3 2,6 2,1 2,9 4,4 2,2 1,8 2Д 3,8 2,8 1,5 1,6 2,4 0,3 2,1 3,0 2,216
4 100,4 126 114,1 103,1 91,5 102,5 151,18 71,1 82,6 142,5 105,6 102,1 111,5 138,7 90,7
5 3,866 40,645 11,276 -8,045 25,854 2,174 167,109 19,741 15,715 -20,802 55,594 16,886 96,449 25,906 8,437
табл.
3.9
6 0,979 1 1 0 1 0,898 1 1 1 0 1 1 1 1 1
108,737
Рис. 3.3. Профиль вероятностного распределения успешной деятель ности ОАО "Радуга" в Воронежской области (2004 г.) 96
В связи с тем, что в стратегические планы ОАО "Радуга" входило расширение сферы деятельности за счет освоения новых рынков сбыта, было решено обследовать другие области, входя щие в Центрально-Черноземный регион. Приведем результаты ис следования по Курской области, в котором использовались офи циальные данные, характеризующие уровень социально-экономи ческого развития районов области в 2003 г. (табл. 3.10). Т а б л и ц а 3.10 Показатели, характеризующие уровень социально-экономического развития районов Курской области в 2003 г.
Район
Объем роз Числен Уровень Темп роста про ничного ность зарегистри мышленного производства в товарообо населения, рованной рота на душу тыс. чел. безработи сопоставимых населения, цы, % ценах, % к тыс. р. предыдущему году *i
1 Беловский Большесолдатский Глушковский Горшеченский Дмитриевский Железногорский Золотухинский Касторенский Конышевский Кореневский Курский Курчатовский Льговский Мантуровский Медвенский Обоянский Октябрьский Поныровский Пристенский Рыл ьс кий
2 2,09 2,46 3,09 3,57 2,45 2,70 2,23 2,73 7,01 3,67 4,69 1,38 0,85 1,72 11,78 4,20 4,28 3,37 2,76 6,18
х-, 3 22,182 14,636 28,147 22,835 22,420 18,190 26,800 24,237 15,155 21,474 56,494 19,714 19,313 16,758 19,220 35,815 23,877 13,553 21,249 40,714
*3
*4
4 0,7 1,0 0,9 1,0 0,4 0,9 0,4
5 73,0 73,0 61,0 98,0 81,0 93,0 103,0 62,0 83,0 111,0 30,0 91,0 198,0 40,0
1,4 1,0 4,0 1,1 4,0 1,4 0,7 0,6 0,6 0,8 1,1 0,6 0,4
70,0 72,0 71,0 55,0 106,0 100,0
|
97
Окончание 1
4
т а б л . 3.10
2
3
5
Советский
11,38
23,673
0,5
63,0
Солнцевский
1,98
18,492
0,6
100,0
Суджанский
5,96
31,466
0,5
104,0 76,0
Тимский
5,98
14,628
0,9
Фатежский
4,24
23,194
0,7
90,0
Хомутовский
2,62
16,432
1,0
93,0
Черемисиновский
1,62
12,431
0,9
99,0
Щигровский
1,18
15,099
1,9
114,0
По ли (*) ности (табл.
данным табл. 3.10 с использованием построенной моде были получены прогнозные оценки результатов деятель ОАО "Радуга" на территории районов Курской области 3.11).
Т а б л и ц а 3.11 Ожидаемые результаты маркетинговой деятельности ОАО "Радуга в Курской области (2003 г.) А
хгЬ
4
5
6
0,7
73
-46,9412
0
1,0
73
-47,4390
0
28,147
0,9
61
-37,5083
0
3,57
22,835
1,0
98
-32,6679
0
2,45
22,42
0,4
81
-41,69%
0
2,7
18,19
0,9
93
-42,1366
0
2,23
26,8
0,4
103
-40,5954
0
х
98
, 1
*г 2
2,09
22,182
2,46
14,636
3,09
Х
3
3
Х
у •'расчет
2,73
24,237
1,4
62
-44,2083
0
7,01
15,155
1,0
83
-5,0027
0,0067
3,67
21,474
4,0
111
-44,1562
0
4,69
56,494
1,1
30
-16,3204
0
1,38
19,714
4,0
91
-67,1239
0
0,85
19,313
1,4
198
-53,0946
0 0
1,72
16,758
0,7
40
-54,5935
11,78
19,22
0,6
70
40,6907
1
4,2
35,815
0,6
72
-22,6557
0
4,28
23,877
0,8
71
-26,9490
0
Окончание 1
2
3,37
13,553
2,76
21,249
6,18
40,714
11,38
23,673
1,98
18,492
5,96
31,466
5,98
14,628
4,24
23,194
2,62
16,432
1,62
12,431
1,0 0,9
15,099
1,9
1,18
3 1,1 0,6 0,4 0,5 0,6 0,5 0,9 0,7
4 55 106 100 63 100 104 76 90 93 99 114
т а б л . 3.11
5 -38,3000
6 0 0
0,0034
0,5009
38,4830 -46,8030
1 0
-5,3103
0,0049
-14,6668
0 0 0 0 0
-41,2526
-25,7273 -43,8987 -53,5275 -59,8260
Анализ табл. 3.11 свидетельствует о том, что в целом терри тория Курской области (за исключением двух районов — Медвенского и Советского) неблагоприятна для осуществления бизнеса ОАО "Радуга". Для того чтобы сформировать окончательную точку зрения от носительно перспектив начала деятельности в Курской области, было проведено (независимо от расчетов по модели) экспертное оценивание ожидаемых ее результатов (табл. 3.12). Т а б л и ц а 3.12 Экспертные оценки результатов маркетинговой деятельности ОАО "Радуга" на территории Курской области Район 1 Белове кий Большесолдатский Глушковский Горшеченский Дмитриевский Железногорский Золотухинский Касторенский Конышевский Кореневе кий
Экспертная оценка 2 0 0 0 1 0 0 0 0 0 0
3 Me две некий Обоянский Октябрьский
Экспертная оценка 4 1 0 0
Поныровский Пристенский Рыл ьс кий Советский Солнцевский Суджанский Тимский
0 0 1 1 0 1 0
Район
99
Окончание 1 Курский Курчатовский Льговский Мантуровский
2 0 0 0 0
т а б л . 3.12
3 Фатежский Хомутовский Черемисиновский Щигровский
4 1 0 0 0
Сравнение табл. 3.11 и 3.12 позволяет сделать вывод о том, что результаты моделирования с использованием построенной модели и экспертные оценки, в основном, совпадают. В целом, Курская область действительно малопривлекательна. Однако по ряду районов (Горшеченскому, Рыльскому, Суджанскому, Фатежскому) имеются расхождения во мнениях. Это может свидетель ствовать о том, что эксперты располагают дополнительной инфор мацией о тенденциях, которые пока еше не нашли отражение в официальной статистике, но проявление которых ожидается в ближайшем будущем. В подобных ситуациях следует рекомендовать корректирующие уточнения базовой модели (*) с учетом субъективных мнений экспертов. Возможны различные варианты подобного уточнения. Предлагаемая нами методика позволяет это делать. 3.5. Модели множественного выбора в экспертном оценивании будущего 3.5.1. Мультиномиальная логит-модель множественного выбора Рассмотрим случай, когда перед экспертами стоит задача выбора не среди двух, а среди целого множества альтер нативных вариантов. По результатам их выбора, оформленным в виде псевдовыборки, требуется построить модель, с помощью которой можно будет осуществлять прогнозные расчеты эксперт ных предпочтений в виде соответствующих вероятностей. Для решения этой задачи можно воспользоваться мультиномиальной логит-моделью, которая по сути является обобщением логит-модели бинарного выбора. Ниже достаточно подробно описывается мультиномиальная логит-модель и некоторые детали, характери зующие особенность ее построения и анализа. Предварительно все варианты множественного выбора нумеру ются в произвольном порядке: 0, 1, 2, ..., /. (Нумерация начата 100
с 0 только для того, чтобы было единообразие с предыдущей кодировкой 0 и 1.) Вероятность наступления того или иного ва рианта описывается полиномиальной логит-моделью Р(>',=7') = ^
'
7 = 0,1,2,...,/.
(3.100)
Вектор независимых переменных х(. = [гр w;] составлен из двух подвекторов, каждый из которых имеет собственную смысловую нагрузку. Компоненты вектора z7 принято называть атрибутами и понимать их как показатели, по которым различаются альтерна тивы. В свою очередь, компоненты вектора w( называют харак теристиками, понимая под ними описание индивидуальных черт тех лиц, которые осуществляли выбор альтернатив. Оценка параметров модели (3.100) не дает однозначного ре зультата, так как вместе с вычисленными коэффициентами b идентичные вероятности позволяют получить вектор b + d. Избе жать этой неоднозначности позволяет операция нормализации (стандартизации), смысл которой в том, чтобы для одного из ва риантов, например yt = /, положить b y = 0. Тогда оценивается не / + 1 функция, a / функций одного вида Р(У,- = У') = —1=1
ь
' 7 = 1,2,...,./,
(3.101)
1+1У' ' после чего определяется еще одна функция через значения этих / функций путем вычитания их суммы из единицы:
1+2У"
(3.102)
7=0
Это одна из особенностей построения полиномиальной логитмодели. В соответствии с этой особенностью компьютерные па кеты рассчитывают только коэффициенты первых / зависимостей b0, b,,..., b / p по которым вычисляются в соответствии с (3.101) первые /вероятностей Р(у, = 0), Р(у(. = 1),... , PCv, = / — 1). Ве роятность выбора последнего варианта Р(у- = J) компьютером не рассчитывается, а определяется отдельно с помощью (3.102). 101
Форма логит-модели, применяемой для бинарного выбора, опи сание которой приведено выше, легко получается из полиномиаль ной при J = 2. В силу того, что логит-модель является частным случаем полиномиальной, ее часто называют биномиальной. Оценивание коэффициентов модели осуществляется путем чис ленного решения уравнений правдоподобия. Для записи самого уравнения правдоподобия, а точнее его логарифмической формы, удобно ввести переменную */.., которая принимает значение 1, если в /-м наблюдении (z'-м индивидуумом) был выбран у'-й аль тернативный вариант среди (/ + 1)-го, и 0 — в противном слу чае. Тогда для каждого /' только одно из й-- будет равно 1. Используя введенную переменную dp запишем функцию лога рифмического правдоподобия
1пь=££^1п (=1 у=0
(3.103)
Sе ' к Xybi.
Дифференцируя это выражение по b , получим систему уравне ний максимального правдоподобия {
\
—-it'.—'» 0
' -I
к=0
к=0 Pj
1=1 ;=0
х,= х,Ь,
к=0
х,Ь,
•54 1=1
1-
е '
2у,ь< к=0
102
*; = £ [ < * , , - Р у К = 0 , У =0,1,2,.../-!. (3.104) )
Заметим, что ву'-м блоке уравнений суммирование идет по всем /, причем если в /-м случае был выбран у'-й вариант, т.е. y-t = j , то в квадратных скобках имеем [1 — Р^], в противном случае [— Р.]. Решение этой системы с учетом того, что Ьу = 0, осуществ ляется численно с помощью метода Ньютона — Рафсона. Ком пьютерная реализация устроена таким образом, и об этом уже го ворилось, что нулевые значения получают параметры той модели, которая соответствует последней из указанных альтернатив. Дру гими словами, если бы мы захотели, чтобы Ь0 = 0, а не Ьу, то данные, соответствующие альтернативе с номером у ~ О, долж ны быть введены последними. Для реализации метода Ньютона — Рафсона требуется матрица частных производных второго порядка. Кроме того, с помощью этой матрицы определяются характеристики надежности самой модели. Поэтому имеет смысл выписать эту матрицу в общем виде:
Э21пЬ
Э "
х,Ь,
dlt
Х; = х ,Ь,
к=0
j x,b, V"
е ' ' к=0 Xie
х b
x,b t
e
x,b,
e '' х,. х,.=
/=1
х.Ь,
=-1 1=1
ЗУ
*=0
А
1(7=0--
х,х,.=
x,bj
5У" (t=0
)
=-ik№j=i)-P«)h'x,
(3.105)
В полученном выражении 1(/ = I) принимает значение 1 при у = / и 0 — в противном случае. Это позволяет осуществлять селекцию, так как результатом произведения РЛ(/ = /) является Р... 103
Матрица состоит из ^-блоков, каждый из которых имеет раз мер по числу оцениваемых параметров, т.е. (т + 1) х (т + 1), где т — число объясняющих переменных. Данные объясняющих переменных должны обеспечивать обратимость этой матрицы. Практически нет строгих ограничений на количество оценива емых альтернатив, однако следует помнить, что каждая новая альтернатива требует дополнительного введения в модель т + 1 параметров. Коэффициенты модели трудно интерпретируемы. Нелинейный характер не позволяет непосредственно через коэффициенты про следить связь между уровнем вероятности и атрибутами (фактора ми). Поэтому естественно для этих целей использовать предель ный анализ. Дифференцируя по /-му атрибуту в /-й точке у'-ю вероятность, получаем предельный эффект в виде "
<%
/А
д дх/
dxj
J
Х
УГ
. /Ь/
_к=0 х,Ь
(
J
. Л
1 > " Л Ъ,-е^(ех-ь"Ь10+е^Ьп к=0
+- +
е^Ьи)
) х,Ь,
х,Ь,
2> J
е
• '
X:b„
к х, Ь,
lj
и
j
E
k=0
x,b,
x,b,
x,b,
-bюm+-
j \п k=0
=Рцк-ьа]
хЪ,
\+-
+ — x,b. k=0
(3.106)
При расчетах по этой формуле нужно помнить, что вектор Ь0 в соответствии с принятым соглашением нулевой, и поэтому первое слагаемое при определении математического ожидания коэффициента равно нулю. 104
Таким образом, предельный эффект, получаемый при измене нии /-го атрибута (1-й независимой переменной) представляет собой произведение вероятности P(yj = J) на разность коэффици ента, стоящего перед 1-й переменной и средней величиной это го коэффициента. Предельный эффект зависит от атрибута, причем механизм этой зависимости реализуется через вероятность и через среднюю вели чину коэффициента, при определении которой задействована та же самая вероятность. При высокой вероятности так же, как и при малой, предельный эффект незначительный. Это объясняется тем, что при больших Р.. в средней величине коэффициента Ь, доми нирует величина Ьц и разность между ними близка к нулю. При малых значениях Р.. разность большая, но значение самой вероят ности близко к нулю, а следовательно, и величина предельного эффекта небольшая. Обобщая, можно утверждать, что 8Г -> 0 в двух случаях: когда Р.. -> 0 и когда Р.. —> 1. Своего максимально го значения он достигает тогда, когда вероятность близка к 0,5, т.е. имеет место ситуация с самым большим уровнем неопределен ности при выборе /-го варианта. Это естественно, так как имен но в этой ситуации наиболее ценна любая информация, уточня ющая наше представление о выборе альтернатив. Фактически предельный эффект является функцией, с помо щью которой можно ранжировать атрибуты по степени их влия ния на выбор конкретного варианта. Кроме того, для каждого атрибута с помощью предельного эффекта можно определить тот вариант, на выбор которого изменение данного атрибута влияет сильнее всего. Безусловно, подобный анализ интересен, однако он не дает прямого ответа на главный вопрос: "Как изменится неопределенность выбора при изменении атрибута?" Ответ можно получить, если использовать энтропийный показатель для оценки уровня неопределенности ситуации множественного выбора. Обычно интерес вызывает анализ конкретной ситуации. Пусть это ситуация с номером /. Тогда неопределенность выбора в /-и ситуации можно определить с помощью выражения J
Hi =-l
fy
logzVy.
(3.107)
j=0
Если вероятность изменяется на величину предельного эффекта дп то, естественно, изменяется и величина энтропийного показателя Hi+AHi
= -i(PiJ+Sij)\og2(Pij+S0). у=о
(з.108)
105
При AHj < 0 увеличение соответствующего атрибута снижает уровень неопределенности множественного выбора в г-й ситуации на величину ДЯ(. Если неравенство в противоположную сторону, то такое же самое изменение атрибута увеличивает уровень неопре деленности. Величину ДЯ, будем называть предельным информационным эф фектом, имея в виду, с одной стороны, содержательный смысл этой величины, а с другой — механизм ее определения через предельный эффект атрибута. Понять, в каких ситуациях следу ет ожидать отрицательное значение предельного информационного эффекта, а в каких — положительное, весьма сложно. Гораздо проще вычислить ДЯ(. как разность между значениями, определя емыми в соответствии с (3.108) и (3.107). И все же рассмотрим механизм формирования величины предельного информационно го эффекта ДЯ, = - Е (Р//+ 8и) log2(P^+ S^+i
?y Iog2 Py =
7=0
7=0
р У*П
= -£(P//+<%)iog 2
7=0
r P
+5
l0
-SPylogjP//- S ^ l O & V i( l/ (/) 82 7=0
7=0
7=0
7=0
7=0
Py+Sy + SP//log 2 P !/ = P„ 7=0 (Py+S^ P„
(3.109)
Полученное значение должно быть отрицательным, чтобы уве личение соответствующего атрибута снизило неопределенность ситуации множественного выбора. Знак выражения (3.109) зави сит от 8,у. Причем одновременно для всех j предельный эффект 8.. не может иметь один и тот же знак^ так как в его составе сомно житель, равный отклонению br ~br Для каждой i-Pt ситуации множественного выбора можно запи сать ДЯ,=- £ V ° S 2 V jer
106
2 (Py+^)log 2
jeJ+
4+V
- S S0\og2Pir JEJ+
X (P//+5^)log2 jeJ-
(3.110)
где J~(J+) — множество тех вариантов, для которых by ~ b, име ет отрицательный (положительный) знак. Следовательно, знак Д//, определяется знаком верхних слагаемых, если они по величи не превосходят нижние, и наоборот, если не превосходят. Зна чения этих сумм различны для разных /, а это значит, что в од них ситуациях предельный эффект будет направлен на снижение неопределенности, а в других — на повышение. В моделях множественного выбора энтропийный анализ играет важную роль, так как лицу, принимающему решение на основе результатов моделирования, необходимы оценка уровня неопреде ленности смоделированной ситуации и возможные варианты ее снижения. 3.5.2. Модели множественного выбора в задачах оценки инвестиционных проектов Рассмотрим прикладные возможности модели множе ственного выбора на следующем примере. ОАО "Жемчужина" приняло решение об открытии нескольких точек общественного питания, предварительно получив разреше ние на строительство одной из этих точек в центре г. Воронежа, второй — в городском районе, удаленном от центра, и третьей — на Ростовской автотрассе (недалеко от города). В каждом из указанных мест можно реализовать один из трех вариантов: от крыть или ресторан, или кафе, или бистро. В свою очередь, на эффективность выбранного варианта влияют различные факторы, среди которых можно выделить наиболее существенные, связан ные с выбором типа кухни (национальной, традиционной и сме шанной), ориентации на потенциальных посетителей (имеющих высокие, средние и ниже среднего доходы), а также максималь ное количество обслуживаемых одновременно клиентов. Руководству ОАО "Жемчужина" необходимо для каждого мес та, отведенного под строительство, выбрать вариант, который с наименьшим риском обеспечит прибыльное долговременное фун кционирование соответствующей точки общественного питания. Для объективной оценки риска было решено изучить все аспекты, связанные с этим бизнесом в г. Воронеже. 107
Компания "Эксперт", специализирующаяся на маркетинговых исследованиях, предоставила ОАО "Жемчужина" данные о наи более успешных ресторанах, кафе и бистро, функционирующих на территории г. Воронежа (табл. 3.13). Т а б л и ц а 3.13 Данные о функционировании предприятий общественного питания г. Воронежа Тип пред № п/п приятия У 1 2 1 Ресторан 2
Ресторан
3
Кафе
4
Бистро
5 6 7 8 9 10 11 12 13 14 15
х, 3 Центр Район города Центр
Тип кухни Х
2
17
Бистро
18
Кафе
Х
4
Национальная
Высокий
45
Смешанная
Средний Ниже среднего Высокий
20
Средний
60
Высокий
50
Традиционная
Ресторан Автотрасса Национальная Район Традиционная Кафе города Район Смешанная Кафе города Смешанная Ресторан Центр Ресторан Автотрасса Традиционная Автотрасса Смешанная Кафе Бистро
3
6 60
Автотрасса Национальная
Центр
Х
Максимальное число одновре менно обслужи ваемых клиентов
5 Высокий
Автотрасса Национальная Район Традиционная Кафе города Район Традиционная Ресторан города Кафе
Уровень дохода посетителей
4 Традиционная
Кафе
16 Ресторан
108
Место располо жения
15 35
Ниже среднего Высокий
50
Высокий
30
Средний
10 40 45 35
15
Автотрасса
Смешанная
Центр Район города Район города
Национальная
Средний Высокий Высокий Ниже среднего Средний
Национальная
Средний
25
Национальная
Высокий
25
20 35
Окончание 4 3 Район Традиционная 19 Ресторан города 20 Бистро Автотрасса Традиционная 1
21
2
Смешанная
Центр
Бистро
т а б л . 3.13
5
6
Высокий
60
Средний Ниже среднего
20 10
Задача состоит в выборе варианта для каждого отведенного под строительство места, обладающего наименьшим риском получения отрицательного результата. Для решения поставленной задачи можно использовать модель множественного выбора. Для числового представления исходных данных введем коды, приведенные в табл. 3.14. Т а б л и ц а 3.14 Таблица условных кодов Тип предприятия общественного питания: 0 — ресторан 1 — кафе 2 — бистро Место расположения: 1 — центр города 2 — городской район, удален ный от центра 3 — автотрасса
Тип кухни: 1 — смешанная 2 — традиционная 3 — национальная Уровень дохода потенциальных потребителей: 1 — высокий 2 — средний 3— ниже среднего
Используя введенные коды, сформируем таблицу данных для построения модели (табл. 3.15). В результате выполнения необходимых действий в пакете STATIST1CA 6.0 были получены расчетные характеристики муль тиномиальной логит-модели, которые отражены в табл. 3.15—3.18. Таблица Числовое представление исходных данных № п/п 1 2 3 4 5 6
У 0 0 1 2 1 1
Х
! 1 2 1 3 3 2
*> 2 3 1 3 3 2
X,
1 1 2 3 1 2
Х
4
60 45 20 15 35 60
№ п/п 12 13 14 15 16 17
У 0 0 1 2 0 2
х
,
1 3 3 3 1 2
Х
7
1 2 1 1 3 3
*i
1 1 1 3 2 2
3.15 *4
40 45 35 20 35 25
109
Окончание № п/п 7 8 9 10 11
У 0 1 0 1 1
х
, 2 1 3 2 2
*?
2 2 3 2 1
*, 3 3 1 1 2
Х
4
50 15 50 30 10
№ п/п 18 19 20 21
У 1 0 2 2
*| 2 2 3 1
т а б л . 3.15 x
i
3 2 2 1
х
, 1 1 2 3
*4
25 60 20 10
Т а б л и ц а 3.16 Оценки коэффициентов модели и характеристики их надежности
Effect Interc l "Var2" "Var3" "Var4" 'Var6" Interc 2
Var 1 - Parameter estimates (Spreadshee 1) Distribution: MULTINOMIAL Link function: LOGIT Standard Level of Level of Wald Stat. Column Estimate P Error Effect Response 17,17 493 6,932 343 6,13804 0,013 230 0 1 -6,12 757 1,816 164 11,38 325 0,000 741 0 2 0 3 -1,70 320 0,751 912 5,13096 0,023503 0 4 -5,91 578 1,715851 11,88 680 0,000 565 0 5 0,38 431 0,074 424 26,66 555 0,000 000 20,82 143 6,824078 9,30 965 0,002 280 6 7
"Var2" "Var3" "Var4"
8 9 10
'Var6" Scale
-4,72 550 1,778 669 7,05 840 -2,40 530 0,685082 12,32 685 -5,15872 1,689 180 9,32 680 0,22 872 0,070 576 10,50 218
0,007 889 0,000 446 0,002 258 0,001 192
1,00 000 0,000 000
Анализ табл. 3.16 позволяет: 1) сделать вывод о том, что полученные оценки коэффици ентов являются статистически значимыми (все стандартные ошибки меньше полученных оценок, значения статистики Вальда превосходят критический уровень и все вероятности ошибки меньше 0,05); 2) записать аналитическое выражение для построенной муль тиномиальной логит-модели:
^
ПО
'
17,17-6,12х, -1,70ft -5,91х3 +0,38х4
е
-
Р(У=О)= 1
-—:—-—
17,17-6,12г1-1,70.г2-5,91хз+0,3&с4 ,
2Q82-4,71X!-2,40A: 2 -5,15^3+0,22X4 '
20,82-4,71х, -2,40х 2 -5,15х3 +0,22х4
P(y=i)=
j + e17,17-6,12x,-l,7ac2-5,9h-3+0,38x4
20,82-4,71лг1-2,4аг2-5,15гз+0,22х4
+
Анализ табл. 3.17 позволяет сделать вывод, что построенная модель обеспечивает достаточно точное предсказание наиболее предпочтительных типов предприятий общественного питания, которые будут успешны в соответствующих условиях. Полужир ным шрифтом в этой таблице выделены те случаи, в которых предсказания были недостаточно точны. Т а б л и ц а 3.17 Предсказанные значения вероятностей № п/п
1 2 3 4 5 6 7 8 9 10 11
Предсказанные вероятности
У 0 0 1 2 1 1 0 1 0 1 1
Р О = 0)
Р(У=1)
Р(У = 2)
0,9929
0,0071
0,0000
0,8699
0,1300
0,0000
0,0601
0,9395
0,0003
0,0000
0,0000
1,0000
0,2395
0,6896
0,0709
0,9413
0,0587
0,0000
0,5951
0,3748
0,0302
0,0088
0,3158
0,6754
0,7813
0,2180
0,0007
0,2431
0,7567
0,0002
0,0024
0,7163
0,2813
Предсказанные вероятности
№ п/п
У
12 13 14 15 16 17 18 19 20 21
0 0 1 2 0 2 1 0 2 2
Р ( у = 0)
Р(у=1)
Р(У=2)
0,7541
0,2459
0,0000
0,4490
0,5504
0,0005
0,0785
0,9207
0,0008
0,0000
0,0013
0,9987
0,7287
0,2709
0,0004
0,0517
0,3703
0,5779
0,2279
0,7653
0,0069
0,9716
0,0284
0,0000
0,0002
0,0197
0,9802
0,0039
0,6204
0,3757
Данные табл. 3.18 позволили оценить пригодность модели в целом с помощью индекса отношения правдоподобия Макфаддена: - ^ = l--92'742=0,59 lnL(Z>0) -226,167 Рассчитанное таким образом значение индекса свидетельству ет об адекватности построенной логит-модели, хотя может пока заться и не очень высоким. Однако нужно помнить, что нас интересует не точность аппроксимации распределения, а предска зание возможности появления самого события (возможность появLRI = l
111
ления события считается предсказанной, если расчетная вероят ность данного события выше остальных). Т а б л и ц а 3.18 Тест правдоподобия J-го типа
Effect Intercept "Var2"
Varl - Likelihood Type 1 Test (Spreadsheet 1) Distribution: MULTINOMIAL Linkfunction: LOGIT Chi-Square Degr. of Freedom Log-Likelihd
P
2 2
-226,167
2
14,7729 13,9401 99,1481
0,000 000
138,9898
0,000 000
-218,781
"Var3" "Var4"
2
-211,811 -162,237
"Var6"
2
-92,742
0,000 620 0,000 940
Используя построенную модель, рассчитаем вероятности успеха в случае выбора инвестиционного проекта, связанного с рестора ном, кафе и бистро, при условии: ¥(у = 0) = 0,0002; Р(у =1) = 0,0056; P(j = 2) = 0,9942; ?{у = 0) = 0,9322; Р(у = 1) = 0,0678; ?{у = 2) = 0,0000. В первом случае наиболее вероятен успех при выборе проек та, связанного с бистро, а во втором — ресторана. Предельный эффект имеет смысл рассчитывать только для фактора х4: 1) для первого случая: bl4 = 0,0002 • 0,3843 + 0,0056 • 0,2287 = 0,0014; 510 = 0,0002 • (0,3843 - 0,0014) = 0,0001; <5И =0,0056- (0,2287 -0,0014)=0,0013; Sn = 0,9942 • (0 - 0,0014)= -0,0014; 2) для второго случая: Ь24 = 0,9322 • 0,3843 + 0,0678 • 0,2287 = 0,3738; 5 20 = 0,9322 • (0,3843 - 0,3738)=0,0098; <521 = 0,0678 • (0,2287 - 0,3738)= -0,0098; 522 =0,0000 (0 -0,3738)= 0,0000. 112
Анализ предельных эффектов показывает, что в первом случае рост числа обслуживаемых одновременно клиентов увеличивает вероятность выбора среди рассматриваемых вариантов в первую очередь кафе, а затем — ресторана. Во втором случае увеличива ется вероятность выбора только ресторана. Причем увеличение вероятностей выбора одних вариантов происходит за счет умень шения вероятности выбора других. Для остальных факторов в силу их дискретного характера сле дует рассчитывать непосредственно вероятности. Например, для х, = 2 при х2 = 3; х3 = 2; х4 = 25; Р(у = 0) = 0,0517; Р(у =1) = 0,3703; Р(у = 2) = 0,5780; для JC, = 1 при х2 = 3; х3 = 2; х4 = 25; Р(у = 0) = 0,3589; ?(у =1) = 0,6323; ?{у = 2) = 0,0088; Получаемые распределения сравниваются с исходным и дела ются соответствующие выводы. В случае х, = 2 предпочтитель ность выбора не изменилась, а в случае х, = 1 предпочтительнее выбрать кафе. 3.5.3- Пробит- и логитмодели множественного выбора в ранговых шкалах Среди задач, решаемых экспертами, наиболее попу лярна задача ранжирования. Прямые методы решения этой задачи детально были рассмотрены во второй главе. Здесь, продолжая развивать идею построения моделей по данным, представляющим результаты экспертного опроса, рассмотрим схему построения пробит- и логит-моделей множественного выбора для случая, когда моделируемая переменная измеряется в ранговой шкале. Опишем несколько ситуаций, формализация которых приводит к задачам подобного рода: 1. Расчет рейтинговых оценок облигаций по независимому оп росу экспертов. 2. Определение рейтинга банков по их надежности. 3. Моделирование результатов дегустационных тестов. 4. Установление приоритетов по результатам обследования об щественного мнения. 5. Выяснение приоритетности социальных программ по резуль татам голосования. Для моделирования подобных ситуаций будем считать, что есть переменная у", значения которой определяются некоторым набором объясняющих переменных в соответствии с зависимостью 113
/ = x b + e. (3.111) Переменная у* — ненаблюдаемая величина, но известны зна чения дискретной переменной, которые в нашем представлении связаны с ненаблюдаемой следующими соотношениями: у - О, если у' < 0; у = 1, если 0 < у' < /I,; у = 2, если Hi
y = J, если /*,_,—xb<£ . Будем считать, что случайная величина е нормально распреде лена по наблюдениям и, кроме того, нормирована таким обра зом, что имеет нулевое математическое ожидание и единичную дисперсию. В случае построения логит-модели предполагается, что случайная величина е имеет логистическое распределение. Для пробит-модели выписанные неравенства позволяют запи сать следующие вероятности: Р(у = 0) = Ф(-хЬ); Р(у = 1) = ф( ^ - хЬ)-Ф(-хЬ); Р(у = 2) = Ф(А1 2 -А)-Ф(/х 1 -хЬ); (3.114)
Р(у = У) = 1-Ф(/*,_,-*). Чтобы все вероятности были положительными, оцениваемые параметры положения должны удовлетворять неравенствам 0 < ^ ! < ^ 2 < ••• < Д , Ч (3.115) 114
Смысл параметров положения хорошо иллюстрирует рис. 3.4.
xb
ji3 - x b
Рис. 3.4. Вероятности в упорядоченной пробит-модели Если учесть, что 1
и
dt (3.116) 2п z где г, =/*£„[ ~~ xb, z2 = Hk ~~ xb, то становится понятным, как построить логарифмическую функцию правдоподобия. Любой из ранее рассмотренных методов позволяет оптимизировать функцию правдоподобия и получить искомые параметры положения и ко эффициенты модели. Поэтому не будем рассматривать детали этого процесса, а более подробно остановимся на анализе и ин терпретации результатов моделирования. Для пояснений рассмотрим упрощенный пример, в котором с помощью нормального распределения моделируется ситуация из трех категорий с одним неизвестным параметром положения ц: Р(у = 0) = 1-Ф(хЬ); Р(у = 1) = ф( ju - хЬ) - Ф(-хЬ); Ф(^-хЬ)-Ф(/^_,-хЬ) =
Р(у = 2) = 1 - Ф ( ^ - х Ь ) . Модель нелинейная, и поэтому предельные эффекты факторов не равны коэффициентам. Дифференцирование уравнений по любому из факторов приводит к соотношениям дР(у = 0) = -ф(хЬ)Ьк; Эх, 115
—^ '- = [ф(-хЪ)-ф(1и-хЪ)]Ьк; dxt дхк Таким образом, предельный эффект — это величина, перерас пределяемая между вероятностями полученного распределения. При чем сумма всех изменений рана нулю. Действительно, в рассматри ваемом примере при Ьк > О вероятность события у = О уменьшает ся на ф(хЬ)Ьк. Одновременно с этим вероятность Р(у = 1) увеличи вается на эту же величину и уменьшается на ф (/и — xb)bk, а веро ятность Р(у = 2) — увеличивается на ф (/и — xb)bk. Нетрудно заме тить, что при положительном Ьк смещение вероятности происходит вправо, а при отрицательном Ьк — влево. Из этого следует, что увеличение факторной переменной, когда коэффициент при ней положителен, приводит к увеличению вероятностей тех событий, которые получили более низкие ранги. Происходит как бы дефор мирование кривой плотности вероятностей с перемещением неко торой вероятностной массы (площади под кривой) слева направо. В случае отрицательного коэффициента все происходит наоборот. Весь этот механизм хорошо показан на рис. 3.5.
Рис. 3.5. Изменения распределения вероятностей под воздействием предельных эффектов Для каждой /-й ситуации можно вычислить энтропию точно так же, как это делалось в модели множественного выбора. Энтропию удобно использовать для оценки информационного эффекта, яв ляющегося следствием предельного эффекта. 116
3.5.4. Преференция условий ведения бизнеса на основе прогнозных рейтинговых решений Рассмотренные выше основные аспекты построения моделей множественного выбора в ранговых шкалах свидетельству ют о возможности использования этих моделей для решения раз личных экономических задач, в том числе, задач практического маркетинга. Как известно, одной из ключевых проблем, перио дически возникающих перед любой компанией, является префе ренция условий ведения бизнеса, т.е. выбор наиболее предпоч тительных альтернатив реализации продукции, рыночных ниш, партнеров по бизнесу, экономических зон хозяйствования и т.д. Изложим результаты исследования, проведенного с целью выбора наиболее благоприятных районов Воронежской области для реализации коммерческой деятельности ОАО "Спектр". Заметим, что эта компания имеет организационную структуру и целевые задачи такие же, как ОАО "Радуга", о котором уже шла речь в этой главе (см. 3.4). Исходя из критерия "минимум затрат на проведение маркетин говых исследований", для реализации поставленной цели исполь зовалась информация, предоставленная Главным управлением экономического развития администрации Воронежской области. Экспертным путем были отобраны семь показателей, играющих в совокупности ключевую роль в задачах обоснования решений, связанных с выбором наиболее привлекательных районов для ве дения торговой деятельности. Однако статистически значимыми показателями оказались только четыре: I) объем промышленной продукции (работ, услуг) в действующих ценах, млн р.; 2) сто имость валовой продукции агропромышленного комплекса в дей ствующих ценах, млн р.; 3) оборот розничной торговли (по всем каналам реализации) в действующих ценах, млн р.; 4) средняя заработная плата, р. Кроме того, с помощью процедуры экспертного опроса были получены обобщенные оценки степени инвестиционной привлека тельности (для ведения торговли) каждого из районов, в котором ОАО "Спектр" осуществляло свою деятельность. Рейтинговое оценивание проводилось в соответствии со следующей шкалой: 0 — самая высокая степень привлекательности; 1 — высокая степень привлекательности; 2 — средняя степень привлекательности; 3 — низкая степень привлекательности; 4 — крайне низкая степень привлекательности. 117
В результате была сформирована табл. 3.19, данные которой и были использованы для построения логит-модели множествен ного упорядоченного выбора. В стратегические планы ОАО "Спектр" на 2005 г. входило расширение сети супермаркетов за счет освоения новых рынков сбыта в других районах Воронежской области. Показатели, харак теризующие уровень социально-экономического развития планиру емых для освоения районов, представлены в табл. 3.20. По итогам выполнения необходимых действий в пакете STATISTICA 6.0 были получены расчетные характеристики модели, которые от ражены в табл. 3.21— 3.23. Т а б л и ц а 3.19 Рейтинговые оценки районов Воронежской области в зависимости от уровня их социально-экономического развития Объем про Рейтин мышленной Район говая продукции Воронеж оценка (работ, услуг) Год ской района в действую области щих ценах, млн р. R *, 2 4 1 3 2002 1688,4 1 1955,2 2003 0 Борисо глебский 2004 2314,8 0 2005* 0 2913,5 2002 278,7 3 2003 344,5 3 Бобровский 2004 1 442,5 2005* 1 556,9 2002 781,4 3 2003 3 1086,2 Бутурлиновский 2004 1178,2 2 2005* 2 1482,9 2002 4 75,3 120,4 3 Верхнема- 2003 монский 2004 3 133,8 2005* 168,4 3
118
Факторы Стоимость Оборот валовой розничной Средняя продукции торговли (по заработ всем каналам АПК в ная действую реализации) в плата, р. щих ценах, действующих ценах, млн р. млн р. X,
5 157,3 166,0 161,3 177,9 455,4 595,7 655,3 722,9 420,4 470,9 519,9 573,5 212,8 247,3 341,4 376,6
*з 6 1538,2 1979,6 2587,6 3197,4 279,9 323,9 356,4 440,4 440,0 558,8 661,5 817,4 163,5 218,7 246,0 303,9
*4
7 2318,3 2877,0 3100,0 3785,7 1975,9 2406,6 2793,0 3410,8 1715,7 1973,0 2421,0 2956,5 1678,2 2044,0 2610,0 3187,3
П р о д о л ж е н и е 1
2 2002 Верхне- 2003 хавский 2004 2005* 2002 2003 Грибановский 2004 2005* 2002 2003 Калаче евский 2004 2005* 2002 2003 Каменский 2004 2005* 2002 2003 Каширский 2004 2005* 2002 Нижне де- 2003 вицкий 2004 2005* 2002 Новоус- 2003 манский 2004 2005* 2002 2003 Ольховатский 2004 2005* 2002 2003 Остро гожский 2004 2005*
3 4 3 3 3 4 3 3 3 3 0 0 0 4 3 3 3 4 3 3 3 4 4 3 3 3 3 0 0 4 3 2 2 I 0 0 0
4 133,3 279,9 544,8 685,7 32,9 66,3 85,6 107,7 1389,4 1461,7 1853,1 2332,4 731,6 765,3 1052,2 1324,3 0,2 21,8 15,3 19,3 56,6 86,3 95,6 120,3 120,7 265,5 326,2 410,6 255,0 482,0 567,8 714,6 455,0 562,8 586,2 737,8
5 169,5 322,0 360,1 397,2 231,3 398,8 429,7 474,0 749,1 824,0 898,0 990,6 220,3 282,9 259,8 286,6 239,3 359,0 346,0 381,7 306,9 368,3 310,2 342,2 359,1 382,8 465,5 513,5 222,6 236,0 277,0 305,6 350,2 369,5 315,7 348,2
табл.
6 155,3 173,0 205,5 253,9 230,8 373,4 446,3 551,5 528,1 686,5 858,0 1060,2 174,8 143,2 161,2 199,2 109,6 140,3 168,9 208,7 161,0 193,8 270,9 334,7 271,7 322,2 415,3 513,2 169,4 208,0 247,0 305,2 1078,7 1340,8 1644,4 2031,9
3.19
7 1760,5 2220,0 2580,0 3150,7 1512,5 1998,0 2414,0 2947,9 2041,7 2409,2 2826,0 3451,1 1921,2 2000,0 2469,4 3015,6 1612,8 2016,0 2575,0 3144,6 1752,1 1668,0 2283,0 2787,9 2499,2 2979,0 3708,0 4528,2 1726,3 2220,0 2770,0 3382,7 2428,1 3278,0 4065,0 4964,1
119
П р о д о л ж е н и е 1
4
5
6
7
2002
4 4 3
158,2 144,1 274,3
394,1 105,3 351,0
157,5 203,2 280,4
1646,0 1962,0 2601,0
3 4
345,2
387,2
0,3
175,8
346,5 145,2
3176,3
2002 2003
4
2,0
1800,0
2004
3
5,6
189,9 285,4
180,0 225,2
2145,6
2005* 2002
3
7,0
314,8
278,3
2620,2
3
43,2
159,4
212,7
2708,3
2003
0
49,8
181,4
257,0
4214,1 4519,0
2005*
Поворинский
3.19
3
2003 Панинский 2004
Петропав ловский
табл.
2
1747,6
2004
0
39,4
0
49,6
221,9 244,8
308,0
2005*
380,6
5518,5
2002
3
27,6
406,2
286,0
2217,0
2003 2004
3
55,2 189,4
435,0 446,6
352,1
2664,8
416,1
3176,1
2005* 2002
0 4
238,4
492,7
514,1
3878,6
12,3
239,0
117,4
1662,0
2003 Репье вский 2004
4
16,5
3
17,3
248,6 216,7
133,8 168,3
2011,0 2574,0
2005*
3 0 0
21,8 4694,3 6060,4
239,1 810,3
3143,3 2807,4
0
7655,7
965,9 853,8
207,9 1106,4 1355,3 1694,0
4412,0
2005*
0
9635,7
941,9
2093,2
2002
3
950,0
314,0
5387,9 2270,7
Рамонский
2002 Россошан 2003 ский 2004
1
3512,0
2003
3
1084,9
289,9 388,5
375,2
2793,0
2004
0
1306,1
382,2
463,1
3326,0
2005*
0
572,2
4061,7
3
1643,9 133,4
421,6
2002
503,7
751,8
1722,4
2003
2
136,2
648,8
825,5
2296,0
2004
0
130,4
523,0
909,7
2802,5
2005* 2002
0 4
164,1
576,9
1124,1
3422,4
32,7
387,9
2003 Терновский 2004
3 3
42,9 45,0
470,9 405,8
182,3 207,1
2040,0
2005*
3
56,6
447,7
Семилукский
Таловский
120
1598,7
228,3
2493,0
282,1
3044,4 |
О к о н ч а н и е 1
Хохольский
Эртильский
табл.
3.19
4
5
6
3
95,4
284,0
109,8
2014,8
3 2
171,7 67,5
326,0 326,3
132,6 263,1
2005*
2
84,9
325,1
2002
4
220,5
359,9 293,4
2176,0 2860,0 3492,6
2003
3
373,2
2 2002 2003 2004
3
2004
3
374,9 663,2
2005*
3
834,7
7
1631,4 2005,0
400
163,9 186,8 283,7
441,3
350,6
3077,4
2520,0
Оценка показателя. Т а б л и ц а 3.20 Показатели, характеризующие уровень развития районов, относительно которых необходимо принять маркетинговое решение Район Воронежской области
Богучарский
Кантемировский
Павловский
Факторы Год
*,
X,
X,
2002
286,3
318,0
2003 2004
326,4
435,6
404,5 457,1
431,9
547,0
2310,0 2935,0
2005*
312,5 320,7
3405,3
297,1
440,9 374,1
586,3
2002
262,8
2003
208,0
558,1
1808,9 2310,0
2004
200,8
612,8
2005*
180,2
642,8
2002
*4
1661,9
295,9 339,4 385,7
2960,0 3200,4
570,1 822,6
626,2
315,8
2109,1
2003 2004
651,2
719,4
1061,9
704,0
901,8
2664,9 3367,1
2005*
1210,3
720,4
1250,3
3545,2
* Оценка показателя. Анализ табл. 3.21 позволяет: 1) сделать вывод о том, что полученные оценки коэффициен тов являются статистически значимыми (все стандартные ошиб ки меньше значений коэффициентов, а все вероятности ошибки меньше 0,05);
121
2) записать аналитическое выражение для построенной логитмодели: е
Р(У,-=О)=
,
-31,1563+0,0005*,, +0,0092*, 2 +0,0088* /3 +0,0066* /4 -31,1563+0,0005*,,+0,0092*,.,+0,0088*; 3 +0,0066*, 4 '
-29,3368+0,0005*,-, +0,0092*,2 +0,0088*,, +0,0066*,4
Р(Л=1) =
е л
-29,3368+0,0005*,, +0,0092*,2 +0,0088*;3 +О,0066*,4
-Р(у,-=0);
-27,3755+0,0005*,,+0,0092*/2+0,0088*,з+0,0066*;4
Р(У/=2) =
j
-27,3755+0,ОО05*,,+0,0092*;2+О,ОО88*;3+0,ОО66*,4
-Р(у,=0)-Р(Л=1); -17,0158+0,0005*,,+0,0092*,2+0,0088*,3+0,0066*,4
Р(У/=3) =
|
-17,0158+0,0005*;,+0,0092*; 2 +0,0088*,з+0,0066*~
-Р(у,.=0)-Р(у,.=1)-Р( 3 ; / .=2); P(j,. = 4) = 1 - Р(у,. = 0 ) - Р(у,. = 1 ) - Р(у, = 2 ) - Р(у,. = 3). Т а б л и ц а 3.21 Оценки параметров модели, их стандартные ошибки, статистики Вальда и вероятности Varl - Parameter estimates (Spreadsheet 11) Distribution : ORDINAL MULTINOMIAL Link function: LOG IT Level of Column Estimate Standard Error Wald Stat. Effect Effect 1,663154 Interc l 1 350,9341 -31,1563 Interc 2 2 1,582 161 -29,3368 343,8136 Interc 3
3
Interc 4
4
"Var2" •Var3" 'Var4"
6 7
"Var5" Scale
122
5
8
-27,3755 -17,0158
1,513240 0,956 436
0,0005 0,0092 0,0088 0,0066 1,0000
P 0,000 000 0,000 000
327,2730 316,5154
0,000 000 0,000 000
0,000 241
5,0410
0,000 847 0,000 585 0,000 374
117,1913 224,6336
0,024 754 0,000 000 0,000 000 0,000 000
0,000 000
309,9378
Данные табл. 3.22 позволили оценить пригодность модели в це лом с помощью индекса отношения правдоподобия Макфаддена:
Ul, = 1 -J»IA = ,.Z3W0_ lnL(b0)
-1287,31
Т а б л и ц а 3.22 Тест правдоподобия 1-го типа
Effect Intercept
Varl - Likelihood Type 1 Test (Spreadsheetl 1) Distribution : ORDINAL MULTINOMIAL Link function: LOGIT Log- Likelihd Degr. of Freedom Chi- Squre
P
4
-1287,31
"Var2"
1
0,000 000
1
-1102,49 -1048,20
369,6538
"Var3"
108,5653
0,000 000
•Var4"
1 1
-891,45 -393,50
313,4970
0,000 000 0,000 000
"Var6"
995,9055
В табл. 3.23 приведены вероятности, с которыми каждому району в зависимости от его показателей может быть присвоен один из рейтингов (R = 0, R = 1, R = 2, R = 3, R = 4). Вто рой столбец этой таблицы содержит экспертную рейтинговую оценку района, которая, по сути, предсказывается моделью. Если модель обладает достаточно высокой точностью, то в ее предсказаниях наибольшая вероятность должна быть согласована с рейтинговой оценкой второго столбца. Анализируя табл. 3.23, можно сделать следующий вывод: с до статочным уровнем надежности результаты моделирования согла суются с экспертными оценками, за исключением четырнадцати случаев, которые выделены полужирным шрифтом. С целью разработки стратегии на 2005 г. по данным табл. 3.20 (для трех районов Воронежской области: Богучарского, Кантемировского и Павловского) были получены оценки ожидаемых резуль татов деятельности ОАО "Спектр", представленные в табл. 3.24. Вычисленные прогнозные оценки, по сути, являются выражени ем объективных тенденций и субъективных мнений относительно степени привлекательности этих районов Воронежской области для осуществления на их территории торговой деятельности. Из данных табл. 3.24 следует, что наиболее перспективным для ведения деятельности ОАО "Спектр" является Павловский район, 123
Т а б л и ц а
3.23
Предсказанные значения вероятностей рейтинговых оценок № п/п
R
1
Вероятности
№ п/п
Я
8
Вероятности
Р„
р,
Р,
10
11
12
Р, 13
Р« 14
0,0956
0,2991
0,4279
0,1775
0,0000
2
Р0 3
Р, 4
Р2 5
Р, 6
Р< 7
1
1
0,4887
0,3663
0,1217
0,0233
0,0000
49
9 1
2
0
0,9996
0,0004
0,0001
0,0000
0,0000
50
0
0,9972
0,0023
0,0004
0,0001
0,0000
3
0
1,0000
0,0000
0,0000
0,0000
0,0000
51
0
1,0000
0,0000
0,0000
0,0000
0,0000
4
0
1,0000
0,0000
0,0000
0,0000
0,0000
52
0
1,0000
0,0000
0,0000
0,0000
0,0000
5
3
0,0000
0,0001
0,0004
0,9412
0,0582
53
4
0,0000
0,0000
0,0000
0,2514
0,7486
6
3
0,0011
0,0056
0,0393
0,9533
0,0007
54
4
0,0000
0,0000
0,0000
0,2200
0,7800
7
1
0,0329
0,1404
0,4251
0,4016
0,0000
55
3
0,0003
0,0014
0,0103
0,9854
0,0026
8
1
0,8915
0,0892
0,0166
0,0028
0,0000
56
3
0,0306
0,1324
0,4176
0,4194
0,0000
9
3
0,0000
0,0000
0,0003
0,9182
0,0814
57
4
0,0000
0,0000
0,0000
0,0680
0,9320
10
3
0,0002
0,0012
0,0088
0,9867
0,0031
58
4
0,0000
0,0000
0,0000
0,1374
0,8626
11
2
0,0180
0,0834
0,3436
0,5551
0,0000
59
3
0,0000
0,0000
0,0002
0,8471
0,1527
12
2
0,8248
0,1419
0,0285
0,0048
0,0000
60
3
0,0002
0,0010
0,0071
0,9879
0,0038
13
4
0,0000
0,0000
0,0000
0,0735
0,9265
61
3
0,0000
0,0002
0,0018
0,9828
0,0151
14
3
0,0000
0,0000
0,0001
0,6683
0,3317
62
0
0,6339
0,2805
0,0726
0,0130
0,0000
15
3
0,0002
0,0009
0,0069
0,9881
0,0039
63
0
0,9668
0,0277
0,0048
0,0008
0,0000
16
3
0,0189
0,0874
0,3518
0,5419
0,0000
64
0
1,0000
0,0000
0,0000
0,0000
0,0000
17
4
0,0000
0,0000
0,0000
0,0809
0,9191
65
3
0,0000
0,0002
0,0013
0,9774
0,0211
«
8
5
Ж
£
$
St
8
8
Я 125
£
S
8
о'
3
о, в
9
<^
f>
2
S 8
я
о'
о
8
I о"
а
го
о
з
о «Г tvO ао
3
s
9 126
"1*1
$
з
9
который с вероятностью, близкой к единице, относится к груп пе районов, имеющих самую высокую привлекательность. С мень шей вероятностью к этой же группе принадлежит Богучарский район. Расчеты показывают, что Кантемировский район уступа ет первым двум и может быть отнесен к группе с более низкой степенью привлекательности. Т а б л и ц а 3.24 Прогнозные оценки степени инвестиционной привлекательности районов Воронежской области Район Воронежской области Богучарский Кантемировский Павловский
Прогнозные вероятности Р, Р, Р» Р, 0,6534 0,2674 0,0672 0,0120 0,3323 0,4220 0,2019 0,0438 1 0 0 0
Рд
0 0 0
Ожидаемый рейтинг района 0
! 0
Для анализа потенциальных возможностей районов необходи мо рассчитать предельные эффекты факторов. Прежде чем присту пить к этим расчетам, сделаем небольшие пояснения, так как компьютерное построение модели несколько отличается от той схемы, которая приведена в 3.5.3. Пусть b°, b1, b2, b3 — векторы коэффициентов модели, отли чающиеся только свободным членом (см. табл. 3.21). Тогда ве роятности рейтингов могут быть записаны следующим образом: P(y = 0)=F(xb°); P(j = l)=F(xb 1 )-F(xb°); P(j = 2)=F(xb 2 )-F(xb 1 ); p ( y = 3) = F(xb 3 )-F(xb 2 ); P( y = 4 ) = l - F ( x b 3 ) . Дифференцируя эти выражения по любой из переменных, например по х,, получим предельные эффекты
эр
^ ^ ах,
(у=°)=РуК. = [F'(xb'Mxb 0 K 127
^W(*,,>)-FVK. '
ox, ox,
Помня, что для логистического распределения плотность веро ятности равна F'(xb) = F(xb)(l — F(xb)), рассчитаем соответству ющие плотности для нашего случая. Используя полученные формулы, определим значения предель ных эффектов. Результаты расчетов по изучаемым трем районам Воронежской области представлены в табл. 3.25. Таблица Предельные эффекты факторов Показатели 1 Накопленные вероятности Плотности вероятности dP(y = j) Эл'] dP(y = j) дх2 ЭР(У = ; ) Эх3 dP(y = j) дх4 Показатели Накопленные вероятности Плотности вероятности 128
2
3
Богучарский район 4 5 2
3.25
6
F(xb°)
F(xb')
F(X6 )
F(X6 )
I-F(X63)
0,65336
0,92080
0,98804
1,00000
0,00000
[
2
3
0,22648
F'(xb ) 0,07292
F'(xb ) 0,01181
F'(xb ) 0,00000
F'(xb4) 0,00000
0,00012
-0,00008
-0,00003
-0,00001
0,00000
0,00208
-0,00141
-0,00056
-0,00011
0,00000
0,00198
-0,00135
-0,00054
-0,00010
0,00000
0,00149
-0,00101
-0,00040
-0,00008
0,00000
F-(xb°)
3
Кант?мировскийрайон F(xb°) 0,33226 F'(xb°) 0,22186
Ffxb1)
F(X62)
0,75427
0,95618
1,00000
1 - F(xb 3 ) 0,00000
F'fxb )
F'H
0,18535
0,04190
F-(xb 3 ) 0,00000
F'(xb4) 0,00000
1
F(X63)
Окончание
т а б л . 3.25
2
3
4
5
6
0,00012
-0,00002
-0,00008
-0,00002
0,00000
0,00204
-0,00034
-0,00132
-0,00038
0,00000
dP(y = j) дхт,
0,00194
-0,00032
-0,00126
-0,00037
0,00000
dP(y = j)
0,00146
-0,00024
-0,00094
-0,00028
0,00000
1 dP(y = j) Эх,
дх7
дх4
Павловский район
Показатели Накопленные вероятности Плотности вероятности ЭР(У=;) Эх, dP(y = j)
дх2 dP(y = j)
1
F(xb°)
FJxb )
F(xb 2 )
0,99997
1,00000
1,00000
F'(xb°)
]
2
4ь )
) 1,00000
I-F(X63/
3
F'(xb4)
F (xb
3
0,00000
0,00003
F-(xb ) 0,00000
0,00000
F-(xb ) 0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
0,00000
Эх3 dP(y = j)
дх4
Результаты предельного анализа показывают, что потенциальные возможности для повышения степени своей привлекательности имеют два района — Богучарский и Кантемировский. Что касается Павловского района, то он уверенно (с вероятностью, близкой к единице) входит в рейтинговую группу самой высокой привлека тельности. Фактором, оказывающим наиболее существенное вли яние на рост степени инвестиционной привлекательности, служит стоимость валовой продукции АПК, что вполне естественно для сельскохозяйственных районов. Далее по убыванию степени значи мости факторы расположились следующим образом: оборот рознич ной торговли, средняя заработная плата и, наконец, объем про мышленной продукции (работ, услуг). Сделанные выводы находят ся в соответствии с представлениями аналитиков о закономернос тях, действующих в экономике сельских районов. 129
ГЛАВА 4 ЭКСПЕРТНЫЕ ОЦЕНКИ В КОМБИНИРОВАННЫХ П Р О Г Н О З Н Ы Х РАСЧЕТАХ Переходя к рассмотрению третьей ситуации (см. 2.2.1), предусматривающей для получения надежных прогнозных оценок комбинирование экспертной и фактографической информации, ос тановимся более подробно на описании тех моделей, которые по требуются для реализации этого подхода. Сразу заметим, что, в отличие от вышерассмотренных, в реализуемом здесь подходе про гнозные оценки должны получаться не в номинальных или ранго вых шкалах, а в абсолютной шкале. На первый взгляд, это заме чание упрощает задачу, так как открывает возможность использо вания известного и достаточно хорошо разработанного аппарата прогнозирования. Однако такое мнение следует считать заблужде нием, и вот почему. Во-первых, не все методы пригодны для того, чтобы на их основе можно было строить схемы комбиниро вания экстраполяционных расчетов с экспертными оценками. Вовторых, даже те методы, которые действительно смогут обеспечить эффективное комбинирование, как правило, требуют серьезной модификации. Не претендуя на мнение последней инстанции, авторы счита ют, что наиболее пригодными для реализации данного подхода являются адаптивные методы прогнозных расчетов. К сожалению, это тот аппарат, который хотя и пользуется популярностью, одна ко нюансы его практического использования не в полном объеме изложены как в учебной, так и в монографической литературе. Поэтому изложению комбинированного подхода будет предшество вать материал, посвященный тому аппарату, который предполага ется применять при реализации данного подхода. В основном, это адаптивные процедуры, построенные на основе рекуррентной схе мы метода наименьших квадратов. Причем будут рассмотрены как одношаговый, так и многошаговый варианты этой схемы. Фундаментом практической реализации комбинированного под хода является идея многовариантных прогнозных расчетов. В 130
последнее время многовариантность становится доминирующим взглядом на возможность достижения адекватности в упреждающем отражении реальной действительности. Ведутся, и достаточно интенсивно, исследования в этой области. Поэтому кроме адаптив ных процедур будет приведено описание моделей многовариант ного прогнозирования. Прежде всего это коснется авторских раз работок по адаптивно-имитационному моделированию и мультитрендовой аппроксимации, к описанию которой мы переходим. 4.1. Мультитрендовая модель с вероятностной оценкой вариантов Использование прогнозных оценок в обосновании уп равленческих решений предъявляет повышенные требования к их точности. У этих требований две составляющие: информационная и математическая. В их наращивании существуют естественные пределы, с которыми необходимо считаться. Нельзя по статис тическим наблюдениям получить выводы о закономерностях, ко торые не имели место в действительности, так же как нельзя надеяться на то, что с помощью математических моделей удаст ся получить расчеты, свободные от воздействия случайных вели чин. Обе составляющие должны быть сбалансированы, и только в этом случае удается получить надежные прогнозные оценки. В предлагаемой ниже методике рассматривается комплексный под ход, позволяющий решить многие вопросы повышения надежно сти принимаемых решений. Построение прогнозной модели по этой методике осуществля ется последовательно в несколько этапов, причем каждый после дующий находится в логической взаимосвязи с предыдущим. Необходимость многоэтапного построения диктуется тем, что схе ма расчетов предусматривает одновременную концентрацию в прогнозных оценках экстраполяционной и экспертно-аналитической информации. Поэтому каждый этап предусматривает получе ние прогнозных оценок соответствующего типа. Чтобы методика обладала возможностью практической реали зации, необходимо при построении модели ориентироваться толь ко на те данные, которые доступны лицу, принимающему реше ние. Если, например, решение касается предоставления креди та, то в качестве данных могут быть те, которые официально используются банком при рассмотрении подобного рода вопросов. В случае маркетинговых решений данными могут быть результа131
ты специально проведенных исследований или статистические наблюдения. Естественно, это накладывает определенные ограни чения на информационную сложность моделей, которые будут применены в прогнозных расчетах. Имеется в виду, что их по строение не должно предусматривать использование факторов, не входящих в перечень тех показателей, которыми пользуются бан ки или маркетинговые службы фирм. Начнем обсуждение вопросов построения модели с ее экстраполяционной составляющей. Если учесть требования, которым должны удовлетворять необходимые для ее построения данные, а также предикторную точность и то обстоятельство, что целью является получение прогнозных оценок, а не объяснение механиз ма формирования показателей, то выбор не столь уж и богат. В основном, это трендовые и авторегрессионные модели. Выбирая из этих двух, без сомнения, следует предпочесть авторегрессион ные модели, так как отражение динамики в виде зависимости текущих значений от предыдущих, как правило, обеспечивает более высокий уровень адекватности, чем представление той же самой динамики в виде элементарной функции от времени. Их построение требует установления порядка интеграции и порядка авторегрессии. Порядок интеграции принято устанавливать с помощью тес та Дики — Фуллера, который достаточно хорошо изложен в ру ководствах по эконометрике и поэтому здесь не приводится. Более того, методика, излагаемая ниже, предусматривает иден тификацию эффектов, нарушающих стационарность, и поэтому вопрос о порядке интеграции при построении модели не рас сматривается. Порядок авторегрессионной модели обычно определяется по частным коэффициентам автокорреляции. Если порядок послед него статистически значимого частного коэффициента автокор реляции равен т, то авторегрессионная модель должна иметь тот же самый порядок. Вместо величины частного коэффици ента автокорреляции при проведении практических расчетов обычно используется последний авторегрессионный коэффици ент модели. Причем у модели первого порядка коэффициент авторегрессии ах одновременно и частный. У моделей второго порядка коэффициент а2 является частным коэффициентом ав торегрессии второго порядка и так далее. Другими словами, как только последний авторегрессионный коэффициент оказы вается незначимым, добавление в модель авторегрессионных 132
членов прекращается. В окончательном варианте модель запи сывается следующим образом: у, = a0+alyt„l +a2y,_2+--- + amyl_m+€r (4.1) К сожалению, как свидетельствует практика применения этих моделей, не во всех случаях с их помощью удается получить про гнозные оценки требуемой точности и надежности. Причин мно го, но основная связана с динамическими эффектами, о которых уже говорилось и которые возникают в силу временной потери ста ционарности. Это наводит на размышление о поиске механизмов адекватного отражения всех этих эффектов. Моменты, в которые возникают эффекты, неизвестны, и поэтому в модель удобно вве сти переменную, характеризующую возможность их проявления. Неизвестность возникновения эффектов диктует необходимость вве дения в качестве такой переменной специальной случайной вели чины ир принимающей соответствующее фиксированное значение в тех случаях, когда проявляется i-й эффект. С учетом дополни тельной случайной величины модель (4.1) записывается в виде У, = а0 + «1 У,-1 + «2 У ,-2 +••• + ат У,-т + ",• + £i, • (4'2) Таким образом, модель содержит две случайные величины, которые должны удовлетворять следующим условиям: Е[ей]=Е[и,] = 0; Е[е;] = сг;; Е[и,2 ] = сг; Е[£,,иу] = 0 для всех /, t и у;
(4.3)
E[£,.,£;J = 0, если t Ф s или / Ф j ; Е[им.] = 0, если / Ф j . По сути, это модель, для оценивания параметров которой не обходимы данные, имеющие панельную структуру. Естественно, на момент построения модели отсутствуют гипотезы относительно структуры данных. Более того, возможность выдвижения той или иной гипотезы предстоит выяснить в процессе построения модели. В соответствии с этой идеей выяснения реальности неучтенных эффектов возникает необходимость их идентификации. Идентификацию эффектов удобнее проводить, если перейти от рассмотрения модели с дополнительной случайной составляющей к модели с фиксированными эффектами. Построение модели с 133
фиксированными эффектами выглядит намного проще, чем по строение модели со случайными эффектами. Процедура иденти фикации фиксированных эффектов предполагает реализацию сле дующих шагов. Оцениваются коэффициенты авторегрессионного уравнения и рассчитываются значения моделируемого показателя У, = а0 + аху,_х + а2у,_2 + ••• + amyt_m, t = m + l,...,T. (4.4) Если построенная модель устраивает по точности, то следует естественный вывод — наличие случайных эффектов не подтвер дилось. В противном случае вычисляются отклонения расчетных значений от фактических Ус ~9f t = m + l,...,T, которые позволяют выборочное множество наблюдений разделить на две части по следующему правилу:
U-yt<0, \yt-yt>0,
tela; /el,.
(45)
На основе полученного деления формируется вектор i, (фиктив ная переменная) из нулей и единиц таким образом, что на ме стах с номерами / е 10 будут стоять нули, а с номерами ^ е 1( — единицы. Введение новой переменной приводит к модели вида У, =a0+alyl_l+a2y,_2+---
+ amyl_m+dlin+el,
(4.6)
в которой dx— коэффициент при фиктивной переменной; /', — значение фиктивной переменной в момент /. Оцененное уравнение у,=а0+
аху,_х + а2у,_2 +••• + ату,_т + dxi,
(4.7)
позволяет проверить значимость коэффициента d и тем самым убедиться в реальности предположения об эффектах. Если пред положение об эффектах подтвердилось, то после получения рас четных значений yt вновь осуществляется деление каждого из под множеств 10 и Ij на две части по следующему правилу:
134
если если если ^если
yt-yt<0, yt-yt>0, yt-yt<0, yt—yt>0,
tel0, то fel 0 0 ; fel 0 , то feloil / e l , , mo г е ^ю> te fell, mo hv
(4-8)
Полученная классификация позволяет ввести вторую фиктив ную переменную i2, следуя правилу если если если если
t е тоо, feloi, tell0, t£ I u ,
«о то то то
il2 - 0; / Г 2 = 1J it2=0; it2 = 1.
(4.9)
Модель с двумя фиктивными переменными У, = ао + ауу^
+ a2yt_2 +••• + ату,_т + dxin + dxitX + £,
(4.10)
обеспечивает получение четырех траекторий, различие между ко торыми определяется идентифицируемыми эффектами. Коэффи циенты модели оцениваются с помощью обычного метода наи меньших квадратов, и полученное уравнение у,=а0+
аху,_х + а2у,_2 +••• + а„у,_т + dxirX + d2il2
(4.11)
используется для статистического анализа результатов моделирова ния. Если коэффициенты при фиктивных переменных окажутся значимыми, то это будет свидетельствовать о том, что эффекты играют существенную роль в динамике моделируемого процесса, и они должны быть учтены в прогнозных расчетах. Процесс уточнения модели путем идентификации фиксирован ных эффектов прекращается, как только точность модели дости гает требуемого уровня или коэффициенты при переменных, ха рактеризующих эффекты, становятся статистически незначимыми. На этом построение экстраполяционной составляющей модели завершается. Полученную модель будем называть мультитрендовой. Таким образом, мулътитрендовая модель — это модель, обеспечи вающая адекватное описание процессов с несколькими траектория ми развития. Мультитрендовая модель имеет две особенности. Во-первых, она обеспечивает высокую точность аппроксимации данных рет роспективного периода, а во-вторых, с ее помощью можно про водить многовариантные прогнозные расчеты. Многовариантность открывает возможность для всестороннего анализа ожидаемых си туаций, которые могут иметь место в обозримом будущем. Это важное и нужное свойство. Оно создает ситуацию альтернативного выбора, обостряя чувство риска у лиц, принимающих решение на основе прогнозной информации. Естественно, в подобной ситу135
ации для снижения риска необходимо уточнение возможной реаль ности каждого из прогнозных вариантов. Для этой цели предлага ется дополнить мультитренд вероятностными оценками, позволяю щими проводить альтернативное сравнение прогнозных вариантов в процессе принятия прогнозного решения. Для получения вероят ностных оценок удобно использовать модель дискретного выбора. Количество прогнозных вариантов заранее не задается, а, как следует из вышерассмотренной схемы построения модели, опреде ляется в соответствии со статистическими критериями надежности. Если их окажется два, то для получения вероятностного распреде ления, устанавливающего степень реальности каждого варианта, можно использовать модель бинарного выбора; если вариантов боль ше двух, то для этих же целей можно использовать модель множе ственного выбора. Таким образом, в схеме прогнозных расчетов применяются две модели: мультитрендовая и дискретного выбора. Первая обеспечивает оценку будущего в виде альтернативных про гнозных траекторий, а вторая — оценивает вероятность реальнос ти каждого из этих вариантов. Формально комбинированная модель может быть записана следующим образом:
j£i = «о + аху, + агу,_х + ••• + amy,_m+i + f *d; р* _
(4.13)
exp(x,+1b') l+£exp(x I+1 b*)
(4-14)
где у* — к-й вариант прогнозной оценки; у— запаздывающие зна чения зависимой переменной; а- — оценка у-го коэффициента регрессии; Р* — вероятность реальности k-ro варианта прогнозной оценки; f* — вектор значений, которые в к-м варианте приняли фиктивные переменные (например при К = 3 имеем набор из четы рех векторов f° = (0,0), Р = (0, 1), f = (1, 0), Р = (1, 1)); d - век тор коэффициентов при фиктивных переменных; 6*— оценка век тора параметров логит-модели множественного выбора к-го вариан та; х ж — вектор значений, описывающий условия, ожидаемые в упреждающем периоде. Описание моделей дискретного выбора со всеми подробностями построения и предельного анализа результатов моделирования приведено в предыдущей главе. Это позволяет непосредственно 136
перейти к построению комбинированной модели на основе мультитрендовой с использованием логит-модели множественного вы бора. Последовательному изложению этапов реализации этой процедуры посвящается следующий параграф. 4.2. Прогнозирование прибыли предприятия с помощью комбинированной модели Рассмотрим прикладные возможности комбинирован ной модели на примере многовариантных прогнозных расчетов ожидаемой прибыли ОАО "Воронежстальмост", которые проводи лись по заданию одного из коммерческих банков г. Воронежа с целью их использования при обосновании кредитной надежности данного акционерного общества, обратившегося к ним с просьбой о предоставлении кредита. Динамика прибыли объединения при ведена в табл. 4.1 Т а б л и ц а 4.1 Динамика прибыли ОАО "Воронежстальмост", тыс. р. Год 1996 1997 1998 1999 2000
Прибыль 13146 16 828 40 325 73454 80 206
Год 2001 2002 2003 2004
Прибыль 115 343 109 730 141 050 126 618
Как предусмотрено описанной в предыдущем параграфе схе мой, построение модели проведем в два этапа. На первом эта пе построим мультитрендовую модель, а на втором — модель множественного выбора, позволяющую рассчитать для каждого прогнозного варианта вероятность его реальности. Построение мультитрендовой модели и все дополнительные расчеты проведем в пакете MS Excel. Его среда обеспечивает много удобств при реализации расчетов подобного типа. Для построения логис тической модели множественного выбора используем пакет STATISTICA 6.0, в котором предусмотрена такая возможность. Всю процедуру построения комбинированной модели разделим на шаги и проведем их подробное описание. 1. Ввод исходных данных в MS Excel. 2. Определение порядка авторегрессии. 137
2.1. Формирование вектора значений лаговой переменной yt_r Построение с помощью "Пакета анализа" MS Excel авторегресси онной модели первого порядка: yt = Z?0 + &i}V-i +Et (см. вывод итогов 4.1). Вывод итогов 4.1 Регрессионная статистика Множественный R 0,914613 R-квадрат 0,836 517 Нормированный „ ,™ .^g R-квадрат Стандартная
ISQIKSM
ошибка Наблюдения
18 9 1 8 8 4
'
8
Дисперсионный анализ
Ре фесе ия Остаток Итого
Y-пересечение Переменная X 1
df
SS
1 6 7
UE+10 2J5E+09 1.31Е+10
Значи мость F 1.1Е+10 30,70098 0,001 458 3,58Е+08 MS
F
Коэффи Стандартная t-cma - Р-значе- Нижние Верхние тистика ошибка циенты ние 95% 95% 26 089,62 13013,91 2,004 749 0,09 182 -5754,28 57 933,53 0,151 347 5,540 847 0,001 458 0,468 257 1,208 923 0,83859
Сравнение расчетных значений ^-статистик с табличными по зволяет сделать вывод о значимости коэффициента авторегрессии Ьх (тот же самый вывод можно сделать по Р-значению, которое в случае значимости коэффициента не должно превосходить 0,05). Следовательно, необходимо далее наращивать порядок авторегрес сии, т.е. строить авторегрессию второго порядка. 2.2. Формирование вектора значений лаговой переменной у,_2. Построение авторегрессионной модели второго порядка: yt =b0 + blyt_l +b2y,-2 +£t ( см - вывод итогов 4.2). Сравнение расчетного значения /"-статистики с табличным по зволяет сделать вывод о незначимости коэффициента &2- Следо вательно, прогнозные расчеты необходимо осуществлять с исполь зованием авторегрессионной модели первого порядка. 138
Вывод итогов 4.2 Регрессионная статистика Множественный R 0,956 435 R-квадрат 0,914 768 Нормированный 0,872 152 R-квадрат Стандартная 12 519,77 ошибка Наблюдения 7 Дисперсионный анализ
Регрессия Остаток Итого
Y-пересечение Переменная X I Переменная X 2
df
SS
2 4 6
6,73Е+09 6,27Е+08 7,36Е+09
Значи мость F 3,36Е+09 21,46528 0,007 265 1,57Е+08 MS
Коэффи Стандартная l-ста ошибка циенты тистика 46 007,64 11137,3 4,130 953 0,03107 0,31213 0,099541 0,772 209 0,326 376 2,366 009
F
Р-значение 0,014483 0,925498 0,077 156
Нижние 95% 15085,49 -0,83554 -0,13396
Верхние 95% 76 929,79 0,897684 1,678 377
3. Построение мультитрендовой модели. 3.1. Вычисление расчетных значений у , отклонений расчет ных от фактических значений и относительных ошибок в процен тах 8Г Результаты расчетов представлены в табл. 4.2. Т а б л и ц а 4.2 У, 16 828 40 325 73454 80 206 115 343 109 730 141 050 126 618
У,-, 13146 16 828 40 325 73454 80 206 115 343 109 730 141 050
У 37 114 40 202 59 906 87 688 93 349 122 815 118 108 144 373
yt-9t -20 285,46 123,38 13548,36 -7481,65 21 993,65 -13 084,72 22 941,50 -17 755,08
5 120,54 0,31 18,44 9,33 19,07 11,92 16,26 14,02 139
3.2. Идентификация случайного эффекта с помощью фиктив ной переменной /|, принимающей только два значения (0 или 1) и формируемой по следующему правилу: _ |0, если y,-yt<
0; >
[1, если у, — yt 03.3. Построение регрессионного уравнения с фиктивной и лаговой переменными: у, = 3114,56 + 31630,72^ + 0,94 yt_y. (6672,99) (5631,03) (0,06) 3.4. Вычисление расчетных значений у , отклонений расчет ных от фактических значений и относительных ошибок в процен тах § г Результаты расчетов представлены в табл. 4.3. Относительный уровень ошибок хотя и снизился, но для не которых наблюдений остается все же высоким. Очевидно, оста ется еще неучтенный эффект, который требуется идентифициро вать аналогичным образом. При этом нужно оставаться в рамках ограничений, которые необходимо выполнить для успешной ре ализации второго этапа. Суть этих ограничений в том, чтобы в каждой группе наблюдений, на которые делится выборочная со вокупность, было не менее двух наблюдений. В противном слу чае идентификация модели множественного выбора невозможна. Т а б л и ц а 4.3 У, 16 828 40 325 73454 80 206 115 343 109 730 141 050 126 618
/, 0 1 1 0 1 0 1 0
У,-, 13146 16 828 40 325 73454 80 206 115 343 109 730 141 050
У
у, -
У,
15414,70 1413,56 50 490,76 -10 165,74 72 475,66 978,47 71 842,43 8363,44 109 790,45 5552,64 111 036,12 -1305,67 137 415,33 3634,63 135088,93 -8471,33
8, 8,40 25,21 1,33 10,43 4,81 1,19 2,58 6,69
3.5. Введение фиктивной переменной f2 аналогично fv Замечание. Преследуя цель выполнения сформулированных выше ограничений при формировании / 2 , самому маленькому положительному отклонению был присвоен 0 вместо 1. 140
3.6. Построение регрессионного уравнения с двумя фиктивны ми и лаговой переменными: у, =-2735,06 + 31924,81/, + 9595,63/2 +0,95y,_i. (5141,52) (3885,31) (3760,31) (0,04) 3.7. Вычисление расчетных значенийy t , отклонений расчетных от фактических значений и относительных ошибок в процентах 5Г Результаты расчетов приведены в табл. 4.4. Т а б л и ц а 4.4 У, 16 828 40 325 73454 80 206 115 343 109 730 141 050 126 618
/, 0 1 1 0 1 0 1 0
л 1 0 0 1 1 0 1 0
У,-, 13146 16 828 40 325 73454 80 206 115343 109 730 141 050
У 19 321.96 45 141,66 67 414,77 76 489,44 114 814,38 106 601,32 142 801,41 130 969,46
у, -
У,
-2493,70 -4816,64 6039,37 3716,43 528,72 3129,12 -1751,45 -4351,85
8, 14,82 11,94 8,22 4,63 0,46 2,85 1,24 3,44
Данные табл. 4.4 свидетельствуют о том, что мультитрендовая модель обеспечивает достаточно высокую точность аппрок симации, особенно последних наблюдений. С помощью этой модели удается рассчитать четыре прогнозных траектории, от личающиеся друг от друга на величину случайного эффекта фиксированной величины. Раз эффекты случайны, то необхо димо знать их вероятностный закон распределения. Его иден тификация осуществляется с помощью модели множественного выбора. Атрибутами (факторами) модели множественного выбора мо гут быть как количественные, так и качественные переменные. Каждый из вариантов есть результат определенной экономической ситуации, которую не всегда удается описать количественными показателями, и поэтому имеет смысл использовать качественные оценки, получаемые с помощью экспертов. 3.8. Нумерация вариантов и определение интервалов для балль ной оценки условий, в которых может сформироваться соответ ствующий вариант (табл. 4.5). 141
Т а б л и ц а 4.5 Ситуация
Номер варианта
Баллы
Очень плохая Плохая Хорошая Очень хорошая
0
5-25 1 5 - 40 3 5 - 75 50 - 90
]
2 3
3.9. Экспертная оценка ситуаций, в которых была получена соответствующая прибыль (табл. 4.6). Т а б л и ц а 4.6 У, 16 828 40 325 73454 80 206 115 343 109 730 141 050 126 618
/, 0 1 1 0 1 0 1 0
Л 1 0 0 1 1 0 1 0
У,, 13146 16 828 40 325 73454 80 206 115343 109 730 141 050
Номер варианта
Баллы
1 2 2 1 3 0 3 0
15 35 75 40 50 5 90 25
3.10. Построение мультиномиальной логит-модели по данным последних двух столбцов табл. 4.6 с помощью пакета STATISTICA. Результаты моделирования представлены в табл. 4.7. Т а б л и ц а 4.7 Оценки параметров модели, их стандартные ошибки, статистики Вальда и вероятности
Effect Interc l "Var2" Interc 2 "Var2" Interc 3 "Var2" Scale 142
Varl - Parameter estimates (Spreadsheetl) Distribution: MULTINOMIAL Link function: LOGIT Level Level of Standard Wald Stat. of Effect Response Column Estimate Error 1 9,672 420 2,140 278 20,42349 0 2 0 -0,270 766 0,058 671 21,29770 3 1 7,769 844 2,044 825 14,43817 4 1 -0,179 950 0,050 178 12,86105 2 5 2,192 924 1,075929 4,15413 6 2 -0,035 078 0,016 337 4,61045 1,000 000 0,000 000
P 0,000 006 0,000 004 0,000 145 0,000 335 0,041 533 0,031778
Статистика Вальда и вероятность ошибки свидетельствуют об адекватности построенной модели. Сама модель может быть запи сана следующим образом: Р(А,) =ехр(9,672 - 0,27Lc,-)+exp(7,770 - 0,180*, )+ехр(2Д 93 - 0,035х,); ехр(9,672-0,271*,.)
P(v =0)=
<
—ттъм—
;
(v )=
ехр( 7,770-0,180х,)
' —i^w—;
^^2093-0,03^) 1 + Р(А,)
_ ! _ . 1 + Р(А,)
3.11. Расчет прогнозных оценок _у?+1 д л я каждого из четырех возможных ситуаций по мультитрендовой модели: &+1 = Ь0 + hf\ + hfl + ЪъУг • Результаты расчетов представлены в табл. 4.8. Т а б л и ц а 4.8 Номер варианта 0 1 2 3
А
А
0 0 1 1
0 1 0 1
U+1 117 288,69 126 884,32 149 213,51 158 809,13
3.12. Вычисление вероятностей получения той или иной вели чины прибыли с учетом экспертной оценки ожидаемой экономи ческой ситуации. Результаты расчетов при экспертной оценке, равной 60 баллам, представлены в табл. 4.9. Т а б л и ц а 4.9 Расчетное значение аргумента логистической функции -6,573 -3,027 0,882
Расчетное значение экспоненты 0,001 0,048 1,092 Сумма: 1,141
Вероятность варианта
Прибыль, тыс. р.
0,001 0,023 0,510 0,467
117 288,69 126 884,32 149 213,51 158 809,13
Многовариантный прогноз, с одной стороны, действительно является более полным, более адекватным описанием будущего, а с другой — требует дополнительных усилий по обоснованию 143
выбора. Это усложняет процедуру принятия решения и требует уточняющих расчетов. Рациональный выбор можно строить, ру ководствуясь следующими соображениями. Среди прогнозных ва риантов явным предпочтением пользуется тот, вероятность реаль ности которого выше. Таким вариантом является третий сверху (см. табл. 4.9). Кроме наиболее вероятного, можно ориентиро ваться на математическое ожидание величины прибыли Е(?, +1 )= 153167,19. Наконец, очень важной характеристикой является оценка ин формационной ситуации, в которой принимается решение. В качестве этой оценки удобно использовать величину энтропии H = -1£pilog2pi
= l,m.
Эта величина служит дополнительным критерием при сравне нии двух решений. При всех прочих равных условиях более надеж ным считается то решение, которое принято в условиях с мень шей энтропией. В рассматриваемом примере уровень неопределенности ситуа ции, в которой осуществлялся выбор варианта, можно считать средним, так как максимальное значение Н при выборе из четы рех вариантов равно 2. Фактически ситуация выбора по своей неопределенности близка к ситуации выбора из двух вариантов, когда максимальное значение Н равно 1. Реальность действитель но такова, что при выборе варианта нулевой и первый не конку рируют со вторым и третьим. Используя формулу
проведем предельный анализ. Сначала вычислим взвешенное сред нее значение коэффициента регрессии Ц= -0,2708-0,001-0,1800-0,023-0,0351-0,510 + 0-0,467 = -0,0223, а затем рассчитаем предельные эффекты по каждому из вари антов: - ^ - = -0,000 25; —¥± = -0,003 63; ох дх 144
— ^ i = -0,006 52; —^1£ = o,010 414 Эх ох Результаты предельного анализа показывают, что если ситуация, для которой был сделан прогноз, будет улучшаться и, следователь но, оцениваться большим количеством баллов, то это соответствен но приведет к возрастанию вероятности последнего варианта. При этом, что тоже немаловажно, энтропия ситуации, в которой осу ществляется выбор, снизится до величины Н = 1,126. Подобного рода анализ в основном ориентирован на повыше ние надежности принимаемых решений, так как, по сути, позво ляет получить упреждающие оценки ожидаемых изменений и учесть их в принимаемом решении. 4.3. Адаптивные модели прогнозирования Принцип экспоненциального сглаживания и адаптивный механизм. Понимая, что не все модели и методы из аппарата адаптивного прогнозирования нам понадобятся для построения комбинированных моделей, ограничим свое рассмотрение много факторными адаптивными моделями регрессии, которые будут ис пользованы в излагаемом здесь подходе. Читателю, у которого этот аппарат вызовет особый интерес, можно рекомендовать мо нографию профессора В. В. Давниса [13], в которой наиболее полно рассматриваются эти вопросы. Изложение начнем с крат кого обсуждения общих принципов построения адаптивных про гнозных моделей. Ситуации, в которых приходится прибегать к принципам адап тации при построении прогнозных моделей, обычно связаны с нестабильной динамикой моделируемых процессов. Отсутствие за кономерностей в изменениях динамики требует подходов, отлич ных от тех, которые используются при построении аналитических моделей. Если информация о закономерностях изменения дина мики моделируемых процессов отсутствует, то построение моде ли должно основываться на правдоподобных предположениях о возможном характере этих изменений. Скорее всего, самой про стой и достаточно естественной для моделирования социальноэкономических процессов является гипотеза, в основе которой лежит предположение о том, что в моделях, отражающих эти сложные закономерности, с течением времени происходит срав нительно медленное изменение структурных коэффициентов по 145
сравнению с изменениями самого процесса. Наиболее подходя щий инструмент для перемещения подобной идеи в практическую плоскость — метод экспоненциального сглаживания. Широкое применение в задачах краткосрочного прогнозирования метод экспоненциального сглаживания получил после выхода работ Р. Винтерса [70], Р. Брауна и Р. Майера [60], Р. Брауна [59]. В них было дано его обоснование для случая прогнозных моделей полиномиального типа. Чтобы понять взаимосвязь экспоненциаль ного сглаживания с адаптацией, рассмотрим пример модели, пред ставляющей собой полином нулевого порядка х,=а, +£,, (4.15) где xt — значение показателя, характеризующего уровень прогно зируемого процесса в момент времени Г, at — изменяющийся во времени параметр, характеризующий средний уровень прогнози руемого процесса в момент времени /; et — случайные независи мые отклонения фактических значений от текущего среднего, имеющие нулевое математическое ожидание и конечную диспер сию а2. В соответствии с этой моделью расчетная величина прогноз ного значения х[+1 считается равной оценке параметра а,, т.е. xt+l=ar
(4.16)
За оценку текущего значения параметра а, принимается экспо ненциальная средняя St, вычисляемая по рекуррентной формуле
S, = а х, + «(1 - а);с,_1 + а(1 - а)2 х^2 +••• = = axr +(l-a)[axl_l +a(l-a)x,_2
+•••] =
= ax,+(l-a)S,_i, (4.17) где Sf — значение экспоненциальной средней в момент г, а — па раметр сглаживания, 0 < а < 1. По сути, расчет прогнозной величины Jcr+1 задается рекуррент ной формулой (4.17), в которой при определении текущей средней применяется процедура "старения" данных по экспоненциальному закону, позволяющая построить прогнозную траекторию с домини рованием тенденции последнего периода. Причем степень этого преобладания регулируется параметром а. Чем ближе а к 1, тем меньше прогнозная оценка отличается от последнего наблюдения. Для социально-экономических процессов такая процедура хоро шо согласуется с интуитивным представлением о характере взаи146
мосвязи будущего их состояния с достигнутыми уровнями пред шествующих периодов и фактически является адаптивной. Чтобы выяснить идеи, положенные в основу адаптивного механизма рас сматриваемой модели, перепишем (4.17) в виде S, =St_l+a(xt-St_l). (4.18) Если 5 М рассматривать как величину прогнозного значения для момента /, то разность (х, — Shi) в выражении (4.18) представ ляет собой ошибку прогноза. Эта ошибка учитывается в качестве корректирующего слагаемого при расчете нового прогнозного зна чения x(+l -S,- Становится очевидным, что в вычислительной схеме экспоненциального среднего используется принцип регуля тора с обратной связью, что позволяет говорить об адаптивных свойствах модели (4.15) — (4.17). Многофакторные адаптивные модели. Принцип экспоненциаль ного сглаживания может успешно использоваться при построении многофакторных моделей, хотя детали конкретной реализации этих принципов имеют свои особенности, порождаемые много факторностью решаемых задач. Проблемы многофакторного адап тивного моделирования обсуждались в [7, 30, 35, 36]. Детальное изложение общей схемы такого моделирования, ориентированное на экономические приложения, можно найти в [13]. Основу этой схемы составляет рекуррентный метод наименьших квадратов (РМНК), в котором используется формула Шермана — Моррисона [41] рекуррентного обращения матриц (С + х х ) , = С 1
, • (4.19) хС х +1 Однако, к сожалению, несмотря на некоторые преимущества (например, значительное сокращение времени расчетов при изме нении объема выборки), РМНК не получил должного признания в эконометрических исследованиях. Реализация идеи экспоненциального сглаживания в задачах многофакторного моделирования сводится к введению весовой функции вида
f(t,j,a) = a ' Ч 0<сг<1,
(4.20)
где а — параметр сглаживания; / — номер последнего наблюде ния выборочной совокупности, используемой для построения модели; j — порядковый номер наблюдения выборочной совокуп ности, используемой для построения модели. 147
Введение весовой функции (4.20) позволяет записать экстре мальную задачу для получения вектора оценок В(?,а) регрессион ного уравнения j ; , =x,B(0 + e„ t = l,2,...,T, (4.21) в виде = Argmin ^а'~][у: - х.В(/,а)] 2 , У=1 (4.22) где yt — значение зависимой переменной (показателя) в момент г, х, = (хи, x2t, —,xmt) — w-мерная вектор-строка значений независи мых переменных (факторов) в момент t, B(0 = (bu, b2t, •••, bmt) — /и-мерный вектор-столбец оцениваемых коэффициентов модели, из меняющих с течением времени свои значения по неизвестному закону; ег — ненаблюдаемая случайная ошибка. Функционал этой задачи является экспоненциально взвешен ной суммой отклонений расчетных значений от фактических. Суть его минимизации в том, что модель с коэффициентами, полученными как результат решения задачи (4.22), в силу сме щения точности аппроксимации к наблюдениям с высокими весовыми коэффициентами позволяет учитывать при расчете про гнозных значений в основном только те тенденции, которые проявляются в последних наблюдениях. Последовательное реше ние задачи для каждого / е [Т{, 7], (Г, > т) позволяет полу чить регрессионное уравнение с изменяющимися коэффициента ми. Многократное использование МНК является весьма громозд ким и неэффективным. В подобной ситуации гораздо предпоч тительнее применение РМНК, предложенного в [30]. Фактичес ки рекуррентная схема служит основой для построения адаптив ного механизма регрессионной модели. Многофакторная регрес сионная модель вместе с ее адаптивным механизмом записыва ется следующим образом: в (Г,а)
&=x,B(f-l,a); B(r,«) = B ( r - l , « ) + г-1
а 148
(4.23)
С
;-'^ [у,-у,] х,СДх, +сс
_ *-r-l x , x r*-r-l
х,с,_!х +а
;
(4.24)
(4.25)
При заданных начальных значениях В(0, а), С^1 и известной величине параметра сглаживания а = а* модель (4.23)—(4.25) позволяет по мере поступления новых данных изменять коэффи циенты и с учетом этого изменения вести соответствующие рас четы прогнозных значений уг В [35] предложена многофакторная адаптивная модель j>, = x , B ( f - l , a ) ;
(4.26)
B(t,a) = В(? - La) + —-^[у, -x,B(f - l , a ) ]
(4.27)
в рекуррентной формуле (4.27) адаптивного механизма которой в качестве корректирующего слагаемого используется обычно приме няемый в адаптивной фильтрации градиент от прогнозной ошибки grad(;y,-x,B(f-l,a))2 = -2 x ;(v,-x,B(?-l,a)),
(4.28)
умноженный на константу к =а/2^х~(0<а < 2). В некоторых случаях эта модель обеспечивает более высокую точность прогноз ных расчетов, чем построенная на основе применения рекуррент ной схемы МНК модель (4.23)— (4.25). Однако ее статистическая обоснованность явно уступает модели, в адаптивном механизме которой используется РМНК. С целью повышения экстраполяционных свойств модели (4.23)— (4.25) в [13] были разработаны прогнозные модели с настраива емой структурой адаптивного механизма. Основное отличие этих моделей от рассмотренных выше в том, что структура их адаптив ного механизма заранее не фиксируется, а автоматически форми руется из заданного множества вариантов в процессе настройки параметров адаптации. В таком подходе фактически реализована возможность построения адаптивных моделей с оптимальной для рассматриваемого набора данных рекуррентной формулой пересчета. Оптимизационная задача, позволяющая реализовать идеи на страиваемой структуры адаптивного механизма, может быть запи сана следующим образом: В(/) = Argmin{(l -у-
P)itat-j[yj
- XjB(t))2 +
+ у£а'^[х,В(г-1)-х,.В(г)] 2 + У=1
149
fiYja'-i[xjMt-2)-2x]Mt-l)
+
+ xjB{t)f}
(429)
7=1
Первое слагаемое такого комбинированного критерия ориенти рует на получение оценок В(//) (здесь для упрощения записи по ложили, что В(/, а, у, Р)= В(?))> обеспечивающих максимально возможную точность аппроксимации. Второе слагаемое выполняет роль стабилизирующего члена, минимизация которого приводит к текущим оценкам B(t), мало отличающимся от предыдущих B(f-l)- Последнее слагаемое, как и второе, выполняет роль ста билизирующего члена, обеспечивающего сглаживание чрезмерных скачков реакций адаптивной модели в случае появления выброс ных наблюдений. Возможные значения параметра а в этом выражении остают ся в прежних границах 0 < а < 1, а значения параметров у и Р, определяющих долю участия каждого слагаемого в комбинирован ном критерии, удовлетворяют следующим неравенствам: у > О, Р> О, у + р< 1. Решение оптимизационной задачи (4.28) с использованием РМНК позволяет записать прогнозную модель с настраиваемой структурой адаптивного механизма в виде соотношений 5>, + T =x / + T B(f-l), r = 0 , 1 , 2 , . . . ;
(4.30)
6 ( 0 = B(t -1) + /3[6(f -1) - B(t - 2)] +
+ -^Нг—а-/"/*)!?,-?,]; £-1 _
а
^t-lXtXt^t-l
х,сДх^+а
(4.31) (4.32)
Структура рекуррентной формулы (4.31), с помощью которой осуществляется пересчет текущих значений коэффициентов адап тивной регрессии, зависит от граничных значений параметров у и р. Если ввести обозначения
*»>«*>= Л" 1 *', 150
;
(4-33)
et = yt-xtB(.t-l,a,Y), (4.34) то возможные варианты этой рекуррентной формулы удобно пред ставить в виде табл. 4.10. Т а б л и ц а 4.10 Варианты структуры адаптивного механизма Параметр ,3 = 0
0 < /К 1
у=0
0 <у < 1
в,=в, ,+
в,=в,_,+
+ АВ,(а)е,
+ (1-у)ДВ,(а) е ,
в,=в,_,+
в,=в,_,+
+ 0[В,_,-6,_ 2 ] + + /3[В,-1-В,_2] +
у =1
В, =В,_!
—
+ (l-(3)ABl(a)er + (1-у-)8)дВ,(аК
в,=в,_,+ /*=0
+ [ВМ-В_2]
—
—
Приведенная таблица убедительно демонстрирует расширение возможностей моделей с настраиваемой структурой адаптивного механизма по сравнению с обычными адаптивными и статическими моделями прогнозирования. Если данные таковы, что более точ ная экстраполяция получается с помощью статической модели, то в процессе настройки параметров получаем у = 1 и (5 = 0, т.е. адаптивная модель вырождается в обычную регрессионную (мы имеем дело с "нулевой адаптацией"). Если же результаты настрой ки приведут к значениям у = 0 и (5 = 0, то рекуррентная форму ла (4.31) принимает вид обычной адаптивной регрессии (4.24). Рассмотренные выше адаптивные многофакторные модели рег рессии принято называть одношаговыми, поскольку в этих моде лях корректировка текущих коэффициентов осуществляется толь ко по одному новому наблюдению. Для ситуаций, в которых появляются отдельные наблюдения с высокой долей случайной составляющей, эти модели подвержены "вибрации", когда слиш ком часто происходят разнонаправленные корректировки коэффи циентов модели, что естественным образом снижает надежность получаемых с ее помощью прогнозных оценок. Хотя эта пробле ма частично решается за счет применения моделей с настраива емой структурой адаптивного механизма, однако в случаях частого 151
появления новых наблюдений с высоким уровнем ошибок необ ходимо использовать другой класс моделей — многошаговых адап тивных. В этих моделях используется идея корректировки текущих ко эффициентов не по одному, а по нескольким наблюдениям одно временно. Принципы построения таких алгоритмов рассматрива лись в работах [1, 24, 42, 46], в которых основное внимание было уделено изучению отдельных статистических свойств и уско рению сходимости оценок, получаемых с помощью многошаговых алгоритмов. Вопросы применения многошаговых алгоритмов не посредственно для создания адаптивных моделей социально-эко номических процессов с расширенным диапазоном упреждающих расчетов обсуждались в работе [13]. Ключевой формулой в схеме многошагового рекуррентного оце нивания является формула Шермана — Моррисона — Вудбери [41] (С + Х'Х)"1 =С~ 1 -С' 1 Х'(ХС" 1 Х'+1)~'ХС-'.
(4.35)
Для случая, когда вектор поправок адаптивной модели опре деляется по группе из п наблюдений, экстремальная задача вычис ления оценок коэффициентов с использованием экспоненциаль но взвешенного квадратичного критерия записывается следующим образом: t-n
. п
B(t,a,n) = Argmin £ a'~"~J ЕЬу+jfc -Х/ + *В(7,а,л)] (4 36) j=o к=\ Использование рекуррентной формулы (4.35) позволяет запи сать многофакторную адаптивную модель в виде У„,=Х п г В(/-1,а,л);
(4.37)
B(t, а, п) = В(г -1, а, п) +
+ с;1ХЛХшС7-Х, +«inr1[Y„, -*„,]; с,"1 =^[сг_,1 -c;!XAX,ltc;-X,r
(4-38)
+ dLnrlxntc;ll], (4.39)
где 1л — единичная матрица порядка п; Ynt = (у,_п+{,..., у)' — «-мер ный вектор-столбец с последней компонентой, равной значению временного ряда в момент времени t, Хт — (« х т) — матрица, пос ледняя строка которой содержит значения независимых переменных в момент /, т.е. 152
Хл/ -
у-я+l
x
l,t-n+2
x
x
\,t
2,t-n+l 2,t-n+2
x
2,t
x
•••
mJ-n+l x
•••
m,t-n+2
•••
x
m,t
В этой модели в обозначении текущего коэффициента регрессии B(t,a,n) используется параметр я, чтобы подчеркнуть зависимость его значения от количества одновременно обрабатываемых на каж дом шаге наблюдений. Вариант модели с настраиваемой структурой многошагового адаптивного механизма выглядит следующим образом: Y,„ =Х„,Й(г-1);
(4.40)
В(0 - 6(г -1) + Р[В(г -1) - В(/ - 2)] + + (l-y- i 8)C7_ 1 1 x;,(X II/ C,-J 1 X' n ,+aIJ" , [Y (I ,-t n ,];
с;1 =-[c,-' 1 -c,-' 1 x;,(x„ ; c / -' 1 x;, /+ ai„)- 1 x,„c,-i 1 ].
(4.41) (4.42)
а Прогнозные расчеты с помощью описываемой модели требуют знания начальных значений B(-l), B(0), CQ1 И оптимальных па раметров а = а*, у = у", /? = /?*,« = «*. Изложенное позволяет сделать вывод о том, что адаптивные регрессионные модели являются гибким и достаточно эффектив ным аппаратом прогнозных расчетов. Однако этот аппарат в ос новном применим только для решения задач краткосрочного про гнозирования. Для нас интерес представляют не прогностические возможности этих моделей, а возможности их адаптивного меха низма перенастраивать модель с одной прогнозной траектории на другую. Именно это свойство потребуется при построении ком бинированной модели. 4.4. Имитационное моделирование на основе адаптивной схемы прогнозных расчетов Имитационные модели. Построение комбинированных моделей предполагает предварительное получение экспертных ва риантов развития прогнозируемого процесса. Естественно, в этих вариантах отражена субъективная точка зрения, и механизм ее 153
формирования не всегда понятен. И все же что бы ни отражали эти варианты, они должны иметь количественное выражение. Зная, что эксперты в числовых шкалах не работают, и руковод ствуясь намерением повысить надежность экспертных оценок, будем формировать для экспертного опроса альтернативные вари анты. В качестве инструмента для формирования этих вариантов будем использовать адаптивно-имитационную модель, которая, по сути, является также комбинированной. Описание данного инст румента начнем с имитационного моделирования. В основу имитационного моделирования положена понятная на интуитивном уровне и доступная для практической реализации идея подражания поведению моделируемого объекта, что делает его универсальным с позиций применения в различных областях человеческой деятельности. Эта универсальность, как показало изучение литературы [3, 4, 44, 56, 69], в которой исследуются вопросы имитационного моделирования, дает право на существо вание различных точек зрения на понятие "имитация". С позиции моделирования социально-экономических процессов наиболее точ ное, на наш взгляд, определение имитации как метода модели рования можно найти в [38, с. 232]. Там под имитационным моделированием понимается "процесс создания модели и ее экс периментальное применение для определения изменений реальной ситуации". Однако все авторы едины в одном — они рекомендуют исполь зовать аппарат имитационного моделирования при решении наи более сложных слабоструктурированных задач. Особо же эффек тивным, а в некоторых случаях, возможно, и единственным ме тодом исследований имитационное моделирование становится при изучении социально-экономических процессов. Прежде всего это связано с высоким уровнем сложности таких процессов и неопре деленностью условий, в которых они протекают, в силу чего для них, как правило, не удается получить удовлетворительное пред ставление с помощью моделей классического типа. Более того, проведение экспериментов на реальных объектах социально-эконо мической природы с целью получения необходимой информации, очевидно, невозможно ввиду существования потенциальной опас ности проявления негативных последствий. По этому поводу в [3] отмечается, что методы имитационного моделирования предостав ляют возможность широкомасштабного использования математи ческого аппарата и вычислительной техники для эксперименталь ного исследования динамики процессов в сложных системах, где 154
или затруднительно, или невозможно осуществлять прямой "на турный" эксперимент. Сама по себе имитация может осуществляться с разной степе нью детализации и с разным уровнем понимания характера ими тируемых процессов. Удачная, с нашей точки зрения, классифи кация имитационных моделей в зависимости от требования к урввню точности воспроизведения реальных процессов предложена в [11]. Там все математические модели, с помощью которых до стигается подражание в области законов, определяющих функци онирование реального объекта, отнесены к имитационным систе мам первого ранга. Модели, обеспечивающие подражание не только в области законов, но и случайных величин, считаются имитационными системами второго ранга. И, наконец, имита ционные системы третьего ранга позволяют осуществлять подра жание реальным объектам как в области поведения, так в обла сти законов и случайных величин. Наибольший интерес для нас представляют модели второго и третьего рангов, с помощью которых удается получать наиболее правдоподобные варианты траекторий поведения изучаемых соци ально-экономических процессов. В них предусматривается при менение метода Монте-Карло, авторами которого являются Дж. Нейман и С. Улам. Подробное изложение этого метода можно найти в работах [20, 50]. Точность подражания реальным процессам в значительной степени зависит от правильности вы бора используемых в имитационных моделях законов распределе ния случайных величин. Правильность выбора, в свою очередь, обусловлена точностью идентификации этих законов и соответ ствующих параметров. Идентификацию, как правило, проводят на основе статистического материала с помощью критерия согла сия. Таким образом, правдоподобность имитации зависит от двух составляющих: адекватности, с которой моделируются законы, характеризующие взаимосвязь процессов, и точности воспроизве дения случайных величин. Проблемы, возникающие в процессе имитации, как прави ло, напрямую связаны с модельным представлением этих со ставляющих. Если говорить о первой составляющей, то коротко суть проблемы в следующем. Обычно в имитационных моделях закономерности отражаются в виде формализованных соотноше ний и уравнений с неизменной во времени структурой, и все расчеты ведутся в предположении, что эта структура сохранится в будущем. На самом деле динамичность современных процес155
сов не подтверждает правильность таких предположений. Ско рость изменений так высока, что даже в краткосрочных прогно зах возникает необходимость в отражении структурной неста бильности. Аналогичные проблемы касаются и второй составляющей. Параметры распределений, используемых для получения псевдо случайных величин, как правило, находятся в постоянном дрей фе. Это обычное явление для процессов, не удовлетворяющих свойствам стационарности. Становится очевидным, что если эти проблемы оставить незамеченными при построении имитационной модели, то уровень подражания естественным образом снизится, сделав модель неправдоподобной, а следовательно, и не пригод ной для получения достоверных прогнозных оценок. В работах [13, 28] было предложено использовать в подобных ситуациях комбинирование адаптивного и имитационного подходов, один из вариантов которого описан ниже. Адаптивно-имитационные модели. Схема имитационных расче тов с использованием адаптивных моделей зависит от свойств самой адаптивной модели и специфики решаемой задачи. Поэто му каждый раз при построении адаптивно-имитационной моде ли возникает необходимость в ее уточнении применительно к конкретной ситуации. Обычно уточненную схему, обладающую, в отличие от общей, более детальным описанием, реализуют в виде программы для ПК и, таким образом, переходят от мате матической формы к машинному аналогу модели, с помощью которой и осуществляются имитационные эксперименты. В ка честве специфических особенностей, применительно к которым уточняется общая схема имитации прогнозных вариантов с помо щью адаптивной модели, выступают ее многошаговость и настраи ваемая структура. Имитационная модель, построенная на базе многофакторной с настраиваемой структурой многошагового адаптивного механизма, в [13] описывается с помощью приведенного ниже набора парамет ров, переменных и рекуррентных формул вычислительной схемы. Оцениваемые параметры: В'(0 = (bv,b2l,...,b ) — усредненное текущее значение вектора коэффициентов многофакторной адаптивной модели; В;(г) = Ф[,,Ь'2,,...,Ь'ш) — текущее значение вектора коэффициен тов, используемых для расчета отклика адаптивной модели в /-м эксперименте; 156
те, se — математическое ожидание и среднеквадратическое от клонение ошибки предсказания; т£, sE — математическое ожидание и среднеквадратическое от клонение ошибки аппроксимации. Настраиваемые параметры: а, у, р — параметры адаптивного механизма многофакторной модели (0< а< 1; 0 < у, /3 < 1; у+j8< 1); п — параметр, определяющий порядок многошаговости адап тивного механизма (п — целое). Случайные величины: ^н-1/ = (е/-л+2'е1-я+з> • • • i£t) — вектор ошибки аппроксима ции, характеризующий уровень рассогласованности модели с ре ально протекающим процессом на отрезке из (я—1) наблюдения; еп — случайная величина с известным законом распределения, имитирующая в i-u эксперименте ошибку предсказания адаптив ной модели в момент г, £ . — случайная величина с известным законом распределения, имитирующая в /-м эксперименте ошибку аппроксимации адаптив ной модели в момент /. Процедуры моделирования случайных величин: F — процедура моделирования псевдослучайных чисел, имити рующих ошибку предсказания; Y — процедура моделирования псевдослучайных чисел, имити рующих ошибку аппроксимации; Экзогенные переменные: х, = (хи,х2(,...,хт1)— вектор-строка значений независимых пе ременных в момент Г; Х-ш ~ (х/-л+1>х/-л+2>---.х,)'— матрица из вектор-строк независи мых переменных; Эндогенные переменные и величины: Ч'п-и = (Уг-п+2>Уг-п+э>—> yt) — вектор-столбец из (п~ 1) фак тического значения зависимой переменной; Х,-и = (&-„+2'.У/- п+ з'---'й) ~ вектор-столбец из ( я - 1 ) рас четного значения зависимой переменной; S't+u — вариант прогнозного значения зависимой переменной, полученный как результат /-го имитационного эксперимента; у { — прогнозное значение зависимой переменной, усреднен ное по серии из N имитационных экспериментов; 157
л'+Т'^г'+Г - соответственно нижняя и верхняя границы вариа ции прогнозных вариантов в момент t + 1; Л,+ 1— размах возможной вариации прогнозных вариантов в момент / + 1; Прочие обозначения: Р, — обратная матрица размера {пхп), используемая в вычис лительной схеме адаптивного механизма; С"1 — матрица, обратная матрице соответствующей системы нормальных уравнений. Вычислительная схема: %-и =Х„_ 1 ,В(Г);
(4.43)
Еп_и =Y„_U-%_и;
(4.44)
Ъ+и = F(me,se);
(4.45)
K+i=(K-u:-e,+uY->
(4-46)
P,=(Xn,+1CrX+i+air';
(4.47)
B,.(r + l) = B(0 + )8[B(0-B(?-l)] + + a-y-P)C;lXnt+lPtEin[; е,+и=хр(Щ>Зе); yt^=xl+lBi(t
+ l) + el+u;
y™"=minyl+uУ?+\ = m a x Уг+и; i
(4.49) (4.50) (451)
(4.52)
min.
/A C-J\
^, + i = У,+1 - y,+i .
(4-53)
yt+i~N~
(4.54)
n
158
(4.48)
max
EU+i<;
B(t + l) = N-l'ZBi(t
+ l).
C/+i = — [С, - С , X„,+1PfX/rf+1Cf ].
( 4.5 5)
(4.56)
Такая имитационная модель, построенная на основе много шаговой адаптивной с настраиваемой структурой, отличается, прежде всего, от обычной адаптивной принципом, в соответ ствии с которым рассчитываются коэффициенты модели и про гнозные значения. Здесь оценки коэффициентов модели вычис ляются для упреждающих, а не для текущих моментов времени. Это удается достичь за счет использования в вычислительной схеме имитируемой ошибки предсказания, что фактически пре вращает адаптивную модель с запаздывающей реакцией на про исходящие в моделируемом процессе изменения в модель с мгно венной реакцией. Кроме того, в модели частично сохранена обратная связь, что отражено в комбинированной структуре вектора рассогласованно сти Е , в котором ошибки аппроксимации являются величинами реального уровня рассогласования, а ошибка предсказания харак теризует имитируемую величину рассогласования. В целом, модель ориентирована на применение в задачах уп равления экономическими объектами, когда для разработки про гнозных решений необходимо выяснить допустимо возможные варианты развития изучаемых объектов. Из множества допустимо возможных формируются варианты для экспертного опроса. Это обеспечивает реальность эксперт ной траектории. Строгих предписаний относительно способа формирования нет. Смысл простейшего в том, чтобы в каче стве вариантов взять значения, равномерно распределенные между минимально и максимально возможными вариантами, полученными с помощью адаптивно-имитационной модели. Способ универсальный, однако в каждом конкретном случае в силу, как правило, имеющей место специфики могут потребо ваться особые приемы формирования экспертного варианта прогнозной траектории. Это и недостаток, и преимущество рассматриваемого нами подхода. Нельзя сохранить строгую формализацию, когда эксперты, по сути, являются элементом моделируемой системы. 159
4.5. Адаптивное моделирование переходных процессов в комбинированных прогнозах Комбинируя экстраполяционные и экспертные прог нозные оценки, мы полагаем, что доверие к этим оценкам раз ное и, более того, изменяется с изменением величины упрежде ния. Ключевой проблемой в реализации идеи такого комбиниро вания является задача моделирования переходных процессов. Вы полнение этой задачи должно быть устроено таким образом, что бы степень доверия комбинированным прогнозным оценкам оста валась на максимально возможном уровне. Разрешение этой про блемы прежде всего связано с формулировкой экстремальной за дачи, в функционале которой предусматривалась бы возможность построения адаптивного механизма, обеспечивающего получение комбинированной прогнозной траектории с требуемым свойством. Для реализации этой идеи положим, что в результате обработ ки исходных данных и дополнительных исследований мы имеем две последовательности прогнозных оценок {у.} и {у.}. Первая из них является итогом экстраполяционных расчетов и с течением времени степень доверия к ним снижается, а вторая — эксперт ного оценивания, к результатам которого степень доверия с уве личением глубины упреждения возрастает. Тогда экстремальную задачу, соответствующую этим предположениям, можно записать следующим образом: Ц) = Argmin £ A V ^ [ y . -х,.В(г)] 2 +
(4.57) 7=1
где А — параметр, регулирующий степень доверия комбинирован ному прогнозу в зависимости от глубины упреждения (0 < Я < 1); а — параметр экспоненциального сглаживания (0 < а < 1); х • = (l, X\j, %2 /'•••' xmj ) — вектор-строка значений факторов в момент времени j ; в(?) = (b0(t), b{(t),..., bm(t)) — вектор-столбец коэффициентов адаптивной модели. Первое слагаемое функционала задачи (4.57) представляет со бой дважды взвешенную сумму квадратов отклонений расчетных значений от данных экстраполяционной траектории. С помощью 160
параметра а в нем реализуется механизм затухающей памяти , касающийся старых тенденций, а с помощью параметра Я — ме ханизм, позволяющий постепенно с течением времени снижать долю "присутствия" экстраполяционной траектории в комбиниро ванной. Второе слагаемое устроено аналогично первому. В нем мини мизируются отклонения расчетных значений от данных экспертных ожиданий. Причем параметр Я служит для постепенного увеличе ния степени влияния экспертных оценок на тенденции, реализу емые в комбинированной траектории. Дифференцируя выражение в фигурных скобках (4.57) по В(?) и приравнивая результат к нулю, получаем систему из (т + 1)-го уравнения
-2XrV-^,-x 7 .B(r)]x' y 7=1
-2t(l-^)a^b7-x;B(r)]x;.=0.
(4.58)
7=1
Преобразуем систему, перенеся в правую часть те слагаемые, которые не содержат оцениваемых параметров
ta-JxfjXjB(t)=
ХА'сГ'*^. + t(l-А0сГ ; х'Д у
7=1
7=1
(4.59)
7=1
После перегруппировки систему (4.59) можно записать следу ющим образом:
£at-JxfyyJ+tl-A.J)yJl
ta'-V.x,.B(0= 7=1
(4.60)
7=1
Если ввести обозначения 1 Y,=
Уг У')
хп
Х
Ы
х
х,=
1
2п
*21
1 Хг1
(4.61) v
tm J
161
V-' L,=
0 0
о • - о] 2
a-
0
•
•
0
; л,=
'A 1 0
0
• •• a
0 A
2
•• •
- ••
0
(4.62) 0
0
• •• A ' 1
то в матричной форме система (4.60) перепишется в виде (X;L,X,)B(/)=X;L,[A,Y, + ( I - A , ) Y , ] • Ее решение можно представить как
(4-63)
B(t)=(X'lLtX[)-l{x'tLt[AtYt+(l-At)Yt]}.
(4.64)
Чтобы перейти к рекуррентной процедуре последовательного оценивания коэффициентов адаптивной рефессии, будем считать последнее наблюдение вновь поступившим и представим (4.64) в виде в(0=(ож;_1ьмх,_1+х;у,)г,х х{аХ;_ 1 Ь / _ 1 [л / _ 1 ¥ / _ 1 +(1-Л,_ 1 )¥ / _,]+х;[1' Л +^-А')? / ]}(4.65) Обозначим C^X^L^X,., (4.66) и, используя формулу рекуррентного обращения матриц Шермана — Мориссона, которая в нашем случае имеет вид
(с,_1 + х;х,Г = с г Л - ^ ^ -
х,сг>;+1'
перепишем (4.65) следующим образом:
в(/) =
1 ^,-1 _ 1 C / _iX / x / C f _ I
«
'-1
a
7 1
а
2
LXtc;W(+l
х {ay M L M k-iYM + (I - Л,-1 ft-J+ *& Ч + (l - A '),,]} (4-67) 162
Выполнив в (4.67) умножение и некоторую перегруппировку результатов перемножения, можем записать
в(/)=в (/ -1) + - c,-ilX; tyyt + (i - л' )yt} а
_l CrVix C,-i, ^ ; _ | L b | [ A [ _ | t b | t (I-A,_,)Y,_|].
(4.68)
После несложных преобразований получаем B(f) = B ( f - l ) + - C / - V f
x r C^ix', + а r'v'
\Xyt+(l-X')y]-
x,B(r-l)
/ ^ 7 — 1 / —1 ' ^
(4.69)
Приведение к общему знаменателю в квадратной скобке позво ляет записать (4.69) следующим образом:
B(r) = B(/-l) + х^ V х^ + ( l - A ' ) ^ ] Л-г-1 г
H v ' ' , fB(r-l). • ^ '• >£—*
r-i
(4.70)
Окончательная формула для рекуррентного вычисления коэф фициентов В(/) приобретает вид
B(t) = B(t-l)+^^{\Xyt Х
+
(l-X)yt]-XtB(t-l)}.
(4.71)
Л"7-1Х/
Начальные значения В(0) и CQ1 определяются по данным рет роспективного периода с помощью МНК. Оптимальное значение параметра сглаживания а подбирается с использованием пост прогнозных расчетов на контрольной выборке, в качестве кото рой, как правило, используются последние наблюдения ретрос пективного ряда. Задача подбора оптимального значения парамет163
pa Я не может быть решена по аналогии с параметром а, так как, в принципе, нельзя получить данные для сравнения с постпрогноз ными расчетами. Четких рекомендаций по его подбору нет. Од нако если предположить, что степень доверия экстраполяционным данным в начале упреждающего периода равна степени доверия рациональным ожиданиям в конце упреждающего периода, то значение параметра Я определяется из уравнения 1 — Ят = I, где т — длина периода упреждения. В тех случаях, когда абсолют ным доверием пользуется только одна из траекторий, Я принимает соответственно значения 0 или 1. Таким образом, в общем виде адаптивная модель для расчета комбинированной траектории выглядит следующим образом:
<4-72>
y,+i =*,«т £(r + i) = £(/)+ +
~~ГГ x
/+i^?
x
/+i
4+1
+
a
{ ( ^ ж + (l - А ' + 1 Ы - х,+1В(/)}; (4.73) Q-1
а
Ц Х
X
!+lXt+l^r
Г + 1*-Т
Х
/+1
(4.74)
+СС
Модель (4.72)—(4.74) можно применять для построения комби нированных прогнозных оценок в тех случаях, когда в качестве экспертной траектории используются непосредственно числовые значения, получившие в результате сравнения с другими возмож ными вариантами ожидаемых значений экспертное предпочтение. Если же считать, что в своих оценках эксперты руководствовались некой моделью и в комбинированном прогнозе следует учесть не значения, а тенденцию, в соответствии с которой эти значения были сформированы, то возникает проблема восстановления этой тенденции. Такая ситуация обычна для регрессионного анализа и при наличии достаточных информационных возможностей эксперт ные оценки аппроксимируются регрессионным уравнением yt=x,B,
t =lt,
(4.75)
которое используется при построении комбинированной модели. Модель, ориентированная на использование тенденций, в со ответствии с которыми формировались экспертные ожидания, естественно, должна отличаться от только что рассмотренной. Это 164
отличие касается, прежде всего, второго слагаемого ее квадра тичного функционала. Оно, по идее, должно представлять собой дважды взвешенную сумму квадратов отклонений расчетных зна чений от соответствующих значений, определяемых построенным уравнением регрессии (4.75), а саму экстремальную задачу мож но записать в виде В (/) = Argmin £ AJa'~j [у,- - х у В(/)] 2+
+
i(l-A;)a'-J[xjB-XjB(t)}2\.
(476)
При записи этого функционала использованы те же самые обозначения, что и в функционале (4.57), кроме вектора В , который представляет собой коэффициенты регрессионного урав нения (4.75). Дифференцирование (4.76) и проведение тех же самых преобра зований, что и в предыдущем случае, позволяет получить формулу для пересчета текущих коэффициентов регрессии следующего вида: B(f)=B(/-l)+A'—§Ц^—^-^(/-1)] + х,С г _]Х, + а
+М )
5
V
' МВ-В(?-1))].
(4.77)
X/C/.jX, +a
Полученная рекуррентная формула адаптивного механизма рег рессионной модели содержит два корректирующих слагаемых, первое из которых является реакцией модели на ошибку прогно зирования, а второе — реакцией на несовпадение текущих коэф фициентов с коэффициентами модели экспертных ожиданий. Адаптивная модель для этого случая имеет вид & + 1 =х, + 1 В(0; В(/ + 1) = В(/) + Xм
ffi+i x
t+v^t
+ (l - Я'+1)
ffi+'
x
t+[ +
(4-78) \ум - хмЩ] +
a
[х ж (В - В(0)];
( 4. 7 9)
165
1
-i-1
С" =
C~V x Г"1 (4.80)
Графическая иллюстрация результатов моделирования переход ного процесса, полученных с использованием выведенных здесь рекуррентных соотношений, представлена на рис. 4.1. У * 25
20
10
X
0
5
10
15
20
—— Траектория переходного процесса —•— Траектория 1
25 А
30
Траектория II
Рис. 4.1. Прогнозные траектории развития экономического процесса На графике легко выделяются четыре участка: ретроспективный и три прогнозных, характеризующих ожидаемые траектории раз вития экономического процесса. На первом из трех прогнозных абсолютным доверием пользуется экстраполяция, на втором — предпочтение отдается траектории, реализующей переходной про цесс, и, наконец, на третьем участке абсолютное доверие смеща ется к экспертным оценкам. Несмотря на то, что в основу построения моделей (4.72)— (4.74) и (4.78)—(4.80) положены одни и те же идеи, применяются они в разных ситуациях. Первая модель, как правило, используется в тех случаях, когда не удается получить формального представления о тенденциях эксперт ных ожиданий, а сами экспертные ожидания — не что иное, как количественные оценки прогнозируемого показателя, которым экс перты отдали свое предпочтение при сравнении с другими. Вторую модель рекомендуется использовать там, где, в прин ципе, количественные оценки могут даже отсутствовать, но у экспертов есть представление в виде некоторой закономерности, в соответствии с которой они формируют свои представления. 166
Чтобы убедиться в том, что эти модели действительно могут при водить к разным результатам при использовании одного и того же набора данных, проведем сравнительные расчеты на условном примере. Исходные данные, характеризующие динамику величи ны чистой прибыли и затратных факторов торговой компании ОАО "Ларец", представлены в табл. 4.11. Таблица Динамика показателей ОАО "Ларец" Период 1 2 3 4 5 6 7 8 9 10
Чистая прибыль, тыс. р. 488,23 451,42 510,41 553,23 548,93 568,88 412,29 576,93 708,64 602,91
Затраты на рекламу, тыс. р. 190,99 161,66 207,32 238,29 235,95 251,99 134,49 192,97 232,85 167,39
4.11
Затраты на хранение, тыс. р. 130,82 74,36 138,24 141,44 156,32 189,92 93,74 114,06 135,29 94,25
Первые семь наблюдений исходных данных были использованы для получения начальных значений адаптивной многофакторной регрессионной модели
в(о)=
^231,9220ч 1,3900 -0,0701
С0 =
4,3258 •0,0323 0,0180
-0,0323 0,0005 -0,0005
0,0180^ -0,0005 0,0006
По оставшимся трем наблюдениям с использованием постпрог нозных расчетов был настроен параметр адаптации а. Его опти мальное значение оказалось равным 0,01. Динамика коэффициен тов адаптивной регрессионной модели при а = 0,01 приведена в табл. 4.12. Коэффициенты адаптивной регрессии для t = 10 были приняты за начальные значения адаптивной модели переходных процессов, а само регрессионное уравнение использовалось для получения экстраполяционных прогнозных оценок. В качестве факторов при проведении этих расчетов были приняты плановые затраты на хранения и рекламу. Все эти величины приведены в табл. 4.13. 167
Т а б л и ц а 4.12 Динамика коэффициентов адаптивной многофакторной модели Параметры *о
*.
ъ,
Г=8 285,5876 2,8947 -2,3765
Время 1=9 174,0371 4,7260 -4,1878
/ = 10 285,3286 4,3583 -4,3743
Кроме того, в эту таблицу включены экспертные оценки I и II. Экспертные оценки I представляют собой обобщенные результа ты экспертного опроса относительно ожидаемого уровня чистой прибыли, а экспертные оценки II являются расчетными значени ями уравнения у = 266,1523 + 3,3577*, -1,8878* 2 , полученного как регрессия экспертных оценок на планируемые затраты. Т а б л и ц а 4.13 Исходные данные для построения адаптивной модели переходных процессов Период t =11 / = 12 t= 13 / = 14 / = 15
Ожидаемая чистая прибыль, тыс. р. Затраты на Затраты на рекламу, хранение, Экстраполяцион- Экспертные Экспертные тыс. р. тыс. р. оценки I ные оценки оценки II 204,93 698,23 712,77 127,92 618,91 198,56 102,51 648,30 722,89 739,35 786,67 234,71 131,56 660,78 805,89 796,44 211,71 119,57 751,30 684,99 236,74 133,57 732,83 813,99 808,91
Данные табл. 4.13 использовались в качестве исходных для расчета коэффициентов адаптивной модели переходных процессов, динамика которых представлена в табл. 4.14. В модели переход ных процессов с помощью дополнительного параметра у = 0,7 регулировался уровень реакции на ошибки прогнозирования. Фактически в табл. 4.14 представлены значения текущих коэф фициентов четырех моделей. Две первые применялись для расчета прогноза с начальным уровнем доверия экстраполяционным оцен кам Я = 0,6, а две последние — с уровнем доверия Я = 0,9. При каждом уровне доверия для получения комбинированной траекто рии использовались модель I (4.72)—(4.74) и модель II (4.78)—(4.80). 168
Т а б л и ц а 4.14 Динамика коэффициентов адаптивной модели переходных процессов Уровень доверия Модель Параметры *о
I
*•
*,
Я = 0,6 11
к *•
Ьг I Я = 0,9 11
К ь, К К ь, ь,
/ = 11 300,9379 3,1105 -2,3237 303,8024 2,8815 -1,9474 291,0117 3,9040 -3,6277 291,7254 3,8470 -3,5340
/ = 12 269,7979 3,6103 -2,8810 243,7292 3,8457 -3,0225 354,2388 2,8891 -2,4962 346,7635 2,9635 -2,5490
Время / = 13 180,7640 4,1225 -3,0046 135,9068 4,4660 -3,1722 392,0664 2,6715 -2,4437 462,4788 2,2978 -2,3884
1= 14 722,0867 -3,3627 6,2349 386,4274 1,0019 1,1038 749,0811 -2,2652 3,6500 736,6041 -1,4927 2,2905
1= 15 415,5484 -10,3667 21,1998 186,1166 -3,5749 10,8828 336,9973 -11,6807 23,7675 267,3906 -12,2135 25,1970
Окончательные результаты в виде четырех вариантов прогноз ных расчетов приведены в табл. 4.15. Т а б л и ц а 4.15 Результаты расчетов ожидаемой чистой прибыли, тыс. р. (модели I, II) Уровень доверия Я = 0,6 Я = 0,9
Модель I II I II
t= 11 641,12 645,19 627,00 628,01
/ = 12 691,33 697,50 672,02 673,91
Время / = 13 753,07 766,79 697,61 687,59
t= 14 755,68 730,52 705,96 694,46
/ = 15 793,01 793,41 746,35 741,53
Анализ результатов расчетов показывает, что от параметра уровня доверия в значительной степени зависят прогнозные оцен ки. Это различие легко обнаруживается на рис. 4.2, 4.3, отра жающих динамику ожидаемой чистой прибыли. При А = 0,6 про гнозные оценки переходных процессов достаточно быстро дости гают тенденции развития, предсказанной экспертами, в то вре мя как при А = 0,9 в комбинированной траектории продолжает доминировать экстраполяционная тенденция. Зависимость про гнозных оценок от А очевидна. В силу этого вопросу определе ния значения этого параметра следует уделять пристальное внима ние, тем более что формальных процедур его выбора нет. 169
Расчеты, полученные по первой и второй моделям, отличаются друг от друга незначительно. И все же между прогнозными тра екториями этих моделей есть различие, и есть объяснение этому различию. Суть его сводится к тому, что в экспертных оценках II учитывается возможное влияние факторов, а это равносильно использованию дополнительной информации, способствующей повышению их объективности. У, 900 800 700 600 500 400 300 200 100
0
10
12
- Комбинированная траектория I
- Комбинированная траектория II
- Экспертная траектория
- Экстраполяционвая траектория
16
Рис. 4.2. Динамика ожидаемой чистой прибыли (А = 0,6) У к 900 > 800700 600 500 400 300200 100 -
X
0
2
4
6
- Комбинированная траектория I - Экспертная траектория
10 12 14 Комбинированная траектория П А
Эксграполяционная траектория
Рис. 4.3. Динамика ожидаемой чистой прибыли (Я = 0,9) Обобщая результаты проведенного вычислительного экспери мента, следует сделать ряд выводов относительно возможности 170
использования разработанных в этом параграфе моделей для по строения комбинированных прогнозных траекторий. Во-первых, с помощью введенного в эти модели параметра Я, регулирующего степень доверия, удается достаточно эффективно управлять процессом комбинирования инерционных тенденций и тенденций экспертных ожиданий. В то же время специфическая роль этого параметра и отсутствие объективной информации, позволяющей оптимизировать выбор Я, оставляет вопрос о его определении в субъективной плоскости. Во-вторых, несмотря на то, что обе разработанные модели дают практически одни и те же прогнозные оценки, однако ус ловия их применения различны. Первая модель (4.72)—(4.74) используется в тех ситуациях, когда удается получить экспертные оценки непосредственно в количественном виде. В отличие от первой, вторая модель (4.78)—(4.80) позволяет проводить расчеты тогда, когда исследователь располагает не количественными оцен ками, а некой параметрической моделью рациональных ожиданий относительно тенденций изменения прогнозируемого показателя. Обычно эта модель представляет собой регрессионную зависи мость, отражающую отличные от ретроспективного периода зако номерности развития моделируемого процесса. В-третьих, адаптивность разработанных моделей позволяет эффективно реализовать процедуру получения прогнозных оценок для тех перспективных периодов, в которых ожидается смена тен денций.
ГЛАВА
5 КОМБИНИРОВАННЫЕ ПРОГНОЗЫ М Н О Г О М Е Р Н Ы Х ПРОЦЕССОВ
В практике принятия прогнозных решений, как пра вило, приходится иметь дело с многомерными временными ряда ми. Причем стандартной является ситуация, когда число наблю дений столь мало, что идея построения эконометрических моде лей многомерных временных рядов в виде систем одновременных уравнений или векторной авторегрессии теряет всякий смысл. По этому возникает необходимость построения моделей, основанных на несколько иных принципах, чем эконометрические. Взамен предположений о характере динамики для рассматри ваемого случая выдвигается гипотеза о характере структурного вза имодействия экономических показателей, которое можно описы вать косвенными темпами приростов, представляющими собой от ношения приростов каждого из рассматриваемых показателей ко всем остальным. Основная идея этой гипотезы в том, что на про тяжении достаточно длительного периода времени структура кос венных темпов приростов прогнозируемых показателей может ос таваться почти неизменной [14]. Неизменность — это как раз то свойство структуры, которое переносится из настоящего в буду щее. Модели, обеспечивающие такой перенос в различных усло виях принятия решений, описаны ниже. Причем описание начи нается с простейших вариантов этой модели, которые постепен но усложняются с целью повышения адекватности отражения многомерной динамики. 5.1. Модель с детерминированным матричным предиктором Детерминированный матричный предиктор имеет смысл строить в тех ситуациях, когда возможность применения статистических методов моделирования полностью исключена. Примером может служить ситуация, в которой исследователь рас полагает всего двумя, тремя наблюдениями. Чтобы перейти к 172
формальному описанию модели с таким предиктором, введем обозначения: xtj — величина /-го показателя в момент времени /; хг_и — величина /-го показателя в момент времени (—1; Axti — величина изменения (прироста) /-го показателя. Далее естественно предположить, что любое изменение произ вольного /-го показателя зависит от величины остальных показа телей. Это может быть функциональная или регрессионная зави симость Axti = F(x„, xa, ... , хт). Будем рассматривать случай, когда малый объем ретроспективных данных не позволяет реали зовать известные методы идентификации этой зависимости. Един ственно доступной альтернативой идентификации в подобной ситуации является подход, основанный на значительном упроще нии этой зависимости. В качестве такой упрощенной формы удобно использовать линейное представление приростов. Сразу заметим, что модель, построенная по двум наблюдениям, не может претендовать на применение для расчетов, распространя емых за рамки, очерченные краткосрочными прогнозами. Поэто му при рассмотрении краткосрочных периодов такое упрощение не приводит к значительному росту ошибки прогнозирования даже в том случае, когда истинная зависимость явно нелинейная. Модель этой простейшей (линейной) зависимости строится в предположении, что прирост любого из показателей формируется под воздействием всех остальных, являясь как бы суммарной ве личиной, причем каждый показатель в отдельности оказывает не значительное влияние, и среди них нет доминирующих. Для ре ализации этого предположения вводится в рассмотрение харак теристика, устанавливающая степень влияния j-ro показателя на изменения, происходящие в /-м. В качестве такой характерис тики, как отмечалось выше, удобно использовать косвенный темп прироста
Если условиться, что на формирование прироста все показате ли оказывают равномерное воздействие, то, разделив vtJ на (и—1), получим ту долю в приросте /-го показателя, которая сформирована под воздействием у-го. Использование введенной меры степени влияния у'-го показателя на /-й позволяет выразить прирост Axtj через сумму произведений 173
A*/* =
~^va П-1
(5.2)
V
j*i
Учитывая, что Axrj = xtj— xt_u, можно величину любого /-го показателя представить в виде суммы предшествующего значения xx_Vl и прироста Axtj (5.2): *«• = х,-\, +
Ъvuxv'
1 = 1, и.
(5.3)
Для полученной системы уравнений (5.3), введя обозначения Хц */2
V=
1
О
"12
"1л
"21
О
"2л
(5.4)
/1-1 v
v
О
«l «2 m можно использовать компактную матричную запись V
v
х
x,_,+Vx,.
(5.5)
Считая, что неизвестным вектором в этой системе является х,, запишем его следующим образом: х, = ( I - V ) - ' x , _ 1 ,
(5.6)
где через I обозначена единичная матрица. Обратную матрицу (I—V)""1 будем называть матричным предик тором. Он определяет переход из состояния, описываемого век тором значений предшествующего момента времени, в состояние, представленное вектором значений текущего момента времени. Внедиагональные элементы обратной матрицы интерпретируются как косвенные темпы роста равномерно распределенных частей прогнозируемых показателей, а диагональные — как прямые тем пы роста оставшейся части. В предположении, что матричный предиктор перспективно го периода почти не отличается от матричного мультипликатора текущего периода, выражение (5.6) позволяет рассчитывать прогнозные оценки. Основное преимущество данного подхода заключается в том, что с его помощью можно проводить рас четы для многомерных рядов динамики даже в том случае, когда исследователь располагает наблюдениями лишь за два 174
периода. Правда, статистическая надежность таких прогнозных расчетов не проверяется и опирается, в основном, на то обсто ятельство, что даже при изменении характера динамики про гнозируемых процессов структура самого предиктора, как пра вило, изменяется незначительно. Как показывает практика прогнозных расчетов, применение этой модели предпочтитель нее обычных расчетов с использованием темпов роста, в кото рых совсем не учитывается взаимодействие между моделируемы ми показателями. Рассмотренная модель является базовой, и ее прикладные воз можности весьма ограничены. Она предназначена, главным об разом, для того, чтобы продемонстрировать принципы построе ния матричного мультипликатора, которые ниже будут использо ваны для построения более сложных модификаций модели. Про иллюстрируем эти принципы условным числовым примером, ис ходные данные для которого представлены в табл. 5.1. Т а б л и ц а 5.1 Динамика основных показателей, характеризующих деятельность ОА О "Консультант ", тыс. р. Период
1 2 3 4 5
Объем оказанных услуг
Фонд оплаты труда
Затраты на переобучение, повы шение квалификации персонала
3231,44
872,48
242,35
3755,52
951,01
271,02
4426,22
1036,61
298,62
5362,63
1129,89
331,45
6430,77
1171,58
347,93
Построение модели начинается с расчета приростов:
Ах1
^524,08Л 78,53 28,67
J
которые используются для формирования матрицы косвенных тем пов прироста f
0 0,2755 0,9669Л 0,0105 0 0,1449 0,0038 0,0151
0 175
На основе этой матрицы вычисляется предиктор '1,0069 0,2928 1,0160Л A 2 = ( l - V 2 ) ~ ' = 0,0111 1,0054 0,1564 0,0040 0,0163 1,0062 помощью которого рассчитываются прогнозные оценки х3 - А2х2
^4335,36^ - 1040,27 303,25
Проведенные расчеты не только иллюстрируют алгоритм по строения базовой модели, но и предназначены для того, чтобы оценить ее точность, поскольку сами, по сути, являются пост прогнозными оценками. Кроме того, представляет интерес срав нение (см. табл. 5.2) этих результатов с оценками, полученны ми с помощью модификаций базовой модели, к описанию кото рых мы и переходим. 5.2. Модель с настраиваемым параметром матричного предиктора Решающим фактором выбора модели с подобным пре диктором является не число наблюдений, а, скорее, ситуация, когда за рамками системы показателей, для которых строится мат ричный предиктор, остались факторы, оказывающие заметное влияние на их динамику. Природа этих факторов либо не изуче на, либо такова, что не поддается количественному измерению, и поэтому факторы не могут быть включены в модель. Но их влияние проявляется в динамике показателей, включенных в мо дель. Уловить это влияние можно, если прирост каждого показа теля разделить на две части, одна из которых формируется меха низмом, явно учитываемым моделью, а вторая — "скрытыми" факторами. В соответствии с этим делением представим прирост в виде суммы двух составляющих Axri =Д'х,+Д*х„-.
(5.7)
где Ыхп — та часть прироста, которая формируется "скрытыми" факторами"; A"xtj — та часть прироста, которая формируется про порционально факторам, включенным в модель. 176
Поскольку влияние "скрытых" факторов в соответствии с на шим предположением проявляется непосредственно в динамике самих показателей, то и отразить это влияние можно через соб ственные темпы той части прироста, которая формируется "скры тыми" факторами, т.е. /
А'*,,-
V;; = '
(5.8)
Коэффициенты косвенных темпов прироста в этом случае бу дем называть частными и вычислять по второй составляющей прироста:
А /г (5.9) о Сложение диагональной матрицы прямых темпов прироста V
U
V' =
=
х
О
О
"22
о (5.10)
о
о
пп J
элементы которой вычислены по формуле (5.8), и матрицы кос венных темпов прироста V" с элементами (5.9) ^0 ft
V2I
V12 ft
о
v
2n
(5.11) V„l
0
V„ 2
приводит к матрице темпов прироста 1
v = v'+-^-v', л-1
(5.12)
с помощью которой можно записать x,=(I-V)
-1,
»,-!'
(5.13)
где (I—V) ' — матрица роста с элементами, представляющими со бой частные коэффициенты роста. 177
Существенным в формировании матрицы роста в рассматри ваемом подходе является вопрос о соотношении, в котором на ходятся две составляющие прироста. Дать абсолютно четкие ре комендации по этому поводу весьма трудно. Единственно пра вильный выход, на наш взгляд, заключается в том, чтобы вве сти в модель настраиваемый параметр, через который можно оп ределять величину этого соотношения. Такая возможность пре доставляется тогда, когда в наборе данных содержится более двух наблюдений и часть из них (хотя бы одно наблюдение) можно использовать в качестве контрольной выборки для настройки параметра. Введение такого параметра позволяет каждую из составляющих прироста любого /-го показателя представить в виде А'*,., = fihxu;
A% =(1-ц)Ах„,
(5.14)
где 0 < jU < 1.
Если в формулах (5.8) и (5.9) используются составляющие при роста (5.14), то матрица темпов приростов V зависит от настраи ваемого параметра /л, и модель (5.13) можно переписать в виде x^d-VGu))-'*,.,.
(5.15)
У этой модели полностью сохраняются свойства, касающиеся точности аппроксимации, и одновременно повышается точность экстраполяции. Настройку параметра ц можно осуществлять таким образом, чтобы минимизировать выражение Х(ц) = max|x,+1/ -xt+u\,
(5.16)
представляющее собой максимальную величину разности между компонентами контрольного наблюдения х,+1 и вектора прогноз ных оценок х1+1=(1-Х(ц)Г1хг
(5.17)
В тех случаях, когда прогнозируемые показатели сильно отли чаются масштабом измерения, критерий в виде разности (5.16) теряет свою целесообразность. Его можно заменить относительной величиной ошибки Ъ\ц) = max ' 178
l x
\ t+u\
-—-—:—1.
(5 18)
Используя набор данных табл. 5.1 и некоторые результаты пре дыдущего примера, проиллюстрируем порядок построения вышеиз ложенной модели. Для удобства расчетов, проводимых в матричной форме, вве дем в рассмотрение матрицу М, элементы которой определяют ся настраиваемым параметром ц, и матрицу весовых коэффици ентов W: А
М*
0,1 0,9 0,9 Л 0,9 ОД 0,9 0,9 0,9 0,1
1 0,5 0,5 W = 0,5 1 0,5 0,5 0,5 1
Затем рассчитаем комбинированную матрицу прямых и косвенных темпов прироста: '0,1395 0,5511 1,9337N V,=V 2 ' + V ' = 0,0209 0,0826 0,2898 0,0076 0,0301 0,1058 v ) Применяя операции блочного умножения (*) и обращения мат риц, получаем предиктор (1,0200 0,2678 0,9323Л A 2 ( / i ) = ( l - M * W * V 2 ) 4 = 0,0102 1,0128 0,1424 0,0037 0,0148 1,0159 с помощью которого рассчитываем постпрогнозные оценки и от носительные ошибки < 2,00 ^
^ 4337,82^ х 3 = А , (/i)x 2 = 1039,95 303,24
$х? у
-0,32 1,55
Настройка параметра по критерию минимизации максимальной относительной ошибки позволила установить оптимальное значе ние параметра /л* = 0,9, при котором предиктор
A2(fi*)=k-M* *W*\2У
(1,1437 = 0,0013 0,0005
0,0342 1,0804 0,0018
0,1228 0,0174 1,1053
дает прогнозные оценки с соответствующими относительными ошибками 179
х
>("*) 2 =
4361,13 1037,03 303,11
f
1,47 ^
5x-i = -0,04
-1,50
Сравним результаты прогнозирования по базовой модели и модели с настраиваемым параметром. Сопоставление корректно проводить по постпрогнозным расчетам четвертого наблюдения, которое не использовалось при построении моделей. Для удобства результаты прогнозирования сведем в табл. 5.2. Таблица Сопоставление результатов прогнозирования Показатели Объем оказанных услуг Фонд оплаты труда Затраты на переобу чение, повышение квалификации персонала
5.2
Модельс параметром Базовая модель Фактическое Прогнозная Прогнозная значение, Ошибка, оценка, Ошибка, оценка, тыс. р. % % тыс. р. тыс. р. 5362,63
5063,81
5,57
5134,55
4,25
1129,89
1138,10
-0,73
1130,86
-0,09
331,45
335,10
-1,10
334,09
-0,80
Анализ табл. 5.2 позволяет сделать, по крайней мере, два вывода. Во-первых, модели с матричным мультипликатором по зволяют получать прогнозные оценки достаточно высокой точно сти. Во-вторых, модель с настраиваемым параметром, как и предусматривалось замыслом ее построения, приводит к результа там, которые по точности выше получаемых по базовой. В тех случаях, когда прогнозные расчеты не дают удовлетво рительных результатов и причиной тому является отсутствие ста ционарности временных рядов, следует предварительно преобра зовать исходные данные ряда, как это принято в авторегрессион ных моделях, в конечные разности и только затем строить мо дель, итоговый вариант которой будет иметь вид (5.19) Этот прием можно распространить и на случай, когда для до стижения стационарности потребуется переход к конечным разно стям более высокого порядка. V+1
180
= х, + (1-УГДх_,.
5.3. Модель с адаптивным матричным предиктором Идеи, лежащие в основе построения адаптивного пре диктора, по сути, ничем не отличаются от тех, которые изложе ны в предыдущей главе, хотя детали имеют свою специфику. Чтобы понять эту специфику, опишем не только модель, но и процедуру ее построения. Особенность такой модели заключается в том, что ее матрич ный предиктор строится в два этапа. На первом этапе определя ется начальное приближение, а на втором — организуется про цесс обучения мультипликатора в виде рекуррентной процедуры постпрогнозных расчетов. С этой целью выборочное множество наблюдений делится на две части. Пусть & (0 > 2) первых наблю дений используются для нахождения начальных значений. Кроме того, в рассмотрение вводится матрица, определяющая соотноше ние прямых и косвенных темпов приростов
(
м
(1-м)
М=
(1-м) • • (1-м)
• • (1-м)
м
,(1-м) 0-м)
(5.20)
М
и матрица весовых коэффициентов ИЛ.
w,.
W
ИЛ,
W
(5.21) W
1
W.я 2
J
определяемая либо по соответствующим коэффициентам корреля ции, либо с помощью экспертного оценивания, либо в соответ ствии с некоторой гипотезой (например, значимость равномерно распределена по показателям). При заданном начальном значении мультипликатора А,, на строенных параметрах ц* и а* и известной матрице W адаптив ная модель записывается следующим образом: Ч+\
Atxt;
(5.22) 181
л/+1 _ Xl+ij
Xt_Hi
', j = ln;
(5.23)
;
(5.24)
At+l=(l-M^W*\t+l)~l
(5.25)
A /+1 = a"Kt + (l -a*)A,+,A,.
(5.26)
V
~
X
t+lj
vt+l =
Л/ + 1
С помощью формулы (5.23) рассчитываются элементы матри цы корректирующих темпов прироста Yt+l, которая использует ся для построения корректирующего мультипликатора (5.25). Если в качестве А ж взять произведение корректирующего и текущего мультипликаторов А, + 1 А Г то расчетное значение х,+1 в точнос ти совпадет с фактическим значением вектора показателей х,+1. Однако учитывая, что основное назначение мультипликатора А ж — прогноз на период / + 2, его значение комбинируется из А, и A f+1 A r , причем параметр а, с помощью которого осуществляет ся комбинирование, является настраиваемым по критерию мини мизации, например, суммарной прогнозной ошибки. Модель (5.22)—(5.26) записана в предположении, что началь ное значение мультипликатора А, и оптимальные значения пара метров ц* и а* известны, а сами процедуры их получения не описывались ранее, поэтому логично привести их алгоритмичес кое описание. Процедура построения начального приближения: 1. Расчет текущих значений прямых и косвенных темпов при роста показателей ,' _ V
V~
X
ii
~
x
X
i-\i
' i , 7 = l , я, / = 1,0.
(5.27)
2. Определение геометрических средних значений прямых и косвенных темпов прироста показателей за период / (5.28)
182
3. Формирование матрицы средних темпов прироста показате лей за период 0 V
e=|KI
(5-29)
4. Построение начального приближения мультипликатора для t = Q
A, = ( l - M * W * V , ) _ 1 . (5.30) Процедура настройки параметров: 1. Определение шага изменения настраиваемых параметров h h = S, где 8 — достаточно малое положительное число. 2. Присвоение начальных значений параметрам ц* = 0 ; а* = 0; ц = -8 «критерию
z(u*,a*)=Q,
где Q — достаточно большое положительное число. 3. Изменение текущего значения fi JJ. = ц + 8 и проверка на выполнение неравенства /л > 1. Если неравенство выполняется, то настройка параметров заверша ется. 4. Присвоение начального значения параметру а а = -8. 5. Изменение текущего значения а а=а +8 и проверка на выполнение неравенства а > 1. Если неравенство выполняется, то выполняется п.З. 6. Установка счетчика t = k- 1 .
7. Присвоение начального значения критерию Z(n, а) = 0. 8. Изменение счетчика t =t +1 и его проверка: если t > Т, то выполняется п. 16. 9. Вычисление постпрогнозной оценки Х
<+1
_
^(Хг-
183
10. Расчет критерия Z,+1(jU,a)=maxjx,+1, - xl+h[ 11. Определение суммарного критерия по всему периоду обу чения Zip., a)= Z(/i, a)+Zt+1(fi, a). 12. Вычисление корректирующих темпов прироста X
t+lj
13. Формирование матрицы корректирующих темпов прироста ll"'+i|| \П Г 14. Построение корректирующего мультипликатора
V,+1
=
A, +1 = (l-M* *W*V, +1 )~\ 15. Определение текущего мультипликатора для момента вре мени ?+1 А, + 1 =а*А, + ( L - « * ) A , + 1 A , и переход на п.8. 16. Сравнение текущего значения критерия с его текущим оптимальным значением: если Z([i, a)
оценку и находим ошибки, которые принимаются за корректиру ющие отклонения ' 65,0858 ^ - 0,4209 - 4,4856
Дх3 = х 3 - А 2 (и*)х-
По этим отклонениям строим корректирующий мультипликатор 1,0134 0,0032 0,9996 А 3 = (l-M* *W*V 3 )~' = 0,0000 -0,0001 -0,0002
0,0109Л - 0,0001 0,9867 ;
и при начальном значении А = 0,1 получаем текущее значение адаптивного мультипликатора ("1,1575 0,0378 0,135 О A 3 ( U * , A ) = A A 2 ( U * ) + ( 1 - A ) A 3 A 2 ( U * ) = 0,0013 1,0800 0,0174 0,0004 0,0016 1,0920 параметр которого А настраивается по относительной ошибке ' 2,98Л 5х 4 = -0,05 0,55 постпрогнозной оценки четвертого наблюдения Х4 = А 3 (и*,я)х 3
/"5203,04Л 1130,45 329,63
Так как оптимальное А* оказалось равным начальному значе нию, т.е. А* = 0,1, то и окончательное значение мультипликатора не меняется, т.е. A3(/i*, A*) = А3(^*, А). Расчеты прогнозных оценок для пятого периода дают следу ющие результаты: 6294,93 х5 = А3(/и*,А*)х4 = 1232,97 366,03
( 5х,
2,10 -5,24 -5,20 185
Необходимо отметить, что если адаптивное свойство не улуч шает прогностическую точность модели, то параметр Я в резуль тате настройки принимает значение, равное единице, и адаптив ная модель вырождается в статическую. В рассмотренной процедуре реализована только схема коррек тировки по ошибке предсказания. Выбор именно этой схемы в основном связан с ограниченным объемом выборочных данных, используемых для построения адаптивной модели. Применение адаптивных принципов при попытке осуществления прогнозных расчетов на основе коротких временных рядов, безусловно, имеет смысл. Однако в тех случаях, когда все же существует некоторая история прогнозируемого процесса, желательно чтобы вся инфор мация с учетом распределения ее значимости была учтена при построении прогнозных оценок. В связи с этим замечанием име ет смысл в адаптивном механизме модели использовать принцип экспоненциального старения данных. Применяя те же самые обозначения, экспоненциально взве шенный матричный предиктор может быть записан следующим образом: х, = (1-а)А,х,_, +а(1-а)А 2 х,_ 2 +--- + а / , ч А / , х , _ р ,
(5.31)
где А^ — матричный предиктор, построенный по отклонениям наблюдений х, и хгк, причем для любого к имеем х, =Акх,_к.
(5.32)
Другими словами, предиктор А^ реализует расчет по средним за к периодов темпам роста. Таким образом, темп роста, задаваемый предиктором, складывается из средних темпов роста за р, р — 1, ..., 2, 1 периодов. Весовые коэффициенты каждой составляющей результирующего темпа роста распределены по экспоненциальному закону с затуханием от темпа роста, определенного по двум пос ледним наблюдениям, до усредненного по всем наблюдениям. Параметр экспоненциального сглаживания а настраивается подбором по постпрогнозным ошибкам, точно так же, как это делалось в предыдущей модели. Сохраняется и принцип адаптив ной корректировки. По вновь поступившему наблюдению строит ся матрица (5.25), с помощью которой корректируется текущий предиктор. Формально это выглядит следующим образом: 186
х, = /}[(1-а)А,х,_, + а(1-а)А 2 х,_ 2 +-- + ар [Apxt_p] + + (1-/3)А, +1 [(1-а)А,х,_, + а(1-а)А 2 х,_ 2 + --- + а р ~ 1 А р х,_ р ].(5.зз) В тех ситуациях, когда позволяют данные, рекомендуется строить модель с адаптивным механизмом экспоненциального ста рения данных, так как с ее помощью удается получить более на дежные оценки. 5.4. Матричная модель с разделенными переменными В целом, числовые примеры показали практическую реализуемость моделей с настраиваемым параметром и адаптивным мультипликатором. Разработанными моделями не исчерпываются все возможности, заложенные в принципы построения мультипли катора. Приоткрыть эти возможности позволяет модель с разде ленными переменными, представляющая собой еще одну специ фическую модификацию базовой модели. По сути, она похожа на модель многофакторного регрессион ного анализа. Ее переменные разбиты на две группы. Перемен ные первой группы будем называть целевыми, а второй — ресурс ными. Целевые переменные представляют собой показатели, ха рактеризующие результаты функционирования экономического объекта, а ресурсные — потенциальные возможности этого же объекта. Считая, что все показатели упорядочены таким образом, что вначале стоят целевые переменные, вектор которых обозначим через х,1; а в конце — ресурсные х й , запишем базовую модель (5.6) в виде v (х > (х > \ 12 (х + Ml = JL ^21 Уг2у V Х*о ) \ ,z) Выполнив умножение, получаем две системы уравнений Х Х
/1
=
Х
/2
=
X
г-11
+
*11 Х П
М2 Х Г2>
(5.35)
r-12
+
*21X,! +V22X,2.
(5.36)
+
Проведя перегруппировку, имеем х
п ~ »и х (1 = х г-п + * 1 2 х, 2 ; х/2 — V 22 x /2 = х,_12 + \21х-гГ
(5.37) (5.38) 187
Решая каждую из этих систем, получаем х„ =(I-V 11 )" 1 (x f _„ + V l 2 x , 2 ) ;
(5.39)
х, 2 =(I-V 2 2 )" 1 (x,_ 1 2 +V 2 1 x f l ).
(5.40)
Первое уравнение определяет значения целевых переменных через запаздывающие значения этих же переменных и ресурсные переменные, а второе — значения ресурсных переменных через их лаговые значения и целевые переменные. С помощью этой модели решаются как бы две взаимодвой ственные задачи. Смысл первой из них в том, что при известных значениях ресурсных показателей определяются значения целевых показателей, т.е. (5.39), по сути, является своеобразным вектор ным аналогом уравнения множественной регрессии. С помощью второго уравнения решается обратная задача: по заданным значе ниям целевых показателей определяются значения ресурсных, обеспечивающих достижение целевых. Следует отметить, что воз можность решения обратной задачи выгодно отличает эту модель от моделей регрессионного анализа, так как расширяет сферу ее прикладного использования. На основе этого математического аппарата можно построить методику, позволяющую сформировать допустимые варианты плана, и тем самым проиллюстрировать возможность переноса идеи альтернативности стратегического выбора в практическую плоскость. Используя все те же данные табл. 5.1 для построения модели с разделенными переменными, положим, что объем оказанных услуг х, и фонд оплаты труда х2 являются целевыми показателя ми, а затраты на переобучение и повышение квалификации пер сонала х3— ресурсными. В соответствии с таким разделением пе ременных матрицу косвенных темпов прироста V2 разобьем на четыре части, из которых для дальнейших расчетов потребуются только две: V„ =
О
0,2755
0,0105
0
0,9669 0,1449
Получив обратную матрицу
Au=(l-Vuyl
(1,0029 0,2763^ 0,0105 1,0029
рассчитаем прогнозные оценки для третьего периода *з = (А'З i >-*32) в зависимости от ожидаемых в этом же периоде затрат на пере обучение и повышение квалификации персонала: М330,68' х 3 - А и |х 2 + V12x33 J — 1039,55 С помощью этой модели можно изучать динамику прогнозных оценок в зависимости от изменения плановых затрат перспектив ного периода. Для случая, когда по заданным значениям целевых показате лей х3' требуется определить уровень ресурсных х 3 , обеспечива ющих достижение заданных значений целевых, модель выглядит следующим образом: x32 = (l-V 2 2 )-'(x2 + V 2 1 x 3 ). Так как в рассматриваемом примере (I-V 22 )=l, то расчеты упрощаются и искомое значение ресурсного показателя равно х\ = 271,02 + (0,0038 0,0151)
'4426,22Л = 303,54. 1036,61
Расчеты показали, что, действительно, с достаточно большой точностью можно решать как прямую задачу по определению зна чений целевых показателей по ресурсным, так и обратную — рас чет уровня ресурсного показателя, требуемого для достижения заданных значений целевых. В разработанной модели с разделенными переменными ис пользуется мультипликатор базовой модели (5.6). Естественно, аналогичная модель может быть получена и с адаптивным матрич ным мультипликатором. Однако мы опускаем отдельное рассмот рение подобной модели, так как ее построение не вызывает осо бых затруднений, если руководствоваться принципами, заложен ными в (5.22)—(5.26). 5.5. Вычислительная схема комбинированных прогнозных расчетов для многомерных процессов Идеи, на основе которых была построена модель пе реходных процессов, позволяющая комбинировать в прогнозных оценках фактографическую и экспертную информацию, могут практически без изменений использоваться при решении задач 189
многомерного прогнозирования. Поэтому логичным продолжением развития идеи комбинированного прогнозирования является созда ние комбинированных моделей для многомерных процессов. Ос новой построения таких моделей может служить адаптивный мат ричный предиктор, различные варианты которого разработаны в предыдущих параграфах настоящей главы. Ниже приводится до статочно подробное алгоритмическое описание построения одно го из вариантов подобной модели. I. Набор данных, имеющихся на момент построения модели 1. Динамика показателей: хи
х12
•••
Х
-^22
'''
X
'"
2\
X
il
l2
х1п, Х
2п'
Х
нГ
2. Ожидаемые темпы роста показателей: вариант 1: qn
qt2
•••
вариант 2 : q\
q]2
••• q]n\
m: q't" q"2
••• q'"x.
вариант
qm;
II. Обозначения 1. Константы: N — число имитационных экспериментов; п — число моделируемых переменных; М — число экспертов; т — число альтернативных вариантов; т — число прогнозных периодов; в — число наблюдений для построения начального значения предиктора; / — число наблюдений, используемых для построения прогноз ной модели. 2. Оцениваемые параметры и величины: Q* — диагональная матрица, диагональными элементами ко торой являются ожидаемые темпы роста показателей по k-му ва рианту (к = 1, т); 190
dp s. — математическое ожидание и среднеквадратическая ошибка случайной величины, характеризующей изменения абсо лютных приростов /-го показателя (г = 1, /г); d, s — математическое ожидание и среднеквадратическая ошибка случайной величины, характеризующей ожидаемые значе ния элементов весовой матрицы W; W — матрица весовых коэффициентов w., характеризующих вклад j-ro показателя в прирост /'-го, имеющая вид 1 W =
XV21
Пп
1 В некоторых случаях, когда число прогнозируемых переменных невелико, элементы матрицы W могут быть настраиваемыми. В имитационных экспериментах элементы матрицы W форми руются случайным образом. 3. Настраиваемые параметры: а — параметр адаптации, регулирующий в предикторе соотно шение старых и новых тенденций; а* — оптимальное значение параметра а; ц — параметр, регулирующий комбинирование прямых и кос венных темпов прироста. В предикторе используется матрица М, элементы которой зависят от ц: XVл 2
1-И М=
1-/л 1-/л
1-М 1-М
\-ц
М* — матрица М с оптимальным значением параметра /и*; к — параметр, регулирующий вклад в прогнозную траекторию экстраполяционных тенденций и экспертных ожиданий. В блоч ном предикторе используется диагональная матрица с элементами, зависящими от X: Л О о 2 Л О о Л,
о о
Лг 191
[Л 0
0 • •• 0" Л • • 0
,0
0 •
; АТ =
• к
!лт 0
0 т
• ••
0
я • ••
0
^0
0
•
• ят
4. Случайные величины: й/у — элемент /-й строки y'-го столбца матрицы w v , форми руемый датчиком случайных чисел в V-M имитационном экспери менте; W" — матрица весовых коэффициентов, сформированная из имитируемых датчиком случайных чисел элементов wjj; 5,v+/, — прогнозная ошибка /-го показателя в периоде t+l, ими тируемая датчиком случайных чисел в V-M эксперименте; v,+/,y — элемент /-й строки y'-го столбца матрицы V v , рассчи тываемый по имитируемой случайной ошибке 8^+и в V-M экспе рименте для периода t+l; V" — комбинированная матрица прямых и косвенных темпов прироста, сформированная по имитируемым прогнозным ошиб кам в v-м эксперименте; A v — корректирующая матрица в v-ом имитационном экспе рименте; А^+. — блочный предиктор для расчета вектора прогнозных оценок по всем упреждающим периодам в V-M имитационном экс перименте; Х)'+. — вектор прогнозных оценок для всех упреждающих пе риодов, полученных в v-ом имитационном эксперименте. 5. Процедура моделирования случайной величины: F — процедура моделирования псевдослучайных чисел, имити рующих элементы весовой матрицы; Т — процедура моделирования псевдослучайных чисел, имити рующих прогнозные ошибки. 6. Процедура экспертного оценивания: Е — процедура интерактивного экспертного оценивания веро ятности реализации того или иного прогнозного варианта. 7. Результаты экспертного оценивания: ~Рн-и ~ вероятностная оценка, полученная от r-го эксперта, относительно реальности А:-го варианта /-го показателя для момен та времени / + /; "p,k+li — групповая экспертная оценка относительно реальности k-ro варианта /-го показателя для момента времени t+l; 192
x
t+n ~ усредненное по групповым экспертным оценкам значе ние /-го показателя для момента времени / + /; ~х,+и — наиболее вероятное значение /-го показателя для мо мента времени по результатам экспертного опроса. 8. Моделируемые переменные и величины: x,i — значение /-го показателя в момент времени /; х н — расчетное значение /-го показателя в момент времени /; x t+u ~ расчетное значение /-го показателя по к-му варианту в момент времени / + / (с целью упрощения алгоритма для каж дого / задается фиктивный вариант х,'"!1, принимающий макси мально возможное значение); X, =(хп, х,2, •••, х,„) — вектор-столбец из значений моделиру емых показателей в момент времени t, х, — вектор расчетных значений моделируемых показателей для момента времени t, X, =(х,,х,,...,х,) — вектор-столбец с компонентами из одина ковых вектор-столбцов хг; X =(х+1, x, + ,,...,x, +r ) ~~ вектор-столбец с компонентами из вектор-столбцов прогнозных значений моделируемых показателей; Х^+. =(х^+|,х^+2,...,х^+г) — вектор-столбец значений комбини рованной прогнозной траектории для моментов времени / + 1, / + 2,
•••'r Zт; Mt+u — индикаторная переменная, принимающая значение О или 1 в зависимости от результата сравнения полученной величи ны /-го показателя в v-м эксперименте для периода / + 1 с соот ветствующим к-м вариантом; Ае — начальное значение предиктора; Ve — начальное значение комбинированной матрицы прямых и косвенных темпов прироста; V,+. — корректирующая матрица прямых и косвенных темпов прироста для моментов времени t + \, t + 2, , t + г, Vt+uj ~ элемент /-й строки у'-го столбца матрицы V,+., опре деляемый по отклонениям постпрогнозных расчетов от фактичес ких значений для периода / + 1; Z(a, /л) — критерий настройки параметров адаптации а и fi. А^ + . _ скорректированное на прогнозные ошибки значение предиктора для моментов времени в + 1, в + 2, ..., в + г, 193
A r + . — корректирующая матрица для моментов времени t + 1, Г +2,..., t + г, А , + . — предиктор для моментов времени / + 1, / + 2, ..., t+ г, рк и — вероятность реальности значения /-го показателя по к-му варианту в момент времени t + 1; А ? + . — предиктор комбинированной модели для моментов вре мени t + 1, t + 2, ..., t + т . III. Вычислительная схема 1. Расчет альтернативных вариантов: ( S-J
\
(глк
хк
Q,
о
О
О
Q*Q*
О
V х Л
k = l,m.
(5.41)
Qk \х>; 2. Построение начального значения предиктора: О
••• Qk
0
ч>; 0-1
Д*/ =
v
y
,
/ = 1, п;
(5.42)
i, j = l,n;
(5.43) (5.44)
v0 = Ae = ( l - M * W * V e )-l
(5.45) 3. Настройка параметров предиктора по постпрогнозным расче там: fх
\
(к О
J+2
О
О Vx, >
2
А
е
(5.46) О _ хе+« )+/;/
-*•'е+к
%+/i 194
О
,
Ag j ухв ;
/, j = 1, п,
I = 1, т ;
(5.47)
ve+.=
(5.48)
e+lij\
A0+. = ( l - M * W * V 0 + . ) - 1 ;
A-£+.=a*Ae+.+(l-a%+.A
(5.49) (5.50)
e+.
- A ad
A
(5.51) (5.52)
X 0+ . - A 0+# X 0 ; Z(a, fi) = max -%+//
-^fl+Zi
v
a
/ = 1, n,
/ = 1, т;
(5.53)
e+«
= Argmin Z(a, /i);
(5.54)
v^ , V, + .=
'f+fty
(5.55) (5.56)
A, + . = a*A 0 + . + (l - a* )&, + .A e+ .
(5.57) (5.58)
4. Имитационные расчеты: (5.59) (5.60) 1, если i = j ;
Щ
w-j / w\, если i * j ;
(5.61)
ГУ
-V
(5.62) (5.63) 195
't+li
~v V,t+lij
i, j = l,n, Vv =
I = 1, т ;
(5.64) (5.65)
/+///•
(5.66)
AV=&-M**WV,*VV)"1;
Al.=a*A„.+(l-a*)kvAt+.;
(5.67) (5.68)
X;+. = A,+.X,, J0, если х^+1 < xt+l, •
к
„ -v
^
k+\
k = l,m',
(5.69)
[l, если x,+l < x,+i < *, + i ,
#,; = ЛГ1 £й# й
(5.70)
v=\
5. Экспертное оценивание
P = E(X, 1
(5.71)
P); M
~k 1 v ~kr Pt+u = 7 7 L, Л + ~
_ Д ~*
(5.72)
.*
(5.73)
2-iPr+uxt+ii;
-*?+//
(5.74) 6. Расчет значений комбинированной прогнозной траектории ш (5.75)
Хг+. = А,+.Х,, _
x
t+li
~~
"/+/// */ +//
x
i+li
'
V;+.=
i, j = l,n,
l = 1, т ;
-f+/
(5.76) (5.77) (5.78)
A, c + . = Л А Г + . + (I - Л ) А , + . А , + # ; 196
(5.79)
Х г с + .=А, С + .Х Г
(5.80)
IV. Описание вычислительной схемы модели Вычислительная схема модели представляет собой систему ин формационно связанных между собой расчетных блоков. В пер вом из них осуществляется расчет альтернативных вариантов мо делируемых показателей в соответствии с ожидаемыми темпами роста этих показателей, задаваемых матрицей со специально уст роенной блочной структурой диагонали. В следующем блоке оп ределяется начальное значение предиктора по средним темпам прироста каждого показателя. Для этого используется известная схема построения комбинированной матрицы прямых и косвенных темпов прироста. Для удобства в расчетную формулу предиктора введена операция блочного умножения. Далее с помощью полученного начального значения строится блочный предиктор, позволяющий осуществлять прогнозные рас четы сразу на несколько периодов. Путем последовательных кор ректировок и одновременного соответствующего подбора парамет ров адаптации он трансформируется в текущий предиктор с оп тимальными параметрами. Текущий предиктор используется в блоке имитационных расче тов, в котором с помощью датчика случайных чисел получают матрицу весовых коэффициентов и комбинированную матрицу прямых и косвенных темпов прироста. Полученные матрицы ис пользуются для построения корректирующей матрицы, которая, в свою очередь, применяется для корректировки текущего предик тора. Скорректированный предиктор, по сути, является случай ным оператором, имитирующим одну из возможных многомерных траекторий развития моделируемых процессов. Многократное об ращение к датчикам случайных чисел позволяет воссоздать доста точно полную картину будущего. Сравнение имитируемых вари антов с альтернативными обеспечивает построение вероятностного распределения, характеризующего степень реальности альтернатив ных вариантов. Именно это вероятностное распределение и явля ется основным результатом комплекса расчетов этого блока, ко торый затем подлежит экспертному оцениванию. В целом, блок экспертного оценивания предназначен для формирования оценок, отражающих экспертное представление о будущей динамике моделируемых показателей. Ориентиром экс пертных ожиданий является эмпирическое вероятностное распре197
деление, полученное в четвертом блоке. Строгих формальных правил получения экспертных ожиданий моделью не предусматри вается. Возможен, например, интерактивный режим формирова ния экспертных оценок. Последний блок вычислительной схемы реализует главный за мысел модели — комбинирование на принципах адаптации экстраполяционных оценок и экспертных ожиданий. Ниже приводятся результаты вычислительного эксперимента, иллюстрирующие весь комплекс расчетов, предусмотренных этой моделью. В расчетах использовались фактические данные, харак теризующие экономическое развитие Воронежской области. С целью упрощения для более легкого восприятия логики расчетов в соответствии с вычислительной схемой комбинированной моде ли прогнозирования многомерных процессов из всех макроэконо мических показателей были выбраны только три — валовой регио нальный продукт (ВРП), продукция промышленности и продук ция сельского хозяйства, динамика которых приведена в табл. 5.3. Для проведения расчетов были сформированы три альтернатив ных варианта возможного развития Воронежской области в бли жайшие два года (2003—2004 гг.). Учитывая, что исходные дан ные содержат инфляционную составляющую (вариант I — 14 %, вариант II — 15 %, вариант III — 16 %), в эти варианты были внесены поправки на ожидаемые уровни инфляции. При разра ботке вариантов для упрощения расчетов принято допущение, что темпы роста и темпы инфляции остаются неизменными на про тяжении 2003—2004 гг. В табл. 5.4 представлены данные о трех вариантах возможной динамики макроэкономических показателей. Т а б л и ц а 5.3 Основные макроэкономические показатели экономического развития Воронежской области (1995-1997 гг. - млрд р., 1998-2002 гг. - млн р.) Годы
Валовой региональный продукт
1 1995 1996 1997 1998 1999
2 14 547,90 20 158,30 23393,10 24075,00 40 710,10
198
Продукция промышленности сельского хозяйства 4 3 4118,80 9598,00 5731,00 12 909,00 6902,70 15 384,70 6783,80 14 653,30 15 500,00 24 237,10
Окончание 2 52 100,40 63 866,90 75284,00
1 2000 2001 2002
3 33151,50 41 623,90 51 573,10
т а б л . 5.3 4 18 247,20 22 300,20 25443,70
Т а б л и ц а 5.4 Альтернативные варианты экономического развития Воронежской области Валовой региональный продукт № Годы варианта Значение, Темп млн р. роста, % 118,0 I 88 827,59 90 997,28 119,4 2003 11 III 89 909,29 120,9 I 104 807,68 139,2 109 990,23 142,6 2004 II 107 375,81 146,1 III
Продукция промышленности сельского хозяйства Значение, Темп Значение, Темп млн р. роста, % млн р. роста, % 60 439,55 117.2 117,4 29 875,99 119,0 62 277,61 30 400,13 118,5 61 354,02 120,8 30 138,06 119,5 70 830,31 137,3 35080,39 137,9 141,5 75203,95 36 322,08 140,3 145,8 72 989,90 35698,54 142,8
Динамические ряды исходных данных были разделены на две части: первые пять наблюдений были использованы для построе ния начального значения адаптивного матричного предиктора, а три последних — для его обучения (настройки параметра адапта ции) по постпрогнозным расчетам. В рамках процедуры постро ения начального значения рассчитывались средние приросты (5.42) показателей за 1995—1999 гг., которые использовались при фор мировании комбинированной матрицы прямых и косвенных тем пов прироста (5.43)—(5.44) '0,1607 0,2699 0,4220^ Vfl = 0,0899 0,1510 0,2361 0,0699 0,1174 0,1836
М
1 0,3 0,7 '0,15 0,85 0,85^ 0,85 0,15 0,85 W = 0,7 1 0,3 0,85 0,85 0,15 0,7 0,3 1
С помощью этих матриц было получено начальное значение предиктора (5.45) 199
0,0478 0,0776 0,2616 0,0570 1,0371 0,0750 0,0442 0,0335 1,0509 Так как прогнозные значения рассчитываются на два упрежда ющих периода, то был построен блочный мультипликатор (5.46) '1,0478 0,0776 0,2616 0,0570 1,0371 0,0750 0,0442 0,0335 1,0509 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 1,1139 0,1705 0,5549 0,1221 1,0826 0,1715 0,0948 0,0734 1,1185
для которого в процессе обучения настраивались параметры /л и а. За два шага постпрогнозных расчетов по критерию минимизации максимальной относительной прогнозной ошибки были получены оптимальные значения параметров /л* = 0,20, а* = 0,15 и настро енный по этим параметрам матричный предиктор 0,0182 ^ 0,0097 < 1,0565 0,0883 0,2815 0,0073 0,0141 0,0678 1,0557 0,1035 0,0106 0,0267 0,0430 0,0317 1,0472 -0,0012 -0,0016 -0,0029 0,0074 0,0110 0,0197 1,1220 0,1805 0,5726 0,0216 0,0311 0,0576 1,1445 1,1165 0,2274 -0,0068-0,0096-0,0182 0,0874 0,0641 1,0967 с помощью которого были рассчитаны прогнозные оценки мак роэкономических показателей на 2003—2004 гг. г
•Л, , . —
92771,64 Л 64383,77 31280,51 109973,80 78944,99 36319,26
Настроенный предиктор и прогнозные оценки использовались в 700 имитационных экспериментах, в результате которых были 200
получены оценки вероятностей возможной реализации каждого из рассматриваемых альтернативных вариантов. Обработанные ими тационные расчеты были сведены в табл. 5.5. Т а б л и ц а 5.5 Экстраполяционные прогнозные оценки, требующие экспертного уточ Валовой № Значе ва ние / продукт, млн р. ри Вероят Расчетная Оценка анта ность оценка эксперта Значе 88 827,59 ние I Вероят 0,10 ность Значе 89 909,29 ние 2003 II Вероят 0,10 ность Значе 90 997,28 ние III Вероят 0,67 ность Значе 104 807,68 ние I Вероят 0,16 ность Значе 107 375,81 ние 2004 II Вероят 0,17 ность Значе 109 990,23 ние III Вероят 0,57 ность
Продукция, млн р. промышленности сельского хозяйства Расчетная Оценка Расчетная Оценка оценка эксперта оценка эксперта 60 439,55
29 875,99
0,09
0,01
61 354,02
30 138,06
0,11
0,07
62 277,61
30 400,13
0,80
0,73
70 830,31
35080,39
0,04
0,13
72 989,90
35698,54
0,11
0,20
75203,95
36 322,08
0,84
0,36
В левой колонке каждого показателя этой таблицы приведены значения по вариантам и оценки вероятностей возможной реали зации соответствующих вариантов. Правая колонка заполняется экспертами. Причем экспертам разрешается, ориентируясь на соб ственное видение ситуации, изменять либо только вероятностные оценки, либо пытаться предсказать и значения, и их вероятнос ти. В случае компьютерной реализации процедуры экспертного оценивания следует предусмотреть интерактивный режим функци онирования этой модели. 201
В проводимом вычислительном эксперименте приняли участие 7 экспертов. Результаты обработки экспертной информации све дены в табл. 5.6 и 5.7 по периодам. Т а б л и ц а 5.6 Результаты обработки экспертной информации (2003 г.) Валовой Эксперт
1 2 3 4 5 6 7 Групповая оценка
продукт, млн р. усреднен наиболее ный вероятный 76 267,29 76 422,90 72 059,00 71 927,43 73628,82 73 725,62 80 978,07 80 918,36 78 704,37 79 167,63 90 323,67 90 997,28 78 930,46 79 120,17
Продукция, млн р. промышленности наиболее вероятная 53991,53 55218,61 57 059,24 52 150,91 54 605,07 59 163,73 58 540,96
усреднен ная 53855,93 55320,09 56 941,44 53047,18 54 639,34 58 717,20 57 952,14
сельского усреднен ная 27 100,67 25961,56 29 792,58 30 093,51 26 939,18 26 177,92 26 660,92
78 698,81 78897,05 55 781,90 55 818,58 27532,33
хозяйства наиболее вероятная 27 124,26 25 918,73 29 836,68 30 138,06 27 784,67 25 315,97 25 536,11 27379,21
Т а б л и ц а 5.7 Результаты обработки экспертной информации (2004 г.) Валовой Эксперт
1 2 3 4 5 6 7 Групповая оценка
Продукция, млн р. промышленности
сельского хозяйства
продукт, млн р. усреднен наиболее ный вероятный 94 385,86 94490,71 93699,16 93416,95 97 295,54 97 711,98 91 564,23 91 269,43 96 686,29 97 891,30 119 400,47 109 990,23 98 341,52 98 785,74
усреднен ная 64 778,50 66 813,04 68 250,74 62 594,96 66 115,74 71 879,30 70 020,72
наиболее вероятная 64 961,01 66 420,81 68 610,50 62 771,31 65690,91 72 947,84 71 443,76
98 767,58 97650,91
67207,57
67549,45 33 220,75 33309,87
усреднен ная 32 872,58 31 525,31 35606,46 34 912,93 32 588,54 34 546,57 30 492,89
наиболее вероятная 32 842,65 31414,71 35 698,54 34 984,56 32 485,67 34 869,20 30 873,77
Групповые экспертные оценки в качестве экспертных ожиданий использовались для перенастройки адаптивного предиктора на 202
режим комбинированного прогнозирования. Перенастройка осу ществлялась с помощью диагональной матрицы, значения элемен тов которой определялись параметром Я. В расчетах этот параметр был принят равным 0,08, т.е.
Л=
,80 0 0 0 0 0 0 0,80 0 0 0 0 0 0 0 0 0,80 0 0 0 0 0,64 0 0 0 0 0 0 0,64 0 0 0 0 0 0 0,64 )
Таким образом, предиктор для расчета комбинированной тра ектории (5.79) с тенденцией усредненной точки зрения экспертов выглядел следующим образом:
,cl
/"1,0307 0,0330 0,0170 0,0492 0,0406 0,0130
0,0754 1,0374 0,0273 0,0787 0,0651 0,0208
0,1408 0,0981 1,0303 0,1409 0,1163 0,0373
0,0202 0,0171 0,0060 1,0590 0,0623 0,0321
0,0315 0,0266 0,0092 0,1437 1,0683 0,0510
0,0577Л 0,0487 0,0172 0,2726 0,1854 1,0561
а с тенденцией наиболее вероятных значений среди ожидаемых f
,с2
1,0308 0,0756 0,1410 0,0202 0,0316 0,0580Л 0,0330 1,0374 0,0981 0,0170 0,0266 0,0488 0,0170 0,0482 0,0409 0,0131
0,0271 0,0773 0,0656 0,0209
1,0301 0,0059 0,0091 0,0170 0,1380 1,0582 0,1425 0,2703 0,1171 0,0625 1,0687 0,1862 0,0375 0,0322 0,0511 1,0563
С помощью этих предикторов были получены следующие ком бинированные прогнозные траектории (5.80):
203
^89717,81 N 62382,09 62374,81 30231,16 30261,59 гс2 X cl 105022,27 ' 105421,56 74000,95 73878,70 34955,79 34923,93 ) Комбинированные траектории X,cj. и Х,с+. существенно отлича ются от экстраполяционной траектории Х, +# : темпы роста последней значительно выше. На наш взгляд, это связано с тем, что эксперты в своих ожиданиях ориентировались на снижение темпов роста ин фляции, в то время как в экстраполяционных прогнозах нашли свое отражение темпы инфляции последних периодов. В этом отличии и заключается суть комбинированного прогнозирования, позволя ющего в прогнозных оценках учесть те тенденции, которые еще не успели проявиться в экономической действительности. 8УО/ЙДЭ
5.6. Многоуровневое комбинированное прогнозирование основных показателей социально-экономического развития региона Разработанные в предыдущих параграфах схемы много мерных прогнозных расчетов вполне применимы для решения реаль ных задач достаточно большого размера. К классу подобных задач следует отнести, прежде всего, разработку прогнозов социальноэкономического развития региона. Число разнообразных показате лей, ожидаемые значения которых необходимо рассчитать при реше нии этой задачи, столь велико, что попытка построения единой прогнозной модели, отражающей взаимодействие между всеми этими показателями, вряд ли окажется успешной. На наш взгляд, в по добной ситуации целесообразнее использовать многоэтапную схему проведения многоуровневых прогнозных расчетов. В рамках такой схемы удается сгруппировать показатели по какому-либо признаку (сектор экономики, отрасль, источник доходов и т.д.), что позво ляет значительно снизить размерность решаемой задачи посредством сведения ее к последовательности задач меньших размеров. Каждая так определенная группа характеризуется соответству ющим агрегированным показателем, являющимся, как правило, суммой всех показателей, включенных в группу. Из практики 204
прогнозных расчетов известно, что динамика агрегированных по казателей менее подвержена случайным колебаниям, и, следова тельно, их прогнозные оценки являются более надежными, чем прогнозные оценки дезагрегированных показателей. Эти рассуждения приводят к выводу, определяющему последо вательность расчетов "сверху вниз", т.е. вначале получают прогноз ные оценки агрегированных показателей, которые затем использу ются для получения прогнозных оценок показателей 1-го уровня дезагрегирования, используемые, в свою очередь, для получения прогнозных оценок показателей 2-го уровня дезагрегирования, и т.д. Прогнозные расчеты социально-экономического развития Во ронежской области проводились в соответствии со структуризаци ей показателей, представленной в приложении 1. Такой подход обеспечивает более высокую точность прогнозных расчетов и, кроме того, позволяет учесть структурную взаимосвязь между моделиру емыми показателями, а также всю априорную информацию, извест ную к моменту начала процесса прогнозирования. Необходимые для построения моделей и проведения прогноз ных расчетов количественные значения показателей представлены в приложении 2. Общая схема разработки прогноза развития региона, учитыва ющая общую концепцию и все изложенные в этом параграфе обстоятельства, изображена на рис. 5.1. В ней отражено совме стное действие правовой, методической, математической и ин формационной составляющих разработки прогноза агрегированных показателей, генерирующего последовательно уточняющийся про цесс обоснования социально-экономической политики региона. Для формализованного описания многоуровневой системы рас четов введем следующие обозначения: X = (х', X2, , X'") ~~ вектор-столбец значений агрегирован ных показателей в момент времени /; т — число агрегированных показателей; X.'=\Х'1 X'2 X""', X' ) ~~~ вектор-столбец значений показа телей 1-го уровня дезагрегирования /-го агрегированного показа теля (/ = 1,т), причем последняя компонента ITlj
представляет собой величину соответствующего агрегированного показателя; 205
о ON
Обоснование социально-экономической политики региона
Информация Рис. 5.1. Общая схема разработки прогнозов социально-экономического развития региона
от,— число показателей 1-го уровня дезагрегирования /-го аг регированного показателя; , X'J' =(xijl X'j2,..., X'1"'', Х у ) — вектор-столбец значений по казателей 2-го уровня дезагрегирования у-го показателя, дезагре гированного на 1-м уровне (/ = 1, т, j = l,m-), причем последняя компонента '"; ...
представляет собой величину соответствующего показателя преды дущего уровня; от — число показателей 2-го уровня дезагрегирования /-го по казателя, дезагрегированного на 1-м уровне. Используя введенные обозначения, запишем многоуровневую модель с матричным мулыпипшкатором для прогнозирования основ ных показателей социально-экономического развития региона в следующем виде: Х,+, = ( I - V ) - % ;
(5.81)
x;+1 = (i-v,'ir(xi+v;2xj+1);
(5.82)
Х^4-^Г(Х?+^Х^),
(5.83)
где V — матрица косвенных темпов прироста прогнозируемых по казателей; "V Vp — соответствующие блоки матрицы косвенных темпов прироста показателей /-Й группы 1-го уровня дезагрегиро вания; V,"p V^ — соответствующие блоки матрицы косвенных тем пов прироста показателей у'-й группы 2-го уровня дезагрегирования /-го показателя предыдущего уровня; X — вектор прогнозных оценок агрегированных показателей; XJ+I — вектор прогнозных оце нок показателей /-Й группы 1-го уровня дезагрегирования; XJ'+I — вектор прогнозных оценок показателей у'-й группы 2-го уровня дез агрегирования i-ro показателя предыдущего уровня. С помощью модели (5.81)—(5.83) удается решить несколько проблем, возникающих в практических расчетах. Во-первых, как ранее неоднократно упоминалось, она повышает надежность про гнозов, осуществляемых по коротким временным рядам. Во-вто рых, она обеспечивает взаимосвязь между прогнозными оценка ми, получаемыми на разных уровнях. Причем механизм этой взаимосвязи устроен таким образом, что в расчетах каждого 207
последующего уровня в качестве ограничивающих условий (ресурс ных показателей) используются прогнозные оценки, полученные на предыдущем уровне. Это гарантирует некую сбалансирован ность темпов роста агрегированных и дезагрегированных показате лей. В-третьих, расчеты по рассматриваемой модели легко моди фицируются, обеспечивая более точную подгонку матричного пре диктора к фактическим данным, а значит — и более точные прогнозные оценки. Вопросы модификации расчетов, несмотря на свою важность, до сих пор не были исследованы, так как они непосредственно связаны с прикладными аспектами прогнозирования, к рассмот рению которых мы приступили только в этом параграфе. При проведении прогнозных расчетов показателей социально-экономи ческого развития Воронежской области сразу же был обнаружен ряд негативных моментов, таких как резкая смена типов роста показателей, несоразмерность показателей, принадлежащих одной группе, и др. Это потребовало применения специальных при емов, ориентированных на устранение подобных "пороков" в фактических данных. Так, в случае резкой смены характера роста показателей при менялась процедура экспоненциального сглаживания с обратным порядком взвешивания данных. В соответствии с этой процеду рой временной ряд Хх, Х2,..., Хп преобразуется в сглаженный ряд Х1,Х2,...,Хп следующим образом: Xn_x=aXn_x+{l-a)Xn; Хя-2=аХ„_2
Х1
+ (1-а)Ха_1;
(5.84)
=aXl+(l-a)Xr
где а — настраиваемый по постпрогнозным расчетам параметр (О < а < 1). Для тех случаев, когда наблюдалась несоразмерность показате лей, принадлежащих одной группе, например, когда одни пока затели измерены в сотнях единиц, а другие — в сотнях тысяч тех же самых единиц, применялась процедура кумулятивного пред ставления многомерного процесса. Формализация этой процеду ры следующая:
х: = х;-, 208
А,
— А,
(5.85)
i A.. ?
х? = х,'""1 + х; В качестве первого (который остается без изменений) в этой процедуре рекомендуется использовать максимальный по величи не показатель. Применение кумулятивного представления данных после получения прогнозных оценок Х], Х2,...,Х'" предполагает обратное преобразование
х! = хУ-. (5.86)
х}=х}-х}\ Y'" = У'" — У'"
В более сложных случаях можно комбинировать рассмотренные приемы обработки данных. Частота использования этих приемов в прогнозных расчетах основных показателей социально-экономи ческого развития Воронежской области отражена в табл. 5.8. Т а б л и ц а 5.8 Использование процедур предварительной обработки данных Показатели Агрегированные ВРП Выпуск товаров и услуг Промышленная продукция Продукция сельского хозяйства Объем инвестиций Доходы области Доходы населения Расходы населения
Процедура экспонен Процедура кумулятив циального сглаживания ного представления
+ +
+
+ + +
+ +
-
Прогнозные расчеты проводились с использованием вышеопи санной модели (5.81)—(5.83), вычисления по которой осуществ лялись в соответствии с многоуровневым вариантом схемы преды дущего параграфа. Детальное описание этого варианта приводится ниже. 209
7. Набор данных, имеющихся на момент построения модели 1. Динамика показателей: 1
21
42
Мл„'
v
1
22
2я„>
агрегированные показатели: к
а
л
\\
х
2\
Л
\2
ч«,-
22
*-2л/••
V2
v
х
показатели 1-го уровня дезагрегирования:
xiJ x'J •
21
m,- >
х'у • • х? ; x'J л 22
•
•4;
x'J л /2
•
• х'7 •
показатели 2-го уровня дезагрегирования
2V
2. Ожидаемые темпы роста показателей: к к к к-я вариант для агрегированных показателей: qn qt2 • • • qm ; k-ik вариант для показателей /-й группы 1-го уровня дезагреги рования: q% qf2 ••• q\ln. ; к-й вариант для показателей у'-й подгруппы /-Й группы 2-го уровня дезагрегирования: qt'J qt'^ ••• gj 7 . ; Q*— диагональная матрица, диагональными элементами кото рой являются ожидаемые темпы роста показателей по к-му вари анту (к = 1, т). II. Обозначения 1. Константы и переменные: N — число имитационных экспериментов; п — число моделируемых переменных; п а ~ число моделируемых агрегированных переменных; ni — число моделируемых переменных /-й группы 1-го уровня дезагрегирования; Чу — число моделируемых переменных /-й группы у'-й подфуппы 2-го уровня дезафегирования; 210
М — число экспертов; т — число альтернативных вариантов; т — число прогнозных периодов; в — число наблюдений для построения начального значения предиктора; t — число наблюдений, используемых для построения прогноз ной модели; qt — среднегодовой ожидаемый темп роста /-го показателя, применяемый для настройки параметров адаптации прогнозной модели; q" — среднегодовой ожидаемый темп роста /-го агрегированно го показателя, используемый для настройки параметров адаптации прогнозной модели; qif, — среднегодовой ожидаемый темп роста дезагрегированно го /-го показателя g-й группы на 1-м уровне (необходим для на стройки параметров адаптации прогнозной модели); q. — среднегодовой ожидаемый темп роста дезагрегированно го /-го показателя g-й группы на 2-м уровне (используется для на стройки параметров адаптации прогнозной модели). 2. Оцениваемые параметры и величины: dj, Sj — математическое ожидание и среднеквадратическая ошибка случайной величины, характеризующей изменения абсо лютных приростов /-го показателя (/ = 1, «); d, s — математическое ожидание и среднеквадратическая ошибка случайной величины, характеризующей ожидаемые значе ния элементов весовой матрицы W; W — матрица весовых коэффициентов и>.., характеризующих вклад у'-го показателя в прирост /-го, имеющая вид:
W W
=
••• w,„N
1
wn
21
1
•••
Win
W„2
•••
1
4 W„i
t
В некоторых случаях, когда число прогнозируемых переменных невелико, элементы матрицы W могут быть настраиваемыми. В имитационных экспериментах элементы матрицы W форми руются случайным образом. 211
3. Настраиваемые параметры: а — параметр адаптации, регулирующий в предикторе соотно шение старых и новых тенденций; а — оптимальное значение параметра а; у. — параметр, регулирующий комбинирование в предикторе прямых и косвенных темпов прироста. При построении предик тора используется матрица М, элементы которой зависят от ц: 1-J" М=
Ц
1 - jl
1 —А*
1- ц I- ц М* — матрица М с оптимальным значением параметра //*; Я — параметр, регулирующий вклад в прогнозную траекторию экстраполяционных тенденций и экспертных ожиданий. В блоч ном предикторе используется диагональная матрица Л с элемен тами, зависящими от Я:
Лт =
где
'я о о я Л=
о
'Л о
о л2
о
о
лт =
о о v
0^
о
ят о о я2
о о
о
я2
о
4. Случайные величины: wjj — элемент /-й строки у'-го столбца матрицы Wv, формиру емый датчиком случайных чисел в v-м имитационном эксперименте; Wv— матрица весовых коэффициентов, сформированная из имитируемых датчиком случайных чисел элементов Щ; Sf+Ii— прогнозная ошибка /-го показателя в периоде t+l, ими тируемая датчиком случайных чисел в v-м эксперименте; 212
Vt+uj ~ элемент /-й строки у'-го столбца матрицы \ v , рассчи тываемый по имитируемой случайной ошибке 5,v+/, в V-M экспери менте для периода t + /; у1'— комбинированная матрица прямых и косвенных темпов прироста, сформированная по имитируемым прогнозным ошиб кам в V-M эксперименте; \v— корректирующий мультипликатор в V-M имитационном эксперименте; Avt+,— блочно-диагональный мультипликатор для расчета век тора прогнозных оценок по всем упреждающим периодам в V-M имитационном эксперименте; Xv+#— вектор прогнозных оценок для всех упреждающих пери одов, полученных в V-M имитационном эксперименте. 5. Процедура моделирования случайной величины: F — процедура моделирования псевдослучайных чисел, имити рующих элементы весовой матрицы; Ц1 — процедура моделирования псевдослучайных чисел, имити рующих прогнозные ошибки. 6. Процедура экспертного оценивания: Е — процедура интерактивного экспертного оценивания веро ятности реализации того или иного прогнозного варианта. 7. Результаты экспертного оценивания: р*+/(- — вероятностная оценка, полученная от г-ю эксперта, от носительно реальности k-го варианта /-го показателя для момен та времени / + /; р*+/. — групповая экспертная оценка относительно реальности А:-го варианта /-го показателя для момента времени / + /; xt+li — усредненное по групповым экспертным оценкам значе ние /-го показателя для момента времени t + I; x*+li — наиболее вероятное значение /-го показателя для момен та времени / + / по результатам экспертного опроса. 8. Моделируемые переменные и величины: хи — значение /-го показателя в момент времени Г, хп— расчетное значение /-го показателя в момент времени Г, xf+li— значение /-го показателя к-го альтернативного варианта в момент времени / + / (с целью упрощения алгоритма для каж дого / задается фиктивный вариант .?,'"!', принимающий макси мально возможное значение); 213
x, = (xn,xr2,.--,xm) — вектор-столбец из значений моделиру емых показателей в момент времени Г, х,— вектор расчетных (прогнозных) значений моделируемых показателей для момрнта времени t, X, = (х,, х,,..., х,) — вектор-столбец с компонентами из одина ковых вектор-столбцов х,; Х, + . = (х,+1, х + 2 ,..., х + ) ~~ вектор-столбец с компонентами из вектор-столбцов прогнозных значений моделируемых показателей; Х^+. = (х^+1, х, с +2 ,..., xrc+ J — вектор-столбец значений комбини рованной прогнозной траектории для моментов времени t+ 1, t + 2, ... , t +т; со^ц — индикаторная переменная, принимающая значение О или 1 в зависимости от результата сравнения полученной величи ны /-го показателя в v-м эксперименте для периода t + I с соот ветствующим к-м вариантом; Ад — начальное значение матричного предиктора; Ve — начальное значение комбинированной матрицы прямых и косвенных темпов прироста; Vy — элемент /-й строки у'-го столбца матрицы Ve ; V,+,— корректирующая матрица прямых и косвенных темпов прироста для моментов времени t + 1, t + 2, ... , t + т; vt+lij— элемент /-й строки у-го столбца матрицы V, + ., опреде ляемый по отклонениям постпрогнозных расчетов от фактических значений для периода / + /; Z(a, fi) — критерий настройки параметров адаптации а и ц. Ag+/ (a, /i) — скорректированное на прогнозные ошибки зна чение предиктора для момента времени 9+1; А!+,— корректирующая матрица для моментов времени t + 1, t+2, ..., t + т; А, — предиктор для моментов времени г, Plk+lj — вероятность реальности значения /-го показателя по к-му варианту в момент времени / + /; А^+. — предиктор комбинированной модели для моментов вре мени t + 1, t + 2, ..., t + г. III. Инициализация глобальных констант t = 3, т = 3, в = 2; т = 5, М = 11; N = 700. 214
IV. Вычислительная схема прогнозирования агрегированных пока зателей 1. Инициализация локальных констант: п = 6; 4i = Ч°Диагональная матрица ожидаемых темпов роста афегированных показателей по £-му варианту: ( к Чл
о
Qf = ч
0
-
qkM
2. Расчет альтернативных вариантов: 0
'Qf Х
,+2
X*
+3
0
=
(Q*)
^0
2
0
^ ГО
0
х
,
3
0
(Qf) ^ Л ,
, к=\,т. к=
1 ' начального ) 3. Построение значения предиктора: М = 0,5; Wy = <
X если i = j , 1 /(я - 1), если i Ф j , /, j = l,n'
xei —хи
ei
~ в-\ в
(5.88) (5.89)
— 1 = 1,п;
(5.90)
, 1, J = 1, П ,
(5.91)
, /, j = 1, п;
(5.92)
'
А
е;
У
Ч
Ув =
(5.87)
в
Ав = ( l - M * W * V e ) _ I . (5.93) 4. Адаптивное преобразование предиктора и настройка его пара метров: а = 0,1; (5.94) 215
(5.95)
Xfl+i — A f l X ( i ,
__ x0+u
v
e+lij
xe+u , i, j = 1, n;
X,e+ij v
\\ve+i J,
e+i
i, 7 = 1, if,
(5.96) (5.97)
A e+1 =(i-M*w*v e+I )T';
(5.98)
Ае+1(а,м) = аА 0 +(1-а)А е+1 А е ;
(5.99) (5.100)
'9+2
(5.101)
l Aff+|Xfl+1 e+iA0+i '
Z(«, /л) = т а х 4i
X
9+2/
, i = hn; (5.102)
^e+i/
'a^
= Argmin Z(a, /л) (5.103)
M У 5. Имитационные расчеты (v = 1, Л0-'
(5.104) (5.105) (1, если / = j , W
ij
= \
v i
[wij /wi
v
•
1 всли
(5.106)
•
I * J\
(5.107) r
W = \\Щ, i,j = \~n; 5V
216
<5,I„-0,5 1,5
-^i+iz
(5.108)
_ / = 1, n;
(5.109)
л и
п 1+и
V.
+UJ
'
/
x,(l + S^j)'
(5.110)
'-' = 1 ' л :
~ v _ ||-v II . . V - | ] v , + 1 y | ] , i, j = 1, n;
^ w'/+/ =
(5.1П)
Av = ( I - M * * W V * V V ) T I ;
(5.112)
Ar+1=a4,+^a^)+(l-a*)AvA,+1(a\^*);
<5-113>
X;;. = A; + .X, ;
(S.IH)
10, если
x,v+/ <x* +/ ;
[1, если
+i, k = \,m, .£ ^ ~v x,+i < xj+/ < Xf+i
/ = 1,T; (5.115)
N
А '
+
| /
=
^ ' Ё С
* = l,m, / = 1,т, г' = 1,п.
(5.116)
6. Экспертное оценивание: (5.117)
Р = Е(Х, Р) ; А/
Рг+п••= — S ?£/,-. / = 1, л ,
* = 1,М,
/ = 1,т;
*+/« = X А+/Д+/; > •/ = 1, "Г, / = 1, л ;
(5.118)
(5.119)
*=1
х/ +;; = Argmax{p*+/I.(x,+li = х"+н)}, / = 1, л, / = 1, т . (5.120) к 1. Расчет значений комбинированной прогнозной траектории: Х,+.=А,+.Х,; v
,+nj
, / , 7 = 1, л , Z = l , r ;
=
(5.121) (5Л22)
X
t+lj
V / + . =|v?7' , и
= 1,л, Z = 1 , T ;
(5.123)
A, + . = (l„x„ - I r x r
(M* * W) * \r+. У;
(5-124) 217
А,с+. = ЛА, + . + (l(
(5.125)
_ 1С X?С + .=A= + .X,.
(5.126)
V. Вычислительная схема прогнозирования показателей i-й груп пы 1-го уровня дезагрегирования 1. Инициализация локальных констант: п1 = 5, «2 = 7, я3 = 13, «4 = 4, я5 = 3, я6 = 8; п = я ; , / = 1, 6;
V >' . . Диагональная матрица ожидаемых темпов роста показателей /-й группы 1-го уровня дезагрегирования по k-му варианту: (
ki
О
Ял
Q,* = О
2. Расчет альтернативных вариантов в соответствии с (3.7) 3. Построение начального значения предиктора: М = 0,5; (5.127) Wy =
1,
если i = j 1 /(п - 1), если i Ф j ' hj-hn д
_
Х
X
в\
U
v
+
'j
Y
Уя =
; _ 1 „ i 1
' /, 7 = 1 , « + 1 ;
, /, у = 1, п +1;
В й = М * W * Уа "в /'•all
вб =
Вв21
+ l;
(5.128) (5.129)
(5.130) (5.131) (5.132)
Т>12\ т>2: а
в
(5.133)
Ав = ( l - M * W * V e ) ~ l . (5.134) 4. Адаптивное преобразование предиктора и настройка его пара метров: а = 0,1; (5.135)
хе+1 = (1-ву) ч (х е +в^ е+ ,.„ + .); x
e+i.n+\ ~ V* ~ "в _ хв+и
-
) \хв,п+\
+
"в
x
e+i)'
(5.136) (5.137)
х
в+и /, j = l, л + i;
3+1(/ V
(5.138)
e+U
_ V'e+i vfl 1 > i, j = I, n + 1', flJ , = H^e+iy
(5.139)
A e+1 =(i-M*w*v e+1 )"';
(5.140)
Ae+i(a,^) = aA 0 +(l-a)A 0+1 A 0 ;
(5.141)
Be+,(a, M) = I - (Ae+,(a, //))"'; * 9 + 2 = (i - ВУ + ,(a, A*))"1 (x9+1 + B £ , ( a , / i ) i e + M + 1 ) ; v
Z ( a , ^ ) = max
e+2/
^0+1;
( a *\ ^
, / = l, n;
(5.142) (5.143) (5.144)
(5.145)
= ArgminZ(a, /u)',
у
5. Имитационные расчеты (v =1, N)'-
w£=F(rf, Д . /, 7 = 1, n + l, щ - X w)/.г' ;' = l и +1;
i*j;
(5.146) (5.147)
(l, если / = /';
w,'r = 1 'У [wy /wj,
WV
~V
(5.148) если i Ф j ; •
•
1
, 1 .
= hvtj > i, j =1, n + 1,
(5.149) 219
^ ^ Y ^ . ^ X , 1 = 1,/1 + 1; 8;+ll=5'+i'~°'5,i 1,5
(5.150)
= ln^l;
(5.151)
Х
;А+П ' 'J ~ ., п ... я* л ' ' ' •' ~1>п +1; ^а+<5; + и )
y +l
(5.152)
У=р + 1 ,у||,/,7 = 1,п + 1;
(5.153)
A^fl-M^W^-V^';
(5.154)
А^,^/Г)=аЧДа%//)+(1-а*)А*А,(а\//*);
(5.155) (5]56)
В|+1(а',^)=1-(А^(а',^)Г'x,+/=(l-B;|i(a\^)X1(x/+/„1+B^I(a\M*)^+u+1),/ kv
=
u
;
[О, если
x,v+/ < xf+/;
[l,
xf+/ < xrv+/ < х*++/ , * = 1, m, / = 1, т ;
если
г-1 V ,М Р,+и=К~^(0,*ц,
k=l,m,l
= l,T,i = l,n + l.
(5.157)
(5.159)
6. Экспертное оценивание: (5.160)
Р = Е(Х,Р)
Iм Pt+u = 77 ^ Й'+//' г = 1, «, А: = 1, М, / = 1, т ;
(5.161)
х,+ц = S Р?+цХ,+ц , Z = 1, т , i = 1, и ;
(5.162)
М ,=1
*Д« = А г § т а х Ы \ / , (*/+// = **+« ) J. i = 1, и, / = 1, т . (5.163) 7. Расчет значений комбинированной прогнозной траектории: xt+l=(l-B]l(a\^)Y(x,+l^+B\2(a\^)xlln
+ l)j
= l^;
х,с+/ = л'х, + / + ( I - A ' ) X , + / , / = П 7 . 220
(5.164) (5.165)
VI. Вычислительная схема прогнозирования показателей j-й под группы i-й группы 2-го уровня дезагрегирования 1. Инициализация локальных констант: пп =10; пп = 2; п = n,j, i = 1 , j = 1, 2.
Диагональная матрица ожидаемых темпов роста показателей у'-й подгруппы /-Й группы 2-го уровня дезагрегирования по к-му варианту: Г
kij
Я,\
О
О
Я,
Q,* = kij
2. Последовательное выполнение шагов 1—7 вычислительной схе мы прогнозирования показателей i-й группы 1-го уровня дезагрегиро вания. Верификация на реальных данных показала, что разработанный аппарат прогнозирования действительно может использоваться в практике массовых расчетов, имеющих место при формировании вариантов социально-экономического развития региона. Более того, применение этого аппарата вносит в прогнозные расчеты элементы системного подхода, что упорядочивает весь многоэтап ный процесс и значительно повышает оперативность решения задач регионального прогнозирования. Результаты всех расчетов по этой многоуровневой схеме пред ставлены в приложениях 3—5.
ЗАКЛЮЧЕНИЕ В монографии получили развитие идеи прогнозирова ния экспертных предпочтений, что эквивалентно прогнозированию в номинальных и ранговых шкалах. До настоящего момента нечис ловые данные, получаемые в результате социологических, марке тинговых и некоторых других исследований, могли подвергаться лишь анализу с помощью математического аппарата, без надежды на их экстраполяцию. В то же время необходимость экстраполяционного решения прикладных задач в номинальных и ранговых шкалах назрела уже давно в связи с возрастанием роли субъектив ного фактора в управлении. Основной барьер в разрешении этой проблемы — отсутствие адекватного математического аппарата. Как известно, теоретические и прикладные аспекты моделиро вания качественных переменных стали интенсивно разрабатываться лишь в последнее десятилетие. Аппарат такого моделирования как раз и был положен в основу реализации идеи прогнозирования экспертных предпочтений. В монографии детально изложены проблемы, касающиеся эконометрики качественных зависимых переменных, которые не достаточно подробно освещены в пере водной литературе. В зависимости от содержательного смысла решаемых задач были разработаны методики прогнозирования с помощью моделей бинар ного выбора, а также моделей множественного выбора с упорядо ченными и неупорядоченными альтернативами. Важным этапом их реализации стало определение правил формирования псевдовыбо рочных совокупностей, являющихся специфическим результатом опросов экспертов. Благодаря таким псевдовыборочным совокуп ностям удается достигнуть главной цели — построить модель, по зволяющую осуществлять экстраполяцию экспертных предпочтений. Кроме того, в монографии изложен авторский подход к опре делению согласованности групповых субъективных прогнозов и оценке компетентности экспертов. Особый интерес представляют модели, основанные на идее ком бинирования адаптивных принципов и экспертных ожиданий. По строенные вычислительные схемы разработанных моделей являются эффективным инструментом для проведения комплексных прогноз ных расчетов. Их верификация на региональном уровне подтверди ла универсальность, гибкость и надежность этого инструмента. 222
БИБЛИОГРАФИЧЕСКИЙ
СПИСОК
1. А в е д ъ я н Э. Д. Модифицированный алгоритм Качмажа для оценки параметров линейных объектов / Э. Д. Аведъян / / Ав томатика и телемеханика. — 1978. — № 5. 2. А й в а з я н С. А. Прикладная статистика и основы эко нометрики: учеб. / С. А. Айвазян, В. С. Мхитарян. — М.: ЮНИТИ, 1998. - 220 с. 3. Б а г р и н о в с к и й К. А. О методах имитационного моделирования экономических процессов / К. А. Багриновский / / Имитационное моделирование экономических систем. — М.: На ука, 1978. 4. Б а к а е в А. А. Имитационные модели в экономике / А. А. Бакаев, Н. И. Костин, Н. В. Яровицкий. — Киев: Наукова думка, 1978. 5. Б а р а н В. И. Определение рыночной доли на основе парных сравнений / В. И. Баран / / Маркетинг в России и за ру бежом. - 2001. - №3(32). - С. 1 2 - 1 4 . 6. Б е ш е л е в С. Д. Математико-статистические методы экс пертных оценок / С. Д. Бешелев, Ф. Г. Гурвич. — М.: Стати стика, 1980. - 263 с. 7. Б о р о д ю к В. П. Статистическое описание промышлен ных объектов / В. П. Бородюк, Э. К. Лецкий. — М.: Энергия, 1971. - 112 с. 8. В о л к о в А. М. Экспертные системы: структурно-функ циональный подход к извлечению экспертного опыта / А. М. Вол ков, Ю. Е. Царев, В. С. Федченко. — М.: Мир, 1991. — 156 с. 9. Г л и ч е в А. В. Прикладные вопросы квалиметрии / А. В. Гличев. — М.: Изд-во стандартов, 1983. — 212 с. 10. Г л у щ е н к о В. В. Разработка управленческого реше ния. Прогнозирование. Планирование. Теория проектирования экс периментов / В. В. Глушенко, И. И. Глушенко. — г. Железно дорожный, Моск. обл.: ТОО НПЦ "Крылья", 1997. — 400 с. 11. Г о р с т к о А . В. К вопросу о содержании понятия "ими тационное моделирование" / А. В. Горстко / / Имитационное мо делирование экономических систем. — М.: Наука, 1978. 12. Г о х м а н О. Г. Экспертное оценивание: учеб. пособие / О. Г. Гохман. — Воронеж: Воронеж, гос. ун-т, 1991. — 152 с. 13. Д а в н и с В. В. Адаптивное прогнозирование: модели и методы: монография / В. В. Давние. — Воронеж: Изд-во Воро неж, гос. ун-та, 1997. — 196 с. 223
14. Д а в н и с В. В. Прогноз и стратегический выбор: моно графия / В. В. Д а в н и е , Е. К. Нагина, В. И. Т и н я к о в а , В. А. Ищенко. — Воронеж: Изд-во Воронеж, гос. ун-та, 2004. - 216 с. 15. Д а в н и с В. В. Современные тенденции развития прогно стических методов управления экономикой / В. В. Давние, В. И. Тинякова / / Экономическое прогнозирование: модели и ме тоды: Материалы международной научно-практической конференции. 29—30 апреля 2005 г.: в 2 ч. / Под ред. проф. В. В. Давниса. — Воронеж: Воронеж, гос. ун-т, 2005. — Ч. 1. — С. 29—36. 16. Д а в н и с В. В. Эконометрический и логико-аналитичес кий подходы к задачам и ситуациям по управлению персоналом / В. В. Давние, И. Б. Дуракова. — Воронеж: Воронеж гос. ун-т, 2000. - 50 с. 17. Д о у г е р т и К. Введение в эконометрику: учеб. / К. Доугерти. - М.: ИНФРА-М, 2004. - 432 с. 18. Е в л а н о в Л. Г. Экспертные оценки в управлении / Л. Г. Евланов, В. А. Кутузов. — М.: Экономика, 1978. — 133 с. 19. Е м е л ь я н о в А. А. Имитационное моделирование экономических процессов: учеб. пособие / А. А. Емельянов, Е. А. Власова, Р. В. Дума. — М.: Финансы и статистика, 2004. - 368 с. 20. Е р м а к о в С. М. Метод Монте-Карло и смежные воп росы / С. М. Ермаков. — М.: Наука, 1971. 21. И в а щ е н к о П . А. Адаптация в экономике / П. А. Иващенко. — Харьков: Выща шк. Изд-во при Харьк. ун-те, 1986. — 144 с. 22. К е н д а л л М. Д ж. Статистические выводы и связи / М. Дж. Кендалл, А. Стьюарт. — М.: Наука, 1973. — 900 с. 23. К о б е л е в Н. Б. Основы имитационного моделирова ния сложных экономических систем: учеб. пособие / Н. Б. Кобелев. — М.: Дело, 2003. - 336 с. 24. К о р х и н А. С. Многошаговые адаптивные алгоритмы идентификации экономических систем по временным рядам / А. С. Корхин / / Методологические проблемы анализа и прогноза краткосрочных процессов. — М.: Наука, 1979. 25. Л а р и ч е в О. И. Качественные методы принятия реше ний: Вербальный анализ решений / О. И. Ларичев, Е. М. Мошкович. — М.: Физматлит, 1996. — 207 с. 26. Л а р и ч е в О. И. Объективные модели и субъективные решения / О. И. Ларичев. — М.: Наука, 1987.— 143 с. 27. Л а р и ч е в О. И. Теория и методы принятия решений, а также Хроника событий в Волшебных странах: учеб. / О. И. Ла ричев. — М.: Логос, 2002. — 392 с. 224
28. Л е в и ц к и й Е. М. Адаптация и моделирование эко номических систем / Е. М. Левицкий. — Новосибирск: Наука, 1978. - 208 с. 29. Л е д е н е в а Т. М. Модели и методы принятия реше ний: учеб. пособие / Т. М. Леденева. — Воронеж: Воронеж, гос. техн. ун-т, 2004. — 189 с. 30. Л и Р. Оптимальные оценки, определение характеристик и управление / Р. Ли. — М.: Наука, 1966. 3 1 . Л и с и ч к и н В. А. Теория и практика прогностики: методологические аспекты / В. А. Лисичкин. — М.: Наука, 1972. - 224 с. 32. Л и т в а к Б. Г. Экспертные технологии в управлении / Б. Г. Литвак. - М.: Дело, 2004. - 398 с. 33. Л и т в а к Б. Г. Разработка управленческого решения: учеб. / Б. Г. Литвак. - М.: Дело, 2003.— 392 с. 34. Л и т в а к Б. Г. Экспертная информация: Методы полу чения и анализа / Б. Г. Литвак. — М.: Радио и связь, 1982. — 184 с. 35. Л у к а ш и н Ю. П. Адаптивные методы краткосрочного прогнозирования / Ю. П. Лукашин. — М.: Статистика, 1979. — 253 с. 36. Л у к а ш и н Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов / Ю. П. Лукашин. — М.: Финансы и статистика, 2003. — 416 с. 37. М а г н у с Я. Р. Эконометрика. Начальный курс: учеб. / Я. Р. Магнус, П. К. Катышев, А. А. Пересецкий. — М.: Дело, 2004. - 576 с. 38. М е с к о н М. Основы менеджмента / М. Мескон, М. Альберт, Ф. Хедоури. - М.: Дело ЛТД, 1995. - 704 с. 39. М и р к и н Б. Г. Анализ качественных признаков и струк тур / Б. Г. Миркин. — М.: Статистика, 1980. — 319 с. 40. М и р к и н Б. Г. Проблема группового выбора / Б. Г. Мир кин. — М.: Наука, 1974. — 256 с. 41. О р т е г а Д ж. Итерационные методы решения нелиней ных систем уравнений со многими неизвестными / Дж. Ортега, В. Рейнболдт.— М.: Мир, 1975. 42. П а н к о в А. Р. Рекуррентное оценивание параметров линейной модели по нескольким группам измерений / А. Р. Пан ков, А. М. Скуридин / / Автоматика и телемеханика. — 1979. 43. П а н к о в а Л . А. Организация экспертиз и анализ экс пертной информации / Л. А. Панкова, А. М. Петровский, М. В. Шнейдерман. — М.: Наука, 1984. — 120 с. 225
44. П е р м и н о в С. Б. Имитационное моделирование про цессов управления в экономике / С. Б. Перминов. — Новоси бирск: Наука, 1981. — 214 с. 45. П ф а н ц а г л ь И. Теория измерений / И. Пфанцагль. - М.: Мир, 1976. - 248 с. 46. Р а й б м а н Н. С. Адаптивные модели в системах управ ления / Н. С. Райбман, В. М. Чадеев. — М.: Советское радио, 1966. - 157 с. 47. С а у ш е в А. В. Экспертный анализ: методы теории экс перимента / А. В. Саушев. — СПб.: Питер, 1996. 48. С и д е л ь н и к о в Ю. В. Теория и организация экс пертного прогнозирования / Ю. В. Сидельников. — М.: ИМЭМО АН СССР, 1990. - 196 с. 49. С к в и р с к и й В. Я. Экспертиза: теория, технология, практика / В. Я. Сквирский. — М.: Прогресс, 1994. 50. С о б о л ь И. М. Метод Монте-Карло / И. М. Соболь. - М.: Наука, 1968. - 64 с. 51. Т е й л Г. Экономические прогнозы и принятие решений / Г. Тейл. — М.: Статистика, 1971. — 488 с. 52. Т е о р и я прогнозирования и принятия решений: учеб. пособие / Под ред. С. А. Саркисяна. — М.: Высш. шк., 1977. - 351 с. 53. Т и н я к о в а В. И. Прогнозирование лингвистических переменных с помощью моделей бинарного выбора / В. И. Тинякова, С. И. Мокшина / / Экономическое прогнозирование: модели и методы: Материалы Всероссийской научно-практической конферен ции. 18—19 марта 2004 г.: В 2 ч. / Под ред. проф. В. В. Давниса. - Воронеж: Воронеж, гос. ун-т, 2004. — Ч. 2. — С. 296—301. 54. Т и х о м и р о в Н. П. Эконометрика: учеб. / Н. П. Ти хомиров, Е. Ю. Дорохина. — М.: Экзамен, 2003. — 512 с. 55. Ц и г и ч к о В. Н. Прогнозирование социально-экономи ческих процессов / В. Н. Цигичко. — М.: Финансы и статисти ка, 1986. 56. Ш е н н о н Р. Имитационное моделирование систем — искусство и наука / Р. Шеннон. — М.: Мир, 1978. 57. Эконометрика: учеб. / Под ред. И. И. Елисеевой. — М.: Финансы и статистика, 2005. — 576 с. 58. А га е га i у а Т. Qualitative response models: a survey / Т. Amemiya / / Journal of Economic Literature. — 1981. — Vol. 19, № 4. - P. 1483-1536. 59. В г о w n R. G. Smoothing, Forecasting and Prediction of Discrete Time series / R. G. Brown / / Englewood Cliffs. — New Jersy: Prentice-Hall, 1963. 226
60. В г о w n R. G. The Fundamental Theorem of Exponential Smoothing / R.G. Brown, R.F. Meyer / / Operation Research. — 1961. - Vol. 5, № 5. 61. C o s s l e t t R. S. Distribution-Free Maximum Likelihood Estimator of the Binary Choice Model / R. S. Cosslett / / Econometrica. - 1983. - Vol. 51, № . 3. - P. 765-782. 62. С о x D. R. The analysis of binary data, 2nd ed. / D. R. Cox, E.J. Snell— London: Chapman and Hall, 1989. 63. G r e e n W. H. Econometric Analysis, 4 th ed. / W.H. Green — New York: Macmillian Publishing Company, 2000. — 1004 p. 64. H a u s m a n J . Specification Tests for the Multinomial Logit Model / J. Hausman, D. McFadden / / Econometrica. — 1984. — Vol. 52, № 5. - P. 1219-1240. 65. H e n s h e r A. D. Sequential and Full Information Maximum Likelihood Estimation of Nested Logit Model / A. D. Hensher / / The Review of Economics and Statistics. — 1986. — Vol. 68, № 4. — P. 657-667. 66. L e e L u n g - F e i . Identifacation and Estimation in Binary Choice Models with Limited (Censored) Dependent Variables / LungFei Lee / / Econometrica - 1979. - Vol. 47, № 4. - P. 977-996. 67. M a d d a 1 a G. S. Introduction to Econometrics. 3 rd ed. / G. S. Maddala. - New York: John Wiley & Sons Ltd., 2001. 636 p. 68. P a r к J. Y. Nonstationary Binary Choice / J. Y. Park, P. С. В. Phillips / / Econometrica. - 2000. - Vol. 68, № 5. P. 1249-1280. 69. S t e r n S. Simulation-based Estimation / S. Stern / / Journal of Economic Literature. - Vol. 35, № 4 (Dec. 1997). - P. 2 0 0 6 2039. 70. W i n t e r s P. R. Forecasting Sales by Exponentially Weighted Moving Averages / P. R. Winters / / Management Sciences. — 1960. - Vol. 6, № 3.
й
ПРИЛОЖЕНИЯ
оо
Приложение
1
Система основных показателей социально-экономического развития региона № п/п
Агрегированные показатели 2 ВРП, ДС по отраслям:
1.5 1.6 1.7
2.1 2.1.1 2.1.2 2.1.3 2.1.4
3
Показатели 2-го уровня дезагрегирования 4
Промышленность Сельское и лесное хозяйство Строительство Транспорт и связь (рыночные услуги) Торговля и общественное питание, оптовая торговля продукцией производственно-технического назначения Другие отрасли Чистые налоги на продукты
1.1 1.2 1.3 1.4
2
Показатели 1-го уровня дезагрегирования
Выпуск товаров и услуг по основным отраслям: Промышленная продукция по подотраслям: Электроэнергетика Черная металлургия Химическая и нефтехимическая про мышленность Машиностроение и металлообработка
Промышленность строительных материалов Лесная, деревообрабатывающая и цел люлозно-бумажная промышленность Легкая промышленность Пищевая промышленность Медицинская промышленность Прочие отрасли
2.1.5 2.1.6 2.1.7 2.1.8 2.1.9 2.1.10 2.2 2.2.1
Продукция сельского хозяйства по подотраслям: Продукция растениеводства
2.2.2 2.3
Продукция животноводства Строительство Торговля и общественное питание, оптовая торговля продукцией производственно-технического назначения Транспорт и связь
2.4 2.5 3 3.1 3.2 3.3 3.4 3.5 3.6 3.7
Объем инвестиций по основным отраслям: Промышленность Сельское хозяйство Лесное хозяйство Строительство Транспорт Связь Торговля и общественное питание, оптовая торговля продукцией производственно-технического назначения
й
О к о н ч а н и е
о 1 3.8
2
3.9 3.10 3.11 3.12 3.13 4
Доходы населения по основным источни кам:
4.1 4.2 4.3 4.4 5
Доходы от предпринимательской деятельности Оплата труда наемных работников Социальные трансферты Другие доходы Расходы и сбережения населения по основ ным направлениям:
5.1 5.2 5.3 6 6.1
3 Жилищно-коммунальное хозяйство Здравоохранение, физическая культура и спорт, социальное обеспечение Образование Наука и научное обслуживание Культура и искусство Другие отрасли
Покупка товаров и оплата услуг Обязательные платежи и взносы Прочие расходы Доходы области по основным источникам: Прибыль (убыток) —сальдо
4
п р и л. 1
6.2 6.3 6.4 6.5 6.6 6.7 6.8
Амортизационные отчисления Налоговые доходы (без налога на прибыль) Неналоговые доходы Средства целевых бюджетных фондов Средства единого социального налога Прочие доходы Сальдо финансовых взаимоотношений с федеральным уровнем власти
К
П р и л о ж е н и е 2
to
Основные показатели социально-экономического развития Воронежской области за 2000—2002 гг., млн р., в ценах соответствующих лет № п/п
Показатели
2 ! 1 Валовой региональный продукт— всего, в том числе добавленная стоимость по отраслям: промышленность сельское и лесное хозяйство строительство транспорт и связь (рыночные услуги) торговля и общественное питание, оптовая торговля продукцией производствен но-технического назначения другие отрасли чистые налоги на продукты 2 Выпуск товаров и услуг по основным отраслям — всего, в том числе: объем произведенной промышленной продукции (услуг) в действующих ценах организаций — всего, в том числе по отраслям: электроэнергетика черная металлургия химическая и нефтехимическая промышленность машиностроение и металлообработка промышленность строительных материалов
Годы 2001 2002 2000 4 5 3 52 100,40 63 866,90 75 284,00 13 683,60 14974,30 9470,60 11 402,90 2885,00 3469,40 5857,80 6670,00
17 767,00 13551,00 4141,00 7905,00
6351,40 8681,40 10 239,00 10 110,20 14 493,90 16 788,00 3741,80 4175,00 4893,00 128 556,50 154 972,00 175 202,80 33 151,50 41 623,90 51 573,10 5960,00 7524,70 9829,40 1220,90 1177,60 985,00 4193,30 5908,70 8532,10 7447,30 10 645,70 12 041,50 2275,90 2412,10 3204,20
лесная, деревообрабатывающая и цсллолозно-бумажная промышленность 735,30 906,60 легкая промышленность 365,00 348,50 пищевая промышленность 8844,10 10 374,10 601,20 медицинская промышленность 689,80 1708,20 прочие отрасли 1416,40 продукция сельского хозяйства в хозяйствах всех категорий — всего, в том числе: 18 247,20 22 300,20 продукция растениеводства 10 650,40 12 729,10 продукция животноводства 7596,80 9571,10 строительство 4082,50 4572,60 торговля и общественное питание, оптовая торговля продукцией производствен но-технического назначения 63 162,30 78 459,90 транспорт и связь (рыночные услуги) 8015,40 9913,00 3 Объем инвестиций (в основной капитал) за счет всех источников финансирования — всего, в том числе: 7301,40 9592,88 промышленность 1920,62 2649,20 сельское хозяйство 482,34 741,80 лесное хозяйство 5,05 3,80 строительство 130,87 135,56 транспорт 2201,65 2390,46 связь 200,96 109,22 торговля и общественное питание, оптовая торговля продукцией производствен но-технического назначения 373,60 223,03 жилищно-коммунальное хозяйство 2234,29 1704,7 здравоохранение, физическая культура и спорт, социальное обеспечение 187,12 111,30 образование 139,24 96,26 наука и научное обслуживание 132,23 64,49 34,77 51,09 культура и искусство
1020,70 431,40 13 150,60 687,60 1690,60 25443,70 13 585,50 11 858,20 5236,30 82 169,20 10 780,50 12 098,20 4056,53 837,80 2,28 145,48 2420,56 156,78 439,60 2831,56 254,23 197,75 166,83 73,56
й
О к о н ч а н и е 1
2
другие отрасли 4 Доходы области — всего, в том числе: прибыль (убыток) —сальдо амортизационные отчисления налоговые доходы (без налога на прибыль) неналоговые доходы средства целевых бюджетных фондов средства единого социального налога прочие доходы сальдо финансовых взаимоотношений с федеральным уровнем власти 5 Доходы населения — всего, в том числе: доходы от предпринимательской деятельности оплата труда наемных работников социальные трансферты другие доходы 6 Расходы и сбережения населения — всего, в том числе: покупка товаров и услуг обязательные платежи и разнообразные выплаты прочие расходы
3
п р и л. 2. 4
5
200,51 369,85 515,24 23 162,75 28 470,60 35 303,70 4471,78 4618,90 4608,50 3608,71 4155,00 4769,00 7001,48 8336,50 9888,50 418,20 383,73 430,00 943,40 1087,10 799,91 5236,25 5631,80 4727,30 1803,40 4922,40 391,19 2563,40 4870,90 1269,71 41 504,20 55509,50 69 626,70 7276,90 14 825,30 7735,90 11666,10 40 045,30
7423,90 19 367,00 11 226,70 17 491,90 54 856,60
9289,70 27 908,10 14 394,50 18 034,40 68 626,70
33 896,50 46 132,60 55 573,00 1772,90 2706,40 4539,70 4375,90 6017,60 8514,00
Приложение
3
Прогнозные оценки основных показателей социально-экономического развития Воронежской области на 2003 г., млн р. Показатели
Интуитивный Формализованный Комбинированный прогноз прогноз прогноз вариант I вариант 11 вариант 1 вариант II вариант I вариант II 3 4 6 7 5 8 88 665,20 71 519,80 87 425,00 82 664,31 88 231,13
1 2 [ Валовой региональный продукт — всего, в том числе добавленная стоимость по отраслям: промышленность 21012,19 21044,24 сельское и лесное хозяйство 16 060,26 16 085,00 строительство 4924,99 4932,72 9343,67 9357,87 транспорт и связь (рыночные услуги) торговля и общественное питание, оптовая тор говля продукцией производственно-технического назначения 12 072,51 12 090,54 другие отрасли 19 505,10 19 531,69 чистые налоги на продукты 5729,52 5737,77 2 Выпуск товаров и услуг по основным отраслям — всего, 199442,21 втом числе: объем произведенной промышленной продукции (услуг) в действующих ценах организаций — всего, в том числе по отраслям: 62 352,20 62 449,07 электроэнергетика 11941,53 11943,27 черная металлургия 1156,43 1156,57 химическая и нефтехимическая промышленность 9624,88 9625,86 машиностроение и металлообработка 13699,89 13701,29
20 632,00 15737,00 4546,00 9529,00
21 892,50 20 879,12 16 768,50 15947,12 4792,34 4844,70 10 154,55 9408,54
21 341,13 16 324,23 4901,92 9636,71
12 234,00 19 583,00 5164,00
12 421,00 19 963,00 5494,65
12 129,03 19 532,37 5531,59
12 206,20 19 682,65 5652,68
178 267,16 203 235,25 192 030,94 200 769,7
59 618,50 60 667,00 61 395,41 61 825,35 11 730,40 11 806,60 11 867,63 11 895,44 1174,40 1162,72 1191,80 1168,90 9486,00 9576,27 9601,70 9617,40 13933,40 14 083,10 13 781,62 13 834,92
К
О к о н ч а н и е
п р и л. 3
ON
2 промышленность строительных материалов лесная, деревообрабатывающая и целлюлознобумажная промышленность легкая промышленность пищевая промышленность медицинская промышленность прочие отрасли продукция сельского хозяйства в хозяйствах всех категорий — всего, в том числе: продукция растениеводства продукция животноводства строительство торговля и общественное питание, оптовая торговля продукцией производственно-техни ческого назначения транспорт и связь (рыночные услуги) 3 Объем инвестиций (в основной капитал) за счет всех источников финансирования — всего, втом числе: промышленность сельское хозяйство лесное хозяйство строительство транспорт связь торговля и общественное питание, оптовая торговля продукцией производственно-техни ческого назначения
1
3 3772,16
4 3772,61
5 3729,40
6 3776,40
7 3757,19
8 3773,94
1155,81 509,07 16 401,75 788,51 2082,51
1155,93 509,13 16 404,38 788,59 2082,83
1194,60 483,60 15 183,30 782,40 1919,00
1203,50 480,40 15 347,30 788,60 2387,60
1169,39 500,16 15975,29 786,37 2025,28
1172,58 499,08 16 034,40 788,59 2189,50
29 203,91 29 236,80 15 153,73 15156,04 13 398,61 13401,12 6007,74 6000,89
28 618,00 15401,90 13425,80 5981,90
28 827,70 28 998,84 29 093,62 16313,10 15 240,59 15561,01 13 304,90 13408,13 13 367,44 5981,90 5994,24 5998,69
91 888,36 91 969,19 92 029,50 94 112,60 91 937,76 92 719,38 12 585,07 12 602,20 12 289,80 12 397,60 12 481,73 12 530,59 15129,09
11 317,80
14 297,25
13 795,14
14 837,94
5187,42 942,68 2,55 157,74 2488,90 185,10
5195,08 943,43 2,55 157,82 2489,39 185,29
5208,64 946,13 2,64 158,21 2492,61 189,25
5358,64 946,13 2,64 158,21 2492,61 189,25
5194,85 943,88 2,58 157,90 2490,20 186,55
5252,33 944,37 2,58 157,96 2490,52 186,68
497,06
497,47
498,35
498,35
497,51
497,78
жилищно-коммунальное хозяйство 3309,02 3312,32 здравоохранение, физическая культура и спорт, социальное обеспечение 289,75 289,49 образование 224,18 223,99 наука и научное обслуживание 169,71 169,67 94,39 культура и искусство 94,25 562,52 другие отрасли 562,15 4 Доходы области — всего, 43 655,87 втом числе: прибыль (убыток)— сальдо 4658,43 4632,18 амортизационные отчисления 5519,01 5621,15 налоговые доходы (без налога на прибыль) 11 761,81 12 027,46 неналоговые доходы 454,12 452,33 средства целевых бюджетных фондов 1268,78 1290,33 средства единого социального налога 3739,98 4086,82 прочие доходы 7987,34 8699,93 сальдо финансовых взаимоотношений с феде ральным уровнем власти 7296,98 7794,42 86 832,67 5 Доходы населения — всего, в том числе: 11 541,84 11 567,48 доходы от предпринимательской деятельности 38 090,81 38 208,38 оплата труда наемных работников социальные трансферты 18 320,83 18 365,36 другие доходы 18 855,92 18 860,89 85 553,94 6 Расходы и сбережения населения — всего, в том числе: покупка товаров и услуг 65 624,06 65 742,39 обязательные платежи и разнообразные выплаты 6217,854 6240,426 прочие расходы 10 907,15 10 938,16
3317,74
3317,74
3312,07
3314,21
289,07 223,29 168,28 94,05 558,99 37 478,61
289,07 223,29 168,28 94,05 558,99 44 245,10
289,35 223,75 169,19 94,18 561,04 41 493,83
289,5! 223,87 169,21 94,27 561,28 43 862,10
5729,00 5196,90 12 742,70 483,30 485,00 5450,80 6371,20
5875,20 5217,30 12 815,30 486,80 885,00 5596,90 6424,10
5300,77 5377,99 5378,84 5325,74 12 350,34 12 500,17 473,01 471,63 798,51 1047,13 4905,21 4854,13 7017,66 7334,43
51 84,00 74 594,70
6944,50 84 211,70
6029,19 82 549,38
7284,47 85 915,33
11 350,00 33 337,60 17 421,80 20 773,60 73 829,70
11 680,00 33751,20 17 986,90 20 773,60 83211,70
11 474,70 36 427,19 18 006,17 19 527,11 81450,46
11 606,86 36 648,36 18 232,90 19 530,34 84 734,16
66 359,10 65 541,79 65 958,24 65 389 6242,00 6184,97 6240,98 6123,90 К) 520,10 10 610,60 10 771,68 10 823,51
К
П р и л о ж е н и е 4
ОО
Прогнозные оценки основных показателей
Показатели
социально-экономического развития Воронежской области на 2004 г., млн р. Интуитивный Комбинированный Формализованный прогноз прогноз прогноз вариант I вариант 11 вариант 1 вариант 11 вариант I вариант 11 4 7 3 5 6 8 97 366,52 103 849,78 82 962,97 103 161,50 89 048,47 103452,30
1 2 1 Валовой региональный продукт — всего, в том числе добавленная стоимость по отраслям: промышленность 24 788,32 18 979,79 сельское и лесное хозяйство 5836,92 строительство 11017,84 транспорт и связь (рыночные услуги) торговля и общественное питание, оптовая тор говля продукцией производственно-технического назначения 14 206,81 другие отрасли 22 671,28 чистые налоги на продукты 6703,62 2 Выпуск товаров и услуг по основным отраслям — 217 324,73 всего, в том числе: объем произведенной промышленной продукции (услуг) в действующих ценах организаций — всего, в том числе по отраслям: 74 607,56 электроэнергетика 14417,77 черная металлургия 1357,85 химическая и нефтехимическая промышленность 10 910,48 15648,70 машиностроение и металлообработка
24 908,18 23 726,80 25 395,30 24 175,29 25189,49 19 072,32 17 940,18 19619,15 18 379,41 19 388,11 5865,84 5329,17 5327,69 5555,91 4955,14 11 070,94 11 434,80 12 287,01 11 258,64 11 773,22 14 274,23 14 436,12 22 770,77 22 716,28 5422,20 6734,49
14 905,20 14 339,24 14 638,61 23 356,71 22 697,27 23109,15 5824,33 5963,60 6208,87
227 223,22 199 659,22 231 688,18 207 122,90 229 801,74
74 967,59 68 322,80 14 428,96 13881,75 1388,47 1358,70 10 916,73 10 451,69 15657,68 15983,21
71 971,10 70 978,11 73237,12 14 299,58 14 108,22 14 354,24 1375,54 1413,70 1453,94 10 901,40 10 645,53 10 907,88 16 611,68 15 841,88 16 208,61
to NO
промышленность строительных материалов лесная, деревообрабатывающая и целлюлознобумажная промышленность легкая промышленность пищевая промышленность медицинская промышленность прочие отрасли продукция сельского хозяйства в хозяйствахи всех категорий — всего, в том числе: продукция растениеводства продукция животноводства строительство торговля и общественное питание, оптовая торговля продукцией производственно-техни ческого назначения транспорт и связь (рыночные услуги) 3 Объем инвестиций (в основной капитал) за счет всех источников финансирования — всего, в том числе: промышленность сельское хозяйство лесное хозяйство строительство транспорт связь торговля и общественное питание, оптовая торговля продукцией производственно-техни ческого назначения жилищно-коммунальное хозяйство
4439,10
4303,39
4488,55
4360,73
4468,90
1314,64 1315,36 600,67 600,28 20 210,14 20 227,02 907,66 907,15 2542,01 2544,02
1386,18 537,28 17 378,36 882,45 2159,07
1431,07 539,77 18 064,41 912,32 3395,83
1355,96 563,90 18 574,79 892,88 2320,86
1382,19 565,50 18 978,11 910,35 3035,94
33513,42
33636,11
31 902,14
32 950,05
32 582,90
33239,91
16 918,07 15126,39 6876,32
16 936,62 15 146,42 6901,83
17 307,14 15066,37 6773,85
19751,46 15061,15 6893,49
17 142,76 15091,73 6817,14
18 562,19 15097,17 6897,01
4442,04
103072,13 103 374,74 102 152,74 108 733,11 102 541,18 106 469,20 14638,88 14 702,40 13887,51 14381,24 14 204,96 14 516,93 17 195,55
18 460,01
14 147,25
18 014,54
15435,16
18 202,75
6531,96 1067,93 2,87 172,43 2571,96 218,79
6561,33 1070,81 2,88 172,75 2573,86 219,54
6562,89 1059,67 3,01 170,87 2542,46
6549,82 1063,16 2,95 171,53 2554,92 223,59
6795,16
227,10
6966,23 1078,59 3,09 I74,03 2617,24 230,89
565,53 3877,66
567,12 3890,28
558,15 3848,58
568,12 3914,93
561,27 3860,87
567.70 3904,52
1075,30 3,00
173,49 2598,91 226,09
О к о н ч а н и е о
1
2 4 5 3 здравоохранение, физическая культура и спорт, социальное обеспечение 326,65 331,51 332,49 образование 250,08 255,28 256,00 наука и научное обслуживание 169,96 173,14 173,29 119,44 118,88 119,40 культура и искусство 598,12 618,15 619,55 другие отрасли 4 Доходы области — всего, 51 198,82 54 100,90 46 098,69 в том числе: 7046,67 прибыль (убыток)— сальдо 4684,77 4705,29 6607,87 5612,65 амортизационные отчисления 6769,28 налоговые доходы (без налога на прибыль) 14486,99 14 899,76 16 183,23 неналоговые доходы 536,46 485,70 485,30 средства целевых бюджетных фондов 1530,08 213,40 1566,20 средства единого социального налога 2937,49 2547,69 6213,91 прочие доходы 8155,14 12 523,38 13426,97 сальдо финансовых взаимоотношений с феде ральным уровнем власти 10 884,85 11 551,16 5443,20 5 Доходы населения — всего, 102 425,82 106 682,64 93989,32 в том числе: доходы от предпринимательской деятельности 14 282,14 14 386,34 13 733,50 50 301,32 50 776,70 39 338,37 оплата труда наемных работников 23 142,65 23 324,25 20 906,16 социальные трансферты 19 929,79 19 951,85 23058,70 другие доходы 6 Расходы и сбережения населения — всего, 101 168,64 105 305,70 91 548,83 в том числе: покупка товаров и услуг 78 383,85 78 870,76 76 505,13 обязательные платежи и разнообразные выплаты 8278,667 8369,674 8206,026 13 897,55 14 023,59 12 939,72 прочие расходы
6
п р и л . 4 7
8
332,43 328,70 254,55 252,28 171,65 171,30 121,32 119,20 609,30 606,58 55 306,38 48 253,49
332,46 255,16 172,34 120,51 613,63 54 797,06
7520,26 5739,03 16 788,04 554,95 725,70 6660,31 8479,81
6672,05 5771,89 15911,83 528,28 424,07 5689,68 8854,06
7066,58 5903,87 16 485,92 543,87 860,18 6002,29 9271,36
10 000,08 6313,86 107 790,98 97 553,74
10 248,25 107 322,71
14 833,60 41 176,46 22 843,36 23 266,43 104 846,74
14 644,63 45 232,56 23046,54 21 866,02 105 040,65
13 965,30 43970,21 21851,08 21 736,73 95613,20
79 630,92 77 298,89 8613,96 8236,717 13 369,36 13 344,4
79 309,75 8510,749 13645,77
Приложение Прогнозные оценки основных показателей
Показатели
5
социально-экономического развития Воронежской области на 2005 г., млн р. Интуитивный Формализованный Комбинированный прогноз прогноз прогноз вариант I вариант II вариант I вариант 11 вариант I вариант 11 4 5 6 7 8 3 104 910,56 121 689,16 95407,41 119 667,34 98 017,21 120 222,58
1 2 1 Валовой региональный продукт— всего, в том числе добавленная стоимостыю отраслям: 29 191,30 промышленность сельское и лесное хозяйство 22 383,70 строительство 6899,92 транспорт и связь (рыночные услуги) 12 970,05 торговля и общественное питание, оптовая тор говля продукцией производственно-технического назначения 16 696,18 другие отрасли 26 367,45 чистые налоги на продукты 7840,14 2 Выпуск товаров и услуг по основным отраслям — всего, 234 440,50 в том числе: объем произведенной промышленной продукции (услуг) в действующих ценах организаций — всего, в том числе по отраслям: 88 559,08 электроэнергетика 17 314,96 черная металлургия 1593,97 химическая и нефтехимическая промышленность 12 418,75 машиностроение и металлообработка 17 933,17
29 457,24 27 048,55 29 458,55 27 637,01 29 458,19 22 589,02 20 272,40 22 758,21 20 852,22 22 711,74 5351,55 5776,77 6964,08 5862,09 6164,72 13087,86 12 578,28 14 744,41 12 685,87 14 289,48 16 845,81 16 890,26 17 588,14 16 836,96 17 384,27 26 588,39 26 123,72 27 093,78 26 190,65 26 954,99 7908,65 6650,22 5639,09 6173,79 6243,55 260 133,02 221 621,74 261 807,65 225 142,09 261 347,75
89 364,20 77 614,69 86 101,21 80 620,29 17 353,75 16 288,83 17 461,96 16 570,64 1596,92 1627,69 1788,27 1618,43 12 440,38 11411,17 12 486,05 11 687,87 17 964,32 18 174,75 19 760,37 18 108,41
86 997,31 17 432,24 1735,72 12 473,51 19 267,13
О к о н ч а н и е 1
2
промышленность строительных материалов лесная, деревообрабатывающая и целлюлознобумажная промышленность легкая промышленность пищевая промышленность медицинская промышленность прочие отрасли продукция сельского хозяйства в хозяйствах и всех категорий — всего, в том числе: продукция растениеводства продукция животноводства строительство торговля и общественное питание, оптовая торговля продукцией производственно-техни ческого назначения транспорт и связь(рыночные услуги) 3 Объем инвестиций (в основной капитал) за счет всех источников финансирования — всего, в том числе: п ромы шл е н ность сельское хозяйство лесное хозяйство строительство транспорт связь торговля и общественное питание, оптовая торговля продукцией производственно-техни ческого назначения
п р и
л. 5
3
4
5
6
7
8
5220,54
5230,73
4922,69
5379,87
5004,49
5338,92
1500,89 707,15 24 662,93 1046,31 3079,68
1503,38 708,52 24 721,47 1048,07 3086,66
1594,63 1715,99 591,55 611,87 19 716,99 21443,21 986,46 1064,58 2407,58 4863,79
1568,88 623,29 21 075,27 1002,90 2592,15
1657,60 638,42 22 343,51 1060,04 4375,74
38 452,83
38 728,32
35244,14
37 991,39
36 125,33
38 193,77
18 890,79 17051,91 7878,92
18 961,29 17 127,79 7936,12
19 274,98 16 756,75 7602,90
24 112,05 17 199,83 8012,92
19 169,47 22 697,52 16 837,81 17 180,04 7678,70 7991,83
115934,18 116 616,36 112 368,01 126 712,28 113 347,37 123939,69 16 979,21 17 120,92 15 554,05 16 826,09 15945,43 16 907,06 19 183,78
22 535,42
17401,12
22 338,02
17 890,68 22 392,23
8134,52 1217,80 3,26 190,07 2672,78 258,98
8202,24 1224,43 3,27 190,79 2677,18 260,71
8137,98 1176,23 3,43 184,54 2567,89 270,25
8916,78 1240,38 3,64 189,69 2721,93 279,37
8137,03 1187,64 3,38 186,05 2596,69 267,15
8720,55 1236,00 3,54 190,00 2709,64 274,25
647,32
650,98
619,55
641,97
627,18
644,45
4580,47 4556,41 4425,87 жилищно-коммунальное хозяйство 4585,49 здравоохранение, физическая культура и спорт, 383,95 365,85 375,65 социальное обеспечение 381,70 294,31 277,59 287,64 образование 292,65 177,71 171,66 176,79 наука и научное обслуживание 177,37 149,45 150,50 155,30 148,25 культура и искусство 688,34 634,01 670,23 685,13 другие отрасли 4 Доходы области — всего, 59 410,49 67 417,95 55 779,42 68 026,84 в том числе: прибыль (убыток)— сальдо 4786,88 4773,58 8596,94 9701,13 8047,38 8294,78 6005,54 6370,32 амортизационные отчисления 18 080,49 18 707,03 20 390,87 22 160,22 налоговые доходы (без налога на прибыль) 529,63 533,06 638,19 неналоговые доходы 590,11 1877,46 1934,59 602,33 средства целевых бюджетных фондов 91,76 1548,36 1089,42 7992,37 средства единого социального налога 7021,72 18 179,05 19 378,63 10 357,02 11 278,15 прочие доходы сальдо финансовых взаимоотношений с феде 15454,52 16 373,92 5660,93 14 500,12 ральным уровнем власти 120 370,93 132 618,38 116 546,76 135 816,63 5 Доходы населения — всего, в том числе: доходы от предпринимательской деятельности 17 630,31 17 883,53 16 480,20 18 987,01 65053,80 66 202,70 46 025,89 50 647,05 оплата труда наемных работников 29 074,04 29 516,91 24 878,33 29 239,50 социальные трансферты 21310,94 21 369,35 25 364,57 25825,74 другие доходы 6 Расходы и сбережения населения — всего, 118 336,27 130 148,19 111 689,57 130 009,96 в том числе: покупка товаров и услуг 94 512,67 95 712,29 88 745,95 96 353,41 обязательные платежи и разнообразные выплаты 10 819,24 11 038,67 109 14,01 11 973,4 прочие расходы 17 632,23 17 938,79 15 786,46 16 979,08
4461,72
4581,85
370,20 281,73 173,23 149,88 648,05 56 776,60
377,93 289,47 177,05 153,69 675,20 67 859,62
8353,09 9385,77 6136,22 6493,49 20 243,00 21 939,21 586,24 631,47 206,05 687,60 6671,43 7550,58 10 857,63 11 796,58 6287,72 14 620,04 117 596,97 134 938,31 16 796,05 51 251,43 26 030,58 24 251,34 113514,92
18 683,96 54 919,02 29 315,69 24 601,90 130 047,92
90 329,64 96 177,35 10 887,99 11716,7 16 293,36 17 242,64
Научное
издание
Давние Валерий Владимирович, Тинякова Виктория Ивановна
ПРОГНОЗНЫЕ МОДЕЛИ ЭКСПЕРТНЫХ ПРЕДПОЧТЕНИЙ Редактор В. В. Пушкаренко Художественный редактор Е. Ю. Бочарникова Компьютерная верстка Е. Н. Попуга Корректоры М. С. Исаева, Г. И. Старухина