А.Н. Тырсин
СИСТЕМНЫЙ АНАЛИЗ. МОДЕЛИ И МЕТОДЫ
Учебное пособие
Воронеж Издательство «Научная книга» 2019
УДК 303.73...
31 downloads
1093 Views
4MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
А.Н. Тырсин
СИСТЕМНЫЙ АНАЛИЗ. МОДЕЛИ И МЕТОДЫ
Учебное пособие
Воронеж Издательство «Научная книга» 2019
УДК 303.732:519,86 ББК 65.063 Т 93 Рецензенты: Кафедра прикладной математики и программирования, ЮжноУральский государственный университет (национальный исследовательский университет), г. Челябинск Сесекин А.Н., доктор физико-математических наук, профессор, ведущий научный сотрудник отдела оптимального управления, Институт математики и механики им. Н.Н. Красовского Уральское отделение РАН, г. Екатеринбург Т 93
Тырсин, А.Н. Системный анализ. Модели и методы: учебное пособие/ А.Н. Тырсин. – Воронеж: Издательство «Научная книга», 2019. – 167 с.
ISBN 978-5-98222-982-3 В учебном пособии рассмотрены основные разделы теории систем и системного анализа, в том числе: предметы и задачи системного анализа; логика и методология системного анализа; модели и методы системного анализа; методы принятия решений в сложных системах; информационные аспекты изучения систем, а также примеры использования методов системного анализа в экономике. Учебное пособие представляет собой конспект лекций для изучения курса «Системный анализ». Для студентов прикладных математических и экономических специальностей вузов. Работа выполнена при финансовой поддержке гранта РФФИ № 17-0100315а. Рис. 26. Табл. 24. Библиогр.: 98 назв.
УДК 303.732:519,86 ББК 65.063 Т 93 ISBN 978-5-98222-982-3
© Тырсин А.Н., 2019
Предисловие
Исключая единичные случаи, необходимо признать, что системная методология редко используется в массовом масштабе и для большинства разработок... характерно эмпирическое развитие метода проб и ошибок. Академик И.М. Макаров
Современный период характеризуется резким возрастанием объема разнообразной информации, который необходимо анализировать современному специалисту для принятия оптимального решения. В соответствии с изменяющимися внешними условиями должны задаваться и системные требования к структуре и функциям аппарата управления предприятий и организаций, вырабатываться методы принятия управленческих решений в сложных экономических ситуациях. Это делает необходимым расширять кругозор специалистов, развивать междисциплинарные связи, прививать системное мышление. Наряду с реализацией этих тенденций в преподавании традиционных предметов, целесообразно включение в учебные планы специфических «системных» курсов, излагающих методологию исследования и проектирования сложных систем. Данное учебное пособие отвечает потребности в учебной литературе по таким курсам. Целью изучения данной дисциплины является рассмотрение теоретических основ и закономерностей построения и функционирования систем, методологических принципов их анализа и синтеза, применение изученных закономерностей для выработки системных подходов при принятии решений. Задачами дисциплины являются приобретение студентами теоретических знаний по системному подходу к исследованию систем и практических навыков по их моделированию. Для освоения данного курса требуется базовая математическая подготовка по высшей
3
математике, теории вероятностей и математической статистике, дискретной математике. В учебном пособии рассмотрены все основные разделы теории систем и системного анализа, в том числе: предметы и задачи системного анализа; логика и методология системного анализа; модели и методы системного анализа; методы принятия решений в сложных системах; информационные аспекты изучения систем, а также примеры использования методов системного анализа в экономике. Содержание учебного пособия представляет собой конспект лекций курса, читаемого автором магистрантам по направлению подготовки 01.04.04 «Прикладная математика» программы «Математическое моделирование в технике и экономике» в Уральском федеральном университете имени первого Президента России Б.Н. Ельцина.
4
Глава 1. Предмет и задачи системного анализа 1.1. Системный анализ и его место среди других научных направлений Многообразие и возрастающие объем и сложность задач требует их взаимной увязки, обеспечения общей целенаправленности. Но этого трудно достичь, если не учитывать сложных взаимосвязей между исследуемыми объектами и системами. Например, 40% информации специалисту необходимо получать из смежных областей, часто весьма отдаленных [71]. Развитие узкоспециальных дисциплин часто стало выходить на обобщающий уровень. Появилась потребность в специалистах «широкого профиля», обладающих знаниями не только в своей области, но и в смежных областях и умеющих эти знания обобщать, использовать аналогии, формировать комплексные модели. Поэтому, наряду с аналитическими методами, эффективными при изучении частных процессов, нужен подход, принцип, который помог бы разобраться в логических связях между отдельными разнородными фактами. Такой принцип получил название системного подхода. Научное направление, названное теорией систем, возникло в 1940-50 годы. Австрийский биолог и философ Л. фон Берталанфи (Ludwig von Bertalanffy), считающийся основоположником этого направления, обобщил идеи, содержащиеся в теории открытых систем, и выдвинул программу общей теории систем [7, 92]. Общая теория систем в широком смысле (по Берталанфи) – фундаментальная наука, охватывающая всю совокупность проблем, связанных с исследованием и конструированием систем. Состав общей теории систем приведен на рис. 1.1 [71]. С целью обобщения прикладных научных исследований, связанных с исследованием и проектированием систем в 1970-е годы был введен термин «системные исследования». Определение 1.1. Системные исследования – вся совокупность научных и технических проблем, которые при всей их специфике и разнообразии сходны в понимании и рассмотрении исследуемых ими объектов как систем, т.е. множества взаимосвязанных элементов, выступающих в виде единого целого. Наиболее конструктивным из прикладных направлений системных исследований в настоящее время считается системный анализ [67]. Термин «системный анализ» впервые появился в США в исследовательском центре RAND в 1948 г., а в СССР – в 1969 г. Образцом системного анализа (хотя в то время этот термин не был принят) можно считать план ГОЭЛРО, 5
разработанный для взаимоувязки программы электрофикации с общей программой подъема производительных сил как по стране в целом, так и по отдельным ее отраслям и регионам.
Рис. 1.1. Состав общей теории систем Одного общепринятого определения системного анализа Приведем один из наиболее распространенных вариантов [82].
нет.
Определение 1.2. Системный анализ – методология трудно наблюдаемых и трудно понимаемых свойств и отношений в объектах с помощью представления этих объектов в качестве целенаправленных 6
систем и изучения свойств этих систем и взаимоотношений между целями и средствами их реализации. Это определение позволяет отличить методы системного анализа от других методов исследования и относит его к определенной области научных знаний. Почти все методы исследования исходят из четко сформулированной заранее задачи. Системный анализ решает вопросы, как правильно ставить задачи, какие методы исследования использовать. Главное в системном анализе – как сложное превратить в простое, как не только трудноразрешимую, но и труднопонимаемую проблему превратить в четкую серию задач, имеющих метод решения. Однако эта цель ввиду сложности объектов исследования не может быть решена полностью. Поэтому, чтобы не свестись к общефилософским рассуждениям, с одной стороны, и конкретным частным задачам, с другой, системный анализ должен иметь границы его применения. В качестве иллюстрации этого тезиса приведем две цитаты: Академик А.И. Берг: «Я не знаю ни одного завершенного системного исследования в технике» [2]. Доктор экономических наук Ю.И. Черняк: «Системный анализ характеризуется главным образом не специфическим научным аппаратом, а упорядоченным, логически обоснованным подходом к исследованию проблемы и использованию соответствующих методов их решения, которые могут быть разработаны в рамках других наук» [82]. Системный анализ всегда имеет дело с определенным объектом, с конкретной проблемой. Основными специфическими особенностями системного анализа, отличающими его от других системных направлений, являются: - наличие средств для организации процессов целеобразования, структуризации и анализа целей; в отличии от других системных дисциплин, ставящих задачу достижения целей, разработки вариантов пути их достижения и выбора наилучшего из этих вариантов, системный анализ рассматривает объекты как системы с активными элементами, способные и стремящиеся к целеобразованию, а затем уже и к достижению сформированных целей; - разработка и использование методики, в которой определены этапы, подэтапы системного анализа и методы их выполнения. Причем в методике сочетаются как формальные методы и модели, так и методы активизации интуиции специалистов, помогающие использовать их знания и опыт и развивать модель исследуемого объекта или процесса. Эти особенности обусловливают важность и привлекательность системного анализа для прикладных математиков в экономических приложениях.
7
1.2. Области применения системного анализа в экономике Вряд ли возможно классифицировать все ситуации экономического управления, при которых возникает потребность в системном анализе. Следует отметить наиболее распространенные типы ситуаций управления, в которых возможно применение системного анализа [82]: 1) Решение новых проблем. С помощью системного анализа формулируется проблема, определяется, что и о чем нужно знать, кто должен знать. 2) Решение проблемы предусматривает увязку целей с множеством средств их достижения. 3) Проблема имеет разветвленные связи, вызывающие отдаленные последствия в разных отраслях народного хозяйства, и принятие решения по ним требует учета полной эффективности и полных затрат. 4) Решение проблем, в которых существуют различные трудно сравнимые друг с другом варианты решения проблемы или достижения взаимосвязанного комплекса целей. 5) Случаи, когда в народном хозяйстве создаются совершенно новые системы или коренным образом перестраиваются старые системы. 6) Случаи, когда осуществляется улучшение, совершенствование, реконструирование производства или экономических отношений. 7) Проблемы, связанные с автоматизацией производства, а особенно управления, в процессе создания автоматизированных систем управления в любом звене. 8) Работа по совершенствованию методов и форм экономического управления, ибо известно, что ни один из методов экономического управления не действует сам по себе, а только в определенном сочетании, во взаимосвязи. 9) Случаи, когда совершенствование организации производства или управления проводится на объектах уникальных, нетипичных, отличающихся большой спецификой своей деятельности, где нельзя действовать по аналогии. 10) Случаи, если принимаемые на будущее решения, разработка плана или программы развития должны учитывать фактор неопределенности и риска. 11) Случаи, когда планирование или выработка ответственных решений о направлениях развития принимается на достаточно отдаленную перспективу. 12) Разработка или совершенствование системы управления, когда имеется в виду создание системы оптимального планирования или управления, где требуется выработка самих критериев оптимальности с учетом целей развития и функционирования экономической системы, ее места в общественном разделении труда и экономических взаимосвязей. 8
1.3. Базовые определения и основные модели систем Центральной концепцией теории систем, системного подхода, всей системологии является понятие системы. В настоящее время нет единства в определении понятия «система», в подходах к классификации систем, в трактовке основных системных закономерностей. Определение понятия «система» изменялось не только по форме, но и по содержанию. 1.3.1. Первое определение системы. Система как средство достижения цели Рассмотрим искусственную, то есть создаваемую человеком систему. Цели, которые ставит перед собой человек, редко достижимы только за счет его собственных возможностей или внешних средств, имеющихся у него на данный момент. Такое стечение обстоятельств называется проблемной ситуацией [55]. Наличие проблемной ситуации у существующего положения обычно осознается в несколько «стадий»: от смутного ощущения, что «что-то не так», к осознанию потребности, затем к выявлению проблемы и, наконец, к формулировке цели. Цель – это субъективный образ (абстрактная модель) несуществующего, но желаемого состояния среды, которое решило бы возникшую проблему. Вся последующая деятельность, способствующая решению этой проблемы, направлена на достижение поставленной цели, то есть это работа по созданию того, что мы будем называть системой. Это и есть первое определение системы: Определение 1.3. Система есть средство достижения цели. Первое определение системы как «средство достижения цели» выдвигает на первый план целевую подчиненность всех сторон организации системы. Однако даже на простых примерах обнаруживаются сложности: - соответствие между целями и системами может быть не однозначным (одна система может быть связана с несколькими целями, а одной цели могут отвечать разные системы); - часто бывает непросто выявить действительные цели существующей системы. Тем не менее целевая предназначенность системы – ее исходное, главное свойство. Приведем несколько упрощенных примеров систем, предназначенных для реализации определенных целей (табл. 1.1).
9
Таблица 1.1. Примеры систем, предназначенных для реализации определенных целей Цель Спланированное по времени перемещение жителей города В произвольный момент указать время Обеспечить выпечку хлеба в заданном ассортименте для значительного количества людей Обеспечить быстрое перемещение большого числа людей по их желанию в пределах города
Система Остановка общественного транспорта Часы Пекарня Городской транспорт
1.3.2. Модель «черного ящика» В определении системы как средства достижения цели, акцентируется назначение системы. Поэтому существуют возможности воздействовать на такую систему из внешней среды, например, уточнять ее работу, снабжать энергией, наблюдать и т.д. Рассмотрим определение 1.3 с этих позиций. Во-первых, данное определение ничего не говорит о внутреннем устройстве системы. Поэтому представим ее в виде непрозрачного «ящика», выделенного из окружающей среды. Эта модель отражает два важных свойства системы – целостность и обособленность от среды. Во-вторых, в определении системы косвенно говорится о том, что хотя «ящик» и обособлен, выделен из среды, но не является полностью от нее изолированным. Иначе говоря, система связана со средой и с помощью этих связей воздействует на среду. Изобразим эти связи в виде стрелок, направленных от системы в среду, которые называются выходами системы. В-третьих, в определении имеется указание на то, что система является средством, поэтому должны существовать и возможности ее использования, воздействия на нее. Это связи другого типа, их можно изобразить в виде стрелок, направленных от среды в систему. Они называются входами системы. В результате мы построили модель системы, которая получила название черного ящика, ее визуальное схематичное изображение приведено на рис.1.2. Понятие «черный ящик» было предложено У.Р. Эшби (William Ross Ashby) [89]. Название «черный ящик» образно подчеркивает полное отсутствие сведений о внутреннем содержании системы. В этой модели задаются только входные и выходные связи системы со средой, и в то же время абстрагироваться от их внутреннего устройства. Таким образом, система изучается не как совокупность взаимосвязанных элементов, а как нечто целое, взаимодействующее со средой на своих входах и выходах. Простота данной модели – перечисление лишь входов и выходов системы
10
обманчива. Как только это потребуется для конкретной реальной системы, мы сталкиваемся с трудностями.
Рис. 1.2. Модель «черного ящика» Определение 1.4. Модель «черного ящика» – модель системы, представляющая собой структуру с известными выходными и входными параметрами и неизвестным внутренним устройством. Пример 1.1. Опишем выходы системы «наручные часы» [55]. Учитывая, что выходы соответствуют конкретизации цели, фиксируем в качестве выхода показание времени в произвольный момент. Затем принимаем во внимание, что сформулированная таким образом цель относится ко всем часам, а не только к нашим. Чтобы различить их, вносим следующее добавление (выход): удобство ношения часов на запястье; тогда появляется обязательность ремешка или браслета, а с ним и еще один выход: удовлетворение требований санитарии и гигиены, так как не любое крепление часов на руке допустимо с этой точки зрения. Далее, представив себе условия эксплуатации часов, можно добавить достаточную в бытовых условиях прочность; пылевлагонепроницаемость. Затем, расширив понятие «условия эксплуатации часов», добавим еще два выхода: достаточную для бытовых нужд точность; легкость прочтения показаний часов при беглом взгляде на циферблат. Можно еще более расширить круг учитываемых требований к часам, что позволит добавить несколько выходов: соответствие моде и понятию красоты; соответствие цены часов покупательной способности потребителя. Очевидно, что список желаемых, то есть включаемых в модель выходов можно продолжить. Например, можно потребовать, чтобы имелась возможность прочтения показаний часов в полной темноте, и реализация этого выхода приведет к существенному изменению конструкции часов. А ведь еще не говорилось о габаритах, весе, многих других физических, химических, экономических и социальных аспектах использования наручных часов.
11
Пример 1.2. Рассмотрим модель черного ящика в виде изолированно взятого уравнения множественной регрессии. Стремление включить в уравнение множественной регрессии как можно больше объясняющих переменных, не вникая в суть их взаимосвязи с выходной переменной обычно приводит к бессмысленному результату (может возникнуть несоответствие знаков при коэффициентах регрессии априорным предположениям, а также с необъяснимые изменения их значений). Для проведения корректного анализа необходимо знать всю совокупность связей между переменными. Рассмотренные примеры свидетельствуют, что построение модели «черного ящика» не является тривиальной задачей. Главной причиной множественности входов и выходов в модели «черного ящика» является то, что всякая реальная система взаимодействует с объектами окружающей среды неограниченным числом способов. Всегда существует опасность неполноты составления перечня входов и выходов как вследствие того, что важные из них могут быть сочтены несущественными, так и в силу неизвестности некоторых из них на момент построения модели. 1.3.3. Модель состава системы Очевидно, что вопросы, касающиеся внутреннего устройства системы, невозможно решить только с помощью модели «черного ящика». Для этого необходимы более развитые, более детальные модели [55]. При рассмотрении любой системы, прежде всего, обнаруживается то, что ее целостность и обособленность, отображенные в модели «черного ящика», выступают как внешние свойства. Внутренность же «ящика» оказывается неоднородной, что позволяет различать составные части самой системы. При более детальном рассмотрении некоторые части системы могут быть в свою очередь разбиты на составные части и т.д., те части системы, которые рассматриваются как неделимые, будут называться элементами. Части системы, состоящие более чем из одного элемента, называются подсистемами. В результате получается модель состава системы, описывающая, из каких подсистем и элементов она состоит (рис. 1.3). Модель состава системы отображает, из каких частей (подсистем и элементов) состоит система. Главная трудность в построении модели состава заключается в том, что разделение целостной системы на части является относительным, условным, зависящим от целей моделирования (это относится не только к границам между частями системы, но и к границам самой системы). Кроме того, относительным является и определение самой малой части – элемента.
12
Рис. 1.3. Модель состава системы Рассмотрим упрощенные примеры моделей состава системы для некоторых систем (табл. 1.2). Таблица 1.2. Примеры моделей состава системы Система Система спутникового телевидения
Подсистемы Подсистема передачи Канал связи Приемная подсистема
Семья
Члены семьи Имущество семьи
Отопительная система жилого дома
Источники тепла Подсистема распределения и доставки тепла Подсистема эксплуатации
Элементы Центральная телестудия, антеннопередающий центр Среда распространения радиоволн, спутники-ретрансляторы Местные телецентры, телевизоры потребителей Муж, жена, предки, потомки, другие родственники Общее жилье и хозяйство, личная собственность членов семьи Котельная или отвод от центральной теплотрассы Трубы, калориферы, вентили Службы эксплуатации и ремонта, персонал
1.3.4. Модель структуры системы Для достижения многих практических целей достаточно модели «черного ящика» или модели состава. Однако, очевидно, есть вопросы, решить которые с помощью этих моделей нельзя. Например, чтобы получить велосипед, недостаточно иметь «ящик» со всеми отдельными его деталями. Необходимо еще правильно соединить все детали между собой, то есть установить между элементами определенные связи – отношения.
13
Совокупность необходимых и достаточных для достижения цели отношений между элементами называется структурой системы. Пример 1.3. Рассмотрим систему «часы вообще». Считаем, что в состав такой системы входят три элемента: датчик, индикатор и эталон времени. Структура часов определяется отношениями между парами элементов, приведенными в табл. 1.3. Таблица 1.3. Отношения между парами элементов системы «часы вообще» Пара элементов Датчик и индикатор Эталон и датчик Индикатор и эталон
Связь между ними Однозначное соответствие Приблизительное соответствие Периодическое сравнение и устранение расхождения
Отношения между элементами могут быть самыми разнообразными. Однако можно попытаться их классифицировать и по возможности перечислить. Трудность состоит в том, что мы знаем не все реально существующие отношения и вообще неизвестно, является ли конечным их число. Говоря, что свойства какого-то объекта можно использовать в системе, мы имеем в виду установление некоторых отношений между данным объектом и другими частями системы, то есть включение этих отношений в структуру системы. Модель структуры системы отображает связи между компонентами модели ее состава, то есть совокупность связанных между собой моделей «черного ящика» для каждой из частей системы. Поэтому трудности построения модели структуры те же, что и для построения модели «черного ящика». 1.3.5. Второе определение системы. Структурная схема системы На основе изложенного выше дадим второе определение системы [55]. Определение 1.5. Система есть совокупность взаимосвязанных элементов, обособленная от среды и взаимодействующая с ней как целое. Это определение охватывает рассмотренные модели «черного ящика», состава и структуры. Все вместе они образуют еще одну модель, которую называют структурной схемой системы. В структурной схеме системы указываются все элементы системы, все связи между элементами внутри системы и связи определенных элементов с окружающей средой (входы и выходы системы).
14
Пример 1.4. Структурная схема системы «синхронизируемые часы» приведена на рис. 1.4. Элементы системы изображены в виде прямоугольников; связи 13 между элементами описаны в примере 1.3; вход 4 изображает поступление энергии извне; вход 5 соответствует регулировке индикатора; выход 6 – показанию часов.
Рис. 1.4. Структурная схема часов Все структурные схемы имеют нечто общее. Если абстрагироваться от содержательной стороны структурных схем, оставив в рассматриваемой модели только общее для каждой схемы, то в результате получим схему, в которой обозначается только наличие элементов и связей между ними, а также (в случае необходимости) разница между элементами и между связями. Такая схема называется графом. Следовательно, граф состоит из обозначений элементов произвольной природы, называемых вершинами, и обозначений связей между ними, называемых ребрами (если направление связи не учитывается и не обозначается) или дугами (если направление связи учитывается и обозначается). Часто бывает необходимо отразить несимметричность некоторых связей; в таких случаях линию, изображающую ребро, снабжают стрелкой (дуга). Если направления связей не обозначаются, то граф называется неориентированным, при наличии стрелок – ориентированным (полностью или частично). Данная пара вершин может быть соединена любым количеством ребер; вершина может быть соединена сама с собой (тогда ребро называется петлей). Если в графе требуется отразить другие различия между элементами или связями, то либо приписывают разным ребрам различные веса (взвешенные графы), либо раскрашивают вершины или ребра (раскрашенные графы). Оказалось, что для графов может быть построена содержательная теория, имеющая многочисленные приложения. Разнообразные задачи этой теории связаны с различными преобразованиями графов, а также с 15
возможностью рассмотрения различных отношений на графах: весов, рангов, цветов, вероятностных характеристик (стохастические графы) и т.д. Графы могут изображать любые структуры, если не накладывать ограничений на пересекаемость ребер. Некоторые типы структур имеют особенности, важные для практики, они выделены из других и получили специальные названия. Так, в организационных системах часто встречаются линейные, древовидные (иерархические) и матричные структуры; в технических системах чаще встречаются сетевые структуры (рис. 1.5); особое место в теории систем занимают структуры с обратными связями, которые соответствуют кольцевым путям в ориентированных графах.
Рис. 1.5. Графы, соответствующие различным структурам: а) линейная; б) древовидная; в) матричная; г) сетевая Пример 1.5. Структурная схема ЭВМ пятого поколения, позволяющая не умеющему программировать пользователю, решать достаточно сложные задачи, приведена на рис. 1.6. Одной структурной информации, которая содержится в графах, для ряда исследований недостаточно. В таких случаях методы теории графов становятся вспомогательными, а главным является рассмотрение конкретных функциональных связей между входными, внутренними и выходными переменными системы. В заключение можно отметить, что структурная схема системы является наиболее полной моделью любой системы. При этом остается актуальным вопрос об адекватности модели, разрешаемый только на практике.
16
Рис. 1.6. Структурная схема ЭВМ пятого поколения 1.3.6. Динамические модели систем Выше были построены модели, которые являются как бы «фотографиями» системы, отображают ее в некоторый момент времени. В этом смысле их можно назвать статическими моделями. Системы, в которых происходят какие бы то ни было изменения, называют динамическими, а модели, отображающие эти изменения, динамическими моделями систем. Различают два типа динамики системы: ее функционирование и развитие. Под функционированием подразумевают процессы, которые происходят в системе (и окружающей ее среде), стабильно реализующей фиксированную цель. Развитием называют то, что происходит с системой при изменении ее целей. Характерной чертой развития является тот факт, что существующая структура перестает соответствовать новой цели, и для обеспечения новой функции приходится изменять структуру, а иногда и состав системы. Типы динамических моделей такие же, как и рассмотренные выше статических моделей, только их элементы имеют временный характер. В табл. 1.4 приведены описания динамических моделей. Таблица 1.4. Типы основных моделей для динамического варианта Модель «черного ящика» Вход: начальное состояние. Выход: конечное (желаемое состояние)
Модель состава Перечень действий, необходимых для перевода начального состояния в конечное
Модель структуры Последовательность действий и продолжительность каждого действия
Структурная схема системы Сетевой график всего процесса
17
С помощью динамических моделей осуществляется отображение процессов, происходящих в системе и в окружающей среде. Всякая реальная динамическая система подчинена принципу причинности: отклик (выходной сигнал) не может появиться раньше входного воздействия. Условия, при которых модель отражает этот принцип, называются условиями физической реализуемости модели.
1.4. Понятия, характеризующие строение и функционирование систем Рассмотрим ниже понятия, с помощью которых уточняют представление о системе и характеризуют ее строение и функционирование [67]. Элемент. Под элементом понимают простейшую неделимую часть системы. Ответ на вопрос, что является такой частью, может быть неоднозначным и зависит от цели рассмотрения объекта как системы, от точки зрения на него или от аспекта его изучения. Таким образом, элемент – это предел членения системы с точки зрения решения конкретной задачи или поставленной цели. Поскольку элемент выступает как своеобразный предел возможного членения объекта, собственное его строение (или состав) обычно не принимается во внимание в характеристике системы: составляющие элементы уже не рассматриваются как компоненты данной системы. Подсистема. Система может быть разделена на элементы не сразу, а последовательным расчленением на подсистемы, которые представляют собой компоненты более крупные, чем элементы, и в тоже время более детальные, чем система в целом. Возможность деления системы на подсистемы связана с вычленением совокупностей взаимосвязанных элементов, способных выполнять относительно независимые функции, подцели, направленные на достижение общей цели системы. Названием подсистема подчеркивается, что такая часть должна обладать свойствами системы, в частности свойством целостности. Этим подсистема отличается от простой группы элементов, для которой не сформулирована подцель и не выполняются свойства целостности (для такой группы используется название компоненты). Структура. Если для решения задачи оказывается достаточным определить элементы и связи, которых относительно немного, то других понятий, характеризующих строение и функционирование систем, не требуется. Однако, как правило, элементов оказывается очень много, они неоднородны и возникает необходимость многоступенчатого расчленения системы. В этом случае вводится понятие структуры. Структура (от латинского слова «structure», означающего строение, расположение, порядок) отражает наиболее существенные взаимоотношения между 18
элементами и их группами (компонентами, подсистемами), которые мало меняются при изменениях в системе и обеспечивают существование системы и ее основных свойств. Структура может быть представлена: - в виде графического отображения; - в виде теоретико-множественных описаний; - в виде матриц; - в виде графов; - с помощью языков моделирования структур. Структуру часто стремятся представить в виде иерархии. Термин иерархия («многоступенчатость», служебная лестница») определяет упорядоченность компонентов по степени важности. Между уровнями иерархической структуры могут существовать взаимоотношения строгого подчинения компонентов (узлов) нижестоящего уровня одному из компонентов вышестоящего уровня, то есть отношения так называемого древовидного порядка. Такие иерархии называют сильными или иерархиями типа «дерева». Они имеют ряд особенностей, делающих их удобным средством представления систем управления. Однако между уровнями иерархической структуры не обязательно должны существовать взаимоотношения строгого древовидного порядка. Один и тот же узел нижестоящего уровня иерархии может быть одновременно подчинен нескольким узлам вышестоящего уровня. Такие структуры называют иерархическими структурами со слабыми связями. Между уровнями иерархической структуры могут существовать и более сложные взаимоотношения. Одна и та же система может быть представлена разными структурами в зависимости от этапа отображения объекта или процесса в виде системы, от аспекта представления системы, цели ее создания. Связь. Понятие связь входит в любое определение системы наряду с понятием элемент и обеспечивает возникновение и сохранение структуры и целостных свойств системы. Данное понятие одновременно характеризует и строение, и функционирование системы. Связь можно охарактеризовать направлением, силой, характером (видом). По первым двум признакам связи делятся на направленные и ненаправленные, слабые и сильные, а по характеру – на связи подчинения, связи порождения, равноправные, связи управления, связи развития, связи функционирования. Связи можно разделить также по месту приложения (внешние и внутренние), по направленности процессов в системе в целом или в отдельных ее подсистемах (прямые и обратные) и по некоторым более частным признакам. Связи в конкретных системах могут одновременно характеризоваться несколькими из перечисленных признаков. Очень важную роль в системах (как в технических, так и в организационных) играет понятие обратной связи. Обратная связь 19
является основой саморегулирования и развития систем, приспособления их к меняющимся условиям существования. Состояние. Понятие состояние характеризует мгновенную фотографию, «срез» системы, остановку в ее развитии. Его определяют либо через входные воздействия и выходные сигналы (результаты), либо макропараметры, макросвойства системы. Поведение. Если система способна переходить из одного состояния в другое (например, s1 s2 s3), то говорят, что она обладает поведением. Этим понятием пользуются, когда неизвестны закономерности переходов из одного состояния в другое. Тогда говорят, что система обладает какимто поведением, и выясняют его закономерности. Поведение можно представить как функцию st f (st 1 , yt , xt ) , где y, x – соответственно управляющие и возмущающие (неконтролируемые) входы системы. Равновесие. Понятие равновесия определяют как способность системы в отсутствие внешних возмущающих воздействий (или при постоянных воздействиях) сохранить свое состояние сколь угодно долго. Устойчивость. Способность системы возвращаться в состояние равновесия после того как она была из этого состояния выведена под влиянием внешних возмущающих воздействий, называют устойчивостью. Равновесие и устойчивость в экономических и организационных системах – гораздо более сложные понятия, чем в технике, и до недавнего времени ими пользовались только для некоторого предварительного представления о системе. В последнее время появились попытки формализованного отображения этих процессов и в сложных организационных системах, помогающие выявить параметры, влияющие на их протекание и взаимосвязь. Развитие. Исследованию процесса развития, соотношения процессов развития и устойчивости, изучению механизмов, лежащих в их основе, в теории систем уделяют большое внимание. Понятие развитие помогает объяснить сложные процессы в природе и обществе. Цель. Применение понятия цель и связанных с ним понятий целенаправленности, целеустремленности, целесообразности сдерживается трудностью их однозначного толкования в конкретных условиях. Это связано с тем, что процесс целеобразования и соответствующий ему процесс обоснования целей в организационных системах весьма сложен. В практических случаях в зависимости от сложности исследуемых объектов и проблем цель может представляться по-разному.
1.5. Основные закономерности систем В понятийном аппарате теории систем находят воплощение выработанные практикой и обобщенные наукой общие правила мышления и человеческой деятельности, которые составляют закономерности систем. 20
Они характеризуют принципиальные особенности построения, функционирования и развития сложных систем [19]. О закономерностях (свойствах) систем можно говорить в разных смыслах. Исследование и представление закономерностей существенно зависит от выбранного метода отображения и анализа системы. Целостность (эмерджентность). Закономерность целостности проявляется в системе в возникновении новых обобщающих качеств, не свойственных образующим ее элементам. Двумя сторонами целостности являются: - свойства системы (целого) QS не являются суммой свойств ее элементов n
(частей) qi: QS qi ; i 1
- свойства системы (целого) зависят от свойств ее элементов (частей): QS f (q1 ,, qn ) . Существенным проявлением целостности являются новые взаимоотношения системы как целого со средой, отличные от взаимодействия с ней отдельных элементов. Иными словами, объединенные в систему элементы могут терять ряд свойств, присущих им вне системы, то есть система как бы подавляет некоторые свойства своих элементов. Например, система производства в рабочее время подавляет у своих работников вокальные, хореографические и некоторые другие способности и использует только те свойства, которые нужны для осуществления процесса производства. Аддитивность (делимость). Закономерностью, двойственной по отношению к целостности, является аддитивность (или делимость) – рассмотрение целостного объекта как состоящего из частей. Свойство физической аддитивности проявляется у системы, как бы распавшейся на независимые элементы. Тогда становится справедливым соотношение n
QS qi . В этом крайнем случае говорить о системе как таковой нельзя. i 1
Строго говоря, любая система находится всегда между крайними состояниями абсолютной целостности и абсолютной аддитивности, и состояние системы (ее «срез») можно охарактеризовать степенью проявления этих свойств или тенденций. Изолированность. Совокупность объектов, образующих систему, и связи между ними можно ограничить от их окружения и рассматривать изолированно. Коммуникативность. Изолированность системы является относительной. Закономерность коммуникативности проявляется в том, что система не изолирована от других систем, а связана множеством коммуникаций со средой, представляющей собой сложное и неоднородное образование, содержащее подсистему (одного уровня с рассматриваемой), 21
задающую требования и ограничения исследуемой системе. Таким образом, коммуникативность характеризует взаимосвязанность системы со средой. Идентифицируемость. Каждая составная часть системы (элемент) может быть отделена от других составляющих, то есть идентифицирована. Множественность. Каждый элемент системы обладает собственным поведением и состоянием, отличным от поведения и состояния других элементов и системы в целом. Наблюдаемость. Все без исключения входы и выходы системы либо контролируемы наблюдателем, либо наблюдаемы. Неопределенность. Наблюдатель не может одновременно фиксировать все свойства и отношения элементов системы и именно с целью их выявления осуществляет исследование. Отображаемость. Язык наблюдателя имеет достаточно общих элементов с естественным языком исследуемого объекта, чтобы отобразить все те свойства и отношения, которые нужны для решения задачи. Нетождественность отображения. Знаковая система наблюдателя отлична от знаковой системы проявления свойств объектов и их отношений, система строится с помощью перекодирования в новую знаковую систему; неизбежная при этом потеря информации определяет нетождественность системы исследуемому объекту. Иерархичность. Закономерность иерархичности заключается в том, что более высокий иерархический уровень оказывает направляющее воздействие на нижележащий уровень, подчиненный ему. Это воздействие проявляется в приобретении подчиненными членами иерархии новых свойств, отсутствовавших у них в изолированном состоянии. В результате формируется новая целостность, то есть возникшее новое целое приобретает способность осуществлять новые функции, в чем и состоит цель образования иерархии. Эквифинальность (потенциальная эффективность). Закономерность эквифинальности характеризует предельные возможности систем. Применительно к открытой системе – это ее способность (в отличие от состояний равновесия в закрытых системах, полностью детерминированных начальными условиями) достигать не зависящего от времени состояния, которое не зависит от ее исходных условий и определяется исключительно параметрами системы. Закон «необходимого разнообразия». Данная закономерность заключается в следующем. Создавая систему, способную справиться с решением проблемы, обладающей определенным известным разнообразием, нужно обеспечить, чтобы система имела еще большее разнообразие, чем разнообразие решаемой проблемы, или была бы способна создать в себе это разнообразие. 22
Применительно к системам управления закон «необходимого разнообразия» может быть сформулирован так: разнообразие управляющей системы должно быть больше (или, по крайней мере, равно) разнообразия управляемого процесса или объекта. Историчность. Любая система не может быть неизменной, она не только функционирует, но и развивается. Можно привести примеры становления, расцвета, упадка (старения) биологических, социальных и технических систем. Таким образом, время является непременной характеристикой системы, и каждая система исторична. Закономерность самоорганизации. Во всех явлениях, в том числе и в развивающихся системах имеет место дуализм. С одной стороны, справедлив второй закон термодинамики, то есть стремление к возрастанию энтропии, к распаду, дифференциации, а с другой стороны, наблюдаются негэнтропийные тенденции, лежащие в основе эволюции, развития. При моделировании негэнтропийных тенденций введен термин повышения организованности, порядка, а закономерность негэнтропийных тенденций названа закономерностью самоорганизации.
1.6. Классификация систем Классификацией называется распределение некоторой совокупности объектов на классы по наиболее существенным признакам. Цель любой классификации – ограничить выбор подходов к отображению классифицируемых объектов. Любая классификация является относительной и представляет собой лишь модель реальности. Поэтому ее не следует абсолютизировать. Большинство классификаций являются произвольными (эмпирическими), то есть их авторами просто перечисляются некоторые виды систем, существенные с точки зрения решаемых задач, а вопросы о принципах выбора признаков (оснований) деления систем и полноте классификации при этом даже не ставятся [37]. Требования к построению классификации следующие: - в одной и той же классификации необходимо применять одно и то же основание; - полнота классификации (объем элементов классифицируемой совокупности должен равняться объему элементов всех образованных классов); - члены классификации (образованные классы) должны взаимно исключать друг друга, то есть должны быть непересекающимися; - подразделение на классы (для многоступенчатых классификаций) должно быть непрерывным, то есть при переходах с одного уровня иерархии на другой необходимо следующим классом для исследования брать ближайший по иерархической структуре системы.
23
В соответствии с этими требованиями классификация систем можно осуществить различными способами [9, 55, 64, 67]: - классификация по виду отображаемого объекта (технические, экономические, биологические и т.п. системы); - классификация по виду научного направления, используемого для моделирования (математические, физические, химические и т.д.); - классификация по происхождению (естественные, искусственные и смешанные системы); - классификация по типу оператора S системы («черный ящик» – S неизвестно, непараметризованный класс – S известно частично, параметризованный класс – S известно до параметров, «белый ящик» – S известно полностью); - классификация по способу управления (самоуправляемые, управляемые извне, с комбинированным управлением); - классификация по степени сложности (сложные и простые системы); - классификация по размеру (большие и малые системы); - классификация по степени организованности (хорошо организованные, плохо организованные и самоорганизующиеся системы); - классификация на детерминированные и вероятностные системы, т.е. системы, имеющие детерминированные характеристики, и системы, в которых происходят стохастические события; - классификация на абстрактные и материальные системы, т.е. на системы, отображаемые абстрактными моделями, и реально существующие системы; - классификация по способности обмениваться со средой энергией и веществом (изолированные, закрытые и открытые системы); - и т.д. В качестве примера приведем классификацию систем на абстрактные и материальные (рис. 1.7). Материальные системы являются объектами реального времени. Среди всего многообразия материальных систем существуют естественные и искусственные системы. Естественные системы представляют собой совокупность объектов природы, а искусственные системы – совокупность социальноэкономических или технических объектов. Естественные системы, в свою очередь, подразделяются на астрокосмические и планетарные, физические и химические. Искусственные системы могут быть классифицированы по нескольким признакам, главным из которых является роль человека в системе. По этому признаку можно выделить два класса систем: технические и организационно-экономические системы. В основе функционирования технических систем лежат процессы, совершаемые машинами, а в основе функционирования организационно24
экономических систем – процессы, совершаемые человеко-машинными комплексами.
Рис. 1.7. Классификация систем Абстрактные системы – это умозрительное представление образов или моделей материальных систем, которые подразделяются на описательные (логические) и символические (математические). Логические системы есть результат дедуктивного или индуктивного представления материальных систем. Их можно рассматривать как системы понятий и определений (совокупность представлений) о структуре, об основных закономерностях состояний и о динамике материальных систем. Символические системы представляют собой формализацию логических систем, они подразделяются на три класса: - статические математические системы или модели, которые можно рассматривать как описание средствами математического аппарата состояния материальных систем (уравнения состояния); - динамические математические системы или модели, которые можно рассматривать как математическую формализацию процессов материальных (или абстрактных) систем; - квазистатические (квазидинамические) системы, находящиеся в неустойчивом положении между статикой и динамикой, которые при 25
одних взаимодействиях ведут себя как статические, а при других – как динамические. Динамические системы – это постоянно изменяющиеся системы. Всякое изменение, происходящее в динамической системе, называется процессом. Вероятностная или стохастическая система – это система, поведение которой описывается законами теории вероятностей. Для вероятностной системы знание текущего состояния и особенностей взаимной связи между элементами недостаточно для предсказания будущего поведения системы со всей определенностью. Для такой системы имеется ряд направлений возможных переходов из одних состояний в другие, и каждому переходу поставлена в соответствие своя вероятность. Детерминированной называется система, состояние которой в будущем однозначно определяется ее состоянием в настоящий момент времени и законами, описывающими переходы элементов и системы из одних состояний в другие. Составные части в детерминированной системе взаимодействуют точно известным образом. Примером детерминированной системы может служить калькулятор, если считать его абсолютно надежным. Установка соответствующих чисел и операции между ними однозначно определяют результат работы устройства. Управляющие системы – это системы, с помощью которых исследуются процессы управления в технических, биологических и социальных системах. Центральным понятием здесь является информация – средство воздействия на систему. Управляющая система позволяет предельно упростить трудно понимаемые процессы управления в целях решения задач исследования проектирования. Целенаправленные системы – это системы, обладающие целенаправленностью, то есть управлением системы и приведением к определенному поведению или состоянию, компенсируя внешние возмущения. Достижение цели в большинстве случаев имеет вероятностный характер. Простые системы – это системы, не имеющие разветвлённых структур, состоящие из небольшого количества взаимосвязей и небольшого количества элементов. Такие элементы служат для выполнения простейших функций, в них нельзя выделить иерархические уровни. Отличительной особенностью простых систем является детерминированность (четкая определенность) номенклатуры, числа элементов и связей как внутри системы, так и со средой. По степени связи с внешней средой системы делятся на изолированные, закрытые, открытые. Изолированные системы не обмениваются со средой энергией и веществом. Процессы самоорганизации в них невозможны. Энтропия изолированной системы 26
стремится к своему максимуму. Закрытые системы не обмениваются с окружающей средой веществом, но обмениваются энергией. Они способны к фазовым переходам в равновесное упорядоченное состояние. Открытые системы обмениваются с окружающей средой энергией и веществом. И социальные системы, биосистемы и т.п. относятся именно к открытым системам. Об этом говорится в [70]: «если в отношении материальных элементов или объектов неживой и искусственной природы проблема определения их границ как систем решается относительно просто, то применительно к субъекту деятельности – человеку, включенному в организационную деятельность, к информации, используемой в социальных системах, энергообмену живых биосистем с окружающей средой, определить границы практически невозможно; поэтому с точки зрения границ и отношений с окружающей средой все живые и социальные системы являются открытыми». Под хорошо организованной системой понимается система, у которой определены все элементы, их взаимосвязь, правила объединения в более крупные компоненты, связи между всеми компонентами и целями системы, ради достижения которых создается или функционирует система. Примером хорошо организованной системы может служить сложное электронное устройство. При представлении объекта в виде плохо организованной системы не ставится задача определить все учитываемые компоненты, их свойства и связи между собой, а также с целями системы. Для плохо организованной системы формируется набор макропараметров и функциональных закономерностей, которые будут ее характеризовать. Определение этих параметров и восстановление функциональных зависимостей осуществляется на основании некоторой выборочной информации, характеризующей исследуемый объект или процесс. Далее полученные оценки характеристик распространяют на поведение системы в целом. При этом предполагается, что полученный результат обладает ограниченной достоверностью и его можно использовать с некоторыми оговорками. Например, если результат получен на основании статистических наблюдений за функционированием системы на основании выборочных статистических наблюдений, то его можно использовать с некоторой доверительной вероятностью. Примером применения подхода к отображению объектов в виде плохо организованной системы можно считать оценивание характеристик надежности системы с множеством компонентов [5]. Самоорганизующаяся система – это система, способная адаптироваться к изменению условий внешней среды. Она обладают свойством изменять структуру при взаимодействии системы со средой, сохраняя при этом свойства целостности системы, способные формировать возможные варианты поведения и выбирать из них наилучшие. Эти особенности обеспечиваются за счет наличия в составе системы активных 27
элементов. Эти элементы с одной стороны, обеспечивают возможность адаптации приспособления системы к новым условиям существования, с другой стороны, вносят элемент неопределенности в поведение системы, чем затрудняют проведение анализа системы, построение ее модели, формальное ее описание и, в конечном счете, затрудняют управление такими системами. Примерами самоорганизующихся систем могут служить биологические системы, предприятия и их системы управления, городские структуры управления и т.д. В [84] приведен наглядный пример, позволяющий увидеть различие в понятиях «организация» и «самоорганизация». Представим себе группу рабочих, перед которыми наниматель ставит задачу построить дом. Люди в этой группе имеют разные навыки, опыт и знания. Если наниматель каждому работнику подробно объяснит, что и как нужно делать, а также с какими именно другими работниками следует при этом взаимодействовать, то получившаяся в результате структура группы будет сформирована путем организации. Если же наниматель ограничится лишь объяснением того, каким бы он хотел видеть готовый дом, то работники в группе вынуждены будут самостоятельно (без указаний нанимателя) разделить обязанности между собой. В этом случае структура группы возникнет благодаря самоорганизации. Особое внимание самоорганизующимся системам уделял лауреат Нобелевской премии по химии, бельгийский физик и физикохимик российского происхождения И.Р. Пригожин (Ilya Prigogine), он ввел понятие диссипативности [62]. Системы, в которых процессы сопровождаются изменением порядка, принято называть диссипативными. Поскольку изменение порядка является необходимым условием самоорганизации, последняя возможна только в диссипативных системах. В физических системах благодаря явлению диссипации (т.е. рассеянию энергии – переходу энергии движения в тепловую) процессы становятся необратимыми. В системах (например, в социальных), в которых нельзя ввести понятие энергии, основным признаком диссипативности систем является необратимость. При этом диссипативность понимается в более широком смысле, чем в физике, а именно как свойство, отвечающее за необратимость происходящих в системе процессов [84]. С этой точки зрения, рассеяние энергии является лишь частным проявлением данного свойства в физических системах. Также И.Р. Пригожин в своих работах сформулировал идею, что, при объединении частиц в систему у последней появляются новые (системные) свойства, которые отсутствуют у каждой из частиц, взятой в отдельности. При этом также имеется в виду, что если мы знаем свойства каждой частицы, то исходя только из этого знания, нам не удастся предсказать всех свойств системы, образованной этими частицами [52]. Другими словами, чтобы создать новый объект, не нужно искать какие-то новые 28
частицы. Достаточно взять те же частицы, что составляют уже существующие объекты, и по-новому заставить их взаимодействовать между собой. При этом в системе возникнет новая структура, порождающее новое свойство. В результате внешний мир, который различает объекты по их свойствам, увидит появление новой системы [84].
1.7. Большие и сложные системы Существует неоднозначность в трактовке терминов большая и сложная системы [55, 67]. С одной стороны, они часто используются как синонимы [25, 30, 36, 50]. С другой стороны, сами названия различаются по смыслу, и логично трактовать их как разные понятия [32, 55, 82]. Втретьих, некоторые авторы связывают сложность с некоторыми особенностями самих систем [65, 87]. С учетом имеющейся тенденции усложнения систем следует проанализировать известные трактовки. В период становления системных исследований для подчеркивания принципиальных особенностей объектов и проблем, требующих применения системного подхода, широко применялся термин большая система. Особенности объектов не выделялись вначале, а постепенно уточнялись в процессе постановки задач. В каком-то смысле это противоречит системному подходу. Можно отметить широкую распространенность термина большие системы управления (БСУ), был опубликован учебник по теории БСУ [26]. Однако БСУ определялись на примерах без формулировки определения. В качестве признаков большой системы предлагались различные понятия: иерархическая структура, человеко-машинная система, большие потоки информации, большое число алгоритмов переработки информации, эмерджентность, открытость, активность элементов, нестабильное и непредсказуемое поведение, самоорганизация и др. Но они сужали класс объектов, описываемых как большие системы [67]. У.Р. Эшби [89] считал, что система является большой с точки зрения наблюдателя, возможности которого она превосходит в каком-то аспекте, важном для достижения цели. При этом один и тот же объект в зависимости от цели наблюдателя и имеющихся в его распоряжении средств можно считать или не считать большой системой. Кроме того, физические размеры объекта не являются критерием отнесения объекта к классу больших систем. Н.П. Бусленко [13] предложил связывать понятие большая система с тем, какую роль играют при изучении системы комплексные общесистемные вопросы, что зависит от свойств систем и классов решаемых задач.
29
В [42] связали понятие большая с величиной системы, количеством элементов (часто относительно однородных), а понятие сложная – со сложностью отношений, алгоритмов, или сложностью поведения. Под большой системой часто понимается совокупность материальных ресурсов, средств сбора, передачи и обработки информации, людейоператоров, занятых на обслуживании этих средств, и людейруководителей, облеченных надлежащими правами и ответственностью для принятия решений. Ф.И. Перегудов и Ф.П. Тарасенко [55] связывают понятие большой системы с ее многомерностью: Определение 1.6. Системы, моделирование которых затруднительно вследствие их размерности, будем считать большими. Данная трактовка позволяет переводить большие системы в разряд малых [33]: разрабатывать более мощные вычислительные средства либо осуществлять декомпозицию многомерной задачи на совокупность связанных задач меньшей размерности (если природа системы это позволяет). Ю.И. Черняк дает следующее определение больших систем, нашедшее широкое распространение в практике системного анализа [82]. Определение 1.7. Большие системы – это системы, не наблюдаемые единовременно с позиции одного наблюдателя либо во времени, либо в пространстве. Схема построения большой системы согласно определению 1.7 представлена на рис. 1.8. Для того чтобы получить необходимые знания о большом объекте, наблюдатель последовательно рассматривает его по частям, строя его подсистемы. Далее он перемещается на более высокую ступень, на следующий уровень иерархии и, рассматривая подсистемы уже в качестве объектов, строит для них единую систему. Если совокупность подсистем оказывается снова слишком большой, чтобы можно было построить из них общую систему, то процедура повторяется, и наблюдатель переходит на следующий уровень иерархии и т.д. Каждая из подсистем одного уровня описывается одним и тем же языком, а при переходе на следующий уровень наблюдатель использует уже метаязык, представляющий собой расширение языка первого уровня за счет средств описания свойств самого этого языка. Если исследователь идет от наблюдения реального объекта, то большая система создается путем композиции – составления ее из малых подсистем, описываемых одним языком. Операция, противоположная 30
композиции, есть декомпозиция большой системы, то есть разбиение ее на подсистемы. Она осуществляется для того, чтобы извлечь новую ценную информацию из знания системы в целом, которая не может быть получена другим путем. Важным понятийным инструментом системного анализа является иерархия подсистем в большой системе. В иерархии экономических систем можно, например, выделить уровни: народное хозяйство, отрасль, подотрасль, предприятие, цех, бригада. Рассмотрение систем в иерархии дает возможность выявить новые их свойства.
Рис. 1.8. Построение большой системы по Ю.И. Черняку Величина большой системы может быть измерена по разным критериям: по числу подсистем; по числу ступеней иерархии подсистем. Четкой границы, отделяющей простые системы от больших, нет. Деление это условное и возникло из-за появления систем, имеющих в своем составе совокупность подсистем с наличием функциональной избыточности. Простая система может находиться только в двух состояниях: состоянии работоспособности (исправном) и состоянии отказа (неисправном). При отказе элемента простая система либо полностью прекращает выполнение своей функции, либо продолжает ее выполнение в полном объеме, если отказавший элемент резервирован. Большая система при отказе отдельных элементов и даже целых подсистем не всегда теряет работоспособность, зачастую только снижаются характеристики ее эффективности. Это свойство больших систем обусловлено их
31
функциональной избыточностью и, в свою очередь, затрудняет формулировку понятия «отказ» системы. Примеры больших систем: информационная система; пассажирский транспорт крупного города; производственный процесс; система управления полетом крупного аэродрома; энергетическая система и др. В настоящее время однозначной, четкой трактовки понятия сложной системы нет. Анализу понятия сложности и разработке способов оценки сложности систем посвящены работы многих исследователей. Назовём некоторых их них: С. Бир [10], Г. Саймон [66], А.И. Берг [2], А.И. Уемов [76], Н.П. Бусленко [13], Ю.И. Черняк [82], В.Ф. Венда [17], С.А. Гайдес [21] и др. Известны различные подходы и предложены разные формальные признаки ее определения. Так, Г.Н. Поваров [56] предлагает относить к сложным системы имеющие 104–107 элементов; к ультрасложным – системы, состоящие из 107–1030 элементов; и к суперсистемам – системы из 1030–10200 элементов. Этот подход имеет тот недостаток, что данное определение сложности является относительным, а не абсолютным. С. Бир предлагает к сложным относить системы, описываемые на языке теоретико-вероятностных методов [10]. Однако здесь к сложным системам можно отнести некоторые весьма тривиальные объекты, описываемые вероятностно. По А.А. Вавилову [14] сложная система управления представляет собой множество взаимосвязанных и взаимодействующих между собой подсистем управления, выполняющих самостоятельные и общесистемные функции и цели управления. А.И. Берг определяет сложную систему как систему, которую можно описать не менее чем на двух различных математических языках (например, с помощью теории дифференциальных уравнений и алгебры Буля) [2]. В.В. Кафидов [32], в зависимости от возможности и целесообразности дальнейшего разбиения систем на более мелкие делит их на три группы: - простая система – система, которую в рамках решения конкретной проблемы можно исследовать как нечто целое, без разбиения на более мелкие подсистемы; - большая система – система, которую трудно исследовать без разбиения на более простые подсистемы, а после разбиения функционирование подсистем можно исследовать практически независимо друг от друга; - сложная система – система, в которой изолированное рассмотрение подсистем невозможно или приводит к ошибочным выводам. Часто сложными системами называют системы, которые нельзя корректно описать математически, либо потому, что в системе имеется очень большое число элементов, неизвестным образом связанных друг с другом, либо неизвестна природа явлений, протекающих в системе. 32
По мнению авторов учебника [6], сложные системы характеризуются тремя основными признаками: способностью сохранять частичную работоспособность при отказе отдельных элементов или подсистем; наличием неоднородных связей; эмерджентностью – наличием у системы свойств, которые отсутствуют у любой из составляющих ее частей. Все это свидетельствует об отсутствии единого определения сложности системы. Однако есть признаки, такие как, многомерность, многосвязность, многоконтурность, многоуровневость (иерархичность), составной и многоцелевой характер построения, а также неопределенность и стохастичность поведения. Ниже приведем два определения, которые, на наш взгляд, наиболее адекватно характеризуют понятие сложной системы. Ю.И. Черняк [82] называет сложными системами те, которые нельзя скомпоновать из некоторых подсистем. Это равноценно тому, что: - наблюдатель последовательно меняет свою позицию по отношению к объекту и наблюдает его с разных сторон; - разные наблюдатели исследуют объект с разных сторон. Процесс построения сложной системы показан на рис. 1.9.
Рис.1.9. Построение сложной системы по Ю.И. Черняку
33
Пример 1.6. Решается задача выбора конкретного материала для промышленного изготовления ветрового стекла автомобиля. Задачу нельзя решить без того, чтобы не рассмотреть этот объект в самых разных аспектах и на разных языках: прозрачность и коэффициент преломления – язык оптики; прочность и упругость – язык физики; наличие станков и инструментов для изготовления – язык технологии; стоимость и рентабельность – язык экономики и т.д. Каждый из наблюдателей отбирает подмножество прозрачных материалов, удовлетворяющих его требованиям и критериям. В области пересечения подмножеств, отобранных всеми наблюдателями, метанаблюдатель отбирает единственный материал, работая в метаязыке, объединяющем понятия всех языков низшего уровня и описывающем их свойства и отношения. Принципиальная трудность решения задачи состоит в том, что подмножества, отобранные наблюдателями первого уровня, могут вообще не пересекаться. В таком случае метанаблюдателю придется потребовать снизить некоторым из наблюдателей свои требования и расширить подмножества потенциальных решений. В другом случае область пересечения может оказаться слишком большой, так что метанаблюдатель будет испытывать затруднения в выборе конкретного элемента. В первом случае встает вопрос: кому из наблюдателей первого уровня приказать снизить свои требования (оптику, физику, технологу, экономисту). Во втором случае – чьими требованиями и в какой степени руководствоваться в отборе конечного решения? Очевидно, что здесь не может существовать никаких строгих объективных правил отбора, а приходится прибегать к чисто человеческим процедурам социологического типа – опросу общественного мнения, выявлению мнений авторитетных экспертов в различных областях и приданию им количественных оценок. Подобные процедуры получения субъективных оценок представляют собой композицию сложной системы из комплекса моделей. Противоположным случаем является декомпозиция сложной системы, когда критерий системы известен, но решение задачи достигается в результате решения каждой из подсистем своей собственной задачи в собственном языке. В этом случае приходится осуществлять декомпозицию критерия системы в критерии составляющих ее подсистем с одновременным переводом его в различные языки подсистем. С измерением сложности систем дело обстоит так же, как и с измерением их величины. Системы можно соизмерять по степени сложности, используя разные аспекты самого этого понятия: путем соизмерения числа моделей сложной системы; путем сопоставления числа языков, используемых в системе; путем соизмерения числа объединений и дополнений метаязыка.
34
Понятие сложности является одним из основополагающих в системном анализе. Системный анализ есть стратегия исследования, которая принимает сложность как существенное, неотъемлемое свойство объектов и показывает, как можно извлечь ценную информацию, подходя к ней с позиции сложных систем. По мнению американского исследователя Р. Акоффа (Russell Lincoln Ackoff) [3], простота не задается в начале исследования, но если ее вообще можно найти, то она находится в результате исследования. Определение 1.8 [82]. Сложная система – это система, построенная для решения многоцелевой задачи; система, отражающая разные несравнимые аспекты характеристики объекта; система, для описания которой необходимо использование нескольких языков; система, включающая взаимосвязанный комплекс разных моделей. Главным общим свойством приведенных трактовок является представление сложности системы как следствия недостаточности информации для желаемого качества управления системой. Это не только упорядочивает терминологию (благодаря введению четкого различия между терминами большая система и сложная система), но и указывает пути преодоления сложности. Четкое и лаконичное определение сложной системы дано Ф.И. Перегудовым и Ф.П. Тарасенко [55]: Определение 1.9. Сложной называется система, в модели которой недостаточно информации для эффективного управления этой системой. Примеры сложных систем: мозг человека (при рассмотрении его с точки зрения выполнения интеллектуальных действий); клетка биологического образования (на метаболическом уровне); химическая реакция (на молекулярном уровне); экономика (на макроуровне); человеческое общество (на политико-религиозно-культурном уровне); ЭВМ (при рассмотрении как средства получения знаний). Таким образом, сложные системы различной природы являются многомерными, стохастическими, открытыми и самоорганизующимися. Кроме этого в них присутствует неоднородность элементов и сложность связей. Сложные системы в большинстве своем многогранны и определяются множеством переплетенных характеристик, затрудняющих выбор емкого критерия эффективности управления. Например, такая территориальная единица как город является открытой, стохастической, самоорганизующейся системой, внутренние воздействия в которой весьма разнообразны и непостоянны. Город – это локализованный по своим масштабам объект, имеющий экономические, технические, социальные, транспортные и другие связанные между собой показатели [18]. 35
Очевидно, что большие и сложные системы – это фактически два способа разложения задачи на ее составляющие или, соответственно, построения различным способом модели системы. Этот способ получил такое широкое распространение, что понятия «цель» и «критерий» в некоторых областях техники и исследования операций стали считать синонимами. Также выше на примере больших и сложных систем были рассмотрены процедуры системного анализа – композиция и декомпозиция.
1.8. Моделирование сложных систем Математическая модель должна совместить в себе все это разнообразие элементов и связей сложной системы. Поэтому выбор эффективного метода математического моделирования является одним из основополагающих для такого рода систем. Формально сложными системами занимается системный анализ. Согласно общей концепции системного анализа модель сложной системы должна учитывать общесистемные закономерности [60]. Однако, несмотря на большое количество работ, сегодня так и не создано общей теории моделирования сложных систем. Рассмотрим проблематику системного моделирования на примере учебника [19]. Авторы приводят следующие рекомендации по практическому применению положений общей теории систем: 1) надо опираться на основные понятия теории систем и философские концепции, лежащие в основе исследования общесистемных закономерностей; 2) надо производить структуризацию целей; 3) основной методикой применения системного анализа является постепенная формализация частных задач; 4) целесообразно проводить рекурсивное улучшение частных моделей; 5) адекватность частных моделей должна доказываться последовательно по мере их формирования. Суть подхода заключается в формализации частных моделей. Однако здесь нет системных и конструктивных рекомендаций для движения от частного к общему. Поэтому он вряд ли может иметь широкое практическое применение: ни одна частная модель не может быть адекватна абсолютно, и новый класс сложных систем потребует решения новой частной задачи. В работе [5] автор, касаясь вопроса описания объекта моделирования, как наиболее важного этапа построения модели сложной системы выделяет следующие моменты: 1) выбор показателей качества, отражающих цели моделирования;
36
2) определение управляющих переменных, выбор состава контролируемых характеристик объекта моделирования; 3) детализация описания функционирования системы; 4) представление информации о воздействии внешней среды. Одной из серьезных проблем при исследовании сложных систем становится определение уровня ее детализации, т.к. попытка максимально приблизить модель к объекту исследования – бессмысленна. Это отмечает Г.Б. Клейнер: «Современный уровень развития математического моделирования практически не позволяет сколько-нибудь адекватно моделировать реальные объекты» [34]. Схожую точку зрения высказал В.В. Налимов, отмечая неоднозначность математического моделирования плохо организованных систем, он указывал, что моделирование возможно лишь при ослаблении требований к его математическому описанию [48]. Поэтому нужно каким-то образом найти компромисс между общим и частным, и перейти к некоторой формальной модели. Идеи поиска этого компромисса, можно увидеть в основных принципах системологии, приведенных Б.С. Флейшманом в [79]. Это: 1) формирование законов; 2) рекуррентное объяснение; 3) минимаксное построение моделей. По первому принципу, постулируются осуществимые модели, а из них в виде теорем выводятся законы сложных систем. И несоответствие реальной сложной системы закону говорит о том, что эта система не соответствует тому классу моделей, для которых выведен закон. Второй принцип – это объяснение явлений на более высоком уровне явлениями на низких уровнях системы, т.е. свойства системы определенного уровня логически выводятся на основе свойств элементов и связей между ними согласно первому принципу. Это довольно ослабленное объяснение, т.к. постулируемая модель может быть не адекватной реальной системе, и при рекуррентном описании это никак не корректируется. Минимаксное построение моделей заключается в том, что теория должна состоять из простейших моделей нарастающей сложности или, в минимаксной терминологии, грубая модель более сложной системы может оказаться проще более точной модели более простой системы. Следовательно, по Б.С. Флейшману, возможности построения теории сложных систем связаны с возможностями построения их простых оптимизационных моделей. Как справедливо указывает Г.Я. Гольдштейн [24], «построенная таким образом теория будет страдать неизбежными принципиальными пороками: оценочным характером простых моделей и неизбежным стохастическим характером выводов, достоверность которых будет определяться допустимой грубостью оценок». Таким образом, имеем основные проблемы системного моделирования. Во-первых, нужно каким-то образом формализовать
37
первую, достаточно простую математическую модель. Заметим, что требования к модели четко сформулированы в [86]. Модель должна быть: 1) простой и понятной пользователю; 2) целенаправленной; 3) надежной в смысле гарантии от абсурдных ответов; 4) удобной в управлении и обращении, т.е. общение с ней должно быть легким; 5) полной с точки зрения возможности решения главных задач; 6) адаптивной, позволяющей легко переходить к другим модификациям или обновлять данные; 7) допускающей постепенные изменения, т.е. будучи вначале простой, она может становиться все более сложной. Во-вторых, данный подход не учитывает требования, чтобы математическая модель сложной системы учитывала общесистемные закономерности. Ввиду невозможности построения адекватной модели для сложной системы рассмотрим проблему по-иному. Исследуем сложную систему как объект моделирования с позиций диагностики. Считаем, что для нас достаточно лишь достоверно оценить состояние системы, т.е. рассмотрим задачу диагностики. Для ее решения необходимо построить диагностическую модель. В диагностической модели должна в определенной форме выражаться связь измеряемого вектора признаков x с тестируемым свойством, которое в дальнейшем будет обозначаться как y [11]. Т.е. должен быть раскрыт механизм преобразования у = f(x). Первое предъявляемое к модели требование – конечный результат должен быть максимально точным и надежным. Второе требование – лаконичность и интерпретируемость способа получения конечного результата. Указанные требования находятся в тесной взаимосвязи. Чем более экономно по форме и содержательно по смыслу преобразование у = f(x) при соблюдении заданной точности модели, тем более общие закономерности структуры экспериментальных данных вскрывает используемая модель и, значит, тем более устойчива и надежна количественная оценка диагностируемого показателя, получаемая с помощью преобразования f(x). Таким образом, от диагностической модели не требуется максимальной адекватности описания исследуемого объекта в целом. Она предназначена лишь для описания степени отклонения технического состояния объекта от нормы. Следует отметить, что диагностические модели эффективно применяются не только при оценке технического состояния, но и при исследовании организационных систем. Так, диагностические модели, как показано в [94], помогают: 1) упорядочить данные об организации; 2) улучшить понимание организационных проблем; 3) систематически
38
интерпретировать данные; 4) разрабатывать подходящие стратегии изменений. Построение диагностической модели фактически включает в себя две задачи. Во-первых, требуется определить вид функции f(x). Эту задачу называют по-разному, в зависимости от специфики, например, структурной идентификацией системы [23, 88], качественной идентификацией [27], непараметрической идентификацией [31], спецификацией модели [1], восстановлением зависимости [16] и др. Если вид математической модели объекта известен (или найден), то решают задачу определения неизвестных параметров модели. Ее называют оцениванием модели [1] или параметрической идентификацией [40]. Таким образом, математическое моделирование сложной системы предлагается заменить на несколько задач построения диагностических моделей. В каждой из этих задач сложную систему уже можно формализовать на основе соответствующего тестируемого свойства y.
39
Глава 2. Логика и методология системного анализа В настоящее время все более утверждается концепция, что получение значительного результата исследования во многом определяется подходом к постановке проблемы и определению общих путей решения. Это приводит к своеобразной переоценке ценностей. Если совсем еще недавно познание измерялось почти исключительно по совокупности его конечных результатов, то сейчас все большее значение начинает приобретать научная обоснованность начальных этапов исследования, определяемых во многом применяемыми методами. Такое изменение объясняется огромной технической оснащенностью современного познания, при которой решение точно поставленной задачи (сколь бы сложной она ни была) обычно не создает больших трудностей. Таким образом, построение логики и методологии науки, в частности, системного анализа, является в настоящее время первоочередной задачей.
2.1. Логические основы системного анализа Логика (греч. logos – речь, мысль, разум) – наука о законах, формах и приемах правильного построения мышления, направленного на познание объективного мира. Основные задачи логики – выявление условий достижения истинных знаний, изучение внутренней структуры мыслительного процесса, выработка логического аппарата и правильного метода познания. Логическая форма обусловлена наиболее общими, чаще всего встречающимися свойствами, простейшими связями и отношениями реального мира. Поэтому она закономерно выражает устойчивые черты всякого правильного мышления [46]. Различают следующие виды мышления: - наглядно-действенное – первая ступень мышления; характеризуется тем, что решение задачи осуществляется с помощью реального, физического преобразования ситуации, опробования свойств объекта; - словесно-логическое – характеризуется использованием понятий, логических конструкций; - наглядно-образное – воссоздает все многообразие реальных характеристик предмета. Выделяют следующие типы мышления: - теоретическое – направлено на открытие законов, свойств объекта; - практическое – связано с постановкой целей, выработкой планов и проектов; - логическое (аналитическое) – связано с анализом действий; - интуитивное – характеризуется быстротой протекания, отсутствием четко выраженных этапов, минимальной осознанностью. 40
Различные виды и типы мышления, междисциплинарность, универсальность исследований мышления требует выделения в системном анализе его логических основ. Основная задача логики системного анализа – открытие путей движения к достижению новых системных результатов, а не экономических, технических или каких-либо других. Важнейшей категорией логики является проблема. В общем случае под проблемой понимают несоответствие между желаемым и фактическим положением дел. Никакие усилия не приведут к успеху, правильному решению, если направление поиска выбрано ошибочно. Использование системного анализа может помочь устранить это узкое место, поскольку одним из основных его назначений является правильная и четкая постановка проблемы [71]. Выделяют три класса проблем: - хорошо структурированные (количественно сформированные); - слабо структурированные (смешанные), содержащие количественные и качественные оценки; - неструктурированные (качественные). Для решения проблем первого класса успешно применяется математический аппарат исследования операций. При решении проблем второго класса нужны системные методы. Для решения проблем третьего класса применяются эвристические методы. Следовательно, системный анализ применяется для того, чтобы сначала слабо структурированную проблему превратить в хорошо структурированную, к решению которой затем можно применить аппарат исследования операций и теорию оптимизации. Каковы же пути правильной постановки проблем? Их много. Рассмотрим один из них, который можно считать научно обоснованным. Сначала получают ответ на вопрос, существует ли проблема? Далее, следует ее точная формулировка и анализ ее структуры. Затем рассматриваются развития проблемы (в прошлом и будущем), внешние связи данной проблемы с другими проблемами и ставится вопрос о принципиальной разрешимости проблемы. Рассмотрим некоторые аспекты этого метода. Известно, что любая задача по совершенствованию деятельности в любой области включает решение ряда вопросов. Во-первых, надо четко установить границы совершенствуемой области, что исключает тенденцию «объять необъятное». Во-вторых, следует сформулировать условия, которые характеризуют необходимое или желаемое положение дел в этой области. Необходимым его называют тогда, когда оно объективно обусловлено, а желаемым – при субъективном подходе. В-третьих, нужно определить фактическое положение дел в анализируемой области и на этой основе выявить недостатки, то есть
41
несоответствие между необходимым (желаемым) и фактическим положением дел. В-четвертых, следует оценить последствия, к которым приводят выявленные недостатки, если их не устранить, или иначе – оценить актуальность выявленных проблем. И если проблемы актуальны, считаем, что они требуют решения. Чтобы построить такое решение, надо проанализировать причины, порождающие выявленные недостатки, а также определить средства устранения этих причин и затем установить пути реализации выбранных средств. Научной проблемой считают такую проблему, решение которой не содержится в накопленном обществом знании. Можно выделить три уровня постановки проблем. Первый уровень – состоит в том, что после определения основного вопроса о дальнейшем развертывании проблемы мало заботятся. Это низшая интуитивная форма постановки проблемы. Второй уровень – постановка проблемы в соответствии с описанными правилами, но без полного осознания их смысла и необходимости соблюдения. При этом не обязательно, чтобы все операции были полностью реализованы одним специалистом. Главное, чтобы каждая из них была так или иначе представлена в какой-нибудь из действительных проблем науки. Это и явилось основанием для составления процедурного поиска. Третий уровень – сознательное использование всех процедур и входящих в него операций. Важным для организации науки является вопрос о мнимых проблемах. Ими считают проблемно-подобные структуры, не являющиеся проблемами, которые либо ошибочно принимаются за проблемы, либо выдаются за таковые. В зависимости от характера возникновения все мнимые проблемы делят на два класса. 1. Экстранаучные мнимые проблемы, причины которых находятся вне науки. В основе их возникновения – мировоззренческие, методологические, идеологические и прочие заблуждения. 2. Интранаучные проблемы, причины которых лежат в самом познании, в его достижениях и трудностях. К ним относятся: - «уже не проблемы», то есть решенные, но ошибочно принимаемые за нерешенные; - «еще не проблемы», которые возникают как следствие отрыва нашего мышления от реальных возможностей настолько, что ни в настоящее время, ни в обозримом будущем нет возможности решить данные проблемы; - «никогда не проблемы», то есть такие проблемно-подобные структуры, для которых вообще не существует решения (например, создание 42
вечного двигателя), постановка которых противоречит фундаментальным принципам науки. Одной из причин появления ложных проблем является отсутствие у исследователя, специалиста системного мышления. Можно отметить следующие способы обращения с проблемой: - не решать проблему, игнорировать ее; - решать частично, сделать что-нибудь с приемлемым результатом; - решать проблему полностью и получить наилучший результат; - устранить, растворить проблему, переделать либо саму систему, либо ее окружение. Вторая важнейшая категория логики – гипотеза. Это важнейшая форма развития научного мышления, научного знания. Выдвижение научных гипотез – это всегда определенный скачок в развитии научного мышления. Имеются следующие пути формирования гипотез: - формулирование проблемности, противоречивости прежней теории, что уже носит характер гипотезы; - формулирование нового идеального объекта теории; - предположение о существовании каких-то предметов или их свойств, которые могут стать объектом практической деятельности. Третья категория логики – теория. Теория – совокупность знаний, образующих систему на основе некоторых общих положений, то есть это система знаний, пронизанная общими положениями, идеями [29]. Различают теории разного уровня. Самым высоким уровнем является дедуктивная теория. В дедуктивной теории различают две части: основания и следствия. Основания теории включают: - группу понятий; - основные положения; - эмпирический базис – научные факты, входящие в теорию опосредованно. Основные положения дедуктивной теории (постулаты) – это высказывания, которые логически не выводятся из других знаний в рамках этой же теории, а являются обобщением опыта и проверяются опытами (прямыми или косвенными). Они не должны противоречить друг другу и не следовать один из другого. Форма основных положений может быть различной, они могут быть выражены в форме: - принципов; - модельных гипотез; - математических гипотез (аксиом). К теории в целом предъявляются требования логической непротиворечивости: в каждой части она должна удовлетворять своим исходным посылкам.
43
Для того чтобы какая-то система знаний стала научной теорией, она должна пройти многоплановую проверку на практике. Любая теория верна в определенной области, то есть имеет границы применимости. Новые теории возникают тогда, когда в науке есть целый ряд экспериментальных фактов, для объяснения которых старые представления не годятся. В отличие от дедуктивных теорий в описательных теориях (например, эволюционная теория Дарвина) законы формулируются не в начале теории, а по мере развертывания материала. Эти законы, как и вся теория, формулируются в основном в словах обыденного языка с привлечением по мере необходимости специальной терминологии из той или иной области знаний. Схема содержания знаний о теории следующая [29]: 1) определение теории как системы знаний, пронизанной совокупностью общих идей; 2) состав и структура оформленной дедуктивной теории; 3) характеристика основных положений теории, требования, предъявляемые к постулатам и ко всей теории в целом; 4) пути проверки теории; 5) границы применимости теории; 6) условия возникновения теорий; 7) отличия дедуктивных теорий от описательных. Итак, под научной теорией понимается особая форма организации знаний, включающая три элемента: научные понятия, основные положения и следствия. Органичным свойством теории является системность входящих в нее знаний. Как же сформировать системные знания? Для этого должны быть сформированы: - знания о теории, ее составе и структуре; - представления о природе получения этих знаний; - представления о том, какие знания входят в теории непосредственно, а какие опосредованно; - представления о роли научных фактов для теории.
2.2. Понятие о методе и методологии Метод – это путь познания, опирающийся на некоторую совокупность ранее полученных общих знаний [46]. Поскольку метод связан с предварительными знаниями, методология делится на две части: учение об исходных основах (принципах) познания и учение о способах и приемах исследования, опирающихся на эти основы. В учении об исходных основах познания анализируются и оцениваются те философские представления и взгляды, на которые исследователь 44
опирается в процессе познания. Следовательно, эта часть методологии непосредственно связана с философией, с мировоззрением. В учении о способах и приемах исследования рассматриваются общие стороны частных методов познания, составляющих общую методику исследования. Методология научного познания изучает методы научного исследования. К ним относятся [71]: - исходные основы и принципы научного исследования; - приемы и способы эмпирического и теоретического исследования в науке, опирающиеся на эти принципы. Исходя из вышесказанного, под методологией системного исследования понимают совокупность системных методов и средств, направленных на решение сложных и комплексных проблем. Главные особенности научного познания в современных условиях состоят в следующем: 1. В наши дни становится все более ясным, что исходные основы (принципы) научного познания по своей объективной сущности являются диалектико-материалистическими. 2. Наука так глубоко проникла во все отрасли народного хозяйства, что его планирование, в свою очередь, требует единого планирования научных исследований. 3. Значение и масштабы научных исследований настолько возросли, что в ряде областей необходимо не только внутригосударственное, но и международное планирование. 4. Объем научных знаний так возрос, что возникла потребность его особой систематизации. Систематизация – это объединение предметов или знаний о них путем установления существенных связей между ними, порядка между частями целого на основе определенных закономерностей, принципов или правил. В условиях быстрого роста объема научных знаний особое значение приобретает разработка методов получения и приобретения новых научных знаний и способов быстрого овладения ими. Знания можно синтезировать лишь на основе каких-либо общих представлений о мире. Создание научного синтеза – важнейшая проблема. Ее решение позволит построить современную теорию научного знания, разработать более эффективные методы получения новых знаний и методы их быстрого освоения. Значение методологии научного познания состоит в том, что она позволяет: - выяснить подлинную философскую основу научного познания; - систематизировать весь объем научных знаний, что даст возможность эффективнее использовать все имеющиеся знания;
45
- создать условия для разработки новой, еще более эффективной методики для дальнейших исследований во всех областях знаний. Главная задача методологии научного познания в данный период – создание современного синтеза всех накопленных научных знаний. Выделяют три вида методологии: - методология как наука о всеобщем методе исследования; - методология как наука об общенаучных методах исследования; - методология как наука о частных, специальных методах познания.
2.3. Классификация методов системного анализа Принципиальной особенностью системного анализа является использование методов двух типов – формальных и качественных. Для того чтобы облегчить выбор методов в реальных условиях принятия решения, необходимо разделить методы на группы, охарактеризовать особенности этих групп и дать рекомендации по их использованию при разработке моделей и методик системного анализа. Постановка любой задачи заключается в том, чтобы перевести ее вербальное (словесное) описание в формальное. Для простых задач такой переход осуществляется в сознании человека, который не всегда даже может объяснить, как он это сделал. Если полученная формальная модель опирается на фундаментальный закон или подтверждается экспериментально, то этим доказывается ее адекватность отображаемой ситуации, и модель рекомендуется для решения задач соответствующего класса. По мере усложнения задач получение модели и доказательство ее адекватности затрудняется. Вначале эксперимент становится дорогим (например, при создании сложных производственных комплексов и т.п.), а применительно к экономическим объектам практически нереализуемым. Задача переходит в класс проблем принятия решений, и формирование модели, то есть перевод вербального описания в формальное, становится важной составной частью процесса принятия решения. Иными словами, перевод вербального описания в формальное, осмысление, интерпретация модели и получаемых результатов становятся неотъемлемой частью практически каждого этапа моделирования сложной развивающийся системы. Возникающие вопросы, как формировать такие развивающиеся модели или механизмы, как доказывать их адекватность, являются основным предметом системного анализа. Для решения проблемы перевода вербального описания в формальное в различных областях знаний стали развиваться специальные приемы и методы. Отметим, что в литературе по системному анализу отсутствует общепринятая классификация этих методов [71]. Однако на наш взгляд
46
весьма убедительно выглядит разделение методов системного анализа на два класса [19]: - методы формализованного представления систем; - методы, направленные на активизацию использования интуиции и опыта специалистов, называемые экспертными методами системного анализа. Такое разделение методов соответствует основной идее системного анализа, состоящей в сочетании в моделях и методиках формальных и неформальных представлений. Классификация этих методов по В.Н. Волковой [19] приведена на рис. 2.1.
Рис.2.1. Классификация методов системного анализа В приведенной классификации экспертные методы расположены сверху вниз в порядке возрастания возможностей формализации, а у методов формализованного представления систем сверху вниз повышается внимание к содержательному анализу проблемы и появляется все больше 47
средств для такого анализа. Такое упорядочение методов помогает их сравнивать и выбирать при формировании развивающихся моделей принятия решений или методик системного анализа. Разумеется, перечень экспертных методов не является полным и может быть дополнен (например, методами организации сложных экспертиз и др.). Следует подчеркнуть, что реальные модели часто создаются на основе пересечения выделенных классов методов (или на основе комплексирования). Например, комбинаторика начала развиваться параллельно в рамках линейной алгебры и теории множеств, а затем оформилась в самостоятельное направление, использующее средства обоих классов методов. Широко употребляемое при управлении сложными динамическими объектами ситуационное моделирование базируется на выразительных средствах математической логики, математической лингвистики, теории множеств и графов. Имитационное динамическое моделирование использует удобный для человека структурный язык, который помогает выражать реальные взаимосвязи, отображающие в системе замкнутые контуры управления, и аналитические представления (линейные конечно-разностные уравнения), позволяющие реализовать формальное исследование получаемых моделей с помощью ЭВМ. Модели и методики, возникающие как результат попеременного использования методов из обоих классов, можно выделить в самостоятельную группу методов постепенной формализации задач принятия решений. Сейчас бурно развиваются так называемые методы искусственного интеллекта, которые условно можно отнести к данной группе методов. Следует отметить, что приведенная выше классификация методов системного анализа, как и любая другая – условна. Она лишь средство, помогающее ориентироваться в большом числе разнообразных методов и моделей.
48
Глава 3. Методы формализованного представления систем В настоящее время известны различные классификации методов формализованного представления систем. В результате этого методы, иногда возникающие независимо, имеют в основном только терминологические различия. В этой главе приведена наиболее распространенная классификация [19], в которой выделяют следующие группы методов формализованного представления: аналитические, статистические, теоретико-множественные, логические, лингвистические, семиотические, графические. Общая направленность классификации следующая: каждая последующая группа методов позволяет формализовать задачу, которая не может быть решена в рамках предыдущей группы методов.
3.1. Аналитические методы Основная терминология. Аналитическими называются методы, в которых ряд свойств многомерной, многосвязной системы отображается в n-мерном пространстве одной единственной точкой, совершающей какоето движение (рис. 3.1).
Рис. 3.1. Символический образ аналитических методов Это отображение осуществляется либо с помощью функции fSx, либо посредством оператора (функционала) FSx. Можно также две или более систем или их частей отобразить точками, и рассматривать взаимодействие этих точек, каждая из которых совершает какое-то движение, имеет свое поведение. Поведение точек и их взаимодействие описывается аналитическими закономерностями. Основу терминологического аппарата аналитических представлений составляют понятия классической математики и некоторых новых ее 49
разделов (величина, функция, уравнение, система уравнений, производная, дифференциал, интеграл, функционал и т.д.). На базе аналитических представлений возникли и развиваются математические теории различной сложности (табл. 3.1) – от аппарата классического математического анализа (методов исследования экстремумов функций, вариационного исчисления и т.д.) до таких разделов современной математики, как математическое программирование (линейное, нелинейное, динамическое и др.), теория игр (матричные игры с чистыми стратегиями, дифференциальные игры) [44]. Таблица 3.1. Математические теории различной сложности Группы методов Анализ Математическое программирование Игры Распределение работ, ресурсов
Методы Нахождение экстремумов функций, Вариационное исчисление Линейное, Нелинейное, Дискретное, Эвристическое Антагонистические, Матричные, Позиционные, Коалиционные, Дифференциальные Теория управления запасами, Износ и замена оборудования
Применение аналитических методов. Аналитические методы применяются в тех случаях, когда свойства системы можно отобразить с помощью детерминированных величин или процессов, то есть знания о процессах и событиях в некотором интервале времени позволяют полностью определить поведение их вне этого интервала. Эти методы используются при решении задач движения и устойчивости, оптимального размещения, распределения работ и ресурсов, выбора наилучшего пути, оптимальной стратегии поведения в конфликтных ситуациях и т.п. При практическом применении аналитических представлений для отображения сложных систем следует иметь в виду, что они требуют установления всех детерминированных взаимосвязей между учитываемыми компонентами и целями системы в виде аналитических зависимостей. Для сложных многокомпонентных, многокритериальных систем получить требуемые аналитические зависимости очень трудно. Более того, если даже это и удается, то практически невозможно доказать правомерность применения этих аналитических выражений, то есть адекватность модели рассматриваемой задаче.
3.2. Статистические методы Основная терминология. В тех случаях, когда не удается представить систему на основе детерминированных категорий, можно 50
применить отображение ее с помощью случайных (стохастических) событий, процессов, которые описываются соответствующими вероятностными характеристиками и статистическими закономерностями. По аналогии с аналитическими отображениями статистическое отображение системы можно представить в виде «размытой» точки (области) в n-мерном пространстве, в которую переводит систему (ее учитываемые свойства) оператор FSx (рис. 3.2).
Рис. 3.2. Символический образ статистических методов «Размытую» точку следует понимать как некоторую совокупность, характеризующую движение системы (ее поведение). При этом границы области заданы с некоторой вероятностью («размыты»), и движение точки определяется некоторой случайной функцией. Закрепляя все параметры кроме одного можно получить срез по линии a – b, физический смысл которого – воздействие данного параметра на поведение системы, что можно описать статистическим распределением по этому параметру. Аналогично можно получить двумерную, трехмерную и т.д. картину статистического распределения. На статистических отображениях базируются математическая статистика, теория статистических испытаний (или статистического имитационного моделирования), частным случаем которой является метод Монте-Карло, теория выдвижения и проверки статистических гипотез, частным случаем которой является байесовский подход к исследованию процессов передачи информации в процессах общения, обучения и других ситуациях, характерных для сложных развивающихся систем. Применение статистических методов. Статистические отображения позволили расширить области применения ряда дисциплин, возникших на базе аналитических представлений. Так возникли статистическая теория распознавания образов, стохастическое программирование, новые разделы теории игр и др. На базе статистических представлений возникли и
51
развиваются такие прикладные направления, как теория массового обслуживания, теория статистического анализа и др. Расширение возможностей отображения сложных систем и процессов по сравнению с аналитическими методами можно объяснить тем, что при применении статистических представлений процесс постановки задачи как бы частично заменяется статистическими исследованиями, позволяющими, не выявляя все детерминированные связи между изучаемыми событиями или учитываемыми компонентами сложной системы, на основе выборочного исследования получать статистические закономерности и распространять их на поведение системы в целом. Однако не все процессы и явления могут подчиняться статистическим закономерностям, не всегда может быть выбрана представительная выборка, доказана правомерность применения статистических закономерностей, часто для получения статистических закономерностей требуются недопустимо большие затраты времени, что также ограничивает возможности их применения. В этих случаях следует рассматривать возможность применения других методов представления систем.
3.3. Теоретико-множественные представления Основная терминология. Теоретико-множественные представления базируются на понятиях: множество, элементы множества и отношения на множествах. Сложную систему можно отобразить в виде совокупности разнородных множеств и отношений между ними (рис. 3.3). Множества могут задаваться двумя способами: перечислением элементов {a1, a2, , an} названием характеристического свойства (именем, отражающим это свойство) – например, множество A. В основе большинства теоретико-множественных преобразований лежит переход от одного способа задания множества к другому. В множестве могут быть выделены подмножества. Из двух и более множеств или подмножеств можно, установив отношения между их элементами, сформировать новое множество, состоящее из элементов, качественно отличающихся от элементов исходных множеств. При теоретико-множественных представлениях можно вводить любые отношения. При конкретизации применяемых отношений и правил их использования можно получить одну из алгебр логики, один из языков математической лингвистики. Можно также создать язык моделирования сложных систем, который затем может развиваться как самостоятельное научное направление.
52
Рис. 3.3. Символический образ теоретико-множественных представлений Применение теоретико-множественных представлений. При применении теоретико-множественных представлений для отображения сложных систем и процессов в них наиболее общими формальными характеристиками являются абстрактные знаковые формулы, с помощью которых удобно отображать многоуровневое строение систем. Например, система S может быть отображена в совокупность множеств, описываемую теоретико-множественной формулой: S I , C , A, P, E , U , X , W , Z , (3.1) где I {i} совокупность (вектор) входных информационных сигналов; A {a} множество выходных действий (актуаций) системы; E {e} множество элементов, из которых составлена данная система; U {u} множество отношений между элементами E системы; C {c} множество состояний (ситуаций) системы; X {x} множество признаков, характеризующих состояние элементов и отношений; W {w} множество свойств, то есть w – свойства свойств системы: вес, цена, значимость каждого свойства по отношению к другим свойствам; P { p} множество вероятностей p изменения состояний; Z {z} множество возмущений z, действующих на систему. Представление системы полной формулой (3.1) не всегда возможно и целесообразно. Обычно системы описываются сокращенными формулами в зависимости от требований полноты описания. При отображении системы осуществляется ее декомпозиция – выделение групп (множеств) элементов, обладающих одинаковыми (в рамках определенных ограничений) свойствами. Выделив множества, можно производить соответствующие операции над ними, то есть, ставя их в определенные отношения друг с другом, перейти к композиции системы: (3.2) xR1cR2 eR j uRk aRn i . 53
Символом R здесь обозначаются отношения между элементами или множествами в случае, если не определен характер этих отношений. Решение задачи композиции системы заключается в определении характера взаимоотношений между элементами или множествами, то есть в замене символа R соответствующим знаком – оператором. Выяснение характера взаимоотношений между множествами или их элементами и возможные преобразования выражения (3.2) выполняются на основе определенных правил: законов, аксиом. Таким образом, теоретико-множественные формулы переводят систему Sx языка реальности в абстрактную систему, описываемую искусственным языком, имеющим соответствующий словарь (множество элементов, множество состояний, множество признаков и т.д., отображенных определенными символами) и правила образования новых понятий – композиций (множество отношений, законов, аксиом). Сложность языка определяется сложностью отображаемой системы и допустимой степенью абстрагирования. Благодаря тому, что при теоретико-множественных представлениях систем и процессов в них можно вводить любые отношения, эти представления: - служат хорошим языком, с помощью которого облегчается взаимопонимание между представителями различных областей знаний; - могут являться основой для возникновения новых научных направлений, для создания языков моделирования, языков автоматизации проектирования. Однако свобода введения любых отношений приводит к тому, что в создаваемых языках моделирования трудно ввести правила, закономерности, используя которые формально, можно получить новые результаты, адекватные реальным моделируемым объектам и процессам (как это позволяют делать аналитические и статистические методы). Поэтому первоначально при применении теоретико-множественных представлений стремились использовать ограниченный набор отношений.
3.4. Логические методы Основная терминология. Логические отображения являются частным случаем теоретико-множественных отображений. Они переводят реальную систему и отношения в ней на язык одной из алгебр логики (двузначной, многозначной), основанных на применении алгебраических методов для выражения законов формальной логики (рис. 3.4).
54
Рис. 3.4. Символический образ логических методов Наибольшее применение получила бинарная алгебра логики Буля (булева алгебра). Алгебра логики оперирует понятиями: высказывание, предикат, логические операции (логические функции, кванторы). В ней доказываются теоремы, приобретающие затем силу логических законов, применяя которые, можно преобразовать систему из одного описания в другое с целью ее совершенствования: можно, например, получить более простую структуру (схему), содержащую меньшее число состояний, элементов, но осуществляющую требуемые функции. Логические методы представления систем относятся к детерминированным. На базе математической логики созданы и развиваются теории логического анализа и синтеза, теория автоматов. На основе логических представлений первоначально начинали развиваться некоторые разделы теории формальных языков. В силу ограниченности смысловыражающих возможностей бинарной алгебры логики в последнее время имеются попытки создания многозначных алгебр логики с соответствующими логическими базисами и теоремами. Применение логических методов. Логические методы применяются при исследовании новых структур систем разнообразной природы (технических объектов, текстов и др.), в которых характер взаимодействия между элементами еще не настолько ясен, чтобы было возможно их представление аналитическими методами, а статистические исследования либо затруднены, либо не привели к выявлению устойчивых закономерностей. В то же время следует иметь в виду, что с помощью логических алгоритмов можно описывать не любые отношения, а лишь те, которые предусмотрены законами алгебры логики и подчиняются требованиям логического базиса.
55
Логические представления нашли широкое практическое применение при исследовании и разработке автоматов разного рода, автоматических систем контроля, а также при решении задач распознавания образов. Логические представления лежат в основе теории автоматов. На их базе развиваются прикладные разделы теории формальных языков. В то же время смысловыражающие возможности логических методов ограничены базисом и функциями алгебры логики и не всегда позволяют адекватно отобразить реальную проблемную ситуацию. Попытки же создания многозначных алгебр логики на практике пока не находят широкого применения из-за сложности создания логического базиса и доказательства формальных теорем многозначной алгебры логики.
3.5. Лингвистические и семиотические представления Основная терминология. Лингвистические и семиотические представления (рис. 3.5) – самые «молодые» методы формализованного отображения систем.
Рис. 3.5. Символический образ лингвистических и семиотических представлений Лингвистические представления базируются на понятиях тезауруса T (множество смысловыражающих элементов языка с заданными смысловыми отношениями; тезаурус характеризует структуру языка), грамматики G (правила образования смысловыражающих элементов разных уровней тезауруса), семиотики (смысловое содержание формируемых фраз, предложений и других смысловыражающих элементов) и прагматики (смысл для данной задачи, цели). Семиотические представления основываются на понятиях: знак, знаковая система, знаковая ситуация. Семиотика возникла как наука о знаках в широком смысле. Однако наиболее широкое практическое применение нашло направление лингвистической семиотики. С теоретической точки зрения границу между лингвистическими и 56
семиотическими представлениями при разработке языков моделирования можно определить характером правил грамматики (если правила не охватываются классификацией правил вывода формальных грамматик Н. Холмского, то модель удобнее отнести к семиотической и применять принципы ее анализа, предлагаемые семиотикой). Для практических приложений модели лингвистических и семиотических представлений можно рассматривать как один класс формализованного представления систем. Применение лингвистических и семиотических представлений. Данные представления возникли и развиваются в связи с потребностями анализа текстов и языков. Однако в последнее время эти представления начинают широко применяться для отображения и анализа процессов в сложных системах в тех случаях, когда не удается применить сразу аналитические, статистические представления или методы формальной логики. В частности, лингвистические и семиотические представления являются удобным аппаратом (особенно в сочетании с графическими представлениями) для первого этапа постепенной формализации задач принятия решений в плохо формализуемых ситуациях, чем и был вызван возрастающий интерес к этим методам со стороны разработчиков сложных систем. На их основе разрабатывают языки моделирования, автоматизации проектирования и т.д. Что касается недостатков методов, то при усложнении языка моделирования трудно гарантировать правильность получаемых результатов, возникают проблемы алгоритмической разрешимости, возможно появление парадоксов, что частично может быть устранено с помощью содержательного контроля и корректировки языка на каждом шаге его расширения в диалоговом режиме моделирования. При этом создатель языка не всегда может объяснить его возможности, происходит как бы «выращивание» языка, у которого появляются новые свойства.
3.6. Графические представления Основная терминология. К графическим представлениям (рис. 3.6) относятся любые графики (графики Ганта, диаграммы, гистограммы и т.п.) и возникшие на основе графических отображений теории (теория графов, теория сетевого планирования и управления и т.п.), то есть все то, что позволяет наглядно представить процессы, происходящие в системах, и облегчить таким образом их анализ для человека (лица, принимающего решения).
57
Рис. 3.6. Символический образ графических представлений Применение графических представлений. Графические представления являются удобным средством исследования структур и процессов в сложных системах и решения различного рода организационных вопросов в информационно-управляющих комплексах, в которых необходимо взаимодействие человека и технических устройств (в том числе – ЭВМ). Широкое применение на практике получила теория сетевого планирования и управления. Удобным средством представления информации различного рода при применении всех групп методов являются графики, диаграммы и другие графические формы. Графически представляют результаты аналитических расчетов, статистические закономерности и т.д. Для ускорения формализации и анализа сетевых моделей графические представления удобно сочетать с лингвистическими и семиотическими, что позволяет автоматизировать процесс формирования модели.
58
Глава 4. Экспертные методы системного анализа Экспертные методы системного анализа направлены на активизацию использования интуиции и опыта специалистов. Они применяются на начальных стадиях, когда отсутствует возможность эффективного использования методов формализованного представления систем. В этой главе рассмотрим распространенные экспертные методы согласно классификации, приведенной в [19].
4.1. Методы типа «мозговой атаки» Концепция мозговой атаки была разработана американским журналистом и предпринимателем А. Осборном (Alex Faickney Osborn). В 1942 голу он издал книгу [96], в которой описал первый вариант мозгового штурма, который использовался им и сотрудниками его рекламного агентства еще в конце 1930-х годов. Он утверждал, что «Количество, количество и ещё раз количество! Вот девиз дня... Чем больше попыток, тем больше вероятность попадания в цель» [43]. В 1953 году А. Осборн издал книгу «Прикладное воображение: принципы и процедуры творческого решения проблемы» [95] и начал проводить семинары по креативу для предпринимателей. С тех пор концепция мозговой атаки получила широкое распространение как «метод систематической тренировки творческого мышления», направленный на открытие новых идей и достижение согласия группы людей на основе интуитивного мышления. Методы этого типа известны также под названиями мозгового штурма, конференций идей, коллективной генерации идей. В нашей стране значительный вклад в данных методов развития творческого мышления внес А.Г. Альтшуллер, создавший теорию решения изобретательских задач (ТРИЗ) [4]. При проведении мозговой атаки или сессий коллективной генерации идей, участники стараются выполнить определенные правила, суть которых сводится к тому, чтобы обеспечить как можно большую свободу мышления участников коллективной генерации идей и высказывания ими новых идей. Для этого рекомендуется приветствовать любые идеи, даже если они вначале кажутся сомнительными или абсурдными (обсуждение и оценка идей проводится позднее), не допускать критики, не объявлять ложной идею и не прекращать обсуждать ни одну идею, высказывать как можно больше идей (желательно нетривиальных), стараться создавать цепные реакции идей. Методы мозговой атаки представляют собой эмпирически найденные эффективные способы решения творческих задач.
59
В зависимости от принятых правил и жесткости их выполнения различают прямую мозговую атаку, метод обмена мнениями, обратную мозговую атаку (когда одна группа вносит как можно больше предложений, а вторая старается их максимально критиковать). Мозговую атаку часто проводят в форме деловой игры. В реальных условиях достаточно трудно обеспечить жесткое выполнение требуемых правил, создать «атмосферу мозговой атаки»: мешает влияние должностной структуры организации, трудно собрать всех специалистов. Поэтому желательно применять способы привлечения компетентных специалистов, не требующие обязательного их присутствия в конкретном месте и в конкретное время и устного высказывания своих мнений. Рассмотрим метод прямой мозговой атаки. Он включает в себя следующее [57]. Формулировка задачи. Постановка задачи перед творческой группой участников мозговой атаки может иметь самую различную форму и содержание. Однако в ней должны быть четко сформулированы два момента: что в итоге желательно получить или иметь; что мешает получению желаемого. Формирование творческой группы. Наиболее эффективное число участников в творческой группе для проведения сеанса мозговой атаки составляет 5-12 человек. Как правило, творческие группы состоят из двух подгрупп: постоянное ядро группы и временные члены. В ядро группы входит ее руководитель и сотрудники, легко и плодотворно генерирующие идеи, а также люди, хорошо знающие и соблюдающие правила игры. Временные члены приглашаются из числа специалистов по решаемой задаче. Правила для участников сеанса мозговой атаки: - Стремление высказывать максимальное число идей; предпочтение отдается количеству, а не качеству идей. Свои идеи следует высказывать коротко. - Во время сеанса мозговой атаки абсолютно запрещена критика предложенных идей. Запрещаются также неодобрительные замечания, иронические реплики, консервативные, ядовитые шутки. Запрет критики создает благоприятный творческий микроклимат. - Внешнее и внутреннее одобрение и принятие всех идей, даже заведомо непрактичных и, казалось бы, глупых; предпочтение отдается не систематическому логическому мышлению, а озарениям, необузданной и безграничной фантазии в самых разных направлениях. - Весьма способствуют продуктивному мышлению шутки, каламбуры, юмор и смех. Следует создавать и поддерживать такую обстановку. - Стремление развивать, комбинировать и улучшать высказанные ранее идеи, получать от них новые ассоциативные идеи. 60
- Обеспечение между участниками мозговой атаки свободных, демократических, дружественных и доверительных отношений. Никто после сеанса не будет зло шутить над неудачными идеями других. - Настоящий сеанс мозговой атаки – это особое психологическое состояние людей, когда думается без волевых усилий и принимается во внимание «все, что придет в голову». Именно такое состояние оказывается наиболее продуктивным, поскольку позволяет в наибольшей мере использовать подсознание человека, самый мощный аппарат творческого мышления. Обязанности руководителя (ведущего) в сеансе мозговой атаки. Успех и результативность мозговой атаки в большой мере зависит от ведущего совещание, который осуществляет оперативное управление мозговой атакой. Ведущий должен руководствоваться правилами для участников мозговой атаки и поддерживать непринужденную обстановку. Кроме того, на ведущего возлагаются следующие обязанности: - если есть новички в творческой группе, ведущий в самом начале представляет всех участников, давая им короткую лестную характеристику. Далее излагаются правила для участников сеанса мозговой атаки; - ведущий четко и эмоционально излагает формулировку задачи как в специальном, так и в общедоступном изложении. При этом заставляет участников воспринимать задачу как свою главную проблему; - ведущий должен уметь обеспечить соблюдение участниками всех правил проведения мозговой атаки, не пользуясь при этом приказаниями и критическими замечаниями; - ведущий должен обеспечивать непрерывность высказывания идей, заполнять паузы поощрительными репликами; - ведущий должен следить, чтобы обсуждение не шло в слишком узком и слишком практическом направлении, своими идеями или репликами он должен расширять сферу поиска; - ведущий должен следить за регламентом работы. Говорить, сколько времени осталось до конца сеанса. Тактично останавливать участника, который высказывает свою идею более полминуты, интенсифицировать работу последних минут. Организация проведения мозговой атаки. Приглашать участников на совещание (сеанс мозговой атаки) желательно за 2-3 дня с изложением сути задачи, чтобы они могли подумать и настроиться. Продолжительность совещания составляет 1,5-2 часа. Совещание имеет следующий порядок проведения и соответствующие затраты времени на отдельные мероприятия: - представление участников совещания друг другу и ознакомление их с правилами проведения сеанса мозговой атаки (5-10 минут);
61
- постановка задачи ведущим с ответами на вопросы участников (10-15 минут); - проведение мозговой атаки (20-30 минут); - перерыв (10 минут); - составление отредактированного списка идей (30-45 минут). Весьма повышают эффективность различные мероприятия по психологической настройке и психоэвристическому стимулированию, например: показ перед мозговой атакой короткометражного фильма, заставляющего забыть заботы дня, или фильма, актуализирующего постановку задачи; включение во время сеанса мозговой атаки негромкой фоновой музыки; показ натурального образца, макета или эскиза объекта, который требуется улучшить; угощение чаем или кофе; объявление перед сеансом о гонораре, вручаемом сразу после окончания совещания и т.д. Запись и оформление результатов мозговой атаки. Фиксирование идей, высказываемых во время сеанса мозговой атаки, производится одним из трех способов: - среди участников имеется стенографист; - с помощью магнитофона; - каждый участник после высказывания записывает свою идею. После сеанса проводится быстрое коллективное редактирование полученного списка идей с полукритическим отношением. При этом участники мозговой атаки быстро отбрасывают наименее приемлемые и абсурдные идеи. Все полученные идеи желательно разделить на три группы: наиболее приемлемые и легко реализуемые для решаемой задачи; наиболее эффективные и перспективные; прочие. Отредактированный и оформленный список передается заинтересованным лицам для дальнейшей более детальной оценки и проработки. Методы типа «мозговой атаки» целесообразно применять для определения возможных вариантов развития. Его использование позволяет получить продуктивные результаты за короткий период времени и вовлечь всех экспертов в активный творческий процесс.
4.2. Методы типа «сценариев» Методы подготовки и согласования представлений о проблеме или анализируемом объекте, изложенных в письменном виде, получили название сценариев. Впервые сценарии начали использовать в военно-воздушных силах США после 2-й мировой войны для того, чтобы просчитывать возможные варианты действий противника. В 1960-х годах Г. Кан (Herman Kahn), ранее работавший в военно-воздушных войсках, впервые начал использовать метод сценариев для решения бизнес-задач. В 1970-х годах 62
метод сценариев вышел на новый уровень развития благодаря идеям П. Вака (Pierre Wack), работавшего в компании Royal Dutch Shell. В начале семидесятых П. Вак осознал, что традиционный метод прогнозирования через экстраполяцию – плохой способ смоделировать завтрашний день. Истинная роль стратегии в том, чтобы описать будущее таким, каким мы хотели бы его видеть. С моделью будущего в голове к нему можно готовиться и приближать его, получая тем самым преимущество перед конкурентами. Стратегия, иными словами, сводится к сочинению рассказов о будущем. Так был развит альтернативный инструмент для заглядывания в будущее – сценарное планирование. Сценарием называют преимущественно качественное описание возможных вариантов развития исследуемого объекта при различных сочетаниях определенных, заранее выделенных условий. Он не предназначен для «предсказания» будущего, а лишь в развернутой форме показывает возможные варианты развития событий для их дальнейшего анализа и выбора наиболее реальных и благоприятных. Как правило, на практике предложения для подготовки подобных документов пишутся экспертами вначале индивидуально, а затем формируется согласованный текст. Сценарий предусматривает не только содержательные рассуждения, помогающие не упустить детали, которые невозможно учесть в формальной модели (в этом заключается основная роль сценария), но и содержит результаты количественного технико-экономического или статистического анализа с предварительными выводами. Группа экспертов, подготавливающая сценарий, обычно пользуется правом получения необходимых справок от предприятий и организаций и необходимых консультаций. На практике по типу сценариев, например, разрабатываются прогнозы в отраслях промышленности. Роль специалистов по системному анализу при подготовке сценария заключается в следующем: - помочь привлекаемым ведущим специалистам соответствующих областей знаний выявить общие закономерности развития системы; - проанализировать внешние и внутренние факторы, влияющие на ее развитие и формирование целей; - определить источники этих факторов; проанализировать высказывания ведущих специалистов в периодической печати, научных публикациях и других источниках информации; - создать вспомогательные информационные фонды, способствующие решению проблемы. Метод сценариев является средством первичного упорядочения проблемы, получения и сбора информации о взаимосвязях решаемой проблемы с другими и о возможных и вероятных направлениях будущего 63
развития. Группа квалифицированных специалистов составляет план сценария, где стремится наметить области науки, техники, экономики и пр., которые должны быть учтены при постановке и решении проблемы. Различные разделы сценария обычно пишутся разными группами людей. Привлечение разных профессионалов позволяет проследить ветвление сценария, взаимосвязи с другими проблемами и т.д. В сценарии в явном виде фиксируются причинно-следственные связи, определяющие возможную в будущем динамику изменения состояния системы, и условия, под воздействием которых они будут происходить [81]. Прогнозный сценарий является некоторой относительной оценкой возможного развития системы, так как всегда строится в рамках предположений о будущих условиях развития, которые часто носят непредсказуемый характер. Формально сценарий может быть представлен некоторой траекторией в пространстве и во времени параметров состояния СЭС и условий ее существования (рис. 4.1) [77].
Рис. 4.1. Модель сценарного метода в базовой системе координат: ПС – прошлая ситуация; ИС – исходная ситуация; БС – будущая ситуация; сплошными линиями представлены реальные ПС и ИС; пунктиром – субъективное представление о ситуациях; область вне пересечения – степень неопределенности Сценарии могут быть использованы на разных этапах системного анализа, когда требуется собрать и упорядочить разнородную информацию. Но главной областью применения являются этапы I (анализ 64
проблемы) и VII (прогноз и анализ будущих условий) системного анализа, которые будут рассмотрены в следующей главе. Ограниченностью применения данного метода является то, что сценарий – это текст, с этим связанна возможность неоднозначного его толкования разными специалистами. Поэтому такой текст следует рассматривать как основу для разработки более формализованного представления о будущей системе или решаемой проблеме.
4.3. Методы экспертных оценок Методы экспертных оценок предусматривают одно- и многоэтапный опрос экспертов и обработку полученных результатов с помощью аппарата математической статистики [8]. Достоинствами таких методов являются малые ограничения по специальной подготовке экспертов и простота реализации. К недостаткам метода следует отнести их ориентацию на краткосрочное прогнозирование, а также существенную зависимость от подбора экспертной группы. Выбор форм и методов проведения экспертных опросов зависит от конкретной задачи и условий проведения экспертизы. Однако существуют некоторые общие проблемы, которые нужно знать специалисту по системному анализу. Возможность использования экспертных оценок, обоснование их объективности базируется на том, что неизвестная характеристика исследуемого явления трактуется как случайная величина, отражением закона распределения которой является индивидуальная оценка специалиста-эксперта о достоверности и значимости того или иного события. При этом предполагается, что истинное значение исследуемой характеристики находится внутри диапазона оценок, получаемых от группы экспертов, и что обобщенное коллективное мнение является достоверным. Проблемы, для решения которых применяются экспертные оценки, делят на два класса. К первому классу относятся проблемы, которые достаточно хорошо обеспечены информацией и для которых можно использовать принцип «хорошего измерителя», считая эксперта хранителем большого объема информации, а групповое мнение экспертов – близким к истине. Ко второму классу относятся проблемы, в отношении которых знаний для уверенности в справедливости названных предположений недостаточно. Здесь экспертов нельзя рассматривать как «хороших измерителей», и необходимо осторожно подходить к обработке результатов экспертизы, поскольку в этом случае мнение одного эксперта, уделяющего больше внимания, чем другие, малоизученной проблеме, может оказаться наиболее значимым, а при формальной обработке оно будет утрачено. В связи с этим к задачам второго класса в основном 65
должна применяться качественная обработка результатов. Использование методов осреднения, справедливых для «хороших измерителей», в данном случае может привести к существенным ошибкам. Задачи коллективного принятия решений по формированию целей, совершенствованию методов и форм управления обычно можно отнести к первому классу. Однако при разработке прогнозов и перспективных планов целесообразно выявлять «редкие» мнения и подвергать их более тщательному анализу. Другая проблема, которую нужно иметь в виду при проведении системного анализа, заключается в следующем. Даже в случае решения проблем, относящихся к первому классу, нельзя забывать о том, что экспертные оценки несут в себе не только узко-субъективные черты, присущие мнениям отдельных экспертов, но и коллективно-субъективные черты, которые не исчезают при обработке результатов опроса (а при применении Дельфи-процедуры даже могут усиливаться). Иными словами, на экспертные оценки нужно смотреть как на некоторую «общественную точку зрения», зависящую от уровня научно-технических знаний общества относительно предмета исследования, которая может меняться по мере развития системы и наших представлений о ней. Следовательно, экспертный опрос – это не одноразовая процедура, то есть при решении сложной проблемы, характеризующейся большой степенью неопределенности, необходимо создать регулярную практику работы с экспертами. Следует также обратить внимание на то, что использование классического частотного подхода к оценке вероятности при организации проведения экспертных опросов бывает затруднительным, а иногда и невозможным (из-за невозможности доказать правомерность того, что используемая выборка является представительной). В этом случае экспертную оценку представляют как степень подтверждения гипотезы или как вероятность достижения цели.
4.4. Методы типа «Дельфи» Метод «Дельфи» или метод «Дельфийского оракула» был разработан в 1950-е годы в США в исследовательском центре по методам ведения военных действий RAND. Авторами считаются О. Хелмер (Olaf Helmer), Н. Решер (Nicholas Rescher) и Н. Дэлки (Norman Dalkey). Этот метод первоначально был предложен как итеративная процедура при проведении мозговой атаки, которая способствовала бы снижению влияния психологических факторов при проведении заседаний и повышения объективности результатов. Однако почти одновременно Дельфи-процедуры стали средством повышения объективности
66
экспертных опросов с использованием количественных оценок при оценке «деревьев цели» и при разработке «сценариев». Метод «Дельфи» был разработан для решения сложных стратегических проблем с целью [91]: - получить более широкие источники информации о будущем; - предельно устранить субъективный фактор в суждениях и оценках будущего; - стимулировать способы мышления специалистов путем создания специальной информационной системы с обратными связями; - устранить помехи в обмене информацией между специалистами, давление авторитета и другие формы давления; - обеспечить повышение достоверности прогнозов путем специальных процедур количественной оценки мнений экспертов и их машинной обработки. В отличие от метода сценариев, метод «Дельфи» предполагает предварительное ознакомление привлекаемых экспертов с ситуацией с помощью какой-либо модели, например, эконометрической модели развития экономики или неформального описания процесса в виде сценария. Специалистам предлагается оценить структуру модели в целом и дать предложения о включении в нее неучтенных связей. Результаты каждого этапа этого опроса и их систематизация доводятся вновь до сведения всех экспертов, что позволяет им далее корректировать свои суждения на основе вновь полученной информации. И так далее. В методе «Дельфи» предусмотрена необходимость статистической обработки мнений экспертов, он может комбинироваться с другими методами прогнозов на основе математико-статистических моделей прогнозирования. Основными средствами повышения объективности результатов при применении метода «Дельфи» являются: - использование обратной связи; - ознакомление экспертов с результатами предшествующего тура опроса; - учет результатов предшествующего опроса при оценке значимости мнений экспертов; - наличие итераций. В системном анализе метод «Дельфи» используется на следующих его этапах (см. главу 5): - на этапе VI для оценки современного состояния тех факторов, которые не поддаются непосредственной количественной оценке (например, оценка современных социальных факторов, влияющих на формирование целей); - на этапе VII в качестве одного из важнейших методов получения и обработки прогнозной информации; - на этапе VIII для оценки целей и средств. 67
Метод «Дельфи» представляется самым надежным средством получения данных, особенно относительно информации о будущем.
4.5. Методы типа «дерева целей» Концепция дерева целей впервые была предложена Ч. Черчменом (Charles West Churchman) и Р. Акоффом в 1957 году и представляет собой упорядочивающий инструмент (подобный организационной схеме компании), используемый для формирования элементов общей целевой программы развития компании (главных или генеральных целей) и соотнесения со специфическими целями различных уровней и областей деятельности. Термин «дерево» подразумевает использование иерархической структуры, полученной путем разделения общей цели на подцели, а их, в свою очередь, на более детальные составляющие, подцели нижележащих уровней. В настоящее время метод дерева целей является центральным, главным методом системного анализа. Дерево целей представляет собой связный граф, вершины которого интерпретируются как цели, а ребра или дуги – как связи между целями. При этом в понятие целей на разных уровнях вкладывается различное содержание: от объективных народнохозяйственных потребностей и желаемых направлений развития на верхнем уровне дерева до решения конкретных практических задач и осуществления отдельных мероприятий на нижних уровнях. Основным требованием к дереву целей является отсутствие циклов. В остальном метод достаточно универсален. Дерево целей является главным инструментом увязки целей высшего уровня с конкретными средствами их достижения на низшем производственном уровне через ряд промежуточных звеньев. Представление целей начинается с верхнего уровня, дальше они последовательно разукрупняются, конкретизируются. Основным правилом разукрупнения целей является полнота: каждая цель верхнего уровня должна быть представлена в виде подцелей следующего уровня исчерпывающим образом, то есть так, чтобы объединение понятий подцелей полностью определяло понятие исходной цели [71]. На рис. 4.2 представлен фрагмент примерного дерева целей долгосрочной программы развития региона, взятый из [39]. Метод дерева целей ориентирован на получение полной и относительно устойчивой структуры целей, проблем, направлений, то есть такой структуры, которая на протяжении какого-то периода времени мало изменялась при неизбежных изменениях, происходящих в любой развивающейся системе. Для достижения данной цели при построении вариантов структуры следует учитывать закономерности целеобразования и использовать принципы и методики формирования иерархических структур целей. 68
В качестве основного инструмента метод дерева целей используется на этапах V, VI, VII, VIII и IX системного анализа (см. главу 5).
Рис. 4.2. Фрагмент дерева целей
4.6. Морфологические методы Термином «морфология» в биологии и языкознании определяется учение о внутренней структуре исследуемых систем (организмов, языков) или сама внутренняя структура этих систем. Метод морфологического анализа и синтеза был разработан в 1930-х годах американским астрофизиком швейцарского происхождения Ф. Цвикки (Fritz Zwicky) для конструирования астрономических приборов [57]. 69
Морфологический подход основан на комбинаторике. Его основная идея – систематически находить наибольшее число, а в пределе – все возможные варианты решения поставленной проблемы или реализации системы путем комбинирования основных (выделенных исследователем) структурных элементов системы или их признаков. При этом система или проблема может разбиваться на части разными способами и рассматриваться в различных аспектах [53]. Отправными точками морфологического подхода считаются: - равный интерес ко всем объектам морфологического моделирования; - ликвидация всех ограничений и оценок до тех пор, пока не будет получена полная структура исследуемой области; - максимально точная формулировка поставленной проблемы. Кроме этих общих положений были предложены отдельные способы морфологического моделирования: - метод систематического покрытия поля (МСПП); - метод отрицания и конструирования (МОК); - метод морфологического ящика (ММЯ); - метод экстремальных ситуаций (МЭС); - метод сопоставления совершенного с дефектным (МССД); - метод обобщения (МО). Наибольшую распространенность получили первые три метода. МСПП предполагает, что существует некоторое число так называемых «опорных пунктов» знания в любой исследуемой области. Этими пунктами могут быть теоретические положения, эмпирические факты, открытые законы и т.д. Исходя из ограниченного числа опорных пунктов знания и принципов мышления, ищут все возможные решения поставленной проблемы. МОК основывается на соображениях, которые Ф. Цвикки сформулировал следующим образом: «На пути конструктивного прогресса стоят догмы и компромиссные или диктаторские ограничения. Следовательно, есть смысл их отрицать. Однако, одного этого недостаточно. То, что получается из отрицания, необходимо конструктивно переработать». В соответствии с этим МОК разбивается на три этапа: 1) формирование ряда высказываний (положений, утверждений, аксиом), соответствующих современному уровню развития исследуемой области знаний; 2) замена одного, нескольких или всех сформулированных высказываний на противоположные; 3) построение всевозможных следствий, вытекающих из такого отрицания и проверка непротиворечивости вновь полученных и оставшихся неизменными высказываний.
70
МОК может быть реализован в форме одного из вариантов мозговой атаки: метода обратной мозговой атаки. Идея ММЯ состоит в определении всех возможных параметров, от которых может зависеть решение проблемы, и представления их в виде матриц-строк, а затем в определении в этой морфологической матрицеящике всех возможных сочетаний параметров по одному из каждой строки. Полученные варианты решений подвергаются оценке и анализу с целью выбора наилучшего. Построение и исследование по ММЯ проводится в пять этапов: 1) Точная формулировка поставленной проблемы. 2) Определение параметров (классификационных признаков) Pi, от которых зависит решение проблемы (процедура анализа может быть итеративной с уточнением или изменением набора Pi по мере уточнения представлений об исследуемом объекте или процессе принятия решения). 3) Деление параметров Pi на их значения pik i (формирование классификаторов по выбранным признакам Pi) и представление их в виде матриц-строк p1 , p 2 ,, p k1 , p1 , p 2 ,, p k2 , , p1 , p 2 , , p kn , 2 n 2 1 2 1 1 n n набор значений (по одному из каждой строки) различных параметров представляет собой возможный вариант решения моделируемой задачи, p11 , p22 , , pn2 ; общее число вариантов например, вариант содержащихся в морфологическом ящике, равно R k1 k2 kn , где ki число значений i-го параметра i 1, 2, , n. 4) Оценка всех имеющихся в морфологическом ящике вариантов. 5) Выбор из морфологического ящика оптимального варианта решения задачи. С математической точки зрения идея морфологического перебора базируется на получении размещений с повторением из k по n. Для сокращения перебора этапы 3 и 4 могут быть совмещены, и явно неприемлемые варианты можно сразу исключить из рассмотрения в п.5. Возможные пути выбора решений из морфологического ящика (рис. 4.3): - применение одного критерия, полностью исключающего все варианты решений, кроме одного (рис. 4.2а); - последовательное применение нескольких критериев A, B, C, постепенно исключающих все варианты, кроме одного (рис. 4.2б); - расчленение проблемы на подпроблемы (или задачи на подзадачи) и последовательное применение нескольких критериев для выбора по
71
одному варианту решения каждой из подпроблем (подзадач), которые вместе взятые и составляют искомое решение (рис. 4.2в).
Рис. 4.3. Пути выбора решений из морфологического ящика
72
В последнем случае может быть получено не одно решение, составленное из решений подзадач, а несколько таких (равноценных) решений, и тогда уменьшение числа этих вариантов, дальнейшее сужение области решений осуществляется путем введения дополнительных (как правило, качественных) критериев. Решения по подзадачам, из которых формируется общий вариант решения, могут быть взаимозависимыми. Расширению практического применения ММЯ существенно способствует автоматизация морфологического моделирования. При этом важно автоматизировать не только получение вариантов, то есть собственно перебор, но и получение оценок этих вариантов.
4.7. Матричный метод Матричный метод – широко используется в планировании и прогнозировании. Например, в практике маркетинга матричный метод применяется как метод оценки позиции предприятия на рынке, что позволяет принять решение о выборе одной из возможных стратегий: - стратегии атаки при благоприятной позиции (С1); - стратегии обороны при средней, неопределенной позиции (С2); - стратегии отступления при неблагоприятной позиции (С3). Это так называемая стратегическая матрица, или графическая сетка (рис. 4), образованная пересечением координат, которые отражают величину двух факторов, как правило, характеризующих рыночную ситуацию (А) и собственные возможности предприятия (конкурентоспособность) (В). Решения о поведении на рынке (С) принимаются на основе того, на какое поле (квадрант) матрицы, образованное комбинацией действия факторов, по своим параметрам попадает данное предприятие. Минимальным числом квадрантов должно быть четыре, хотя в принципе матрица может содержать любое число квадрантов. Оптимальным числом считается 9-16, так как в противном случае результаты трудно интерпретировать. Количественные оценки факторов (стратегических индексов) определяются экспертным путем (в баллах) в зависимости от величины и силы действия фактора. Однако в целях упрощения количественные оценки можно заменить эквивалентными качественными, например: хороший, высокий (ранг 1), плохой, слабый (ранг 2). На рис. 4.4 позиция предприятия в маркетинге диктует одну из стратегий: стратегию атаки (С1), когда предприятие занимает сильную позицию; стратегию обороны (С2), когда позиция оценивается как средняя; стратегию отступления (С3), когда позиция явно невыгодная, слабая. Индексы РН, РС и РВ означают уровень коммерческого риска – соответственно низкий, средний и высокий. Подробно о применении
73
матричного метода прогнозирования в практике маркетинга (в сочетании со статистическими методами).
Рис.4.4. Алгоритм стратегической маркетинговой матрицы Обобщением данного подхода является метод решающих матриц, который был предложен Г.С. Поспеловым как средство повышения достоверности экспертной оценки путем разделения проблемы с большой неопределенностью на подпроблемы и пошагового получения оценок [59]. Например, при создании сложных производственных комплексов, автоматизированных систем управления и других сложных объектов нужно определить влияние на проектируемый объект фундаментальных научно-исследовательских работ (НИР), чтобы запланировать эти работы, предусмотреть их финансирование и распределить средства между ними. Получить от экспертов объективные и достоверные оценки влияния фундаментальных НИР на проектирование сложного комплекса практически невозможно. Для того чтобы облегчить экспертам решение этой задачи, можно вначале спросить их, какие направления исследований могут быть полезны для создания комплекса и попросить определить относительные веса этих направлений 1, , n. Затем нужно составить план опытно-конструкторских работ (ОКР) для получения необходимых результатов по названным направлениям и оценить их вклад 1, , n. Далее нужно определить программу прикладных научных исследований и относительные веса прикладных НИР 1, , n. И наконец, необходимо оценить влияние фундаментальных НИР 1, , n на прикладные. Таким образом, область работы экспертов можно представить в виде нескольких уровней: направления – ОКР – прикладные НИР – фундаментальные НИР (рис. 4.5). Относительные веса по всем уровням должны быть нормированы. В методе решающих матриц для удобства опроса экспертов относительные
74
веса определяются не в долях единицы, а в процентах; они нормируются вначале по отношению к 100:
n
j 100 . j 1
Рис. 4.5. Уровни работы экспертов Только вклад направлений (подцелей) в реализацию общей цели проекта оценивается экспертами непосредственно. Остальные относительные веса (ОКР, прикладных НИР) вычисляются. Эксперты оценивают вклад каждой отдельной альтернативы (ОКР, НИР) в реализацию альтернатив более высокого уровня, непосредственно предшествующего уровню данной альтернативы. Так, вклад опытноконструкторской работы i в реализацию подцели (направления) i оценивается некоторой величиной aij. Для каждой ОКР i относительные веса aij также нормированы:
n
aij 100 . j 1
Таким образом, каждая строка решающей матрицы aij характеризует относительный вклад i-й ОКР в реализацию каждого из направлений
75
(подцелей). Оценив предварительно 1 , , n и, используя решающую n
матрицу aij , можно получить относительные веса ОКР как i aij j . j 1
Аналогично, зная i и оценив bki , можно получить относительные веса прикладных НИР k, а затем и фундаментальных исследований l. В результате при использовании метода решающих матриц оценка относительной важности сложной альтернативы сводится к последовательности оценок более частных альтернатив, которые эксперт способен осуществить. Таким образом, большая неопределенность, имевшая место в начале решения задачи, разделяется на более «мелкие», лучше поддающиеся исследованию и оценке.
4.8. Ассоциативные и алгоритмические методы прогнозирования Метод исторической аналогии основан на установлении и использовании аналогии объекта прогнозирования с одинаковым по природе объектом, опережающим первый в своем развитии. Нечетко-множественное моделирование основано на понятиях нечеткой логики и инструментальных средствах ее реализации. Преимуществом данного класса методов является возможность учета неполной и нестрогой информации на основе предварительно построенной базы правил. Недостатками таких методов являются: - отсутствие формальной количественной оценки достоверности прогноза; - зависимость от программного обеспечения; - необходимость специального обучения экспертов; - относительная простота исследуемых объектов. Интеллектуальный анализ данных. Технологии искусственного интеллекта (методы системного анализа, нейросетевое моделирование, генетические алгоритмы и др.) для прогнозирования основаны на адаптации и верификации экономико-информационных моделей. Методы искусственного интеллекта могут использоваться независимо или же в сочетании с другими методами экономико-статистического анализа. Существует много примеров успешного использования генетических алгоритмов в ситуациях, когда математические методы не реализуемы практически из-за слишком больших вычислительных затрат. Недостатками таких методов являются: - сложность конфигурирования и «обучения» информационных моделей с учетом особенностей конкретной предметной области; - невозможность количественной оценки достоверности результатов оценивания и прогноза. Метод имитационного моделирования состоит в реконструировании изменений некоторых сущностей путем прогона их компьютерных 76
моделей [86]. Это формальный метод, то есть состоящий в манипулировании символами и не учитывающий возможных разнообразных проявлений интеллекта некоторых субъектов, влияющих на изучаемые сущности. Имитационное моделирование используется в случаях, когда по формальному описанию системы невозможно или затруднительно получить значения ее «выходов» для заданных значений ее «входов» путем формальных преобразований. Различаются имитационные модели: 1) процессуальные, событийные; 2) детерминированные, вероятностные. Посредством имитационного моделирования могут более или менее точно предсказываться, например, погода, распределение и движение поверхностных вод, распределение и движение промышленных и прочих загрязнений в атмосфере, водах, грунте, начальное течение тотальной термоядерной войны, распространение эпидемии и т.п. То есть такие процессы и события, на которые не влияют текущие решения людей, либо которые зависят от выбора из заранее известных вариантов действий, осуществляемого по известным правилам.
4.9. Другие экспертные методы Сетевое моделирование и планирование получило широкое применение на практике, особенно в оперативном прогнозировании. В основу метода положено построение сетевого графика, который имеет много разновидностей. На сетевых графиках каждый вид работы изображается стрелкой (дугой), которая соединяет начальное и конечное события. События изображаются кружками. При построении сетевых графиков соблюдаются следующие условия: нумерацию событий делают так, чтобы стрелки имели направление от события с меньшим номером к событию с большим номером; должна быть единственная начальная и единственная конечная вершины; стрелки должны иметь направление слева направо; любая пара событий соединяется только одной стрелкой. Графические представления являются удобным средством исследования структур и процессов в сложных системах и решения различного рода организационных вопросов в информационноуправляющих комплексах, в которых необходимо взаимодействие человека и технических устройств (в том числе – ЭВМ). Кроме того графики, диаграммы и другие графические формы являются удобным средством представления различного рода информации при применении разных групп методов прогнозирования. Графически представляют результаты аналитических расчетов, статистические закономерности и т.д.
77
Для ускорения формализации и анализа сетевых моделей графические представления удобно сочетать с лингвистическими и семиотическими, что позволяет автоматизировать процесс формирования модели. Методы структурной аналогии. В этом методе прогноз делают с помощью переноса известного результата на другой объект исследования. Суть метода структурной аналогии заключается в следующем. По однотипной продукции, на основе статистических данных, определяется структура себестоимости по элементам затрат, т.е. находится удельный вес материальных затрат, заработной платы и других элементов затрат в полной себестоимости продукции. Затем нормативным или другим методом определяется абсолютная величина материальных затрат, заработной платы по новому изделию. Эти элементы выделяются в качестве основы себестоимости при расчете цены данным методом. Зная абсолютную величину того или иного вида затрат по основному изделию и его удельный вес в структуре себестоимости по аналогичной группе продукции, можно рассчитать себестоимость нового изделия по формуле: М (З ) С н з п 100% , d m(d з ) где Сн – себестоимость нового изделия; М3(Зп) – материальные затраты (заработная плата) на единицу нового изделия; dm(dз) – удельный вес материальных затрат (заработной платы) в себестоимости по аналогичной группе изделий. Диагностические методы представляют собой достаточно хорошо отработанные приемы массового обследования предприятий и органов управления с целью усовершенствования форм и методов их работы. Они применяются специально на этапе диагностики обследуемого объекта (этап X системного анализа, см. главу 5), но могут использоваться также и на других этапах для получения необходимой информации. Наиболее наглядным и удобным средством отражения динамических, развивающихся во времени процессов, их анализа и планирования с включением элементов оптимизации являются сетевые методы. Известные сетевые методы и их модификации используются в системном анализе главным образом на этапе построения комплексных программ развития. Более сложные многомерные сети используются для распределения сфер ответственности, распределения работ по конкретным исполнителям в организациях, ориентированных на цель. В общем виде матричные формы представления и анализа информации не являются специфическим инструментом системного анализа, однако широко используются на различных его этапах в качестве вспомогательного средства. Матрица является не только чрезвычайно наглядной формой представления информации, но и формой, которая во многих случаях раскрывает внутренние связи между элементами, помогает выяснить и проанализировать ненаблюдаемые части структуры. 78
На всех стадиях системного анализа применяются методы экономического анализа. В процессе системного анализа значительная часть информации не имеет количественных оценок или в принципе не может их иметь, поэтому одной из основных задач системного анализа является задача преобразования этих данных путем структуризации и введения субъективных оценок в некоторый комплекс задач. Эта задача наилучшим образом решается методами экономического анализа. Кибернетические модели, отображающие процессы управления в экономических системах, должны использоваться всякий раз, когда именно эти процессы являются предметом системного анализа. В этих моделях могут использоваться самые различные выразительные средства: схемы, блок-схемы, таблицы, диаграммы. Экономико-математические модели бывают двух типов: описательные и операционные. Описательные модели описывают состояние объекта или его поведение и являются важнейшим средством представления экономических систем в процессе системного анализа в той их части, где имеется достаточная количественная информация. Примеры описательных моделей: модели отраслевых, межотраслевых и межрегиональных балансов типа «затраты – выпуск». Нормативные операционные модели служат для нахождения оптимальных и приближенно оптимальных решений. Модели такого типа (оптимизационные, имитационные, игровые) могут использоваться в системном анализе в том случае, если они уже заранее отработаны и по ним имеется собранная и проанализированная информация.
79
Глава 5. Методики системного анализа 5.1. О разработке методики Методика системного анализа разрабатывается и применяется в тех случаях, когда у лиц, принимающих решения на начальном этапе нет достаточных сведений о проблемной ситуации, позволяющей выбрать метод ее формализованного представления, сформировать математическую модель или применить один из подходов к моделированию, сочетающих качественные и количественные приемы, типа рассмотренных в главах 3, 4 [19]. В таких условиях может помочь представление объектов в виде систем, привлечение для их анализа специалистов различных областей знаний, организация процесса коллективного принятия решения с использованием разных методов системного анализа, со сменой методов при необходимости по мере познания объекта (ситуации). Для того, чтобы организовать такой процесс, нужно определить последовательность этапов, рекомендовать методы для выполнения этих этапов, предусмотреть при необходимости возврат к предыдущим этапам. Такая последовательность определенным образом выделенных и упорядоченных этапов с рекомендованными методами или приемами их выполнения и представляет собой методику системного анализа. Таким образом, методика системного анализа разрабатывается для того, чтобы организовать процесс принятия решения в сложных проблемных ситуациях. Они должны ориентировать лицо, принимающее решение, на необходимость обоснования полноты анализа, формирование модели принятия решения, адекватно отображающей рассматриваемый объект или процесс.
5.2. Этапы реализации системного анализа В связи с многообразием задач, решаемых с помощью методов системного анализа, различием подходов разных школ системного анализа существует несколько вариантов классификации этапов системного анализа [51, 54, 78, 82, 90]. Каждый автор предлагает свою классификацию, отражающую сферы его деятельности. Однако, несмотря на различия в частностях, выявляется большая общность воззрений и принципиальное единство подходов к разделению системного анализа на этапы. Примеры выделения этапов в наиболее распространенных методиках системного анализа приведены в табл. 5.1.
80
Универсальным средством методологии системного анализа является четкое выделение пяти логических элементов в процессе исследования любых систем, подсистем и других элементов. К ним относятся: 1) цель или ряд целей; 2) альтернативные средства (или системы), с помощью которых может быть достигнута цель; 3) затраты ресурсов, требуемых для каждой системы; 4) математическая и логическая модели, каждая из которых есть система связей между целями, альтернативными средствами их достижения, окружающей средой и требованиями на ресурсы; 5) критерий выбора предпочтительной альтернативы; с его помощью составляют некоторым способом цели и затраты. Таблица 5.1. Сравнительная классификация этапов системного анализа По С.Л. Оптнеру Идентификация симптомов. Определение актуальности проблемы. Определение цели. Определение структуры системы и ее дефектов. Определение возможностей. Нахождение альтернатив. Оценка альтернатив. Выработка решения. Признание решения. Запуск решения. Управление реализацией решения. Оценка реализации решения и ее последствий.
Этапы методик системного анализа По С.Янгу По Н.П. Фе- По С.П. Никадоренко норову Определение целей организации. Выявление проблемы. Исследование проблемы и постановка диагноза. Поиск решения. Оценка всех альтернатив и выбор наилучшей из них. Согласование решения. Утверждение решения. Подготовка к вводу в действие. Управление применением решения. Проверка эффективности решения.
Формулирова ние проблемы. Определение целей. Сбор информации. Разработка максимальног о количества альтернатив. Отбор альтернатив. Построение модели в виде уравнений, программ или сценария. Оценка затрат. Параметрическое исследование чувствительности решения.
Обнаружение проблемы. Оценка актуальности проблемы. Анализ ограничений проблемы. Определение критериев. Анализ существующей системы. Поиск возможностей (альтернатив). Выбор альтернативы. Обеспечение признания. Принятие решения (принятие формальной ответственности). Реализация решения. Определение результатов решения.
По Ю.И. Черняку Анализ проблемы. Определение системы. Анализ структуры системы. Формирование общей цели и критерия системы. Декомпозиция цели, выявление потребности в ресурсах и процессах. Выявление ресурсов и процессов, композиция целей. Прогноз и анализ будущих условий. Оценка целей и средств. Отбор вариантов. Диагноз существующей системы. Построение комплексной программы развития. Проектирование организации для достижения целей.
81
Отметим, что в одних методиках больше внимания уделяется разработке и исследованию альтернатив принятия решений (С.П. Оптнер, Н.П. Федоренко, С.П. Никаноров), в других – определению и структуризации целей (Ю. И.Черняк) или процессу реализации уже принятого решения (С. Янг). Приведенное описание методик носит абстрактный характер. В табл. 5.2. приведены этапы системного анализа и их последовательность по методике системного анализа Ю.И. Черняка. Таблица 5.2. Последовательность этапов и работ системного анализа Этапы
Научные инструменты системного анализа
I. Анализ проблемы 1. Обнаружение проблемы. Методы: сценариев, 2. Точное формулирование проблемы. диагностический, 3. Анализ логической структуры проблемы. деревьев целей, 4. Анализ развития проблемы (в прошлом и будущем). экономического анализа, 5. Определение внешних связей проблемы (с другими мозговой атаки проблемами). 6. Выявление принципиальной разрешимости проблемы. II. Определение системы 1. Спецификация задачи. Методы: матричные, 2. Определение позиции наблюдателя. кибернетические модели 3. Определение объекта. 4. Выделение элементов (определение границ разбиения системы). 5. Определение подсистем. 6. Определение среды. III. Анализ структуры системы 1. Определение уровней иерархии (в большой системе). Методы: диагностичес2. Определение аспектов и языков (в сложной системе). кие, матричные, сетевые, 3. Определение процессов функций (в динамической морфологические, киберсистеме). нетические модели 4. Определение и спецификация процессов управления и каналов информации (в управляющей системе). 5. Спецификация подсистем. 6. Спецификация процессов, функций текущей деятельности (рутинных) и развития (целевых). IV. Формулирование общей цели и критерия системы 1. Определение целей, требований надсистемы. Методы: «Дельфи», де2. Определение целей и ограничений среды. ревьев целей, экономи3. Формулирование общей цели. ческого анализа, морфо4. Определение критерия. логический, кибернети5. Декомпозиция целей и критериев по подсистемам. ческие модели, норма6. Композиция общего критерия из критериев подсистем. тивные операционные модели (оптимизационные, имитационные, игровые)
82
Продолжение табл. 5.2 Научные инструменты системного анализа V. Декомпозиция цели, выявление потребностей в ресурсах и процессах 1. Формулирование целей верхнего ранга. Методы: деревьев целей, 2. Формулирование целей текущих процессов. сетевые, описательные 3. Формулирование целей эффективности. модели, моделирования 4. Формулирование целей развития. 5. Формулирование внешних целей и ограничений. 6. Выявление потребностей в ресурсах и процессах. VI. Выявление ресурсов и процессов, композиция целей 1. Оценка существующих технологии и мощностей. Методы: «Дельфи», 2. Оценка современного состояния ресурсов. деревьев целей, 3. Оценка реализуемых и запланированных проектов. экономического анализа 4. Оценка возможностей взаимодействия с другими системами. 5. Оценка социальных факторов. 6. Композиция целей. VII. Прогноз и анализ будущих условий 1. Анализ устойчивых тенденций развития системы. Методы: сценариев, 2. Прогноз развития и изменения среды. «Дельфи», деревьев 3. Предсказание появления новых факторов, целей, сетевые, эконооказывающих сильное влияние на развитие системы. мического анализа, 4. Анализ ресурсов будущего. статистический, 5. Комплексный анализ взаимодействия факторов описательные модели, будущего развития. мозговой атаки 6. Анализ возможных сдвигов целей и критериев. VIII. Оценка целей и средств 1. Вычисление оценок по критерию. Методы: «Дельфи», 2. Оценка взаимозависимости целей. экономического анализа, 3. Оценка относительной важности целей. морфологический 4. Оценка дефицитности и стоимости ресурсов. 5. Оценка влияния внешних факторов. 6. Вычисление комплексных расчетных оценок. IX. Отбор вариантов 1. Анализ целей на совместимость и входимость. Методы: деревьев целей, 2. Проверка целей на полноту. матричные, 3. Отсечение избыточных целей. экономического анализа, 4. Планирование вариантов достижения целей. морфологический 5. Оценка и сравнение вариантов. 6. Совмещение комплекса взаимосвязанных вариантов. X. Диагноз существующей системы 1. Моделирование процессов. Методы: 2. Расчет потенциальной и фактической мощностей. диагностические, 3. Анализ потерь мощности. матричные, 4. Выявление недостатков организации производства и экономического анализа, управления. кибернетические модели 5. Выявление и анализ мероприятий по совершенствованию организации. Этапы
83
Окончание табл. 5.2 Научные инструменты системного анализа XI. Построение комплексной программы развития 1. Формулирование мероприятий, проектов, программ. Методы: матричные, 2. Определение очередности целей и мероприятий по их экономического анализа, достижению. описательные модели, 3. Распределение сфер деятельности. нормативные 4. Распределение сфер компетенции. операционные модели 5. Разработка комплексного плана мероприятий в рамках ограничений по ресурсам во времени. 6. Распределение по ответственным организациям, руководителям и исполнителям. XII. Проектирование организации для достижения целей 1. Назначение целей организации. Методы: 2. Формулирование функций организации. диагностические, 3. Проектирование организационной структуры. деревьев целей, 4. Проектирование информационных механизмов. матричные, сетевые, 5. Проектирование режимов работы. кибернетические модели 6. Проектирование механизмов материального и морального стимулирования. Этапы
Комментарий к 12-ти этапам системного анализа. I. Вопрос о том, существует ли проблема, имеет первостепенное значение, поскольку приложение значительных усилий к решению несуществующих проблем – отнюдь не исключение, а типичный случай. Правильное и точное формулирование проблемы является первым и необходимым этапом любого системного исследования. Как известно, успешное формулирование проблемы может быть равносильно половине решения проблемы. II. Чтобы построить систему, надо разложить проблему на комплекс четко сформулированных задач. При этом в случае большой системы задачи образуют иерархию, в случае сложной системы – множество различных задач на разных языках. Позиция наблюдателя определяет критерий решения проблемы. В некоторых случаях весьма трудными являются задачи определения объекта и среды. III. Произвол в выделении подсистем и реализуемых в них процессов неизбежно обрекает системное исследование на неудачу. Выявление целей и процессов развития требует не только строгости логического мышления, но и умения найти контакт с работниками управления. IV. Формировать общие цели организации и особенно конструировать критерий эффективности системы на основе лишь опроса общественного мнения нельзя. Это представляет собой сложную логическую процедуру в рамках понятий теории систем и требующую тонкого знания специфики экономики и технологии исследуемого объекта.
84
V. В больших и сложных системах (а именно с такими имеет дело системный анализ) цель системы настолько отдалена от конкретных средств их достижения, что выбор решения требует большой трудоемкости по увязке цели со средствами ее реализации путем декомпозиции целей. Эта важная и трудоемкая работа, как правило, является центральной в системном анализе. Она породила метод дерева целей, который является главным инструментальным достижением системного анализа. VI. В ряде случаев, особенно когда мы имеем дело с непроизводственными, а тем более неэкономическими системами (здравоохранение, образование и т.д.), выразить явным образом цель и критерий эффективности развития логическим путем не удается. Здесь неприемлем анализ «от естественных потребностей человека» в связи с их непрерывным развитием и изменением. Надо идти традиционным путем от анализа существующего положения, достигнутого уровня и последовательного прогноза. VII. Системный анализ, как правило, имеет дело с перспективой развития. Поэтому максимальный интерес представляет любая информация о будущем – ситуациях, ресурсах, открытиях и изобретениях. В результате этого прогнозирование является важнейшей и сложнейшей частью системного анализа. VIII. Ряд социальных, политических, моральных, эстетических и других факторов, которые нельзя не принимать во внимание в системном анализе (они иногда решающие), не исчисляются количественно. Единственный способ их учета – это получение субъективных оценок экспертов. Поскольку системный анализ, как правило, имеет дело с неструктуризованными или слабо структуризованными, то есть лишенными количественных оценок, проблемами, то получение оценок специалистов и их обработка представляется необходимым этапом системного анализа большинства проблем. IX. Несоответствие потребностей и средств удовлетворения составляют закон и важнейший стимул социально-экономического развития. Поскольку понятия цели и средств ее достижения неотделимы, то центральным моментом принятия решений в системном анализе является усечение целей: отсечение тех целей, которые признаны малозначащими или не имеющими средств для достижения, и отбор конкретных вариантов достижения взаимосвязанного комплекса важнейших целей. В системных исследованиях «инженерного» типа отбор альтернатив считается самой важной, если не единственной задачей системного анализа. X. Проблемы управления, решаемые методами системного анализа, возникают в реально существующих системах. Задачей системного анализа большей частью является не создание нового органа управления, а усовершенствование существующих. Поэтому возникает необходимость в 85
диагностическом анализе органов управления, направленном на выявление их возможностей, недостатков и т.п. Новая система будет эффективно внедряться в том случае, если она облегчает работу органа управления. XI. Результаты системного анализа получаются в рамках системных понятий. Для практического планирования они должны быть переведены на язык социально-экономических категорий. В результате решения задач системного анализа крупных народнохозяйственных проблем создаются комплексные программы развития. XII. Системный анализ имеет ряд специфических методов и приемов проектирования эффективных органов управления, ориентированных на цель, то есть создание и использование определенной социальноэкономической системы.
86
Глава 6. Методы принятия решений Необходимость принимать решения, для которых не удается полностью учесть предопределяющие их условия, а также последующее их влияние, встречается во всех областях техники, экономики и социальных наук. Если принятия решений в условиях неопределенности ранее нередко удавалось избежать, требуя от заказчика более полную информацию, то, имея дело со сложными системами и процессами, проектант должен сам оценивать и устранять многие неопределенности, уточнение которых он более не может перекладывать на заказчика.
6.1. Основные понятия исследования операций Операцией называется всякое мероприятие, объединенное единым замыслом и направленное на достижение какой-то цели. Цель исследования операций предварительное количественное обоснование оптимальных решений. Всякий определенный выбор зависящих от нас параметров называется решением. Оптимальными называются решения, по тем или другим признакам предпочтительные перед другими. Параметры, совокупность которых образует решение, называются элементами решения. Множеством допустимых решений называются все решения, удовлетворяющие заданным условиям. Показатель эффективности – количественная мера, позволяющая сравнивать разные решения по эффективности. Все решения принимаются всегда на основе информации, которой располагает лицо, принимающее решение (ЛПР). Каждая задача в своей постановке должна отражать структуру и динамику знаний ЛПР о множестве допустимых решений и о показателе эффективности. Задача называется статической, если принятие решения происходит в заранее известном и не изменяющемся информационном состоянии. Если информационные состояния в ходе принятия решения сменяют друг друга, то задача называется динамической. Следует рассмотреть процесс принятия решений с самых общих позиций. Психологами установлено, что решение не является начальным процессом творческой деятельности. Оказывается, непосредственно акту решения предшествует тонкий и обширный процесс работы мозга, который формирует и предопределяет направленность решения. В этот этап, который можно назвать «предрешением» входят следующие элементы:
87
- мотивация, то есть желание или необходимость что-то сделать. Мотивация определяет цель какого-либо действия, используя весь прошлый опыт, включая результаты; - возможность неоднозначности результатов; - возможность неоднозначности способов достижения результатов, то есть свобода выбора. После этого предварительного этапа следует, собственно, этап принятия решения. Но на данном этапе процесс не заканчивается, так как обычно после принятия решения следует оценка результатов и корректировка действий. Таким образом, принятие решений следует воспринимать не как единовременный акт, а как последовательный процесс. Выдвинутые выше положения носят общий характер, обычно подробно исследуемый психологами. Более близкой с точки зрения инженера будет схема процесса принятия решения, включающая в себя следующие компоненты: - анализ исходной ситуации; - анализ возможностей выбора; - выбор решения; - оценка последствий решения и его корректировка. В зависимости от степени определенности возможных исходов или последствий различных действий, с которыми сталкивается ЛПР, в теории принятия решений рассматриваются четыре типа моделей: - выбор решения в условиях определенности, если относительно каждого действия известно, что оно неизменно приводит к некоторому конкретному исходу; - выбор решения в условиях конфликта или противодействия (активного противника); - выбор решения в условиях риска (частичной неопределенности), если каждое действие приводит к одному из множества возможных частных исходов, причем каждый исход имеет вычисляемую или экспертно оцениваемую вероятность появления. Предполагается, что ЛПР эти вероятности известны или их можно определить путем экспертных оценок; - выбор решения в условиях полной неопределённости, когда то или иное действие или несколько действий имеют своим следствием множество частных исходов, но их вероятности не известны или не имеют смысла.
6.2. Постановка задач принятия оптимальных решений Этому классу задач соответствует условие полной определенности ЛПР. Несмотря на то, что методы принятия решений отличаются универсальностью, их успешное применение в значительной мере зависит 88
от профессиональной подготовки специалиста, который должен иметь четкое представление о специфических особенностях изучаемой системы и уметь корректно поставить задачу. Искусство постановки задач постигается на примерах успешно реализованных разработок и основывается на четком представлении преимуществ, недостатков и специфики различных методов оптимизации. В первом приближении можно сформулировать следующую последовательность действий, которые составляют содержание процесса постановки задачи: - установление границы подлежащей оптимизации системы, то есть представление системы в виде некоторой изолированной части реального мира. Расширение границ системы повышает размерность и сложность многокомпонентной системы и тем самым затрудняет ее анализ. Следовательно, в инженерной практике следует осуществлять декомпозицию сложных систем на подсистемы, которые можно изучать по отдельности без излишнего упрощения реальной ситуации; - определение показателя эффективности, на основе которого можно оценить характеристики системы или ее проекта с тем, чтобы выявить «наилучший» проект или множество «наилучших» условий функционирования системы. В приложениях обычно выбираются показатели экономического (издержки, прибыль) или технологического (производительность, энергоемкость, материалоемкость) характера. «Наилучшему» варианту всегда соответствует экстремальное значение показателя эффективности функционирования системы; - выбор внутрисистемных независимых переменных, которые должны адекватно описывать допустимые проекты или условия функционирования системы и способствовать тому, чтобы все важнейшие технико-экономические решения нашли отражение в формулировке задачи; - построение модели, которая описывает взаимосвязи между переменными задачи и отражает влияние независимых переменных на значение показателя эффективности. Несмотря на то, что модели принятия оптимальных решений отличаются универсальностью, их успешное применение зависит от профессиональной подготовки специалиста, который должен иметь полное представление о специфике изучаемой системы. Все оптимизационные задачи имеют общую структуру. Их можно классифицировать как задачи минимизации (максимизации) M-векторного векторного показателя эффективности Wm(x), m = 1, 2, , M, N-мерного векторного аргумента x = (x1, x2, ..., xN), компоненты которого удовлетворяют системе ограничений-равенств hk(x) = 0, k = 1, 2, , K, ограничений-неравенств gj(x) > 0, j = 1, 2, , J, областным ограничениям xli xi xui , i = 1, 2, , N.
89
Для принятия решений в условиях определенности разработан и широко используется на практике аппарат, который получил название математического программирования. Задачи математического программирования делятся на: - задачи линейного программирования (W(x), hk(x), gj(x) линейны); - задачи нелинейного программирования (W(x), hk(x), gj(x) нелинейны); - задачи целочисленного программирования (x целочисленны); - задачи динамического программирования (x зависят от временного фактора). Вопросы математического программирования рассматриваются в курсе «Методы оптимизации».
6.3. Принятие решений в условиях конфликта. Матричные игры Существует достаточно широкий класс задач, в которых элементы системы имеют цели, не согласованные с целью всей системы. Более того, такие системы могут иметь цели, несовпадающие и даже противоположные цели системы в целом. В таких случаях говорят, что возникает конфликтная ситуация, т.е. столкновение сторон, каждая из которых стремиться воздействовать на развитие конфликта в своих собственных интересах. Примером конфликтной ситуации является взаимодействие покупателя и продавца на рынке. Продавец стремится продать товар по возможно более дорогой цене, его целью является максимизация дохода. Покупатель хочет приобрести этот же товар по наиболее дешевой цене, его цель – минимизация затрат. Целя покупателя и продавца прямо противоположны. Вопросы принятия решений в условиях конфликта рассматриваются в теории игр. Теория игр берет начало от работы Э. Бореля (Felix Edouard Justin Emile Borel) 1921 года [12], но широкое распространение получила в 1944 году после ее применения к теоретическому исследованию экономики Дж. Фон Нейманом (John von Neumann) и О. Моргенштерном (Oskar Morgenstern) [49, 98]. Идея теории игр возникла из анализа спортивных, карточных и других игр. Следствием этого является ее специфическая терминология, в частности, «ход», «игра», «стратегия», «результат», «выигрыш», «степень информированности» и др. В настоящее время теория игр развилась в самостоятельную область математики и может рассматриваться независимо от ее приложений к реальным игровым ситуациям. Она используется в различных областях экономики, производстве, бизнесе, менеджменте, финансах, военном деле, сельском хозяйстве, социологии, политологии и психологии.
90
Рассмотрим вопросы принятия решений в условиях конфликта на примере матричных игр. 6.3.1. Основные понятия матричных игр Введем основные понятия матричных игр. Игра – упрощенная формализованная модель реальной конфликтной ситуации. Математически формализация означает, что выработаны определенные правила действия сторон: - возможные действия каждого из игроков; - объем информации (степень информированности) каждой стороны о поведении всех других сторон; - исход игры при данном варианте действия. Игрок – одна из заинтересованных сторон в игровой ситуации. Ход – это момент игры, когда игроки должны выбрать один из возможных вариантов действий, т.е. принять одно из допустимых решений. Партия игры – это определенная совокупность ходов и выборов возможных вариантов действий. Стратегия игрока – любое возможное действие игрока в каждой из возможных ситуаций игры. Стратегия может быть чистой или смешанной. Сравнение степени удовлетворенности игрока в различных ситуациях осуществляется с помощью отношения предпочтения данного игрока, и, как правило, характеризуется его функцией выигрыша или проигрыша. Выигрыш или проигрыш сторон оценивается численно, другие случаи в теории игр не рассматриваются. Основная цель теории игр – выработка рекомендаций для наилучшего поведения игроков в конфликте, т.е. выявлении для каждого из них оптимальной стратегии. Оптимальной называется стратегия, которая при многократно повторяющейся игре гарантирует игроку максимально возможный средний выигрыш (или, соответственно, минимально возможный средний проигрыш). Следует отметить, что оптимальность может пониматься поразному, в зависимости от используемого показателя эффективности. Так, стратегия, оптимальная по одному показателю эффективности, может не быть оптимальной для другого показателя. Выбор оптимальной стратегии основан на следующих допущениях: - все игроки разумны в равной степени; - поведение игроков направлено на достижение своих целей и противодействие другим игрокам в достижении их целей. Эти допущения позволяют абстрагироваться от ошибок, просчетов, азарта, присущих реальным ситуациям.
91
В теории игр нет установившейся классификации видов игр. Однако по определенным критериям некоторые виды можно выделить. Количество игроков. Если в игре участвуют две стороны, то ее называют игрой двух лиц. Если число сторон больше двух, ее относят к игре n игроков. Наибольший интерес вызывают игры двух лиц. Они и теоретически, и практически более глубоко проработаны. Количество стратегий игры. По этому критерию игры делятся на конечные и бесконечные. В конечной игре каждый из игроков имеет конечное число возможных стратегий. Если хотя бы один игрок имеет бесконечное число возможных стратегий, то игра является бесконечной. Взаимоотношения сторон. Согласно данному критерию игры делятся на кооперативные, коалиционные и бескоалиционные. Если игроки не имеют право вступать в соглашения, образовывать коалиции, то такая игра относится к бескоалиционным; если игроки могут вступать в соглашения, создавать коалиции – коалиционной. Кооперативная игра – это игра, в которой заранее определены коалиции. Характер выигрышей. Этот критерий позволяет классифицировать игры с нулевой и с ненулевой суммой. Игра с нулевой суммой предусматривает условие: «сумма выигрышей всех игроков в каждой партии равна нулю». Игры двух игроков с нулевой суммой относят к классу антагонистических. В противном случае имеем игру с ненулевой суммой. Вид функции выигрышей. По этому критерию игры подразделяются на матричные, биматричные, непрерывные, выпуклые, сепарабельные и т.д. Матричная игра – конечная игра двух игроков с нулевой суммой. Матричные игры всегда имеют решения в смешанных стратегиях. Они могут быть решены методами линейного программирования. Биматричная игра – конечная игра двух игроков с ненулевой суммой. Для биматричных игр также, как и для матричных, разработана теория оптимального поведения игроков. Если функция выигрышей каждого игрока является непрерывной, игра считается непрерывной. Если функция выигрышей выпуклая, то и игра – выпуклая. Количество ходов. По этому критерию игры делятся на одношаговые и многошаговые. Одношаговые игры заканчиваются после одного хода каждого игрока. Многошаговые игры бывают позиционными, стохастическими, дифференциальными и др. Информированность сторон. По данному критерию различают игры с полной и неполной информацией. Для матричных игр функция выигрыша задается в виде платежной матрицы, (матрица эффективности, матрица игры), которая включает все значения выигрышей (в конечной игре). Она показана в табл. 6.1.
92
Пусть игрок 1 имеет m стратегий Ai (i =1, , m), а игрок 2 – n стратегий Bj (j = 1, , n). Игра может быть названа игрой m n. Тогда имеем платежную матрицу игры двух лиц с нулевой суммой (табл. 6.1). Таблица 6.1. Платежная матрица матричной игры m n Игрок 2 Игрок 1 A1 A2
B1
B2
Bn
i
a11 a21
a12 a22
a1n a2n
1 2
Am j
am1 1
am2 2
amn n
m
Игра G, описываемая платежной матрицей a11 a12 ... a1n a a ... a 22 2n , (6.1) G 21 ... ... ... ... am1 am 2 ... amn заключается в следующем. Игрок 1 выбирает стратегию Ai (i-я строка матрицы G), а игрок 2 выбирает стратегию Bj (j-й столбец матрицы G). После этого игрок 1 получает выигрыш aij. Игрок 2 получает выигрыш aij. Если выигрыш отрицателен, то это говорит о проигрыше этого игрока. Величины i, (i =1, , m) и j, (j = 1, , n) – соответственно минимальные значения элементов aij по строкам и максимальные – по столбцам. Оценки игры. Рассмотрим матричную игру, представленную матрицей выигрышей (6.1) [28]. Применяется принцип получения максимального гарантированного результата при наихудших условиях. Игрок 1 стремится принять такую стратегию, которая должна обеспечить максимальный проигрыш игрока 2. Соответственно игрок 2 стремится принять стратегию, обеспечивающую минимальный выигрыш игрока 1. Требуется рассмотреть оба этих подхода. Подход игрока 1. Он должен получить максимальный гарантированный результат при наихудших условиях: i min aij . j
Чтобы этот гарантированный эффект в наихудших условиях был максимальным, нужно из всех i выбрать наибольшее значение. Обозначим его и назовем чистой нижней ценой игры («максимин»):
max i max min aij . i
i
j
93
Таким образом, максиминной стратегии отвечает строка платежной матрицы G, которой соответствует элемент . Какие бы стратегии ни применял игрок 2, игрок 1 максиминной чистой стратегией гарантирует себе выигрыш не меньше чем . Таково оптимальное поведение игрока 1. Подход игрока 2. Своими оптимальными стратегиями он стремится уменьшить выигрыш игрока 1, поэтому при каждой j-й чистой стратегии он отыскивает величину своего максимального проигрыша j max aij в i
каждом j-м столбце, то есть определяет максимальный выигрыш игрока 1, если игрок 2 применит j-ю чистую стратегию. Из всех своих n j-х чистых стратегий он отыскивает такую, при которой игрок 1 получит минимальный выигрыш, то есть определяет чистую верхнюю цену игры («минимакс»): min j min max aij . j
j
i
Чистая верхняя цена игры показывает, какой максимальный выигрыш может гарантировать игрок 1, применяя свои чистые стратегии, выигрыш, не меньший, чем . Игрок 2 за счет выбора своих чистых стратегий не допустит, чтобы игрок 1 мог получить выигрыш, больший, чем . Таким образом, минимаксная стратегия отображается столбцом платежной матрицы G, в котором находится элемент . Она является оптимальной чистой, гарантирующей стратегией игрока 2, если он ничего не знает о действиях игрока 1. Нетрудно показать, что . Чистая цена игры – цена данной игры, если нижняя и верхняя ее цены совпадают: max min aij min max aij . i
j
j
i
В этом случае игра называется игрой с седловой точкой. В противном случае . Пример 6.1. Определить верхнюю и нижнюю цены при заданной платежной матрице игры 1 0 4 G 5 3 8 7 2 1 и указать максиминную и минимаксную стратегии. Решение. Определим нижнюю и верхнюю цены игры: 1 = 1, 2 = 3, 3 = 1, = 3; 1 = 7, 2 = 3, 3 = 8, = 3. Таким образом, = = = 3 – чистая цена игры при стратегиях A2 и B2. Игра имеет седловую точку. Пример 6.2. Дана матрица игры 3 5 8 6 11 . G 8 4 12 7 9 94
Определить верхнюю и нижнюю цены и указать максиминную и минимаксную стратегии. Решение. Определим нижнюю и верхнюю цены игры: 1 = 3, 2 = 4, = 4; 1 = 8, 2 = 5, 3 = 12, 4 = 7, 5 = 11, = 5. Таким образом, = 4 < = 5. Седловой точки не существует. Поэтому ситуации равновесия в чистых стратегиях нет. Если матричная игра не имеет ситуации равновесия, то обычно игроки стремятся отгадать стратегии остальных игроков, сохраняя собственные стратегии в тайне. Покажем это на примере. Пример 6.3. Пусть в примере 6.2 игроку 1 стало известно, что игрок 2 принял минимаксную стратегию. Игрок 1 должен выбрать оптимальную стратегию при условии, что В2 – стратегия игрока 2. Решение. Оптимальной стратегией для игрока 1 в этом случае будет не максиминная А2, дающая игроку 1 выигрыш α = 4, а та стратегия, которая соответствует max ai 2 5 . Поэтому максимальный выигрыш i
игрока 1 будет равен верхней цене игры β = 5 , поэтому он выберет свою оптимальную стратегию А1, зная, что игрок 2 выбрал свою стратегию В2. Таким образом, рассмотренный пример дает результат, отличный от результата при игре с седловой точкой. Стратегия матричной игры является оптимальной, если ее применение обеспечит игроку наибольший гарантированный выигрыш при любых возможных стратегиях другого игрока. На примере 6.3 показано, что бывают ситуации, когда игрок 1 может получить выигрыш, превосходящий максиминный, если ему известны намерения игрока 2. При многократном повторении игры в сходных условиях можно добиться гарантированного среднего выигрыша, превосходящего для игрока 1 максиминный. 6.3.2. Смешанные стратегии Если в матричной игре отсутствует седловая точка в чистых стратегиях, то находят верхнюю и нижнюю цены игры. Они показывают, что игрок 1 не получит выигрыша, превосходящего верхнюю цену игры и что игроку 1 гарантирован выигрыш, не меньший нижней цены игры. В примере 6.3 игрок 1 получил по своей оптимальной стратегии A1, отличной от максиминной, выигрыш, равный верхней цене игры. Такова плата за информированность о стратегии игрока 2. Это крайний случай. Не улучшится ли результат игрока 1, если информация о действиях противной
95
стороны будет отсутствовать, но игрок будет многократно применять чистые стратегии случайным образом с определенной вероятностью? В такой ситуации, оказывается, можно получать выигрыши, в среднем большие нижней цены игры, но меньшие верхней. Смешанная стратегия игрока – это полный набор применения его чистых стратегий при многократном повторении игры в одних и тех же условиях с заданными вероятностями. Перечислим условия применения смешанных стратегий: - игра без седловой точки; - игроки используют случайную смесь чистых стратегий с заданными вероятностями; - игра многократно повторяется в сходных условиях; - при каждом из ходов ни один игрок не информирован о выборе стратегии другим игроком; - допускается осреднение результатов игр. Применяются следующие обозначения смешанных стратегий. Для игрока 1 смешанная стратегия, заключающаяся в применении чистых стратегий A1, A2, … , Am с соответствующими вероятностями p1, p2, , pm: A A2 Am m , pi 1, 0 pi 1. S1 1 p p p 2 m i 1 1 Для игрока 2: B B2 Bn n , q j 1 , 0 q j 1, S 2 1 q1 q2 qn j 1 где qj – вероятность применения чистой стратегии Bj. Чистые стратегии игрока являются единственно возможными несовместными событиями. Например, в случае, когда pi = 1, для игрока 1 имеем чистую стратегию A A2 Ai Am . S1 1 0 0 1 0 В матричной игре, зная матрицу G (она относится и к игроку 1, и к игроку 2), при заданных векторах p и q можно определить средний математическое ожидание выигрыша игрока 1: m n
M(G , p, q) aij pi q j , i 1 j 1
где pi и qj – компоненты векторов p и q. Путем применения своих смешанных стратегий игрок 1 стремится максимально увеличить свой средний выигрыш, а игрок 2 – довести этот эффект до минимально возможного значения.
96
Игрок 1 стремится достигнуть min max M(G, p, q) . q
p
Игрок 2 добивается того, чтобы max minM(G, p, q) . p
q
Обозначим p0 и q0 – векторы, соответствующие оптимальным смешанным стратегиям игроков 1 и 2, то есть, при которых будет выполнено равенство min max M(G, p, q) max min M(G, p, q) M(G, p 0 , q 0 ) . q
p
p
q
Цена игры -средний выигрыш игрока 1 при использовании обоими игроками смешанных стратегий. Следовательно, решением матричной игры являются: 1) p0 – оптимальная смешанная стратегия игрока 1; 2) q0 – оптимальная смешанная стратегия игрока 2; 3) цена игры. Смешанные стратегии будут оптимальными (p0 и q0), если они образуют седловую точку для функции M( G, p, q) , то есть M(G, p, q 0 ) M(G, p 0 , q 0 ) M(G, p 0 , q) . Существует основная теорема матричных игр (без доказательства).
Теорема 6.1. Для матричной игры с любой матрицей G величины max minM(G, p, q) и min max M(G, p, q) p
q
q
p
существуют и равны между собой: = = . Отметим, что при выборе оптимальных стратегий игроку 1 всегда будет гарантирован средний выигрыш, не меньший, чем цена игры, при любой фиксированной стратегии игрока 2 (и наоборот, для игрока 2). Активными стратегиями игроков 1 и 2 называют стратегии, входящие в состав оптимальных смешанных стратегий соответствующих игроков с вероятностями, отличными от нуля. Значит, в состав оптимальных смешанных стратегий игроков могут входить не все априори заданные их стратегии. 6.3.3. Частные случаи решения задач в смешанных стратегиях Решить игру – означает найти цену игры и оптимальные стратегии. Рассмотрение методов нахождения оптимальных смешанных стратегий для матричных игр начинается с простейшей игры, описываемой матрицей 2 2. Игры с седловой точкой специально рассматриваться не будут. Если получена седловая точка, то это означает, что имеются невыгодные стратегии, от которых следует отказываться. При отсутствии седловой
97
точки можно получить две оптимальные смешанные стратегии. Как уже отмечалось, эти смешанные стратегии записываются так: B1 B2 A A2 . , S 2 S1 1 q1 q2 p1 p2 a12 a Значит, имеется платежная матрица G 11 . При этом a a 21 22 a11 p1 a21 p2 ; a12 p1 a22 p2 ; p1 p2 1. Решив систему из трех последних уравнений, получаем оптимальные значения p10 , p20 и : a22 a21 ; p10 a11 a22 (a12 a21 ) a11 a12 ; p 20 1 p10 a11 a 22 (a12 a 21 ) a11a22 a12 a21 . a11 p10 a21 p20 a11 a22 (a12 a21 )
Вычислив , находим q10 и q 20 из решения системы двух уравнений: a11q1 a12 q2 ; q1 q2 1 . a a12 Имеем: q10 ; q20 1 q10 11 , при a11 a12 . a11 a12 a11 a12 p10 0 q10 Задача решена, т.к. найдены векторы p 0 , q 0 и цена игры . q2 p2 Решим задачу графически. Алгоритм решения весьма прост (рис. 6.1): 1. По оси абсцисс откладывается отрезок единичной длины. 2. По оси ординат откладываются выигрыши при стратегии A1. 3. На линии, параллельной оси ординат, в точке 1 откладываются выигрыши при стратегии A2. 4. Концы отрезков обозначаются для a11 – b11, a12 – b21, a22 – b22, a21 – b12 и проводятся две прямые (b11 b12) и (b21 b22). 5. Определяется ордината точки пересечения с. Она равна . Абсцисса точки с равна p2 (p1 = 1 – p2). Данный метод имеет достаточно широкую область приложения. Это основано на общем свойстве игр m n, состоящем в том, что в любой игре m n каждый игрок имеет оптимальную смешанную стратегию, в которой число чистых стратегий не больше, чем min(m, n). Из этого свойства 0
98
можно получить известное следствие: в любой игре 2 n и m 2 каждая оптимальная стратегия S10 и S 02 содержит не более двух активных стратегий. Значит, любая игра 2 n и m 2 может быть сведена к игре 2 2. Следовательно, игры 2 n и m 2 можно решить графическим методом.
Рис. 6.1. Оптимальная смешанная стратегия Если матрица G игры имеет размерность m n, где m > 2 и n > 2, то для определения оптимальных смешанных стратегий используют линейное программирование или итеративные алгоритмы [20]. Пример 6.4. Выбрать оптимальный режим работы новой системы ЭВМ, состоящей из двух ЭВМ типов A1 и A2. Известны выигрыши от внедрения каждого типа ЭВМ в зависимости от внешних условий, если сравнить со старой системой. При использовании ЭВМ типов A1 и A2 в зависимости от характера решаемых задач B1 и B2 (долговременные и краткосрочные) будет разный эффект. Предполагается, что максимальный выигрыш соответствует наибольшему значению критерия эффекта от замены вычислительной техники старого поколения на ЭВМ A1 и A2. Дана матрица игры (табл. 6.2), где A1 и A2 стратегии руководителя; B1 и B2 стратегии, отражающие характер решаемых на ЭВМ задач. Требуется найти оптимальную смешанную стратегию руководителя и гарантированный средний результат у, то есть определить, какую долю времени должны использоваться ЭВМ типов A1 и A2.
99
Таблица 6.2. Платежная матрица матричной игры 2 2 Игрок 2 Игрок 1 A1 A2 j
B1
B2
i
0,3 0,7 0,7
0,8 0,4 0,8
0,3 0,4
Решение. Запишем условия в принятых индексах: a11 = 0,3; a12 = 0,8; a21 = 0,7; a22 = 0,4. Определим нижнюю и верхнюю цены игры: 1 = 0,3, 2 = 0,4, = 0,4; 1 = 0,7, 2 = 0,8, = 0,7. Получаем игру без седловой точки, так как max min aij a22 0,4 < min max aij a21 0,7 . i
j
j
i
Максиминная стратегия руководителя вычислительного центра – A2. Для этой стратегии гарантированный выигрыш равен = 0,4 (40%) по сравнению со старой системой. Решение для определения , p1 и p2 проведем графически (рис. 6.2).
Рис. 6.2. Графическая интерпретация алгоритма решения Алгоритм решения: 1. По оси абсцисс отложим отрезок единичной длины. 2. По оси ординат отложим выигрыши при стратегии A1. 3. По вертикали в точке 1 отложим выигрыши при стратегии A2. 4. Проводим прямую (b11 b12), соединяющую точки a11, a21. 5. Проводим прямую (b21 b22), соединяющую точки a12, a22. 100
6. Определяем ординату точки c пересечения линий (b11 b12) и (b21 b22). Она равна . 7. Определим абсциссу точки пересечения c. Она равна p2, а p1 = 1 – p2. Выпишем решение и представим оптимальную стратегию игры: p1 = 0,375, p2 = 0,625, = 0,55, A2 A . S 0 1 0,375 0,625 Вывод. При установке новой системы ЭВМ, если неизвестны условия решения задач заказчика, на работу ЭВМ A1 должно приходиться 37,5% времени, а на работу ЭВМ A2 62,5%. При этом выигрыш составит 55% по сравнению с предыдущей системой ЭВМ. 6.3.4. Свойства решений матричных игр Определение 6.1. Систему W ( A , B, G ) , (6.2) где A = {A1, A2, ... , Am} – множество стратегий игрока 1; B = {B1, B2, ... , Bn} – множество стратегий игрока 2; G – платежная матрица вида (6.1), назовем конечной матричной игрой m n. Определение 6.2. Пусть задана матричная игра (6.2). Назовем функцию K ( Ai , B j ) aij функцией выигрыша игрока 1, ( Ai , B j ) A B . Определение 6.3. Стратегия A1 игрока 1 доминирует (строго доминирует) над стратегией A2, если K(A1, B) K(A2, B) (K(A1, B) > K(A2, B)), B B. Стратегия B1 игрока 2 доминирует (строго доминирует) над стратегией B2, если K(A, B1) K(A, B2) (K(A, B1) < K(A, B2)), A A. При этом стратегии A2 и B2 называются доминируемыми (строго доминируемыми). Определение 6.4. Спектром смешанной стратегии игрока в конечной матричной игре называется множество всех его чистых стратегий, вероятность которых согласно этой стратегии положительна. Свойства решений конечных матричных игр. Приведем свойства матричных игр. Более подробно данный вопрос изложен в учебниках по матричным играм, например в [20]. 1. Если чистая стратегия одного из игроков содержится в спектре некоторой его оптимальной стратегии, то его выигрыш в ситуации,
101
образованной данной чистой стратегией и любой оптимальной стратегией другого игрока, равен значению конечной антагонистической игры. 2. Ни одна строго доминируемая чистая стратегия игрока не содержится в спектре его оптимальной стратегии. 3. Пусть W ( A, B, G ) – конечная матричная игра, W (A \ A, B, G) – подыгра игры W, а A – чистая стратегия игрока 1 в игре W, доминируемая некоторой стратегией A , спектр которой не содержит A. Тогда всякое решение (p0, q0, ) игры W является решением игры W. 4. Пусть W ( A, B, G ) – конечная матричная игра, W (A, B \ B, G) – подыгра игры W, а B – чистая стратегия игрока 2 в игре W, доминируемая некоторой стратегией B , спектр которой не содержит B. Тогда всякое решение (p0, q0, ) игры W является решением W. 5. Если для чистой стратегии A игрока 1 выполнены условия свойства 3, а для чистой стратегии B игрока 2 выполнены условия свойства 4, то всякое решение игры W (A \ A, B \ B, G) является решением игры W ( A, B, G ) . 6. Тройка (p0, q0, ) является решением игры W ( A, B, G ) тогда и только тогда, когда (p0, q0, c + d) является решением игры W (A, B, cG dE) , где E – единичная матрица, c > 0, d – любое вещественное число. 7. Для того, чтобы p 0 ( p10 , p20 , ... , pm0 ) была оптимальной смешанной стратегией матричной игры с матрицей G и ценой игры , необходимо и достаточно выполнение неравенств m
aij pi0 ,
(j = 1, , n).
(6.3)
i 1
Аналогично для игрока 2: для того, чтобы q 0 (q10 , q20 , ... , qn0 ) была оптимальной смешанной стратегией игрока 2 необходимо и достаточно выполнение неравенств n
aij q 0j ,
(i = 1, , m).
(6.4)
j 1
Из свойства 7 вытекает: чтобы установить, является ли предполагаемые (p0, q0) и решением матричной игры, достаточно проверить, удовлетворяют ли они неравенствам (6.3) и (6.4). С другой стороны, найдя неотрицательные решения неравенств (6.3) и (6.4) совместно со следующими уравнениями m
pi0 1 , i 1
n
q 0j 1, j 1
получим решение матричной игры.
102
(6.5)
Таким образом, решение матричной игры сводится к нахождению неотрицательных параметров решений линейных неравенств (6.3), (6.4) и линейных уравнений (6.5). Однако это требует большого объема вычислений, которое растет с увеличением числа чистых стратегий игроков. Например для платежной матрицы 3 3 имеем систему из 6 неравенств и 2 уравнений. Поэтому в первую очередь следует, по возможности используя свойства 2 и 3, уменьшить число чистых стратегий игроков. Затем следует во всех случаях проверить выполнение неравенства max min a ij = min max aij . i
j
j
i
Если оно выполняется, то игроки имеют чистые оптимальные стратегии (игрок 1 – чистую максиминную, а игрок 2 – чистую минимаксную). В противном случае хотя бы у одного игрока оптимальные стратегии будут смешанные. Для матричных игр небольшого размера эти решения можно найти, применяя свойства 1–5. Замечание 6.1. Отметим, что исключение доминируемых (не строго) стратегий может привести к потере некоторых решений. Если же исключаются только строго доминируемые стратегии, то множество решений игры не изменится. Пример 6.5. Пусть W ( A, B, G ) , где A = {1, 2, 3, 4}; B = {1, 2, 3, 4}, а платежная матрица G задана следующим образом: 1 2 3 4 1 2C C 2C 3C 2 3C 3C 2 C 2C , С > 0. G 3 2C 2C C C 4 C C C C 2 Решение. Прежде всего заметим, что по свойству 6 достаточно решить игру W 1 ( A, B, G1 ) , 1 2 3 4 1 2 1 2 3 2 3 3 2 1 2 1 где G1 G . 3 2 2 1 1 C 4 1 1 1 1 2 Элементы 4-й строки матрицы G1 меньше или равны соответствующих элементов 3-й строки и поэтому 3-я стратегия игрока 1 доминирует над 4-й. Кроме того, элементы 1-го столбца матрицы G1 больше или равны соответствующих элементов 2-го столбца, Следовательно, 2-я стратегия игрока 2 доминирует над его 1-й стратегией.
103
Далее, из свойства 5 следует, что всякое решение игры W ( A \ {4}, B \ {1}, G1 ) является решением игры W1. В матричной форме игру W2 можно представить матрицей 2 3 4 1 1 2 3 G 2 23 2 1 2 . 3 2 1 1 Очевидно, что элементы второй строки матрицы G2 меньше или равны полусумме соответствующих элементов первой и третьей строк. Кроме того, элементы третьего столбца матрицы G2 больше или равны соответствующих элементов второго столбца. Применяя свойство 5 получим, что всякое решение игры W 3 ( A \ {4,2}, B \ {1,4}, G 2 ) является решением игры W2, а значит и игры W1. Игра W3 определяется матрицей 2 3 1 1 2 . G 3 3 2 1 Матрица G3 не имеет седловой точки, а игра W3 не имеет решения в чистых стратегиях, т.е. оптимальные стратегии игроков являются смешанными. Эти стратегии (в данном случае) легко найти из анализа структуры матрицы G3. Поскольку матрица G3 симметрична, можно предположить, что игроки в оптимальной стратегии используют свои чистые стратегии с равными вероятностями. Действительно, если игрок 1 выбирает с равными вероятностями стратегии 1 и 3, то при применении любой из двух чистых стратегий игроком 2 математическое ожидание выигрыша игрока 1 будет равным 1 1 3 1 1 3 либо 1 2 , либо 2 1 . 2 2 2 2 2 2 Аналогично, если игрок 2 использует свои чистые стратегии 2 и 3 с равными вероятностями, то математическое ожидание его проигрыша будет равно 3/2. Следовательно, указанные стратегии являются оптимальными в игре W3, а величины 3/2 – значением игры W3. Из предыдущего следует, что эти стратегии оптимальны и в W1. 1 1 Таким образом, стратегия p 0 ; 0; ; 0 является оптимальной 2 2 1 1 стратегией игрока 1, стратегия q 0 0; ; ; 0 – оптимальной стратегией 2 2 игрока 2 в игре W1, а значение игры W1 равно 3/2. В силу свойства 4 3C решением игры W будет тройка p 0 ; q 0 ; . 2 2
104
6.3.5. Сведение матричной игры к задаче линейного программирования Предположим, что цена игры положительна ( > 0). Если это не так, то согласно свойству 6 всегда можно подобрать такое число d, прибавление которого ко всем элементам матрицы выигрышей дает матрицу с положительными элементами, и следовательно, с положительным значением цены игры. При этом оптимальные смешанные стратегии обоих игроков не изменяются. Итак, пусть дана матричная игра с матрицей G {aij } порядка m n. Согласно свойству 7 оптимальные смешанные стратегии p ( p1 , p2 , ... , pm ) , q (q1 , q2 , ... , qn ) игроков 1 и 2 и цена игры должны удовлетворять соотношениям m aij pi , ( j 1, n), im1 (6.6) pi 1, i 1 pi 0, (i 1, m), n aij q j , (i 1, m), jn1 (6.7) q j 1, j 1 q j 0, ( j 1, n). Разделим все уравнения и неравенства в (6.6) и (6.7) на (это можно сделать, т.к. по предположению ( > 0) и введем обозначения: qj pi y j ( j 1, n) . xi (i 1, m) , Тогда (6.6) и (6.7) перепишется в виде: m m 1 aij xi 1 , xi , xi 0 , (i 1, m) , i 1 i 1 n n 1 a y 1 , ij j y j , y j 0 , ( j 1, n) . j 1 j 1 Игрок 1 стремится найти такие значения pi и, следовательно, xi, чтобы цена игры была наибольшей, поэтому решение первой задачи сводится к нахождению таких неотрицательных значений xi (i 1, m) , при которых
105
m
m
(6.8) xi min , aij xi 1 . i 1 i 1 Игрок 2 стремится найти такие значения qj и, следовательно, yj, чтобы цена игры была наименьшей, поэтому решение второй задачи сводится к нахождению таких неотрицательных значений yj, ( j 1, n) , при которых n
n
j 1
j 1
y j max , aij y j 1.
(6.9)
Формулы (6.8) и (6.9) выражают двойственные друг другу задачи линейного программирования. Решив их, получим значения xi (i 1, m) , yj ( j 1, n) и . Тогда смешанные стратегии, т.е. pi и qj найдем по формулам:
pi xi (i 1, m) , q j y j ( j 1, n) . Пример 6.6. Найти решение игры, определяемой матрицей 0 1 1 G 0 1 0 . 1 0 1 Решение. При решении этой игры к каждому элементу матрицы А прибавим 1 и получим следующую матрицу 1 2 0 G1 1 0 1 . 2 1 0 Составим две взаимно-двойственные задачи линейного программирования: p1 p2 p3 min, q1q2 q3 max, 1, p1 p2 2 p3 1, q1 2q2 2 p + q3 1, p3 1, q1 1 1, p3 1, 2q1 q2 q1 , q2 , q3 0. p1 , p2 , p3 0,
6.4. Принятие решений в условиях риска (Статистические игры) 6.4.1. Риск и его измерение Любая сфера человеческой деятельности в особенности экономика и бизнес, связана с принятием решений в условиях неполноты информации. Источники неопределенности могут быть самые разнообразные: нестабильность экономической и политической ситуации, неопределенность действий партнеров по бизнесу, неопределенность
106
спроса на товары, неабсолютная надежность процессов производства, неточность информации, погодные условия и др. [28]. Выбор решения в условиях частичной или полной неопределенности называют игрой с природой. Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников – ЛПР, называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнер по игре. Поэтому термин «природа» характеризует некую объективную действительность. Под риском принято понимать вероятность (угрозу) потери лицом или организацией части своих ресурсов, недополучения доходов или появления дополнительных расходов в результате осуществления определенной производственной и финансовой политики. Выделяют динамический и статический риск. Динамический риск связан с возникновением непредвиденных изменений стоимости основного капитала вследствие принятия управленческих решений, а также рыночных или политических обстоятельств. Статический риск обусловлен возможностью потерь реальных активов вследствие нанесения ущерба собственности и потерь дохода из-за недееспособности организации. Исследование риска целесообразно проводить в следующей последовательности: - выявление объективных и субъективных факторов, влияющих на конкретный вид риска; - анализ выявленных факторов; - оценка конкретного вида риска с финансовых позиций, определяющая либо финансовую состоятельность проекта, либо его экономическую целесообразность; - установка допустимого уровня риска; - анализ отдельных операций по выбранному уровню риска; - разработка мероприятий по снижению риска. Мерой риска некоторого решения часто считают среднее квадратическое отклонение значения показателя эффективности этого решения или операции. Например, в качестве показателя эффективности финансового решения обычно используют прибыль. Пример 6.7 [28]. Пусть имеются два инвестиционных проекта. Первый с вероятностью 0,6 обеспечивает прибыль 15 млн. руб., однако с вероятностью 0,4 можно потерять 5,5 млн. руб. Для второго проекта с вероятностью 0,8 можно получить прибыль 10 млн. руб. и с вероятностью 0,2 потерять 6 млн. руб. Какой проект выбрать?
107
Решение. Оба проекта имеют одинаковую среднюю прибыльность, равную (0,6 15 + 0,4 (–5,5) = 0,810 + 0,2 (–6) = 6,8 млн. руб. Однако среднее квадратическое отклонение прибыли равно: - для 1-го проекта (0,6 (15 – 6,8)2+0,4 (–5,5 – 6,8)2)1/2 = 10,04 млн. руб., - для 2-го проекта (0,8 (10 – 6,8)2+0,2 (–6 – 6,8)2)1/2 = 6,4 млн. руб., поэтому более предпочтителен второй проект. Методы принятия решений в условиях риска разрабатываются и обосновываются в рамках теории статистических решений. В этом случае имеем «доброкачественную», или стохастическую, неопределенность, когда состояниям природы поставлены в соответствие вероятности, заданные экспертно либо вычисленные. Критерии принятия решений в условиях риска могут использоваться те же, что и в условиях неопределенности, а также некоторые специальные критерии, например: - критерий ожидаемого значения; - критерий «ожидаемое значение – дисперсия»; - критерий предельного уровня; - критерий наиболее вероятного исхода. Критерий ожидаемого значения максимизирует ожидаемую прибыль (или минимизирует ожидаемые затраты). Использование ожидаемых величин предполагает возможность многократного решения одной и той же задачи, пока не будут получены достаточно точные расчётные формулы. Математически это выглядит так: пусть Х – случайная величина с математическим ожиданием MX и дисперсией DX. Если x1, x2, ..., xn – значения случайной величины X, то среднее арифметическое их значений x ( x1 x2 ... xn ) / n имеет дисперсию DX / n . Таким образом, при n , имеем DX / n 0 и x MX . Другими словами, при достаточно большом объёме выборки разница между средним арифметическим и математическим ожиданием стремится к нулю (так называемая предельная теорема теории вероятности). Следовательно, использование критерия ожидаемого значения справедливо только в случае, когда одно и тоже решение приходится применять достаточно большое число раз. Справедливо и обратное: ориентация на ожидания будет приводить к неверным результатам для решений, которые приходится принимать небольшое число раз. Критерий «ожидаемое значение – дисперсия» является модификацией критерия ожидаемого значения. В нем максимизация ожидаемого значения прибыли сочетается с минимизацией её дисперсии. Критерий предельного уровня не дает оптимального решения, например, максимизирующего прибыль, или минимизирующего затраты.
108
ЛПР на основании субъективных соображений определяет наиболее приемлемый способ действий. Критерий наиболее вероятного исхода предполагает замену случайной ситуации детерминированной путем замены случайной величины прибыли (затрат) единственным, наиболее вероятным ее значением. Использование данного критерия в значительной степени опирается на опыт и интуицию. При этом необходимо учитывать два обстоятельства, затрудняющие применение этого критерия: - его нельзя использовать, если наибольшая вероятность события недопустимо мала; - применение критерия невозможно, если несколько значений вероятностей возможного исхода равны между собой. Пример 6.8. Требуется принять решение о том, когда необходимо проводить профилактический ремонт ПЭВМ, чтобы минимизировать потери из-за неисправности. В случае, если ремонт будет производиться слишком часто, затраты на обслуживание станут большими при малых потерях из-за случайных поломок. Так как невозможно предсказать заранее, когда возникнет неисправность, необходимо найти вероятность того, что ПЭВМ выйдет из строя в период времени t. В этом и состоит элемент «риска». Математически это выглядит так: ПЭВМ ремонтируется индивидуально, если она остановилась из-за поломки. Через T интервалов времени выполняется профилактический ремонт всех n ПЭВМ. Необходимо определить оптимальное значение Т, при котором минимизируются общие затраты на ремонт неисправных ПЭВМ и проведение профилактического ремонта в расчёте на один интервал времени. Пусть рt – вероятность выхода из строя одной ПЭВМ в момент t, а nt – случайная величина, равная числу всех вышедших из строя ПЭВМ в тот же момент. Пусть далее С1 – затраты на ремонт неисправной ПЭВМ и С2 – затраты на профилактический ремонт одной машины. Применение критерия ожидаемого значения в данном случае оправдано, если ПЭВМ работают в течение большого периода времени. При этом ожидаемые затраты на один интервал составят: T 1
C1 M (nt ) C2 n ОЗ t 1 , T где M(nt) – математическое ожидание числа вышедших из строя ПЭВМ в момент t. Так как nt имеет биномиальное распределение с параметрами (n, pt), то M(nt) = npt. Таким образом,
109
T 1
n(C1 pt C2 ) t 1 ОЗ . T Необходимые условия оптимальности T* имеют вид: ОЗ (T*–1) ОЗ (T*), ОЗ (T*+1) ОЗ (T*). Следовательно, начиная с малого значения T, вычисляют ОЗ(T), пока не будут удовлетворены необходимые условия оптимальности. Пусть С1 = 100; С2 = 10; n = 50. Значения pt имеют вид (табл. 6.3):
Таблица 6.3. Результаты расчета T
рt
T 1
pt
ОЗ(Т)
0 0,05 0,12 0,22 0,35
500 375 366,7 400 450
t 1
1 2 3 4 5
0,05 0,07 0,10 0,13 0,18
T* 3, ОЗ(Т*) 366,7. Следовательно, профилактический ремонт необходимо делать через * T = 3 интервала времени. 6.4.2. Статистические игры Методы принятия решений в условиях риска обосновываются в рамках теории статистических решений, или статистических игр. Создателем теории статистических игр считается американский математик и статистик венгерского происхождения А. Вальд (Abraham Wald). Он показал, что в теории принятия решений статистические игры являются основным подходом, если решение принимается в условиях риска [15]. В этом случае предполагаются заданными вероятности состояний «природы»: P(1 ), P(2 ), ... , P(n ) ,
n
P ( j ) 1 . j 1
При этом в качестве показателя эффективности стратегии, который мы стремимся обратить в максимум, естественно взять среднее значение выигрыша, которое для i-й стратегии Ai определяется выражением n
ai aij P ( j ) , j 1
где aij – элементы матрицы выигрышей A {aij }mn . С помощью такого приема задача о выборе решений в условиях риска, по существу, превращается в задачу о выборе решений в условиях
110
определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем. Пример 6.9. Пусть планируется операция в заранее неизвестных метеорологических условиях с вариантами 1, 2, 3, 4. Согласно данным метеосводок за много лет вероятности этих вариантов равны соответственно: P(3 ) 0,5 , P(1 ) 0,1, P(2 ) 0,2 , P(4 ) 0,2 . Проведение операции в различных условиях влечет за собой различную выгоду, представленную матрицей (см. табл. 6.4). Видим, что оптимальной стратегией является A1. Таблица 6.4. Расчет средней выгоды ai использования стратегий Ai 1 1 3 4 0,1
A1 A2 A3 P(j)
2 4 8 6 0,2
3 5 4 6 0,5
4 9 3 2 0,2
ai 5,2 4,5 5,0
При выборе оптимальной стратегии в условиях с известными вероятностями состояний природы вместо среднего выигрыша можно использовать средний риск n
ri rij P ( j ) , i 1, ..., m , j 1
который надо обратить в минимум. В данной формуле rij – элемент матрицы риска R, равный rij max aij aij j aij , i 1, ..., m , j 1, ..., n . i
Покажем, что стратегия, максимизирующая средний выигрыш ai , совпадает со стратегией, минимизирующей средний риск ri . Для этого выразим средний риск через средний выигрыш n
n
n
n
j 1
j 1
j 1
j 1
ri rij P ( j ) ( j aij ) P( j ) j P ( j ) aij P( j ) C ai .
Таким образом, средний риск отличается от среднего выигрыша на константу, а значит, они одновременно достигают своих оптимальных значений. Важным обстоятельством является тот факт, что при решении статистической игры можно обойтись одними чистыми стратегиями. Действительно, если мы будем применять какую-либо смешанную стратегию S A ( p1 , ..., pm ) , тогда средний выигрыш, осредненный и по стратегиям, будет равен
111
m
a ai pi . i 1
Это взвешенное среднее средних выигрышей ai , соответствующих чистым стратегиям Ai. Очевидно, что любое среднее не может превосходить максимальной из усредняемых величин. Поэтому в статистической игре применение смешанной стратегии не может быть выгоднее, чем применение оптимальной чистой стратегии. Пример 6.10. Выбор оптимального варианта капиталовложений при строительстве электростанций. Пусть необходимо построить в регионе электростанцию. При этом в регионе имеются следующие возможности: - строительство большого водохранилища и гидроэлектростанции (A1); - сооружение тепловой электростанции (A2); - сооружение атомной электростанции (A3). Затраты складываются из затрат на строительство и эксплуатационных расходов. На эксплуатационные расходы гидроэлектростанции влияют климатические условия, поскольку от погодных условий зависит уровень воды в водохранилищах. На экономическую эффективность тепловой электростанции влияют цены на газ и мазут, срывы поставок мазута из-за неритмичности работы транспорта, вызванной плохими климатическими условиями. Экономическая эффективность атомной электростанции зависит от больших затрат на строительство, а также от устойчивости агрегатов и системы управления во время эксплуатации. Случайные факторы, от которых зависит экономическая эффективность вариантов капиталовложений, объединим в четыре возможных состояния природы: 1 – цены на газ и мазут – низкие, климатические условия – благоприятные; 2 – цены на газ и мазут – высокие, климатические условия – благоприятные; 3 – цены на газ и мазут – низкие, климатические условия – неблагоприятные; 4 – цены на газ и мазут – высокие, климатические условия – неблагоприятные. Представим возможные выигрыши в виде платежной матрицы: Таблица 6.5. Платежная матрица эффективности капиталовложений при строительстве электростанций A1 A2 A3 j
112
1 50 40 30 50
2 50 25 30 50
3 25 35 30 35
4 25 20 30 30
i 25 20 30
Рассмотрим задачу как матричную игру, считая, что дополнительная статистическая информация отсутствует. Очевидно, минимаксной стратегией является A3, т.е. строительство атомной электростанции. Теперь предположим, что существует многолетняя статистика, позволяющая оценить вероятности состояний природы. Пусть они равны следующим значениям: P(1 ) 0,15 , P(2 ) 0,3 , P(3 ) 0,2 , P(4 ) 0,35 . Тогда можно определить средний выигрыш для каждого из решений: a1 36,25 , a2 27,5 , a3 30 . При этом максимальный средний выигрыш соответствует первой стратегии A1, т.е. оптимальным решением будет инвестирование средств в строительство гидроэлектростанции. Выше была рассмотрена ситуация, когда появление дополнительной статистической информации о состояниях природы привело к изменению ранее принятого решения. Можно сказать, что дополнительная информация всегда появляется в результате некоторого эксперимента. Зададимся вопросом, в каких случаях целесообразно проведение эксперимента для увеличения количества имеющейся информации? Естественно, этот вопрос возникает только тогда, когда затраты на проведение эксперимента существенны и сравнимы с тем увеличением выигрыша, которое можно получить, узнав более точно обстановку. Если затраты на проведение эксперимента меньше дополнительного увеличения выигрыша, то эксперимент является целесообразным. 6.4.3. Идеальный эксперимент Рассмотрим случай идеального эксперимента E, приводящего к точному знанию состояния природы. Пусть задана матрица выигрышей A {aij }mn . Пусть также известны вероятности P(1 ), P(2 ), ... , P(n ) состояний природы 1, 2, 3, 4, а затраты на проведение эксперимента равны C. Если не проводить эксперимента, то нужно выбрать стратегию с максимальным выигрышем n
a max ai max aij P( j ) . i
i
j 1
Теперь предположим, что мы провели эксперимент E и точно выяснили действительное состояние природы. Если это состояние k, то надо применять стратегию, для которой достигается max aik k . Нужно i
заранее решить, будем ли мы производить эксперимент E или нет, и нам заранее неизвестно, какое состояние на самом деле имеет место, а значит, и какой будет выигрыш. Поэтому осредним возможный средний выигрыш n
j P ( j ) . j 1
113
Таким образом, потребность в эксперименте должна определяться по правилу: C a . Представим это неравенство в более удобном виде. Раскроем и a : n
n
n
C j P( j ) max aij P( j ) min ( j aij ) P ( j ) min ri r , j 1
i
j 1
i
j 1
i
т.е. C r . Пример 6.11. Рассмотрим игру с природой из примера 6.9. Определим целесообразность идеального эксперимента, если его стоимость C = 2. Перейдем к матрице рисков 3 4 1 0 R 1 0 2 6 . 0 2 0 7 Отсюда получим r1 1,6 , r2 2,3 , r3 1,8 , следовательно, r 1,6 . Поскольку C r , то эксперимент следует признать нецелесообразным. 6.4.4. Неидеальный эксперимент Рассмотрим случай неидеального эксперимента E, который не приводит к выяснению в точности состояния природы, а лишь дает какието косвенные свидетельства в пользу тех или иных состояний. В общем случае неидеальный эксперимент E приводит к появлению одного из k несовместных событий B1 , B2 , ... , Bk . Причем вероятности этих событий (исходов эксперимента) зависят от состояний, при которых проводится эксперимент. Обозначим условную вероятность появления события Bl при состояниях j через P( Bl / j ) , j 1, ... , n , l 1, ... , k . Будем считать, что эти вероятности нам известны. После осуществления неидеального эксперимента E, давшего, например, исход Bl, придется пересмотреть вероятности состояний природы. Они будут характеризоваться не прежними (априорными) вероятностями а новыми (апостериорными) P(1 ), ... , P(n ) , вероятностями P(1 / Bl ), ... , P(n / Bl ) , определяемыми по формуле Байеса. Пример 6.12. Продолжим пример 6.11, но в предположении, что проводимый эксперимент неидеальный и может иметь три исхода B1, B2, B3. Условные вероятности P( Bl / j ) этих исходов для разных состояний известны и приведены в табл. 6.6. Пусть в эксперименте имел место исход B1. Вычислим по формуле полной вероятности вероятность его появления
114
n
P ( B1 ) P( j ) P ( B1 / 1 ) 0,46 . j 1
Отсюда вычислим по формуле Байеса P( j ) P( B1 / j ) , j 1, ..., n , P( j / B1 ) P( B1 ) апостериорные вероятности: P(1 / B1 ) 0,0435 , P(2 / B1 ) 0,3913 , P(3 / B1 ) 0,4348 , P(4 / B1 ) 0,1304 . На основе этих апостериорных вероятностей вычислим значения средних выигрышей a i1 : a11 4,957 , a21 5,391, a31 5,391. Таблица 6.6. Условные вероятности исходов экспериментов Bl для разных состояний природы j P(Bl /j) B1 B2 B3
1 0,2 0,1 0,7
2 0,9 0,1 0
3 0,4 0,5 0,1
4 0,3 0,3 0,4
Таким образом, с учетом результата эксперимента, оптимальными стратегиями являются стратегии A2 и A3, а не A1. При этом a 1 max ai1 5,391. i
Пример 6.13. Продолжим пример 6.12, но в другой постановке задачи. Определим целесообразность проведения неидеального эксперимента E. Для этого надо произвести аналогичные расчеты для остальных исходов B2 и B3, а также сопоставить средний выигрыш при выполнении эксперимента и без его исполнения. Результаты расчетов: P( B2 ) 0,34 , P(1 / B2 ) 0,0294 , P(2 / B2 ) 0,0588 , P(3 / B2 ) 0,7353 , P(4 / B2 ) 0,1765 ; P( B3 ) 0,2 , P(1 / B3 ) 0,35 , P(2 / B3 ) 0 , P(3 / B3 ) 0,25 , P(4 / B3 ) 0,4 ; a12 5,529 , a22 4,029 , a32 5,235 , отсюда a 2 max ai2 5,529 ;
a13
5,2 ,
a23
3,25 ,
a33
3,235 , отсюда a 3
i 3 max ai i
5,2 .
В результате получим полный средний выигрыш k
a a l P( Bl ) 5,391 0,46 5,529 0,34 5,2 0,2 5,4 . *
l 1
Сравнивая это значение с выигрышем в случае не проведения эксперимента, видим, что оно больше на 0,2. Значит, если стоимость эксперимента меньше 0,2, то его надо проводить.
115
6.5. Формальная структура принятия решений в условиях неопределенности 6.5.1. Матрица решений Принятие решения представляет собой выбор одного из некоторого множества E рассматриваемых вариантов: Ei E. Каждым вариантом Ei однозначно определяется некоторый результат (например, выигрыш, полезность или надежность) ei. Эти результаты должны допускать количественную оценку [47]. Идет поиск варианта с наибольшим значением результата, то есть целью выбора является max ei . Таким образом, выбор оптимального i
варианта производится с помощью критерия (6.10) E0 Ei 0 : Ei 0 E ei 0 max ei . i При рассмотрении сложных структур и систем каждому допустимому варианту решения Ei могут соответствовать различные внешние условия (состояния) Fj и результаты eij решений. Под результатом решения (полезностью решения) eij понимают оценку, соответствующую варианту Ei и условиям Fj и характеризующую экономический эффект, полезность, надежность и т.д. Семейство решений описывается некоторой матрицей (табл. 6.7). Увеличение объема семейства по сравнению с детерминированной ситуацией (одному варианту соответствует одно решение) связано, как с недостатком информации, так и с многообразием возможностей. Первоначальная задача максимизации (6.10) должна быть заменена другой, учитывающей все последствия любого из вариантов решения Ei. Таблица 6.7. Матрица решений {eij} Fj
F1
F2
Fn
E1 E2
e11 e21
e12 e22
e1n e2n
Em
em1
em2
Ei
emn
6.5.2. Оценочная функция Чтобы прийти к однозначному и по возможности оптимальному решению даже в том случае, когда каким-то вариантам решений Ei могут соответствовать различные условия Fj, можно ввести подходящие оценочные (целевые) функции. При этом матрица решений {eij} сводится к 116
одному столбцу. Каждому варианту Ei приписывается некоторый результат eir, характеризующий в целом все последствия этого решения. Процедуру выбора можно представить по аналогии с применением критерия (6.10). Однако возникает проблема: какой смысл вложить в результат eir. Способ построения оценочных функций приведен в табл. 6.8. Таблица 6.8. Способ построения оценочных функций E1 E2
e1r e2r
Em
emr
Ниже приведены различные оценочные соответствующие им исходные позиции. Оптимистическая позиция: max eir max (max eij ) . i
i
j
функции,
а
также
(6.11)
Из матрицы решений {eij} (табл. 6.7) выбирается вариант (строка), содержащий в качестве возможного решения наибольший из всех возможных результатов. Делается ставка на то, что выпадет наивыгоднейший случай, и исходя из этого выбирается решение. Позиция нейтралитета: 1 n (6.12) max eir max eij . i i n j 1 ЛПР исходит из того, что все встречающиеся отклонения результата решения от «среднего» случая допустимы, и выбирает результат, оптимальный с этой точки зрения. Пессимистическая позиция: (6.13) max eir max (min eij ) . i
j
i
ЛПР исходит из того, что надо ориентироваться на наименее благоприятный случай и приписывает каждому из альтернативных вариантов наихудший из возможных результатов. При этом выбирается самый выгодный вариант, то есть ЛПР ожидает наилучшего результата в наихудшем случае. Позиция относительного пессимизма: min eir min max (max eij eij ) . (6.14) i
i
j
i
Для каждого варианта решения ЛПР оценивает потери в результате по сравнению с определенным по каждому варианту наилучшим результатом, а затем из совокупности наихудших результатов выбирает наилучший согласно представленной оценочной функции. Примеры оценочных функций можно продолжить и далее.
117
Всякое техническое или экономическое решение в условиях неполной информации – сознательно или неосознанно – принимается в соответствии с какой-либо оценочной функцией. Как только это бывает признано явно, последствия соответствующих решений становятся лучше обозримыми, что позволяет улучшить их качество. При этом выбор оценочных функций всегда должен осуществляться с учетом количественных характеристик ситуации, в которой принимаются решения.
6.6. Классические критерии принятия решений в условиях неопределенности 6.6.1. Максиминный критерий Вальда Максиминный критерий Вальда (ММ-критерий) использует оценочную функцию (6.13), соответствующую позиции крайней осторожности. При Z MM max eir и eir min eij справедливо соотношение i
j
E0 Ei 0 : Ei 0 E ei 0 max min eij , (6.15) j i где ZMM – оценочная функция ММ-критерия. Правило выбора решения в соответствии с ММ-критерием можно интерпретировать следующим образом. Матрица решений {eij} дополняется еще одним столбцом из наименьших результатов eir каждой строки. Выбрать надлежит те варианты Ei0, в строках которых стоят наибольшие значения eir этого столбца. Выбранные таким образом варианты полностью исключают риск. В соответствии с этим критерием из всех самых неудачных результатов выбирается лучший. Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай. Такая стратегия приемлема, например, когда ЛПР не столь заинтересован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей, то есть ЛПР не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать максиминный критерий одним из фундаментальных. В приложениях он применяется чаще всего. Однако положение об отсутствии риска стоит различных потерь. Применение ММ-критерия целесообразно, если ситуация, в которой принимается решение, характеризуется следующими обстоятельствами: - о возможности появления внешних состояний Fj ничего не известно; - приходится считаться с появлением различных внешних состояний Fj; - решение реализуется лишь один раз;
118
- необходимо исключить какой бы то ни было риск, т.е. ни при каких условиях Fj не допускается получать результат, меньший, чем ZMM. 6.6.2. Критерий БайесаЛапласа При построении оценочной функции ZMM (по ММ-критерию) каждый вариант Ei представлен лишь одним из своих результатов eir min eij . j
Критерий БайесаЛапласа (BL-критерий), напротив, учитывает каждое из возможных следствий. Пусть qj – вероятность появления внешнего состояния Fj. Тогда для BL-критерия n
Z BL max eir , eir eij q j , i
j 1
n n (6.16) E0 Ei 0 : Ei 0 E ei 0 max eij q j & q j 1 . i j 1 j 1 Правило выбора решения в соответствии с BL-критерием следующее. Матрица решений {eij} дополняется еще одним столбцом, содержащим математическое ожидание значений каждой из строк. Выбираются те варианты Ei0, в строках которых стоит наибольшее значение eir этого столбца. При этом предполагается, что ситуация, в которой принимается решение, характеризуется следующими обстоятельствами: - вероятности появления внешних состояний Fj известны и не зависят от времени; - решение реализуется (теоретически) бесконечное число раз; - для малого числа реализаций решения допускается некоторый риск. При достаточно большом количестве реализаций среднее значение постепенно стабилизируется. Поэтому при полной (бесконечной) реализации какой-либо риск практически исключен. Исходная позиция при применении BL-критерия оптимистичнее, чем в случае ММ-критерия, однако она предполагает более высокий уровень информированности и достаточно длинные реализации.
6.6.3. Критерий минимаксного риска Сэвиджа Критерий минимаксного риска Сэвиджа реализует оценочную функцию (6.14). С помощью обозначений aij max eij eij , (6.17) i
eir max aij max (max eij eij ) j
j
i
формируется оценочная функция 119
Z S min eir min max (max eij eij ) , (6.18) i i i j и строится множество оптимальных вариантов решения E0 Ei 0 : Ei 0 E ei 0 min max aij . i j Для понимания этого критерия определяемую соотношением (6.17) величину aij можно трактовать по-разному: - как максимальный дополнительный выигрыш, который достигается, если в состоянии Fj вместо варианта Ei выбрать другой, оптимальный для этого внешнего состояния вариант; - как потери (риск), возникающие в состоянии Fj при замене оптимального для него варианта на вариант Ei. Соответствующее критерию Сэвиджа правило выбора решения выглядит так. Каждый элемент матрицы решений {eij} вычитается из наибольшего результата max eij соответствующего столбца. Разности aij образуют i
матрицу остатков (рисков) {aij}. Эта матрица пополняется столбцом наибольших разностей eir. Выбираются те варианты Ei0, в строках которых стоит наименьшее для этого столбца значение. По выражению (6.18) оценивается значение результатов тех состояний, которые вследствие выбора соответствующего распределения вероятностей, оказывают одинаковое влияние на решение. С точки зрения матрицы решений {eij} критерий Сэвиджа связан с риском, однако, с позиций матрицы {aij}, он от риска свободен. В остальном, к ситуации принятия решений предъявляются те же требования, что и в случае ММкритерия. 6.6.4. Критерий азартного игрока Критерий азартного игрока использует оценочную функцию (6.11), соответствующую позиции крайнего оптимизма. При Z A max eir и eir max eij справедливо соотношение i
j
E0 Ei 0 : Ei 0 E ei 0 max max eij , i j где ZA – оценочная функция критерия азартного игрока. Правило выбора решения по данному критерию следующее. Матрица решений {eij} дополняется еще одним столбцом из наибольших результатов eir каждой строки. Выбрать надлежит те варианты Ei0, в строках которых стоят наибольшие значения eir этого столбца.
120
С помощью критерия азартного игрока определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния. Это критерий крайнего оптимизма. Следует отметить, что ситуации, требующие применения такого критерия в экономике, в общем, нередки, и пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «или пан, или пропал». 6.6.5. Применение классических критериев Из требований, предъявляемых рассмотренными критериями к анализируемой ситуации, становится ясно, что вследствие их жестких исходных позиций они применимы только для идеализированных практических решений. В случаях, когда требуется слишком сильная идеализация, можно одновременно применять поочередно различные критерии. После этого среди нескольких вариантов, отобранных таким образом в качестве оптимальных, приходится все-таки волевым образом выделять некоторое окончательное решение. Такой подход позволяет, вопервых, лучше проникнуть во все внутренние связи проблемы принятия решений и, во-вторых, ослабляет влияние субъективного фактора. Пример 6.14. При работе ЭВМ необходимо периодически приостанавливать обработку информации и проверять ЭВМ на наличие в ней вирусов. Приостановка в обработке информации приводит к экономическим издержкам. В случае же если вирус вовремя обнаружен не будет, возможна потеря и некоторой части информации, что приведёт к ещё большим убыткам. Варианты решения таковы: Е1 – полная проверка; Е2 – минимальная проверка; Е3 – отказ от проверки. ЭВМ может находиться в следующих состояниях: F1 – вирус отсутствует; F2 – вирус есть, но он не успел повредить информацию; F3 – есть файлы, нуждающиеся в восстановлении. Результаты расчета (в усл. ед.) по четырем классическим критериям приведены в табл. 6.9, 6.10 [47]. Согласно ММ-критерию следует проводить полную проверку (E0 = E1). Критерий азартного игрока и критерий Байеса–Лапласа (в предположении, что все состояния машины равновероятны) рекомендуют отказаться от проверки (E0 = E3). По критерию Сэвиджа в качестве оптимальной рекомендуется минимальная проверка (E0 = E2). В рассмотренном примере критерии предлагают разные решения. Это делает неясным, какому критерию следовать.
121
Таблица 6.9. Расчет по критериям Вальда, Байеса–Лапласа и азартного игрока ММ-критерий F1
F2
F3
eir min eij
max eir
-25 -31 -40
-25
j
E1 E2 E3
-20 -22 -25 -14 -23 -31 0 -24 -40
i
Критерий азартного игрока
Критерий BL eir
1 eij 3 j
max eir
eir max eij
max eir
-21,33
-20 -14 0
0
j
i
-22,33 -22,67 -21,33
i
Таблица 6.10. Расчет по критерию Сэвиджа Критерий Сэвиджа F1
F2
F3
eir max a ij
min eir
+20 +14 +15
+14
j
E1 E2 E3
+20 +14 0
0 +1 +2
0 +6 +15
i
Поскольку различные критерии связаны с различными же аспектами ситуации, в которой принимается решение, лучше всего для сравнительной оценки рекомендаций тех или иных критериев получить дополнительную информацию о самой ситуации. Если принимаемое решение относится к сотням объектов с одинаковыми параметрами, то целесообразно придерживаться критерия Байеса–Лапласа. Если же число реализации невелико, то больший вес приобретают более осторожные рекомендации критериев Вальда и Сэвиджа.
6.7. Производные критерии принятия решений в условиях неопределенности 6.7.1. Критерий пессимизма-оптимизма Гурвица С целью занять более уравновешенную позицию был предложен критерий Гурвица, оценочная функция которого находится где-то между предельным оптимизмом (6.11) и крайним пессимизмом (6.13): Z HW max eir , i
eir c min eij (1 c) max eij . j
j
Тогда E0 Ei 0 : Ei 0 E ei 0 max c min eij (1 c) max eij , 0 c 1 , j i j где с – весовой множитель.
122
(6.19)
Правило выбора согласно критерию Гурвица формулируется следующим образом: Матрица решений {eij} дополняется столбцом, содержащим средние взвешенные значения наименьшего и наибольшего результатов для каждой строки (6.19). Выбираются те варианты Ei0, в строках которых стоят наибольшие элементы eir этого столбца. При с = 1 критерий Гурвица превращается в ММ-критерий. При с = 0 он превращается в критерий азартного игрока. Отсюда ясен смысл весового множителя с. В приложениях правильно выбрать этот множитель бывает так же трудно, как правильно выбрать критерий. Поэтому чаще всего весовой множитель с = 0,5 принимается в качестве некоторой «средней» точки зрения. Критерий Гурвица предъявляет к ситуации, в которой принимается решение, следующие требования: - о вероятностях появления состояний Fj ничего не известно; с появлением состояний Fj необходимо считаться; - реализуется лишь малое количество решений; - допускается некоторый риск. 6.7.2. Критерий Ходжа–Лемана Критерий Ходжа–Лемана (HL) опирается одновременно на ММкритерий (6.15) и BL-критерий (6.16). С помощью параметра v выражается степень доверия к используемому распределению вероятностей. Если это доверие велико, то акцентируется BL-критерий, в противном случае предпочтение отдается ММ-критерию. Оценочная функция определяется равенством Z HL max eir , i
n
eir v eij q j (1 v) min eij , 0 1 , j 1
j
(6.20)
а множество HL-оптимальных решений записывается в виде n E0 Ei 0 : Ei 0 E ei 0 max v eij q j (1 v) min eij , 0 v 1. j i j 1 Правило выбора, соответствующее HL-критерию, формулируется так. Матрица решений {eij} дополняется столбцом, составленным из средних взвешенных (с постоянными весами) математического ожидания и наименьшего результата каждой строки (6.20). Отбираются те варианты решений Ei0, в строках которых стоит наибольшее значение этого столбца. Для v = l HL-критерий переходит в BL-критерий, а для v = 0 превращается в ММ-критерий.
123
Степень уверенности в какой-либо функции распределения практически не поддается оценке. Сам критерий тоже не дает для этого точки опоры. Таким образом, выбор параметра подвержен влиянию субъективизма. Кроме того, без внимания остается и число реализаций. Поэтому HL-критерий применяется при принятии решений крайне редко. Требования HL-критерия к ситуации, в которой принимается решение, следующие: - вероятности появления состояний Fj неизвестны, но некоторые предположения о распределениях вероятностей возможны; - принятое решение теоретически допускает бесконечно много реализаций; - при малых количествах реализаций допускается некоторый риск. 6.7.3. Критерий Гермейера Опираясь на подход к отысканию эффективных и пригодных к компромиссу решений, которые не считаются заведомо худшими, чем другие, можно предложить критерий Гермейера (G), обладающий определенной эластичностью. Он с самого начала ориентирован на величины потерь, то есть на отрицательные значения всех еij. В качестве оценочной функции выступает Z G max eir , eir min eij q j . i
j
Множество оптимальных по данному критерию решений записывается как E0 Ei 0 : Ei 0 E ei 0 max min eij q j eij 0 . j i Поскольку в хозяйственных задачах преимущественно имеют дело с ценами и затратами, условие eij < 0 обычно выполняется. В случае же, когда среди величин еij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования (еij – а) при подходящим образом подобранном а > 0. Следует, однако, иметь в виду, что оптимальный вариант решения зависит от а. Правило выбора согласно G-критерию формулируется так. Матрица решений {eij} дополняется еще одним столбцом, содержащем в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния Fj. Выбираются те варианты Ei0, в строках которых находится наибольшее значение eir этого столбца. В известном отношении G-критерий обобщает ММ-критерий. В случае равномерного распределения qj = 1/n, j = 1, , n, они становятся идентичными. Условия применимости G-критерия таковы: - вероятности появления состояний Fj известны; 124
- с появлением тех или иных состояний, отдельно или в комплексе, необходимо считаться; - допускается некоторый риск; - решение может реализоваться один или много раз. Если функция распределения известна не очень надежно, а числа реализаций малы, то, следуя G-критерию, получают неоправданно большой риск. Таким образом, здесь остается некоторая свобода для субъективных действий. 6.7.4. BL(MM)-критерий Стремление получить критерии, которые бы лучше приспосабливались к имеющейся ситуации, чем все, до сих пор рассмотренные, привело к построению так называемых составных критериев. Одним из них является BL(MM)-критерий, полученный путем объединения критериев БайесаЛапласа и максиминного. Правило выбора для этого критерия следующее. Матрица решений {eij} дополняется еще тремя столбцами. В первом из них записываются математические ожидания каждой из строк, во втором – разность между опорным значением ei0 j0 max min eij и i
j
наименьшим значением min eij соответствующей строки. В третьем j
столбце помещаются разности между наибольшим значением каждой строки max eij и наибольшим значением max ei0 j той строки, в которой j
j
находится значение ei0 j0 . Выбираются те варианты Ei0 , строки которых (при соблюдении приводимых ниже соотношений между элементами второго и третьего столбцов) дают наибольшее математическое ожидание. А именно, соответствующее значение оценок риска i i ei0 j0 min eij j
из второго столбца должно быть не больше некоторого заранее заданного уровня риска доп. Значение же из третьего столбца должно быть больше значения из второго столбца. Применение этого критерия обусловлено следующими признаками ситуации, в которой принимается решение: - вероятности появления состояний Fj неизвестны, однако имеется некоторая априорная информация в пользу какого-либо определенного распределения; - необходимо считаться с появлением различных состояний, как по отдельности, так и в комплексе; - допускается ограниченный риск; - принятое решение реализуется один раз или многократно. 125
BL(MM)-критерий хорошо приспособлен для построения практических решений прежде всего в области техники и может считаться достаточно надежным. Однако заданные границы риска доп и, соответственно, оценок риска i не учитывает ни число применения решения, ни иную подобную информацию. Влияние субъективного фактора хотя и ослаблено, но не исключено полностью. Условие max eij max ei0 j i существенно в тех случаях, когда j
j
решение реализуется только один или малое число раз. В этих условиях недостаточно ориентироваться на риск, связанный только с невыгодными внешними состояниями и средними значениями. Из-за этого можно понести некоторые потери в удачных внешних состояниях. При большом числе реализаций данное условие перестает быть таким уж важным и допускает разумные альтернативы. 6.7.5. Критерий произведений Критерий произведений с самого начала ориентирован на величины выигрышей, то есть на положительные значения eij. Оценочная функция: Z P max eir , eir eij . i
j
Тогда E0 Ei 0 : Ei 0 E & ei 0 max eij eij 0 . i j Правило выбора в этом случае формулируется так. Матрица решений {eij} дополняется новым столбцом, содержащим произведения всех результатов каждой строки. Выбираются те варианты Ei0, в строках которых находятся наибольшие значения этого столбца. Критерий произведений используют, когда: - вероятности появления состояний Fj неизвестны; - с появлением каждого из состояний Fj по отдельности необходимо считаться; - критерий применим и при малом числе реализации решения; - некоторый риск допускается. Как уже упоминалось, критерий произведений приспособлен в первую очередь для случаев, когда все еij положительны. Если указанное условие нарушается, а критерий приходится применять и в этом случае, то следует
выполнить некоторый сдвиг (еij + а) с некоторой константой a min eij . i, j
Результат применения критерия существенно зависит от этого значения а.
126
На практике в качестве значения а часто используют величину min eij 1 . i, j
Если же никакая константа не может быть признана имеющей смысл, то к таким проблемам критерий произведений не применим. Выбор оптимального решения по этому критерию оказывается значительно менее пессимистическим, чем выбор в соответствии с ММкритерием. В результате применения критерия произведений происходит некоторое выравнивание между большими и малыми значениями eij, и, устанавливая оптимальный вариант решения с помощью этого критерия, можно при фиксированных состояниях Fj получить большую выгоду, чем при использовании ММ-критерия, но при этом должна учитываться возможность появления и худших результатов. Следует отметить, что при использовании этого критерия ни число реализаций, ни информация о распределении вероятностей не принимаются во внимание. Если оптимальный результат, полученный согласно критерию произведений, определяется преимущественно малыми значениями результатов, это указывает на довольно-таки пессимистический подход, аналогичный ММ-критерию. При возрастании полезного эффекта пессимистический акцент снижается, и по существу происходит все большее сближение данного критерия с нейтральным. 6.7.6. Применение производных критериев Найдем оптимальные вариантов решения согласно производным критериям на примере матрицы решений о проведении проверок ЭВМ из примера 6.14 (четыре левых столбца в табл. 6.9). Построение оптимального решения для матрицы решений о проверках по критерию Гурвица имеет вид (при c = 0,5, данные приведены в усл. ед.). В этом примере у решения имеется поворотная точка относительно весового множителя c: до 0,57 в качестве оптимального выбирается Е3, а при больших значениях – выбирается Е1. Таблица 6.11. Расчет по критерию Гурвица eij -20 -14 0
-22 -23 -24
c min eij
(1 c) max eij
eir
max eir
-12,5 -15,5 -20,0
-10,0 -7,0 0,0
-22,5 -22,5 -20,0
-20,0
j
-25 -31 -40
j
i
Рассмотрим применение критерия Ходжа–Лемана (qj = 1/3, v = 0,5). Критерий Ходжа–Лемана (табл. 6.12) рекомендует вариант Е1 (полная проверка) – так же как и ММ-критерий. Смена рекомендуемого варианта происходит только при v > 0,94. Поэтому равномерное распределение состояний рассматриваемой машины должно распознаваться с очень 127
высокой вероятностью, чтобы его можно было выбрать по большему математическому ожиданию. При этом число реализаций решения всегда остаётся произвольным. Таблица 6.12. Расчет по критерию Ходжа–Лемана
eij q j
min eij
v eij q j
-25,0 -31,0 -40,0
-11,17 -11,34 -10,67
j
j
-22,33 -22,67 -21,33
j
(1 v) min eij
eir
max eir
-12,5 -15,5 -20,0
-23,67 -26,84 -30,76
-23,67
j
i
Критерий Гермейера при qj = 1/3 дает следующий результат (табл. 6.13). В качестве оптимального выбирается вариант Е1. Сравнение вариантов с помощью величин eir показывает, что способ действия критерия Гермейера является даже более гибким, чем у ММ-критерия. Таблица 6.13. Расчет по критерию Гермейера eij q j
eij
-20 -14 0
-22 -23 -24
-25 -31 -40
-6,67 -4,67 0,0
eir min eij q j
max eir
-8,33 -10,33 -13,33
-8,33
j
-7,33 -7,67 -8,0
-8,33 -10,33 -13,33
i
В табл. 6.14 решение выбирается в соответствии с BL(MM)-критерием при q1 = q2 = q3 = 1/3. Вариант Е3 (отказ от проверки) принимается этим критерием только тогда, когда риск приближается к возм = 15103. В противном случае оптимальным оказывается Е1. Во многих технических и хозяйственных задачах допустимый риск бывает намного ниже, составляя обычно только незначительный процент от общих затрат. В подобных случаях бывает особенно ценно, если неточное значение распределения вероятностей сказывается не очень сильно. Если при этом оказывается невозможным установить допустимый риск доп заранее, независимо от принимаемого решения, то помочь может вычисление ожидаемого риска возм. Тогда становится возможным подумать, оправдан ли подобный риск. Такое исследование обычно дается легче. Таблица 6.14. Расчет по BL(MM)-критерию
eij q j
eij
-20 -14 0
128
-22 -23 -24
j
-25 -31 -40
-22,33 -22,67 -21,33
ei0 j0 min eij
max eij
max eij max ei0 j
0,0 +6,0 +15,0
-20,0 -14,0 0,0
0,0 +6,0 +20,0
j
j
j
j
Результаты применения критерия произведения при а = 41103 и а = 200103 приведены в табл. 6.15. Таблица 6.15 Расчет по критерию произведения eij a
a a = 41
a = 200
+21 +27 +41 +180 +186 +200
+19 +18 +17 +178 +177 +176
eir = eij
max eir
6384 4860 697 5607 5563 5632
6384
j
+16 +10 +1 +175 +169 +160
i
5632
Условие eij 0 для данной матрицы невыполнимо. Поэтому к элементам матрицы добавляются (произвольно заданные) сначала а = 41103, а затем а = 200103. Для а = 41103 оптимальным оказывается вариант Е1, а для а = 200103 – вариант Е3, так что зависимость оптимального варианта от а очевидна.
129
Глава 7. Информационные аспекты изучения систем В самом общем виде информация – это сведения о чем-либо. В настоящее время не существует единого определения информации как научного термина, причём академик Н.Н. Моисеев даже полагал, что в силу широты этого понятия нет и не может быть строгого и достаточно универсального определения информации [45]. С точки зрения различных областей знания данное понятие описывается своим специфическим набором признаков. Современное понимание того, что такое информация, и какую роль она играет в искусственных и естественных системах, сложилось не сразу; оно представляет собой совокупность знаний, полученных разными науками: физикой, биологией, философией, теорией связи и т.д. Если состояния одного объекта находятся в соответствии с состояниями другого объекта, мы говорим, что один объект отражает другой, содержит информацию о другом. В настоящее время информация рассматривается как фундаментальное свойство материи. Особенностью информации является то, что ее можно исследовать количественно. Эти вопросы рассматриваются в теории информации – разделе прикладной математики, радиотехники и информатики, относящейся к измерению количества информации, ее свойств и устанавливающий предельные соотношения для систем передачи данных. Появление теории информации связано с опубликованием К. Шенноном (Claude Elwood Shannon) в 1948 году работы «Математическая теория связи» [97]. Как и любая математическая теория, теория информации оперирует математическими моделями, а не реальными физическими объектами (источниками и каналами связи).
7.1. Сигналы в системах Для того чтобы два объекта содержали информацию друг о друге, необходимо, чтобы между их состояниями существовало соответствие: только при этом условии по состоянию одного объекта можно судить о состоянии другого. Такое соответствие может установиться как в результате физического взаимодействия между этими объектами, так и с помощью взаимодействия с промежуточными объектами (или их совокупностью). Сигнал есть материальный носитель информации, средство перенесения информации в пространстве и времени. Следует уточнить, что один и тот же объект может выступать в качестве разных сигналов: колебания воздуха могут нести звуки музыки,
130
речь лектора, пение птиц или шум самолета; с магнитной ленты можно стереть одну запись и сделать другую и т.д. Следовательно, в качестве сигналов используются не сами по себе объекты, а их состояния. Далее, не всякое состояние имеет сигнальные свойства. Точнее говоря, данный объект взаимодействует не только с тем объектом, информацию о котором мы хотели бы получить, но и с другими, не интересующими нас объектами. В результате соответствие состояний ослабевает. Соответствие между сигналом и информацией, которую он содержит, устанавливается по специальным правилам, называемым кодом. В искусственных системах кодом называют комплекс правил образования сигнала. Посторонние воздействия, нарушающие это соответствие, называются помехами или шумами. Нарушение соответствия может происходить не только вследствие помех, но и из-за рассогласования кодов взаимодействующих объектов. Таким образом, информация есть свойство материи, состоящее в том, что в результате взаимодействия объектов между их состояниями устанавливается определенное соответствие. Сигналы делятся на два типа: - статические сигналы. К ним относятся сигналы, являющиеся стабильными состояниями физических объектов (например, книга, фотография, запись на жестком диске, состояние памяти ЭВМ и т. д.); - динамические сигналы. К этому типу относятся сигналы, в качестве которых используются динамические состояния силовых полей. Такие поля характеризуются тем, что изменение их состояния не может быть локализовано в (неизолированной) части поля и приводит к распространению возмущения. Примерами таких сигналов могут служить, световые сигналы и радиосигналы. Динамические сигналы используют преимущественно для передачи, а статические – для хранения информации, но можно найти и противоположные примеры (динамические запоминающие устройства, письма, газеты). Сигналы играют в системах особую, очень важную роль. Потоки информации, переносимые сигналами, организуют функционирование системы, управляют ею. Основоположник кибернетики и теории искусственного интеллекта Н. Винер (Norbert Wiener), например, подчеркивал, что общество простирается до тех пределов, до каких распространяется информация. Имеется существенное различие между просто состоянием объекта и сигналом. Оно состоит в том, что единственная функция не исчерпывает всех важных свойств сигналов. Ведь понятие функции предполагает, что нам известно значение x (либо правило его вычисления) для каждого t. Если же это известно получателю сигнала, то отпадает необходимость в передаче: функция x(t) может быть и без этого воспроизведена на приемном конце.
131
Следовательно, единственная однозначная функция вещественного аргумента не может служить моделью сигнала. Такая функция приобретает сигнальные свойства только тогда, когда она является одной из возможных функций. Другими словами, моделью сигнала может быть набор (ансамбль) функций параметра t, причем до передачи неизвестно, какая из них будет отправлена; это становится известным получателю только после передачи. Каждая такая конкретная функция называется реализацией. Если теперь еще ввести вероятностную меру на множество реализации, то мы получим математическую модель, называемую случайным процессом. Имеется несколько различных подходов к тому, как вводить вероятностную меру на множестве реализаций. Для инженерных приложений оказывается удобным определение случайного процесса как такой функции времени x(t), значение которой в каждый данный момент является случайной величиной. Случайная величина полностью характеризуется распределением вероятностей, например плотностью P1(x1/t1). Однако, чтобы охарактеризовать случайный процесс, нужно описать, связаны ли (и если да, то как) значения реализации, разделенные некоторыми интервалами времени. Так как связь только двух таких значений, описываемая распределением второго порядка P2(x1,x2/t1,t2), может неполно характеризовать процесс в целом, вводят распределения nго порядка: Рn(x1, ... , хn/t1, ... , tn). В конкретных задачах обычно ясно, до какого порядка следует доходить в описании процесса. Необходимость моделирования самых разнообразных сигналов приводит к построению частных моделей случайных процессов, то есть наложением дополнительных ограничений на параметры распределений и на сами распределения. Перечислим наиболее важные классы случайных процессов. Непрерывные и дискретные по времени процессы. Случайный процесс с непрерывным временем характеризуется тем, что его реализации определяются для всех моментов из некоторого (конечного или бесконечного) интервала T параметра t. Дискретный по времени процесс (или случайная последовательность) задается на дискретном ряде точек временной оси (обычно равноотстоящих). Непрерывные и дискретные по информативному параметру процессы. Процессы различаются в зависимости от того, из какого (непрерывного или дискретного) множества принимает значение реализация x случайной величины X. Стационарные и нестационарные процессы. Так называются процессы в зависимости от постоянства или изменчивости их статистических характеристик. Случайный процесс называется стационарным в узком смысле, если для любого n конечномерные
132
распределения вероятностей не изменяются со временем, то есть при любом τ выполняется условие Pn(x1, x2, ... , хn/t1 + τ, t2 + τ, ... , tn + τ) = Pn(x1, ... , хn/t1, t2, ... , tn). Если же условие независимости от времени выполняется только для первых двух моментов (среднего и функции автокорреляции), то процесс называется стационарным в широком смысле. Эргодические и неэргодические процессы. На практике при описании случайных величин вместо рассмотрения их распределений часто ограничиваются только их числовыми характеристиками, обычно моментами. В тех случаях, когда распределение неизвестно, моменты (и другие числовые характеристики) можно оценить статистически. Перенос такой практики на произвольные случайные процессы требует не только учета зависимости отстоящих друг от друга во времени значений, но и наложения дополнительных требований. Требование совпадения величин, получающихся при усреднении по ансамблю (то есть при фиксированном времени) и при усреднении по времени (точнее, по одной реализации), и называется условием эргодичности. Это требование можно толковать и как совпадение результатов усреднения по любой реализации. Вывод. Случайный процесс может служить математической моделью сигнала. Необходимо только следить за тем, чтобы конкретные особенности изучаемых сигналов были корректно отображены в свойствах случайного процесса.
7.2. Информационная энтропия Установив, что случайные процессы являются адекватной моделью сигналов, мы получаем возможность воспользоваться результатами и мощным аппаратом теории случайных процессов. Это не означает, что теория вероятностей и теория случайных процессов дают готовые ответы на все вопросы о сигналах: подход с новых позиций выдвигает такие вопросы, которые раньше просто не возникали. Так появилась теория информации, специально рассматривающая, сигнальную специфику случайных процессов. Первым специфическим понятием теории информации является понятие неопределенности случайного объекта, для которой К. Шеннон в 1948 году ввел количественную меру, названную информационной энтропией [85, 97]. Начнем с простейшего варианта – со случайного события. Пусть, например, некоторое событие может произойти с вероятностью 0,99 и не произойти с вероятностью 0,01, а другое событие имеет вероятности соответственно 0,5 и 0,5. Очевидно, что в первом случае результатом опыта «почти наверняка» является наступление
133
события, во втором же случае неопределенность исхода так велика, что от прогноза разумнее воздержаться. Для характеристики размытости распределений широко используются второй центральный момент (дисперсия) или доверительный интервал. Однако эти величины имеют смысл лишь для случайных числовых величин и не могут применяться к случайным объектам, состояния которых различаются качественно, хотя и в этом случае можно говорить о большей или меньшей неопределенности исхода опыта. Следовательно, мера неопределенности, связанной с распределением, должна быть некоторой его числовой характеристикой, функционалом от распределения, никак не связанным с тем, в какой шкале измеряются реализации случайного объекта. Примем (пока без обоснования) в качестве меры неопределенности случайного объекта A с конечным множеством возможных состояний A1, ... , An с соответствующими вероятностями p1, ... , рn величину n
H ( A) H (pi ) pi log pi ,
(7.1)
i 1
которую и называют информационной энтропией случайного объекта A (или распределения {pi}). От основания логарифма в (7.1) зависит единица измерения информации и энтропии. Отметим, что в (7.1) часто используют натуральное или двоичное основание. Функционал (7.1) обладает следующими свойствами: l. H(p1, ... , рn) = 0 в том и только в том случае, когда какое-нибудь одно из {pi} равно единице (а остальные нули). Это соответствует случаю, когда исход опыта может быть предсказан с полной достоверностью, т.е. когда отсутствует всякая неопределенность. Во всех других случаях энтропия положительна. 2. H(p1, ... , рn) достигает наибольшего значения при p1 = … = pn = 1/n, то есть в случае максимальной неопределенности. 3. Если A и B независимые случайные объекты, то H ( A B) H ( A) H ( B) . 4. Если A и B зависимые случайные объекты, то H ( A B) H ( A) H ( B / A) H ( B) H ( A / B) , (7.2) где условная энтропия H(В\А) определяется как математическое ожидание энтропии условного распределения. 5. Имеет место неравенство Н(А) ≥ Н(А/В), что согласуется с интуитивным представлением о том, что знание состояния объекта В может только уменьшить неопределенность объекта А, а если они независимы, то оставит ее неизменной. К. Шеннон показал следующее. Связав понятие неопределенности дискретной величины с распределением вероятности по возможным состояниям, и потребовав некоторых естественных свойств от 134
количественной меры неопределенности, мы приходим к выводу, что такой мерой может служить только функционал (7.1), названный информационной энтропией.
7.3. Количество информации В основе всей теории информации лежит открытие, что информация допускает количественную оценку. В простейшей форме эта идея была выдвинута еще в 1928 г. Р. Хартли (Ralph Vinton Lyon Hartley) [93], но завершенный и общий вид придал ей К. Шеннон в 1948 г. 7.3.1. Количество информации как мера снятой неопределённости Процесс получения информации можно интерпретировать как изменение неопределенности в результате приема сигнала. Проиллюстрируем это на примере, когда передача сигнала происходит при следующих условиях: 1) полезный (отправляемый) сигнал является последовательностью статистически независимых символов с вероятностями p( xi ) , i 1, m ; 2) принимаемый сигнал является последовательностью символов yk того же алфавита; 3) если шумы (искажения) отсутствуют, то принимаемый сигнал совпадает с отправляемым yk = xi; 4) если шум имеется, то его действие приводит к тому, что данный символ может либо остаться прежним (i-м), либо быть подмененным любым другим (k-м) символом, вероятность этого равна p(yk/xi); 5) искажение очередного символа является событием, статистически независимым от того, что произошло с предыдущими символами. Конечно, можно рассматривать ситуацию и со стороны передатчика, используя вероятности p(xi/yk) (рис. 7.1). В этих условиях энтропия процесса есть энтропия одного символа, и все сводится к рассмотрению посимвольного приема. Итак, до получения очередного символа ситуация характеризуется неопределенностью того, какой символ будет отправлен, то есть априорной энтропией H(Х). После получения символа yk неопределенность относительно того, какой символ был отправлен, меняется: - в случае отсутствия шума она вообще исчезает (апостериорная энтропия равна нулю, поскольку точно известно, что был передан символ xi = yk);
135
- при наличии шума мы не можем быть уверены, что полученный нами символ и есть отправленный, и возникает неопределенность, характеризуемая апостериорной энтропией H(X/yk) = H({p(xi/yk)}) > 0. Определим теперь количество информации как меру снятой неопределенности: количество информации о некотором объекте равно разности априорной и апостериорной энтропии этого объекта, т.е. I ( X ,Y ) H ( X ) H ( X / Y ) . (7.3) Использовав равенство (7.2), получим I ( X , Y ) H (Y ) H (Y / X ) . (7.4) Теперь равенство (7.3) запишется так: m
I ( X , Y ) H ( X ) H ( X / Y ) p( xi ) log p( xi ) i 1
m
m
k 1
i 1
p( yk ) p( xi / y k ) log p( xi / y k ) p( xi , yk ) log p( xi ) k m m
p ( xi , y k ) log p ( xi / y k ) p ( xi , y k ) log i
i 1 k 1
k
(7.5)
i
p ( xi / y k ) , p ( xi )
а для равенства (7.4) имеем m m
p ( y k / xi ) . (7.6) p( yk ) i 1 k 1 Количество информации можно определить как меру уменьшения неопределенности в результате получения сигнала. Это соответствует разности энтропии до и после приема сигнала. I ( X , Y ) p ( xi , y k ) log
Рис. 7.1. Схема «вееров неопределенности» при наличии шума в канале
136
7.3.2. Количество информации как мера соответствия случайных объектов Умножим и разделив логарифмируемое выражение в (7.5) на p(yk), а в (7.6) на р(хi), придадим формулам (7.5) и (7.6) симметричность: m m p ( xi , yk ) I ( X , Y ) p ( xi , yk ) log . (7.7) p ( xi ) p ( yk ) i 1 k 1 Эту симметрию можно интерпретировать так: количество информации в объекте X об объекте Y равно количеству информации в объекте Y об объекте X. Таким образом, количество информации является не характеристикой одного из объектов, а характеристикой их связи, соответствия между их состояниями. Подчеркивая это, можно сформулировать еще одно определение: среднее количество информации, вычисляемое по формуле (7.7), есть мера соответствия двух случайных объектов. Это определение позволяет прояснить связь понятий информации и количества информации. Информация есть отражение одного объекта другим, проявляющееся в соответствии их состояний. Один объект может быть отражен с помощью нескольких других, часто какими-то лучше, чем остальными. Среднее количество информации и есть числовая характеристика степени отражения, степени соответствия. Отметим некоторые важные свойства количества информации. 1. Количество информации в случайном объекте Х относительно объекта Y равно количеству информации в Y относительно X: I ( X , Y ) I (Y , X ) . 2. Количество информации неотрицательно: I ( X , Y ) 0 . 3. Для дискретных Х справедливо равенство I ( X , X ) H ( X ) . 4. Преобразование φ() одной случайной величины не может увеличить содержание в ней информации о другой, связанной с ней, величине: I (( X ), Y ) I ( X , Y ) . (7.8) При обработке данных содержащееся в них количество информации не может быть увеличено. Следовательно, обработка делается лишь для представления информации в более удобном, компактном виде и в лучшем случае без потери полезной информации. 5. Для независимых пар величин количество информации аддитивно: n
I ({X i , Yi }, i 1, n) I ( X i , Yi ) . i 1
6. Количество информации (в отличие от энтропии) имеет одинаковый смысл как для дискретных, так и для непрерывных случайных объектов.
137
7.3.3. Единицы измерения энтропии и количества информации Рассмотрим теперь вопрос о единицах измерения количества информации и энтропии. Из определений I и H следует их безразмерность, а из линейности их связи одинаковость их единиц. Поэтому будем для определенности говорить об энтропии. Начнем с дискретного случая. За единицу энтропии примем неопределенность случайного объекта: m
H ( X ) pi log pi 1 . i 1
Легко установить, что для однозначного определения единицы измерения энтропии необходимо конкретизировать число m состояний объекта и основание логарифма. Возьмем для определенности наименьшее число возможных состояний, при котором объект еще остается случайным, то есть m = 2, и в качестве основания логарифма также возьмем число 2. Тогда из равенства p1 log 2 p1 p 2 log 2 p 2 1 вытекает, что p1 p 2 1 / 2 . Следовательно, единицей неопределенности служит энтропия объекта с двумя равновероятными состояниями. Эта единица получила название «бит». Бросание монеты дает количество информации в один бит. Другая единица («нит») получается, если использовать натуральные логарифмы, обычно она употребляется для непрерывных величин. 7.3.4. Количество информации в индивидуальных событиях Остановимся еще на одном важном моменте. До сих пор речь шла о среднем количестве информации, приходящемся на любую пару состояний (хi, yk) объектов Х и Y. Эта характеристика естественна для рассмотрения особенностей стационарно функционирующих систем, когда в процессе функционирования принимают участие все возможные пары (хi, yk). Однако в ряде практических случаев оказывается необходимым рассмотреть информационное описание конкретной пары состояний, оценить содержание информации в конкретной реализации сигнала. Тот факт, что некоторые сигналы несут информации намного больше, чем другие, виден на примере того, как отбираются новости средствами массовой информации (скажем, все радиостанции и газеты сообщают о рождении шестерых близнецов где-то в Африке, но рождение двойни уже не так интересует людей). Допуская существование количественной меры информации i(хi, yk) в конкретной паре (хi, yk), естественно потребовать, чтобы индивидуальное и среднее количества информации удовлетворяли соотношению
138
I ( X , Y ) Mi( xi , yk ) p ( xi , yk )i ( xi , yk ) .
(7.9)
i, k
Хотя равенство сумм имеет место не только при равенстве всех слагаемых, сравнение формул (7.9) и, например, (7.6) наталкивает на мысль, что мерой индивидуальной информации в дискретном случае может служить величина p( xi | yk ) p( yk | xi ) p( xi , yk ) , i ( xi , yk ) log log log p( xi ) p( yk ) p( xi ) p( yk ) а в непрерывном величина p( x | y ) p( y | x) p( x, y) , i( x, y) ln ln ln p( x) p( y ) p( x) p( y ) называемая информационной плотностью. Свойства этих величин согласуются с интуитивными представлениями (в том числе и возможная отрицательность при положительности в среднем) и, кроме того, доказана единственность меры, обладающей указанными свойствами. Полезность введения понятия индивидуального количества информации проиллюстрируем на следующем примере. Пусть по выборке (то есть совокупности наблюдений) x = (x1, ..., xn) требуется отдать предпочтение одной из конкурирующих гипотез (H1 или H0), если известны распределения наблюдений при каждой из них, то есть p(x/H0) и p(x/H1). Как обработать выборку? Из теории известно, что никакая обработка не может увеличить количества информации, содержащегося в выборке x (см. формулу (7.8)). Следовательно, выборке x нужно поставить в соответствие число, содержащее всю полезную информацию, то есть обработать выборку без потерь. Возникает мысль о том, чтобы вычислить индивидуальные количества информации в выборке x о каждой из гипотез и сравнить их: p(x / H 0 ) p(x / H1 ) p(x / H1 ) i i(x, H1 ) i(x, H 0 ) ln ln ln . p ( x) p ( x) p(x / H 0 ) Какой из гипотез отдать предпочтение, зависит теперь от величины Δi и от того, какой порог сравнения мы назначим. Оказывается, что мы получили статистическую процедуру, оптимальность которой специально доказывается в математической статистике. Данный пример иллюстрирует эвристическую силу теоретико-информационных представлений.
139
Глава 8. Дифференциальная энтропия как математическая модель сложной системы Реальные сложные системы и явления часто можно представлять в виде многомерных систем, имеющих стохастический характер поведения. Информационная энтропия позволяет исследовать протекающие в системах информационные процессы. Однако ее применение для моделирования сложных систем сталкивается с несколькими серьезными затруднениями. Перечислим их. 1. Расчет информационной энтропии требует оценки вероятностей pi элементарных состояний системы. Это требует больших выборок, для некоторых состояний статистику получить практически невозможно. 2. Требуется выделить у сложной системы фиксированное конечное множество состояний; некоторые состояния заранее могут быть вообще не известны. 3. Затруднено моделирование взаимосвязей между элементами многомерных систем. Это приводит к проблеме выбора энтропийного критерия эффективности функционирования открытых систем, так как энтропия у них может, как возрастать, так и уменьшаться. Обычно критерий эффективности задают исходя из иных общих предпосылок, не учитывающих фактическое состояние системы. 4. Не учитывается изменение дисперсии. Поэтому адекватные модели на основе информационной энтропии разработаны для частных задач [18, 38, 58, 63, 68, 80, 83].
8.1. Дифференциальная энтропия случайного вектора Приведенные ограничения могут быть разрешены за счет использования дифференциальной энтропии. Она была эвристически предложена К. Шенноном как формальный аналог понятия информационной энтропии для m-мерного непрерывного случайного вектора Y [97]
H (Y) ... pY ( x1, x2 , ..., xm ) ln pY ( x1, x2 , ..., xm )dx1dx2 ...dxm ,
(8.1)
где pY ( x1 , x2 ,, xm ) – плотность распределения случайного вектора Y. Величина (8.1) впоследствии была изучена и формализована А.Н. Колмогоровым совместно с И.М. Гельфандом и А.М. Ягломом и ими же была названа дифференциальной энтропией [22]. В частном случае для одномерной непрерывной случайной величины X дифференциальная энтропия определяется по формуле
140
H ( X ) p X ( x) ln p X ( x)dx ,
где pX(x) – плотность распределения случайной величины X. Представим сложную стохастическую систему S в виде многомерной непрерывной случайной величины Y (Y1 , Y2 , ... , Ym ) , имеющей некоторую – совместную плотность распределения pY ( x1 , x2 ,, xm ) . Каждый элемент Yi этого вектора является одномерной случайной величиной, которая характеризует функционирование соответствующего элемента исследуемой системы. Элементы могут быть как взаимозависимыми, так и не зависеть друг от друга. В [73] доказано, что если все компоненты Yi имеют дисперсии Y2i , то дифференциальная энтропия (далее энтропия) H(Y) случайного вектора Y равна m m 1 m H (Y) ln Yi i ln(1 RY2k / Y1Y2 ...Yk 1 ) , (8.2) 2 k 2 i 1 i 1 где i H (Yi / Yi ) – энтропийный показатель типа закона распределения случайной величины Yi; RY2k / Y1Y2 ...Yk 1 регрессионных зависимостей. В (8.2) первые два слагаемых m
m
m
i 1
i 1
i 1
индексы
H (Y)V H (Yi ) ln Yi i
детерминации
(8.3)
представляют собой энтропию случайного вектора с взаимно независимыми компонентами и названы энтропией хаотичности, а третье 1 m H (Y) R ln(1 RY2k / Y1Y2 ...Yk 1 ) (8.4) 2 k 2 энтропией самоорганизации. Если случайный вектор Y имеет совместное нормальное m
распределение, его энтропия хаотичности H (Y)V ln Yi m ln 2e , а i 1
1 энтропия самоорганизации H (Y) R ln R Y , где R Y определитель 2 корреляционной матрицы многомерной случайной величины Y. Согласно (8.2) энтропия H(Y) обладает триализмом. Существуют три причины ее изменения: изменение степени рассеяния ее компонент, изменение форм распределений ее компонент и изменение тесноты корреляционных связей между ее компонентами. Достоинством формулы (8.2) является то, что энтропийное моделирование многомерных стохастических систем на ее основе не требует знания или определения закона распределения многомерной 141
случайной величины Y, что практически нереализуемо в реальных задачах. При этом в отличие от методов многомерного статистического анализа, здесь не теряется формальная строгость и соответствие (8.2) реальным экспериментальным данным. Это позволяет использовать формулу (8.2) для моделирования и исследования реальных многомерных стохастических систем и процессов по экспериментальным данным ограниченного объема. При моделировании вместо (8.2) более оправданно векторное представление энтропии [74] (8.5) h(Y) (hV ; hR ) ( H (Y)V ; H (Y) R ) . Исследуем выражение (8.3) с позиции его использования в виде диагностической модели сложных стохастических систем.
8.2. Энтропия как диагностическая модель Согласно (8.2) (8.5) параметрами энтропийной модели являются: - средние квадратические отклонения Yi компонент Yi., - энтропийные показатели i законов распределений, i 1, 2, ..., m , - индексы детерминации RY2k / Y1Y2 ...Yk 1 регрессионных зависимостей между компонентами случайного вектора Y, k 2, 3, ..., m . Это конкретные показатели, характеризующие, отдельные компоненты случайного вектора, а значит, и соответствующие элементы исследуемой системы. По изменениям этих показателей на основе векторного представления (8.5) можно будет делать лаконичные и интерпретируемые выводы при условии достижения поставленных в работе целей. Диагностическая модель должна объяснять изменения, происходящие в исследуемом объектов процессе функционирования, в динамике. Рассмотрим с этих позиций энтропию случайного вектора (8.2). Пусть стохастическая система представима в виде случайного вектора Y. Тогда на основе (8.2), (8.5) можно осуществлять мониторинг состояния стохастической системы путем анализа изменения ее энтропии. Это можно сделать следующим образом. Будем считать, что два случайных вектора Y (1) (Y1(1) , Y2(1) ,..., Ym(1) ) Y ( 2) (Y1( 2) , Y2( 2 ,...,Ym( 2) ) и соответствуют предыдущему и текущему периодам функционирования системы. Считаем, что дисперсии всех компонент случайного вектора конечны. Для диагностирования состояния многомерной стохастической системы будем придерживаться следующих этапов: 1) определение поведения системы (стабильная/нестабильная), поиск зависимостей поведения системы от времени, критических значений; 2) обнаружение характера изменения в системе («хаотичность» или 142
«самоорганизация») в критических периодах; 3) на основании обнаруженной причины, проведение анализа: какой элемент системы оказался причиной изменения ее состояния; 4) формулирование вывода о влиянии изменения в системе с учетом выявленных критических моментов и причин их появления. Случай 1. Рассмотрим вначале случай, когда распределения всех соответствующих компонент Yi (1) , Yi ( 2) ( i 1, 2, ..., m ) описываются однотипными законами распределения с некоторыми параметрами положения и масштаба. Это означает, что i i(1) i( 2) . Тогда разность энтропий H (Y) H (Y ( 2) ) H (Y (1) ) определяется как m
H (Y) ln
Y ( 2 ) i
i 1
Y (1)
m
Y ( 2 )
i
где H (Y)V ln i 1
i
Y (1) i
2 1 m 1 RYk( 2 ) / Y1( 2 ) ...Yk(21) , ln 2 k 2 1 R 2(1) (1) (1)
(8.6)
Yk / Y1 ...Yk 1
2 1 m 1 RYk( 2 ) / Y1( 2 ) ...Yk(21) , H (Y) R ln . 2 k 2 1 RY2(1) / Y (1) ...Y (1) k
1
k 1
При однотипности всех пар компонент Yi , Yi вместо триализма имеем частный случай дуализма, т. е. энтропия может меняться только изза изменения рассеяния (дисперсий) компонент случайного вектора или за счет изменения тесноты корреляционной связи между этими компонентами. Вклад любой l-й компоненты в изменение энтропии хаотичности Y ( 2) H (Y)V ,l ln l , l 1, 2, , m . Y (1) (1)
( 2)
l
Поскольку
RY2m / Y1Y2 ...Ym1
RY2m / Y1Y2 ...Ym 2 ... RY2m / Y1 ,
то
предельный
индекс детерминации RY2m / Y1Y2 ...Ym1 наиболее достоверно описывает зависимость компоненты Ym от остальных (m – 1) компонент. Поэтому оценивать вклад произвольной l-й компоненты в изменение энтропии самоорганизации целесообразно через предельные значения индексов детерминации 2 1 1 RYl( 2 ) / Y1( 2 ) ...Yl(21)Yl(21) ...Ym( 2 ) , l 1, 2, , m . H (Y) R,l ln 2 1 R 2(1) (1) (1) (1) (1) Y / Y ...Y Y ...Y l
1
l 1 l 1
m
Суммарный вклад l-й компоненты в изменение энтропии случайного вектора определяется как H (Y) l H (Y)V ,l H (Y) R,l . Случай 2. Рассмотрим общий случай, когда распределения хотя бы одной пары компонент Yi (1) , Yi ( 2) не описываются однотипными законами
143
распределений. Тогда разность энтропий H (Y) H (Y ( 2) ) H (Y (1) ) равна m
H (Y) ln
Y ( 2 )
i 1 m
Y (1) i
где H (Y)V ln i 1
i
Y ( 2 ) i
Y (1) i
i( 2)
m
( i( 2) i 1
1 RY2( 2 ) / Y ( 2 ) ...Y ( 2 ) m 1 1 k k 1 , i(1) ) ln 2 2 k 2 1 RY (1) / Y (1) ...Y (1) k
m
( i( 2) i 1
1
(8.7)
k 1
1 RY2( 2 ) / Y ( 2 ) ...Y ( 2 ) m 1 1 k k 1 . i(1) ) , H (Y) R ln 2 2 k 2 1 RY (1) / Y (1) ...Y (1) k
1
k 1
i(1)
Поскольку 0 , то появляется третий фактор изменения энтропии из-за изменения типа распределения. Например, разность между энтропийными показателями нормального распределения и распределения 1 Лапласа равна ln 2e ln e 2 ln . Это изменение эквивалентно 2 e увеличению дисперсии случайной величины в / e 1,16 раз. Таким образом, случай сохранения типов законов распределений компонент случайного вектора проще реализуем и не требует определения энтропийных показателей компонент. Но нарушение этого условия может привести к значительным ошибкам в оценивании динамики энтропии, а, значит, и к снижению достоверности диагноза о состоянии системы. Отслеживая изменение H (Y) энтропии в целом и ее составляющих, можно сделать выводы о состоянии исследуемой стохастической системы и обнаружить зарождающиеся тенденции изменения состояния. Анализ изменения каждой из компонент случайного вектора Y позволит выявить те из них, которые оказали наибольшее влияние на изменение энтропии H (Y) , а значит, и на изменение состояния системы.
8.3. Энтропия как модель сложной системы Рассмотрим соответствие энтропии случайного вектора модели сложной системы. Для удобства интерпретации результатов рассмотрим случай гауссовского случайного вектора Y, т.е. (8.8) h(Y) ( H (Y)V ; H (Y) R ) , m m 1 где H (Y)V H (Yi ) ln Yi m ln 2e , H (Y) R ln R Y 2 i 1 i 1 Адекватная модель сложной системы должна объяснять ее поведение, удовлетворять общесистемным закономерностям и позволять моделировать воздействия на нее с помощью управляющих переменных. Исследуем выражение (8.8) с этих позиций [75]. 1. Наличие основных системных закономерностей. Модель (8.8) должна в том или ином виде описывать основные системные закономерности. Рассмотрим каждую их них.
144
Целостность и аддитивность. Закономерность целостности проявляется в системе в возникновении новых обобщающих качеств, не свойственных образующим ее элементам. Двумя сторонами целостности являются: - свойства системы (целого) Q не являются суммой свойств элементов n
(частей) qi: Q qi ; i 1
- свойства системы зависят от свойств ее элементов: Q f (q1 ,, qn ) . Энтропия удовлетворяет данной закономерности, поскольку m
H (Y) H (Yi ) и H (Y) f ( H (Y1 ), H (Y2 ),..., H (Ym )) . i 1
Аддитивность – двойственная по отношению к целостности закономерность, состоящая в рассмотрении целостного объекта как состоящего из частей. При абсолютной аддитивности система m
представляется распавшейся на независимые элементы, т.е. Q qi . В i 1
этом крайнем случае говорить о системе как таковой нельзя. Для энтропии: - абсолютная аддитивность (не целостность) достигается при R Y 1 , что соответствует взаимной независимости случайных величин Y1, Y2, … , Ym, в этом случае H (Y) R 0 ; - абсолютная не аддитивность (целостность) достигается при R Y 0 , что соответствует взаимной зависимости случайных величин Y1, Y2, … , Ym;, при которой индивидуальность хотя бы одного элемента системы полностью подавляется другими элементами, здесь H (Y) R . Очевидно, что любая система всегда находится между крайними состояниями абсолютной целостности и абсолютной аддитивности, и ее состояние можно охарактеризовать степенью проявления этих свойств. Энтропийная модель (8.8) это учитывает. Изолированность и коммуникативность. Закономерность изолированности состоит в том, что совокупность объектов, образующих систему, и связи между ними можно ограничить от их окружения и рассматривать изолированно. Изолированность системы может быть достигнута в условиях закрытости системы. Коммуникативность – это закономерность, двойственная относительно изолированности. Она характеризует взаимосвязанность системы со средой. В рамках энтропийного подхода изолированность означает, что система не обменивается с окружающей средой энергией, веществом и информацией, а коммуникативность – наоборот, наличие такого обмена. Очевидно, что влияние среды на систему состоит в воздействии на ее элементы, которые моделируются в виде отдельных взаимосвязанных компонент Yi случайного вектора Y. В модели (8.8) это описывается с 145
помощью изменения числовых характеристик многомерного нормального распределения – элементов ковариационной матрицы Σ Y случайного вектора Y. Идентифицируемость. Каждый элемент системы может быть отделен от других составляющих, то есть идентифицирован. Очевидно, что по имеющимся выборочным данным можно оценить все числовые характеристики каждой компоненты Yi многомерного вектора Y в рамках энтропийной модели (8.8). Множественность. Каждый элемент системы обладает собственным поведением и состоянием, отличным от поведения и состояния других элементов и системы в целом. Данная закономерность также учитывается в энтропийной модели, поскольку каждый элемент системы описывается отдельной случайной величиной. Зависимость между элементами системы является не функциональной, а статистической (корреляционной). Поэтому поведение любого элемента лишь частично зависит от других элементов системы. Наблюдаемость. Это означает, что все без исключения входы и выходы системы либо контролируемы наблюдателем, либо наблюдаемы. В данном случае каждая компонента случайного вектора моделирует конкретную подсистему, которая является наблюдаемой (имеем многомерную выборку экспериментальных данных). Неопределенность. У наблюдателя отсутствует возможность одновременно фиксировать все свойства и отношения элементов системы, он осуществляет исследование именно с целью их выявления. Действительно, это вытекает из случайности вектора Y, который моделирует поведение сложной стохастической системы S. Отображаемость и нетождественность отображения. С одной стороны, модель должна отражать все свойства и отношения исследуемой системы, которые нужны для решения задачи (отражаемость). Это проявляется в том, что каждая компонента случайного вектора Y моделирует поведение соответствующего элемента системы S. А, с другой, энтропийная модель (8.8) не тождественна исследуемому объекту (нетождественность отображения). Иерархичность системы заключается в том, что более высокий иерархический уровень оказывает направляющее воздействие на нижележащий уровень, подчиненный ему. В результате, подчиненные члены иерархии приобретают новые свойства, отсутствовавшие у них в изолированном состоянии. Данную закономерность применительно к энтропийной модели (8.8) можно интерпретировать следующим образом. Каждая компонента Yi в свою очередь может являться многомерной системой и состоять из собственных элементов, которые могут моделироваться другим случайным вектором.
146
Эквифинальность (потенциальная эффективность) характеризует предельные возможности систем. Применительно к открытой системе – это ее способность (в отличие от состояний равновесия в закрытых системах, определяемых начальными условиями) достигать не зависящего от времени требуемого состояния, за счет изменения своих параметров, независимо от исходного состояния системы. В энтропийной модели под воздействием внешней среды система за счет изменения своих параметров (элементов ковариационной матрицы) может варьировать свои свойства в пределах от абсолютно аддитивной до абсолютно целостной. Закон «необходимого разнообразия». Создаваемая система должна иметь (способна создать в себе) разнообразие не менее чем разнообразие решаемой проблемы. Применительно к энтропийной модели данная закономерность обеспечивается за счет того, что, варьируя параметры модели, можно получить любое состояние многомерной системы Y. Историчность. Любая система в процессе функционирования должна изменяться. Энтропийная модель обеспечивает данную закономерность за счет изменения своих параметров, например под воздействием внешней среды. Закономерность самоорганизации. Во всех явлениях имеет место дуализм. С одной стороны, справедлив второй закон термодинамики, то есть стремление к возрастанию энтропии, к распаду, дифференциации, а с другой, наблюдаются негэнтропийные тенденции, лежащие в основе эволюции, развития. Модель (8.8) объясняет, как рост энтропии, так и ее уменьшение. Рост (снижение) энтропии достигается за счет увеличения (уменьшения) дисперсий компонент Yi и определителя R Y корреляционной матрицы. 2. Наличие управляющих переменных. Воздействие на систему в рамках энтропийной модели осуществляется с помощью изменения параметров модели (8.8) – элементов ковариационной матрицы Σ Y случайного вектора Y. Действительно управлять значительно удобнее не дисперсиями и коэффициентами парной корреляции, а ковариациями, как однородными величинами . Напомним известные формулы: cov( X , Y ) 2 XY , X cov( X , X ) , Y2 cov(Y , Y ) , X Y где XY, cov(X, Y) – коэффициент парной линейной корреляции и ковариация между случайными величинами X и Y; X, Y – соответственно средние квадратические отклонения случайным величин X и Y. Таким образом, установили, что энтропийная модель (8.8) удовлетворяет всем признаком модели сложной системы и может использоваться для ее описания и управления. Аналогично показывается адекватность выражения (8.5) для моделирования сложных систем. 147
Замечание 8.1. Влияние энтропии на эволюцию открытых систем исследовалось в работах И.Р. Пригожина, Г. Николис (Gregoire Nicolis), И. Стенгерс (Isabelle Stengers) [52, 61, 62], Ю.Л. Климонтовича [35], Д.И. Трубецкова [72] и др. В их публикациях отмечается, что изменение открытых систем, либо ведет к деградации, либо это процесс самоорганизации, в результате которого появляются более сложные структуры. И.Р. Пригожин [61] в 1955 г. сформулировал расширенный вариант второго начала термодинамики, согласно которому полное изменение энтропии dS открытой системы нужно представлять в виде двух частей: причиной первой из них служат внутренние процессы, которые необратимы и непременно сопровождаются переходом части энергии упорядоченных процессов (кинетической энергии движущегося тела, энергии электрического тока и т.п.) в энергию неупорядоченных процессов, в конечном счете – в теплоту; вторая часть обусловлена обменом энергией и веществом между системой и окружающей средой (8.9) dS dSin dSout , где dS полное изменение энтропии открытой системы; dS in изменение энтропии в ходе процессов, происходящих в системе; dS out изменение энтропии в ходе процессов обмена со средой. Однако вопрос практического применения этой теории для исследования реальных сложных стохастических систем, например, технических, организационных, живых и т.д. не был раскрыт. Выразим изменение общей энтропии H(Y) через изменения энтропий хаотичности и самоорганизации: (8.10) H (Y) H (Y)V H (Y) R . Попробуем дать трактовку формулы (8.9) согласно (8.10). Во-первых, очевидно, что dSout H (Y) . Знак условного равенства «» используем в виду того, что в [61] рассматривалось изменение термодинамической энтропии dS. Рассмотрим влияние на энтропию процесса обмена с средой. От среды многомерная открытая система берет или отдает энергию, что можно что можно трактовать как изменение дисперсий или средних квадратических отклонений Yi . Кроме этого появление новых свойств, состояний также может возникнуть извне, от среды. Поэтому изменение вида распределения, а значит и энтропийных показателей i также обусловлено процессом обмена системы со средой, т.е. можно считать, что изменение энтропии в ходе процессов обмена со средой представляет собой изменение энтропии хаотичности, т.е. (8.11) dSout H (Y)V .
148
Элементы системы в процессе функционирования могут усиливать или ослаблять взаимодействие между собой за счет увеличения или уменьшения тесноты корреляционной связи. Следовательно, изменение энтропии в ходе процессов, происходящих в системе – это изменение энтропии самоорганизации, т.е. (8.12) dSin H (Y) R . На основе (8.11) и (8.12) можно выдвинуть следующую гипотезу. Полное изменение энтропии открытой многомерной стохастической системы состоит из суммы двух слагаемых. Первое слагаемое характеризует влияние взаимодействия системы с внешней средой и представляет собой изменение энтропии хаотичности. Второе слагаемое характеризует процессы, происходящие внутри системы, и представляет собой изменение энтропии самоорганизации. Отметим, что наряду с изменением энтропии, имеем формулы (8.3), (8.4) для нахождения энтропий хаотичности и самоорганизации. Они позволяют в статике исследовать систему в рамках энтропийной модели. Это может оказаться полезным для практического применения энтропийного моделирования, например уточнения существенных элементов системы и настройки модели. Пример 8.1. Моделирование системы, характеризующей безопасность производства [69]. Были исследованы 17 угледобывающих предприятий. По системе первичных показателей с помощью факторного анализа сформированы два обобщенных фактора (главных компонент), объясняющие 88% всей вариации исходных признаков: Y1 – фактор, характеризующий организацию безопасного производства; Y2 – фактор, отражающий профессионализм персонала. Все предприятия были разделены на две группы: 1) предприятия с низким уровнем травматизма (коэффициент частоты травмирования от 5,8 до 16,5 случаев на 1000 человек); 2) предприятия с высоким уровнем травматизма (коэффициент частоты травмирования от 21,7 до 49,7 случаев на 1000 человек. Результаты расчета по группам предприятий: H (Y (1) ) H (Y (1) )V H (Y (1) ) R 2,42 0,31 2,11. H (Y ( 2) ) H (Y ( 2) )V H (Y ( 2) ) R 3,73 0,69 3,04 . У предприятий второй группы энтропия выше, чем в первой, вызванный значительно большей величиной энтропии хаотичности ( H (Y ( 2) )V H (Y (1) )V ). Более высокий уровень риска во 2-й группе в некоторой степени компенсируется за счет более активного вмешательства руководства («административного ресурса») ( H (Y ( 2) ) R H (Y (1) ) R ).
149
Глава 9. Примеры использования методов системного анализа в экономике 9.1. Выбор решений с помощью дерева решений Рассмотрим более сложные (позиционные, или многоэтапные) решения в условиях риска. Одноэтапные игры с природой, таблицы решений удобно использовать в задачах, имеющих одно множество альтернативных решений и одно множество состояний среды. Многие задачи, однако, требуют анализа последовательности решений и состояний среды, когда одна совокупность стратегий игрока и состояний природы порождает другое состояние подобного типа. Если имеют место два или более последовательных множества решений и/или два или более множества состояний среды (то есть появляется целая цепочка решений, вытекающих одно из другого, которые соответствуют событиям, происходящим с некоторой вероятностью), используется дерево решений. Дерево решений – это графическое изображение последовательности решений и состояний среды с указанием соответствующих вероятностей и выигрышей для любых комбинаций альтернатив и состояний среды. 9.1.1. Принятие решений с применением дерева решений В постановочном плане рассмотрим несколько задач, которые могут быть решены с помощью данного метода. Пример 9.1. Разведывательное бурение скважин. Некоторая нефтяная разведывательная партия должна решить, стоит ли бурить скважины на данном участке до того, как истечет срок контракта. Для руководителей партии не ясны многие обстоятельства: - в какую сумму обойдется стоимость бурения, зависящая от качества грунта, глубины залегания нефти и т.д.; - на какие запасы нефти в этом месте можно рассчитывать; - сколько будет стоить эксплуатация скважины. В распоряжении руководства имеются объективные данные об аналогичных и не вполне похожих скважинах этого типа. При помощи сейсмической разведки можно получить дополнительную информацию, которая, однако, не дает исчерпывающих сведений о геофизической структуре разведываемого участка. Кроме того, получение сейсмической информации стоит недешево, поэтому еще до того, как будет принято окончательное решение (бурить или нет), следует определить, есть ли необходимость собирать эти сведения.
150
Пример 9.2. Выпуск нового товара. Большая химическая компания успешно завершила исследования по усовершенствованию строительной краски. Руководство компании должно решить, производить эту краску самим (и если да, то какой мощности строить завод), либо продать патент или лицензию, а также технологию независимой фирме, которая имеет дело исключительно с производством и сбытом строительной краски. Основные источники неопределенности: - рынок сбыта, который фирма может обеспечить при продаже новой краски по данной цене; - расходы на рекламу, если компания будет сама производить и продавать краску; - время, которое потребуется конкурентам, чтобы выпустить на рынок подобный товар (успеет ли компания за этот срок окупить затраты, понесенные для того, чтобы стать лидером в данной сфере производства). Компания может получить некоторые дополнительные сведения, имеющие косвенное отношение к проблемам проникновения конкурентов на рынок сбыта, опросив часть поставщиков краски. Но к материалам опросов следует относиться с осторожностью, ибо поставщики в действительности могут поступать не так, как они первоначально предполагают. В качестве подтверждения последнего суждения можно привести исследования, проведенные американскими автомобильными корпорациями для определения спроса на большие легковые автомобили. Несмотря на надвигающийся энергетический кризис 1971-1973 гг., результаты анкетирования показали, что американские покупатели попрежнему предпочитают многоместные легковые автомобили. На деле же все произошло с точностью до наоборот, и на рынке стали пользоваться спросом небольшие, экономичные машины. Такие результаты опроса могут быть частично объяснены скрытностью человеческого характера, и это должно учитываться при принятии решений. 9.1.2. Анализ и решение задач с помощью дерева решений Процесс принятия решений с помощью дерева решений в общем случае предполагает выполнение следующих пяти этапов. Этап 1. Формулирование задачи. Прежде всего необходимо отбросить не относящиеся к проблеме факторы, а среди множества оставшихся выделить существенные и несущественные. Это позволит привести описание задачи принятия решения к поддающейся анализу форме. Должны быть выполнены следующие основные процедуры: - определение возможностей сбора информации для экспериментирования и реальных действий;
151
- составление перечня событий, которые с определенной вероятностью могут произойти; - установление временного порядка расположения событий, в исходах которых содержится полезная и доступная информация, и тех последовательных действий, которые можно предпринять. Этап 2. Построение дерева решений. Этап 3. Оценки вероятностей состояний среды, то есть сопоставление шансов возникновения каждого конкретного события. Следует отметить, что указанные вероятности определяются либо на основании имеющейся статистики, либо экспертным путем. Этап 4. Установление выигрышей (или проигрышей, как выигрышей со знаком минус) для каждой возможной комбинации альтернатив (действий) и состояний среды. Этап 5. Решение задачи. Прежде чем продемонстрировать процедуру применения дерева решений, нужно ввести ряд определений. В зависимости от отношения к риску решение задачи может выполняться с позиций так называемых «объективистов» и «субъективистов». Поясним эти понятия на следующем примере. Пусть предлагается лотерея: за 100 руб. (стоимость лотерейного билета) игрок с равной вероятностью p = 0,5 может ничего не выиграть или выиграть 1000 руб. Один индивид пожалеет и 100 руб. за право участия в такой лотерее, то есть просто не купит лотерейный билет, другой готов заплатить за лотерейный билет 500 руб., а третий заплатит даже 600 руб. за возможность получить 1000 руб. (например, когда ситуация складывается так, что, только имея 1000 руб., игрок может достичь своей цели, поэтому возможная потеря последних денежных средств, а у него их ровно 600 руб., не меняет для него ситуации). Безусловным денежным эквивалентом (БДЭ) игры называется максимальная сумма денег, которую ЛПР готов заплатить за участие в игре (лотерее), или, что тоже, та минимальная сумма денег, за которую он готов отказаться от игры. Каждый индивид имеет свой БДЭ. Индивида, для которого БДЭ совпадает с ожидаемой денежной оценкой (ОДО) игры, то есть со средним выигрышем в игре (лотерее), условно называют объективистом, индивида, для которого БДЭ ОДО, субъективистом. Ожидаемая денежная оценка рассчитывается как сумма произведений размеров выигрышей на вероятности этих выигрышей. Например, для нашей лотереи ОДО = 0,50 + 0,51000 = 500 руб. Если субъективист склонен к риску, то его БДЭ > ОДО. Если не склонен, то БДЭ < ОДО. Предположим, что решения принимаются на основе объективного анализа ситуации. Рассмотрим процедуру принятия решения на примере следующей задачи.
152
Пример 9.3. Руководство некоторой компании решает, создавать ли для выпуска новой продукции крупное производство, малое предприятие или продать патент другой фирме. Размер выигрыша, который компания может получить, зависит от благоприятного или неблагоприятного состояния рынка (табл. 9.1). На основе данной таблицы выигрышей (потерь) можно построить дерево решений (рис. 9.1).
Рис. 9.1. Дерево решений без дополнительного обследования конъюнктуры рынка: решение (решение принимает игрок); * случай (решение «принимает» случай); // отвергнутое решение. Процедура принятия решения заключается в вычислении для каждой вершины дерева (при движении справа налево) ожидаемых денежных оценок, отбрасывании неперспективных ветвей и выборе ветвей, которым соответствует максимальное значение ОДО. Определим средний ожидаемый выигрыш (ОДО): - для вершины 1 ОДО1 = 0,5200000 + 0,5(–180000) = 10000 дол.; - для вершины 2 ОДО2 = 0,5100000 + 0,5(–20000) = 40000 дол.; - для вершины 3 ОДО3 = 10000 дол.
153
Таблица 9.1 Таблица выигрышей компании Номер стратегии
Выигрыш, в дол., при состоянии экономической среды*
Действия компании
благоприятном
неблагоприятном
1
Строительство крупного предприятия (a1)
200000
–180000
2
Строительство малого предприятия (a2)
100000
–20000
3
Продажа патента (a3)
10000
10000
* Вероятность благоприятного экономической среды равна 0,5.
и
неблагоприятного
состояний
Вывод. Наиболее целесообразно выбрать стратегию a2, то есть строить малое предприятие, а ветви (стратегии) a1 и a3 дерева решений можно отбросить. ОДО наилучшего решения равна 40 000 дол. Следует отметить, что наличие состояния с вероятностями 50% неудачи и 50% удачи на практике часто означает, что истинные вероятности игроку скорее всего неизвестны и он всего лишь принимает такую гипотезу (так называемое предположение «пятьдесят на пятьдесят»). Усложним рассмотренную выше задачу. Пусть перед тем, как принимать решение о строительстве, руководство компании должно определить, заказывать ли дополнительное исследование состояния рынка или нет, причем предоставляемая услуга обойдется компании в 10000 дол. Руководство понимает, что дополнительное исследование по-прежнему не способно дать точной информации, но оно поможет уточнить ожидаемые оценки конъюнктуры рынка, изменив тем самым значения вероятностей. Относительно фирмы, которой можно заказать прогноз, известно, что она способна уточнить значения вероятностей благоприятного или неблагоприятного исхода. Возможности фирмы в виде условных вероятностей благоприятности и неблагоприятности рынка сбыта представлены в табл. 8.2. Например, когда фирма утверждает, что рынок благоприятный, то с вероятностью 0,78 этот прогноз оправдывается (с вероятностью 0,22 могут возникнуть неблагоприятные условия), прогноз о неблагоприятности рынка оправдывается с вероятностью 0,73. Таблица 9.2. Условные вероятности для рынка сбыта Прогноз фирмы Благоприятный Неблагоприятный
154
Фактически благоприятный 0,78 0,27
неблагоприятный 0,22 0,73
Предположим, что фирма, которой заказали прогноз состояния рынка, утверждает: - ситуация будет благоприятной с вероятностью 0,45; - ситуация будет неблагоприятной с вероятностью 0,55. На основании дополнительных сведений можно построить новое дерево решений (рис. 9.2), где развитие событий происходит от корня дерева к исходам, а расчет прибыли выполняется от конечных состояний к начальным.
Рис. 9.2. Дерево решений при дополнительном обследовании рынка (см. условные обозначения к рис. 9.1) Анализируя дерево решений, можно сделать следующие выводы:
155
- необходимо проводить дополнительное исследование конъюнктуры рынка, поскольку это позволяет существенно уточнить принимаемое решение; - если фирма прогнозирует благоприятную ситуацию на рынке, то целесообразно строить большое предприятие (ожидаемая максимальная прибыль 116400 дол.), если прогноз неблагоприятный – малое (ожидаемая максимальная прибыль 12400 дол.). 9.1.3. Ожидаемая ценность точной информации Предположим, что консультационная фирма за определенную плату готова предоставить информацию о фактической ситуации на рынке в тот момент, когда руководству компании надлежит принять решение о масштабе производства. Принятие предложения зависит от соотношения между ожидаемой ценностью (результативностью) точной информации и величиной запрошенной платы за дополнительную (истинную) информацию, благодаря которой может быть откорректировано принятие решения, то есть первоначальное действие может быть изменено. Ожидаемая ценность точной информации о фактическом состоянии рынка равна разности между ожидаемой денежной оценкой при наличии точной информации и максимальной ожидаемой денежной оценкой при отсутствии точной информации. Рассчитаем ожидаемую ценность точной информации для примера, в котором дополнительное обследование конъюнктуры рынка не проводится. При отсутствии точной информации, как уже было показано выше, максимальная ожидаемая денежная оценка равна: ОДО = 0,5 100000 0,5 20 000 = 40000 дол. Если точная информация об истинном состоянии рынка будет благоприятной (ОДО = 200 000 дол., см. табл. 8.1), принимается решение строить крупное производство; если неблагоприятной, то наиболее целесообразное решение – продажа патента (ОДО = 10 000 дол.). Учитывая, что вероятности благоприятной и неблагоприятной ситуаций равны 0,5, значение ОДОТ.И. (ОДО точной информации) определяется выражением: ОДОТ.И. = 0,5 200000 + 0,5 10000 = 105000 дол. Тогда ожидаемая ценность точной информации равна: ОЦТ.И. = ОДОТ.И. – ОДО = 105000 - 40000 = 65000 дол. Значение ОЦТ.И. показывает, какую максимальную цену должна быть готова заплатить компания за точную информацию об истинном состоянии рынка в тот момент, когда ей это необходимо.
156
9.2. Некоторые практические результаты применения системного анализа 1. При строительстве ВАЗа предусмотрели столовые, рассчитанные на то, чтобы все рабочие смены могли пообедать одновременно. Проверено: за 18 минут в этих столовых свободно обедают сразу 30 тыс. человек. Но размеры столовых, которые должны вместить сразу 30 тыс. человек, обязаны быть огромны. Такие залы используются всего два раза в сутки. Экономично ли? С точки зрения людей, видящих перед собой только одну столовую, невыгодно, что не укладывается в сознании таких экономистовнесистемщиков, противоречит здравому смыслу. Но подойдем к вопросу с иной позиции. Будем рассматривать его не изолированно, а в комплексе, в единой системе со всем производством. При этом учтем все многообразие факторов: технических, технологических, экономических, психологических и т. п., и ради кажущейся выгоды откажемся от таких столовых. Пусть, скажем, главный конвейер останавливается на обед в одно время, а конвейер кузовного производства – в другое. Рабочая смена пройдет в столовую в две очереди, а ее зал можно уменьшить наполовину. Такое решение кажется выгодным. Однако, на тот час, когда смена с кузовного производства будет обедать, а главный конвейер работать, нужен дополнительный задел. А ведь с конвейеров завода сходит одна машина каждые 25 секунд. Каким же должен быть задел во время обеда корпусников, во что он обойдется? И где его разместить, в каких помещениях? На автозаводе все – на подвесных конвейерах в огромных корпусах. Значит, чтобы сэкономить площадь столовой, пришлось бы увеличить площадь цехов. Но здание цеха не то, что здание столовой. Цех – это мощные пролетные строения 14-метровой высоты да еще столько же в подвале, где размещаются подсобные службы. И строительство, и содержание таких помещений обойдется несравненно дороже, чем столовых. И выходит, что со всех точек зрения куда выгоднее строить столовые с расчетом на целую смену. Прийти к такому выводу помог системный подход. Как видно, системный подход не есть какое-то открытие, позволяющее делать принципиально новое, а лишь систематизация здравого смысла, объединение предметов или знаний о них путем установления существенных связей между ними. При таком синтезе требуется мудрая дальновидность, умение связывать близкие цели с дальними, технические и экономические перспективы с экологическими и социальными. 2. В Стокгольме в 1999 году была организована выставка драгоценных камней из Республики Шри Ланка. Главное внимание посетителей привлекал знаменитый голубой сапфир «Звезда Ланки» 157
массой в 392 карата. Организаторы выставки весьма оригинально решили проблему охраны столь редких экспонатов. В витрину с драгоценными камнями они поместили трех ядовитых змей. «Мы подобрали самых ядовитых, самых смертоносных и наиболее быстрых змей, – заявил шведский специалист по змеям Уле Рузенквист. – Мы их специально не кормили в течение недели, чтобы они были в форме». 3. Проведена сравнительная оценка экономической и системной эффективности. В качестве объекта приложения методики оценки выбраны электромонтажные соединения радиоэлектронной аппаратуры (РЭА). Будучи малоисследованными, они являются самыми массовыми и распространенными элементами любой технической системы. Для конкретной сравнительной оценки выбраны паяные соединения (ПС), в настоящее время наиболее распространенные в промышленности, и накрученные соединения (НС) как наиболее перспективные. Сравнительные расчеты экономической и системной эффективности ПС и НС показали, что НС по системной эффективности значительно превосходят ПС (в 12,5 раза на примере типового блока РЭА!), что и должно обусловливать их выбор в технической системе. И этот пример показывает, что системная оценка – основа принятия управленческого решения. 4. Японская компания «Сумитомо» купила обанкротившийся французский завод «Данлоп» по производству автопокрышек. «С тех пор за очень короткое время мы шагнули из века каменного в век XXI, говорит один из профсоюзных лидеров. Производительность труда возросла на 40%, вдвое сократилось число прогулов, зарплата увеличилась на 22%...» В чем же причина такого небывалого успеха? Дело в том, что в новой дирекции оказался один японец-системщик с двумя помощниками.
158
Заключение Подведем итоги. Каковы условия успешного использования системного анализа? Первым условием успеха системного анализа является применение его там, где он действительно нужен. Сам характер системного исследования сложных объектов требует высокого уровня знаний, привлечения на той или иной стадии анализа высококвалифицированных специалистов. Во-вторых, не может быть успешного системного исследования в случае недобросовестного отношения к нему руководства организациизаказчика или самих исследователей. В памфлете на современный «менеджеризм» С. Паркинсона говорится: «Всегда должно казаться странным, что промышленная корпорация, возглавляемая выдающимся президентом, управляемая опытными директорами и битком набитая руководящими работниками, известными своей компетентностью и рвением, должна призывать внешних консультантов, чтобы получить от них совет, как распределить работу между своими сотрудниками. Если директора не знают, как организовать работу, то закономерно спросить, что же они тогда знают и за что получают деньги … Тщательно проведенное исследование позволяет установить, что клиенты, обращаясь к промышленным консультантам, делают это по двум причинам. В первом случае администраторам нужны козлы отпущения, которых можно принести в жертву при проведении реорганизации, а на нее они уже решились. В другом – они хотят избежать реорганизации, которую им навязывают». Условиями успеха системного анализа следует считать наличие трех элементов: - явно понятой потребности, цели или назначения; - источника идей, накопленной информации, опыта и представления о предмете; - ресурсов – опытных специалистов, а также оборудования, материалов и денежных средств. Системный анализ является сам по себе инструментом обеспечения наличия всех этих трех элементов: выявления и детализации целей, соответствующей информации, ресурсов и их увязки с целями. Таким образом, специалисты по системному анализу должны знать условия успеха своей работы и приступать к ней только при их выполнении.
159
Список литературы 1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики: Учебник. – М.: ЮНИТИ, 1998. 2. Аксель Иванович Берг. 1893-1979 / Ред.-сост. Я.И. Фет; сост.: Е.В. Маркова, Ю.Н. Ерофеев, Ю.В. Грановский; отв. ред. А.С. Алексеев. – М.: Наука, 2007. 3. Акофф Р. Планирование в больших экономических системах: Пер. с англ. – М.: Советское радио, 1972. 4. Альтшуллер Г.С. Творчество как точная наука: теория решения изобретательских задач. – М.: Советское радио, 1979. 5. Антонов А.В. Системный анализ. ‒ М.: Высшая школа, 2004. 6. Анфилов В.С., Емельянов А.А., Кукушкин А.А. Системный анализ в управлении: Учебное пособие. –М.: Финансы и статистика, 2003. 7. Берталанфи Л. фон. История и статус общей теории систем // Системные исследования: Ежегодник: Пер. с англ. ‒ М.: Наука, 1973. С. 20–37. 8. Бешелев С.Д., Гурвич Ф.Г. Математико-статистические методы экспертных оценок. 2-е изд., перераб. и доп. – М.: Статистика, 1980. 9. Бир С. Кибернетика и управление производством: Пер. с англ. – М.: Наука. Физматлит, 1965. 10. Бир С. Мозг фирмы: Пер. с англ. – М.: Радио и связь, 1993. 11. Биргер И.А. Техническая диагностика. – М.: Наука, 1978. 12. Борель Э. Случай: Пер. с франц. – Москва-Петроград: Государственное издательство, 1923. 13. Бусленко Н.П. Моделирование сложных систем. – 2-е изд., перераб. – М.: Наука. ФИЗМАТЛИТ, 1978. 14. Вавилов А.А., Верхолат М.Е., Рубашкин И.Б. Силовые электромеханические следящие системы копировально-фрезерных станков. – М.: Машиностроение, 1964. 15. Вальд А. Последовательный анализ: Пер. с англ. – М.: ФИЗМАТЛИТ, 1960. 16. Вапник В.Н. Восстановление зависимостей по эмпирическим данным. – М.: Наука. ФИЗМАТЛИТ, 1979. 17. Венда В.Ф. Системы гибридного интеллекта: Эволюция, психология, информатика. – М.: Машиностроение, 1990. 18. Вильсон А.Дж. Энтропийные методы моделирования сложных систем: Пер. с англ. – М.: Наука. ФИЗМАТЛИТ, 1978. 19. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа. ‒ СПб: Изд-во СПбГТУ, 1999. 20. Воробьев Н.Н. Теория игр для экономистов-кибернетиков. – М.: Наука. ФИЗМАТЛИТ, 1985.
160
21. Гайдес С.А. Общая теория систем (системы и системный анализ). – М.: Глобус-Пресс, 2005. 22. Гельфанд И.М., Колмогоров А.Н., Яглом А.М. Количество информации и энтропия для непрерывных распределений // В книге: Труды III Всесоюзного математического съезда. Т.3. М.: АН СССР, 1958. С. 300–320. 23. Гинсберг К.С. Системные закономерности и теория идентификации // Автоматика и телемеханика. 2002. № 5. С. 156–170. 24. Гольдштейн Г.Я. О несистемности общей теории систем // Известия ТРТУ. 2004. № 4(39). С. 71–75. 25. Гуд Г.Х., Макол Р.Э. Системотехника: Введение в проектирование больших систем: Пер. с англ. – М.: Советское радио, 1962. 26. Денисов А.А., Колесников Д.Н. Теория больших систем управления. – М.: Энергоиздат. Ленинградское отделение, 1982. 27. Диментберг М.Ф. Нелинейные стохастические задачи механических колебаний. – М.: Наука, 1980. 28. Дубров А.М., Лагоша Б.А., Хрусталев Е.Ю. Моделирование рисковых ситуаций в экономике и бизнесе; Под ред. Б.А. Лагоши. – М.: Финансы и статистика, 2000. 29. Зорина Л.Я. Системность – качество знаний. – М.: Знание, 1976. 30. Калашников В.В. Сложные системы и методы их анализа. – М.: Знание, 1980. 31. Катковник В.Я. Непараметрическая идентификация и сглаживание данных: метод локальной аппроксимации. – М.: ФИЗМАТЛИТ, 1985. 32. Кафидов В.В. Исследование систем управления: учеб. пособие для вузов. – 2-е изд. М.: Академический проект; Екатеринбург: Деловая книга, 2005. 33. Квейд Э. Анализ сложных систем: Пер. с англ. – М.: Советское радио, 1969. 34. Клейнер Г.Б. Системное моделирование микроэкономических объектов // Системный анализ в экономике: Сб. науч. тр. ‒ Таганрог: Изд-во ТРТУ, 2001. С. 186–203. 35. Климонтович Ю.Л. Введение в физику открытых систем. ‒ М.: Янус-К, 2002. 36. Клыков Ю.И. Ситуационное управление большими системами. – М.: Энергия, 1974. 37. Кориков А.М., Павлов С.Н. Теория систем и системный анализ: учебное пособие. – М.: ИНФРА-М, 2017. 38. Королев О.Л., Куссый М.Ю., Сигал А.В. Применение энтропии при моделировании процессов принятия решений в экономике / Под ред. А.В. Сигала. – Симферополь: Издательство «ОДЖАКЪ», 2013. 39. Лопатников Л.И. Экономико-математический словарь. – 5-е изд., перераб. и доп. – М.: Дело, 2005.
161
40. Льюнг Л. Идентификация систем. Теория для пользователя: Пер. с англ. – М.: Наука. ФИЗМАТЛИТ, 1991. 41. Меерович Г.А. Эффект больших систем. – М.: Знание, 1985. 42. Методологические проблемы кибернетики: В 2-х т. – М.: МГУ, 1970. 43. Микалко М. Игры для разума. Тренинг креативного мышления. – СПб.: Питер, 2007. 44. Моисеев Н.Н. Математические задачи системного анализа. – М.: Наука. ФИЗМАТЛИТ, 1981. 45. Моисеев Н.Н. Современный рационализм. – М.: МГВП КОКС, 1995. 46. Мостапенко М.В. Философия и методы научного познания. – Л.: Лениздат, 1972. 47. Мушик Э., Мюллер П. Методы принятия технических решений: Пер. с нем. – М.: Мир, 1990. 48. Налимов В.В. Теория эксперимента. ‒ М.: Наука, 1971. 49. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение: Пер. с англ. –. М.: Наука. ФИЗМАТЛИТ, 1970. – 708 с. 50. Нечипоренко В.И. Структурный анализ систем (эффективность и надежность. – М.: Советское радио, 1977. 51. Никаноров С.П., Никитина Н.К., Теслинов А.Г. Введение в концептуальное проектирование АСУ: Анализ и синтез структур. – М.: РВСН, 1995. 52. Николис Г., Пригожин И. Самоорганизация в неравновесных системах: от диссипативных структур к упорядоченности через флуктуации: Пер. с англ. ‒ М.: Мир, 1979. 53. Одрин В.М., Картавов С.С. Морфологический анализ систем. Построение морфологических таблиц. – Киев: Наукова думка, 1977. 54. Оптнер С.Л. Системный анализ для решения деловых и промышленных проблем: Пер. с англ. – М.: Советское радио, 1969. 55. Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ: учебное пособие. – М.: Высшая школа, 1989. 56. Поваров Г.Н. Об уровнях сложности систем // Методологические проблемы кибернетики (материалы к всесоюзной конференции). М.: МГУ, 1970. Т. 2. С. 184. 57. Половинкин А.И. Основы инженерного творчества: 2-е изд., перераб. и дополн. – М.: Машиностроение, 1988. 58. Попков Ю.С. Математическая демоэкономика: Макросистемный подход. – М.: ЛЕНАНД, 2013. 59. Поспелов Г.С., Ириков В.А. Программно-целевое планирование и управление (Введение). – М.: Советское радио, 1976. 60. Прангишвили И.В. Энтропийные и другие системные закономерности: Вопросы управления сложными системами. – М.: Наука, 2003. 61. Пригожин И. Введение в термодинамику необратимых процессов: Пер с англ. Ижевск: НИЦ «Регулярная и хаотическая динамика», 2001. 162
62. Пригожин И., Стенгерс И. Порядок из хаоса: Новый диалог человека с природой: Пер. с англ. ‒ М.: Прогресс, 1986. 63. Приц А.К. Принцип стационарных состояний открытых систем и динамика популяций. – Калиниград: Калининградский государственный университет, 1974. 64. Раков В.И. Системный анализ (начальные понятия): учебное пособие. – М.: Изд. дом Академии Естествознания, 2012. 65. Растригин Л.А. Адаптация сложных систем. – Рига: Зинатне, 1981. 66. Саймон Г. Науки об искусственном: Пер. с англ. – 2-е изд. – М.: Едиториал УРСС, 2004. 67. Системный анализ и принятие решений: Словарь-справочник / Под ред. В.Н. Волковой, В.Н. Козлова. – М.: Высшая школа, 2004. 68. Скоробогатов С.М. Катастрофы и живучесть железобетонных сооружений (классификация и элементы теории). – Екатеринбург: УрГУПС, 2009. 69. Соколова И.С., Тырсин А.Н. Использование энтропийновероятностного моделирования в задачах мониторинга и управления сложными системами // Современные технологии. Системный анализ. Моделирование. 2012. № 4. С. 35–39. 70. Соловьев В.С. Теория социальных систем: В 3 томах. Том 1. Теория организации социальных систем. ‒ Новосибирск, 2005. 71. Спицнадель В.Н. Основы системного анализа: Учебное пособие. – СПб.: Изд-во «Бизнес-пресса», 2000. 72. Трубецков Д.И., Мчедлова Е.С., Красичков Л.В. Введение в теорию самоорганизации открытых систем. ‒ М.: Физматлит, 2002. 73. Тырсин А.Н. Энтропийное моделирование многомерных стохастических систем. Воронеж: Научная книга, 2016. 74. Тырсин А.Н., Геворгян Г.Г. Векторный энтропийный мониторинг и управление гауссовскими стохастическими системами // Вестник Бурятского государственного университета. Математика, информатика. 2018. № 1. С. 19‒33. 75. Тырсин А.Н., Геворгян Г.Г. Моделирование сложных систем в задачах диагностики // Научный ежегодник «Качар». ‒ Ереван: Международный научно-образовательный центр Национальной Академии Наук Республики Армения «Качар», 2017. С. 23–30. 76. Уемов А.И. Системный подход и общая теория систем. – М.: Мысль, 1978. 77. Учитель Ю.Г., Терновой А.И., Терновой К.И. Разработка управленческих решений. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2008. 78. Федоренко Н.П. Вопросы оптимального функционирования экономики. – 2-е изд. перераб. и доп. – М.: Наука, 1990. 79. Флейшман Б.С. Основы системологии. ‒ М.: Радио и связь, 1982. 163
80. Цветков О.В. Энтропийный анализ данных в физике, биологии и технике. ‒ СПб.: Издательство СПбГЭТУ «ЛЭТИ», 2016. 81. Цыгичко В.Н. Руководителю о принятии решений. – М.: Финансы и кредит, 1991. 82. Черняк Ю.И. Системный анализ в управлении экономикой. – М.: Экономика, 1975. 83. Чумак О.В. Энтропии и фракталы в анализе данных. ‒ М.-Ижевск: НИЦ «Регулярная и хаотическая динамика, Институт компьютерных исследований, 2011. 84. Шаповалов В.И. Основы теории упорядочения и самоорганизации. ‒ М.: Испо-Сервис, 2005. 85. Шеннон К. Работы по теории информации и кибернетике: Пер. с англ. – М.: Изд-во иностранной литературы, 1963. 86. Шеннон Р. Имитационное моделирование систем – искусство и наука: Пер. с англ. ‒ М.: Мир, 1978. 87. Шрейдер Ю.А., Шаров А.А. Системы и модели. М.: Радио и связь, 1982. 88. Эйкхофф П. Основы идентификации систем управления: Пер. с англ. – М.: Мир, 1975. 89. Эшби У.Р. Введение в кибернетику: Пер. с англ. ‒ М.: Издательство иностранной литературы, 1959. 90. Янг С. Системное управление организацией: Пер. с англ. – М.: Советское радио, 1972. 91. Янч Э. Прогнозирование научно-технического прогресса: Пер. с англ. ‒ М.: Прогресс, 1980. 92. Bertalanffy L. von. General System Theory: Foundations, Development, Applications. – New York: George Braziller, 1968. 93. Hartley R.V.L. Transmission of Information // Bell System Technical Journal, July 1928, pp. 535–563. 94. Lok P., Crowford J. The Application of a Diagnostic Model and Surveys in Organizational Development // Journal of Managerial Psychology. 2000. V. 15. N 2. P. 108–125. 95. Osborn A. Applied Imagination: Principles and Procedures of Creative Problem Solving. – New York: Scribner, 1953. 96. Osborn A. How to Think Up! – New York. – McGraw-Hill Book, 1942. 97. Shannon C.E. A Mathematical Theory of Communication // The Bell System Technical Journal, 1948, Vol. 27. P. 379-423, 623-656. 98. Von Neuman J., Morgenstern O. Theory of Games and Economic Behavior. – Princeton, N.J.: Princeton University Press., 1944.
164
Содержание ПРЕДИСЛОВИЕ.................................................................................................. 3 ГЛАВА 1. ПРЕДМЕТ И ЗАДАЧИ СИСТЕМНОГО АНАЛИЗА.................... 5 1.1. СИСТЕМНЫЙ АНАЛИЗ И ЕГО МЕСТО СРЕДИ ДРУГИХ НАУЧНЫХ НАПРАВЛЕНИЙ .................................................................................................... 5 1.2. ОБЛАСТИ ПРИМЕНЕНИЯ СИСТЕМНОГО АНАЛИЗА В ЭКОНОМИКЕ ................ 8 1.3. БАЗОВЫЕ ОПРЕДЕЛЕНИЯ И ОСНОВНЫЕ МОДЕЛИ СИСТЕМ ........................... 9 1.3.1. Первое определение системы. Система как средство достижения цели.......................................................................................... 9 1.3.2. Модель «черного ящика» ................................................................. 10 1.3.3. Модель состава системы................................................................ 12 1.3.4. Модель структуры системы .......................................................... 13 1.3.5. Второе определение системы. Структурная схема системы ... 14 1.3.6. Динамические модели систем ......................................................... 17 1.4. ПОНЯТИЯ, ХАРАКТЕРИЗУЮЩИЕ СТРОЕНИЕ И ФУНКЦИОНИРОВАНИЕ СИСТЕМ............................................................................................................. 18 1.5. ОСНОВНЫЕ ЗАКОНОМЕРНОСТИ СИСТЕМ ................................................... 20 1.6. КЛАССИФИКАЦИЯ СИСТЕМ ....................................................................... 23 1.7. БОЛЬШИЕ И СЛОЖНЫЕ СИСТЕМЫ .............................................................. 29 1.8. МОДЕЛИРОВАНИЕ СЛОЖНЫХ СИСТЕМ ...................................................... 36 ГЛАВА 2. ЛОГИКА И МЕТОДОЛОГИЯ СИСТЕМНОГО АНАЛИЗА ..... 40 2.1. ЛОГИЧЕСКИЕ ОСНОВЫ СИСТЕМНОГО АНАЛИЗА ........................................ 40 2.2. ПОНЯТИЕ О МЕТОДЕ И МЕТОДОЛОГИИ ...................................................... 44 2.3. КЛАССИФИКАЦИЯ МЕТОДОВ СИСТЕМНОГО АНАЛИЗА............................... 46 ГЛАВА 3. МЕТОДЫ ФОРМАЛИЗОВАННОГО ПРЕДСТАВЛЕНИЯ СИСТЕМ ............................................................................................................ 49 3.1. АНАЛИТИЧЕСКИЕ МЕТОДЫ ........................................................................ 49 3.2. СТАТИСТИЧЕСКИЕ МЕТОДЫ ...................................................................... 50 3.3. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДСТАВЛЕНИЯ ..................................... 52 3.4. ЛОГИЧЕСКИЕ МЕТОДЫ............................................................................... 54 3.5. ЛИНГВИСТИЧЕСКИЕ И СЕМИОТИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ....................... 56 3.6. ГРАФИЧЕСКИЕ ПРЕДСТАВЛЕНИЯ ............................................................... 57 ГЛАВА 4. ЭКСПЕРТНЫЕ МЕТОДЫ СИСТЕМНОГО АНАЛИЗА ............ 59 4.1. МЕТОДЫ ТИПА «МОЗГОВОЙ АТАКИ» ......................................................... 59 4.2. МЕТОДЫ ТИПА «СЦЕНАРИЕВ» ................................................................... 62 4.3. МЕТОДЫ ЭКСПЕРТНЫХ ОЦЕНОК ................................................................ 65 4.4. МЕТОДЫ ТИПА «ДЕЛЬФИ» ........................................................................ 66 165
4.5. МЕТОДЫ ТИПА «ДЕРЕВА ЦЕЛЕЙ» .............................................................. 68 4.6. МОРФОЛОГИЧЕСКИЕ МЕТОДЫ ................................................................... 69 4.7. МАТРИЧНЫЙ МЕТОД .................................................................................. 73 4.8. АССОЦИАТИВНЫЕ И АЛГОРИТМИЧЕСКИЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ .. 76 4.9. ДРУГИЕ ЭКСПЕРТНЫЕ МЕТОДЫ ................................................................. 77 ГЛАВА 5. МЕТОДИКИ СИСТЕМНОГО АНАЛИЗА ................................... 80 5.1. О РАЗРАБОТКЕ МЕТОДИКИ ......................................................................... 80 5.2. ЭТАПЫ РЕАЛИЗАЦИИ СИСТЕМНОГО АНАЛИЗА .......................................... 80 ГЛАВА 6. МЕТОДЫ ПРИНЯТИЯ РЕШЕНИЙ ............................................. 87 6.1. ОСНОВНЫЕ ПОНЯТИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ ................................... 87 6.2. ПОСТАНОВКА ЗАДАЧ ПРИНЯТИЯ ОПТИМАЛЬНЫХ РЕШЕНИЙ ..................... 88 6.3. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ КОНФЛИКТА. МАТРИЧНЫЕ ИГРЫ ....... 90 6.3.1. Основные понятия матричных игр ................................................ 91 6.3.2. Смешанные стратегии.................................................................... 95 6.3.3. Частные случаи решения задач в смешанных стратегиях ......... 97 6.3.4. Свойства решений матричных игр .............................................. 101 6.3.5. Сведение матричной игры к задаче линейного программирования .................................................................................................................... 105 6.4. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ РИСКА (СТАТИСТИЧЕСКИЕ ИГРЫ).... 106 6.4.1. Риск и его измерение ...................................................................... 106 6.4.2. Статистические игры .................................................................. 110 6.4.3. Идеальный эксперимент................................................................ 113 6.4.4. Неидеальный эксперимент ............................................................ 114 6.5. ФОРМАЛЬНАЯ СТРУКТУРА ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ ...................................................................................... 116 6.5.1. Матрица решений .......................................................................... 116 6.5.2. Оценочная функция ........................................................................ 116 6.6. КЛАССИЧЕСКИЕ КРИТЕРИИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ ...................................................................................... 118 6.6.1. Максиминный критерий Вальда ................................................... 118 6.6.2. Критерий БайесаЛапласа ........................................................... 119 6.6.3. Критерий минимаксного риска Сэвиджа .................................... 119 6.6.4. Критерий азартного игрока ......................................................... 120 6.6.5. Применение классических критериев ........................................... 121 6.7. ПРОИЗВОДНЫЕ КРИТЕРИИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ ...................................................................................... 122 6.7.1. Критерий пессимизма-оптимизма Гурвица ................................ 122 6.7.2. Критерий Ходжа–Лемана ............................................................ 123 6.7.3. Критерий Гермейера ..................................................................... 124 6.7.4. BL(MM)-критерий .......................................................................... 125 6.7.5. Критерий произведений ................................................................. 126
166
6.7.6. Применение производных критериев ........................................... 127 ГЛАВА 7. ИНФОРМАЦИОННЫЕ АСПЕКТЫ ИЗУЧЕНИЯ СИСТЕМ ... 130 7.1. СИГНАЛЫ В СИСТЕМАХ ........................................................................... 130 7.2. ИНФОРМАЦИОННАЯ ЭНТРОПИЯ .............................................................. 133 7.3. КОЛИЧЕСТВО ИНФОРМАЦИИ ................................................................... 135 7.3.1. Количество информации как мера снятой неопределённости . 135 7.3.2. Количество информации как мера соответствия случайных объектов .................................................................................................... 137 7.3.3. Единицы измерения энтропии и количества информации ........ 138 7.3.4. Количество информации в индивидуальных событиях ............. 138 ГЛАВА 8. ДИФФЕРЕНЦИАЛЬНАЯ ЭНТРОПИЯ КАК МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СЛОЖНОЙ СИСТЕМЫ ....................... 140 8.1. ДИФФЕРЕНЦИАЛЬНАЯ ЭНТРОПИЯ СЛУЧАЙНОГО ВЕКТОРА ...................... 140 8.2. ЭНТРОПИЯ КАК ДИАГНОСТИЧЕСКАЯ МОДЕЛЬ ......................................... 142 8.3. ЭНТРОПИЯ КАК МОДЕЛЬ СЛОЖНОЙ СИСТЕМЫ ........................................ 144 ГЛАВА 9. ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ МЕТОДОВ СИСТЕМНОГО АНАЛИЗА В ЭКОНОМИКЕ.......................................................................... 150 9.1. ВЫБОР РЕШЕНИЙ С ПОМОЩЬЮ ДЕРЕВА РЕШЕНИЙ .................................. 150 9.1.1. Принятие решений с применением дерева решений ................... 150 9.1.2. Анализ и решение задач с помощью дерева решений ................. 151 9.1.3. Ожидаемая ценность точной информации................................ 156 9.2. НЕКОТОРЫЕ ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ ПРИМЕНЕНИЯ СИСТЕМНОГО АНАЛИЗА......................................................................................................... 157 ЗАКЛЮЧЕНИЕ ............................................................................................... 159 СПИСОК ЛИТЕРАТУРЫ............................................................................... 160
167
Учебное издание Тырсин Александр Николаевич Системный анализ. Модели и методы Учебное пособие Издание публикуется в авторской редакции Дизайн обложки С.А. Кравец Подписано в печать 09.01.2018. Формат 60х84 1/16 Усл. печ. л. 10,5. Заказ 000. Тираж 500 экз. ООО Издательство «Научная книга» 394077, Россия, г. Воронеж, ул. 60-й Армии, 25-120 http://www.sbook.ru/ Отпечатано с готового оригинал-макета в ООО «Цифровая полиграфия» 394036, Россия, г. Воронеж, ул. Ф. Энгельса, 52 Тел. (473) 261-03-61
168