МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Оренбургский государственный университет»
С.В. МИРОНОВ, А.М. ПИЩУХИН
МЕТАСИСИСТЕМНЫЙ ПОДХОД В УПРАВЛЕНИИ МОНОГРАФИЯ
Рекомендовано к изданию Ученым Советом государственного образовательного учреждения высшего профессионального образования «Оренбургский государственный университет» в качестве научного издания
Оренбург 2004
УДК 004.94:658.01 М-73 ББК 65.050.03
Рецензент доктор технических наук, профессор, заведующий кафедрой программного обеспечения вычислительной техники и автоматизированных систем Оренбургского государственного университета Соловьев Н.А.
Миронов С.В., Пищухин А.М. М-73
Метасистемный подход в управлении: Монография. – Оренбург: ГОУ ОГУ, 2004.-
338 с.
ISBN Монография предназначена для специалистов в области системного анализа и управления. Рассмотрены как общие вопросы системного анализа, так и особенности метасистемного подхода. Книга может быть полезна аспирантам, а также студентам, как дополнительный источник по курсам: «Управление техническими системами», «Теория управления», «Введение в системный анализ», «Системы автоматизации и управления». 0605010202 М ------------6Л9-2000
ББК 65.050.03 © Миронов С.В. © Пищухин А.М. © ОГУ, 2004 г.
ISBN 2
Введение О достоинствах системного подхода написано большое количество книг, эффективность его применения доказана многочисленными примерами. Однако большинство примеров касается структурированных систем (по терминологии американского системного аналитика Джорджа Клира). И хотя часто говорят об интегрированных системах (метасистемах), достаточно серьезные исследования методологии решения типовых задач, связанных с ними, отсутствуют. Данная работа призвана, в первую очередь, заполнить этот пробел. Однако метасистема может быть определена только после того, как описаны все другие типы систем, поэтому к работе приложены необходимые сведения из системологии Дж. Клира /1/. С другой стороны, разговор о метасистемах без привязки к предметной области уведет в абстрактную математику. Нисколько не умаляя достоинств этого направления, здесь будем рассматривать метасистемный подход в конкретной области - в теории управления. Управление на верхних иерархических уровнях неизбежно выходит на некоторое множество совместно работающих систем, поэтому здесь метасистемный подход является наиболее актуальным. Метасистемы можно поделить на два больших класса: с последовательным выбором лишь одной системы, функционирующей в каждый конкретный момент времени, или некоторого подмножества параллельно функционирующих. Возможна также комбинация этих двух основных классов. В соответствии с этим разделением в работе рассмотрены особенности постановки и решения задач оптимального функционирования, а также типовые задачи, возникающие при синтезе и управлении такими метасистемами. В качестве практических областей применения рассмотренной методологии выбраны: контроль качества готовой продукции, организация медицинского обслуживания, а также выбор методики оценки уровня безопасности при эксплуатации промышленных объектов. Столь разнообразный спектр лишний раз подчеркивает широту разработанных методов, двумерность современной науки по выражению Клира. Авторы признательны рецензентам, прочитавшим рукопись и сделавшим массу полезных исправлений.
3
История зарождения науки об управлении и системах Человек поднялся над животным миром благодаря, в первую очередь, своей осознанной деятельности. Деятельность становится осознанной тогда, когда ставится конкретная цель, подбираются средства для ее достижения, осуществляются воздействия в необходимый момент времени, в определенном месте и должной интенсивности, контролируются и корректируются полученные результаты. Все это, вместе взятое, образует процесс управления. Исторически организованная деятельность людей потребовалась на самых ранних стадиях эволюции, например, при охоте и рыболовстве. Будучи мало осознанной, такая деятельность привела даже к созданию первых самодействующих устройств – автоматов в виде различного рода ловушек. Неожиданность и эффективность первых крупных результатов от организованной деятельности людей привела их на волне эйфории к созданию грандиозных и мало для чего пригодных сооружений в виде пирамид. На найденных при раскопках осколках глиняных египетских сосудов сохранились изображения способа их постройки /2/. Большая колонна рабов несла тяжелую плиту. Впереди этой колонны шли музыканты, которые музыкальным сопровождением задавали определенный темп и ритм рабам, осуществляя координацию их индивидуальных усилий. По бокам колонны шли надсмотрщики с палками (стимулами), которые подстегивали выбивающихся из общего темпа и ритма рабов. Позади колонны также шли надсмотрщики, которые добивали тех, кто не мог подняться. Подобные изображения сегодня можно трактовать как факт трансляции определенных норм процесса управления, которые по прошествии тысячелетий мало изменились. Как и тогда, первоначально задают нечто, что позволяет координировать совокупность индивидуальных усилий, дополнительно к этому обеспечивают необходимое стимулирование. Затем контролируют соответствие индивидуальных усилий заданным условиям. Если есть несоответствие, которое можно устранить, не нарушая процесса, его устраняют (регулирование). Если обнаруженное несоответствие не поддается регулированию, то освобождаются от исполнителя или его заменяют. Заметим, что публичное и неотвратимое избиение палками выбивающихся из общего темпа и ритма служило не только средством регулирования и ускоряло процесс выбывания «негодных» рабов, но и стимулировало остальных выдерживать заданные условия процесса. Но, скорее всего, эти нормы в те времена не воспринимались вне конкретного процесса строительства пирамид и поэтому вряд ли осознавались как нормы управления, по крайней мере, мы не располагаем материалами, показывающими, что у египтян существовал особый термин для обозначения феномена управления. На основании дошедших до нас исторических документов считается, что первоначально понятие управления было сформировано греками в XI – X в.в. до нашей эры. Оно обозначалось как «χυβερνητιχη» (кибернетика) и означало искусство вождения кораблей, которое было жизненно важным для раз4
вития Греции. Отметим, что корабль – пентеконтера (50 – ти весельное судно) – был самым сложным в то время техническим устройством, которое, как и многие последующие технические устройства, во многом обусловило социальные процессы того периода (по мнению М.С. Солодкой /2/). Потребности в точном измерении времени, возникшие в связи с развитием кораблевождения, привели к созданию такого распространенного автомата как часы. Автоматизация в виде механических театров, пишущей куклы, сада с поющими райскими птицами вызывала у людей восторг и восхищение. И вместе с тем, самодействие автомата могло вызывать суеверный ужас. Например, при зажигании свечи в храме открывались двери. На самом деле свеча нагревала сосуд с водой, которая перетекала в другой сосуд и своей тяжестью с помощью шнура открывала дверь. Непосвященному человеку казалось, что это действуют сверхъестественные силы. Развитие управления как науки началось с использования на производстве паровых машин. Максвеллом и Вышнеградским была развита теория регуляторов, подобных регулятору Уатта. К концу 19 века теория управления развивалась в двух аспектах: управление государством (governmant) и управление в технических системах (control). Появление фабричного производства вызвало необходимость науки об управлении предприятием (management). Отечественные ученые Сеченов, Павлов показали, что реакция животных организмов аналогична действию технических устройств (автоматов). Завершил обобщение этих разрозненных ветвей в единой теории управления, названной кибернетикой, Н. Винер. Процесс управления, как осознанное достижение цели, органично требует применения системного подхода, то есть выстраивания средств достижения цели в некоторую систему. Однако лишь развитие вычислительной техники в конце 60-ых годов 20 века привело к пониманию того, что любое явление, обращенное в цифры и введенное в компьютер, приобретает некоторые общесистемные черты, когда его конкретная физическая сущность теряется. С этого момента активно начал развиваться системный подход при изучении любых процессов и явлений.
5
1 Основные понятия и определения 1.1 Основные понятия системного анализа Основы теории систем являются наиболее общими и развились в результате интеграции знаний многих наук. Такие понятия, как система, структура, среда, состояние, информация, управление приобрели статус общенаучных /3/. Под системой первоначально будем понимать совокупность взаимосвязанных элементов, каждый из которых связан с элементами системы более тесно, чем с элементами, не входящими в систему и объединенными в качестве внешней среды. Система может выделяться исследователем из окружающего мира в соответствии с поставленной целью либо создаваться для достижения некоторой цели. Такое определение, хотя и не является строгим, все же позволяет оттенить два следующих понятия, возникающих при синтезе системы: необходимость элементов системы и их достаточность (полноту). Первое означает, что в систему включены элементы, только самые необходимые, без которых ее функционирование невозможно. Второе – что включенных в нее элементов достаточно и не нужны другие, слабо связанные с ней. С другой стороны, система должна обладать некоторым «системным» свойством, не возникающим от обычного сложения свойств составляющих ее элементов, то есть эмерджентностью. Например, отдельные детали двигателя внутреннего сгорания являются пассивными элементами, а собранные вместе образуют активный элемент – двигатель, обладающий свойством совершать механическую работу. 1.2 Основные понятия теории управления В данной работе рассматриваются особенности системного подхода применительно к управлению технологическими процессами. В связи с этим обсудим ряд относящихся сюда понятий. Любой технологический процесс осуществляется рабочими операциями и операциями управления. Соответственно замена человека в рабочих операциях называется механизацией, а замена человека в операциях управления называется автоматизацией /4/. Как видим из определения, в основе автоматизации лежит процесс управления. Управление есть целеобусловленное, целеподчинённое субъектнообъектное взаимодействие, в результате которого достигается в той или иной степени цель субъекта. Главным в процессе управления является цель. Цель – это желаемый мысленный конечный результат. Если есть цель, то начинается управление, нет цели - не может быть и управления. Цель - первична, она - основопола6
гающая всего процесса управления. Цель управления ставится человеком или группой людей, называемых субъектом управления. Для достижения поставленной цели субъект ищет средства. Под средствами понимается все, что способствует достижению цели: от орудий труда и энергетических источников до друзей, которые могут помочь. К средствам относится и последовательность операций в процессе управления (алгоритм управления). С использованием выбранных средств проводится управление и достигается результат, пусть не всегда точно соответствующий цели, а хотя бы в пределах допустимых отклонений. Такое взаимодействие ЦЕЛЬСРЕДСТВА-РЕЗУЛЬТАТ показано на рисунке 1.1. Цель
Средства
Результат
Рисунок 1.1 – Схема достижения цели Понятия: цель, средства, результат имеют существенные различия. Цель – идеальный образ, мысленная модель желаемого. Средства могут быть реальными и абстрактными; это может быть и умственная работа и вполне конкретные орудия труда, это и общественная деятельность и контроль конкретного технологического процесса и многое, многое другое. Результат – это конкретно существующее достижение (или недостижение) заданной цели. В соответствии с поставленной целью субъект управления выделяет из окружающей природы главное из средств достижения цели – объект управления и воздействует на него управляющими воздействиями, чтобы добиться определенного его состояния или поведения. При этом объект подвержен возмущающим воздействиям, которые обычно препятствуют достижению цели. Объект управления может иметь любую природу: и физическую, и химическую, и биологическую, и социальную. Естественно, что природа объекта управления в сильной степени влияет на характер процесса управления. В англоязычной литературе нет единого термина, эквивалентного нашему понятию “управление”. Там существует три самостоятельных термина: government – государственное управление, management – управление в сфере бизнеса, control – управление в технических системах. Введение различных терминов для обозначения управления различными объектами подчёркивает, что имеющиеся особенности процесса управления, являющиеся следствием различной природы объектов, весьма существенны. Объект управления может быть не только материальным (например, в случае управления роботом), но и идеальным объектом (например, при управлении проектами). В качестве объекта управления можно рассматривать технологический процесс изготовления какого-либо продукта. Таким образом, объект управления – часть объективной реальности, которую выделяет субъект в соответствии с поставленной целью управления. От объекта управления зависят средства управления. Они различны, но 7
всегда соответствуют объекту, а объект согласован с целью, то есть существует закон соответствия. В простейших случаях этот закон приводит к полной детерминированности процесса управления, то есть чёткой определённости в каждый момент времени. Например, пусть объектом управления является резервуар с жидкостью, в котором уровень жидкости может понижаться за счёт ее расхода. Цель управления будет состоять в обеспечении возможности в любой момент пользоваться этой жидкостью (например, для полива). Она характеризуется конкретным параметром – уровнем жидкости в резервуаре и, следовательно, технически формулируется постоянством этого уровня. Средство управления должно обеспечивать долив жидкости при понижении её уровня. Результат может оцениваться точностью поддержания заданного уровня. Таким образом, организация процесса управления включает постановку цели, поиск средств ее достижения и организацию их системного взаимодействия для достижения поставленной цели. Если эта задача теоретически решена, то следующим действием является правильное согласование взаимодействий в рамках модели цель – средство – результат. Рассмотрим этот аспект подробнее. 1.3 Системные составляющие процесса управления Выясним, как связано управление с рассмотренной выше схемой: цель – средство – результат. К понятию «средство» в рассматриваемой системе управления относятся: субъект управления, объект управления с действующими на него возмущениями, ресурсы управляющих воздействий. В качестве субъекта управления могут выступать и отдельный индивид, и руководящий коллектив предприятия, или даже социальная группа. В автоматических устройствах, работающих без участия человека, субъект управления присутствует, образно говоря, «незримо». Он ставит цель управления, рассчитывает алгоритм работы, создает конструкцию и отлаживает её работу. В этом случае автомат становится средством. Результат управления достигается взаимодействием субъекта с объектом, при котором каждый из них проходит свою часть пути. Поэтому управление определено выше как субъектно-объектное взаимодействие. Процесс управления заключается в деятельности субъекта, который направляет управляющие воздействия с учётом определённых запасов – ресурсов управляющих воздействий, добиваясь результата в соответствии с поставленной целью. Ресурсы управляющих воздействий – это материальные и идеальные средства, используемые субъектом управления при воздействии на объект управления для достижения его целевого состояния или поведения. В общем случае эти ресурсы управляющих воздействий могут как подводиться к объекту, так и отводиться от него. Так, для увеличения скорости вращения двигателя необходимо подвести к нему дополнительную энергию, а при уменьшении – отвести часть энергии. 8
В качестве ресурсов управляющих воздействий может быть использована, прежде всего, энергия (электрическая, механическая, тепловая и так далее), а также вещество, например, жидкость для поддержания заданного уровня или песок для приготовления цементного раствора и так далее. В качестве ресурсов может выступать даже информация. На рисунке 1.2 показана взаимосвязь элементов системы в процессе управления. Здесь указано только пять типов ресурсов управляющих воздействий, хотя их, конечно, гораздо больше. Возмущающие воздействия – это те воздействия на объект управления, которые субъект управления не может изменять по своему желанию. Условно все виды возмущающих воздействий можно разделить на три группы. Первая группа - полезная нагрузка. Обычно это основное противодействие для достижения поставленной цели. Вторая группа – внешние возмущающие воздействия среды.
Цель
Возмущающие воздействия
Субъект управления Объект управления
Процесс управления
Ресурсы управляющих воздействий
нагрузка, внешнее воздействие, внутренние помехи
Результат
Средства достижения цели управления
вещество, энергия, кадры, финансы, информация и т.д.
Рисунок 1.2 – Взаимосвязь элементов системы в процессе управления Третья группа – внутренние возмущающие воздействия, которые проявляются, прежде всего, в объекте управления, а, может быть, и в ресурсах управляющих воздействий. Суть процесса управления заключается в том, чтобы достичь цели управления, несмотря на влияние всех возмущающих воздействий на объект управления и при этом рационально использовать ресурсы управляющих 9
воздействий. Этого можно добиться различными способами, например опережением подачи управляющего воздействия. Когда субъекту управления заранее известно о наступлении какого-то вида возмущающего воздействия, то можно повысить эффективность процесса управления - можно заранее направить на объект управления управляющие воздействия. Например, зная, что завтра похолодание, заранее прогреть дом. Перед часом пик на общественном транспорте увеличить число автобусов на маршруте и так далее. На основании произведённого анализа средств, используемых в процессе управления, можно сделать следующие выводы: а) совокупность цели, средств управления, объекта с учётом возмущающих воздействий образует систему управления. Причём цель и средства управления образуют управляющую систему, а объект управления с учётом возмущающих воздействий – управляемую систему; б) система управления создаётся для достижения поставленной цели управления. При этом предусматривается рациональное использование имеющихся ресурсов; в) для успешного достижения цели управления необходимо изучить совокупность возмущающих воздействий. Более того, нужно рассмотреть систему, состоящую из внешних и внутренних возмущающих воздействий. Таким образом, рассмотрение этих вопросов с точки зрения системных понятий позволяет шире охватить всё многообразие процессов управления, глубже разобраться в их специфических особенностях, полнее и качественнее проводить синтез, то есть получать системы управления, удовлетворяющие самым высоким требованиям. 1.4 Согласованность составляющих системы и методы ее достижения Как выяснено выше, система - это совокупность элементов и взаимосвязей между ними. Можно разбить процесс синтеза системы на три этапа: этап формирования состава, этап упорядочивания и обеспечения взаимосвязи элементов, этап согласования элементов и системы в целом. Реализация первых двух этапов частично обсуждена выше и будет обсуждаться далее. Третьему этапу посвящен данный параграф. При синтезе важна цель, которую ставит исследователь, выделяя ту или иную систему, а также цель, которая достигается самой системой, если она активная (целенаправленная). Кроме того, отдельным элементом необходимо задавать внешнюю для системы среду. Таким образом, элементы, взаимосвязи и цели образуют фундаментальные составляющие системы /5/. Следующим вопросом, предъявляемым выделенной (или синтезированной) системе, является вопрос об ее эффективности. Очевидно, что система будет наиболее эффективной, если ее составляющие максимально согласованы друг с другом. 10
Связь эффективности систем с согласованностью или несогласованностью ее составляющих не вызывает сомнений и закреплена даже в пословицах и баснях (из пушки по воробьям, лебедь, рак и щука) и так далее. С древних времен известно, что хорошо согласованная армия может победить более многочисленную, но менее согласованную. В техническом плане несогласованность управляющей системы с объектом управления выражается в неустойчивости. В самой управляющей системе при распараллеливании потоков сигналов может наблюдаться «гонка сигналов», отсутствие координации различных технологических объектов может приводить к различным нарушениям (заклиниванию механизмов с несколькими приводами) или даже к авариям (несогласованность генераторов в единой энергосистеме) /6/. Систематизация при изучении любого явления требует его классификации. Согласованность, исходя из данного выше определения системы, можно разбить на три больших класса: согласованность элементов и взаимосвязей, элементов и целей, взаимосвязей и целей. Кроме того, учитывая множественный характер этих составляющих системы, можно говорить о согласованности друг с другом элементов, взаимосвязей, а также целей с подцелями. Согласованность между элементами или взаимосвязями внутри системы является локальной, в то время как согласованность элементов и взаимосвязей со свойствами системы как целого называют глобальной. Согласованность можно рассматривать в отношении пространства, времени и их комбинации. Тогда можно говорить о согласованности размеров (соразмерность), расположений (сорасположенность) или форм (соответствие форм), одновременности или разнесенности и изменении, развитии (синхронность, синфазность) во времени, взаимодействии или порядке следования каких-либо событий одновременно в пространстве и времени (координированность). Взаимоположение и взаимоподчинение элементов задается иерархической согласованностью (структуризация, организация). Классификацию можно продолжить в направлении большей конкретизации природы элементов (например, согласованность звуков - созвучие), взаимосвязей, а также содержания целей. 1.4.1 Локальная согласованность В /1/ (смотри приложение Б) понятие согласованности вводится через функцию поведения, определяемую по формуле f b : C → {0,1} , где C - множество возможных состояний переменных системы. Для получения значений функции поведения конкретного элемента необходимо находить проекцию функции поведения на множество возможных состояний C x переменных, связанных с этим элементом S x
[
]
f bx = f b ↓ S x : C x → {0,1}
Соединение двух элементов в системе задается совместными переменными, входящими в пересечение множеств переменных этих элемен11
тов S x ∩ S y . Все это позволяет сформулировать условие локальной согласованности двух элементов системы (смотри приложение) f bx ↓ S x ∩ S y = f by ↓ S x ∩ S y . Однако требовать полной согласованности элементов не всегда приемлемо, так как в этом случае речь идет о синтезе максимально детерминированной и, следовательно, максимально негибкой системы, поэтому заменим предыдущее условие другим f bx ↓ S x ∩ S y − f by ↓ S x ∩ S y = ∆( x , y ) ≤ ∆ доп , (1.1)
[
] [
[
] [
]
]
где ∆ доп - допустимая по определенному критерию несогласованность двух элементов. 1.4.2 Глобальная согласованность В этом случае согласованность рассматривается по отношению к системе как единому целому и поэтому, прежде всего, необходимо выяснить характерные свойства целостной системы. С точки зрения систем управления (целенаправленные системы) самым главным свойством составляющих является их соответствие цели, достигаемой системой. Поскольку любая система в некоторой степени может удовлетворять любой цели, введем характеристику системы (или ее составляющих) относительно цели, обычно определяемую характеристической функцией (смотри приложение) ω : X × X → [0 ,1 ] , где X - множество систем, отличающихся свойствами, определяющими понятие цели (остальные свойства совпадают), ω ( x , x * ) - представляет степень соответствия данной системы x ∈ X целевой системе (хорошей, идеальной) x * ∈ X . Характеристическую функцию конкретной системы x можно выразить через расстояния до идеальной и «наихудшей» в заданном множестве систем. ω ( x, x * ) = 1 −
где ∆ m ( x , y ) = max ∆( x , y )
∆( x , x *)
∆ m ( x, y)
,
x , y ∈X
Используя аналогичный подход, можно и степень локальной согласованности выразить в виде характеристической функции, при этом понятие идеально согласующегося элемента x * выводится из общей цели системы методом декомпозиции ∆ ( x , x max ) − ∆ ( x , x * ) ω л ( x, x ) = , ∆ ( x , x max ) *
где ∆ ( x , x max ), ∆ ( x , x * ) - максимальная и имеющаяся в данный момент рассогласованность между элементами и, соответственно, x max - максимально рассогласованный по отношению к цели системы элемент.
12
1.4.3 Методы достижения согласованности Прямое использование предложенных формул наталкивается на трудности даже в случае простейшего линейного регулятора, изображенного на рисунке 1.3. Приняв функцию поведения в виде вероятностного распределения сигналов, убеждаемся, что закон сложения дисперсий здесь не применим для функций f b1 , f b2 /7/. Происходит это из-за сильной коррелированности возмущений и управляющего сигнала.
f f b1
Wf
f b2
y Уставка
Wu
Wb
Рисунок 1.3 - Линейный регулятор При синтезе системы максимальная с точки зрения достигаемого эффекта согласованность составляющих является целью. Каковы же в таком случае имеющиеся средства достижения этой цели? Таких средств на наш взгляд три: оптимизация, адаптация и селекция. Оптимизация позволяет достигать согласованности в том случае, когда о системе, влияющих на нее факторах, а также о критериях согласованности известно почти все. Тогда можно построить целевую функцию, присоединив к ней имеющиеся ограничения и минимизировать рассогласованность составляющих вычислительными методами. В случае, когда известен лишь критерий согласованности, но неизвестны или известны неполно условия и ограничения, необходимо синтезировать адаптивную систему, которая во время своего функционирования доведет согласованность до необходимого уровня. Наконец, в случае, когда не ясны даже критерии согласованности, можно прибегнуть к селекции, то есть создать несколько систем, проследить за их функционированием, затем выбрать в каком-то смысле лучшую. Практически локальная согласованность достигается изменением параметров элементов или взаимосвязей, заменой самих элементов или взаимосвязей или вставкой промежуточных согласующих элементов, а также организацией дополнительных взаимосвязей. Глобальная согласованность требу13
ет изменения структуры системы или целевых уставок взаимосвязи отдельных элементов с дальнейшим их локальным согласованием. 1.4.4 Оптимизация согласованности Как видно из вышеприведенных рассуждений, согласованность - разносторонний признак системы. Усиление одной из сторон ведет к ослаблению другой, поэтому необходимо искать оптимум, исходя из какого-либо критерия. Рассмотрим простой пример /8/. Объект управления задан уравнением dy (t ) + y (t ) = u(t ) , y(0) = 0 dt и требуется осуществить при t ≥ 0 согласование с процессом y * (t ) = C0 1(t ) , C0 = const , T
(1.2)
где 1(t ) - функция Хевисайда. Критерием согласования в данном случае служит равенство нулю ошибки между реальным и идеальным процессами. Тогда по формуле (1.2) имеем u(t ) = C0 Tδ (t ) + C0 1(t ) , где δ (t ) - функция Дирака. Теперь очевидно, что согласование с идеальным процессом ведет к несогласованию с источником управляющего воздействия и требует компромисса в нарастании идеального процесса не быстрее, чем за время t1 (смотри 73 с. в /8/) t1 =
T u max
| C0 | − 1
.
Однако и это значение может быть не согласовано с исполнительным устройством по условию перегрузки, с объектом управления по условию износа, с экономикой системы по условию чрезмерных затрат и так далее. 1.4.5 Адаптивная согласованность В случае, когда зависимость критерия согласованности от управляющих воздействий неизвестна, можно применять пошаговое приближение к оптимуму. Если же не идентифицирован объект управления, вводится модель объекта с неизвестными параметрами, на основе наблюдений находятся оценки этих параметров, а затем вычисляется управление, оптимизирующее показатель качества, например по алгоритму Робинса-Монро u[ k + 1] = u[ k ] − γ k y[ k ] , y[ k ] = ∇J ( u[ k ]) + N [ k ] , где k - номер шага в процессе адаптации, ∇J - вектор градиента критерия согласованности, γ k - медленно убывающий коэффициент ( в соответствии с алгоритмом Робинса-Монро /9/), N [ k ] - погрешность наблюдения вектора градиента. Изменчивое поведение объекта управления и внешних воздействий может потребовать перестройки самой модели или даже структуры системы 14
управления, то есть другого уровня адаптации - синтеза самоорганизующихся и самообучающихся систем. 1.4.6 Селекция согласованных систем В том случае, когда отсутствует информация даже о критериях согласованности и система не позволяет проводить резких направленных изменений (например, биологический объект или человек), необходимо прибегать к методу «проб и ошибок», отбирать наиболее жизнеспособные элементы или даже систему в целом, развивать их и снова выбирать лучшие, то есть прибегнуть к селекции. В этом случае перспективными могут быть методы теории распознавания образов, позволяющие выявить наиболее согласованный элемент из рассматриваемой группы /10/, например, с минимальным риском. При выборе признаков, используемых для распознавания большей согласованности, можно воспользоваться критерием Горелика: F=
(
)
(
), S ( Ω ) S (Ω ) R2 Ω p , Ωq p
q
где R Ω p , Ω q - характеризует среднеквадратичное расстояние между классом систем с хорошей согласованностью Ω p и неприемлемой Ω q ,
( )
( ) - среднеквадратичный
S Ω p и S Ωq
разброс систем внутри этих двух
классов. Используя рассмотренные методы, можно предложить следующую методику синтеза согласованной системы: а) провести исследование некоторого множества составляющих системы и выявить лучшие, применяя критерий Горелика, определить признаки наиболее далеко разносящие «плохие» составляющие от «хороших»; б) на основе найденных признаков сформулировать критерии и синтезировать адаптивные системы; в) детальное исследование функционирования последних позволит выявить все недостающие сведения для постановки и решения строгой задачи оптимизации согласованности.
15
2 Особенности метасистемного подхода Сложные системы управления характеризуются явно выраженной иерархией и на верхних уровнях неизбежно выходят на некоторое множество локальных систем управления. В соответствии с системологией Джорджа Клира (смотри приложение Д) существует два способа интегрирования систем: создание структурированной системы или метасистемы. В первом случае система разбивается на подсистемы, которые в свою очередь дробятся на подсистемы второго уровня, третьего уровня и так далее. Во втором случае система формируется на основании правила замены, когда из некоторого набора систем в каждый момент выбирается одна или некоторая группа функционирующих систем. Структурированную систему характеризуют следующие признаки: - между элементами существует сильная и стабильная взаимосвязь; - в данный момент времени функционируют все элементы системы. - число элементов системы определяется по принципам полноты и достаточности; Отличия структурированной системы от метасистемы иллюстрируются рисунком 2.1.
16
Метасистемный подход характеризуется тремя существенными особенностями, коррелирующими с указанными выше признаками и отличающими его от традиционного системного. Во-первых, элементы метасистемы в большой степени самодостаточны и независимы друг от друга. Во-вторых, в метасистеме в любой момент времени функционируют не все элементы, а лишь один, либо некоторая группа, выбранных. Наконец, в метасистеме количество элементов удовлетворяет совсем другим критериям и должно быть оптимальным в соответствии с ними. Поэтому, чтобы в практической задаче доказать правомерность метасистемного подхода необходимо в первую очередь отыскать данные отличительные признаки. Примером метасистем может служить набор нескольких технологий изготовления продукции, обучения, лечения и так далее. Метасистемный подход позволяет расширить круг объектов управления в сторону возрастания сложности за счет включения в состав метасистемы управления даже разнородных регуляторов и адекватного применения процедур их замены. При этом в зависимости от природы явления, могут всякий раз выбираться либо одно технология, либо некоторая группа параллельно функционирующих. В зависимости от этого рассматриваются два класса метасистем: последовательного и параллельного действия. В соответствии с системологией Дж. Клира (смотри приложение) каждый уровень изучения систем имеет свой, характерный именно для него набор задач. Исходные системы требуют определиться со свойствами, принимаемыми к рассмотрению, процедурами их измерения, а также с базами, на которых рассматриваются изменения этих свойств. Поскольку исходные системы являются всего лишь схемой, в случае систем данных возникают задачи сопоставления реальных данных переменным и параметрам, также степени уверенности в их значениях в случае нечетких каналов измерения, а также задачи осмысления и получения этих данных, определения их полноты. Большим разнообразием отличается множество задач уровня порождающих систем, которые по сути моделируют процесс порождения данных. Здесь и задачи выбора масок, их упрощения и задачи оценки поведения систем и поиска систем с подходящим поведением, то есть задачи исследования и проектирования систем. Структурированные системы требуют решения задач проектирования систем, их идентификации и реконструкции. При проведении всех этих процедур требуется решать задачу упрощения. При метасистемном подходе необходимо решить следующие типовые задачи /11/: - выявление диапазонов эффективного функционирования систем; - оценка и повышение необходимого уровня готовности систем к использованию; 17
- выявление и обеспечение сочетаемости, согласованного взаимодействия систем; - разработка стратегии переключения отдельных или групп одновременно функционирующих систем; - оптимальное перераспределение ограниченных общесистемных ресурсов; - оптимальный синтез метасистемы. Метасистемный анализ удобнее всего начинать с выявления диапазонов оптимального функционирования систем, поскольку на их основе в дальнейшем удобно разрабатывать стратегию выбора. При решении этой задачи важно помнить, что метасистема возникает там и тогда, где и когда диапазон решаемой задачи настолько велик, что он не перекрывается использованием одной системы, либо эта система функционирует неэффективно в некоторых частях общего диапазона. Поэтому и возникает задача выявления границ, разделяющих поддиапазоны эффективного функционирования систем. Метасистема должна выбирать функционирующие системы на основе некоторой модели. Существующая модель, при которой оценивается внешний процесс и на основе этой оценки принимается решение о выборе, не учитывает внутренние процессы, проходящие в самой метасистеме. Из-за этого и возникают основные проблемы неточности срабатывания метасистемы. Рассмотрим этот аспект подробнее. 2.1 Концепция двух процессов при функционировании метасистемы Метасистема, как известно, включает несколько систем. В ней и в каждой из входящих в нее систем протекают процессы управления. Они являются ведомыми. Кроме того, всегда имеется другой процесс (протекающий во внешней среде или в объекте управления), который является ведущим для метасистемы, как изображено на рисунке 2.2. Для большей общности разрабатываемых методов необходимо рассматривать данные процессы как стохастические. Главная задача метасистемы, таким образом, заключается в согласовании двух процессов (то есть она является следящей системой управления). С одной стороны, она может выбирать (включать) одну из систем, максимизирующую некоторый критерий качества. С другой, пользуясь другим критерием, - перераспределять общесистемные ресурсы управления между функционирующими параллельно системами. Данный подход является концептуальным, поскольку, как будет показано ниже, он используется и для классификации метасистем и для оптимизации набора, входящих в метасистему систем и для оптимального управления ими при функционировании.
18
Внешний процесс (ведущий)
Устройство выбора функционирующих систем (ведомый процесс)
F
U
структура 1
Y
структура 2
ЦЕЛЬ
структура 3
• • •
• • •
• • •
структура 1
Объект управления (технологический процесс ведущий)
структура 2
Общесистемный ресурс управляющего воздействия
Рисунок 2.2 - Схема взаимодействия согласуемых метасистемой процессов 2.2 Классификация матричных систем управления Общую иерархию управления можно представить следующим образом. На самой вершине (самом высоком уровне) дерева формулируется цель управления, она разбивается на задачи, решением которых можно ее достигать. Далее для задач подбираются методы решения, для них составляется программа или алгоритм управления, включающий необходимые команды. 19
Наконец, команды разбиваются на операции с выделением функций, а по Устройство выбора задачи
Подсистема распознавания задачи
Устройство выб
Ц
М1 З1
Подсистема распознавания метода
•
•
F •
П1
К1
О1
Ф1
У1
И У
П2
К2
О2
Ф2
У2
И У
М2
U
•
СУ М1 З2
М2 М3
• •
•
• •
Y
Объ ект упра вления
И У
Рисунок 2.3 – Схема матричной системы управления следние формируют необходимые управляющие уставки. Схема такой многоуровневой системы управления приведена на рисунке 2.3.Здесь применяются следующие обозначения: Y – вектор управляемых величин, F – вектор возмущающих воздействий, U – вектор управляющих воздействий на объект управления, Ц – цель управления, СУ – субъект управления, З1,З2 – задачи, М1 - М3 – методы, П1, П2 – программы, К1,К2 – команды, О1, О2 – операции, Ф1, Ф2 – функции, У1,У2 – уставки. Буквой И обозначены исполнительные устройства. Для упрощения на схеме показано подробное решение лишь одной задачи управления, одним методом, одной программой, одной командой, одной операцией, одной функцией и двумя уставками. На схеме также показаны подсистемы выбора задачи и метода; подсистемы выбора программ, команд, операций, функций и уставок не показаны также из соображений упрощения. Как следует из схемы, для выбора задачи и метода нужна разная информация. Это и заставляет разделять подсистемы распознавания и устройства выбора. Пользуясь метасистемным подходом матричную систему управления можно определить как метасистему, в состав которой могут входить как метасистемы более низкого уровня иерархии, так и независимые системы управления. Под независимостью будем понимать независимость, в первую 20
очередь, алгоритмов функционирования систем управления. В соответствии с определением, матричные системы управления можно классифицировать в направлении обработки информации по количеству уровней иерархии, типу самого верхнего уровня, на котором производится разветвление структур, степени разветвленности выбора на каждом уровне. В поперечном направлении можно разделять матричные системы по составу входящих в нее структур (систем самого нижнего уровня), по числу источников управляющего воздействия и исполнительных устройств и по процедуре замены /12/ одной группы функционирующих систем на другую. 1) По типу самого верхнего уровня, на котором начинается ветвление структур, можно выделить следующие классы систем. Если задающие блоки обеспечивают лишь уставки для регулирования – уровень технологических режимов (множество задающих блоков = {const1, const2,…, constN}), то систему можно назвать многорежимной, и ее работа заключается в своевременном переключении или поддержании этих режимов. Такова, например, система управления сборочным автоматом, закручивающим гайки с разными моментами затяжки. Задающие блоки могут реализовывать ту или иную функцию (множество задающих блоков = {f1(), f2(),…,fN()}), и тогда система станет многофункциональной. Примером такой системы является система управления сварочным роботом. Обеспечивая функции перемещения сварочной головки во времени вдоль координат, система управления может придать ей сложную траекторию в пространстве. Задаваемые функции могут объединяться в группы и образовывать некие операторы (множество задающих блоков = {А1[], А2[],…,AN[]}), придавая тем самым системе статус многооператорной или, поскольку выполнение оператора есть операция - многооперационной. В технике совокупность нескольких функций приводит к выполнению операции (например, нагревая кольцо и сажая его прессом на деталь, будем выполнять операцию посадки с натягом). Поэтому сборочный автомат, осуществляющий несколько посадок одновременно или целую гамму посадок последовательно, можно назвать многооперационным. Операторы могут объединяться в команды, и в этом случае мы имеем дело с многокомандной системой. Сложный сборочный робот имеет свой язык команд и тем самым управляется многокомандной системой. Команды, в свою очередь, могут быть объединены в программу - в этом случае система многопрограммная (мультипрограммная). Гибкая автоматическая линия, собирающая некоторую размерную гамму какой-либо сборочной единицы, например, шестереночного насоса, может служить примером автомата с многопрограммным управлением. Программа, в свою очередь, реализует какой-либо метод управления (алгоритм или технологию). Такую систему можно назвать системой с возможностью выбора метода (технологии). Это может быть многопотоковая автоматическая линия, на которой одна и та же сборочная единица может изготавливаться по нескольким технологиям (например, литьем, ковкой или 21
механической обработкой). При выходе из строя какого-либо оборудования просто меняется технологический маршрут. С помощью методов решаются задачи, поэтому система более высокого уровня становится многозадачной. Переналаживаемая автоматическая линия является многозадачной. Роль задающих блоков в системе управления могут играть люди - субъекты. Учитывая, что субъект может ставить и менять цели, только в этом случае система управления станет многоцелевой. В такой постановке цели рассматриваются как совокупности нескольких задач. Примером может служить автоматизированная система управления сборочным цехом. Итак, многоуровневое управление включает в себя иерархию целей, задач, методов, программ, команд, операций, функций и уставок. Кроме того, внутри каждого уровня может быть дополнительное разбиение задач на подзадачи, методов на методики, программ на подпрограммы и так далее. Возможны также различные комбинации указанных типов задающих блоков с пропуском некоторых уровней. Как указано в /3/, стратификация не поддается полной формализации. Однако для автоматизации определенность в этом вопросе крайне важна. Поэтому приведенная классификация может носить рекомендательный характер и обосновываться следующими соображениями. Если система управления функционирует с объектами управления разных классов, то она явно многозадачная, так как в этом случае для каждого класса объектов необходимы свои методы, программы, команды и так далее. Если же все объекты относятся к одному классу, но диапазоны изменения признаков не могут быть перекрыты одним методом управления, необходимо объединять в систему несколько различных методов, и система становится многометодной. Метод включает в себя как набор определенных действий, так и режимы, поэтому, если в системе управления меняется и то и другое (меняется программа), то система называется многопрограммной. Если реализация методов отличается только действиями, система управления станет многокомандной, если только режимами, то – многооперационной. Режимы, в свою очередь, могут изменяться непрерывно в многофункциональной системе или дискретно в многорежимной системе. Подобная иерархия поясняется рисунком 2.4. Можно пойти и в обратном порядке. Фиксированные режимы образуют уставки, меняющиеся режимы задаются функциями, совокупность функций в математике образует оператор, совокупность операторов выполняет команду, совокупность команд складывается в программу, программы реализуют некий метод, а методы решают поставленные задачи. Наконец, решением задач достигается цель. Цель же может поменять только человек, находящийся в контуре управления. Важность выделения иерархических уровней обусловлена еще и спецификой управления в условиях разных частот возмущающих воздействий, действующих на объект управления. При этом высокочастотные возмуще22
ния, исходящие от изменения исходных свойств сырья, материалов и энергии, компенсируются нижними уровнями. Задачи верхних уровней низкочасМатричные системы управления уровень задач методы решения реализующие программы команды операции функции уставки Рисунок 2.4 – Стратификация матричных систем тотного управления решают в терминах статической оптимизации, и при этом компенсируются возмущения скачкообразного типа, источниками которых являются изменения условий поставок сырья и отгрузки продукции, ремонтно-восстановительные работы на оборудовании и так далее /13/. 2) По числу уровней в дереве задающих блоков система может быть одноуровневой и многоуровневой. При этом, как рассмотрено в /2/, можно выделить четыре подтипа таких систем, а именно одноуровневые одноцелевые, одноуровневые многоцелевые, многоуровневые одноцелевые и многоуровневые многоцелевые. В первом случае примером могут служить одинаковые сборочные автоматы в гибкой производственной системе. Во втором – несколько людей одного уровня управления. Главной особенностью здесь является отсутствие конфликтов внутри системы. Система, принадлежащая к классу многоуровневых одноцелевых, имеет несколько субъектов с собственными целями, которые не обязательно конфликтны и подчинены единой цели управления. Наконец, класс многоуровневых многоцелевых систем характеризуется наличием иерархических отношений между субъектами каждого уровня принятия решений. Продолжение классификации проводится по признакам, связанным с 23
метасистемностью. 3) По количеству источников управляющего воздействия многоуровневая система может быть с общим источником или с независимыми источниками. Примером последней может быть автоматическая линия, в которой присутствуют операции механической сборки, сварки, склейки и так далее. В этом случае источники управляющих воздействий в ветвях управления, связанных с указанными операциями, различны. 4) По количеству исполнительных устройств, входящих в многоуровневую систему, можно выделить системы с общим или с независимыми исполнительными устройствами. Системы последнего вида в теории управления названы многомерными, многокоординатными или многоканальными. Если при этом связь между воздействиями по координатам достаточно сильна, то систему называют многосвязной. Одним исполнительным устройством у нескольких линий предварительной подсборки может служить сложный сборочный робот. 5) По алгоритму работы задающих блоков (по процедурам замены) многоуровневые системы можно поделить на системы с параллельной (одновременной) работой, с последовательной (программной или цепной) работой и с произвольным выбором задающих блоков в зависимости от создавшихся условий. Примером первой системы может служить агрегатная автоматическая линия, ко второму типу систем можно отнести технологический процесс, осуществляемый на многооперационном сборочном автомате. Наконец, к третьему типу систем относятся все системы сортировки деталей перед сборкой. Пользуясь предложенным выше двухпроцессным подходом к управлению, можно ввести более тонкую классификацию. При этом первый процесс – ведущий, играет роль источника возникновения управленческих ситуаций, а второй процесс, разворачивающийся внутри матричной системы, является реакцией на первый. В зависимости от способа порождения управленческой ситуации и ответа на нее – вероятностного или детерминированного, возможны четыре класса систем. Детерминированное порождение и детерминированная реакция возможны при работе полных автоматов. В автоматической линии, например, заранее известно, в каком бункере какая деталь имеется, и алгоритм сборки из этих деталей также детерминированный. Вероятностное (случайное) порождение в сочетании с детерминированной реакцией приводит в зависимости от фиксированной или переменной (переключаемой) внутренней структуры к системам массового обслуживания или к системам с переменной структурой. Наконец, вероятностная реакция на детерминированную или вероятностную управленческую ситуацию порождает еще два класса систем, связанных с работой классифицирующих систем в режиме обучения и контроля (то есть в рабочем режиме классификации). Последние три класса объединены за счет общей теории систем случайной структуры. 24
Ввиду значительной изученности первых двух классов, в данной работе исследуются системы, принадлежащие к последним двум классам. Дальнейшее уточнение классификации по обсуждаемому признаку (по процедуре замены) включает классификацию, рассмотренную в работе /14/. Подводя итог исследованию классификации, видим, что выделение матричности систем управления позволяет провести классификацию в двух взаимно независимых направлениях: метасистемности и иерархичности, что естественно отражается на четкости выделяемых классов. Однако матрица, представляющая сложную систему управления, может быть и многомерной. Для этого достаточно дополнительно классифицировать задающие блоки на всех уровнях. Например, ввести классификацию задач по их физической сущности (или какому-либо другому признаку). В таком случае появится плоскость задач (или даже пространство n измерений), плоскость методов, плоскость программ и так далее. Конечно, матричные системы можно классифицировать по классическим признакам: по принципу управления, по типу объекта управления, по виду полученной системы управления, по применяемой в исполнительном устройстве энергии и так далее. В заключение необходимо отметить, что матричность системы не связана с какими-либо ее математическими свойствами, а лишь отражает ее внутреннее строение, относительную независимость иерархичности от метасистемности, уровней иерархии - друг от друга, так же как и составляющих систем друг от друга. Это свойство позволяет достаточно просто отлаживать, диагностировать, модернизировать такие системы 2.3 Подсистема распознавания образов Проведенная выше классификация матричных систем по уровням позволяет разделить задачу распознавания управленческой ситуации на ряд этапов, на каждом из которых анализируется своя специфичная информация. Рассмотрим эту специфику на примере обобщенной гибкой производственной системы. На первом этапе при выборе задачи анализируется состояние рынка с целью выявления ассортимента продукции, реализующейся с максимальной прибылью по имеющейся себестоимости. На втором этапе осуществляется выбор технологии изготовления выявленного ассортимента продукции. При этом анализируются запасы сырья, инструмента, наличие квалифицированного персонала и так далее. На третьем этапе выбирается конкретная программа работы оборудования в зависимости от его исходного состояния, наличия в нем инструментов и приспособлений. В дальнейшем программа выбирает команды, в которые обычно уже заложены проводимые операции, реализуемые функции и технологические режимы исполнения. На последних этапах возрастает роль локальных обратных связей при принятии управленческих решений и снижается роль опережающего управления. Кроме того, на верхних уровнях можно применять медленно действующие, но более точные методы принятия реше25
ний, тогда как на нижних уровнях все наоборот. Таким образом, на разных уровнях иерархии при распознавании и принятии управленческого решения анализируется разная информация, используются соответственно различные признаки распознавания. Под управленческой ситуацией здесь понимается /15/ совокупность всех сведений о состоянии объекта управления и внешней среды, достаточных для принятия управленческого решения (то есть включения определенной структуры адекватной данной управленческой ситуации). Формальная постановка задачи распознавания состоит в следующем /10/. Пусть задано множество объектов или явлений Ω = {ω1 ,..., ω z } (алфавит классов), а также множество возможных управлений (стратегий) L={l1,…, lk}, которые могут быть приняты по результатам решения задачи распознавания, и на основании которых множество Ω разбито на m непересекающихся классов Ap, где p=1,…, m. Известны значения признаков, которыми характеризуются управленческие ситуации, относящиеся к соответствующим классам (связанным с необходимостью включения определенных структур), обраj - значения j-го зующие априорный словарь признаков. Обозначим через x pk
признака k-го объекта p-го класса, j=1,…, n; k=1,…, kp. Горелик А.Л. ввел в рассмотрение величины S (Ω p ) =
(
)
(
),
1 1 kp kp n j j ∑ ∑ ∑ λ j x pk − x pl k p k p −1 k =1 l =1 j =1
2
(2.1)
и 1 1 k p k1 n j j R (Ω p , Ω q ) = ∑ ∑ ∑ λ j x pk − x ql k p k q k =1 l =1 j =1
2
(2.2)
которые назвал соответственно среднеквадратичным разбросом объектов внутри класса Ω p и среднеквадратичным разбросом объектов классов Ω p и
Ω q ; λ j представляют собой компоненты вектора λ = {λ1 ,..., λn } и принимают значения 1 или 0 в зависимости от того, используется ли данный признак априорного словаря в рабочем словаре. Наиболее общим предположением относительно затрат ресурсов на разработку измерительных средств системы распознавания является предположение относительно аддитивности расходов ресурсов, то есть n
C = C (λ1 ..., λn ) = ∑ C j λ j , j =1
(2.3)
где Cj – затраты на создание технического средства, предназначенного для определения j-го признака. Пусть на разработку измерительных средств системы выделены ресурn
сы, величина которых равна C0. Если C 0 ≥ ∑ C j λ j , то представляется возj =1
можность в полном объеме реализовать априорный словарь признаков. Од26
n
нако, если C 0 < ∑ C j λ j , то возникает задача разработки такого словаря приj =1
знаков, который в условиях указанных ограничений обеспечивает наибольшее значение показателя эффективности проектируемой системы распознавания. В качестве критерия эффективности в общем случае Горелик А.Л. предлагает использовать величину F = R 2 (Ω p , Ω q )/ S (Ω p )S (Ω q ) (2.4), которая характеризует отношение расстояний между классами к разбросам объектов внутри классов. Максимизировать отношение можно за счет уменьшения знаменателя, который связан с точностью измерений признаков. Этого же можно добиться увеличением числителя, который зависит от расстояния между классами и определяется информативностью используемых признаков. Многие свойства объектов по своей физической природе являются непрерывными и многомерными. Для классификации объектов неприемлемо измерение этих свойств во всем диапазоне изменения, тем более, что на больших участках эти свойства могут совпадать для объектов разных классов. Возникает проблема выбора точечных значений свойств, используемых в качестве признаков для максимально точной классификации. Ситуацию, описанную выше, рассмотрим в отношении спектральной плотности мощности (СПМ) видеоизображения различных дефектов ткани. Прежде чем применять рассмотренную далее методику /16, 17/, важно определиться с эталонами классов дефектов, то есть наиболее характерными представителями этих классов. Обычно это несложно сделать с помощью экспертного метода. Пусть экспериментальным образом определены двумерные спектральные плотности мощности для эталонов GIIэi(ωx,ωy), где i = 1,…,N (N - количество классов, учитываемых стандартом /18/). Сформируем все возможные парные сочетания и пронумеруем все пары из N классов, вводя индекс r = 1,…,k, где k = N*(N-1)/2 - равно числу сочетаний из N по 2. Найдем модули разностей двумерных спектральных плотностей мощностей сформированных пар: GIIr (ωx,ωy) = | GIIэi(ωx,ωy) - GIIэj (ωx,ωy)|, где i ≠ j, i,j = 1,…,N; r = 1,…,k . (2.5) Просуммируем эти выражения по всем парам дефектов и по всему диапазону изменения: k (2.6) ℜ(ωx,ωy) = ∑GIIr(ωx,ωy) . r=1 Образованная суммарная поверхность ℜ будет иметь впадины и возвышения, несущие информацию о суммарном расстоянии между классами дефектов. Наиболее высокие точки этой поверхности будут самыми перспективными для использования в качестве признаков при классификации. Однако большие значения суммарного расстояния могут быть обусловлены значи27
тельным удалением лишь одного или нескольких дефектов от остальной группы. Признаки, основанные на таких значениях, будут хорошо выделять только эти несколько дефектов и будут "слепы" для остальных. Для исключения таких значений введем дополнительную процедуру. В точках больших значений суммарной разности СПМ определим среднее расстояние между классами Lm : ΣGIIr(ωxm,ωym) Lm(ωxm,ωym) = -------------------, m = 1,…,S , (2.7) k m m где ωx ,ωy - частоты с большим суммарным значением двумерной спектральной плотности мощности на суммарной поверхности, S - количество больших значений, принятых во внимание. Введем в рассмотрение относительную разность значений СПМ между классами, которая будет уже безразмерной величиной: GIIr(ωxm,ωym) Lmr(ωxm,ωym) = -------------------, r = 1,…,k . (2.8) m m Lm(ωx ,ωy ) Если теперь строить гистограмму этой разности для каждого значения суммарной разности, принятого за перспективное для использования в качестве признака, она будет иметь вид I или II, как изображено на рисунке 2.5.
К о л и ч е с тв о
2 1
0 1 О тн о с и те л ь н а я р а зн о с ть
К р и в а я 1 - ги с т о гр а м м а с е л е кт и в н о го ф и л ь т р а кр и в а я 2 - ги с т о гр а м м а у н и в е р с а л ь н о го ф и л ь т р а .
Рисунок 2.5 – Гистограмма суммарных разностей Вид гистограммы II означает, что в данной сумме основной вклад имеют разности, большие среднего расстояния между классами, а оставшиеся разности меньше среднего. То есть хорошо будут классифицироваться лишь один или несколько дефектов. Таким образом, анализ гистограмм позволяет выделить значения частот, на которых классификация дефектов будет осуществляться примерно с одинаковой точностью (можно назвать признаки, осно28
ванные на значениях двумерной СПМ для этих частот, универсальными, в противоположность этому, признаки, основанные на значениях СПМ для частот, гистограмма суммарной разности для которых имеет вид II – селективными). Хотя данная методика является работоспособной, ее можно значительно упростить. Построим для этого матрицу разностей двумерной СПМ для всех эталонов дефектов (верхний индекс указывает номера эталонов): GII11 GII12 GII13 … GII1N GII21 GII22 GII23 … GII2N ……………………….. (2.9) N1 N2 N3 NN GII GII GII … GII . Эта матрица имеет нулевую диагональ, относительно которой она симметрична. Отсюда понятно, что в суммарной разности должны присутствовать только наддиагональные компоненты, что более чем в два раза уменьшит количество слагаемых. Кроме упрощения, интересен вопрос о выборе такого набора селективных признаков, которые, взаимно дополняя друг друга, образуют систему классификации более точную, чем та, что построена на основе универсальных признаков. Открытым остался вопрос о количестве универсальных признаков, принимаемых во внимание при классификации, если конечно их больше одного. Этот вопрос напрямую связан, с одной стороны, с точностью классификации, с другой, как показано выше, с затратами на измерение признаков, оптимизация набора которых рассмотрена выше. Если выделенные средства позволяют, то можно организовать дополнительную процедуру измерения размытости каждого из классов во всех найденных точках, а затем, воспользовавшись формулой (2.4), выбрать наиболее эффективное значение признака, максимизирующего критерий Горелика, еще и за счет уменьшения знаменателя. 2.4 Конечноавтоматная модель матричной системы
Дискретность матричных систем, рассмотренная выше, наводит на мысль использовать для выбора функционирующей в данный момент времени структуры модель конечного автомата. Конечный автомат, схема которого изображена на рисунке 2.5, представляет собой дискретное устройство с n входами x1,…, xn и k выходами y1,…, yk /19, 20/. Он может иметь s обратных связей, каждая из которых имеет задержку в виде элемента памяти (ЭП). Часть устройства, в которой сосредоточены элементы, реализующие контактные соединения и операции алгебры логики И, ИЛИ, НЕ и другие, образующие однотактную схему, принято называть логическим преобразователем (ЛП) устройства. На входы ЭП воздействуют сигналы, снимаемые с дополнительных (внутренних) выходов ЛП yk+1,…, yk+s. С выходов ЭП сигналы воздействуют на дополнительные (внутренние) входы ЛП xn+1,…, xn+s. 29
Каждый из входных сигналов может принимать значения из некоторого множества, чаще всего конечного. Говорят, что i-й набор значений входных сигналов, воздействующих на основные входы ЛП, образует состояние входа - ρi. При конечном множестве значений каждого входа множество состояний входа тоже конечно X = {ρ1,…, ρN}. Аналогично имеет место состояние выхода в виде множества Y= {λ1,…, λK} и внутреннее состояние S={ν0,…, νS-1}. Конечным автоматом называется /19/ упорядоченная пятерка (2.10) А = ‹ X, S, Y, S0, h ›, где S0 ⊆ S – множество начальных состояний, h – отображение (функция выходов): (2.11) S×X → 2S×Y , где использовано обозначение для множества всех подмножеств М в виМ де 2 . Кроме функции выходов, существует функция переходов φ: S×X → 2S (2.12) Через эти две функции определяют модель автомата Мили и Мура. Модель Мили описывается функцией переходов ν (t+1) = φ[ρ(t), ν(t)] и функцией выходов λ(t) = h[ρ(t), ν(t)]. (2.13) Модель Мура описывается функцией переходов (2.11) и функцией выходов λ(t) = h[ν(t)]. (2.14) При этом автомат Мура может рассматриваться как частный случай автомата Мили. Применительно к матричным системам управления, необходимо выстроить иерархию конечных автоматов, в которой верхние уровни разрешают или запрещают работу нижних уровней. Подобная схема изображена на рисунке 2.6. Черная точка на схеме означает, что у каждого автомата, кроме автомата самого верхнего уровня, имеется дополнительный вход, по которому его работа может быть заблокирована автоматом более высокого уровня. Горизонтальные параллельные линии, соединяющие вертикальные связи на схеме, обозначают, что автоматы (или локальные системы управления, именуемые далее для краткости регуляторы) включаются одновременно и работают параллельно. Таким образом, автоматы всех уровней, кроме самого нижнего, управляют работой автоматов более низкого уровня в соответствии с состояниями их входов и заложенным в логический преобразователь алгоритмом. Самый нижний уровень управляет включением регуляторов (локальных систем управления). Конечноавтоматная модель матричной системы описывается неким древовидным /20/ конечным автоматом A = {A1 , A2 ,..., An } (2.15) или A = {A1 {A11 {P1 ∧ P2 }∨ A12 {A121 {P3 }∨ A122 {P4 ∨ P5 }}}... An {Pm }}, (2.16) 30
где каждый автомат в отдельности по-прежнему описывается пятеркой x1
• • •
• • •
Логический
xn xn+1
y1
yk преобразователь • • •
• • •
xn+s
yk+1
yk+s
Элемент памяти s • • • Элемент памяти 1 Рисунок 2.6 – Схема конечного автомата Аi = ‹ Xi, Si, Yi, S0i, hi ›. (2.17) Здесь индексация автоматов показывает уровень, на котором он находится, и его порядковый номер в ряду этого уровня, знаки конъюнкции и дизъюнкции означают параллельную или последовательную работу автоматов или регуляторов. Однако формула (2.9) описывает лишь общую структуру автомата, и к ней необходимо добавить функцию перехода от автоматов более высокого уровня к автоматам более низкого уровня. Кроме того, в системе могут быть особенности, связанные с возвратом управления к автоматам более высокого уровня, которые могут ожидать конца работы автоматов более низкого уровня или прекращать их работу в произвольный момент. В последнем случае автомат более низкого уровня может все же доводить заданную программу до определенного места или сразу останавливаться. Эти особенности могут быть определены только конкретно заданной системой. Из схемы рисунка 2.7 следует, что управляющие элементы образуют «недетерминированный» граф. Этот граф можно рассматривать как представление автомата без выходов, со специальными начальными и финальны31
ми состояниями. Такие автоматы функционируют недетерминированным обКонечный автомат первого уровня
Конечный автомат второго • уровня
Регулятор
Регулятор
Конечный автомат нижнего уровня
•
•
•
Конечный автомат второго • уровня
Конечный автомат нижнего уровня
•
•
•
Регулятор
Конечный автомат второго • уровня
Объект управления Рисунок 2.7 – Иерархия автоматов в матричной системе разом, то есть при данном состоянии и данном входе состояние, которое должен принять автомат, может быть определено неоднозначно, так, что автомат может «выбирать» между возможными переходами в следующее состояние. Такие автоматы получили название недетерминированных автоматов Рабина-Скотта (НРС – автоматы) /20/. Иерархичность в таком автомате накладывает дополнительные ограничения в виде запрета переходов в со32
стояния, находящиеся на том же уровне иерархии, что и текущее или более высокое. Сведение функционирования матричных систем управления к работе конечного автомата накладывает ограничения на класс решаемых такими системами задач. Это связано, с одной стороны, с требованием к управленческим ситуациям, на которые возможна реакция системы. Последние должны быть дискретными, полностью различимыми между собой, неделимыми и независимыми друг от друга, порождаемыми последовательно друг за другом. Кроме того, алгоритмы принятия решений в автомате также должны быть строго детерминированными (формальными), а, как известно, формальная логика ограничена, и эти решения не всегда будут адекватны управленческой ситуации. Для выхода из этого положения необходимо перейти от детерминированного включения структур к вероятностному, и применять при принятии решений теорию нечетких множеств Заде. Из этой модели также следует, что агрегированный конечный автомат забирает на себя выполнение всех опосредованных функций управления: логику распознавания управленческой ситуации и логику принятия решения. В то же время, непосредственные функции управления, от которых зависят все технико-экономические показатели управления, в первую очередь интересные с точки зрения автоматизации, реализуются локальными независимыми системами управления (регуляторами). Последние образуют совокупность структур в матричной системе, то есть отвечают за метасистемность. Именно поэтому далее в работе основное внимание уделено исследованию метасистемности систем управления. 2.5 Метасистемность матричных систем
Определяя главное в классификации метасистем, описанной ранее, остановимся на последнем признаке классификации: по алгоритму работы задающих блоков или по процедурам замены одной структуры другой. Отдельные структурные ветви могут работать одновременно, то есть параллельно или последовательно, подчиняясь тому или другому закону их выбора. Не исключена также комбинация этих двух способов. Структуры при параллельной работе должны быть поэлементно максимально независимы друг от друга. Объединяют же их общесистемные ресурсы управляющих воздействий. Поэтому доступ к этим ресурсам должен быть дозирован, синхронизирован, скоординирован, то есть максимально согласован для каждой структурной ветви. Строго говоря, в таких системах могут быть совместно используемые элементы, но тогда к ним необходимо относиться так же, как к общим ресурсам, то есть строго согласовывать их использование, избегая конфликтов между параллельно работающими структурами. При последовательной работе выбранная в данный момент структура единовластно пользуется ресурсами управляющих воздействий, а также может пользоваться элементами из других структур, так как они в это время все 33
равно «простаивают». Имеет место перекрытие структур (рисунок 2.7). Это перекрытие для двух структур может быть оценено коэффициентом структурного перекрытия второй структуры по отношению к первой с12 K c12 = п , (2.18) K1 где Кп – количество совместно используемых элементов структур, К1 – общее количество элементов в первой структуре. При этом обе величины могут оцениваться и в стоимостном выражении. Если в метасистеме n ветвей, то характеристикой количества совместно используемых элементов будет уже матрица структурного перекрытия
c11, c12,...c1n c , c ,...c C = 21 22 2n . L cn1, cn2 ,...cnn
(2.19)
Диагональные коэффициенты этой матрицы единичные, а все остальные могут быть равны или меньше единицы. Ясно, что приближение коэффициентов матрицы к единице повышает загруженность элементов системы, уменьшает суммарную ее стоимость и сложность. Следовательно, при проектировании новой метасистемы необходимо добиваться как можно большего значения суммы всех коэффициентов этой матрицы n n
∑ ∑ cij → max .
(2.20)
i =1 j =1
Ограничения в данной задаче будут обусловлены применяемой технологией. Очевидно, для параллельных метасистем необходимо также найти характеристику, отражающую степень участия каждой структуры в распределении общих ресурсов управления (рисунок 2.8). Однако сама доля используемых ресурсов (при этом ресурсы, используемые в каждой структуре для обеспечения возможности сравнения, должны быть приведены к одинаковым единицам измерения) не является мерой полезности структуры с точки зрения метасистемы. В связи с заявленной целью исследования необходимо разработать метод, оценивающий влияние этой доли на точность управляемой данной структурой величины, а также найти критерий оптимальной точности управ-
34
Подсистема знавания
распо-
F
структура 1
структура 2
ЦЕЛЬ
структура 3
• • •
• • •
• • •
Объект управления
структура n
Ресурс управляющего воздействия
структура 1
структура 2
Ц
• •
• •
Объект
управления
• •
структура n
Ресурс управляющего воздействия
Рисунок 2.8 – Схема метасистем последовательного и параллельного действия
35
ляемой величины в каждой структуре, максимизирующей метасистемную целевую функцию. Очевидно показателем точности управляемой величины может служить ее дисперсия относительно заданной уставки (или заданного закона ее изменения). Для обеспечения возможности сравнения необходимо взять безразмерные дисперсии управляемых величин в каждой структуре, для чего текущее значение дисперсии можно отнести к «норме», взятой из требований технологического процесса. Полученное отношение будет отражать потери, возникающие от недостатка ресурсов управления этой величиной. Однако, влияние каждой управляемой величины на целевую функцию метасистемы может быть различным (допустима даже большая дисперсия некоторых из управляемых величин). Чтобы учесть этот факт, умножим относительную дисперсию данной управляемой величины (за управление которой ответственна одна из составляющих систем метасистемы) на коэффициент ее значимости, определенный, например, экспертами. Назовем полученную в результате величину «потерей» от дисперсии управляемой величины. Располагая потери, например, в порядке их увеличения, получим диаграмму следующего вида (рисунок 2.9). Y (потери от дисперсий)
1 2 3 4 5 6 7 8
x (№ управл. величины)
Рисунок 2.9 – Диаграмма потерь от дисперсий управляемых величин Изменения этой диаграммы во времени могут служить характеристикой интенсивности протекающих перераспределительных процессов в метасистеме управления. Очевидно, что в хорошо работающей системе потери от дисперсий (Di) должны быть примерно одинаковы, а суммарная занимаемая ими площадь должна быть минимальной. n
∑ α i Di → min .
i =1
где αi – коэффициенты ранжирования. 36
(2.21)
Ограничения в этой задаче будут обусловлены как применяемой технологией, так и величиной общесистемных ресурсов. Это обстоятельство необходимо иметь в виду при синтезе метасистемы параллельного действия. Очевидно, эти два свойства: возможность перекрытия последовательно работающих структур и возможность перераспределения управляющих ресурсов с «сильных» структур на «слабые» - эмерджентны (то есть появляются только при объединении элементов в систему). Они придают дополнительный смысл агрегированию локальных систем автоматики в единую мета систему, увеличивая их общую эффективность. Больше того, полное снятие управляющих ресурсов со всех систем, кроме одной, превращает параллельную метасистему в последовательную, а полное перекрытие одной системы другой приводит к обратному результату. 2.6 Модель функционирования метасистемы как системы массового обслуживания
В условиях рынка стратегические аспекты деятельности строительных организаций (планирование пакета технологий, объёмов производимой продукции, используемых ресурсов) приобретают особую актуальность. Строительная фирма не может специализироваться только на одной строительной технологии (при условии, что она не является в этой отрасли монополистом), ввиду наличия конкурентов, а также крайней неравномерности и неоднородности поступающих заказов. Она вынуждена решать задачу об оптимальной специализации в области строительных технологий. Каждую технологию можно представить в виде некоторой системы довольно независимой от других систем (технологий), освоенных фирмой. Следовательно, совокупность технологий фирмы (пакет технологий), образует метасистему. Выбор и функционирование конкретной реализуемой технологии в каждый момент времени в этой метасистеме диктует рынок строительных работ и услуг посредством заявок или заказов. Технологии, используемые для производства продукции, не пользующейся спросом, убыточны для фирмы и наоборот, востребованные на рынке технологии должны быть срочно освоены фирмой, при условии наличия у нее необходимых ресурсов. Для качественного и эффективного строительства необходимо наличие производственно-технической базы, квалифицированного персонала, способности ведения больших объемов работ и возможности вложения значительных средств и ресурсов. И поскольку любое строительство сопряжено со значительными вложениями средств, имеется немалая доля риска. В этой связи правильная стратегия строительной фирмы приобретает принципиальное значение: от эффективности действия той или иной модели, используемой для выработки этой стратегии, зависит функционирование и развитие организации в целом, расширение ее деятельности на рынке услуг. Правиль37
Спрос на продукцию
но выбранная модель улучшает экономические показатели работы, поэтому при выборе ее типа требуется строгое обоснование. Математическую модель легче всего построить при условии подчинения объемов поступающих заказов требованию марковости. В этом случае вероятности превышения рыночным спросом некоторых уровней, начиная с которых строительной фирме целесообразно осваивать новую технологию (смотри рисунок 2.10, на котором S – объемы спроса, T – период поступления заказов), описываются уравнениями Колмогорова. Доход фирмы от выпуска n видов продукции за время Т составит: cv c v cv Д= ( 1 1 + 2 2 + ... + n n )T (2.22). t1 t2 tn
t1 t2
S1
S2
S1
S1
S2
Время Рисунок 2.10 – Схема превышения спросом уровня целесообразности Используя статистическую информацию о поведении рынка, можно математически оценить (для каждого вида строительной продукции либо услуг) среднее время между всплесками спроса (ti), среднюю «высоту» всплесков и их среднюю длительность по формулам случайных процессов /21/. Перемножая последние два параметра, можно оценить средний объем одного всплеска (vi) и, умножая этот объем на цену единицы продукции или услуги (сi), перевести эту оценку в денежную форму. Находя количество всплесков в единицу времени (величина обратная среднему времени между всплесками спроса), можно оценить доход (за месяц, за год и т.д.). За это же время Т фирма производит расходы (даже если не осуществляет никакой деятельности), связанные с доходом, со скоростью γ(Д). Чтобы фирма не разорилась, должно выполняться неравенство cv c v c v ( 1 1 + 2 2 + ... + n n )T ≥ γ (Д )T (2.23). t1 t2 tn 38
С другой стороны, вновь осваиваемая (n+1)-я технология требует первоначальных капитальных вложений (К), а также учета срока окупаемости (Ток) и эксплуатационных расходов (Э). Поэтому должно выполняться следующее неравенство: cn+1vn+1 n+1 Tok ≥ K n+1 + Эn+1Tokn+1 (2.24) t n+1 Оценка технологий применяемых предприятием, по выше приведенным формулам, может потребовать такой их производительности, которая будет не по силам даже крупной фирме. К тому же при простое более производительного оборудования убытки фирмы будут возрастать пропорционально производительности. Очевидно, необходима оптимизация производительности каждой из технологий для заданного состояния рынка. Поскольку выполнение заказов связанно с многократным исполнением однотипных задач и операций, можно применить для описания процесса обслуживания заказов (функционирования метасистемы) модель системы массового обслуживания (СМО). Предприятие обладает n технологиями для выполнения ряда работ и производства продукции. Каждому типу работ соответствует своя технология и работа не может быть выполнена с использованием другой. Применяя принцип суперпозиции поступающих заявок, можно рассматривать реализацию той или иной технологии раздельно, а предприятие как совокупность одноканальных СМО с отказом (смотри рисунок 2.11). Функционирование СМО выглядит следующим образом: - входящий поток заявок в систему является простейшим по каждому каналу (пуассоновским); - на вход поступают заявки с частотой λi; - производительность технологий µ1, µ2, µ3,…, µn; - вероятность одновременного появления k разнородных заявок /22/:
P1,2,3...k(t) = (1− e−л1t ) ⋅ (1− e−л2t ) ⋅ (1− e−л3t ) ⋅ ...⋅ (1− e−лk t ) ⋅ et(−лk+1 −лk+2 −лk+3 −...−лn−1 −лn ) . Для оценки качества работы модели будем использовать суммарные потери в единицу времени n n (2.25), α = ∑ mi ⋅ zi + ∑ ( ξ i ⋅si ) i =1 i =1 где m – число потерянных заявок; n – число имеющихся технологий; zi – стоимость потерянной заявки; ξi – время простоя i-ой технологии; si – стоимость простоя технологии в единицу времени. Считая количество отказов пропорциональным вероятности отказа заявке, а потери от простоя технологии пропорциональными её производительности с коэффициентом α получаем:
mi лi + б i мi . лi + мi 39
ЦЕЛЬ -
максимизация прибыли
Поток заявок на строительную продукцию с интенсивностью λ
Оптимальное перераспределение общесистемных ресурсов
Строительная технология 1
Строительная технология 2
Объект управления – процесс производства строительной продукции
Строительная технология n
Общесистемные ресурсы, необходимые для обеспечения заданной производительности технологий Рисунок 2.11 – Модель формирования процесса производства строительной продукции и услуг 40
mi лi d + б i мi → min имеОптимизируя полученное выражение dм лi + мi − mi лi
+ б i = 0 , так как нас интересуют только положительные значе2 (лi + мi ) ния, то оптимальное значение:
ем
µ = −λ +
m
α
λ
(2.26).
График зависимости производительности технологии от интенсивности заказов и соотношения m/α демонстрирует (смотри рисунок 2.12), что минимально допустимая производительность существует при
m > λ , то есть стоиα
мость потерянных заявок должна превосходить стоимость простоя в величину λ. Отсюда следует простая методика выявления целесообразности включения технологии в пакет технологий предприятия. Имея модель функционирования строительного предприятия, необходимо создать оптимальный пакет технологий. Для выполнения этой задачи нужно перебрать востребованные рынком технологии и найти наиболее эффективные по предложенному критерию. Стратегия деятельности предприятия может быть построена с помощью обработки большого количества статистического материала, и прогнозирования. Разработка подобной стратегии наиболее удобна и занимает меньше времени при использовании специальных программных средств, а именно системы поддержки принятия решения. Выводы по второму разделу 1 Сложные системы управления необходимо рассматривать как метасистемы. Такой подход позволяет расширить круг объектов управления в сторону возрастания сложности за счет включения в состав метасистемы управления даже разнородных регуляторов и адекватного применения процедур их замены. 2 Концепция двух стохастических процессов, связанных с метасистемой управления, позволяет свести задачи построения и оптимального управления к задачам согласования данных процессов на основе вероятностных критериев качества. 3 В сложных системах управления целесообразно выявить их матричность – послойное строение в двух взаимно независимых направлениях: иерархичности и метасистемности. Это упрощает задачи построения, отладки и оптимального управления в таких системах. Классификация, проведенная в этих направлениях, дает максимально отчетливое разделение видов матричных систем управления. 4 Дискретность матричных систем управления позволяет организовать ее функционирование на основе иерархического конечного автомата Рабина41
Рисунок 2.12 – Поверхность оптимальных решений Скотта. 5 Конечный автомат в матричной системе управления, взяв на себя логику распознавания управленческой ситуации и принятия решения, выполняет опосредованные функции управления и обусловливает иерархичность. Непосредственное управление, определяющее основные технико-экономические показатели системы и, следовательно, наиболее важные для решения вопросов автоматизации, выполняется нижним уровнем – набором конкретных регуляторов. 6 Перекрытие структур в метасистемах последовательного действия и перераспределение общих управляющих ресурсов в метасистемах параллельного действия являются эмерджентными свойствами этих систем. Усиление одного из них при ослаблении другого приводит к смене типа метасистемы. 7 В достаточно сложных системах имеются центры наибольшей реакции на происходящие внутри или вне процессы. Значения параметров в этих центрах резко изменяются по величине, и потому использование этих параметров в качестве признаков для распознавания процессов наиболее эффективно. (пример действия синергетического принципа в системологии). 8 Модель функционирования метасистемы в виде системы массового обслуживания позволяет довести согласование двух процессов до конкретных оптимальных значений производительности каждой из систем в метасистеме.
42
3 Синтез метасистем 3.1 Постановка задачи
Задача проектирования системы автоматизации является в общем случае сложной. При ее решении целесообразно проводить декомпозицию. В /23/ выделяется четыре иерархических уровня: экономический, технологический, структурный (алгоритмический) и параметрический (технический). По нашему мнению, эту декомпозицию необходимо дополнить еще одним уровнем – социальным, поскольку при автоматизации в первую очередь должны учитываться гуманитарные, юридические, экологические и ряд других социальных аспектов, которые могут обесценить результаты автоматизации. На экономическом уровне ставятся и решаются задачи оптимизации экономических показателей. На технологическом уровне решаются задачи оптимизации технологии. Структурный уровень (в теории управления структурная схема тесно связана с алгоритмом управления, поэтому этот уровень можно назвать также алгоритмическим) связан с решением задач выработки алгоритмов оптимального управления технологическими процессами. Наконец, параметрический уровень решает задачи параметрической оптимизации системы управления. При этом критерии оптимального синтеза выявляются на более высоком уровне иерархии, а используются на более низком уровне. В настоящее время практически единственной теорией автоматизации, которая охватывает все указанные уровни проектирования, является теория производительности общественного труда Шаумяна, сформулированная им еще в 1932-1933 гг. /24/. Её сущностью является коэффициент повышения производительности общественного труда, равный отношению произведённой продукции к затратам, связанным с её изготовлением. Эта теория позволяет не только довести проектирование до расчёта технологических параметров и требуемой надёжности применяемого оборудования, но даже наметить три перспективы автоматизации: снижение затрат “живого труда”, снижение стоимости оборудования и повышение производительности технологического оборудования. Однако, данная теория справедлива лишь для так называемой “жёсткой” автоматизации и для реализации только экономически обоснованных систем автоматизации и не годится для расчета гибких производственных систем, а также систем автоматизации, целесообразность которых обусловлена социальным эффектом и эффектом придания человеку новых качеств. В настоящее время компьютер становится главным средством автоматизации. Его возрастающие возможности по охвату всего производственного процесса в целом позволяют говорить о компьютерно-интегрированном производстве (Computer Integrated Manufacture - CIM). При этом в качестве объ43
екта, на который нацелено производство, можно рассматривать рынок, как изображено на рисунке 3.1. Из схемы видно, что компьютерно-интегрированное производство следит за состоянием рынка (за ценами на разные виды продукции) и за действующими на него возмущениями (колебание курса валюты, изменение вкусов потребителей, технический прогресс), быстро перестраивает производст-
Компьютерноинтегрированное производство (CIM)
F U
Объект управления - рынок
Y
Рисунок 3.1 - Схема взаимодействия CIM с рынком во на выпуск товаров в ассортименте и стоимости, приносящих наибольшую прибыль предприятию. В условиях рыночной экономики самым главным экономическим показателем становится конкурентоспособность предприятия и продукции. Последняя зависит от прибыли, получаемой от продажи своей продукции. Прибыль же, в свою очередь, является функцией производительности (П) производства, качества (К) выпускаемой продукции, затрат (З) на производство продукции и степени учета побочных эффектов (Эк) - экологии, юридических аспектов, местных условий и так далее Э = f(П, К, З, Эк). (3.1) Попробуем конкретизировать данную формулу. Поскольку любая автоматизация связана с затратами, необходимо, чтобы эффект от использования её результатов был максимален и быстро оправдывал вложенные средства. Поэтому логично положить в основу синтеза отношение эффекта от автоматизации, измеренного в каких-либо единицах, к затратам, связанным с ней Э η= (3.2) З и стремиться при проектировании системы автоматизации довести это отношение до максимума. В связи с тем, что оно определяет величину эффекта на единицу затрат, его можно назвать коэффициентом удельного эффекта. Затраты могут быть денежными, материальными, временными, машинными ( например, затраты памяти компьютера ) и так далее, а также комплексными. При этом существует несколько видов эффекта от автоматизации: экономический, социальный или качественный. Выделяют три классических обоснования целесообразности автоматизации (именно с обоснования целесообразности и начинается автоматизация). 44
С одной стороны, автоматизация оправдана только тогда, когда она приносит прямой экономический эффект - повышает производительность труда, качество изготовляемой продукции, снижает её себестоимость и так далее. Тогда эффект может оцениваться в рублях. С другой стороны, автоматизация может иметь социальный эффект: освобождать человека от вредных и опасных условий труда, устранять монотонную нетворческую работу и так далее. В этом случае необходим поиск критериев для сравнения эффективности систем автоматизации. Наконец, автоматизация помогает преодолевать ограниченные природой возможности человека, то есть придавать ему новые качества (поэтому данное обоснование можно назвать «качественным») - многократно увеличивать его физическую силу, зрение, слух, интеллект и так далее. Эффект от нового качества, которое порождает автоматизация, требует меру для сравнения важности качеств. В этом случае оценка эффекта особенно трудна. Не исключён и “комбинированный” вариант. В этом случае необходимо ввести коэффициенты ранжирования эффектов Э + α 1Э с + α 2 Э к η= , (3.3) З где Э, Эс, Эк – эффекты от аспектов автоматизации: экономического, социального и появления нового качества. Данный критерий выгодно отличается от обычно используемой в экономике разности эффекта и затрат η1 = Э – З. (3.4) С одной стороны, он не требует оценки эффекта в тех же единицах, что и затраты (для этого иногда необходима сложная, и часто с элементами большой неопределенности, методика). С другой стороны, не дает отрицательных значений, как это имеет место с разностью (3.4), при малых значениях эффектов. Наконец можно констатировать, что данный критерий обобщает и критерий Шаумяна, и тем самым теория производительности труда может быть развита в более общую теорию автоматизации на базе этого критерия. В этом случае формула производительности труда преобразуется к следующему виду NЭг Ат = ----------------------- , (3.5) [k + N(m + 1)] Тж где Эг –годовой экономический эффект от автоматизации; остальные составляющие здесь соответствуют обозначениям теории производительности труда: Тж - текущие затраты живого труда обслуживающих рабочих, которые, используя средства труда, создают новые материальные ценности, k – коэффициент технической вооруженности живого труда, характеризующий отношение единовременных затрат овеществленного труда на создание средств производства к годовым затратам живого труда, m – коэффициент энергоматериалоемкости живого труда, характеризующий отношение годовых текущих затрат овеществленного труда на инст45
румент, электроэнергию, вспомогательные материалы и ремонт к годовым затратам живого труда (подробнее смотри /25/). Прямым следствием применения этого критерия является расширение направлений автоматизации, при котором к прежним трем путям добавляется улучшение качества продукции, множество социальных, экономических, технологических мероприятий, которые повышают значение числителя. Задачу синтеза метасистем рассмотрим на примере некоторой обобщенной гибкой производственной системы (ГПС). Используем концепцию двух процессов, описанную в разделе 2.1. Тогда внешний процесс будет протекать на рынке и определять виды продукции, пользующиеся спросом. Внутренний процесс (изготовление продукции) будет протекать в ГПС. Согласование этих двух процессов приведет к изготовлению продукции, наиболее выгодной при эксплуатации данной ГПС. Итак, имеется M видов продукции, цена на которые на рынке превышает расчетную себестоимость ее изготовления в проектируемой ГПС. Необходимо при заданных затратах К выбрать технологические структуры, изготавливающие продукцию, приносящую наибольшую прибыль от эксплуатации ГПС, то есть максимизирующие критерий (3.2). При этом необходимо учитывать возможность перекрытия структур с помощью коэффициентов перекрытия cij, перераспределения управляющих ресурсов ( в соответствии с исследованием, описанным в разделе 2.4), приводящую к общему уменьшению потерь за счет уменьшения дисперсии – bi∆D и ограниченную покупательную способность рынка, а также ограничения, вносимые существующей технологией. Обсудим последние ограничения более подробно. 3.2 Выявление ограничений
Модель, включающая номенклатуру и объемы продукции, рассматривалась в экономике /26/. При этом использовалась критериальная функция вида L n
τ ∑ ∑ Ci X iν → min ,
ν =1 i =1
где
Ci - оптовая цена i –го заказа; X iτν - признак включения i –го заказа в τ – ый период; ν – признак приоритетности выполнения i –го заказа при следующих ограничениях: - по пропускной способности
46
(3.6)
L n m
загр τ τ ∑ ∑ ∑ tij X iν ≤ K пл Ф j
ν =1 i =1 j =1
,
(3.7) где
tij - трудоемкость изготовления заказа i –го вида по j – ой технологической структуре;
Фτj - полезный фонд времени работы по j – ой технологической структуре в τ – ом плановом периоде;
Кплзагр – плановый коэффициент загрузки оборудования; - по объему выпуска L n
τ τ ∑ ∑ Ci X iν ≥ С пл
ν =1 i =1
,
(3.8) где Сплτ – программа выпуска заказов за τ – ый период планирования; - по признаку включения заказов в программу 1, если i − ый заказ включен в τ − ый плановый период, X iτν = 0 − в противном случае ;
(3.9); - по ресурсам (металлу) M
L n
н τ τ ∑ ∑ ∑ M iϕ X iν ≤ M iϕ
ϕ =1ν =1i =1
,
(3.10) где Мiφн – норма расхода φ – го металла на i – ый заказ;
Мiφτ – наличный объем φ – го металла; - по заработной плате τ τ ∑ ∑ ∑ ∑ Pijψ tijψ X iν ≤ Зн i
j ν ψ
,
(3.11) где Pijψ – расценка; 47
tijψ – разряд; Знτ – норматив заработной платы.
Однако в этой модели затраты на организацию производства продукции рассматриваются как общее ограничение и не участвуют в формировании значения целевого критерия. Кроме того, не учитываются вероятностный характер дохода, а также эффекты от эмерджентных свойств метасистем и связанный с ними вид подключения технологических структур к ГПС. Обсудим эти вопросы подробнее. Исходя из концепции, сформулированной в разделе 2.1, выделяем два процесса: формирование спроса на рынке на данный вид продукции и подготовка и запуск изготовления данного вида продукции в технологической системе, например, в некой обобщенной ГПС. Ясно, что уже на этапе проектирования автоматизация должна быть рассчитана на производство продукции с максимальной прибылью. Проведем вероятностную оценку прибыли от текущей реализации продукции. Вероятность того, что скалярный марковский случайный процесс ξ (t , ω ) (колебания цены на продукцию на рынке) в течение интервала времени (t ,τ ) превзойдет значение ее себестоимости для данной ГПС, определяется равенством ∞
P (τ ) = ∫ W l (τ , y )dy
l = 1,..., s ,
(3.12)
Cl
где W l (τ , y ) – условная функция плотности вероятности, y – значения цены, C l - себестоимость данного вида продукции, s – количество видов про-
дукции (ассортимент), учитываемых при расчете. Тогда средняя величина превышения цены над себестоимостью определится интегралом ∞
∆Ц ср = ∫ yW l (τ , y )dy
l = 1,..., s .
(3.13)
Cl
Поскольку процесс считается марковским, условная функция плотности вероятности удовлетворяет уравнению Фоккера - Планка – Колмогорова (ФПК). Считая переменную цену подчиняющейся стохастической модели состояния в форме Стратоновича
48
dξ (t , ω ) = −αξ (t , ω )dt + m 2 dw(t , ω ), ξ (0, ω ) = x 0 ,
(3.14)
где w(t , ω ) - винеровский случайный процесс,
α , m 2 – параметры модели, приходим к необходимости решения следующей смешанной задачи для уравнения ФПК
∂W l (τ , y ) ∂ m2 ∂2 l ( ) = , + α yW y τ W l ( y, τ ); 2 ∂y ∂t 2 ∂y l W (0, y ) = δ ( y ); l l W (τ , C l ) = W (τ , ∞ ) = 0.
(
)
(3.15) Решение данной задачи проведено в /21/ и выражается через функцию параболического цилиндра Dν (z ) . Подставляя его в формулу (3.13), получим ∆Ц ср =
∞
2 ∑ ck k =1
αy 2 αν k τ ∞ exp − ∫ y exp − 2 2 Cl 2m
(
)
2α Dν m y dy ,
(3.16)
где ν k - корни уравнения Dν 2αC l / m 2 = 0 , сk - нормирующий множитель вычисляется по формуле −1 2
∞ 2α c k = ∫ Dν2k y dy , k = 1,2, K . (3.17) c m l Определим теперь среднее время пребывания цены на продукцию в области превышения над себестоимостью. Пусть f ρ (z ) - функция плотности вероятности времени пребывания скалярного марковского процесса в заданной области. Если в момент времени τ значения рассматриваемого случайного процесса (цены на продукцию) еще ни разу не достигали границ области, то время ρ их пребывания там будет не менее чем τ − t . Вероятность реализации этого события равна ∞
∫ f ρ ( z )dz.
τ −t
(3.18)
С другой стороны, эта же вероятность определяется через плотность вероятности ∞
∞
τ −t
Cl
l ∫ f ρ ( z )dz = ∫ W (τ , y )dy .
(3.19)
Таким образом, 49
∞ ∂W l
f ρ ( z ) = − P ′(τ ) |τ =t + z = − ∫
(3.20) |τ =t + z dy . ∂τ Математическое ожидание времени пребывания процесса в заданной области Cl
∞
∞
0
t
ρ l = ∫ zf (ρ )dz = ∫ P (τ )dτ .
(3.21)
Для того момента, когда значения случайного процесса достигают границы допустимой области, функция W (t , y ) является решением первого уравнения Колмогорова ∂W l ∂W l 1 2 ∂ 2W l − αy + m = 0. (3.22) ∂t ∂y 2 ∂y 2 Заменив в этом уравнении производную Wt′ на − Wτ′ и проинтегрировав его по переменному y в пределах от C l до ∞ с учетом равенства (3.12), приходим к дифференциальному уравнению ∂P ∂P 1 2 ∂ 2 P . (3.23) = −αy + m ∂τ ∂y 2 ∂y 2 Так как, согласно определению вероятности P (τ ) , имеют место равенства P (t ) = 1, P (∞ ) = 0 , (3.24) то, после интегрирования этого уравнения по τ в пределах от t до ∞ в соответствии с равенством (3.21), приходим к обыкновенному дифференциальному уравнению второго порядка относительно ρ = ρ ( y ) с соответствующими граничными условиями: 1 2 ′′ m ρ l ′ ( y ) + αyρ l′ ( y ) + 1 = 0, C l < y < ∞, (3.25) 2 ρ l (C l ) = ρ l (∞ ) = 0. Решая эту краевую задачу, находим y αz 2 αy 2 2 y ρ l ( y ) = 2 ∫ C − ∫ exp − 2 dz exp 2 dy , m Cl Cl m m −1
∞ αy 2 ∞ ∞ α C = ∫ exp 2 dy ∫ ∫ exp 2 y 2 − z 2 dzdy . (3.26) CC C m m l l l Оценим теперь среднее число выбросов значений марковского процесса за данный уровень. Рассмотрим временной интервал (t, t+∆t). Поскольку его длина не зависит ни от τ, ни от y, то функция вероятности того, что значения процесса не опустятся ниже уровня Cℓ, должна удовлетворять уравнению ФПК ∂v (τ , y ) ∂ ∂v (τ , y ) 1 ∂ 2 − α y m 2 v (τ , y ) = 0 . (3.27) − 2 ∂τ ∂y ∂y 2 ∂y
(
(
50
)
)
Начальные и граничные условия v (τ , y ) |τ
(3.28)
где f (t , y ) - функция плотности вероятности в заданный момент времени t. Число выбросов n (C l , ρ 0 ) , длительность которых не меньше заданной величины ρ0 (времени одной купли-продажи единицы данной продукции), определяется ∞
n (C l , ρ 0 ) = ∫ v ( ρ 0 , y )dy .
(3.29)
Cl
Решение поставленной краевой задачи найдено в /21/ с помощью преобразования Лапласа при условии, что случайный процесс является стационарным в широком смысле αy 2 α f (y) = exp − 2 . m π m
(3.30)
В отображениях по Лапласу для искомого числа выбросов получаем αCl 2 αCl m2 ∂ αy 2 D ( y /α) α − N (Cl , s) = exp − 2 − exp − 2 −s /α | y = Cl .(3.31) m s 2s ∂y 2m D−s / α (Cl ) m π Обращая найденное выражение, можно найти среднее число выбросов данной продукции за уровень себестоимости. Тогда средний доход от реализации можно найти, перемножая найденные средние величины превышения цены над себестоимостью на длительность этого превышения и на их частоту Д l = ∆Ц ср ρ l n (C l , ρ 0 ) .
(3.32)
Полученный доход должен быть умножен на долю проектируемой ГПС в зависимости от ее производительности и обеспечиваемого качества и отнесен к затратам, которые необходимы для организации производства данной продукции в течение единицы времени (года) 51
λl =
Д l ϕ ( p, q ) . K ( p, q )
(3.33)
3.3 Исследование альтернативы параллельности и последовательности
Вопрос о параллельности двух процессов решается из следующих соображений. На рисунке 3.2 изображены колебания цен на продукцию двух видов. Как видно, имеется заштрихованное перекрытие этих двух процессов. Обозначим S1, S2 – доходы, получаемые от реализации продукции первого и второго вида соответственно, Sп – «перекрывающийся» доход и К1, К2 - соответствующие затраты. При вычислении коэффициента удельного эффекта в метасистеме последовательного действия (как следует из рассуждений об эмерджентности свойств метасистемы в предыдущей главе) необходимо уменьшить затраты на величину перекрытия по структуре. А для метасистемы параллельного действия следует увеличить эффект на долю, обусловленную «суммарным» уменьшением дисперсии управляемых величин (последнее эквивалентно добавлению
52
Цена на продукцию
Sп
S1
Sп
S2
S1
S1
S2 время
Рисунок 3.2 – Схема перекрытия процессов управляющих ресурсов). Знак разности коэффициентов удельного эффекта для этих двух метасистем определит, в каком режиме надо подключать к первой из них вторую (при последовательном разность должна быть положительной, при параллельном - отрицательной). Определим искомую разность ∆=
S1 + S 2 − S п S + S 2 + b∆DS п − 1 , K1 + K 2 − c21 K 2 K1 + K 2
(3.34)
где c21 – коэффициент перекрытия второй структурой первой; ∆D - “суммарное “ уменьшение дисперсии управляемых величин; b – размерный коэффициент. Знак этой разности зависит только от числителя, так как c21≤ 1. Производя сокращения в числителе, получим c21 K 2 (S1 + S 2 ) + c21 K 2 b∆DS п − S п (K1 + K 2 ) − b∆DS п (K1 + K 2 )
.
(3.35) 53
Как видно из этого результата, превышение суммы первого и второго слагаемых над суммой третьего и четвертого ведет к преимуществу последовательного присоединения второй структуры к первой и наоборот. Считая, что коэффициент структурного перекрытия линейно уменьшается с ростом перекрытия процессов спроса, а эффект от «суммарного» уменьшения дисперсии управляемых величин линейно возрастает, имеем два линейных слагаемых (первое и третье) и по одному квадратичному (четвертое) и кубичному (второе). Примерные графики этих зависимостей в диапазоне от явно преобладающего последовательного до явно преобладающего параллельного хода процессов изображены на рисунке 3.3. Пунктиром показана результирующая разность, пересечение которой оси абсцисс показывает смену стратегии присоединения следующей структуры к ГПС с последовательной на параллельную. Вычисляя суммарный коэффициент удельного эффекта (в зависимости от вида присоединения он будет вычисляться по-разному), можно провести Вклад слагаемых с21
второе слагаемое
0
1
перекрытие
b∆D четвертое слагаемое Рисунок 3.3 – Зависимости слагаемых в исследуемой разности коэффициентов удельного эффекта от степени перекрытия процессов спроса на продукцию точно такие же рассуждения для последующих присоединяемых 54
структур. Очевидно, что для метасистемы, в которой n ветвей, будут наблюдаться закономерности, подобные изображенным на рисунке 3.3. При этом диапазон рассмотрения будет располагаться от отдельно работающих n структур через запараллеливание двух и более структур, вплоть до всех n структур, работающих одновременно. 3.4 Алгоритм синтеза метасистемы
Выбранный критерий не позволяет решить задачу синтеза аналитически, поскольку процедура синтеза подразумевает пробные шаги в разных направлениях и дополнительно зависит от порядка этих шагов. Это означает, что теряется свойство марковости и задачу можно решить разработкой поискового алгоритма. Процесс поиска состоит из повторяющихся этапов, каждый из которых представляет собой переход от одного решения к другому, лучшему, что и образует процедуру последовательного улучшения решения в смысле максимизации критерия Q (L,W , C ) → max ⇒ Wоп , Соп , W ,C∈S
(3.36)
где множество S образовано условиями удовлетворения заданной системы неравенств, накладываемых на функционирование системы в условиях L, а Wоп и Cоп – оптимальный набор структур и параметры в этих условиях. Итак, алгоритм образует последовательность шагов /27/: U[0]→U[1] →…U[N] →U[N+1] →… .
(3.37)
В этой последовательности каждое последующее решение в определенном смысле лучше, предпочтительнее предыдущего, то есть U[N+1] f U[N],
N = 0,1,… .
(3.38)
Здесь смысл знака предпочтения « f » может быть разным. Например, если U[N+1] ,U[N]∈ S, то (3.38) означает, что Q(U[N+1]) > Q(U[N]). Если U[N] ∉S, то предпочтение (3.38) естественно связать с выполнением условия U[N]∈ S. 55
В нашем случае роль варьируемых параметров могут играть производительность по каждому виду продукции и уровень его качества. Задаваясь начальным возможным качеством и производительностью при минимальном шаге по затратам, можно выбрать необходимый набор технологических структур в обобщенной ГПС по следующему алгоритму. 1 Вычислить все коэффициенты удельного эффекта для множества возможных видов продукции М в предположении объема затрат К0 по формуле (3.33), расположить их в порядке убывания. 2 Выбрав вид продукции с первым коэффициентом, заменить его на два других, связанных с эффектами от расширения данного вида продукции и улучшения его качества, вычисленных по формулам
λl ( p ) = λl ( p ) +
∂λl dp ∆K ∂p dK
и λl (q ) = λl (q ) +
∂λl dq ∆K . (3.39) ∂q dK
3 Пересчитать все коэффициенты удельного эффекта, учитывая при этом перекрытия с выбранной технологической структурой (при последовательном присоединении) в смысле общих затрат (одно и то же технологическое или транспортное оборудование, управление, программы и так далее) и уменьшая их затраты на величину перекрытия.
56
НАЧАЛО Ввод исходных данных: К0, Дlφ, Кl min, Дl min, cij, bl ∆D
Вычисление коэффициентов λmin, сортировка и выбор первого
Добавление λ для паралл струкЗамена первого на λl(p),
λl(q)
Пересчет
ко-
эффициентов λ
Запомнить выбран-
ную структуру
Сортировка по убыванию
Первый
да
λl ?
2
1
Рисунок 3.4 – Алгоритм выбора технологических структур
57
2
1 да
Первый λl(p)?
Увеличение производительности
на Улучшение каче-
Пр. > Дlφ да Запомнить и исключить λl(p)
нет
ства на ∆K
Промежуточное запомина-
ние
K - ∆K < 0
Вывод результатов работы алгоритма
КОНЕЦ Рисунок 3.4 – Продолжение алгоритма выбора технологических структур
58
4 Добавить к ним коэффициенты, учитывающие возможность перераспределения управляющих ресурсов в случае параллельного подключения к выбранной технологической структуре. 5 Отсортировать полученный ряд коэффициентов в порядке убывания. 6 Если первый коэффициент рассчитан для нового вида продукции с последовательным (параллельным) присоединением, то добавить новую технологическую структуру и перейти к пункту 2. 7 Если первый коэффициент рассчитан в предположении увеличения производительности по уже выбранному виду продукции, увеличить производительность из расчета увеличения затрат на ∆K. В противном случае перейти к пункту 10. 8 Проверить, не превышает ли новая производительность потребности рынка. Если да, то исключить данный коэффициент из ряда и перейти к пункту 2. 9 Проверить, не превысили ли затраты заданной величины К0. Если да, то закончить работу алгоритма, распечатав при этом результаты. В противном случае перейти к пункту 3. 10 Пересчитать первый коэффициент в предположении увеличения качества данного вида продукции при увеличении затрат на его достижение на ∆K и перейти к девятому пункту.
В результате работы этого алгоритма выбираются виды продукции с самыми быстрыми сроками окупаемости, определяется необходимое оборудование с учетом перекрытия технологических структур, уточняется производительность ГПС по каждому виду продукции, необходимое качество каждого вида продукции и порядок работы отдельных структур – параллельный или последовательный. Выводы по третьему разделу 1 Коэффициент удельного эффекта имеет преимущества перед другими критериями, применяемыми в экономике, в силу необязательности оценки эффекта от автоматизации и затрат, связанных с нею в одних единицах, а также в силу положительности его значений даже при учете малых эффектов от автоматизации. Это позволяет более полно оценивать различные эффекты, в том числе для трех классических обоснований актуальности автоматизации: экономического, социального и «качественного». 59
2 При синтезе метасистем автоматизации необходимо рассматривать два процесса: процесс спроса на рынке на данный вид продукции и процесс подготовки и запуска данного вида продукции в гибкой производственной системе. Такая двухпроцессная модель позволяет добиться более адекватного рыночным условиям набора технологических структур и тем самым повысить эффективность автоматизации. 3 Применение теории условно марковских процессов к анализу спроса на рынке на данный вид продукции позволяет оценить возможный эффект от включения в гибкую производственную систему технологической структуры по изготовлению этой продукции и оптимизировать полный набор структур, максимизирующий эффект от автоматизации при заданных затратах на нее. 4 Коэффициент удельного эффекта позволяет решить вопрос о параллельном или последовательном выпуске нескольких видов продукции. При его вычислении необходимо учитывать эмерджентные свойства метасистем: возможность перекрытия технологических структур и возможность перераспределения общесистемных управляющих ресурсов. 5 Процесс выбора технологических структур, включаемых в гибкую производственную систему, не обладает свойством марковости, поэтому его реализация возможна в виде итерационного поискового алгоритма. 6 Третий этап системного синтеза (согласование составляющих системы) можно осуществить тремя методами: оптимизацией в случае, когда о системе и о влияющих на нее факторах, а также о критериях синтеза известно все; адаптацией, когда известен лишь критерий согласования и селекцией, когда возможности адаптации ограничены.
60
4 Оптимизация управления в метасистемах 4.1 Обсуждение критериев оптимального управления
Назначение минимизируемого критерия оптимизации режима системы является, как известно, самой важной задачей оптимизации. Она не может целиком решаться формализованными методами. Для детерминированных процессов с непрерывным временем в качестве критерия оптимальности процесса управления обычно принимают классический функционал /27/ I(t0, Y, u, tк), где t0 – начальный, tк – конечный момент времени управления tк I(t0, Y, u, tк) = ℓ(Y, tк) + ∫ (L(Y, τ) + uт(τ)K-1u(τ))dτ . (4.1) t0 Функционал такого типа содержит первое слагаемое, оценивающее точность приведения управляемого процесса в желаемое конечное состояние Y(tк). Эта часть функционала часто называется терминальной. Второе слагаемое является интегральной оценкой качества переходного процесса, третье слагаемое характеризует потери на управление. Здесь K – матрица параметров, отражающая степень влияния управляющего воздействия на интегральную часть этого критерия. Применительно к метасистемам последовательного действия критерий должен отбирать системы с максимальным быстродействием и максимально адекватным включением нужной структуры (другие два показателя качества – устойчивость и нечувствительность к внутренним изменениям можно считать удовлетворительными в рамках рассмотренной выше конечноавтоматной модели). В таких случаях подынтегральную часть берут постоянной, а терминальную (поскольку речь идет о включении структур) необходимо выразить через вероятности включения различных структур. Таким образом, классический критерий требует в данном случае некоторого преобразования. В нашем случае в качестве функций ℓ1 примем сумму разностей вероятностей переходов внешнего и внутреннего процессов из одного стояния в другое l 1 ( Y ,t k ) =
N
∑(P
l внешн .
l − Pвнутр ) .
, (4.2) а L(Y, τ), исходя из требований быстродействия, приравняем 1. При перераспределении управляющих ресурсов в метасистеме параллельного действия критерий (4.1) можно использовать непосредственно, если ресурсы в разных структурах одинаковы по природе или могут быть сведены к одинаковым единицам измерения. В этом случае компоненты вектора управляемых величин и компоненты управляющих воздействий будут соответствовать разным структурам и критерий «автоматически» оптимально перераспределит управляющие воздействия. l =1
61
Такого невозможно добиться с помощью данного критерия в отношении точности поддержания заданных значений управляемых величин. В этом случае необходимо, чтобы критерий оптимального управления включал дисперсии выходных величин и управляющие воздействия, направляемые на поддержание этих дисперсий на заданном уровне. Считая данный функционал отражающим потери в метасистеме, примем, что l1( Y ,t k ) = 0, функция L зависит не от управляемых величин, а от их дисперсий, а вместо обычной работы управляющих воздействий используется виртуальная (вводится ниже) n ∞
I = ∑ ∫ (α i σ i (t ) + A(σ i (t ), t ))dt .
(4.3)
i =1 t0
Дальнейшие рассуждения по поводу требований к критерию привязаны к более конкретным задачам, описанным ниже. 4.2 Согласование процессов случайной структуры
Как показано выше (в разделе 2.1), в системах управления, функционирующих на принципе последовательно переключаемых структур, имеют место два процесса случайной структуры: один тесно связан с изменением внешних условий и формирует уставки для другого. Второй процесс является исполнительным и переводит объект управления в заданное первым процессом состояние. От согласованного функционирования этих двух процессов зависят такие важные качественные показатели системы управления, как точность и быстродействие. Постановка задачи. Имеются два процесса случайной структуры, состояние одного из которых (ведомого) определяется состоянием другого (ведущего). Ведущий процесс описывается векторным стохастическим дифференциальным уравнением вида W& = D ( l ) (t )ϕ (l ) (W , t ) + H (l ) (W , t )ζ (t ), W (t 0 ) = W0 , (l = 1,...,s ) (4.4) где W – вектор фазовых координат процесса, t – время, s – число структур (различных состояний), D ( l ) (t ) – матрица порядка n×n детерминированных параметров с компонентами dkr(ℓ)(t), ϕ(ℓ)(W,t) – векторная детерминированная нелинейная функция (векторстолбец) с компонентами ϕ1(ℓ), …, ϕn(ℓ), 62
H(ℓ)(W,t) – матрица n×m или n×n с нелинейными относительно W компонентами hij(ℓ)(W,t) (i = 1,…, n, j = 1,…, m), ς(t) – вектор гауссова белого шума с компонентами ς1(t), …, ςm(t). Вектор белого шума ς(t) будем считать случайным центрированным процессом с корреляционной функцией K ζ (t , t ′) = G (t )δ (t − t ′) (4.5) где G(t) – симметричная матрица интенсивностей с компонентами Gij(t). Ведомый процесс является управляемым и описывается подобным урав-
нением Y& = D (l) (t )ϕ (l) (Y , t ) + σ (l) (Y , t )u + H (l) (Y , t )V (t ), Y (t 0 ) = Y0, (l = 1,..., s) (4.6) где σ(ℓ)(Y,t) – матрица детерминированных нелинейных функций σij(ℓ), u – вектор управляющих воздействий, V(t) – вектор гауссова белого шума с компонентами V1(t), …, Vm(t). Ведущий процесс измеряется с помощью канала наблюдения, в результате чего имеется m-мерный наблюдаемый процесс Z (t ) = C (l ) (W , u1 , t ) + N (l ) (t ) (l = 1,..., s ) , (4.7) (ℓ) где C (W, u1, t) – m-мерная векторная функция, u1 – вектор управляющих воздействий на канал наблюдения, N(ℓ)(t) – белый гауссов шум с матрицей интенсивностей Q(ℓ)(t), статистически не зависящий от ς(t). Требуется так подобрать векторы управлений u и u1, чтобы процессы были максимально согласованы по включаемой структуре и по быстродействию переключения на необходимую структуру. Оптимизация управления ведомым процессом. Вопросы системной
согласованности рассмотрены в третьей главе. Применим рассмотренные там положения к согласованию двух стохастических процессов в соответствии с принятой в работе концепцией. В данном случае согласование процессов можно провести с помощью решения задач оптимизации. Тогда в качестве функций ℓ1 примем разность вероятностей переходов процессов из одного состояния в другое, учитывая при этом марковость процесса, а также то, что в дальнейшем используется уравнение Колмогорова, примем l 1 (Y , t k ) = U = (ω 2 ( y (t1 ) | y (t h −1 ) − ω 2 ( w(t h ) | w(t h −1 )) , (4.8) а L(Y, τ), исходя из требований быстродействия, приравняем 1. Как известно /28/, марковский случайный процесс подчиняется уравнению Колмогорова (причем в данном случае первому уравнению /21/ для того, чтобы оно было согласовано по направлению движения во времени с применяемым в дальнейшем уравнением Беллмана) 63
∂ω(ℓ) (w, t|w*,t*)
n
∂
—————— + ∑ — (Ak(ℓ)(w, t) ω(ℓ)(w, t|w*,t*)) + ∂t
k=1 ∂wk 1 n n +—∑ ∑
∂ ——— (Bkm(ℓ)(w, t) ω(ℓ)(w, t|w*,t*)) = 0, (4.9)
2 k=1 m=1 ∂wk ∂wm где wk(t + ∆t) – wk(t) Ak(ℓ)(w, t) = lim M [———————— | w,t ], ∆t→ 0
(4.10)
∆t (wk(t + ∆t) – wk(t)) (wk(t + ∆t) – wk(t))
Bkm(ℓ)(w, t) == lim M [———————————————— | w,t ], (4.11) ∆t→ 0
∆t
M[•] – символ осреднения. Поскольку какая-нибудь структура обязательно должна реализоваться в любой момент времени на плотности вероятности, а через них и на управляющие воздействия (через уравнение Колмогорова) наложено ограничение: интеграл от суммы плотностей вероятности реализации всех структур должен быть равен единице. В уравнение ведомого процесса входит неизвестная пока функция управляющих воздействий f[σ(ℓ)(Y,t)] ∂ω(ℓ) (y, t|y*,t*)
n
∂
—————— + ∑ — (Ak(ℓ)(y, t) ω(ℓ)(y, t|y*,t*)) + f [σ(ℓ)(Y,t)] + ∂t
k=1 ∂yk 1 n n +—∑ ∑
∂ ——— (Bkm(ℓ)(y, t) ω(ℓ)(y, t|y*,t*)) = 0. (4.12)
2 k=1 m=1 ∂yk ∂ym Эта функция играет в уравнении роль источника возникновения и поглощения реализаций случайного процесса. 64
Вычитая из (4.9) (4.12), получим уравнение относительно U ∂U(ℓ)
n
∂
—— + ∑ — (Ak(ℓ)(y, t) U(ℓ)) + f [σ(ℓ)(Y,t)] + ∂t
k=1 ∂yk 1 n n
∂ ——— (Bkm(ℓ)(y, t) U(ℓ)) = 0.
+—∑ ∑
(4.13)
2 k=1 m=1 ∂yk ∂ym Поскольку один процесс “копирует” другой лишь с опозданием и возможными ошибками, дифференцирование по w и y здесь совершенно эквивалентно. Полагая далее 1 ∂U(l)
∂U(ℓ)
f [σ(ℓ)(Y,t)] = — [——]т σ(ℓ)Kσ(ℓ)[ ——] + M[L(Y, τ)], 4
∂y
(4.14)
∂y
получаем точно такое же уравнение как в /28, формула (8.69) на с. 283/, именуемое также стохастическим принципом минимума обобщённой работы /27/, которому должна удовлетворять функция U для того, чтобы управление было оптимальным и равным ∂U(ℓ)
1
u(ℓ) = - — K[σ(ℓ)(Y(ℓ), t)т ——].
2
(4.15)
∂y
Общий критерий оптимизации можно сложить из полученных частных s
s
tк
I(t0, Y, u, tк) = ∑ Iℓ(t0, Y, u, tк) = ∑[ℓ1(Y, tк) + ∫ (1 + uт(τ)K-1u(τ))dτ]. (4.16) ℓ=1 ℓ=1 t0 Добиваясь оптимального управления для каждой случайной структуры ℓ, мы достигнем минимального общего критерия. Оптимизация обратной связи в канале измерений. Будем полагать, что управления u1(t) в канале наблюдения являются функцией фазовых координат оптимального фильтра, т.е. выбираются таким образом, что не нарушаются условия марковости совместного процесса {Y(t), Z(t)}т. При этих ус65
ловиях нормированные апостериорные плотности вероятности ω€1(l ) ( y , t ) , ω1(ℓ)(y, t) фильтруемого процесса для каждого из состояний будут удовлетворять обобщенным уравнениям Стратоновича ∧ ∂ω1(ℓ)(w, t) ∧ 1 ∧ ∞ ∧ (ℓ) (ℓ) (ℓ) (ℓ) ———— = -divπ (w,t) - — ω1 (w, t)[f (w, z, u,t) - ∫f (w, z, u,t) ω1(ℓ)(x, t)dx]+ ∂t 2 -∞ s ∧ ∧ + ∑ [vrℓ(w,t) – urℓ(w,t)]. (4.17) r =1 ∧ Вектор плотности потока вероятности π(ℓ)(w,t) равен ∧ ∧ 1 n ∂ ∧ π(ℓ)(w,t)=Ap(ℓ)(w,t)ω1(ℓ)(w, t) - — ∑ — [Bpq(ℓ)(w, t)ω1(ℓ)(w, t)] (p = 1,n;ℓ = 1,s), 2 q=1∂yq (4.18) (ℓ) (ℓ) где Ap ,Bpq – коэффициенты сноса и диффузии, приведенные выше; f(ℓ)(w, z, u,t) – производная от логарифма функции правдоподобия определяется по формуле r Qpq(ℓ)(t) f(ℓ)(w, z, u,t) = ∑ ——— [zp(t) – Cp(ℓ)(w, u, t)][ zq(t) – Cq(ℓ)(w, u, t)] (4.19) (ℓ) p,q=1 |Q (t)| и дополнительно зависит от функции управления в соответствии с уравнени∧ ∧ ем наблюдения (4.7); vrℓ(w,t), urℓ(w,t) – соответственно функции поглощения и восстановления реализаций случайного процесса. Задача управляющей части ведущего процесса - оптимальная фильтрация сигналов, поступающих от внешней среды. Такая задача решена в /28/ в предположении квадратичной функции потерь ∧ ∧ т Ψ(w, W0,t) = [w – W0] [w – W0],
(4.20)
∧ где W0 – оптимальная оценка сигналов. Сама процедура нахождения оптимальных управлений существенно зависит от вида функций коэффициентов статистической линеаризации и задаваемых ограничений. Если известно, что минимизируемая функция потерь одномодальная и ограничения на управления отсутствуют, оптимальные управления могут быть найдены из системы 66
уравнений s m Qpq(ℓ)(t) n ∂ ∂ (ℓ) (ℓ) (ℓ) ∑ ∑ ——— ∑ [ — cpj (u,t)cqk (u, t) + cpj (u, t) — cqk(ℓ)(u,t)]× l=1 p,q=1 |Q(ℓ)(t)| i,j,k=1 ∂uf ∂uf (ℓ) (ℓ) (ℓ) ×[Rji (t)Rkj (t) + Rjk (t)Rij(ℓ)(t)] = 0, (4.21) где использованы обозначения ∞ ∧ ∧ ∧ (ℓ) (ℓ) (ℓ) Rij (t) = ∫ (wi – Wi ) (wj – Wj ) ω1(ℓ)(w, t)dw. (4.22) -∞ Для согласования ведомого процесса с ведущим необходимо решать эту задачу с заменой выходного вектора сигналов W на Y, что обеспечит максимальное быстродействие, управляя каналом наблюдения до тех пор, пока необходимая структура не установится в ведомом процессе. 4.3 Экспериментальное исследование последовательной метасистемы
Из проведенного в предыдущем параграфе исследования следует необходимость быстрого уравнивания вероятностей включений для всех структур, входящих в систему с соответствующей вероятностью изменений хода внешнего процесса. Исходя из управляемости второго процесса, можно ввести главную обратную связь, которая будет следить за реальной частотой включений каждой структуры, запоминать ее и уравнивать с требуемой вероятностью. Причем срабатывать эта связь должна только в случаях наибольшей неопределенности, то есть как это следует из рассуждений, проведенных в разделе 2 на границах между классами управленческих ситуаций. Экспериментальное исследование и было посвящено оценке точности включений структур, которую должна резко повысить указанная обратная связь. Модель представляла собой две последовательно переключаемые локальные системы управления (структуры), изображенные на рисунке 4.1. Здесь w1 , w2 - уставки регуляторов по частоте включения, <w> - оценка вероятности включения регуляторов. Работа схемы без обратной связи (на рисунке не изображена) сравнивалась с работой схемы при ее наличии в условиях зашумленности внешнего процесса. Изменения внешнего процесса без шума изображены на рисунке 4.2 и представляют собой две синусоиды с отличающимся в два раза периодом. Обратная связь срабатывает только в определенном диапазоне, когда разность значений зашумленных синусоид меньше некоторого числа ε. Коррекция в схеме с обратной связью осуществляется только за счет наращивания частоты включений. Ошибки рассчитывались как отношение модуля 67
разности частоты включений в схемах с шумом с частотой включения в схеме без шума к последней частоте и брались в процентах. Полученная в результате эксперимента зависимость ошибок включений приведена на рисун
Внешний процесс
<w>
w1
Регулятор 1
w2
Регулятор 2
Объект управления
Рисунок 4.1 – Схема двух последовательно переключаемых систем локального управления ке 4.3. Программа, реализующая описанную модель, написана на алгоритмическом языке Паскаль версии 7.0 и приведена в Приложении. Как видно из графика (рисунок 4.3), некоторая ошибка у схемы с обратной связью имеет место лишь при малых ε, сравнимых с максимальным уровнем шума. С ростом ε ошибка быстро уменьшается и обращается в нуль для обоих включаемых систем локального управления. В то же время во второй схеме ошибки включения локальных систем управления различаются. Их незначительная зависимость от ε обусловлена лишь шумом.
68
4.4 Координация в метасистеме
По-другому обстоит дело с метасистемой параллельного действия. Здесь необходимы дополнительные теоретические исследования. Постановка задачи. Пусть каждая ветвь метасистемы представляет стохастический регулятор, описываемый уравнением Ито dо t,щ =Шо t,щ ,t + G о t,щ ,t ⋅ dw t,щ , (4.23) о 0 ,щ = о щ . 0 От уравнения Ито однозначно можно перейти к уравнению Колмогорова
( ) (( ) ) ( ) ( )
(( ) )
( )
/21/ (интеграл от плотности вероятности по переменной X равен единице)
1 0,8 sin(t)
0,6
sin(2t)
0,4 0,2
10.
8.5
7.0
3.5
0 0.0
Амплитуда
1,2
время Рисунок 4.2 – График изменения во времени внешнего процесса
69
Ошибка по включениям, %
4,5 4 3,5 3 2,5 2 1,5 1 0,5
0. 54 1
0. 45 1
0. 36 1
0. 27 1
0. 18 1
0. 09 1
0. 00 1
0
Диапазон срабатывания обр. связи (ε) Рисунок 4.3 – Зависимости ошибки по частоте включения локальных систем управления в двух исследуемых схемах n 1 n n ∂f ∂f ∂ 2f + ∑ a k ( X, t ) ⋅ + ∑∑ b km (X, t ) ⋅ =0. (4.24) ∂x k 2 k =1 m=1 ∂x k ∂x m ∂t k =1 Специальной подстановкой /29/ из уравнения (4.24) можно убрать второе слагаемое. Управляющее воздействие попадает в правую часть и делает это уравнение неоднородным. Необходимо определить оптимальные управляющие воздействия для
нормального распределения вероятности. Решение преобразованного неоднородного уравнения (4.24) можно выразить через функцию Грина ( y − ξ )2 a2 a ∞∞ 1 u (ξ ,t )dtdξ . (4.25) exp − f (Y ,t ) = exp( t − y ) ∫ ∫ 4 bt b b − ∞ 0 2 πbt Подставляя в левую часть этого решения желаемый результат управления (плотность вероятности в виде нормального закона), получаем уравнение Фредгольма 1-го рода y − y уст 2 ( y − ξ )2 1 a2 a ∞∞ 1 u (ξ ,t )dtdξ . = exp( t − y ) ∫ ∫ exp − exp − 2 b b 4 bt σ 2π π 2 bt 2σ −∞ 0
(
70
)
(4.26) С помощью этого уравнения можно исследовать динамику системы управления. Ограничимся исследованием установившегося движения. Для этого, вернувшись к уравнению (4.24) для одномерного случая с постоянными коэффициентами a и b, уберем производную по времени и подставим вместо плотности вероятности нормальный закон распределения: 1 b b a − 2 ( y − y уст ) − 3 − 3 ( y − y уст ) ⋅ e 2π 2σ 5 2σ σ где yуст- уставка регулятора,
( y − y уст ) 2σ 2
= u( y ) ,
(4.27)
u(y) - управляющее воздействие.
Введем понятие виртуальной работы как работы, которую необходимо совершать системе управления для поддержания дисперсии выходной величины на заданном уровне ∞
A (у ) = ∫ u ( y )
1
−
( y − y ус ) 2 2у 2
dy . (4.28) у 2р Пользуясь формулой (4.27), можно построить зависимость дисперсии e
−∞
выходной величины от виртуальной работы, имеющей гиперболический характер, объяснимый природой процесса (смотри рисунок 4.4). Прилагая все большие ресурсы управления (увеличивая виртуальную работу управления), можно уменьшить дисперсию управляемой величины до сколь угодно малого значения (однако не до нуля). Наоборот, уменьшая ресурсы, направляемые на управление, приходим к увеличению дисперсии вплоть до бесконечности. Имея зависимости дисперсии управляемой величины от виртуальной работы по управлению, можно оптимально распределить ресурсы. Классический критерий оптимизации обычно принимают в следующем виде /21/ tk
(
)
I 0 = M [ l1( Y ,t k )] + M [ ∫ L( Y ,τ ) + u T ( τ )K −1u (τ ) dτ ] ,
(4.29)
to
где L(Y, t), l1(Y, tk) – заданные положительно определенные функции, К – симметричная положительно определенная или диагональная 71
матрица положительных коэффициентов. Считая данный функционал отражающим потери в метасистеме, примем, что l1( Y ,t k ) = 0, функция L зависит не от управляемых величин, а от их дисперсий, а вместо обычной работы управляющих воздействий используется виртуальная: Решая задачу оптимального управления метасистемой параллельного действия с данным функционалом, можно определить установившиеся оптимальные значения дисперсий выходных величин. Для этого необходимо решить совместно систему, включающую уравнения (4.27), определение (4.28) 5
4
3 A( σ) 2
1
0
0
0.5
1
1.5
2
σ
Рисунок 4.4 – Зависимость виртуальной работы от дисперсии и критерий (4.30) ∞ I = ∑ M ∫ ( α iσ i ( t ) + A( σ i ( t ),t ))dt . t0 i =1 n
72
(4.30)
2.5
(y − y уст )2 − 1 bi bi ai 2 2σ 2 y y y y − − − − = ui ( yi ), уст e \ уст 5 3 3 2 π 2 2 σ σ σ i i i (y − y уст )2 ∞ ui ( yi ) − 2σ 2 ( σ ) A dy, i = 1,K, n, (4.31) = i ∫ σ 2π e −∞ i n ∑ [α iσ i + Ai (σ i )] → min . i =1 Продифференцировав последнее уравнение по всем σ i и приравняв эти производные нулю, получим новую систему из n уравнений. В неё подставим выражение виртуальной работы из второго уравнения системы (4.31), в которую, в свою очередь, подставлено управляющее воздействие из первого уравнения системы (4.31). Окончательно получим n уравнений вида ( y − y уст ) 2 − ∞ bi ai ∂ 1 bi 2 σ2 ( y − y ) − − ( y − y ) e dy = −2πα i уст уст ∫ ∂σ σ 5 3 3 .(4.32) 2σ i σ i 2σ i i i −∞ i = 1, K, n Решение этих уравнений определяет оптимальные нормы для дисперсий. Дальнейшее управление можно свести к работе конечного автомата, который будет перераспределять управляющие ресурсы с "благополучных" структур на "неблагополучные" (то есть на те структуры, дисперсия выходных величин которых больше всего возросла). Все варианты распределения управляющих воздействий (состояний конечного автомата) можно описать следующей матрицей: − , ∆u12 ,..., ∆u1n ∆u , − ,..., ∆u 2n ∆U = 21 (4.33) . L ∆un1 , ∆un 2 ,..., − Здесь номера столбцов соответствуют номерам структур, с которых управляющие ресурсы "снимаются", а номера строк соответствуют номерам структур, на которые управляющие воздействия направляются. Чертой помечены неиспользуемые состояния. Так будет работать система, у которой каждая структура имеет независимый источник управляющего воздействия. При общем источнике параллельная система может превратиться в последовательную (как отмечено выше). В этом случае управляющие ресурсы в любой момент времени подключаются автоматом лишь к одной структуре. Тогда можно применить теорию систем случайной структуры и, вычислив вероятности включения каждой
(
)
(
)
73
структуры, использовать их в качестве уставок для конечного автомата (превратив тем самым автомат Мура в автомат Мили с обратной связью), что увеличит точность работы системы. Такое решение несправедливо для многосвязной системы. Рассмотрим подробнее процесс перераспределения ресурсов. Положим для простоты анализа, что описанная выше зависимость имеет для двух управляемых величин самый простой вид Σ1 =
α
, Σ2 =
β
, (4.34) Α Α где α , β - размерные коэффициенты. График этой зависимости изображен на рисунке 4.5. Управление необходимо вести таким образом, чтобы суммарная дисперсия была минимальна N
K = ∑ σ i → min .
(4.35)
i =1
При этом можно провести двухуровневое управление с доведением управляемых параметров до области нормированных значений, а затем, используя координацию управляющих воздействий, свести к минимуму критерий К /30/. Забирая малую долю ресурса от второго параметра и вкладывая ее в улучшение первого, мы получим уменьшение суммы двух дисперсий управляемых величин на величину ∆Σ1 − ∆Σ 2 . (4.36) Такое перераспределение ресурса рационально, пока данная разность положительна. Равенство отнимаемых и добавляемых ресурсов дает уравнение для нахождения точек оптимальности σ 1* , σ 2*
β β α α . (4.37) − * = * − σ1 σ1 σ 2 σ 2 β α Вводя обозначение для начальной суммы + = C , можно выразить σ1 σ 2
одно оптимальное значение через другое
σ 2* =
σ 1* β Cσ 1*
,
(4.38)
−α Цель оптимизации теперь формулируется следующим образом * * σ 1 + σ 1 β → min . (4.39) * C σ α − 1 * Взяв производную от этой суммы по σ1 и приравнивая ее нулю, найдем оптимальное значение
74
Дисперсия
σ1 ∆Σ1 ∆Σ2
σ2
∆A
∆A Виртуальная работа
A
Рисунок 4.5 – Схема перераспределения управляющих ресурсов
( )
C 2 σ 1*
2
− 2Cασ 1* − α (β − α )
(
Cσ 1*
σ 1* =
−α
)
2
= 0; (4.40)
α ± αβ
. C Считая коэффициенты α > 1 и β > 1 и учитывая, что σ 1* всегда положительно, имеем единственное решение * α + αβ ; σ 1 = C (4.41) + β αβ * . σ 2 = C При этом минимальная сумма равна
( σ* +σ* =
α + β)
2
. (4.42) C Если бы мы потребовали совпадения точек оптимальности, то уравнение 1
2
(4.37) приняло бы вид:
β β α α − * = * − . σ1 σ σ2 σ Его решение
σ* =
(α + β )σ 1σ 2 ασ 2 + βσ 1
.
(4.43)
(4.44)
При этом минимальная сумма равна 2σ*.
75
Определяя разность двух минимальных сумм, убеждаемся, что она положительна
(
)2
(
)2
α + β σ 1σ 2 α− β 2(α + β )σ 1σ 2 − = > 0. (4.45) ασ 2 + βσ 1 ασ 2 + βσ 1 ασ 2 + βσ 1 Если погрешность, равная этой разности для двух параметров устраивает проектировщика системы, то можно, последовательно добавляя опасности отклонений следующих параметров, определить единственное псевдооптимальное значение σ* и минимальную сумму N
∑ σ i* = Nσ * .
(4.46)
i =1
Находя разность этого значения σ* с каждой опасностью отклонения, можно добиться раздельного поканального управления подсистемами. Если же эта разность нас не устраивает, тогда проведем более тонкое исследование. Очевидно, что перераспределение управляющих ресурсов можно прекратить, когда разность (4.36) равна 0. Ограничиваясь конечными приращениями ∂Σ ∂Σ ∆Σ1 = 1 ∆Α; ∆Σ 2 = 2 ∆Α, (4.47) ∂Α ∂Α видим, что перераспределение ресурсов дает эффект, пропорциональный частным производным. В таком случае можно организовать следующий алгоритм. 1 Вычислить частные производные дисперсий всех управляемых величин по ресурсу в данных точках (σ1, σ2…σN). 2 Отсортировать производные в порядке убывания. 3 Перераспределить ресурс величиной ∆А от управления параметром с максимальным значением производной на управление параметром с минимальной производной. 4 Пересчитать производные, изменившиеся в результате выполнения п.3. 5 Определить максимальную разность производных (max-min) и, если она больше некоторого значения δ, перейти к п. 2. 6 Конец работы. Значение δ определяется здесь по минимальному изменению производной на краю диапазона при заданном изменении ресурса ∆А. Этот алгоритм работает тем точнее, чем ∆А меньше. Однако, при этом возрастает время его работы. Таким образом, при проведении такой координации мы сводим суммарную дисперсию управляемых величин к минимуму или можем экономить ресурсы управляющих воздействий (в зависимости от того, что выгоднее).
76
4.5 Экспериментальное исследование параллельной метасистемы
Модель такой системы включала три параллельно действующих регулятора, характеризующихся систематической погрешностью ai и среднеквадратичным разбросом bi , где i=1,2,3. Изменение во времени плотности распределения управляемой величины ω i подчиняется уравнениям ФоккераПланка-Колмогорова ∂ω i bi ∂ 2ω i ∂ω i (4.48) + ai − = ui , ∂t ∂yi 2 ∂yi 2 где yi –управляемая величина, ui – управляющее воздействие, изменяющее точность регуляторов (поднастройка, подналадка). Выше было проведено решение задачи непрерывного управления дисперсией управляемой величины. Однако на практике поднастройка регуляторов проводится в импульсном режиме, то есть время от времени. Подставляя импульсное воздействие в правую часть уравнения (4.48), найдем его решение y − yi 2 ai ai 2 1 mo . (4.49) exp − i ω i = exp( y i − t) 4bi t bi bi 2 πbi t Как видим, результирующее решение представляет собой нормальный закон с изменяющимся во времени среднеквадратичным отклонением (СКО) (в зависимости только от параметра bi ) и сносом по оси yi (в зависимости только от ai ). Осредненное СКО за некоторый промежуток времени можно вычислить по следующей формуле: 2 2bi T − 2bi t 1 T σ ср = . (4.50) ∫ 2biτ dτ = T −t t 3(T − t ) Процесс импульсного управления моделировался на компьютере при следующих параметрах: a =1, b =1, ymo =1, σ ср =1. В отсутствии управляющих воздействий плотность распределения измеренной величины подвержена сносу и размытию, как показано на рисунке 4.6. Характер изменения СКО во времени при импульсной поднастройке представлен на рисунке 4.7. По горизонтальной оси на рисунке отложен номер шага по времени ( ∆t = 0.03 сек). Для ответа на вопрос об оптимальной частоте поднастроек менялся период их повторения, одновременно вычислялась виртуальная работа с использованием зависимости, изображенной на рисунке 4.5. При этом была получена новая зависимость виртуальной работы от длительности периода, изображенная на рисунке 4.8.
(
(
)
)
77
Изломы на графике обусловлены попаданием целого числа периодов в расчетное время. Как следует из данной зависимости, минимальная суммарная виртуальная работа имеет место при непрерывном управлении (нулевая длительность периода). С ростом длительности периода между поднастройками приборов трудоемкость обслуживания комплекса измерительных приборов резко возрастает. Если же метасистема является многосвязной, а не многомерной как в предыдущем исследовании, то задача уже не поддается аналитическому решению. В этом случае необходимо синтезировать конечный автомат, работающий по алгоритму, описанному в предыдущем разделе, и его функционирование позволит определить оптимальные значения дисперсий управляемых величин. Многосвязность моделировалась здесь следующим образом. Считалось, что второй и третий регуляторы имеют положительное влияние на первый (уровень перетекания управляющих воздействий везде принимался равным 10%). Первый и второй регуляторы отрицательно влияют на третий. Наконец, первый регулятор положительно влияет на второй, а третий - отрицательно. Результаты такого эксперимента представлены на рисунке 4.9. На графике выделяются три области. Первая – область независимой работы регуляторов (дисперсия возрастает во всех трех каналах одинаково). Во второй области вводится описанная выше взаимосвязь регуляторов, что приводит к
78
Плотность вероятности Дисперсия
Значения управляемой величины Рисунок 4.6 - Размытие плотности вероятности управляемой величины в отсутствии поднастройки
время Рисунок 4.7 - Изменение СКО во времени при импульсной поднастройке 79
Виртуальная работа
Период Рисунок 4.8 - Зависимость виртуальной работы от длительности периода между поднастройками
80
σ
t Рисунок 4.9 – Изменения дисперсий трех регуляторов во время эксперимента увеличению дисперсии управляемой величины в третьем регуляторе, уменьшению в первом и почти не меняет дисперсии второго регулятора. В третьей области включается конечный автомат, который, оптимально перераспределяя управляющие воздействия, возвращает дисперсиям почти прежнее их значение. Из экспериментального моделирования метасистем параллельного и последовательного действия видно, что, хотя их поведение описывается уравнением ФПК, управлять ими приходится по-разному. Во втором случае можно напрямую увеличивать частоту включений в случаях большой неопределенности, а в первом можно лишь создавать условия для уменьшения дисперсий управляемых величин. Выводы по четвертому разделу 1 Критерий оптимальности в виде разности плотностей вероятности реализации внешнего процесса и включения соответствующей этой реализации структуры позволяет оптимизировать управление в метасистеме последовательного действия в отношении повышения точности и своевременности включения. 81
2 Концепция двух стохастических процессов при функционировании метасистемы последовательного действия позволяет организовать обратнуюсвязь в объекте управления по частоте включений и за счет этого повысить точность и адекватность включения структур. 3 Критерий в виде суммы дисперсий управляемых величин и виртуальных работ, необходимых для поддержения этих дисперсий, позволяет оптимизировать управление в метасистеме параллельного действия, минимизируя виртуальную работу и сохраняя приемлемую точность регулирования в отдельных структурах. 4 Между дисперсиями регулируемых величин в метасистеме параллельного действия и виртуальной работой, необходимой для их поддержания, существует гиперболическая зависимость. 5 При импульсном управлении метасистемой параллельного действия с уменьшением частоты импульсного воздействия виртуальная работа, направляемая на поддержание заданных дисперсий регулируемых величин, резко возрастает. Минимальность виртуальной работы имеет место при непрерывном управлении. 6 В случае многосвязанной метасистемы необходима модель конечного автомата, работающая по специальному алгоритму и позволяющая «автоматически» найти оптимальные значения дисперсий выходных величин. 7 Модели управления вероятностями в метсистемах последовательного и параллельного действия носят различный характер. Если в последовательных системах можно напрямую увеличивать частоту включения, то в параллельных системах можно лишь создавать условия для повышения частоты появления на выходах структур управляемых величин, равных уставкам, при одновременном понижении частоты появления всех других значений управляемой величины.
82
5 Применение метасистемного подхода 5.1 Автоматизация контроля качества ткани
Рыночная экономика требует от производителя повышения качества выпускаемой продукции. Это тем более справедливо по отношению к такой распространенной продукции, как ткань. Тем не менее, в настоящее время управление качеством ткани является в большой степени искусством, а контроль этого качества в отечественной текстильной промышленности проводится, в основном, визуально /16/. При этом пропускаются даже крупные дефекты, что ведет к штрафным санкциям, или ткани приписываются несуществующие дефекты, чем занижается сорт ткани и, соответственно, ее цена. Автоматизация процесса обеспечения качества ткани повысит конкурентоспособность и снизит экономические потери предприятия. Система обеспечения качества, в данном случае, состоит из подсистемы управления качеством и подсистемы контроля готовой продукции. Последовательно рассмотрим их. 5.2 Синтез подсистемы управления качеством ткани
Подсистема управления качеством ткани состоит из четырех крупных технологических структур, отвечающих соответственно за качество на этапах прядения, ткачества, отделки, а также за контроль готовой продукции. Ввиду отсутствия структурных перекрытий на этих этапах, они выполняются параллельно и, следовательно, допускают перераспределение управляющих ресурсов. Такой же вывод следует из формулы (3.35), если принять c21 равным нулю. В первую очередь встает вопрос о том, что выгоднее: вкладывать ресурсы в совершенствование технологии изготовления ткани или в совершенствование системы выходного контроля? Большое количество и разнообразие пороков внешнего вида ткани делают задачу полного контроля трудной и дорогостоящей /31/. Здесь также возможна альтернатива. С одной стороны, отказываясь от разбраковки готовой ткани, можно нарастить контролирующие средства на предшествующих этапах ее изготовления, максимально исключив появление пороков. Другая крайность - усложнение устройств выходного контроля с уменьшением до минимума промежуточных контролирующих средств. Средства, которые можно направить на повышение качества продукции, оценим следующим образом. Пусть возможности предприятия по выпуску продукции первого сорта равны S1в , а выпускает оно часть продукции S1 первым сортом, часть S2 вторым, а часть Sб продукции уходит в брак. Тогда, обозначая себестоимость единицы продукции З, в предельном случае получаем (5.1) K = S1в Ц 1 − S1 Ц 1 − S 2 Ц 2 + S б З . 83
Очевидно, необходимо поделить эти средства между системой управления и контроля так, чтобы качество продукции стало максимальным (n − n1 ( K1 ) ) (n − n1 ( K1 ))θ (K − K1 ) + ⇒ max (5.2) K1 K − K1 где n – среднее количество дефектов в единицу времени при данной технологии, n1(K1) – количество дефектов, устраненных за счет улучшения технологии, θ(K-K1) – вероятность обнаружения и правильной классификации дефектов системой контроля качества, K-K1 – затраты на систему контроля. Взяв производную от этой суммы по K1 и приравняв ее к нулю, можно определить оптимальные затраты на улучшение технологии, а затем затраты на систему контроля, при условии, что известны зависимости уменьшения числа дефектов от улучшения технологии и точности классификации от затрат. Схема системы управления качеством продукции представлена на рисунке 5.1. Здесь применяются обозначения: Y – вектор выходных показателей (сорт продукции, ее количество, браковочная ведомость), F – вектор воз-
84
F
Подсистема распознавания
Устройство выбора задачи
Задача 1 обеспечения кач-ва
М1
Задача 2 обеспечения кач-ва
2
Ц
М1
СУ
U
Объект управления – качество продукции
• М2 Задача • N обеспечения кач-ва
•
ПСАК
Y
М1
М2
Рисунок 5.1 – Схема многоуровневого управления качеством мущающих воздействий (качество исходных материалов, сырья, энергии, инструмента и так далее), U – вектор управляющих воздействий на технологический процесс изготовления продукции (технологические уставки по качеству на отдельных операциях), Ц – цель управления – обеспечение оптимального качества в данных рыночных условиях (при минимизации затрат), СУ – субъект управления, ПСАК – подсистема автоматического контроля качества. Данная схема может быть классифицирована как многозадачная мультиструктурная система параллельного действия. Задачи обеспечения качества 85
на отдельно взятой операции (для ткани - это прядение, ткачество и отделка) могут быть решены, как это следует из предыдущей главы, несколькими методами: изменением частоты подналадки оборудования, изменением величины премий обслуживающему персоналу, ужесточением требований к входному контролю и так далее. На схеме условно показано лишь по два метода решения каждой из задач. К тому же считается, что внутри каждого блока метода (М1, М2) заложен алгоритм или программа со всей совокупностью команд, операций, функций и режимов их реализации. Рисунок 5.2 поясняет, что понимается под оптимальным качеством в данных рыночных условиях. Улучшение качества по отношению к оптимальному уровню ведет к прямому увеличению затрат на более частую подналадку оборудования, увеличение премий и так далее. Снижение качества по сравнению с оптимальным наказывается штрафными санкциями со стороны потребителя, снижением объемов продаж и так далее. В реальности оптимальный уровень постоянно изменяет свое положение и система требует перераспределения управляющих воздействий. В данных условиях устройство выбора приоритетной задачи по улучшению качества должно реализовать (выбирать) ту задачу из N, которая выполняется в данный момент хуже всего. При этом управляющими ресурсами мо
86
Затраты
Уровень качества продукции Оптимальный уровень Рисунок 5.2 – Изменение затрат на обеспечение качества продукции гут быть обновление оборудования и инструмента, учащение его подналадки, увеличение премии работающим и так далее. Перераспределение управляющих ресурсов рассмотрено выше по отношению к контролю и технологии. Оно допустимо также и между технологическими структурами. В таком случае работа подсистемы распознавания дефектов может сводиться лишь к накоплению статистики по появляющимся случаям брака за определенный промежуток времени. Далее организуется обратная связь, то есть на ту задачу, решение которой приводит к максимальному браку и переключается управление, а ресурсы освобождаются с той задачи, где брак минимален или вообще отсутствует. Такой механизм переключения задач есть не что иное как принцип главного звена или метод Парето-Лоренца в экономике, когда имеющиеся ресурсы не размазываются равномерно по всем имеющимся задачам, а прикладываются кумулятивно, концентрированно – в этом случае эффект от их применения максимален. С другой стороны, можно проранжировать виды брака по степени их соответствия рыночным условиям в данный момент относительно некоторой середины. Тогда механизм управления должен уменьшать ресурсы управ87
ляющих воздействий пропорционально удалению от этой середины в сторону улучшения качества и увеличивать их в противоположном направлении. Вопрос выбора середины по достигаемому качеству продукции, также как и коэффициенты изменения управляющих ресурсов, требуют дальнейших исследований. В любом случае необходимо анализировать диаграмму потерь. Для тканей производственного объединения «Орентекс» ее можно получить из таблицы данных 5.1. Сама диаграмма изображена на рисунке 5.3. Таблица 5.1 Оценка потерь от дефектов Тип дефекта
Кол-во
Ш.бал
частота
1
2 2 21 4 7+8+11
3 11 1 11 11
4 2\211 21\211 4\211 26\211
Кр «опасн» 5 22\211 21\211 44\211 286\211
4 16 17 9 6 4 2 5 6 14 8 4 7 5 15 14 1 1 15 5
11 11 1 1 3 1 1 1 1 11 1 11 1 1 1 1 1 1 5 1
4\211 16\211 17\211 9\211 6\211 4\211 2\211 5\211 6\211 14\211 8\211 44\211 7\211 5\211 15\211 14\211 1\211 1\211 15\211 5\211
44\211 176\211 17\211 9\211 18\211 4\211 2\211 5\211 6\211 154\211 8\211 44\211 7\211 5\211 15\211 14\211 1\211 1\211 75\211 5\211
1 Затек краски 2 Пятно 3 Перекос ткани 4 Заломы (варочный, красильный, сухой) 5 Разнооттеночность 6 Заработка пуха 7 Масляная или цветная нити 8 Парочка 9 Непропряды 10 Пролеты 11 Подплетина 12 Местное сужение ткани 13 Дыры 14 Рвань 15 Надиры 16 Зебристость, полоса 17 Недоработка нити 18 Пятна от заработки 19 Непропечать рисунка 20 Слеты 21 Ткацкие узлы 22 Незаработка петель 23 Недосека 24 Засечки ( затяжки ) 88
Потери
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 1617 18 19 20 21 22 23 24 № дефекта Рисунок 5.3 – Диаграмма потерь от дефектов (пороков) ткани Из диаграммы сразу следует, что «снимать» управляющие ресурсы можно с дефектов под № 8, 10-13, 15, 17, 18, 21, 22, 24 и «направлять» их на дефекты под № 4, 6, 14, 23. Очевидно, это приведет к общему повышению качества ткани при остающихся прежними ресурсах управляющих воздействий. Проведем расчеты по методике, описанной в подразделе 4.4. Для этого сформируем методом экспертных оценок таблицу 5.2 трудоемкости, обеспечивающей равное повышение качества при применении разных управляющих средств.
89
Таблица 5.2 Трудоемкость повышения качества разными средствами № Средство управления № дефекта по Трудоемкость таблице 5.1 1 1 Поднастройка оборудова3 ния 4 5 9 10 12 16 23 24 2 2 Повышение культуры про2 изводства 6 7 13 14 3 Замена изношенных частей 1 3 оборудования 19 4 Сочетание 1-го и 2-го 8 1.5 18 21 5 Сочетание 2-го и 3-го 17 2.5 20 6 Сочетание 1-го и 3-го 11 2 15 22 Пользуясь этой таблицей расчитываем величину фактически направляемых ресурсов по каждому виду дефектов (третий столбец Таблицы 5.3). Пользуясь упрощенной формулой (4.42) можно определить квазиоптимальное управляющее воздействие и определить необходимую коррекцию (четвертый столбец таблицы 5.3), перевести ее в величину корректирующих потерь, а затем, найдя отношение площадей их площади к площади первоначальных фактических потерь найти процент повышения качества продукции. В результате расчетов он оказался равным 18.6 %.
90
Таблица 5.3 Расчет эффекта от перераспределения ресурсов Тип дефекта потери управкоррекляющее ция воздейст 0.175 0.136 22 1 Затек краски 0.216 0.095 21 2 Пятно 0.288 0.023 44 3 Перекос ткани 0.307 0.004 286 4 Заломы (варочный, красильный, сухой) 0.288 0.023 44 5 Разнооттеночность 0.3 0.011 176 6 Заработка пуха 0.193 0.118 17 7 Масляная или цветная нити 0.134 0.177 9 8 Парочка 0.251 0.056 18 9 Непропряды 0.061 0.25 4 10 Пролеты -0.689 1 2 11 Подплетина 0.111 0.2 5 12 Местное сужение ткани -0.022 0.333 6 13 Дыры 0.298 0.013 154 14 Рвань 0.061 0.25 8 15 Надиры 0.288 0.023 44 16 Зебристость, полоса -0.046 0.357 7 17 Недоработка нити 0.011 0.3 5 18 Пятна от заработки 0.111 0.2 15 19 Непропечать рисунка 0.132 0.179 14 20 Слеты -1.189 1.5 1 21 Ткацкие узлы -1.689 2 1 22 Незаработка петель 0.298 0.013 75 23 Недосека 0.111 0.2 5 24 Засечки ( затяжки ) Итог Среднее Повышение качества (%)
изменение потерь 17 9 3 3 3 7 10 11 4 16 -3 9 -89 7 33 3 -54 138 27 19 -1 -1 3 9 183
983 0.310875
18.6
5.3 Синтез подсистемы автоматического контроля качества готовой ткани
Контроль качества ткани сводится к нахождению отклонений, называемых дефектами ткани или пороками, оценке их (обычно в баллах) и определению сорта ткани. Все отклонения возникают из-за нарушения технологических процессов: прядения, ткачества или отделки. Дефекты (пороки) внешнего вида ткани делятся, в зависимости от размера, на распространенные и местные, а в зависимости от технологической 91
операции, на которой они допущены - на сырьевые, пороки ткачества и отделки /32/. Учитывая, что данная подсистема работает на основе схем последовательного сканирования, которые подробно будут рассмотрены ниже, дефекты поступают в нее один за другим. Кроме того, вероятность перекрытия дефектов на ткани очень мала, поэтому из формулы (3.35), приравнивая Sп = 0, также получаем последовательную схему работы данной мультиструктурной системы. С другой стороны, эта подсистема является многопрограммной, поскольку после классификации дефекта необходимо выполнить вполне конкретную программу (запомнить адрес дефекта, начислить штрафные баллы, остановить протяжку, вырезать дефект, поставить метку и так далее). Схема этой подсистемы изображена на рисунке 5.4. Подсистема распознавания информации
Выбор программы
Цель
Программа 1
Реализация программы 1
Программа 2
Реализация программы 2 •
Программа N
•
•
F
U
Y
Объект контроля ткань с дефектами
Реализация программы N
Рисунок 5.4 – Схема управления реакцией на дефекты ткани Поскольку для появления дефекта, измеряемому признаку достаточно преодолеть некоторый порог, и средняя длительность и математическое ожидание этого отклонения неважны, для синтеза подсистемы автоматического контроля качества ткани достаточно определить среднюю величину появления дефектов разных типов, что и определит в свою очередь необходимую производительность. Эта же средняя величина может служить уставкой по каждому виду дефектов для организации обратной связи по частоте включений каждой структуры, реагирующей на эти виды дефектов. Срабатывать эта связь должна, как это следует из развитой выше теории только в случае появления неопределенности при распознавании. Требуемая же точность классификации дефектов и соответственно затраты на достижение этой точности определяется из экономических сообра92
жений по формуле (5.2). Приведенные соображения относятся к экономическому уровню синтеза подсистемы автоматического контроля качества готовой ткани. Рассмотрению технологического структурного и параметрического уровней посвящены остальные параграфы данной главы.
93
6 Организация медицинского обслуживания Одним из самых очевидных направлений автоматизации, обусловленной социальным эффектом, обладает автоматизация медицинских технологий. И среди них особое место занимает офтальмология как область, связанная с самым необходимым человеку органом при общении с внешним миром – органом зрения. Актуальность автоматизации при лечении глазных болезней возрастает в последнее время в связи с интенсивной информатизацией общества и повышением нагрузки на глаза (с появлением книг, телевизора, компьютера), что приводит в первую очередь к появлению близорукости. 6.1 Общие соображения о синтезе системы
При синтезе автоматизированной системы медицинского обслуживания метасистемного типа необходимо стремиться максимально большому охвату пациентов при заданных затратах, поскольку качество лечения обеспечивают включенные в ее состав структуры. Кроме того, при анализе параметров, характеризующих функциональное состояние того или другого органа, зачастую необязательно знать, насколько далеко он отклонился от порога, обусловливающего необходимость лечения. Достаточно лишь знать, что это отклонение имеет место. Следовательно, из трех вероятностных задач, рассматриваемых при синтезе метасистемы, необходимо решать только две: определение средней продолжительности выбросов параметров за заданный порог и частоты этих выбросов. Причем среднюю продолжительность выбросов необходимо будет поделить на среднее время обслуживания пациента системой, тем самым полностью определится производительность автоматизированной системы. При синтезе необходимо сравнивать методы лечения между собой по силе их воздействия, стабильности результатов и охвату как можно большего количества лечебных случаев. Следовательно, необходим соответствующий критерий для сравнения методов лечения. Необходима также методика автоматической классификации пациентов при назначении наиболее эффективного метода лечения. Кроме того, необходимы методы слежения за состоянием лечимого органа непосредственно в процессе лечения и остановки этого лечения при определенных условиях. Все эти задачи рассматриваются ниже в данной главе. Автоматизированная система должна, анализируя измеренные значения параметров функционального состояния лечимого органа предложить пациенту наиболее эффективный метод лечения. При этом схема выбора метода лечения для поступающего пациента с точки зрения теории управления может выглядеть, как показано на рисунке 6.1. Здесь вектор U обозначает воздействие методов лечения близорукости на
94
Подсистема распознавания
Выбор метода лечения
Цель
Метод лечения
Реализация метода 1
Метод лечения
Реализация метода 2 •
Метод лечения
•
•
F
U
Y
Объект лечения пациент с близорукостью
Реализация метода N
Рисунок 6.1 – Схема управления лечением близорукости пациента, вектор Y оценивает результат лечения, а вектор F несет информацию о первоначальном состоянии пациента. Подобная схема управления является многоуровневой и многомерной. Ее можно также назвать системой управления лечением близорукости с возможностью выбора метода. Нетрудно также с помощью компьютерной программы автоматизировать этот процесс. 6.2 Характеристика нехирургических методов лечения близорукости
В течение многих десятилетий проблема близорукости является предметом интереса практических врачей-офтальмологов и ученых-исследователей /33/. И это не случайно, ведь с одной стороны, близорукость - наиболее частый дефект зрения, распространение которого увеличивается, особенно среди детей и подростков. На изучение проблем, связанных с близорукостью, направлены усилия ученых самых разных специализаций: педиатров, оптометристов, специалистов по контактной коррекции, хирургов, ретинологов, а также биологов, физиологов, экспериментаторов. Формируется близорукость часто в школьном возрасте. Число близоруких учащихся возрастает от младших классов к старшим. Впервые это отметили Cohn H. и Эрисман Ф.Ф. /34, 35/. По данным Михалевой М.Г., после обследования 180000 школьников в первых классах найдено 2,1%, в четвер95
тых - 4,7 %, в восьмых - 12,3 %, в десятых - 16,2% близоруких школьников. Следовательно, каждый шестой выпускник выходит в жизнь близоруким /36/. Актуальность и социальная значимость этой проблемы обусловлена не только широким распространением, но и ведущим положением близорукости в структуре инвалидизации по зрению. По данным Либман Е.С., показатели инвалидизации вследствие близорукости в РФ равны 16-18% /37/. Как правило, инвалидность вследствие осложненной высокой близорукости наступает в трудоспособном возрасте, нередко в 30-40 лет /38/. В настоящее время разработано множество способов стабилизации и улучшения зрительных функций при миопии. Среди них – физические /3851/, медикаментозные /52-76/, физиотерапевтические /77-91/. В последние годы вышли за пределы научно – исследовательских лабораторий и все шире используются в практической медицине методы лечения, реализующие приемы внешней обратной связи. Необходимость обратных связей или афферентаций при восстановлении нарушенных функций целого организма была сформулирована П.К.Анохиным еще в 1935 году. В большой серии экспериментов было выявлено, что восстановление функций нервной системы, то есть «переучивание центров», происходит при непрерывном обратном афферентировании с периферии от каждого этапа восстановления функций. Можно сказать, что в каждый отдельный момент организм при восстановлении функций только тогда переходит к следующему этапу восстановления, когда он получит с периферии обратную афферентацию, информирующую центральную нервную систему о достигнутом эффекте. Принцип обратной связи по параметрам разнообразных физиологических функций используется для лечения гипертонической болезни /92/, сердечных аритмий /93/, язвенной болезни желудка /94/, тяжелых форм детского церебрального паралича /95/, для релаксационнной тренировки /96/, для лечения двигательных расстройств у неврологических больных /97/.Метод биологической обратной связи используется и в офтальмологии. E.S.Silvia с соавторами применяли этод метод при глаукоме /98/.Петербургской фирмой «Ин Витро» разработан и производится прибор «Амблиокор-01», реализующий метод обратной связи. Применение метода видеокомпьютерной коррекции улучшает зрительные функции, используя непосредственно возможности самого мозга. Клинический эффект основан на способности мозга активировать зрительные реабилитационные процессы, когда присутствует высокая мотивация даже на уровне подсознания. Таким мотивационным фактором является просмотр увлекательного фильма. Производится регистрация электроэнцефалограммы. Компьютер производит анализ биотоков мозга пациента и вычисляет текущий уровень активности зрительного анализатора. Изображение на экране телевизора будет сохраняться только в моменты «правильного» зрения и будет пропадать (погаснет изображение) в момент «неправильного» зрения. Таким образом, производится положительное подкрепление определенного состояния мозга, при котором зрительное восприятие оптимально. В результате многократного повторения этой рефлекторной процедуры в мозгу формируется новая система связей, способная поддержи96
вать более эффективное состояние зрительных структур и обеспечивать высокое качество восприятия предметного изображения. 6.3 Параметры, характеризующие состояние глаза при близорукости
Существует множество параметров, определяющих состояние органа зрения при близорукости. Первым из них является острота зрения, равная обратной величине предельного угла различения, выраженного в минутах. Острота зрения измеряется в десятичных дробях 0.1; 0.2; 0.3;…;1.0; 1.1; 1.2 и так далее. За норму, соответствующую остроте зрения 1.0, принимается такая различительная способность глаза, при которой две точки видны как раздельные, если угол между лучами, идущими от них в глаз, равен 1′ /51/. Обычно измерения остроты зрения проводятся с помощью таблицы Головина – Сивцева с аппаратом для освещения при ее рассматривании с расстояния в пять метров. При этом велико значение субъективного фактора, поскольку острота зрения зависит от условий предъявления знаков и общего состояния обследуемого. Другим важным параметром является статическая рефракция, под которой понимают соотношение между преломляющей силой оптической системы глаза и положением сетчатки /99/. Исследование статической рефракции проводят в условиях циклоплегии с помощью скиаскопии или с применением рефрактометра. Однако циклоплегия чаще всего проводится с помощью 1% раствора гоматропина или цикломеда, которые дают лишь кратковременный и неполный парез цилиарной мышцы, что не исключает при измерениях остаточную аккомодацию. При исследовании рефракции все шире применяют автоматические рефрактометры, позволяющие в большинстве случаев избегать циклоплегии /100/. Но даже в этом случае имеют место как погрешности метода измерения, так и погрешности технических устройств. Через аппарат аккомодации опосредуется влияние многих неблагоприятных факторов, способствующих развитию близорукости. В связи с этим приобретают большое значение клинические методы исследования аккомодации. Область и объем аккомодации исследуют с помощью проксиметров или аккомодометров по положению ближайшей и дальнейшей точек ясного видения (punctum proximum, pp, punctum remotum, pr). Простейший проксиметр представляет собой линейку длиной 50 см с перемещаемым по ней тестобъектом (обычно шрифт №4 таблицы для близи). Так как при данном обследовании велико значение субъективного фактора, обычно исследование проводят 2-3 раза и вычисляют среднее значение этого показателя. 97
В.И.Матвеев и Ю.Е.Шелепин определяли дальнейшую и ближайшую точки ясного видения с помощью решеток разной пространственной частоты (цикл/см), а также верхнюю и нижнюю пространственную частоту в цикл/угловой градус, воспринимаемую наблюдателем в pp и pr /101/. Для удобства исследования объема аккомодации существует прибор - аккомодометр, позволяющий сразу определять ближайшую и дальнейшую точки ясного зрения, но он не исключает субъективизма измерения /51/. Относительная аккомодация характеризует изменения напряжения аккомодации при совместной работе обоих глаз при расположении объекта на определенном расстоянии (обычно 33 см - оптимальное расстояние для зрительной работы). Исследование относительной аккомодации возможно только при наличии бинокулярного зрения. Для измерения состояния аккомодации приставляют линзы положительные для расслабления аккомодации и отрицательные - для ее напряжения. Сила максимальной положительной линзы укажет отрицательную часть относительной аккомодации, сила максимальной отрицательной линзы - положительную часть (запас) относительной аккомодации. Большое значение имеет запас относительной аккомодации. Его снижение означает ухудшение зрительной работоспособности вблизи /102/. Оценить работоспособность цилиарной мышцы при ее длительном напряжении позволяет глазная эргография, которую впервые применил C. Berens (1926). Более подробное физиологическое обоснование метода представили Н.В.Зимкин и А.В. Лебединский /103/, предложившие специальный прибор - глазной эргограф. Посредством этого эргографа определяются перемежающиеся изменения напряжения цилиарной мышцы и его степень. Наряду с эргографией, уточняющим субъективным методом исследования аккомодации является кобальто-рефрактоаккомодометрия /104/, основным элементом установки которой является кобальтовое стекло, которое пропускает только красные и синие лучи с разными коэффициентами преломления. Существуют и объективные методы исследования аккомодации. Одним 98
из них является метод фотографической регистрации изменений кривизны передней поверхности хрусталика в процессе аккомодации по величине изображений фигурок Пуркинье-Сансона или смещения оптического среза хрусталика (В.Д.Глезер, Л.Т. Загорулько). Второй метод /105/ основан на принципе сканирования отраженного от глазного дна изображения щели. С помощью объективной аккомодометрии можно с большой точностью исследовать время аккомодационной реакции, микрофлюктуации аккомодации, устойчивость аккомодационной установки и величину изменений аккомодации при переводе взгляда на объект фиксации. Ввиду сложности этих методов, они применяются в научных лабораториях, а не в практической медицине. С исследованием рефракции и аккомодации тесно связаны методы прижизненного определения длины оси глазного яблока: расчетные методы, основанные на измерении рефракции хрусталика и общей рефракции глаза /49/; рентгеновский метод Рэштона; ультразвуковое исследование как А-, так и Вметодом. Прямые измерения передне-задних размеров глазного яблока при аккомодации и конвергенции на небольших расстояниях от глаза были выполнены с помощью компьютерной томографии и А-скан-ультразвуковой эхобиометрии (В.В.Волков, 1988). При этом установлена принципиальная возможность удлинения глазного яблока при релаксации отводящих и сокращении приводящих прямых мышц. По возможности проводят прижизненное определение деформационных свойств склеры /106/. Это позволяет судить о степени участия склеры в развитии миопии в данном случае, составить более правильное представление о прогнозе и целесообразности проведения операции укрепления заднего полюса или оценить эффект операции, если она уже произведена. Все большее применение в офтальмологии находит определение ретинальной остроты зрения (РОЗ) /99/. Если РОЗ не менее 1.0, а острота зрения ниже, то это указывает на зависимость снижения зрения от оптических факторов. Для измерения РОЗ используют ретинометр АРЛ-1 (анализатор рети99
ны лазерный). Оптическая система прибора позволяет формировать непосредственно на сетчатке интерференционную картину (ИК) или решетку, состоящую из чередующихся темных и светлых полос с синусоидальным распределением освещенности. В исследовании РОЗ не исключается субъективный фактор, так как результат измеряется по ответу обследуемого. Следующим параметром является контрастная чувствительность. Поскольку рецептивные поля зрительного анализатора подобны системе локальных фильтров разных пространственных частот и ориентаций, лучшими тестовыми стимулами для их возбуждения служат разноконтрастные чернобелые или хроматические синусоидальные решетки, то есть с размытыми контурами, разных направлений и ширины /107/. Для определения контрастной чувствительности создана компьютерная программа «ZEBRA» /108/. Методика визоконтрастометрии превосходит обычную визометрию по выявляемости различных зрительных нарушений, но требует специального оборудования и более длительна. Для тестирования светочувствительности применяют темновую адаптометрию и периметрию. Темновую адаптометрию проводят с помощью отечественных адаптометров (АДМ) или зарубежных никтометров. Световые пороги, полученные при темновой адаптометрии, широко варьируют у здоровых людей, поскольку зависят от возраста и достигают максимума только при полной темновой адаптации (от 40 до 60 минут непрерывного пребывания в полной темноте). Исследование полей зрения является одним из информативных в офтальмологии. Оно позволяет судить не только о характере распределения светочувствительности в каждом глазу по площади рецептора (сетчатки), но и об уровне поражений зрительно-нервного пути по совокупности нарушений в обоих глазах. Различают кинетическую и статическую периметрию. При кинетической периметрии тестируемый объект смещают по поверхности периметра либо от периферии к центру, либо наоборот. При кинетической периметрии исследование проводят с помощью надпорогового объекта, и 100
технически невозможно уловить некоторые скотомы. При статической периметрии тестируемый объект не перемещают и не меняют в размерах, а предъявляют в заданных по той или иной программе точках поля зрения с переменной яркостью /109/. В современных периметрах используется яркость фона, близкая к мезопическим условиям зрения, что уравнивает вклад палочек и колбочек в светочувствительность и исключает необходимость предварительной световой или темновой адаптации зрительной системы. Яркость распознавания стимула - единственный количественный критерий оценки световой чувствительности в исследуемой точке. Результаты статической периметрии выражаются в единицах светочувствительности - децибелах (дБ). Изучению поля зрения при миопии посвящено немало работ, но обращают на себя внимание разноречивость данных и суждений по этому вопросу. В известной мере это связано с применением различных методик исследования поля зрения. Отмечено (Dudois-Poulsen A.; Layle G.K., Berard P., 1955; Пржибыльская Я.И. 1958, и др. /99/), что при близорукости может наблюдаться как концентрическое сужение границ поля зрения, так и преимущественное их уменьшение в верхневисочном квадранте. Сужение границ поля зрения связывают с функциональными или дегенеративными хориоретинальными изменениями на периферии глазного дна. При близорукости нередко наблюдается нарушение фотометрической гармонии, выраженность которой возрастает по мере увеличения степени близорукости. Подобное нарушение встречается и у лиц с близорукостью слабой степени при нормальной картине глазного дна и поля зрения. Скорее всего это свидетельствует о том, что изменения в рецептивных полях носят функциональный характер и предшествуют органическим изменениям в сетчатке. В основе их лежит дисбаланс возбудительного и тормозного процессов в сетчатке с преобладанием последнего. Для определения электрической активности большинства клеточных элементов сетчатки применяют электроретинографию, представляющую со101
бой графическое отображение изменений биоэлектрической активности в ответ на световое раздражение. Однако в поликлинической практике проще измерять порог электрочувствительности (ПЭЧ) и электролабильность (ЭЛ). Под порогом электрочувствительности (ПЭЧ) понимают минимальную амплитуду тока, способную вызвать ощущение фосфена. ПЭЧ характеризует состояние периферии сетчатки и идущих от нее волокон зрительного нерва. Электролабильность (ЭЛ) или критическая частота исчезновения фосфена оценивает способность ткани воспроизводить частоту раздражения. ЭЛ характеризует состояние центральных отделов сетчатки. 6.4 Материал и методы исследования
В основу работы легли результаты комплексного клинического обследования пациентов поликлиники восстановительного лечения города Оренбурга. Клинический материал включает 213 пациентов (419 глаз) с приобретенной неосложненной близорукостью различной степени в возрасте от 15 до 20 лет. С близорукостью слабой степени было 171 наблюдение, с близорукостью средней степени – 126 наблюдений, с близорукостью высокой степени – 122 наблюдения. Количество пациентов выбиралось примерно одинаковым как по степени близорукости, так и по методу лечения. У всех пациентов острота зрения корригировалась оптическими средствами до 1.0. Периметрическое обследование проводилось 20 пациентам (40 глаз) до и после лечения тремя вышеописанными методами. Отдаленные наблюдения в сроки до двух лет проведены у 47 пациентов, которым лечение проводилось один – два раза в год в зависимости от клинико–физиологических показателей. В качестве сравнения была взята контрольная группа из 24 пациентов, идентичных по возрасту и степени близорукости, не получавших лечения. Применялись следующие методы исследования. Визометрия и подбор оптимальной коррекции проводились на приборе-рефракторе фирмы Carl Zeiss Jena. Использовались набор оптотипов для взрослых (цифры, кольца Ландольта). Шаг (переход от одной строки к другой) составил 1/10. Подбор коррекции проводился с автоматической сменой стекол. Полную оптимальную коррекцию определяли на этом приборе с учетом дуохромного теста. Подбирали полную коррекцию для каждого глаза, при этом пациент должен был видеть одинаково оптотипы при разной окраске предъявляемого поля в красном и зеленом цвете. Оптимальную коррекцию проверяли не только на дуохромном тесте, но и на тексте номер 4 проверки остроты зрения для близи. Исследование рефракции проводилось методом скиаскопии и на рефрактометре фирмы Carl Zeiss Jena в условиях циклоплегии (S.Cyclomedi 1%). На этом приборе производятся измерения по методу, предложенному про102
фессором Хартингером с приведением к коинциденции (совмещению) измерительных меток. Он позволяет определять рефракцию в пределах от –38,0 Дптр. до +18,5 Дптр. Погрешность при измерении на нем значительно ниже, вне зависимости от степени освещенности. Рефрактометрия для всех пациентов до и после лечения проводилась в приблизительно одинаковых стационарных условиях освещенности. Определение запаса относительной аккомодации проводилось по методу Аветисова-Шаповалова. Пациенту в очках, полностью корригирующих миопию, предлагали с расстояния 33 см читать текст №4, который соответствует остроте зрения 0,7 таблицы для близи. Если он мог читать этот текст, то начинали приставлять одновременно к обоим глазам отрицательные сферические линзы, ступенчато увеличивая их силу на 0,5 Дптр. Сильнейшая отрицательная линза, с которой еще возможно чтение, позволяет определить величину запаса относительной аккомодации (ЗОА). Для выбранной группы пациентов (в возрасте от 15 до 20 лет) примерная возрастная норма ЗОА по данным Аветисова-Шаповалова составляет 5,0 Дптр. Именно такое значение использовалось для оценки результатов. Определение объема абсолютной аккомодации проводилось на основе измерений ближайшей (punctum proximum, pp) и дальнейшей точки ясного зрения (punctum remotum, pr) каждого глаза. При этом в качестве тестобъекта использовалось кольцо Ландольта, соответствующее остроте зрения 0,7 – 0,8 с расстояния 33 см. Зная величины показателей pp и pr в диоптриях, можно определить объем абсолютной аккомодации по следующей формуле: A = pp – pr. Объем аккомодации не должен быть меньше минимального значения нормы, которая для выбранной возрастной группы пациентов составляет 10,0 Дптр. Определение порога электрочувствительности проводилось с помощью микропроцессорного офтальмологического электростимулятора «Sunshine VSD-002» фирмы «Комет» (город Уфа). Измерения проводились в непрерывном режиме при постоянном увеличении тока до появления у пациента ощущения фосфена. Определение электролабильности осуществлялось на том же приборе. Методика исследования включает предварительное определение ПЭЧ. Затем, если ПЭЧ меньше 150 мкА, начальную силу тока принимают равной 150 мкА и увеличивают частоту тока до сообщения пациента о слиянии мельканий фосфена. В противном случае измерения проводят при начальной силе тока, равной ПЭЧ пациента. Периметрия. Исследование проводилось с помощью автоматизированного компьютерного периметра фирмы «Dicon» (США), реализующего метод статической периметрии. Была использована пороговая абсолютная стратегия. По этой стратегии результатом обследования является карта поля зрения, где каждая обследованная точка имеет абсолютное значение порога чувствительности, выраженное в децибелах (дБ). Она основана на методе по103
строения относительного холма зрения, что означает: перед каждым обследованием глаза при помощи четырех точек определяется уровень «нормальной» (индивидуальной) чувствительности. Этот уровень или «смещение» используется затем для установления начальной освещенности для каждой точки в поле зрения. Для уменьшения объема анализируемой информации принимались во внимание только значения светочувствительности точек поля зрения, расположенных на четырех меридианах с полюсом в макулярной области, следующих друг за другом с шагом в 45° по часовой стрелке для правого глаза и против часовой стрелки для левого. Исследование сред глаза и глазного дна проводилось с использованием щелевой лампы 110 и ручного офтальмоскопа НО 110 фирмы Carl Zeiss Jena, при максимальном мидриазе. Методика лечения. Лечение пациентов проводилось тремя методами. Метод видеокомпьютерной коррекции реализовывался с помощью аппаратурного комплекса “Амблиокор-01”, который предназначен для обучения пациентов навыку нормализации уровня активации зрительных отделов мозга при просмотре предметного изображения. Комплекс имеет два режима – “активация” и “релаксация”. Для лечения близорукости применялся режим “релаксации” в соответствии с рекомендациями авторов метода. Пациент осуществляет просмотр фильма попеременно правым и левым глазом при оптической коррекции, соответствующей статической рефракции. Время сеанса – 20 минут (по 10 минут каждым глазом). Инструкция по комплексу предусматривает проведение от 12 до 30 сеансов ежедневно (5 раз в неделю). В наших исследованиях проводилось 10 сеансов. Пациент находился перед телевизором, на экране которого демонстрировался увлекательный фильм. Производилась регистрация электроэнцефалограммы (ЭЭГ). Компьютер производил анализ биотоков мозга пациента и вычислял текущий уровень активности зрительного анализатора. Экран телевизора, перед которым находился пациент, включался только в периоды активации зрительных систем мозга. При появлении фазы торможения экран телевизора гас. Таким образом, производилось положительное подкрепление определенного состояния мозга, при котором зрительное восприятие оптимально. В результате повторения этой процедуры, в центральной нервной системе формируется новая система связей, способная поддерживать более активное состояние зрительных структур. Чрезкожная электростимуляция зрительного нерва и сетчатки проводилась с помощью прибора «Sunshine VSD-002». Лечебные электростимуляции проводились на основании результатов измерения ПЭЧ и ЭЛ пациента в соответствии с типовыми рекомендациями (величина лечебного тока определялась из соотношения ПЭЧ ×1,5, лечебная частота – ЭЛ-5…10 Гц). Курс лечения включал одну процедуру в день в течение 7-10 дней непрерывно. Лечение проводилось в пачечном режиме по 5 импульсов в пачке, количество пачек в серии – 30, количество серий на каждый глаз – 4, интервал между сериями – 30 сек. 104
Лечебный эффект при проведении чрезкожной электростимуляции объясняется активацией ретиноэнцефальных путей обоих полушарий от соответствующих областей сетчатки стимулируемого глаза. В третьем случае лечение проводилось сочетанием этих двух методов. 6.5 Критерии выбора методов лечения
Как показано в обзоре литературы, близорукость является сложным заболеванием со множеством патофизиологических и клинических особенностей, которые невозможно описать одним или двумя простыми параметрами. Если же в качестве параметров взять традиционные, описывающие состояние зрительных функций при близорукости, и использовать их в качестве координат многомерного пространства, то можно найти комплексный показатель, включающий в себя информацию обо всех координатах, позволяющий более точно оценивать состояние глаза. С другой стороны, в распоряжении врача-офтальмолога в настоящее время имеется множество методов лечения близорукости. Комплексный показатель позволит оценить эффективность действия каждого из методов, а также выработать клинические показания к их применению. В качестве координат многомерного пространства выбраны острота зрения, рефракция, объем абсолютной аккомодации, запас относительной аккомодации, порог электрочувствительности, электролабильность (то есть обычный набор показателей, определение которых не требует сложной аппаратуры и доступно в стандартных поликлинических условиях). В таком многомерном пространстве состояние глаза отмечается точкой. Для оценки эффективности лечения необходимо рассматривать три состояния глаза: до лечения, после лечения и состояние здорового глаза. Соединив эти три точки, можно получить два вектора, изображенные на рисунке 6.2 (для упрощения изображены лишь две координатные оси из шести), с началом в точке, описывающей исходное состояние больного глаза (точка A). Первый вектор направлен в точку, характеризующую состояние здорового глаза (точка C) и задает направление скорейшего излечения. Второй вектор направлен в точку, описывающую состояние глаза после лечения (точка B) и отражает реальные изменения, наблюдающиеся при лечении тем или иным методом. В качестве критериев оценки эффективности лечения можно выбрать угол между этими векторами (косинус этого угла – cos α), величину изменений при лечении (длину второго вектора - AB), а также величину изменений в направлении скорейшего излечения (длина проекции вектора реального изменения на направление скорейшего излечения -AD). Исследование проводилось на всех группах пациентов при лечении методами видеокомпьютерной коррекции, чрезкожной электростимуляции и сочетанием этих методов. Попытка прямого вычисления трех вышеописанных критериев привела к необходимости модификации исходных данных. Первая модификация обусловлена тем, что большая величина одной из компонент (ПЭЧ) привела к 105
Рефракция, дптр
0
B
α A
1
ОЗ
Рисунок 6.2 - Расположение векторов в многомерном пространстве резкому уменьшению вклада в изменение длины вектора AB других компонентов. Выход состоит в нормировании. Для этого все значения параметров были отнесены к показателям здорового глаза. В результате получились нормированные безразмерные значения всех шести компонентов векторов. Вторая модификация потребовала изменения шкалы измерения остроты зрения. Эта шкала имеет сильную нелинейность, так как низкое зрение определяется сотыми долями, в то время как более высокое зрение измеряется десятыми. Была введена единая линейная шкала 1 – 20. Значения по этой шкале затем были так же нормированы и приведены к безразмерному виду. Критерии вычислялись по формулам: V11∗V21 + V12∗V22 + … +V1n ∗V2n К1= Cos α = , (6.1) 2 2 2 2 2 2 √ V11 + V12 +…+V1n * √ V21 +V22 +…+V2n 2 K2 = √ V11 +V122 +…+V1n2 ∗ K1 = √ V112 +V122 +…+V1n2 ∗ Cos α , (6.2) (6.3) K3 = √ V112 +V122 +…+V1n2 / √ V212 +V222 +…+V2n2 , где V11,…,V1n - нормированные безразмерные компоненты вектора изменений состояния глаза, обусловленные методом лечения; V21,…,V2n – нормированные безразмерные компоненты вектора необходимых изменений до нормального состояния глаза. Первые десять значений нормированных параметров, отражающих исходное состояние глаза, и вычисленные по формулам (6.1), (6.2), (6.3) значения всех критериев приведены в таблице 6.1. Нормированные значения самих изменений вместе со значениями критериев приведены в таблице 6.2.
106
Таблица 6.1 - Результаты вычисления критериев в группе пациентов с близорукостью высокой степени при лечении методом чрезкожной электростимуляции № ОЗ R ОА ЗОА ПЭЧ ЭЛ К1 К2 К3 п/п 1 6 -7,5 7,8 2 100 30 0,84 0,07 0,06 2 6 -7,5 7,6 2 90 31 0,09 0,003 0,03 3 6 -6,5 7,4 1,5 100 32 0,97 0,07 0,08 4 7 -6,5 7,4 1,5 100 31 0,97 0,08 0,08 5 8 -7,0 7,3 2 100 31 0,9 0,07 0,08 6 8 -7,0 7,2 2 100 32 0,76 0,05 0,06 7 8 -6,5 7 1,5 100 31 0,89 0,08 0,09 8 8 -6,5 7 1,5 100 31 0,89 0,08 0,09 9 9 -6,5 7,4 2 100 35 0,71 0,04 0,06 10 9 -6,5 7,5 2 100 35 0,71 0,04 0,06 С точки зрения устойчивости действия методов лечения важен разброс (дисперсия) вычисленных критериев. Большой разброс говорит о нестабильности результатов лечения, об отсутствии в базовых параметрах дополнительной информации, оценивающей состояние глаза, колебание которой и Таблица 6.2 - Результаты вычисления критериев в группе пациентов с близорукостью слабой степени при лечении методом видеокомпьютерной коррекции № п/ п 1 2 3 4 5 6 7 8 9 10
ОЗ
R
ОА
ЗОА
ПЭЧ
ЭЛ
К1
К2
К3
0,05 0,05 0,1 0,1 0,25 0,2 0,1 0,1 0,3 0,25
-0,5 -1 -1 -0,5 -0,75 -0,25 -1 -0,75 -0,5 -0,5
0,02 0,02 0,02 0,02 0,01 0,08 0,04 0,02 0,04 0,02
0,5 0,1 0,3 0,2 0,3 0,2 0,1 0,2 0,2 0,2
-0,4 -0,4 -0,28 -0,28 -0,28 -0,28 -0,28 -0,14 -0,14 -0,14
0,28 0,14 0,24 0,2 0,1 0,14 0,22 0,16 0,28 0,16
0,95 0,97 0,96 0,9 0,94 0,9 0,98 0,98 0,89 0,98
0,65 0,5 0,5 0,2 0,8 0,8 0,4 0,3 0,2 0,5
0,7 0,51 0,5 0,25 0,8 0,9 0,5 0,3 0,3 0,5
вызвало указанный разброс (психологическое состояние пациента, накопленная усталость, сопутствующие заболевания и т.д.). Разброс нагляднее всего изображается гистограммами. С результатами полного исследования можно ознакомиться в /33/. Здесь же приведены лишь гистограммы (рисунки 6.3 – 6.5), показывающие значения критериев при лечении близорукости слабой степени. 107
На основании проведенного исследования приходим к выводу о перспективности применения для оценки эффективности метода лечения угла между векторами реального и желательного изменений. Это обусловлено ясным геометрическим смыслом этого критерия, наличием естественной границы, оценивающей эффективность метода лечения - 45°, при которой одинаковы желательные (AD) и «побочные» (BD) изменения, что проиллюстрировано на рисунке 6.6. Отсутствие в этом критерии информации о величине изменений не умаляет его значения, потому что величина изменений при углах, меньших 45°, всегда ведет к улучшению зрительных функций и приближает их к показателям нормального глаза. При углах, больших 45°, «побочные» влияния слишком велики и, следовательно, данный метод не эффективен. А при углах, больших 90°, метод лечения даже вреден пациенту, так как уводит показатели зрительных функций в сторону от нормальных. На втором месте по значимости находится критерий, связанный с величиной проекции реальных изменений на направление скорейшего излечения. Положительное значение проекции и ее величина отражают степень улучшения функций, а отрицательное значение этой проекции говорит о вредности метода. Его недостатком является отсутствие сведений о «побочных» изменениях. Критерий эффективности в виде длины вектора реальных изменений лишь говорит о степени влияния метода на пациента и ничего не говорит о
108
Рисунок 6.3 - Гистограмма первого критерия при электростимуляции и миопии слабой степени
Рисунок 6.4 - Гистограмма первого критерия при ВКА и миопии слабой степени
Рисунок 6.5 - Гистограмма первого критерия при сочетании методов и миопии слабой степени направлениях изменений состояния глаза при его использовании. 109
Рефракция, дптр
Подытоживая анализ критериев, можно сказать, что полную информацию об эффективности метода лечения несут любые два из рассмотренных трех критериев. 0
45°
A 1
ОЗ
Рисунок 6.6 - Геометрический смысл второго критерия Проведенные исследования показывают, что высокое значение одного из критериев еще не гарантирует получения хорошего результата для нового пациента с близкими значениями исходных параметров. Например, пациент, стоящий первым в таблице 6.1 (первые два значения) имеет близкие исходные параметры, а результаты лечения по всем трем критериям резко отличаются. Это может быть объяснено как неучетом некоторых важных факторов (передне-задний размер глазного яблока, психологический настрой во время лечения и др.), так и отсутствием научно-обоснованных показаний к назначению того или иного метода лечения. Оценить погрешность полученных значений критериев можно, используя аппарат расчета погрешностей результатов косвенных измерений /110/. При этом, чтобы оценить вклад от погрешности измерения каждого параметра, необходимо найти частные производные от соответствующей формулы (6.1), (6.2), (6.3). Тогда для первого критерия будем иметь погрешность по первому параметру: (V21 – V11)√ V112 + V122 +…+V1n2 σК1V1 = σV1. (4) 2 2 2 V11 + V12 +…+V1n Полную погрешность измерения критерия вычислим, пользуясь геометрической суммой: n
σК1 = √ Σ σ2Vn . 1
110
(5)
6.6 Автоматизация процесса назначения метода лечения
В предыдущем параграфе сравнивалась эффективность действия различных методов лечения, но не менее важна и обратная задача – выбор группы пациентов, для которой лечение конкретным рассматриваемым методом даст гарантированное улучшение зрительных функций. С научной точки зрения задача деления множества пациентов на группы, для лечения которых предпочтителен тот или иной метод, является задачей классификации. Классификация, в свою очередь, требует эффективных классифицирующих признаков (критериев). Три подобных критерия предложены и исследованы выше. Из результатов клинических исследований, описанных выше, видно, что все методы дают размытые критерии их эффективности. С другой стороны, малая размытость этих критериев говорит об устойчивости достижения положительных результатов, о слабой зависимости их от первоначального состояния больного. Поэтому зоны с относительно малой дисперсией критериев и помогут выявить группу больных, для которых данный метод гарантированно дает положительный результат, при условии достаточно большого значения выбранного критерия эффективности. При этом рассмотренные выше критерии необходимо модифицировать заменой абсолютной длины проекции на относительную путем деления на длину вектора необходимых изменений до нормального состояния глаза. Кроме того, для усиления влияния направленности необходимо домножить этот критерий еще раз на косинус угла между векторами. В результате получится несколько иной критерий K4 = √ V112 +V122… +V1n2 * Cos2 α/ √ V212 +V222 +…+V2n2 . (6) Этот критерий, конечно, потеряет информацию по отношению к критерию (2) о методах лечения, ухудшающих состояние глаза, но это не является большим недостатком, поскольку такие методы лечения легко обнаруживаются по первичным данным, без вычисления критериев. К тому же, в результате нелинейности, заложенной в коэффициенте (6), он дальше разносит классы эффективных и слабо влияющих методов лечения миопии. Простое деление замкнутой области, включающей точки, описывающие состояния глаз до лечения, на элементарные объемы не позволяет провести достоверных исследований ввиду большого количества координат многомерного пространства. Даже при делении координатных диапазонов пополам в шестимерном пространстве получится 128 элементарных объемов. Очевидно, что имеющийся статистический материал (около 400 случаев) не позволит сделать достоверные выводы о дисперсии. Поэтому предлагается провести исследование с помощью сканирования замкнутой области, включающей точки, описывающие состояние глаз до лечения, элементарным объемом. На рисунке 6.7 схематично изображено многомерное пространство параметров со сканирующим элементарным объемом. Для упрощения рассмотрены лишь три параметра из шести. На координат111
ных осях выделены диапазоны изменений исходных параметров для всех пациентов и пунктирными линиями построен куб, включающий в себя данные об исходном состоянии глаз всех пациентов (некоторые из этих данных изображены на схеме звездочками). Сканирующий элементарный объем выделен сплошными линиями. При этом вычисленное среднее значение критерия, равно как и его дисперсия, сопоставляются с серединой элементарного объема, отмеченного на схеме кружочком. Выбор размеров элементарного сканирующего объема зависит от количества исходных данных. Для состоятельности оценки дисперсии (при нормальном законе распределения) необходимо не менее сорока значений исходных точек /110/. При выборе размера элементарного сканирующего объема в половину диапазона изменения параметров, объем, включающий в себя Рефракция, дптр
* *
* *
*
* *
*
* * *
* *
*
ОЗ *
ЗА, дптр Рисунок 6.7 – Схема сканирования исходных данных.
112
исходные данные обо всех пациентах, разбивается на восемь частей. При этом имеющиеся четыреста исходных экспериментальных точек дадут по пятьдесят значений в каждой из частей. Учитывая, что это очень близко к статистическим рекомендациям, принимаем размер сканирующего объема в направлении координатных осей в половину размера диапазона изменений параметров. С другой стороны, было желательно уменьшать размеры сканирующего объема, так как это позволит максимально сузить группу пациентов, для которых действие метода наиболее эффективно. Особо необходимо обсудить размер шага сканирования. Принимая гипотезу о равномерном распределении всех исходных данных, можно оценить среднее расстояние между ними. Для четырехсот исходных значений размер шага в направлении каждой из координатных осей должен быть в одну четырехсотую размера диапазона изменений параметров. Учитывая разброс расстояния между исходными точками относительно среднего значения, необходимо выбрать шаг в соответствии с дисперсией этого разброса. Малые значения шага приведут к лишним вычислениям и к временной задержке программы, так как при сдвиге элементарного сканирующего объема будет добавляться и уходить слишком малое количество точек. При большом шаге вычисления будут грубыми, кроме того, шаг не может быть больше размеров сканирующего объема, так как в таком случае не вся экспериментальная информация будет использована. Исходя из этих рассуждений, в данной работе принят шаг сканирования размером в одну пятисотую диапазона изменения параметров, для параметров, изменяющихся непрерывно. Для дискретных параметров шаг можно выбрать равным величине квантования. При сканировании в направлениях, указанных на рисунке 6.7 стрелками, получается новая область точек с определенными значениями критерия и дисперсии (при этом вычисления критериев и дисперсии осуществляются как обычно с учетом результатов лечения выбранным методом, которые на схеме никак не отражены). В этом пространстве необходимо найти точки со значением критерия, близким к максимальному, а значением дисперсии, близким к минимальному. Для этого необходимо сортировать массивы значений критерия и дисперсии. Затем, просматривая значения критерия, начиная с максимального, выбрать точку с минимальной дисперсией. По этим значениям критерия и дисперсии восстановить диапазон исходных параметров (в размерах элементарного сканирующего объема). Этот диапазон и задаст группу пациентов, для которых лечение данным методом гарантировано даст максимальный эффект. Такие исследования необходимо провести для всех, имеющихся в распоряжении врача-офтальмолога, методов лечения. По изложенному выше алгоритму была написана программа на языке Delphi 3. Программа вынесена в приложение. Результаты расчетов по этой программе следующие: Электростимуляция Диапазоны: Острота зрения = [0.08 .. 0.85] 113
Рефракция = [2,75 .. 8,625] Объем аккомодации = [8 .. 10] Запас аккомодации = [2 .. 4] ПЭЧ = [60 .. 95] ЭЛ = [35 .. 52,5] Амблиокор Диапазоны: Острота зрения = [0.02 .. 0.25] Рефракция = [2,75 .. 8,625] Объем аккомодации = [7,5 .. 9,5] Запас аккомодации = [2,5 .. 4,5] ПЭЧ = [60 .. 95] ЭЛ = [25 .. 42,5] Электростимуляция+ Амблиокор Острота зрения = [0.02 .. 0.25] Рефракция = [3,75 .. 9,625] Объем аккомодации = [8 .. 10] Запас аккомодации = [1,5 .. 3,5] ПЭЧ = [90 .. 125] ЭЛ = [35 .. 52,5] При поступлении пациента на лечение врачу необходимо будет лишь определить, в диапазон какого метода лечения входят значения параметров его зрительных функций. Таким образом, вычисляя для множества пациентов этот новый критерий, выбирая зоны с его максимальным значением, мы выделим значения исходных параметров, при которых данный метод лечения гарантированно улучшит зрительные функции. При поступлении больного на лечение врачу необходимо будет лишь определить, входят ли значения параметров, описывающих состояние глаза, в данную группу.
114
7 Автоматизация процесса бурения скважины 7.1 Синтез системы управления процессом бурения
Целесообразность автоматизации процесса бурения нефтяных и газовых скважин обусловлена преодолением ограниченных возможностей человека, то есть придания ему совершенно новых, несвойственных по природе, качеств. Этот процесс недоступен непосредственному наблюдению и управлению, поэтому здесь необходима автоматическая система, состоящая из подсистем слежения за скоростью проходки, за качеством образующейся глинистой корки, за степенью тиксотропности промывочной жидкости. Кроме этого, имеется много других параметров, но эти – главные, отвечающие за себестоимость скважины, а также за эффективность ее дальнейшей эксплуатации. В отличие от предыдущих случаев, здесь необходимо поменять базовый параметр, по которому разворачивается управление, и взять в этом качестве глубину скважины. Тогда на всех трех графиках можно провести уровень минимальных требований к указанным параметрам (рисунок 7.1). Всплески на нижнем графике, так же как и провалы на верхнем, обусловлены остановами процесса бурения для проведения спуско-подъемных операций или в связи с возникшими осложнениями. На среднем графике всплески объясняются водопроявлениями или водопоглощениями, а также возрастающими требованиями к качеству глинистой корки при прохождении продуктивного пласта для того, чтобы избежать его засорения фильтратом промывочной жидкости. Как видим, средняя скорость проходки с ростом глубины скважины падает. Это обусловлено возрастанием времени проведения спуско-подъемных операций, возрастанием твердости разбуриваемых пород, ухудшением условий очистки забоя, некоторым падением перепада давления на турбине и так далее. Требования же к качеству промывочной жидкости, наоборот, с возрастанием глубины увеличиваются. Поэтому даже минимальные уровни требований к этим параметрам приводят к перекрытию верхних половин графиков и, следовательно, к необходимости синтеза мультиструктурной системы управления параллельного действия. Она также является многофункцио115
нальной, так как за счет управления обеспечивается выполнение основных функций промывочной жидкости и инструмента. Тем не менее, на начальном участке бурения все ресурсы необходимо направлять на увеличение скорости проходки, то есть здесь можно применить систему управления последовательного действия. Такая стратегия подтверждается анализом практической информации филиала производственного объединения "Оренбургбургаз", представленного на рисунке 7.2. Как видно из графика, ориентировочная глубина переключения с последовательной на параллельную систему составляет 1700 м. На практике улучшение реологических свойств промывочной жидкости осуществляют на уровне 1500 м, совмещая этот процесс со спуском обсадной колонны. Поскольку с ростом глубины скважины возрастают требования к реологическим свойствам промывочной жидкости, а технологические параметры уже подвергались серьезному анализу /111/, дальнейшие исследования посвятим реологическим аспектам бурения. Процесс бурения скважины, а также последующие показатели ее эксплуатации, в сильной степени зависят от состояния применяемой промывочной жидкости (с ростом глубины скважины требования к реологическим свойствам промывочной жидкости возрастают как выяснено выше). Под состоянием понимаются как ее реологические свойства (вязкость, тиксотропия), так и гидравлические (давление, расход) и физико-химические (водоотдача, теплоемкость).
116
V, м/сут Требования к качеству глинистой корки н/м2
30
1000
ГЛУБИНА, м
Требования к тиксотропии раствора н/м2
100 1000
ГЛУБИНА, м
10 1000
ГЛУБИНА, м
Рисунок 7.1 – Зависимость основных параметров бурения от глубины скважины
Потери, тыс. руб.
100
1
2 1000
Глубина, м 117
1 - график потерь от 5% снижения скорости бурения; 2 - график потерь от осложнений при бурении. Рисунок 7.2 - Графики потерь от снижения скорости бурения и возрастания количества и тяжести осложнений При этом очень важна точность поддержания технологических режимов бурения, которая может быть достигнута лишь за счет хотя бы частичной автоматизации этого процесса. Автоматизация же возможна с помощью синтеза многоуровневой системы управления. На самой вершине (самом высоком уровне) дерева формулируется цель управления. При автоматизации этого процесса нет необходимости рассматривать все дерево целей и подзадач управления, так как ветвление начинается только на уровне функций. Они задают переменные уставки, которые и реализуют непосредственное управление состоянием промывочной жидкости. По этому признаку такую систему управления можно назвать многофункциональной.
118
Схема такого управления представлена на рисунке 7.3. F
Подсистема распознавания
Устройство выбора функции
Охлаждение инструмента
С
Промывка
P
U
Ц
СУ
Q Вращеη Удержа-
Объект управления – состояние промывочной жидкости
Y
τ0 В
Образование корки
Рисунок 7.3 – Схема многоуровневого управления Здесь применяются следующие обозначения: Y – вектор выходных показателей (скорость бурения, качество глини-
стой корки на стенке скважины, давление на забое, появление осложнений при бурении, расход инструмента), F – вектор возмущающих воздействий (свойства разбуриваемой породы,
качество ингредиентов промывочной жидкости, стабильность работы буро119
выхнасосов, состояние инструмента и т.д.), U – вектор управляющих воздействий на состояние промывочной жид-
кости (С - теплоемкость, P – давление нагнетания, Q - расход промывочной жидкости, η - вязкость, τ0 – тиксотропные свойства, В – водоотдача), Ц – цель управления: получение высокой производительности при минимизации затрат и должном качестве скважины (отклонения от вертикали, инфильтрация продуктивного пласта и т.п.), СУ – субъект управления. В данной схеме большая роль отводится подсистеме распознавания, которая, пользуясь информацией от имеющихся датчиков – скорости бурения, температуры промывочной жидкости, расхода и давления нагнетания, реологических свойств, определяет технологическое состояние процесса бурения. Устройство выбора управляющей функции на основе этой, а также некоторой другой информации – свойствах разбуриваемой породы, качества глинистой корки на стенках скважины, наличия осложнений и т. д., выбирает управляющую функцию, реализация которой внесет необходимую коррекцию в технологический процесс бурения. При этом выбранная функция усиливает свое воздействие, а остальные функции несколько подавляются. Как видно из схемы, на большинство устройств, задающих уставки, воздействует более одной функции. Следовательно перед ними должны быть установлены сумматоры с определенным весом связи каждой воздействующей функции. К тому же субъект управления может вмешаться в работу любого элемента управления и поменять уставки, изменить алгоритм управления, добавить дополнительную информацию в систему. Такая схема управления позволяет устранить взаимные связи между управляющими воздействиями, тем самым улучшая качественные показатели системы управления. Таким образом, применение разработанной многоуровневой схемы управления позволит в высокой степени автоматизировать контроль технологических параметров процесса бурения и гарантированно управлять качеством пробуренной скважины при сохранении высокой скорости бурения и низком расходе инструмента. 120
8 Управление безопасностью при эксплуатации промышленных объектов Стратегию управления промышленной безопасностью региона необходимо строить на основе метасистемного подхода. При этом решается шесть задач, суть которых значительно отличается от описанных ранее. Термин промышленная безопасность появился сравнительно недавно. Ранее все, что стоит за этим понятием, относилось к охране труда. «Переходным» термином можно считать – технику безопасности. Изменение названий в данном случае влечет за собой изменение сущности, так как меняется объект исследования, управления, наконец, объект, на который направлена деятельность в области промышленной безопасности. Промышленная безопасность – это область науки и техники, изучающая причины возникновения, закономерности проявления и развития, методы и средства превентивного и текущего управления природными и техногенными явлениями разрушительного и пожароопасного характера, сопровождающимися значительным ущербом /112/. Основная деятельность в области промышленной безопасности должна сводиться к мероприятиям, выявляющим и предотвращающим природные и техногенные проявления, приносящие вред здоровью общества либо экономические, материальные потери и естественно она должна быть сознательной, оптимально управляемой. С точки зрения управления процессами необходимо иметь «датчики» информации о состоянии опасных промышленных объектов и «рычаги (каналы)» управляющих воздействий на выявленные опасности, промышленного характера. Схема системы управления уровнем безопасности, о необходимости которой известно давно /113/, изображена на рисунке 8.1. В отличие от упомянутой работы она носит не комплексный, а метасистемный и даже матричный /114/ характер, то есть состоит из нескольких довольно независимых между собой систем - отдельных предприятий и объектов в одном направлении и нескольких уровней иерархии управления (уровней предприятия, опасного объекта, опасных мест и технологий повышения безопасности) в другом. В качестве «датчиков» информации для принятия решения используется достаточно развитый сегодня институт экспертизы опасных промышленных объектов. Управляющие же воздействия ввиду явной иерархичности процесса управления будут разными в зависимости от уровня. На верхних уровнях воздействия будут в основном экономическими, на нижних уровнях они сводятся к техническим мероприятиям и режимам (технологиям повышения безопасности). Метасистемный характер управления требует решения шести задач /11/. Применительно к управлению промышленной безопасностью смысл этих задач кардинально меняется.
121
1) выявление условий и границ диапазонов значений факторов, при которых возникает опасность от того или иного промышленного объекта; 2) разработка стратегии направления управляющих воздействий на наиболее опасные объекты; 3) определение объемов и последовательности мероприятий (а также их проведение), снижающих опасность конкретного объекта (в соответствии с выбранной стратегией); 4) выявление общих аспектов опасности объектов с целью оптимизации набора, снижающих опасность технологий; 5) оптимальное перераспределение ресурсов между объектами с одинаковым рангом опасности; 6) ограничение общего количества объектов, влекущих наибольшую опасность. С помощью экспертизы выявляется на уровне региона ранжированный ряд опасных предприятий, на уровне предприятия – ранжированный ряд опасных объектов и сооружений, на уровне опасных объектов - ранжированный ряд опасных мест, и, самое главное этот ряд увязывается с диапазоном
122
• • •
Мониторинг безопасности
Изменение внешних условий
Технология 1111 Технология 1112 • • • Технология 111L •
•
•
Уровень опасных пред-тий
Уровень опасных установок и сооружений
Уровень опасных мест
Объект управления – уровень безопасности региона
Опасное место 111 Опасное место 112
• • •
Опасное место 11K
•
Установка 11
•
Установка 12
Предприятие 1
•
Выбор и реализация оптимальной технологии повышения безопас-сти
Предприятие N
Цель – поддержание безопасности региона на максимальном уровне
оптимальное перераспределение региональных ресурсов
Оптимальное перераспределение ресурсов, выделенных на установку
Установка 1M
Оптимальное перераспределение ресурсов предприятия
Уровень технологий повышения безопасности
Рисунок 8.1 – Система управления уровнем безопасности региона 123
значений факторов, в которых опасность от конкретного объекта повышается до предельной. Это необходимо для построения многомерного пространства, в котором конкретные условия в регионе будут давать изображающую точку (или некоторую область вокруг этой точки в силу приблизительности многих оценок), по движению которой может быть спрогнозирована стратегия направления управляющих воздействий. Сама стратегия должна определять моменты переключения управленческого внимания, а также количество опасных объектов, принимаемых во внимание на каждом промежутке времени. При этом для ее разработки может использоваться метод, отличающийся от вышеописанного, что приведет к соответствующему изменению первой задачи метасистемного подхода. Третья задача, решаемая при метасистемном подходе к управлению уровнем промышленной опасности в регионе, диаметрально противоположна обычному подходу, когда система, входящая в метасистему, заранее готовилась к использованию (включению) /115/. В данном случае все мероприятия направлены как раз на отстранение опасного объекта от попадания в зону управления. Следовательно критерий оптимизации, разработанный в /115/ в виде разности плотностей вероятности потребности в системе и готовности ее к использованию меняется на разность плотности вероятности (ω), что внешние и внутренние неуправляемые параметры выведут данный объект на предел опасности и вероятности (ω1) того, что проводимые мероприятия «уведут» его от этого s = ω − ω1 . (8.1) Понятно, что новый критерий должен максимизироваться в отличие от известного. Данный критерий требует даже прекращения эксплуатации опасного промышленного объекта при достижении им критического значения. Таким образом, возникает задача поддержания низкого уровня опасности объекта, за счет различных мероприятий, несмотря на изменение неуправляемых параметров. Внешним (возмущающим) процессом при управлении является резкое изменение таких параметров как ресурс опасного объекта, неблагоприятная экологическая, экономическая обстановка, соседство с другими опасными и некоторых других, описываемых вектором X. Считая этот процесс марковским, воспользуемся уравнением Колмогорова с правой частью: ∂ω ∂ω b(X, t ) ∂ 2 ω = f (t) , (8.2) + a ( X, t ) − 2 ∂X 2 ∂t ∂X где а – коэффициент сноса;
b – коэффициент диффузии; f(t) – возмущающее воздействие. Для адекватного функционирования метасистема, включающая набор средств снижения риска аварии, должна подчиняться тому же уравнению, что и внешний процесс (для адекватного реагирования) с добавлением в пра-
вой части управляющего воздействия – u(X,t). Самостоятельность метасистемы выражается не только в появлении управляющих воздействий, но и в другой величине плотности вероятности, которая отражает вероятность приближения риска аварии к недопустимой границе – ω1. Таким образом, уравнение (2) преобразуется к следующему виду: ∂ω1 ∂ω1 b(X, t ) ∂ 2 ω1 + a ( X, t ) − = f ( t ) + u ( X, t ) , (8.3) ∂t ∂X 2 ∂X 2 Принимая, что оба процесса подвергаются одинаковым возмущениям, и подставляя сюда вместо f(t) его выражение из уравнения (2), после приведения подобных членов, получаем: ∂ (ω − ω1 ) ∂ (ω − ω1 ) b(X, t ) ∂ 2 (ω − ω1 ) + a ( X, t ) − = u (X, t ) . (8.4) ∂t ∂X 2 ∂X 2 Используя (1) преобразуем уравнение (4) к следующему виду ∂s ∂s b(X, t ) ∂ 2s = u ( X, t ) . (8.5) + a ( X, t ) − ∂t ∂X 2 ∂X 2 Теперь можно сформулировать задачу оптимизации. В качестве критерия оптимальности можно было бы принять сумму потерь от малой разности двух вероятностей и затрат на рискоснижающие мероприятия, которые можно оценивать в соответствии с /115/ с помощью виртуальной работы управляющих воздействий:
A(σ ) =
t
∞
1 ∫ ∫ u (X, τ) σ 2π e
−
X2 2σ 2
dXdτ
(8.6)
−∞ −∞
В данном случае принят закон распределения Гаусса с дисперсией σ для вероятности отклонения потребности от среднего значения. Однако в этом случае приходим к вырожденным уравнениям Эйлера, которые не позволяют определить минимум. Примем в соответствии с теорией аналитического конструирования оптимальных регуляторов, предложенной профессором Летовым А.М. /116/, в качестве критерия оптимальности сумму квадратов потерь, зависящих от разности вероятностей (1) и затрат управляющих воздействий: τ
F = ∫ (u 2 − qs 2 )dt → min
(8.7)
0
где q – размерный коэффициент. В такой постановке задача оптимизации включает критерий (8.7), уравнение (8.5) с соответствующим начальным и граничными значениями, играющее роль некоторых условий обязательных к выполнению. Кроме того, в зависимости от времени начала рискоснижающих мероприятий по отношению к возникающей возможности повышения опасности, меняется интенсивность проведения этих мероприятий и соответственно затраты на управ125
ление. Это означает, что имеет место задача с подвижной верхней границей, а, значит, на этой границе должно выполняться условие трансверсальности экстремалей функционала (8.7) кривой, по которой скользит верхняя граница. Таким образом, сформулированная задача позволяет определить оптимальный закон изменения управляющих воздействий, направляемых на поддержание вероятности повышения опасности на приемлемом уровне во времени и в зависимости от изменения внешних условий. Данная задача оптимизации относится к классу задач на условный экстремум и сводится к классическому случаю с помощью одного множителя Лагранжа λ: τ ds ∂s b ∂ 2 s 2 2 F1 = ∫ (u − qs + λ + a (8.8). + − u )dt → min 2 dt x 2 ∂ x ∂ 0 Для нахождения экстремалей данного функционала составляем три уравнения Эйлера: ∂f d ∂f − = 0; ∂s dt ∂s& ∂f d ∂f − = 0; ∂u dt ∂u& ∂f d ∂f − =0 (8.9) ∂λ dt ∂λ& где f – подынтегральное выражение функционала (8.8). Здесь точка сверху символа означает производную по времени. Выполняя дифференцирование, имеем: dλ − 2qs − = 0; dt 2u + λ = 0; ds ∂s b ∂ 2 s +a + − u = 0; (8.10) ∂x 2 ∂x 2 dt Сюда же добавляем условия трансверсальности на подвижной верхней границе функционала /117/ (8.11) ( f + (ϕ& − s&) f s&' ) |t =τ = 0 где φ - уравнение кривой, по которой скользит верхний предел функционала. Здесь штрих сверху символа означает дифференцирование по параметру, приведенному в качестве нижнего индекса. Для использования этого условия необходимо знать зависимость разности вероятностей s от интенсивности проведения рискоснижающих мероприятий. Очевидно, что чем выше эта интенсивность (обусловленная резким изменением условий) тем больше вероятность того, что подготовительные мероприятия в срок не завершатся. Поэтому примем указанную зависимость в первом приближении линейной.
126
С другой стороны, необходимо знать, как интенсивность проведения рискоснижаяющих мероприятий зависит от времени. Понятно, что чем больше времени на проведение мероприятий, тем интенсивность их проведения ниже. И наоборот, она возрастает до бесконечности, если время на их проведение приближается к нулю. Следовательно, окончательную зависимость можно принять гиперболической: A ϕ = k (8.12),
τ
где k – коэффициент пропорциональности, а виртуальная работа А вычисляется по формуле (8.6). Теперь можно провести вычисления по формуле (8.11). Они дают: ds A ds ∂s b ∂ 2s {u 2 − qs 2 + λ ( + a (8.13). u ) ( k − + − − )λ} | t =τ = 0 + dt ∂x 2 ∂x 2 τ 2 dt С помощью второго уравнения (8.10) можно исключить λ из дальнейших выкладок, а третье уравнение, как уравнение экстремали, обязательное к выполнению везде, а значит и на границе диапазона изменения t, упрощает уравнение (8.13): A ds {u 2 − qs 2 + (− k 2 − )λ} | t =τ = 0 (8.14). dt τ Из этого уравнения можно определить оптимальное время τ, необходимое на рискосохраняющие мероприятия. Производя все необходимые подстановки в третье уравнение (8.10) получаем: 1 d 2u a ∂ 2u b ∂ 3u −u =0 (8.15). + + q dt 2 q ∂x∂t 2q ∂x 2 ∂t Четвертая задача имеет особое значение в связи с унификацией средств повышения промбезопасности. При отыскании опасностей одинакового или близкого характера в разных и многих объектах можно оптимизировать арсенал средств, отработать и сделать их высоконадежными. Тем самым можно экономить средства на дорогостоящих, но редкоиспользуемых технологиях. Пятая задача посвящена одному из самых важных вопросов - об оптимальном перераспределении финансовых, материальных и кадровых ресурсов, позволяющих максимизировать уровень промышленной безопасности региона, предприятия, объекта или сооружения. Можно конечно равномерно «размазать» средства по всем опасным предприятиям и объектам. Ясно, однако, что при этом общий уровень безопасности не будет максимальным. Необходимо «кумулятивно» расходовать средства в самых опасных местах, тогда эффект будет наибольшим. При самом крупном делении оптимизируются средства, выделяемые на экспертизу с одной стороны и на повышение безопасности с другой. Эти два аспекта противоречивы: уменьшая степень осведомленности о потенциальных опасностях (затраты на экспертизу), увеличиваем расходы на повышение уровня безопасности, но рискуем допустить большие потери от необнару127
женной неглубокой экспертизой опасности и наоборот. Следовательно, необходимо оптимизировать суммарные затраты: N
∑ [З i + П(З i )] → min
(8.16),
i =1
где N – последовательно, в зависимости от уровня, на котором решается задача оптимизации – количество опасных предприятий в регионе, опасных объектов на предприятии, опасных мест в конкретном опасном объекте, Зi – текущие затраты на экспертизу. Если известна зависимость потерь от глубины экспертизы (осуществляемых на нее затрат), а также ограничения, налагаемые природой опасного объекта Зi ∈ Zi , и коэффициенты ранжирования опасностей, то минимизацией данного критерия можно оптимально перераспределить выделяемые ресурсы. Получив размер затрат, направляемых на осуществление экспертизы, можно вычитанием их из общей суммы, выделяемой на повышение уровня безопасности, получить размер средств, которые можно потратить на технологические приемы, снижающие риск аварий. Распределение этих средств по опасным объектам также может быть оптимизировано. Для этого необходимо минимизировать следующий критерий N
∑ [Ti + П(Т i )] → min
(8.17),
i =1
где Тi – последовательно, в зависимости от уровня, затраты на повышение безопасности предприятия, объекта на предприятии, конкретной зоны объекта (опасного места), наконец на реализацию конкретной технологии повышения безопасности, вплоть до повышения квалификации персонала, П(Тi) – потери от выбора не лучшей технологии (в силу недостатка средств) либо от проведения ее не на лучших режимах. Опять-таки, если известна зависимость потерь от эффективности технологии (осуществляемых на нее затрат), а также ограничения, налагаемые природой опасного объекта Ti ∈ ℑ i , и коэффициенты ранжирования опасностей, то минимизацией данного критерия можно оптимально перераспределить выделяемые на повышение безопасности ресурсы. Наконец, последняя задача метасистемного подхода связана с синтезом метасистемы. Здесь необходимо определиться в первую очередь с критерием, по которому будут проранжированы все опасные объекты. Тогда включать в метасистему придется наиболее опасные до того момента, пока не кончатся выделенные для этого ресурсы. Таким критерием может быть отношение возможных от промышленной аварии потерь, умноженных на риск аварии к затратам, которые необходимы, чтобы данных потерь избежать.
128
9 Метасистемная модель функционирования сортировочной станции Уменьшение объёмов железнодорожных перевозок при существующей большой организационно-технологической структуре ведёт к повышению их стоимости, к резкому снижению эффективности работы сортировочных станций. В этих условиях возрастает необходимость оптимизации имеющихся кадровых и материальных ресурсов, гибкого реагирования на быстроизменяющуюся транспортную обстановку. Кроме того, имеется тенденция к обособлению, специализации многих служб. Например, обслуживание пассажирских поездов выделяется в отдельное предприятие внутри общероссийской железнодорожной компании. В таких условиях железнодорожное хозяйство и сортировочная станция адекватнее всего представляются совокупностью нескольких независимых систем метасистемой. В системологии Дж. Клира /1/ существуют два способа интегрирования систем в единое целое: образование структурированной системы путём выделения подсистем первого уровня и дальнейшего дробления их на подсистемы второго, третьего и т. д. уровней или создание метасистемы из нескольких систем и выбор в каждый момент одной или нескольких функционирующих с помощью правила замены. Эти два способа характеризуются тремя существенными отличиями. В структурированной системе: - элементы связаны непосредственной (информационной) связью; - все элементы задействованы во время функционирования системы; - синтез проводится по принципу полноты и достаточности. В метасистеме: - каждый элемент самодостаточен и связан с другими элементами лишь косвенно, через верхний уровень управления; - в каждый момент времени задействован лишь один или несколько элементов, то есть имеются простаивающие и неиспользуемые элементы; - количество элементов в метасистеме не является строгим; элементы могут дробиться, интегрироваться, к метасистеме могут добавляться новые элементы, либо исключаться наименее эффективные. Сортировочная станция является сложным и ответственным объектом управления, который характеризуется быстрым изменением обстановки. Принятие неправильного решения в таких условиях резко снижает эффективность ее функционирования, может привести к непоправимым последствиям. К тому же повышение быстродействия ответной реакции требует опережения, а следовательно, прогнозирования складывающейся обстановки. Большие объёмы информации и требуемая скорость ее обработки делают необходимым применение систем компьютерной поддержки, функционирующих так же как и сама сортировочная станция на метасистемном принципе. Докажем последнее положение. 129
При функционировании сортировочной станции явно выделяются несколько слабо связанных структур: пассажирского обслуживания, путевого хозяйства и сооружений, грузовых перевозок, локомотивного и вагонного обслуживания, сигнализации централизации и блокировки, материальнотехнического обеспечения, информационного обслуживания и так далее. Во время приёма и обслуживания поездов не все эти структуры задействованы. Например, при обслуживании грузовых поездов пассажирская служба не используется. Лишь при необходимости используются: снегоочистка, пожаротушение, восстановительный поезд и так далее. Количество служб (систем) на сортировочной станции может меняться в зависимости от объёма работ, средств. Например, при большом объёме сортировочной работы создаются две горочные системы. И наоборот, при уменьшении объёмов перевозок объединяются локомотивные депо, закрываются станции. По этим трем признакам функционирование сортировочной станции носит явно выраженный метасистемный характер. При метасистемном подходе необходимо решить следующие типовые задачи /11/: - выявление диапазонов эффективного функционирования систем; - оценка и повышение необходимого уровня готовности систем к использованию; - выявление и обеспечение сочетаемости, согласованного взаимодействия систем; - разработка стратегии переключения отдельных или групп одновременно функционирующих систем; - оптимальное перераспределение ограниченных общесистемных ресурсов; - оптимальный синтез метасистемы. Метасистемный анализ удобнее всего начинать с выявления диапазонов оптимального функционирования систем, поскольку на их основе в дальнейшем удобно разрабатывать стратегию выбора. При решении этой задачи важно помнить, что метасистема возникает там и тогда, где и когда диапазон решаемой задачи настолько велик, что он не перекрывается использованием одной системы, либо эта система функционирует неэффективно в некоторых частях общего диапазона. Поэтому и возникает задача выявления границ, разделяющих поддиапазоны эффективного функционирования систем. Применительно к сортировочной станции легко проводятся границы между службами, задействованными при приёме грузов или пассажиров, транзитных или разборочных поездов. Труднее разделить функции пункта технического обслуживания поездов. Здесь необходимо искать дополнительные параметры при приёме разных типов поездов: длина состава, скорость его движения, выделяемые пути для их остановки и так далее. Главными функциями сортировочных станций являются разборка и формирование составов, а также обслуживание транзитных поездов. Поэтому 130
актуален вопрос определения количества горочных систем. Диапазоны эффективности показаны на рисунке 1 в координатах объёмов чётного и нечётного грузопотоков, требующих сортировочных работ. При малых объёмах горка может находиться с чётной или нечётной стороны. Граница между этими системами при условии их равноправности проходит под углом 45 градусов. При возрастании объёмов становится эффективной двухгорочная система. Границы диапазонов эффективности могут изменяться в зависимости от изменения условий функционирования сортировочной станции. Например, чётный грузопоток возрастает за счёт взрывоопасных грузов, которые нельзя спускать с горки. В этом случае граница между одногорочными системами поднимется на угол больше, чем 45 градусов. Равное возрастание таких грузов в чётном и нечётном направлениях приведёт к отодвиганию границы двухгорочной системы. Это означает, что компонента выявления границ эффективности в системе компьютерной поддержки должна работать с некоторой регулярностью. Другим актуальным вопросом является объединение или разделение транзитного и отправочного парков. На рисунке 2 изображены области эффективности в координатах объёмов транзитных и сортировочных работ. Поскольку при приёме и обслуживании разных типов поездов некоторые службы не задействованы, возникает вторая задача по оценке и поддержанию необходимого уровня готовности этих служб к действию. Так как момент начала работы этих служб носит вероятностный характер, оценивать уровень их готовности удобнее всего плотностью вероятности, а для его поддержания необходимо организовывать комплекс мероприятий. Особенно актуален этот вопрос для редко используемых функциональных звеньев: снегоочистки, пожаротушения, восстановительного поезда. Готовность службы (Pсл) к функционированию складывается из готовности техники и сооружений (Pт), кадров( Pк), документов( Pд), информационного(Pио) и энерго- обеспечения (Pэо): Pсл = Pт Pк Pд Pио Pэо. Данная формула позволяет построить сетевой график выполнения мероприятий, поддерживающих или повышающих уровень готовности служб к действию. Например, подготовительные мероприятия службы перевозок при встрече грузового поезда, приходящего в расформирование сведены в таблицу 1 с указанием их вида и последовательности. Таблица 9.1 - Последовательность проведения подготовительных мер-тий Подготовительные Порядок мероприятия следования 1 Получение телеграммы- натурного листа ТГНЛ (сообщения 02) оператором станционного технологического центра (СТЦ) станции расформирования 1 2 3 131
Продолжение таблицы 9.1 1 2 2 Получение плана подвода поездов оператором станционного технологического центра и его обработка 3 Выдача автоматизированной системой оперативного управления перевозками (АСОУП) плана прибытия поездов маневровому диспетчеру 4 Выдача АСОУП итоговой части натурного листа 5 Получение дежурным по станции сообщения с соседней станции об отправлении поезда 6 Приготовление дежурным по станции маршрута приёма поезда 7 Извещение работников СТЦ, пункта технического осмотра (ПТО), пункта коммерческого осмотра (ПКО), маневрового диспетчера о номере, времени и пути приёма поезда 8 Выход работников ПТО с материалом, инструментом на путь приёма поезда 9 Выход работников ПКО с материалом, инструментом на путь приёма поезда 10 Фиксация через телетайп оператором СТЦ во входной горловине номеров вагонов прибывшего поезда 11 Выдача маневровому диспетчеру оператором СТЦ размеченной ТГНЛ и ее рассогласования с фактическим состоянием (сообщение 09) 12 Доставка пневмопочтой грузовых документов в СТЦ 13 Прибытие поезда на путь парка приёма 14 Ввод в АСОУП оператором при дежурном по станции информации о времени фактического прибытия поезда, корректировка модели парка приёма 15 Отцепка поездного локомотива локомотивной бригадой 16 Отпуск тормозов, ограждение состава работниками сетевого ПТО 17 Сверка документов и ТГНЛ операторами СТЦ 18 Технический осмотр и обслуживание вагонов работниками ПТО 19 Коммерческий осмотр состава работниками ПКО 20 Снятие ограждения и доклад в СТЦ работников ПТО, ПКО 21 Корректировка оператором СТЦ специализации путей сортировочного парка, сведений о вагонах прибывшего поезда (сообщения 09) и передача сортировочного листа работникам по расформированию 132
3 После 2 После 1 После 5 После 5
После 7 После 7 После 6 После10 После10 После10 После13 После13 После15 После12 После16 После16 После18 После17
Продолжение таблицы 9.1 1 2 22 Извещение маневровым диспетчером машиниста горочного локомотива о начале надвига состава на пути парка приёма
3 После21
V четного грузопотока
Сетевой график подготовки к роспуску состава на односторонней сортировочной станции представлен на рисунке 9.3. Выявление сочетаемости технологий, связанных с функционированием сортировочной станции, заключающейся в использовании одного и того же
Двухгорочная
Четная горка
Нечетная горка
V нечетного грузопотока
Объем транзитных вагонопотоков
Рисунок 9.1- Области эффективности горочных систем
Транзитный парк Объединенный парк
Отправочный парк
Объем сортировочных вагонопотоков
Рисунок 9.2 – Области эффективности парковых систем 133
Маневровый диспетчер
3
оператор СТЦ
11
21
2
10
1
12
20
17
4
610 Дежурный по станции 5 7
13
Локомот. бригада, машинист горочн. локомот.
14
22
15
8
ПТО
18
ПКО 9
15
19
Рисунок 9.3 – Сетевой график подготовки к роспуску состава 134
оборудования, инструмента или кадров, позволяет максимально сократить расходы, повысить коэффициент использования оборудования, а также общую эффективность функционирования. Например, техническое обслуживание ходовых частей грузовых и пассажирских вагонов выполняется одной и той же бригадой пункта технического обслуживания. В разные моменты времени уровни готовности служб меняются, например, не нужен высокий уровень готовности службы снегоочистки летом, а зимой может быть несколько снижен уровень готовности службы пожаротушения из-за уменьшения вероятности пожара. Как видим, на поддержание уровня готовности, а тем более на его повышение, требуются определенные затраты. Определение минимально достаточного уровня готовности служб в разные моменты времени (создание и мониторинг карты готовности служб) и минимизация этих затрат является, следовательно, актуальной задачей. Анализ сочетаемости технологий погрузки – выгрузки, используемых на транспортно-складском комплексе (грузовом дворе), входящем в состав сортировочной станции, позволяет определить необходимость организации дополнительных технологий, либо исключения действующих, но малоэффективных. Для этого необходимо рассчитать коэффициенты удельного эффекта – отношение эффекта (Э), даваемого технологией к затратам на ее организа цию (З) с учетом перекрытия по оборудованию и кадрам с имеющимися технологиями, отражаемого матрицей перекрытий (С) /115/ Э . η= З (С ) Если этот коэффициент высок для технологии, планируемой к внедрению по сравнению с имеющимися, то необходимо принять решение об ее использовании и наоборот имеющиеся технологии с низким коэффициентом удельного эффекта необходимо исключать. Например, оснащение погрузчика для тарно-штучных грузов дополнительными захватами позволяет при небольших затратах внедрить прогрессивную технологию пакетирования грузов. Большие требования предъявляются железной дорогой к согласованности служб сортировочной станции. Общая схема согласования действий служб должна осуществляться в соответствии с моделью, изображенной на рисунке В соответствии с предложенной моделью сортировочная станция рассматривается в качестве объекта управления (смотри рисунок 9.4). Главным возмущением, действующим на данный объект, является тип принимаемого поезда. Автоматизированная система управления сортировочной станции (АСУСС), получая информацию о типе поезда, выбирает необходимые службы и согласует взаимодействие между ними. 135
Для повышения скорости обслуживания принимаемых поездов АСУСС должна прогнозировать последовательность поступления поездов на станцию, разрабатывать планы взаимодействия необходимых служб, то есть решать четвёртую задачу метасистемного подхода - разрабатывать стратегию привлечения служб. При этом необходимо использовать график движения поездов, а вероятность его выполнения оценивать на основе имеющегося предыдущего статистического материала. При своём функционировании метасистема использует некоторые общесистемные ресурсы (кадры, денежные и материальные средства, оборудование, инструмент и так далее), которые почти всегда ограничены. Оптимальное перераспределение этих ресурсов между системами позволит увеличить эффективность на метасистемном уровне. При этом ресурсы могут перераспределяться как во время функционирования нескольких систем, так и в ре
136
Принимаемый поезд АСУ сортировочной станции
Служба пассажирских перевозок Служба грузовой коммерческой работы ● ● Служба● формирования состава (горка) Служба путевого хозяйства и сооружений
Объект управления сортировочная станция
Локомотивная служба Служба сигнализации, централизации, блокировки
Рисунок 9.4- Метасистемная модель функционирования сортировочной станции жиме их ожидания, так как на поддержание их в определённой степени готовности также расходуются средства. Все рассмотренные выше задачи вносят свой вклад в решение последней задачи - синтеза оптимальной метасистемы. Применительно к сортировочной станции речь идёт о количественном и качественном наборе служб. В зависимости от уровня грузо - и пассажиропотоков структура метасистемы 137
может гибко меняться, привлекая дополнительные службы, либо исключая малоэффективные. Таким образом, метасистемный подход к функционированию сортировочной станции позволяет оптимально регулировать количество служб, решать соответствующие задачи (в том числе в нештатных ситуациях) и позволяет за счет оптимизации резко повысить эффективность ее работы.
138
10 Метасистемный подход к автоматизации выбора технологии проведения авиационно-химических работ При автоматизации процесса принятия решения о выборе технологии проведения авиационно-химических работ (АХР) возникает ряд проблем. Представляется возможным разрешить их путем применения разработанного методологического подхода к внутренней организации авиационного специализированного комплекса (АСК). 10.1 Доказательство метасистемности процесса выбора технологии проведения АХР
Поскольку потенциальные возможности АСК оцениваются совокупностью технологий, целесообразно определить понятие технологии с учетом определяющих ее параметров. 10.1.1 Выявление параметров, определяющих технологию проведения АХР На технологию проведения АХР оказывают влияние факторы, сведенные в таблицу 10.1. Определяющие факторы сгруппированы профессором Н.З. Султановым в /118/ по принадлежности к подсистемам АСК. В виду структурной сложности АСК и наличия функциональных взаимосвязей всех параметров необходимо выделить главные параметры, наиболее характерно влияющие на остальные. С этой целью АСК условно разделяется на функциональные подсистемы: сельскохозяйственные летательные аппараты (СЛА), АХР и наземный комплекс (НК), обладающие определенной автономностью. Координация согласованности действий этих подсистем возложена на подсистему управления, выполняющую ряд диспетчерских, надстроечных функций.
139
Таблица 10.1 - Параметры АСК, определяющие технологию проведения АХР. Параметры ЛА Параметры АХР Параметры НКМ 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
2 Тип ЛА Схема ЛА (варианторазмер) Летно-технические характеристики Силовая установка
3 Вид работ Метод внесения
4 Количество взлетнопосадочных полос (ВПП) Состояние ВПП
Объем (количество) АХР Дальность перелета
Условия базирования Наличие складских помещений Шасси Длина рабочего гона Наличие авиационнотехнической базы (АТБ) Уровень механизации Высота перелета Удаленность Геометрические данВысота обработки Наличие и номенкланые тура складских механизмов Весовые данные Ширина захвата Средства загрузки Аэродинамические Время загрузки Геологические услоданные вия Технологичность Расход химикатов Состояние РД Условия эксплуаАгротехнические Состояние КПБ, тации и базирования сроки (периоды) БПБ Надежность Климатические условия Состояние МС, ЗПЛ Стоимость Территориальные усло- Количество мест стовия янки Производительность Скорость обработки Размерность Энерговооруженность Служебно-технические помещения Ремонтопригодность Состояние грунта Службы управления воздушным движением (УВД ) Объем АХР
Ввиду большого числа параметров, влияющих на формирование технологии проведения АХР, учет всех параметров приводит к необоснованному росту размерности задачи. Поэтому количество учитываемых параметров сводится к рациональному минимуму. В результате, из общего числа параметров выделяются следующие, определяющие понятие технологии: высота 140
обработки, расход химикатов, скорость обработки, длина рабочего гона, длина перелета, агротехнические сроки (периоды), объем АХР. 10.1.2 Принципиальные отличия системы от метасистемы Согласно /119/ определение системы включает понятия структуры, функции, элемента (подсистемы), процесса, связи, управления и поведения. В соответствии с системологией Дж. Клира /1/ существует два способа интегрирования систем: создание структурированной системы или метасистемы. В первом случае система разбивается на подсистемы, которые в свою очередь дробятся на подсистемы второго уровня, третьего уровня и т.д. Во втором случае система формируется на основании правила замены, когда из некоторого набора систем в каждый момент выбирается одна или некоторая группа функционирующих систем. Покажем правомерность метасистемного подхода к авиационному специализированному комплексу. Подсистемы АСК функционируют, как правило, в режиме разделения времени и осуществляют необходимые связи в соответствии с параметрами технологии проводимых АХР, находясь в различной степени готовности. В процессе реализации конкретной технологии задействованы элементы той или иной подсистемы, а остальные элементы не используются. Отсюда следует вывод об относительной автономности подсистем АСК, отсутствии постоянной жесткой связи между ними. Связь осуществляется только через верхний уровень управления. Исходя из этого формулируются следующие положения: 1 АСК характеризуется набором самостоятельных слабосвязанных технологий, каждая из которых независима и самодостаточна. При этом технологии могут перекрываться в меру того, насколько при ее выполнении задействованы подсистемы или отдельные элементы АСК. 2 Степень включения подсистем АСК обусловлена, главным образом, спецификой АХР - сезонностью их выполнения, например: - весеннее - летний период (борьба с насекомыми - вредителями, сорняками); - осенне - зимний период (экологический мониторинг, съемка, оценка эффективности мер снегозадержания). 3 Различная степень готовности подсистем АСК, отдельных элементов подсистем к реализации той или иной технологии (несоответствия: запасов го-рюче - смазочных материалов и химикатов; подготовки кадров). 4 В силу разнородности задач набор технологий, реализуемых АСК, нестабилен и в зависимости от складывающейся ситуации может быть сокращен или дополнен. В процессе совершенствования технологий менее эффективные могут быть заменены более эффективными. Модернизация технических средств позволяет реализовать некоторые технологии за счет перекрытия их другими. 141
Особое внимание следует уделить подсистеме управления, свойства которой носят неявный, но всеобъемлющий характер, поскольку она координирует включение тех или иных подсистем, их элементов, параметры которых находятся в определенной зависимости. Вследствие этого появляется необходимость согласования зависимых параметров, то есть требуется более высокий уровень управления, а сама система управления становится иерархической. По совокупности приведенных положений можно сделать вывод о правомерности метасистемного подхода к АСК. Поэтому далее будем рассматривать АСК с позиций метасистемности. Рассмотрим особенности задач метасистемного подхода применительно к АСК. 10.2 Выявление диапазонов эффективности технологий проведения авиационно-химических работ
Под диапазоном эффективности понимается ограниченный объем в пространстве параметров технологии, в котором ее применение в наибольшей степени эффективно. Задача выявления диапазонов эффективности согласуется с параметрической моделью, предложенной профессором Н.З. Султановым в /118/. Процесс функционирования АСК моделируется с учетом вероятности выполнения СЛА своего назначения, для чего необходимо определение эффективности СЛА по ряду показателей: вероятность выполнения основных стадий функционирования (целевая надежность), целевая производительность, техническая надежность и топливная эффективность. Целью и основным элементом функционирования ЛА любого назначения является полет (событие). Вероятность выполнения своего назначения (величина целевой надежности) определяется надежностью операций, соответствующих основным стадиям функционирования, т.е. комплексный показатель целевой надежности, R записывается в следующем виде R = Pисijk · Pпрijk · Pбпijk · Pнсij · Pэкij (10.1) где Pисijk - коэффициент исправности парка однотипных СЛА, вероятность того, что в момент поступления заявки на полет j-ый вариант СЛА находится в исправном состоянии и может выполнить i-ый вид АХР с kго наземного комплекса (НКМ); Pпрijk - коэффициент использования СЛА в производственных полетах, вероятность того, что исправный СЛА j-го варианта (типа) не будет простаивать и своевременно будет подана заявка на i-ый вид АХР с k-го НКМ; Pбпijk - коэффициент благополучия полета, т.е. вероятность того, что исправный СЛА j-го варианта, своевременно подготовленный к полету и имеющий заявку, будет безотказно функционировать в полете и выполнит iый вид АХР с k-го НКМ; Pнсij - коэффициент надежности системы при условии успешного прохождения трех предыдущих стадий (СЛА j-го варианта или типа исправен, 142
имеет заявку на производство i-го вида АХР и безотказно технически проводит работу), т.е. вероятность отсутствия непредвиденных обстоятельств (например: резкое изменение метеоусловий); Pэкij - коэффициент экологической надежности j-го вида СЛА на i-ом виде АХР. Для снижения размерности и упрощения графической интерпретации из общего числа параметров, определяющих по п.10.1.1 понятие технологии выберем: расход химикатов q хм , длину рабочего гона l Г , длину перелета Lпер . На этих параметрах строим графическую интерпретацию зависимостей R = ( q хм , l Г , Lпер ), (10.2) позволяющих обозначить области предпочтительного применения (ОПП) для различных типов (варианторазмеров) СЛА. Области предпочтительного применения в системе координат q хм , l Г (при всех прочих сопоставимых условиях) для разных методов АХР: 00-03 рассев, 00-04 разбрасывание показаны на рисунках 10.1, 10.2. L г, м Q=300000 га Lпер= 16 км
1000
Индекс 00-03
СХС
Рассев
800 600
СХВ 400
НС 0 20
40
60
80
100
120
140
qхм, кг/га
Рисунок 10.1 - Области предпочтительного применения сельскохозяйственных летательных аппаратов на авиационно-химических работах по индексу 00-03 Анализ графиков, приведенных на рисунках 10.1, 10.2 показывает, что вертолеты сельскохозяйственной модификации имеют области предпочтительного применения в диапазонах норм расхода химикатов q хм (от 3 до 125 кг/га) и длины рабочих гонов над полем l Г (от 150 до 1300 м). ОПП вертолетов сельскохозяйственной модификации по форме напоминает “кокон” под ОПП сельскохозяйственных самолетов. Все остальные области занимают ОПП малоразмерных летательных аппаратов (МЛА) и наземных средств. ОПП определяют точные границы применения сельскохозяйственных летательных аппаратов на АХР. Вместе с тем по результатам теоретических 143
L г, м
Q=300000 га
СХС 1200 00-04
Lпер=16 км Индекс Разбрасывание
1000
СХВ 800 600
МЛА НС
400 200
qхм, кг/га Рисунок 10.2 - Области предпочтительного применения сельскохозяйственных летательных аппаратов на АХР по индексу 00-04
20
40
60
80
100
120
140
исследований и на основе обработки статистического материала профессором Н.З. Султановым в /118/ выявлены области, вложенные в ОПП и называемые зонами рационального применения, определяющие использование в той или иной технологии конкретных типов (варианторазмеров) СЛА. Исследование влияния технологий проведения АХР на ОПП показало: - изменение метода внесения химикатов приводит к “свертыванию” и удлинению области предпочтительного применения вертолетов; - увеличение объемов АХР приводит к асимптотичному повороту области предпочтительного применения; - появляются новые области предпочтительного применения при АХР с индексом 00-04 для малоразмерных летательных аппаратов с гибким крылом (мотодельтапланов). Анализ ОПП в процессе выбора и подготовки технологии позволяет, исходя из заданных параметров l г и q хм , однозначно определить тип (варианторазмер) СЛА, включенного в технологию проведения АХР. Однако, при обследовании места проведения планируемых летных операций, проводимых представителем летного отряда, закономерно выявление фактора, вносящего серьезные коррективы в определение типа (варианторазмера) СЛА, привлекаемого к реализации конкретной технологии. Наличие этого фактора обусловлено сложностью конфигурации отдельных обрабатываемых участков, что накладывает значительные ограничения на параметры технологий проведения АХР по целевой и экологической надежности. 144
Следует отметить, что сложность конфигурации отдельных участков при определении типа (варианторазмера) СЛА, привлекаемого для проведения АХР, не учитываются ни параметрической моделью, ни моделью проведения летной операции. Из этого можно сделать вывод о необходимости разработки аналитического или методологического аппарата для вычленения из общего количества участков, запланированных для обработки, участков со сложной конфигурацией, или «спорных» участков. В конечном счете, это позволяет обосновать определение типа (варианторазмера) привлекаемого СЛА. 10.3 Обеспечение сочетаемости элементов АСК
Проблема сочетаемости элементов АСК возникает исходя из сложности конфигурации обрабатываемых участков, затрагивающей экономические и экологические аспекты проведения АХР. Исходя из этого естественно предположение о том, что в некоторых случаях обработку «спорных» участков целесообразно проводить путем сочетания различных технологий, обусловливающих использование различных СЛА (например, СХВ и СХС, либо СХВ и МДП). При функционировании метасистемы на первый план выходит проблема согласования включенных в нее систем. Важность этой проблемы обсуждена в работе /5/ и на ее решение направлена вторая задача метасистемного подхода. При этом поиск статически согласованных систем осуществляется путем учета взаимных перекрытий частей различных систем, а согласованность в динамике выявляется с помощью оценки увеличения общего эффекта от взаимодействия систем. Сочетаемость систем в динамике можно пояснить рассмотрением одновременного функционирования двух систем. Пусть предпочтительные значения технологических параметров задают рабочие точки как показано на рисунке 10.3, где изображены графики зависимостей потерь систем от объемов, направляемых на них управляющих общесистемных ресурсов. Крутизна графиков а и б, приведенных на рисунке 10.3, отражает эффективность затрат, вложенных в управление конкретной подсистемой. В данном случае управляющие воздействия представляют управляющие общесистемные ресурсы. Наиболее целесообразно приложение управляющих воздействий к подсистеме, позволяющей получить наилучшие значения технологических параметров. Таким образом, показана возможность переноса управляющих ресурсов с одной системы на другую с уменьшением общих метасистемных потерь. По совокупности очевидных свойств, в соответствии с признаками, приведенными в /115/, а также спецификой выполняемых работ, АСК характеризуется иерархичностью и мультиструктурностью. В мультиструктурных системах отдельные структуры включаются последовательно или параллельно. 145
П1
П2
∆П1
а)
б) ∆П2
∆З1
З1
∆З2
З2
Рисунок 10.3 - Графическая иллюстрация сочетаемости подсистем. При параллельном включении структур последние должны обладать максимальной автономностью. Здесь объединяющим фактором общесистемных ресурсов являются управляющие воздействия, сформированные координирующей подсистемой - подсистемой управления. Элементы, используемые в метасистемах совместно, фактически являются общими ресурсами параллельно работающих структур. При этом поиск статически согласованных систем осуществляется путем учета взаимных перекрытий частей различных систем, а согласованность в динамике выявляется с помощью оценки увеличения общего эффекта от совместного взаимодействия систем. 10.4 Стратегия выбора технологии проведения АХР
Имея диапазоны эффективности в многомерном пространстве и изображающую точку, построенную на основе реального состояния систем, можно, согласно /120/, прогнозировать последовательность и моменты переключения функционирующих систем на основе движений этой точки, что показано на рисунке 10.4. Наличие неопределенности предполагает разработку комплекса мер по ее устранению или максимально возможной компенсации. Поскольку решение задач АХР носит сезонный характер и порядок их выполнения укладыва146
ется во временной ряд, целесообразно стратегию выбора описывать с позиции методов прогнозирования.
L г, м
qхм, кг/га
Т
Рисунок 10.4 - Графическая иллюстрация стратегии выбора технологии проведения авиационно – химических работ 10.4.1 Разработка концепции прогнозирования параметров технологии проведения АХР Анализ работ В.И. Автономова /121/, И.П. Стабина, В.С. Моисеевой /122/ позволяет сделать вывод о том, что технология проведения АХР, максимально отвечающая цели функционирования, представляет собой идеальное конструкторское решение на базе существующей (опорной) АСК. Процесс принятия решения по выбору оптимального варианта АСК представлен на рисунке 10.5. Из блок-схемы, приведенной на рисунке 10.6 видно, что на основе выявления противоречий между идеальным конечным результатом (ИКР) и существующим вариантом из множества альтернатив формируется АСК, по параметрам максимально приближенная к ИКР.
147
Непосредственное применение летательного аппарата как составной части АСК, включающей совокупность подсистем, обеспечивающих данное применение, происходит в условиях операции, отражающей взаимодействие всех средств, участвующих в обеспечении и решении поставленной задачи /123/. Математическая модель, разрабатываемая на основе схемы операции, содержит описание процессов, протекающих в операции МОД (W ) | =
, (10.3) где W - показатели эффективности; | = - знак оператора модельного отображения; Act - совокупность действий, отражающих функционирование ЛА; Kon - совокупность противодействий;
2
3 ИКР
Блок формирования критериев Анализ альтернатив
Блок сравнения Вариант авиационного специализированного комплекса
Генерация альтернатив
ВЫБОР РЕШЕНИЕ
Рисунок 10.5 - Блок - схема алгоритма развития технической системы
{U} - условия операции. В математической модели операции для описания элементов вводятся два вида параметров: идеальные и тактические. Прогнозируемые параметры { π } = { π 1, π 2,…, π i,}- совокупность технических характеристик, описывающих разрабатываемый элемент системы. Тактические параметры { τ }= { τ 1, τ 2,…, τ s } - совокупность характеристик, определяющих показатель эффективности. Тактические параметры представим функционально зависимыми от идеальных параметров и неноминальных значений параметров условий операции τ s = fs [ { π }, {U0} ] , s = 1, nτ , (10.4) На основе математической модели операции устанавливаем зависимость показателя эффективности системы в виде W = W ({ τ }, { β }, {U}), (10.5) 148
где { β } = { β 1, β j, …, β m} – совокупность параметров противодействия; {U}= {u1,u σ , ..., uiu} - совокупность параметров условий операции. Отсюда задача выбора рационального варианта а* АСК математически формулируется следующим образом W ( { τ }*, { β }, { U } ) → max, { τ }* = a*= { τ *1, τ *2,…, τ n }, (10.6) В формулировке задачи указывается на выбор рационального варианта, поскольку в условиях неопределенности { β } и {U} выбрать однозначно оптимальный вариант невозможно. На основе математического описания процессов, протекающих в операции и алгоритма синтеза оптимального варианта АСК, максимально приближенного к ИКР, процесс выбора рационального варианта опишем в виде блок - схемы, приведенной на рисунке 10.6. Из модуля 4 на рисунке 10.6. видно, что на задачу выбора рационального варианта АСК решающее влияние оказывают факторы { β } и {U}, обусловленные неопределенностью и существенно снижающие достоверность прогноза относительно прогнозируемых параметров { π 1, π 2, ..., π i}opt . Анализируя задачи выбора рационального варианта АСК, необходимо дать оценку их сложности и возможности формализации. Задача формирования критерия может быть решена либо путем программной реализации известных математических методов, либо через разработанные самостоятельно процедуры на основе предлагаемых методик. Более простым видится первый путь, однако, формирование критерия характеризуется наличием неопределенности, обусловленной накладываемыми ограничениями, что видно из модуля 5 на рисунке 10.6. Вследствие этого целесообразным следует признать разработку адаптированного аппарата, позволяющего компенсировать или в значительной степени снизить неопределенность при формировании критериев. Задача анализа вариантов АСК по выбранному (сформированному) критерию эффективности является трудно формализуемой, характеризуется значительной трудоемкостью вследствие большого количества анализируемых вариантов и неопределенности анализируемой информации от модулей 4, 5, 6 на рисунке 10.6. Как правило, задача анализа вариантов решается путем привлечения математических методов, что не дает желаемого результата и приводит к необходимости формирования нового методологического подхода. По результатам проведенного анализа можно обобщить вышеизложенное в виде блок-схемы, изображенной на рисунке 10.6. Из блок-схемы видно, что процесс выбора рационального варианта АСК обусловлен тремя видами неопределенности:
149
1 Неопределенность баланса критериальной оценки, обусловленная ограничениями на область допустимых значений проектных параметров и неоднозначностью соотношений частных критериев. 2 Неопределенность границ описания ПО обусловлена, во-первых: ее избыточной сложностью; во-вторых: ограничениями на область допустимых значений идеальных параметров. 3 Неопределенность исходных данных, обусловленная их неполнотой, связанной, зачастую, с несвоевременностью получения данных, либо с несвоевременностью их предварительной обработки для последующей их загрузки в базу данных или в базу знаний. Как отмечает В.С. Брусов в /60/, операторы, отражающие свойства объекта недостаточно формализованы и осуществляют лишь приближенное моделирование объекта. Это создает дополнительную неопределенность, обусловленную неточностью описания объекта. Очевидно, что на результаты анализа вариантов АСК будут оказывать влияние все перечисленные виды неопределенности. В связи с этим предлагается сформулированные выше трудно формализуемые задачи, обусловленные неопределенностью, 1 Идеальный СЛА id id id {τ} = {τ1, τ2, …}
5
3
W({ π },{ β },{U}) → max
Ограничения на область допустимых значений проектных параметров Ф ( π 1, π 2,…, π i) < Ф0
Блок сравнения
2
6 Выбор критерия
Анализ вариантов СЛА по критерию maxной эффективности W ( avar, , β ,U)
8
ПРОТИВОРЕЧИЯ 4
Опорный вариант ор ор ор { τ } = { τ 1, τ 2,… }
7
Генерация альтернатив A = {a1, a2, ...,a } 9
Выбор варианта СЛА
Рациональный вариант проект ного решения СЛА aort = { π 1, π 2,…, π i}ort
Рисунок 10.6 - Процесс выбора рационального варианта АСК. АСК авиационный специализированный комплекс решать методами инженерии знаний, априорно ориентированными на решение задач данного класса. Предлагается параметры АСК в силу их неопределенности целесообразно представлять в виде прогнозируемых величин. Таким образом, рациональный вариант АСК может быть описан совокупностью прогнозируемых 150
параметров { π 1, π 2, ..., π i}, задача определения которых разбивается на ряд задач прогнозирования по количеству прогнозируемых параметров. 10.5 Оценка и обеспечение уровня готовности технологии проведения АХР к использованию.
Эта задача возникает из-за особенностей метасистем /87/, в которых в любой момент времени функционируют только одна или несколько систем, а остальные "простаивают". Их готовность к включению можно оценивать вероятностью включения. Она подчиняется уравнению Колмогорова и управлять ею можно только созданием условий, способствующих возможности включения системы /84/. Вопросу оценки и обеспечения уровня готовности технологии проведения АХР к использованию посвящен самостоятельный раздел.
151
ЗНАНИЕ ЭКСПЕРТОВ
Выбор критерия W ({ τ },{ β },{U})
→ max
НЕОПРЕДЕЛЕННОСТЬ БАЛАНСА КРИТЕРИАЛЬНОЙ ОЦЕНКИ
Анализ вариантов вертолета по критерию max-ной эффективности W ( avar, β , U )
ОПИ САНИЕ ПО
4 В ТЕРМИНАХ
ЭКСПЕРТОВ
БАЗА ЗНАНИЙ М О Д Е Л Ь О П И С А Н И Я ПО
Ограничения на область допустимых значений проектных параметров Ф( π 1, π 2,..., π )<Ф0
НЕОПРЕДЕЛЕННОСТЬ
НЕОПРЕДЕЛЕННОСТЬ ГРАНИЦ ОПИСАНИЯ ПО
Генерация альтернатив A= { a1, a2, ..., a µ }
ВЫБОР ВАРИАНТА ВЕРТОЛЕТА
НЕОПРЕДЕЛЕННОСТЬ ИСХОДНЫХ ДАННЫХ
Рациональный вариант проектного решения aopt={ π 1, π 2,..., π i}opr
ЗНАНИЯ ЭКСПЕРТОВ ОПИСАНИЕ 1
ПО
ПРОГНОЗИРОВАНИЕ π1 opt
В 2
ТЕРМИНАХ ЭКСПЕРТОВ
ФОРМУЛИРОВКА ЗАДАЧ ПРОГНОЗИРОВАНИЯ
3
ПРОГНОЗИРОВАНИЕ π2 opt ПРОГНОЗИРОВАНИЕ πi opt
Рисунок 10.7 - Блок - схема анализа и выявления предпосылок создания базы знаний: ПО - предметная область; АСК - авиационный специализированный комплекс
152
10.6 Оптимизация перераспределения общесистемных ресурсов АСК
Если подсистемы АСК функционируют параллельно, согласно /88/ возникает дополнительная задача оптимального перераспределения общесистемных ресурсов с максимизацией общего эффекта метасистемы. Классический функционал оптимизации включает три слагаемых: - Lterm – терминальная составляющая, показывающая конечные установившиеся потери, обусловленные неточностью системы; - L(x,t) – отражает потери, возникающие из-за отклонения переходного процесса в системе от идеального; - А(ω) – затраты управляющих ресурсов t
Φ = LТЕРМ + ∫ [L( x, t ) + A(u )]dt
(10.7)
o
Смысл оптимизации непосредственно заключен в минимизации этого функционала. Однако, следует учесть, что на терминальную составляющую Т нельзя оказать решающего влияния непосредственно управляющими воздействиями. Это возможно только при изменении структуры системы. Следовательно, значимыми с точки зрения управления будут лишь два последних слагаемых. Кроме того, перераспределение ресурсов осуществляется между дискретными системами, поэтому интеграл превращается в простую сумму. Окончательно имеем N
∑П i =1
i
+ Зi → min
(10.8)
где П – потери от недостатка объема управляющих ресурсов, З -затраты управляющих ресурсов, ведущие к таким потерям. Данные положения справедливы для параллельных систем. С другой стороны, простаивающие системы должны поддерживаться в разной степени готовности к использованию. На это также затрачиваются общесистемные ресурсы, перераспределение которых между системами можно оптимизировать по аналогичной схеме. Применительно к АСК перераспределение ресурсов сводится к перераспределению ресурсов НКМ: кадров, горючесмазочных материалов, химикатов и др. 10.7 Оптимизация набора используемых технологий
Методика синтеза начинается с предварительного определения и ранжирования по убыванию коэффициентов удельного эффекта для множества систем, перспективных с точки зрения включения в будущую метасистему /89/. Выбирая первую, самую эффективную систему, необходимо далее решать вопрос о параллельном или последовательном подключении следующих сис-тем. При этом учитывается степень перекрытия частей подключае153
мой системы при последовательном подключении либо эффект от перераспределения ресур-сов при параллельном подключении. Выбор производится на основе анализа разности значений коэффициентов удельного эффекта для этих двух вариантов подключений S1 + S 2 − S п S + S 2 + b∆DS п ∆= − 1 (10.9) K1 + K 2 − c21 K 2 K1 + K 2 и зависит от знака числителя получаемой дроби:
c21 K 2 (S1 + S 2 ) + c21 K 2 b∆DS п − S п (K1 + K 2 ) − b∆DS п (K1 + K 2 )
(10.10)
где c21 - коэффициент перекрытия второй системой первой;
∆D - “суммарное “ уменьшение дисперсии управляемых величин; b - размерный коэффициент; S1,S2 - эффекты, получаемые от функционирования первой и второй систем соответственно;
Sп - “перекрывающийся” эффект (в этой области системы работают параллельно и эффект суммируется);
К1, К2 - соответствующие затраты. Набор систем в метасистему прекращается при достижении величины допустимых затрат на ее создание. Если системы функционируют параллельно, возникает дополнительная задача оптимального перераспределения общесистемных ресурсов с максимизацией общего эффекта метасистемы. 10.8 Метасистемная модель функционирования АСК
В результате анализа задач, решаемых при метасистемном подходе, показана правомерность метасистемного подхода к АСК и построена метасистемная модель его функционирования, приведенная на рисунке 10.8. Предлагаемая метасистемная модель функционирования авиационного специализированного комплекса отражает всю совокупность проанализированных выше задач, решаемых при метасистемном подходе. Резюме 1 На основе проведенного анализа структуры и функциональных возможностей АСК для проведения АХР можно сделать однозначный вывод о том, что задачи, решаемые исследуемым АСК, согласуются с задачами метасистемного подхода и определяют его как метасистему. 2 Каждая технология проведения АХР, реализуемая АСК, имеет свой диапазон эффективности, определяемый областью предпочтительного применения. 154
3 При проведении АХР не учитывается такой важный параметр, как конфигурация обрабатываемого участка, определяющая специфику используемых технологий проведения АХР. Заявка на проведение АХР
Экспертная система выбора технологии проведения АХР Технология 1: Распыливание с самолета Ан-2
Технология 2: Опрыскивание с вертолета Ка-126
•
•
Технология n: Разбрасывание с мотодельтаплана
•
Объект управления - АСК ••• АСК
Общесистемные ресурсы: кадры, НКМ, сельскохозяйственное оборудование, ГСМ, химикаты и др.
АХР- авиационные химические работы; АСК - авиационный специализированный комплекс; НКМ - наземный командный комплекс; ГСМ - горюче - смазочные материалы Рисунок 10.8 - Метасистемная модель функционирования авиационного специализированного комплекса 4 Затраты на формирование оптимального набора технологий проведения АХР могут быть уменьшены за счет увеличения их перекрытия по оборудованию или кадрам. 5 Разработка стратегии использования технологий проведения АХР позволяет оптимально готовить их к включению во времени, тем самым сокращая простои и отказы при выполнении поступающих заявок на выполнение АХР.
155
6 Перераспределение общесистемных ресурсов имеет решающее значение при их ограниченности, позволяя уменьшить общие метасистемные потери. 7 Оптимизация выбора технологий проведения АХР по коэффициенту удельного эффекта при минимальных затратах обслуживает максимальное разнообразие заявок, при этом исключаются неэффективные технологии за счет выявления уровня целесообразности. 8 В результате проведенных исследований предлагается метасистемная модель функционирования АСК, отражающая специфику его внутренней организации. 9 Анализ рассмотренных задач показал, что мало исследованной и вместе с тем очень важной является время реакции АСК на изменение внешних условий, определяемое метасистемной задачей оценки и повышения степени готовности технологий проведения АХР к использованию.
156
Список использованных источников 1 Клир Дж. Системология. Автоматизация решения системных задач.М.: Радио и связь, 1990.-544 с. 2 Солодкая М.С. Взаимодействие социального и технического в управлении. Дисс. на соискание уч. степ д-ра. фил. наук - М.: МГУ, 1999. 3 Месарович М., Такахара Я. Общая теория систем: Математические основы / Под ред. С.В. Емельянова.- М.: Мир, 1978.- 311 с. 4 Теория автоматического управления. Ч.I Теория линейных систем автоматического управления.- М.: Высшая школа, 1986.- 367 с. 5 Пищухин А.М. Согласованность составляющих системы и методы ее достижения //Вестник ОГУ №1, 1999.- с 87-90. 6 Бойчук Л.М. Синтез координирующих систем автоматического управления.- М.: Энергоатомиздат, 1991 г. - 160 с. 7 Гнеденко Б.В. Курс теории вероятностей.-М.:Наука, 1988.-448с. 8 Первозванский А.А. Курс теории автоматического управления.М.:Наука, 1986 г.- 616 с. 9 Справочник по теории автоматического управления.-М.:Наука. 1987.712 с. 10 Горелик А.Л., Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания: некоторые аспекты.-М.:Радио и связь, 1985.-160 с. 11 Пищухин А.М., Коршунова Т.И. Особенности метасистемного подхода в теории управления //Матер. региональн. н/п конф. «Современные информационные технологии в науке, образовании и практике». Оренбург.2002.- с. 160-162. 12 Пищухин А.М. Синтез иерархических систем для управления сборочными автоматами //Сборка в машиностроении и приборостроении 2001.№2.- с. 27-30. 13 Потапова Т.Б. Структурный анализ системы управления непрерывным замкнутым производством.- Приборы и системы управления, 1999.- № 2.- с. 16-24. 14 Бухалев В.А. Распознавание,оценивание и управление в системах со случайной скачкообразной структурой.- М.:Наука. Физматлит, 1996.- 282 с. 15 Поспелов Д.А. Ситуационное управление: теория и практика.-М.: Наука, 1986.-288 с. 16 Коршунова Т.И. Автоматизация контроля качества ткани. Диссертация на соискание ученой степени кандидата технических наук. Оренбург, 1998 г. - 154 с. 17 Коршунова Т.И., Пищухин А.М. Выбор значений непрерывных признаков для классификации объектов при контроле ткани.// Контроль. Диагностика, №5 2000, с. 7-8 18 ГОСТ 161-86. Ткани хлопчатобумажные, смешанные и из пряжи химических волокон. Определение сортности.- М.:ГК СССР по стандартам, 1986., 10 с. 19 Конечные автоматы: эквивалентность и поведение.-М.: Наука. 1984.157
192 с. 20 Брауэр В. Введение в теорию конечных автоматов.-М.: Радио и связь, 1987.- 392 с. 21 Волков И.К., Зуев С.М., Цветкова Г.М. Случайные процессы. – М.:Изд-во МГТУ им. Баумана, 1999.- 448 с. 22 Шелобаев С.И. Математические методы и модели в экономике, финансах, бизнесе: Учеб.пособие для вузов. - М. : ЮНИТИ-ДАНА, 2000 - 367с. 23 Абдрашитов Р.Т. Методы синтеза оптимальных автоматических систем управления сельскохозяйственными технологическими процессами. Дис....доктора технических наук. Минск, 1980. - 408 с. 24 Кузнецов и др. Автоматизация производственных процессов.М.:Высшая школа, 1978.-431 с. 25 Пищухин А.М. Теоретические основы выбора средств автоматизации технологических процессов /Учебное пособие.- Оренбург. – 2004. – 111 с. 26 Зеленцова Л.С. Оперативное планирование производства в условиях рынка.-Оренбург. ОГУ, 2000.-161 с. 27 Справочник по теории автоматического управления.-М.: Наука, 1987.-712 с. 28 Казаков И.Е., Артемьев В.М. Оптимизация динамических систем случайной структуры - М.: Наука, 1980.- 384 с. 29 Тихонов А.Н., Самарский А.А. Уравнения математической физики.М.:Наука, 1977.-736 с. 30 Бойчук Л.М. Синтез координирующих систем автоматического управления.- М.: Энергоатомиздат, 1991. - 160 с. 31 Коршунова Т.И., Пищухин А.М. Автоматизация процесса разбраковки ткани. / / Деп. ВИНИТИ №201-В97, 1997. - 7с. 32 Победимский В.П. Отделка и контроль качества готовых тканей: Учеб.пособие - М.: Высшая школа, 1981. - 335с. 33 Нотова С.В. Метод видеокомпьютерной коррекции зрения в лечении близорукости. Дис.... канд.мед.наук, РМАПО, 2000. 34 Эрисман Ф.Ф. Влияние школ на происхождение близорукости.- СПб., 1870. 35 Cohn H. Untersuchungen der Augen von 10060 Schulkinder. Leipzig, 1867. 175 s. 36 Михалева М.Г. Частота распространения миопии в различных природных зонах РСФСР //Материалы научно-практической конференции по вопросам профилактики патогенеза и лечения заболеваний органа зрения у детей. - М., 1971.- с.94-96. 37 Либман Е.С., Вервельская В.М., Русакова О.А., Мелкумянц Т.А. и др. Эпидемиология и особенности развития инвалидизирующих форм близорукости // Близорукость. Патогенез, профилактика прогрессирования: Материалы Международного симпозиума. - М., 1990. - с. 225-226.
158
38 Балабанов В.И. О некоторых закономерностях формирования рефракции глаз у школьников и влияние оптической коррекции на ход этого процесса. // Дис.... доктора медицинских наук. Донецк, 1971. 39 Асабина В.А. Состояние здоровья и предшествующие заболевания у детей со спазмом аккомодации при ложной и истинной миопии //Офтальмологический журнал. 1971. -№4.- с. 289-292. 40 Дашевский А.И. Профилактика ложной и осевой близорукости в свете гипотезы их патогенеза //Офтальмологический журнал.-1968.-№6.-с. 404-410. 41 Дашевский А.И. Близорукость // Л.:Медгиз, 1962. С.148. 42 Вилина И.Я. О методике лечения спазмов аккомодации. //Вестник офтальмологии. 1971. №2. С. 19-24. 43 Randle R.J., Murphy M.R. The dinamic response of visual accomodation over a seven-day period. Am. J. Optom. Physiol. Opt. 1974. V 51. P 530-544. 44 Scheard C. Ocular accomodation. - Hartford, USA. 1920. 45 Ольгина А.М. Применение метода «затуманивания» для профилактики лечения спазма аккомодации в домашних условиях// Офтальмологический журнал. 1971.-№8.-с. 621-623. 46 Шаихова Д.И. Применение дивергентной дезаккомодации и микрозатуманивания при лечении миопии // Здравоохранение Казахстана. 1975.№8.-С. 81-82. 47 Мандель Ы.М. Упражнения для глазных мышц как профилактика прог-рессирования близорукости // Всесоюзная конференция по вопросам детской офтальмологии. - М.,- 1976.- С.129-130. 48 Ремезов М.С., Гильдина Б.И. Роль астигматизма роговицы в ослаблении аккомодационной способности и ортоптическое лечение при миопии // Материалы научной конференции по вопросам профилактики, патогенеза и лечения заболеваний органа зрения у детей. - М., 1971. С. 97-100. 49 Аветисов Э.С., Мац К.А. Методы тренировки цилиарной мышцы при ослабленной аккомодации // Материалы научной конференции по вопросам профилактики, патогенеза и лечения заболеваний органа зрения у детей. - М., -1971.-с. 60-63. 50 Аветисов Э.С. Некоторые итоги изучения экологии и генеза миопии в институте глазных болезней им. Гельмгольца //Материалы научнопрактической конференции по вопросам профилактики патогенеза и лечения заболеваний органа зрения у детей. - М., 1971.-с. 53-58. 51 Розенблюм Ю.З. Оптометрия (подбор средств коррекции зрения).СПб.: Гиппократ, 1996.- 320 с. 52 Вязовский И.А., Пономаренко С.Ф. К вопросу о влиянии циклоплегических средств на течение близорукости //Офтальмологический жур., 1980.№6.-с. 350-351. 53 Lecaillon-Thibou M.B. Premiers resultats du treatment des myopies evolutives par la MMP (neosynephrine associee a la vitamine E). Bull. Soc. Ophthal. Fr.,1964, V 64. № 9. P. 728-734. 159
54 Tokoro T., Kabe S. Treatment of myopia.- Acta Soe. Ophthalmol., Jap., 1964. V. 68. P. 1958-1961. 55 Jamai R., Nakayama S. Treatment of Myopia due to Cyclospasm. Acta Soc. Ophthalmol., Jap., 1970. P.P. 74, 12, 1580. 56 Rubin M.L., Milder B Myopia – a Treatebl “Disease” - Surv. Ophthalmol., 1976. V. 21. № 1. P. 65-69. 57 Аветисов Э.С., Розенблюм Ю.З., Тарутта Е.П. Профилактика близорукости //Вестник офтальмологии. 1989. Т.105. №6. С. 3-6. 58 Маликова Р.Г., Савицкая Н.Ф. Миопия. - М.,1974. С. 108-109. 59 Tori T. Treatment of Myopia with Local use of Neasynephrine Hydrochloride. Jap., J., Ophthalmol., 1960. №4. Р. 213. 60 Oohaka R., Kawai T., Marica mai K. Effect of mydriatica (neasynesin) on the coses of suspected pseudomyopia. Jap. J. Chin. Op., 1964. 18. 1259. 61 Лохтина Н.И. Профилактика прогрессирования миопии путем воздействия на аккомодационный аппарат глаза // Дис.... кандидата медицинских наук. - М., 1977. 62 Левченко О.Г. К вопросу о лечении детей с прогрессирующей близорукостью мезотоном //Офтальмологический журнал. 1987. №3. С. 165-168. 63 Маликова Р.Г. Влияние некоторых вегетотропных средств на работоспособность цилиарной мышцы при миопии // Дис....кандидата медицинских наук. - М., 1973. 64 Нестеров А.П., Свирин А.В., Лапочкин В.И. О медикаментозном лечении прогрессирующей близорукости// Вестник офтальмологии.-1990.-Т. 106.-№2.-с. 25-28. 65 Токуева Р.Ж., Батманов Ю.Е. Комбинированный метод лечения ложной близорукости и профилактика развития осевой миопии// Вестник офтальмологии. -1998.- №6.-с. 33-35. 66 Филатов В.П., Скородинская В.В. Несколько соображений о путях лечения и профилактики близорукости // Офтальмологический журнал.1955.-№6.-с. 6-11. 67 Шпак Н.И., Федорова Л.И. Результаты клинического испытания препарата «Биосед»// Офтальмологический журнал -1987.- №2.- с. 141. 68 Шлопак Т.В. Микроэлементы в офтальмологии. - М.:Наука.-1969.-с. 185-195. 69 Бойчук Р.В. Некоторые биохимические изменения крови больных с прогрессирующей близорукостью // Автореферат дис....кандидата медицинских наук. - Киев, 1969.-18с. 70 Аветисов Э.С., Савицкая Н.В. О патогенезе миопии и некоторых новых возможностях ее профилактики и лечения // 3-й Всероссийский съезд офтальмологов. - М., 1975.- Т. 2.-с. 5-16. 71 Jamai R., Yoshihara M., Furuta J., Sakiyama A., Ishicawa K., Nacamura R. A Clinical study of the Effects of Mydrin-M on the visual Acuity and Refraction in Myopic children. Folia ophthal., Jap., 1966. P.P. 17,161. 72 Левченко О.Р. Оценка лечебного действия нигексина при прогрессирующей близорукости у детей // Вестник офтальмологии.-1988.-№2.-с. 43-45. 160
73 Мац К.А. Новые методы тренировки цилиарной мышцы при ослабленной аккомодационной способности // Дис....кандидата медицинских наук. М., 1973. 74 Нестеров А.П., Свирин А.В., Лапочкин В.И. О медикаментозном лечении прогрессирующей близорукости// Вестник офтальмологии.-1990.-Т. 106.- №2.-с. 25-28. 75 Фетисов А.А. Влияние карбогена на регионарную гемодинамику, гидродинамику глаза и функциональное состояние зрительно-нервного аппарата при миопии// Вестник офтальмологии.-1979.-№4.-с. 35-38. 76 Лопотко З.А. Результаты наблюдения над эффективностью инъекций азотнокислого натрия в лечении близорукости// Офтальмологический журнал.-1966.-№3.-с. 201-204. 77 Стругань А.С., Хомич С.Т. Результаты клинического лечения детей с прогрессирующей школьной близорукостью// Офтальмологический журнал. 1982.- №1.-с. 60-62. 78 Чирикчи Л.Е., Сенякина А.С., Белезина Т.В. Электротерапия спазма аккомодации при прогрессирующей миопии// Офтальмологический журнал.1979.-№6.-с. 356-357. 79 Кубарева Н.С. Эффективность ультразвуковой терапии при спазмах аккомодации и миопии слабой степени // Реабилитация больных с патологией органа зрения. Тез. докл. конф. с участием иностранных специалистов. Одесса, 1986. 80 Сидоренко Е.И., Обрубов С.А., Тумасян А.Р. Опыт клинического применения инфразвукового пневмомассажа в лечении прогрессирующей близорукости у детей школьного возраста// Вестник офтальмологии. 1995. №3. С.18-20. 81 Лапочкин В.И. Офтальмотонус миопического глаза: статистическая оценка и роль в формировании приобретенной миопии//Вестник офтальмологии.-1997.-№5.-с. 20. 82 Лазаренко В.И., Корниловский И.М. О целесообразности использования умеренной локальной гипотермии в глазу у больных близорукостью// Офтальмологический журнал.-1981.-№5.-с. 278-284. 83 Ивашина А.И., Михайлова Г.Д., Балашова И.В.Вазокомпрессия глаза при прогрессирующей близорукости и контроль за ее эффективностью// Вестник офтальмологии.-1988.-№5.-с. 31-34. 84 Ананин В.Ф., Ананин В.В. Глаз и фармакология.- М.: ЛЭТМО, Биомединформ, 1994. – 272 с. 85 Зверев В.А., Тимофеев Е.Г., Голованова Т.П. Квантовая терапия в офтальмологии: лечение прогрессирующей миопии аппаратами АСО// Вестник офтальмологии.-1997.-№2.-с. 39-40. 86 Шаталов О.А., Ченцова О.Б. Способ профилактики и лечения спазма аккомодации и прогрессирования миопии у детей// Вестник офтальмологии.1998.-№6.-с. 31-33. 87 Белозеров А.Е., Корнюшина Т.А. Новый метод тренировки аккомодации// Вестник офтальмологии.-1997.-№2.-с. 25-28. 161
88 Шандурина А.Н., Панин А.В. Клинико-физиологический анализ способа переорбитальной чрезкожной электростимуляции пораженных зрительных нервов и сетчатки// Физиология человека.-1990.-Т.16.-№4.-с. 58. 89 Иванова А.И., Добросердов А.В. Применение чрезкожной электростимуляции в лечении некоторых глазных заболеваний// Актуальные вопросы офтальмологии: Сб. трудов научно-практической конференции.-М., 1996. Ч.2.-с. 208-210. 90 Шарипов А.Р., Гареев Е.М., Гафурова З.Ф. О возможном механизме увеличения остроты зрения под влиянием чрезкожной электростимуляции при миопии// Новые технологии микрохирургии глаза», Оренбург, 1995.№4.-с.39-40. 91 Оковитов А.В. Трансконъюнктивальная электроофтальмостимуляция в системе патогенетического лечения прогрессирующей близорукости// Вестник офтальмологии.-1997.-№5.-с. 24-26. 92 Kristt D.A., Engel B.T. Learneal control of blood pressure in patient with high blood pressure. // Circlstion.1975. V.51. №3. P.370. 93 Shwartz G.E. Self-regulation of Response patterning. Implications for psyhophysiological research and therapy.//Biofeedback and self-regulation. 1976. V.1. №1. P. 7. 94 Biofeedback – principles and practice for clinicians. - Ed.J.V. Basmajian. Baltimore: Williams a Wilkins, 1979. 95 Богданов О.В., Пинчук Д.Ю., Михайленок Е.Л. Эффективность различных форм сигналов обратной связи в ходе лечебных сеансов функционального биоуправления. Физиология человека.-1990.-T.16.-№1. 96 William C. Retention of EMG biofeedback relaxation training.//Percept. And Mot. Sciels. 1983. V.56. №2. P.671. 97 Богданов О.В. Функциональное биоуправление в лечебной физкультуре// Вопросы курортологии, физиотерапии и лечебной физкультуры. 1986. №6. C.26. 98 Silvia E.S., Raczynski G.M., Kleinstein R.N. Self-regulation facial muscle tension effects in intraocular pressure// Psychophysiology.-1984.-V.21.-№1.- P. 79. 99 Аветисов Э.С. Близорукость.- М.: Медицина, 1986.- 240 с. 100 Methling D., Maxam U. Optometrie. Bestimmung von Sehhilfen. - VEB Verlag Technik. - Berlin, 1989. - 232 S. 101 Матвеев В.И., Шелепин Ю.Е. Определение ближайшей и дальнейшей точек ясного видения в зависимости от пространственно-частотных характеристик тестовых изображений// Физиология человека.-1994.-Т.20.-№3.с. 23-29. 102 Валькова В.И., Нюрнберг О.Ю., Стишковская Н.Н. Исследование функционального состояния аппарата аккомодации у детей дошкольного и младшего школьного возраста// Офтальмологический журнал.-1988.-№3.-с. 396-397.
162
103 Зимкин Н.В., Лебединский А.В. Об исследовании деятельного состояния аккомодационной мышцы//Сб., посвященный 45-летию деятельности проф. В.Н. Долганова.- Л.,-1936.-с. 143-152. 104 Волков В.В., Колесникова Л.Н. Аккомодация и рефракция по материалам исследований с помощью кобальтового стекла // Офтальмологический журнал. -№3,-1973.-с 172-176. 105 Ананин В.Ф., Аветисов Э.С., Киприянова Т.И. Объективная регистрация аккомодации глаза методом сканирования щелевого изображения, отраженного от сетчатки глаза // Вестник офтальмологии.-1971.-№2.-с.61-63 106 Аветисов Э.С., Никитюк Б.А., Розенблюм Ю.З. и др. Исследование рефракции и ее компонентов у близнецов с применением ультразвуковой биометрии// Применение ультразвука в офтальмологии. - М.,-1976.-с.55-59. 107 Шамшинова А.М., Белозеров А.Е., Шапиро В.М. и др. Новый метод исследования контрастной чувствительности в клинике глазных болезней//Вестник офтальмологии.-1997.-Т.113.-№1.-с.22-25. 108 Aulhorn E. Einfache Perimetrische Methoden fur die Erfassung der glaucomatosen Fruhaus falle // Glaucoma.- Wurzburg, 1974.- S.117-130.iu 109 Шамшинова А.М., Волков В.В. Функциональные методы исследования в офтальмологии. - М.:Медицина, 1998.- 416 с. 110 Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. – Л.: Энергоатомиздат. 1991. – 304 с. 111 Цыганков В. А. Принципы построения и исследование автоматических систем управления процессом бурения. Дисс…. д.т.н. Челябинск 1973 г., 273 с. 112 Паспорта научных специальностей. Специальность 05.26.03 Пожарная и промышленная безопасность. 113 Швалев Л.Н., Зверев А.Г. Комплексная система управления охраной труда в строительстве.-М.:Стройиздат, 1990.-240 с. 114 Пищухин А.М., Шалкин А.В. Матричные системы управления //Вестник ОГУ №1,-2001.- с. 140-145. 115 Пищухин А.М. Оптимальные методы построения и управления мультиструктурными системами автоматизации технологических процессов и производств на основе вероятностных критериев качества// Дис....доктора технических наук.-Оренбург-2001.-338с. 116 Летов А.М. Аналитическое конструирование регуляторов I-IV // Автоматика и телемеханика.-1960.,-№4,-с. 436-441;-№5,-с. 561-568;-№6,-с. 661665;-1961,-№4-с. 425-435. 117 Ванько В.И. и др. Вариационное исчисление и оптимальное управление. М.: Изд-во МГТУ им. Н.Э. Баумана, 2001.-488 с. 118 Султанов Н.З. Оптимизация технологий и парка машин для проведения сельскохозяйственных авиационно-химических работ// Дис....доктора технических наук.-Оренбург-1997. -355с. 119 Брахман Т.Р. Многокритериальность и выбор альтернативы в технике. -М.: Радио и связь, 1984.-376 с. 163
120 Пищухин А.М., Корщунова Т.А., Коршунова Е.И., Пищухина Т.А. Траекторная стратегия выбора функционирования систем в метасистеме // Вестник ОГУ № 1, 2003 г. – С. 141 – 143. 121 Автономов В. Н.. Создание современной техники. Основы теории и практики. -М.: Машиностроение,1991. -258 с. 122 Стабин И.П., В.С. Моисеева. Автоматизированный системный анализ. -М.: Машиностроение, 1984. -321 с. 123 Ильичев А.В., Волков В.Д., Грущанский В.А.. Эффективность проектируемых элементов сложных систем. -М.: Высшая школа, 1982 -280 с.
164
Приложение А ВВЕДЕНИЕ В СИСТЕМОЛОГИЮ А.1 НАУКА О СИСТЕМАХ Если следовать общепринятому определению, то термин «система» означает, в общем, множество элементов и отношений между ними. Термин отношение используется здесь в самом широком смысле, включающем весь набор родственных понятий, таких как ограничение, структура, информация, организация, сцепление, связь, соединение, взаимосвязь, зависимость, корреляция и так далее. Система S представляет, таким образом, упорядоченную пару S=(A,R), где А - множество соответствующих элементов, а R – множество отношений между элементами множества А. Чтобы сделать это определение практически полезным, его нужно уточнить, ввести определенные классы упорядоченных пар (A,R). Эти классы можно ввести с помощью одного из двух фундаментальных критериев различия: а) выделение систем, базирующихся на определенных типах элементов; б) выделение систем, базирующихся на определенных типах отношений. Классификационные критерии а) и б) можно рассматривать как ортогональные. Примером классификации с помощью критерия а) служит традиционное подразделение науки и техники на дисциплины и специальности, причем каждая из них занимается определенным типом элементов (физических, химических, биологических, политических, экономических и так далее). При этом никакой определенный тип отношений не фиксируется. Поскольку элементы разных типов требуют разных экспериментальных (инструментальных) средств для сбора данных, эта классификация по существу имеет экспериментальную основу. Критерий б) дает совершенно другую классификацию систем: класс задается определенным типом отношений, а тип элементов, на которых определены эти отношения, не фиксируется. Такая классификация непосредственно связана с обработкой данных, а не с их сбором, и основа ее преимущественно теоретическая. Самыми большими классами систем по критерию б) являются классы, описывающие различные эпистемологические уровни, то есть уровни знания относительно рассматриваемых феноменов. Далее они уточняются с помощью разных методологических отличий. Каждый класс систем, заданный определенным эпистемологическим уровнем и конкретными методологическими отличиями, подразделяется далее на еще меньшие классы (подклассы). Каждый из этих подклассов состоит из систем, эквивалентных с точки зрения конкретных, практически существенных, сторон определенных в них отношений. Такая эквивалентность обычно называется изоморфизмом, а определенные по ней классы эквивалентности – изоморфными классами. Если рассматривать только характеристики отношений в системах, то достаточно каждый класс изоморфных систем заменить одной системой, представляющей этот класс. Для теоретических целей будем выбирать в ка165
честве представителя те системы, в которых множествами элементов являются абстрактные (неинтерпретированные) множества одной природы, а отношения описаны в подходящей стандартной форме. Представителей изоморфных классов, удовлетворяющих этим требованиям, при определенной интерпретации термина «стандартный» будем называть общими системами. Таким образом, общая система – это стандартная и неинтерпретированная система, выбранная в качестве представителя класса систем, эквивалентных (изоморфных) относительно некоторых практически существенных характеристик отношений. По Дж. Клиру, системы образуют иерархию эпистемологических уровней. Данная иерархия опирается на несколько элементарных понятий: исследователь (наблюдатель) и его среда, исследуемый (наблюдаемый) объект и его среда и взаимодействие между исследователем и объектом. Самый нижний уровень в этой иерархии, обозначаемый как уровень 0 – это система, различаемая исследователем как система. То есть исследователь выбирает способ, каким он хочет взаимодействовать с исследуемым объектом. В большинстве случаев этот выбор не вполне произволен. По крайней мере, частично он определяется целью исследования, условиями исследования (доступностью измерительных инструментов, финансовыми возможностями, временными рамками, юридическими ограничениями и так далее), а также имеющимися знаниями, относящимися к данному исследованию. Система эпистемологического уровня 0 определяется через множество переменных, множество потенциальных состояний (значений), выделяемых для каждой переменной, и некий операционный способ описания смысла этих состояний в терминах проявлений соответствующих атрибутов данного объекта. Для определенных на этом уровне систем используется термин исходная система, указывающий на то, что подобная система является, по крайней мере, потенциально источником эмпирических данных. Множество переменных обычно подразделяется на два подмножества, называемые основными переменными и параметрами. Совокупность состояний всех параметрических переменных образует параметрическое множество, при котором наблюдается изменение в состояниях отдельных основных переменных. Чаще всего в качестве параметров выступают время, пространство и различные совокупности объектов одного типа (социальные группы, группы стран, продукция одного типа и так далее). Исходные системы можно классифицировать по различным критериям, по которым имеются методически существенные отличия в конкретных свойствах множеств переменных или множеств состояний. Согласно одному из таких критериев основные переменные могут быть разделены на входные и выходные переменные. При таком разделении состояния входных переменных рассматриваются как условия, влияющие на выходные переменные. Входные переменные не являются предметом исследования; считается, что они определяются неким фактором, не входящим в рассматриваемую систему. Этот фактор называют средой системы, в которую часто включают и исследователя. 166
Системы, в которых переменные разделены на входные и выходные, называют направленными; системы, в которых такое разделение не задано, называются нейтральными. Выделяют также ряд дополнительных отличий множеств состояний, связанных с введенными переменными (основными и параметрическими), что позволяет проводить более глубокую методологическую классификацию исходных систем. Это, например, отличия между четкими и нечеткими переменными, между дискретными и непрерывными переменными, между переменными с разными шкалами значений. В системах более высокого эпистемологического уровня используются все знания соответствующих систем более низких уровней и, кроме того, содержатся дополнительные знания, недоступные низшим уровням. Например, исходная система содержится во всех системах более высоких уровней. После того как исходная система дополнена данными, то есть действительными состояниями основных переменных при определенном наборе параметров, мы рассматриваем новую систему (исходную систему с данными) как определенную на эпистемологическом уровне 1. Системы этого уровня называются системами данных. В зависимости от задачи данные могут быть получены из наблюдений или с помощью измерений, или определены как желательные состояния. Более высокие эпистемологические уровни содержат знания о некоторых инвариантных параметрам характеристиках отношений рассматриваемых переменных, посредством которых можно генерировать данные при соответствующих начальных или граничных условиях. Генерируемые данные могут быть точными (детерминированными) или приблизительными в какомто определенном смысле (стохастическими, нечеткими). На уровне 2 инвариантность параметров представлена одной обобщенной характеристикой, задающей ограничение на множестве основных переменных при данном множестве параметров. В множество основных входят переменные, определяемые соответствующей исходной системой и, возможно, некоторые дополнительные. Каждая дополнительная переменная определяется конкретным правилом преобразования на множестве параметров, применимом или к основной переменной исходной системы, или к гипотетической (ненаблюдаемой) переменной, введенной пользователем (составителем модели, проектировщиком). Эта переменная обычно называется внутренней. Правило преобразования обычно представляет собой взаимно однозначную функцию, присваивающую каждому элементу множества параметров другой (единственный) элемент того же множества. Поскольку задачей параметрически инвариантного ограничения является описание процесса, при котором состояния основных переменных могут порождаться по множеству параметров при любых начальных или граничных условиях, системы уровня 2 называются порождающими системами (generative system). На эпистемологическом уровне 3 системы, определенные как порождающие системы (или иногда системы более низкого уровня), называются подсистемами общей системы. Эти подсистемы могут соединяться в том 167
смысле, что они могут иметь некоторые общие переменные или взаимодействовать как-то иначе. Системы этого уровня называются структурированными системами (structure system). На эпистемологическом уровне 4 системы состоят из набора систем, определенных на более низком уровне, и некоторой инвариантной параметрам метахарактеристики (правила, отношения, процедуры), описывающей изменения в системах более низкого уровня. Требуется, чтобы системы более низкого уровня имели одну и ту же исходную систему и были определены на уровне 1, 2 или 3. Определенные таким образом системы называются метасистемами. На уровне 5 допускается, что метахарактеристика может изменять множество параметров согласно инвариантной параметрам характеристике более высокого уровня или мета-метахарактеристике. Такие системы называются мета-метасистемами или метасистемами второго порядка. Аналогично определяются метасистемы более высоких порядков. Для справок на рисунке А.1 представлено упрощенное представление иерархии эпистемологических уровней систем. Уровень 4, 5… МЕТАСИСТЕМЫ Отношения между определенными ниже отношениями Уровень 3 СТРУКТУРИРОВАННЫЕ СИСТЕМЫ Отношения между определенными ниже моделями Уровень 2 ПОРОЖДАЮЩИЕ СИСТЕМЫ Модели, порождающие определенные ниже данные Уровень 1 СИСТЕМЫ ДАННЫХ Наблюдения, описанные на определенном ниже языке Уровень 0 ИСХОДНЫЕ СИСТЕМЫ Язык описания данных
СОБЫТИЯ
ПРЕДСКАЗАНИЕ ДЕЙСТВИЯ
Рисунок А.1 – Иерархия эпистемологических уровней систем
168
Приложение Б ИСХОДНЫЕ СИСТЕМЫ И СИСТЕМЫ ДАННЫХ Б.1 Объекты и системы объектов
Будем называть объектом часть мира, выделяемую как единое целое в течение ощутимого отрезка времени. В большинстве случаев объекты обладают практически бесконечным числом свойств, любое из которых можно вполне осмысленно изучать и, как следствие, почти любой объект невозможно изучить полностью. Это означает, что необходимо отобрать ограниченное (и обычно довольно малое) число характеристик, наилучшим образом описывающих данный объект как явление. После того как такой отбор сделан, необходимо определить процедуру измерения (наблюдения) каждого свойства, которое, в свою очередь, задает абстрактную переменную, представляющую наш образ (наше отображение) соответствующего свойства. Мы говорим, что на интересующем нас объекте система задана набором соответствующих свойств объекта и назначением каждому из них определенной переменной (с помощью процедуры измерения). Таким образом, система всегда рассматривается не как реальная вещь, а как абстрагирование или отображение некоторых свойств объекта. С каждым свойством связано множество его появлений (проявлений). Так, например, если свойством является относительная влажность в определенном месте Земли, то множество проявлений – это всевозможные значения относительной влажности (определяемые некоторым способом) в диапазоне от 0 до 100%. При единичном наблюдении свойство имеет одно конкретное проявление. Для определения возможных изменений его проявлений требуется множество наблюдений этого свойства. Для этого, однако, необходимо, чтобы отдельные наблюдения свойства, осуществляемые с помощью одной и той же процедуры наблюдения, каким-то образом отличались одно от другого. Любое существенное свойство, на самом деле используемое для определения различий в наблюдениях одного и того же свойства, будем называть базой (backdrop). Выбор этого термина объясняется тем, что всякая различающая особенность, какой бы она ни была, является своего рода базой, с которой наблюдается свойство. Типичной базой, пригодной практически для любого свойства, является время. В этом случае разные наблюдения одного свойства отличаются друг от друга тем, что они сделаны в разные моменты времени. Например, относительную влажность в определенном месте можно измерять в различные моменты времени. В некоторых случаях разные наблюдения одного и того же признака по времени неразличимы (то есть либо сделаны одновременно, либо время вообще не имеет значения), зато отличаются положением в пространстве, в 169
которых сделаны наблюдения. Например, различные свойства, характеризующие качество акустики, можно наблюдать в один и тот же момент времени в разных точках концертного зала. Множественные наблюдения одного и того же свойства могут различаться друг от друга представителями какой – либо группы (population), на которой определено данное свойство. Это может быть социальная группа, набор производимых товаров определенного типа, множество слов в какомто стихотворении или рассказе, множество стран, популяция лабораторных мышей и так далее. Базы трех основных типов – время, пространство, группа – можно комбинировать. Правильно выбранные базы должны удовлетворять некоторым ограничениям, которые могут служить руководящими принципами в процессе определения системы на интересующем нас объекте: 1 Базы должны быть применимы ко всем свойствам системы, для которой они определены. Например, ни время, ни пространство не могут быть использованы для отличия испытаний продукции определенного типа (не имеет значения, когда и где были проведены эти испытания); ни пространство, ни группа не применимы в качестве баз для свойств, характеризующих музыкальное сочинение; ни время, ни группу нельзя использовать при описании мозаики. 2 Базы системы должны отвечать назначению, для которого определяется данная система. Так, например, при наблюдении за выздоровлением пациента после хирургической операции наблюдают за соответствующими признаками. Ясно, что единственной подходящей для этого базой является время. Но если целью является создание медицинской базы данных, то те же самые характеристики будут различаться не только по времени, но и по фамилиям и другим характеристикам пациентов, находящихся на одной стадии выздоровления, сведения о которых и будут заноситься в базу данных. Таким образом, в этом случае применимыми в качестве баз оказываются и время, и группа. 3 Наблюдения всех свойств системы должны однозначно определяться базами системы, то есть каждый элемент базового множества (значение определенного момента времени, точка пространства, элемент группы или соответствующая комбинация элементов) определяют одно и только одно проявление любого из свойств. Например, при исследовании признаков слов текста (позиция, функция слова в предложении, число букв в слове и так далее) вполне разумной базой является группа слов, входящих в этот текст. Очевидно, что такая база применима к этим свойствам и соответствует цели исследования. Однако, она не удовлетворяет требованию однозначного различения наблюдений. В самом деле, одно и то же слово может находиться в одной и той же позиции и иметь ту же функцию в нескольких предложениях в данном тексте и, разумеется, в нем будет одно и то же число букв. Для того, чтобы отличить любое наблюдение, нам нужно обратиться в данном случае к одномерному абстрактному пространству, точкой которого является положе170
ние слова в тексте. Если смысл свойств и баз и их взаимоотношения поняты правильно, то ясно, как формально определить систему, заданную на объекте, иначе систему объекта. Она представляет собой множество свойств, с каждым из которых связано множество его проявлений, и множество баз, с каждой из которых связано множество ее элементов. Формально система объекта – это О = ({(a i , Ai ) | i ∈ N n }, {b j , B j | j ∈ N m }) , (Б.1) где N n = {1,2,..., n}, а N m = {1,2,..., m} ; ai и Ai - соответственно свойство и множество его проявлений; bj и Bj - база и множество ее элементов; О – система объекта. Необходимо понимать, что система объекта может приобрести содержание только благодаря заданию конкретных процедур наблюдения или измерения, с помощью которых создаются образы свойств. Таким образом, система объекта должна рассматриваться как компонент большей системы; рассматривать систему объекта саму по себе практически бесполезно. Б.2 Переменные и параметры
Переменной здесь называется операционное представление свойства, то есть образ свойства, определяемый конкретной процедурой наблюдения или измерения. Каждая переменная имеет определенное имя (метку), отличающее ее от других, и связывается с определенным множеством величин, через которые она себя проявляет. Эти величины обычно называют состояниями (или значениями) переменной, а все множество – множеством состояний. Аналогично параметром называется операционное представление базы. Каждый параметр имеет уникальное имя, и с ним связывается некое множество. Оно называется параметрическим множеством, а его элементы – значениями параметра. На отдельных множествах состояний или параметрических множествах могут быть определены некоторые математические отношения, например, отношения порядка или расстояние. Они отражают фундаментальные характеристики свойств и баз в той степени, в какой они присущи соответствующим измерительным процедурам. Различия в подобных свойствах среди переменных или параметров, которые имеют существенное методологическое значение, называют методологическими отличиями. В дополнение к конкретным переменным и параметрам, представляющим соответственно определенный признак или базу, рассматриваются также обобщенные переменные и параметры. Обобщенной переменной дается интерпретация, когда множество ее состояний отображается изоморфно (то есть отображается один в один с сохранением всех существенных математических отношений, определенных на нем) в элементы множества состояний конкретной переменной; то же относится к обобщенным и конкретным параметрам и их параметрическим мно171
жествам. Отображение такого рода называют конкретизацией обобщенной переменной (или обобщенного параметра), а обратное отображение – абстрагированием конкретной переменной (или конкретного параметра). Для формализации понятий обобщенных координат и конкретных переменных и их параметров введем следующие обозначения: vi ,Vi , Vi – соответственно обобщенная переменная, ее множество состояний и множество математических свойств, определенных на vi . Обозначим через v&i ,V&i , V’i те же характеристики конкретной переменной, являющиеся конкретизацией переменной vi . Обозначим через w j , W j , Wj соответственно обобщенный параметр, его множество состояний и множество математических свойств, определенных на параметре w j , а через w& j , W& j ,W’j - те же характеристики конкретного параметра, полученные конкретизацией параметра w j . Назовем каналом наблюдения любую операцию, вводящую конкретную переменную как образ свойства. Канал наблюдения, с помощью которого свойство ai представляется переменной v& i , реализуется функцией oi : Ai → V&i . (Б.2) Эта функция гомоморфна относительно предполагаемых свойств множеств Ai и V&i . Аналогичная функция ω j : B j → W& j (Б.3) задает представление базы bj параметром w& j , она также должна быть гомоморфной относительно соответствующих свойств базы (например, времени) и свойств множества W& j . Б.3 Методологические отличия
Термин методологическое отличие используется для выявления отличий типов системных задач внутри одного эпистемологического уровня. Для исходных систем методологические отличия касаются переменных и введенных параметров. Одним из фундаментальных методологических отличий является отсутствие математических свойств у множества состояний или соответствующего параметрического множества. Такие, например, переменные как семейное положение (одинокий, женатый, разведенный, вдовец), политическая принадлежность (демократ, республиканец, независимый), группа крови (А, В, О, АВ) или пол (мужской, женский), заданные на элементах какой – либо общественной группы, демонстрируют существенность этого методологического отличия. Другим фундаментальным свойством множеств является упорядоченность. Методологически следует различать два типа упорядоченности – частичную и линейную. Частичная упорядоченность – это бинарное отношение на множестве, являющееся рефлексивным, антисимметричным и транзитивным. Линейная 172
упорядоченность сильнее частичной, так как под ней понимается частичная упорядоченность, обладающая свойством связности (то есть любая пара элементов множества так или иначе упорядочена). Формально частичная упорядоченность Q, например, множества Vi – это бинарное отношение Q ⊂ Vi + Vi , (Б.4) удовлетворяющее следующим требованиям: 1 ( x, y) ∈ Q (рефлексивность); 2 если ( x, y) ∈ Q и ( y, x ) ∈ Q , то x=y (антисимметричность); 3 если ( x, y) ∈ Q и ( y, z) ∈ Q , то ( x , z) ∈ Q (транзитивность). Если ( x, y) ∈ Q , то x называется предшественником y, а y – преемником x. Если ( x, y) ∈ Q и не существует z ∈ Q , такого, что ( x , z) ∈ Q и (z, x ) ∈ Q , то x называется непосредственным предшественником y, а y – непосредственным преемником x. В дополнение к требованиям рефлексивности, антисимметричности и транзитивности отношение линейной упорядоченности удовлетворяет следующему требованию связности: для всех ( x, y) ∈ Vi , если x≠y, то или ( x, y) ∈ Q , или ( y, х ) ∈ Q . Примерами переменных с частично упорядоченным множеством состояний являются служебное положение или образование человека (определенные, например, на группе государственных служащих). Примерами переменных с линейно упорядоченными множествами состояний являются шкала твердости Мооса, высота как характеристика звука или экзаменационные оценки, определенные на группе студентов. Прекрасным примером упорядоченности параметрического множества является время. Хотя в большинстве случаев такое упорядочение линейно, имеют смысл и частично упорядоченные временные множества, например при исследовании отдельных пространственно разделенных процессов (таких, как распределенные вычислительные машины, которые обмениваются друг с другом информацией и для которых задержка при передаче сообщения сравнима со временем изменения состояний переменных из отдельных процессов). Полезно определить упорядочение и для некоторых групп. Например, группа людей может быть упорядочена по таким отношениям, как «быть старше», «быть потомком», «занимать более высокое положение по работе». Обычно частичные упорядочения и их существенность зависит от характера группы и всего контекста задачи. Переменные с линейно упорядоченными множествами состояний называются переменными с упорядоченной шкалой. Кроме частичных или линейных упорядочений существуют и другие математические свойства, определение которых для множеств состояний или параметрических множеств оказывается во многих случаях очень полезным. Одним из наиболее существенных свойств является расстояние между парой элементов изучаемого множества. Эта мера определяется функцией, сопоставляющей любой паре элементов этого множества число, определяющее, на каком расстоянии друг от друга находятся эти элементы с точки зрения неко173
торого фундаментального упорядочения. Для данного множества, скажем множества Vi , расстояние определяется функцией δ вида δ : Vi × Vi → R . (Б.5) Однако для того, чтобы эта функция отвечала интуитивному представлению о расстоянии, она должна удовлетворять следующим условиям для всех x, y, z ∈ Vi : (δ 1) δ ( x, y ) ≥ 0 (условие неотрицательности); (δ 2) δ ( x, y ) = 0 тогда и только тогда, когда х=у (условие нулевого расстояния, называемое также условием невырожденности); (δ 3) δ ( x, y ) = δ ( y, x ) (симметричность); (δ 4) δ ( x, z ) ≤ δ ( x, y ) + δ ( y, z ) (неравенство треугольника). Любая функция, удовлетворяющая условиям (δ 1) − (δ 4) , называется метрическим расстоянием на множестве Vi , а пара (Vi , δ ) - метрическим пространством. Метрическое расстояние можно, разумеется, определить как на множестве состояний, так и на параметрическом множестве. Примерами переменных с выраженными и существенными метрическими расстояниями являются почти все переменные в физике, например длина, масса, давление, электрическая проводимость, напряжение, сила звука, однако и помимо физики есть множество примеров таких переменных, скажем, количество денег, объемы производства, число дефектов, число несчастных случаев и так далее. Совершенно очевидно, что и пространство, и время – это параметры, к которым вполне естественно применимо понятие метрического расстояния. Однако редко удается определить метрическое расстояние на группах. Одним из таких примеров является группа студентов, линейно упорядоченная по показателям их успеваемости. При этом расстояние для каждой пары студентов определяется как абсолютное значение разницы между их позициями в упорядоченном списке. Переменные, с множеством состояний которых связано метрическое расстояние, обычно называются метрическими переменными. Еще одним свойством множеств состояний и параметрических множеств, имеющим большое значение как методологическое отличие, является непрерывность. Это понятие хорошо известно из математического анализа, и нет необходимости рассматривать его здесь подробно. Тем не менее уместно будет привести несколько замечаний относительно некоторых аспектов непрерывности, которые будут использоваться нами в дальнейшем. Необходимым условием непрерывности множества является его упорядоченность. Так как линейная упорядоченность является частным случаем частичной упорядоченности, то предпочтительнее определить непрерывность через частичную упорядоченность. Это можно сделать несколькими способами. Одно из определений непрерывного частичного упорядочения опирается на понятие разреза частично упорядоченного множества: разрез частично упорядоченного множества, скажем множества Vi , это разделение этого 174
множества на два непустых подмножества, например X и Y = Vi − X , такое, что или никакой элемент X не является предшественником (согласно частично упорядочению, определенному на Vi ) никакого элемента из Y и некий элемент Y является предшественником какого-либо элемента X , или никакой элемент из X не является преемником никакого элемента из Y и некоторый элемент Y является преемником некоторого элемента X . Непрерывное частичное упорядочение Vi определяется как частичное упорядочение, для которого любой разрез X , Y множества Vi характеризуется неким элементом из X , являющимся предшественником элемента из Y , такого, что или наибольшая верхняя граница X принадлежит Y , или наименьшая нижняя граница Y принадлежит X . Наилучшим примером непрерывного частичного упорядочения является отношение «меньше или равно», определенное на множестве действительных чисел или на его декартовых произведениях. Фактически само понятие непрерывной переменной (или непрерывного параметра) опирается на требование, чтобы соответствующее множество состояний (или параметрическое множество) было изоморфно множеству действительных чисел. Из этого следует, что множество состояний любой непрерывной переменной или параметрическое множество любого параметра бесконечно и несчетно. Тем самым альтернативой непрерывным переменным и параметрам являются переменные и параметры, заданные на конечных множествах или, возможно. На бесконечных счетных множествах. Последние называются дискретными переменными или параметрами. Непрерывные переменные и параметры представляются действительными числами, а их дискретные аналоги удобно представлять целыми числами. Это особенно существенно, если множество состояний или параметрическое множество значений дискретной переменной или параметра линейно упорядочено и, следовательно, изоморфно соответствующим множествам значений целых чисел. Для работы с некоторыми переменными и параметрами могут быть использованы метрическое расстояние, определяемое естественным образом как абсолютное значение разницы между целыми, а также целая арифметика. Для нас такие свойства. Как упорядоченность, метрическое расстояние и непрерывность множеств состояний и параметрических множеств, представляют основу для определения наиболее существенных методологических отличий на уровне переменных и параметров. Приведем список перенумерованных альтернатив для этих свойств: Упорядоченность: 0 – упорядоченности нет 1 – частичная упорядоченность 2 – линейная упорядоченность Расстояние: 0 – не определено 1 – определено Непрерывность: 0 – дискретно 1 – непрерывно 175
Статус любой переменной (или параметра) для этих трех свойств может быть однозначно охарактеризован триплетом - упорядоченность, расстояние, непрерывность, в котором каждое свойство представляется его определенным значением (или его идентификатором). Так, например, триплет (2, 1, 0) описывает дискретную переменную с линейно упорядоченным множеством состояний, на котором определено метрическое расстояние. Хотя данные три свойства в принципе определяют 12 возможных комбинаций, три из них (0, 0, 1), (0, 1, 0) и (0, 1, 1) смысла не имеют. В самом деле, если на множестве не определена упорядоченность, то на нем нельзя ни содержательно определить метрическое расстояние, ни рассматривать его как непрерывное. Таким образом, имеется девять осмысленных комбинаций. Будем называть эти комбинации методологическими типами переменных и параметров. Они могут быть частично упорядочены с помощью отношения «быть методологически более определенным чем». На рисунке Б.2(а) это частичное упорядочение, образующее решетку, представлено в виде диаграммы Хассе. Упрощенная решетка на рисунке Б.2(б) задает схему для свойств упорядоченности и расстояния, но без непрерывности. 000
100
200
101
201
210
00
10
110
20
11
211 а) б) 21 Рисунок Б.2 - Решетки методологических типов переменных или параметров На уровне переменных и параметров методологическое отличие одной переменной представляет собой сочетание методологических типов этой переменной и соответствующих баз. Каждая из них имеет девять типов. Следовательно, если есть только одна база или требуется, чтобы все базы, входящие в комбинацию, имели один методологический тип (наиболее часто встречающийся случай), то число методологических отличий будет равно 81 (так как методологические типы переменных и параметров не накладывают ограничений друг на друга). Если к тому же в нашей схеме будут учитываться только дискретные переменные и параметры, методологические типы которых приведены на рисунке Б.2(б), то число методологических отличий сократится до 25. Решетка методологических отличий для этого случая приведена в таблице Б.1.
176
Теперь предположим, что имеется два или более, например m, параметров. Они могут быть одного, двух, трех (независимо от порядка) и так далее. Таблица Б.1- Решетка методологических отличий для дискретных переменных и параметров Методологическое отли- Непосредственные предшественники в решетке чие 00/00 10/00 00/10 00/10 10/10 00/20 00/11 00/20 10/20 00/21 00/11 10/11 0/21 00/21 10/21 10/00 20/00 11/00 10/10 10/10 20/10 11/10 10/20 10/11 10/20 20/20 11/20 10/21 10/11 20/11 11/11 10/21 10/21 20/21 11/21 20/00 21/00 20/10 20/10 21/10 20/20 20/11 20/20 21/20 20/21 20/11 21/11 20/21 20/21 21/21 11/00 11/10 21/00 11/10 11/20 11/11 21/10 11/20 11/21 21/20 11/11 11/21 21/11 11/21 21/21 21/00 21/10 21/10 21/20 21/11 21/10 21/21 21/11 21/21 21/21 none Предположим, что m ≤ 9 (это довольно разумное предположение), тогда общее число методологических типов полного параметра определяется суммой 9 9 9 + + ... . 1 2 m
(Б.6)
типов. При сочетании этой суммы с девятью методологическими типами переменных мы получим общее число возможных методологических отличий одной переменной и ее параметра, это число определяется формулой m 9 9× ∑ . (Б.7) i i =1 177
Б.4 Представляющие и исходные системы
Свойства, конкретные и общие переменные, а также базы, конкретные и общие параметры являются компонентами соответственно трех примитивных систем – системы объекта, конкретной представляющей (image) системы и общей представляющей системы, которые вместе с отношениями между ними образуют исходную систему. Одна из этих трех систем введена в разделе Б.1 и формально определяется уравнением (Б.1). Оставшиеся две примитивные системы имеют тот же вид, что и система объекта, но их компонентами являются переменные и параметры, а не свойства и базы. Пусть İ и I – это, соответственно конкретная и общая представляющая системы. Тогда I& = ({ϑ&i ,V&i ) | i ∈ N n }, {(ϖ& j ,W& j ) | ∈ N m }) , (Б.8) I = ({(ϑi ,Vi ) | i ∈ N n } , {(ϖ i ,Wi ) | j ∈ N m }) , (Б.9) где соответствующие символы имеют тот же смысл, что и в разделе Б.2. Теперь нужно определить отношения между тремя примитивными системами O, İ, I. Для упрощения нотации условимся, что для любых i ∈ N n и j ∈ M свойство ai соответствует переменным ϑ& ,ϑ , а база b - параметm
i
i
j
рамϖ& j ,ϖ j . Отношение между системой объекта и конкретной представляющей системой задается в виде полного канала наблюдения, состоящего из отдельных каналов наблюдения, по одному для каждого свойства или базы из системы объекта. Обозначим через Q четкий полный канал наблюдения. Тогда Q = ({(Ai , V&i , oi ) | i ∈ N n , о i (Б.10) определяется уравнением (Б.2) и должны быть гомоморфны относительно свойств Ai и V&i } , {(B j ,W& j ,ϖ j ) | j ∈ N m , ϖ i определяются уравнением (Б.3) и
})
должны быть гомоморфны относительно свойств B j и Wj , где все символы имеют тот же смысл, что и в разделе Б.2. ~ Нечеткий полный канал наблюдения, скажем Q , можно получить, заменив o~i из (Б.10) на o~i , определенное совместно со степенью достоверности. Функции ϖ j также можно было бы заменить на функции ϖ~ j , также определенные с некоторой степенью достоверности. Отношение между конкретной и общей представляющими системами задаются набором отображений конкретизации (абстрагирования, по одному для каждой переменной и параметра из этих систем). Будем называть этот набор каналом конкретизации / абстрагирования и обозначать его E . Тогда E = ({V&i ,Vi , ei ) | i ∈ N n , ei определяют переход от обобщенных переменных к конкретным и должны быть изоморфны относительно свойств V&i и Vi } , {(W& j ,W j , ε j ) | j ∈ N m , ε j определяют переход от обобщенных параметров к
конкретным и должны быть изоморфны относительно свойств W& j , W j }) . 178
Можно рассмотреть канал наблюдения из системы объекта непосредственно в общую представляющую систему. Однако этот канал можно получить из двух каналов. Он состоит из триплетов (Ai ,Vi , oi Oei−1 ) и (B j ,W j ,ϖ j Oε −j 1 ), где символ О обозначает композицию. Теперь можно определить исходную систему, как пятерку S = (O, İ, I, Q, E). (Б.11) На рисунке Б.3 изображены эти пять компонентов, а также их связи с дометодологическими посылками (исследователь, объект, цель исследования и так далее) и с системами более высоких эпистемологических уровней. Рисунок также дает представление об основных методологических понятиях, связанных с исходной системой: 1 С одной стороны, исходная система представляет связи с реальным миром. Они проходят через систему объекта О и канал наблюдения Q. С другой стороны, исходная система связана с универсальным решателем системных задач (УРСЗ) через общую представляющую систему I и канал конкретизации / абстрагирования Е. Эти два компонента (I и Е) представляют интерфейс между конкретной предметной областью и УРСЗ. Данный интерфейс, находящийся на самом нижнем эпистемологическом уровне, очень важен, поскольку любой интерфейс на более высоком уровне опирается на него. 2 По существу концептуальная схема УРСЗ – это специальный язык для описания важных системных задач. Область УРСЗ ограничена синтаксическими аспектами решения системных задач. Эти аспекты представляются через разные методологические отличия общих представляющих систем и их эпистемологически более высоких аналогов. Таким образом, реализация УРСЗ может быть разработана и описана только в терминах общих представляющих систем и их развития на более высоких эпистемологических уровнях. При применении УРСЗ в конкретном исследовании или для какой-то
179
СИСТЕМЫ ЭПИСТЕМОЛОГИЧЕСКИ БОЛЕЕ ВЫСОКИХ УРОВНЕЙ ИСТОЧНИК ДАННЫХ
УРСЗ (синтаксические объекты)
ИНТЕРФЕЙС С УРСЗ
КАНАЛ КОНКРЕТИЗАЦИИ / АБСТРАГИРОВАНИЯ
ОБОБЩЕННАЯ ПРЕДСТАВЛЯЮЩАЯ СИСТЕМА I
Уравнение (2.12)
УРАВНЕНИЕ ( ) E
АБСТРАГИРОВАНИЕ (семантические аспекты)
КАНАЛ НАБЛЮДЕНИЯ
КОНКРЕТНАЯ ПРЕДСТАВЛЯЮЩАЯ СИСТЕМА
Уравнение (2.11)
Уравнение (2.13)
Q
СИСТЕМА ОБЪЕКТА О
ИСХОДНАЯ СИСТЕМА S
ФОРМАЛИЗАЦИЯ ИСХОДНОЙ СИСТЕМЫ
•
Цель исследования
•
Ограничения на исследование (прагматические
ИНТЕРПРЕТАЦИЯ (семантические аспекты) Уравнение (2.1)
ДОМЕТОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ
ВЫБОР • признаков • баз
ИССЛЕДОВАТЕЛЬ ИЛИ ГРУППА ИССЛЕДОВАТЕЛЕЙ
ОБЪЕКТ
СРЕДА ИССЛЕДОВАНИЯ
Допустимые и уместные взаимодействия
Рисунок Б.3 – Концептуальные элементы, используемые для определения исходной системы
180
другой цели соответствующие семантические аспекты вводятся через I, O, Q и E данной исходной системы. С абстрагированием связаны функции oi , ϖ j , ei−1 и ε −j 1 ; конкретизация характеризуется функциями ei , ε j и разбиениявводятся на ми oi−1 = Ai oi , ϖ −j 1 = B j ϖ j . Прагматические аспекты дометодологическом уровне. К ним относятся цель и ограничения на определенные действия (научные исследования, системное проектирование и так далее). Некоторые из этих прагматических аспектов находят свое отражение в формулировках языка УРСЗ. 3 Исходная система называется исходной по двум причинам. С одной стороны, например, для научных исследований она является источником эмпирических данных, так есть источником описанных на языке УРСЗ абстрактных представлений явлений реального мира. С другой стороны, для таких работ, как инженерное проектирование, она является источником интерпретации абстрактных данных, которые или определяются пользователем, или выводятся УРСЗ. Как отмечалось в разделе 1, при определении системы на объекте полезно различать два типа переменных (или соответствующих признаков). Мы назвали их входными и выходными переменными. Все, что в дальнейшем будет говориться об отличии между входными и выходными переменными. Равным образом относится к конкретным и обобщенным переменным, а также соответствующим свойствам. Дихотомия входных и выходных переменных возникла из практических соображений. Она отражает в основном точку зрения пользователя, которая, в свою очередь, повлияла, а в некоторых случаях и определила цель, с которой задавалась система. Выходные переменные исходной системы рассматриваются пользователем как переменные, значения которых при соответствующих значениях параметров определяются внутри системы, в отличие от входных переменных, значения которых задаются извне. Все факторы, влияющие на определение входных переменных, обычно называются средой системы. Системы с входными и выходными переменными будем называть направленными системами. А системы, у которых переменные не классифицированы таким образом, нейтральными. Согласно этой терминологии исходная система, определяемая уравнением (Б.11), также как и три ее примитивные системы (O, İ, I) являются нейтральными. Чтобы преобразовать их в направленные системы, нужно, чтобы в их определении все переменные (и свойства) были объявлены как входные или выходные. Пусть, например. Для системы I такое объявление сделано с помощью функции u : N n → {0,1}, такой, что если u (i ) = 0 или u (i ) = 1 , то это значит, что переменная vi является соответственно входной или выходной. Любую n -ку u = (u (1) , u (2 ) , …, u (n )) , задающую определенный статус для всех переменных системы, назовем определителем входа-выхода. Ясно, что для n переменных всего может быть 2 n объявлений входов-выходов, каждый из которых имеет свой определитель 181
входа-выхода u . Разумеется, переменным v&i и признакам ai соответствует тот же определитель входа-выхода. Определение любой из трех примитивных систем O, İ, I можно легко превратить в определение ее направленного аналога, если добавить к нему конкретный определитель входа-выхода. Обозначим направленные аналоги нейтральных систем теми же символами, но с добавлением знака ^ Тогда O€ = ({ai , Ai ) | i ∈ N n }u{(b j , B j ) | j ∈ N m }) , (Б.12) I&€ = ({ϑ& ,V& ) | i ∈ N }u{(ϖ& ,W& ) | j ∈ N }) , (Б.13) i
i
n
j
j
m
I€ = ({ϑi ,Vi ) | i ∈ N n }u{(ϖ j ,W j ) | j ∈ N m }) ,
(Б.14)
где O€, I€&, I€ - направленные аналоги нейтральных систем O, I&, I . Направленная исходная система определяется пятеркой S€ = O€, I&€, I€, Q, E .
(Б.15)
Б.6 Системы данных
Исходная система – это схема, по которой могут быть сделаны наблюдения отобранных признаков. Если канал наблюдения четкий, то любое реальное наблюдение представляется в виде упорядоченной пары, состоящей из значения полного параметра, при котором было сделано наблюдение, и зафиксированного полного состояния переменных. Так как при одном значении параметра может быть сделано только одно наблюдение, множество этих упорядоченных пар является функцией, отображающей полное параметрическое множество в полное множество состояний. Эта функция и представляет собой данные или, точнее, четкие данные. В УРСЗ всегда предполагается, что данные должны быть представлены как обобщенные параметры и переменные (см. рисунок 5). Следовательно, при формализации понятия данных мы можем ограничиться рассмотрением только обобщенной направляющей системы I, как она определена в (Б.14). Пусть W = W1 × W2 × ... × Wm , V = V1 × V2 × ... × Vn . Тогда четкие данные представляются функцией d :W → V . (Б.16) Функция d любому значению полного параметра ставит в соответствие одно полное состояние переменных. В то время как представляющая система I описывает только потенциальные состояния переменных, функция d дает информацию об их действительных состояниях при неограниченном параметрическом множестве. Система I в соединении с функцией d можно рассматривать как систему более 182
высокого эпистемологического уровня (уровня 1). Будем называть такую систему системой данных и обозначать D. Тогда D = (I , d ) . (Б.17) Несмотря на то, что в этом определении отсутствует какой-либо семантический оттенок, оно достаточно и вполне удобно для разработки и описания методологических характеристик УРСЗ. Однако для любого конкретного применения в формулировке должен быть отражен и смысл данных d. Это можно сделать, заменив представляющую систему I в уравнении (Б.17) соответствующей исходной системой S. Получившуюся в результате этой замены систему назовем системой данных с семантикой и обозначим S D . Таким образом: S D = (S , d ) , (Б.18) где d – та же самая функция, что и в уравнении (Б.17). Однако в данном случае функция d связана с системой S следующим образом: если наблюдение, описываемое с помощью oi Oe −1 ( xi ) = yi для всех i = N n (где x i - предполагаемое проявление свойства a i , а yi - соответствующее состояние переменной vi ), связывается со значением полного параметра ϖ ∈ W , то d ( w) = v , где v = ( y1 , y 2 ,..., y n ) ∈ V . В зависимости от рассматриваемой задачи функция d на самом деле может быть определена по крайней мере тремя разными способами. Во-первых, она может быть результатом наблюдений или измерений, как это бывает при всевозможных эмпирических исследованиях. Во-вторых, ее можно вывести из систем более высоких уровней, как это показано далее. В-третьих, она может быть из каких-то соображений определена самим пользователем, как это бывает в задачах проектирования систем. Системы данных D и S D нейтральные, так как они определены, соответственно через нейтральную представляющую систему I и нейтральную исходную систему S . Превращение этих систем в их направленные аналоги D€ и S D€ труда не представляет. Нужно только заменить I на I€ , а S на S€ . Таким образом, D€ = ( I€, d ) , (Б.19) S € D = ( S€, d ) , (Б.20) - это направленные системы данных без семантики и с семантикой соответственно. Если переменные определяются через нечеткие каналы наблюдения, то каждое наблюдение записывается как упорядоченная пара, состоящая из значения полного параметра, с которым связано наблюдение, и n -ки (h1 , h2 ,..., hn ) функций hi : Vi → [0,1], i ∈ N n , (Б.21) 183
где hi ( y ) выражает степень уверенности в том, что y является наблюденным состоянием переменной vi . Формализуем понятие нечетких данных. Пусть ~ V = {V1 → [0,1]}× {V2 → [0,1]}× ... × {Vn → [0,1]} . Тогда нечеткие данные представляются функцией ~ ~ d :W → V . (Б.22) Для любого значения полного параметра w ∈ W ~ d ( w) = h , ~ где h = (h1 , h2 ,..., hn ) ∈ V . Если данные являются нечеткими, то определения систем данных сле~ дует модифицировать, заменив в (Б.17) - (Б.20) функцию d функцией d . С каким типом данных – четким или нечетким – мы имеем дело, всегда ясно по контексту, поэтому не имеет смысла для систем данных с четкими и нечеткими данными использовать разные обозначения. Если в определении системы данных с нечеткими данными входит исходная система S, то функции d и S связаны следующим образом, если наблюдение связано со значением полного параметра. Описываемого как o~i ( xi , y& i ,k ) = z i ,k . и −1 e ( y& i ,k ) = y i ,k для всех i ∈ N n , где xi - возможное проявление признака ai , то hi ( y i ,k ) = z i ,k для всех yi ,k ∈ Vi и всех i ∈ N n . Четкие данные могут быть представлены в самом разном виде. Пусть стандартной формой представления дискретных переменных и параметров будет матрица d = [vi ,ϖ ], элементами которой vi ,ϖ являются состояния переменных vi , наблюденные при соответствующих значениях полного параметра w (рисунок Б.4а). Каждый столбец матрицы d задает полное состояние, наблюденное при данном w, а каждая строка – все наблюдения одной переменной на параметрическом множестве W. Если W линейно упорядочено, то и столбцы в матрице d должны быть упорядочены точно таким же образом. Если используются несколько параметров, например группа – время, пространство нескольких измерений или пространство – время, то может оказаться удобнее использовать другие формы представления. Некоторые из этих форм будут продемонстрированы в различных примерах. Для нечетких данных стандартной формой представления, подобной матрице d, является трехмерный массив ~ ~ d = d i , ji ,w ,
[
184
]
элементами которого являются значения степени уверенности в том, что при значении параметра w наблюдалось состояние ji переменной vi . Понятно, что i ∈ N n , ji ∈ Vi , w = W, а d i , j , w ∈ [0,1] . Массив представляет собой d матриц (страниц, плоскостей), по одной для каждой переменной. Столбец w в матрице переменной v1 задает функцию hi , определяемую уравнением (Б.21) и соответствующую наблюдению, идентифицируемому w. Методологические отличия, определенные для исходных систем, весьW ϖ ∈W
V
ϑi ∈V
Vi ,ϖ ∈ Vi
Рисунок Б.4 - Стандартные формы представления данных для дискретных переменных а) матрица d четких данных d ; б) трехмерный ~ массив d нечетких данных d
а) W ϖ ∈W
V1
d1, j1 ,ϖ ∈ [0,1]
j1 ∈ V1
ϖ ∈W
V2
d 2, j2 ,ϖ ∈ [0,1]
j2 ∈ V 2
…
ϖ ∈W
Vn
d n , jn ,ϖ ∈ [0,1]
jn ∈ V n
б) ма важны, поскольку они приложимы и ко всем системам более высоких эпистемологических уровней. Проиллюстрируем эти отличия, а также другие свойства исходных систем на следующих двух примерах. Пример 1. Пусть объектом исследования являются лесопосадки деревьев твердых лиственных пород на западе штата Нью-Йорк. Лесники обычно помечают деревья для выборочной рубки через довольно регулярные промежутки. Главные цели маркировки деревьев для рубки – поддержание или улучшение качества леса и вывоз лесоматериалов, стоимость которых достаточно велика, чтобы это было выгодно и владельцу и лесообрабатывающему предприятию. Цель определения исходной системы для данного объекта – получение характеристик деревьев, маркированных для рубки, их оценка и 185
разработка более подходящих и точных руководств для маркировки деревьев в будущем. Базой в данном примере является группа деревьев, представляющая собой выбранный для исследований лесной массив. Пусть каждое исследуемое дерево помечается целым числом. Тогда функция ϖ дает отображение «один в один», равно как и функция ε . Пусть для исследования объекта было отобрано семь свойств. Приведем их описания и определим соответствующие переменные. Вид дерева: свойство a1 . Для исследования в данном лесном массиве для всех видов деревьев выделено только четыре класса деревьев. Следовательно, для представления этого свойства нужна конкретная переменная с четырьмя состояниями. На рисунке Б.5а определена функция o1 , связывающая свойство с этой переменной. На том же рисунке определяется функция e1 , которая, как всегда, представляет собой простую схему переобозначения. Множества A1 и V1 никакими свойствами не обладают, и, следовательно, всевозможные свойства целых чисел из множества V1 и не могут быть использованы. Канал наблюдения является четким, то есть непосредственно представляется функцией o1 . Диаметр (диаметр на уровне груди): свойство a2 . Более точно это свойство определяется как диаметр ствола на уровне четыре с половиной фута от земли. Хотя с помощью рулетки диаметр может быть измерен с точностью до 0,1 дюйма, при оценке объема древесины этот диаметр оценивается или измеряется с точностью до 1-2 дюймов. Однако для выборочной рубки деревьев достаточно разбить диаметры стволов всего на пять категорий. Они определяются на рисунке Б.5б вместе с функциями o2 и e2 . Несмотря на то, что возле границ блоков разбиения A2 o2 может иметь место некоторая нечеткость измерения, канал наблюдения o2 можно рассматривать как четкий, так как эта нечеткость практического значения не имеет. Множества A2 , V&2 ,
V2 можно рассматривать как линейно упорядоченные с метрическим расстоянием, и, следовательно, если нужно, то можно для множества V2 воспользоваться свойствами целых чисел. Товарная высота: свойство a3 . Несмотря на то, что этот параметр может быть измерен довольно точно, достаточно только оценить его значение и выделить три диапазона: меньше 24 футов, от 24 до 48 футов, больше 48 футов. Эти диапазоны можно представить состояниями 0, 1, 2 множества V3 . Порядок и расстояние для целых чисел из V3 можно использовать в исследованиях.
186
A1 (проявления)
o1
V&1 (конкретные состояния)
e1
V1 (обобщенные состояния)
Твердый клен Белый ясень Черная вишня
Класс дерева I
0
Класс дерева II
1
Класс дерева III
1
Класс дерева IV
1
Красный дуб Мягкий клен Желтая береза Тюльпановый тополь Американская липа Белый дуб Белая сосна Бук Гикори Осина Хэмлок Другие деревья а)
A2
V&2
o1
V2
e1
Менее 6 дюймов
Молодые деревца
0
6,0-10,9 дюймов
Жерди
1
11,0-16,9 дюймов
Тонкий строевой лес
2
17,0-25,0 дюймов
Строевой лес
3
Более 25,0 дюймов
Зрелые деревья
4
б)
Рисунок Б.5 - Определение переменных для признаков a1 и a2 из примера
187
Класс кроны: свойство a4 . Класс кроны описывает размер и положение верхней части дерева относительно верхушек соседних деревьев. Подавленные деревья заслонены другими деревьями, относительно мало влияют на соседей, и им в борьбе за существование плохо помогает освобождение от соседей. С другой стороны, доминирующие деревья оказывают большое влияние на соседей. Это свойство считается очень важным показателем того, как дерево реагирует на освобождение от соседей и насколько оно способно дать хорошую древесину. Лесоводы разработали четкие стандарты для классификации класса кроны на четыре состояния V&4 : доминирующая, кодоминирующая, средняя, подавленная, которые могут быть соответственно представлены состояниями 0,1,2,3, сохраняющими в V4 линейный порядок. Сорт согласно стандартам ЛССШ (Лесная служба США): свойство a5 . Значение этого свойства зависит от числа, размера и взаимного расположения ветвей, сучков и других признаков наличия в дереве узлов. Выделяется четыре сорта (состояния V&5 ). Они хорошо определены и опираются на стандарты Национальной ассоциации производителей лесоматериалов и Лесной службы министерства сельского хозяйства США. Они называются сортами ЛССШ 1, 2, 3 и местного применения. Их в V5 можно представить в виде целых чисел 0, 1, 2, 3, сохраняющих отношение порядка. Дефекты: свойство a6 . Значения этого свойства говорят о дефектах дерева, таких, как гнилостность, искривления и разветвленность, уменьшающие объем древесины, которую можно получить три состояния: без дефектов или с небольшими дефектами, частично испорченное, бракованное дерево. Эти состояния в V6 можно, сохраняя порядок, представить значениями 0, 1 и 2. Так как эта переменная представляет собой оценку внутренних дефектов по внешним признакам, она может быть ошибочной, даже если её делает очень компетентный наблюдатель. Поэтому в данном случае желательно использовать нечеткий канал наблюдения, позволяющий наблюдателю в каждом отдельном наблюдении выразить степень неуверенности в достоверности его оценке. При этом функция o6 явно не задается, а определяется самим наблюдателем. Маркировка дерева: свойство a7 . Исследуемые деревья либо маркируются для рубки, либо нет. Пометим проявления этого свойства в множестве V7 цифрами 1 и 0. Множество V&7 никакими свойствами не обладает. Мы видим, что определенная в этом примере исходная система является нейтральной. Однако для формулирования правил маркировки деревьев, предназначенных на сруб, система должна быть переопределена как направленная с входными переменными v1 − v6 и выходной переменной v7 . Один канал наблюдения нечеткий, а остальные четкие, поэтому в исходной системе смешаны четкие и нечеткие переменные. Множество параметров свойствами не обладает, а множества состояний имеют два, а, возможно, и три типа: без свойств, линейно упорядоченные и, может быть, линейно упорядоченные 188
с метрическим расстоянием. Для пояснения различных характеристик систем данных и их представлений рассмотрим более детально некоторые примеры конкретных систем данных (то есть систем данных с семантикой). Пример 2. При изучении поведения животных этологи используют такие методы, которые как можно меньше беспокоят исследуемых животных, находящихся в естественной среде обитания. Одним из таких методов изучения поведения группы животных является съемка фильмов, а затем определение уже по фильму характера поведения животных. Для каждого конкретного вида животных обычно определяются характерные позы и движения. Этологи часто специфицируют их рисунками, сопровождаемыми часто вербальными описаниями. Например, на рисунке Б.6а изображены важнейшие позы ча-
e1 = e 2
V&1 = V&2
V1 = V2 0 1
Нападение Выпрямление Разбрасывание Травы
2
Волнение Отступление
3 4 б)
а)
t=
v1 v2 t=
v1 v2 t=
v1 v2
1 1
2 1
3 0
4 3
5 3
6 3
7 3
8 3
9 4
10 3
11 3
12 0
13 2
14 1
15 1
16 1
17 1
18 4
19 4
20 4
4
3
4
3
3
3
3
3
4
4
3
3
4
2
1
1
1
4
4
4
21 4
22 4
23 0
24 2
25 2
26 4
27 4
28 4
29 4
30 4
31 4
32 4
33 2
34 2
35 2
36 2
37 2
38 0
39 2
40 1
4
3
1
4
2
2
4
4
4
4
4
4
4
4
1
1
1
3
3
1
21 0
22 2
23 1
24 1
25 4
3
3
3
3
4
Рисунок Б.6 - Данные, описывающие пограничное столкновение между двумя чайками (пример 2)
в)
ек, которым даны поясняющие названия; «отдых», движение «вперед» и так далее. Каждая из них также описывается вербально, например «волнение на189
чинается с того, что чайка наклоняется над гнездом (или любой другой вмятиной в земле, похожей на гнездо, например, над следом ноги), а затем начинает ритмично покачивать головой вверх-вниз». Объектом исследования в данном примере являются две чайки: чайка I и чайка II. Переменные определены на следующих характеристиках: a1 - тип поведения чайки I, a2 - тип поведения чайки II. Характеристики наблюдаются во времени. Период наблюдения 90 с. Он разделен на интервалы по 2 с, каждый из которых представляет одно наблюдение. Таким образом, конкретное временное множество (являющееся параметрическим множеством для данного примера), скажем & T = {t1 , t 2 ,..., t 45 }, может быть определено разбиением периода в 90 с. с помощью следующего канала наблюдения: 0 ≤ ϖ −1 (t1 ) < 2c,
2 ≤ ϖ −1 (t 2 ) < 4c, … −1 88 ≤ ϖ (t 45 ) < 90c. Время T& линейно упорядочено и имеет метрическое расстояние. При отображении T на множество целых чисел, скажем на множество T = N 45 с помощью функции ε (k ) = t k (k ∈ N 45 ), порядок и метрическое расстояние сохраняются. Каждое наблюдение данных двух характеристик представляется теми кадрами из фильма, которые относятся к данному периоду в 2 с. Эти кадры изучаются этологом, и для каждой чайки определяется один из нескольких перечисленных выше типов поведения (состояния из множеств состояний V&1 , V&2 ). В данном примере, в котором исследуется пограничный конфликт между двумя чайками, для обеих характеристик достаточно пяти одинаковых типов поведения (то есть V&1 = V&2 ). Названия этих типов, а также их целые обозначения (элементы обобщенных множеств состояний V1 , V2 ) приведены на рисунке Б.6б. Типы поведения, называемые «выпрямление» и «волнение», входят в число основных поз, изображенных на рисунке Б.6а. «Разбрасывание травы» определяется так: «неистово клюет землю, вырывает растения и разбрасывает их в стороны движениями головы». Два оставшихся типа поведения «нападение» и «отступление» хорошо характеризуются своими названиями. На рисунке Б.6в приведена матрица данных, полученная по реальному фильму. При этом t ∈ T и v1,t , v2,t ∈V1 (= V2 ) . Определенная в этом примере система является нейтральной системой с семантикой. Её переменные дискретны, а параметром является время. Параметрическое множество (время) линейно упорядочено и обладает метрикой. Данные четкие. 190
По поводу этого примера необходимо сделать два замечания. Вопервых, оба канала наблюдения oi : Ai → V&i (i = 1,2) , где Ai - это предполагаемый набор возможных действий, одинаковы, представлены самим исследователем, и их нельзя определить математически. Они определяются по сочетанию картинки и вербального описания. Во-вторых, любое наблюдение (столбец матрицы данных) представляет собой сделанное исследователем заключение относительного того, что произошло в соответствующий 2-секундный период времени. Этот подход довольно сомнителен, поскольку действия чайки (описанные в терминах типов поведения, определенных на множестве состояний) не обязательно начинаются и заканчиваются на границах 2-секундных интервалов. В подобного рода исследовании лучше было бы временное множество T представить неявно, по изменению состояния переменных. Временное множество T& определяется неявно по следующему правилу: весь период наблюдения (в нашем примере 90 с) делится на временные интервалы, в течение которых ни одна из переменных (в нашем случае переменные две) не меняет своего состояния, если по крайней мере одна переменная изменяет свое состояние, один временной интервал кончается и начинается следующий. Если важно знать длительность отдельных действий, то можно ввести новую переменную – длительность временного интервала (измеряемую с необходимой точностью) и запоминать значения этой переменной в качестве части данных. Неявное определение временных множеств (как с введением дополнительной переменной, содержащей длительность неявно заданных временных интервалов, так и без этой переменной) часто бывает более подходящим, чем любое явное определение. Оно также бывает полезно, а часто и желательно для переменных, параметром которых является то или иное пространство.
191
Приложение В Порождающие системы В.1 Эмпирическое исследование
Для любого содержательного эмпирического исследования необходимы три предпосылки. Во-первых, должен быть определен объект исследования; во-вторых, должна быть известна цель исследования этого объекта; в третьих, должны быть определены ограничения, при которых проводится исследование. Объект исследования определен в разделе Б как часть мира, различаемая как единое целое в течение достаточно длительного периода времени и подходящая для какого-либо конкретного исследования. Цель исследования можно представить как набор вопросов об объекте, на которые исследователь (или его заказчик) хотят получить ответы. Если, например, объектом исследования является г. Нью-Йорк, то целью исследования могут быть ответы на такие вопросы: каким образом можно сократить преступность в городе или как улучшить движение транспорта; если объектом исследования является вычислительный комплекс, то целью исследования может быть поиск ответов на вопросы: каковы узкие места в комплексе, что можно сделать для повышения его производительности – и тому подобное; если исследуется больница, то возможны такие вопросы: как повысить готовность оказать срочную помощь в опасных случаях, как сократить среднее время пребывания пациента в больнице или что можно сделать для сокращения платы за лечение при сохранении его качества? Если музыковед изучает творчество какого-либо композитора, например Игоря Стравинского, то его вопрос будет, вероятно, выглядеть так: каковы основные особенности сочинений Стравинского, отличающие их от произведений других композиторов? Ограничения в эмпирическом исследовании представляют ограниченные возможности выбора инструментов, ограниченные финансовые возможности и время, людские ресурсы и мощность вычислительной техники, правовые, моральные и другие нормы, которых должен придерживаться исследователь. Основные этапы эмпирического исследования является рисунке В.1; они послужат нам руководством при изложении материала данного раздела. Первым этапом любого эмпирического исследования является определение исходной системы на соответствующем объекте. Этот этап достаточно подробно рассмотрен в разделе Б и изображен на рисунке Б.3. Основной проблемой этого этапа исследования является выбор обычно из многих возможностей исходной системы, наилучшим образом соответствующей цели исследования и удовлетворяющей имеющимся ограничениям. Решение этой проблемы, безусловно, зависит от контекста. Оно требует со стороны иссле192
дователя не только опыта и знаний в изучаемой области, но и специального исследования. Перед тем как выбрать какую-либо определенную исходную 1
••
• •
ОБЪОбъЕКТ ект ИССЛЕ исслеДОВАдоваНИЯ Цель ния исследо Цель вания
2
ОпределеОпределение ние исходисходной ной систесистемы мы
3
Сбор дан-
Обработ-
Интер-
ных
ка данных
пре-тация
С
• ИсходИсходная ная система система
4
•• Система Система данных данных
бор
бра
•• ПараметричеПараметрические ские инвариантинвариантные свойстные свойства ва •
•• •
И
О
ПРО• ДОЛЖЕПроНИЕ должеОБРАБОТКИние ДАННЫХ обра• • Новый ботки способ обработки данных данных Продолжение Продолжениеизмерений измеренийили илинаблюнаблю-
нтер
•
ВЫВ ОДЫ (ЗАКЛЮЧИТЕЛЬ •
Продолж ение иссле дова
Переопределение исходной системы
Рисунок В.1 - Основные этапы эмпирических исследований систем систему для эмпирического исследования, часто приходится изучить сначала различные гипотетические варианты систем более высоких эпистемологических уровней. С самого начала при выборе подходящей исходной системы возникают две проблемы: выбор свойств и баз и выбор каналов наблюдения для них. Каналы абстрагирования рассматриваются позже когда возникает необходимость перевести систему на язык УРСЗ. Выбор свойств и баз, возможно, самое важное решение, принимаемое в процессе эмпирического исследования, так как этот выбор влияет на все последующие этапы этого процесса. Принять решение очень непросто и не всегда удается рационально объяснить это решение. Решение часто опирается на некие априорные идеи, которые, когда они достаточно четко сформировались в сознании исследователя, называются научными теориями. Некоторые ученые, занимающиеся философией науки, настаивают на том, что любой осмысленный выбор свойств для эмпирического исследования всегда опирается на некую теорию, которая или сформулирована явным образом, или возникала у исследователя подсознательно, или является частью нашего унаследованного генетического врожденного знания. После выбора свойств и баз исследователь должен определить для них канал наблюдения. Как уже говорилось в разделе Б, каналы наблюдения задают разбиения заданного множества проявлений свойства или значений параметра. Любое такое разбиение будем называть разрешающей формой (resolution form). Хотя в некоторых случаях разрешающие формы не могут быть определены математически (если только не принимать какие-то метафизические допущения), вполне возможно определить, является ли одна разрешающая форма уточнением другой или её укрупнением (в смысле стандарт193
ного уточняющего упорядочения определенного на разбиениях заданного множества). Подобное сравнение двух разрешающих форм делается не математически, а с помощью сопоставления соответствующих процедур измерения. Диапазон возможных разрешающих форм всегда имеет верхнюю границу, определяемую разрешающей способностью имеющихся измерительных инструментов. Нижней границей является любая разрешающая форма, состоящая только из двух блоков. Выбор формы из этого диапазона зависит от цели исследования. После определения исходной системы становится возможным сбор данных. Этот процесс сводится к наблюдению или измерению отобранных свойств при определенных значениях баз и записи этих наблюдений в некой подходящей форме (см. раздел Б.5). Если исследователь имеет возможность управлять некоторыми свойствами, он может этим воспользоваться. В этом случае свойства, которыми он собирается управлять, рассматриваются как выходные свойства, что дает направленную исходную систему. Затем исследователь предлагает некие эксперименты, в которых согласно осуществимой экспериментально стратегии, связанной с целью исследования, задаются входные свойства. При этом наблюдаются выходные свойства. В результате получается система данных. После определения системы данных начинается следующий этап эмпирического исследования – обработка данных. Его целью является определение неких параметрически инвариантных свойств переменных, позволяющих экономно представлять данные и, если нужно, порождать их. На этом этапе УРСЗ может очень помочь исследователю. При этом или используются все данные для вывода нужных параметров инвариантных свойств, или сначала обрабатывается только часть данных, а остальные резервируются для последующей проверки полученных свойств. Существует ряд параметрически инвариантных свойств, но все они имеют нечто общее. Каждое такое свойство описывает ограничение, наложенное на переменные исходной системы, не меняющиеся в пределах параметрического множества. Если, например, параметром является время, то любое инвариантное времени свойство описывает ограничение на переменные, не меняющиеся во времени. Разные параметрические инвариантные свойства могут служить характеристиками типов ограничений, связываемых с различными эпистемологическими уровнями, или, наоборот, могут отличаться только способом, каким представляется один и тот же тип ограничений, связанный с определенным эпистемологическим уровнем. На первых отличиях базируется различение эпистемологических уровней систем, вторые служат для представления методологических отличий на определенном эпистемологическом уровне. После того как данные каким-то образом обработаны и определены соответствующие параметрически инвариантные свойства, им необходимо дать интерпретацию с учетом цели исследования, то есть нужно посмотреть, насколько они полезны для поиска ответов на поставленные в исследовании вопросы. Если на вопросы можно ответить адекватно, то исследование ус194
пешно завершено и исследователь может подвести итоги и готовить заключительный отчет. В противном случае он может попытаться обработать данные другим способом. Этот процесс может повторяться несколько раз, причем можно искать параметрически инвариантные свойства как того же уровня, так и других эпистемологических уровней. В конечном счете исследователь получает набор порождающих систем или систем более высокого уровня, каждая из которых с определенной точки зрения правильно представляет данные. Подобный набор взаимодополняющих систем, каждая из которых отражает определенные свойства данных. Что дает исследователю лучшее понимание проблемы, чем какая-либо одна система. Система (или системы), полученная в результате обработки данных, иногда оказывается сложной, чтобы человек мог ее охватить целиком, и, следовательно, такая система не может помочь исследователю лучше понять проблему. В подобных случаях необходимо или по крайней мере желательно уменьшить сложность этой системы. Таким образом, УРСЗ должен располагать средствами упрощения систем разных типов по критериям, указанным пользователем. После обработки данных и интерпретации полученных свойств исследователь может также захотеть собрать дополнительные данные для того, чтобы повысить свою уверенность в правильности полученных свойств, или пересмотреть их на основе новых данных. Подобный повторный сбор данных изменяет систему данных, но оставляет без изменений исходную систему. Однако исследователь может сделать и более решительное изменение – переопределить исходную систему. В этом случае он, разумеется, должен повторить весь процесс для новой исходной системы. Вся процедура эмпирического исследования систем, согласно рисунку 9, может быть теперь описана следующим образом: 1) дан объект, цель и ограничения эмпирического исследования; на объекте определяется исходная система (подробности см. на рисунке 5); 2) для данной исходной системы собираются данные и представляются в удобном виде, обычно в виде массива данных; 3) данные обрабатываются с целью определения неких представляющих их параметрически инвариантных свойств; 4) полученные параметрически инвариантные свойства интерпретируются в соответствии с целью исследования и делаются окончательные выводы или исследование начинается снова с этапа 3, 2 или 1. В.2 Системы с поведением
Термин поведение используется в данной книге просто для получения характеристики общего параметрически инвариантного ограничения на переменные обобщенной представляющей системы и, может быть, на некоторые дополнительные абстрактные переменные. Дополнительные переменные определяются на параметрическом множестве с помощью правил сдвига 195
(translation rule). Такое правило может быть применено или к переменной из заданной представляющей системы, или к введенной по каким-либо методологическим соображениям гипотетической переменной, обычно называемой внутренней. Вопросы, связанные с внутренними переменными, рассматриваются далее в специально посвященном этому вопросу разделе. В остальных разделах предполагается, что внутренние переменные в рассмотрение не вводятся. Так как описание параметрически инвариантного ограничения на рассматриваемые переменные может быть использовано для порождения состояний переменных при данном параметрическом множестве, системы, содержащие такие ограничения, называются порождающими системами. Поведение представляет собой одну из форм задания этого ограничения. Для заданной обобщенной представляющей системы диапазон возможных типов параметрически инвариантных ограничений зависит от свойств, приписываемых параметрическому множеству. Если на этом множестве никаких свойств не определено (как это часто бывает для групп), то состояния переменных могут ограничивать только друг друга. Однако если параметрическое множество упорядочено, состояния переменных могут ограничиваться не только другими состояниями, но и состояниями выбранного соседства для каждого конкретного значения параметра. Поскольку соседство является основой для представления параметрически инвариантного ограничения, оно само должно быть параметрически инвариантным. Соседство на упорядоченном параметрическом множестве обычно называется маской (почему, будет объяснено ниже) и определяется через переменные, параметрическое множество и набор правил сдвига на параметрическом множестве. Правило сдвига, скажем правило r j , - это однозначная функция rj : W → W , (В.1) которая каждому элементу W ставит в соответствие другой (причем единственный) элемент W. Если, например, параметрическое множество полностью упорядочено (как в случаях, когда рассматривается время или одновременное пространство) и представляет собой множество последовательных целых положительных чисел, то любое правило сдвига может быть задано простым уравнением r j ( w) = w + ρ , (В.2) где ρ - целая константа (положительная, отрицательная или нуль). При ρ = 0 r j называется тождественным правилом сдвига. Пусть задана обобщенная представляющая система I, определяемая уравнением (Б.9). Обозначим через V множество переменных из I, а через R набор правил сдвига, рассматриваемых для этих переменных. Тогда множество переменных S = {s1 , s 2 ,...}, называемых выборочными переменными, может быть введено с помощью уравнений 196
sk ,ϖ = vi ,r j ( w)
(В.3)
для некоторых переменных vi ∈V и правил сдвига r j ∈ R ; s k ,ϖ обозначено состояние выборочной переменной sk при значении параметра w, а vi , ji ( w) - состояние переменной vi при значении параметра r j ( w) , то есть при значении, полученном для заданного w, при применении правила сдвига r j . Для полностью упорядоченного параметрического множества, правила сдвига которого имеют вид (В.2), уравнение (В.3) может быть переписано в более определенном виде sk ,w = vi ,w+ ρ& (В.4) Так как любое правило сдвига из набора R может быть применено к любой переменной из множества V, то множество всех возможных выборочных переменных представляется декартовым произведением V × R . В действительности рассматриваются выборочные переменные, характеризуемые отношением M ⊆V ×R (В.5) так, что всякой паре (vi , r j ) ∈ M соответствует одно уравнение из (В.3). Отношение М представляет схему соседства на параметрическом множестве, в терминах которого определены выборочные переменные. Как уже говорилось выше, эта схема обычно называется маской. Понятно, что для введения идентификаторов выборочных переменных k должна быть введена некая однозначная функция (кодирование). (В.6) λ:M → NM , где M - это мощность множества M. Если выборочная переменная s k определена через переменную vi и некоторое правило сдвига согласно уравнению (В.3), то множество состояний s k , очевидно, то же самое, что и множество состояний vi , то есть Vi . Однако для удобства обозначений будем множество состояний выборочной переменной обозначать S k ; смысл любого S k (k ∈ N M ) однозначно определяется маской в терминах одного из множеств Vi (i ∈ N n ) . Таким образом, декартово произведение C = S1 × S 2 × ... × S M представляет собой полное множество состояний выборочных переменных. Рассмотрим сначала понятие маски и связанное с ним поведение представляющих систем для полностью упорядоченных параметрических множеств, а затем распространим его на частично упорядоченные параметрические множества. Обозначим полностью упорядоченные параметрические множества T, а их элементы t (t ∈ T ) . При этом уравнение (В.4) немного изменится: s k ,t = vi ,tρ& (В.7) 197
Для полностью упорядоченных параметрических множеств маска может быть изображена в виде вырезки из матрицы, представляющей декартово произведение V × R . Это показано на рисунке 3.2а, на котором строки помечены идентификаторами i переменных из множества V, а столбцы – целыми константами ρ , связанными с правилами сдвига вида (В.2). Элементы матрицы или пусты, или представляют собой идентификаторы k выборочных переменных, приписанные парам (i, ρ ) согласно (В.7); пустые элементы матрицы соответствуют элементам V × R , не входящим в маску. В визуальном представлении становится ясно, почему мы используем термин «маска». Часто бывает удобно разбить маску M на подмаски M i , каждая из которых связана с одной переменной vi из подобной системы. Формально M i = {(α , β ) | (α , β ) ∈ M ,α = vi } . (В.8) В визуальном (матричном представлении) M подмаски M i представляют собой строки. В любой маске один столбец соответствует тождественному правилу сдвига ( ρ = 0) . Этот столбец имеет особое значение, поскольку связанные с ним выборочные переменные идентичны базовым переменным заданной представляющей системы. Будем этот столбец в масках называть справочником. Если маска помещена на матрицу данных таким образом, что справочник совпадает с определенным значением t, то маска выделит только некоторое подмножество элементов, а именно элементы, представляющие полное состояние выборочных переменных при данном значении t. Так, например, на рисунке В.2б изображена маска (определенная на рисунке В.2а), помещенная на матрицу данных d при t= 7 (справочник маски совпадает с t= 7). Полное состояние выборочных переменных для этого положения маски показано на рисунке В.2в. Обратите внимание на то, что состояния справочника выборочных переменных s 2 , s3 , s7 , s9 , s10 в точности те же (доля любого t), что и состояние базовых переменных соответственно v1 , v2 , v3 , v4 , v5 . Остальные выборочные переменные представляют собой состояния из параметрического соседства в t. Для любой маски при любом t схема соседства сохраняется. Если t – время, то переменная s 4 будет представлять будущее (от
198
ρ = −2
s1,7 = v1,6 =
2
s2,7 = v1,7 = s4,7 = v2,8 =
0 3 2
s5,7 = v3,5 = s6,7 = v3,6 =
1 1
3
5
s7,7 = v3,7 =
0
4
8
s8,7 = v3,7 =
3
s9,7 = v4,7 =
0
s10,7 = v4,7 =
2
s3,7 = v2,7 = s8,7 = ϑ4,5 =
−1
0
1
2
i =1 Состояние d для М при t=7
k 3
2 6
9
Маска
10
в)
Справочник
б)
а) t=
1
2
3
4
5
6
7
8
9
v1
0
0
1
2
2
2
0
1
1
v2
3
2
2
1
2
3
3
2
0
v3
0
0
0
1
1
1
0
0
0
0
0
1
2
3
0
0
1
2
2
2
2
0
1
2
2
2
1
v5
4
7
5
v4
1
…
Матрица данных d
Справочник в)
Рисунок В.2 - Пояснение понятия маски для полностью упорядоченных параметрических множеств носительно рассматриваемого значения t) состояние переменной v2 , а переменные s5 и s 4 будут представлять, например, прошлые состояния переменной v3 . Любая маска представляет определенную точку зрения, в соответствии с которой представляются ограничения на базовые переменные. Самый простой способ задания определенной маски – это перечисление всех полных состояний соответствующих выборочных переменных. В общем виде подобный перечень является подмножеством декартова произведения С, то есть многомерным отношением, определенным на С. Это отношение определяется функцией f B : C → {0,1}, (В.9) такой, что f B (c) = 1 , если состояние c входит в перечень, и f B (c) = 0 в противном случае. Таким образом. функция f B - это типичная функция выбора. 199
Она выбирает состояния выборочных переменных из множества всех потенциальных состояний (из декартова произведения С). Так как подобный выбор дает по крайней мере некоторые сведения о поведении этих переменных, функцию f B обычно называют функцией поведения (behavior). Функция, определяемая уравнением (В3), задает только один из существующих типов функций поведения, разными способами описывающих ограничения на переменные. В следующем разделе вводятся разные функции поведения, которые рассматриваются как методологические отличия. В этом разделе мы ограничимся выбирающей функцией поведения, определяемой Обратите(В1). внимание на то, что функция f B определяет реально встречающиеся состояния c , но не определяет значение параметра, при котором они имеют место. Таким образом, эта функция является параметрически инвариантной. Обратите также внимание на область определения f B . Она одинакова для всех типов функций поведения и определяется через маску, которая, в свою очередь, определяется через переменные и параметры представляющей системы. Отсюда следует, что некоторая система, скажем система FB , характеризующая параметрически инвариантное ограничение на множество переменных через функции поведения, определяется тройкой FB = ( I , M , f B ) , (В.10) где I – обобщенная представляющая система; М- маски, определенная на I; f B - функция поведения, определенная через М и I. Будем такую систему называть системой с поведением. Несмотря на то, что любая система с поведением, определяемая (В.10), неким конкретным параметрически инвариантно описывает ограничения на переменные представляющей системы, она не содержит описания того, как использовать это ограничение для порождения данных. Для разработки такого описания нужно разбить выборочные переменные на два подмножества: 1) переменные, состояния которых порождаются из ограничения; назовем их порождаемыми переменными; 2) переменные, состояния которых используются как условия в процессе генерации, назовем их порождающими переменными. Для заданной системы с поведением одним из способов определения порожденных и порождающих переменных является определение для данной маски M двух подмасок M g и M g . Будем
M G = (M , M g , M g ) ,
(В.11)
где
M g , M g ⊂ M , M g ∪ M g = M , M g ∩ M g = 0/ , называть маской порождения, то есть эта маска M и её разбиение на порождаемую подмаску M g . По аналогии с разбиением M на M g и M g множество M M идентификаторов k выборочных переменных можно разбить на два подмножества, скажем K g и K g , представляющих идентификаторы соответственно порож200
даемых и порождающих переменных. Для удобства обозначений кодирующая функция (В.6) может быть заменена двумя функциями λg : M g → K g , (В.12)
λg : M g → K g , с помощью которых множества состояний G и G соответственно порождаемых и порождающих переменных задаются декартовыми произведениями G = × Sk , k∈K g
G = × Sk . k∈K g
(В.13)
Теперь способ представления состояния порождаемых переменных (скажем g ∈ G ), определяемого по состоянию порождающих переменных (скажем, g~ ∈ G ), можно выразить функцией f GB : G × G → {0,1}, (В.14) где f GB ( g , g ) = 1, если g может иметь место или если имеет место g 0, если g не может иметь место или если имеет место g Назовем эту функцию порождающей функцией поведения. Если маску M и функцию f B из (В.2) заменить соответственно на M G и f GB , то получится альтернативная система FGB = ( I , M G , fGB ) . (В.15) Будем называть такую систему порождающей системой с поведением. Использование использующей системы с поведением для порождения данных включает следующие два этапа: ~ а) для некоторого значения t ∈ T задано состояния g~ ∈ G ; для определения состояния g ∈ G при том же значении используется функция f GB ; б) значение t заменяется на новое и повторяется этап а). Необходимо прояснить несколько вопросов, связанных с двухэтапной процедурой порождения. Во-первых, на этапе а) неявно предполагается, что при заданном значении t состояние g известно. При первом выполнении этого этапа данное состояние определяется пользователем как походящее начальное условие. Однако после этого все полностью определяется самим процессом порождения, то есть состояниями g и g , связанными с предшествующим значением t . При этом предполагается, что значения t должны на этапе (б) изменяться в соответствии с порядком, заданным на множестве T . Таким образом, значения t заменяются или на t + 1 , или на t − 1 . В первом варианте начальное условие должно быть определено для наименьшего возможного значения t , а во-втором – наибольшего возможного значения t . Во-вторых из необходимости порождения данных в одном из двух порядков следует, что существует только два содержательных разбиения маски на M на M g и M g , каждое из которых соответствует одному из двух порядков порождения. Если данные порождаются в порядке возрастания (убыва201
ния) t , то M g содержит ровно по одному элементу каждой подмаски M i (i ∈ N n ) , определенной в (В0), элемент с наибольшим (наименьшим) значением ρ ; остальные элементы M входят в M g . Таким образом, графически получается, что M g - это множество самых правых элементов M (правый край этой маски) или, наоборот, множество самых левых элементов M (левый край маски). В-третьих, предполагается, что для любого состояния g ∈ G имеется по крайней мере одно состояние g ∈ G , допустимое функцией f GB [то есть
f GB ( g , − g ) =1]. Если допускается только одно состояние, то для любого начального условия данные порождаются однозначно: такие системы называются детерминированными. Если допускается более чем одно состояние, то порождение данных проблематично, так как порождаемое состояние не всегда однозначно определено. Для таких систем выбирающие функции поведения не подходят. Более содержательно они описываются функциями поведения других типов, рассматриваемых далее. Для детерминированных систем представление (В4) порождающей функции поведения f GB может быть заменено более простым f GB : G → G. (В.16) Пример В.1 Для пояснения процесса порождения данных порождающей системой с поведением типа, определяемого уравнением (В.15), положим, что подобная система состоит из упорядоченного параметрического множества T = N 99 и пяти переменных v1 ,..., v5 , состояния которых будут определены ниже. Воспользуемся маской, заданной на рисунке В.2. Данные могут порождаться или в порядке возрастания, или в порядке убывания значений параметра t . Оба эти варианта показаны соответственно на рисунках В.4 и В.5. В первом случае (рисунок В.3) порождаемые выборочные переменные – это переменные, соответствующие правому краю маски, то есть s 2 , s 4 , s 7 , s9 , s10 ; остальные выборочные переменные являются порождающими. Порождение данных в матрице данных происходит слева направо. Пусть порождающая функция поведения f GB , представленная в виде (В.16), определяется уравнениями s k ,t = s1,t + s3,t + s5,t + s 6,t + s8,t (mod k) при k=2, 4, 7, 9, 10. Множества состояний порождаемых переменных определяются этими уравнениями, а множества состояний порождающих переменных – их положением в маске. Например, множество состояний порождаемой
202
t=
1
v1
2
3
1
1
4
6
…
t=
2
3
4
1
1
1
1
1
1
v1
1
v2
5
v2
1
v3
1
1
5
v3
1
1
5
2
v4
1
1
5
v4
1
1
5
0
5
v5
5
9
v5
Справочник
1
v1
7
…
7
8
1
б)
2
3
4
5
1
1
1
0
1
1
1
v2
6
Справочник
а) t=
5
6
…
t=
2
3
4
5
6
1
1
1
0
0
1
1
1
2
1
v1 v2
2
v3
1
1
5
2
0
v3
1
1
5
2
0
4
v4
1
1
5
0
5
v4
1
1
5
0
5
4
5
9
4
v5
5
9
4
v5
Справочник
1t =
v1
0
Справочник
в) t=
г)
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
1
1
1
0
0
1
0
1
0
0
1
0
0
0
0
0
1
1
1
2
0
1
0
3
0
0
1
0
0
2
2
v2 v3
1
1
5
2
0
4
2
5
0
5
5
6
2
5
0
3
3
v4
1
1
5
0
5
4
0
3
7
3
3
4
7
3
5
1
1
5
9
4
4
9
2
7
2
2
3
6
2
4
0
0
v5
…
Начальное условие
…
д)
Рисунок В.3 - Данные, порожденные в порядке возрастания значений параметра t (пример В.1) переменной s 4 - это 0, 1, 2, 3, так как уравнение для s 4 берется по модулю 4; порождающая переменная s3 имеет то же множество состояний, что и s 4 , так как обе эти переменные определены через одну и ту же переменную представляющей системы (то есть S 3 = S 4 = V2 ). Первой осмысленной позицией 203
маски на матрице данных ( позиция определяется положением справочника маски) является позиция t = 3 ; позиции t = 1 и t = 2 смысла не имеют, так как состояния некоторых выборочных переменных для этих позиций не определены ( t + ρ не входит в множество T ). Начальное условие состоит из шести элементов матрицы данных: v1, 2 , v2,3 , v3,1 , v4,1 , v4, 2 . Пусть, например, все эти элементы равны 1. Ещё пять элементов матрицы данных - v1,1 , v2,1 , v2, 2 , v5,1 ,
v5, 2 - не могут быть порождены, а могут быть заданы пользователем, но для порождения данных эти переменные не нужны. На рисунке В.3а, б, в, г подробно показано порождение состояний соответственно для t = 3, 4, 5, 6; кружками обведены порожденные состояния. На рисунке В.3д показано начальное условие и несколько больший фрагмент порожденной матрицы данных. Если данные порождаются в порядке убывания t (смотри рисунок В.4), то порождаемыми переменными являются переменные, представляющие левый край маски, то есть переменные s1 , s3 , s5 , s8 , s10 . Данные в матрице данных порождаются справа налево. Предположим теперь, что f GB определяется уравнениями s k ,t = s 2,t + s 4,t + s6,t + s 7,t + s9,t (mod k+1) при k = 1, 3, 5, 8, 10. Порождение данных при t = 98, 97, 96, 95 подробно показано на рисунке 3.4а, б, в и г. На рисунке В.4д показано начальное условие и несколько больший фрагмент порожденной матрицы. В.3 Методологические отличия
Хотя функция выбора является, вероятно, наиболее подходящим формальным аппаратом для задания ограничений в детерминированных системах, в которых порождение данных удобно описывать с помощью функции (В.16), для работы с недетерминированными системами функции выбора не годятся. Традиционно с недетерминированными системами работают в теории вероятностей. Несмотря на то, что это наиболее развитый и важнейший математический инструмент, в настоящее время вероятностная мера рассматривается только как частный случай более общего класса мер, называемого нечеткими мерами. В нашем случае меры определяются на подмножествах декартового произведения С. Отсюда мера определяется функцией µ: Р(С)→[0,1], (В.17) где Р(С) – мощность множества С. Чтобы функция являлась мерой, она должна обладать следующими свойствами нечетких мер:
204
(µ1) (µ 2 )
µ (0) = 0;
…
9
95
9
98
9
11
9
5
1
1
5
1
1
94
t=
…
8
96
9
9
1
1
1
1
3
1
1
3
3
5
1
1
6
0
5
1
1
4
9
5
8
8
8
v3
97
9
1
1
1
1
1
v4
3
5
1
1
0
5
1
1
5
5
v5 б )
9
t= … 9
v1
94
95
1
v2
1
v3 v4
9
v1 v2
1
v3 v4 v5
Справоч9
9
9
9
1
1
1
1
2
3
1
1
3
3
5
1
1
1
6
0
5
1
1
1 0
4
9
5
v5
8
9
4
г)
8
9
v2
1
Справоч-
8
9
Справоч-
9
в )
94
v1
5 а)
Х 1 ⊇ Х 2 ⊇ ...,
или
t= … 9
1 1
t= … 9
µ ( Х 1) ≤ µ ( Х 2);
то
если Х 1 ⊆ Х 2 ⊆ ... lim µ ( X 1) = lim( Xi ). i→0
то t=
х1 ⊆ х 2,
если
( µ 3)
µ (С ) = 1;
v1 v2
1
v3 v4 v5
Справоч-
91
9
9
9
96
9
97
9
0
1
1
0
1
1
1
0
1
0
1
0
1
1
1
1
1
2
3
3
0
1
1
1
0
1
0
3
2
3
1
1
5
3
2
5
5
5
2
3
0
3
4
3
3
5
1
1
2
6
2
8
8
5
8
0
3
6
1
6
0
5
1
1
9
7
0
4
9
6
6
5
8
9
1
4
1
4
9
5
д)
t99=
v1 v2
1
v3 v4 v5
Начальное условие
Рисунок В.4 - Данные, порожденные в порядке убывания значений пара-свойстТребование (µ1) очевидно. Требование (µ2), обычно называемое метра t (пример В.1) 205
вом монотонности , не допускает, чтобы подмножество другого подмножества С обладало большей мерой, чем включающее подмножество. Согласно требованию (µ3), называемому непрерывностью, предел мер бесконечной монотонной последовательности. К дискретным системам, в которых С всегда является конечным множеством, требование непрерывности, естественно, неприменимо. В литературе описаны самые разные классы нечетких мер, имеющих разные свойства. На рисунке В.5 приведена диаграмма, изображающая отношение включения для некоторых мер. Так, например, класс вероятностных мер входит в класс мер правдоподобия и в класс мер доверия, но не пересекается с классами мер возможности или необходимости. Классы нечетких мер рассматриваются как методологические отличия. Они используются в порождающих системах и во всех системах более высоких эпистемологических уровней. Далее будут рассматриваться только два класса мер. Первый - классический и хорошо разработанный класс вероятностных мер, второй – это класс возможностных мер. Необходимо отметить, что возможные меры приложимы только к конечным множествам и к некоторым частным случаям бесконечных множеств; в общем случае эти меры не удовлетворяют требованию непрерывности. Таким образом, они наверняка применимы к дискретным, но не к непрерывным системам. Из теории вероятностей хорошо известно, что любая вероятностная мера p, однозначно определяется функцией распределения f B : C → [0,1], (В.18) Нечеткие меры
Возможностные меры
Меры доверия (убежденности) Четкая необходимость (уверенность)
Вероятностные меры
Четкая возможность Меры правдоподобия
Меры необходимости
Рисунок В.5 – Некоторые классы нечетких мер которая должна удовлетворять соответствующим требованиям согласно формуле 206
p( X ) =
∑ f B (c ) ,
(В.19)
c∈X
где X ∈ P(C ) . Здесь применен тот же индекс B, что и в описании функции поведения, определенной в (В1), так как плотность вероятности также будет использоваться в качестве функции поведения. Мера возможностей – это функция π : P(C ) → [0,1] , (В.20) удовлетворяющая следующим требованиям: (π1) π (0 ) = 0;π (C ) = 1; (π2) π (∪ X i ) = max π ( X i ) i
Хорошо известно, что мера возможности π однозначно определяется функцией распределения возможностей fB, имеющей вид (В8) и определяемой формулой π ( X ) = max f B . (В.21) c∈X
В.4 От систем данных к системам с поведением
Важный класс системных задач, часто называемый индуктивным моделированием систем, может быть описан в первом приближении как множество задач, связанных с подъемом по эпистемологической иерархии систем. Все задачи этого класса характеризуются следующим общим описанием: дано Конкретная система, скажем x определенного эпистемологического уровня; Множество всех конкретных систем некоего более высокого эпистемологического уровня, совместимых с системой x (то есть основанных на той же представляющей системе, с теми же методологическими отличиями), скажем множество Y; Набор соответствующих требований Q относительно неких свойств систем из множества из множества Y, причем одним из этих требований является требование, чтобы данная система x была аппроксимирована как можно более точно системой более высокого уровня и требуется определить YQ – подмножество Y, такое, чтобы любая система из YQ удовлетворяла всем требованиям, определенным в наборе Q. Для демонстрации в данном разделе задачи определения систем с поведением, представляющих заданную систему данных и обладающих некими подходящими дополнительными свойствами, будем считать, что x – это система данных с номинальными переменными (переменными с номинальной шкалой), Y – множество всех систем с поведением с вероятностными или возможностными функциями поведения, совместимыми с x, а набор Q состоит из: 1) подмножества Yr – множества Y, определенного пользователем или УРСЗ (как выбор по умолчанию); 207
2) требования, чтобы несогласованность между соответствующими переменными заданной системы данных и системы с поведением из YQ была как можно меньшей; 3) требования, чтобы степень неопределенности при порождении данных системой с поведением из множества YQ была как можно меньшей; 4) требования, чтобы система из подмножества YQ была как можно более простой; 5) предпочтения требования 2 требованиям 3 и 4. В этой общей формулировке требование 1 сводится к определению множества допустимых масок. Если параметрическое множество не упорядочено, то понятие параметрического соседства не определено, и, следовательно, существует только одна осмысленная маска. Эта маска, определяемая тождественным правилом сдвига; она называется маской без памяти. Эта задача сводится к определению для имеющихся данных функции распределения вероятностей или возможностей, удовлетворяющих требованию 2. Она решается полным перебором данных с помощью маски без памяти (в данном случае порядок выбора не важен) и определения для каждого состояния выборочных переменных с ( в данном случае они совпадают с основными переменными) числа N(c) их появлений в данных. Числа N(c) для всех с∈ С обычно называются частотами состояний с. Они используются для вычисления по некоторым правилам соответствующих функций вероятностей или возможностей. Вычислять распределение вероятности или возможности по частотам можно разными способами. Выбор способа зависит от того, какой смысл придает пользователь этим вероятностям или возможностям. Так, например, если вероятности рассматриваются как характеристики данных, то обычно вычисляются относительные частоты, то есть отношения N(с) к общему числу имеющихся выборок из данных по используемой маске. Отсюда N (c ) f B (c ) = . (В.31) ∑ N (α ) α∈C
Если, однако, вероятности рассматриваются как оценки частот по уже имеющимся результатам наблюдения, то они вычисляются по формуле f B (c ) = ( N (c ) + 1) ( ∑ N (α )+ | C |) . (В.32) α∈C
Поскольку распределения возможностей менее ограничены, чем их вероятностные аналоги (например, к ним не надо добавлять 1), существует еще больше возможных правил для вычисления их по частотам N(c). Естественный способ вычислений распределения возможностей, который можно считать аналогом формулы (42) – это считать значение возможности равной отношению частоты N(c) к максимальной зафиксированной частоте, то есть f B (c ) = N (c ) max N (α ) . (В.33) α∈C
По другой формуле распределение возможности вычисляются по соответствующим вероятностям. Пусть f B (c ) и f B′ (c ) - это соответственно воз208
можность и вероятность состояния с (c ∈ C ) . Тогда f B (c ) = ∑ min[ f B′ (c ), f B′ (α )].
(В.34)
α∈C
По этой формуле распределение возможностей выражается через верхние границы значений вероятностей. Предположим теперь, что параметрическое множество полностью упорядочено. В этом случае из одной и той же системы данных можно получить множество систем с поведением, отличающихся масками. Если для заданных данных они определены достаточно корректно, то они одинаково хорошо отвечают требованию согласованности. Точнее, выражение «достаточно корректно» означает, что функция поведения хорошо согласуется с данными (и, возможно, с некоторой дополнительной информацией) с точки зрения маски и типа выбранных ограничений. Всякая маска представляет собой некоторое окно, через которое отбираются рассматриваемые данные из матрицы данных (или из массива более высокого порядка). При движении этого окна вдоль всей матрицы данных частоты состояний соответствующих выборочных переменных определяются подсчетом того, как часто наблюдается каждое состояние. Число столбцов в маске называют глубиной маски и обозначают ∆М. Есть по крайней мере два соображения, по которым применение масок с большой глубиной в общем случае не желательно. Во-первых, если маска используется для порождения данных, то чем больше ее глубина, тем большее требуется начальное условие. Это, вообще говоря, не желательно. Во-вторых, если маска используется для выборки данных, то число неполных выборок равно 2(∆М-1). Это означает, что с ростом глубины маски все меньше имеющихся данных используется для определения функции поведения. Следовательно, с увеличением глубины маски сужается эмпирическая основа, на которой строится функция поведения. Как выяснено выше, любая система определяется таким образом, что она хорошо согласуется с заданной системой данных и дополнительной информацией по маске и принятому типу описания ограничений. Таким образом, требование согласованности имеет более высокий приоритет, чем остальные требования. Теперь остается только применить условия 3) и 4) обычно называемые условием детерминированности и условием простоты, для вывода подмножества решений YQ ограниченного множества Yr. Несмотря на то, что в формулировках конкретных типов задач возникают и дополнительные требования, условия детерминированности и простоты имеют всеобщее значение. Поэтому обычно они не опускаются. Часто сначала определяется множество решений, удовлетворяющих этим условиям (и, разумеется, условию согласованности), а затем входящие в это множество системы с поведением изучаются исследователем. Он может использовать их в качестве вспомогательного представления базовых переменных. Однако, если необходимо дальнейшее сокращение множества решений, исследовательпроизводит их оценку и сравнение согласно некоторым вспомогатель209
ным критериям. Эти критерии могут определяться как контекстом, так и вкусами исследователя. В.5 Меры нечеткости
Степень недетерминированности должна измеряться обобщенной нечеткостью, сопутствующей порождению данных. А значит, она должна быть определена через порождающие функции поведения f GB и f€GB для нейтральных и направленных систем с поведением. Если эти функции представляют собой функции распределения вероятностей, то мера обобщенной нечеткости хорошо известна – это шенноновская энтропия, введенная К. Шенноном в 1948 году. Обозначим через Р множество всех распределений вероятностей, которые могут быть определены на конечных множествах альтернативных (взаимно исключающих) исходов. Тогда вероятностная мера нечеткости – это функция H : P → [0, ∞] , обладающая некоторыми свойствами. Следующие свойства являются необходимыми свойствами любой содержательной меры нечеткости: Н1 симметричность – нечеткость инвариантна относительно перестановки вероятностей; Н2 расширяемость – нечеткость не меняется при добавлении к рассматриваемому множеству исходов с нулевой вероятностью; Н3 квазиаддитивность – нечеткость совместного распределения вероятностей не больше суммы нечеткостей соответствующих безусловных распределений его компонентов; Н4 аддитивность – для распределений вероятностей любых двух независимых множеств исходов нечеткость совместного распределения вероятностей равна сумме нечеткостей отдельных распределений вероятностей; Н5 непрерывность – нечеткость – это непрерывная функция на всех своих аргументах. Известно, что только функции вида H ( f ( x ) | x ∈ X ) = −a ∑ f ( x )log b f ( x ) x∈X
обладают свойствами Н1-Н5;
( f (x ) | x ∈ X ) ∈ P - это распределение вероятностей для определенного конечного множества X альтернативных исходов x, где a – произвольная положительная константа, а b- произвольное основание логарифмов. Если потребовать выполнения еще и нормализующего свойства H (0.5;0.5) = 1 (нечеткость двух равновероятных исходов равна 1), то мера нечеткости определяется однозначно: 210
H ( f ( x ) | x ∈ X ) = H ( x ) = − ∑ f ( x )log 2 f ( x ) .
(В.37)
x∈X
Обычно функцию (В.37) называют шенноновской энтропией. Она измеряет нечеткость в единицах, называемых битами. Рассмотрим теперь порождающую нечеткость в системах, описываемых с помощью функций распределения возможностей. Пусть П – это множество всех распределений возможностей, имеющих по крайней мере одно ненулевое значение, которые можно определить на конечных множествах альтернативных исходов. Тогда возможностная мера нечеткости представляет собой функцию U : П → [0, ∞ ] , (В.48) обладающую определенными свойствами. Прежде чем рассматривать эти свойства, нужно сначала ввести некоторые понятия, связанные с распределениями возможностей. 1 Распределение возможностей f = (ϕ | i ∈ N | X | )∈ П , (В.51) определенное на конечном множестве X альтернативных исходов x называется нормализованным распределением возможностей тогда и только тогда, когда max ϕ i = 1 ; (В.52) i
понятно, что ϕ i = f (x) для некоторого взаимнооднозначного соответствия между N|X| и X. 2 Пусть для любого распределения возможностей f, например для распределения, определенного в (49), и для любого действительного l ∈ [0,1] c : П × [0,1] → P( N ) (В.53) такая функция, что (В.54) c( f , l ) = {i ∈ N X | ϕ i ≥ l} .
Эта функция называется функцией l-уровня, а множество c( f , l ) - множеством l- уровня от f. 3 Для заданного распределения возможностей (49) назовем
L f = {l | ( Ei ∈ N X )(ϕ i = l ) или l = 0 }
(В.55)
уровневым множеством для f. Обозначим через L f = {l1 , l2 ,..., lq } уровневое множество для f, где l1=0, q = L f , причем из i < j следует, что li < l j . Пусть для удобства l f = max ϕ i . i
Понятно, что l f = lq ∈ L f . Кроме того, l f = 1 тогда и только тогда, когда f является нормализованным распределением возможностей. 4 Для любого m ∈ N пусть 211
1
(
)
f = 1ϕ i | i ∈ N m ∈ П ,
2
(
)
f = 2ϕ i | i ∈ N m ∈ П ,
два распределения возможностей. Тогда 1 f называется субраспределением 2
f тогда и только тогда, когда для любого i ∈ N m
max1ϕ i = max 2ϕ i и 1ϕ i ≤ 2ϕ i . i
1
2
i
1
Пусть f ≤ f означает, что f является субраспределением 2 f . Понятно, что отношение « 1 f субраспределение 2 f » представляет собой частичное упорядочение, определенное на любом множестве распределений возможностей с числом элементов, равным m. Обозначим это множество m П . Далее ( m П , ≤ ) – это решетка с объединением и пересечением, определяемыми соответственно как 1 f ∨ 2 f = max 1ϕ i , 2 ϕ i | i ∈ N m , 1 1
2
f ∨2f
( [ ] ) = (min[ ϕ , ϕ ]| i ∈ N ) 1
i
2
i
m
m
для любых f , f ∈ П . Теперь, располагая определенными понятиями, связанными с рапсределениями возможностей, можно вернуться к обсуждению главного вопроса – о мере возможностной нечеткости. Хотелось бы, чтобы возможностные аналоги свойств Н1 – Н5, которыми обладает шенноновская энтропия, также выполнялись бы и для возможностной меры нечеткости. Возможностные аналоги этих свойств можно сформулировать точно так же, как Н1-Н5, за тем только исключением, что слово «вероятность» нужно везде изменить на слово «возможность». Функция вида (48), удовлетворяющая этим свойствам, известна. Ее можно представить в виде 1 q −1 (В.56) U ( f ) = ∑ (l k +1 − lk ) log c( f , lk +1 ) , l f k =1 или в более простом виде lf
1 U ( f ) = ∫ log 2 c( f , l ) dl . (В.57) lf 0 Эта функция называется U – нечеткостью. Помимо возможностных аналогов свойств Н1-Н2, U – нечеткость обладает некоторыми другими полезными свойствами. Важнейшим из них является монотонность: для любых 1 f , 2 f ∈m П (m ∈ N ) , если 1 f ≤ 2f , то U 1 f ≤ U 2 f .
( ) ( )
В.6 Поиск подходящих систем с поведением
Располагая теперь мерами нечеткости, через которые выражается степень детерминированности, вернемся в данном разделе к типу задач, введенному в разделе 6.4; дана система данных D с полностью упорядоченным параметрическим множеством и с наибольшей допустимой маской М, совмес212
тимой с D; требуется определить все системы с поведением, удовлетворяющие требованиям согласованности, детерминированности и простоты, причем требование согласованности более приоритетно, чем остальные два. Любая наибольшая допустимая маска М содержит набор корректных масок, каждая из которых является подмножеством М. Для каждой маски может быть определена функция поведения (определенного выбранного типа), хорошо согласующаяся с данными, с помощью разреженной выборки данных. Однако на практике достаточно провести выборку только для маски М. Функции поведения для ее подмасок могут быть получены вычислением подходящих проекций функции поведения соответствующей маске М. Для заданной функции fB, определенной через полные состояния неких выборочных переменных, любая из ее проекций также является функцией поведения, соответствующей fB в смысле субсостояний, основанных на определенном подмножестве выборочных переменных. Пусть s k (k ∈ N M ) - выборочные переменные, через которые определяются состояния fB; М – маска, через которую выбираются значения выборочных переменных. Пусть f B ↓ Z - проекция fB, где подмножество множества N|M| идентификаторов выборочных переменных, то есть Z ⊂ N . Тогда [ f B ↓ Z ] : × S k → [0,1], (В.67)
[
]
k∈Z
так что
[f
]
↓ Z ( x ) = a ({ f (c ) | c f x}) , (В.68) где а – некая агрегирующая функция, определяемая характером функции fB. Например, f B ↓ Z ( x ) = ∑ f B (c ) , (В.69) B
[
]
cf x
где fB – распределение вероятностей; соответственно для распределения возможностей, f B ↓ Z ( x ) = max f B (c ) . (В.70)
[
]
cf x
Будем в контексте любой конкретной задачи через 1 f B обозначать функ-
цию поведения для наибольшей приемлемой маски М. Через i f B (i = 2,3,...) , будем обозначать функции поведениядля ее различных осмысленных подмасок i M , каждая из которых связана с множеством i Z ⊂ N M идентификато-
ров выборочныз переменных. За исключением очень небольших наборов данных, с точки зрения вычислений проще определять функции поведения с помощью проекций, а не через выборки данных. Чем больше объем данных, тем больше вычислительного времени экономится. Таким образом, лучше производить выборку только однажды для наибольшей приемлемой маски, а затем определять функции поведения для всех содержательных подмасок как соответствующие проекции. Пример В.4 Определим проекцию вероятностной функции поведения, 213
приведенной в таблице В.1 и возможностной функции поведения, приведенной в таблице В.2 для Z ={1,2}. Таблица В.1 S1 С= 0 0 0 0 1 1 1 1
S2 0 0 0 1 0 0 1 1
S3 0 0 1 0 0 1 0 1
S4 0 1 0 1 0 0 1 0
f(c) 0.2 0.2 0.1 0.1 0.1 0.1 0.1 0.1
Таблица В.2 S1 0 0 0 1 1
С=
S2 0 0 1 0 1
S3 0 1 1 0 1
f(c) 1.0 0.25 0.25 0.5 0.5
Применив формулу (В.58) для вероятностной функции, получим: x=
S2 0 1 0 1
S1 0 0 1 1
[f↓{1,2}](x) 0.5(=0.2+0.2+1) 0.1 0.2(=0.1+0.1) 0.2(=0/1+0/1)
Для возможностной функции по формуле (В.59) имеем x=
S1 0 0 1 1
S2 0 1 0 1
[f↓{1,2}](x) 1.0 0.25 0.5 0.5
Для заданной системы данных D и наибольшей допустимой маски М требование соответствия приводит к ограниченному множеству Yr ={i FB = I , i M , i f | i = 1,2,..., N (n, ∆M )} , содержащему по одной системе с поведением для каждой осмысленной маски i M ⊆ M ; пусть для удобства 1M = M . Следующим шагом решения рас-
(
214
)
сматриваемой задачи должно быть вычисление степеней недетерминированности и сложности для всех систем из множества Yr . Как было показано в разделе В.5, степень недетерминированности задается соответствующей мерой порождающей нечеткости, определяемой для вероятностных систем шенноновской энтропией, а для возможностных систем U – нечеткостью. Для определения порождающей нечеткости требуется, чтобы был определен порядок порождения (и соответствующее разбиение любой маски). Если допускается несколько порядков порождения, то для каждой маски мы берем порядок с наименьшей порождающей нечеткостью. Что касается меры сложности, то тут возможно много вариантов. Возьмем для примера простую, но содержательную меру – размер (мощность) маски. Пусть i qu (i = 1,2,...) - значение соответствующих порождающих нечеткостей для систем с поведением i FB из ограниченного множества Yr. Поскольку любая система FB однозначно идентифицируется своей маской М, мощность которой i M задает ее сложность, статус системы i FB в смысле
(
)
порождающей нечеткости и сложности удобно описывать парой i M , i qu . Теперь рассматриваемую задачу можно обсуждать в терминах масок i M , а не соответствующих систем с поведением i FB . Численное упорядочение масок i M , идентифицирующих системы из Yr с
по их мощности, задает упорядочение сложности ≤ на множестве Yr. Численное упорядочение значений i qu определяет упорядочение по нечеткости u
≤ на множестве Yr. В то время, как упорядочение по сложности полностью определяется самими масками, упорядочение по нечеткости может быть определено только после оценки масок. Для любого множества порождающих масок мы можем определить частичное упорядочение i M G ≤ j M G тогда и только тогда, когда i
g =i g
и
i
g < ig.
(В.60)
(или i e< i e для направленных систем), которое мы будем называть упорядочением подмасок. Это упорядочение часто оказывается полезным при разработке различных эвристических процедур поиска на множестве систем Yr. Пример упорядоченности по сложности и упорядоченности подмасок для наибольшей допустимой маски М при n=3 u ∆M=2 приведен далее... Из этого примера видно, что упорядочение по сложности – это связное квазиупорядочение (рефлексивное и транзитивное отношение, определенное для любой пары систем). Упорядочение по подмаскам – это частичное упорядочение, но решетки оно не образует. Однако оно представляет собой набор решеток по одной для каждого множества порождаемых выборочных переменных (в нашем приме215
ре это крайние правые элементы масок). Упорядочение по нечеткости связное, но из-за того, что несколько разных систем могут иметь одинаковую порождающую нечеткость, это отношение не является антисимметричным. Следовательно, в общем случае это связное квазиупорядочение, которое в некоторых частных случаях оказывается полным упорядочением. Таким образом, на множестве Yr определены два связных квазиупорядочения – по сложности и по нечеткости. Было бы желательно объединить их неким подходящим образом. Поскольку для рассматриваемого типа задач требуется, чтобы и сложность и порождающая нечеткость систем во множестве решений YQ, были минимизированы. Соответствующее объединенное *
упорядочение ≤ определяется следующим образом: i
*
FB ≤ j FB тогда и только тогда, когда i
c
j
M≤ M
и
i
u
qu ≤ j q u ,
(В.61)
где i FB , j FB ∈ Yr . Это упорядочение не является связным, поскольку пары i
FB , j FB , для которых i M < j M и i qu > j qu или i M > j M и i qu < j qu (подоб-
ные пары, разумеется, могут существовать), несравнимы. Оно также неантисимметрично, так как не исключена возможность того, что i M = j M и i qu = j qu для некоторых i ≠ j. Следовательно объединенное упорядочение – это общего вида квазиупорядочение (рефлексивное и транзитивное отношение) на Yr. Теперь множество решений YQ можно определить как множество всех систем из Yr, которые или эквивалентны, или несравнимы относительно объединенного упорядочения (В.61). Две системы из Yr, скажем системы i FB и j
FB , несравнимы в смысле обединенного упорядочения, если выполнено одно из следующих условий: i FB более сложна и менее детерминирована, чем j FB или i FB менее
сложна и более детерминирована, чем j FB . Формально *
*
YQ ={i FB ∈ Yr | (∀ j FB ∈ Yr )( j FB ≤ i FB ⇒ i FB ≤ j FB )} . (В.62) Системы из множества решений YQ будем называть подходящими системами с поведением для рассматриваемого типа задач. Пример В.5 Чтобы пояснить различные вопросы, изучаемые в данном разделе, рассмотрим этологическую систему данных, описанную в примере В.2 (смотри также рисунок В.8). Определим все подходящие в смысле (В.62) системы с поведением для этой системы данных в предположении, что пользователь хочет получить описания вероятностных систем с поведением и использовать их для предсказания. Предположим сначала, что ∆М = 2. Тогда имеется восемь содержатель216
ных масок, которые вместе с их упорядочением подмасок и указанием трех уровней сложности изображены на рисунке В.6а. После выполнения исчерпывающей выборки для наибольшей приемлемой маски 1M = M по определенной пользователем формуле по частотам N(c) вычисляются вероятности f B (c ) , а порождающая нечеткость оценивается как вероятностная. Если для вычисления вероятностей используется формула (В.42), то порождающая нечеткость равна 1.11. Затем для остальных семи содержательных масок по формуле (В.58) определяются соответствующие проекции и вычисляются их порождающие нечеткости. Результаты этих вычислений показаны на рисунке В.6б (в правом нижнем углу масок). На рисунке В.6б также изображено упорядочение масок по нечеткости. В этом примере упорядочение является полным, поскольку значения нечеткости у всех разные. Объединенное упорядочение по сложности и нечеткости (61) изображено на рисунке В.6в. Как мы видим, минимальными с точки зрения объединенного упорядочения являются маски с идентификаторами 1,2,6. Следовательно, YQ ={ 1 FB , 2 FB , 6 FB }. Предположим теперь, что ∆М = 3. Тогда имеется 40 содержательных масок. После их обработки, аналогичной обработке для случая ∆М = 2, мы получим пять подходящих систем с поведением, маски которых, значения сложности и порождающие нечеткости приведены на рисунке В.7а. оставшиеся 35 масок хуже с точки зрения их сложности, как и с точки зрения четкости, и, следовательно, их вовсе не нужно рассматривать. Описанный здесь поиск подходящих систем с поведением может быть реализован самыми разными способами. Основной принцип заключается в том, что содержательные маски получаются с помощью некоторого алгоритма из наибольшей приемлемой маски в порядке уменьшающейся сложности. Среди масок одинаковой сложности выбираются только маски с минимальной порождающей нечеткостью. При этом если значение этой минимальной нечеткости меньше или равно значению нечеткости для предшествующего уровня сложности, то все ранее принятые системы отбрасываются. В результате применения этой процедуры у нас остаются только подходящие системы. Важно понимать, что задачи данной категории представляют собой тему со многими вариациями. Например, можно многими разными способами вычислять вероятности или возможности, можно использовать разные определения сложности, можно выдвинуть дополнительные условия, такие, как задание наибольшей приемлемой четкости. В.8 Порождающие системы
Термин «порождающая система» используется здесь в качестве общего
217
1 2
1
2
1
3 4
Упорядоченность подмасок
3
3 4
3 4
2
6
1 2
4
7
3 4
5 4
1 2
3
8
1
3
2
4 а)
1
2
1
1 2
3 4
3 4
Упорядоченность по нечеткости 1.11
3 1.88
6
2
3 4
4 2.53
7
3 4
1 2
5 4
2.37
8
1 4
3.38
1 2
3 1.97
3 2
3.41
3.65
б 1
2
1
3 4
6
1 2
3 4
4 1.11
3 3 1.88
2
3 4
3 4
Объединенная упорядоченность по сложности и по нечеткости 4 3 2.53
7 2 3.38
1 2
5 4
8
1 4
в
3 2.37
2 3.41
Рисунок В.6 – К примеру В.5 218
1 2
3 3 1.97
3 2
2 3.65
i
Маска
i|M|
iH (G / G )
1
1 3 5
6
0.41
5
0.55
4
1.07
2
3
3 5 2 4 6 3 5 2 4
4
3 5 6
3
1.88
5
5 6
2
3.38
Нечеткость, iH(G/G)
2 4 6
4 3 2 1 0 2
3
4
5
6
Сложность, |i M |
а) б) Рисунок В.6 – Подходящие системы с поведением к примеру В.5 наименования для всех систем уровня 2 в эпистемологической иерархии систем. В этих системах обобщенное параметрически независимое ограничение на рассматриваемые переменные описывается с разных сторон. Для порождающих систем выделены различные методологические отличия. Это отличия, выделенные для систем более низких уровней, и некоторые новые. Среди них наиболее существенными являются: упорядоченность параметрического множества, что позволяет ввести важное понятие маски; упорядоченность множеств состояний, что играет существенную роль в упрощении процедур для порождающих систем и при работе с неполностью определенными наборами данных; отличие четких и нечетких каналов наблюдения, дающих соответственно четкие или нечеткие данные и требующих применения различных методов обработки данных; отличие между нейтральными и направленными системами, с которыми следует обращаться по-разному. Методологическими отличиями, относящимися к порождающим системам, но не к системам данных и исходным системам, являются: детерминированность и недетерминированность систем; для недетерминированных систем различаются типы нечетких мер, характеризующих параметрически инвариантное ограничение на рассматри219
ваемые переменные, в частности меры вероятности и возможности; по используемой маске различаются порождающие системы без памяти и системы, зависящие от прошлого. Разумеется, эти методологические отличия характеризуют и системы более высоких эпистемологических уровней. В.9 Упрощение порождающих систем
На некотором этапе обработки заданной системы данных часто желательно бывает упростить соответствующие этой системе порождающие системы. В некоторых случаях упрощения требует пользователь, для которого существующие порождающие системы оказываются слишком сложными для понимания. В других случаях упрощение требуется из-за предполагаемого использования порождающих систем или по разным методологическим соображениям. Существует два основных метода одновременного упрощения систем данных и соответствующих порождающих систем: 1) упрощение за счет исключения некоторых переменных из соответствующей подобной системы; 2) упрощение за счет определения классов эквивалентности состояний некоторых переменных. Пусть множество переменных порождающей системы V состоит из n переменных и любое подмножество V, за исключением пустого множества, представляет содержательное упрощение первого рода. Следовательно, имеется 2n-2 нетривиальных упрощения первого рода. Они частично упорядочены по отношению «подмножество». Если для удобства включить исходное множество V и пустое множество, то множество упрощений с частичным упрощением образует решетку. Эту решетку называют решеткой переменных или V-решеткой. По ней можно проводить упрощение порождающих систем, подбираемых к соответствующим системам данных. Многочисленные примеры реального упрощения приведены далее... В.10 Исследование и проектирование систем
Системные задачи могут возникать в двух основных контекстах: при исследовании и при проектировании систем. Задачей исследования систем является накопление знаний о различных наборах переменных и параметров, определенных с конкретными целями на существующих объектах. Задачей проектирования систем является использование накопленных знаний для создания новых объектов, для которых на специфицированные переменные наложены определенные ограничения. Несмотря на то, что системные задачи как при исследовании систем, так и при их проектировании существуют на любом эпистемологическом уровне иерархии систем, в этом разделе ограничимся рассмотрением задач, связанных с исходными системами, системами данных и порождающими системами. 220
Рассмотрим сначала некоторые вопросы, связанные с проектированием систем. Наиболее важной чертой проектирования систем является то, что параметрически инвариантное ограничение на некоторые конкретные переменные определяется пользователем. Совершенно иначе обстоит дело с исследованием систем, где это ограничение неизвестно, и задача состоит в том, чтобы адекватно охарактеризовать его с учетом конкретной цели исследования. Ограничение при проектировании систем определяется или явно на языке конкретной порождающей, обычно направленной системы, или неявно на языке системы данных. В первом случае задача проектирования сводится к определению набора структурированных систем, удовлетворяющих заданным требованиям. Эти вопросы рассматриваются в следующем разделе. Во втором случае необходимо определить некие порождающие системы, адекватно описывающие ограничения, содержащиеся в данных. Эта задача соответствует классу задач, рассматриваемых в параграфах 6.4 и 6.6 в контексте исследования систем, однако в случае проектирования систем система данных по определению содержит всю информацию о способе, каким накладываются ограничения на переменные. При проектировании системы функция данных часто определяется неявно через описание их свойств, а не явно в виде матрицы или массива данных. Допустим, например, что имеется простая направленная система с одной входной переменной, множество состояний которой включает 26 латинских букв и пробел, и с одной выходной переменной с двумя состояниями 0 и 1. Входная переменная определяется последовательностью букв и пробелов просматриваемого английского текста. Требуется, чтобы выходная переменная при определенных условиях была равна 1, например, при условии, что последнее слово просматриваемого текста кончалось на ING, и 0 в противном случае. Задача состоит в том, чтобы преобразовать это неявное определение системы данных в некую порождающую систему, которая бы для любого английского текста порождала (детерминированным образом) требуемые состояния выходной переменной. Методы решения задач подобного типа хорошо разработаны в рамках теории конечных автоматов. Поскольку на эту тему имеется обширная литература, то нет смысла описывать эти методы. При сравнении исследования систем и их проектирования на уровне систем данных и порождающих систем, необходимо отличать два класса систем данных, встречающихся при исследовании систем. К первому классу относятся системы данных, в которых переменные не имеют смысла вне параметрического множества, на котором они определены. Примерами таких систем являются: музыкальное сочинение, рассматриваемое как система данных, переменные которой, очевидно, не имеют смысла вне временного множества, соответствующего всему сочинению; любая система данных с пространственным параметром, в которой пространственное множество не может быть расширено, например система пространственных данных по акустике концертного зала или система, опреде221
ленная для земного шара, в котором параметрическим множеством являются значения широт и долгот; любая система данных, определенная на всей группе определенного типа, например все сочинения какого-либо композитора, все служащие определенного нанимателя и другое Системы данных такого типа содержат всю информацию об ограничениях на их переменные. Тем самым они методологически подобны системам данных, определяемым при проектировании систем. Будем такие системы называть полными системами данных. Второй класс систем, который при исследовании, по-видимому, встречается чаще, составляют системы, в которых переменные не ограничены тем параметрическим множеством, для которого имеются данные. Можно говорить о том, что практически все системы, параметром которых является время, относятся к этому классу (пример с музыкальным сочинением — редкое исключение). Примеры полных систем данных для параметров других типов, хотя и встречаются чаще, также не являются типичными. Существует два основных метода исследования систем. При одном подходящие порождающие системы (или системы более высоких уровней), базирующиеся на определенных требованиях, выводятся из заданной системы данных. Для наиболее типичных требований этот процесс рассматривается в разделах В.4 и В.6. Этот метод обычно называется методом открытия. При другом методе гипотетическая порождающая система (или система более высокого уровня) постулируется, а затем ее правильность проверяется сравнением порождаемых ею (при соответствующих начальных условиях) данных с эмпирическими данными. Если система не проходит проверки, основанной на некоем конкретном критерии правильности (критерии совпадения), то она отвергается и постулируется новая система. Этот подход к исследованию систем обычно называется методом постулирования. Понятно, что при использовании метода открытия любая порождающая система, полученная непосредственно из системы данных, является неким экономным представлением каких-то аспектов системы данных. То, какие именно аспекты представляются порождающей системой, зависит от ее маски и характера функции поведения. Если порождающая система детерминирована, то это экономное описание всей системы данных своего рода «стенографическое» описание. Если система данных является полной, то метод открытия сводится к нахождению моделей ее данных. Обнаруженные модели данных могут затем использоваться для разных целей. Если система неполная, то необходимо различать две проблемы, связанные с найденными моделями (т. е. с полученными подходящими системами данных): объяснение данных в рамках заданного параметрического множества, вывод данных вне пределов параметрического множества, то есть предсказание, восстановление (retrodiction) или обобщение данных. 222
Если метод открытия используется для неполных систем данных, то порождающие системы (или системы более высоких уровней) определяются не столько для объяснения имеющихся данных, сколько для расширения данных за пределы заданного параметрического множества, что делает возможным предсказание, восстановление и обобщение данных. Этот процесс требует, разумеется, применения индуктивного рассуждения некоего типа. Задачи определения подходящих порождающих систем рассматривались в разд. В.4 и В.6 в неявном предположении, что выборочные переменные определены только через переменные, включенные в заданную систему данных, то есть через наблюдаемые переменные. Это ограничение не обязательно и может в некоторых случаях затруднить получение достаточно простых порождающих систем с незначительной порождающей нечеткостью или вовсе без нечеткости. Эти задачи могут быть обобщены, если разрешить пользователю постулировать гипотетические состояния некоторых дополнительных переменных, не входящих в число наблюдаемых переменных. Такие переменные обычно называются внутренними переменными, а их состояния — внутренними состояниями. Несмотря на то, что гипотетические внутренние состояния могут вводиться из самых разных соображений, обычно они вводятся для усиления зависимости между порождающей нечеткостью и сложностью подходящих порождающих систем. При введении внутренних состояний требуется, чтобы для заданных данных была определена модель порождения этих состояний. В то же время эти переменные должны способствовать уменьшению общей порождающей нечеткости. Подобное определение моделей возможно только для полных систем данных и изучается в рамках теории конечных автоматов, детерминированных и вероятностных. Понятия внутренних переменных и состояний весьма существенны при проектировании систем. Введение внутренних состояний в процессе проектирования систем сводится к соответствующему переопределению накладываемых ограничений. После их введения на абстрактном уровне внутренние переменные и их состояния могут быть конкретизированы любым подходящим способом. Однако при исследовании систем использование внутренних переменных довольно проблематично, поскольку они не несут семантической нагрузки и нельзя, как при проектировании систем, конкретизировать их подходящим образом. Таким образом, проектирование систем всегда представляет собой процесс подъема по эпистемологической иерархии систем. Он начинается с определения или порождающей системы, или системы данных и набора требований относительно структуры систем. Задача определения подходящих порождающих систем по заданной системе данных принадлежит к тому же классу задач, что и задачи, обсуждаемые в разд. В.4 и В.6, с той лишь разницей, что допускается использование внутренних переменных. Исследование систем осуществляется с помощью:
223
- подъема по иерархии посредством обнаружения систем более высоких уровней, для которых системы более низких уровней обладают определенными свойствами, и, если система данных неполная, соответствующих индуктивных выводов (метод открытия); - постулирования порождающих систем или систем более высокого уровня и отбрасывания тех из них, которые не удовлетворяют проверке на соответствие между эмпирическими и порожденными данными (метод постулирования); - любой комбинации метода открытия и метода постулирования, например подъема по иерархии до определенного уровня и постулирования систем на более высоком уровне. Наибольшее внимание в этой книге уделяется задачам, связанным с методом открытия. Объясняется это двумя соображениями. Прежде всего, учебным характером книги. Метод открытия, при котором системы вводятся в порядке возрастания их концептуальной сложности, очень удобен для объяснения и формулирования всей концептуальной схемы УРСЗ. Второе соображение заключается в том, что метод открытия недостаточно полно описан в литературе, методы постулирования и проектирования систем освещены вполне удовлетворительно.
224
Приложение Г СТРУКТУРИРОВАННЫЕ СИСТЕМЫ Г.1 Целое и части
Определение порождающей системы (или множества подходящих порождающих систем), рассматриваемое в разделе В, это теоретически только первый этап исследования систем. При введении более высоких эпистемологических уровней возникают новые проблемы. Данный раздел посвящен задачам, связанным со структурированными системами. Структурированная система представляет собой набор исходных систем, систем данных или порождающих систем, имеющих общее параметрическое множество. Системы, образующие структурированную систему, обычно называются ее элементами. Некоторые переменные у них могут быть общими. Общие переменные обычно называются связывающими переменными. Они представляют взаимодействия между элементами. Естественно называть эти три типа систем структурированными исходными системами, структурированными системами данных и структурированными порождающими системами. Для некоторых задач удобно также выделить более частные типы структурированных систем, например структурированные представляющие системы или структурированные системы с поведением Для заданной структурированной системы одного из этих типов существует связанная с ней система, определяемая всеми переменными, входящими в ее элементы. Эта система (предполагается, что она того же типа, что и элементы структурированной системы) рассматривается как некая полная система, то есть система, представляющая в виде некоторого целого все входящие переменные. С этой точки зрения элементы любой структурированной системы интерпретируются как подсистемы соответствующей полной системы, а полная система — как суперсистема этих элементов. При этом структурированные системы становятся, по существу, представлениями полных систем в виде различных подсистем. Статус системы как полной системы или подсистемы не является, разумеется, абсолютным. Например, некая система с поведением в одном контексте может рассматриваться как элемент структурированной системы (и, следовательно, как подсистема полной системы с поведением), а в другом — может рассматриваться как полная система, подсистемы которой образуют структурированную систему. Любая исходная система, система данных или порождающая система существует как бы в двух «лицах». В одном контексте она имеет статус подсистемы, а в другом — статус суперсистемы. Можно, таким образом, говорить не только о том, что «часть — это амплуа целого» (как предлагает Р. Гленвилл), но и о том, что целое—это ампула части. Подобная двойственность дает возможность представить любую полную систему как иерархию структурированных систем, то есть как структуриро225
ванную систему, элементами которой являются структурированные системы, элементами которой также являются... и так далее вплоть до элементов, состоящих из отдельных переменных. Зачем нужно представлять полную систему как совокупность ее подсистем? Причин несколько. Одна из них связана с наблюдением или измерением. Если в параметры входит время, то часто бывает технически невозможно или, по крайней мере, неразумно одновременно наблюдать (измерять) все переменные, имеющие отношения к цели исследования. В этом случае можно собрать данные только частично, для наибольшего возможного подмножества переменных. В других случаях исследователь вынужден использовать чужие данные, собранные различными организациями или последователями для собственных нужд и покрывающие только часть переменных, необходимых ему для работы. Другой причиной структурирования систем является сложность, которая в свою очередь, связана, с обозримостью рассматриваемой системы. Одной из характеристик системы является объем памяти компьютера необходимый для хранения системы. Рассмотрим, например, п переменных с k состояниями каждая. При работе с полной системой этих переменных для запоминания ее состояния нужно располагать nk n ячейками памяти, если хранить в ячейке по одному из k состояний. С другой стороны, если использовать структурированную систему, состоящую из всех подсистем с двумя переменными, то для той же цели понадобится только k2n(n— 1) ячеек памяти. С ростом значений k и п это число, как показано на рисунке Г.1 для k =10, растет значительно медленнее, чем nk n . Если же
Рисунок Г.1 – Зависимость емкости памяти от числа переменных в системе (k=10) структурированная система содержит только некоторые из двух переменных систем, это сравнение будет еще более разительным. Несмотря на то, что при малых п и k структурированные системы могут потребовать боль226
шего объема памяти, чем соответствующие полные системы, ясно, что в основном для важных практических случаев, особенно при больших k и n, их требования к памяти существенно ниже. Другой аспект возможности обработки систем связан с числом систем, которые должны быть рассмотрены в некоторых задачах Для сравнения чисел полных и структурированных систем определенного типа снова рассмотрим п переменных с k состояниями. Кроме того, будем отличать, является ли любое состояние системы возможным. Тогда имеется 2 k возможных полных систем, n (n − 1)2k −1 возможных структурированных систем, состоящих только из бинарных (состоящих из двух переменных) подсистем, и n 2 k возможных структурированных подсистем, состоящих только из п бинарных подсистем. Несмотря на то, что все эти числа достаточно велики, чтобы можно было бы говорить о полном переборе вариантов даже для небольших п и k, число структурированных систем (в обоих случаях) растет заметно медленнее, чем число возможных полных систем. Например, при n—10 и k = 2 структурированных систем, содержащих все бинарные подсистемы, 720, а возможных полных систем 10308 (т. е. находится за пределом Бремерманна). Таким образом, в общем случае легче осуществлять поиск на множестве всех возможных структурированных систем определенного типа, чем на множестве всех возможных полных систем, хотя и в том, и другом случае часто бывают неизбежны некоторые ограничения. Имеется много соображений в пользу применения структурированных систем в технике. Некоторые из них связаны с обозримостью процесса проектирования. Основные из этих соображений уже обсуждались. Другие связаны с наличием ограниченного набора подходящих готовых элементов (модулей), с эффективностью реализации, а также с различными вопросами надежности, проверяемости и ремонтопригодности проектируемой системы. Практические соображения, связанные с обозримостью задачи, эффективностью, ремонтопригодностью и тому подобное, не единственные соображения, по которым желательно использовать структурированные системы. В исследовании систем структурированные системы имеют более фундаментальное значение. Соответствующим образом обоснованная структурированная система дает исследователям сведения, не содержащиеся, по крайней мере явно, в соответствующей полной системе. Эти дополнительные сведения могут помочь ответить на определенные вопросы, возникающие в процессе исследования, помочь лучше разобраться в задаче. Со структурированными системами связана одна из самых спорных философских проблем — проблема взаимоотношения между целым и частями. Эта проблема рассматривается не только в древнегреческой философии, но и в значительно более древней китайской философии, в частности в книге И Цзин и более поздних работах. Это хорошо описывается в статье А. Бама /31/. n
2
2
227
Нет проблемы более важной для понимания природы существования, знания, ценностей или логики, чем проблема природы целого и его частей и их взаимоотношений. Совершенно ясно, когда мы говорим «часть», то имеем в виду «часть целого», а под «целым» подразумеваем «целое, состоящее из частей». В этом смысле нет частей, не являющихся частями целого, и нет целого, не состоящего из частей. Целое и части взаимосвязаны; каждое понятие зависит от того, что представляет собой другое и в то же время одно не есть другое. Часть целого не есть Целое, а целое, состоящее из частей не является ни одной из своих частей. Однако проблемы в понимании того, как соотносятся друг с другом целое и части, приводят к появлению теорий, по-видимому, отрицающих или, по крайней мере, модифицирующих первоначально ясные понятия. Некоторые трудности возникают также из-за того, что существуют разные типы целого и разные отношения часть-целое.
Гоген и Варела предлагают четыре альтернативных критерия оценки целостности системы /127/: Интересно посмотреть, как можно оценить степень целостности системы. Всегда, разумеется, можно нечто выделить и назвать «системой», но это нечто не всегда окажется тождественным понятием «цельная система», «естественное единство», «связанный объект» или «понятие». Что же делает одни системы более связными, более естественными, более «цельными», чем другие? ... Согласно одному подходу, полнота — это способность к соответствующему отображению существенных новых свойств... С другой точки зрения полнота измеряется степенью сложности сокращения системы... Третий подход состоит в том, что система считается настолько полной, насколько ее части взаимосвязаны, т. е. насколько трудно найти относительно независимые подсистемы. .. Согласно четвертому подходу система тем полнее, чем она сложнее, т. е. чем труднее свести ее к описаниям взаимосвязей компонентов более низкого уровня.
Философская контроверза «часть-целое» нашла свое отражение в противопоставлении двух научных методологий — редукционизма и холизма (от греческого holos, что значит целый). Редукционизм опирается на следующий тезис: свойства целого объяснимы через свойства составляющих его элементов. Холизм же отрицает этот тезис и утверждает, что нельзя без потерь анализировать целое с точки зрения его частей. Это утверждение часто формулируется в виде известного высказывания «целое больше суммы составляющих его частей», настоящий автор которого, вероятно, останется неизвестным. В схеме УРСЗ дихотомия целого и частей выражается двойственной ролью исходных систем, систем данных и порождающих систем, являющихся одновременно и суперсистемами и подсистемами. Различные вопросы, связанные с взаимоотношением целого и частей, которые часто бывают окружены некой таинственностью, могут быть на самом деле четко сформулированы в виде системных задач и изучаться соответствующим образом. При этом две методологические доктрины оказываются взаимодополняющими, что хорошо сформулировано в работе /127/: В большинстве исследований холизм и редукционизм занимают полярные позиции. Это, вероятно, является следствием исторически сложившегося размежевания между эмпирическими науками, по большей части редукциональными и аналитическими, и евро228
пейскими школами философии и общественных наук, пытающимися нащупать динамику общностей. Обе эти позиции вполне допустимы на определенном уровне описания и, по существу, дополняют друг друга. С одной стороны, можно спуститься на более низкий уровень и изучать свойства компонентов, не принимая во внимание их системные взаимосвязи. С другой стороны, можно, не обращая внимания на структуру компонентов, исследовать их поведение только с точки зрения их вклада в поведение большей единицы. Оба направления анализа всегда, вероятно, явно или неявно существуют, поскольку для наблюдателя оба эти уровня описаний взаимосвязаны. Невозможно представить себе компоненты, если нет системы, из которой они абстрагированы, и нет целого без составляющих его частей... Эти уровни описания по большей части не представляются явно как взаимодополняющие в основном из-за того, что в большинстве областей современной науки существует различие между описываемой методологией и практикой. Позиция редукционалиста достаточно сильна, однако анализ системы не может быть начат без знания степени связности исследуемой системы; аналитик интуитивно должен представлять себе, что он имеет дело с целостным явлением. Несмотря на то, что официально наука стоит на позиции редукционализма, на практике используются оба подхода. Нельзя быть чистым холистом или редукционалистом: эти точки зрения на системы являются взаимодополняющими... Редукционализм занимается более низким уровнем, а холизм — более высоким. В любом достаточно полном описании они переплетены, и каждый подход имеет свои достоинства и недостатки.
Более коротко и образно мысль о том, что в зависимости от цели исследования систем нужно быть готовым работать как с целым, так и с частями, выражена в работе /300/: Я за тонкое балансирование между частями и целым. Нельзя находиться ни в одной из крайностей. Это балансирование должно продолжаться бесконечно.
Со структурированными системами связаны некоторые наиболее важные типы системных задач. Это типы задач, имеющие в основном операционные формулировки на языке УРСЗ, и связанные с вопросами взаимоотношений между целым и частями. Некоторые из них относятся к исследованию, а некоторые к проектированию систем: одни возникли из практики, другие имеют теоретическое значение или затрагивают определенные философские вопросы. В этой главе определяются структурированные системы различных типов и рассматриваются некоторые связанные с ними ключевые задачи. Г.2. Системы, подсистемы, суперсистемы
В разделах Б и В были определены различные системы трех эпистемологических уровней. Для двух заданных систем одного из этих типов часто бывает нужно определить, соотносятся ли эти системы как часть и целое Однако для того, чтобы это можно было сделать, в схеме УРСЗ необходимо определить некий конкретный смысл отношения часть-целое, что должно достаточно хорошо отражать общепринятое понимание этого отношения. Это, в свою очередь, означает, что в формализме УРСЗ на отношение часть-целое должны быть наложены некоторые условия, с помо229
щью которых общепринятое понимание адекватно описывалось бы на языке УРСЗ. Одной очевидной особенностью отношения часть-целое является то, что при рассмотрении целое и часть сопоставлены, т. е. они являются понятиями одного типа. Отсюда следует требование, чтобы системы, связанные отношением часть-целое, также были совместимы. Ясно, что для того, чтобы системы были совместимы, необходимо, чтобы они были одного типа. Кроме того, здравый смысл подсказывает, что эти системы должны быть определены на одном и том же полном параметрическом множестве. Совместимость систем является необходимым условием того, что системы связаны отношением часть-целое, но недостаточным. Если есть две совместные системы, скажем системы x и y, то в соответствии со здравым смыслом х воспринимается как часть у только тогда, когда х полностью включается в у неким соответствующим образом, определяемым типом этих систем. Требования совместимости и включенности, видимо, адекватно описывают самую суть отношения часть-целое. Чтобы как можно более общим образом определить смысл этого отношения никаких добавочных требований ненужно. Остается, разумеется, определить отношение часть-целое для исходных систем, систем данных и порождающих систем так, чтобы оба этих требования выполнялись. Введем сначала соответствующую терминологию и обозначения. Пусть система х рассматривается как часть системы у. Будем х называть подсистемой у, а у — суперсистемой х. Формально будем обозначать, что х является подсистемой у (а у — суперсистемой для x), следующим образом: х p у. Пусть теперь x S и yS— исходные системы. Для определения отношения «подсистема» (и обратного отношения «суперсистема») необходимо выполнить условие совместимости исходных систем. Это значит, что они должны быть одного методологического типа (т. е. иметь одни и те же методологические отличия) и должны быть определены для одних и тех же параметров, как и для соответствующих баз. Требование включенности для исходных систем выражается в виде нескольких отношений включения: xS рассматривается как исходная подсистема yS (предполагается, что xS и yS — сравнимые исходные системы) тогда и только тогда, когда множества переменных (и обобщенных, и конкретных) и множество свойств системы xS являются подмножествами соответствующих множеств системы yS и, соответственно, множества состояний и проявлений свойств, а также множества наблюдений и каналы конкретизации системы xS являются подмножествами соответствующих систем yS. Данный набор отношений включения, которые должны выполняться, чтобы выполнилось отношение «подсистема», удобно представить через отношения одного индексного множества. Элементы этого множест230
ва идентифицируют отдельные сущности разных множеств (переменные, свойства, каналы), причем предполагается, что соответствующие друг другу обобщенные переменные, конкретные переменные и свойства помечаются одним и тем же элементом индексного множества (так же, как в формальном определении исходных систем в главе 5. Пусть переменные, свойства и другие характеристики систем xS, yS помечены (идентифицированы) соответственно индексными множествами xJ, уJ. Тогда отношение xS — подсистема yS «полностью» описывается отношением включения x J ⊆ yJ для их индексных множеств. Обычно считается, что y J ⊆ Nn 1 Пример Г.1. Пусть S — исходная система из примера Б.1 (состояние деловой древесины). Тогда 1J=N7. Пусть 2S — исходная система, определенная как подсистема 1S(2S p 1S) с помощью индексного множества 2 J={1, 2, 3, 7}. Тогда 2 S будет состоять из всех элементов, входящих в 1S, за исключением v i ,Vi , v& i ,V&i , a i , Ai , o i , ei при i =4, 5, 6. Для направленных исходных систем отношение «подсистема» находит отражение и в соответствующих идентификаторах входов-выходов. Пусть xS, yS — направленные исходные системы, такие, что xS p yS, и пусть x u = ( x u ( j ) | j∈x J ) , y u = ( y u ( j ) | j∈ y J ) - идентификаторы их входов-выходов. Тогда x u(j)= y u(j) для всех j∈x J . Для отслеживания значений, связанных с отдельными компонентами хи и уи, удобно считать, что для любого идентификатора входа-выхода элементы u(j) упорядочены в порядке возрастания значений j. Определенное для исходных систем отношение «подсистема» легко может быть распространено на системы данных. Понятно, что для двух сравнимых систем данных xD, yD, которым соответствуют исходные системы xS, yS, xD является подсистемой данных yD, то есть xD p yD, тогда и только тогда, когда xS p yS и xD содержит только данные, содержащиеся в yD и относящиеся к переменным, входящим в xS. Существенно, чтобы массивы данных были помечены таким образом, чтобы для каждого элемента можно было однозначно определить, к какой конкретной переменной он относится. Теперь остается только определить отношение «подсистема» для двух вариантов порождающих систем и систем с поведением. Пусть x FB = x S , x M , x f B y
( ) = ( S, M , f )
y y y FB B x - сравнимые системы с поведением и пусть J, yJ — множества идентификаторов переменных, соответствующих исходных систем xS, yS.
231
Тогда xFB является подсистемой системы с поведением yFВ, то есть x
FB p y FB
тогда и только тогда, когда выполнены следующие три условия: x y 1) x J ⊆ y J , так что S p S ;
(
)
(
)
x y 2) x M ⊆ y M , так что υ i , r j ∈ M тогда и только тогда, когда υi , rj ∈ M x и j∈ J ;
[
]
3) f B = f B ↓ K , где xK – множество идентификаторов выборочных переменных, соответствующих xМ, т. е. xfB является проекцией yfB для выборочных переменных системы xFB. Пример Г.2. Рассмотрим отношение подсистема-суперсистема для двух систем с поведением, изображенных на рисунке Г.2. Обе системы определены на одном и том же полностью упорядоченном параметрическом множестве. Их представляющие системы 1I, 2I содержат соответственно переменные υ1 ,υ 2 ,υ 3 ,υ 4 и υ1 , υ 4 , каждая из которых имеет два состояния. Им может быть дана некоторая интерпретация (каналы конкретизации и наблюдения), однако в данном примере эта интерпретация несущественна. Функциями поведения систем являются распределения вероятностей. Система 2FB удовлетворяет трем условиям, определяющим, что 2FB является подсистемой системы 1FB, то есть 2FB<1FB. Поскольку эти системы вероятностные, то при проецировании [1 f B ↓ {1,2,6}] в качестве агрегирующей функции используется сумма. Например, значение для 2 f B (000 ) получается суммированием первых трех вероятностей из таблицы для 1fB. Понятия подсистемы с поведением достаточно легко распространить и на другие типы порождающих систем (порождающие системы с поведением, направленные системы с поведением и так далее). Нужно только подходящим образом идентифицировать порождающие, порождаемые и входные переменные для обеих рассматриваемых систем. x
x
x
Г.3. Структурированные исходные системы и структурированные системы данных
Как уже указывалось выше, структурированные системы — это множества исходных систем, систем данных или порождающих систем. Они нужны для объединения нескольких систем в большие. Для того чтобы такое объединение было осмысленным, необходимо, чтобы отдельные системы — элементы структурированной системы, были совместимы, т. е. были одного типа и определены на одном и том же параметрическом множестве. По существу, это то же условие совместимости, выполнение которого требуется для отношения «подсистема» (раздел Г.2). Кроме условия совместимости нужно еще потребовать, чтобы никакой элемент не был подсистемой другого элемента той же структурированной 232
Рисунок Г.2 - Пример отношения подсистема с поведением/суперсистема с поведением (пример Г.2) системы. Выполнение этого требования позволяет избежать перемешивания уровней отдельных структурированных систем для того, чтобы они были иерархически упорядочены, как об этом говорится в разделе Г.1. Более того, в структурированной системе подсистемы, состоящие из любых элементов, полностью избыточны в том смысле, что любая содержащаяся в них информация также может быть выведена из элементов их суперсистем. Таким образом, в структурированных системах они бесполезны. Назовем это требование требованием неизбыточности. Избыточные элементы часто используются в технических системах для обнаружения и коррекции ошибок. Как показано в разделе Г.4 (пример Г.8), требование неизбыточности никоим образом не исключает из рассмотрения системы такого типа. Для формального определения структурированных систем предположим, что нейтральная структурированная система состоит из q элементов (нейтральных систем того же типа), удовлетворяющих тре233
бованиям совместимости и неизбыточности. Элементы идентифицируются индексом х, где x ∈ N q . Пусть, кроме того, V = {vi | i ∈ N n }
(Г.1)
является множеством всех переменных, входящих в элементы системы, и пусть xV - множество переменных элементов х ( x ∈ N q ). Тогда V = ∪ xV . x∈N q
(Г.2)
Будем для удобства обозначений переменные из множеств xV идентифицировать с помощью того же индекса i, что и переменные из полного множества V, определенного в (Г.1). Тогда любой элемент однозначно идентифицируется множеством своих переменных xV. Различные типы структурированных систем будем обозначать стандартным для этого типа символом с префиксом S. Так, через SS, SD, SFB обозначены структурированные системы, элементами которых являются соответственно нейтральные исходные системы, направленные системы данных и нейтральные системы с поведением. Таким образом, префикс S используется как оператор, показывающий, что несколько систем определенного типа объединено в большую систему. Элементами структурированных систем простейшего типа являются нейтральные исходные системы. Системы этого типа определяются как множество SS={(xV, xS) |x∈ N q }, (Г.3) где xS для каждого x ∈ N q — нейтральная исходная система (элемент SS); через x V обозначено множество переменных, входящих в *S; это обозначение удобно использовать как идентификатор элементов структурированной системы. Разумеется, исходные системы xS из (Г.3) должны удовлетворять требованиям совместимости и неизбыточности, но только этим требованиям. Если два элемента SS, скажем элементы, идентифицированные как х,y ∈ N q , имеют общие переменные, то есть V ∩xV ≠ 0 ,
x
(Г.4)
то эти элементы соединены. Будем это множество общих переменных называть соединением элементов х и у, а переменные из этого множества — соединяющими переменными. Соединения — это важные характеристики структурированных систем, так как они определяют взаимодействия между их элементами. Понятно, что для нейтральных структурированных систем соединения симметричны, то есть не зависят от порядка, в котором рассматриваются элементы. Для удобства соединение между нейтральными элементами х и у структурированной системы будем обозначать как Cx,y=V. 234
(Г.5)
Пример Г.4. Рассмотрим с точки зрения садовника структурированную исходную систему, определенную для розового куста в горшке. Эта система задаЛистья ется для того, чтобы определить пути повышения ежегодного урожая. Все переменные этой системы имеют два одинакоПочВа вых параметра: группу изучаемых розовых кустов и время. На самом деле параллельно исследуется несколько групп, причем каждая характеризуется определенными свойствами, такими, как тип почвы, удобрения и заболевания растения, частота срезания цветов и так далее Необходимо, чтобы наблюдения Рисунок Г.3. Части розового делались для каждого члена группы раз в два куста, являющиеся элементами структурированной системы, опреде- дня в течение одного года; если нужно, то исленной в примере Г.4 следование может быть продлено еще на несколько лет. В объекте исследования — розовом кусте в горшке — можно выделить шесть частей: почва, корни, стебель, сок растения, листья и цветы (см. рисунок Г.3). Исходная система определена для каждой из этих частей через следующий набор из 19 переменных (для простоты мы опускаем описание наблюдений и каналов конкретизации): V1 (влажность почвы) —низкая, средняя, высокая; V2 (способность корней поглощать влагу) — низкая, средняя, высокая; V3 (способность корней поглощать минеральные вещества) - низкая, средняя, высокая; V4 (способность стебля переносить сок) — хорошо, плохо; V5 (частота расположения цветов на стебле) — малая, средняя, большая; V6 (частота расположения листьев на стебле) — малая, средняя, большая; V7 (характеристики цвета сока) — плохие, средние, хорошие; V8 (характеристики запаха сока) — плохие, средние, хорошие; V9 (характеристики выработки сока) —плохие, средние, хорошие; V10 (количество листьев) — небольшое, нормальное, избыточное; V11 (цвет листьев) — плохой, хороший; V12 (развитие листьев) — задержанное, нормальное; V13 (окраска цветка) — бледная, обычная, интенсивная; V14 (запах цветка) — слабый, обычный, интенсивный; V15 (размер цветка) — небольшой, нормальный, огромный; V16 (количество цветов) — небольшое, большое, огромное; V17 (температура воздуха по Фаренгейту) — ниже 60, 60—69, 70—79, 80— 89, 90° и выше; V18 (осадки) —ниже нормы, норма, выше нормы; V19 (среднее число солнечных часов за день) —меньше 3, 3—6, больше 6. Шесть элементов структурированной системы определяются следующими подмножествами полного множества переменных: Среда
235
x = 1 (почва) — v1, v17, v18 ; х = 2 (корни) — v1, v2, v3; х = 3 (стебли) — v2, v3 v4, v5, v6, v17, v19; x = 4 (сок) — v2, v3 v4, v7, v8, v9, v17, v19; x = 5 (листья) — v6, v10 v11, v12, v17, v18, v19; x = 6 (цветы) — v5, v13 v14, v15, v16, v17, v18, v19; Соединения отдельных элементов легко получить, взяв пересечения этих множеств. Например, С1,2= { v1 }, С2,5=0 , С3,4 = { v2 ,v3 ,v4 ,v17 ,v19 } и так далее. Определим структурированную систему SS, элементами которой являются направленные исходные системы, как множество ) ) SS = {( x X ,x Y ,x S | x ∈ N q )}, где xХ, xY — множества входных и выходных элементов соответственно. Понятно, что x X ∪ x Y = xV . (Г.7) Если не считать выделения входных и выходных переменных, то множество (Г.6) совершенно аналогично определенному формулой (Г.3) множе) x . Однако элементы S ству для нейтральных структурированных систем SS ) любой направленной структурированной системы SS должны удовлетворять еще одному требованию, связанному с идентификаторами входов-выходов: ни одна из переменных из множества V, определенного уравнения (Г.2), не может быть объявлена как выходная более чем для одного элемента. Это требование обеспечивает согласованность состояний всех переменных при любом значении параметра. В самом деле, если переменная объявлена как выходная для более чем одного элемента структурированной системы, то ее состояния будут определяться (контролироваться) при любом значении параметра всеми этими элементами, что, как правило, будет приводить к несогласованности (к заданию нескольких различных состояний переменной при одном и том же значении параметра). Избежать этой несогласованности можно только тогда, когда все элементы влияют на эту переменную одинаково, что является исключительным, очень редким случаем. При этом, однако, ничто не будет потеряно, если потребовать, чтобы только один из этих элементов (любой) был объявлен управляющим этой переменной элементом. Это требование, которое должно выполняться для всех направленных структурированных систем, назовем требованием однозначности управления. Классификация переменных каждого элемента направленной системы на входные и выходные и требование однозначности управления имеют важные следствия для понятия соединения элементов. Для двух заданных элементов х, у направленной структурированной системы можно определить два направленных соединения. Одно из этих соеди) нений, ведущее из х в у, обозначается C x ,y и определяется как ) C x ,y = x Y ∩ y X . (Г.8) 236
) Второе ведет из у в х, обозначается C y ,x и определяется как ) C y ,x = y Y ∩ x X . Поскольку x Y ≠ y Y для x ≠ y
(Г.9)
(из-за требования однозначности управления), понятно, что ) ) (Г.10) C x , y ≠ C y ,x для разных элементов х, у. Кроме соединений элементов направленной структурированной системы, имеются также соединения элементов со средой системы. Будем для удобства рассматривать среду как отдельный элемент с уникальной меткой x=0. Несмотря на то, что на самом деле среда не является элементом структурированной системы (как это следует из (Г.6)), такой подход ) ) позволяет нам определить направленные соединения C0 ,x и C x ,0 ( x ∈ N q ) среды с элементами структурированной системы точно так же, как и соединения элементов. Если переменная объявлена выходной переменной некоего элемента х направленной структурированной системы, то эта переменная не управляется средой (из-за требования однозначности управления) и, следователь) но, не входит ни в какое соединение C0 ,x . Однако если некая переменная не объявлена как выходная ни для какого элемента, то остается только рассматривать ее как переменную, управляемую средой. Следователь) но, такая переменная должна быть включена в некое соединение C0 ,x . Поэтому все переменные в любом x Х, не объявленные ни в каких элементах как выходные, образуют соединение среды с элементом х. Формально ) С0 ,x = x X ∩ V − ∪ yY (Г.11) y∈N q
для любого x ∈ N q
) Для описания соединений C x ,0 (x ∈ N q ) рассмотрим переменные из множества xY, не объявленные как входные ни для какого элемента направленной структурированной системы. По определению, эти переменные не входят ни в какие соединения элементов структурированной системы. Таким образом, их надо рассматривать как соединения со средой, то есть ) как входящие в соединение С x ,0 . Остальные переменные также могут быть ) включены в С x ,0 . Вопрос о том, рассматривать ли их как соединения со средой или нет, остается в компетенции пользования. Формально x
) Y ∩ V − ∪ y X ⊆ C x ,0 ⊆ x Y y∈N q
237
(Г.12)
для любого x ∈ N q . Пример Г.5. Определим направленную структурированную систему, состоящую из пяти исходных систем. Система предназначена для изучения деятельности высших судебных инстанций шт. Нью-Йорк (США) по делам, рассматриваемым в уголовном суде. Система описывает прохождение дела через уголовный суд и суды высших инстанций, утверждающие приговор. Эта система определяет структуру сбора и обработки данных. Параметром в системе является время. В зависимости от конкретных целей наблюдения делаются ежемесячно, еженедельно или даже каждый день, начиная с некоторой фиксированной даты, скажем с 1 января 1970 г. В систему включены следующие переменные (множество V): v1 — общее число исков, поступивших в уголовный суд (в течение конкретного периода наблюдения — месяц, неделя или день); v2 — число исков, прекращенных в результате соглашения сторон; v3 — число отклоненных исков; v4 — число задержанных дел; v5 — число дел, по которым вынесены оправдательные приговоры; v6 — число дел, переданных на утверждение высших инстанций; v7 — число дел, не переданных на утверждение (это дела, в которых единственным наказанием является штраф или возмещение убытков); v8 — число дел, в которых нарушены условия утверждения; v9 — число дел, приговоры по которым отмечены судом высшей инстанции; v10 — число дел, приговоры по которым отмечены учреждениями уголовного суда. Рассматриваемая структурированная система состоит из пяти элементов (рисунок Г.4). Их множества входных и выходных переменных приведены в таблице Г.1 Прямоугольниками, которым даны условные названия, на схеме показаны элементы структурированной системы и ее среды. Связи между блоками представляют переменные, соединяющие элемнты (а также среду). Полное мно) жество соединений C x ,y (х, y=0, 1, . . ., q) пред
238
Рисунок Г.4 – Схема структурированной системы из примера Г.5 Таблица Г.1 - Определение элементов направленной структурированной системы из примера Г.5 (эквивалентно схеме на рисунке Г.4) x x x X Y 1 { v1 } { v 2 ,v 3 } 2 { v2 } { v 4 ,v 5 } 3 { v 4 ,v 8 } { v6 ,v7 } 4 { v6 } { v 8 ,v 9 } 5 { v3 ,v5 ,v7 ,v9 } { v10 } Таблица Г.2 - Матрица соединений структурированной системы, описанной в примере Г.5 ) 0 1 2 3 4 5 С x ,y 0
Ø
{ v1 }
Ø
Ø
Ø
Ø
1
Ø
Ø
{ v2 }
Ø
Ø
{ v3 }
2
Ø
Ø
Ø
{ v4 }
Ø
{ v5 }
3
Ø
Ø
Ø
Ø
{ v6 }
{ v7 }
4
Ø
Ø
Ø
{ v6 }
Ø
{ v9 }
5
{ v10 }
Ø
Ø
Ø
Ø
Ø
ставлено матрицей (таблице Г.2), обычно называемой матрицей соединений. Аналогично структурированным исходным системам определяются и структурированные системы данных; SD = {( xV ,x D )| x ∈ N q }, (Г.13) ) ) SD = {( xX ,x Y ,x D ) | x ∈ } . (Г.14) Поскольку любая система данных содержит исходную систему, структурированные системы данных должны удовлетворять всем условиям, которым должны удовлетворять исходные системы (совместимости, неизбыточности, однозначности управления). Кроме того, обычно требуется, чтобы они удовлетворяли локальной согласованности данных, определяемой 239
следующим образом: для всякой соединяющей переменной соответствующие ей данные должны быть одинаковыми во всех элементах, в которые входит эта переменная. Формально, если ) vi ∈ C x ,y (или vi ∈ C x ,y ), то xvi,w = yvi,w для всех w∈W , где xvi,w и yvi,w — подмножества данных, соответствующих переменной v i в элементах х и y. Обычно предполагается, что структурированные системы данных локально согласованы. Однако если множества данных, связанных с разными элементами, собираются независимо друг от друга, например разными группами экспериментаторов, то полученные множества данных могут и не удовлетворять требованию локальной согласованности данных. Нарушение этого условия ведет к аналогичным противоречиям и на более высоких эпистемологических уровнях, поэтому необходимо на некотором этапе исследования разрешить их. Процедуры разрешения локальных противоречий до сих пор должным образом не разработаны. Представляется, однако, что в общем случае более удобно и осмысленно противоречия разрешаются на уровне структурированных порождающих систем (они вводятся в разделе Г.4), а не на уровне структурированных систем данных. Поэтому задача разрешения локальных противоречий рассматривается именно на уровне структурированных порождающих систем. Г.4 Структурированные системы с поведением
У любой системы есть автор, и он преследует при изучении системы свои собственные цели. В. фон Лукаду, К- Корнвакс
Структурированные порождающие системы определяются в столь же общем виде, как и другие типы структурированных систем. Они также должны удовлетворять условиям совместимости и неизбыточности, как исходные структурированные системы. Они же должны удовлетворять некоторым дополнительным требованиям относительно масок и функций поведения своих элементов. Тот факт, что множество выборочных переменных порождающей системы в общем случае больше множества переменных соответствующей исходной системы или системы данных, дает некоторые новые возможности для соединения порождающих систем в структурированную систему. Пусть нужно соединить заданное множество систем с поведением в структурированную систему. Для каждой рассматриваемой системы с поведением, идентифицированной как элемент х ( x ∈ N q ) структурированной системы, обозначим через xV и xS соответственно множество переменных ее исходной системы и множество ее выборочных переменных. Пусть 240
V = ∪ xV = { v i | i ∈ N |V | };
(Г.15)
S = ∪ x S = { s k | k ∈ N |S | ;
(Г.16)
V ⊆ S и xV ⊆ x S для всех x ∈ N q
(Г.17)
x∈ N q
x∈ N q
Понятно, что
Для нейтрального варианта SF B структурированная система с поведением теперь может быть определена так: SFB ={(xS, xFB) | x ∈ N q }. (Г.18) Чтобы однозначно идентифицировать элементы х множествами xS, предположим, что выборочные переменные из всех множеств xS ( x ∈ N q ) идентифицируются тем же индексом k, что используется для идентификации переменных во всем множестве S [уравнение (Г.16)]. Соединения Сх,у элементов x , y ∈ N q структурированной системы SFB определяются теперь как пересечения множеств выборочных переменных Cx,y = xS ∩ yS. (Г.19) В представлении (Г.18), которое не содержит никаких ограничений на порядок порождения и на результирующее разбиение переменных из множеств x S ( x ∈ N q ) и S на порождающие и порождаемые переменные, обычно требуется, чтобы для всех пар элементов x , y ∈ N q выполнялось только одно дополнительное условие, а именно следующее уравнение: [ xf ↓ x S ∩ y S ] = [ yf B ↓ x S ∩ y S (Г.20) x Это условие обеспечивает то, что проекции функций поведения fB,, уfB для любой пары элементов из SFB равны относительно их общих переменных (соединяющих переменных). По существу, это требование сводится к требованию, чтобы переменные из разных элементов, считающихся (определяемых) одинаковыми, были действительно равны независимо от элементов, в которые они входят. Будем это требование называть локальной согласованностью поведения. Как уже говорилось, системы с поведением xFB,, являющиеся элементами SFB, на практике часто определяются на локально несогласованных множествах данных и, следовательно, не удовлетворяют требованию локальной согласованности поведения. Для работы с такими структурированными системами в различных проблемных контекстах, нужно сначала разрешить эти несогласованности (смотри раздел Г.11). В остальных разделах этой главы считается, что структурированные системы с поведением локально согласованы. После определения порядка порождения для структурированной системы с поведением SFB множество выборочных переменных S и SFB разбивается на порождающие и порождаемые переменные, соответственно обозна241
чаемые как S g и S g . Полученная структурированная система должна удовлетворять требованию однозначности управления. В данном случае это означает, что любая переменная из Sg должна порождаться одним и только одним элементом структурированной системы. В свою очередь, это значит, что множества порождаемых переменных xSg ( x ∈ N q ), связанные с отдельными элементами структурированных систем, должны образовывать разбиение множества Sg. Взяв один определенный элемент х ( x ∈ N q ) структурированной системы SFB, рассмотрим теперь множество переменных ( xS ∩ S g )− xS g . Это (с глобальной точки зрения) множество порождаемых переменных, соединенных с элементом х, но не порождаемых этим элементом. Понятно, что с локальной точки зрения (отдельный элемент) это входные переменные, хотя с глобальной точки зрения (структурированная система) они являются порождаемыми переменными. Следовательно, сам элемент должен рассматриваться как направленная система, в то время как структурированная система рассматривается как нейтральная в том смысле, что переменные множества не разбиты на входные и выходные. Это не значит, что в определении структурированных систем есть некоторая несогласованность. Это просто следствие того, что для структурированных систем возможны два сосуществующих подхода - локальный (с точки зрения элементов систем) и глобальный (рассматривающий структурированную систему как целое). С локальной точки зрения все элементы, с которыми связан некий элемент, образуют его среду. Это нечто вроде внутренней среды, определенной только для структурированной системы. С глобальной точки зрения среда (или внешняя среда) не выделяется. Однако нам представляется, что в данном случае предпочтительнее рассматривать структурированную систему как направленную, у которой все переменные из множества V объявлены выходными. Теперь остается обсудить только роль множества порождающих переменных xSg для отдельных элементов структурированной системы, то есть значение переменных из множеств S g ∩ x S для всех x ∈ N q . Состояния этих переменных должны быть доступны данному элементу на каждом шаге процесса порождения, как того требует функция поведения. Они могут быть доступны или изнутри, т. е. выводиться обычным образом из предыдущих состояний, так же как предыдущие состояния порождаемых и входных переменных, или снаружи, т. е. через входные переменные, представляющие соединения с другими элементами структурированной системы. Таким образом, эти переменные рассматриваются или как порождающие переменные, или как входные переменные элемента. Одну из этих альтернатив должен выбрать пользователь. В любом случае будем эти пе242
ременные обозначать x S g . Спецификация их действительной роли входит в определение системы с поведением, представляющей этот элемент, а также в определение направленных соединений элементов. Итак, порождающие системы с поведением, объединяемые в структурированную систему, обычно должны рассматриваться как направленные системы. Поскольку такой подход возможен всегда, мы определяем ) SFGB = {( xS g ,x S e ,x FGB )x ∈ N q }, (Г.21) понимая, что при этом не требуется никакого содержательного определения SFGB. Под это определение подходит и особый (вырожденный) случай, когда ни одна из переменных из V не объявляется как входная. xSg и xSе — это соответственно порождаемые и входные переменные элементов х: x S g это множество переменных, введенных и рассмотренных в предыдущем параграфе. В зависимости от того, какая из альтернатив выбрана, в это множество входят входные или выходные переменные элемента. Как и в предшествующем определении структурированной исходной системы, предполагается, что переменные из всех этих трех множеств и все элементы x ∈ N q идентифицируются индексом b, определенным в уравнении (Г.16). Для любого x ∈ N q эти три множества образуют разбиение множества x S. Кроме того, для некоторого y ∈ N q {0} переменные из множества ) x Sq входят в соединения C x ,y , в то время как переменные из множества x S e ) входят только в соединения C y ,x , переменные из x S g могут входить в соединения с любым направлением или вовсе не входить в соединения. Будем структурированные системы вида (Г.18) или (Г.21) называть соответственно структурированными системами с поведением основного и порождающего типа. Понятно, что из структурированной системы с поведением основного типа может быть выведено семейство структурированных систем с поведением порождающего типа. Структурированные системы этого семейства отличаются одна от другой: 1) разбиением S на S g и S g ; 2) разбиением S g на x S g ( x ∈ N q ) ; 3) использованием переменных из множеств x S g ( x ∈ N q ) . Разбиение 1 определяется разными порядками порождения для предсказания или восстановления. Разбиение 2 определяется перекрытиями переменных из множества Sg с элементами структурированной системы. Говоря точнее, переменная из множества Sg, входящая в один и только один элемент, очевидно, должна порождаться этим элементом. С другой стороны, переменная, входящая в несколько элементов, может порождаться любым из этих элементов, но только одним из них. Выбор этого элемента обычно осуществляется исходя из порождающей нечеткости (чем меньше 243
получающиеся порождающие нечеткости, тем предпочтительнее этот вариант), а также некоторыми вспомогательными критериями, определенными пользователем. Альтернативы типа 3) не влияют на порождающую нечеткость выбранной структурированной системы. Они представляют собой просто варианты формального представления. Пользователю должна быть предоставлена возможность повлиять на выбор представления; если представление ему безразлично, то нужно использовать один из вариантов по умолчанию. Пример Г.6. Рассмотрим структурированную систему основного типа (Г.18), состоящую из двух подсистем, базирующихся на одном и том же полностью упорядоченном параметрическом множестве. Каждый из элементов состоит из двух бинарных переменных, определяемых вероятностными функциями поведения. Маски 1М и 2М и функции поведения 1fB и 2fB показаны соответственно на рисунке Г.5 а и б. Ясно, что эта структурированная система удовлетворяет требованию неизбыточности. Она также локально согласована, как это показано на рисунке Г.5 б. Полная маска, схема, а также две частичные маски приведены на рисунке Г.6 а. Остальные схемы и маски на рисунке Г.6 представляют собой характерные примеры некоторых структурированных систем порождающего типа, которые могут быть получены из этой системы основного типа.
= 1М s1 α =0 0 0 0 0 0 1 1 1 1
244
s2 0 0 0 1 1 1 0 0 1 1
s3 0 1 1 0 1 1 0 1 0 1
s4 0 0 1 0 0 1 1 0 1 0
1
fB(α ) 0.05 0.05 0.1 0.2 0.05 0.05 0.15 0.15 0.15 0.05
= 2М
s3 β =0 0 0 0 1 1 1 1 1 1
s4 0 1 1 1 0 0 0 0 1 1
s5 0 0 0 1 0 0 1 1 1 1
s6 0 0 1 0 0 1 0 1 0 1
s3 s4 [1fB↓{s3, s4}](γ) [2fB↓{s3, s4}](γ) —————————————————— ——————————————— γ=0 0 0.25(= 0.05+0.20) 0.25(= 0.05+0.10+0.10) 0 1 0.30(= 0.15+0.15) 0.30(= 0.05+0.20+0.05) 1 0 0.30(= 0.05+0.05+0.15+0.05) 0.30(= 0.05+0.10+0.10+0.05) 1 1 0.15(= 0.10+0.05) 0.15(= 0.05+0.10) Рисунок Г.5 - К примеру Г.6
2
fB(α ) 0.05 0.05 0.1 0.2 0.05 0.05 0.15 0.15 0.15 0.05
Для вычисления общего числа существенно отличных структурированных систем порождающего типа, которые можно получить из приведенной в этом примере системы основного типа, предположим, что соединение со средой содержит все порождаемые переменные, равно как и все остальные переменные, рассматриваемые как соединяющие переменные. Тогда в этом примере имеются 24 порождающие системы для каждого из двух порождающих порядков (предсказание, восстановление). Для целей предсказания они получаются комбинированием следующих вариантов для переменных: две возможности для переменной s l и две для переменно s5 (они рассматриваются или как соединяющие, или нет); возможности для переменной s3 (она или не рассматривается как соединяющая, или имеет одно из двух возможных направлений); два возможных направления для переменной s 4 . Если учитывать оба порядка порождения, то в данном примере существуют 48 возможных порождающих структурированных систем. Далее варианты любой системы можно получить, по-разному определяя соединения со средой. Из 48 вариантов пять, представляющих важнейшие показаны на рисунке Г.6,б - Г.6,е. Будем для удобства называть их системами b,c,…,f. Первые четыре варианта (системы b — е} предназначены для предсказания, а последний вариант (система f) для восстановления. Структурированные системы b и с подобны в том смысле, что и в той и в другой системе выборочные переменные входят в разные соединения. Их роль отлична от роли переменных s3, s4. В системе b переменная s 4 порождается первым элементом 1f B (на языке функций поведения она однозначно определяется по приведенной на рисунке Г.5,б), а переменные s3, s4 используются как входные переменные второго элемента. В системе с переменные s3, s4 играют противоположную роль. Для этих двух систем можно сравнить их порождающие нечеткости, связанные с переменной s4. Они равны 0,2427 для системы b и 0.6754 для системы c. (Вычисление порождающих нечеткостей, описанные в разделе 3.5, мы предоставляем выпол245
нить читателю в качестве упражнения.) Таким образом, система b является более предпочтительной, поскольку она порождает состояния переменной s4 с существенно меньшей нечеткостью, чем система с (порядка 36% нечеткости системы с) и, следовательно, является лучшим предиктором, чем система с. Система d похожа на систему с в том смысле, что они одинаковым образом порождают переменную s 4 . Их отличие состоит в том, что переменные s1, s3, s4 в качестве соединяющих переменных играют разные роли, а также в формальном определении первого элемента. Несмотря на эти отличия, по существу, системы с и d порождают данные одинаково. То же относится и к системе е. Ее единственное отличие от системы d состоит в том, что переменная s3 используется как входная переменная для второго элемента, а не как порождающая переменная. Система f — это одна из 24 имеющихся в данном примере восстанавливающих систем. Основной вопрос, связанный с выбором одного из этих вариантов, состоит в том, какой из двух элементов более предпочтителен для порождения переменной s3. Порождающие нечеткости равны 0.8609 (для системы f ) и 0.9559 (для систем, в которых s3 порождается вторым элементом). Несмотря на то, что порождение s3 первым элементом дает несколько меньшую нечеткость, разница значительно меньше, чем для случая предсказания. Пример Г.7. Продемонстрируем гибкость, имеющуюся в определении структурированных систем. Предположим, что четыре разных изделия а, b, с и d производятся четырьмя разными подразделениями фирмы. Допустим далее, что для произведения одной единицы продукции а требуется две единицы продукции b и три единицы продукции с; для произведения одной единицы продукции d требуется две единицы
246
Рисунок Г.6 - Основной тип структурированной системы с поведением и некоторые полученные системы порождающего типа (пример Г.6) продукции а, одна единица продукции с и четыре единицы продукции b. Каждое подразделение ежедневно должно знать, сколько продукции ему необходимо произвести. Соответствующее количество продукции будем представлять переменными ра, рb, рс, pd. Их значения определяются заказом, наличием готового продукта и объемами этого продукта, необходимыми другим подразделениям для производства их собственных продуктов. Заказы будем представлять переменными о а , о b , о с o d , а объемы готовой продукции - переменными ia, ib, ic, id. Эти объемы определяются значениями p a , p b , p c , p d . Будем переменные, связанные с одним подразделением (имеющие одинаковые индексы), рассматривать как переменные, которые образуют 247
элемент структурированной системы. В их число входят и переменные ра, рb, рс, pd, определяющие объемы продукции данного подразделения, которые должны быть переданы другим подразделениям. Таким образом, структурированная система состоит из четырех элементов, соединенных так, как это показано на рисунке Г.7.
Pа
Pь PC Рисунок Г.7. Структурированная система (пример Г.7)
Входные переменные любого элемента, представляющие сведения об объемах заказов и готовой продукции, а также потребности других подразделений определяются средой (отделом торговли и складом), а также другими производственными подразделениями. Элементы представляют собой детерминированные направленные системы с поведением (без памяти), а параметром является время. Определим функции поведения элементов следующими простыми уравнениями: a f B : p a = o a − ia + 2 p d , b
f B : pb = ob − ib + 2 p a + 4 pd ,
c
f B : p c = o c − ic + 2 p a + p d ,
f B : p d = o d − id . Пример Г.8. На этом примере будет показано, что требование неизбыточности структурированных систем не противоречит тому, что в технике (в частности, вычислительной технике) для обнаружения и исправления ошибок часто используются именно избыточные системы. Одна из простейших схем корректирования ошибок состоит в том, что три системы параллельно выполняют одну и ту же работу, оперируя одними входными переменными. Подобная схема показана на рисунке Г.8, где три последовательных двоичных сумматора оперируют переменными v1 и v2. При нормальной работе состояния их выходных переменных v3, v4, v5 равны, однако если произошел случайный сбой или если устройство вышло из строя, то одно значение будет отличаться от двух других, чтобы распознать подобные ситуации и дать возможность системе в целом продолжить работу, состояния выходных переменных трех одинаковых устройств оцениваются двумя специальными системами. Одна из них на рисунке Г.8 называется «большинство». d
248
Рисунок Г.8 - Простая структурированная система для корректирования ошибок (пример Г.8) Она выбирает то состояние выходной переменной (0 или 1), которое имеют по крайней мере две из трех переменных v3, v4, v5, то есть состояние выходной переменной v6 равно тому состоянию, которое имеет большинство входных переменных. Вторая специальная подсистема, названная «сообщение об ошибке» предназначена для обнаружения любой несогласованности состояний переменных v3, v4, v5 и для выдачи соответствующего сообщения об ошибке. Ее поведение может быть описано следующим утверждением: v7 = l (сообщение об ошибке) тогда и только тогда, когда состояния переменных v3, v4, v5 неодинаковы, в противном случае v7 = 0 (нормальная работа). Если сообщения об ошибках появляются редко, это говорит о случайных сбоях; частое появление таких сообщений говорит о том, что одно из трех основных устройств (сумматоров) вышло из строя. Структурированная система, изображенная на рисунке Г.8, удовлетворяет требованию неизбыточности. Несмотря на то, что система содержит две избыточные подсистемы (два из трех сумматоров), они отличаются своими выходными переменными и, если смотреть глубже, своими внутренними переменными. Таким образом, избыточность в технике совершенно не похожа на ту избыточность, которая запрещается требованием неизбыточности. Избыточность в первом смысле означает, что одна и та же работа выполняется параллельно несколькими устройствами, которые отличаются выходными (и внутренними) переменными. Во втором понимании избыточность состоит в том, что структурированная система содержит систему, которая либо неотличима от другой системы, либо является подсистемой другой системы, входящей в эту структурированную. Пример Г.9. В этом примере система из предыдущего примера, изображенная на рисунке Г.8, используется для демонстрации уровней структурного уточнения. Рассмотрим более детально один из блоков на рисунке
249
Г.8 — последовательный двоичный сумматор. Его поведение обычно описывается следующими уравнениями: z t = xt + yt − ct −1 (mod 2 ), (а) c t = ( x t + y t + c t −1 − z t ) / 2 , (б) где xt, yt — состояния входных переменных в момент t, равные 0 или 1 (и упорядоченные по времени в порядке возрастания значений); zt — состояние выходной переменной (суммарный бит) в момент t; ct (ct-1)—состояние внутренней переменной, представляющей цифру переноса в момент t (t — 1). Согласно этому описанию двоичный сумматор представляет собой структурированную систему, схема которой изображена на рисунке Г.9,а. Ее элементы, описанные уравнениями (а), (б), также могут быть детализированы и представлены в виде структурированных систем. Например, элемент, представляющий уравнение (б), сам может быть представлен как структурированная система, элементами которой являются стандартные логические функции от двух переменных (рисунок Г.9,б). Теперь понятен смысл парных процессов укрупнения и уточнения структуры. При укрупнении схемы структурированная система корректирования ошибок на рисунке Г.8 является элементом большей структурированной системы (арифметического устройства). При дальнейшем структурном укрупнении эта структурированная система становится элементом еще большей структурированной системы (центрального процессора вычислительной машины) и так далее до тех пор, пока не будет достигнут максимальный уровень, необходимый для конкретного исследования. Но при уточнении структуры любой элемент системы корректирования ошибок (например, сумматор) может рассматриваться как соответствующая структурированная система (например, та, что изображена на рисунке Г.9,а), а любой элемент этой структурированной системы также может рассматриваться как структурированная система (рисунок Г.9,б) и так далее до тех пор, пока не будет достигнут необходимый уровень уточнения. Два или более уровня структурного уточнения также могут быть объединены в одну систему, то есть в структурированную систему, элементами которой являются структурированные системы, элементами которых являются структурированные системы... и так далее. Эта рекурсия, разумеется, заканчивается на тех элементах, которые не являются структурированными системами. Будем структурированные системы, содержащие несколько уровней уточнения, называть многоуровневыми структурированными системами и помечать обобщенным оператором Sk, где k — число уровней уточнения. Например, S2FB — это двухуровневая структурированная система с поведением, то есть структурированная система, элементами которой являются структурированные системы с поведением.
250
Рисунок Г.9 - Уточнение и укрупнение структуры (пример Г.9) Г.5. Задачи проектирования систем
Иерархическая схема — одна из самых важных структурных схем, используемых при проектировании сложных систем. Герберт А. Саймон
Структурированные системы используются при решении наиболее важных системных задач, возникающих как при исследовании, так и при проектировании систем. В общем случае эти задачи представляют собой системные формулировки различных вопросов, связанных с отношением между частями и целым. Проблемы типа часть-целое, возникающие при исследовании систем, существенно отличаются от тех же проблем, возникающих при их проектировании. В данном разделе мы рассмотрим структурированные системы с точки зрения их роли при решении системных задач проектирования. Изучению роли этих систем при исследовании систем, роли более сложной и хуже изученной, посвящены оставшиеся разделы этой главы. 251
Как указывалось в разделе В.10, первым этапом проектирования является определение порождающей системы, представляющей задание, которое должна выполнить данная система. В общем случае это задание представляет собой преобразование состояний соответствующих входных переменных в состояния выходных переменных. Таким образом, полученная порождающая система всегда является направленной. Кроме того, это обычно детерминированная система. Часто эта система не является уникальной, что показывается в следующем примере. Пример Г.10. Снова рассмотрим последовательный двоичный сумматор, введенный в примере Г.9. Его задачей является суммирование двух двоичных чисел, передаваемых последовательно разряд за разрядом в порядке возрастания значимости разрядов. Обычная система с поведением, используемая для представления этой задачи, описана в примере Г.9. Ее маска и поведение показаны на рисунке Г.10,а.
Рисунок Г.10 - Два варианта систем с поведением, представляющих последовательный двоичный сумматор (пример Г.10) Помимо входных и выходных переменных х, у, z, полностью описывающих ее задачу, система включает еще и внутреннюю переменную с — переносимый разряд. На рисунке Г.10,б показана альтернативная система с поведением (ее маска и поведение), не содержащая внутренних переменных. Эти системы, несмотря на то, что они решают одну и ту же задачу преобразования входных переменных х и у в выходную переменную z, совершенно различны. Различия, хорошо видные при сравнении масок, необхо252
димо влекут за собой различия в структурах, реализующих поведение. Так, например, если предположить, что предшествующие значения переменных (т. е. значения, определенные при ρ = - 1) непосредственно доступные команде задержки, то эти две системы с поведением включают структурированные системы, изображенные соответственно на рисунке Г.9,а и Г.10,в. Эти две структурированные системы, совершенно одинаковые с точки зрения среды, представляют собой совершенно разные основы для проектирования. Выбор одной из систем может быть осуществлен пользователем сразу или процесс проектирования может быть продолжен для обеих систем, а выбор осуществлен на более позднем этапе. Следующим после определения конкретной системы с поведением этапом проектирования является определение структурированной системы, удовлетворяющей таким требованиям: 1) она реализует функцию поведения выбранной порождающей системы; 2) все ее элементы представляют собой порождающие системы с определенными (подходящими) функциями поведения; 3) она удовлетворяет некоторым целевым критериям, определяемым как необходимые; 4) она принадлежит к определенному классу структурированных систем (то есть удовлетворяет некоторым структурным ограничениям). Требование 1) очевидно, поскольку предполагается, что эта структурированная система выполняет требуемое задание и это задание представляется функцией поведения данной порождающей системы, то эта функция, в свою очередь, должна представляться этой структурированной системой. Требование 2) говорит об имеющихся технологических возможностях. Оно представляет собой перечень всех модулей (компонентов, кирпичиков), которые можно использовать при создании проектируемой структурированной системы. Важно быть уверенным в том, что выбранных типов элементов достаточно для реализации данной порождающей системы. Требования 3) и 4) представляют собой условия оптимизации соответственно по целям и по ограничениям. Обычно имеется множество возможных целевых критериев и ограничений. Часто они представляют собой комбинации таких факторов, как стоимость, сложность, систематичность, время реакции, надежность, тестируемость, ремонтопригодность и так далее. Задача реализации заданной функции поведения с помощью элементов определенных типов сводится в принципе к задаче нахождения подходящей (в смысле целевых критериев и ограничений) декомпозиции функций, соответствующих отдельным выходным переменным данной системы, на функции, представляемые элементами заданных типов. Одним из методов решения этой задачи, который применим только в определенных случаях, является использование формальных правил некой алгебры, операции которой соответствуют функциям, представленным этими
253
элементами. Этот метод, если считать систему детерминированной, состоит из следующих шагов: а) Для каждой функции, соответствующей выходной переменной, определяется алгебраическое выражение. Оно может быть, например, подходящей канонической формой определенного типа. Эти алгебраические выражения задают определенный способ композиции функций проектируемой системы из функций, соответствующих элементам. Таким образом, эти выражения удовлетворяют требованиям 1) и 2) для задачи проектирования. Если, чтомаловероятно, отсутствуют целевые критерии и ограничения, то задача проектирования решена. б) Полученные выражения преобразуются согласно правилам данной алгебры к виду, удовлетворяющему целевым критериям и ограничениям. В общем случае может быть несколько решений. Обычно бывает достаточно определить только одно. Другой метод решения задачи декомпозиции, применимый только к дискретным системам, состоит в том, что декомпозиция производится независимо от алгебраических преобразований, а непосредственно с помощью действий над определениями рассматриваемых функций (их табличным, матричным или каким-то другим подходящим представлением) или с использованием соответствующих функциональных уравнений. Для демонстрации этого метода предположим для простоты, что все имеющиеся элементы имеют две входные переменные и одну выходную. На рисунке Г.11,а показаны входные и выходные переменные проектируемой системы и одного из ее элементов.
Рисунок Г.11 - Иллюстрация метода декомпозиции для проектирования систем Будем считать, что любая выходная переменная является функцией выходных переменных, а именно:
254
vn +1 = f n+1 ( v1 ,v2 ,...,vn ), vn + 2 = f n+ 2 ( v1 ,v2 ,...,vn ), ..................................
(Г.22)
vn + m = f n + m ( v1 ,v2 ,...,vn ) для проектируемой системы и y = g ( x1 , x2 ) (Г.23) для этого элемента. Теперь представим, что элемент включен в систему Fb таким образом, что его выходная переменная идентична одной из выходных переменных Fb, скажем переменной vn+i. Это дает структурированную систему, схема которой показана на рисунке Г.11,б. Она состоит из двух подсистем: одна — это данный элемент, а другая — модифицированная система Fb. Структурированная система содержит две переменные z1 и z2, не входящие в исходную систему Fb. Поскольку в этой системе переменные vn+i и у рассматриваются как идентичные, то функциональное уравнение fn+i(v1, v2, ..., vn)=g(x1, х2) (Г.24) должно выполняться. Решение этого уравнения представляет собой две функции x1=h1(v1, v2,..., vn), (Г.25) x2=h2(v1, v2, ..., vn). Чтобы эти функции были решением уравнения (Г.24), это уравнение должно, разумеется, выполняться при подстановке данных функций вместо переменных х1 и х2. Поскольку в данном случае считается, переменные х1, х2 идентичны новым переменным z1 и z2 (смотри рисунок Г.11,б), то можно переписать уравнение (Г.25) следующим образом: z2=h2(v1, v2, ..., vn). (Г.26) Обычно решений уравнений (Г.24) может быть много. Следовательно, основная проблема состоит в выборе одного решения. Прежде всего, множество решений сокращается за счет решений, не удовлетворяющих заданным структурным ограничениям. Кроме того, ищутся такие решения, для которых функции h1, h2 зависят от как можно меньшего числа переменных v1, v2,...,vn. В самом деле, чем меньше это число, тем сильнее декомпозиция и тем легче при необходимости осуществлять дальнейшую декомпозицию функций h1, h2. И, наконец, оставшиеся решения упорядочиваются относительно целевых критериев и те решения, которые оказываются худшими по всем критериям (или их подмножество), выбираются как основа для продолжения процесса декомпозиции. Шаг декомпозиции, изображенный на рисунке Г.11,б, должен быть повторен для всех выходных переменных vn+i, vn+2,...,vn+m и, если нужно, для новых переменных z1, z2,..., введенных в процессе декомпозиции. Декомпозиция прекращается в тех случаях, когда все новые переменные становятся идентичны входным переменным v1,v2,...,vn. Понятно, что на каждом шаге декомпозиции нужно испытывать новые элементы и сравнивать их возможные декомпозиции. 255
Многошаговая декомпозиция показана на рисунке Г.12. Для простоты используется только один тип элементов, тот, что изображен на рисунке Г.11,а. На рисунке Г.13 приведены эффективные типы декомпозиций системы с одной выходной переменной на элементы с двумя входными переменными и одной выходной.
Рисунок Г.12. Пример возможной ситуации после семи шагов декомпозиции Показаны все типы декомпозиций для n = 3, 4, 5, 6, для которых на каждом шаге декомпозиции новые переменные зависят от непересекающихся подмножеств входных переменных, унаследованных от предшествующей декомпозиции. Это наиболее подходящие типы декомпозиций. Числа на рисунке Г.13 — это количество входных переменных, от которых зависят соответствующие выходные или промежуточные переменные. Легко видеть, что вычислительная сложность задачи проектирования с ростом числа входных и выходных переменных проектируемой системы растет очень быстро. То же происходит и с ростом числа возможных типов элементов. Так, например, при п входных переменных и т выходных и одном типе элементов с двумя входными переменными и одной выходной число эффективных шагов декомпозиции, показанных на рисунке Г.13, равно произведению (п —1) m , а для е типов элементов (е≥2) оно равно уже e ( n−1 ) m с каждой декомпозицией, разумеется, связано решение соответствующего функционального уравнения, оценка и сравнение его решений и отбор наиболее перспективных из них с точки зрения всего проекта. Есть два основных способа сделать обозримой задачу проектирования. Один из них — представление общего задания в виде иерархии частных
256
Рисунок Г.13 - Примеры декомпозиций, основанных на элементах с двумя входными и одной выходной переменной заданий таким образом, чтобы на каждом уровне иерархии сложность проектирования была относительно небольшой. Подобная организация имеет некоторые дополнительные преимущества, связанные с надежностью, тестируемостью и восстанавливаемостью. Другой способ уменьшения сложности проектирования состоит в ослаблении целевых критериев. Вместо того чтобы требовать получения оптимального проекта, соглашаются на «хороший» или «приемлемый». Такой подход к проектированию систем позволяет использовать эвристические методы. Из-за большого числа возможных типов элементов оказывается слишком сложным включить в УРСЗ различные конкретные типы проектирования, основанные на определенных алгебрах или типах функциональных уравнений. Поэтому УРСЗ должен служить источником информации для пользователя. Если для задачи проектирования, заданной пользователем, имеется некий определенный метод проектирования, УРСЗ должен предоставить пользователю исчерпывающую информацию об этом методе. Средства УРСЗ для решения проблемы проектирования на уровне структурированных систем должны разрабатываться, в рамках общего подхода к декомпозиции как оптимизации (для небольших задач) или как средства удовлетворения требований (основанного на соответствующих эвристических методах). Г.6. Задачи идентификации
...даже зная свойства частей и законы их ваимодействия, очень непросто вывести свойства целого. Герберт А. Саймон
257
В исследованиях систем важное место занимают две взаимодополняющие задачи, связанные с взаимоотношением обобщенной системы с поведением и разных множеств ее подсистем. Одна из них основывается на предположении, что система с поведением, рассматриваемая как обобщенная, уже задана. Задача состоит в определении того, какие структурированные системы, состоящие из множеств подсистем заданных обобщенных систем, подходят для реконструкции данной системы с поведением с приемлемым уровнем точности. Во втором случае структурированная система с поведением задана, и задача состоит в том, чтобы вывести свойства неизвестной обобщенной системы. В литературе эти задачи называют соответственно задачей реконструкции и задачей идентификации. В этом разделе рассматривается задача идентификации, а в следующем — задача реконструкции. Задача идентификации распадается на две подзадачи. Одна состоит в определении множества всех обобщенных систем с поведением, представленных данной структурированной системой в том смысле, что функции поведения их элементов являются проекциями функции поведения любой из этих обобщенных систем. Это множество обобщенных систем называется реконструктивным семейством рассматриваемой структурированной системы, Вторая подзадача заключается в выборе из реконструктивного семейства такой обобщенной системы, которая задает в определенном смысле лучшую гипотезу относительно реальной обобщенной системы. РЕКОНСТРУКТИВНОЕ СЕМЕЙСТВО Рассмотрим структурированную систему с поведением SF вида (Г.18), элементы которой представлены множествами xS выборочных переменных и функциями поведения xf ( x ∈ N q ). Будем говорить, что система с поведением сопоставима с данной структурированной системой SF, если обе системы определены для одних и тех же параметров и переменных, а также используют один и тот же тип функций поведения (например, функции распределения вероятностей или возможностей). Обозначим через GSF множество функций поведения всех систем с поведением, сопоставимых с SF, а через FSF множество функций поведения систем с поведением из реконструктивного семейства SF. f ∈ FSF тогда и только тогда, когда
[ f ↓ x S ] = xf
(Г.27)
для всех ( x ∈ N q ). Для вероятностных или возможностных функций поведения уравнения (Г.27) представляются соответственно системами уравнений x f ( xc ) = ∑ f ( c ) (Г.28) c f xc
или x
f ( xc ) = max f ( c ) c f xc
258
(Г.29)
где ( x ∈ N q ). В этих уравнениях определяются значения xf(xc), значения f(с) определяются для всех обобщенных состояний входящих в уравнения переменных. Положим, что с ∈ С и x c∈x C для всех ( x ∈ N q ). Чтобы определить значения f(c), которые можно интерпретировать как вероятности или возможности состояний с, уравнения (Г.28) или (Г.29) нужно дополнить требованием, чтобы f(c)≥0 для всех с ∈ С . Несмотря на то, что f(c) должны для вероятностных систем удовлетворять некоторым дополнительным требованиям, таким, как f(c)≤1 и ∑ f(c) = 1 c∈C
легко увидеть, что эти дополнительные требования учитываются видом этих уравнений и требованием, чтобы f(c)≥0 для всех с ∈ С . Взаимоотношение между заданной структурированной системой и соответствующими обобщенными системами с поведением описывается множеством из ∑ |x C | x∈N q
уравнений вида (Г.28) или (Г.29) с |С| неизвестными, f(с), удовлетворяющей неравенствам f(c)≥0 для всех с ∈ С . Обычно некоторые из этих уравнений зависят от остальных и могут быть исключены. Если заданная структурированная система непротиворечива, то полученная система уравнений [то есть система линейно-независимых уравнений вида (Г.28)] имеет по крайней мере одно решение в области неотрицательных действительных чисел. Идентификация обобщенной системы с поведением по заданной структурированной системе однозначна тогда и только тогда, когда решение ограниченной системы уравнений существует (то есть структурированная система непротиворечива) и оно единственно. Это бывает довольно редко. Если решение не единственно, что бывает значительно чаще, то идентификация неоднозначна. По существу, это означает, что данная обобщенная система, хоть для нее и выполняются все ограничения на переменные структурированной системы, содержит некоторую дополнительную информацию. Это и есть конструктивное выражение известного утверждения науки о системах, что «целое больше суммы составляющих его частей». Пример Г.11. Рассмотрим структурированную систему, элементами которой являются системы с поведением без памяти, каждая из которых содержит по две из трех переменных v1,v2,v3. Каждая переменная имеет одно из двух состояний 0 или 1. Вероятностные функции поведения элементов lf, 2 3 f, f приведены в таблице Г.3. Легко убедиться, что эта структурированная система локально согласована. Например, вероятность того, что v2 = 0 равна 0.6 (и 0.4 для v2=1) независимо от того, вычисляется она как проекция lf или 2f. Обозначим через р0, р1,...p7 (таблица Г.4) неизвестные вероятности состояний обобщенных систем с поведением. Тогда реконструктивное семейство
259
данной структурированной системы описывается pi ≥ 0( i ∈ N 0 ,7 ) и 12 уравнениями вида (Г.28)
неравенствами
Таблица Г.3- Элементы структурированной системы из примера Г.11 v1 v2 1f(1с) v2 v3 2f(2с) v1 v3 3f(3с) 1
с=0 0
0.4
0 1 1 0 1 1
2
с=0 0
0.4
0.3 0.2
0 1 1 0
0.1
1 1
З
с=0
0
0.4
0.2 0.1
0 1
1 0
0.3 0.1
0.3
1
1
0.2
Таблица Г.4 - Обозначения, используемые в примерах Г.11, Г.12 и Г.14 v1 v2 v3 f(с) с=0 0 0 f(000) = р0 0 0 1 f(001 )= р1 0 1 0 f(010) = р2 0 1 1 f(011) = р3 1 0 0 f(100) = р4 1 0 1 f(101)=р5 1 1 0 f(110)=р6 1 1 1 f(111)= р7
p0+p1=0.4 (1), p0+p4=0.4 (5) p0+p2=0.4 (9), p2+p3=0.3 (2), p3+p7=0.3 (6) p1+p3=0.3 (10), p4+p5=0.2 (3), p1+p5=0.2 (7) p5+p7=0.2 (11), p6+p7=0.1 (Г), p2+p6=0.1 (8) p4+p6=0.1 (12),
Исследовав эти уравнения, получаем, что все неизвестные могут быть выражены через одну из них, скажем через р0. В самом деле, из (1): р1 = 0.4 - р0; из (5): р4 = 0.4 - р0; из (9) : р2=0.4 - р0; из (2): р3 = 0.3 - р2= - 0.1+р0; из (3): р5 = 0.2 - р4 = - 0.2+р0; из (6): р7 = 0.3 - р3 = 0,4 - р0; из (8): р6 = 0.1 - р2 = - 0.3 + р0. Таким образом, p1 = p2 = p4 = p7 = 0.4 – p0 , (a) рз = - 0.1 + p0, (б) р5 = - 0.2 + р0, (в) р6 = - 0.3 + р0. Из неравенств для каждого из уравнений получаем следующие ограничения на р0: а) p1 (или р2, р4, р7) ≥ 0 дает p0 ≤ 0.4; б) р з ≥ 0 дает p 0 ≥0.1; 260
в) p 5 ≥ 0 дает p 0 ≥0.2; г) р6 ≥ 0 дает p0≥0.3. Так как должны выполняться все эти ограничения, из неравенств следует, что р0 должно принимать значения в диапазоне 0.3 ≤ p0 ≤ 0.4 Если задаться значением р0 из этого диапазона, то из уравнений а) — г) можно однозначно определить значения неизвестных. В таблице Г.5 показано, как таким образом определяется реконструктивное семейство для данного примера. 1 1 2 2 v1 v2 f( c) v2 v3 f( c) ———————— ———————— 0 1 0.3 0 0 0.1 1 2 c= 1 0 0.5 c=0 1 0.4 1 1 0.2 1 1 0.5 Таблица Г.5 - Реконструктивное семейство из примера Г.11 v1
с= 0
V2
v3
pi =f(с)
0
0
0.3 ≤ p0 ≤ 0.4
(степень свободы)
0 1 1 p1= 0.4 -р0 0 0 0 p2= 0.4 - р0 0 1 1 p3= -0.1+ р 0 1 0 0 p4= 0.4 - р0 1 1 1 p5= - 0.2 + р0 1 0 0 p6= -0.3 + р0 1 1 1 p7= 0.4 - р 0 При определении реконструктивного семейства этой системы будем использовать для неизвестных те же обозначения, что и в примере Г.11. Тогда реконструктивное семейство будет описываться неравенствами pi ≤ (i ∈ N 0 ,7 ) и следующими восемью уравнениями: p0 + p1 = 0.0, (1) p0 + p4 = 0.1, (5) p1 + p5 = 0.4, (6) p2 + p3 = 0.3, (2) p2 + p6 = 0.0, (7) p4 + p5 = 0.5, (3) p3 + p7 = 0.5, (8) p6 + p7 = 0.2, (Г) Из уравнений (1), (7) и неравенств имеем р0 = р1 = р2 = р6 = 0. Отсюда просто определить оставшиеся вероятности: р3 = 0.3, р4 = 0.1, р5 = 0.4, р7 = 0.2. Следовательно, в данном случае идентификация однозначна. То есть данный пример — это пример одного из тех редких случаев, когда «целое равно сумме составляющих его частей». Пример Г.13. Чтобы продемонстрировать более общий тип реконструктивного семейства, рассмотрим структурированную систему из трех 261
элементов, причем каждый элемент содержит три переменных v1,v2,v3. Пусть v1 и v2 принимают состояния из множества {0, 1}, а v3 – из множества {0 1, 2}. Элементы представляют собой вероятностные системы с поведением без памяти. Их функции поведения lf, 2f, 3f приведены в таблице Г.6. Таблица Г.6 - Элементы структурированной системы из примера Г.13. v1 1 c=0 0 1 1
v2 1f(1c) v2 v3 2f(2с) 0 0.25 2с =0 0 0.17 1 0.18 0 1 0.16 0 0.20 0 2 0.12 1 0.37 1 0 0.14 1 1 0.18 1 2 0.23
v1 3 с= 0 0 0 1 1 1
v3 0 1 2 0 1 2
3 3
f( с) 0.11 0.14 0.18 0.20 0.20 0.17
Будем использовать приведенные в таблице Г.7 обозначения неизвестных вероятностей состояний полной системы. Таблица Г.7- Обозначения, используемые в примере Г.13 f(с) v1 v2 v3 с= 0 0 0 f(000) = p0 0 0 1 f(001) = p 1 0 0 2 f(002) = p 2 0 1 0 f(010) = p3 0 1 1 f(011) = p4 0 1 2 f(012) = p5 1 0 0 f(100) = p6 1 0 1 f(101) = p7 1 0 2 f(102) = p8 1 1 0 f(110) = p9 1 1 1 f(111) = p10 1 1 2 f(112) = p11 Составление уравнений, описывающих реконструктивное семейство, и определение их решений при ограничениях p i ≥ 0 ( i ∈ N 0 ,1 ) предоставим читателю. Скажем только, что система из 16 исходных уравнений с 12 неизвестными сводится к 10 линейно-независимым уравнениям с двумя степенями свободы. Если предположить, что свободными являются неизвестные р10 и р11, то мы получим следующие неравенства: 262
0.04 ≤ p10 ≤ 0.18 , 0.05 ≤ p11 ≤ 0.17 , 0.23 ≤ p10 + p11 ≤ 0.34. Область значений для р10 и р11, определяемая этими уравнениями, показана на рисунке Г.14; это выпуклое множество, натянутое на четыре точки (0.06, 0.17), (0.17, 0.17), (0.18, 0.16), (0.18, 0.05). Для любой пары значений р10 и р11 из этой области значения остальных неизвестных однозначно определяются следующим образом: р0 = 0.34 - р10 - р11, p1 = - 0.04 + р10, р 2 = - 0.05 + р 11 , р3 = - 0.023 + р10 + р11, р4 = 0.18 – р10, р5 = 0.23 – р11, р 6 = - 0.17 + р 10 + р 11 , р7 = 0.20 – р10, р8 = 0.17 – р11, р9 = 0.37 – р10 - p11. p11 0.3
(0.06 – 0.17) 0.25
(0.17 – 0.17) 0.2
(0.18 – 0.05)
(0.18 – 0.16)
0.15
0.1
0.05
0.05
0.1
0.15
0.2
0.25
0.3
0.35
p10
Рисунок Г.14 – Описание реконструктивного семейства из примера Г.13
Пример Г.14. Рассмотрим структурированную систему, элементами которой являются возможностные системы с поведением с теми же наборами переменных, что и в примере Г.12. Функции поведения элементов приведены в таблице Г.8. Как видно, они не нормализованы.
263
Для описания реконструктивного семейства этой структурированной системы снова воспользуемся обозначениями из таблицы Г.4. Тогда реконструкТаблица Г.8 - Элементы структурированной системы из примера Г.14 1 1 2 2 f( с) f( c) v1 v2 v2 v3 1 2 с=0 0 0.8 c = 0 0 0.8 0 I 0.5 0 1 0.9 1 0 0,9 I 0 0.8 1 1 0.8 1 1 0.6 тивное семейство определяется неравенствами p i ≥ 0 ( i ∈ N 0 ,7 ) и следующими восемью уравнениями в виде (Г.29): max(p2, p3)= 0.5, (1) max( p0, p4)= 0.8, (5) max(p3, p7)= 0.6, (2) max( p2, p6)= 0.8, (6) max(p0, p1)= 0.8, (3) max( p4, p5)= 0.9, (7) max(p6, p7)= 0.8, (Г) max( p1, p5)= 0.9, (8). Из уравнения (1) следует, что ни р2, ни р3 не могут быть больше 0.5; следовательно, из (6) следует, что р6 = 0.8, а из уравнения (2), что р7 = 0.6. Из уравнения (5) следует, что р4 не может быть больше 0.8, а значит, из уравнения (7) следует, что p5 = 0.9. Согласно этим результатам данная система может быть сведена к двум независимым подсистемам уравнений max(p2, p3)= 0.5, max(p0, p1)= 0.8, max( p0, p4)= 0.8
Единственное уравнение при условии, что р2 ≥ 0 и р3 ≥ 0, имеет решение р 2 =0.5 и 0 ≤ p 3 ≤0.5 или р 3 =0.5 и 0 ≤ p 2 ≤0.5. Пара уравнений, при условии, что р0 ≥ 0, р1 ≥ 0 и р4 ≥ 0, имеет решение р 0 =0.8 и 0 ≤ p 1 ≤0.8, а также 0 ≤ p 4 ≤0.8 или р 1 = p4= 0.8, и 0 ≤ p 0 ≤0.8. B данном реконструктивном семействе легко выделить одно максимальное и четыре минимальных распределения возможностей. Они приведены в таблице Г.9, где через fSP и fSFi ( i ∈ N 4 ) обозначены соответственно максимальное и минимальные распределения, а через SF — рассматриваемая cтруктурированная система. Реконструктивное семейство состоит из этих четырех распределений, а также из всех распределений, находящихся между максимальным распределением и любым из четырех минимальных. Для возможностных структурированных систем известно, что в общем случае их реконструктивные семейства всегда имеют вид, что и в примере
264
Г.14. То есть реконструктивное семейство всегда содержит одно максимальное семейство (предполагается, что данная структурированная система соглаТаблица Г.9 - Максимальное и минимальные распределения возможностей для реконструктивного семейства из примера Г.14 v1 v2 v3 fSF fSF,1 fSF,2 fSF,3 fSF,4 C=0 0 0 0.8 0.8 0.8 0 0 0 0 1 0.8 0 0 0.8 0.8 0 1 0 0.5 0.5 0 0.5 0 0 1 1 0.5 0 0.5 0 0.5 1 0 0 0.8 0 0 0.8 0.8 1 0 1 0.9 0.9 0.9 0.9 0.9 1 1 0 0.8 0.8 0.8 0.8 0.8 1 1 1 0.6 0.6 0.6 0.6 0.6 сована) и множество решений, состоящее из возможностных распределений, находящихся между максимальным решением и одним из нескольких минимальных решений. Более того, возможность любого полного состояния переменных, входящих в любое минимальное решение, равна или возможности этого состояния в максимальном решении, или нулю. Данный результат, равно как и некоторые другие результаты, связанные с задачей определения реконструктивного семейства для заданной структурированной системы, получены недавно и для возможностных, и для вероятностных систем. КОЭФФИЦИЕНТ ИДЕНТИФИЦИРУЕМОСТИ
Часто необходимо иметь подходящую меру для оценки размера реконструктивного семейства. Если эта мера является адекватной, то ее можно использовать для оценки нечеткости, связанной с реконструкцией обобщенной системы по заданной структурированной системе, а также как степень идентифицируемости реальной структурированной системы. Для возможностных систем размер реконструктивного семейства адекватно оценивается произведением П [ 1 + f SF ( c )] (Г.30) SF
с∈А
- максимальный элемент реконструктивного семейства FSF, а A где f множество всех полных состояний, для которых степень возможности в реконструктивном семействе определяется не единственным образом [то есть множество полных состояний, для которых решение ограниченной системы уравнений вида (Г.29) не единственное]. Обратите внимание, что это произведение всегда больше или равно 1 и что его значение пропорционально мощности множества А и значениям fSF(с); оно равно 1 только тогда, когда множество А пустое (то есть если существует единственное решение. Если принять произведение (Г.30) в качестве разумной оценки размера реконструктивного семейства, то естественно было бы определить реконст265
руктивную нечеткость uSF, связанную со структурированной системой SF, как логарифм этого произведения, то есть u SF = log 2 ∏ [ 1 + f SF ( c )] = ∑ log 2 [ 1 + f SF ( c )] . (Г.31) с∈A
c∈A
Понятно, что
0 ≤ u SF ≤| C |, где считается, что |С| - реконструктивная нечеткость всего множества GSF обобщенных систем, сопоставимых с SF. Можно использовать меру | C | −u SF u (Г.32) I SF = = 1 − SF , |C | |C | называемую коэффициентом идентифицируемости, в качестве разумного показателя возможности определения единственной обобщенной системы по заданной структурированной системе SF. Понятно, что 0 ≤ I SF ≤ 1. I = 1 только тогда, когда |FSF| = 1; ISF = 0 только тогда, когда |А| = |С| , и fSF (с) = 1 для всех с ∈ С . Коэффициент идентифицируемости бывает полезен при решении некоторых системных задач, особенно при сравнительных исследованиях структурированных систем. В общем случае значительно легче определить коэффициент идентифицируемости структурированной системы, чем реконструктивное семейство: для этого достаточно определить максимальное решение и состояния с единственными решениями (то есть С - А). Пример Г.15. Определим коэффициент идентифицируемости структурированной системы, определенной в примере Г.14. Отметим, что в этом примере |С|=8, а множество А состоит из первых пяти состояний, перечисленных в таблице Г.9. Используя значения f SF(с) для этих состояний, получим реконструктивную нечеткость u SF = 3 log 2 1.8 + 2 log 2 1.5 = 3.714. Отсюда ISF = 1 — 3,714/8 = 0.536. ЕДИНСТВЕННЫЙ ВЫБОР ИЗ РЕКОНСТРУКТИВНОГО СЕМЕЙСТВА
Рассмотрим теперь вторую подзадачу задачи идентификации—задачу выбора из реконструктивного семейства одной обобщенной системы как гипотезы о реальной обобщенной системе. Эта задача тривиальна, если реконструкция однозначна (то есть если ISF = 1). В остальных случаях (если данная структурированная система SF согласована и, следовательно fSF ≠ 0, этот выбор совершенно произволен, если только мы не определим некий критерий и не потребуем, чтобы система, выбранная из реконструктивного семейства, наилучшим образом удовлетворяла этому критерию. В этом случае задача выбора превращается в задачу оптимизации с последующим произвольным выбором из лучших, с точки зрения 266
данного критерия, систем. Если исполнительный критерий оптимизации обеспечивает единственность оптимизации, то из данной задачи исключается элемент произвольности. Критерии оптимизации всегда используются исходя из неких фундаментальных соображений и, следовательно, определяются этими соображениями. С эпистемологической точки зрения самым существенным соображением для выбора обобщенной системы является ее максимальная независимость со всех точек зрения, за исключением только условия для проекций (Г.27). Более конкретно это соображение можно сформулировать так: для заданной структурированной системы из реконструктивного семейства следует выбирать такую обобщенную систему, которая опирается на всю информацию, содержащуюся в этой структурированной системе, но только на эту информацию. Такую обобщенную систему можно было бы назвать несмещенной реконструкцией. Это система, реконструированная по структурированной системе без смещений, то есть, с одной стороны, использующая всю имеющуюся информацию, а с другой, - не использующая никакой другой дополнительной информации. Выбор несмещенной реконструкции, по существу, представляет собой индуктивный вывод. Он может быть описан как следующая оптимизационная задача. По заданной структурированной системе с поведением SF из множества функций реконструктивного семейства FSF выбрать такую функцию поведения fSF , для которой мера нечеткости (шенноновская энтропия для вероятностных систем или U-нечеткость для возможностных) была бы максимальной при условии, что выполняются ограничения на проекции (Г.27). Для вероятностных систем эта задача оптимизации фигурирует под названием «принцип максимума энтропии». Известно, что несмещенная реконструкция единственна и для вероятностных, и для возможностных систем. Она определяет самое слабое из возможных ограничений на переменные, соответствующие заданной структурированной системе. Для возможностных систем fSF это максимальное распределение из реконструктивного семейства FSF, или, другими словами, это распределение из множества распределений FSF, которое представляет наибольшее нечеткое подмножество всех полных состояний переменных систем. Несмотря на то, что несмещенная реконструкция эпистемологически наиболее существенна, поскольку она опирается на один-единственный хорошо обоснованный принцип индуктивного вывода, для других целей могут лучше подойти другие реконструкции. Совершенно естественным и важным примером этого может послужить выбор обобщенной системы, для которой минимизирована наибольшая возможная ошибка. Под ошибкой здесь имеется в виду расстояние между распределением (вероятностным или возможностным) реконструированной обобщенной системы и распределением истинной системы. Такого типа реконструкция - это реконструкция с наименьшим риском. Конкретная формулировка полученной оптимизационной задачи зависит от того, какой тип расстояния используется. Особую важность из всех 267
возможных типов расстояния имеют те, что оценивают потерю информации. Далее в этой главе, в особенности в разделах Г.7 и Г.9, мы рассмотрим такие типы расстояний. ПРОЦЕДУРЫ СОЕДИНЕНИЯ
Одним из важнейших результатов, связанных с задачей идентификации, является то, что несмещенная реконструкция может быть определена с помощью относительно простой процедуры, не включающей решение описанной выше задачи оптимизации (задачи максимизации шенноновской энтропии или U - нечеткости при заданных ограничениях). Эта процедура, называемая процедурой соединения, основана на вероятностном или возможностном варианте операции соединения довольно простым образом комбинирующей функции поведения элементов заданной структурированной системы. Рассмотрим две функции поведения 1 f : A × B → [ 0 ,1 ], f : B × C → [ 0 ,1 ], определенные на множествах состояний А, В, С, смысл которых мы поясним ниже. Обратите внимание, что в множество В входит область определения обеих функций. Соединение 1f и 2f, обозначаемое как lf *2f, это функция 1 f ∗2 f : A × B × C → [ 0 ,1 ], свойства которой зависят от природы функций 1f и 2f . Если это функции распределения вероятностей, то [ 1f ∗2 f ]( a ,b , c ) = min[ 1f ( a ,b ),2 f ( c | b )], (Г.33) 2 где f(c|b) — условная вероятность с при .заданном b; если это функции распределения возможностей, то [ 1f ∗2 f ]( a ,b , c ) = min[ 1f ( a ,b ),2 f ( b ,c )] (Г.34) Обратите внимание, что в отличие от (Г.33) в (Г.34) не используются условные возможности. Дело в том, что тут используется соотношение min[ 1f ( a ,b ),2 f ( с | b ) = min[ 1f ( a ,b ),2 f ( b , c )], которое легко может быть доказано. Пусть операция соединения применяется к двум элементам структурированной системы с выборочными переменными из множеств 1S и 2S и функциями поведения lf и 2f. Тогда необходимо преобразовать области определения функций 1f и 2f к виду А × В и В × С соответственно, где А - множество совокупных состояний переменных, входящих только в первый элемент, то есть переменных из множества 1S - ( 1S ∩ 2 S ); В - множество совокупных состояний переменных, входящих в оба элемента, то есть переменных из 1 S ∩ 2 S ; С - множество совокупных состояний переменных, входящих только во второй элемент, т. е. переменных из множества 2S - ( 1S ∩ 2 S ) . 2
268
Для определения несмещенной реконструкции данной структурированной системы операция соединения должна быть выполнена для пар элементов этой системы. При каждом ее выполнении два элемента сливаются (объединяются) в один больший элемент новой структурированной системы. Пусть операция соединения всегда выполняется в таком порядке, чтобы результат ранее выполненных операций соединения входил в операцию соединения в качестве второго элемента. Эта процедура заканчивает свою работу тогда, когда все элементы сливаются в одну обобщенную систему. Будем называть эту процедуру базовой процедурой соединения. Прежде чем ее формализовать, нужно рассмотреть два вырожденных случая, чтобы все содержательные ситуации были описаны. В первом случае все переменные из первого элемента (соответствующего 1f) могут быть включены во второй элемент (соответствующий 2f). Это может быть, поскольку, вообще говоря, второй элемент получен в результате выполнения неких операций соединения. В этом случае множество А является пустым, a lf принимает вырожденный вид 1 f : B → [ 0 ,1 ]. Во втором случае элементы не соединены. Это значит, что множество В является пустым, а функции поведения имеют вырожденный вид 1 f : A → [ 0 ,1 ], 2 f : B → [ 0 ,1 ]. Обратите внимание на то, что вследствие требования неизбыточности для структурированных систем (смотри раздел Г.3) и договоренности о том, что результат предшествующих операций соединения всегда выступает как 2 f, множество С не может быть пустым. Для вероятностных систем вырожденные операции соединения определяются так: [ 1f ∗2 f ]( b , c )= 1f ( b )⋅2 f ( c | b ) (Г.35) для А=0 и [ 1f ∗2 f ]( a ,c )= 1f ( a )⋅2 f ( c ) (Г.36) для В=0; для возможностных систем они определяются следующим образом: [ 1f ∗2 f ]( b , c ) = min[ 1f ( b ),2 f ( b , c )], (Г.37) 1 2 1 2 [ f ∗ f ]( a ,c ) = min[ f ( a ), f ( c )]. (Г.38) l 2 Через f * f будем обозначать в зависимости от контекста как обычную, так и вырожденную операцию соединения. Тогда базовая процедура соединения описывается следующим алгоритмом. Базовая процедура соединения. Дана локально согласованная структурированная система с поведением SF (вероятностная или возможностная) с функциями поведения xf (x ∈ Nq). Для определения соединения xf для всех x∈ Nq: 1) положить k=2 и f = 1f ; 2) произвести соответствующую группировку аргументов kf и f и выполнить соответствующий вариант операции соединения k f ∗ f → f (операция может быть вероятностной или возможностной, обычной или вырожденной); 269
3) если k < q, то k+1 → k и перейти на шаг 2; 4) стоп. Можно доказать следующее утверждение: если базовая процедура соединения применяется к согласованной возможностной системе SF, то в результате всегда получается несмещенная реконструкция fSF (максимальное для реконструктивного семейства FSF распределение возможностей). Однако если эта процедура применяется к вероятностной системе, то несмещенная (максимум энтропии) реконструкция получается только для определенного класса структурированных систем — так называемых ациклических структурированных систем, описываемых в разделе Г.7. По полученному результату, не определяя типа данной структурированной системы можно определить результат применения базовой процедуры соединения f несмещенную реконструкцию или нет. Если f удовлетворяет условию для проекции [ f ↓ x S ] = xf для всех x∈ Nq, то это несмещенная реконструкция, в противном случае f не соответствует данной структурированной системе и должна быть уточнена с помощью следующей итеративной процедуры соединения. Итеративная процедура соединения. Дана локально согласованная структурированная система с поведением SF с вероятностными функциями поведения jf (j∈ N0,q-1). Дана также функция f, полученная с помощью базовой процедуры соединения, примененной к SF, и число ∆ ∈ [0, 1]; требуется с точностью до ∆ определить функцию поведения несмещенной реконструкции: 1) присвоить j=0, i=1 и f0 = f; 2) сделать соответствующее разбиение аргументов jf и fi-1 и выполнить ~ операцию соединения j f ∗ f i −1 → f i для вырожденного вида (Г.35); 3) если i ≠ 0 (mod q), то i + 1 → i, j+1 (mod q) → j, и перейти на 2; ~ 4) если | f i ( c ) − f i −q ( c ) | >∆ для какого-то с∈ С, то i+1→ i, j+1 (mod q)→ j, и перейти на 2; 5) конец. Если после выполнения итеративной процедуры соединения ∑ f i ( c ) = 1 , то c
f SF ( c ) − ∆ ≥ f i ( c ) ≤ f SF ( c ) + ∆ для всех c ∈ C ; в противном случае данная структурированная система SF глобально не согласована (смотри раздел Г.11) и реконструкции SF не существует, то eсть FSF = 0, и, следовательно, SF бессодержательна. Пример Г.16. Рассмотрим структурированную систему из примера Г.11, определенную в таблице Г.3. Сначала используем для определения несмещенной реконструкции вероятностный вариант базовой процедуры соединения. В первых столбцах таблице Г.10 приводятся промежуточный результат 2 1 f* f и окончательный результат f = 3f*(2f*1f). Легко видеть, что окончательный результат f не соответствует заданной структурированной системе. Так, 270
например, [f↓{v1, v2}](0 0) =0.312195+0.111628=0.423823 не равно 1f(0 0)=0.4, так что требование для проекций (Г.27) не выполняется. Следовательно, необходимо использовать итеративную процедуру соединения. Последовательность порождаемых процедурой функций поведения сходится к несмещенной реконструкции. Она приводится в таблице Г.10 для i=1, 2, ...,21. Таблица Г.10 - Последовательность функций поведения, полученных с помощью базовой и итеративной процедур соединения, пример Г.16 Базовая процедура соединения
v1 0 0 0 0 1 1 1 1
v2 0 0 1 1 0 0 1 1
v3 0 1 0 1 0 1 0 1
i=6 0.309608 0.092433 0.090392 0.207567 0.090079 0.108277 0.009921 0.091723
2
1
f* f 0,26 0.15 0.075 0.225 0.13 0.06 0.025 0.075
3
2
1
f*( f* f) 0.312195 0.111628 0.087805 0.188372 0.084211 0.094118 0.015789 0.105882
i=7 0.308036 0.091964 0.091011 0.208989 0.090826 0.109174 0.009761 0.090239
Итеративная процедура соединения i=1 i=2 i=3 i=4 i=5 0.294647 0.302908 0.309934 0.304982 0.307696 0.105353 0.099904 0.096561 0.095018 0.093371 0.095379 0.088024 0.090066 0.092059 0.089834 0.204621 0.210484 0.203439 0.207941 0.209672 0.094444 0.097092 0.089019 0.091490 0.092304 0.105556 0.100096 0.105580 0.108510 0.106629 0.012977 0.011976 0.010981 0.010418 0.010166 0.087023 0.089516 0.094420 0.089582 0.090328
i=8 0.308915 0.091444 0.090314 0.209528 0.091085 0.108556 0.009686 0.090472
i=9 0.309511 0.091148 0.090489 0.208852 0.090388 0.109086 0.009612 0.090914
i= 10 0.309002 0,090998 0.090688 0.209312 0.090626 0.109374 0.009561 0.090439
i = 11 0.309289 0.090829 0.090462 0.209486 0.090711 0.109171 0.009538 0.090514
i= 12 0.309481 0.090734 0.090519 0.209266 0.090486 0.109343 0.009514 0.090657
i= 13 0.309315 0.090685 0.090584 0.209416 0.090563 0.109*37 0.009498 0.090502
i = 14 i = 15 i = 16 i = 17 i = 18 i = 19 i= 20 i = 21 0.309409 0.309472 0.309417 0.309448 0.309469 0.309451 0.309461 0.309468 0.090630 0.090599 0.090583 0.090565 0.090555 0.090549 0.090543 0.090540 0.090510 0.090528 0.090550 0.090525 0.090531 0.090538 0.090530 0.090532 0.209473 0.209401 0.209450 0.209469 0.209445 0.209462 0.209468 0.2C9460 0.090591 0.090518 0.090543 0.090552 0.090528 0.090536 0.090539 0.090531 0.109370 0.109427 0.109457 0.109435 0.109454 0.109464 0.109457 0.109463 0.009490 0.009482 0.009477 0.009476 0.009472 0.009470 0.009470 O.Q0946 0.090527 0.090573 0.090523 0.090531 0,090546 0.090530 0.090532 0.090537 Результаты проверки на сходимость — шаг 4—алгоритм процедуры соединения— приведены в таблице Г.11. Отсюда, если ∆>0.15067, то выполнение процедуры завершится при i=3; если ∆>0.004128, то выполнение
271
завершится при i = 6 и так далее. Так как ∆=0.00002, то процедура завершится при i = 21. Таблица Г.11. Проверка на сходимость — шаг 4 итеративной процедуры соединения из примера Г.16 | f i ( c ) − f i −q |,i = 0(mod q ) ————————————————————————————————— v1 v2 v3 i = 3 i=6 i=9 i = 12 i = 15 i = 18 i = 21 0 0 0 0.002261 0.000326 0.000097 0.000030 0.000009 0.000003 0.000001 0 0 1 0.015067 0.004128 0.001285 0.000414 0.000135 0.000044 0.000015 0 1 0 0,002261 0.000326 0.000097 0.000030 0.000009 0.000003 0.000001 0 1 1 0.015067 0.004128 0.001285 0.000414 0.000135 0.000044 0.000015 1 0 0 0.004808 0.001060 0.000309 0.000098 0.000032 0.000010 0.000003 1 0 1 0.011462 0.002697 0.000809 0.000257 0.000084 0.000027 0.000009 1 1 0 0.004808 0.001060 0.000309 0.000098 0.000032 0.00001 0.000003 1 1 1 0.011462 0.002697 0.000809 0.000257 0.000084 0.000027 0.000009 Г.7 Задача реконструкции
Разбиение воспринимаемого мира на части удобно и, возможно, необходимо, но неизвестно точно, как, оно должно быть сделано. Г. Бейтсон
Задача реконструкции может быть сформулирована следующим образом: дана система с поведением, рассматриваемая как обобщенная система; требуется определить, какие наборы ее подсистем, а каждый такой набор рассматривается как гипотетическая реконструкция, подходят для реконструкции заданной системы с заданной точностью, причем реконструкция должна производиться только по той информации, что содержится в этих подсистемах. Укажем, прежде всего, на то, что согласно такой формулировке задачи понятие «реконструкция» становится более конкретным: при реконструкции используется вся информация, полученная из подсистем, но только она. Это означает, что требуется, чтобы реконструкция была несмещенной в том смысле, как это определилось в разделе Г.6, и, следовательно, можно использовать для ее получения соответствующую процедуру соединения. В задаче идентификации несмещенная реконструкция представляет собой хорошо обоснованную гипотезу (оценку) относительно неизвестной обобщенной системы причем гипотеза эта строится по заданной структурированной системе. Поскольку истинная обобщенная система неизвестна, то невозможно определить, насколько близка к ней эта гипотетическая система В задаче реконструкции несмещенная реконструкция описывает реконструктивные возможности рассматриваемой гипотезы относительно заданной 272
обобщенной системы. Чем ближе несмещенная реконструкция к истинной (заданной) системе, тем лучше гипотеза. В общем случае близость двух сопоставимых систем с поведением может быть выражена через метрическое расстояние между их функциями поведения. Существует много разных типов метрических расстояний. Так, например, класс расстояний Минковского определяется следующей формулой: δ p ( f , f h ) = [ ∑ | f ( c ) − f h ( c ) |1 / p , (Г.39) h
c∈C
где f, f - соответственно функция поведения заданной системы и несмещенная реконструкция по гипотезе h, a p ∈ N - параметр функций расстояния. При р = 1- это расстояние Хэмминга, при p = 2 - Евклида, при р = ∞ - верхняя граница расстояний. Расстояния по Минковскому вычисляют по точечным разностям | f ( c ) − f h( c )| распределение вероятностей или возможностей в соответствии с формулой (Г.39) . Несмотря на то, что поточечное описание близости f и f h полезно для многих приложений, теоретически оно недостаточно хорошо обосновано. Более обосновано рассматривать близость как разности информации, содержащейся в h относительно f, или, другими словами, как потерю информации при замене f на h (на множество проекций f ). Меру подобной потери информации будем называть информационным расстоянием и обозначать D(f, f h)- Для вероятностных систем она задается хорошо известной формулой 1 f(c) D( f , f h ) = f ( c ) log 2 h , (Г.40) ∑ f (c) log 2 | C | c∈C где константа l/log2|C| — нормирующий коэффициент, обеспечивающий выполнение соотношения 0 ≤ D(f, f h) ≤ 1. Поскольку, если f h(с) = 0, то f(с) = 0, вероятностное информационное расстояние определено всегда. Это, однако, не метрическое расстояние, так как оно асимметрично, более того, D(f h, f) может быть не определено для некоторых f и f h [когда f h(с) > 0 и f (c) = 0 для некоторого с ∈ С]. При применении вероятностного расстояния к порождающей системе с поведением уравнение (Г.40) приобретает следующий вид: 1 f(g|g ) DG ( f , f h ) = f ( g )∑ f ( g | g ) log h . (Г.41) ∑ log 2 | G | g∈G f (g|g) g∈G Модификация уравнений (Г.40) и (Г.41) для направленных систем с поведением очевидна. Для возможностных систем информационное расстояние рассчитывается по формуле 1 1 | c( f h ,l ) h D( f , f ) = (Г.42) ∫ log 2 c( f ,l ) , log 2 | C | 0 273
представляющей собой аналог вероятностного информационного расстояния (Г.40) для U - нечеткости. Далее в этом разделе, после соответствующего описания свойств реконструктивных гипотез, будет описано применение информационных расстояний для сравнения этих гипотез. Реконструктивная гипотеза для заданной обобщенной системы с поведением представляет собой набор ее подсистем. Если обобщенная система состоит из n переменных, то число ее подсистем, содержащих по крайней мере одну переменную равно 2n - 1, а общее число наборов таких подсистем, содержащих не менее одной подсистемы, равно 2 2 −1 − 1. С ростом n это число| растет очень быстро. Однако без потери общности его можно существенно уменьшить, если рассматривать только неизбыточные; наборы подсистем (смотри раздел Г.3). Для многих системных исследований очень перспективным является другой способ сокращения числа реконструктивных гипотез. Он состоит в исключении наборов подсистем, не содержащих всех переменных обобщенной системы. Это требование, обычно называемое условием покрытия, формально выглядит так: ∪k S = S , n
k
k
где S — множество переменных из подсистем реконструктивной гипотезы, а S – множество переменных обобщенной системы. Это условие объясняется прежде всего необходимостью использовать в реконструктивной гипотезе информацию обо всех переменных обобщенной системы для того, чтобы реконструкция была логически возможна. Поскольку вопрос о включении или исключении выборочных переменных из обобщенной системы решается в результате анализа маски (смотри раздел В.6), выполнение условия покрытия общности не нарушает. Далее под реконструктивной гипотезой будут пониматься только такие наборы подсистем заданной обобщенной системы, которые удовлетворяют и требованию неизбыточности, и условию покрытия. Таким образом, реконструктивная гипотеза — это структурированная система с поведением, сравнимая с обобщенной системой с поведением. Однако иногда бывает нужно работать со всеми наборами подсистем, которые удовлетворяют только требованию неизбыточности. Будем такие наборы подсистем называть обобщенными реконструктивными гипотезами. Понятно, что для данной обобщенной системы с поведением множество ее реконструктивных гипотез является подмножеством множества ее обобщенных реконструктивных гипотез. Любая реконструктивная гипотеза (равно как и любая обобщенная реконструктивная гипотеза) полностью описывается: 1) семейством подмножеств входящих в нее переменных, 2) функциями поведения, соответствующими отдельным подмножествам переменных.
274
Если опустить свойство 2, то свойство 1 определяет класс инвариантности реконструктивных гипотез, отличающихся друг от друга только функциями поведения их элементов. Этот класс инвариантности для того, чтобы отличать его от отдельных реконструктивных гипотез класса, будем называть структурой. Напомним, что каждая отдельная реконструктивная гипотеза представляет собой конкретную структурированную систему. Таким образом, структура - это свойство структурированной системы, инвариантное относительно изменения функций Для поведения данного множества ее элементов. переменных, скажем множества S, множество структур, представляющих все реконструктивные гипотезы любой обобщенной системы, определенной на S, состоит из семейств подмножеств S, удовлетворяющих условиям неизбыточности и покрытия. Будем для удобства представлять все множества переменных одной мощности, скажем мощности n, общим множеством структур, скажем множеством Gn, определенным на множестве Nn положительных целых чисел. Формально для любого n ∈ N Gn = {Gi/Gi ⊂ P( N n ),Gi удовлетворяет условиям неизбыточности и покрытия}. В этом формальном определении через Gi обозначены элементы Gn, являющиеся наиболее общими структурами, рассматриваемыми при решении задачи реконструкции (некие специальные типы этих структур будут введены ниже); индекс i идентифицирует структуры из Gn и обычно i ∈ N|G | . Множество Gn тривиально интерпретируется на языке любого множества переменных S, такого, что |S| = n, заданием взаимно однозначного отображения переменных из S на целые из Nn. Будем для удобства структуры из множеств Gn называть G-структурами. Из некоторых соображений удобно расширить множество Gn до множества G+n всех обобщенных реконструктивных гипотез. Формально для любого n ∈ N G+n={Gi|Gi ⊂ P( N n ),Gi удовлетворяет условию неизбыточности}. Несмотря на то, что далее в этой главе основное внимание будет уделяться множествам Gn, все результаты относительно Gn могут быть легко обобщены и на множества G+n. Если множество Gn для некоторого определенного п получает конкретную интерпретацию в контексте некой обобщенной системы с поведением с п переменными, то структуры в Gn представляют собой однозначные представления реконструктивных гипотез, связанных с этой обобщенной системой. Это непосредственно следует из того факта, что функции поведения, соответствующие любым подмножествам переменных, определяются однозначно как соответствующие проекции обобщенной функции поведения. Следовательно, реконструктивные гипотезы могут изучаться в виде абстрактных структур. Данная структура из Gn становится конкретной реконструктивной гипотезой, когда интерпретируется в контексте сравнимой с ней определенной обобщенной системы с поведением (то есть системы с п переменными). n
275
Основным вопросом задачи реконструкции является разработка эффективных вычислительных процедур, допускающих представление, оценку и сравнение реконструктивных гипотез, представленных всеми структурами для данного множества переменных. Это очень непростая задача, поскольку, как будет показано ниже в этом разделе, число структур растет очень быстро. Для успешного решения этой задачи необходимо использовать соответствующее упорядочение и классификацию структур. Определим сначала естественное упорядочение структур, называемое уточняющим упорядочением. Пусть даны две структуры Gi, Gj ∈ &n Будем называть Gi уточнением Gj (и, соответственно, Gj укрупнением Gi) тогда и только тогда, когда для любого x ∈ Gi существует y ∈ G j , такое, что x ⊆ y ; пусть Gi ≤ Gj означает, что Gi это уточнение Gj. Рассмотрим две структуры Gi, Gj ∈ &n , такие, что Gi ≤ Gj. Тогда Gi называется непосредственным уточнением Gj (a Gj — непосредственным укрупнением Gi ) тогда и только тогда, когда не существует Gk ∈ &n , такого что Gi∈ &n и Gk ≤ Gj. Для заданной структуры Gi∈ Gn структурное соседство определяется как множество всех непосредственных уточнений и непосредственных укрупнений Gi в &п. Легко видеть, что отношение уточнения определяет частичное упорядочение. Более того, пара ( &п ≤ ) определяет решетку, что подтверждают следующие факты: 1) существует универсальная верхняя граница — множество (Nn}; 2) существует универсальная нижняя граница - множество {{x}| x ∈ N n }; 3) для любой пары Gi, Gj ∈ &n наибольшим общим уточнением является неизбыточный эквивалент множества { x ∩ y | x ∈ Gi , y ∈ G j }; 4) для любой пары Gi, Gj ∈ &n наименьшим общим укрупнением является неизбыточный эквивалент множества Gi ∩ G j . Будем называть эти решетки решетками уточнения G-структур). (по одной для каждого n ∈ N ). Отметим, что уточняющее упорядочение применимо и к множествам G+n, что дает решетки (&+п,≤ ). Понятно, что решетка уточнения или некая нужная ее часть может быть получена с помощью неоднократного выполнения процедуры, порождающей все непосредственные уточнения для любой структуры из решетки. Одна такая процедура определяется следующим образом. Уточняющая процедура для G-структур (или RG-процедура). Заданы Gструктуры Gi ={kS |k ∈ Nq} ∈ &n. Для определения всех их непосредственных уточнений 1) положить k = 0; 2) если k
Обратите внимание на то, что условие |kS| ≥ 2 из шага 3 обеспечивает то, что порождаемые структуры будут удовлетворять условию покрытия; замена этого условия на условие |kS| ≥ l позволяет работать с множествами &+п обобщенных реконструктивных гипотез. Шаг 4 обеспечивает выполнение условия неизбыточности. Тот факт, что наименьшее возможное изменение делается на шаге 3, т. е. только один элемент Gi изменяется на непосредственно следующие меньшие элементы (подмножества), обспечивает то, что порождаемые структуры являются непосредственными уточнениями Gi. Пример Г.17. Дано G i = { 1 S= {1, 2, 3}, 2 S={2, 3, 4}, 3 S={ 1 , 4 } } . Сразу видно, что для всех k ∈ N 3|k S |≥ 2 , и, следовательно, RG -процедуры применимы к любому элементу. Таким образом, имеются три непосредственных уточнения G i . Множество 1S заменяется на множества {1, 2}, {1, 3}, {2, 3}, однако третье множество является подмножеством и будет исключено на шаге 4; это даст следующее непосредственное уточнение: {{1, 2}, {1, 3}, {2, 3, 4}, {1, 4}}.
Аналогичная замена 2S дает второе непосредственное уточнение: {{ 1, 2, 3}, {2, 4}, {3, 4}, {1, 4}}. Наконец, множество 3S заменяется на множества {1} и {4}, которые являются избыточными и будут исключены на шаге 4; отсюда имеем третье непосредственное уточнение: {{1, 2, 3}, {2, 3, 4}}. Для сокращения вычислительной сложности порождения реконструктивных гипотез полезно разбить решетки уточнения на подходящие классы эквивалентности по уровню вычислений. Тогда эти классы эквивалентности могут быть представлены соответствующими каноническими структурами, а уточняющие процедуры разработаны для этих канонических представлений разных уровней вычислительной сложности. Чтобы продемонстрировать этот подход, предположим, что описаны только два уровня вычислений, называемые локальным и глобальным. Локальный уровень вычислений представлен уже описанной RGпроцедурой. Для определения глобального уровня вычислений определим функции rn : Gn → Rn , n ∈ N , где R - множество симметричных и рефлексивных бинарных отношений, определенных на множестве Nn (они также называются отношениями сравнения, отношениями толерантности или неориентированными графами с циклами), a rn(Gi) — бинарное отношение, выполняемое для целых а и b (a, b ∈ N n ) тогда и только тогда, когда и а, и b принадлежат по крайней мере одному из подмножеств Nn, входящих в Gi. Формально rn ( Gi ) = {( a ,b ) | ( ∃x ∈ Gi )( a ∈ x и b ∈ x )} . 277
Будем элементы Rn называть графами. Однако мы должны помнить, что эти графы не ориентированы (симметричность) и содержат циклы (рефлексивность). Некоторые примеры функций классов r4 и r5 показаны на рисунке Г.15. При изображении этих графов опущены тривиальные циклы в узлах.
G1
G2
r4(G1)=r4(G2)
Рисунок Г.15. Примеры функции rп Понятно, что функции rп сюръективны, а при n ≥ 3 прообразы могут состоять из более чем одного элемента. Поэтому они индуцируют следующее отношение эквивалентности на соответствующих множествах Gn Gr
структур: Gi ≡ Gj тогда и только тогда, когда Gt, Gj ∈ Gn и rn(Gi) = r n(Gj) для некоторого n ∈ N . Если Gi = Gj, то мы говорим, что структуры Gi и Gj r-эквивалентны. Для обозначения классов эквивалентности, индуцируемых rп на &п , будем использовать стандартную запись &п/rп . Для любого n ∈ N n множество Rп и отношение подмножества (или, иначе, операции объединения и пересечения множеств) определяют булеву решетку. Очевидное взаимнооднозначное соответствие между &п/rп и Rп индуцирует изоморфную булеву решетку на множестве Gn/rn. Этот изоморфизм позволяет нам порождать классы эквивалентности на &п/rп с помощью соответствующих операций на графах из Rп. При этом, однако, желательно, чтобы любой класс эквивалентности из &п/rп был представлен некоей канонической структурой. С этой целью введем для любого n ∈ N следующие подмножества &n: &п , в которое входят те G-структуры Gi из множества &п, которые состоят из максимально сочетаемых классов, соответствующих графу rn(Gi) или, но в другой терминологии, основанных на кликах этого графа. Подобные структуры называются также полными покрытиями rn(Gi). Будем обозначать структуры Ci из Gn и называть С-структурами. Примерами С-структур являются структуры G1 и G2, изображенные на рисунке Г.15. Pn, в которое входят те G-структуры из &n, элементы которых состоят из пар, связанных на графе rn(Gi) узлов (обозначаемых целыми числами), или являются отдельными изолированными узлами. Будем структуры из множества &n называть Р-структурами и обозначать через Pk. Примером Р-структуры является структура G4 на рисунке Г.15. Из этих определений и из того факта, что множество всех максимально сочетаемых классов для любого неориентированного графа единственно, следует, что любой класс эквивалентности из &п/rп содержит в точности одну 278
С-структуру из &п и одну Р-структуру из Pп. Таким образом, С- и Рструктуры могут рассматриваться как два канонических представления классов r-эквивалентности G-структур. Каждый класс r-эквивалентности, представленный графом, описывается двумя каноническими структурами - наименее уточненной С-структурой и наиболее уточненной Р-структурой. Взаимно однозначное соответствие между Rп и Gп (или Pп) индуцирует булеву решетку на Gп (или на Pn), изоморфную естественной булевой решетке, определенной на Pn. Например, на рисунке Г.16 показаны решетка (& 3 ,≤) и взаимно изоморфные булевы решетки, определенные на R3, G3, P3 и &3/r3.
Рисунок Г.16 – Решетка (&3,≤) и булевы решетки, определенные на R3, G3, P3, &3/r3 Для описания больших решеток полезно определить отношение эквивалентности
279
i
≡ на множествах &n следующим образом:
G1=C1
G2=P1
&3
&3/i
G1
G1
G2
G2
G3 C2
G3
P2
G4
G4 C3
G3
G5 G6
P3
G7 G5
G4
G8
C4
а)
P4
G9
G5
б) Рисунок Г.17 – Решетка (&3, ≤ ) и гомоморфное отображение &3→&3/i i
Gi ≡ G j тогда и только тогда, когда Gi, Gj ∈ &n и Gi, Gj изоморфны (то есть когда одна структура может быть получена из другой только перестановкой целых чисел из Nn, напоминаем, что каждое целое число соответствует i
узлу). Будем ≡ называть i - эквивалентностью и обозначать через &n/i множество классов эквивалентности изоморфных структур (или перестановочных классов эквивалентности), определенных на &п. Пример, демонстрирующий смысл i-эквивалентности, приведен на рисунке Г.17, где обозначенные полужирным шрифтом Gk (k ∈ N 5 ) показы вают классы эквивален тности в & 3 / i . Н а рисунке Г.17,а показана решетка (& 3/i, ≤). Это та же самая решетка, что и на рисунке Г.16, но упрощенная, так как на ней не различаются изоморфные структуры. Сделано это за счет удаления меток входов в блоки на схеме и включения только одной схемы для каждого перестановочно эквивалентного класса. Структуры в каждом классе легко определяются перестановкой целых 1, 2, 3 для входов в блоки. Упрощенная решетка на рисунке Г.17,в является гомоморфным образом решетки, изображенной на рисунке Г.16. Гомоморфное отображение, являющееся основой данного упрощения, показано на рисунке Г.17д 280
На рисунке Г.18 показана более сложная решетка (&4/i, ≤ ). Перестановочные классы эквивалентности G-структур снова выделены жирным шрифтом, равно как С-структуры и Р-структуры, сгруппированные по классам rэквивалентности. Каждому такому классу соответствует граф ρ k и две канонические структуры Ck и Pk (k ∈ N11). Для того чтобы более ярко продемонстрировать общие свойства этой решетки, на рисунке Г.19 перестановочные классы С-структур обозначены только их идентификаторами и выделены классы r-эквивалентности
Рисунок Г.18. Решетка с указанием классов r-эквивалентности и канонических G- и Р-структур 281
Рисунок Г.19 – Упрощенная схема реРисунок Г.20 – Решетка (&4/i, ≤ ) шетки (& 4 / i , ≤), полностью показанной на рисунке Г.18 На рисунке Г.20 изображена решетка (&4/i, ≤), являющаяся подрешеткой (G4/i, ≤). Число около каждой схемы указывает на число различных Сструктур, входящих в перестановочный класс эквивалентности, показанный на этой схеме; числа, помещенные около дуг, указывают на число непосредственных уточнений С-структуры из данного перестановочного класса эквивалентности в другой класс. Как уже объяснялось выше, эта решетка изоморфна решеткам, определенным на R4/i, P4/i и (&4/i). В то время как полные решетки (&n, ≤) представляют основу для локального уровня вычислений в задаче реконструкции, решетки (&n, ≤) и их изоморфизмы являются основой для глобальных вычислений. Для работы на глобальном уровне вычислений необходима процедура, порождающая для любой заданной С-структуры Ck∈ &n (n∈ N) все непосредственные уточнения в решетке (&n, ≤). Ниже приводится одна такая процедура, использующая представление С-структур в виде графов.
282
Уточняющая процедура для С-структур (или КС-процедура). Дана Сструктура Ск ∈ &п и соответствующий граф rn(Ck). Нужно определить все непосредственные уточнения на множестве. 1) исключить одно ребро из графа rn(Ck), скажем ребро (a, b); 2) разделить каждый элемент х из Сk, который содержит а и b на два элемента ха = х - {b} и xb = x - {а} и заменить х из Ck на xа и xb; 3) исключить все избыточные ха и xb, полученные на шаге 2 и записать полученный результат в качестве непосредственного уточнения Ck в решетке (&п,≤); 4) выполнить шаги 1—3 для всех ребер графа rn(Ck) и остановиться. Данная процедура имеет следующие обоснования: 1) имеется взаимно однозначное соответствие между множествами Rп и &п и, следовательно, любое изменение графа приводит к изменению соответствующей С-структуры; 2) чем меньше число ребер графа, тем более уточненной является соответствующая С-структура; 3) поскольку никакой из циклов в вершинах нельзя исключить без нарушения .условия покрытия соответствующей С-структуры, то наименьшим допустимым сокращением графа является исключение одного из ребер. Таким образом, число ребер в графе определяет число непосредственных уточнений соответствующей С-структуры. Пример Г.18. Рассмотрим граф ρ 1 и соответствующую С-структуру Ci (рисунок Г.21,а). Этот граф имеет шесть ребер и, следовательно, шесть непосредственных уточнений этой С-структуры. Они изображены на рисунке Г.21,б. Например, уточнение получается с помощью RС-процедуры следующим образом: 1) из графа ρ 1 исключается ребро (Г,5) и получается граф ρ7 ; 2) элемент (2, 4, 5} из C1 (единственный элемент С1 содержащий и 4 и 5) разбивается на элементы (2, 5} и {2, 4}; 3) поскольку элемент {2, 4} является единственным избыточным элементом ({2, 4} ⊂ {2, 3, 4}), он исключается, а полученный результат С 7 ={{1, 2}, {2, 5}, (2, 3, 4}} записывается как непосредственное уточнение С1. Так как элементы Р-структур представляют собой просто ребра соответствующих графов, то процедура уточнения Р-структур (или RРпроцедура) совершенно тривиальна. Она состоит в исключении отдельных ребер из заданного графа [смотри шаг 1 RС-процедуры] и интерпретации результатов как Р-структур. Полезны также процедуры, с помощью которых получаются все непосредственные укрупнения для множеств G-, С- и Р-структур. Они нужны для определения полного структурного соседства заданной структуры. Формулирование этих процедур мы предоставляем читателю в качестве упражнения (смотри также рисунок Г.10). Примеры такого соседства для трех этих типов структур приведены на рисунках Г.22 - Г.2Г. В этих примерах структуры обозначены соответственно как G, С и Р. Их непосредственные уточнения помечены нижними индексами, а непосредственные укрупнения - верхними. На рисунке Г.22 показано, что в структурное соседство данной G-структуры могут входить G-структуры, входящие в другой класс r-эквивалентности (на рисунке Г.22 это структура G3). Чтобы непосредственные уточнения принад283
лежали тому же классу r-эквивалентности, можно слегка модифицировать RG-npoцедуру, заменив условие | k S|≥ 2 на шаге 3 условием | k S |>2. При
С2
ρ2
ρ4
ρ3
C4
ρ5
ρ6
C6
ρ6
C6
Рисунок Г.21. Пояснение к RС-процедуре: а — заданный граф и соответствующая С-структура; б — непосредственные уточнения C1
284
Рисунок Г.22. Структурное соседство G-структуры G этом запрещается изменять элементы, содержащие только две вершины, и, следовательно, граф данной r-структуры остается неизменным. Представление о непосредственных уточнениях (или укрупнениях) структур различных типов можно использовать для разбиения соответствующего множества структур на блоки структур, эквивалентных в смысле уровня уточнения, т. е. таких структур, которые достигаются от универсальной верхней границы {Nn} соответствующей решетки уточнения за одинаковое число шагов уточнения. Будем называть эту эквивалентность эквивалентноi
стью уровня уточнения и обозначать ≡ . Так, например, структуры G1, G2, G3 на рисунке Г.22 - l-эквивалентные G-структуры из множества &4; структуры, показанные на рисунке Г.21,б, - l-эквивалентные С-структуры из множества G5; структуры Р1.P2 , Р 3 , P 4 на рисунке Г.24 являются l -эквивалентными Р-структурами из множества &Г. Для того чтобы можно было составить представление о скорости роста числа структур этих трех типов с ростом п, а также числа их классов i- и lэквивалентности, в таблице Г.12 приведены соответствующие данные для п ≤ 7. Понятно, что | &n |=| Pn |=| Rn |,| Rn |= 2 n( n−1 ) / 2 , 285
Рисуноу Г.23 - Структурное соседство С-структуры С
Рисунок Г.24 - Структурное соседство Р-структуры Р
286
Таблица Г.12 - Число G-структур в & n + и & n , С-структур и их классов i-эквивалентности и классов l-эквивалентности для n ≤ 7 1 2 3 4 5 6 7 n + |Gn | 1 4 18 166 7,579 7,828,352 2,414,682,040,996 1 |Gn| 2 9 114 6,894 7,785,062 2,414,627,396,434 1 |&n| 2 8 64 1,024 32,768 2,097,152 + |Gn /i| 1 3 8 28 208 |Gn/i | 1 2 5 20 180 |&n/i | 1 2 4 П 34 156 1,044 + |Gn /l| 1 3 7 15 31 63 127 |Gn/l | 1 2 5 12 27 58 121 |&n/l | 1 2 4 7 11 16 22 где показатель п(п — 1)/2 — общее число возможных ребер в графе, определенном на Nn. Ясно также, что |Gп/1|=п(п—1)/2+1. Вычисление |R n /i | для заданного более сложно, но эта задача уже решена в теории графов (смотри раздел Г.11). Приведенные в таблице Г.12 значения | G + n |, | G + n /i | , | G + n / l |, | G п |, | G n /i | и | G n /l | известны только для п≤7. Введем упоминавшиеся уже структуры еще одного типа. Это такие структуры, для которых при работе с вероятностными системами для определения несмещенной реконструкции не нужна итеративная процедура соединения. Обычно их называют ациклическими структурами. Для решения задачи реконструкции наибольший интерес представляют ациклические структуры особого типа, которые можно было бы назвать строго ациклическими структурами или L-структурами. G-структура G i ∈ G n является L -структурой тогда и только тогда, когда не существует такой пары ( а , b ) ∈ N 2 n , что она входит в некий элемент Gi и связана через несколько соединенных элементов. Будем множество L-структур для некоего п обозначать L n . Определим множество L п формально. Пусть дана G-структура G i ∈ & n . Для любой пары ( a , b) ∈ N 2 n пусть X a,b ={x | x ∈ G i , { а , b ⊂ х}. Тогда Gi является L-структурой (Gi ∈ Ln) тогда и только тогда, когда не существует пары (a, b)∈ N2n, являющейся элементом транзитивного замыкания rn(Gi - Ха,b ). Очевидно, например, что все структуры из множества G 3 (рисунок Г.16), за исключением структуры G 2 ={{1, 2}, {2, 3}, (3, 1}}, являются L-структурами. В множестве G4 только три структуры не являются L-структурами. Они принадлежат к одному и тому же классу i-эквивалентности, который можно, например, представить С-структурой С={{1, 2}, {2, 3}, {3, 4}, {4, 1}}. В самом деле, транзитивное замыкание r4(С - X1,2)- это N4, и, следовательно, пара (1, 2) является ее элементом. 287
L-структуры отличаются тем, что для них не нужно использовать итеративную процедуру соединения независимо от порядка, в котором объединяются элементы рассматриваемой L-структуры. Ациклические структуры, не являющиеся L-структурами, этим замечательным свойством не обладают. Для таких структур, чтобы избежать применения итеративной процедуры соединения, нужно применять базовую процедуру соединения к элементам, расположенным в определенном порядке. Определение таких порядков требует сложных вычислений и проверок, так что методологическое значение таких структур существенно уступает значению L-структур. С помощью различных понятий, введенных в этом разделе, можно более конкретно сформулировать задачу реконструкции. Дана обобщенная система и множество заданных пользователем реконструктивных гипотез (базирующихся на множестве Gп, &п, Pп или L - cтpyктyp). Решение задачи реконструкции сводится к выбору подмножества данного множества в соответствии с некоторыми требованиями. Обычно требуется, чтобы: 1) расстояния, соответствующие выбранным гипотезам, были как можно меньше и 2) сами гипотезы были, возможно, более уточненными. Оба эти требования предполагают упорядочение множества реконструктивных гипотез. Упорядочение в соответствии с требованием 2 фиксировано - это частичное упорядочение по структурному уточнению с решеткой, свойства которой описаны выше. Упорядочение согласно требованию 1 - его можно назвать упорядочением по расстоянию — не фиксировано. Оно зависит от данной обобщенной системы и выбранного типа расстояния и определяется только вычислением несмещенных реконструкций и расстояний отдельных реконструктивных гипотез. Если используется расстояние, определяемое по формуле (Г.40) для вероятностных систем [или по формуле (Г.42) для возможностных систем], которое является мерой количества информации, потерянной при замене обобщенной системы реконструктивной гипотезой, то существует определенное предупорядочение по расстоянию: информационное расстояние монотонно не убывает с увеличением уточнения реконструктивных гипотез. Кроме того, оба варианта информационного расстояния аддитивны для любого пути на используемой решетке уточнения. Это значит, что D (f x, f z) =D (f x, f y) + D (f y, f z) (Г.43) для любых трех реконструктивных гипотез х, у, z одной обобщенной системы, таких, что x ≥ y ≥ z. Свойства предупорядоченности и аддитивности очень полезны при решении задачи реконструкции и придают особую важность информационному расстоянию. В дальнейшем при обсуждении задачи реконструкции всегда будет предполагаться, что используется соответствующая версия информационного расстояния (то есть вероятностная или возможностная, базовая или порождающая). Сочетание упорядочения по расстоянию с упорядочением по уточнению образует объединенное упорядочение для задачи реконструкции. Теперь множество решений задачи реконструкции характеризуется с помощью этого комбинированного упорядочения следующим образом: это множество пред288
ставляет собой такое подмножество реконструктивных гипотез, в которое не входят гипотезы, худшие, чем любая другая гипотеза. Слово «худшие» используется здесь в обычном смысле: гипотеза h1 хуже гипотезы h2 тогда и только тогда, когда или h 1 является менее уточненной и ее расстояние не меньше, чем у h2 или у h1, большее расстояние, чем у h2, и в то же время она не является более уточненной, чем h2. Элементы этого множества решений будем называть подходящими реконструктивными гипотезами. Теперь видно совершенное сходство задачи реконструкции с двумя рассмотренными выше задачами - задачей определения подходящих систем с поведением (раздел В.4 и В.6) и задачей определения подходящих упрощений заданной системы с поведением (раздел В.9). Если упорядочение по нечеткости и упорядочение по сложности из этих задач сопоставить соответственно с упорядочением по расстоянию и упорядочением по уточнению из задачи реконструкции, то сходство этих трех задач станет очевидным. Предоставляем читателю использовать это сходство для формального определения комбинированного упорядочения и множества решений для задачи реконструкции. Структурные Обобщенная ограничения система В X Средстда порождения Процедура порождения реконструктивных гипотез Реконструктидные гипотезы
Средства оценки и критерии
Процедуры оценки реконструктивных гипотез Реконструктивная система и ее характеристики
Вывод Критерии принятия решения
Процедуры принятия решения
Стоп
Продолжение работы с множеством реконструктидных гипотез X
Рисунок Г.25 - Общая схема процесса решения задачи реконструкции Мы видим, что задачи, связанные с подъемом по эпистемологической иерархии систем, а также с упрощением систем, образуют важнейшую категорию задач, имеющих следующие общие черты: ДАНО: множество X рассматриваемых систем; 289
множество отношений порядка МНОЖЕСТВО РЕШЕНИИ: *
a
b
c
≤ ,≤ ,≤ на X.
*
X s = { x ∈ X | ( ∀y ∈ X )( y ≤ x ⇒ x ≤ y )}, *
где ≤ - объединенный порядок предпочтения на X, определенный для всех х, у ∈ Х следующим образом: *
a
x ≤ y тогда и только тогда, когда x ≤ y , a
c
и x ≤ y , и x ≤ y , и ... В процессе решения задачи реконструкции необходимы три набора процедур: 1) процедуры порождения всех нужных реконструктивных гипотез; 2) процедуры оценки и сравнения порожденных реконструктивных гипотез с точки зрения целей задачи реконструкции; 3) процедуры, которые на соответствующих этапах процесса решения задачи принимают решение о том, какие из порожденных реконструктивных гипотез должны быть включены в множество решений, какие использованы для дальнейшего порождения реконструктивных гипотез и должен ли процесс решения продолжаться или закончиться. На рисунке Г.25 показано, каким образом эти три набора процедур объединяются в единый процесс решения. Ядром процесса является порождение всех подходящих реконструктивных гипотез. Удобно это делать, порождая соответствующие структуры, которые затем интерпретируются как реконструктивные гипотезы для заданной обобщенной системы. Интерпретация эта сводится к установлению соответствия между переменными обобщенной системы и целыми числами, которыми идентифицированы узлы структур, а также к вычислению, если нужно, проекций обобщенной функции поведения. Порожденные структуры можно разными способами сократить, что уменьшает время вычислений и их цену, а также, возможно, и по другим соображениям. Например, можно выбрать подмножество соответствующих G-, С- или L-структур или ограничиться рассмотрением только тех уровней уточнения (классов l-эквивалентности), для которых потеря информации не превышает некоторого заданного пользователем значения. Таким образом, процесс порождения реконструктивных гипотез может быть ограничен либо набором рассматриваемых структур, либо ограничениями на способ порождения. Для достижения гибкости в решении задачи реконструкции УРСЗ должен располагать разнообразным набором способов порождения, но этот вопрос находится за пределами проблем, связанных с архитектурой УРСЗ. Это способы порождения соответствующих уточнений (или укрупнений) имеющихся реконструктивных гипотез, примерами чему служат RGпроцедура и RС-процедура (и их укрупняющие аналоги). Как уже говорилось выше, порождение структур также может быть организовано на нескольких уровнях вычислений. Так, например, RС290
процедура может быть использована на глобальном уровне для работы с классами r-эквивалентности G-структур. Модифицированная RG-процедура, в которой на шаге 3 вместо |k S | ≤ 2 используется условие |kS| > 2, которое затем на локальном уровне для порождения непосредственных уточнений некоторых важных классов r-эквивалентности, определенных на глобальном уровне. Часто бывает необходимо породить уточнения или укрупнения нескольких структур одного уровня уточнения. В этих случаях нужно использовать такие процедуры, которые не порождают одинаковых структур. Вход в процедуры для оценки реконструктивных гипотез — второй блок на рисунке Г.25 - состоит из порожденных реконструктивных гипотез и различных способов оценки и критериев, определенных пользователем. К ним относятся определения расстояния (а также другие необходимые характеристики, такие, как коэффициент идентифицируемости, реконструктивная нечеткость или некий уровень доверия) и принцип, на котором основывается реконструкция (несмещенная, минимаксная и так далее). По умолчанию следует использовать такие хорошо теоретически обоснованные понятия, как информационное расстояние и несмещенная реконструкция. Полученные реконструктивные гипотезы нужным образом оцениваются и сравниваются. Если получены интересующие пользователя результаты, особенно относительно множества решений, то они выдаются на печать. Процедуры принятия решений — третий блок на рисунке Г.25 - используют информацию об оценке реконструктивных гипотез и принимают различные решения в соответствии с заданными пользователем критериями. Самые важные - это решение о том, продолжать или завершить процесс решения, и, если процесс продолжается, решение о том, какая из реконструктивных гипотез должна использоваться на следующем шаге (множество X на рисунке Г.25). Проиллюстрируем некоторые вопросы, связанные с задачей реконструкции и рассматриваемые в этом разделе, на нескольких примерах. Пример Г.19. Рассмотрим возможностную систему с поведением, определенную на данных, полученных путем наблюдения за четырьмя переменными, характеризующими работу вычислительного комплекса. Целью является нахождение условий, при которых загрузка ЦП (центрального процессора) оказывается высокой. Наблюдаемые значения переменных представляют загрузку ЦП и трех каналов, скажем каналов Kl, К2 и КЗ. Наблюдение проводилось в течение одного часа типичной рабочей нагрузки комплекса, и загрузка каждого устройства фиксировалась с интервалом в 1 с. Таким образом, было сделано 3600 наблюдений. Если загрузка, наблюдаемая в течение некоторого интервала - в 1 с, была меньше некоторого заданного исследователем порога (определенного на основании предшествующих исследований), то она считается низкой (Н), а если выше этого порога, то высокой (В). 291
Для определения на этих данных системы с поведением исследователь решил использовать возможностную методологию без памяти. Из 16 возможных состояний переменных в действительности наблюдались только 6. Поскольку эти состояния наблюдались примерно с одинаковыми частотами, исследователь решил, что функция поведения должна только отличать далее наблюдаемое и ненаблюдаемое состояния. Таким образом, он объявил, что единственно возможными состояниями являются наблюдаемые ранее состояния. Эти состояния имеют возможность, равную 1, остальные состояния (т. е. которые не наблюдались) — равную 0. Полученная функция поведения f приведена в таблице Г.13. Она дает исследователю понимание важной вещи: при некоторых изменениях в организации работы компьютера загрузка ЦП может поддерживаться по высоким уровням, если три канала загружены одним из следующих способов: K1 К2 КЗ н в н в н н н в в Для подтверждения этой идеи исследователь решил изучить реконструктивные свойства обобщенной функции поведения f. Его интересовали только реконструктивные гипотезы без потери информации. В этом случае переменные оказываются сильно ограниченными (возможны только 6 из 16 состояний переменных). Однако легко определить, что проекции f, соответствующие любой паре из четырех переменных (всего таких пар шесть), совершенно неограничены, то есть любое из четырех состояний, определенных на этой паре переменных, имеет возможность, равную 1. Следовательно, эти переменные попарно независимы, и обобщенная функция поведения не может быть реконструирована только по ее двумерным проекциям. Чтобы определить, может ли f вообще быть реконструирована по каким-либо проекциям, полезно сначала рассмотреть реконструктивные гипотезы, основанные на использовании С-структур. С помощью RС-процедуры мы получаем шесть реконструктивных гипотез на первом уровне уточнения. Их схемы и соответствующие графы изображены на рисунке Г.26,а. Каждая гипотеза помечена номером в левом верхнем углу соответствующей клетки, а ее несмещенные реконструкции f h (h ∈ N 6 ) приведены в таблице Г.13. Гипотезы 1, 4 и 6 в точности реконструируют f и являются перспективными кандидатами на включение в множество решений. Каждая из оставшихся гипотез дает по четыре некорректных состояния обобщенной системы. Они также имеют следующее информационное расстояние, вычисленное по формуле (Г.42): (log210 - log26)/log216 = (3.32 - 2.58)/4 = 0.185. Несмещенные реконструкции вычисляются, разумеется, с помощью возможностного варианта процедуры соединения. Для реконструктивной гипотезы 1 она показана на рисунке Г.27. Связями на диаграмме показаны те состояния отдельных трехмерных проекций, возможности которых равны 1. Ре292
зультатом процедуры соединения, которая выполняется только один раз, являются все четверки из Н и В, которые лежат на путях на диаграмме, ЦП
1 ЦП
К1 К1
К2
К3
2 ЦП
К1
К2
К3
К2
К3 1
D(f, f 2) = 0.185
D(f, f ) = 0
4 а)
К1
ЦП
К1 К2
К2
К3
5 ЦП
К1
К2
К3
ЦП
К3
D(f, f 4) = 0
D(f, f 2) =
б)
Рисунок Г.26 - Рассматриваемые в примере Г.19 реконструктивные гипотезы К2
К3 D( f, f 10 ) = 0.105
соединяющих левые и правые узлы.
293
При изучении трех удачных реконструктивных гипотез, изображенных на рисунке Г.26,а, видно, что все они содержат подсистему, основанную на переменных ЦП, К1 и К2. На рисунке Г.26,а эта подсистема изображена заштрихованным прямоугольником. Таким образом, любая потенциально удачная гипотеза на следующем уровне уточнения должна содержать эту подсистему. Таких гипотез только три (они показаны на рисунке Г.26,б). Как следует из таблицы Г.13, их несмещенные реконструкции равны. Происходит это из-за того, что двумерные проекции не содержат никакой информации. Данная рекон-струкция не являРисунок Г.27 – Иллюстрация к ется безупречной: вместо шести репроцедуре соединения реконстконструируется восемь состояний, а их руктивной гипотезы 1, изображен- расстояния равны 0,105. Это согласно ной на рисунке Г.26 условиям задачи является неприемлемым. Рассматривать укрупнения этих трех удачных реконструктивных гипотез нет необходимости, поскольку они явно хуже: по определению, они являются менее уточненными, а их расстояния не могут быть меньше расстояний успешных гипотез (то есть не могут быть меньше 0). Следует, однако, рассмотреть укрупнения неудачных гипотез 2, 3 и 5 (смотри рисунок Г.26,а). Воспользовавшись рисунком Г.18, на котором изображена соответствующая решетка G-структур, можно установить, что рассматриваемые структуры - это G-структуры, принадлежащие классу изоморфизма GГ.
294
Таблица Г.13 - Возможностные функции поведения для обобщенной системы и некоторых несмещенных реконструкций из примера Г.19 ЦП Н Н Н Н Н Н Н Н в в в в в в в в
К1 Н Н Н Н в в в в Н Н Н Н в в в в
К2 Н Н в в Н Н в в Н Н в в Н Н в в
К3 Н в Н в Н в Н в Н в Н в Н в Н в
f 1 1 0 0 0 0 0 1 0 0 1 1 1 0 0 0
f1=f4=f6 1 1 0 0 0 0 0 1 0 0 1 1 1 0 0 0
f2 1 1 1 1 0 0 0 1 1 1 1 1 1 0 0 А
f3 1 1 0 1 1 0 0 1 1 0 1 1 1 0 0 1
f5 1 0 0 1 0 1 0 1 1 1 1 1 1 0 1 0
f7=f8=f9 1 1 0 0 0 0 1 1 0 0 1 1 1 1 0 0
f10 1 1 0 1 0 0 0 1 1 0 1 1 1 0 0 0
Из каждой подсистемы, изображенной на рисунке Г.26,а, за исключением успешных подсистем, представленных переменными ЦП, К1 и К2 (на рисунке они заштрихованы), выбираются две подсистемы с двумя переменными. Однако мы знаем, что эти пары подсистем являются неподходящими и что подсистемы из двух переменных информации не добавляют. Следовательно, реконструктивные гипотезы из класса изоморфизма G4 могут быть отброшены без вычисления несмещенных реконструкций и расстояний. Остается только рассмотреть реконструктивные гипотезы, основанные на G-структурах из класса изоморфизма G3. Поскольку подсистемы, представленные переменными ЦП, К1 и К2, снова должны быть исключены из рассмотрения, то остается только одна гипотеза. Она показана на рисунке Г.26,а, а ее функция поведения f 10 приведена в таблице Г.13. Мы видим, что и эта гипотеза не подходит: ее расстояние равно 0.105, и, следовательно, она должна быть отвергнута. Поскольку укрупнением успешных реконструктивных гипотез является только гипотеза, основанная на G2, ее также не следует рассматривать. Таким образом, можно" прийти к заключению, что множество решений состоит из изображенных на рисунке Г.26,а реконструктивных гипотез 1, 4 и 6. Данный результат подтверждает предположение пользователя о том, что следует обратить внимание на критическую подсистему, базирующуюся на переменных ЦП, К1 и К2. В соответствии с этим загрузка ЦП может поддерживаться на высоком уровне при любой организации вычислитель295
ного комплекса, при которой не допускается, чтобы загрузка каналов К1 и К2 была одновременно или высокой, или низкой. Пример Г.20. Пример основан на данных по использованию противозачаточных средств до замужества (смотри Г.13). Состояния следующих двоичных переменных были определены на группе из 414 студенток старших курсов университета: v1 - отношение к внебрачным связям (0 - всегда отрицательное, 1 - не всегда отрицательное); v2 - обращение в университетскую клинику для предотвращения беременности (0 - да, 1 - нет); v3 - девственность (0 - да, 1 - нет). Частоты N(c) отдельных состояний и соответствующая вероятностная функция поведения f приведены в таблице Г.14а. Если рассматривать реконструктивные гипотезы, основанные только на С-структурах, то для получения гипотез первого уровня уточнения можно использовать RС-процедуру. Схемы гипотез, их графы и расстояния (полученные в результате выполнения этой процедуры) приведены на рисунке Г.28. С помощью предупорядочения по информационному расстоянию по расстояниям для первого уровня уточнения мы можем, как это показано на рисунке, определить нижние границы расстояний для всех реконструктивных гипотез второго уровня уточнения. Так, например, D6 ≥ 0.0637, поскольку гипотеза 6 является уточнением гипотезы 3 и D3 = 0.0637. По этим
296
Таблица Г.14 - Функции поведения из примера Г.20,а и примера Г.21,б а) 1 2 v1 v2 с=0 0 00 01 01 10 10 11 11
3 v3 0 1 0 1 0 1 0 1
4 5 N(c) f(c) 23 0.056 127 0.307 23 0.056 18 0.043 29 0.070 112 0.270 67 0.162 15 0.036
6 7 s1 s2 с =0 0 00 00 00 01 00 01 01 01 01 00 10 10 10 11 01 11 11 11
б) 8 s3 0 1 2 3 0 3 0 1 2 3 2 1 2 3 3 0 1 2 3
9 s4 0 0 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3
10 f(c) 1/3 2/3 1/3 1/3 1 1/3 2/3 1/3 1 1/3 1/3 1 1/3 2/3 1/3 1/3 2/3 2/3 1/3
нижним границам расстояний сразу определяется, что гипотеза 2 входит в множество решений. Оценивая гипотезу 4, имеющую самую маленькую нижнюю границу среди конкурирующих гипотез второго уровня уточнения, получим, что действительное расстояние D4 = 0.0127. Поскольку оно меньше любой нижней границы для других гипотез и D7 ≥ 0.0637, то гипотеза 4 является членом множества решений. Обратите внимание на то, что мы пришли к этому заключению не прибегая к вычислению ни конкурирующих гипотез, ни ее преемника. Если нас интересует гипотеза 7, то можно вычислить, что D7= 0.0802, и понятно, ее следует включить в множество решений, поскольку она является самой уточненной гипотезой из этой решетки уточнения. Элементы множества решений выделены на рисунке Г.28 заштрихованными прямоугольниками. В данном случае комбинированное отношение упорядочения упорядочивает их полностью. Как видно, переменные v1 (отношение) и v2 (обращения в клинику) больше зависят от переменной v 3 (девственность), чем друг от друга. Особенно сильна связь между v2 и v3. Пример Г.21. На этом примере мы хотим продемонстрировать некоторые проблемы, возникающие при решении задачи реконструкции в тех случаях, 297
когда заданная функция поведения зависит от памяти. Данная система представлена тремя переменными описывающими человека (v1 – производи0 v1
v2
l=0 v3
1
D =0
298
v1 v2 v3
Рисунок Г.28 – Иллюстрация к задаче реконструкции, рассматриваемой в примере Г.20 тельность труда v2 - общее состояние здоровья, v3 - стресс). Параметром является время (полностью упорядоченный параметр). Наблюдения делаются ежедневно в течение определенного периода времени. Ограничения на переменные заданы возможностной функцией поведения, приведенной в таблице Г.14,б. Они определены на множестве состоянии следующих выборочных переменных: s1 ,t = v1,t s2 ,t = v2 ,t , s3 ,t = v3 ,t
s4 ,t = v4 ,t .
Функция поведения получена по данным с помощью метода оценки масок, описанного в разделе В.6. Не вдаваясь в подробности относительно предыдущих этапов исследования, сосредоточим свое внимание на задаче реконструкции данной функции поведения. Пусть стандартная формулировка этой задачи основывается на идеях несмещенной реконструкции и информационного расстояния. Предположим далее, что требуется, чтобы реконструктивные гипотезы основывались только на С-структурах, и что максимальное приемлемое расстояние равно 0.1. Сначала породим и оценим реконструктивные гипотезы, основанные на С-структурах первого уровня уточнения. Они показаны на рисунке Г.29 (гипотезы 1 - 6), причем выборочные переменные Sk представлены их идентификаторами k (k ∈ Nk), а подмножества переменных разделяются косой чертой. Оценка этих гипотез заключается в определении их несмещенных реконструкций (с помощью возможностного варианта процедуры соединения) и вычисления их расстояний [по формуле (Г.42)]. Поскольку гипотеза 4 имеет наименьшее расстояние (D4 = 0) то породим и оценим все ее непосредственные С-уточнения Всего этих уточнений пять, и они помечены номерами 7—11 Наименьшее расстояние в этой группе D10 = 0.021. Из монотонности информационного расстояния следует, что расстояние любой гипотезы на первом уровне уточнения является также нижней границей расстояний для всех ее уточнений. Следовательно, единственной гипотезой первого уровня уточнения, которая потенциально может быть источником уточнений с расстояниями, меньшими или равными 0.021, является гипотеза 5, чье расстояние D 5 = 0.0179. Однако легко видеть, что любое непосредственное уточнение гипотезы 5 является одновременно уточнением какой-то другой гипотезы первого уровня. Отсюда следует, что любое не посредственное уточнение гипотезы 5 либо находится среди гипотез 7 - 11, либо среди гипотез, нижняя граница расстояний которых больше 0.021. Следовательно лучшей на втором уровне является гипотеза 10. Ее непосредственными уточнениями являются гипотезы 12—15, среди которых гипотеза 13 имеет наименьшее расстояние. Для того чтобы убедиться, что гипотеза 13 является лучшей на третьем уровне, необходимо оценить все остальные гипотезы этого уровня, 299
за исключением уточняющих гипотез 1, 3, 7 и 8, нижние границы которых превышают D13. Поскольку гипотеза 7 является уточнением гипотезы 1, ею 1
2
123/234 D = 0.0774 1
7
123/134 D2=0.058
3 123/124 D3= 0.0952
4
5
124/234 124/234 5 4 D =0 D = 0.0179
6 124/134 D6= 0.0449
8
234/13 D7=0.086
9 10 11 134/23 14/24/13/23 234/14 134/24 l=2 D8= 0.0681 D9=0.122 D10 =0.021 D11=0.0477
12
13
14
14/24/34
D12=0.1626
D13= 0.06 5
D 1 4 =0.1354 D15=0.0887
D16= 0.1 188
17
18
19
l=4
12/23/4
12/24/3
14/34/23
16
234/1
12/13/4
14/24/23
15
20
12/14/34
l=3
13/34/2
D17= 0.2381 D18= 0.1 7 43 D19= 0.2056 D20= 0.23 81
Рисунок Г.29. Реконструктивные гипотезы, оцениваемые в примере Г.21 можно пренебречь. Графы гипотез 1, 3 и 8 приведены на рисунке Г.30,а. Графы гипотез, не являющихся их уточнением на третьем уровне, должны содержать ребра (1, 4), (3, 4), а также либо ребро (1, 2), либо ребро (2, 4). Имеется всего два таких графа. Они приведены на рисунке Г.30,б.
18
Рисунок Г.30 - Графы некоторых реконструктивных гипотез, рассматриваемые в примере Г.21
Первый на самом деле является графом гипотезы 13, второй представляет гипотезу 12/14/34, являющуюся единственным потенциальным конкурентом гипотезы 13.
300
Оценив этого потенциального конкурента (на рисунке Г.29 он помечен номером 16), мы получим, что D16 ≠ 0.1188 > D13. Следовательно, гипотеза 13 является лучшей на третьем уровне уточнения. Поскольку наименьшее расстояние на третьем уровне (D13 = 0.065) меньше, чем наибольшее допустимое расстояние, необходимо исследовать 4-й уровень. На этом уровне 15 гипотез (представленных всеми парами ребер на графе из четырех узлов), но только четыре из них не являются уточнениями гипотез 9, 12, 14 и 16, расстояния которых превышают критическое значение 0.1. Это гипотезы 12/13/4, 12/23/4, 12/24/3 и 13/34/2. Их номера и расстояния приведены на рисунке Г.29. Поскольку все эти расстояния превышают 0.1, никакая из этих гипотез не входит в множество решений, и дальнейшие уточнения не нужны. Множество решений полностью упорядочено и состоит из гипотез 4, 10 и 13 (а также, возможно, гипотезы 0 — обобщенной системой 1234).
301
Обратите внимание на то, что, Dl используя предупорядочение по ин- 0.5 формационному расстоянию, нам 0.4 Максимально удалось решить эту задачу (причем 0.3 допустимое 0.2 расстояние совершенно точно), оценив только 20 0.1 из 63 возможных реконструктивных 0 гипотез, то есть только одну треть 0 1 2 3 4 5 6 l всех гипотез. Для систем с большим Множество решений числом переменных применение преРисунок Г.31 – Зависимость минидупорядочения по информационному мального расстояния Dl от уровня расстоянию еще более эффективно. уточнения l (пример Г.21) Вообще говоря, чем больше отличаются (по расстоянию) оцениваемые реконструктивные гипотезы на отдельных уровнях уточнения, тем эффективнее использование этого предупорядочения. Часто бывает полезно посмотреть на приращения минимального расстояния, соответствующие соседним уровням уточнения. Для этого определяется расстояние для наиболее уточненной гипотезы и вычисляется среднее приращение расстояния, равное этому наибольшему расстоянию, деленному на общее число уровней уточнения. В данном примере расстояние для наиболее уточненной гипотезы 1/2/3/4 равно 0.4591, следовательно, среднее приращение расстояния равно 0.4591/6=0.0765. Экстраполируя по известным значениям расстояний, можно получить график зависимости минимального расстояния Dl от уровня уточнения l. Этот график для данного примера приведен на рисунке Г.31. График точен для l = 0, 1, 2, 3, 6, приблизителен для l =4 (нам известно, что 0.1188 ≤ D 4 ≤ 0.1748) и оценен для l=5. Остается только решить вопрос относительно однозначности управления для каждого элемента множества решений (раздел Г.4, пример Г.6). Как показано на рисунке Г.32,а, переменные 1, 2, 3, очевидно, являются порождаемыми, а единственной порождающей переменной является переменная Г. Каждая порождаемая переменная должна управляться (определяться) в точности одной подсистемой реконструктивной гипотезы. Для гипотезы 134/234 ясно, что переменные 1 и 2 управляются соответственно подсистемами 134 и 234, однако переменная 3 может управляться любой из них. Решение о том, какая из подсистем должна быть выбрана для управления переменной 3, должно быть принято исходя из их порождающих нечеткостей. Для данного примера вычисленные U - нечеткости равны: U(3| 1,4) =0.834 для подсистемы 134 и U(3|2,4) для подсистемы 23Г. Так как U(3|2,4)
примере переменная 4 будет запоминаться в подсистеме 234 и рассматриваться как входная переменная подсистемы 13Г. Из принятых решений относительно ролей переменных 3 и 4 реконструктивной гипотезы 134/234 будет получена схема, изображенная на рис. Г.32б. На этой схеме также приведены маски, соответствующие отдельным подсистемам, причем указаны порождаемые, порождающие и входные переменные. Окончательные схемы остальных элементов множества решений - гипотез 14/234 и 14/24/34 - приведены соответственно на рисунках Г.32в и г. В обоих случаях роли выборочных переменных, как это показано на схемах, определяются единственным образом. Важно понимать, что для зависящих от памяти систем осмысленными являются далеко не все реконструктивные гипотезы, о самом деле, понятно, что гипотеза не имеет смысла, если порождающая переменная не входит по крайней мере в одну подсистему этой гипотезы, содержащую соответствующую порождаемую или входную переменную или другую порождающую переменную (определенную на той же базовой переменной), по которой она может быть определена с помощью запоминания. Такая порождающая переменная может быть оставлена неопределенной, поскольку она не может быть ни порождена (так как она порождающая), ни определена с помощью запоминания другой переменной, которая сама определяется некоторым особым образом. Так, например, если обобщенная система описывается маской, изображенной на рисунке Г.32,а, то все гипотезы, для которых переменные 3 и 4 не входят по крайней мере в одну общую подсистему, являются бессмысленными. Из этого следует, что в данном случае ровно половина реконструктивных гипотез, базирующихся на С-структурах, являются бессмысленными; это те гипотезы, графы которых не содержат ребра (3, 4), то есть гипотезы 123/124; 14/24/23, 123/4, 13/24 и т. д. Несмотря на то, что множество решений в примере Г.21 не содержит бессмысленных гипотез, сам процесс решения может быть упрощен за счет того, что оценивались бы только осмысленные гипотезы (не нужно было оценивать 8 из 20 оцененных гипотез). Если предположить, что используемое параметрическое множество полностью упорядочено, то можно следующим образом определить содержательную реконструктивную гипотезу для зависящей от памяти обобщенной системы с поведением. Реконструктивная гипотеза h является содержатель-
303
ρ=-1
0
v1
1
v2 v3
2 4
Порождаемые переменные
4 1
входные переменные
3 Порождающая переменная
Порождающая переменная а) 4
304
Порождаемая и выходная переменная
1f
2 3
Порождаемые и выходные переменные
1 3f
3f
Входная переменная
4
Порождаемая и выходная переменная
1
4
Порождающая переменная
2f Задержка
2
2f
4
3
2 1
3
Порождаемые и выходные переменные
в) 3f Входная переменная
3f
4 1
Порождаемая и выходная переменная
2
5f
4
3f
Входная переменная
4 2
4f Задержка
4f
Порождающая переменная
4
3
Порождаемая и выходная переменная
г)
Порождаемая и выходная переменная
Рисунок Г.32. Подробное изображение элементов множества решений из примера Г.21 ной тогда и только тогда, когда любая порождающая переменная sk, определяемая уравнением sk ,t = vi ,t + a , входит по крайней мере в одну подсистему h, содержащую переменную sj, которая определяется уравнением s j ,t = vi ,t +b , где b > а, если переменные порождаются по возрастанию t (предсказание), и b < а, если переменные порождаются по убыванию t (восстановление). Понятие содержательной реконструктивной гипотезы может быть легко обобщено на зависящие от памяти системы, базирующиеся на двух и более полностью упорядоченных параметрических множествах (таких, как двух- и трехмерные декартовы пространства), однако для таких систем формализация оказывает-
305
ся существенно более сложной прежде всего из-за значительного роста числа возможных порядков порождения. Г.8. Анализ реконструируемости
Разрозненные факты подавляют негибкий ум. Но лишь возникнув, связь Распространяется как по равнине Тень облака, очерчивая гору. У. Стивене Анализ реконструируемости — это пакет методологических инструментов, входящий в УРСЗ и используемый при решении целого класса задач, имеющих следующее общее свойство: в них изучается взаимосвязь между обобщенными системами и различными их подсистемами. В задачах этого класса фигурируют системы двух эпистемологических типов: порождающие системы и структурированные порождающие системы, причем обычно они представляются в виде систем с поведением. Эти задачи естественным образом разбиваются на два подкласса в зависимости от эпистемологического уровня исходной (заданной) системы. Задачи, в которых исходная система является порождающей структурированной, называются задачами идентификации, а задачи, в которых исходная система является структурированной системой,— задачами реконструкции. Самые общие типы задач идентификации и реконструкции, в которых множества состояний переменных не обладают никакими особыми свойствами, сформулированы и рассмотрены соответственно в разделе Г.6 и Г.7. Основные вопросы (подзадачи), связанные с этими задачами, не зависят от конкретных методологических отличий и являются предметом общего анализа реконструируемости. Они показаны на рисунке Г.33 и приведены в следующем списке: определение реконструктивного семейства для заданной системы с поведением; определение коэффициента идентифицируемости (реконструктивной нечеткости) для заданной системы с поведением; определение несмещенной реконструкции для заданной системы с поведением; определение реконструкции наименьшего риска или, возможно, реконструкции какого-то другого типа для заданной системы с поведением; разрешение локальных несогласованностей в заданной системе с поведением (раздел Г.11); порождение подходящих реконструктивных гипотез для заданной системы с поведением; вычисление соответствующих проекций заданной системы с поведением; 306
вычисление расстояния между заданной системой с поведением и системой, реконструированной по реконструктивной гипотезе; упорядочение соответствующих реконструктивных гипотез и определение приемлемых, реконструктивных гипотез (множества решений задачи реконструкции); определение управления для рассматриваемых переменных. Если посмотреть с точки зрения эпистемологической иерархии систем, то легко увидеть, что анализ реконструктивности представляет собой решение последовательностей задач, принадлежащих к четырем категориям, которые на рисунке Г.34 изображены помеченными стрелками. Приведем список подзадач, относящихся к каждой категории: 1 - реконструктивное семейство, коэффициент идентифицируемости, несмещенная реконструкция или реконструкция наименьшего риска; 2 - проекции; 3 - разрешение локальных несогласованностей, порождение и упорядочение реконструктивных гипотез, управление переменными; 4 - расстояние. При других методологических отличиях возникают другие типы задач идентификации и реконструкции. Например, если переменные непрерывны, то проекции обобщенной системы с поведением зависят не только от выбранных подмножеств переменных, но и от преобразований координат. Так, трехмерный объект, изображенный на рисунке Г.35а, может быть полностью реконструирован по трем своим двумерным (планарным) проекциям (видам), скажем по виду слева, виду спереди и виду снизу (рисунок Г.35б) в соответствии с декартовыми координатами, определенными на этом объекте. Несмотря на то, что реконструируемость сохраняется при изменении положения начала системы координат, очевидно, что это свойство не сохраняется при вращении координат. В действительности существует континуум проекций одного объекта, соответствующий континууму вращений системы координат или, иначе, континууму вращений объекта в одной системе координат. Кроме того, дополнительные проекции могут быть получены на любую плоскость, определенную в данной системе координат.
307
ЗАДАЧИ ИДЕНТИФИКАЦИИ Заданная структурированная Множество функций поведения, система с поведением сопоставимых с SF: CSF
Рис. Г.3Г. Категории задач, рассматриваемые при анализе реконструируемости
• еконструктивное семейство SF:RSF • Коэффициент идентифицируемости SF: ISF
ЗАДАЧИ РЕКОНСТРУКЦИИ
Заданная система с поведением
•Решетка реконструктивных гипотез для F Уровень 1 Уровень 2 Уровень 3
F
· · ·Уровень L · ·
• Порождение реконструктивных гипотез • Несмещенная реконструкция • Упорядочение реконструктивных гипотез • Управление переменными
Множества подходящих реконструктивных гипотез для F для отдельных уровней уточнения (множество решений}
Рисунок Г.33. Основные вопросы, связанные с анализом реконструируемости
308
Р
Необходимо отметить, что показанные на рисунке Г.35 проекции являются проекциями специального типа - так Структурированные порождаю3 называемые ортогональные проекции, щие системы (с поведением) получаемые опусканием перпендикуляра на плоскость проектирования 1 2 из каждой точки объекта. Другим типом проекций являются так называемые тени, получаемые соединени4 Порождающие системы (с ем каждой точки объекта с некоторой подедением) фиксированной точкой (называемой точкой проекции или источником света). Полученные пересечения этих прямых с плоскостью проектироваРисунок Г.34 – Категории задач, ния и дают тень. Понятно, что и здесь рассматриваемых при анализе ре- имеется континуум проекций, соответконструируемости ствующий континууму положений точки проектирования. Далее, пересечения объекта с различными плоскостями, - так называемые сечения,также могут быть использованы в качестве двумерных представлений. Несмотря на огромное разнообразие возможных проекции для систем с непрерывными переменными, основные понятия, связанные с отношением целого (скажем, трехмерных объектов) и частей (их различных двумерных и одномерных проекций), такие, как реконструктивное семейство, несмещенная реконструкция, локальная согласованность, расстояние и т. д., остаются теми же самыми, даже если они принимают некие специфические формы. Например, процедура соединения, с помощью которой по двумерным ортогональным проекциям определяется несмещенная реконструкция, состоит в восстановлении для каждой из проекций бесконечных цилиндров и определении общего объема этих цилиндров (то есть множества точек, принадлежащих их пересечению). Разумеется, существуют некоторые дополнительные проблемы, связанные с непрерывными переменными. Они прежде всего связаны с выбором соответствующих проекций. Несмотря на то, что эти проблемы имеют важное значение в таких областях, как оптика, механика, картография или томография, это тем не менее проблемы, частные, не применимые ко всем системам. Поэтому они не входят в сферу вопросов, рассматриваемых в данной книге, хотя в УРСЗ должны, быть включены соответствующие методы решения этих задач. Некоторые из этих задач рассматривались в дескриптивной геометрии и в последнее время в системах обработки изображений. Методологический пакет, такой, как пакет анализа реконструируемости, должен быть доступен как в интерактивном, так и в автоматическом (пакетном) режиме. При работе в интерактивном режиме пользователь может применять соответствующие процедуры в любом порядке и объеме, 309
Вид спереди
Вид слева
Вид сверху
б)
Рисунок Г.35 - Трехмерное тело, реконструируемое по трем своим двумерным ортогональным проекциям а) принимает решения, исходя из промежуточных результатов и собственного опыта. Например, при решении задачи реконструкции он может начать с исходной структурированной системы как возможной реконструктивной гипотезы, оценить ее и, если нужно, сравнить с непосредственными уточнениями, со всеми реконструктивными гипотезами, в ее структурной соседстве, с другими возможными гипотезами, не находящимися в соседстве, или предпринять какие-либо другие действия. При решении задачи идентификации можно сравнить несколько вариантов структурированных систем по их коэффициентам идентифицируемости. В зависимости от полученных результатов можно определить затем или реконструктивные семейства, или только некие типы реконструкций для некоторых из них. То, что интерактивный режим дает возможность пользователю сосредоточить внимание на конкретных вопросах и воспользоваться своим опытом и знаниями, является большим преимуществом интерактивного режима при работе с большими системами, в которых полная обработка практически невозможна из-за неприемлемых запросов на вычислительные ресурсы. При работе в автоматическом режиме пользователю должен быть предоставлен набор последовательностей различных процедур, что позволило бы ему выбирать различные варианты решения задачи. Так, например, при решении задачи реконструкции одна из последовательностей процедур, повторяющаяся на каждом уровне уточнения, может состоять из RС-процедуры, процедуры соединения, вычисления расстояния и процедуры принятия решения о продолжении. В другой последовательности RC-процедура может быть заменена на RG-процедуру (ограниченную уточнениями из одного класса r-эквивалентности), за которой следуют три остальные процедуры (процедура соединения и так далее); другие последова310
тельности могут базироваться на укрупнении, а не на уточнении и тому подобное. Одна из последовательностей должна выполняться по умолчанию, например простая последовательность, основанная на RС-процедуре. Помимо своей основной роли при анализе систем естественного происхождения, реконструктивный анализ может быть применен также и для решения задач, связанных с искусственными системами. Понятие структурного соседства можно, например, Непосредственно использовать для обнаружения дефектов в связях между элементами структурированной системы в тех случаях, когда непосредственное наблюдение связей невозможно. Правильно использованное, оно может оказать большую помощь и при проектировании. Его, например, можно применять для определения всего множества структурных уточнений, полностью сохраняющих данную проектируемую систему с поведением. Такие уточнения являются основой для естественного способа проектирования по частям, что делает этот процесс более управляемым. Под «естественным» здесь понимается то, что эти уточнения содержат только входные и выходные переменные, входящие в данную систему с поведением, т. е. не содержат дополнительных (или искусственных) переменных, вводимых на данном этапе. В каждом уточнении по крайней мере некоторые из заданных переменных входят в несколько подсистем и, следовательно, играют несколько разных ролей. В максимально подробных уточнениях множественность использования любой переменной достигает предела. Далее переменные должны при необходимости вводиться с помощью обычных методов декомпозиции или другого подходящего метода проектирования. Несмотря на такое использование реконструктивного анализа для искусственных систем, необходимо подчеркнуть, что основным его назначением является исследование естественных систем. Дело в том, что отношение часть-целое в естественных системах куда более неопределенно, чем в естественных. Так, например, любая искусственная система является также определением соответствующей обобщенной системы. Это непосредственно следует из того факта, что соединяющие переменные в любой искусственной системе являются либо переменными, которые прямо представляют единственную систему с поведением (определенную в задаче проектирования), либo искусственными соединяющими переменными, введенными только для косвенного представления этой единственной системы. Следовательно, реконструктивное семейство любой искусственной структурированной системы является единственным и представляет собой объединение функций поведения ее элементов. То есть обобщенная система любой искусственной структурированной системы всегда представляется несмещенной реконструкцией этой структурированной системы. Это взаимно однозначное соответствие между искусственными структурированными системами и связанными с ними обобщенными системами является, без сомнения, доводом, возможно самым главным, в пользу того, что связь между сопоставимыми системами с поведением и структурированными системами при исследовании систем (то есть при исследовании ес311
тественных систем) часто недостаточно хорошо понимается, особенно людьми с инженерной подготовкой. В самом деле, в литературе описано множество больших систем, которые, как предполагается, описывают различные естественные явления и составлены из меньших взаимосвязанных систем (подсистем). На основании полученной конкретной структурированной системы делаются выводы о свойствах обобщенной системы так же, как это делается для аналогичных искусственных систем, т. е. с помощью соединения или композиции функций поведения соответствующих элементов. Понятно, что подобные выводы основываются на предположении, что структурированные системы представляют эту обобщенную систему точно так же, как для искусственных систем. Это недоказанное и обычно неверное предположение, которое в подобных исследованиях никогда явно не декларируется, принимается без доказательства из-за неправомерной и сбивающей с толку аналогии с искусственными системами. Г.9. Вычислительные эксперименты Эксперименты на компьютере не только возможны, но и могут дать информацию, которую невозможно получить иным путем. У. Росс Эшби
В этом разделе в качестве примера метаметодологических средств УРСЗ описываются вычислительные эксперименты, с помощью которых можно определить некоторые важнейшие характеристики анализа реконструируемости (связанные с задачей реконструкции). Эти характеристики нужны для более глубокого понимания реконструктивного анализа, помощи пользователям УРСЗ по применению реконструктивного анализа при общесистемных исследованиях и оценки новых принципов, таких, как принцип индуктивного вывода, рассматриваемый в разделе Г.10. В типичном эксперименте реконструктивная гипотеза выбирается при заданном числе переменных и мощностях их множеств состояний. Затем процесс порождения данных с помощью этой гипотезы моделируется на компьютере. В большей части этих экспериментов порождается последовательность из 2000 элементов данных. В соответствии с описанными выше правилами анализ реконструируемости проводится на 10 разных сегментах этих последовательностей, содержащих 10, 20, 40, 80, 160, 320, 640, 1000, 1500 и 2000 элементов данных. Полученные для каждого сегмента результаты затем сравниваются с данной реконструктивной гипотезой. Для заданного числа переменных и их множеств состояний порождается и анализируется соответствующее число различных последовательностей данных. Усредненные результаты этих экспериментов затем используются для определения различных характеристик. Эксперименты для простоты ограничиваются только С-структурами. Они были проведены для множеств &3, &4 и &5; для 312
каждого множества были соответствующим образом представлены все уровни уточнения. Аналогичные эксперименты были проведены для множеств состояний одинаковой мощности (2, 3, 4 и 5) для всех рассматриваемых переменных, а также для определенных смесей разной мощности. Поскольку отличия переменных, описываемых масками и средами, которые для общесистемных исследований очень важны, собственно для реконструктивного анализа значения не имеют, эксперименты проводились только для нейтральных систем без памяти. Последовательности данных порождались с помощью генератора случайных чисел в соответствии с конкретной вероятностной структурированной системой (представленной С-структурой). Затем они анализировались вероятностным и возможностным методами. На самом деле одной из целей проведения экспериментов было сравнение этих двух методов и определение их областей применения. На начальном этапе эксперимента было замечено, что возможностный анализ демонстрирует тенденцию к естественной классификации реконструктивных гипотез на каждом уровне уточнения на хорошие и плохие гипотезы, т. е. на гипотезы соответственно с малыми и большими расстояниями. Было также отмечено, что корректные гипотезы (то есть гипотезы, с помощью которых были порождены анализируемые данные) часто не обладают наименьшим расстоянием, но почти всегда принадлежат к хорошему кластеру. Исходя из этих наблюдений вероятностный и возможностный анализы проводились по немного отличающимся правилам. При вероятностном анализе любая порожденная последовательность данных анализируется на соответствующей решетке уточнения дважды с помощью двух различных процедур поиска. Согласно первой процедуре на каждом уровне уточнения уточняются только структуры с минимальным расстоянием. Согласно второй процедуре уточняются все структуры, чьи расстояния не превышают минимальное более чем на 100%. По каждой из процедур характеристики вычисляются отдельно. При возможностном анализе структуры на каждом уровне уточнения кластеризуются на плохие и хорошие и далее уточняются только хорошие структуры. Любая последовательность данных анализируется дважды с помощью двух разных процедур кластеризации. Для описания этих процедур пусть R = {( Ci , d i ) | i ∈ N r } обозначает множество всех С-структур Сi, оцениваемых на определенном уровне уточнения конкретного эксперимента, с их расстояниями di. Пусть di≤di+1 для всех i∈ N r −1 и пусть G={C1 С2, . .., Сс}; В= {Сс+1 Сс+2, . . ., Сr } - соответственно кластеры хороших и плохих структур, где 1 ≤ c ≤ r (то есть кластер G всегда непустой, в то время как кластер В в некоторых случаях может быть пустым).
313
В первой процедуре кластеризации с определяется наименьшим значением i, для которого разность di - di-1 превышает среднюю разность в R для всех i ∈ Nr-1. To есть d − d1 d i − d i −1 ≤ r r для i ∈ N c ( d 0 = 0 ) и d − d1 . d c +1 − d c > r r Будем называть эту процедуру кластеризацией по средней разности или AD-кластеризацией (average difference). Во второй процедуре кластеризации с определяется значением k ∈ N r , для которого выражение c r 1 ( ∑ | d i − a1 | + ∑ | d i − a2 | a2 − a1 i =1 i =c достигает минимума, причем 1 c a1 = ∑ d i , c i =1 1 r a2 = ∑ di . r − c i = c +1 Эта процедура основана на естественном кластеризационном требовании о том, что расстояния между кластерами должны быть велики, а расстояния внутри кластеров малы; будем называть это кластеризацией по внутреннему и внешнему расстоянию или IOD-кластеризацией (от англ. Inside and Outside Distance). Теперь можно целиком описать процедуру реализации одного эксперимента (смотри диаграмму на рисунке Г.36). Она начинается с выбора струкОцениваемые Сструктуры и их расстояния l=1 Т
SF
TF
D
DF DSF RF
l =2
· · · · · ·
l=x
уровень ТSF
Рисунок Г.36 - Схема вычислительного эксперимента турированной системы с поведением TSF (которая рассматривается в эксперименте как подлинная). Эта система основывается на С-структуре. Эта структуризованная система, представляющая обобщенную систему с поведением TF (полученную из системы TSF с помощью процедуры соединения), моделируется на компьютере и используется для порождения данных. После порождения данных из соответствующей системы данных D выводится обобщенная система с поведением без памяти DF (вероятностная или возможностная). Затем для 314
ведением без памяти DF (вероятностная или возможностная). Затем для системы D F проводится реконструктивный анализ в соответствии с одной из упомянутых выше процедур поиска (например, для возможностных систем, основанных на одном из двух типов кластеризации). Результатом является последовательность множеств С-структур (и их расстояний), которые оцениваются на отдельных уровнях соответствующей решетки уточнения. Это множества, скажем множества El = {( Ci , d i ) | il ∈ I l } для l = 1, 2, ..., п(п — 1)/2, где п — число рассматриваемых переменных. Особый интерес представляет множество El для того же уровня уточнения, что и система TSF. Система DF также используется для определения структурированной системы DSF, основанной на такой же С-структуре, что и заданная структурированная система TSF. Эта система (DSF) представляет обобщенную систему с поведением RF (реконструированную обобщенную систему). По множеству El (l ∈ Nn(n-1)/2) и обобщенным системам с поведением TF, DF и RF, полученным в результате экспериментов одного типа (то есть для определенного числа переменных, определенных множеств состояний, для вероятностного или возможностного варианта и так далее), можно определить различные характеристики результатов анализа реконструируемости. Опишем эти характеристики на нескольких примерах систем из трех переменных. Некоторые основные характеристики для вероятностных систем (с тремя переменными) представлены на рисунке Г.37. Они получены с использованием процедуры поиска, в которой уточняются только структуры с минимальным расстоянием. Графики на рисунке Г.37,а описывают влияние числа наблюдений (объем данных |d|) на качество анализа реконструируемости для переменных с двумя и с пятью состояниями. Качество оценивается как для тех экспериментов, для которых процедура поиска получает на соответствующем уровне уточнения корректную структуру, являющуюся структурой с наименьшим расстоянием. Как видно, 100%-ое качество достигается достаточно быстро для обоих случаев. Несмотря на то, что с ростом числа наблюдений результативность сходится к 100% во всех исследованных случаях, скорость сходимости несколько падает с ростом числа переменных. Это объясняется прежде всего высокой селективностью используемой процедуры поиска. Видно также, что переменные с пятью состояниями (верхний график) оцениваются лучше, чем переменные с двумя состояниями (нижний график). Это также общая тенденция: с ростом мощностей множеств рассматриваемых состояний улучшается и качество. Таким образом, для любого конкретного числа переменных характеристики представленных систем с двоичными пере менными могут рассматриваться как худший случай. На остальных графиках на рисунка Г.37 показаны характеристики анализа реконструируемости только для двоичных переменных. На графике (рисунок Г.37,б) показано, насколько отличается корректная структура по информационному расстоянию от других структур на том же уровне уточнения. На нижнем графике представлено расстояние для корректной структуры D(Df, Rf ), на l
315
среднем — наименьшие расстояния для структур, конкурирующих с корректной на том же уровне уточнения, и на верхнем средние расстояния для всех структур, конкурирующих с корректной (в соответствии с процедурой по
а)
б)
в) г) Рисунок Г.37 - Некоторые характеристики анализа реконструируемости для вероятностных систем
иска) на одном уровне уточнения. Несмотря на то, что на вид этих кривых влияет число переменных и мощность множеств их состояний, а также используемый тип расстояния, с ростом числа наблюдений эти расстояния всегда убывают, а расстояние для корректной структуры стремится к нулю. На графике (рисунок Г.37в) сравниваются информационные расстояния между подлинной системой TF и соответственно системами DF и RF. Поскольку соответствующие пары распределений вероятностей Tf, Df и Tf, Rf являются произвольными, необходима общая мера информационного расстояния. Это расстояние, назовем его G, определяется формулой 1 1 f + 2f f + 2f 1 2 1 2 G( f , f ) = D( f , ) + D( f , ), (Г.44) 2 2 где 1f и 2f - произвольные распределения вероятностей, определенные на одном и том же конечном множестве состояний; D — специальное информационное рас316
стояние, заданное уравнением (Г.40); (1f +2f )/2—распределение вероятностей, полученное взятием среднего для каждой пары соответствующих вероятностей из 1 f и 2 f . Нижний график на рисунке Г.37,в представляет D( T f, R f), а
а)
б)
в) г) Рисунок 7.38 - Некоторые характеристики анализа реконструируемости для возможностных систем
верхний - D(Tf, Df). Таким образом, реконструированная система RF оказывается ближе к подлинной системе TF, чем система DF, опирающаяся только на доступные данные. Это довольно неожиданный результат, важность которого будет проанализирована в разделе Г.10. На графиках (рисунок Г.37г) показана взаимосвязь множеств состояний с ненулевыми вероятностями для трех участвующих в вычислительном эксперименте систем с поведением ТF, DF и RF; будем эти множества состояний обозначать соответственно ТХ, DX и RХ. На нижнем графике показана доля тех состояний TF, которые имеются в D F (это происходит из-за недостатка данных), то есть (DX/TX)·100; на верхнем графике представлен процент состояний TF, имеющихся в R X ⋅ 100 T X 317
Из этих графиков ясно видно, что D
X ⊆ RX ⊆T X
(Г.45)
Это столь же важное свойство, как и то, что получено из графиков на рисунке Г.37,г, и оно также будет рассмотрено в разделе Г.10. Возможностные аналоги описанных характеристик приведены на рисунке Г.38. Они основаны на IOD-кластеризации. Поскольку реконструктивный анализ возможностных систем основывается на работе с кластерами структур, а не с отдельными структурами, то соответствие между вероятностными характеристиками и их возможностными аналогами не является прямым. На рисунке Г.38 (а) показано качество возможностного анализа реконструируемости для различных множеств состояний (от двух до пяти для переменной). График в данном случае имеет обобщенный вид, поскольку различия для разных множеств состояний малы и никаких особых тенденций выявить не удается. Качество представляется как доля экспериментов, в которых корректные структуры входят в кластер хороших структур. Остальные зависимости на рисунке Г.38 построены только для двоичных переменных На рисунке Г.38,г показаны верхнее и нижнее информационные расстояния для двух кластеров структур. Они существенно отличаются от своих вероятностных аналогов. Напротив, на рис. Г.38,в и г очень похожи на свои вероятностные аналоги. Возможностная версия общего информационного расстояния, использованная при построении графиков на этих рисунках, определяется формулой G(1f, 2f)=D(1f, 1f V 2f)+D(2f, 1f V 2f),
(Г.46) где f и f— произвольные распределения возможностей, определенные на одном и том же конечном множестве состояний; D - специальное информационное расстояние, определяемое уравнением (Г.42); 1f V 2f - распределение возможностей, получаемое взятием максимума для каждой пары соответствующих возможностей из 1f и 2f . Все эксперименты, для которых определялись данные характеристики, проводились в предположении, что данные порождены некой структурированной системой. Целью этих экспериментов было определение того, насколько недостаток данных влияет на качество анализа реконструируемости. Несмотря на то, что эти идеализированные эксперименты достаточно ценны и представляют собой естественный первый этап анализа реконструируемости, очень желательно было бы расширить их для более общих и более реальных ситуаций. Позвольте в качестве примера описать обобщенные эксперименты, подготавливаемые в настоящее время. Подобно идеализированным вычислительным экспериментам, обобщенные эксперименты будут также разбиты на группы по числу переменных и по мощностям их множеств состояний. Для каждого эксперимента будет выбрано определенное распределение, где для каждого обобщенного состояния рассматриваемых переменных будет определено число его наблюдений. Одни 1
318
2
сматриваемых переменных будет определено число его наблюдений. Одни распределения будут выбраны из различных архивов данных и из литературы, а другие — порождены случайными процессами. Эти два класса экспериментов будут анализироваться по отдельности для того, чтобы понять, обладают ли распределения, основанные на реальных данных, некими особыми реконструктивными свойствами по сравнению с порожденными случайно распределениями. Каждое отобранное распределение будет использовано двояко. Вопервых, его реконструктивные свойства будут анализироваться как вероятностным, так и возможностным методами. Во-вторых, оно будет использовано для порождения данных, обычно для 2000 наблюдений. Затем распределения, полученные для различных сегментов данных, будут анализироваться точно так же, как и исходные (истинные) распределения, и с помощью тех же методов (вероятностного и возможностного). Наконец, результаты соответствующих экспериментов, полученные для различных сегментов данных, будут сравниваться с теоретическими свойствами, определенными для исходного распределения. Это сравнение будет проводиться для того, чтобы определить, насколько хорошо эти теоретические (истинные) свойства согласуются с экспериментальными. Для каждого свойства, считающегося существенным, в результате выполнения каждой группы экспериментов будет определена зависимость средней сохранности этого свойства (а также вариации этой сохранности) от размеря анализируемого сегмента данных и используемого метода. Вычислительные эксперименты так, как они описаны в этом разделе для анализа реконструируемости, являются важнейшим инструментом для метаметодологических исследований в науке о системах. УРСЗ должен не только предоставлять в распоряжение пользователя метод решения разных типов задач, но и давать метаметодологическое описание этих методов. Характеристики анализа реконструируемости, описанные в данном разделе,— это простой пример такого метаметодологического описания. Г.10 Индуктивное рассуждение Откуда берутся гипотезы, если они не рождаются прямо из головы Зевса? Частично ответ состоит в том, что они возникают в процессе порождения гипотез. Герберт А. Саймон
Хотя индуктивное рассуждение неявно применялось только при решении задач идентификации и реконструкции, оно используется практически в любой задаче, связанной с применением метода открытия в исследовании систем. Поэтому желательно дать обзор вопросов, связанных с индуктивными рассуждениями, и это - одна из задач данного раздела; вторая задача - введение нового
319
принципа индуктивного вывода, основанного на некоторых особенностях анализа реконструируемости. Понятие индуктивного рассуждения мы будем рассматривать не в традиционном узком смысле - как выведение общего заключения из частных примеров, а более широко - как «охват всех недоказуемых случаев, в которых истинность предпосылок хотя и не определяет инстинность заключения, но показывает, что есть серьезные основания доверять истинности этого заключения» (Философская энциклопедия). Понятие индуктивного рассуждения в течение столетий являлось предметом философских споров, особенно после опубликования в 1739 г. Дейвидом Хьюмом классического анализа этого понятия (David Hume, A. Treatise of Human Nature, William Collins, Glasgow, 1962). Несмотря на то, что было выдвинуто множество доказательств, опровергающих скептическое отношение Хьюма к возможности обоснования индуктивного вывода, в конечном счете оказалось, что все эти доказательства имеют слабые места. В одних случаях доказательства оказывались несостоятельными из-за скрытой цикличности (то есть из-за попыток обоснования индукции с помощью индукции), в других - зависели от неких метафизических допущений (типа единообразия природы). Основной недостаток этих доказательств заключается в том, что они всерьез рассматривают тезис Хьюма как содержательную проблему. Альтернативный подход состоит в том, чтобы отказаться от попыток обоснования индуктивного вывода дедуктивными методами, что неявно присутствует в анализе Хьюма, и рассматривать индуктивное рассуждение как процесс правильного суждения на основе неполной информации. Одним из самых многообещающих способов обоснования индуктивного рассуждения при таком подходе является методологический прагматизм, предложенный недавно Решером [263]. Согласно этому способу ключом к обоснованию индуктивного рассуждения являются методы; понятно, что методологический прагматизм хорошо согласуется с темой данной книги. Дадим краткий обзор основных особенностей этого способа. Решер рассматривает индуктивное рассуждение как метод «правильного суждения с помощью систематизации на основе опыта, представляющего собой оптимально правдоподобное сочетание догадки и имеющейся информации» [266]. Он утверждает, что информацию о природе можно получить, только взаимодействуя с ней, и если мы не готовы довериться такому взаимодействию, то остается только отказаться от всего проекта исследования. Несмотря на то, что цели такого проекта являются как научными, так и практическими, окончательная проверка должна основываться на том, насколько полученные знания оказываются полезны для деятельности человека. Происходит это из-за того, что в отличие от теоретических построений на практике для достижения целей (например, чтобы избежать гибели, травмы, болезни, страданий, огорчений и так далее) нужно принимать неотложные решения. В книге [260] подробно рассматривается вопрос о том, насколько необ320
ходимы индуктивные рассуждения для успеха работы лица, принимающего решения. Поскольку индуктивное рассуждение рассматривается как метод решения задач при неполной информации, его обоснование - это обоснование с точки зрения практический пригодности; отсюда и название «методологический прагматизм». Обоснование метода индуктивных рассуждений, по Решеру, разбивается на два этапа, называемые соответственно начальным и окончательным обоснованием. При начальном обосновании, которое является неиндуктивным, требуется показать, что метод является потенциально более пригодным по сравнению с другими сопоставимыми методами. Окончательное обоснование — это проверка реальной эффективное!и метода, т. е. проверка того, насколько его эффективность выше, чем у альтернативных методов, Существенной стороной начального обоснования метода индуктивного распределения, по Решеру, является учет того, в какой степени полученные с помощью этого метода результаты могут быть включены в систему, основанную на предшествующем опыте. Все остальное остается таким же. В качестве критериев для начального обоснования метода используются различные параметры систематичности (полнота, связанность, совместимость, простота и т. д.). Такой подход является следствием согласованной теории истинности [261], подробно излагаемой в книге Решера «Когнитивная систематизация» [265]. Решер утверждает также, что индуктивное рассуждение «лежит в самой основе использования человеком языка для коммуникаций. Именно естественный язык служит для согласования явного расхождения между полученными утверждениями и реальными свидетельствами; это делается с помощью завуалирования фактов, причем этот процесс имеет индуктивную природу» [266]. Взаимосвязанность индуктивного рассуждения и естественного языка, хорошо согласующаяся с основными идеями методологического прагматизма, отмечается и в работах некоторых современных философов. Одно из самых ясных высказываний на этот счет принадлежит Блэку. Он утверждает [45]: Мне представляется естественным считать, что индукция — это система, управляемая правилами. Индукция как система человеческой деятельности использует соответствующую терминологию, а также определенные правила вывода суждений. При индуктивном рассуждении требуется соответствующим образом помечать определенные ситуации, определенными способами делать выводы и, что важно, принять определенный способ мышления, прежде чем предпринять соответствующие действия... Грубо говоря, индуктивные правила определяют: как говорить, как думать и как действовать в определенных рамках... У этих правил есть априорная и есть практическая стороны, определяющие правильное использование этих правил; при нашем языке и включающей его системе понятий невозможно представить себе, как можно вообще отказаться от них. Однако это опытом. Большая часть этого опыта воплощена в структуре нашего языка, не означает, что мы находимся в плену у догмы: устанавливающие правила индукции дают значительную свободу для различных суждений относительно индуктивных заключений, достоверности правил и т. п. При этом можно обратиться к прошлому опыту как основе для повышения мощности вывода или при разумных ограничениях для модификации системы индукции и ее компонентов. Однако обращение к предшествующему опыту — 321
это, пользуясь политической терминологией, ревизионизм: для революций в способах мышления нужно искать другие пути.
Индуктивное рассуждение хорошо формулируется на языке теории информации. Большой вклад в эту область внесли работы Кристенсена [7579]. Он определил индуцированное суждение как суждение, представляющее всю доступную информацию, но только ее. Несмотря на то, что индуцированные суждения получаются не обязательно с помощью дедукции из имеющейся информации, случаи, в которых применима дедукция, также рассматриваются как особые (экстремальные) случаи индуцированных суждений. Из определения индуцированного суждения следуют два общих принципа индуктивного рассуждения: 1) наши суждения не должны быть отражением большего объема информации, чем тот, которым мы располагаем; 2) наши суждения должны отражать всю доступную нам информацию. Поразительно, что эти чрезвычайно фундаментальные принципы были прекрасно известны китайскому философу Лао-цзы уже в V в. до н. э. Они блестяще сформулированы в его книге Дао Дэ Цзин: Кто имея знания, делает вид, что не знает, тот выше всех. Кто имея знания, делает вид, что не знает, тот болен . Для создания определенной методологии индуктивного рассуждения, основанного на этих общих принципах, нужно принять какое-то определение термина «информация». В разных контекстах этот термин понимается поразному. В контексте исследования систем, когда информация понимается как мера ограничений на рассматриваемые переменные, смысл этого термина определяется способом представления этих ограничений. В рамках теории вероятностей два общих принципа индуктивного рассуждения становятся соответственно принципами минимума и максимума энтропии. В альтернативных теориях есть соответствующие аналоги этих принципов. Например, в теории возможностей это принципы максимума и минимума U нечеткости. Принцип максимума энтропии используется для оценки неизвестных вероятностей (которые нельзя определить дедуктивно) по имеющейся информации. Согласно этому принципу оцененное распределение вероятностей должно быть таким, чтобы его энтропия была максимальной при имеющихся ограничениях, т. е. ограничениях, представляющих имеющуюся информацию. Таким образом, этот принцип обеспечивает то, что не будет использована никакая информация, кроме имеющейся. Принцип минимума энтропии применяется при формировании разрешающих форм и в связанных с этим процессом задачах. Согласно этому принципу энтропия оцениваемого распределения вероятностей, обусловленного определенной классификацией заданных событий (например, состояний рассматриваемой переменной), является минимальной основой для ограничений, накладываемых на ситуацию. Таким образом, этот принцип гаранти322
рует, что при оценке неизвестных вероятностей используется вся имеющаяся информация, насколько это возможно при заданных ограничениях (например, при требуемом числе состояний) и по существу согласно Ватанабе [331], это является основным принципом распознавания образов: Распознавание образов — это способность интеллекта, направленная на то, чтобы в ряде событий выделить некую «форму». На языке математики самым подходящим было бы такое определение: распознавание образов - это формирование, переформирование и модификация нашей системы отсчета с тем, чтобы соответствующим образом минимизировать с учетом неизбежных ограничений определенную для этой системы отсчета энтропию.
Соответствующее применение обоих методологических принципов— максимума и минимума энтропии и дает методологию индуктивного рассуждения по Кристенсену. Она называется методологией минимакса энтропии. Для обоснования этой методологии Кристенсен анализирует грамматические структуры и морфемы естественного языка. Он утверждает следующее: Так же как в физике, где измерения зависят от физической системы отсчета, наши индуктивные суждения зависят от системы понятий, выработанной нашим опытом. Большая часть этого опыта воплощена в структуре нашего языка, в смысле используемых нами слов, фраз, предложений. Искать твердый «принцип индукции», на котором основывались бы наши обобщения, столь :же тщетно, как искать окончательную систему отсчета для ньютоновской механики... [75]. Любое сделанное человеком обобщение зависит не только от конкретных данных, непосредственно из которых оно получено, но и (только косвенно) от всего опыта истории эволюции языка, на котором получено это обобщение. В конечном счете все суждения людей используются при принятии решений того или иного рода или при выборе последовательности действий. Решение зависит от оценок и суждений лица, принимающего решение, причем эти оценки относятся и к природе окружающего его мира. На систему ценностей и убеждения влияет как внешний мир, так и сама личность... Предположим, что индуктивное рассуждение широко используется всеми членами некоего общества, говорящими на одном языке. Тогда, приняв первую часть определения индуцированного суждения, а именно, что оно представляет не больше информации, чем нам доступно, мы видим справедливость термодинамического закона неубывания энтропии. Из этого закона следует, что будущий опыт стремится быть представленным так же просто на существующем в настоящее время языке, как и опыт прошлый. Принимая вторую часть определения индуцированного суждения, а именно, что оно представляет всю доступную нам информацию, и считая, что индуктивное рассуждение используется всем обществом, мы приходим к принципу эволюции языка: [Язык эволюционирует в направлении, ведущем к более простому описанию опыта всех членов общества, использующих этот язык]. Из чего следует, что прошлый опыт может быть легко выражен на языке современности. Однако это также означает, что индуктивное рассуждение порождает представление физической действительности. Таким образом, мы показали условную обоснованность индуктивного рассуждения, условную, поскольку она зависит от применения индуктивного рассуждения в обществе. Другими словами, обоснованность индуктивного рассуждения зависит от того, поддерживается оно «живым» язы323
ком или нет. Однако, и это очень важно, такая условность находится под контролем людей, принимающих решение о том, доверять или нет этим индуцированным суждениям. Основывая свои решения на результатах индуктивных рассуждений, они оценивают все, от чего зависит обоснование индуктивного рассуждения. В этом смысле принятие решений на основе индуктивного рассуждения, реализуемое в «живом» языке, представляет собой процесс, обосновывающий сам себя [79].
Рассматривая все доводы в обоснование метода минимакса энтропии как методологии индуктивного рассуждения, можно прийти к выводу, что эта методология обоснована достаточно хорошо. Будут, вероятно, разработаны и соответствующим образом обоснованы аналоги этой методологии для других классов нечетких множеств (например, методология минимакса (U - нечеткости). После этого краткого обзора некоторых важнейших вопросов индуктивного рассуждения позвольте мне описать некий новый принцип индуктивного вывода. Поскольку этот принцип связан с задачей реконструкции, назовем его реконструктивным принципом индуктивного вывода. Предположим, что некое ограничение для заданной обобщенной системы с поведением было определено по эмпирическим данным с помощью индуктивных рассуждений, скажем с помощью методологии минимакса энтропии. Поскольку количество данных ограничено, это ограничение представляет собой только оценку того, как рассматриваемые переменные ограничены в действительности; если эта оценка основана на всей информации относительно действительного ограничения, содержащейся в базе данных, то она является несмещенной. Теперь допустим, что действительное ограничение таково, что оно может быть реконструировано по определенному набору своих проекций. Из-за ограниченности данных оцененное ограничение может этим свойством не обладать. Тем не менее реконструктивная гипотеза, основанная на подсистемах, будет, вероятно, лучше подходить для оценки обобщенного ограничения, чем другие гипотезы на том же уровне решетки уточнения. Затем это превосходство будет проявляться на любом более низком уровне этой решетки при всех уточнениях такой удачной реконструктивной гипотезы. Теперь можно привести решающий довод. Если корректная реконструктивная гипотеза и/или ее уточнения на различных уровнях уточнения в самом деле определяются как лучшие, то с помощью любой из них потенциально возможно реконструировать некоторые обобщенные состояния, которые переменные могут иметь, но которые не входят в имеющиеся данные и, следовательно, в ограничения для заданной обобщенной системы. Это хорошо согласуется с масштабными экспериментами, результаты которых приведены на рисунке Г.37,г и Г.38,г. Более того, поскольку с любой подсистемой связано меньшее множество состояний обобщенной системы, то в общем случае его ограничения лучше описываются данными, чем ограничения обобщенной системы (например, больше отношение числа наблюдений к числу потенциальных состояний). То есть с помощью луч324
ших реконструктивных гипотез можно улучшить нашу исходную оценку обобщенного ограничения. Это также подтверждается результатами экспериментов, приведенными на рисунке Г.37,в и Г.38, в. Полученные результаты ясно указывают на то, что неравенство G( Tf ,R f ) < G( Tf ,D f ) для конечных данных выполняется всегда независимо от объема данных. Это значит, что обобщенная система, реконструированная на основе корректной реконструктивной гипотезы, информационно всегда ближе к истинной обобщенной системе, чем система, выведенная только из заданных данных. Свидетельством того, что реконструированное ограничение Rf оценивает истинное ограничение T f, лучше, чем полученное из данных (Df), является неравенство δ 1 ( Tf ,R f ) < δ 1 ( Tf ,D f ), где δ 1 - расстояние Хемминга. Выполнение этого неравенства подтверждается также результатами вычислительных экспериментов. Так, например, результаты реальных экспериментов для трех переменных с пятью состояниями каждая приведена в таблице Г.15 соответственно для вероятностной и возможностной систем. Таблица Г.15. Пример экспериментального подтверждения реконструктивного принципа индуктивного вывода 20 40 80 160 320 640 1,000 1,500 2,000 |d| 10 а) Вероятностная система T D δ 1 ( f , f ) 0.0132 0.0111 0.0086 0.0063 0.0044 0.0031 0.0023 0.0018 0.0015 0.0012 δ 1 ( Tf ,R f ) 0.0106 0.0073 0.0052 0.0036 0.0025 0.0018 0.0014 0.0011 0.0009 0.0008 G1 ( Tf ,D f ) G1 ( Tf ,R f )
δ 1 ( Tf ,D f ) δ 1( f , f ) T
R
G1 ( Tf ,D f ) G1 ( Tf ,R f )
0.0952
0.0741
0.0526
0.0328
0.0174
0.0084
0.0042
0.0025
0.0017
0.0012
0.0697
0.0404
0.0213
0.0104
0.0045
0.0024
0.0013
0.0008
0.0005
0.0004
0.2779 0.2645 0.0999 0.0972
0.2479 0.1999 0.0894 0.0742
0.2188 0.1470 0.1002 0.0691
0.0746 0.0544 0.0450 0.0334
0.0627 0.0457 0.0379 0.0260
0.0565 0.0403 0.0369 0.0261
б) Возможностная система 0.1859 0.1216 0.0872 0.0647
0.1508 0.1021 0.0776 0.0568
0.1100 0.0764 0.0599 0.0450
0.0883 0.0648 0.0526 0.0383
Для сравнения в этих таблицах приведены результаты, полученные с помощью информационного расстояния. Будем ли мы получать реконструкцию с помощью лучшей реконструктивной гипотезы на некотором уровне уточнения как улучшенную оценку обобщенного ограничения, зависит от того, влияет ли, по нашему мнению, рассматриваемая гипотеза на некоторые фундаментальные реконструктивные свойства переменных или нет. Что может помочь исследователю принять то или иное решение? Предлагается следующее: с помощью вычислительных экспериментов на компьютере, как это описано в разделе Г.9, ему следует определить некоторые реконструктивные характеристики. Эти характеристики позволят исследователю оценить конкретную ситуацию и сформировать соответствующее мнение. Такие характеристики могут быть использованы даже в соответствующих руководствах 325
по формированию этого мнения, и, в конечном счете, могут быть разработаны некие обоснованные функции формирования мнения и одна из них использоваться в УРСЗ по умолчанию. Очевидно, что эти функции должны быть определены реконструктивными характеристиками типа изображенных на рисунке Г.37,а, б или Г.38,а, б. Умение решать задачу реконструкции позволяет нетрадиционно подойти к процессу индуктивного рассуждения. Он осуществляется в два этапа. На первом обобщенное ограничение определяется по имеющимся данным с помощью обычных принципов индуктивного рассуждения (например, с помощью принципа минимакса энтропии). Второй этап состоит из трех шагов: 1) на различных уровнях уточнения определяются лучшие реконструктивные гипотезы для обобщенной системы; 2) формируются мнения о том, насколько эти гипотезы влияют на реальные реконструктивные свойства рассматриваемых переменных; эти мнения формируются на основе соответствующих экспериментальных характеристик, руководств и конкретных функций; 3) заданное обобщенное ограничение дополняется (или заменяется) ограничениями, реконструированными с помощью лучших реконструктивных гипотез, причем с каждой связывается определенная степень доверия. При использовании только той информации, что содержится в данных, этот двухэтапный метод позволяет включать в оцененное обобщенное ограничение некоторые характеристики (например, обобщенные состояния), которые нельзя непосредственно определить по имеющимся данным. Следовательно, такой метод позволяет нам предсказывать или восстанавливать с определенной степенью достоверности некоторые состояния исследуемых переменных, которые не входят в момент предсказания или восстановления в данные, которыми мы располагаем. Г.11. Несогласованные структурированные системы
...различие между обоснованным и необоснованным может быть отделено от согласованного и несогласованного... уверенно провести грань между рациональным и иррациональным можно, только учитывая несогласованность... Мысленные конструкции или утверждения могут быть несогласованными, однако в конечном счете на некотором метауровне нашего мышления мы можем и должны ими оперировать согласованно. Николас Решер и Роберт Брандом 326
Возможно, согласованность является самым фундаментальным критерием для классификаций структурированных систем. Для структурированных систем согласованность тесно связана с задачей идентификации (раздел Г.6): если структурированная система с поведением согласованная, то ее реконструктивное семейство непусто, если несогласованная, то пусто. В структурированных системах с поведением возможна несогласованность двух типов - локальная и глобальная. Структурированная система локально несогласованная, если она не удовлетворяет требованиям локальной согласованности, задаваемым уравнением (Г.20), и глобально несогласованная, если она локально несогласована и ее реконструктивное семейство пусто. Пример Г.22. Рассмотрим структурированную систему с поведением, элементы которой описываются вероятностными функциями поведения, приведенными в таблице Г.16а. Вычислив проекции этих функций относительно соединяющей переменной v2 , имеем v2 [ 1f ↓ { v2 }]( α ) α =0 0.6 1 0,4 2 v2 [ f ↓ { v2 }]( α ) а=0 0,55 1 0,45 Эта система локально не согласована, так как [ 1f ↓ { v2 }]( α ) ≠ [ 2f ↓ { v2 }]( α ) Пример Г.23. Понятно, что структурированная система с поведением, вероятностные функции поведения которой приведены в таблице Г.16,б, локально согласованная. Однако несложная проверка уравнений, определяющих реконструктивное семейство, показывает, что реконструктивное семейство является пустым. Например, требуется, чтобы вероятности состояний
Таблица Г.16. Пример несогласованных структурированных систем с поведением а) Локально несогласованная структурированная система v1 v2 1f(1c) v2 v3 1f(2c) 1
c=0 0 1 1
327
0 1 0 1
0.5 0.2 0.1 0.2
2
с=0 0 1 1
0 1 0 1
0.4 0.25 0.15 0.2
б) Глобально несогласованная структурированная система 1 1 v1 v2 f( c) v2 v3 2f(2c) v1 v3 2 3 0 1 0.7 с=0 1 0.3 с=0 0 1 0 0.3 1 0 0.7 0 1 1 0
3
f(3c) 0.4 0,3 0.3
001 и 011 согласно функциям lf и 2f были равны 0, и в то же время требуется, чтобы их сумма согласно функции 3f была равна 0.3. Таким образом, эта система глобально несогласованная. Локальные несогласованности в структурированных системах обычно возникают из-за того, что соответствующие их элементам функции поведения являются всего лишь оценками, полученными по ограниченным экспериментальным данным. Из таких несогла-сованностей (в отличие от глобальных) не следует, что сами исследуемые переменные являются несогласованными. Это просто отражение того факта, что информация о каждом подмножестве входящих в структурированную систему переменных неполная. Эта неполнота (т. е. наше незнание) и порождает локальные несогласованности, и, следовательно, можно и нужно работать с локально несогласованными структурированными системами. Иначе обстоит дело с глобальной несогласованностью. Глобальная несогласованность означает, что структурированная система плохо задумана; это математическая конструкция, не имеющая реального смысла. Превосходные примеры глобальной несогласованности целого при локальной согласованности можно найти в живописи. Например, это некоторые рисунки М. Эшера (скажем, его литография «Бельведер») и многие рисунки шведского художника О. Ретерсвярда, которые называют невозможными рисунками или японской перспективой. Понятно, что к локально несогласованным структурированным системам неприменимы обычные логические процедуры. Относиться к ним можно двояко: либо вообще отбросить такие структурированные системы, поскольку они не представляют никакую обобщенную систему, либо разрешить эти локальные несогласованности с помощью такой модификации заданных функций поведения, чтобы новые функции поведения были согласованными Таблица Г.17. Решение задачи оптимального разрешения локальных несогласованностей для функций поведения, приведенных в таблице Г.16а v1 v2 1fс(1c) v2 v3 1fс(2c) 1
c=0 0 1 1
328
0 1 0 1
0.5208 0.1875 0.1042 0.1875
2
с=0 0 1 1
0 1 0 1
0.3846 0.2404 0.1732 0.2018
и в некотором смысле как можно более близки к исходным. Обычно близость определяется через информационное расстояние. Полученная в результате структурированная система используется затем вместо исходной. Пусть дана локально несогласованная структурированная система с поведением SF={(xS,xF)|x∈ Nq} с вероятностными функциями поведения xf (x∈ Nq). Тогда задачу разрешения несогласованностей можно сформулировать следующим образом. Требуется определить функции поведения хfс того же вида, что и функции xf (x∈ Nq), так, чтобы функция (Г.47) ∑ D( xf ,x f c ) x∈N q
достигала минимума при ограничениях [ xf c ↓ x S ∩ y S ] =[ yf c ↓ x S ∩ y S ] для всех х,y∈ N q и
(Г.48)
f ( xc ) ≠ 0⇒ x f c ( xc ) ≠ 0 (Г.49) для всех состояний хс (x∈ Nq). Назовем ее задачей оптимального разрешения локальных несогласованностей. Согласно уравнению (Г.48) полученная структурированная система должна быть локально согласованная. Из утверждении (Г.49) следует, что любое состояние, возможное при исходной формулировке, не будет отброшено при модифицированной локально согласованной формулировке; это требование делает возможным использование простого информационного расстояния D (смотри уравнение (Г.40) или (Г.42) для функции (Г.47). Пример Г.2Г. Рассмотрим локально несогласованную структурированную систему с поведением, состоящую из двух элементов, чьи функции поведения приведены в таблице Г.16а. Решение задачи оптимального разрешения локальных несогласованностей для этих функций поведения дают функции поведения lfc и 2fс, приведенные в таблице Г.17. Легко убедиться в том, что эти функции локально согласованы и что D( 1f ,1 f c ) + D( 2f ,2 f c ) =0.0245. Интерес к задаче разрешения локальных несогласованностей был проявлен сравнительно недавно. Методологически эта проблема пока не разработана и является объектом активных исследований. x
329
ПРИЛОЖЕНИЕ Д МЕТАСИСТЕМЫ По кадру невозможно предсказать, О чем весь фильм, И с гусеницей кадр Нам не сулит рожденья мотылька, А бабочки полет не показать Единственным ее изображеньем.
Р. Бакминстер Фуллер
Д.1 Изменение и инвариантность Ученый стремится не столько описать неизменное, сколько найти неизменяющиеся описания меняющегося. Г. Спенсер Браун
Одной из основных способностей человека, и возможно самой существенной, является способность распознавать отличия. Наиболее элементарные проявления этой способности описываются в книге [127]: Отличие расщепляет мир надвое: на «это» и «то», «среду» и «систему», на «мы» и «они» и т. д. В человеческой деятельности различение занимает одно из самых важных мест и является, разумеется, одним из самых важных действий в науке о системах, поскольку любое определение системы есть различение собственно системы и ее среды. Отличия неразрывно связаны с намерениями. В частности, наиболее распространенным является случай, когда система определяет свои границы и пытается их поддерживать; это, видимо, соответствует тому, что мы называем самоосознанием. Подобное наблюдается и у отдельных личностей (самосохранение), и у социальных групп (клубы, субкультуры, нации). В этих случаях имеет место не только отличие, но и индикация, т. е. выделение одного из двух различаемых состояний как более важного («это», «я», «мы» и т. д.). В самом деле, целью различения является, как правило, именно такая индикация. Менее важным типом отличия является отличие, которое делается при самостоятельном определении цели: в основном при научных исследованиях, например тогда, когда какая-то дисциплина «определяет область своих интересов» или когда ученый определяет систему, которую он будет изучать. В любом случае установление границ системы неизбежно связано с тем, что мы называем когнитивной точкой зрения; ... в частности, оно связано с понятием ценности или пользы, а также с мыслительными способностями (чувствительностью, знаниями) того, кто определяет отличия. И наоборот, выделенные отличия обнаруживают уровень мыслительных способностей того, кто их сделал. Именно таким способом 330
биологические и социальные структуры проявляют свою связность и позволяют убедиться в том, что они обладают мыслительными способностями или что они до некоторой степени «ощущают».
Таким образом, распознавание различий, близкие (по смыслу) к отличиям, может быть двух типов. Можно распознать либо то, что две вещи являются различными, либо то, что одна и та же вещь меняется во времени (в терминологии УРСЗ, с точки зрения соответствующей базы или соответствующего параметра). Эти два понимания отличия теснейшим образом связаны и дополняют друг друга. Первое охватывает неизменные (инвариантные, постоянные) свойства вещей, а второе - те свойства, которые рассматриваются как временные (варьирующиеся, изменяющиеся). Важность понятия изменение, являющегося одним из производных от понятия отличие, выражена в литературе многими способами. Например, древнегреческому философу Гераклиту принадлежит знаменитое высказывание о том, что Ничто не постоянно, кроме изменений.
Джон Вильмонт, английский поэт XVII в., в одном из своих стихотворений выражает ту же мысль: Так как закон Природы — измененье, лишь постоянство вызывает изумленье
а Эдмунд Берк, английский государственный деятель, в 1774 г. в своей «Речи об американском налогообложении» высказал эту мысль на политическом языке: Государство, которое не может измениться, не может и сохранить себя.
Независимо от того, разделяем мы точку зрения Гераклита или нет, хотя бы из практических соображений необходимо считать, что некоторые характеристики среды являются неизменными. Если это невозможно, то невозможно также и передавать сообщения, поскольку отсутствуют идентифицируемые единицы, и на самом деле нельзя действовать осмысленным образом, поскольку ничто в среде нельзя считать истинным. Имеется несколько соображений, по которым можно определить инварианты в среде. Одно из таких очевидных соображений состоит в том, что изменения в среде происходят значительно медленнее, чем мы воспринимаем, думаем или действуем. Таким образом, на практике можно или пренебречь этими изменениями, или вообще их не замечать. Другое соображение заключается в том, что эти изменения происходят на таком уровне разрешения, что человек не может их наблюдать. Поэтому эти изменения, если они только не проявляются каким-то образом в диапазоне нашего восприятия, являются для нас несущественными. Можно выделить инвариантность другого типа, которая связана с процессом изменений, а не с тем, что меняется. В схеме УРСЗ этот тип инвариантности нашел свое отражение в понятии порождающей системы. Ее переменные изменяются, однако способ изменения, описываемый функцией поведения системы, параметрически инвариантен, то есть постоянен (неизменен) относительно параметрического множества. 331
Поиск инвариантностей составляет самую суть науки, о чем очень хорошо пишет Г. Спенсер Браун [57]: Наука занимается определением констант: это изучение неизменного. Если я брошу бомбу из окна верхнего этажа, то она будет падать вниз со все возрастающей скоростью. Это изменение скорости - проклятие для ученого. Он не успокоится до тех пор, пока не придумает, как описать это изменение неизменным образом. В данном случае долго искать решение не нужно. Скорость этой бомбы может меняться, но неизменной остается скорость ее изменения (называемая ускорением). Функция 32 фут/с 2 - это константа, описывающая поведение не только этой бомбы, но и всех других бомб, сброшенных поблизости. Мы говорим о функции 32 фут/с2 как об абсолютной константе, но если вдуматься, то это не так. Масса Земли понемногу увеличивается за счет захвата метеоритов и космической пыли. Следовательно, можно ожидать, что гравитационное ускорение будет со временем увеличиваться. Можно считать это увеличение «константой», но нет оснований считать, что и эта «константа» будет оставаться неизменной. Наша попытка исчерпывающего описания гравитационного ускорения оказалась неудачной. Может показаться, что положение можно исправить следующим образом Мы можем утверждать, что g зависит от заданных масс, расстояний и других факторов, которые называются соответствующими. Если соответствующие факторы определены, то мы в состоянии определить неменяющуюся константу. Однако теперь эта задача представляется чисто лингвистической: либо изменение этой константы, сделанное исходя из наблюдений и экспериментов, может быть объяснено нашим ошибочным определением соответствующих условий, при которых следует наблюдать эту константу. Другими словами, всегда существует «действительная» константа, к которой сходятся наши наблюдения; если нам даже покажется, что мы ее определили, впоследствии обнаружится, что мы нашли только некоторое ее приближение. Это похоже на философское понятие «вещь в себе» или «реальности вне проявления». Его можно было бы назвать «константой вне аппроксимации». Подобное предположение является частью научного подхода, и для определенных Целей этот подход, несомненно, удобен. Его плодотворность мы обсудим позже, а сейчас необходимо подчеркнуть, что законы природы — это всего лишь сделанные нами описания таких структур, относительно которых было выяснено, что они меняются, но только очень медленно. По существу, мы не располагаем свидетельствами того, что какая-то структура вообще не меняется... То, что мы замечаем, зависит от того, как и особенно как быстро меняемся сами. Например, замечаем вещи, которые меняются также медленно, как мы, или еще медленнее, но в общем случае не те, что меняются значительно быстрее. Таким образом, чем быстрее мы меняемся, тем больше мы замечаем. Если мы снимем на кинопленку растение со скоростью один кадр в минуту и прокрутим эту пленку со скоростью 30 кадров в секунду, то нам покажется, что это растение ведет себя как животное. Если поместить что-то рядом с ним, то растение явно ощутит это и отреагирует. Это, безусловно, чувствующее существо. Тогда почему в обычных условиях не кажется, что оно обладает чувствительностью? Возможно, дело в том, что оно слишком медленно думает. Для существ, которые реагируют в 1800 раз быстрее нас, мы тоже выглядим как лишенные чувств растения. В самом 332
деле, существа, двигающиеся так быстро, будут уверены в том, что мы лишены чувств, поскольку, как правило мы не будем ощущать их поведение. Их мимолетные появления не будут для нас ничего значить. Дерево не может почувствовать, что я прошел мимо, так же как я не могут почувствовать пролетевшую мимо меня пулю. Я должен ощутить определенные события, связанные с полетом пули, например простреленную руку. Точно так же, если моя прогулка была достаточно «разрушительной», то дерево ощутит определенные события, связанные с моей прогулкой, скажем сломанную ветку. Но то, что для дерева быстро, для меня медленно и скучно, а то, что происходит с обычной для меня скоростью, вообще находится за пределами мира дерева ... Тот, кто сможет двигаться бесконечно быстро, будет способен знать все, поскольку для него все будет находиться в состоянии покоя. Он будет располагать бесконечным временем для узнавания. А если ему будет позволено и самому перемещать частицы вселенной, то он станет не только всезнающим, но и всесильным, поскольку сможет сколь угодно долго изменять положение вещей. Мы видели, что наука всегда стремится описать изменение в виде неизменной формулы. Такая формула всегда может быть найдена, если изменение уже произошло, однако она не всегда применима к будущему. Если же изменяется само изменение, то нужна новая формула. Теперь мы в состоянии разделить задачу историка и задачу ученого. Мы видели, что ученый стремится зафиксировать неизменным образом меняющиеся явления, в то время как историк занимается только фиксированием изменений, которые уже произошли. Историк не занимается поиском формулы, которая была бы истинной на все времена. Еслид бы им когданибудь была обнаружена такая формула, то больше не потребовалось бы никаких новых записей, и он потерял бы работу. Повторяется не история, а наука. Ученый начинает с того, что вглядывается в сумбур изменений:? и что может фиксирует в виде формул. История — это то, что остается послед того, как ученый уже отобрал свое. Таким образом, история важнее науки, поскольку она дает первоначальноез понимание вещей. Но изучать ее не обязательно. То, что не изменяется (напри-мер, прошлое), не опасно. Оно не может нам повредить. Остерегаться следует того, что изменяется. А для того, чтобы приспособиться к изменениям и суметь их почувствовать, нужно быстро ощущать.
Понятно, что поиск инвариантностей, столь важный для науки, должен быть одним из главных компонентов УРСЗ. Некоторые виды параметрической инвариантности связаны с порождающими системами и структурированными порождающими системами. Они рассматриваются соответственно в гл. 3, 4. Однако они представляют собой только частные случаи общего понятия параметрической инвариантности, рассматриваемого в следующем разделе. Д.2. Первичные и вторичные характеристики системы
Закон тождественности не позволяет иметь пирог и есть его. Эйн Рэнд
333
Существовать — значит быть тождественным самому себе, что, в свою очередь, значит быть идентифицированным. Система обладает тождественностью, если определены какие-то ее характеристики. Характеристики, совокупность которых идентифицирует систему, будем называть первичными характеристиками. Любые другие характеристики системы, не участвующие в ее идентификации, назовем ее вторичными характеристиками. Таким образом, множество всех характеристик системы образует ее определение. Общим свойством эпистемологической иерархии систем является то, что множество первичных характеристик определенного уровня является подмножеством множества первичных характеристик всех более высоких уровней. На рис. Д.1 эти включения для нейтральных систем показаны вплоть до уровня структурированных систем с поведением. Аналогично можно представить эти включения для структурированных систем данных или структурированных исходных систем. Для этого нужно только исключить те характеристики, которые не входят в определения соответствующих систем (маски, функции поведения и функции данных); модификация этого рисунка для направленных систем тривиальна. Необходимым условием оперирования с системой при решении задачи является сохранение ее тождественности. Это значит, что первичные характеристики (но, разумеется, не вторичные) должны оставаться неизменными. Так, например, заданная система данных может быть дополнена функцией поведения, определенной по ее данным. Очевидно, что она является характеристикой данной системы данных. Однако, так как существует множество разных функций поведения, которые можно определить для одной и той же системы данных при разных масках и способах представления ограничений на переменные, эта функция не может быть использована для идентификации системы. Она является вторичной характеристикой системы, и, следовательно, ее можно изменять. Можно заменить одну функцию поведения другой, не изменив тождественности системы данных. Можно привести и обратный пример. Заданная система с поведением при разных начальных условиях может порождать разные наборы данных. Любой такой на- бор данных является вторичной характеристикой этой системы с поведением. Она остается неизменной независимо от того, какой набор данных рассматривается. На определенном этапе процесса решения задачи система обычно переопределяется в том смысле, что ее вторичные характеристики принимаются как первичные. Например, при эмпирическом исследовании система первоначально определяется как исходная, и это определение сохраняется на этапе сбора данных. После того как исследователь придет к заключению, что полученных данных достаточно, чтобы соответствующим образом описать переменные исходной системы, он может принять полученный массив данных в качестве первичной характеристики. Это означает, что он переопределил исходную систему в систему данных. Такое переопределение представляет собой шаг индукции, поскольку оно является следствием индуктивного действия, основанного, например, на предположении, что любой экземпляр возможного для переменных состояния имеется среди собранных данных или может быть выведен из них. Решение о переопределении исходной системы в систему данных в этом случае отражает уверенность исследователя в том, что имею334
щихся данных достаточно для целей исследования. Эта уверенность основывается не только на самих данных, но и на цели исследования, на представлении о том, как будут обрабатываться такие данные, на сравнении с аналогичными исследованиями, проведенными ранее, а также зависит от субъективных качеств самого исследователя (от его опыта в данной области, интуиции и тому по1S 1d 1M 1f добное). После переопределения исходной 1D 1F системы в систему данных исследование приобретает теоретический характер. Первой задачей такого исследова2S 2f 2M 2d ния является поиск такой порождающей системы, которая адекватно пред2D 2F ставляла бы систему данных. Любая функция поведения или ST-функция, • • • полученная по данным при различных масках, представляет собой втоqM qf q1S qd ричную характеристику этой системы данных. Если исследователь достаqD qF точно уверен в какой-то из этих функций, то может принять ее за Рисунок Д.1 - Отношение включения первичную характеристику и, таким первичных характеристик для эпиSFB с x ,y ( x, y ∈ N q ) образом, переопределить систему стемологической иерархии систем данных в порождающую систему. Это переопределение также содержит элемент индукции, поскольку принятая функция поведения или ST-функция по природе своей параметрически инвариантна, а следовательно, определение порождающей системы выходит за пределы заданного параметрического множества и различных начальных условий. С помощью другого шага индукции порождающую систему можно аналогичным образом переопределить в структурированную порождающую систему при условии, что реконструктивные свойства этой системы проанализированы. Переопределяются системы и в процессе проектирования. Предположим, что задача состоит в том, что заданную систему с поведением нужно реализовать в виде структурированной системы, состоящей из элементов определенных типов и удовлетворяющей определенным требованиям (целям, ограничениям). Характеристики структурированных систем, определяемых в процессе проектирования, рассматриваются как вторичные. Эти характеристики не изменяют тождественности заданной системы с поведением; их исходная система, маски и функция поведения остаются единственными первичными характеристиками в течение всего процесса проектирования. В результате обычно получается несколько структурированных систем. Если одна из них принимается в качестве решения, то ее можно переопределить как структурированную систему с поведением; она и будет служить основой при реализации проекта. B
B
B
B
B
B
335
Первичные характеристики как средства идентификации системы должны быть известны и параметрически инвариантны. К вторичным характеристикам подобные требования не предъявляются. Они могут быть или полностью неизвестны, или известны только частично и при этом не должны быть параметрически инвариантны. Если первичные характеристики системы каким-либо образом изменяются, то, по определению, система перестает быть тождественной самой себе и появляется новая система. С другой стороны, изменения вторичных характеристик не влияют на тождественность системы. Так, например, объем имеющихся данных не влияет на исходную систему, в то время как конкретная система Данных меняется при добавлении или исключении данных. Аналогичным образом система с поведением не меняется при замене ее текущего состояния другим состоянием или реализующей ее структурированной системы на другую, также реализующую ее структурированную систему. Параметрическая инвариантность является одним из свойств функций поведения. Здесь понятие инвариантности строго связано с конкретным параметрическим множеством, определенным как часть рассматриваемой исходной системы. Однако иногда бывает нужно использовать это понятие в локальном смысле— для некоторого подмножества, заданного параметрического множества. Такую инвариантность можно назвать локальной инвариантностью или субинвариантностью. Теперь рассмотрим множество функций поведения, определенных на одной исходной системе, причем эти функции только локально инвариантны и, следовательно, не полностью характеризуют переменные (и порождают их состояния) на всем параметрическом множестве исходной системы. Таким образом, эти функции не могут рассматриваться как первичные характеристики одной системы с поведением. Однако они в принципе могут быть интегрированы в большую систему. Для этого требуется описать процедуру замены одной функции поведения другой на параметрическом множестве. Назовем эту процедуру процедурой замены. Если некие функции поведения, которые являются параметрически инвариантными только локально, интегрируются с помощью соответствующей процедуры в одну систему, то для удобства их параметрическая инвариантность может быть распространена на все параметрическое множество. Подобное распространение не повлияет на интегрированную систему, так как процедура замены не позволяет использовать функцию поведения вне области ее локальной инвариантности. Таким образом, интегрированную систему удобно рассматривать как множество функций поведения и процедуру замены. Предложенный метод интегрирования систем с поведением подходит и для других типов систем. В следующем разделе мы введем, формализуем и рассмотрим различные категории интегрированных систем. Д.3. Метасистемы 336
Естественные явления представляются нам осмысленными не только тогда, когда нам удается найти связь между их кратковременными существованиями, но и тогда, когда мы, руководствуясь определенным подходом, синтезируем их изменения во времени. Амос И Цао Чжан
Один из способов интегрирования нескольких сопоставимых систем в большую систему состоит в образовании структурированной системы, как это описано в главе 4. Другой способ интегрирования систем состоит в определении соответствующей процедуры, как это предлагается в данном разделе. Интегрированные таким образом системы будем называть метасистемами. В термине «метасистема» используется греческий префикс мета. По гречески он имеет три значения: 1. «Мета X» называется то, что наблюдается (имеет место) после X, то есть X является предпосылкой мета X. 2. Выражение «мета X» показывает, что X меняется и служит общим названием этого изменения. 3. «Мета X» используется в качестве названия того, что вышеX в том смысле, что оно более высоко организовано, имеет более высокий логический тип или рассматривается в более широком смысле. Мы видим, что термин «метасистема» в приложении к системам, соединяющим с помощью соответствующей процедуры замены несколько систем, включает все три смысла этого понятия. Понятно, что: 1) метасистема может быть определена только после того, как определены другие типы систем; 2) эта система описывает изменение — замену одной системы другой; 3) она выше отдельных систем — процедура замены делает ее чемто большим, чем набор отдельных процедур. Таким образом, название «метасистема» вполне обоснованно. Метасистемы вводятся в основном для описания изменений при заданном параметрическом множестве тех системных характеристик, которые определяются как параметрически инвариантные. Такими характеристиками являются множества переменных и соответствующие множества состояний и каналов, функций поведения и ST-функций и соединения структурированных систем. Метасистемы могут быть определены через системы любого из трех определенных ранее типов. Включенные в метасистему системы будем называть элементами. Они должны быть сопоставимы в том смысле, что должны иметь один тип базы (время, пространство, группа). 337
Для обозначения метасистем будем использовать (подобно оператору S для структурированных систем) оператор М следующим образом: помещенный перед обозначением системы определенного типа, он означает метасистему, элементами которой являются системы данного типа. Напри) мер, MFB, MFB и MSD - это метасистемы, элементами которых являются соответственно нейтральные системы с поведением, направленные системы с поведением и структурированные системы данных (нейтральные). Для формального определения метасистем рассмотрим сначала метасистемы, элементами которых являются нейтральные системы с поведением, то есть метасистемы MF B . Всякая метасистема этого типа определяется как тройка: MFB=(W, FB , r), (Д.1) где W - параметрическое множество; FB — множество нейтральных систем с поведением, чьи параметрические множества являются подмножествами W (но не обязательно точными); r - процедура замены, реализующая определенную функцию вида r: W→FB. (Д.2) Назовем функцию (Д.2) функцией замены. Важно понимать, что эта функция не обязательно должна быть явно включена в метасистему. Требуется только, чтобы была задана процедура, представляющая определенную функцию вида (Д.2), даже если невозможно или трудно определить, какую функцию она реализует. Можно, разумеется, определить функцию замены и явно. В этом случае процедура замены идентична функции замены или ею определяется. Этот подход будет продемонстрирован в этом разделе на нескольких примерах. Можно легко модифицировать уравнение (Д.1), определяющее метасистему нейтральных систем с поведением так, чтобы оно подходило и для других систем. Для этого нужно заменить обозначения MFB и FB на обозначения, представляющие другие системы. Для удобства договоримся, что множество систем определенного типа обозначается прописной рукописной буквой, соответствующей системам этого типа. Тогда, например, MSFS=(W, SFS , r), ) ) M D = (W, D , r) является соответственно определением метасистемы структурированных (нейтральных) систем и определением метасистемы направленных систем данных. Нетрудно дать определения и остальных типов метасистем. Вообще говоря, можно определить метасистему и для множества систем разных типов. Обозначим MX подобный общий тип метасистем. Тогда MX=(W, X , r ), (Д.3) где X - произвольное множество систем, чьи параметрические множества являются подмножествами W; r - снова процедура замены, которая должна реализовывать определенную функцию замены r:W→X. (Д.4) 338
В общей формулировке метасистемы (Д.4), элементами которой являются системы одного типа, могут рассматриваться как частные случаи системы (Д.3), где X ∈ { G , D , FB , FS ,GG ,GD ,GFB ,GFS }; ) ) ) ) ) ) ) ) ) X = { G , D , FB , FS ,GG ,GD ,GFB ,GFS } 7ч;16ч
Рисунок Д.2. Метасистема управления движением (пример Д.1)
23 ч
9ч;18ч
Процедуры замены
соответственно для нейтральных и направленных систем. Такие метасистемы будем называть гомогенными метасистемами. Процедуры замены, являющиеся, очевидно, первичными характеристиками метасистемы, могут быть определены различными способами. Они допускают даже случайный выбор. Единственное условие состоит в том, что процедура замены должна реализовывать определенную функцию замены общего вида (8.4). Приведем несколько примеров, показывающих типичные способы определения функций замены. Пример Д.1. В этом примере описывается работа светофоров на перекрестке в течение суток. Описание представляет собой гомогенную метасистему, состоящую из трех элементов, определенных как системы данных. Все три элемента содержат одни и те же переменные и множества состояний. Переменные описывают сигналы светофоров для транспортных потоков с севера на юг, с юга на север, с востока на запад, с запада на восток, обозначенные соответственно СЮ, ЮС, ВЗ и 3В, а также сигналы для левых поворотов с севера на восток, с юга на запад, с востока на юг, с запада на север, обозначенные соответственно СВ, ЮЗ, ВЮ и ЗС. Параметром является время; единицей измерения времени — секунда, соответствующие интервалы времени измеряются в секундах. На рисунке Д.2 приведены матрицы данных d1, d2, d3 для трех элементов D1, D2, D3; их временные множества определены непосредственно соответствующими интервалами времени. Матрицы данных периодические и задаются одним периодом. Как показано в таблице Д.1, системы D1 D2 и D3 определяют управление движением ночью, днем и в часы пик. Эти системы, рассматриваемые как элементы метасистемы, заменяют одна другую в определенные моменты времени в течение суток. Функцию замены в данном случае удобно представить в виде помеченной диаграммы, изображенной на рисунке 8.2. Ее узлами являются элементы данной метасистемы, стрелка из Di в Dj (i,j = 1, 2, 3) показывает, что Di заменяется на Dj, а метка стрелки указывает на момент време339
ни, в который происходит эта замена. Таким образом, данная метасистема представляет собой тройку MD= (T, G = { D 1 D 2 , D 3 }, r), где D и r полностью определены в таблице Д.1, а T состоит из 5760 определенных интервалов времени суток (420 периодов d1, 390 периодов d2 и 240 периодов d3). Таблица Д.1. Метасистема управления движением ti ∈ СВ- ЮЗ СЮ-ЮС ВЮ-ЗС ВЗ-ЗВ
Элемент Di: управление движением ночью [0, 20) [20, 30) [30, 50) [50, 60) 3 ж к к 3 ж к к к к 3 ж к к 3 ж
Элемент D2: управление движением в нормальных условиях ti∈ [0, 15) [15, 25) [25, 55) [55, 65) [65, 80) [80, 90) [10, 110) [110,120) СВ-ЮЗ 3 ж к к к к к к СЮ-ЮС к к 3 ж к к к к ВЮ-ЗС к к к к 3 ж к к ВЗ-ЗВ к к к к к к 3 ж Элемент D3: управление движением в часы пик [30, 40) [40, 50) [50, 60) ti ∈ [0, 30) СВ-ЮЗ к к к к СЮ-ЮС 3 ж к к ВЮ-ЗС к к к к ВЗ-ЗВ к к 3 ж Пример Д.2. Рассмотрим больного, у которого время от времени почки перестают функционировать соответствующим образом. Наблюдение за состоянием больного ведется по нескольким переменным. При необходимости работу почек берет на себя искусственная почка или устройство для гемодиализа. При работе искусственной почки контроль осуществляется по нескольким дополнительным переменным. Таким образом, при наблюдении за больным имеются две исходные системы, скажем S1 и S2. Одна из них связана с теми периодами, когда почки работают нормально, а другая — с периодами, когда больному подключают искусственную почку. Система S1 состоит из четырех переменных: v1 - вода в урине (измеряется с точностью 0,1 л в диапазоне 0 - 1 л ) ; v2 - глюкоза в урине (измеряется с точностью 20 г в диапазоне 0—200 г); v3 - мочевина в урине (измеряется с точностью 5 г в диапазоне 0—50 г);
340
v4 — содержание азота в крови (канал наблюдения дает только два состояния 1 и 0 в зависимости от того, достигает ли содержание азота 150 мг на 100 мл крови или нет). В систему S2 входят все перечисленные выше переменные, а также две дополнительные: v5 — температура крови (измеряется с точностью 0,2° F в диапазоне (7— 100° F); v6 — кровяное давление (измеряется с точностью 2 мм ртутного столба в диапазоне 110—130 мм). Значения этих переменных искусственная почка должна поддерживать в определенном узком диапазоне. Все введенные переменные наблюдаются во времени. Реально моменты времени определяются тяжестью состояния пациента и другими факторами, которые нет необходимости рассматривать в данном примере. Эти две исходные системы можно рассматривать как метасистему со следующей процедурой замены r; если v4=1, заменить S1 на S2; если v4=0, заменить S2 на S1. Таким образом, данная метасистема представляет собой тройку
M S = ( T , G = { S 1 , S 2 }, r), где Т — объединение временных наборов S1 и S2. Пример Д.3. Рассмотрим структурированную систему, элементы которой образуют массив п × п. Пусть каждый из ее элементов, часто называемых ячейками, соединен только с соседними ячейками из массива. Пример такого массива 5 × 5 приведен на рисунке 8.3. Ячейки массива удобно идентифицировать двумя целыми числами i ,j ∈ N 0 ,n−1 , указывающими номера соответственно строки и столбца. На рисунке Д.3 также показано, что ячейку можно идентифицировать и одним целым числом c= ni + j. Будем называть с идентификатором ячейки. Допустим, что внутренняя среда ячейки (за исключением пограничных ячеек) состоит из четырех ее соседних ячеек, как это показано на рисунке Д.4. Такая ячейка имеет четыре входные переменные vc-n , vc-1 , v6c+1 , vc+n - по одной на каждую соседнюю ячейку и одну выходную переменную, соединенную со всеми соседними ячейками. Понятно также, как определяется внутренняя среда для пограничных ячеек, то есть ячеек из строк 0, п - 1 и столбцов 0, п - 1. Предположим, что все ячейки из массива, скажем изображенного на рисунке Д.3, представляют собой детерминированные направленные системы с поведением, определенные на одном и том же полностью упорядоченном временном множестве Т с функцией поведения f B = f c ( vc −n , vc −1 , vc +1 , vc + n ), (Д.5) где v’c - следующее состояние переменной vc;c∈ N0,24 разумеется, для пограничных ячеек определение этой функции должно быть уточнено, поскольку у этих ячеек отсутствуют некоторые входные переменные. Допустим далее, что 341
каждая из переменных имеет только два состояния 0 или 1. Если vc=1, будем называть ячейку с активной (если vс=0, пассивной). Для заданного массива ячеек можно определить множество структурированных систем, где каждая система описывается подмножеством ячеек этого массива. Так, например, для массива ячеек, изображенного на рисунке Д.3, суj =0
1
2
3
4
i=0 0
1
2
3
4
1 5
6
7
8
9
2 10
11
12
13
14
3 15
16
17
18
19
4 20
21
22
23
24
Рис. Д.3. Массив ячеек 5X5 (пример Д.3) ществует 225 (то есть более 3,3·107) структурированных систем. Иногда нужно объединить структурированные системы из этого множества, назовем его множеством GFS, в метасистему ) ) MS F S=(T, GFS , r ). (Д.6) с помощью соответствующей процедуры замены. В качестве простого примера процедуры r из определения (Д.6) можно предложить следующий: ячейка с ( c ∈ N 0 ,24 ) включается в структурированную систему тогда и только тогда, когда или она сама является активной, или активна по крайней мере одна ячейка из ее внутреннего окружения, т. е. тогда и только тогда, когда v c − n + v c −1 + v c + v c + n ≥ 1 . Для демонстрации конкретной процедуры типа (Д.6) воспользуемся предложенной процедурой замены и функцией поведения для массива 5 × 5, имеющей вид v'с= [ (vc-5+vc-1+vc+1) (mod 2) +vc+vc+5] (mod 2). Если какие-то переменные недоступны для определенной ячейки, то они просто исключаются из этой формулы. Для каждой начальной структурированной системы данная метасистема порождает последовательность структурированных систем. Короткие фрагменты трех таких последовательностей показаны на рисунке Д.5. Черные и серые клетки - это ячейки, входящие в структури342
рованную систему, причем черные клетки - активные ячейки, а серые - пассивные; белыми клетками обозначены ячейки, не входящие в структурированную систему. Разнообразие введенных в данном примере метасистем объясняется использованием различных функций поведения и процедур замены. Еще большего разнообразия можно достигнуть за счет использования разных массивов, в общем случае k - мерных, где k ≥ 1. Элементы этого класса метасистем известны в литературе как клеточные автоматы.
Рисунок Д.5 - Фрагменты трех последовательностей структурированных систем, которые могут быть порождены метасистемой, описанной в примере Д.3 Пример Д.4. Рассмотрим систему, состоящую из одной переменной v с множеством состояний V и одного параметра t, представляющего собой индекс, определяющий позицию в строках сoстояний V. Полностью упорядоченное параметрическое множество Т — это множество неотрицательных целых чисел. Для этой системы может быть определен класс метасистем типа MD = (T, D, r) таким образом, чтобы: D представляла собой множество всех систем данных, которые могут быть образованы переменной v для всех возможных подмножеств Nn из множества Т (n = 1, 2, . . . ) ; r представляло процедуру замены, в общем случае определенную следующим образом: задана система данных D ∈ D 343
с массивом данных d; массив d просматривается в порядке возрастания параметра (обычно слева направо) и заменяется на d' с помощью подстановки вместо каждого состояния α из d строки состояний р( α ) , определяемой функцией p :V → V ∪V 2 ∪K∪V k (Д.7) для некоторого конечного k; d' определяет новую систему данных D'∈ D . В литературе такие метасистемы называются развивающимися OLсистемами (или системами без взаимодействий Линденмайера). Пары α , р( α ) обычно называются продукционными правилами и обозначаются α → p( α ). В качестве конкретного примера детерминированной OL-системы (или в нашей терминологии метасистемы) положим V = N0,9 и пусть функция продукционного правила p :V → V ∪V 2 определяется таблицей α 0 1 2 3 4 5 6 7 8 9 р( α ) 12 93 49 61 25 87 78 34 9 9
Тогда, например, для начальной системы данных с массивом данных [0] эта метасистема порождает последовательность систем данных со следующими массивами данных: Для недетерминированных OL-систем продукционные правила [0] [12] [9349] [961259] [9789349879] [93499612599349] [9612599789349879961259] [9789349879934996125993499789349879] определяются не функцией вида (8.7), а множеством пар ( α , β ) из декартового произведения V × ( V ∪ V 2 ∪ K ∪ V k ). Выбор определенных продукционных правил может быть основан на условных вероятностях β при заданном α .
Д.4. Метасистемы и структурированные системы Бабочка-однодневка не знает ни начала, ни конца лунного месяца; пятнистая цикада не знает ни весны, ни осени... Чжуан-цзы 344
Структурированные системы и метасистемы - это две схемы интегрирования других систем (исходных систем, систем данных и порождающих систем). Это разные схемы, они независимы и ни одна из них не имеет преимущества перед другой. Более того, их можно комбинировать, то есть применять одну к другой. В структурированных системах интегрирование осуществляется по множествам переменных в предположении, что все они имеют одно и то же параметрическое множество. Таким образом, элементами структурированных систем являются системы с разными множествами переменных, но с одинаковыми параметрическими множествами. В метасистемах, напротив, интегрирование систем осуществляется по параметрическим множествам независимо от того, имеют эти системы одно множество переменных или нет. Следовательно, элементами метасистем являются системы с разными локальными параметрическими инвариантами, определенными на обобщенном параметрическом множестве; они могут быть определены и для одного обобщенного множества переменных. Как было показано в разделе Д.3, метасистемы можно использовать для интегрирования структурированных систем, которые в свою очередь, используются для интегрирования других систем. Примером тому служит класс метасистем из структурированных систем с поведением (клеточных автоматов), рассмотренный в примере Д.3. ) Такие системы обозначаются как системы типа MS FS , причем в этом обозначении используются оба символа интегрирования М и S. Структурированные системы можно также использовать для интегрирования метасистем, определенных для различных множеств. В обозначении таких систем оператор S предшествует оператору М. Так, например, SMFB обозначается структурированная метасистема, элементами которой (т. е. элементами метасистем, объединенных в структурированную систему) являются нейтральные системы с поведением, a MSFB обозначается метасистема, элементами которой являются структурированные системы с поведением. Следовательно, эти операторы некоммутативны. Системы MSX и SMX (для любого X) не только различны, но и не сопоставимы в смысле упорядочения в соответствии с эпистемологической иерархией систем. Пример Д.Д. Рассмотрим направленную структурированную систему, состоящую из двух метасистем, элементами которых являются направленные сис) темы с поведением. Эти метасистемы 1М FGB и 2MFGB соединены так, как это показано на схеме на рисунка Д.6,а. Каждая метасистема состоит из двух направленных систем с поведением, переменные которых имеют два состояния 0 и 1 с одним и тем же полностью упорядоченным параметрическим множеством. Системы с поведением для каждой метасистемы имеют одинаковую маску, но разные функции поведения. Маски 1М и 2М приведены на рисунке Д.6,б. Выборочные переменные, наблюдаемые в обеих системах, имеют, как это требуется для структурированных 345
систем, одинаковые идентификаторы. Соответствующая маска используется в обеих системах, входящих в одну метасистему. Функции поведения (порождающие функции) являются детерминированными, т. е. порождающие переменные в обеих системах с поведением являются функциями порождающих и входных выборочных переменных. Эти функции приведены на рисунке Д.6,б. Функции поведения для первой метасистемы обозначены 11 f GB ,12 f GB , а для второй метасистемы - 21 f GB ,22 f GB . В обеих метасистемах используются процедуры замены одного типа: если все входные и порождающие переменные имеют состояние 0, то первая система с поведением заменяется второй; 11
s4
ρ = -1
0
v1
1
4
v2
2
5
1
=M
1
MFGB
s5
1
MFGB s6
a)
ρ = -1
0
v2
2
5
v3
3
6
б)
β =2M
f GB ( α )
f GB ( α
s1 0 0
s2 0 0
s4 0 1
s5 0 1
s5 0 0
0 0
1 1
0 1
1 0
0 1
1 1
0 0
0 1
1 0
0 1
1 1
1 1
0 1
0 1
1 1
21
f GB ( β )
s2 0 0 0 0 1 1 1 1
s3 0 0 1 1 0 0 1 1
s5 0 1 0 1 0 1 0 1
s6 1 0 0 1 0 1 1 0 в)
346
12
22
f GB ( β )
s6 1 1 1 1 0 1 1 0
Рисунок Д.6 - Структурированная метасистема (пример Д.5) если все входные и порождающие переменные имеют состояние 1, то вторая система заменяется первой. Если этот алгоритм применить к соответствующим переменным, то будут получены процедуры 1r и 2r, показанные на рисунке Д.6,г.
t = v1= v2= v3=
1 1 2 2 1 2 3 4 5 0 1 0 0 1 0 1 0 0 0 0 0 0 1 1 1 1 2 2 Начальное условие
2 6 1 1 1 2
Номер функции поведения для метасистемы 1MFGB 2 2 1 1 1 1 2 2 2 2 1 7 8 9 10 11 12 13 14 15 16 17 0 1 1 0 1 0 0 0 1 1 1 ... 1 1 1 0 1 0 0 0 0 1 1 ... 0 1 0 0 0 0 1 1 1 1 0 ... 1 1 1 1 1 1 2 2 2 2 1 Номер функции поведения метасистемы 2MFGB
Рисунок Д.7 - Пример данных, порождаемых структурированной метасистемой, изображенной на рисунке Д.6 (пример Д.5) На рисунке Д.7 показан образец данных, порожденных этой cтpyктурированной метасистемой при начальном условии s 1 = s 2 = s 3 = 0 и определенной входной последовательности (последовательности состояний переменной v 1 ). На рисунке Д.7 также указано, какая из двух функций поведения каждой из метасистем используется при соответствующем значении параметра t. Д.5 Многоуровневые метасистемы
До тех, пор, пока тождества сохраняются, они представляют собой правильные законы. Если же они нарушаются, то эти законы следует модифицировать. Однако сама такая модификация может быть закономерной. Частное изменение может выявить закон изменения и даже подобные законы изменения сами могут меняться. Альфред Норт Уайтхед
Теперь мы можем определить многоуровневые метасистемы точно так же, как были определены многоуровневые структурированные системы 347
(раздел Г.4): это метасистемы, элементами которых являются метасистемы, элементами которых... и так далее. Такая рекурсия заканчивается на элементах, которые не являются метасистемами. Продолжая аналогию со структурированными системами, будем обозначать многоуровневые метасистемы обобщенным оператором, где Мk число уровней метасистемы. Так, например, M3D обозначает трехуровневую метасистему, конечными элементами которой являются системы данных; это метасистема, элементами которой являются метасистемы, элементами которых снова являются метасистемы, элементами которых являются нейтральные системы данных. Двухуровневые метасистемы можно для удобства называть мета-метасистемами. Формально k-уровневая метасистема определяется как тройка MkX = (Wk, Mk-1X, rk) (Д.8) где Wk - ее параметрическое множество; rk - процедура замены; Mk-1X - множество ее элементов (метасистем уровня k — 1) чьими конечными элементами являются системы из множества X, не являющиеся метасистемами. Для многоуровневой метасистемы МkХ первичной характеристикой, по которой определяется тождественность системы, является процедура замены только самого высокого уровня (rk). Процедуры замены более низких уровней представляют собой вторичные характеристики, так как с точки зрения метасистемы МkХ они определяют только локальную параметрическую инвариантность. Пример Д.6. Рассмотрим двухуровневую метасистему (или мета-метасистему) ) ) ) ) M 2 S FS = ( T , M G FS = { I M S FS , 2 M S FS } , r 2 ) , с параметрическим множеством T; первый элемент этой метасистемы ) 1 MS FS - метасистема, описанная в примере Д.3 (клеточный автомат). Второй элемент (вторая метасистема) имеет вид ) ) 2 MS FS =(Т, G FS , 2 r ), ) ) причем Т и G FS те же, что и в метасистеме 1MS FS , а 2r представляет собой следующую процедуру замены: выбирается случайным образом активная ячейка, затем она делается пассивной и из структурированной системы исключаются те ячейки внутренней среды этой ячейки (включая и саму эту ячейку), которые являются пассивными и у которых все соседи пассивны. Эти метасистемы интегрируются в мета-метасистему с помощью следующей процедуры второго уровня (или метапроцедуры) r 2: если структурированная система при значении параметра t - 1 отличается от структурированной системы при значении t - 2, то использовать метаси) ) стему 1 МS FS , в противном случае использовать метасистему 2MS FS . Пример Д.7. Рассмотрим развивающуюся OL-систему (пример Д.4), определенную как метасистему. Она состоит из двух метасистем 348
(Д.8)
1
MD = ( T , D ,1 r ),
MD = ( T , D ,2 r ), отличающихся только процедурами замены 1r и 2r. Их компоненты Т и D те же, что и в примере Д.4, только V={0, 1, 2, 3}. Процедуры замены 1r, 2 r определяются следующими функциями 1 р и 2р: 0 1 2 3 α 0 1 2 3 α 1 2 р (α ) 01 20 30 32 р (α ) 01 21 30 32 1
Тогда мета-метасистема M2D определяется как М 2 D=(T, { 1 MD, 2 MD},r 2 ), причем метапроцедура r2 определяется следующим образом: просматривается последний полученный массив данных; если не меньше половины элементов массива равно 0, то используется метасистема 1MD (функция 1р); в противном случае - метасистема (функция 2р). Например, для начального массива данных [0] метасистема 1MD порождает следующую последовательность массивов: [0] [01] [0 1 2 0] [01203001] [0120300132010120] [01203001320101203230012001203001] Метасистема 2MD порождает другую последовательность массивов [0] [01] [0121] [01213021] [0121302132013021] [01213021320130213230012132013021] Мета-метасистема M2D порождает другую последовательность; массивов (в каждом случае показано, какое продукционное правило было использовано): [0], 1p [0 1], 1p [0 1 2 1], 2р [0 1 2 0 3 0 2 0], 1р [0 1 2 1 3 0 0 1 3 2 0 1 3 0 0 1], 2р [01203020320101203230012032010120], 2р 349
> *
Многоуровневые метасистемы можно комбинировать с многоуровневыми структурированными системами в любой последовательности. Единственное требование состоит в том, чтобы элементами метасистем или структурированных систем нижнего уровня были системы одного из трех основных типов - исходные системы, системы данных и порождающие системы. На языке УРСЗ вполне адекватно можно описать систему MSMSF B , M 2 S 2 SD или M2S2MSS. Д.6. Идентификация изменения
Мы понимаем, что происходит изменение только потому, что что-то остается неизменным, а неизменность определяется только на фоне преобразования. Джеральд Уейнберг
Многообразие способов, которыми можно определить метасистемы с разными типами элементов и различным числом уровней продемонстрировано в разделах Д.3 - Д.5 на нескольких показательных примерах. Однако задача получения соответствующего метасистемного описания исследуемых переменных по имеющимся данным является одной из наиболее сложных и наименее разработанных системных задач. Своим возникновением эта задача обязана одному из фундаментальных вопросов исследования систем: должны ли ограничения на исследуемые переменные рассматриваться как параметрически инвариантные или только как меняющиеся в соответствии с некими параметрически инвариантными правилами изменения (процедуры замены)? Трудность состоит в том, что на этот вопрос нет однозначного ответа. Выбор той или иной точки зрения зависит не только от природы самих переменных, но и от целей исследования, от того, каким образом заданы ограничения (в виде маски, степени ограничения), являются данные полными или нет, и от других факторов, в частности связанных с контекстом исследования. Если выбран определенный способ представления ограничений (например, вероятностные меры и наибольшая приемлемая маска) и используются обычные целевые критерии порождающей нечеткости и сложности, то эта задача сводится к определению изменения функции поведения. Другими словами, она становится задачей определения существенных локальных ограничений на переменные на рассматриваемом параметрическом множестве. Если функция поведения, представляющая все параметрическое множество (глобальная функция), несильно отличается от функций поведения, соответствующих различным подмножествам параметрического множества, то нет необходимости в использовании формализма метасистем. Но если между этими функциями имеются существенные различия, то следует рас-
350
смотреть вопрос об использовании такого формализма. Однако применение этого подхода встречает некоторые трудности. Прежде всего следует неким конструктивным образом определить, что понимается под «существенным различием функций поведения». То есть для придания понятию «разница» конкретного смысла необходимо выбрать функцию расстояния для функций поведения. Кроме того, нужно задаться каким-то пороговым значением расстояния для определения того, что это расстояние «существенно». Несмотря на то, что принятие этих решений предоставляется пользователю, УРСЗ должен располагать неким вариантом решений, которые используются по умолчанию (при наличии соответствующего запроса). Во-вторых, разница (расстояние) между локальной и глобальной функциями поведения может считаться существенной только в том случае, когда локальная функция определена на достаточно большом подмножестве параметрического множества. И снова должно быть принято решение, какой наименьший размер подмножества параметрического множества может считаться достаточным, чтобы на нем можно было бы определить содержательную локальную функцию поведения. Размер этот зависит от числа состояний переменных, от меры, с помощью которой задаются ограничения на переменные, от используемой маски и, возможно, от каких-то других факторов. Помимо отмеченных теоретических проблем, в задаче определения существенных локальных ограничений имеются и трудности практического характера. Они связаны прежде всего с тем, что число подмножеств параметрического множества, рассматриваемых в процессе определения существенных программных ограничений, с ростом параметрического множества растет экспоненциально. Как следствие с ростом параметрического множества лавинообразно растет число необходимых вычислений, так что эта задача становится неразрешимой даже для параметрических множеств относительно небольшого размера. В заключение этого раздела опишем простую процедуру определения локальных ограничений. Будем называть ее процедурой идентификации метасистемы. Эта процедура использует предположение о том, что параметрическое множество Т полностью упорядочено и что переменные описываются системой данных. Эта процедура или не определяет никакой метасистемы (если не находится существенных локальных ограничений), или определяет метасистему, состоящую из последовательности определенных на параметрическом множестве систем с поведением. Замена одной системы на другую происходит при определенных значениях параметра, которые вычисляются этой процедурой. Даны: система данных с полностью упорядоченным параметрическим множеством T = Nn, маска (обычно наибольшая допустимая) и определенный способ представления ограничений на переменные (со своей мерой порождающей нечеткости). Процесс идентификации метасистемы состоит в следующем. Шаг 1. Пусть дано целое число m, рациональное число ∆ и известно, что t =1, k=1. Шаг 2. Необходимо определить функцию поведения для подмножества данных, соответствующих отрезку [t, t+m] параметрического множества, и вычислить ее порождающую нечеткость U1. 351
Шаг 3. Затем надо увеличить k на 1; если t+km∉T, то перейти на шаг 6. Шаг 4. Определить функцию поведения для подмножества данных, соответствующего отрезку [t, t+km] параметрического множества, и вычислить ее порождающую нечеткость Uk . Шаг Д. Если | Uk - Uk-1/max (Uk, Uk-1)<∆, то перейти на шаг 3; иначе записать t+(k—l ) m в качестве аппроксимированной точки замены элементов метасистемы, t=(k—l)m, k присвоить значение 1 и перейти на шаг 2. Шаг 6. Стоп. В основе этой процедуры лежит следующее наблюдение: если данные не имеют существенных локальных ограничений, то порождающие нечеткости локальных функций поведения для отрезков [1, t] с ростом t быстро сходятся (после некоторых начальных возмущений) к значениям, лежащим в малом интервале ∆; напротив, если данные содержат существенное локальное ограничение, например, на отрезке параметрического множества [t1, t2], то порождающие нечеткости обычно демонстрируют значительно превосходящие ∆ колебания около значений параметра t1 и t2, а внутри отрезка [t1, t2] снова находятся внутри небольшого интервала. Таким образом, существенные вариации порождающей нечеткости после того, как она колебалась в небольшом интервале, позволяют считать данную систему метасистемой, каждый элемент которой соответствует некоему подмножеству параметрического множества. Чувствительность и вычислительная сложность данной процедуры существенным образом зависят от выбранных значений m и ∆. Для оказания помощи пользователю в выборе этих значений УРСЗ должен располагать соответствующими характеристиками, полученными в результате вычислительных экспериментов, подобных тем, что описаны в главе 4 для анализа реконструируемости. Можно также выполнить эту процедуру несколько раз при разных значениях m, ∆ и усреднить полученные результаты. Как бы то ни было, эта процедура определяет возможные точки замены только приблизительно. Для более точного определения и оценки их существенности необходимо провести более общее исследование. Пример Д.8. В данном примере описывается применение процедуры идентификации метасистемы при оценке работы пилотов в процессе их тренировки на летных тренажерах. Исходная система состоит из четырех переменных,
Таблица Д.2 - Описание системы, рассматриваемой в примере Д.8 Характеристика: Переменная: Единицы:
352
Каналы наблюдения Скорость Высота над Курс Расстояние уровнем моря s a r d Узлы Футы Градусы Мор. мили относительно магнитного
Интерпретация состояний
1 2 3 4 5 6 7
[150, 170) [170, 220] [220, 250) [250—270) ≥270 — —
[1700—1840) [1840—2400] [2400—2700) [2700—4900) [4900—6900) [6900—22800) >22800
севера [0—93) [0-2,6) [93—113] [2,6-14) [113—122) [14—21) [122—360) >21 — — — — — —
Матрица данных s 444455555555555555555555555555555555555555555554444444333 а 777666666666666666666666666666666666666666666666666655555 r 211111111111111111111111111111111111111111111111111111222 d 444444444444444444444444444444444444433333333333333333333 s 333333333333332222222222222111111111111111111111111111111 а 555555555555444444444444444444333333333333333333333333333 r 222333333333333333333333333333333333333333333333333333333 d 333333333333333322222222222222222222222222222222222222222 s 1111111111111112222233333333333333333333333333333 а 3222222111111112222223334444444444444444444444444 r 3333333333333333333344444444444444444444444444444 d 2222222222111111111111111111222222222222222222222
описывающих соответствующие характеристики реактивного самолета; параметром является время. Не вдаваясь в технические подробности, будем каждую переменную описывать ее идентификатором, соответствующей характеристикой и множеством состояний: s — скорость, множество состояний N5; а — высота, множество состояний N7; r — курс, множество состояний N4; d — расстояние, множество состояний N4. Каналы наблюдения и матрица данных для этих переменных приведены в таблице Д.2. Матрица, в которой данные представлены в порядке возрастания времени, описывает типичный (идеальный, правильный) способ захода на посадку реактивного самолета. Весь период захода на посадку разделен на 163 равных временных интервала, и для каждого определены соответствующие состояния переменных. Матрица данных, приведенная в таблице 8.2, является своего рода эталоном, по которому оценивается работа тренирующихся летчиков. И для курсантов, и для инструкторов желательно, чтобы вся задача была естественным образом разбита на подзадачи так, чтобы было легче локализовать ошибки. 353
s s
Процедура модификации метасистемы была а матрице данных, приведенной в таблице Д.2 для применена к r вероятностной функции поведения, маски из двух столбцов и d ∆=0.1. Процедура выполнена для нескольких значений Полученные для разных значений т точки замены были т. затем усреднены. В результате получена метасистема, состоящая из трех элементов, определенных соответственно на следующих отрезках времени: 1—70, 71—122, 123—163. На самом деле, три этих элемента являются естественными этапами выполнения посадки. Они соответствуют снижению высоты, полету по дуге с заходом на посадочный курс и собственs но посадке. a а s s r Для каждого элемента меа d тасистемы была проведена Рисунок Д.8 - Метасистема для R оценка маски (раздел 3.6) и вытипичного захода на посадку реакd полнена процедура реконструктивного самолета (пример Д.8) ции (раздел Д.7). Полученные результаты приведены на рисунs ке Д.8. Это система типа MSFB. Понятно, что по сравнению с обобщенной системой с поведеt ∈ [ 123 ,163 ] нием данная система позволяет t ∈ [ 1 ,70 ] более точно оценивать работу t =123 t =71 1 2 3 SFB → SFB курсантов. → SFB
354