Е. Г. Крушель, О. В. Степанченко
СИНТЕЗ И МОДЕЛИРОВАНИЕ ЦИФРОВЫХ УПРАВЛЯЮЩИХ СИСТЕМ С ДВОЙНОЙ ШКАЛОЙ ВРЕМЕНИ Монография...
32 downloads
263 Views
1009KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Е. Г. Крушель, О. В. Степанченко
СИНТЕЗ И МОДЕЛИРОВАНИЕ ЦИФРОВЫХ УПРАВЛЯЮЩИХ СИСТЕМ С ДВОЙНОЙ ШКАЛОЙ ВРЕМЕНИ Монография
МОСКВА «МАШИНОСТРОЕНИЕ-1» 2006 3
УДК 004.3(06) К 84 Рецензенты: лаборатория «Системные проблемы управления и автоматизации в машиностроении» Института проблем точной механики и управления РАН; заведующий кафедрой «Радиотехнические системы» Самарского государственного технического университета, д. т. н., профессор В. Н. Нестеров; заведующий кафедрой «Информатика и вычислительная техника», декан строительно-технического факультета Волгоградского государственного архитектурно-строительного университета, д. т. н., профессор А. Н. Богомолов К 84
Крушель Е. Г., Степанченко О. В. СИНТЕЗ И МОДЕЛИРОВАНИЕ ЦИФРОВЫХ УПРАВЛЯЮЩИХ СИСТЕМ С ДВОЙНОЙ ШКАЛОЙ ВРЕМЕНИ: Монография. – М.: Машиностроение-1, 2006. – 96 с. ISBN 5-94275-271-0
Рассмотрены задачи построения цифровых управляющих систем для распространенного класса технологических процессов, особенностью которых является наличие существенно различных по показателям инерционности (т. е. разнотемповых) составляющих (субпроцессов). Приведены результаты анализа особенностей и принципов моделирования технологических процессов с разнотемповыми составляющими, разработана методика моделирования систем управления такими процессами на основе введения управляющей системы с двойной шкалой времени. Описаны принципы построения алгоритмического обеспечения двухконтурного цифрового пропорционально-интегрального регулятора с двойной шкалой времени. Изложены результаты обобщения методов аналитического конструирования оптимальных регуляторов класса задач управления процессами с разнотемповыми составляющими. Для студентов, аспирантов и инженеров, интересующихся вопросами разработки алгоритмического обеспечения автоматизированных и автоматических систем управления. Может быть использована как раздел спецкурса по специальным главам кибернетики. Ил. 40. Табл. 2. Библиогр.: 35 назв. ISBN 5-94275-271-0
© Крушель Е. Г., Степанченко О. В., 2006 © Волгоградский государственный технический университет, 2006 4
Научное издание
Елена Георгиевна Крушель Ольга Викторовна Степанченко
СИНТЕЗ И МОДЕЛИРОВАНИЕ ЦИФРОВЫХ УПРАВЛЯЮЩИХ СИСТЕМ С ДВОЙНОЙ ШКАЛОЙ ВРЕМЕНИ
Монография
Редакторы: Попова Л. В., Пчелинцева М. А. Компьютерная верстка Сарафановой Н. М. Темплан 2006 г., поз. № 3. Лицензия ИД № 04790 от 18.05.2001. Подписано в печать 14. 04. 2006 г. Формат 60×84 1/16. Бумага листовая. Гарнитура ”Times“. Усл. печ. л. 6,0. Усл. авт. л. 5,81. Тираж 200 экз. Заказ Волгоградский государственный технический университет 400131 Волгоград, просп. им. В. И. Ленина, 28. РПК «Политехник» Волгоградского государственного технического университета 400131 Волгоград, ул. Советская, 35. ООО Издательство «Машиностроение-1» 107076, Москва, Стромынский пер., 4. Отпечатано в муниципальном унитарном предприятии «Камышинская типография» Лицензия ИД № 05440 от 20 июля 2001 г. 403882, Волгоградская обл., г. Камышин, ул. Красная, 14
5
Е. Г. КРУШЕЛЬ, О. В. СТЕПАНЧЕНКО
СИНТЕЗ И МОДЕЛИРОВАНИЕ ЦИФРОВЫХ УПРАВЛЯЮЩИХ СИСТЕМ С ДВОЙНОЙ ШКАЛОЙ ВРЕМЕНИ
6
СОДЕРЖАНИЕ ВВЕДЕНИЕ.......................................................................................................9 СПИСОК АББРЕВИАТУР...............................................................................7 ГЛАВА 1. МОДЕЛИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ ПРОЦЕССАМИ С РАЗНОТЕМПОВЫМИ СОСТАВЛЯЮЩИМИ.....................................................................................8 § 1. Основные идеи моделирования разнотемповых процессов и построения их упрощенных моделей на основе метода ДШВ............12 1.1. Общая характеристика метода ДШВ и области его применения.............................................................................................1 2 1.2. Класс объектов с разнотемповыми процессами, для которого предлагается метод ДШВ.....................................................................14 1.3. Способы расчета параметров для модели (1.2) с сепаратным представлением медленной и быстрой составляющих....................15 1.4. Достаточные условия наличия разнотемповости......................19 1.5. Последовательность расчета параметров при использовании метода ДШВ для моделирования динамики сложного процесса...20 § 2. Направления развития метода ДШВ для дискретных систем......22 § 3. Методика моделирования дискретных систем управления по методу ДШВ................................................................................................................................23 3.1 Методика моделирования систем с разнотемповыми процессами...........................................................................................24 3.2. Пример выполнения расчетов и моделирования по разработанной методике для объекта четвертого порядка с разнотемповыми составляющими......................................................34 § 4. Использование метода двойной шкалы времени при моделировании электродвигателя постоянного тока............................44 § 5. Выводы................................................................................................51 ГЛАВА 2. ПРОЕКТИРОВАНИЕ АЛГОРИТМИЧЕСКОГО ОБЕСПЕЧЕНИЯ ЦИФРОВОГО ПИ-РЕГУЛЯТОРА С УЧЕТОМ СВОЙСТВ ОБЪЕКТОВ С РАЗНОТЕМПОВЫМИ ПРОЦЕССАМИ........53 § 1. Схема построения цифрового ПИ–регулятора для объектов с разнотемповыми составляющими...........................................................54 § 2. Оценка эффективности использования «двушкальных» цифровых ПИ-регуляторов......................................................54 2.1. Система показателей для оценки эффективности введения ДШВ......................................................................................................66 7
2.2. Исследования качества управления объектом с применением «двушкального» цифрового ПИ-регулятора.....................................58 § 3. Выводы................................................................................................61 ГЛАВА 3. СИНТЕЗ СУБОПТИМАЛЬНЫХ СИСТЕМ УПРАВЛЕНИЯ ОБЪЕКТАМИ С РАЗНОТЕМПОВЫМИ СУБПРОЦЕССАМИ................62 § 1. База для оценки эффективности использования метода ДШВ....63 § 2. Синтез субоптимальных управляющих воздействий для объектов c разнотемповыми составляющими на основе метода ДШВ............................................................................................................77 2.1. Исходные положения, принимаемые для синтеза субоптимальных управляющих воздействий....................................66 2.2. Сравнение точного и приближенного решения задачи АКОР (на примере управления объектом 4-го порядка)............................72 § 3. Использование фильтров пониженного порядка в задаче синтеза субоптимальных управлений...................................................................8 § 4. Выводы..............................................................................................81 ЗАКЛЮЧЕНИЕ...............................................................................................83 ЛИТЕРАТУРА.................................................................................................84 ПРИЛОЖЕНИЕ 1. МОДЕЛЬ, РАССМАТРИВАЕМАЯ В КАЧЕСТВЕ ПРИМЕРА В ГЛАВАХ 1, 3...........................................................................86 ПРИЛОЖЕНИЕ 2. МОДЕЛЬ ЭЛЕКТРОДВИГАТЕЛЯ ПОСТОЯННОГО ТОКА................................................................................................................88 ПРИЛОЖЕНИЕ 3. РЕШЕНИЕ ЗАДАЧИ АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ С КРИТЕРИЕМ СПЕЦИАЛЬНОГО ВИДА...............................................91
8
Введение Перевод управляющей техники на цифровую основу не только открывает возможности усовершенствования алгоритмов управления, но и ставит перед разработчиками задачу повышения эффективности использования ресурсов вычислительной (в частности, микропроцессорной) техники. Одним из направлений решения этой важной проблемы является поиск упрощающих допущений на этапе постановки задачи создания управляющей системы, позволяющих получить более простые и быстродействующие алгоритмы без заметного ухудшения качества управления и одновременно улучшить вычислительную процедуру, их реализующую. Ресурсы цифровой системы, которые высвобождаются благодаря упрощению алгоритмов, могут быть использованы для расширения состава информационных функций локальных систем управления и, соответственно, для повышения надежности и экономической эффективности автоматизации. Источником возможных упрощений постановок задач алгоритмизации является учет особенностей структуры и свойств объектов управления. В данной книге исследуется одно из направлений учета свойств некоторых распространенных объектов, основанное на выделении существенно различных по показателям инерционности (т. е. разнотемповых) составляющих (субпроцессов) в автоматизируемом технологическом процессе. Технологические процессы, обладающие разнотемповыми составляющими, довольно широко распространены. В качестве одного из примеров можно указать электропривод постоянного тока, изменение скорости вращения которого характеризуется гораздо большей инерционностью, чем изменение тока в якорной цепи. Другим примером являются аппараты химической промышленности, в которых изменение характеристик катализатора имеет гораздо большую инерционность, чем процесс производства продуктов. В предшествующих работах [1...6] был предложен подход к исследованию систем с разнотемповыми составляющими в непрерывном времени. Теоретической основой данных работ являлся метод малого параметра [7...11]. В частности, в [10] рассматриваются вопросы использования метода малого параметра для придания новых, полезных свойств нелинейным законам управления. В [11] метод малого параметра использован для решения задач математического программирования. Имеются работы, распространяющие идеи исследования систем с разнотемповыми составляющими на процессы с дискретным временем [12...15]. Однако осталось непреодоленным различие в формах описания объектов управления (для которых время является непрерывным, а разделение на субпроцессы – условным, вводимым только для упрощения их 9
анализа) и систем управления, которые в современных условиях являются цифровыми. Для описания цифровых управляющих систем требуется не только ввести дискретное время, но и учесть особенности работы, связанные с многофункциональностью и необходимостью разделения времени между задачами. Результаты, полученные в предшествующих работах, недостаточны для получения практичных методов построения цифровых управляющих систем для объектов с разнотемповыми составляющими, функционирующих в непрерывном времени. Рассмотрению одного из возможных путей преодоления противоречия между формами описания объекта с разнотемповыми составляющими и цифровой управляющей системы и посвящена данная книга. Результаты излагаются применительно к задачам управления многомерными линейными динамическими объектами. В монографии рассмотрены следующие задачи: 1. Анализ особенностей и принципов моделирования технологических процессов с разнотемповыми составляющими, разработка методики моделирования систем управления такими процессами на основе введения двойной шкалы времени (гл. 1). 2. Разработка алгоритмического обеспечения двухконтурного дискретного пропорционально-интегрального (ПИ) регулятора с двойной шкалой времени (гл. 2). 3. Оценка эффективности предлагаемых алгоритмов при решении практической задачи управления процессом стабилизации скорости вращения электродвигателя постоянного тока (гл. 3). 4. Синтез дискретных субоптимальных алгоритмов управления процессами с разнотемповыми составляющими на основе обобщения методов аналитического конструирования оптимальных регуляторов (АКОР) и использования фильтров пониженного порядка для восстановления неизмеряемых составляющих вектора состояния объекта (гл. 3). Проведение исследований базируется на теоретических методах описания дискретных процессов управления в пространстве состояний, принципах понижения порядка математических моделей с использованием метода малого параметра и двойного временного шкалирования, а также на методах имитационного моделирования. Основные результаты работы опубликованы в [16...21].
10
СПИСОК АББРЕВИАТУР АКОР – аналитическое констуирование оптимальных регуляторов АСУТП – автоматические и автоматизированные системы управления технологическими процессами ДШВ – двойная шкала времени П-закон – пропорциональный закон ПИ-регулятор – пропорционально-интегральный регулятор
11
ГЛАВА 1. МОДЕЛИРОВАНИЕ СИСТЕМ УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ ПРОЦЕССАМИ С РАЗНОТЕМПОВЫМИ СОСТАВЛЯЮЩИМИ Содержание главы составляют вопросы, связанные с описанием динамических процессов с разнотемповыми составляющими, моделированием этих процессов и определением параметров, позволяющих упростить математические модели путем введения двойной шкалы времени (ДШВ). Изложение проведено по следующей схеме: на основании обзора опубликованных работ [12...15], посвященных исследованию разнотемповых процессов в дискретном времени (§ 1), определяются направления развития достигнутых результатов, обладающие новизной (§ 2); излагается методика моделирования систем управления разнотемповыми процессами с использованием ДШВ, содержащая заявленные в п. 1.2 новые элементы; позиции методики сопровождаются сквозным иллюстративным примером (§ 3); приводятся результаты использования разработанной методики для решения прикладной задачи (моделирование разнотемповых процессов в электродвигателе постоянного тока) (§ 4). § 1. Основные идеи моделирования разнотемповых процессов и построения их упрощенных моделей на основе метода ДШВ Материал, включенный в данный параграф, носит обзорный характер; цель обзора – сформулировать направления развития известных методов. Главное внимание уделено обзору результатов, достигнутых в области исследования разнотемповых процессов в дискретном времени [12...15]. 1.1. Общая характеристика метода ДШВ и области его применения Известно, что метод ДШВ входит в группу методов упрощения описания сложных динамических систем, основанных на различных способах понижения порядка описания объектов управления [7,10,11,22...24]. Область применения метода – управление динамическими процессами, переменные состояния которых имеют существенно различные инерционные свойства (далее такие переменные состояния называются разнотемповыми). Техническими примерами объектов, содержащих разнотемповые переменные состояния, являются: аппараты химической промышленности, в которых изменение характеристик катализатора имеет гораздо большую инерционность, чем процесс производства продуктов; электродвигатели, механическая система которых характеризуется гораздо большей инерционностью, чем изменение тока в якорной цепи. Интуитивным обоснованием метода понижения порядка при управлении разнотемповыми процессами является отказ от учета быстрой со12
ставляющей при моделировании переходных процессов (в связи с ее быстрым затуханием) и ориентация алгоритмов управления только на медленную составляющую, которая, в основном, и определяет продолжительность переходных процессов. Инженерные подходы к разделению задач принятия решений по частотному спектру с введением различных интервалов управления, для контуров оперативного планирования, оперативного управления и автоматической стабилизации, основаны именно на использовании данного свойства объектов. Однако управление только медленными составляющими приводит к потерям качества управления в периоды времени, непосредственно примыкающие к моментам изменения режима работы объекта (в частности, к моментам скачкообразного изменения задающих воздействий или возникновения возмущений). В ряде работ [1...3,7] предлагается способ улучшения качества управления за счет введения различных дискрет времени для контуров управления разнотемповыми процессами. Теоретические результаты излагаются в терминах двойной шкалы времени, так как обобщение на случай множественных шкал не представляет труда. Главная идея метода ДШВ состоит в рассмотрении медленной и быстрой составляющих вектора состояния по следующей схеме: − в шкале медленного времени быстрая составляющая трактуется как безынерционная (в частности, для ее описания используются не дифференциальные и не разностные, а алгебраические соотношения); − для периодов резких изменений режима работы объекта, на которых динамика быстрой составляющей существенна, вводится более дробная временная единица (шкала быстрого времени); уравнения, описывающие быструю составляющую, трактуются как динамические, а значения медленной составляющей во время переходных процессов быстрой составляющей приближенно считаются постоянными. Более строгие исследования позволяют установить количественные характеристики параметров объекта, при которых метод ДШВ позволяет получить хорошую аппроксимацию динамики процесса и удовлетворительное качество управления на основе метода ДШВ. К настоящему времени основные результаты по управлению разнотемповыми процессами на базе ДШВ получены для систем управления с непрерывным временем [10, 25...27]. Для целей использования метода ДШВ для разработки цифровых систем управления разнотемповыми процессами более пригодны модели с дискретным временем. Приведем сводку результатов, полученных в этом направлении в [1...3, 7, 20, 21].
13
1.2. Класс объектов с разнотемповыми процессами, для которого предлагается метод ДШВ Рассматривается класс линейных дискретных многомерных объектов управления [28, 29], математическая модель которых представлена в nмерном евклидовом пространстве состояний Rn: x[ s] ∈ R n , s = 0, 1, … – такты дискретного времени, отсчитываемые с заданным интервалом Δt; начальное состояние x[0] считается известным. Предполагается, что по физическим соображениям в векторе состояния x[s] могут быть выделены медленные и быстрые субпроцессы, описываемые субвекторами состояний x1 [ s ] ∈ R n1 и x 2 [ s ] ∈ R n2 соответственно, n1 + n2 = n, после чего модель объекта представляется в виде: x1 [ s + 1] A A12 x1 [ s ] B (1.1) = 11 + 1 u[ s ] , x 2 [ s + 1] A21 A22 x 2 [ s ] B2 где u[ s] ∈ R m – вектор управляющих воздействий, Аij, i,j = 1,2 и Bi, i = 1,2 – матрицы размерностей n1 × n1, n1 × n2, n2 × n1, n2 × n2, n1 × m, n2 × m соответственно. Внедиагональные (возможно, ненулевые) блоки Аij, I ≠ j показывают перекрестные связи между медленным и быстрым субпроцессами. Наличие этих связей не позволяет подтвердить интуитивные предположения о разнотемповости субпроцессов и (тем более) получить ее количественную оценку. Из-за влияния медленной составляющей на быструю реакция быстрого субпроцесса на внешние воздействия имеет примерно такой же характер, как и реакция медленного. Формальное определение свойства разнотемповости. В [12] предложен прием, позволяющий диагностировать наличие разнотемповости путем формального преобразования модели вида (1.1) в эквивалентную модель, в которой перекрестные взаимодействия между субпроцессами исключены. Существо приема состоит в расчете параметров такого линейного преобразования (агрегирования) исходных «физических» переменных состояний, чтобы уравнения динамики для быстрого xБ[s] и медленного xM[s] субпроцессов в преобразованной модели стали автономными: x М [ s + 1] A 0 xМ [s] B (1.2) = М + М u[ s ] , x Б [ s + 1] 0 AБ x Б [ s ] BБ
[
]
T
[
]
T
где x M [ s ]T x Б [ s ]T = C x1[ s ]T x2 [ s ]T , С – n × n матрица линейного преобразования (агрегирования) исходных блоков вектора состояния, AM, AБ, BM, BБ – матрицы размерности n1 × n1, n2 × n2, n1 × m, n2 × m соответственно, полученные путем расчета по параметрам модели (1.1).
14
Наличие свойства ДШВ формально проявляется в существовании «зазора» между собственными числами медленной λi, i = 1, … , n1 и быстрой λj, j = 1, … , n2 подсистем: Δ
Δ
(1.3) λз < λM , где λз = max λ j ( Aз ) ; λМ = min λi ( AМ ) . i j Из (1.3) видно, что самая медленная мода быстрой подсистемы в объекте с ДШВ затухает быстрее, чем самая быстрая мода медленной подсистемы. Достаточным признаком наличия свойства ДШВ является условие −1 (1.4) А М−1 >> А Б ,
где ||...|| – евклидова норма матрицы. В (1.4) использована известная оценка границ спектра собственных чисел −1 min λi ( AМ ) ≥ АМ i
−1
; max λ j ( AБ ) ≤ АБ . j
Соотношение (1.4) используется для того, чтобы избежать сложной процедуры расчета спектра собственных значений, необходимых для непосредственной проверки условия (1.3). В соответствии с последним исходные уравнения (1.1) должны быть преобразованы в форму с сепаратными уравнениями для медленного x М [ s ] ∈ R n1
и быстрого x2 [ s ] ∈ R n2 субпроцессов (1.2).
1.3. Способы расчета параметров для модели (1.2) с сепаратным представлением медленной и быстрой составляющих Известны два способа расчета параметров матриц АМ, АБ, ВМ, ВБ для модели (1.2) [12]. Первый (так наз. Б-преобразование) состоит в первоначальном исключении влияния медленного субпроцесса на быстрый и завершается сепарацией медленного субпроцесса. Второй (так. наз. Мпреобразование), двойственный к Б-преобразованию, состоит в первоначальном исключении влияния быстрого субпроцесса на медленный и завершается сепарацией быстрого субпроцесса. Технология Б-преобразования состоит в следующем. Быстрый сепаратный субпроцесс формируется как агрегат «физических» исходных субпроцессов: (1.5) xБ [ s] = x2 [ s] + PБ x1[ s] , где PБ – поправочная n2 × n1 матрица, элементы которой рассчитываются ниже так, чтобы исключить влияние x1[s] на xБ[s]: x1[ s + 1] B A11 A12 x1[ s ] (1.6) = + 1 u[ s ] , x Б [ s + 1] B2 0 A 22 x Б [ s ] причем A11 , A12 , B2 подлежат определению из условий совпадения динамики (1.6) и (1.1). Для этого выполняются следующие действия: 15
1. Из (1.6) выписывается соотношение для x1[s], в которое подставляется выражение для xБ[s] из (1.5):
x1 [s + 1] = A11 x1 [s ] + A12 x Б [s ] + B1u[ s ] =
= A11 x1 [s ] + A12 ( x 2 [s ] + PБ x1 [s ]) + B1u[ s ], x1 [s + 1] = ( A11 + A12 PБ ) x1 [ s ] + A12 x 2 [ s ] + B1u [ s ] .
(1.7)
Для того чтобы (1.7) тождественно совпадало с формулой для x1[s+1] из (1.1), A11 должна быть определена следующим образом: Δ
A11 = A11 − A12 PБ .
2. Аналогично выписываются соотношения для xБ[s]: xБ [s +1] = A22 xБ [s] + B 2u[s] ,
(1.8) (1.9)
x2 [s + 1] + PБ x1[s +1] = A22 x2 [s] + A22 PБ x1[s] + B 2u[s] .
Подстановка уравнения связи xi[s+1] с xi[s], ui[s], i = 1, 2 из (1.1) в последнее уравнение и группировка элементов с одинаковыми сомножителями приводит к соотношению: ( A21 + PБ A11 − A 22 PБ ) x1[ s ] + ( A22 + PБ A12 ) x2 [ s ] +
+ ( B2 + PБ B1 )u[ s ] = A 22 x2 [ s ] + B 2 u[ s ]. Для того чтобы модели (1.1) и (1.6) были эквивалентными, последнее соотношение должно выполняться тождественно. Это будет достигнуто, если матрицу PБ рассчитать из условия равенства нулю сомножителя перед x1[s] и если определить A22 , B2 следующим образом: Δ
Δ
A 22 = A22 + PБ A12 , B 2 = B2 + PБ B1 .
(1.10) Таким образом, получено матричное уравнение для расчета элементов РБ: А21 + PБ А11 − A22 PБ = 0 . С учетом (1.10) получим матричное уравнение размерности n2 × n1 (уравнение типа Риккати [30]): (1.11) А21 + PБ А11 − А22 PБ − PБ А12 PБ = 0 . 3. После того, как (1.1) приведена к форме (1.6), производится агрегирование исходного медленного субпроцесса с сепаратным быстрым агрегатом xБ[s] с помощью линейного преобразования: (1.12) xМ [ s] = x1[ s] − QБ xБ [ s] , где QБ – поправочная n1 × n2 матрица, элементы которой рассчитываются ниже так, чтобы исключить влияние xБ[s] на xМ[s] и получить модель с полностью сепаратными составляющими. x М [ s + 1] xМ [ s] 0 A11 B1 (1.13) = + u[ s ] . x Б [ s + 1] 0 A 22 x Б [ s ] B2 16
4. Из (1.12)
x1[ s] = xM [ s] + QБ xБ [ s] .
Полученное выражение подставляется в формулу для x1[s+1] из (1.6):
x1[ s + 1] = A11 x1[ s ] + A12 x Б [ s ] + B1u[ s ],
x М [ s + 1] + QБ x Б [ s + 1] = A11 x М [ s ] + A11QБ x Б [ s ] + A12 x Б [ s ] + B1u[ s ]. 5. В полученное выражение подставляется уравнение динамики xБ [s + 1] = A22 xБ [s] + B2u[s] из (1.9); после группировки слагаемых:
x M [ s + 1] = A11 x M [ s ] + ( B1 − Q Б B 2 )u[ s ] + + ( A12 + A11Q Б − Q Б A 22 ) x Б [ s ].
(1.14)
Для того, чтобы уравнение (1.13) определяло медленную составляющую сепаратно, QБ выбирается так, чтобы матричный коэффициент при хБ[s] был нулевым. Из (1.14) получено Δ
B1 = B1 − QБ B 2 , где QБ удовлетворяет уравнению: А12 + A11QБ − QБ A 22 = 0 . С использованием (1.10), (1.8) получено окончательно Δ
B1 = ( E n1×n1 − Q Б PБ ) B1 − Q Б B 2 , где
(1.15)
E n1×n1 – единичная матрица n1 × n1; QБ – решение уравнения Ляпуно-
ва [31]:
( A11 − A12 PБ )QБ − QБ ( A22 + PБ A12 ) + A12 = 0 .
(1.16)
Таким образом, получена искомая сепаратная модель вида (1.13): xМ [s +1] A −А P 0 = 11 12 Б xБ [s +1] A22 + PБ А12 0
xМ [s] (E − QБ PБ )B1 − QБ B2 + n1×n1 u[s] . (1.17) xБ [s] PБ B1 + B2
Преобразования (1.5) и (1.12) задают связь между «физическими»
[
переменными x1 [ s ]T
x 2 [ s]T
медленной составляющими
[x
]
T
и вектором с разделенными быстрой и
T М [s]
E n1×n1 − QБ PБ xМ [s] = PБ x Б [s]
x1[ s ] x2 [ s]
=
E n1×n1 − PБ
x Б [ s ]T
]: T
− QБ E n2 ×n2
x1[ s ] , x2 [ s ]
QБ E n2 ×n2 − PБ QБ
xМ [ s]
17
x Б [ s]
(1.18)
.
(1.19)
Из (1.18) и (1.19) видно, что матричные сомножители – взаимно обратные матрицы. Уравнение (1.18) допускает интересную трактовку: можно рассматривать блочные строки матрицы-сомножителя как матрицы агрегации, позволяющие сформировать быструю либо медленную сепаратные составляющие путем преобразования «физических» переменных состояния линейными фильтрами: xM [ s] = C M x[ s], x Б [ s] = C Б x[ s] , где СМ и СБ представляют собой матрицы агрегации «физических» переменных состояния и записываются в виде: (1.20) C М = [ En × n − QБ PБ − QБ ]; C Б = [ PБ En × n ] . 1
1
2
2
Формулы Б-преобразования существенно упрощаются, если в исходной модели (1.1) матрица А12 – нулевая (такой случай встречается на практике, когда модель в состояниях записывается вместо исходной модели «вход-выход» со скалярными входами и выходами). Аналогично выводятся соотношения для М-преобразования, в котором вначале исключается влияние быстрого субпроцесса на медленный, а затем сепарируется быстрый субпроцесс. В табл. 1 приведены параметры модели с сепаратными быстрой и медленной составляющими, полученные с помощью М-преобразования и Б-преобразования. Матричные уравнения, определяющие (PБ, PМ) и (QБ, QМ) удовлетворяют соотношениям двойственности: (1.21а) A21 + PБ A11 − A22 PБ − PБ A12 PБ = 0 ↔
A12 + PM A22 − A11PM − PM A21PM = 0, ( A11 − A12 PБ )Q Б − Q Б ( A22 + PБ A12 ) + A12 = 0 ↔
(1.21б) (1.22а)
( A22 − A21PM )QM − QM ( A11 + PM A21 ) + A21 = 0.
(1.22б) Таблица 1 Параметры модели (1.2), полученные различными преобразованиями Обозначения параметров в модели (1.2) AМ
Формулы, полученные: при Б-преобразовании при М-преобразовании
AБ BМ
A11 − A12 PБ
A11 + PM A21
A22 + PБ A12
A22 − A21 PМ
(En ×n − QБ PБ )B1 − QБ B2 1
1
18
B1 + PМ B2
Обозначения параметров в модели (1.2) BБ
Формулы, полученные: при Б-преобразовании при М-преобразовании
(En ×n
B2 + PБ B1
2
2
)
− QМ PМ B2 − QМ B1
Для решения матричных уравнений (1.21) – (1.22) предложена итерационная процедура, сходимость которой гарантируется при наличии в объекте свойства ДШВ: −1 , (1.23) PБv = A22 PБv −1 + PБv−1 A12 PБv −1 − A21 A11
(
)
(
)
−1 PMv = A11 A12 + PMv −1 A22 − PMv −1 A21 PMv −1 ,
(1.24)
где в качестве нулевого приближения принимается: −1 −1 PБ0 = − A21 A11 , PМ0 = A11 A12 .
Аналогично получают рекуррентные формулы для определения QБ, QМ: −1 (1.25) QБv = A11 A12 PБ QБv −1 + QБv −1 ( A22 + PБ A12 − A12 ) ,
(
(
)
)
QMv = ( A22 − A21 PM )QMv −1 − QMv −1 PM A21 + A21 A11−1 ,
(1.26)
где в качестве начального приближения использовано: −1 −1 QБ0 = − A11 A12 , QМ0 = A21 A11 .
Уравнение (1.22) можно решать и алгебраически (не итерационно), поскольку параметры матриц QБ, QМ входят в них линейно.
1.4. Достаточные условия наличия разнотемповости Проверка производится с использованием леммы, устанавливающей нижнюю границу величины зазора между спектрами собственных чисел медленного и быстрого субпроцессов. Для ее использования исходное уравнение (1.1) должно быть представлено в виде ˆ x 1 [s + 1] x 1 [s] B A 11 μ 1− j A 12 (1.27) = j + 1 u[s] , ˆ ˆ x 2 [s + 1] x 2 [s] B2 μ A μA 21
22
где μ – малый скалярный параметр. Если x1[s] и x2[s] считаются по физическим соображениям разнотемповыми, то в качестве μ можно выбрать А (1.28) μ = 22 << 1. А11 В (1.27) значение j, 0 ≤ j ≤ 1 определяется из условия
μ j Aˆ 21 = A21 ; μ 1− j Aˆ 12 = A12 ; μAˆ 22 = A22 . Если используется Б-преобразование, то для того чтобы объект (1.1) обладал свойством ДШВ, достаточно, чтобы малый параметр μ удовлетворял условию 19
0≤μ <
dБ 2
c(d Б + 8abБ )
,
(1.29)
a = A 0 ; A 0 = Aˆ 22 − Aˆ 21 A11− 1 Aˆ 12 ; c = A11− 1 ; f = Aˆ 21 A11− 1 ; b Б = f Aˆ 12 ; d Б = a + bБ . При выполнении (1.29) существует единственная матрица РБ размерности n2 × n1, норма которой удовлетворяет условию
⎛ 2a ⎞ ⎟⎟ . PБ ≤ μ j f ⋅ ⎜⎜ 1 + + a b Б ⎠ ⎝
(1.30)
Спектр собственных чисел σ(A11 – A12PБ) является подмножеством спектра σ(А), последний является объединением спектров следующих матриц: σ ( A) = σ ( A11 − A12 PБ ) ∪ σ ( A22 + PБ A12 ) . Выполнение условий (1.29) гарантирует сходимость итерационной процедуры определения РБ по (1.23). Если используется М-преобразование, то условие, аналогичное (1.29), имеет вид:
0≤μ <
dМ , c d М2 + 8abМ
(
)
(1.31)
−1 ˆ где bМ = s Aˆ 21 ; s = A11 A12 ; d М = a + b М ; остальные параметры – как
в (1.29). Если μ удовлетворяет (1.31), то существует единственная матрица РМ размерности n1 × n2, норма которой удовлетворяет условию ⎛ 2a ⎞ . (1.32) ⎟⎟ PМ ≤ μ (1− j ) ⋅ s ⋅ ⎜⎜ 1 + + a b М ⎠ ⎝ Спектр собственных чисел σ(A11+PМA21) является подмножеством спектра σ(A), последний является объединением спектров следующих матриц: σ ( A) = σ ( A11 + PM A21 ) ∪ σ ( A22 − A12 PM ) .
1.5. Последовательность расчета параметров при использовании метода ДШВ для моделирования динамики сложного процесса 1. В зависимости от формы исходных «физических» уравнений (1.1) выбрать способ их преобразования к модели с сепаратными быстрой и 20
медленной составляющими. Например, при А12 = 0 удобнее Бпреобразование, при А21 = 0 – М-преобразование. 2. Привести исходную запись (1.1) в форму (1.27), определить численные значения μ, j, Аˆ12 , Аˆ 21 , Аˆ 22 . 3. Проверить наличие свойства ДШВ в модели объекта (с использованием условия (1.28) при Б-преобразовании либо (1.30) при М-преобразовании). При подтверждении наличия данного свойства метод ДШВ применим; в противном случае также остается возможность получения удовлетворительного результата (поскольку условия (1.29) и (1.31) достаточные), но работоспособность метода следует проверять экспериментально. 4. При использовании Б-преобразования определить последовательно РБ (по (1.21а) либо по итерационной процедуре (1.23)), затем QБ (по (1.22а) либо итерационной процедуре (1.25)). При использовании Мпреобразования определить РМ (по (1.21б) либо (1.24)), затем QМ (по (1.22б) либо (1.26)). Несмотря на то, что (1.21а) и (1.21б) имеют несколько решений, соотношения (1.30), (1.32) позволяют выбрать единственное допустимое. 5. Рассчитать параметры АМ, АБ, ВМ, ВБ по формулам, приведенным в табл. 1. 6. Провести моделирование отработки ненулевого начального состояния при нулевых управлениях u1, u2 в исходном объекте (1.1) и в модели с сепаратными составляющими (1.2); установить номер такта s*, начиная с которого динамику объекта можно характеризовать только медленной составляющей, т. е. с заданной точностью положить: x Б [k ] = 0, x1 [k ] = x M [k ], ∀k ≥ s * . На интервале k ≥ s* для моделирования динамики может быть использована модель пониженного порядка xˆ1 [ k + 1] = AМ xˆ1 [ k ] , где x1 [ 0 ] = x1 [ 0 ] – задано, k ≥ s*. 7. Как показывает опыт расчетов, приближение к точной модели (1.1) может быть значительно улучшено, если в качестве x$1 [ 0] выбрать агрегированный сигнал
xˆ1[0] = CМ x[0] , где СМ определяется по (1.20). В силу соотношений двойственности при использовании М-преобразования начальные условия корректируются для быстрой составляющей
21
[
]
⎡ x [ 0] ⎤ xˆ 2 [0] = − QM | I n2 ×n2 − QM PM ⎢ 1 ⎥ , ⎣ x2 [0]⎦ при этом
[
]
[
]
⎡ x [ 0] ⎤ ⎡ x [ 0] ⎤ xˆ1[0] = E n1×n1 | PM ⎢ 1 ⎥ = E n1×n1 − PM QM | PM ( E n2 ×n2 − QM PM ) ⎢ 1 ⎥ . ⎣ xˆ 2 [0]⎦ ⎣ x2 [0]⎦ Быстрая составляющая рассматривается как квазиустановившаяся (получается из (1.18) или (1.19) в предположении, что хБ[k] = 0 ∀ k ≥ s*) – т. е. в одной из следующих форм: (1.33) xˆ 2 [k ] = − PБ xˆ1[k ] ; xˆ 2 [ k ] = Q M xˆ M [ k ], k ≥ s * . В (1.33) полностью пренебрегают зависимостью х2[s] от начального состояния (она имеет значение лишь при 0 ≤ s < s*). 8. На интервале 0 ≤ s < s* ввести более детальную временную шкалу (для более точного моделирования x2[s]) из условия: ΔT2 = μΔT1 , где ΔT1 – интервал дискретизации, выбранный для моделирования медленной составляющей (и объекта (1.1) в целом). Пересчитать параметры быстрой модели с учетом нового интервала дискретизации. § 2. Направления развития метода ДШВ для дискретных систем Обзор достигнутого уровня методологии моделирования разнотемповых процессов позволил выявить необходимость проведения дополнительных исследований. В частности, остались неизученными следующие позиции: 1. Не разработана детальная методика использования свойства разнотемповости процессов в объекте для моделирования [16] и синтеза систем управления. 2. Не введены соотношения, позволяющие рассчитывать параметры моделей процессов в разных шкалах времени, в связи с чем методика моделирования дискретных разнотемповых процессов не доведена до уровня, позволяющего ее использовать в задачах анализа и синтеза алгоритмов для цифровых систем, используемых для управления объектами в непрерывном времени. 3. Отсутствует аппарат описания разнотемповых процессов с учетом внешних (в частности, управляющих) воздействий. Подмена этого аппарата рассмотренными в [8, 13, 76] задачами отработки ненулевых начальных условий не позволяет получить приемлемую точность декомпозиции процесса на быструю и медленную составляющие.
22
4. Не введены показатели и критерии, позволяющие оценить точность приближенного описания процессов с разнотемповыми составляющими в разных шкалах времени. 5. Недостаточно выявлены перспективы использования эффектов разнотемповости для усовершенствования алгоритмического обеспечения существующих локальных регуляторов без усложнения их технической структуры. 6. Не разработаны методы учета особенностей разнотемповых процессов для синтеза субоптимальных алгоритмов. Вклад в решение этих вопросов составляет содержание данной книги. Перечислим основные направления выполненных исследований: 1. Разработка методики моделирования дискретных систем с разнотемповыми составляющими в двух шкалах времени, ориентированной на применение в цифровых управляющих системах (гл. 1, § 3). 2. Исследование эффективности метода ДШВ при моделировании дискретных объектов с ненулевыми управляющими воздействиями (гл. 1, § 3). 3. Разработка показателей качества, позволяющих проводить оценку результатов процесса декомпозиции модели объекта на медленный и быстрый субпроцессы (гл. 2, § 2). 4. Синтез цифровых «двушкальных» регуляторов для объектов с разнотемповыми составляющими. Оценка эффективности таких алгоритмов при изменяющемся задающем воздействии (гл. 2, § 1). 5. Разработка подхода к оценке эффективности метода ДШВ с позиций использования ресурса времени, высвобождающегося в цифровой управляющей системе за счет применения моделей разнотемповых процессов пониженного порядка (гл. 2, § 2). 6. Упрощение процедуры синтеза законов управления разнотемповыми процессами методом АКОР за счет использования двух шкал времени. Предлагаемый подход позволяет получить хорошее приближение к качеству оптимальной системы, синтезированной методом АКОР без использования упрощений. Субоптимальные управляющие воздействия представляются в виде суммы составляющих, каждая из которых рассчитывается методом АКОР для медленного и быстрого субпроцессов автономно, в разных шкалах времени (гл. 3, § 2). 7. Исследование возможности восстановления неизмеряемых компонент вектора состояния для систем управления с разнотемповыми составляющими с использованием фильтра Люенбергера пониженного порядка (гл. 3, § 3).
§ 3. Методика моделирования дискретных систем управления по методу ДШВ Описание методики проведено по следующей схеме: 23
− кратко аннотируются этапы расчета (п. 3.1); − вводится необходимый формальный аппарат для каждого этапа. Проверка методики проведена на двух примерах. Первый (рассмотрен в данном параграфе, п. 3.2) иллюстрирует положения методики применительно к абстрактному многомерному процессу, без упрощения формальных соотношений. Второй (рассмотренный в § 4) направлен на решение конкретной прикладной задачи (моделирование переходных процессов в электродвигателе постоянного тока). Этот пример иллюстрирует возможность упрощения формальных (матричных) соотношений методики применительно к распространенным объектам второго порядка, поскольку разнотемповые субпроцессы в таких объектах описываются в скалярах.
3.1 Методика моделирования систем с разнотемповыми процессами
1. Общие положения. Конечная цель моделирования – определить, могут ли различия в инерционности субпроцессов в объекте, выявленные интуитивно, обеспечить приемлемую точность представления субпроцессов в различных шкалах времени с соответствующим понижением порядка (уровня сложности) модели объекта в системах управления. Содержательно методика состоит в следующем. Вначале осуществляется сепарация (разделение) медленной и быстрой составляющих на независимые субпроцессы способом, аналогичным описанному в § 1. Затем проводится диагностирование наличия существенно разнотемповых субпроцессов либо по соотношениям, аналогичным (1.29), либо по факту сходимости итерационных процедур расчета матричных коэффициентов (PБ, QБ) (1.23), (1.25) или (PМ, QМ) (1.24), (1.26). В случае подтверждения наличия таких субпроцессов определяются параметры шкал времени для описания медленной и быстрой составляющих, т. е. рассчитывается дискрета отсчета быстрого времени в зависимости от заданного значения дискреты отсчета медленного времени и определяется число тактов медленного времени, на которых целесообразно учитывать собственную динамику быстрого субпроцесса. Вводится неравномерный ритм работы управляющей системы: временные интервалы, в течение которых собственной динамикой быстрого субпроцесса можно пренебречь без заметных потерь точности, отсчитываются с дискретой медленного времени; в моменты инициирования свободной составляющей быстрого субпроцесса (т. е. при резких изменениях задающих воздействий или возмущений) происходит переход к отсчету с дискретой быстрого времени. Вводятся модели пониженного порядка для описания медленной и быстрой динамики. Модель для описания медленных динамических процессов 24
(ее размерность соответствует размерности вектора состояния медленного субпроцесса) ориентирована на представление медленного субпроцесса и вынужденной составляющей быстрого субпроцесса. Последняя обусловлена влиянием медленного субпроцесса, управляющими воздействиями и внешними возмущениями. Потери точности связаны с представлением вынужденной составляющей быстрого субпроцесса как безынерционной. Ниже (как в данной, так и в остальных главах) используется следующий прием построения модели пониженного порядка для описания медленных компонентов вектора состояния. Запишем вместо (1.1) модель объекта в форме, явно показывающей взаимодействие субпроцессов:
⎧ x1[s + 1] = A11 x1[s] + A12 x2 [s] + B1u[s], ⎨ ⎩x2 [s + 1] = A21 x1[s] + A22 x2 [s] + B2 u[s]. Считая, что в медленном времени можно пренебречь свободной динамикой быстрого субпроцесса, приближенно оценим вынужденную (медленную) составляющую быстрого субпроцесса как результат безынерционного слежения за медленной составляющей и управляющим воздействием. Для этого заменим второе уравнение статическим, т. е. вместо
x2 [ s + 1] = A21x1[ s] + A22 x2 [ s] + B2u[ s]
запишем: x2 [ s] = A21 x1[ s] + A22 x2 [ s] + B2 u[ s] . Из последнего соотношения определим оценку вынужденной составляющей быстрого субпроцесса: x2 [ s] = ( E − A22 ) ⋅ A21x1[s] + VM u[s] , где VM = ( E − A22 ) ⋅ B2 , Е – единичная матрица размерности n2 × n2 (предполагается, что ( E − A22 ) обратима). Замена динамического описания быстрого субпроцесса статическим (алгебраическим) уравнением позволяет приближенно представить динамику в медленном времени моделью x1[ s + 1] = A11x1[ s] + A12 x2 [ s ] + B1u[ s] . Отметим, что в опубликованных работах [12...15] не учтено влияние управляющих воздействий. Модель для описания быстрых динамических процессов (ее размерность соответствует размерности вектора состояния быстрого субпроцесса) ориентирована на представление свободной составляющей быстрого субпроцесса. Потери точности связаны с отсутствием учета изменений медленной составляющей в интервале времени, на котором рассматривается свободная составляющая быстрого субпроцесса. 25
В моменты изменений режима работы объекта (вызываемых, например, ступенчатым изменением задающего воздействия или возмущения) начинается отсчет дискрет быстрого времени τ = 0, 1, … , τmax. Здесь τmax – число тактов таких, что при τ > τmax динамику свободной составляющей быстрого субпроцесса можно считать завершившейся. Значения управляющего воздействия uM[s], «ответственного» за медленные процессы xM[s], так же как и значение вектора состояния медленного субпроцесса х1[s], считаются постоянными. Может быть введено управляющее воздействие uБ[s,τ], «ответственное» за динамику свободной составляющей (этот прием использован в гл. 2 и 3 для синтеза составных управлений u[s,τ] = uM[s] + uБ[s,τ]. Для моделирования динамики свободной составляющей быстрого субпроцесса x 2 _ Б [ s, τ ] используется модель с понижением порядка до размерности n2 быстрого субпроцесса:
x 2 _ Б [ s , τ + 1] = A22 x 2 _ Б [ s , τ ] + B2 (u М [ s ] + u Б [ s , τ ]) + A21 x1[ s ] .
Количественная оценка потерь точности из-за понижения порядка моделей объекта и введения двух шкал времени производится путем сопоставления динамических процессов в системах управления с моделями пониженного порядка и двойной шкалой времени с динамическими процессами в системах с моделями полного порядка и равномерной шкалой времени, отсчитываемой с быстрой дискретой. Вводятся показатели, подлежащие расчету при этом сопоставлении. В завершение проводятся вычислительные эксперименты, в ходе которых уточняются параметры управляющей системы с ДШВ.
2. Этапы, предусмотренные методикой моделирования систем с разнотемповыми процессами. Этап 1. О п р е д е л е н и е с о о т н о ш е н и й м е ж д у п а раметрами, моделирующими процесс в объекте в р а з л и ч н ы х ш к а л а х в р е м е н и : вводится механизм, позволяющий рассчитать параметры модели объекта при изменении дискреты отсчета непрерывного времени. Этап 2. С е п а р а ц и я с о с т а в л я ю щ и х в е к т о р а с о стояния объекта и определение соотношения между дискретами отсчета медленного и быстр о г о в р е м е н и : проверяется применимость введения упрощенных моделей пониженного порядка и двойной шкалы времени для моделирования процессов в объекте. Определяется малый параметр μ, связывающий дискрету отсчета быст26
рого времени δt с заданной дискретой медленного времени Δt соотношением δt = μ⋅Δt.
Этап 3. М о д е л и р о в а н и е д и н а м и к и с и с т е м ы с п о м о щ ь ю м е т о д а д в о й н о й ш к а л ы в р е м е н и : вводятся модели пониженного порядка для описания медленного и быстрого субпроцессов; производится сравнение динамики исходной модели полного порядка с ее приближением моделями пониженного порядка на системе введенных показателей точности. 3. Пояснения к этапу 1. Определение соотношений между параметрами, моделирующими процесс в объекте в различных шкалах времени. Для того чтобы получить соотношения, позволяющие описать процессы в одном и том же объекте в разных шкалах времени, необходимо ввести механизм порождения множества моделей с различными дискретами отсчета времени из некоторой единой модели. Будем полагать, что порождающая модель задана в непрерывном времени и описывается линейным дифференциальным уравнением в терминах пространства состояний dx (1.34) = Ax (t ) + Bu (t ) , dt
где x(t) – вектор состояния объекта размерности n × 1, в котором можно выделить составляющие с существенно различными инерционными характеристиками; u(t) – вектор управляющих воздействий размерности r × 1; A, B – параметры объекта непрерывной модели (матрицы размерности n × n и n × r соответственно). Предполагаем, что объект (1.34) устойчив и что собственные числа матрицы А имеют существенные различия, отражающие наличие быстрого и медленного субпроцессов. Механизм порождения множества K дискретных моделей, связанных с исходным описанием (1.34), введем так, чтобы выполнялось следующее условие: в точках отсчета s = 1, 2, … произвольно заданных дискрет времени продолжительностью θk значения переменных состояния xDk[s] в каждой k-й дискретной модели, k∈K, должны совпасть с соответствующими значениями переменных состояния порождающей модели x[s⋅θk]. Такой механизм реализуется с использованием аппарата матричных весовых функций [26,31], позволяющего рассчитать параметры AD и BD конкретной порожденной дискретной модели с интервалом дискретизации непрерывного времени Δt: (1.35) x[ s + 1] = AD x[ s] + BD u[ s] , удовлетворяющей введенному выше условию. 27
В (1.35) s – номер такта дискретного времени, s = 0, 1, … , N (N = tmax/Δt, значения tmax и Δt заданы). Матрицы AD, BD параметров дискретной модели объекта (1.35) рассчитываются по следующим формулам: BD = A −1 (MWF (Δt ) − E )B,
AD = MWF (Δt ),
где E – единичная матрица размерности n × n; MWF(Δt) – матричная весовая функция объекта, для расчета которой используется формула Лагранжа-Сильвестра [34]: n
n
MWF (Δt ) = ∑ e λi ⋅ Δt i =1
∏ ( A − λ j ⋅ E)
j =1, j ≠ i n
,
∏ (λi − λ j )
j =1, j ≠ i
где λi, λj – собственные числа матрицы A. Если порождающая непрерывная модель обладает свойством разнотемповости и устойчивости, то оба эти свойства сохранятся и в дискретной модели, поскольку значения переменных состояния дискретной и непрерывной моделей в точках отсчета дискретного времени совпадают точно.
4. Пояснения к этапу 2. Сепарация составляющих вектора состояния объекта и определение соотношения между дискретами отсчета медленного и быстрого времени. Предположим, что в порождающей модели (1.34) присутствуют субпроцессы с различными инерционными свойствами. Тогда в порожденных дискретных моделях вида (1.35) сохранится это же свойство. Однако без проведения расчетов нельзя установить, достаточны ли различия в инерционности субпроцессов для того, чтобы можно было использовать свойство разнотемповости для упрощения описания объекта. Представим матрицы АD и ВD в дискретной модели (1.35) в блочной форме; соответственно вводится блочная форма для вектора состояния: ⎡ X 1[ s] ⎤ x[ s] = ⎢⎢ L ⎥⎥ , ⎢⎣ X 2 [ s]⎥⎦ где X1[s] – вектор размерности n1×1, соответствует медленному субпроцессу; X2[s] – вектор размерности n2×1, соответствует быстрому субпроцессу. Уравнение (1.35) запишем в форме, отражающей взаимодействие субпроцессов: 28
X 1[ s + 1] = AD11 X 1[ s ] + AD12 X 2 [ s ] + B D1 u[ s ], X 2 [ s + 1] = AD 21 X 1[ s ] + AD 22 X 2 [ s ] + B D 2 u[ s ].
(1.36)
Из (1.36) видно, что быстрая и медленная составляющие взаимно
AD21 ).
влияют друг на друга (через матрицы AD и 12
В быстрой компоненте выделим две составляющие: вынужденную (обусловлена влиянием медленной компоненты X1[s] и управляющим воздействием u[s]) и свободную (определяется начальными условиями). Для того чтобы определить, насколько быстро завершается динамика свободной составляющей и можно ли на время ее завершения считать медленную составляющую неизменной, требуется исключить вынужденную составляющую из быстрой компоненты. Для этого преобразуем дискретную модель (1.36) к форме (1.2) с сепаратными составляющими с использованием метода, предложенного в [12] и описанного в § 1. Выполняются следующие действия: 1. Оценивается значение параметра μ по нормам диагональных блоков AD22 и AD11 матрицы в (1.35)
μ=
A D 22 A D 11
.
Данный параметр должен удовлетворять условию μ <<1, но это условие является только качественным. 2. Тестируется найденное значение μ на принадлежность диапазону, определяемому по (1.29). Если тест дает положительный результат, то субпроцессы можно рассматривать как разнотемповые и вводить модели пониженного порядка и двойную шкалу времени для их описания. Поскольку условия (1.29) – только достаточные, то по факту выхода значения μ за диапазон не следует делать немедленный вывод о неприменимости подхода к понижению порядка моделей процесса на основе метода ДШВ. Дополнительные возможности диагностики разнотемповости предоставляются при расчете параметров, позволяющих рассматривать медленную и быструю составляющие как сепаратные. Для этого: а. Рассчитываются параметры матриц декомпозиции PБ и QБ с использованием Б-преобразования по формулам (1.23) и (1.35). Расчет проводится итеративно. Факт сходимости итерационного процесса расчета матриц PБ и QБ к константным матрицам и скорость сходимости можно контролировать по следу матриц. б. Если итерационный процесс (1.23) расходится, то следует сделать вывод о том, что различия в инерционности субпроцессов недостаточны 29
для их использования при разработке моделей пониженного порядка на базе ДШВ, и отказаться от рассмотрения субпроцессов как разнотемповых. В противном случае, если итерационный процесс (1.23) сходится к константной матрице, то для следа матрицы PБ проверяется условие (1.30). Хотя это условие также только достаточное, но, как показывают расчеты для конкретных примеров, оно является менее жестким, чем (1.29). Если (1.30) выполняется, то можно рассматривать субпроцессы как разнотемповые и при невыполнении условия (1.29). Если же сходимость процесса (1.23) к константной матрице имеет место, но ее норма не удовлетворяет условию (1.30), то метод ДШВ, возможно, приведет к получению моделей пониженного порядка приемлемой точности, но окончательный вывод о приемлемости или неприемлемости метода можно будет сделать только по результатам моделирования. в. По полученным значениям PБ и QБ рассчитываются параметры АМ, АБ, BM, BБ модели (1.2) с сепаратными составляющими по формулам, приведенным в табл. 1. г. Тестируется правильность расчета матриц PБ и QБ: спектр собственных чисел матриц АМ, АБ должен быть объединением спектра собственных чисел исходной матрицы объекта AD. д. Тестируется правильность декомпозиции вектора состояния на сепаратные разнотемповые субпроцессы. Основа тестирования – проверка выполнения соотношения (1.19), связывающего исходный вектор состояния с блочным вектором, компонентами которого являются вектора состояния сепаратных субпроцессов. Значения вектора состояния, полученные с помощью этого преобразования (xагрег[s]), должны быть равны значениям исходного вектора состояния (x[s]) для всех s = 0, 1, … (достаточно сопоставить значения для одного – двух тактов). Двойственный способ тестирования – использование (1.18) для оценки вектора сепаратных переменных xсепарат[s]. Значения вектора, полученного с помощью преобразования (1.18), должны совпадать со значениями xM[s] и xБ[s]. Таким образом, в результате выполнения этапа 2: – либо будет сделан вывод о неприменимости подхода к упрощению модели процесса на базе метода ДШВ; – либо будут получены параметры моделей, позволяющих оценить количественно время завершения переходных процессов для свободной составляющей быстрого субпроцесса и определить соотношение шкал быстрого и медленного времени по формуле δt = μ⋅Δt.
5. Пояснения к этапу 3. Моделирование динамики системы с помощью метода двойной шкалы времени. Целью расчетов является определение качества аппроксимации объ30
екта моделью пониженного порядка. Существо метода понижения порядка состоит в следующем:
1. Собственная динамика быстрой составляющей через несколько тактов медленного времени работы системы завершается, начальные условия для нее перестают сказываться на изменениях вектора быстрого субпроцесса. 2. После этого можно приближённо учитывать динамику только медленной составляющей. Быстрая составляющая при этом рассматривается как вынужденная, которая безынерционно отслеживает медленную составляющую и внешние воздействия. Это позволяет снизить размерность описания процесса до значения размерности медленной составляющей. 3. На начальном участке процесса, когда влияние начальных условий на динамику свободной компоненты быстрого субпроцесса ещё заметно, вводится более дробный интервал дискретизации (быстрая дискрета) и параметры модели процесса пересчитываются согласно этому интервалу, см. этап 1. На этом участке (так называемый пограничный слой, boundary layer) будем приближенно считать, что значение вектора состояния медленного субпроцесса не успевает измениться по сравнению с достигнутым к началу периода времени, на котором вводится быстрая дискрета. Поэтому медленную составляющую можно рассматривать как константный вектор. Это позволит снизить размерность модели процесса на начальном участке до размерности быстрой составляющей.
Выполняются следующие действия: 1. Рассчитываются процессы для медленной подсистемы.
x1 _ appr [ s + 1] = AM x M [ s ] + VM u[ s ] ,
(1.37) x 2 _ appr [ s ] = − PБ x1 _ appr [ s ] + VБ u[ s ] , (1.38) где в отличие от (1.2), [см. § 1] учтены управляющие воздействия u[s] и введены матричные коэффициенты VM = BM + QБVБ , VБ = ( E − AБ ) −1 BБ , Е – единичная n2 × n2 матрица (предполагается, что матрица (E – AБ) обратима). Переменная x1_appr[s] приближенно соответствует «физической» медленной составляющей x1[s]. Аппроксимация x2_appr[s] динамики «физической» быстрой составляющей x2[s] сводится к безынерционному слежению (1.38) за изменениями медленной составляющей и управляющих воздействий. 2. Определяется число тактов, относящихся к «пограничному слою». Для этого рассчитываются и сравниваются 31
реакции исходной модели процесса (1.35) и модели пониженного порядка (1.39) на ступенчатое изменение управляющего воздействия. Задается погрешность ε > 0 аппроксимации процесса в целом только его медленной составляющей. Определяется номер такта, начиная с которого различия между реакциями укладываются в трубку допустимых расхождений ± ε. Этот номер такта определяет границу, вне которой собственную динамику быстрого субпроцес-са можно не учитывать с точностью до ε. 3. На участке пограничного слоя вводится быстрая шкала времени с дискретой δt = μ⋅Δt и производится расчет параметров модели для быстрого времени (по формулам этапа 1). Модель пониженного (до размерности вектора состояния быстрого субпроцесса) порядка для приближенного описания быстрой составляющей в пограничном слое имеет вид:
x2 _ bound [ s,τ + 1] = A22 _ bound x2 _ bound [ s,τ ] +
+ B2 _ boundu[s,τ ] + A21 _ boundx1[s] , (1.39) где A21_bound, A22_bound, B2_bound – параметры модели пониженного порядка в пограничном слое, рассчитанные по параметрам A и B, с учетом нового интервала дискретизации; τ – такты отсчета дискрет быстрого времени; x1[s] – вектор состояния медленной составляющей, соответствующий началу отсчета быстрых дискрет, τ = 0; u[τ] – медленное управление, пересчитанное на шкалу быстрого времени. 4. Медленная составляющая в пограничном слое рассматривается приближенно как константа: x1 _ bound [τ ] = x1 [ 0 ] . Для сравнения рассчитывается точное значение переменных состояния: xtrue[τ + 1] = Abound xtrue[τ ] + Bboundu[τ ] , где Abound, Bbound – параметры модели объекта, пересчитанные с учетом интервала дискретизации δt. 32
5. Для оценки точности представления динамики (1.34) моделями пониженного порядка (1.37), (1.38) рассчитываются показатели для медленной (JM) и быстрой (JБ) составляющих медленной подсистемы: JМ =
JБ =
N 1 ∑ (x1[i] − xМ [i])T (x1[i] − xМ [i]) , N − k i =1+ k N 1 (x2[i] − xБ [i])T (x2[i] − xБ [i]), ∑ N − k i =1+ k
где N – максимальное количество тактов дискретного времени; k – номер такта, начиная с которого рассчитываются показатели качества. 6. В пограничном слое для оценки точности аппроксимации медленной составляющей константой рассчитывается относительная погрешность: x1 _ true [ s b ] − x1 _ bound [ s b ] ⋅ 100 %. J отн = x1 _ true [ s b ] 7. В заключение производится сравнение погрешности аппроксимации быстрой составляющей статической (1.38) и динамической (1.39) моделью: pogr стат [τ ] = x 2 _ appr [τ ] − x 2 _ true [τ ] ; pogr дин [τ ] = x 2 _ bound [τ ] − x 2 _ true [τ ] .
Эта позиция завершает расчеты по разработанной методике. Далее позиции методики проверяются на двух примерах. Пример 1 (п. 3.2) специально рассчитан для абстрактного процесса 4-го порядка так, чтобы достаточное условие (1.29) для малого параметра μ не соблюдалось. В этом примере иллюстрируется использование моделирования для подтверждения наличия свойства разнотемповости.
33
Пример 2 (§ 4) относится к прикладной задаче. В этом примере достаточное условие (1.29) оказалось выполненным, что позволило упростить расчеты. 3.2. Пример выполнения расчетов и моделирования по разработанной методике для объекта четвертого порядка с разнотемповыми составляющими
Для выполнения моделирования были разработаны специальные программные средства, реализованные на базе пакета программ для научных расчетов MathCAD-2001. Перейдем к описанию результатов проверки методики на примере. Исходные данные приведены в приложении 1. Генерация параметров непрерывной модели была произведена с помощью специально разработанной процедуры получения матрицы А с заранее выбранным составом собственных чисел – так, чтобы собственные числа А в данном примере разделялись на 2 группы. Первая (действительные собственные числа λ3 = – 0.021 и λ4 = – 0.097) соответствует 2-мерному вектору медленно затухающего (апериодического) субпроцесса. Вторая группа (комплексная пара собственных чисел λ1,2 = – 0.876 ± 0.168i) соответствует 2-мерному вектору быстро затухающего (колебательного) субпроцесса. Выполнение этапа 1. Сравним значения матриц дискретных моделей AD и BD, рассчитанных для медленного времени с интервалом отсчета Δt = 2 (ед.), а также Abound и Bbound, рассчитанных для быстрого времени с интервалом отсчета δt = 0.34 (ед.), с параметрами A и B, см. приложение 1: ⎡− 0.0235 − 0.0032 − 0.2 − 0.077⎤ ⎡ 0.5 − 0.9⎤ ⎢ 0.015 − 0.0065 − 0.5 ⎥ ⎢ ⎥ − 0 . 09 ⎥, B = ⎢− 0.2 0.3 ⎥, A=⎢ ⎢ 0.11 ⎢ 0.7 − 1.052 0.0918⎥ 0.19 1 ⎥ ⎢ ⎥ ⎢ ⎥ − 0.043 − 0.18 − 0.788⎦ ⎣ − 0.13 ⎣ 1.1 − 1.3⎦
− 0.04 − 0.141 − 0.084 ⎤ ⎡ 0.724 − 1.828⎤ ⎡ 0.945 ⎥ ⎢ ⎢ − 0.011 0.893 − 0.378 − 0.113⎥ ⎥, B D = ⎢ − 0.902 0.227 ⎥, AD = ⎢ ⎢ 0.604 ⎢ 0.08 0.143 0.058 0.01 ⎥ 0.675 ⎥ ⎥ ⎢ ⎥ ⎢ − 1.268⎦ ⎣ 0.98 ⎣− 0.138 − 0.059 − 0.022 0.215 ⎦
34
Abound
⎡ 0.9914 − 0.0029 − 0.0566 − 0.0239⎤ ⎡ 0.1593 − 0.313 ⎤ ⎢ 0.0029 ⎥ ⎢− 0.0922 0.0828 ⎥ 0.993 − 0.1431 − 0.0293⎥ ⎥. =⎢ , Bbound = ⎢ ⎢ 0.0311 0.0544 0.6905 0.0217 ⎥ ⎢ 0.2069 0.28 ⎥ ⎥ ⎢ ⎥ ⎢ ⎣− 0.0399 − 0.0145 − 0.0427 0.7627 ⎦ ⎣ 0.3223 − 0.3941⎦
Несмотря на отсутствие сходства в значениях параметров, дискретные модели удовлетворяют условию согласованности с порождающей моделью. Собственные числа матриц AD и ADF равны: ⎡0.739 + 0.043i ⎤ ⎡0.164 − 0.057i ⎤ ⎢0.739 − 0.043i ⎥ ⎢0.164 + 0.057i ⎥ ⎥. ⎥ ⎢ λ ( AD ) = ; λ ( Abound ) = ⎢ ⎥ ⎢ ⎥ ⎢ 0.993 0.824 ⎥ ⎢ ⎥ ⎢ 0.967 0.959 ⎦ ⎣ ⎦ ⎣
Как видно из приведенных значений, в дискретных моделях (как и в порождающей) существуют зазоры между двумя группами собственных чисел матриц, следовательно, в объекте возможно наличие процессов с существенно различными инерционными характеристиками. Кроме того, поскольку все собственные числа лежат в круге единичного радиуса на комплексной плоскости, то дискретная модель устойчива. Выполнение этапа 2. Рассчитываем параметр μ: AD 22 μ= = 0 .172 . AD 11 Поскольку μ << 1, можно предположить, что в объекте имеется свойство разнотемповости. Тестируем значение μ на соответствие условию (1.29). Промежуточные вычисления приведены в приложении 1. Получено достаточное условие, определяющее μ как малый параметр:
0 ≤ μ < 0.118 .
Как видно из неравенства, при значении μ = 0.172 данный тест дает отрицательный результат (достаточное условие не соблюдается), следовательно, необходим этап моделирования для подтверждения возможности применения метода ДШВ в данном объекте. Проводим декомпозицию процесса на сепаратные составляющие. Для этого рассчитываем матрицы PБ и QБ с использованием Бпреобразования по формулам (1.23) и (1.25). Расчет проводится итеративно. Определить правильность расчета матриц PБ и QБ можно по скорости сходимости итеративного процесса. Для этого анализируется след матриц PБ и QБ. Такой анализ приведен на рис. 1 для цифровых данных примера из приложения 1. След матрицы удовлетворяет достаточному условию (1.30): PБ = 0 .311 ≤ 0 .594 , см. приложение 1. 35
а)
б)
Рис. 1. Иллюстрация сходимости процедуры расчета матриц PБ и QБ
Из рис. 1 видно, что в данном примере сходимость итерационных процедур хорошая, и в качестве значений матриц PБ и QБ можно принять значения на шестой итерации: ⎡− 0.092 − 0.189⎤ ⎡0.196 0.135⎤ PБ = ⎢ , QБ = ⎢ ⎥ ⎥. 0.119 ⎦ ⎣0.523 0.211⎦ ⎣ 0.195
По полученным значениям PБ и QБ рассчитываем параметры АМ, АБ, BM, BБ и тестируем правильность расчетов: спектр собственных чисел матриц АМ, АБ, должен быть объединением спектра собственных чисел исходной матрицы объекта AD. В рассматриваемом примере: ⎡ 0 .164 − 0 .057 i ⎤ ⎢ 0 .164 + 0 .057 i ⎥ ⎡ 0 .824 ⎤ ⎡ 0 .164 − 0 .057 i ⎤ ⎥. ⎢ A , ( ) A λ ( AM ) = ⎢ λ λ , ( ) = = Б D ⎥ ⎢ 0 .164 + 0 .057 i ⎥ ⎥ ⎢ 0 .824 ⎣ 0 .959 ⎦ ⎣ ⎦ ⎥ ⎢ 0 .959 ⎦ ⎣ Проанализируем полученный результат. Построим графики исходных и сепаратных составляющих вектора состояния. На этапе подготовки к моделированию примем управляющие воздействия равными нулю, чтобы проследить, как отрабатываются начальные условия. Сравним графики процессов с «физическими» и сепаратными составляющими (рис. 2). Как видно из рис. 2б, 2г, «физический» быстрый процесс (x3[s], x4[s]) не будет (при нулевых управлениях) равен нулю, пока не закончатся переходные процессы в медленной составляющей, поскольку через перекрестные связи (через матрицу A21) эта составляющая влияет на быстрый субпроцесс (см. рис. 2г). Однако динамика быстрой составляющей xБ[s] после сепарации ее от медленного субпроцесса при тех же условиях почти сразу завершается (рис. 2а, 2б). Следовательно, метод ДШВ позволяет не только упростить модель объекта, но и прояснить физическую картину процесса.
36
б)
а)
в)
г)
Рис. 2. Сравнение элементов вектора состояния сепаратной модели (xM[s], xБ[s]) и исходного «физического» процесса (x[s])
Тестируем правильность выполнения декомпозиции с помощью соотношений агрегирования (1.19) и (1.8) для некоторых тактов s. В рассматриваемом примере тест по (1.19) подтверждает правильность расчетов. Например, при s = 5: ⎡− 2.589⎤ ⎡− 2.589⎤ ⎢ 1.064 ⎥ ⎢ 1.064 ⎥ ⎥. ⎥ ⎢ xагрег [5] = , x[5] = ⎢ ⎢ − 0.038⎥ ⎢− 0.038⎥ ⎥ ⎢ ⎥ ⎢ ⎣ 0.377 ⎦ ⎣ 0.377 ⎦ Тест по (1.18) также подтверждает правильность расчетов. Например, при s = 3: ⎡ − 2.723 ⎤ ⎢ 1.354 ⎥ ⎥ , x M [3] = ⎡ − 2.723⎤ , x Б [3] = ⎡ 0.0061 ⎤ . x сепарат [3] = ⎢ ⎢ 1.354 ⎥ ⎢ − 0.017 ⎥ ⎢ 0.0061 ⎥ ⎣ ⎦ ⎣ ⎦ ⎥ ⎢ ⎣ − 0.017 ⎦ Выполнение этапа 3. На рис. 3 приведены графики, иллюстрирующие точность аппроксимации динамики объекта моделью пониженного порядка, соответствующей медленной подсистеме. 37
а)
б)
в)
г)
Рис. 3. Точность аппроксимации динамики объекта медленной (x1_appr[s]) и быстрой (x2_appr[s]) составляющих
Из рис. 3 следует, что точность аппроксимации медленной составляющей (рис. 3а, 3б) очень хорошая. Но точность аппроксимации быстрой составляющей (рис. 3в, 3г) на первых нескольких тактах неудовлетворительна.
Погрешность аппроксимации оценивается по средним квадратическим ошибкам. Величина этих показателей зависит от следующих факторов: – От величины параметра μ. – От частоты смены управляющих воздействий, поскольку именно смена управляющего воздействия возбуждает собственную динамику быстрого процесса. – От номера такта времени (при постоянных управляющих воздействиях), начиная с которого рассчитываются показатели качества. Чем этот номер больше, тем лучше значения показателей качества (со временем точность аппроксимации возрастает). Показатели качества для медленной (JM) и быстрой (JБ) составляющих рассчитываются следующим образом: JМ =
N 1 (x1[i] − xМ [i])T (x1[i] − xМ [i]) , ∑ N − k i =1+k
38
JБ =
N 1 (x2 [i] − x Б [i])T (x2 [i] − x Б [i]) , ∑ N − k i =1+ k
где N – максимальное количество тактов дискретного времени; k – номер такта, начиная с которого рассчитываются показатели качества. В рассматриваемом примере значения показателей качества равны: при k = 0: J M = ⎡⎢0.024 ⎤⎥, J Б = ⎡⎢0.026 ⎤⎥ ; при k = 3: J M
⎣ 0.041⎦ ⎣0.149 ⎦ ⎡ 0.000274 ⎤ . ⎡0.0000918 ⎤ =⎢ , JБ = ⎢ ⎥ ⎥ ⎣0.1000336 ⎦ ⎣ 0.000187 ⎦
Как следует из полученных результатов, по мере удаления от начального момента времени точность аппроксимации моделью пониженного порядка возрастает. Далее рассчитываем число отсчетов времени, входящих в пограничный слой. Для этого вводится общий показатель аппроксимации – среднее квадратическое отклонение всех компонент истинного вектора x[s] от его аппроксимации вектором xappr[s]: pogr [ s ] = δ X [ s ] = x[ s ] − x appr [ s ] . Как видно из рис. 4, погрешность аппроксимации со временем резко уменьшается.
Рис. 4. Погрешность аппроксимации исходного вектора x[s] моделью пониженного порядка xappr[s]
Используя рассчитанную величину погрешности, оценим интервал времени, в течение которого будет наблюдаться влияние собственной динамики быстрой фазы (продолжи39
тельность пограничного слоя). Способ оценки: начиная с номера такта времени, при котором величина погрешности заведомо меньше заданной погрешности ε, уменьшаем в обратном времени номер такта до тех пор, пока погрешность остается меньше заданной. В результате будет определен номер такта, до которого необходимо учитывать динамику быстрой составляющей. Величина пограничного слоя (sboundary) в рассматриваемом примере равна четырем тактам медленного времени. Далее уточняем величину интервала дискретизации шкалы быстрого времени и пересчитываем параметры модели объекта для быстрой шкалы. Интервал дискретизации для пограничного слоя вычисляем так: nБ = Δt/δt было целым и близким к оценке 1 / μ = 5.819 . Затем параметры модели объекта пересчитываются с учетом нового интервала дискретизации и определяется количество тактов быстрого времени, приходящееся на один такт медленного времени (в примере nБ = 6). На рис. 5 приведено сравнение истинных значений вектора состояния и его приближенной оценки в течение периода времени, входящего в пограничный слой.
40
а)
б)
в)
г)
Рис. 5. Сравнение истинного значения вектора состояния (xtrue[τ]) и его оценки (x1_bound[τ], x2_bound[s,τ]) в пограничном слое
Из рис. 5а, следует, что к концу пограничного слоя истинное значение быстрой составляющей x true 3 [τ ] расходится со своей оценкой x 2 _ bound 1 [ s , τ ] . Это подтверждает предположение о том, что динамику быстрой составляющей необходимо учитывать только в начале пограничного слоя. Рис. 5в, 5г подтверждают предположение о неизменности значений медленных составляющих (x1_bound[τ]) в пограничном слое. Для оценки точности аппроксимации медленной составляющей константой рассчитывается относительная погрешность: J отн =
x1 _ true [ s b ] − x1 _ bound [ s b ] x1 _ true [ s b ]
⋅ 100 % ,
где sb – число тактов быстрого времени в пограничном слое. Относительная погрешность аппроксимации медленной составляющей x1_bound[τ] в рассматриваемом примере равна: 41
⎡7.491%⎤ . J отн = ⎢ ⎥ ⎣ 33.3% ⎦
Как видно, даже в конце пограничного слоя
погрешность невелика. В заключение производится сравнение погрешности аппроксимации быстрой составляющей статической (1.38) и динамической (1.39) моделью: pogrстат [τ ] = x 2 _ appr [τ ] − x 2 _ true [τ ] ; pogrдин [τ ] = x 2 _ bound [τ ] − x 2 _ true [τ ] .
Результаты сравнения приведены на рис. 6.
а)
б)
Рис. 6. Погрешности оценивания быстрой составляющей статической (1.38) и динамической (1.39) моделями
Как видно из рис. 6, к концу пограничного слоя точность обеих оценок сближается. На начальном участке пограничного слоя хорошо видно улучшение оценки быстрой составляющей благодаря учету ее собственной динамики. На рис. 7 сопоставлены значения истинной быстрой составляющей x2_true[τ], ее оценки в пограничном слое 42
x2_bound[s,τ] и ее безынерционной оценки x2_appr[τ] при ненулевых управляющих воздействиях.
а)
б)
Рис. 7. Сравнение истинной быстрой составляющей (xtrue[τ]) с ее оценками по статической (x2_appr[τ]) и динамической (x2_bound[s,τ]) моделям
Из рис. 7 видно, что в моменты смены управляющего воздействия динамическая оценка x2_boubd[s,τ] ближе к истинному значению x2_true[τ], при этом безынерционная оценка x2_appr[τ] не имеет ничего общего с истинной составляющей. Однако в моменты постоянства управляющего воздействия безынерционная оценка становится точнее оценки пограничного слоя. 43
Приведенный пример показывает, что разработанная методика позволяет провести все необходимые расчеты, содержит средства для диагностики их правильности и позволяет оценить пригодность метода ДШВ для понижения размерности модели объекта.
§ 4. Использование метода двойной шкалы времени при моделировании электродвигателя постоянного тока Изложенная выше методика (§ 3) применяется для задачи управления электродвигателем постоянного тока, в котором из физических соображений можно выделить характеристики, обладающие существенно различной инерционностью: скорость вращения вала двигателя и скорость тока в якорной цепи. Целью моделирования является подтверждение предположения о существенно различных инерционных характеристиках объекта и в случае подтверждения – определение интервала дискретизации для быстрой и медленной составляющих объекта. Модель объекта описывается линейной дискретной системой в терминах пространства состояний: x[ s + 1] = AD x[ s ] + B D u[ s ] + C D f [ s ] , где x[s] – вектор размерности 2 × 1, элементами которого являются: x1 – скорость вращения вала двигателя; x2 – ток в якорной цепи; u[s] – управляющее воздействие – скаляр (напряжение питания цепи якоря); f[s] – возмущающее воздействие – скаляр (момент нагрузки на валу двигателя); s – такты дискретного времени, соответствующие интервалу дискретизации медленного времени Δt; A,B,C – матрицы параметров объекта.
При моделировании по методу ДШВ возмущающее воздействие полагалось равным 0. Более подробное описание модели электродвигателя и ее верификации приведено в приложении 2. Этап 1. Сепарация вектора состояния. Для декомпозиции вектора состояния рассчитываются параметры матрицы декомпозиции PБ и QБ с использованием Б-преобразования по формулам (1.23) и (1.25). Расчет проводится итеративно. Из рис. 8 видно, что сходимость итерационных процедур хорошая, и в качестве значений параметров можно принять значения на 6-й итерации (PБ = 0,154; QБ = – 1,25). По полученным значениям PБ и QБ рассчитываются параметры АМ, АБ, BM, BБ модели (1.2) с сепаратными составляющими (формулы приведены в табл. 1).
44
При правильном расчете параметров PБ и QБ спектр собственных чисел матриц АМ, АБ должен являться объединением спектра собственных чисел исходной матрицы объекта A:
AM = 0.81 ⎡ 0.81⎤ λ ( A) = ⎢ ⎥, AБ = 0.28 0 . 28 ⎣ ⎦
где λ(А) – собственные числа матрицы А.
а)
б)
Рис. 8. Сходимость итерационных процедур расчета параметров PБ и QБ
Далее необходимо сравнить графики исходных переменных состояния (x1[s] и x2[s]) и полученных в результате декомпозиции (xM[s] и xБ[s]).
а)
б)
Рис. 9. Сравнение исходных переменных состояния (x1[s], x2[s]) и сепаратных (xM[s], xБ[s])
Из рис. 9 видно, что динамика быстрого процесса x2[s] не сразу заканчивается из-за влияния медленного процесса через элемент A21 матрицы А. В то же время составляющая xБ[s], полученная в результате декомпозиции, почти не имеет инерции и завершается быстро.
Для проверки правильности декомпозиции используем два теста, введенные в п. 1.3: 1. Между исходными и сепарированными переменными состояния существует линейное преобразование (1.19). Соответственно значения 45
вектора состояния, полученные с помощью этого преобразования, должны быть равны значениям исходного вектора состояния в одинаковые моменты времени s. Так, при s = 4 (как и при других s) значения одинаковы: ⎡1561.6⎤ ⎡1561.6.⎤ , x [4] = , x[4] = П
⎢12.496⎥ ⎣ ⎦
⎢12.496 ⎥ ⎣ ⎦
где x П [4] – вектор, полученный с помощью преобразования (1.19); x[4] – исходный вектор. 2. Аналогично получается и второе преобразование, при котором из исходного вектора состояния с помощью (1.18) получается вектор сепарированных переменных xM[s] и xБ[s]. Значения вектора, полученного с помощью преобразования (1.18), должны совпадать со значениями xM[s] и xБ[s]. В данном случае это также соблюдается. Например, при s = 10: ⎡1563.7⎤ xM [10] = 1563.7, x П _ C [10] = ⎢ ⎥, ⎣12.737⎦ x Б [10] = 12.737, где x П _ C [10] – вектор, полученный с помощью преобразования (1.18); xM[10], xБ[10] – значения сепарированных медленной и быстрой составляющих.
На этом первый этап моделирования закончен. В результате его выполнения проведена декомпозиция исходной модели на две составляющие, имеющие различные инерционные характеристики. Этап 2. Определение величины малого параметра для шкалы быстрого времени. В качестве критерия, определяющего наличие свойства ДШВ в объекте, был выбран малый параметр μ (формула (1.28)). При расчете малого параметра для электродвигателя получилось следующее значение: μ=
A22 A11
= 0.187.
Полученное значение меньше единицы, что говорит о возможности наличия свойства ДШВ в объекте. Кроме параметра μ, рассчитываются еще несколько параметров (1.29), (1.30), которые позволяют проверить, будет ли достигнута хорошая точность аппроксимации динамики процесса в объекте с использованием только медленной составляющей. 46
1. По формуле (1.29) получен следующий результат: 0 ≤ μ < 0.224 . Как видно из неравенства, при значении μ = 0.187 данный тест дает положительный результат, следовательно, в объекте свойство ДШВ имеет место. 2. По формуле (1.30) получен следующий результат: PБ ≤ 0.275 . Данное неравенство выполняется, так как PБ = 0.155. На этом этап 2 завершен. Поскольку все тесты дали положительный результат, то свойство ДШВ имеет место в объекте. Этап 3. Моделирование динамики системы с помощью метода двойной шкалы времени.
1. Определяется число тактов, относящихся к пограничному слою. При этом погрешность аппроксимации (ε) процесса медленной составля-ющей равна 0.001. Переменная x1_appr[s] рассчитывается по формуле (1.37) и приближенно соответствует «физической» медленной составляю-щей x1[s]. Аппроксимация x2_appr[s] (по формуле 1.38) динамики «физической» быстрой составляющей x2[s] сводится к безынерционному слежению за изменениями медленной составляющей и управляющих воздействий. На рис. 10 приведены графики, иллюстрирующие точность аппроксимации динамики объекта.
а)
б)
47
Рис. 10. Точность аппроксимации исходного вектора состояния (x1[s], x2[s]) моделью пониженного порядка (x1_appr[s], x2_appr[s])
Из рис. 10а следует, что точность аппроксимации медленной составляющей очень хорошая. Но точность аппроксимации быстрой составляющей на первых нескольких тактах неудовлетворительна. Погрешность аппроксимации оценивается по средним квадратическим ошибкам, значения которых для медленной (JM) и быстрой (JБ) составляющих равны: при k = 0: JM = 0.0339, JБ = 0.0318; при k = 3: JM = 0.0067, JБ = 0.0013. Как следует из полученных результатов, по мере удаления от начального момента времени точность аппроксимации моделью пониженного порядка возрастает. Далее рассчитывается величина пограничного слоя. Для этого вводится общий показатель аппроксимации – среднее квадратическое отклонение всех компонент истинного вектора x[s] от его аппроксимации вектором xappr[s]: pogr [ s ] = δ X [ s ] = x[ s ] − x appr [ s ] . Рис. 11 показывает, что погрешность со временем резко уменьшается.
Рис. 11. Погрешность аппроксимации исходного вектора x[s] моделью пониженного порядка xappr[s]
Используя рассчитанную величину погрешности, оцениваем продолжительность пограничного слоя, которая при моделировании электродвигателя получилась равной: sboundary = 4 такта медленного времени, т. е. 6 (с). 48
2. Далее производится расчет интервала дискретизации быстрой шкалы времени и пересчет модели объекта согласно новой дискрете. Интервал дискретизации для пограничного слоя вычисляется с помощью малого параметра μ: δt = μ ⋅ Δ t ,
где Δt – интервал дискретизации медленного времени. Затем параметры модели объекта пересчитываются с учетом нового интервала дискретизации и определяется количество тактов быстрого времени, приходящееся на один такт медленного времени (nБ = 6). Модель пониженного порядка для приближенного описания быстрой составляющей в пограничном слое имеет вид (1.39). Медленная составляющая в пограничном слое считается константой: x1 _ bound [τ ] = x1 [ 0 ] . Для сравнения рассчитывается точное значение переменных состояния: x true [τ + 1] = Abound x true [τ ] + Bbound u[τ ] , где Abound, Bbound – параметры модели объекта, пересчитанные с учетом интервала дискретизации δt. На рис. 12 приведено сравнение истинных значений вектора состояния и его приближенной оценки.
а) слое
б) Рис. 12. Сравнение истинного значения вектора состояния и его оценки в пограничном
49
Из рис. 12 следует, что к концу пограничного слоя истинное значение быстрой составляющей x2_true[τ] расходится со своей оценкой x2_bound[s,τ]. Это подтверждает предположение о том, что динамику быстрой составляющей необходимо учитывать только в начале пограничного слоя. Для оценки точности аппроксимации медленной составляющей константой рассчитывается относительная погрешность: J отн =
x1 _ true [ s b ] − x1 _ bound [ s b ] x1 _ true [ s b ]
⋅ 100 % ,
где sb – число тактов быстрого времени в пограничном слое. Относительная погрешность аппроксимации медленной составляющей электродвигателя равна: Jотн = 0.13 %. Как видно, в конце пограничного слоя погрешность невелика. В заключение производится сравнение погрешности аппроксимации быстрой составляющей статической (1.38) и динамической (1.39) моделями: pogr стат [τ ] = x 2 _ appr [τ 1 ] − x 2 _ true [τ ] ; pogr дин [τ ] = x 2 _ bound [τ ] − x 2 _ true [τ ] .
Результаты сравнения приведены на рис. 13.
Рис. 13. Погрешности оценивания быстрой составляющей статической (1.38) и динамической (1.39) моделями
Как видно из рис. 13, к концу пограничного слоя точность обеих оценок сближается. На начальном участке пограничного слоя хорошо видно улучшение оценки быстрой составляющей благодаря учету ее динамики. 50
На рис. 14 сопоставлены значения истинной быстрой составляющей x2_true[τ], ее оценки в пограничном слое x2_bound[s,τ] и ее безынерционной оценки x2_appr[s]. Из рис. 14 видно, что на первых тактах пограничного слоя динамическая оценка x2_bound[s,τ] точно следует истинному значению x2_true[τ], при этом безынерционная оценка x2_appr[τ] не имеет ничего общего с истинной составляющей. Однако затем точности оценок выравниваются, а в конце пограничного слоя безынерционная оценка становится точнее оценки, учитывающей динамику только быстрого субпроцесса (в предположении о постоянстве значения вектора состояния медленного субпроцесса).
Рис. 14. Сравнение истинной быстрой составляющей (x2_true[τ]) с ее оценками по статической (x2_appr[τ]) и динамической (x2_bound[s,τ]) моделям
§ 5. Выводы 1. Предложена методика моделирования многомерных линейных дискретных систем управления на основе метода декомпозиции модели объекта с существенно различными инерционными характеристиками. Определены условия, позволяющие проверить наличие свойства ДШВ в объекте без расчета собственных чисел. Приведено подробное описание 51
схемы моделирования системы по методу ДШВ для оценки точности аппроксимации объекта только медленной составляющей. 2. Предложенная методика подробно рассмотрена на примере моделирования системы четвертого порядка. Проведенное моделирование подтверждает возможность упрощенного описания данного объекта и выделения в нем процессов с существенно различными инерционными характеристиками. Предложенная методика позволяет проводить моделирование при ненулевых управляющих воздействиях. Таким образом, решена первая подзадача метода ДШВ – моделирование динамики сложного объекта с понижением порядка уравнений, ее описывающих. 3. Проверка методики проведена на примере моделирования динамики изменения скорости вращения (медленный субпроцесс) и тока в якорной цепи (быстрый субпроцесс) электродвигателя постоянного тока. Полученные результаты подтверждают возможность использования метода ДШВ при управлении данным объектом.
52
ГЛАВА 2. ПРОЕКТИРОВАНИЕ АЛГОРИТМИЧЕСКОГО ОБЕСПЕЧЕНИЯ ЦИФРОВОГО пи-РЕГУЛЯТОРА С УЧЕТОМ СВОЙСТВ ОБЪЕКТОВ С РАЗНОТЕМПОВЫМИ ПРОЦЕССАМИ
Содержание раздела составляют вопросы, связанные с расширением области применения цифровых регуляторов на объекты с существенно различными инерционными характеристиками. В настоящее время цифровые (в частности пропорционально-интегральные (ПИ)) регуляторы применяются в одноконтурных системах управления. Представляет интерес задача усовершенствования популярного цифрового ПИзакона управления без усложнения его технической структуры [32], за счет внесения изменений в алгоритмическое обеспечение. Ниже рассматриваются возможности такого усовершенствования за счет введения двойной шкалы времени и моделей пониженного порядка. Благодаря упрощениям, вносимым методом ДШВ, удается разработать алгоритм для ПИ-регулятора, в котором искусственно сформированы два контура за счет реализации управления в виде составного по схеме, описанной в п. 1.3. Контур, ответственный за управление медленными субпроцессами, работает в шкале медленного времени и реализует ПИ-управление этими субпроцессами. Контур, ответственный за управление свободной составляющей быстрого субпроцесса, работает в шкале быстрого времени только эпизодически, в периоды изменений режима работы объекта. В результате ритм работы регулятора получается неравномерным, и паузы, внутри которых быстрый контур не инициируется, могут быть заполнены дополнительными функциями, для которых в регуляторах с традиционной организацией вычислительного процесса недостаточен ресурс времени. Соответственно может быть повышен уровень автоматизации и достигнут дополнительный экономический эффект. 53
Изложение проводится по следующей схеме. На примере задачи управления объектом 2-го порядка рассматривается построение двухконтурного («двушкального») цифрового ПИ-регуля-тора (§ 1). Проводится анализ эффективности использования «двушкальных» регуляторов для задач управления объектами с разнотемповыми составляющими (§ 2). Для этого вводится система показателей качества (п. 2.1), позволяющих оценивать качество управления и возможности высвобождения ресурсов цифровой системы при использовании «двушкального» ПИ-регулятора. Оценка эффективности использования такого рода регуляторов проводится на примере задачи управления электродвигателем постоянного тока (п. 2.2). § 1. Схема построения цифрового ПИ–регулятора для объектов с разнотемповыми составляющими Традиционно ПИ-регулятор [33] применяется в одноконтурных системах управления. Цифровая форма ПИ-закона управления имеет вид: u [ s + 1] = u[ s ] + k p (ε [ s ] − ε [ s − 1]) + k i ε [ s ] , где u[s+1] – скалярное управляющее воздействие, рассчитываемое для следующего, (s+1)-го такта по данным об отклонениях ε [s] и ε [s–1] скалярного выхода объекта от заданного значения на текущем и предшествующем тактах работы системы, а также по величине управляющего воздействия u[s] в текущем такте. Настроечными параметрами ПИ-регулятора являются коэффициенты kp и ki (дискретные аналоги настроечных параметров ПИ-регулятора с непрерывным временем, характеризующие вклады пропорциональной и интегральной составляющих закона управления). Представляет интерес расширение сферы применения ПИрегулятора такое, чтобы в рамках одной и той же технической структуры управляющей системы реализовать двухконтурное управление путем усовершенствования алгоритмического обеспечения. Ниже данная задача решается применительно к управлению разнотемповыми процессами. Особенности этих процессов, рассмотренные в гл. 1, позволяют осуществить «развязку» контуров единой технической структуры во времени, используя метод ДШВ. Далее регулятор, имеющий контуры раздельного управления медленной и быстрой составляющими вектора состояния объекта, называется «двушкальным». 54
Рассматривается задача управления объектом, у которого имеется два выхода с различными характеристиками инерционности. Управление организуется по следующей схеме:
f[s] xм[s]
xм_z[s] xб_z[s]
ОБЪЕКТ
xб[s]
u[s,τ] uБ[s,τ] uM[s]
«Двушкальный» ПИ-РЕГУЛЯТОР
Рис. 15. Структура системы управления с «двушкальным» ПИ-регулятором
Управляющее воздействие u[s, τ] рассчитывается как составное,
u[ s, τ ] = u M [ s ] + u Б [ s, τ ] ,
причем такты s = 0, 1, … отсчитываются с дискретой медленного времени Δt , а такты τ = 0, 1, … – с дискретой быстрого времени δt, δt = μ⋅Δt, μ <<1, где μ – малый параметр, рассчитываемый исходя из характеристик разнотемповости, см. (1.28) в гл. 1. В периоды длительного постоянства задающих воздействий операция управления осуществляется медленной компонентой uM[s] составного управления со сравнительно редкими управляющими воздействиями (периодичность выдачи управлений Δt сравнительно большая). При этом, как следует из изложенного в гл. 1, достигается высокая точность управления не только медленным субпроцессом, но и вынужденной составляющей быстрого субпроцесса. В моменты резкого изменения задающих воздействий инициируется быстрая компонента uБ[s,τ] составного управления, «помогающая» основному, медленному контуру управлять динамикой быстрой составляющей. Далее подробное описание схемы построения «двушкального» ПИ-регулятора ведется на примере управления линейным дискретным объектом второго порядка, модель которого порождена исходной моделью в непрерывном времени: dx (2.1) = Ax (t ) + Bu (t ) , dt
55
где x(t) – вектор переменных состояния объекта размерности 2 × 1; u(t) – управляющее воздействие (скаляр); 0 .2 ⎤ ⎡ − 0 .8 ⎡ 0.5⎤ – матрицы параметров объекта. (2.2) A= ; B= ⎢ − 0.3 − 0.05⎥ ⎣ ⎦
⎢ 0 .7 ⎥ ⎣ ⎦
Значения параметров дискретной модели рассчитаны по методике, описанной в § 3, см. этап 1. В рассматриваемом примере: 0.164 ⎤ ⎡2.518⎤ . ⎡ 0.569 AD = ⎢ ⎥ ⎥; B D = ⎢ ⎣− 0.246 − 0.046 ⎦
⎣0.124 ⎦
Для того чтобы определить, обладает ли объект разнотемповыми составляющими, рассчитаем значение малого параметра μ (см. § 3, этап 2, гл. 1), получим μ = 0.058. Значение параметра μ удовлетворяет условию (1.28); следовательно, в объекте имеются процессы с существенно различными инерционными характеристиками. Затем рассчитывается интервал дискретизации быстрого времени (δt) и число (step) отсчетов быстрого времени в одной дискрете медленного времени: δ t = μΔt = 0.292; step =
Δt = 17. δt
Будем рассматривать режим работы объекта, при котором задающие воздействия для медленной и быстрой составляющих носят характер периодических колебаний прямоугольной формы (рис. 16).
а)
б)
Рис. 16. Задающие воздействия для медленной x1z[s] и быстрой x2z[s] составляющих
Характер процессов в объекте оценивается кривой разгона [40] (рис. 17). 56
Рис. 17. Реакция объекта на ступенчатое управляющее воздействие
По виду графика нельзя заметить, что в процессе есть медленная и быстрая составляющие, поскольку через внедиагональные элементы матрицы А медленная составляющая влияет на быструю и порождает иллюзию «собственной» (а не вынуждаемой изменениями медленной составляющей и управляющими воздействиями) динамики в ней. Далее рассчитываются параметры системы управления, синтезируемой в предположении об отсутствии динамики у быстрого процесса. Тогда его уравнение можно приближенно записать в статической форме: x Б [ s ] = AD 21 x М [ s ] + AD 22 x Б [ s ] + B D 2 u[ s ] . В результате получим описание быстрой составляющей через медленную xБ [s] = a 21xМ [s] + b2u[s] , (2.4) −1 где a 21 = (1 − AD 22 ) AD 21 ; b 2 = (1 − AD 22 ) −1 BD 2 . После подстановки безынерционной модели быстрого процесса (2.4) в уравнение медленного процесса произойдет понижение порядка объекта (до первого). Для управления медленным процессом используем дискретный вариант ПИ-закона с настроечными параметрами, значения которых в рассматриваемом примере выбраны из условия достижения минимального времени переходного процесса при отсутствии перерегулирования: kp = 0.08, ki = 0.009. 57
Расчет медленной составляющей и управляющих воздействий производится по следующим формулам: xМ [s + 1] = ( AD11 + AD12 a 21 )xМ [s] + ( AD12 b 2 + BD1 )u[s];
(
)
u[s] = u[s − 1] + k p + ki Δt ( xМz [s] − xМ [s]) − k p (xМz [s − 1] − xМ [s − 1]).
Далее необходимо произвести пересчет задающих воздействий для быстрой составляющей путем исключения влияния медленной составляющей: z[s] = xБZ [s] − a 21xм [s] − b2u[s] . В результате получится безынерционная модель быстрой составляющей, отслеживающая задающее воздействие xБ [s] = a 21xМ [s] + b 2u[s] + z[s] . На рис. 18 представлены результаты управления по модели пониженного порядка.
а)
б)
Рис. 18. Графики отработки задающих воздействий для медленной и быстрой составляющих
На графиках видно иллюзорно хорошее качество управления «быстрым» процессом (благодаря безынерционности его приближенного описания график точно следует заданию). Виден динамический характер изменения медленной составляющей даже при условии безынерционности быстрой составляющей. Для оценки потерь качества управления, вызванных отказом от рассмотрения быстрой составляющей как динамической, сравним результаты, представленные на рис.18, с расчетами, в которых те же управляющие воздействия применя58
ются к объекту с исходной моделью. Для этого производится пересчет задающих воздействий для быстрой составляющей ⎡ − AD12 z[ s] ⎤ . C[ s] = ⎢ ⎥ ⎣ z[ s](1 − AD 22 )⎦
В результате получим график отработки управляющего воздействия, рассчитанного по модели пониженного порядка, в системе с объектом исходного порядка (рис. 19): x[s + 1] = AD x[s] + BD u[s] + C[s] .
а)
б)
Рис. 19. Сравнение точности расчета изменений вектора состояния при использовании моделей пониженного и полного порядка
Из графиков (рис. 19) видно, что уточнение описания модели объекта (учет динамики быстрой составляющей) не требуется: имеет место практически полное совпадение результатов расчета по моделям полного и пониженного порядка. Сквозь призму медленного времени имеет место также хорошее совпадение быстрой составляющей с расчетной, безынерционной. Это связано с тем, что за интервал времени Δt, выбранный для медленной составляющей, переходный процесс в быстрой составляющей практически заканчивается. Однако даже при использовании интервала дискретизации Δt заметно наличие пограничного слоя (рис. 19), на котором имеют место небольшие отклонения быстрого процесса от его модели при изменениях задающих воздействий. Более детально отличие быстрого процесса xБ[s] от его истинного значения x2[s] показано на рис. 20. 59
Рис. 20. Погрешность оценки истинной быстрой составляющей x2[s] ее моделью xБ[s] в момент смены задающего воздействия x2z[s]
Для улучшения качества управления в пограничном слое используется быстрая добавка к медленному управлению, рассчитываемая в быстром времени. Для этого необходимо произвести пересчет всех параметров на быструю шкалу. На рис. 21 приведен график управляющего воздействия в быстрой шкале времени.
а)
б) Рис. 21. График управляющего воздействия в быстром времени
Справа на рис. 21 приведен фрагмент графика в растянутой шкале, где отчетливо видны участки постоянства медленного управления на тактах отсчета быстрого времени. Быстрая добавка к управляющему воздействию рассчитывается по следующей схеме: 1. Предполагается, что за такт быстрого времени медленная составляющая не изменяется: x2 [ s, τ ] = AD x1[ s] + AD x2 [ s, τ ] + BD u[ s] + BD u Б [ s, τ ] + C2 [ s] , 21
22
2
2
где uБ[s,τ] – быстрая добавка к управлению u[s]. 2. В полученное выражение подставим значение C2[s]:
x2 [ s,τ ] = AD21 x1[ s ] + AD22 x2 [ s,τ ] + BD2 u[ s ] + BD2 u Б [ s,τ ] +
(
)[
(
+ 1 − AD22 x2 z [ s ] − 1 − AD22
)
−1
(
AD21 x1[ s ] − 1 − AD22
60
)
−1
]
BD2 u[ s ] .
3. После упрощений получится уравнение для быстрого процесса в пограничном слое в отклонениях от задания: * ε 2 [ s , τ + 1] = AD x 2 [ s , τ ] + B D u Б [ s , τ ] , (2.5) 22
2
где ε 2 [ s , τ ] = x 2 [ s , τ ] − x 2 z [ s ] – рассогласование между «быстрым» процессом в пограничном слое и задающим воздействием. 4. Уравнение (2.5) показывает, что можно обеспечить сходимость быстрого процесса к заданию за один такт быстрого времени, если использовать пропорциональный (П)-закон управления: u Б [ s, τ ] = − k Б ε 2 [ s, τ ] , A где k = D 22 . Б B D2 Однако такое большое значение коэффициента усиления регулятора может нарушить устойчивость медленного процесса, поэтому следует подбирать его при настройке. В частности, можно использовать переменный коэффициент усиления П-закона, уменьшающий долю быстрого управления по мере удаления от момента смены задающего воздействия:
⎛ −τ + Δs⋅целое ⎛⎜ τ ⎞⎟⋅0.1 ⎞ ⎝ Δs ⎠ ⎟, k Б [τ ] = k Б ⋅ ⎜ e ⎟ ⎜ ⎠ ⎝ где k Б =
AD22 B D2
⋅ α – максимальное значение коэффициента усиления (α –
множитель, подбираемый при настройке).
На рис. 22 приведен график изменения коэффициента усиления П–регулятора. Заметно снижение значения коэффициента усиления по мере удаления от момента смены задающего воздействия.
Рис. 22. Фрагмент графика изменения коэффициента усиления П-регулятора
61
Далее производится расчет процессов в системе управления с использованием составного управляющего воздействия (суммы медленного и быстрого управления): x М _ Б [ s , τ + 1] = AD x М _ Б [ s , τ ] + BD (u[τ ] − u Б [ s , τ ]) + C [τ ] ,
(
)
где u Б [ s , τ ] = − k Б [τ ] x М _ Б2 [ s , τ ] − x 2 z [τ ] – быстрое управление; xМ_Б[s,τ] – процесс, вызванный в системе составным управлением; u[τ] – медленное управление, пересчитанное на шкалу быстрого времени; C[τ] – поправочный вектор задающих воздействий, пересчитанный на шкалу быстрого времени. В качестве основы для сравнения рассчитывается процесс, происходящий только под влиянием медленного управления: x[τ + 1] = Ad x[τ ] + Bd u[τ ] + C [τ ] , где Ad, Bd – параметры объекта, рассчитанные для дискретной модели с интервалом дискретизации δt, порожденной из (2.1). На рис. 23 представлен график быстрого управления.
Рис. 23. График быстрого управления в пограничном слое
На графике хорошо прослеживается уменьшение значения быстрого управления по мере удаления от границы смены задающего воздействия. На рис. 24 приведены результаты сравнения эффективности составного управления по сравнению с управлением только медленной составляющей. Быстрое управление порождает «всплеск» на графике xМ_Б[s,τ]. При рассмотрении процесса xМ_Б[s,τ] в медленной шкале времени «всплеск» не 62
обнаруживается, так как затухает внутри такта медленного времени. Поведение процесса xМ_Б[s,τ] в медленной шкале при использовании составного управления будет неотличимо от поведения при использовании только медленного управления.
Рис. 24. Сравнение графиков медленного процесса при использовании
составного управления (xМ_Б[s,τ]) и только медленного управления (x1[τ]) На рис. 25 прослеживается заметное улучшение качества управления на начальном участке пограничного слоя.
Рис. 25. Сравнение графиков быстрого процесса при использовании составного управления (xМ_Б[τ]) и только медленного управления (x2[τ])
На этом процесс построения алгоритмического обеспечения цифрового «двушкального» ПИ-регулятора завершается. Такой регулятор, в отличие от обычного ПИ-регулятора, формирует составное управляющее воздействие, включающее в себя сумму быстрой и медленной составляющих. Приведенные выше результаты показывают, что при этом достигается повышение качества управления, особенно заметное для быстрой составляющей выхода объекта. 63
§ 2. Оценка эффективности использования «двушкальных» цифровых ПИ-регуляторов Предлагается подход для обоснования эффективности введения ДШВ при проектировании цифровых систем управления. Подход основан на сопоставлении затрат ресурсов ЭВМ на организацию ДШВ, с одной стороны, и эффектов от повышения точности управления быстрой фазой за счет введения ДШВ и от расширения функций локальной системы управления, которые могут быть реализованы на свободных ресурсах вычислительной системы, с другой стороны. Расчет эффективности основывается на следующих данных. 1. Неизменяемая часть: – малый параметр μ, показывающий степень различия инерционных характеристик объекта; – характеристики задающих воздействий; представляются в форме средней частоты изменения режима работы объекта. 2. Варьируемая часть: – вариант технической структуры, задается характеристиками ресурсов цифровой системы (быстродействием, объемом оперативной памяти, скоростными характеристиками передачи данных и др.); – состав дополнительных информационных функций автоматического или автоматизированного управления (учет, контроль, протоколирование действий персонала, техническая диагностика и т. п.), которые могут принести экономический эффект, но непосредственно не связаны с управлением переменными состояния. Предположим, что вариант технической структуры выбран. Тогда задачу удается параметризировать, рассчитывая перечисленные эффекты и затраты в функции средней частоты изменения задающих воздействий и возмущений (рис. 26). Комментарии к рис. 26: 1. Затраты, связанные с организацией собственно режима ДШВ (т. е. с расчетом параметров, агрегированных фильтров, преобразованных элементов объекта и т. д.) можно считать независимыми от частоты смены режима работы.
64
Потери, связанные с качеством управления быстрой фазой
Потери, связанные с автоматизацией функций, которые вытесняются за счет увеличения частоты режима быстрой шкалы Эффективность введения ДШВ
Затраты, связанные с организацией режима ДШВ
ωopt
ω
Рис. 26. Обоснование эффективности введения ДШВ
2. Потери от функциональной неполноты системы из-за недостатка ее ресурсов будут небольшими при редких изменениях режима, поскольку после операций по расчету медленной составляющей управляющего воздействия высвобождается большая доля интервала времени Δt (эта доля и используется для выполнения дополнительных функций). 3. При увеличении частоты смены режима быстрая шкала занимает все большую часть шкалы медленного времени; при этом возрастает количество дополнительных функций системы, которые должны быть исключены из контура управляющей системы; соответственно, растут потери, связанные с их невыполнением. 4. Потери, связанные с ухудшением точности управления быстрой составляющей, уменьшаются по мере увеличения интервала действия быстрой фазы. Это уменьшение тем заметнее, чем чаще изменяется режим.
Если просуммировать все эти составляющие, то окажется, что имеется экстремум, соответствующий минимуму суммарных потерь качества управления при использовании цифровой системы с заданными ресурсами для управления объектом с заданными характеристиками разнотемповости. Положение минимума показывает, при какой средней частоте смены задающих воздействий экономический эффект от введения ДШВ максимален. Возможна также оценка диапазона частот изменения режима работы объекта, внутри которого эффект от введения ДШВ превосходит потери от утраты 65
части функций цифровой системы (правая ветвь экстремальной кривой на рис. 26) или от снижения качества управления быстрой составляющей (левая ветвь). Вышеизложенные положения иллюстрируются на примере задачи управления электродвигателем постоянного тока, моделирование которого по методу ДШВ рассматривается в гл. 1 (§ 4). 2.1. Система показателей для оценки эффективности введения ДШВ
Для оценки качества использования цифрового «двушкального» ПИ-регулятора по сравнению с обычным ПИ-регулятором вводятся следующие показатели качества: 1. Количество свободного времени (в тактах медленного времени) в промежутках между включениями быстрого управления – timefree. Показатель определяет, какой резерв времени имеется в цифровой системе для реализации дополнительных информационных функций, не связанных непосредственно с управлением (контроля, учета и т. д.). Для расчета показателя определяется количество тактов быстрого времени, когда быстрое управление равно нулю. Полученное значение времени делится на количество тактов быстрого времени в одной дискрете медленного. 2. Среднее квадратическое отклонение быстрого процесса от задающего воздействия при использовании составного (СКОБ) и только медленного управления (СКОБ_М) в пограничном слое: СКО Б =
1 s bound
Δs ⋅ step + s bound
∑ (x
τ = Δs ⋅ step
M _ Б2
[τ ] − x 2 z [τ ]
)
2
,
где sbound – число тактов медленного времени, по истечении которых можно считать, что «собственные» динамические процессы в быстрой составляющей завершились; Δs – периодичность изменений задающего воздействия (количество тактов медленного времени); xМ_Б2[τ] – вектор быстрого процесса при использовании составного управления; x2z[τ] – вектор задающих воздействия для быстрого процесса,
66
СКО Б _ M =
1
Δ s ⋅ step + s bound
s bound
τ = Δ s ⋅ step
∑
(x 2 [τ ] − x 2 z [τ ])2 ,
где x2[τ] – вектор быстрого процесса при использовании только медленного управляющего воздействия. 3. Сравнительная оценка среднего квадратического отклонения быстрого процесса при использовании составного и только медленного управления: СКО Б _ М − СКО Б . ⋅ 100 % Comp = Б
СКО Б _ М
4. Относительное отклонение быстрого процесса от задания при использовании составного (Jotn_Б) и только медленного управления (Jotn_Б_М) в пограничном слое: ⎛ x М _ Б [τ ] − x 2 z [τ ] 2 J otn _ Б = max ⎜ ⎜ x 2 z [τ ] ⎝
⎞ ⎟ ⋅ 100 %, ⎟ ⎠
τ = Δ s ⋅ step , L , Δ s ⋅ step + s bound ;
⎛ x [τ ] − x 2 z [τ ] ⎞ ⎟ ⋅ 100%, τ = Δs ⋅ step , L, Δs ⋅ step + sbound . J otn _ Б _ М = max ⎜⎜ 2 ⎟ x τ [ ] z 2 ⎠ ⎝
5. Сравнительная оценка относительного отклонения быстрого процесса при использовании составного и только медленного управления: Comp otn _ Б =
J otn _ Б _ М − J Б J otn _ Б _ М
⋅ 100 % .
6. Среднее квадратическое отклонение медленного процесса при использовании составного (СКОМ) и только медленного управления (СКОМ_М) в пограничном слое: СКО
М
=
Δ s ⋅ step + s bound
1
∑
s bound
τ = Δ s ⋅ step
(x M _ Б [τ ] − x1 z [τ ] )2 , 1
где xМ_Б1[τ] – вектор медленного процесса при использовании составного управления; x1z[τ] – вектор задающих воздействия для медленного процесса, СКО
М _M
=
1 s bound
Δ s ⋅ step + s bound
∑
τ = Δ s ⋅ step
67
(x1 [τ ] − x1 z [τ ] )2
,
где x1[τ] – вектор медленного процесса при использовании только медленного управления. 7. Сравнительная оценка среднего квадратического отклонения медленного процесса при использовании составного и только медленного управления СКО М _ М − СКО М Comp = ⋅ 100 % . М
СКО М _ М
8. Относительное отклонение медленного процесса от задания при использовании составного (Jotn_М) и только медленного управления (Jotn_М_М) в пограничном слое: ⎛ x М _ Б [τ ] − x1 z [τ ] 1 J otn М = max ⎜ ⎜ x1 z [τ ] ⎝
⎞ ⎟ ⋅ 100 %, ⎟ ⎠
τ = Δ s ⋅ step , L , Δ s ⋅ step + s bound ;
⎛ x [τ ] − x1 z [τ ] = max ⎜⎜ 1 x1 z [τ ] ⎝
⎞ ⎟ ⋅ 100 %, ⎟ ⎠
τ = Δ s ⋅ step , L , Δ s ⋅ step + s bound .
J otn М
_M
9. Сравнительная оценка относительного отклонения медленного процесса при использовании составного управления и только медленного управления: Comp otn _ М =
J otn М _ М − J М J otn М _ М
⋅ 100 % .
10. Среднее квадратическое отклонение медленного процесса при использовании составного (СКОall_М) и только медленного управления (СКОall_М_М) за весь период управления: СКО
all _ М
СКО
=
τ max
(x ∑ τ
1
τ max
all _ М _ M
=
=1
1
τ max
)
[τ ] − x 1 z [τ ] , 2
M _ Б1
τ max
(x [τ ] − x ∑ τ =1
1
[τ ] ) . 2
1z
11. Сравнительная оценка среднего квадратического отклонения медленного процесса при использовании составного и только медленного управления: 68
Comp all _ М =
СКО all _ М _ М − СКО all _ М СКО all _ М _ М
⋅ 100 % .
12. Среднее квадратическое отклонение быстрого процесса при использовании составного (СКОall_Б) и только медленного управления (СКОall_Б_М) за весь период управления: СКО
all _ Б
=
τ max
∑ (x M _ Б
1
τ max =
τ =1
2
[ s , τ ] − x 2 z [τ ]
)2
,
τ max
1
∑ (x 2 [ s , τ ] − x 2 z [τ ] )2
. τ max τ = 1 13. Сравнительная оценка среднего квадратического отклонения медленного процесса при использовании составного и только медленного управления: СКО all _ Б _ М − СКО all _ Б ⋅ 100 % . Comp all _ М = СКО
all _ Б _ M
СКО all _ Б _ М
2.2. Исследования качества управления объектом с применением «двушкального» цифрового ПИ-регулятора
В качестве объекта исследования рассматривается электродвигатель постоянного тока (модель и параметры приведены в приложении 2). Для оценки эффективности применения «двушкальных» цифровых регуляторов были проведены следующие эксперименты: 1. Сравнение динамики медленного и быстрого процессов при использовании составного и только медленного управления, а также зависимость свободного времени в системе управления от частоты задающего воздействия. Результаты эксперимента приведены на рис. 27, 28. Из рис. 27, 28 видно, что при увеличении частоты задающего воздействия количество тактов свободного времени уменьшается. Но при этом возрастает качество управления быстрым процессом при использовании составного управления по сравнению с обычным управлением. Преимущество же медленного процесса при использовании составного 69
управления по сравнению с обычным (только медленным) управлением невелико и остается на постоянном уровне. 25
9% 8%
20
7% 6%
15
5% 4%
10
3% 2% 1%
5 0
0% 2
3
4 5 6 7 8 частота смены задающего воздействия
timefree time_free
9
10
Comp all_Б Compall_Б
Рис. 27. Графики изменения свободного времени и сравнительной характеристики быстрого процесса при изменении частоты задающего воздействия 0.14 % 0.14 0.12 % 0.12 0.10.1 % 0.08 % 0.08 0.06 % 0.06 0.04 % 0.04 0.02 % 0.02 0% 0
2
3 4 5 6 7 8 9 частота смены задающего воздействия
10
Рис. 28. Графики изменения сравнительной характеристики медленного процесса Compall_M при изменении частоты задающего воздействия
Таким образом, имеется возможность обоснования области эффективного использования алгоритмов управления с ДШВ в составе управляющих и информационных функций автоматических и автоматизированных систем управления технологическими процессами (АСУТП). При заданных ресурсах техники управления и характеристиках разнотемповости процессов в объекте эта область определяется частотой изменений задающих воздействий, при которой достигается компромисс между требованием обеспечить высокое качество 70
управления быстрым процессом, с одной стороны, и стремлением высвободить ресурс времени управляющей системы для реализации дополнительных функций. 2. Исследование влияния изменения частоты возмущающего воздействия (при постоянной частоте задающего воздействия) на динамику медленного и быстрого процессов (результаты представлены на рис. 29, 30). Графики, показанные на рис. 29, подтверждают предположение о том, что при увеличении частоты возмущающего воздействия качество управления медленным процессом остается неизменным, а качество управления быстрым процессом улучшается. 12%
0,030%
10%
0,025%
8%
0,020%
6%
0,015%
4%
0,010%
2%
0,005%
0%
0,000% 2
3
4 5 6 7 8 частота смены возмущающего воздействия
Compall_Б
9
10
Compall_M
Рис. 29. Графики сравнительной характеристики быстрого и медленного процессов при изменении частоты возмущающего воздействия
На рис. 30 сравнивается динамика быстрой составляющей при 2-кратном и 10-кратном изменении возмущающего воздействия за весь период управления. Из рисунка видно заметное улучшение качества управления при увеличении частоты возмущающего воздействия.
71
а)
б)
Рис. 30. Сравнение динамики быстрого процесса с использованием составного (xМ_Б2[τ]) и только медленного управления (x2[τ]) при частоте возмущающего воздействия, равной 2 (рис. а) и 10 (рис. б)
3. Сравнение динамики медленного и быстрого процессов при использовании составного и только медленного управления в пограничном слое в зависимости от частоты изменений задающего воздействия. Результаты сравнения приведены на рис. 31. Из рис. 31 следует, что при изменении частоты задающего воздействия качество управления быстрой составляющей при составном управлении выигрывает по сравнению с использованием только медленного управления. Отличие медленного процесса при составном управлении от процесса при обычном управлении невелико и остается на постоянном уровне. Эти результаты еще раз подтверждают предположение о том, что введение «двушкального» цифрового ПИрегулятора не ухудшает качество управления медленной составляющей по сравнению с обычным ПИ-регулятором, но при этом достигается улучшение качества управления быстрой составляющей.
72
60%
0.12%
50%
0.10%
40%
0.08%
30%
0.06%
20%
0.04%
10%
0.02% 0.00%
0% 2
4 6 8 частота смены задающего воздействия
Compotn_Б CompotnМ_Б
10
Comp otn_М CompotnМ
Рис. 31. Графики сравнения относительного отклонения (%) медленной и быстрой составляющих от задающего воздействия при различных вариантах управления
§ 3. Выводы 1. Разработано алгоритмическое обеспечение для «двушкального» цифрового ПИ-регулятора. Построение такого регулятора учитывает различие в инерционных характеристиках объекта и позволяет управлять многомерными объектами без существенного усложнения технического обеспечения. 2. Разработана методика обоснования области эффективного использования алгоритмов управления с ДШВ в составе алгоритмического обеспечения АСУТП. Показано, что при заданных ресурсах техники управления и характеристиках разнотемповости процессов в объекте эта область определяется частотой изменений задающих воздействий, при которой достигается компромисс между требованием обеспечить высокое качество управления быстрым процессом, с одной стороны, и стремлением высвободить ресурс времени управляющей системы для реализации дополнительных информационных функций АСУТП, с другой стороны. 3. Разработана система показателей качества для оценки эффективности использования двойной шкалы времени в цифровых управляющих системах. 4. Проведены исследования эффективности применения ДШВ в системе управления скоростью вращения электродвигателя постоянного тока.
73
ГЛАВА 3. СИНТЕЗ СУБОПТИМАЛЬНЫХ СИСТЕМ УПРАВЛЕНИЯ ОБЪЕКТАМИ С РАЗНОТЕМПОВЫМИ СУБПРОЦЕССАМИ Содержание главы составляют вопросы, связанные с упрощением решения задачи линейно-квадратичной оптимизации за счет использования свойств разнотемповости процессов в объекте [31...36]. Согласно алгоритму решения этой задачи методом аналитического конструирования оптимальных регуляторов (АКОР), разработанному А. М. Лётовым, управляющее воздействие формируется в цепи отрицательной обратной связи на основе измерения всех компонентов вектора состояния объекта. Для многомерных объектов решение этой задачи требует довольно больших вычислительных ресурсов. В связи с этим актуальной становится задача о возможности использования модели пониженного порядка для синтеза оптимальных управляющих воздействий. В результате размерность задачи может быть снижена до размерности медленного субпроцесса в объекте без существенной потери качества управления объектом в целом. Изложение проведено по следующей схеме. На основании постановки задачи аналитического конструирования оптимальных регуляторов (АКОР) (§ 1) проводится синтез субоптимальных алгоритмов управления (§ 2). Поскольку в алгоритмах, разработанных на основе АКОР, используются все переменные состояния объекта, в том числе и неизмеряемые, в § 3 излагаются результаты разработки фильтра пониженного порядка для восстановления неизмеряемых компонентов. Материал, изложенный в данной главе, представляет также интерес с позиции проверки эффективности метода ДШВ в целом. При обосновании упрощения эвристических алгоритмов могут возникнуть затруднения, связанные с неоднозначностями при выборе настроечных параметров сопоставляемых законов управления. Необходимы аргументы, позволяющие доказать, что база для сравнения (закон управления, используемый без упрощений модели объекта) выбрана обоснованно и корректно. В отличие от эвристических законов управления оптимизационные алгоритмы, синтезируемые на основе строгих допущений, позволяют получить количественные данные об оптимальном значении критерия, оптимальной траектории компонент вектора состояния и управляющих воздействий в системе, используемой в качестве базы для сравнения, и благодаря этому получить корректную, обоснованную оценку эффективности предлагаемого метода упрощения.
74
§ 1. База для оценки эффективности использования метода ДШВ В качестве базы для оценки эффективности упрощений, вводимых при использовании метода ДШВ, будем использовать точное решение оптимизационной задачи аналитического конструирования оптимальных регуляторов (АКОР), соответствующее полноразмерной модели объекта (1.35). Задача АКОР широко освещена в научной литературе [31...36], поэтому опишем ее ниже только конспективно. Постановка задачи АКОР формулируется в следующих терминах: Необходимо найти r-мерные векторы управляющих воздействий v[s], s = 0, 1, …, N – 1, N – задано, доставляющие минимум квадратичному критерию J, сформированному на отклонениях n-мерного вектора состояния z[s] от n-мерного вектора задающих воздействий z*[s], s = 0, 1, …, N и на отклонениях v[s] от желательных значений r-мерного вектора v*[s], s = 0, 1, …, N–1:
[
N −1
J = ( z[ N ] − z * [ N ]) K [ N ]( z[ N ] − z * [ N ]) + ∑ ( z[ s] − z * [ s]) Q[ s]( z[ s] − z * [ s]) + T
(v[s] − v * [s])
T
]
s =0
T
(3.1)
R[ s](v[s] − v * [ s]) ,
где K[N], Q[s], s = 0, 1, …, N – 1 – заданные симметричные неотрицательно определенные матрицы размерности n × n, n × n соответственно; R[s] – r × r положительно определенная симметричная матрица. Примечание: в задаче АКОР, рассматриваемой в непрерывном времени t, матрица R(t) должна быть положительно определенной. В дискретных системах часто встречаются задачи с такими параметрами, что требование положительной определенности матрицы R[s] может быть заменено более слабым требованием неотрицательной определенности (в частности, R[s] может быть нулевой). Элементы K[N], Q[s] и R[s] в (3.1) имеют смысл штрафов за отклонения соответствующих компонентов векторов z[N], z[s], v[s] от заданных z*[N], z*[s], v*[s]. Минимизация (3.1) по v[s] производится на системе ограничений – линейных равенств, имеющих смысл модели объекта: (3.2) z[ s + 1] = A[ s ]z[ s ] + B[ s ]v[ s ] + F [ s ], где F[s] – внешнее детерминированное возмущение (значение F[s] известно заранее для всех s = 0, 1, …, N – 1); A[s], B[s] – соответственно n × n и n × r матрицы параметров объекта (возможно зависящие от времени, зависимость детерминированная). Ограничения-неравенства отсутствуют; диапазон изменений переменных состояния и управлений косвенно задается путем надлежащего выбора матриц штрафов K[N], Q[s], R[s] в (3.1). 75
Решение задачи АКОР. Для нахождения решения используется метод динамического программирования [36]. Обычно в научной литературе приводится результат, относящийся к нулевым значениям задающих воздействий z*[N], z*[s], внешних возмущений F[s] и желательных управлений v*[s]. Полезно привести результаты обобщения решения на случай, когда z*[N], z*[s], v*[s], F[s], s = 0, 1, …, N – 1 – ненулевые векторы. Для этого используем замену переменных: Δ
Δ
z[ s ] − z * [ s] = x[ s], s = 0, 1, ..., N ; v[ s ] − v * [ s] = u[ s], s = 0, 1, ..., N − 1. (3.3)
После подстановки (3.3) в (3.1) и (3.2) получим задачу АКОР в следующей форме: найти последовательность управляющих воздействий u[s], s = 0, 1, …, N – 1, доставляющих минимум критерию I. N −1
I = x[ N ] K [ N ]x[ N ] + ∑ x[ s]T Q[ s]x[ s] + u[ s]T R[ s]u[ s] T
(3.4)
s =0
на модели объекта
x[ s + 1] = A[ s ] x[ s ] + B[ s ]u[ s ] + ϕ [ s ],
(3.5) где ϕ[s] – детерминированное воздействие, учитывающее детерминированное возмущение F[s] (3.2) и результат преобразования заданных значений z*[s], v*[s] моделью объекта: ϕ[ s ] = F [ s ] − (z * [ s + 1] − Az * [ s ] − Bv * [ s ]), s = 0, 1, ..., N − 1 .
После решения задачи (3.4),(3.5) вычисляются реальные управляющие воздействия для задачи (3.1), (3.2). vopt [ s ] = u opt [ s ] + v * [ s ],
s = 0, 1, ..., N − 1 ,
где uopt[s] – управляющие воздействия, минимизирующие (3.4). Приведем, опуская выкладки, результат решения задачи (3.4), (3.5). Управляющие воздействия uopt[s] находятся в контуре обратной связи по состоянию объекта: u opt [ s ] = −Cx[ s ] + G[ s ], s = 0, 1, ..., N − 1 , где C[s], G[s] – матричные коэффициенты размерности r × n и r × 1 соответственно. Параметры регулятора C[s] и G[s] находятся в результате решения следующих матричных уравнений:
(
)
−1
W1[ s] = R[ s] + BT [ s]K [ s + 1]B[ s] ,
W [s] = B[s]W1[s]BT [ s] . Уравнение Риккати: K[s] = Q[s] + AT [s]K[s + 1] A[s] − AT [s]K[s + 1]W [s]K[s + 1] A[s] – матрицы n × n, L[ s] = L[ s + 1] + 2ϕ T [ s]K [ s + 1] (E − W [ s]K [ s + 1] A[ s]) – строки 1× n,
(
)
76
E – единичная матрица размерности n × n,
(
)
M [ s] = L[ s + 1] + ϕ T [ s]K [ s + 1] (E − W [ s]K [ s + 1]ϕ [ s]) +
(
)
+ M [ s + 1] − 0.25L[ s + 1]W [ s]LT [ s + 1]
(
– скаляры,
)
D[s] = W1[s] BT [s]K[s + 1]ϕ [s] + 0.5BT [s]LT [s + 1] – векторы r × 1,
C[ s ] = W1[ s]B T [ s ]K [ s + 1] A[ s ] ,
G[s] = C[s]x*[s] + u*[s] − D[s] – матрицы r × n.
(3.6)
Согласно методу динамического программирования рекурсивные соотношения (3.6) рассчитываются в обратном времени, s = N, N – 1, …, 0, K[N] задано в (3.4), L[N] – строка с нулевыми элементами, M[N] = 0, после чего может быть рассчитано значение критерия, соответствующее оптимальным управляющим воздействиям: T (3.7) I = x opt K [ 0] x opt + L[0] x opt + M [0] , и числовые значения оптимальных управляющих воздействий и переменных состояния:
xopt [ s + 1] = A[ s ] xopt [ s ] + B[ s ](−Cx opt [ s ] − D[ s ]) + F [ s ],
u opt [ s ] = −Cx opt [ s ] − D[ s ]. Отметим, что эти числовые значения могут быть использованы для тестирования правильных расчетов: при их подстановке непосредственно в критерий (3.4) должно получиться то же значение, что и рассчитанное по (3.7).
§ 2. Синтез субоптимальных управляющих воздействий для объектов с разнотемповыми составляющими на основе метода ДШВ Предположим наличие медленного x1[s] (вектор размерности n1 × 1) и быстрого x2[s] (вектор размерности n2 × 1) субпроцессов в векторе состояния x[s] (вектор размерности n × 1, n = n1 + n2), входящих в модель (3.5). Разбивая матрицы A[s], B[s] и вектор ϕ[s] в (3.5) на субблоки Aij[s] i,j = 1, 2, Bi[s], ϕi[s], i = 1, 2, представим (3.5) в форме взаимодействующих субпроцессов:
⎧x1[s +1] = A11x1[s] + A12x2[s] + B1u[s] +ϕ1[s], ⎨ ⎩x2[s +1] = A21x1[s] + A22x2[s] + B2u[s] +ϕ2[s],
(3.8а) (3.8б)
где A11, A12, A21, A22, B1, B2 – матрицы размерностей n1 × n1, n1 × n2, n2 × n1, n2 × n2, n1 × r, n2 × r соответственно; u[s] – управляющее воздействие общее для обоих субпроцессов; ϕ1[s], ϕ2[s] – векторы размерности n1 × 1 и 77
n2 × 1, являющиеся блоками вектора ϕ[s] из (3.8). ⎡ϕ [ s ] ⎤ ⎡ F [ s ] ⎤ ⎡ z * [ s + 1] − A11 z1 * [ s ] − A12 z 2 * [ s ] − B1v * [ s ] ⎤ , (3.9) ϕ[ s] = ⎢ 1 ⎥ = ⎢ 1 ⎥ − ⎢ 1 ⎥ ⎣ϕ 2 [ s ]⎦ ⎣ F2 [ s ]⎦ ⎣ z 2 * [ s + 1] − A21 z1 * [ s ] − A22 z 2 * [ s ] − B2 v * [ s ⎦ *
где z i [ s] , Fi[s] – блоки векторов z[s], F[s].
В (3.8а), (3.8б) подразумевается зависимость матриц от времени (опущенная для большей компактности формул). 2.1. Исходные положения, принимаемые для синтеза субоптимальных управляющих воздействий
Используется возможность понижения порядка модели объекта за счет раздельного управления медленным и быстрым субпроцессами с разными интервалами дискретизации. 1. Медленный субпроцесс xМ[s] в медленном времени, отсчитываемом с дискретой Δt, отождествляется с составляющей x1[s]: x M [s] ≈ x1[s] . 2. Быстрый субпроцесс, отождествляемый с составляющей x2[s], представляется как составной: x2 [ s,τ ] = x2M [ s] + x2Б [ s,τ ] . Здесь: x2M [ s] – медленная составляющая быстрого субпроцесса, отождествляемая с его вынужденной компонентой (вынужденная динамика, согласно (3.8б), объясняется действием медленной составляющей x1[s], u[s] и внешнего воздействия ϕ2[s]). x2Б [ s,τ ] – свободная составляющая быстрого субпроцесса, трактуется как отработка начальных условий для x2[s], имеющих место на s-м такте, в течение промежутка времени, охватывающего пограничный слой. 3. Управляющие воздействия u[s] ищем в виде составных: u[ s, τ ] = u M [ s ] + u Б [ s, τ ] . (3.10) Назначение медленной компоненты u M [s ] – управление медленным субпроцессом x1[s] и медленной составляю78
щей быстрого субпроцесса x2M [ s] в медленном времени. Назначение быстрой компоненты u Б [ s, τ ] – подавление свободной составляющей x2Б [ s,τ ] быстрого субпроцесса x2[s] в быстром времени с дискретой δt = μ ⋅ Δt (μ – малый параметр, рассчитываемый по изложенной в гл. 1 методике). 4. Приближенно считаем, что свободная динамика x2Б [ s,τ ] завершается внутри части интервала Δt (т. е. число тактов быстрого времени τ*, охватывающих пограничный слой таково, что τ ⋅ δ t < Δ t ). Поэтому можно считать, что u M [s ] изменяется только в моменты времени s ⋅ Δt , s = 0, 1, …, N – 1, и постоянно внутри интервала отсчета медленного времени: u M (t ) = u M [ sΔt ], sΔt ≤ t < ( s + 1) Δt . Быстрая компонента u [ s , τ ] изменяется в моменты отсчета быстрого времени τ ⋅ δ t , τ = 0, 1, …, τ*. Отсчет тактов быстрого времени возобновляется в моменты отсчета медленного времени. Внутри интервалов отсчета быстрого времени быстрая составляющая постоянна: u Б (t ) = u Б [τδ t ], τδ t ≤ t < (τ + 1)δ t . Характер зависимости управляющих воздействий поясняется на рис. 32. 5. В предположении 4 быстрая компонента u Б [ s, τ ] сквозь призму медленного времени может не учитываться, и для расчета u M [s ] можно аппроксимировать модель объекта (3.8а), (3.8б) пониженного (до размерности медленного субпроцеса n1) порядка, в которой вместо (3.8а) используется модель безынерционного слежения x2M [ s ] за x1[s], u M [s ] и ϕ2[s]: Б
x 2M [ s ] ≅ A21 x1[ s ] + A22 x 2M [ s ] + B2 u M [ s ] + ϕ 2 [ s ] . (3.11) 79
Из (3.11) выразим x2M [ s] через x1[s], u M [s ] и ϕ2[s], что позволит исключить динамику быстрой фазы из модели объекта: x2M [ s] ≅ A 21 x1[ s] + B 2 u M [ s] + ϕ 2 [ s] , (3.12) −1 −1 где A21 = (E − A22 ) A21 – n2 × n1 матрица; B 2 = (E − A22 ) B2 – n2
× r матрица; ϕ 2 [ s ] = (E − A22 )−1 ϕ 2 [ s ] – n2 × 1 вектор. Предполагается, что матрица (E − A22 )−1 существует, где E – единичная матрица размером n2 × n2. После подстановки (3.12) в (3.8а) получим приближенную модель объекта порядка n1, которая будет использована для нахождения медленной составляющей субоптимального управления u M [s] : x1 [ s + 1] = A11 x1 [ s ] + B 1u M [ s ] + ϕ 1 [ s ],
где A11 = A11 + A12 A 21 – n1 × n1 матрица; B1 = A12 B 2 + B1 – r × 1 матрица; ϕ 1[ s] = A12 ϕ 2 [ s] + ϕ1[ s] – n1 × 1 вектор.
80
uM[s]
t
uБ[s,τ]
t
u[s]
t
Рис. 32. Формирование составного управления
6. Модель (3.12) используется для исключения составляющей x2M [ s] из формулы (3.4), определяющей критерий задачи АКОР. После довольно громоздких, но простых преобразований получим формулу, представляющую приближение критерия (3.4), достигаемое при управлении только медленными компонентами вектора состояния. Как видно из (3.14), в критерии учтены отклонения от заданий только медленного субпроцесса x1[s]. Но благодаря изменению параметров матриц штрафов в (3.14) косвенно учтены и отклонения медленной составляющей быстрого субпроцесса x2M [ s] , причем матрицы штрафов в (3.14) согласуются с соответствующими матрицами исходного критерия (3.4). 81
[
]
J M = x1T [N]K11[N]x1[N] + 2x1T [N]L1[N]ϕ 2[N] + ϕ 2T [N]K22[N]ϕ 2[N] N−1⎡xT [s]Q [s]x [s] + 2xT [s]H1[s]u M [s] + 2xT [s]P1[s]ϕ [s] + 1 1 1 1 11 2
⎤ ⎥, + ∑⎢ T MT MT M ⎢ s=0 + 2u [s]T1[s]ϕ 2[s] + u [s]R11[s]u [s] + ϕ 2 [s]Q22[s]ϕ 2[s]⎥⎦ ⎣
(3.14) T где K 11[ N ] = K11[ N ] + A21 K 22[ N ]A21 + 2K12 A21 – n1 × n1 матрица; K11[N], K12[N], K22[N] – n1 × n1, n1 × n2, n2 × n2 блоки матрицы K[N] в (3.4) ⎡ K11[ N ] M K12 [ N ]⎤ ; ⎥ ⎢ K[ N ] = ⎢ L L L ⎥, K12 [ N ] = K 21[ N ] ⎢⎣ K 21[ N ] M K 22 [ N ]⎥⎦
n1 × n2 матрица; T Q11[s] = Q11[s] + A21Q22[s] A21 + 2Q12 A21 – n1 × n1 матрица; Q11[s], Q12[s], Q22[s] – n1 × n1, n1 × n2, n2 × n2 блоки матрицы Q[s] в (3.4): –
T
L1[ N ] = A21K 22[ N ]
⎡Q11[ s] M Q12 [ s]⎤ ; L L ⎥⎥, Q12 [ s] = Q21[ s] Q[ s] = ⎢⎢ L ⎣⎢Q21[ s] M Q22 [ s]⎦⎥
H 1[ s ] =
T A21Q22 [s]B 2
(3.16) + Q12 [s]B 2 – n1 × r матрица;
T
P1[ s] = A21Q22 [s]B 2 + Q12 [ s] – n1 × n2 матрица; T
T 1[ s] = B 2 Q22 [s] – r × n2 матрица; T
R11[s] = R[s] + B 2 Q22 [s]B 2 – r × r матрица.
7. Поскольку вывод формул, определяющих оптимальные управлени противном случае расчет также возможен, но рекуррентные соотношения для параметров, входящих в алгоритм управления, получить не удается. Поскольку на практике перекрестные произведения компонентов x1M [s] и x 2M [ s ] чаще всего не входят в критерий, то в дальнейшем ограничимся случаем, когда Q11[s], Q21[s], K12[N], K21[N] – нулевые матрицы. При 82
этом квадратичные формы для x1[s], x1[N], u[s] будут содержать симметричные ядра. 8. Таким образом, получена формальная постановка задачи АКОР для расчета медленной составляющей u M [ s ] составного управления u[s] из (3.11): найти последовательность управляющих воздействий u M [s ] , s = 0, 1, …, N – 1, доставляющих минимум критерию J M = x1T [ N ]K 11 [ N ] x1 [ N ] + 2ψ 1T [ N ] x1 [ N ] + M 1 [ N ] + 2 x1T [ s ]H 1 [ s ]u M [ s ] + 2ψ 1T [ s ] x1 [ s ] + ⎤ ⎥, + ∑⎢ T M MT M ⎥⎦ ⎢ s = 0 ⎣ + 2Θ 1 [ s ]u [ s ] + u [ s ]R 11 [ s ]u [ s ] + M 1 [ s ] N −1 ⎡ x T [ s ]Q [ s ] x [ s ] + 1 1 11
(3.17) где ψ 1[ N ] = AT21 K 22 [ N ]ϕ 2 [ N ] – n1 × 1 вектор; T M 1 [ N ] = ϕ 2 [ N ]K 22 [ N ]ϕ 2 [ N ] – скаляр; T ψ 1[ s ] = A 21Q22 [ s ]ϕ 2 [ s ] – n1 × 1 вектор;
T
Θ1[ s ] = B 2 Q22 [ s ]ϕ 2 [ s ] – r × 1 вектор; T
R 11 [ s ] = R[ s ] + B 2 Q 22 [ s ]B 2 – r × r матрица; T
M 1[ s ] = ϕ 2 [ s ]Q22 [ s ]ϕ 2 [ s ] – скаляр. Модель (3.14) медленного субпроцесса x1[s] – линейная: x1[ s + 1] = A11 x1[ s ] + B1u M [ s] + ϕ 1[ s ] . (3.18) Сводка обозначений для модели (3.17)–(3.18) и соответствующие формулы со ссылками на позиции, в которых эти формулы были введены выше, приведена в табл. 2. Порядок перечисления в таблице выбран таким образом, чтобы источники данных для каждой формулы вводились в строках с меньшими номерами. 9. Модель (3.18) по форме не отличается от принятой в классической задаче АКОР. Однако критерий (3.17) отличается от «классического» критерия вида (3.4). Отличия состоят во введении штрафов за перекрестные произведения 83
u M [s ] векторов x1[s] и (слагаемое 2 x1T [ s ] ⋅ H 1[ s ] ⋅ u M [ s ] ) и линейных слагаемых, в которые входят
компонентов
x1[N], u M [s ] , x1[s] ( 2ψ 1T [ N ] ⋅ x1[ N ] , 2ψ 1T [ s ] ⋅ x1[ s ] , 2Θ1T [ s ] ⋅ u M [ s ] , s = 0, 1, …, N – 1). 10. Из-за этих отличий формулы (3.7) должны быть пересмотрены. Выкладки, следующие процедуре динамического программирования, приведены в приложении 3. Здесь приведем лишь конечный результат. Оптимальные управляющие воздействия рассчитываются в контуре обратной связи по вектору состояния объекта: M u opt [ s] = −C1[ s]x1[ s] − C 2 [ s]x1[ s] − G[ s ] .
Здесь:
(
(
)
C 2 [ s] = R11[ s] + B1T [ s]K [ s + 1]B1[ s]
(
)
T
C1[ s] = R11[ s] + B1 [ s ]K [ s + 1]B1[ s] −1
)[
−1
(3.19)
T
B1 [ s]K [ s + 1] A11 ;
H 1T [ s]
]
G[ s] = R11[ s] + B1 [ s]K [ s + 1]B1[ s] Θ1[ s ] + B1 [ s](K [ s + 1]ϕ 1[ s ] + ψ [ s + 1]) Из (3.19) видно, что первое слагаемое в алгоритме управления по форме такое же, как получается при минимизации «классического» критерия АКОР. Второе слагаемое и свободный вектор G[s] имеют специфику, связанную с особенностями критерия (3.14). Параметры K[s], ψ[s] рассчитываются при обратном отсчете тактов s, начиная с N – 1 ( K [ N ] = K 11[ N ], ψ [ N ] = ψ 1[ N ] – расчет приведен в табл. 2). −1
T
{
T
K [ s ] = A11T [ s ] K [ s + 1] ⋅ A11 [ s ] + Q 11 [ s ] − A11T [ s ] K [ s + 1] ⋅ B 1 [ s ] ×
( − {− A
× R 11 [ s ] + B 1T [ s ] K [ s + 1] B 1 [ s ] 11
T
(
)
−1
⋅ B 1T [ s ] K [ s + 1] A11 [ s ]⎫⎬ − ⎭
[ s ] K [ s + 1] B 1 [ s ] ⋅ R 11 [ s ] + B 1T [ s ] K [ s + 1] B 1 [ s ]
( − H [ s ](R
) [ s ] K [ s + 1] B [ s ])
)
−1
H 1T [ s ] −
− H 1 [ s ] R 11 [ s ] + B 1T [ s ] K [ s + 1] B 1 [ s ]
−1
B 1T [ s ] K [ s + 1] A11 [ s ] −
B 1T
−1
H 1T [ s ]⎫⎬, ⎭
1
11 [ s ] +
1
(
)
ψ [ s ] = A 11 T [ s ] K [ s + 1] ⋅ ϕ 1 [ s ] + ψ [ s + 1] + M 1 [ s ] −
( × (B
)(
T
T
− H 1 [ s ] + A 11 [ s ] K [ s + 1] B 1 [ s ] R 11 [ s ] + B 1 [ s ] K [ s + 1] B 1 [ s ]
)
)
−1
×
(3.20)
(3.21)
[ s ] K [ s + 1]ϕ 1 [ s ] + B 1 [ s ]ψ [ s ] + Θ 1 [ s ] . Расчет параметров, используемых в (3.20)–(3.21), приведен в табл. 2. 84 1
T
T
Значение критерия (3.17) при использовании оптимальных управляющих воздействий равно I opt = x1T [0]K[0]x[0] + 2ψ T [0]x1[0] + M [0] , где x1[0] – заданное начальное состояние; K[0], ψ[0] – получаются в результате рекуррентных расчетов по (3.20), (3.21); M[0] – скаляр, получается рекурсивно при обратном отсчете тактов s, начиная с N – 1 ( M [ N ] = M 1[ N ] – расчет приведен в табл. 2)
M [s] = M [s + 1] + M1[s] + ϕ 1T [s]K[s + 1]ϕ 1[s] + 2ψ T [s + 1]ϕ 1[s] −
( ) × (R [s] + B [s]K[s + 1]B [s]) × × (Θ [s] + B [s]ψ [s + 1] + B [s]K[s + 1]ϕ [s]).
T
− Θ1[s] + B1T [s]ψ [s + 1] + B1T [s]K[s + 1]ϕ 1[s] × T 1
11 1
T 1
T
(3.22)
1
T 1
1
Расчет параметров, используемых в (3.22), приведен в табл. 2. Задача управления быстрой составляющей x 2Б [ s , τ ] строится на следующих положениях: 1. В пограничном слое (τ = 0, ...,τ*) значения медленной составляющей вектора состояния x1[s], вынужденной компоненты быстрой составляющей x2M [ s ] , а также медленной составляющей управления uM[s] не изменяются и сохраняют значения s-го такта на всем интервале пограничного слоя. 2. В предположении о неизменности компонент x1[s], x2M [ s ] и uM[s] исходный критерий задачи АКОР (3.4) примет вид:
J Б = ( x 2Б [ s, τ ]) T Q22 [ s ]x 2Б [ s, τ ] + 2ψ 2T [ s ]x 2Б [ s, τ ] + M 2 [ s ] + τ *−1⎡(
⎤ ⎥, + ∑⎢ Б БT Б ⎢ τ = 0 ⎣+ 2Θ 2 [ s ]u [ s, τ ] + u [ s, τ ]R[ s ]u [ s, τ ] + M 2 [ s ]⎥⎦ где ψ 2 [ s ] = Q 22 [ s ] x 2M [ s ] ∀ s = 0, … ,N–1; x 2Б [ s, τ )] T Q22 [ s ]x 2Б [ s, τ ] + 2ψ 2T [ s ]x 2Б [ s, τ ] +
ψ 2 [ N ] = K 22 [ N ] x 2M [ N ] – n2 ×
1 векторы;
85
M 2 [s] = ( x1[s])T Q11[s]x1[s] + ( x2M [s])T Q22 [s]x2M [s] + u M [s])T ⋅ R[s]u M [s]
–скаляры ∀ s = 0, 1, … , N – 1; M 2 [ N ] = ( x1[ N ]) T K 11 [ N ] x1[ N ] + ( x 2M [ N ]) T K 22 [ N ] x 2M [ N ]
– ска-
ляр; Θ 2 [ s ] = R[ s ]u M [ s ] – r × 1 вектор; Б Управляющее воздействие uopt [ s, τ ] рассчитывается в форме обратн Б uopt [ s, τ ] = −C[ s, τ ]x2Б [ s, τ ] + G[ s, τ ] ,
где матричные коэффициенты C[s, τ], G[s, τ] рассчитываются по пиложению 3 с очевидными переобозначениями.
2.2. Сравнение точного и приближенного решения задачи АКОР (на примере управления объектом 4-го порядка)
Приведенные выше теоретические положения иллюстрируются примером решения задачи управления объектом 4-го порядка, в котором можно выделить субпроцессы с существенно различными инерционными характеристиками. Модель и параметры объекта приведены в приложении 1, данный объект рассматривается в качестве примера также в гл. 1. Модель объекта описывается линейной дискретной системой уравнений [63]: x[ s + 1] = AD x[ s] + BD u[ s] + F[ s] , где x[s] – n-мерный вектор состояния объекта, в котором выделяются две группы субпроцессов (медленные – x1[s], x2[s] и быстрые – x3[s], x4[s]); u[s] – r-мерный вектор управляющих воздействий; F[s] – n-мерный вектор детерминированных возмущающих воздействий; AD, BD – матрицы параметров дискретной модели размерности n × n и n × r соответственно (значения параметров приведены в пиложении 1). Согласно изложенным выше теоретическим положениям, задача управления n-мерным вектором состояния может быть приближенно заменена более простой задачей управления только медленным субпроцессом (3.13) и медленной составляющей быстрого субпроцесса (3.12) с понижением порядка до размерности медленного субпроцесса x1[s]. При этом оптимальное управляющее воздействие рассчитывается по формуле 86
(3.20). Результаты управления рассматриваемым объектом по модели пониженного порядка приведены на рис. 33.
Как видно из рис. 33, управление медленным субпроцессом xopt_M[s] по формуле (3.13) дает очень хороший результат. Полученные траектории почти полностью совпадают с траекториями, рассчитанными по «классической» задаче АКОР. На рис. 34 приведены результаты управления медленной составляющей быстрого субпроцесса x 2M [ s] по формуле (3.12). Из анализа графиков на рис. 34 следует, что безынерционная оценка медленной составляющей быстрого процесса хорошо совпадает с оптимальной траекторией xopt[s]. Можно добиться и более качественного отслеживания задания, если увеличить штрафы за отклонения этих переменных от задающих воздействий в критерии (3.17) и (3.4).
87
Таблица 2
Обозначения к задаче (3.18)-(3.19) и расчетные формулы Обозначения
Размерность матриц
N × n, n × r соответственно n1 × n1, n1 × n1, n2 × n1, n2 × n2, n1 × r, n2 × r, соответственно
A, B
A11, A12, A21, A22, B1, B2
Ссылки на позиции таблицы
Расчетная формула
(3.2) (3.8а), (3.8б)
⎡ A11 M A12 ⎤ , ⎡ B1 ⎤ A = ⎢⎢ L L L ⎥⎥ B = ⎢ L ⎥ ⎢ ⎥ ⎢⎣ A21 M A22 ⎥⎦ ⎢⎣ B2 ⎥⎦
п.1
74
A21
n2 × n1
(3.12)
A 21 = (E − A22 ) A21
п. 2
A11
n1 × n1
(3.13)
A11 = A11 + A12 A 21
п. 3, 4
B2
n2 × r
(3.12)
B 2 = (E − A22 ) B2
п. 2, 3
B1
n1 × r N×1
(3.13)
B1 = A12 B 2 + B1
F[s]
F2[s]
Формула, в которой описана
n1 × 1, n2 × 1
(3.9)
z*[s] z1* [ s],
n ×1
(3.1)
n1 × 1, n2 × 1
(3.9)
r ×1
(3.1)
v*[s]
−1
п. 2, 3, 5
(3.2)
F1[s],
z
−1
⎡ F1[ s] ⎤ F [ s] = ⎢⎢ L ⎥⎥ ⎢⎣ F2 [ s]⎥⎦
[
z *[s]T = z1[s]T M z2[s]T 3
п.7
]
п. 9
n×1
ϕ[s]
ϕ[s] = F[s] − (z *[s + 1] − Az *[s] − Bv *[
(3.5)
п.1, 7, 9, 11
Продолжение табл. 2 Обозначения
ϕ2[s]
ϕ1[s],
Расчетная формула
ϕ[s]T = [ϕ1 [s]T M ϕ 2 [s]T ]
n2 × 1
(3.12)
ϕ 2 [ s ] = (E − A22 )−1 ϕ 2 [ s ]
φ 1[ s]
n1 × 1
(3.13)
ϕ 1 [ s ] = A12 ϕ 2 [ s ] + ϕ1[ s ]
K[N]
N×n
(3.1)
75
Q[s]
Q22[s]
n1 × 1, n2 × 1
Формула, в которой описана (3.8а), (3.9б)
φ 2 [ s]
K11[N], K12[N], K21[N], K22[N]
Q12[s],
Размерность матриц
Q11[s], Q21[s],
n1 × n1, n1 × n1, n2 × n1, n2 × n2 соответствен-
(3.15)
но n×n n1 × n1, n1 × n1, n2 × n1, n2 × n2 соответственно
Ссылки на позиции таблицы п. 12 п. 2, 13 п. 2, 13, 14
⎡K11[N] M K12[N]⎤ K[N] = ⎢⎢ L L L ⎥⎥, K12[N] = K21[N] =[0] ⎢⎣K21[N] M K22[N]⎥⎦
п. 16
⎡Q11[s] M Q12[s]⎤ Q[s] = ⎢⎢ L L L ⎥⎥, Q12[s] = Q21[s] ⎢⎣Q21[s] M Q22[s]⎥⎦
п. 18
(3.1)
(3.16)
R[s]
r×r
(3.1)
ψ1[N]
n1 × 1
(3.17)
п. 3, 14,
T
ψ 1[ N ] = A 21 K 22 [ N ]ϕ 2 [ N ] 4
17
M1[N]
скаляр
T
M 1[ N ] = ϕ 2 [ N ] K
(3.17)
22
[ N ]ϕ 2 [ N ]
п. 14, 17
Окончание табл. 2 Обозначения
Размерность матриц
Q11[ s]
n 1 × n1
H 1[ s]
n1 × r
ψ1[s]
n1 × 1
Θ1[s]
R×1
R11[ s]
R×r
M1[s]
скаляр
Формула, в которой описана
Расчетная формула
Ссылки на позиции таблицы
T
(3.14)
Q11[s] = Q11[s] + A21Q22[s]A21 + 2Q12 A21
(3.14)
H 1[s] = A21Q22 [ s]B 2 + Q12 [s]B 2
(3.17)
ψ 1[ s ] = A 21Q22 [ s ]ϕ 2 [ s ]
(3.17)
Θ1[ s ] = B 2 Q22 [ s ]ϕ 2 [ s ]
(3.17)
R 11 [ s ] = R[ s ] + B 2 Q22 [ s ]B 2
(3.17)
M 1[ s ] = ϕ 2 [ s ]Q22 [ s ]ϕ 2 [ s ]
п. 3, 19 п. 3, 7,
T
19 п. 5, 5,
T
21 п. 5, 14,
T
19 п. 5, 19,
T
T
76 5
20 п. 14, 19
6
Отличие критериев оптимальности (3.17) и (3.4) для траекторий, приведенных на рис. 33 составляет 1.25 %, а на рис. 34 – 7.3 %, что подтверждает возможность использования модели пониженного порядка при расчете оптимальных управлений в задаче АКОР.
а)
б)
Рис. 33. Сравнение результатов управления с помощью классической задачи АКОР (xopt[s]) и субоптимального управления (xopt_M[s])
а)
б) 7
Рис. 34. Сравнение результатов управления с помощью классической задачи АКОР M (xopt[s]) и субоптимального управления ( x 2 [ s ] )
§ 3. Использование фильтров пониженного порядка в задаче синтеза субоптимальных управлений Известно, что закон управления, синтезированный методом АКОР, строится на всех переменных состояния объекта. Обычно ряд переменных состояния недоступен непосредственному измерению, и для их восстановления в системах, удовлетворяющих критерию наблюдаемости, используются различные фильтры. В системах с ДШВ имеется возможность приближенного восстановления неизмеряемых компонентов вектора состояния с помощью фильтров пониженного порядка. Предлагается алгоритм приближенной оценки медленной составляющей вектора состояния и медленной фазы быстрой составляющей с помощью фильтра Люенбергера [34, 35] с понижением порядка модели фильтра до размерности медленной фазы. Пусть непосредственному наблюдению доступна часть y n [s ] (mмерный вектор выхода объекта) компонент «физической» медленной фазы
x1[ s]
(n1-мерный вектор,
n1 < m ), т. е.
y n [ s] = H n x1[ s] , где Hn – m × n1-мерная матрица наблюдения. Начальное состояние предполагается неизвестным. Приведем схему расчета параметров фильтра Люенбергера порядка n1 для приближенного оценивания медленной фазы всех переменных состояния объекта. По существу задача сводится к оценке неизвестного начального состояния. 1. Задается спектр собственных чисел матрицы, «управляющей» динамикой уменьшения ошибки фильтра. Проще всего выбрать собственные числа действительными, различными и по абсолютной величине меньшими единицы. Число задаваемых собственных чисел равно n1. 2. Формируется диагональная матрица Г размерности n1 × n1, в которой заданные собственные числа размещаются по диагонали. 3. Задается почти (см. п. 4) произвольная матрица Φ размерности n1 × m, рассчитывается n1 × n1 матрица
ϑ:
ϑ = ΦH n ,
и формируется матрица собственных векторов Tn со столбцами:
Tn
j
(
= AMT − Г j , j E 8
)
−1
ϑT ,
где AM – параметр медленного субпроцесса, рассчитывается по формуле (1.8) (гл. 1); E – единичная матрица размерности n1 × n1; Гj,j – j-й диагональный элемент матрицы Г; j – номер столбца, j = 1, …, n1. 4. Рассчитывается матрица параметров фильтра Люенбергера Kn:
( )
K n = TnT
−1
Φ.
Если окажется, что матрица TnT необратима, следует изменить матрицу Φ . 5. Для проверки рассчитываются собственные числа матрицы ( AM − KnHn ) , определяющей процесс уменьшения ошибки фильтра. Если расчет проведен правильно, собственные числа должны совпасть с заданными (п.1). 6. Оценивается медленная фаза медленной составляющей x n _ M [ s ] объекта с ДШВ приближенно (из произвольного начального состояния) по формуле: xn _ M [ s + 1] = AM xn _ M [ s ] + BM u[ s ] + K n y n [ s ] − H n xn _ M [ s ] .
(
)
7. Оценивается медленная составляющая быстрой фазы с использованием формулы (1.38) (гл. 1) прямым расчетом по результатам восстановления вектора состояния медленной фазы. 8. Поскольку оценки получаются приближенными, необходим этап моделирования (для подтверждения факта достижения нужной точности оценивания при различных факторах, неучтенных при расчете параметров фильтра (неточно известная модель объекта, неучтенные и неконтролируемые возмущения и т. п.). 9. Результаты приближенного оценивания неизмеряемых компонент могут быть использованы для построения регуляторов пониженного порядка (в частности, синтезированных методами АКОР). Вышеизложенную схему проиллюстрируем на примере системы 4-го порядка (модель и параметры приведены в приложении 1) с двумерными компонентами x1[ s ] (медленная составляющая) и x2 [ s] (быстрая составляющая). Матрицы Г и Ф задаются следующим образом: 0 ⎤ ⎡0.6 ⎡− 20⎤ ; Г =⎢ , Φ=⎢ ⎥ ⎥ ⎣ 0 0.54⎦ ⎣ 10 ⎦ Производятся расчеты основных параметров фильтра Люенбергера (по схеме, описанной выше); сравнение собственных чисел матрицы ( AM − K n H n ) и матрицы Г показывает правильность проведенных расчетов: 9
⎡0.54⎤ ⎥, ⎣ 0.6 ⎦
λ ( AM − K n H n ) = ⎢
0 ⎤ ⎡0.6 Ã=⎢ ⎥. ⎣ 0 0.54⎦
На рис. 35 приведены результаты оценки сходимости первой компоненты вектора медленной фазы x n _ M [ s ] к истинному измеряемому зна1
чению x1_изм[s] (рис.35а) и второй компоненты вектора медленной фазы x n _ M [ s ] к истинному неизмеряемому значению x1_неизм[s] (рис. 35б ). 2
а)
б)
Рис. 35. Иллюстрация сходимости оценки медленной фазы
xn _ M [s]
к истинному значению первой компоненты x1[s].
Как видно из рис. 35, измеряемая компонента с высокой точностью восстанавливается с помощью фильтра пониженного порядка (рис. 35а). На графике (рис. 35б) виден эффект неучтенной быстрой динамики (проявляется в отклонениях оценки от истинного значения неизмеряемой компоненты). На рис. 36 приведен результат оценки сходимости одной из компонент вектора быстрой фазы x n _ Б [ s ] к истинному значению неизмеряемой компоненты x2_неизм[s].
Рис. 36. Иллюстрация сходимости оценки второй компоненты быстрой фазы
xn _ Б2 [ s] к истинному значению неизмеряемой компоненты x2 _ неизм2 [ s] 10
По рис. 36 видно, что при оценке неизмеряемых компонент быстрой фазы фильтром пониженного порядка требуется учет динамики быстрой составляющей (особенно в моменты смены управляющих или задающих воздействий). На рис. 37, 38 приведены результаты сравнения работы фильтра пониженного порядка и фильтра, рассчитанного для полноразмерной модели объекта.
а)
б)
Рис. 37. Иллюстрация сходства оценки медленной фазы пониженного порядка и оценки, полученной с помощью обычного фильтра Люенбергера
xn _ M1 [ s]
x1 _ набл1 [ s ]
Рис. 38. Иллюстрация сходства оценки быстрой фазы пониженного порядка и оценки, полученной с помощью обычного фильтра Люенбергера
x n _ Б2 [ s ]
x2 _ набл2 [ s ]
Как видно из рисунков, оценка с помощью фильтра пониженного порядка почти полностью совпадает с оценкой обычного фильтра. Отличия наблюдаются в области начальных условий или смены задающих воздействий (т. е. в зоне пограничного слоя), где необходим учет динамики быстрой фазы.
§ 4. Выводы 1. Разработана процедура синтеза субоптимальных управляющих воздействий в рамках задачи АКОР для объектов, имеющих в своем составе субпроцессы с существенно различными инерционными характеристиками. 11
2. На примере задачи управления объектом четвертого порядка проведено сопоставление качества управления в системе, алгоритмы для которой синтезированы на базе моделей пониженного порядка, с качеством управления, достижимым в строго оптимальной системе, синтезированной методом АКОР с полноразмерной моделью объекта. Результаты моделирования показывают, что использование возможностей понижения порядка моделей объекта, предоставляемых методом ДШВ, позволяет получить работоспособные субоптимальные алгоритмы, причем качество управления при их использовании близко к достижимому в строго оптимальной системе. 3. Разработаны алгоритмы оценивания неизмеряемых компонент медленной составляющей вектора состояния на основе применения фильтра Люенбергера пониженного порядка. Проведено моделирование алгоритмов оценивания и сопоставление результатов с оценками, получаемыми с помощью полноразмерного фильтра. Результаты исследования позволяют сделать вывод о возможности использования фильтров пониженного порядка в задачах синтеза субоптимальных алгоритмов управления.
12
Заключение 1. Изложены результаты разработки методики моделирования многомерных линейных дискретных систем управления на основе метода декомпозиции модели объекта с существенно различными инерционными характеристиками. Определены условия, позволяющие проверить наличие свойства ДШВ в объекте без расчета собственных чисел. 2. Описана разработанная схема моделирования системы по методу ДШВ для оценки точности аппроксимации объекта только медленной составляющей. Проверка методики проведена на примере моделирования динамики изменения скорости вращения (медленный субпроцесс) и тока в якорной цепи (быстрый субпроцесс) электродвигателя постоянного тока. Полученные результаты подтверждают возможность использования при управлении данным объектом метода ДШВ. 3. Изложены результаты разработки алгоритмического обеспечения для «двушкального» цифрового ПИ-регулятора. Построение такого регу13
лятора учитывает различие в инерционных характеристиках объекта и позволяет управлять многомерными объектами без существенного усложнения технического обеспечения. 4. Разработана система показателей качества для оценки эффективности введения ДШВ в систему управления. Проведены исследования эффективности применения ДШВ на модели электродвигателя постоянного тока, которые подтверждают основные теоретические положения метода ДШВ. 5. Приведена методика обоснования области эффективного использования алгоритмов управления с ДШВ в составе алгоритмического обеспечения АСУТП. Показано, что при заданных ресурсах техники управления и характеристиках разнотемповости процессов в объекте эта область определяется частотой изменений задающих воздействий, при которой достигается компромисс между требованием обеспечить высокое качество управления быстрым процессом, с одной стороны, и стремлением высвободить ресурс времени управляющей системы для реализации дополнительных информационных функций АСУТП, с другой стороны. 6. Разработана процедура нахождения субоптимального решения задачи АКОР на основе использования моделей пониженного порядка для приближенного описания динамики объектов, имеющих в своем составе субпроцессы с существенно различными инерционными характеристиками. 7. Проведены исследования применения фильтров пониженного порядка в системах с ДШВ. Результаты исследования позволяют сделать вывод о возможности использования фильтров пониженного порядка в задачах синтеза субоптимального управления.
14
ЛИТЕРАТУРА 1.
2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
16.
17. 18.
19.
Буров Н. Н. Метод разделения движений в задачах анализа и синтеза дискретных систем с вектором скорости в законе управления // Автоматическое управление объектами с переменными характеристиками: Межвуз. сб. / Новосиб. электротехн. ин-т. – Новосибирск, 1986. – С. 86–91. Геращенко Е. И., Геращенко С. М. Метод разделения движений и оптимизация нелинейных систем. – М.: Наука, 1975. – 296 с. Грищенко А. З., Хиленко В. В. Метод понижения порядка и исследование динамических систем. – Киев: УМК ВО, 1988. – 164 с. Saksena V. R., O'Reilly J., Kokotovic P.V. Singular Perturbations and Time-scale Methods in Control Theory: Survey 1976–1983 // Automatica, Vol.20, № 3. 1984. pp. 273–293. Phillips R. G. Reduced order modeling and control of two-time-scale discrete systems // Control, Vol. 31, № 4, 1980. pp. 765–780. Hapaev M. M., Filatov O. P. Averaging of differential inclusions with slow and fast variables // Math. Zametky № 47, 1990. pp. 102–109. Гайцгори В. Г. Управление системами с быстрыми и медленными движениями. – М.: Наука, 1991. – 224 с. Крутько П. Д. Исследование влияния малых параметров на динамику управляемых систем // Теория и системы управления. – 2000. – № 6. – С. 5–17. Юркевич В. Д. Синтез нелинейных нестационарных систем управления с разнотемповыми процессами. – СПб.: Наука, 2000. – 288 с. Первозванский А. А., Гайцгори В. Г. Декомпозиция, агрегирование и приближенная оптимизация. – М.: Наука, 1979. – 342 с. Litkuhi B., Khalil H. Multirate and composite control of two-time scale discrete-time scale systems // IEEE Trans. Automatic Control Vol. AC–30, 1985. pp. 645-651. Mahmoud M. S. Stabilization of discrete systems with multi-rate scales // IEEE Trans. Automatic control, Vol. AC-31, № 2, 1986. pp. 159–162. Mahmoud M. S. Structural properties of discrete systems with slow and fast models. UMIST Control Systems center report № 505, 1981. Grammel G. Limits of nonlinear discrete-time control systems with fast subsystems // Systems&Control Letters, № 36, 1999. pp. 277–283. Крушель Е. Г. Компьютерная поддержка изучения задач оценки состояния и управления дискретными динамическими системами // Труды II-й международной конференции «Идентификация систем и задачи управления SicPRO'03». – М.: Изд-во Института проблем управления им. В. А. Трапезникова Российской академии наук, 2003. – С. 2578–2597. Крушель Е. Г., Степанченко О. В. Математическое моделирование разнотемповых дискретных систем управления // Математические методы в технике и технологиях: Сб. тр. XVI Междунар. науч. конф.: В 10 т. Т. 6. Секции 9,13 / Под общ. ред. В. С. Балакирева. – Ростов н/Д: РГАСХМ ГОУ, 2003. – С. 123–126. Крушель Е. Г., Степанченко О. В. Синтез и моделирование дискретных систем управления с двойной шкалой времени // Математика. Компьютер. Образование: Сб. научн. тр. Вып. 8. Ч. II / Под ред. Г. Ю. Ризниченко. – М.: Прогресс-Традиция, 2001. – С. 517–522. Крушель Е. Г., Степанченко О. В. Алгоритмы оценки состояния и линейноквадратичной оптимизации для управляющих систем с двойной шкалой времени // Труды IY-й международной конференции «Идентификация систем и задачи управления SicPRO'05». – М.: Изд-во Института проблем управления им. В. А. Трапезникова Российской академии наук, 2005. – С. 1428–1447. Степанченко О. В. О моделировании линейных законов управления динамическими объектами с учетом двойного временного шкалирования // Наука Кубани. Библиотека журнала: Сб. науч. тр. – Краснодар, 2001. – С. 192–201.
15
20. Степанченко О. В. Проектирование алгоритмов управления дискретными разнотемповыми процессами с учетом двойного временного шкалирования. Синтез и моделирование дискретных систем управления с двойной шкалой времени // Математика. Компьютер. Образование: Сб. научн. тр. Ч. II / Под ред. Г. Ю. Ризниченко. – Москва–Ижевск: Научно-издательский центр «Регулярная и хаотическая динамика», 2001. – С. 562–572. 21. Фомин В. Н. Методы управления линейными дискретными объектами. – Л.: Изд-во ЛГУ, 1985. – 336 с. 22. Цициашвили Г. Ш. Декомпозиционный анализ сложных систем: Автореф. дис. … д-ра физ.-мат. наук: 01.01.11;01.02.05. – Владивосток, 1992. – 22 с. 23. Шаршеналиев Ж. Н. Оптимизация систем с разделяемыми движениями и ограниченными ресурсами. – Фрунзе: Илим, 1980. – 197 с. 24. Карелин А. Н. Необходимость применения детерминированного идентификатора при синтезе закона оптимального управления для оценивания состояния системы // Приборы и системы. Управление, контроль, диагностика. – 2001. – № 10. – С. 1–8. 25. Александров А. Г. Синтез регуляторов многомерных систем. – М.: Энергия, 1986. – 272 с. 26. Карелин А. Н. Применение многошаговой временной декомпозиции при синтезе субоптимальных законов управления многомерными объектами в пространстве состояний // Приборы и системы. Управление, контроль, диагностика. – 2001. – № 7. – С. 1–7. 27. Заде Л., Дезоер Ч. Теория линейных систем. (Метод пространства состояний) / Пер. с англ. – М.: Наука, 1970. – 703 с. 28. Стрейц В. Метод пространства состояний в теории дискретных линейных систем управления. – М.: Наука, 1985. – 296 с. 29. Востриков А. С. Оптимальные и адаптивные системы: Учеб. пособие / Новосиб. электротехн. ин-т. – Новосибирск, 1977. – 65 с. 30. Методы классической и современной теории автоматического управления: Учебник. В 3 т. Т. 2: Синтез регуляторов и теория оптимизации систем автоматического управления / Под ред. Н. Д. Егупова. – М.: Изд-во МГТУ им. Н. Э. Баумана, 2000. – 736 с. 31. Astrom К. J., Wittenmark В. Computer-controlled system. Theory and design. PrenticeHall, 1984. 32. Бесекерский В. А., Попов Е. П. Теория систем автоматического регулирования. – М.: Наука, 1975. – 768 с. 33. Александров А. Г. Оптимальные и адаптивные системы. – М.: ВШ, 1989. – 262 с. 34. Александров А. Г. Синтез регуляторов многомерных систем. – М.: Энергия, 1986. – 272 с. 35. Брайсон А., Хо Ю-ши. Прикладная теория оптимального управления. – М.: Мир, 1972. – 544 с.
16
ПРИЛОЖЕНИЕ 1
МОДЕЛЬ, РАССМАТРИВАЕМАЯ В КАЧЕСТВЕ ПРИМЕРА В ГЛАВАХ 1, 3 Порождающая модель объекта описывается линейным дифференциальным уравнением в терминах пространства состояний: dx (П1.1) = Ax(t ) + Bu (t ) , dt где x(t) – вектор состояния объекта размерности n × 1 (n = 4); u(t) – вектор управляющих воздействий размерности r × 1 (r = 2); A, B – параметры объекта непрерывной модели размерности n × n и n × r соответственно: − 0.077⎤ ⎡ 0.5 − 0.9⎤ ⎢− 0.2 0.3 ⎥ . ⎥ − 0.09 ⎥ ⎥ , B=⎢ ⎢ 0.7 0.0918⎥ 1 ⎥ ⎥ ⎢ ⎥ − 0.788⎦ ⎣ 1.1 − 1.3⎦ Начальные условия x(0) заданы так: x ( 0 ) T = [− 3 2 1 − 2 ]T . ⎡− 0.0235 − 0.0032 − 0.2 ⎢ 0.015 − 0.0065 − 0.5 A= ⎢ ⎢ 0.11 0.19 − 1.052 ⎢ ⎣ − 0.13 − 0.043 − 0.18
В векторе x(t) можно выделить две группы субпроцессов: медленная составляющая ⎡ x1 (t ) ⎤ размерности n1×1 (n1 = 2); ⎢ x (t )⎥ ⎣ 2 ⎦
быстрая составляющая ⎡ x3 (t ) ⎤ размерности n2×1 (n2 = 2). ⎢ x (t )⎥ ⎣ 4 ⎦ Для проведения моделирования модель (П1.1) преобразуется к виду x[ s + 1] = AD x[ s] + BD u[ s] , − 0.04 − 0.141 − 0.084⎤ ⎡ 0.945 ⎡ 0.724 − 1.828⎤ ⎢ − 0.011 0.893 − 0.378 − 0.113⎥ ⎢ ⎥ где ⎥, BD = ⎢− 0.902 0.227 ⎥ . AD = ⎢ ⎢ 0.08 ⎢ 0.604 0.675 ⎥ 0.143 0.058 0.01 ⎥ ⎢ ⎥ ⎢ ⎥ − 1.268⎦ ⎣− 0.138 − 0.059 − 0.022 0.215 ⎦ ⎣ 0.98 Дискретизация модели производится с интервалом Δt = 2. Время моделирования tmax = 100 c, дискретное время s = 0, 1, …, N (N = tmax/Δt = 50). Начальные условия для модели с сепаратными составляющими
x М [ s + 1] x Б [ s + 1]
=
AМ
0
xМ [s]
0
AБ
x Б [s]
+
BМ BБ
u[ s ]
рассчитываются следующим образом: x M [0] = R1 X 1[0] − Q Б X 2 [0] , где R1 = E − Q Á PÁ ; E – единичная матрица размерности n2 × n2; T T T X 1 [0] = [− 3 2] ; X 2 [0] = [1 − 2] . 17
x Б [0] = PБ X 1[0] + EX 2 [0] .
Для проверки возможности применения метода ДШВ используются следующие параметры:
μ =
А D 22 А D 11
= 0 . 172 << 1 , где
– евклидова норма матрицы.
0.204 ⎤ ⎡ − 0.578 − 0.342 ⎤ ⎡ 0.113 1 1 Aˆ 21 = j AD 21 = ⎢ ; Aˆ12 = 1− j AD 12 = ⎢ ⎥; ⎥ μ μ ⎣ − 1.546 − 0.463 ⎦ ⎣ − 0.196 − 0.084 ⎦ 0.06 ⎤ ⎡ 0.336 1 Aˆ 22 = AD 22 = ⎢ ⎥ , 0 ≤ j = 0 .2 < 1 μ ⎣ − 0.129 1.249 ⎦ −1 dБ 0≤μ < = 0.118 , где a = A0 ; A0 = A22 − A21 A11 A12 ; 2 c(d Б + 8abБ ) c = A 11− 1 ; f = Aˆ 21 A 11− 1 ; b Б = f ⋅ Aˆ 12 ;
⎛ 2a ⎞ ⎟ = 0 . 594 . f ⋅ ⎜⎜ 1 + a + b Б ⎟⎠ ⎝ На этапе моделирования рассчитываются параметры объекта матрицы Abound, Bbound с учетом нового интервала дискретизации δt = μΔt: d Б = a + b Б ; PБ ≤ μ
Abound
j
⎡ 0.1593 − 0.313 ⎤ ⎡ 0.9914 − 0.0029 − 0.0566 − 0.0239⎤ ⎢− 0.0922 0.0828 ⎥ . ⎥ ⎢ 0.0029 0.993 − 0.1431 − 0.0293⎥ ⎥ ⎢ , Bbound = ⎢ = ⎢ 0.2069 ⎢ 0.0311 0.0544 0.6905 0.0217 ⎥ 0.28 ⎥ ⎥ ⎢ ⎥ ⎢ ⎣ 0.3223 − 0.3941⎦ ⎣− 0.0399 − 0.0145 − 0.0427 0.7627 ⎦
Количество тактов быстрого времени в одной дискрете медленного рассчитывается следующим образом: ⎛1⎞ n Б = округл⎜⎜ ⎟⎟ , ⎝μ⎠
где округл( ) – функция, округляющая до ближайшего целого «сверху». Для получения большего эффекта ДШВ в пограничном слое задаются ненулевые управляющие воздействия (рис. П1.1)
Рис. П1.1. Периодическое управляющее воздействие
18
Амплитуда управляющего воздействия изменяется в пределах [–1; 1] с интервалом постоянства 10 тактов. ПРИЛОЖЕНИЕ 2 МОДЕЛЬ ЭЛЕКТРОДВИГАТЕЛЯ ПОСТОЯННОГО ТОКА
Используется известная математическая модель электродвигателя постоянного тока двойного питания (рис. П2.1), которая затем приводится к стандартной форме описания линейной системы в состояниях. Ф
MН R U I
Рис. П2.1. Схема электродвигателя постоянного тока с двойным питанием: Ф – магнитный поток; U – напряжение; I – ток в якорной цепи; МН – нагрузка на валу двигателя; R – сопротивление
Цель управления – стабилизация скорости вращения (Ω) за счет изменения магнитного потока (Ф) и (или) напряжения (U) питания цепи якоря при изменяющейся нагрузке на валу двигателя (МН). Введем обозначения для описания электродвигателя как системы управления. Управляющие воздействия – напряжение (U) и магнитный поток (Ф); возмущающее воздействие – момент нагрузки на валу двигателя (МН); выход объекта – скорость вращения вала двигателя (Ω). Для составления математической модели электродвигателя используем законы механики и электротехники. Согласно второму закону Ньютона для вращающихся тел (П2.1) dΩ J = M Д −MH, dt где J – момент инерции всех вращающихся частей, приведенный к валу двигателя (константа); MД – момент двигателя. (П2.2) M Д = k Д IΦ , где kД – коэффициент момента (константа), вычисляется по формуле
kД =
M
Д 0
I 0Φ 0
, (MД0, I0, Ф0 – паспортные (номинальные) данные). 19
Используем дифференциальный закон Ома для нахождения тока в якорной цепи. dI (П2.3) L + RI = U − E Д , dt
где L – индуктивность; R – сопротивление; EД – противоЭДС, развиваемая двигателем при вращении. Для нахождения противоЭДС используем уравнение для рамки с током в магнитном поле: (П2.4) E = k ΦΩ , Д
E
где kE – коэффициент ЭДС (константа), вычисляется по формуле:
kE =
E Д0 Φ 0Ω0
,
(EД0, Ω0, Ф0 – паспортные данные двигателя – номинальные значения). В результате получилась система четырех уравнений (П2.5), достаточная для описания двигателя: ⎧ dΩ ⎪⎪ J dt = M Д − M H , M Д = k Д I Φ , (П2.5) ⎨ ⎪ L dI + RI = U − E , E = k ΦΩ , Д Д E ⎪⎩ dt где I, Ω – переменные состояния. Учитывая, что уравнения (П2.2) и (П2.4) не дифференциальные, а алгебраические, приведем систему (П2.5) к виду: ⎧ dΩ ⎪⎪ J dt = kd IΦ − M H , ⎨ ⎪ L dI + RI = U − k ΦΩ. e ⎪⎩ dt
(П2.6)
Система (П2.6) является нелинейной (из-за произведения переменных состояния на управляющие воздействия). Для того чтобы полученную математическую модель привести к стандартной форме (П2.7), необходимо линеаризовать систему уравнений (П2.6). dx (П2.7) = Ax + Bu + Cf , dt где x – вектор состояния размерности 2 × 1; u – вектор управлений, размерности 2 × 1; f – возмущающее воздействие (скаляр); A, B, C – матрицы параметров объекта размерности 2 × 2, 2 × 2 и 2 × 1 соответственно. Используя известную технику линеаризации модели (разложение в ряд в окрестности номинального режима и отбрасывание слагаемых ряда выше 1-го порядка), получим: dx (П2.8) = Ax + Bu + Cf , dt
20
где
⎡ ⎢ 0 A=⎢ k Φ ⎢− e H ⎣ L
kd Φ H J R − L
kd I H ⎤ ⎡ ⎥, ⎢0 J ⎥ B = ⎢1 keΩ H ⎥ ⎢ − ⎣L ⎦ L
⎤ ⎡ 1⎤ ⎥ , C = ⎢− J ⎥ , ⎢ 0 ⎥ ⎥ ⎣ ⎦ ⎥ ⎦
индекс «Н» обозначает номинальные значения соответствующих переменных. Параметры конкретного объекта и данные о номинальном режиме, использованные в главах 1, 2 при моделировании: 1. Сопротивление якорной цепи R = 1 Ом. 2. Индуктивность якорной цепи L = 1 гн. 3. Момент инерции ротора J = 0.5 н*с/(об/мин). 4. Коэффициент двигателя kd = 4.804. 5. Коэффициент обмотки возбуждения ke = 0.546. В задаче имеется 5 переменных (U, M, I, Ω, Ф). Только три из них можно задать по паспортным данным двигателя, а две остальные (по числу переменных состояния) нужно вычислить из уравнений статического режима - так, чтобы производные
dI dt
и
dΩ dt
были равны 0. Иначе получит-
ся, что начальные условия не будут нулевыми, и в системе будут переходные процессы даже в отсутствии отклонений от номинальных условий. Зададим, например, следующие номинальные значения: – номинальное значение напряжения питания якорной цепи UН = 220 В. – номинальный ток в якорной цепи IН = 12.2 А. – номинальное значение магнитного потока ФН = 0.244 вб. Тогда значение остальных номинальных данных можно вычислить по формулам (получаются путем приравнивания правой части уравнений к нулю). Номинальное значение момента нагрузки МН = kdIНФН = 14.301 н. Номинальное значение скорости вращения Ω = U H − RI H = 1560 об/мин. H keΦ H В результате расчета по формулам (П2.8) и (П2.9) получены следующие числовые значения параметров линеаризованной модели: 0.234⎤ 0⎤ ⎡ 0 ⎡ 11.722 ⎡− 0.2⎤ . A=⎢ ; B=⎢ ; C=⎢ ⎥ ⎥ ⎥ −1 ⎦ ⎣− 0.133 ⎣− 851.639 1⎦ ⎣ 0 ⎦ Вычислительные эксперименты, проведенные с целью проверки адекватности линеаризованной модели, показали, что при управлении скоростью вращения путем изменения напряжения питания якорной цепи (магнитный поток, создаваемый обмоткой возбуждения, остается неизменным) точность линеаризованной модели очень высокая. Использование управления изменением магнитного потока приводит к небольшим (но заметным) расхождениям между расчетами по исходной и линеаризованной моделям. Поэтому в основном тексте (относящемся к управлению линейными дискретными процессами) рассматривалась линейная модель управления ско21
ростью вращения электродвигателя со скалярным управляющим воздействием (напряжением питания якорной цепи). Параметры модели: 0.18 ⎤ ⎡ 0.978 ⎡ − 126.188 0.169⎤ ⎡− 0.297⎤ . AD = ⎢ ; BD = ⎢ ; CD = ⎢ ⎥ ⎥ ⎥ ⎣− 0.102 0.209⎦ ⎣− 655.289 0.768⎦ ⎣ 0.019 ⎦ ПРИЛОЖЕНИЕ 3 РЕШЕНИЕ ЗАДАЧИ АНАЛИТИЧЕСКОГО КОНСТРУИРОВАНИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ С КРИТЕРИЕМ СПЕЦИАЛЬНОГО ВИДА Постановка задачи: найти последовательность управляющих воздействий r-мерных векторов u[s], s = 0, 1, …, N – 1, N – задано, доставляющих минимум квадратичному критерию. I = x T [ N ]K [ N ] x[ N ] + 2ψ T [ N ] x[ N ] + M [ N ] + (П3.1) N −1 ⎡ x T [ s ]Q[ s ] x[ s ] + 2 x T [ s ]H [ s ]u[ s ] + 2ξ T [ s ] x[ s ] + ⎤ + ∑⎢ ⎥, T T s u s u s R s u s V s 2 [ ] [ ] [ ] [ ] [ ] [ ] + Θ + + ⎥⎦ s =0 ⎢ ⎣ где K[N], Q[s] – заданные n × n неотрицательно определенные матрицы; R[s] – заданная r × r положительно определенная матрица; ψ[N], ξ[s] – заданные n-мерные векторы; Θ[s] – заданный r-мерный вектор; H[s] – заданная n × r матрица; M[N], V[s] – заданные скаляры. Вектор состояния x[s] в (П3.1) (размерности n×1) удовлетворяет системе линейных равенств, имеющих смысл модели объекта (П3.2) x[ s + 1] = A[ s]x[ s] + B[ s]u[s] + ϕ[s] , где A[s], B[s] – заданные n × n, n × r матрицы; ϕ[s] – n × 1 детерминированный вектор внешних воздействий. Начальное состояние x[0] задано. Модель (П3.2) не отличается от принятой в классической задаче АКОР. Но критерий (П3.1) специфичен. Его отличительной особенностью является наличие слагаемых, содержащих квадратичную связь между переменными состояния и управляющими воздействиями ( 2 x T [ s ]H [ s ]u[ s ] ) и линейную T
комбинацию компонент вектора управлений ( 2Θ [ s ]u[ s ] ). Как показано в гл. 3, задача с таким критерием может быть использована для синтеза субоптимального управления объектом с разнотемповыми составляющими. Возможно, есть и другие задачи, в которых встречается такой критерий. Схема решения задачи (П3.1), (П3.2). Используется процедура динамического программирования Р. Беллмана методически так же, как и при решении классической задачи АКОР. 1. Оптимальное значение части критерия I, оставшейся на N-м шаге 22
(в предположении, что существующие N-1 шагов завершены) равно: (П3.3) I = x T [ N ]K [ N ]x1 [ N ] + 2ψ T [ N ]x[ N ] + M [ N ] . Как видно из (П3.3), Iopt[N] является функцией вектора состояния x[N], в котором аккумулированы все предшествующие управляющие воздействия. 2. Используя принцип оптимальности Р. Беллмана, запишем часть критерия, минимизация которой определяет управляющие воздействия uopt[N – 1] в зависимости от вектора состояний x[N – 1]. I [ N − 1] = xT [ N − 1]Q[ N − 1] x[ N − 1] + 2 xT [ N − 1]H [ N − 1]u[ N − 1] + + 2ξ T [ N − 1]x[ N − 1] + 2ΘT [ N − 1]u[ N − 1] + u T [ N − 1]R[ N − 1]u[ N − 1] + (П3.4) + V [ N − 1] + I opt [ N ].
3. Производится подстановка модели (П3.2) в (П3.4) для представления x[N] через x[N – 1], u[N – 1]. Используя условие минимизации ∇ u[ N −1] I [ N − 1] = 0 , где ∇ u[ N −1] I [ N − 1] – градиент критерия по управляющим воздействиям: ⎡ ∂I [ N − 1] ∂I [ N − 1] ⎤ , L ∇ u[ N −1] I [ N − 1] = ⎢ ⎥ ∂u r [ N − 1] ⎦ ⎣ ∂u1 [ N − 1] находим форму зависимости оптимальных управляющих воздействий от вектора состояния текущего такта u opt [ N − 1] = u opt ( x[ N − 1]) .
4. Подставляя u opt [ N − 1] в (П3.4), приведем критерий к форме, аналогичной (П3.3) I = x T [ N − 1]K [ N − 1] x[ N − 1] + 2ψ T [ N − 1] x[ N − 1] + M [ N − 1] . (П3.5) Опуская довольно громоздкие (но простые) выкладки, приведем сводку рекуррентных матричных соотношений, позволяющих рассчитать оптимальные значения управляющих воздействий. Оптимальные управляющие воздействия рассчитываются в контуре обратной связи по вектору состояния объекта: П(3.6) uopt [ N − 1] = −C1[ s ]x[ s ] − C2 [ s ]x[ s ] − G[ s ] , где слагаемое − C1[s]x[s] – такое же, как в расчете оптимальных управлений для классической задачи АКОР. Остальные слагаемые специфичны:
( ) B [s]K[s + 1] A; C [ s ] = (R[ s ] + B [ s ]K [ s + 1]B[ s ]) H [ s ]; G[ s ] = (R[ s ] + B [ s ]K [ s + 1]B[ s ]) [Θ[ s ] + B [ s ](K [ s + 1]ϕ[ s ] + ψ [ s + 1])]. C1 [ s ] = R[ s ] + B T [ s ]K [ s + 1]B[ s ] T
−1
−1
T
T
2
T
−1
T
23
(П3.7)
Параметры K[s], ψ[s] рассчитываются при попятном отсчете тактов s, начиная с N – 1 (K[N], ψ[N] – заданы в (П3.1)) K [ s ] = A T [ s ] K [ s + 1] A[ s ] + Q[ s ] − A T [ s ] K [ s + 1] B[ s ] ×
( − {− A
{
× R[ s ] + B T [ s ] K [ s + 1] B[ s ] T
(
)
−1
}
B T [ s ] K [ s + 1] A[ s ] −
[ s ] K [ s + 1] B[ s ] R[ s ] + B T [ s ] K [ s + 1] B[ s ]
( − H [ s ](R[ s ] + B
) [ s ] K [ s + 1] B[ s ])
)
−1
− H [ s ] R[ s ] + B T [ s ] K [ s + 1] B[ s ]
−1
B T [ s ] K [ s + 1] A[ s ] −
T
−1
H T [s] ,
}
ψ [ s ] = A T [ s ](K [ s + 1]ϕ [ s ] + ψ [ s + 1]) + ξ [ s ] −
( × (B
(П3.8)
H T [s] −
)(
− H [ s ] + A T [ s ] K [ s + 1] B[ s ] R[ s ] + B T [ s ] K [ s + 1] B[ s ]
)
)
−1
×
(П3.9)
[ s ] K [ s + 1]ϕ [ s ] + B T [ s ]ψ [ s ] + Θ[ s ] . Значение критерия (П3.1) при использовании оптимальных управляющих воздействий равно (П3.10) I opt = x T [0]K [0]x[0] + 2ψ T [0]x[0] + M [0] , T
где x[0] – заданное начальное состояние; K[0], ψ[0] – получаются в результате рекуррентных расчетов по (П3.8), (П3.9); M[0] – скаляр, получается рекурсивно в обратном отсчете тактов s, начиная с N – 1 (M[N] – задано в (П3.1))
M [s] = M [s + 1] + V [s] + ϕ T [s]K[s + 1]ϕ[s] + 2ψ T [s + 1]ϕ[s] −
( ) × (R[s] + B [s]K[s + 1]B[s]) × × (Θ[s] + B [s]ψ [s + 1] + B [s]K[s + 1]ϕ[s]).
T
− Θ[s] + BT [s]ψ [s + 1] + BT [s]K[s + 1]ϕ[s] × T
T
T
T
24
(П3.11)
ДЛЯ ЗАМЕТОК
25
ДЛЯ ЗАМЕТОК
26