Київський національний університет імені Тараса Шевченка
ВАРІАЦІЙНЕ ЧИСЛЕННЯ ТА МЕТОДИ ОПТИМІЗАЦІЇ М.О. Перестюк, О.М. ...
166 downloads
341 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Київський національний університет імені Тараса Шевченка
ВАРІАЦІЙНЕ ЧИСЛЕННЯ ТА МЕТОДИ ОПТИМІЗАЦІЇ М.О. Перестюк, О.М. Станжицький, О.В. Капустян, Ю.В. Ловейкін
Рекомендовано Міністерством освіти і науки України як навчальний посібник для студентів, які навчаються за напрямом підготовки "Математика"
Київ – 2010
2
ЗМІСТ Вступ ......................................................................................................... 5 Формалізація екстремальних задач ....................................................... 6 Розділ 1. Негладкі екстремальні задачі ............................................... 12 1.1. Теореми Вейєрштраса ................................................................ 12 1.2. Задача апроксимації в нормованому просторі ......................... 17 1.3. Задачі опуклої оптимізації .......................................................... 21 Розділ 2. Гладкі екстремальні задачі ................................................... 29 2.1. Елементи диференціального числення в нормованих просторах. Частина 1 .................................................................. 29 2.2. Елементи диференціального числення в нормованих просторах. Частина 2 .................................................................. 35 2.3. Метод Лагранжа .......................................................................... 39 Розділ 3. Задачі класичного варіаційного числення ........................... 47 3.1. Найпростіша задача варіаційного числення (задача Лагранжа) ..................................................................................... 47 3.2. Задача Больца ............................................................................. 51 3.3. Ізопериметрична задача ............................................................. 54 3.4. Задачі зі старшими похідними і векторні задачі ....................... 57 3.5. Умови Вейєрштраса, Лежандра, Якобі ...................................... 62 3.6. Задача з рухомими кінцями ........................................................ 66 Задачі оптимального керування. Приклади задач оптимального керування ................................................................................................ 71 Постановка задачі оптимального керування ....................................... 78 Розділ 4. Метод динамічного програмування ...................................... 81 4.1. Принцип оптимальності Беллмана ............................................ 81 4.2.Рівняння Беллмана задачі оптимальної швидкодії ................... 86 3
4.3. Задача аналітичного конструювання лінійного регулятора ..... 89 4.4. Про диференційовність функції Беллмана ............................... 92 Розділ 5. Принцип максимуму Понтрягіна ........................................... 98 5.1. Задача Майера ............................................................................ 98 5.2. Задача оптимальної швидкодії ................................................ 105 5.3. Достатні умови оптимальності у формі принципу максимуму .................................................................................. 112 5.4. Принцип максимуму Понтрягіна та необхідні умови екстремуму в класичному варіаційному численні ................... 113 Література ............................................................................................. 120
4
Вступ Людям властиве бажання прагнути до найкращого, і тому, якщо вони змушені обирати серед багатьох можливостей, то бажання обрати серед них оптимальну є цілком природним. Щоб знайти оптимальну серед можливостей, ми змушені розв’язувати задачі на відшукання максимуму або мінімуму, тобто найбільших або найменших значень якихось величин. Обидва ці поняття – максимум і мінімум – об’єднані єдиним терміном "екстремум". Тому задачі на відшукання максимуму або мінімуму називають екстремальними задачами. Методи розв’язання і дослідження різних класів екстремальних задач і складають основу даного посібника. П’ять його розділів "Негладкі екстремальні задачі", "Гладкі екстремальні задачі", "Задачі класичного варіаційного числення", "Метод динамічного програмування" і "Принцип максимуму Понтрягіна" дають можливість ознайомитись з методами розв’язання значної частини типових екстремальних задач. Кожен розділ посібника містить заняття, які, у свою чергу, складаються з теоретичної частини, прикладів розв’язання задач і вправ для самостійної роботи. Порядок занять повністю відповідає семестровому нормативному курсу "Варіаційне числення та методи оптимізації", що читається для студентів механіко-математичного факультету. Теоретична частина занять є близькою до підручника [1] і повністю відповідає курсу лекцій, викладеному в навчальних посібниках [16, 17]. При підборі вправ автори спиралися на посібник [8], збірник задач [9], методичну розробку [10], а також на багаторічний досвід проведення практичних занять із курсу "Варіаційне числення та методи оптимізації" на механіко-математичному факультеті.
5
Формалізація екстремальних задач Перед тим, як переходити до суто математичних постановок задач, доцільно спочатку на прикладах з’ясувати, як такі постановки виникають. Задача 1 (Евклід). У трикутник
ABC вписати паралелограм
ADEF найбільшої площі. Задача 2 (Ферма). Знайти траєкторію променя світла між двома точками оптично неоднорідного середовища. Задача 3 (Бернуллі). Знайти шлях, уздовж якого під дією лише сили тяжіння тіло від точки A до точки B переміститься за найкоротший час. Задача 4 (транспортна задача). Запаси продукту розподілені по m базах. Потрібно доставити цей товар до n споживачів за найменших витрат. Щоб формалізувати поставлені задачі, тобто звести їх до математичної постановки, потрібно чітко визначити структуру екстремальної задачі. Точно поставлена екстремальна задача містить такі елементи: простір елементів X , множина допустимих елементів C X , функціонал
f : X R , який потрібно мінімі-
зувати або максимізувати на множині допустимих елементів C , де
R R . Таким чином, потрібно звести поставлені задачі до вигляду
f ( x) extr, x C X. Формалізація задачі 1. Нехай точка
Рис. 1
D AB , точка E BC , точка F AC (рис. 1). Вважаючи, що довжина H висоти трикутника ABC , проведеної із вершини B , і довжина a сторони AC відомі, 6
отримуємо відносно змінної
x – довжини сторони AF , таку екстре-
мальну задачу:
x f ( x) H (a x) sup, a x [0, a]. Це – гладка задача, в якій X R , C [0, a ] . Формалізація задачі 2. Нехай площина
z 0 розділяє два однорідні середовища,
z
причому швидкість розповсюдження світла в
A
верхньому півпросторі рівна
y
C x
v2 . Шукаємо траєкторію променя світла, що йде з точки A (0, 0, ) ,
B
v1 , в нижньому –
B (, 0, ) ,
0
0 , до точки
(рис. 2).
Будемо
Рис. 2
спиратись на варіаційний принцип Ферма, згідно з яким промінь світла проходить ту траєкторію, для проходження якої йому знадобиться найменше часу. У силу симетрії траєкторія
променя
лежить
у
площині
y 0 . Нехай точка
C ( x, 0, 0) – точка переломлення променя. Тоді відносно змінної x маємо таку екстремальну задачу: 2 ( x ) 2 2 x2 inf . f ( x) v1 v2 Це так само гладка задача,
A x
X C R.
Формалізація задачі 3. Уведемо в площині, що містить задані точки A , B систему координат так, щоб вісь
B y Рис. 3
була горизонтальна, вісь
OY
OX була
направлена вниз, точка A співпадала з початком координат. Нехай точка B 7
має координати
( x1 , y1 ) , x1 0 , y1 0 , y ( ) – функція, що задає
рівняння кривої, яка з’єднує точки A і B (рис. 3). Тоді швидкість тіла в точці
( x, y ( x)) дорівнює
2 gy ( x) , а час, необхідний тілу на
проходження ділянки кривої довжиною ds
dx 2 dy 2 від точки
ds . 2 gy ( x)
( x, y ( x)) до точки ( x dx, y ( x) dy ) дорівнює dt Звідси маємо таку екстремальну задачу: x1 1 ( y( x)) 2 dx inf , f ( y ( )) 2 gy ( x ) 0 y (0) 0, y ( x1 ) y1 .
Це задача класичного варіаційного числення, в якій X C ([0, x1 ]) , 1
C y ( ) C1 ([0, x1 ] : y (0) 0, y ( x1 ) y1 . Формалізація задачі 4. Уведемо позначення для відомих з умови задачі величин:
ai – кількість одиниць продукту на i -й базі, i 1, m ; b j – кількість одиниць продукту, що потребує j -й споживач, j 1, n ; cij – вартість доставки одиниці продукту з i -ї бази до j -го споживача. m
Тоді загальна вартість доставки дорівнює
n
c x i 1 j 1
ij ij
, де xij – кіль-
кість одиниць продукту, що підлягає доставці з i -ї бази до j -го споживача. Відносно змінних x i j , i 1, m , мальну задачу:
8
j 1, n , маємо екстре-
m n f ( x ) cij xij inf, i 1 j 1 n m x a, xij b j , xij 0. ij i j 1 i 1 Отримали задачу лінійного програмування, де X простір матриць розміру m n ,
C x xij , i 1, m, j 1, n :
n
xij ai , j 1
m
x i 1
ij
b j , xij 0 .
Після формалізації екстремальної задачі виникає питання про її розв’язність. Будемо вважати, що Оскільки
( X , ) – метричний простір.
sup f ( x) inf ( f ( x)) , то будемо розглядати лише за-
дачу мінімізації
f ( x) inf, x C X , і розв’язок цієї задачі будемо розуміти в одному з двох сенсів:
x C доставляє глобальний мінімум, якщо для всіх x C виконується f ( x) f ( x ) ;
точка
точка
x C доставляє локальним мінімум, якщо існує 0
таке, що для всіх
x C B ( x ) виконується f ( x) f ( x ) , де
B ( x ) x X : ( x, x ) . Із контексту завжди буде зрозуміло, про який розв’язок ідеться. Вправи Формалізувати задачі 1–12: 1. Знайти на заданій прямій таку точку, щоб сума відстаней від неї до двох заданих точок була мінімальною. 2. Вписати в круг прямокутник найбільшої площі. 3. Вписати в кулю конус найбільшого об’єму. 9
4. Серед замкнутих плоских кривих, що мають задану довжину, знайти криву, яка охоплює максимальну площу (задача Дідони). 5. Знайти криву з фіксованими кінцями, що лежить в 1-му квадранті площини, від обертання якої навколо осі абсцис утворюється поверхня найменшої площі. 6. Знайти форму абсолютно гнучкого канату заданої довжини, закріпленого в фіксованих точках. 7. Знайти лінію найменшої довжини, що з’єднує дві задані точки на деякій гіперповерхні в n -вимірному просторі. 8. Скласти раціон харчування з мінімальними витратами при фіксованому асортименті продуктів, заданій кількості в кожному з них поживних речовин і відомій вартості одиниці кожного продукту, вважаючи, що раціон повинен забезпечувати необхідну потребу організму в поживних речовинах. 9. Формалізувати задачу найкращого вибору споживача при заданому бюджеті і цінах на товари, якщо він робить вибір серед наборів з
n товарів у деякій множині X R n і при цьому
U : X R в тому сенсі, що набір x кращий за набір y тоді і лише тоді, коли U ( x) U ( y ) .
керується функцією корисності
10. Серед усіх дуг довжини L , що лежать у півплощині, обмеженій прямою
l із заданими кінцями A, B l , знайти таку, яка разом із
відрізком AB прямої
l обмежує фігуру найбільшої площі.
11. Тіло рухається прямолінійно без тертя і керується зовнішньою силою, що може змінюватись у заданих межах. Знайти таке керування зовнішньою силою, що забезпечує зупинку тіла в заданій точці за найкоротший час. 12. Корабель рухається зі сталою швидкістю відносно течії, швидкість якої стала за модулем і напрямом. Знайти керування кораблем, що забезпечує досягнення ним заданої точки із заданого початкового стану за найкоротший час, вважаючи 10
керуючим вектор
u (cos ,sin ) , де (t ) – кут між
векторами швидкостей корабля і течії. 13. Навести приклади функцій, що мають такі властивості: а) глобальний мінімум і максимум досягаються в нескінченній кількості точок; б) функція обмежена, глобальний максимум досягається, мінімум не досягається; в) функція обмежена, глобальні екстремуми не досягаються; г) функція має єдиний локальний екстремум, що не є глобальним. 14. Нехай
f C(R n ), lim f ( x) . Довести, що f досягає гло| x|
n
бального мінімуму на будь-якій замкненій підмножині R . Якщо ж
f C1 (R n ) і f має єдиний нуль x x , то x доставляє глобальний мінімум функції
f.
11
Розділ 1. Негладкі екстремальні задачі 1.1. Теореми Вейєрштраса Розглядається екстремальна задача
f x inf x C X .
(1)
Тут f : X R R , X – деякий простір, на
допустимих
елементів,
Уточнюючи умови на X ,
на
якій
C X – множи-
шукається
розв’язок
(1).
C , f , ми будемо впродовж цього курсу
отримувати теореми щодо необхідних і достатніх умов розв’язності задачі (1). Нехай X – метричний простір з метрикою
.
Означення. 1)
f : X R називається напівнеперервною знизу
(н.н.зн.) в точці
x0 , якщо lim f x f x0 . x x0
2)
f : X R називається напівнеперервною зверху (н.н.зв.) в
точці
x0 , якщо lim f x f x0 . x x0
При цьому якщо н.н.зн. (н.н.зв.) в точці
f ( x0 ) () , то функція f вважається x0 .
Очевидно, що функція f : X R , яка одночасно н.н.зн. і н.н.зв. в точці
x0 , є неперервною в точці x0 . Для напівнеперервних функцій
можна узагальнити відому теорему Вейєрштраса. Теорема (Вейєрштраса). Якщо
f : X R – н.н.зн. і скінчена на
компакті K X , то f – обмежена знизу на K і приймає на K своє найменше значення. Нехай X – банахів простір з нормою .
12
Означення. f : X R називається слабо н.н.зн. (слабо н.н.зв.) в точці
x0 , якщо для xn X такої, що xn x0 , виконується w
lim f xn f x0 ( lim f xn f x0 ). n
n
Теорема (Вейєрштраса в банаховому просторі). Якщо X
– ре-
флексивний простір, M X – обмежена, замкнена, опукла множина,
f : X R – скінчена, опукла, н.н.зн. на M , то f обме-
жена знизу на M і приймає на M своє найменше значення. Приклад 1. Нехай g : X K R – н.н.зн., K – компакт. Довести, що функція f : X R Розв’язання. Позначимо компакт, то існує Існує
f ( x) inf g ( x, y ) є н.н.зн. yK
A lim f ( x) lim f ( xn ) . Оскільки K – xn x0
x x0
yn K таке, що f ( xn ) inf g ( xn , y ) g ( xn , yn ) . yK
yn k
підпослідовність
така,
що
A lim f ( xn ) lim f ( xn k ) lim g ( xn k , yn k ) n
k
k
yn k y0 K . lim
x x0 , y y0
Тоді
g ( x, y )
g ( x0 , y0 ) f ( x0 ) , що і доводить шукане. Приклад 2. Дослідити на напівнеперервність знизу функціонал 1
( x()) f ( x(t )) dt 0
в
метриці
простору
L 2 [0;1] ,
якщо
f : R R – н.н.зн. функція. Розв’язання. Покажемо, що мо
() , взагалі кажучи, не є н.н.зн. Візьме-
f ( x) x3 і x0 (t ) 0 . Для послідовності {xn (t ), n 1} , xn (t )
n, t [0;1 n3 ], маємо, що xn x0 3 0, t (1 n ;1],
13
L 2 [0;1]
0 і в той же час
( xn ()) 1 .
Звідси маємо, що lim ( x ) 1 ( x0 ) 0 . Таким x xo
чином, функціонал
не є н.н.зн. Вправи
1. Дослідити на напівнеперервність:
0, x Q, 1, x R \ Q;
– ціла частина);
а) f x x (
в) f x
1 , x 0, б) f x x , x 0;
1 , x 0, г) f ( x) x 0, x 0.
2. Показати, що якщо
f1 , f 2 – н.н.зн. функції, то функції f1 f 2 ,
f1 ( 0) , f1 f 2 ( fi 0)
є н.н.зн. У випадку, коли f 0 –
н.н.зн. або н.н.зв. дослідити на напівнеперервність функцію 3. Дослідити на напівнеперервність функції та ( x) max{ f ( x), g ( x)} , якщо
1 f .
( x) min{ f ( x), g ( x)}
f , g – н.н.зн. (н.н.зв.) функції.
4. Довести наступні твердження: а) f
– н.н.зн. (н.н.зв.) в точці x0
0
( , x0 ) 0
тоді і лише тоді, коли
таке,
що
x B x0
f x f x0 ( f x f x0 ). б) f
– н.н.зн. (н.н.зв.) в точці
f ( x0 )
(
f ( x0 ) )
f ( x) ( f ( x) ).
14
x0 тоді і лише тоді, коли
r 0 таке, що x Br ( x0 )
в) f
– н.н.зн. на множині X тоді і лише тоді, коли a R
множина x X : f x a – замкнена. г)
f – н.н.зв. на множині X тоді і лише тоді, коли a R
множина x X : f x a – замкнена. д) множина A X – відкрита (замкнена) тоді і лише тоді, коли
1, x A – н.н.зн. (н.н.зв.). 0, x A
A x :
5. Переформулювати і довести теореми Вейєрштраса для напівнеперервних зверху функцій.
fi : X R , i I – сім’я н.н.зн. (н.н.зв.) функцій.
6. Нехай Дослідити
на
напівнеперервність
x sup fi x , якщо множина I
x inf fi x ,
функції
iI
може бути як скінченою, так і
iI
нескінченою. 7. Нехай
f x
n
n 1
– неспадна послідовність н.н.зн. функцій і
f x lim f n x . Довести, що f – н.н.зн. n
8. Нехай M – метричний простір дійсних, обмежених функцій
t ,
t a, b з метрикою , sup t t . Дослідити на t a ,b
напівнеперервність знизу функціонал n
L sup i 1
L:M R ,
ti ti 1 ti ti 1 2
2
,
де sup береться по всім розбиттям відрізка a, b . Який вигляд має L для функцій з неперервною похідною? 15
1
x t dt
9. Показати, що функція f : L 2 0,1 R , f x
4
не є
0
неперервною в метриці простору L 2 0,1 . Дослідити цю функцію на напівнеперервність в цій метриці. 10. Нехай R
n
– відкрита підмножина і
борелівська функція така, що
u : R R –
w функція y u w, y –
н.н.зн. і u w, y 0 w, y R . Означимо функціонал
f
на L2 за формулою
x L 2
f x u w, x w dw .
(2)
Довести, що f : L 2 R – н.н.зн. 11. Нехай R
n
– відкрита підмножина і
u : R R –
борелівська функція така, що функція y u w, y – н.н.зн. для всіх
w і для деяких a L1 (), c R виконується нерівність u w, y a ( w) cy 2
w, y R .
Довести, що тоді функціонал f : L 2 R , означений як і в попередній задачі формулою (2), буде н.н.зн. 12. Нехай R
n
– відкрита підмножина і u : R R
борелівська функція така, що: а) функція w u w, y вимірна
yR ,
б) функція y u w, y неперервна
w .
Крім того, для деяких a L1 (), c R виконується нерівність
16
–
u w, y a( w) cy 2 w, y R . Довести,
що
тоді
функціонал
f : L 2 R , означений
формулою (2), буде неперервним. 13. Нехай функція
f : C 0,1 R
задана співвідношенням
1
1 f x x t dt x . Знайти inf і sup функції на одинич2 0 ній кулі
B1 простору C 0,1 . Чи досягаються вони на B1 ? Чому?
14. За допомогою теореми Вейєрштрасса дослідити на компактність множину
U x C 0,1 : sup x t 1, x 0 0, x 1 1 t0,1
в C 0,1 . 15. Довести, що в нормованому просторі
( X ,|| ||) функція
f ( x) || x || є слабо н.н.зн. 16. Довести, що функціонал f x x x0 замкненій множині
K
на будь-якій опуклій,
рефлексивного банахового простору
X , досягає inf . 17. В просторі
l2 побудувати замкнену множину, в якій немає
елемента з найменшою нормою.
1.2. Задача апроксимації в нормованому просторі Нехай
X,
– нормований простір, M X ,
апроксимації в нормованому просторі
17
x0 M . Задача
x x0 inf x M Означення.
Якщо
x M
–
розв’язок
(1) задачі
(1),
тобто
x x0 inf x x0 , то x називається елементом найкращого xM
наближення для
x0 на множині M і позначається projM x0 .
Теорема (про апроксимацію в нормованому просторі). Якщо M – скінченновимірний підпростір, то задача (1) має розв’язок.
X,
Означення. Простір якщо з того, що
називається строго нормованим,
x y x y , y 0 , випливає, що x y ,
R . Строго нормованим є, зокрема, гільбертів простір. Теорема (про єдиність елемента найкращого наближення). Якщо
X,
– строго нормований простір, M X – довільний під-
простір, то задача (1) має не більше одного розв’язку. Теорема (про апроксимацію в гільбертовому просторі). Нехай X – гільбертів простір, M X – замкнена опукла множина. Тоді задача (1) має єдиний розв’язок. Приклад. Нехай X – комплексний гільбертів простір зі скалярним добутком , і нормою , M – замкнена, опукла підмножина X .
z projM x
Довести, що
тоді і лише тоді, коли
yM
Re x z , z y 0 . Розв’язання. Достатність. Запишемо послідовність рівностей:
yM
2
2
x y xzz y 2
2
2
x z z y 2 Re( x z , z y ) x z . Звідси маємо доведення достатності.
18
z projM x , то
Необхідність. Оскільки опуклості
M
множини
y (1 ) z M
маємо,
x z inf x y . З yM
(0;1]
yM
що
. Тоді
2
2
2
2
x z x y (1 ) z x z 2 z y 2 Re( x z, z y) . В результаті одержуємо, що
(0,1] . Спрямувавши
Re( x z , z y ) z y
до нуля, маємо
2
2 при
Re( x z, z y) 0 .
Вправи 1. Довести, що гільбертів простір є строго нормованим. Навести приклад не строго нормованого простору. 2. Довести, що для всіх x Br ( x0 )
proj B x x x0 r
0
r x x0 . x x0
3. M – замкнений, опуклий конус в X . Довести, що тоді і лише тоді, коли
Re x z, y 0 yM Re x z, z 0.
4. M – підпростір в X . Довести, що коли
x z, y 0 .
yM
x projM x
z projM x
належить
z projM x тоді і лише тоді,
Показати,
L( X ) .
Знайти
що
відображення
projM x ,
якщо
dim M n . 5. Нехай
M x R n a, x , де a R n , R ,
скалярний добуток в
R n . Довести, що для всіх
19
,
–
xM
projM x x
a , x a . a
2
Чи
зміниться
відповідь
для
M x R n a, x ?
M x R n ai , x i , i 1, m , де ai i 1 R n – лі-
6. Нехай
нійно незалежні,
i i 1 R . m
projM x x AT AAT
1
m
Довести, що для всіх
Ax ,
xM
де A – матриця з рядками
ai R n . 7. Нехай
для всіх
8. Нехай
M x R n : i xi i , i 1, n, i i . Довести, що
, x i x M projM x i i i , xi i .
M x R n xi 0, i 1, n . Довести, що для всіх x R n
projM x max 0, xi i 1 . n
9. Для функції
et знайти многочлен p t 2-го степеня такий, що
норма e p t мінімальна в L2 1,1 . t
10. Для функції
t 3 знайти многочлен pn t n -го степеня такий, що
норма t pn t мінімальна в L2 1,1 , 3
n 0,1, 2 .
11. В просторі L2 1,1 побудувати проекцію будь-якої функції на підпростори парних і непарних функцій. 12. Розв’язати задачу
20
t 2 x t x L,
L2 0,1
inf
13. Нехай в просторі
1 де L x L2 (0,1) : x t dt 0 . 0
l2 задано точку x0 1, 0, 0, і множину
n Ln x l2 : xi 0 . Знайти d n : inf x x0 . Чому дорівнює xLn i 1
lim d n ? n
14. В просторі C 0,1
описати множину елементів найкращого
наближення x0 t 1 елементами з
L x C 0,1 : x 0 0 .
15. В просторі C 0,1
знайти відстань від x0 t t до множини
многочленів нульового ступеня.
1.3. Задачі опуклої оптимізації
Нехай X , Означення.
– лінійний простір.
Множина
MX
називається
опуклою,
якщо
x1 , x2 M 0,1 x1 1 x2 M . Означення. Мінімальна опукла множина, що містить множину M , називається опуклою оболонкою M і позначається Лема.
co M
M A A опукла
n A i xi i 1
n
i 1
i
co M .
1, i 0, xi M .
Означення. Множина K X називається конусом з вершиною в нулі, якщо
x K 0 x K . 21
Теорема (про відокремлення). Нехай X – нормований простір,
M X – замкнена, опукла підмножина X . Якщо x0 M , то існує
x X і 0 такі, що x M x x x x0 .
Теорема (про відокремлення в широкому сенсі). Нехай
dim X ,
M X – опукла, x0 M . Тоді існує x X , x 0 такий, що
x x x x0 x M . Ефективною областю визначення функції ся множина
f : X R називаєть-
dom f : x X f x . При цьому f : X R
називається власною, якщо Означення. Функція графік функції
dom f і f x x X .
f : X R називається опуклою, якщо над-
f epi f
x, x dom f , f x
– опукла
множина. Лема. Власна функція
f : X R опукла тоді і лише тоді, коли
x1 , x2 dom f 0,1 f x1 1 x2 f x1 1 f x2 . Нехай X R . Розглянемо елементарну задачу лінійного програмування n
n f x fi xi inf i 1 x 0, i 1, k i x 0, i k 1, m i xi 0, i m 1, n
22
(1)
Теорема. Допустимий x x1 , , xn – розв’язок задачі (1) тоді і лише тоді, коли 1) f i 0, i 1, k ;
f j 0, j m 1, n ;
2) f i xi 0, i 1, n . Тепер нехай X – довільний лінійний простір, A X – опукла множина,
fi : X R – опуклі функції, i 0, m . Розглянемо задачу
опуклого програмування
f 0 ( x) inf x A f i ( x) 0, i 1, m Для набору чисел
0 , 1 ,..., m
функція L ( x, )
зивається функцією Лагранжа задачі (2), а числа
(2) m
i 0
f ( x) на-
i i
0 , 1 ,..., m
–
множниками Лагранжа. Теорема (Куна-Такера). Якщо
x – розв’язок (2), то існують множ-
ники Лагранжа 0 , 1 , , m , не всі одночасно рівні нулю такі, що а) i 0, i 0, m ; б)
i fi x 0, i 1, m ;
в) min L x, L x , . x A
Якщо 0 0 , то умови а)-в) є достатніми для існування розв’язку задачі (2). Для того щоб 0 0 досить виконання умови Слейтера: таке, що f i x 0 , i 1, m .
23
x A
Приклад 1. Довести, що A X – опукла тоді і тільки тоді, коли n
i 1 ,
x1 , , xn A 1 , , n R n
i 1
n
x i 1
i
i
A.
Розв’язання. Достатність. Очевидне.
n 2 твердження вірне. Припустимо, що
Необхідність. При твердження
вірне
1 , , k R k
nk,
при k
:
k
i 1 ,
x
i 1
n k 1 . Розглянемо
k 1
i 1
тобто
i 1
i x i , де
i
i 1
A . Перевіримо для
i
k 1
x1 , , xk A
1 , i R , i 1, k 1 .
i
Перепишемо останню лінійну комбінацію: k 1
k
i 1
i 1
i x i i x i k 1 x Для коефіцієнтів
i
i x i k 1 x k 1 . i 1 1 k 1 k
k 1 (1 k 1 )
i 1 k 1
k
i 1 . Тоді за припущенням i 1
k 1
ємо, що
i 1
i
i 1, k , виконується: i R ,
, k
i
1 i 1
x i A . В результаті маk 1
xi A.
Приклад 2. Розв’язати задачу
x y inf 2 2 x y 1.
Розв’язання. Даний приклад є задачею опуклого програмування. В цьому прикладі виконується умова Слейтера: існує точка
( x, y ) A R 2 така, що x 2 y 2 1 . Функція Лагранжа має вигляд L( x, y, ) x y ( x 2 y 2 1) . Тоді за теоремою Куна-Такера розв’язок задачі характеризується наступною системою
24
0, 2 2 ( x y 1) 0, Lx 1 2 x 0, Ly 1 2 y 0. Єдиним розв’язком такої системи є x y 1 Отже, розв’язок даної задачі – x y 1
2 при 1
2.
2.
Вправи В усіх задачах, якщо не стверджується інше, X простір.
– нормований
1. Дослідити на опуклість множини в X : а) lx , y {z X : z tx (1 t ) y , t R} – пряма; б) L x {z X : z tx, t R} – промінь. 2. Знайти критерій опуклості конуса. 3. Нехай
A, B – опуклі множини в X , , R .
а) Чи будуть опуклими множини
A B , A B , A B ;
б) Чи буде опуклою множина A B в X X . 4. Нехай
L : X 1 X 2 – лінійний оператор, Ai X i – опуклі. Чи
будуть опуклими L A1 , L
1
A2 .
5. Довести, що власна функція тоді, коли для всіх n
i 1
i
f : X R є опуклою тоді і лише
x1 ,, xn dom f
n n 1 , f i xi i f xi . i 1 i 1
25
, для всіх
1 , , n Rn ,
6. Нехай X – нормований простір. Довести, що K X множина
K x X x x 0, x K є опуклим конусом в X * . 7. Довести, що в гільбертовому просторі довільна послідовність непорожніх, замкнених, обмежених, опуклих, вкладених множин має спільну точку. 8. Довести, що в банаховому просторі будь-яка послідовність непорожніх, замкнених, вкладених куль має спільну точку. Чи вірно це для довільної послідовності непорожніх, замкнених, обмежених, опуклих, вкладених множин? 9. Дослідити на опуклість функції: ( A , опукла)
0, x A, , x A;
а) f x
б) f x sup f i x , iI
sup x y ,
в) f x
yA
г) f x
inf
0, x A
fi – опуклі; x X ;
;
д) f x inf x y ; y A
е) f x
1 Ax, x a, x , X – гільбертів простір, A L X , 2
A 0. 10. Нехай
f : X R , опукла і A X – опукла. Довести, що
locmin f A globmin f A ,
причому
множина
U
x A f x inf f y – опукла. Якщо f – строго опукла y A
26
(знак " " в нерівності f можливий лише при
x 1 y f x 1 f y
0,1 ),
то
U містить не більше однієї
точки. Сформулювати достатні умови єдиності розв’язку в теоремі Куна-Такера. 11. Нехай в умовах попередньої задачі X R
n
і
f C1 – опукла.
Довести: а)
x U тоді і лише тоді, коли x A
б) для
f ' x , x x 0 ;
x int A x U тоді і лише тоді, коли f ' x 0 .
12. Нехай
f :R n R, f C2 . Довести, що f – опукла тоді і лише f x є невід’ємно визначеною для всіх
тоді, коли матриця
x Rn . 13. Нехай
f : X R – власна, опукла. Довести, що f – неперер-
вна в точці
x0 dom f тоді і лише тоді, коли f – обмежена
зверху в деякому околі точки 14. Нехай
x0 .
f : X R – власна, опукла, int dom f . Довести:
а) якщо X R , то n
f – неперервна на int dom f ;
б) якщо X – банахів простір, f – н.н.зн., то f – неперервна на
int dom f . 15. Розв’язати наступні задачі
x1 x2 x3 sup x x 5, 1 3 а) x2 x3 1, 2 x1 x2 x3 0;
3x 2 y 2 2 z 2 inf б) 2 2 2 x y z 3.
27
x 2 2 y 2 3z 2 inf 2 2 2 в) x y z 2, x 2 y 3z 1. 16. Розв’язати наступну задачу (модель споживання Стоуна)
n ( xi xi )i sup i 1 n i 1 pi xi K , xi xi , i 1, n, де
i (0;1) ,
n
px i 1
i i
K.
28
Розділ 2. Гладкі екстремальні задачі 2.1. Елементи диференціального числення в нормованих просторах. Частина 1 Нехай X , Y – нормовані простори,
F : X Y , x0 X .
Означення 1. Відображення F має в точці
x0 похідну за напрямом
h X , якщо існує F x0 th F x0 : F h, x0 Y . t 0 t lim
(1)
Означення 2. Якщо границя (1) існує для всіх h X , то F в точці
x0 має першу варіацію, а відображення h F h, x0 називають першою варіацією. Означення 3. Якщо існує x0 L X , Y такий, що F h, x0
x0 h , то відображення F називається диференційовним за Гато в точці
x0 . При цьому x0 : F x0 – похідна Гато,
F x0 , h x0 h F x0 h – диференціал Гато. Означення 4. Відображення F називається диференційовним за Фреше в точці
x0 , якщо існує x0 L X , Y такий, що
F x0 h F x0 x0 h o x0 , h , де lim h 0
o x0 , h h
0 . При
цьому F x0 : x0 – похідна Фреше, F x0 , h F x0 h – диференціал Фреше. Означення 5. Відображення F називається строго диференційовним в точці
x0 , якщо існує x0 L X , Y такий, що для всіх 29
0
існує
0 таке, що для всіх x ', x '' B x0 виконується
F x ' F x '' x0 x ' x '' x ' x '' . При цьому F ( x0 ) : x0
– строга похідна, F ( x0 , h) F x0 h – строгий диференціал. Надалі поряд з F x0 , h будемо використовувати позначення
dF x0 , h , кожен раз уточнюючи, який диференціал мається на увазі. Очевидно, що кожна з похідних, означених вище, якщо існує, то єдина. У випадку X Y R означення 3, 4 визначають один і той самий об’єкт – звичайну похідну F x0 . У випадку X R , 2
Y R це не так. Теорема. Між означеннями 1) – 5) і неперервністю F мають місце такі імплікації: а)
5) 4) 3) 2) 1) ,
б)
5) неперервність F в околі точки x0 ,
в)
4) неперервність F в точці x0 ,
причому жодна з них не може бути обернена. Лема. а) Якщо F L X , Y , то F – строго диференційовна в будь-якій точці б) Якщо
x0 X і F x0 F .
Fi : X Y , i 1, 2 – диференційовні в точці x0 X в
сенсі одного з означень 1) – 5), то для будь-яких браження
, R
F F1 F2 диференційовне в точці x0 в тому ж
сенсі і F x0 , h F1 x0 , h F2 x0 , h для всіх
h X .
Теорема (про диференційовність суперпозиції). Нехай нормовані
відо-
простори,
F : X Y ,
H G F : X Z . Тоді 30
G :Y Z ,
X , Y, Z –
F x0 y0
і
G – диференційовна за Фреше в точці y0 , F – диферен-
1) Якщо
ційована (в сенсі будь-якого з означень 1 – 4) в точці – диференційовна в точці
x0 в тому ж сенсі, що і F , при цьому
H x0 , h G y0 F x0 , h 2) Якщо
.
(2)
G – строго диференційовна в точці y0 , F – строго
диференційовна в точці точці
x0 , то H
x0 , то H – строго диференційовна в
x0 і має місце формула (2).
Приклад 1.
Дослідити
на
диференційовність
відображення
f : C[0;1] R , f ( x()) x(0) . Розв’язання. Перевіримо спочатку диференційовність за Фреше. Розглянемо вираз
f ( x h) f ( x ) :
f ( x h) f ( x) x(0) h(0) x(0) h(0) .
x [h] h(0) визначає x як лінійний неперервний
Рівність
оператор з
C[0;1] в R . Покладаючи o( x, h) 0 , маємо, що f ( x) є
диференційовним за Фреше і диференціал Фреше –
df ( x, h) h(0)
. Перевіримо строгу диференційовність відображення вираз
f . Розглянемо
f x ' f x '' x x ' x '' , в якому лінійний неперервний
оператор
x , якщо існує, то співпадає з похідною Фреше
відображення
f:
f x ' f x '' x x ' x '' x '(0) x ''(0) ( x '(0) x ''(0)) 0 x ' x '' . Звідси можна зробити висновок, що
f ( x) є строго диферен-
ційовним відображенням. Приклад 2. Знайти похідну Фреше відображення 31
f : C[0;1] R ,
f ( x( )) sin x(0) . Розв’язання. Для знаходження похідної скористаємось теоремою про диференційовність суперпозиції. Представимо відображення у
вигляді
суперпозиції
f ( x()) g (u ( x())) , де
f
g :R R ,
g ( p) sin p , u : C[0;1] R , u ( x()) x(0) . Відображення g є скалярною диференційовною функцією, а отже, диференційовною за Фреше і, при цьому,
dg ( p) cos p dp . Відображення u є дифе-
ренційовним за Фреше за попереднім прикладом і диференціал цього відображення –
du ( x, h) h(0) . Отже, за теоремою про f
диференційовність суперпозиції маємо, що відображення диференційовним
за
Фреше
і
диференціал
Фреше
є –
df ( x, h) cos x(0) h(0) , а похідна – f ( x) cos x(0) , де – функція стрибку така, що дорівнює 0 при x 0 і дорівнює 1 при
x0. Вправи 1. f : R R , f ( f1 ,..., f m ), f i C , i 1, m . Довести, що n
–
1
m
строго
xf1 1 f ( x) fm x1
диференційовна
. fxmn
в
будь-якій
точці
х
f і
f1 xn
Знайти
f ( x0 )
у
випадку,
коли
f : R 2 R 2 , f ( x1 , x2 ) ( x1 x2 , x12 x2 2 ) , x0 1, 2 . 2. Показати, що функція
f : R 2 R , яка задана співвідношенням
1, y x 2 , x 0, f ( x, y ) 0, інакше, в точці
(0, 0) має похідну Гато f (0, 0) 0 , але не диференці32
йовна за Фреше. 3. Дослідити на диференційовність:
а) F : C[0;1] R, F x x 0 ; б) F : C[0;1] R, F x x (1) ; 2
в) F : C [0;1] C[0;1], F x x ; 1
г) f : C[t0 , t1 ] R,
f x x t0 , x t1 , де C 1 (R 2 ) ; t1
1
д) f : C [t0 , t1 ] R,
f x L t , x t , x t dt , t0
де L – неперервна по першій змінній і неперервно диференційовна по сукупності інших змінних. 4. Нехай H – дійсний гільбертів простір, F x x . Довести, що
F – диференційована за Фреше при x 0 і F x
x . x
5. Нехай H – дійсний гільбертів простір, A L H , H ,
R . F x
Дослідити на диференційовність та знайти похідну
1 ( Ax, x) (a, x) . 2
6. Знайти похідні Фреше наступних відображень: а)
aH ,
F : C[0;1] R, F x e x0 ;
1
x t sin t dt ;
б) F : L 2 [0;1] R, F x
0
1
x t dt ;
в) F : L 2 [0;1] R, F x
2
0
33
г) F : C[0;1] R, F x x 0 x 1 ; 2
1 д) F : L2 [0;1] R, F x x t dt ; 0
е) F : C[0;1] C[0;1], F x ln x (t ) . 2
7. Знайти похідні Фреше наступних відображень у вказаних точках
x0 і представити їх в канонічному вигляді:
а) F : C[0;1] R, F x x
2
12 ,
x0 t t 1; 2
1 б) F : C[0;1] R, F x x t dt , x0 t t 1. 0 Вказівка: для знаходження канонічного вигляду скористатись теоремою Рісса про загальний вигляд лінійного неперервного функціонала в
C[0;1] .
8. Довести, що функція задається
f : R 2 R , що в полярних координатах f x r cos 3
співвідношенням
( x x1 , x2
r cos , r sin ) має в точці 0, 0 першу варіацію, але не диференційовна за Гато. 9. Вказати точки, в яких функція
f : R n R не диференційовна за
Фреше:
12
xi ; i 1
а) f x
n
б) f x max xi ;
i 1, n
в) f x
n
x i 1
i
.
10. Нехай D 0,1 0,1 r , r , функція K t , s, x C D така, що
K x C D . Довести, що оператор Урисона 34
Ax t
K t , s, x s ds діє з Br 0 C[0,1] в C[0;1] і знайти його 1
0
похідну в кожній точці x Br 0 .
2.2. Елементи диференціального числення в нормованих просторах. Частина 2
Нехай X – нормований простір, a, b X . Відрізком a, b в X будемо називати наступну множину
a, b : x X Теорема
(Лагранжа
для
x a t b a , t 0,1 . скалярнозначних
функцій).
Нехай
F : X R , F C a, b , F – диференційовна за Гато на
a, b . Тоді існує c a, b таке, що F b F a FГ c b a . Теорема Лагранжа для вектор-функцій, взагалі кажучи, місця не має. Натомість виконується наступна Теорема (Лагранжа). Нехай
відкрита, a, b U . Якщо
X , Y – нормовані простори, U X –
F : U Y – диференційована за Гато
в кожній точці x a , b , то F b F a sup Наслідок
1.
Нехай
c a ,b
виконані
умови
теореми
L X ,Y .
FГ c b a . Лагранжа
і
Тоді
F b F a b a sup FГ c b a . c a ,b
Наслідок 2. Нехай X , Y – нормовані простори, точки
x0 X , U – окіл
x0 , F : X Y – диференційовна за Гато в кожній точці
x U . Якщо відображення x F x неперервне (в нормі
35
простору L X , Y ) в точці точці
x0 , то F – строго диференційовна в
x0 .
Нехай тепер
F : X R – диференційовне за Фреше (Гато) на
X відображення. Тоді коректно означеним є відображення
X э x F x X * Означення. Функціонал F в точці
(1)
x має другу похідну Фреше
(Гато), якщо відображення (1) диференційоване за Фреше (Гато) в точці x. Щодо способу знаходження F x0 , маємо наступний результат, що випливає з означення другої похідної. Лема. Якщо
F : X R – двічі диференційована за Гато в точці
x0 , то d 2 F x0 , h
d2 F x0 th . dt 2 t 0
Теорема (формула Тейлора). Якщо F : X R має в точці
x0
другу похідну Фреше, то
, h 0 .
1 F x0 h F x0 dF x0 , h d 2 F x0 , h o h 2
2
Формула Тейлора дозволяє перенести класичні результати щодо локальних екстремумів гладких функцій на гладкі функціонали. Означення. Точка
x0 доставляє локальний мінімум функціоналу
F : X R , якщо існує r 0 таке, що для всіх x Br x0
F x F x0 . Теорема (необхідні умови екстремуму першого порядку). Нехай
x0
доставляє локальний мінімум функціоналу F і існує F x0 – похідна Гато. Тоді F x0 0 .
36
Теорема (необхідні умови екстремуму другого порядку). Нехай
x0
доставляє локальний мінімум функціоналу F і існує F x0 – друга похідна Фреше. Тоді d F x0 , h 0 для всіх 2
Теорема (достатні умови екстремуму). Нехай диференційована за Фреше в точці 1) dF x0 , h 0
F : X R – двічі
x0 і виконуються умови
h X ,
2) c 0 h X Тоді точка
h X .
d 2 F x0 , h c h . 2
x0 доставляє локальний мінімум для F .
Приклад. F : H R , F x x a , де L H , H . Довести, що F двічі диференційовна за Фреше та знайти F ( x ) , F ( x ) . Розв’язання. Покажемо спочатку, що F диференційовна за Фреше та знайдемо
F ( x) . Розглянемо F ( x h) F ( x) : F ( x h) F ( x) [ x h] x h .
– лінійний неперервний оператор, то покладаючи o( x, h) 0 , маємо, що F диференційовна за Фреше і
Оскільки
dF ( x, h) h – диференціал Фреше. Похідна F ( x) в даному випадку буде
F ( x) . Тепер покажемо, що F є диферен-
ційовним за Фреше. Розглядаємо
F ( x g ) F ( x) :
F ( x g ) F ( x) 0 . Тоді F є диференційовним за Фреше і d ( F )( x, g ) 0 – диференціал Фреше відображення F . Звідси маємо, що F ( x ) 0 . Вправи В усіх задачах H – гільбертів простір, X – нормований простір.
37
1. F : H R,
F x
1 Ax, x a, x , 2
де
A LH , H ,
a H , R . Знайти F x , F x . 2. F : H R,
3.
F x
1 2 x . Знайти F x , F x . 2
F : X R і x X F x . Довести: якщо F – диференx0 , то F диференційовна за Фреше в
ційовна за Фреше в точці точці
x0 .
4. F : X R, A L X , H і
F x Ax b
2
H
,
b H . Знайти
F x , F x . 5. Нехай
Q (c, d ) (a, b) , A L2 Q , b() L2 c, d . Для всіх 2
b x() L2 (a, b) F x A s, t x t dt b s ds . Довести, ca що F – двічі диференційовна за Фреше і d
d b F x 2 A s, A s, t x t dt b s ds , c a d
F x 2 A s, t A s, ds . c
6. Нехай двічі
F : l2 R,
x2 F x n3 xn 4 . Довести, що F – n 1 n
диференційовна
за
Фреше
в
точці
x 0,
причому
dF 0, h 0 , d 2 F 0, h – додатно визначена квадратична форма, але F не має в точці
x 0 локального мінімуму. 38
7. F : C 0,1 R,
1
F x t x 2 t x 3 t dt . Довести, що 0
F – двічі диференційовна за Фреше в точці x 0, причому
dF 0, h 0 , d 2 F 0, h – додатно визначена квадратична форма, але F не має в точці
x 0 локального мінімуму.
8. Довести, що якщо dim X , то в теоремі про достатні умови локального мінімуму умову 2) можна замінити умовою додатної визначеності квадратичної форми d F 0, h . 2
9. A L( H ), A – додатно визначений оператор. Довести: а) рівняння Ax y для довільного y H має не більше одного розв’язку; б)
x – розв’язок рівняння Ax y тоді і лише тоді, коли x – розв’язок задачі F x Ax, x 2 x, y inf .
2.3. Метод Лагранжа Суть методу Лагранжа – це дослідження екстремальної задачі з обмеженнями шляхом зведення її до екстремальної задачі без обмежень. Нагадаємо, як реалізується цей принцип для скінченновимірних задач з обмеженнями типу рівностей. Розглянемо задачу X R , n
f 0 ( x) inf fi ( x) 0, i 1, m, m n. Означення. Будемо казати, що
(1)
x0 – розв’язок задачі (1), якщо x0
доставляє умовний локальний мінімум, тобто
39
fi ( x0 ) 0 , i 1, m ,
і існує
0
таке, що для всіх
x B ( x0 ) таких, що fi ( x) 0 ,
i 1, m , виконується f 0 ( x) f 0 ( x0 ) . 1 етап: складаємо функцію Лагранжа L ( x, )
m
i 0
(0 , m ) ка
0
f ( x) , де
i i
– множники Лагранжа. При цьому наявність множни-
суттєва, бо інакше схема Лагранжа може привести до хибного
результату. В задачах на мінімум слід брати максимум
0 0 ,
0 0 .
0 0 ,
в задачах на
Корисно окремо розглянути випадки
причому в останньому випадку можна покласти
0
0 0
і
довіль-
ним числом відповідного знаку. 2 етап: шукаємо стаціонарні точки функції Лагранжа з рівняння
Lx ( x, ) 0. При цьому характер екстремуму в цих точках самої функції Лагранжа для нас не має значення. Система
Lx ( x, ) 0, fi ( x) 0, i 1, m має m n рівнянь і
(2)
m n 1 невідомих, але множники Лагранжа
визначаються з точністю до числового множника, тому система (2) дає "повний" набір умов для визначення стаціонарних точок. 3 етап: шукаємо серед розв’язків (2) розв’язки (1), або доводимо, що їх не існує. Ця схема обгрунтовується рядом теорем, які наведені нижче. Зауважимо, що поза умовами цих теорем може трапитись ситуація, коли розв’язок задачі існує, але схема Лагранжа до нього не приводить. Теорема. Якщо f i C , 1
i 0, m і точка x0 – розв’язок задачі (1),
то існують множники Лагранжа рівні нулю такі, що
0 0, 1 ,, m
Lx ( x0 , ) 0 . 40
не всі одночасно
Якщо f i C , i 0, m і виконується умова: 2
вектори
fi( x0 )i 1 – ЛНЗ m
(3)
m n
f ( матриця i x0 має ранг m ), то можна отримати x j i 1 j 1 необхідні умови другого порядку і достатні умови. Розглянемо множину
P x R n : f i( x), x 0, i 1, m .
Теорема. Якщо f i C , 2
, точка
x0 – розв’язок задачі (1) і
виконується умова (3), то існують
, які одночасно
не обертаються в нуль, такі, що
,
Lxx ( x0 , ) x, x 0 x P . ( x0 , ) x, x 0 тоді і лише тоді, коли Якщо в (4) Lxx
(4)
x 0 , то
умови (3), (4) є достатніми.
x 2 y 2 z 2 inf Приклад 1. Розв’язати задачу x 2 y z 3. Розв’язання. Тут f 0 x y z , 2
ня
2
2
f1 x 2 y z 3 . Відображен-
f0 та f1 є неперервно диференційовними, f1 ( x, y, z ) (1, 2,1) .
Отже, умова (3) має місце і можемо скористатися теоремою. Складаємо функцію Лагранжа:
L 0 ( x 2 y 2 z 2 ) 1 ( x 2 y z 3) . Шукаємо стаціонарні точки функції Лагранжа з умов
Lx 20 x 1 0, Ly 20 y 21 0, Lz 20 z 1 0, x 2 y z 3. 41
(5)
З цих умов безпосередньо видно, що якщо
0 0 ,
приводить до суперечності. Тоді можемо покласти додатнім числом, наприклад,
1 0 ,
то і
0
що
будь-яким
0 1 2 . Тоді умови (5) набирають ви-
гляду
x 1 0,
y 21 0, z 1 0, x 2 y z 3.
В перших трьох з них виражаємо x, y , z через в останнє. Маємо тоді
1 2
і x0 z0
1
і підставляємо
1 , y0 1 . Таким чином, 2
визначені множники Лагранжа і знайдено критичну точку Оскільки
( x0 , y0 , z0 ) .
Lxx – одинична матриця, то виконується умова (4) і в силу
теореми точка x0 z0
1 , y0 1 є розв’язком задачі. 2
Щодо нескінченновимірних задач, то справедливі наступні теореми. Нехай
X , Y – банахові простори, F : X Y , f 0 : X R і
розглядається задача
f 0 ( x) inf F ( x) 0. Функція
(6)
L( x, 0 , y*) 0 f 0 ( x) y *( F ( x)), y* Y * називається
функцією Лагранжа задачі (6). Теорема. Якщо
x0 – розв’язок задачі (6), f0 , F – строго диферен-
ційовні в точці
x0 , Im F ( x0 ) – замкнена множина в Y , то існують
одночасно не рівні нулю множники Лагранжа
0 0 , y* Y *
що Lx x0 , 0 0 , тобто
0 f 0 x0 h y * F x0 h 0, h X . 42
такі,
Якщо, крім того,
Im F ( x0 ) Y , то 0 0 , і можна вважати
0 1 . Тепер розглянемо задачу
f 0 ( x) inf F ( x) 0, fi ( x) 0, i 1, m,
(7)
де f i : X R, i 1, m. Функція m
L( x, , y*) i fi ( x) y *( F ( x)) , i 0
де
(0 ,..., m ) R m1 , y* Y * , називається функцією Лагранжа
задачі (7),
0 , 1 ,..., m , y * – множники Лагранжа.
Теорема. Якщо x – розв’язок задачі (7), f i , F , i 0, m – строго диференційовні в точці x ,
Im F ( x ) замкнена в Y , то існують
одночасно не рівні нулю множники Лагранжа
0 , 1 ,..., m , y* Y *
такі, що 1)
i 0, i 0, m ,
2)
i fi ( x ) 0, i 1, m ,
3)
Lx ( x , , y*) 0
(
m
f ( x ) h y *( F ( x ) h) 0 , i 0
i i
h X ). Наслідок.
Нехай
X Rn , Y R p ,
F ( x) ( g1 ( x), , g p ( x)) ,
p n . Тоді якщо x – розв’язок задачі (7), fi , g j C 1 , i 0, m ,
j 1, p , то існують одночасно не рівні нулю множники Лагранжа
0 , 1 ,..., m , 1 , , p
такі, що 43
1)
i 0, i 0, m ;
2)
i fi ( x ) 0, i 1, m ; p
m
3) для функції Лагранжа
L i fi ( x) j g j ( x) i 0
Lx ( x , , )
j 1
p
m
f ( x ) i 0
i i
j 1
j
g j ( x ) 0 .
Зауваження (щодо задач з обмеженнями типу строгих нерівностей). Нехай
X , Y – банахові простори, F : X Y , fi : X R, i 0, m , f 0 ( x) inf F ( x) 0, f i ( x) 0, i 1, m.
(8)
f 0 ( x) inf F ( x) 0.
(9)
Поряд розглянемо
Нехай точці
x – розв’язок (8). Тоді якщо fi , F – строго диференційовні в
x , то x – розв’язок задачі (9), для якого fi ( x ) 0 , i 1, m .
Таким чином, випадок обмежень типу строгих нерівностей можна звести до задачі без обмежень. Вправи За допомогою методу Лагранжа розв’язати наступні задачі.
x 2 y 2 12 x 16 y inf 1. 2 2 x y 25. 2.
x y z inf 2 2 x y z 1. 44
xyz inf 2 2 2 3. x y z 1, x y z 0. 4.
x1 inf (Ілюструє суттєвість множника 0 ). 3 2 x x 0 2 1
x22 x1 inf (Ілюструє неспівпадання екстремумів функції Ла5. 3 x1 x1 0 гранжа і вихідної задачі). 6. Нехай H – гільбертів простір. Знайти найкоротшу відстань від точки
x0 H до гіперплощини H 0 x H : x , a b, a H , b R .
7.
X Y l2 , f 0 ( x) n 1
xn x x , F ( x) x1 , 2 ,...., n ,...... . Розв’яn n 2
зати задачу
f 0 ( x) inf F ( x) 0. Пояснити, чому схема Лагранжа дає невірну відповідь. 8. Довести, що квадрат найкоротшої відстані від точки бертового простору H
до
x0 гіль-
n -мірного підпростору з базисом
{x1 ,..., xn } дорівнює
x0 , x0 .......... x0 , xn x1 , x1 .......... x1 , xn ............................... : ............................... . xn , x0 ......... xn , xn xn , x1 ......... xn , xn
45
9. Знайти найбільший об’єм
n -вимірного паралелепіпеда, у якого всі
ребра мають одиничну довжину.
46
Розділ 3. Задачі класичного варіаційного числення 3.1. Найпростіша задача варіаційного числення (задача Лагранжа) Необхідні функціональні простори:
KC([t0 , t1 ]) – кусково-неперервні функції на [t0 , t1 ] , тобто непе[t0 , t1 ] функції крім, можливо, скінченої множини точок
рервні на
розриву першого роду;
KC1 ([t0 , t1 ]) – кусково-диференційовні функції на [t0 , t1 ] , тобто неперервні на
[t0 , t1 ] функції, похідні яких є кусково-неперервними;
C1 ([t0 , t1 ]) – неперервно диференційовні на [t0 , t1 ] функції. Розглянемо наступні норми:
x() 0 max x(t ) , t[ t0 ,t1 ]
Тоді
KC ([t
C ([t
1
1
0
0
, t1 ]),
, t1 ]), 1
0
x() 1 max{ x() 0 , x () 0 } .
– нормований простір (але не банахів),
– банахів простір.
Задача Лагранжа – це задача вигляду t1 J ( x ( )) t L(t , x(t ), x (t ))dt inf 0 x(t0 ) x0 , x(t1 ) x1.
Функції
(1)
x(t ) , що задовольняють умови x(t0 ) x0 , x(t1 ) x1 будемо
називати допустимими елементами задачі (1). Означення. Допустимий елемент x () KC ([t0 , t1 ]) доставляє 1
сильний локальний мінімум задачі (1), якщо існує таке
47
0,
що
для довільного допустимого елементу x () KC ([t0 , t1 ]) , для 1
якого x () x()
0
, виконується J ( x()) J ( x ()) .
Означення. Допустимий елемент
x () C1 ([t0 , t1 ]) доставляє
слабкий локальний мінімум задачі (1), якщо існує таке
0,
що
для довільного допустимого елементу x() C ([t0 , t1 ]) , для якого 1
x () x() 1 , виконується J ( x()) J ( x ()) . Очевидно, що якщо x () C ([t0 , t1 ]) доставляє сильний локаль1
x () доставляє слабкий локальний мінімум. Надалі позначатимемо L (t ) : L(t , x (t ), x (t )) .
ний мінімум, то
Теорема (про слабкий екстремум в задачі Лагранжа). Нехай ставляє слабкий локальний мінімум в задачі (1), де
x () до-
L, Lx , Lx C(U ) ,
U – відкрита множина в R 3 , причому (t , x (t ), x (t )) U для всіх
t [t0 , t1 ] . Тоді 1 1) L x () C ([t0 , t1 ]) ;
2)
x () задовольняє рівняння Ейлера:
d Lx (t ) Lx (t ) . dt
Зауваження. Розв’язки рівняння Ейлера називаються екстремалями.
J ( x) 1 ( x 2 (t ) 2 x(t ))dt inf 0 Приклад. Розв’язати задачу x(0) 0, x(1) 1. Розв’язання. Тут
L(t , x, x ) x 2 2 x . Шукаємо похідні функції L :
Lx 2 , Lx 2 x . Очевидно, що L, Lx , Lx є неперервними в будьякій відкритій множині. Складаємо рівняння Ейлера:
48
2 x 2 або
x 1 . Загальний розв’язок цього рівняння: x(t )
t2 C1t C2 . 2
Серед всіх розв’язків рівняння Ейлера вибираємо ті, що є допустимими елементами даної задачі, а саме, ті розв’язки, для яких виконуються
x(0) 0, x(1) 1 . З цих обмежень шукаємо константи
C1 , C2 і маємо C1
1 , C2 0 . Отже, маємо допустиму екстремаль 2
x (t )
t2 t . Залишилось перевірити, чи дійсно знайдена екстре2
маль
є
розв’язком
J ( x h) J ( x ) , де
задачі.
Для
h(0) 0 ,
цього
розглядаємо
вираз
h(1) 0 . Легко бачити, що
1 J ( x h) J ( x ) h 2 (t ) dt 0 . Остання нерівність означає, що 0
допустима екстремаль
x (t ) доставляє глобальний мінімум даної
задачі. Вправи Розв’язати задачі:
1 2 x (t )dt extr 1. 0 x(0) 0, x(1) 1. 1 2 ( x (t ) x(t )) dt extr 2. 0 x(0) 0, x(1) 1. 2 ( x (t ) x(t ) 4 x(t ) cos t )dt extr 3. 0 x(0) 0, x( ) 0.
49
1 2 (2tx(t ) x (t ))dt extr 4. 0 x(0) 0, x(1) 1. 1 3 x (t ) dt extr 5. 0 x(0) 0, x(1) 1.
3 2 2 2 ( x (t ) x (t ))dt extr 6. 0 x(0) 0, x 3 2 0. T 3 2 ( x (t ) x (t ))dt extr 7. 0 x(0) 0, x(T ) . T 2 2 2t ( x (t ) x (t ))e dt extr 8. 0 x(0) 0, x(T ) . T 2 2 ( x (t ) x (t ))dt extr 9. 0 x(0) 0, x(T ) 0. 10. (Приклад Гільберта) Довести, що в задачі
1 t 2 3 x 2 (t )dt inf 0 x(0) 0, x(1) 1 екстремаль існує, єдина, забезпечує мінімум функціоналу, але не належить
KС1 ([0,1]) .
50
11. (Приклад Вейєрштраса) Показати, що задача
1 t 2 x 2 (t )dt inf 0 x(0) 0, x(1) 1 не має розв’язку серед допустимих кусково-гладких функцій. Знайти значення inf . 12. Знайти перші інтеграли рівняння Ейлера у випадках: а)
L L(t , x ) ;
б)
L L( x, x ) .
Знайти допустимі екстремалі:
t1 1 x 2 (t ) dt inf (задача про брахістохрону); 13. t x ( t ) 0 x(t0 ) x0 , x(t1 ) x1 ; T 2 x(t ) 1 x (t )dt inf 14. T (задача про мінімальну поверхню x(T ) x(T ) ; обертання).
3.2. Задача Больца Розглядається задача t1
J ( x()) L(t , x(t ), x (t ))dt l ( x(t0 ), x(t1 )) inf t0
(1)
Означення. Елемент x () KC ([t0 , t1 ]) доставляє сильний ло1
кальний мінімум задачі (1), якщо існує таке
0,
вільного елементу x () KC ([t0 , t1 ]) , для якого 1
виконується
J ( x()) J ( x ()) . 51
що для до-
x () x() 0 ,
Означення. Елемент x () C ([t0 , t1 ]) доставляє слабкий локаль1
ний мінімум задачі (1), якщо існує таке
0,
елементу x() C ([t0 , t1 ]) , для якого 1
ється
що для довільного
x () x() 1 , викону-
J ( x()) J ( x ()) .
Теорема (про слабкий екстремум в задачі Больца). Нехай доставляє
слабкий
локальний
мінімум
задачі
(1),
x ()
функції
L, Lx , Lx C(U ) , l C (V ) , де U – відкрита множина в R 3 , V – 1
відкрита
множина
в
R2 ,
причому
для
всіх
t [t0 , t1 ]
(t , x (t ), x (t )) U , ( x (t0 ), x (t1 )) V . Тоді 1 1) L x () C ([t0 , t1 ]) ;
d Lx (t ) Lx (t ) ; dt
2)
x () задовольняє рівняння Ейлера:
3)
x () задовольняє умови трансверсальності: Lx (t0 ) lx0 , Lx (t1 ) lx1 .
Приклад. Розв’язати задачу 1
2 ( x (t ) x(t )) dt 0
Розв’язання. В цій задачі
x 2 (1) extr . 2
L(t , x, x ) x 2 x , Lx 1 , Lx 2 x ,
l x 2 (1) 2 . Очевидно, що L, Lx , Lx неперервні в будь-якій відкри3
l неперервно диференційовна в будь-якій відкритій 1 2 x . Загальний розв’язок рівобласті R . Рівняння Ейлера – 2
тій області R і
няння Ейлера: x (t )
t 2 C1t C2 . Серед всіх розв’язків рівняння 4
Ейлера шукаємо ті, що задовольняють умови трансверсальності:
52
1 Lx (1) lx (1) : 1 2C1 C1 C2 . 4 5 З останніх рівностей маємо, що C1 0 , C2 . Отже, єдина 4
Lx (0) lx(0) : 2C1 0 ;
5 t2 . Для перевірки того, чи є x (t ) 4 складемо різницю J ( x h) J ( x ) , де
допустима екстремаль x (t ) розв’язком
задачі,
1
h C1 ([0,1]) . Маємо J ( x h) J ( x ) h 2 (t ) dt 0
всіх
h C ([0,1]) . Отже, x (t ) доставляє глобальний мінімум даної 1
задачі. Вправи Розв’язати задачі: 1
1.
( x
2
(t ) x(t )) dt x 2 (1) extr .
0
1
2.
x
2
(t ) dt 4 x 2 (0) 5 x 2 (1) extr .
0
1
3.
( x
2
(t ) x 2 (t )) dt 2sh1 x(1) extr .
0
2
4.
t
2
x 2 (t )dt 2 x(1) x 2 (2) extr .
1
5.
x 2 (t ) x(t ) 1 2 2 0 2 dt x (0) 2 x ( ) extr . 1
6.
h 2 (1) 0 для 2
( x
2
(t ) 2 x(t )) dt extr .
0
53
7.
( x
2
(t ) x 2 (t ) 4 x(t ) sin t ) dt 2 x 2 (0) 2 x( ) x 2 ( ) extr .
0
2
( x
8.
2
0
(t ) x 2 (t )) dt x 2 (0) x 2 ( ) 4 x( ) extr . 2 2
e
9.
2 x (t )(tx (t ) x(t ))dt 3x (1) x (e) 4 x(e) extr . 2
2
1
T
10.
( x
2
(t ) x 2 (t )) dt x 2 (T ) extr .
0
Знайти допустимі екстремалі: 3
11.
4 x
2
(t ) x 2 (t ) dt x 4 (0) 8 x(3) extr .
x (t )
x 2 (t )dt 4e x (0) 32e x (1) extr .
0
1
12.
e 0
3.3. Ізопериметрична задача Розглядається задача t1 J ( x ( )) f 0 (t , x(t ), x (t ))dt inf 0 t0 x(t0 ) x0 , x(t1 ) x1 t1 J ( x()) f (t , x(t ), x (t ))dt , i 1, m i i i t0
Функція
(1)
x() називається допустимою в задачі (1), якщо
x(t0 ) x0 , x(t1 ) x1 , J i ( x()) i , i 1, m . З урахуванням цього
54
уточнення аналогічно до задачі Лагранжа переписуються означення слабкого і сильного локального мінімуму задачі (1). Теорема (про слабкий екстремум в ізопериметричній задачі). Нехай
x () доставляє слабкий локальний мінімум задачі (1), функції
fi , fi x , fi x C(U ) , i 0, m , де U – відкрита множина в R 3 , причому для всіх Лагранжа
t [t0 , t1 ] (t , x (t ), x (t )) U . Тоді існують множники
0 , 1 ,..., m , не всі одночасно рівні нулю і такі, що
1 1) L x () C ([t0 , t1 ]) , де L(t , x, x )
m
f (t , x, x ) ; i 0
2) x () задовольняє рівняння Ейлера
i i
d Lx (t ) Lx (t ) . dt
Зауваження. Як і в загальній схемі Лагранжа, тут слід розглянути окремо випадок
0 0 і 0 0 , причому в останньому випадку 0
можна покласти довільному додатному числу. 1 J ( x ) x 2 (t )dt extr 0 Приклад. Розв’язати задачу 1 x(0) 0, x(1) 1, x (t )dt 1. 0
Розв’язання. Тут L (t , x, x , ) 0 x 1 ( x 1) , 2
Очевидно, що
L, Lx , Lx є неперервними в будь-якій відкритій
області. Рівняння Ейлера має вигляд окремо варіанти
Lx 1 , Lx 20 x .
0 0
та
0 0 .
що приводить до протиріччя. Тоді
20 x 1 . Розглядаємо
Якщо
0 0 ,
0 0
і покладемо
цьому випадку рівняння Ейлера набирає вигляду розв’язок цього рівняння
x(t )
1t 2 2 55
то маємо
1 0 ,
0 1 2 .
В
x 1 і загальний
C1t C2 . Серед всіх розв’язків
рівняння Ейлера шукаємо ті, що є допустимими елементами. З рівності
x(0) 0 маємо C2 0 , з двох останніх обмежень задачі –
1 2C1 2 визначили екстремаль
та
1 3C1 6 .
множники
Тоді
Лагранжа
і
C1 4 ,
знайшли
0
допустиму
x (t ) 3t 4t . Тепер перевіряємо, чи доставляє
розглядаємо вираз
єдину
Отже,
2
знайдена екстремаль мінімум функціоналу
1
1 6 .
J ( x) . Для цього
J ( x h) J ( x ) , в якому h(0) h(1) 0 і
1 h(t )dt 0 . Легко бачити, що J ( x h) J ( x ) h 2 (t ) dt 0 .
Тоді
0
x (t ) є розв’язком задачі і доставляє глобальний мінімум
функціоналу
J ( x) . Вправи
1 2 x (t )dt extr 0 1. x (0) 0, x (1) 1, 1 x(t )dt 0. 0
1 2 x (t )dt extr 0 2. x (0) 4, x (1) 4, 1 tx(t )dt 0. 0
x(t ) sin tdt extr 0 3. x (0) 0, x ( ) , x 2 (t )dt 3 . 0 2
1 2 x (t )dt extr 0 4. x (0) 2e 1, x (1) 2, 1 x(t )e t dt e. 0
56
2 x (t )dt extr 0 x(0) 2, x( ) 0, 5. x(t ) cos tdt 2 , 0 x(t ) sin tdt 2. 0
1 2 2 ( x (t ) x (t ))dt extr 0 6. x (0) 0, x (1) e, 1 2 x(t )et dt e 1 . 0 4
T x(t )dt extr T 7. x( T ) x (T ) 0, T 1 x 2 (t )dt . T
T 2 x(t ) 1 x (t )dt extr T 8. x ( T ) x (T ) 0, T 1 x 2 (t )dt . T
3.4. Задачі зі старшими похідними і векторні задачі Задача Лагранжа зі старшими похідними – це задача вигляду t1 (n) J ( x()) L(t , x(t ), x(t ),..., x (t ))dt inf (1) t0 (k ) (k ) x (t0 ) x0 k , x (t1 ) x1k , k 0, n 1. Функція x() називається допустимою в задачі (1), якщо
x ( k ) (t0 ) x0 k , x ( k ) (t1 ) x1k , k 0, n 1 . Тоді відносно норми простору C
(n)
n
([t0 , t1 ]) аналогічно до задачі Лагранжа означаються
сильний і слабкий локальний мінімуми задачі (1). Теорема. Нехай
x () доставляє слабкий локальний мінімум в зада-
чі (1), L, Lx( k ) C(U ) , k 0, n , де причому
U – відкрита множина в R n 2 ,
(t , x (t ), x(t ),..., x ( n ) (t )) U для всіх t [t0 , t1 ] Тоді x () за57
довольняє рівняння
d d d Lx( n ) Lx( n1) Lx( n2) Lx 0 . dt dt dt
Якщо для всіх k 0, n L x( k ) C ([t0 , t1 ]) , то x () задовольняє k
dk L ( k ) (t ) 0 . рівняння Ейлера–Пуасона ( 1) dt k x k 0 n
k
Приклад 1. Розв’язати задачу
J ( x) 1 ( 0 x(t ) 24tx(t ))dt extr x(0) x (0) 0, x(1) 1 5, x (1) 1. Розв’язання. Це задача Лагранжа зі старшими похідними. Тут
L(t , x, x, x) x 2 24tx , Lx 24t , Lx 0 , Lx 2 x . Рівняння Ейлера–Пуассона в даному випадку – розв’язок цього рівняння – x (t )
x (4) 12t . Загальний
t5 C1t 3 C2t 2 C3t C4 . Серед 10
всіх розв’язків рівняння Ейлера–Пуассона шукаємо ті, що є допустимими елементами задачі. З обмежень задачі маємо C1
3 , 10
1 C2 , C3 C4 0 . Таким чином, єдина допустима екстремаль 5 1 5 – x (t ) (t 3t 3 2t 2 ) . Перевіримо чи доставляє x (t ) екстре10 мум функціонала J ( x ) . Розглядаємо вираз J ( x h) J ( x ) , в якому
h(0) h(0) h(1) h(1) 0 .
Легко
бачити,
що
1 J ( x h) J ( x ) h2 (t ) dt 0 . Отже, x (t ) доставляє глобальний 0
мінімум.
58
Векторна задача Лагранжа – це задача вигляду t1 J ( x ()) L(t , x1 (t ),..., xn (t ), x1 (t ),..., xn (t ))dt inf (2) t0 xi (t0 ) xi0 , xi (t1 ) xi1 , i 1, n. 0 0 1 1 Нехай x0 ( x1 ,..., xn ) , x1 ( x1 ,..., xn ) . Вектор-функція x ()
( x1 (),..., xn ()) називається допустимою в задачі (2), якщо x (t0 ) x0 , x (t1 ) x1 . Відносно норм просторів вектор-функцій аналогічно до задачі Лагранжа означається сильний і слабкий локальний мінімуми задачі (2).
Теорема. Нехай x () ( x1 (),..., xn ()) доставляє слабкий локальний мінімум в задачі (2), множина в R
2 n 1
L, Lxi , Lxi C(U ), i 1, n , де U – відкрита
, причому
(t , x (t ), x (t )) U для всіх t [t0 , t1 ] . Тоді
x () задовольняє систему рівнянь Ейлера
d Lx (t ) Lxi (t ), i 1, n . dt i Векторна задача Больца – це задача вигляду t1
J ( x1 (),..., xn ()) L(t , x1 (t ),..., xn (t ), x1 (t ),..., xn (t )) dt t0
l ( x1 (t0 ),..., xn (t0 ), x1 (t1 ),..., xn (t1 )) inf
(3)
Теорема. Нехай x () ( x1 (),..., xn ()) доставляє слабкий локальний
мінімум
в
задачі
(3),
L, Lxi , Lxi C(U ), i 1, n ,
lxi ( t0 ) , lxi (t1 ) C(V ) , де U – відкрита множина в R 2 n 1 , V – відкрита множина в R для всіх
2n
, причому (t , x (t ), x (t )) U , ( x (t0 ), x (t1 )) V
t [t0 , t1 ] . Тоді x () задовольняє: 59
d Lx (t ) Lxi (t ), i 1, n ; dt i 2) умови трансверсальності L (t ) l , L (t ) l
1) систему рівнянь Ейлера
xi
0
xi (t0 )
xi
1
xi (t1 )
, i 1, n .
Приклад 2. Розв’язати задачу 1 J ( x , y ) ( x 2 (t ) y 2 (t ) 2 x(t ) 4 y (t )) dt inf 0 x(0) y (0) 0, x(1) 1, y (1) 1.
Розв’язання. Це векторна задача Лагранжа. Тут L(t , x, y , x , y )
x 2 y 2 2 x 4 y , Lx 2 , Ly 4 , Lx 2 x , Ly 2 y . Система рівнянь Ейлера –
x(t )
x 1 , y 2 . Загальний розв’язок цієї системи –
t2 C1t C2 , y (t ) t 2 C3t C4 . Серед всіх розв’язків си2
стеми рівнянь Ейлера вибираємо ті, що є допустимими для даної задачі. Тоді з обмежень задачі маємо, що
C2 C3 C4 0 ,
C1 1 2 . Таким чином, маємо єдину допустиму екстремаль t2 t 2 , y (t ) t . Перевіримо, чи доставляє екстремаль 2 x (t ), y (t ) екстремум функціонала J ( x, y ) . Розглядаємо вираз x (t )
J ( x h1 , y h2 ) J ( x , y ) , в якому h1 (0) h1 (1) h2 (0) h2 (1) 0 . Неважко впевнитись, що 1
J ( x h1 , y h2 ) J ( x , y ) (h12 (t ) h22 (t )) dt 0 . 0
Отже,
екстремаль
функціонала
x (t ), y (t )
доставляє
глобальний
J ( x, y ) і є розв’язком даної задачі.
60
мінімум
Вправи
1 2 x (t )dt extr 0 1. x(0) 0, x(1) 1, x (0) 0, x (1) 0.
1 2 x (t ) 48 x(t ))dt extr ( 0 2. x(0) 1, x(1) 0, x (0) 4, x (1) 0.
1 2 2 x (t )dt extr (t 1) 0 3. x(0) 0, x(1) ln 2, x (0) 1, x (1) 1 2.
1 t 2 x (t )dt extr e 0 4. x(0) 0, x(1) e, x(0) 1, x (1) 2e.
2 2 2 ( x (t ) y (t ) 2 x(t ) y (t ))dt extr 5. 0 x(0) 0, x( ) 1, y (0) 0, y ( ) 1. 2 2 2 2 2 (2 x (t ) x (t ) y (t ) 2 x(t ) y (t ))dt extr 6. 0 x(0) 0, x( ) 1, y (0) 0, y ( ) 1. 1 2 ( x (t ) y (t ) 6 x(t )t 12 y (t )t )dt extr 7. 0 x(0) 0, x(1) 1, y (0) 0, y (1) 1. 1
8.
( x (t ) y (t ) x(t ) y(t ))dt x(0) y(1) x(1) y(0) extr . 0
1
9.
(x
2
(t ) y 2 (t ) 2 x (t ) y (t )) dt extr .
0
61
10.
( x (t ) y (t ) x(t ) y(t ))dt x( ) y
2
(0) extr.
0
11. Розглянемо задачу (2) з додатковим обмеженням max x (t ) A . t[ t0 ,t1 ]
Довести, що якщо
L C (R 2 n 1 ) і для всіх (t , x ) R n 1 функція
x L(t , x , x ) – опукла, то задача (2) має розв’язок в класі абсолютно неперервних функцій.
3.5. Умови Вейєрштраса, Лежандра, Якобі Розглянемо задачу Лагранжа t1 J ( x ( )) L(t , x(t ), x (t ))dt inf, t0 x(t0 ) x0 , x(t1 ) x1
(1) Теорема (необхідні умови Вейєрштраса сильного мінімуму). Нехай
x () C1 ([t0 , t1 ]) доставляє сильний локальний мінімум задачі (1),
L, Lx , Lx C(U ) , де U – відкрита множина в R 3 , причому (t , x (t ), x (t )) U
для всіх
Вейєрштраса: для всіх
t [t0 , t1 ] . Тоді виконується умова
[t0 , t1 ] ,
для всіх
R
таких, що
( , x ( ), x ( ) ) U , маємо E ( , x ( ), x ( ), x ( ) ) : L( , x ( ), x ( ) ) L( , x ( ), x ( )) Lx ( , x ( ), x ( )) 0. Лема (про спрямлення кутів). Нехай значимо
L C ([t0 , t1 ] R R) . По-
V0 x() KC1 ([t0 , t1 ]) : x(t0 ) x0 , x(t1 ) x1 , V1 x () C1 ([t0 , t1 ]) : x(t0 ) x0 , x(t1 ) x1 . 62
Тоді
inf J ( x()) inf J ( x()) .
x ( )V0
x ( )V1
З леми про спрямлення кутів випливає, що слабкий глобальний мінімум є сильним глобальним мінімумом в задачі (1). Теорема (необхідні умови слабкого мінімуму другого порядку). Нехай
x () доставляє слабкий локальний мінімум задачі (1),
Lxx , Lxx , Lxx C(U ) , U – відкрита множина в R 3 , причому (t , x (t ), x (t )) U для всіх t [t0 , t1 ] . Тоді для x () виконується: 1) рівняння Ейлера
d Lx (t ) Lx (t ) ; dt
(t ) 0 ; 2) умова Лежандра: для всіх t [t0 , t1 ] L xx 3) умова Якобі: на тобто на існує
(t0 , t1 ) немає спряжених точок до точки t0 ,
(t0 , t1 ) не існує точки t * , для якої виконується:
h() – нетривіальний розв’язок рівняння Якобі
d Lxx (t )h(t ) Lxx (t )h(t ) Lxx (t )h(t ) Lxx (t )h(t ) dt * * * такий, що h(t ) h(t ) 0 і L (t ) h (t ) 0 .
0
xx
Насправді посилені умови Лежандра і Якобі забезпечують достатні умови існування локального мінімуму. Теорема (достатні умови слабкого локального мінімуму). Нехай
x () C1 ([t0 , t1 ])
–
Lxx , Lxx C(U ) , U
допустима –
функція
відкрита
множина
задачі
(1),
Lxx ,
R 3 , причому
в
(t , x (t ), x (t )) U для всіх t [t0 , t1 ] і виконані умови: 1) x () задовольняє рівняння Ейлера: 2) виконана
посилена
умова
d Lx (t ) Lx (t ) ; dt
Лежандра: для
Lxx (t ) 0 ; 63
всіх
t [t0 , t1 ]
3) виконана посилена умова Якобі: на чок до точки Тоді
(t0 , t1 ] немає спряжених то-
t0 .
x () доставляє слабкий локальний мінімум в задачі (1).
Теорема (достатні умови сильного локального мінімуму). Нехай
x () C1 ([t0 , t1 ]) – така, що задовольняє умови попередньої теореми і для всіх
(t , x, u ), (t , x, v) U функція Вейєрштраса
E (t , x, u, v) L(t , x, v) L(t , x, u ) (v u ) Lx (t , x, u ) 0 . Тоді
x () доставляє сильний локальний мінімум в задачі (1).
Зауваження. Аналогічні теореми справедливі і для задач на максимум з відповідною заміною знаків в умовах Лежандра і Вейєрштраса.
1 2 ( x (t ) x(t )) dt extr, Приклад. Розв’язати задачу 0 x(0) 0, x(1) 1. Розв’язання. Розв’яжемо задачу, використовуючи достатні умови слабкого локального мінімуму. Тут
L(t , x, x ) x 2 x , Lx 1 ,
Lx 2 x , Lxx Lxx 0 , Lxx 2 . Очевидно, що Lxx , Lxx , Lxx є непе3
рервними в будь-якій відкритій множині з R . Складаємо рівняння
2 x 1 . Загальний розв’язок цього рівняння – x(t )
Ейлера:
t2 C1t C2 . Серед всіх розв’язків рівняння Ейлера шукаємо 4 допустимі
x (t )
функції.
(t 3) . 4
Маємо
єдину
допустиму
екстремаль
очевидно,
виконується:
2
Умова
Лежандра,
Lxx 2 0 . Залишилось перевірити посилену умова Якобі. Для цього складаємо рівняння Якобі:
64
2h h . Загальний розв’язок
рівняння Якобі – існує
точка
h(t ) A1 cos
t * (0;1]
t t A2 sin . Далі перевіряємо, чи 2 2
спряжена
до
h(0) h(t * ) 0 маємо A1 0, A2 sin то
точки
t0 0 . З умов
t* 0 . Оскільки t * (0;1] , 2
A2 0 . Отже, не існує спряжених точок t * до точки t0 0 . Таким
чином, посилена умова Якобі виконується. Тоді допустима екстремаль x (t ) доставляє слабкий локальних мінімум даної задачі. Перевіримо, чи доставляє x (t ) сильним локальним мінімумом. Для цього перевіряємо умову Вейерштраса:
(t , x, u ), (t , x, v) U
E (t , x, u, v) v 2 x (u 2 x) (v u )2u v 2 u 2 2uv 0 . Отже,
x (t ) доставляє сильний локальний мінімум даної задачі. Вправи
Застосовуючи необхідні і достатні умови, розв’язати задачі: 1. Задачі 1–9 з пункту 3.1.
1 2 ( x (t ) tx(t ))dt extr 2. 0 x(0) 0, x(1) 0. e 2 (tx (t ) 2 x(t ))dt extr 3. 1 x(1) 1, x(e) 0. e 2 (tx (t ) x(t ))dt extr 4. 1 x(1) 1, x(e) 2. 65
3 2 2 (t 1) x (t )dt extr 5. 2 x(2) 0, x(3) 1. 1 t 2 e x (t )dt extr 6. 0 x(0) 0, x(1) ln 4. 1 2 ( x (t ) x(t ) x (t ) 12tx(t ))dt extr 7. 0 x(0) 0, x(1) 0.
2 2 2 ( x (t ) x (t ) 2 x(t ))dt extr 8. 0 x(0) 0, x 0. 2 32 2 2 ( x (t ) x (t ) 2 x(t ))dt extr 9. 0 3 x(0) 0, x 0. 2 3.6. Задача з рухомими кінцями Розглядається задача t1
J ( x(), t0 , t1 ) L(t , x(t ), x (t )) dt 0 (t0 , t1 , x(t0 ), x(t1 )) inf t0
i (t0 , t1 , x(t0 ), x(t1 )) 0, i 1, m. 66
(1) (2)
Тут
t0 , t1 – не фіксовані моменти часу з заданого відрізку ;
L(t , x, x ) , i (t0 , t1 , x(t0 ), x(t1 )) , i 0, m , – задані функції. На відміну від найпростішої задачі класичного варіаційного числення та задачі Больца, в задачі (1)–(2) кінці
t0 , t1 є рухомими і тому розв’язок задачі
складається з деякої функції x (t ) та відрізку
[t0 , t1 ] , на якому ця
функція розглядається. Трійка
( x(), t0 , t1 ) називається допустимим елементом задачі
(1)–(2), якщо
x() C1 () , t0 , t1 int , t0 t1 і виконані умови (2).
Означення. Допустимий елемент
( x (), t0 , t1 ) доставляє слабкий
локальний мінімум задачі (1) – (2), якщо існує таке довільного
допустимого
( x(), t0 , t1 ) ,
елементу
t0 t0 , t1 t1 , x () x()
C1 ( )
0, для
що для якого
, виконується
J ( x(), t0 , t1 ) J ( x (), t0 , t1 ) . Правило розв’язування: 1. Складаємо функцію Лагранжа t1
m
t0
i 0
( x(), t0 , t1 , ) 0 L(t , x(t ), x (t )) dt i i (t0 , t1 , x(t0 ), x(t1 )) , де
(0 , , m ) R m 1
– множники Лагранжа.
2. Записуємо рівняння Ейлера
d 0 Lx 0 Lx . dt 3. Умови трансверсальності по x : 0 Lx (t0 ) lx (t0 ) , 0 Lx (t1 ) lx (t1 ) , де l (t0 , t1 , x (t0 ), x (t1 ))
m
(t , t , x(t ), x(t )) . i 0
i
i
0
1
67
0
1
4. Умови стаціонарності по
t0 , t1 (виписуються лише для рухомих
кінців) m
0 : L (t ) ( x (t )) 0 ; t0 i i t0 i x ( t0 ) 0 0 0 i 0
m
0 : L (t ) ( x (t )) 0 . t1 i i t1 i x ( t1 ) 0 1 1 i 0
5. Знаходимо ті розв’язки рівняння Ейлера, що є допустимими функціями для задачі (1)–(2) і задовольняють умови трансверсальності та умови стаціонарності (якщо є рухомі кінці) з ненульовим вектором множників Лагранжа
.
При цьому окремо розглядається випадки
0 0 і 0 0 . 6. Серед допустимих екстремалей знайти розв’язки задачі або показати, що їх немає. Приклад 1. Розв’язати задачу T J ( x ( ), T ) ( x 2 (t ) x(t ) 1) dt extr 0 x(0) 0.
Розв’язання. Тут
L x 2 x 1 , 0 0 , 1 x(0) , m 1 і функція
T
Лагранжа
( x 0
2
x 1) dt 1 x(0) . Записуємо необхідні умо-
0
ви: рівняння Ейлера
0 (2 x 1) 0 ;
умови трансверсальності
20 x (0) 1 , 0 x (T ) 0 ; умови стаціонарності 0 ( x 2 (T ) x(T ) 1) 0 . Якщо 0 0 , то з умов трансверсальності 1 0 , що приводить до суперечності. Тоді рівняння Ейлера –
x(t )
0 0
і покладаємо
0 1 . При цьому
x 1 2 і загальний розв’язок цього рівняння:
t2 C1t C2 . З обмежень задачі маємо, що C2 0 . З 4 68
x 2 (T ) x(T ) 1 0 знаходимо, що T 2 ,
рівностей x (T ) 0 та
C1 1 . Отже, маємо єдину допустиму екстремаль x (t )
t2 t , 4
яка розглядається на відрізку [0, 2] . Покажемо, що ця екстремаль не доставляє мінімум функціонала J x (), T . Дійсно, для функції
x (t )
(T 2)3 4 t2 t J x(), T . При T близьких до T 2 6 3 4
значення функціонала J x (), T можуть бути як менше, так і
більше за J x (), T . Візьмемо послідовність пар
xn (t ) t , Tn n .
Тоді J xn (), Tn при n . Отже, інфімум функціонала
J x (), T дорівнює . Легко побачити, що sup J x (), T . 1 2 J ( x()) x (t ) dt x(1) extr Приклад 2. Розв’язати задачу 0 x(0) 1.
Розв’язання. Тут L x , 2
1
Лагранжа
x 0
2
0 x(1) , 1 x(0) 1 , m 1
і функція
(t ) dt 0 x(1) 1 x(0) 1 . Записуємо рівнян-
0
ня Ейлера та умови трансверсальності:
20 x (1) 0 . Оскільки
0 0 ,
розв’язок рівняння Ейлера –
20 x 0 , 20 x (0) 1 ,
покладаємо
0 1 2 .
Тоді
x(t ) C1t C2 . З умов транс-
версальності та обмежень задачі
1 C1 1 2 , C2 1 .
Отже,
t x (t ) 1 . Покажемо, що x (t ) 2 доставляє мінімум функціонала J ( x()) . Розглядаємо вираз маємо допустиму екстремаль
69
J ( x h) J ( x ) ,
де
h(0) 0 .
Легко
бачити,
що
1
J ( x h) J ( x ) h 2 (t ) dt 0 . Отже, x (t ) доставляє глобальний 0
мінімум даної задачі. Вправи Знайти допустимі екстремалі:
2 x (t )dt extr 1. 0 x(0) 0, T x(T ) 1 0.
T 2 x (t )dt extr 0 2. x(0) 0, 2 (T 1) x (T ) 2 0.
T 3 x (t )dt extr, 3. 0 x(0) 0, T x(T ) 1.
T 2 ( x (t ) x(t ))dt extr 4. 0 x(0) 0, x(T ) .
T 2 ( x (t ) x(t ))dt extr 5. 0 x(0) 0, x(T ) T .
T 2 2 ( x (t ) x (t ))dt extr 6. 0 x(0) 0, x(T ) 1.
T
70
Задачі оптимального керування. Приклади задач оптимального керування В даному розділі ми розглянемо задачу оптимізації, яку будемо називати "задачею оптимального керування". В 50-х роках минулого століття при розв’язуванні космічних задач інженери зіткнулися з задачею керування, що описується за допомогою системи диференціальних рівнянь. Для багатьох задач такого вигляду природно виникло бажання знайти таке керування, що мінімізує заданий критерій. З розвитком обчислювальної техніки з’явилася можливість обчислювати оптимальне керування, а також забезпечувати роботу системи в оптимальному режимі, і теорія знайшла широке застосування в багатьох областях. Наведемо приклади таких задач. 1. Задача про оптимальну швидкодію. Візок рухається прямолінійно без тертя по горизонтальних рейках під дією зовнішньої сили, яку можна змінювати в заданих межах. Потрібно зупинити візок в заданому місці за найкоротший час. Формалізуємо дану задачу. Оскільки візок рухається по горизонтальних рейках, то положення візка в момент часу t характеризується однією координатою
X t (якщо одномірну систему
координат прив’язати до горизонтальних рейок з додатнім напрямком, що співпадає з напрямком руху візка). Нехай маса візка рівна
m , початкову координату будемо вважати нульовою (за
рахунок вибору початку координат), тобто X 0 0 , початкову швидкість –
v0 . Зовнішню силу (силу тяги) позначимо u . Згідно
другого закону Ньютона будемо мати
mX (t ) u (t ) . Це є закон руху, що описується диференціальним рівнянням. Обмеження на величину тяги запишемо у вигляді u1 u t u2 , де
u1 , u2 – задані числа (визначаються реальною задачею). З умов 71
також маємо, що X 0 v0 , X T X A , X T 0 (оскільки візок зупинився), де
X A – координата точки зупинки візка, T – момент
зупинки. Тоді формалізована задача має вигляд
T inf mX u, X 0 0, X 0 v0 , X T X A , X T 0, u u , u . 1 2 2. Задача про найбільшу горизонтальну дальність польоту ракети з обмеженим прискоренням. Знайти керування тягою двигунів ракети, що максимізує горизонтальну дальність її польоту за умови, що значення тяги не може перевищувати деяку задану величину і пропорційне швидкості витрати маси палива. Нехай траєкторія польоту ракети лежить в одній вертикальній площині. Позначимо через x t , y t декартові координати ракети в вибраній системі, вважаючи, що початок координат співпадає з
OY – протилежно направлена силі тяжіння (вертикально вгору), OX – початковим положенням ракети в нульовий момент часу, вісь
перпендикулярна
OY і направлена в сторону польоту ракети, v1 , v2
– проекції вектора швидкості на осі координат ( v1 t x t ,
v2 t y t ), m t – маса ракети з паливом, u1 t , u2 t – компоненти одиничного вектора тяги ( u1 t cos t , u2 t sin t , де
t
– кут між вектором тяги і віссю
OX ), u3 t – швидкість
t u3 t ). зменшення маси ракети ( m Положення ракети в момент t описується вектором станів, або фазовим вектором
x t , y t , v t , v t , m t . 1
72
2
Керуючий про-
цес – вектор тяги двигуна u t u1 t , u2 t , u3 t ,
C – коефі-
цієнт пропорційності величини тяги. Тоді, згідно другого закону Ньютона, будемо мати закон руху ракети:
x v1 t ; y v2 t ; d m t v1 t Cu3u1 ; dt d m t v2 t Cu3u2 mg ; dt m u3 . Обмеження на керування мають вигляд
u12 u22 1 , 0 u3 u3max . В початковий момент часу ракета була в положенні
x 0 y 0 0,
x 0 v1 ,
y 0 v2 , m 0 m0 ,
в кінцевий (фіксований) момент часу, повинні виконуватись умови
y t1 y1 , m t1 m1 , а функціонал t1
I v1 t dt x t1 0
має досягти максимального значення. Таким чином, формалізована задача полягає в наступному: серед всіх допустимих керувань, що задовольняють обмеження
u12 u22 1 , 0 u3 u3max , знайти таке керування, рухаючись за яким по закону
x v1 (t ) , y v2 (t ) , 73
d m(t )v1 (t ) Cu3u1 , dt d m(t )v2 (t ) Cu3u2 mg , dt m u3 x 0 y 0 0 , x 0 v1 , y 0 v2 ,
з крайовими умовами
m 0 m0 , y t1 y1 , m t1 m1 , максимізувати функціонал t1
I v1 t dt x t1 sup . 0
3. Задача про м’яку посадку космічного корабля на поверхню Місяця з мінімальними витратами пального. Для формулювання спрощеного варіанту цієї задачі введемо позначення: m t – маса корабля, h t – висота, v t – вертикальна швидкість корабля над Місяцем (поблизу Місяця), а u t – тяга двигуна корабля. Через M позначимо масу корабля без палива, та
h0
v0 – початкову висоту і вертикальну швидкість відповідно, F –
початковий запас палива, через розвинути двигун, через
– максимальну тягу, яку може
k – деяку сталу (коефіцієнт пропорційно-
сті), а через g – гравітаційне прискорення Місяця. Можна припустити, що g стала біля поверхні Місяця. Аналогічно попередній задачі, рівняння руху корабля мають вигляд
h v, u v g , m m ku (вісь координат ми направили в сторону, протилежну силі гравітації).
74
В цій задачі сила тяги u t двигуна корабля є керуванням, з обмеженням 0 u t . Природно припустити, що початковий момент часу
t0 0 , а кінцевий момент t1 рівний моменту часу, в
який корабель вперше досягає Місяця. Момент
t1 буде знайдений в
процесі розв’язування задачі (спочатку невідомий). Крайові умови мають вигляд:
h 0 h0 , v 0 v0 , m 0 M F , h t1 0 , v t1 0 . Дві останні умови – це умови м’якої посадки. Задача керування полягає в максимізації функціоналу m t1 sup . 4. Модель Рамсея для односекторної економіки. Припускається, що темп росту виробництва y t економіки і капітал K t
зв’язані за допомогою виробничої функції y t F K t . Норма
споживання c t пропорційна функції G K t
капіталу з множ-
ником u t , тобто
c t u t G K t , де 0 u t 1 . Тоді темп зміни капіталу рівний
K t F K t u t G K t .
(1)
Нехай H c – функція корисності, яка представляє корисність системи при нормі споживання
c . Критерій функціонування економіч-
ної системи задається інтегралом від функції корисності t1
H u t G K t dt .
(2)
t0
Задача полягає в знаходженні тієї частини u t , що використовується на споживання і при якій капітал, що задовольняє рів-
75
няння (1), змінюється від початкового значення K t0 K 0 до бажаного значення K t1 K , а інтеграл (2) досягає максимуму. 5. Найпростіша задача варіаційного числення. Найпростішу задачу варіаційного числення, розглянуту раніше, можна переписати у вигляді задачі оптимального керування. А саме, введемо керування x t u t , і нову фазову змінну
t
y t L s, x( s), u ( s) ds. t0
Тоді отримаємо систему диференціальних рівнянь
x u y L t , x, u з крайовими умовами x t0 x0 , x t1 x1 , y t0 0 , керуванням
u R1 і умовою мінімізації функціоналу t1
y (t1 ) L t , x(t ), u (t ) dt inf . t0
Як видно з наведених прикладів функціонали, що досліджуються на екстремум, аналогічні функціоналам із класичного варіаційного числення, тобто є або функціоналами Лагранжа, або Больца, або Майєра. Проте, між задачами варіаційного числення і задачами оптимального керування є суттєва відмінність. В задачах оптимального керування керування приймає значення із замкнутої множини (приклади 1–4), тоді як в задачах варіаційного числення керування (якщо його ввести) приймає значення з відкритої множини (приклад 5). Виявилося, що дана відмінність викликає принципові труднощі при розв’язуванні задач оптимального керування, і методами класичного варіаційного числення дані задачі, взагалі кажучи, розв’язати не можливо. Останнє зумовило пошук нових методів їх розв’язання. На відміну від задач варіаційного числення, основні методи розв’язання яких були відомі ще в XVIII ст., задачі оптимального керування навчилися розв’язувати порівняно 76
нещодавно, в 50-х роках минулого століття. На даний час є два, отриманих майже одночасно, методи розв’язання таких задач. Це принцип максимуму Понтрягіна, розроблений групою тоді ще радянських математиків під керівництвом Л.С. Понтрягіна і метод динамічного програмування Р. Беллмана, отриманий групою американських математиків під керівництвом Р. Беллмана. Це два різні методи. Один з іншого, взагалі кажучи, не випливає. Якщо для керування детермінованими системами основним математичним апаратом є принцип максимуму Понтрягіна, то для стохастичних систем основним методом є метод динамічного програмування Беллмана. Ці два методи і розглядаються в даному навчальному посібнику.
77
Постановка задачі оптимального керування Основним елементом будь-якої задачі оптимального керування є керований об'єкт, еволюція якого в просторі R стемою диференціальних рівнянь
n
описується си-
dx x f t , x, u , dt
(1)
x R n , u R m . При цьому вектор x(t ) x1 (t ),..., xn (t )
де t R ,
називається вектором станів, або фазовим вектором. В систему (1)
u входить як параметр, що приймає свої значення в деякій замкненій підмножині U R . m
V – множина кусково-неперервних функцій u t зі зна-
Нехай ченнями в
U , причому кожна функція u t визначена на деякому
інтервалі t0 , t1 , який може бути різним для різних елементів з
V,в
точках розриву функцію u t будемо вважати неперервною справа. Функцію u t , що належить тор-функції
V , назвемо керуванням. Відносно век-
f : R R n U R n будемо вважати, що вона задо-
вольняє умови існування і єдиності розв’язку задачі Коші при всіх початкових даних, що будуть зустрічатися в подальшому. Як правило будемо вважати функцію f вимірною за сукупністю змінних і такою, що має неперервні похідні по Таким чином, підставляючи замість
x.
u в (1) функції з V , будемо
отримувати різні системи диференціальних рівнянь, а відтак і різні закони еволюції об'єкта. Отже, функцією u t ми можемо керувати еволюцією об’єкта. Задача оптимального керування полягає в тому, щоб знайти таке керування, при якому виконуються деякі обмеження і мінімі-
78
зується певний функціонал. Вигляд обмежень і функціоналів визначається умовами реальних задач. Загальна постановка, яку ми будемо розглядати, наступна. В
просторі KC , R 1
n
KC ,U R
2
розглядається задача:
B0 x t , u t , t0 , t1 inf
(2)
x f t , x, u ,
(3)
u t U , t t0 , t1 ,
(4)
Bi x t , u t , t0 , t1 0,
i 1,..., m,
(5)
Bi x t , u t , t1 , t2 0, i m 1,..., s,
(6)
t1
де
Bi x t , u t , t0 , t1 i t , x, u dt i t0 , x t0 , t1 , x t1 , t0
i 0,1,..., s . Тут – заданий скінченний відрізок, t0,t1 . Означення. Четвірка
x t , u t , t , t 0
1
називається допустимим
керованим процесом, якщо виконуються умови (3)-(6). Означення. Допустимий керований процес
x t , u t , t , t нази-
вається оптимальним (локально), якщо існує
0
0
довільного допустимого керованого процесу такого, що
1
таке, що для
x t , u t , t , t 0
1
t0 t0 , t1 t1 і x t x t для всіх
t t0 , t1 t0 , t1 виконується нерівність B0 x t , u t , t0 , t1 B0 x t , u t , t0 , t1 . Зауваження. Функціонали, що розглядаються в задачі (2)–(6), є функціоналами типу Больца, тому по аналогії з варіаційним численням, таку задачу будемо називати задачею Больца. Якщо ж функціонали будуть містити лише інтегральні, або лише термінальні члени, то задачу назвемо задачею Лагранжа або Майєра відповідно. 79
Але, на відміну від задач варіаційного числення, будь-яку задачу (2)–(6) можна звести, шляхом розширення фазового простору, до задачі Майєра. Дійсно, якщо до фазових координат
x1 , , xn
добавити ще координати x0 , i 0,..., m , закон зміни яких має i
вигляд x0 i t , x, u , то функціонали i
Bi будуть мати вигляд
Bi x0i t1 i t0 , x t0 , t1 , x t1 , тобто стануть функціоналами типу
Майєра.
При
цьому
система
розшириться за рахунок рівнянь
диференціальних
рівнянь
x i t , x, u , і з’являться i 0
додаткові обмеження x0 t0 0 , i 0,..., m . i
Отже, надалі, якщо не буде конкретно обумовлено, задачу оптимального керування будемо вважати задачею Майєра.
80
Розділ 4. Метод динамічного програмування 4.1. Принцип оптимальності Беллмана Розглядається наступна задача оптимального керування
T1 , x T1 inf x f t , x t , u t , T0 t T1 , n 1 x T0 x0 , T1 , x T1 M R , m u t U R , t T0 , T1 , де
(7)
T0 – фіксований момент часу, T1 – нефіксований, що визна-
чається моментом першого попадання точки T1 , x T1
в замкнену
множину M . Задача оптимального керування полягає в тому, щоб серед всіх допустимих керувань, що переводять точку з положення T0 , x0 в множину M , знайти таке, при якому мінімізується функціонал
.
Позначимо через s , y – множину допустимих керувань, що переводять систему з положення s, y в множину M . Означення. Функція B s, y inf
us , y
T1 , x T1
називається функ-
цією Беллмана задачі (7). Якщо s , y , то будемо вважати, що B s, y . Виявляється, що знаючи функцію Беллмана можна розв’язати задачу (7). Звичайно, знайти її в явному вигляді досить складно, але можна встановити деякі її властивості, що дозволяє при певних умовах записати рівняння для її визначення. Теорема (властивості функції Беллмана). 1) Функція Беллмана задовольняє крайову умову
B s, y s, y при 81
s, y M .
2) Якщо u t T0 , x0 , а x t – інтегральна крива, що відповідає
даному керуванню, то функція Беллмана B t , x t вздовж неї
є неспадною на T0 , T1 . 3) Функція Беллмана вздовж оптимальної траєкторії стала. Відзначимо, що дані властивості функції Беллмана є необхідними умовами оптимальності. Виникає питання чи є вони і достатніми. Наступна теорема говорить, що відповідь на це питання позитивна. Теорема (Беллмана). Для того щоб керування u
t T , x 0
0
і від-
t були оптимальними, необхідно і n 1 функції z s, y : R R1 такої, що задо-
повідна інтегральна крива x достатньо існування
вольняє умови: 1) z s, y s, y при s, y M ; 2) якщо u t T0 , x0 , а x t – відповідна інтегральна крива, то
z t , x t скінчена і неспадна на T0 , T1 ;
3) z t , x
t const
на T0 , T1 .
Наслідок (принцип оптимальності Беллмана). Якщо мальне керування з T0 , x0 , а звуження керування
u – опти-
x – відповідна інтегральна крива, то
u на [t , T1 ] є оптимальним керуванням зада-
чі керування з початковими даними t , x
t , де T0 t T1 .
Природно виникає питання, як перевірити, що деяка функція є неспадною вздовж кожної траєкторії із заданої множини траєкторій? Чи можна цю перевірку звести до перевірки меншого числа умов? Крім того, виникає питання побудови класу функцій z s, y , якому
82
належить функція Беллмана. Наступні результати дадуть відповідь на ці питання.
Спочатку припустимо, що функція Беллмана B t , x C R 1
n 1
(в подальшому ми цю умову послабимо). Тоді вона задовольняє наступне нелінійне диференціальне рівняння в частинних похідних n min Bt Bxi f i t , x, u 0 uU i 1
(8)
причому мінімум в (8) досягається на правосторонній границі
u t оптимального керування в момент часу t . Рівняння (8) називається рівнянням Беллмана методу динамічного програмування. Має місце наступна теорема. Теорема (достатня умова оптимальності у формі методу динаміч-
ного програмування). Якщо B t , x C R 1
n 1
ня Беллмана таким, що B s, y s, y
є розв’язком рівнянпри
s, y M ,
а
u t T0 , x0 , x t – відповідна траєкторія така, що n
Bt t , x t Bxx fi t , x t , u t 0 ,
(9)
i 1
то u
t
– оптимальне керування.
Приклад. Для задачі
T inf x u , u 1, x 0 1, x 0 1, x T x T 0 знайти оптимальне керування через функцію Беллмана і записати рівняння Беллмана у вигляді, що не включає явно керування. Розв’язання. Перейдемо від диференціального рівняння другого порядку до системи двох рівнянь першого порядку, при цьому задача перепишеться у вигляді: 83
T inf x y, y u , x 0 1, u 1.
y 0 1, x T y T 0,
Функція Беллмана буде залежна від трьох змінних B t , x, y . Запишемо рівняння Беллмана
B B B min y u 0 . u 1 y t x Перші два доданки від u не залежать, тому маємо
(10)
B B B y min u 0 . u 1 t x y Мінімум залежить від знаку
B (він досягається при u 1 , якщо y
B B 0 , і при u 1 , якщо 0 ), тому рівняння Беллмана набуде y y вигляду
B B B y 0, t x y це і є рівняння Беллмана у формі, що явно не включає керування, а оптимальне керування через функцію Беллмана зображується у вигляді
B 1, y 0, u 1, B 0. y
(11)
Розв’язавши рівняння Беллмана, ми будемо мати явний вигляд
84
3
функції Беллмана, а відтак вкажемо області в просторі R , для яких виконуються нерівності для
B , звідки для кожної точки простору y
R 3 ми вкажемо оптимальне керування в цій точці, тобто отримаємо функцію
u u t , x, y
(12)
u* (t , x, y ) в керовану систему і розв’язавши її,
Підставивши
отримаємо, врахувавши крайові умови, відповідну оптимальну траєкторію
x x t , y y t і оптимальне керування, як
функцію від
t : u u t , x t , y t . Мінімальне значення
функціоналу визначається з умов: x
T 0,
y T 0 . Отже,
B 1, y 0, u 1, B 0 y – оптимальне керування, де B(t , x, y ) розв’язок рівняння Беллмана
B B B y 0. t x y
(13)
Зауваження. Як бачимо, основна складність таких задач полягає у розв’язанні рівняння Беллмана. В нашому випадку рівняння (13) є нелінійним диференціальним рівнянням в частинних похідних. Такі рівняння, взагалі кажучи, не розв’язуються. Проте, коли фазовий простір одномірний або задача має спеціальний вигляд, рівняння Беллмана інколи розв’язується. Тому деякі спеціальні класи задач можна в явному вигляді розв’язати методом динамічного програмування Беллмана.
85
4.2. Рівняння Беллмана задачі оптимальної швидкодії Нехай траєкторія руху керованого об’єкта в просторі R ється системою диференціальних рівнянь
n
опису-
x f x, u , де
x R n , u U R m , з виконанням для них умов загальної
постановки задачі оптимального керування. Задача оптимальної швидкодії полягає в тому, щоб визначити керування u t U R , яке переводить керований об’єкт з початm
кового положення
x0 в момент часу t0 в положення x1 за най-
менший час. Тобто розглядається наступна задача оптимального керування:
T t0 inf x f x, u , x t0 x0 , x T x1 , u U R m . Виведемо рівняння Беллмана для неї. За означенням функції Беллмана
(14)
маємо,
що
B ( , x) inf (T t0 ) , тобто це мінімальне значення функціоналу u ( t ) , x
для задачі
T t0 inf x f x, u , x x, x T x1 , u U R m .
(14а)
Але B ( , x ) inf T t0 . Зробимо в системі (14а) заміну змінної u ( t ) , x
86
s t і позначимо через Tt мінімальний час попадання розв’язку в точку
x1 в змінній t , а через Ts – той же час, але в змінній s .
Зважаючи на заміну змінної мінімальний час в змінній t досягається тоді і тільки тоді, коли досягається мінімальний час в змінній
s і при цьому Ts Tt . Але Ts залежить лише від x , тобто Ts B1 ( x) . Дійсно, провівши заміну s t , отримаємо задачу dx f ( x, u ( s )), x(0) x ds і оскільки
Ts визначається як інфімум по всім можливим керуванням,
тобто по всім кусково-неперерним функціям визначеним на R і таким, що
u ( s) U та переводять систему в положення x1 , то Ts
не залежить від Беллмана
, тобто Ts B1 ( x) . Тоді Tt B1 ( x) , а функція
для
задачі
швидкодії
набуває
вигляду
B( , x) B1 ( x) t0 , а рівняння Беллмана (8) – n min Bi, x fi ( x, u ) 1 . uU i 1
(15)
В одновимірному випадку, коли диференціальне рівняння лінійне, задачу (14) можна розв’язати, що ілюструє наступний приклад. Приклад. Розв’язати задачу оптимальної швидкодії на прямій:
T inf x ax u, a 0, x 0 x , x T 0, 0 u 1. Розв’язання. Складаємо рівняння Беллмана:
min B1 x ax u 1 u 1
87
(16)
з початковою умовою B1 0 0 . Дане рівняння переписується у вигляді axB1 x B1 x 1 . Оптимальне керування визначається співвідношенням
1, B1 x 0, u 1, B1 x 0. Оскільки функція Беллмана переходу з точки
B t , x – це мінімальний час
x в точку 0 , то функція B1 x 0 , x 0 .
Очевидно, що B1 x монотонно зростає при
x 0 і спадає при
x 0 . Отже, B1 x 0 при x 0 і B1 x 0 при x 0 . Тому рівняння Беллмана можна записати у вигляді
B1 x ax 1 1, x 0 ;
B1 x ax 1 1, x 0 .
Звідки B1 x , з урахуванням початкової умови, має вигляд
1 B1 x ln 1 a x , a
x
1 , a
(17)
а оптимальне керування –
1, x 0, u t, x 1, x 0. Оптимальну траєкторію визначаємо з рівняння
x ax sign x ,
x 0 x0 . Мінімальне значення функціоналу визначимо або з умови x
T 0 ,
мана: B 0, x0
або безпосередньо з означення функції Белл-
1 ln 1 a x0 . a
Зауваження. Як видно з (17) задача (16) методом функції Беллмана розв’язується не для всіх
x0 . Останнє пов’язано з тим, що гладкої
88
функції Беллмана для задачі оптимального керування може і не існувати.
4.3. Задача аналітичного конструювання лінійного регулятора Наступна задача оптимального керування має важливе практичне значення, оскільки використовується в техніці при розв’язанні багатьох задач конструювання. Вона має вигляд T1
J Dx T1 , x T1 F t x, x E t u , u dt inf T0
(18)
x A t x B t u. Кінці відрізка
T0 і T1 фіксовані, лівий кінець закріплений x T0 x0 ,
а правий кінець вільний
x T1 R n , обмежень на керування
u R m немає. Матриці D і F (t ) – n n -мірні, симетричні, невід’ємно визначені,
E (t ) – m m -мірна, додатно визначена матриця, A(t ) – n n
-мірна,
B(t ) – n m -мірна матриця.
Будемо вважати, що компоненти цих матриць – неперервні на
T0 , T1 функції. Така задача характерна тим, що рівняння Беллмана для неї зводиться до матричного рівняння Ріккаті. Розв’яжемо цю задачу. Функціонал, який мінімізується, є функціоналом Больца. Зведемо його до функціоналу Майєра. Для цього введемо ще одну фазову змінну
x0 наступним чином
t
x0 x0 (t ) ( F ( s ) x( s ), x( s )) ( E ( s )u ( s ), u ( s )) ds, T0
x0 (T0 ) 0. 89
(19)
Тоді розширеним фазовим вектором є
x x 0 R n 1 , а функціоx
нал набирає вигляду
J ( Dx(T1 ), x(T1 )) x0 (T1 ) : ( x (T1 )) . Будемо шукати функцію Беллмана даної задачі у вигляді
B(t , x ) x0 ( S (t ) x, x), де S (t ) – диференційовна на матриця і така, що
T0 , T1
(20)
n n -мірна, симетрична
S (T1 ) D . Матриця S (t ) визначається як
розв’язок задачі Коші
S (t ) S (t ) A(t ) AT (t ) S (t ) S (t ) B(t ) E 1 (t ) B T (t ) S (t ) F (t ), (21) S (T1 ) D, а оптимальне керування шукається за формулою
u E 1 (t ) B T (t ) S (t ) x.
(22)
Справедлива наступна теорема. Теорема. Якщо існує розв’язок задачі Коші (21), визначений на проміжку
T0 , T1 ,
то задача (18) має розв’язок, причому опти-
мальне керування у формі зворотного зв’язку задається формулою (22). При цьому функція Беллмана B(t , x ) – неперервно диференційовна і задається формулою (20). Рівняння (21) є матричним рівнянням Ріккаті, тобто рівняння Беллмана зведене до системи звичайних диференціальних рівнянь Ріккаті. Для знаходження оптимальної траєкторії отримується задача Коші для системи лінійних диференціальних рівнянь.
x (t ) A(t ) B(t ) E 1 (t ) BT (t ) S (t ) x(t ), x(T0 ) x0 .
90
(23)
Приклад 1. Розв’язати задачу оптимального керування 1 2 2 J u (t )dt x (1) inf 0 x(t ) u (t ), t [0,1], x(0) x 0
Розв’язання. Дана задача – типу (18) з D 1 ,
(24)
F 0 , E 1, A 0 ,
B 1 . Рівняння Ріккаті (21) має вигляд S (t ) S 2 (t ) 0 S (1) 1 Тому
S (t )
1 . t 2
Оптимальне керування у формі зворотного зв’язку задачі (24) набуває вигляду
x (t ) u *(t , x (t )) , t 2 де оптимальна траєкторія x *(t ) визначається як розв’язок задачі
Коші
x(t ) , x (t ) t2 x(0) x0 . Тоді
x *(t )
x0 (t 2) 2
і програмне оптимальне керування задачі (24) має вигляд
u *(t )
x0 . 2
При цьому мінімальне значення функціоналу дорівнює J * 91
x02 . 2
Зауваження. Відмова від невід’ємної визначеності матриць в (18) може призвести до того, що рівняння Ріккаті може і не мати розв’язків на
[T0 , T1 ] .
Приклад 2. 2
J ( x 2 u 2 )dt inf , x (t ) u (t ), x(0) 0. 0
Тут
D 0 , F 1 , E 1 , A 0 , B 1 . Рівняння Ріккаті має
вигляд
S (t ) S 2 (t ) 1 і його розв’язок
S (t ) tg t 2 не визначений в нулі. Виявляється, що задача про лінійний регулятор в постановці (18) завжди має розв’язок. А саме, має місце теорема. Теорема. Якщо матриці D і F (t ) невід’ємно визначені,а матриця
E (t ) додатно визначена, тоді існує розв’язок рівняння Ріккаті (21),
визначений на ,T1 , що задовольняє умову
S (T1 ) D .
4.4. Про диференційовність функції Беллмана У попередньому параграфі сформульовані достатні умови оптимальності. Однак, при отримані цих результатів ми припускали існування гладкого розв’язку B (t , x) рівняння динамічного програмування. На жаль, ця умова на B досить жорстка. Як буде показано нижче, наприклад, для задачі оптимальної швидкодії на площині вона не виконується. Раніше ми вже згадували про керування із зворотним зв’язком, або у формі зворотного зв’язку. Зараз дамо його строге означення. 92
Позначимо
Q0 ( s, y ) R n 1 : s , y . Таку множину назвемо
множиною досягнення. Означення. Будемо казати, що функція
u u (t , x) з Q0 R n 1 в
U є керуванням із зворотним зв’язком, якщо для кожної точки ( s, y ) Q0 існує єдиний розв’язок диференціального рівняння x f (t , x, u (t , x))
на інтервалі t s, T1 ( s, y )
з початковою умовою x( s, s, y ) y ,
(t , x(t , s, y )) Q0
причому
(25)
при
t s, T1 ( s, y )
і
T1 ( s, y ), x(T1 ( s, y ), s, y ) M . Якщо
керування
u* (t , x)
–
оптимальне,
то
B ( s, y )
T1 ( s, y ), x *(T1 ( s, y ), s, y ) , тому якщо гладка функція, то питання про диференційовність функції Беллмана зводиться до питання про диференційовність кінцевого моменту часу стану
T1 і кінцевого
x(T1 ) як функцій від початкових значень траєкторії. Отже має
місце теорема. Теорема. Якщо існує оптимальне керування у формі зворотного зв’язку
u* (t , x) і T1 ( s, y) , x(T1 ( s, y ), s, y ) – відповідно кінцевий
момент часу і кінцевий стан для траєкторії рівняння
x f (t , x, u *(t , x)) з початковими значеннями
( s, y ) , то функція Беллмана диферен-
ційовна в кожній точці, в якій ренційовними функціями від Якщо
T1 ( s, y) і x(T1 ( s, y ), s, y ) є дифе-
( s, y ) .
u* (t , x) є неперервною функцією, то в силу відомих тео-
рем про диференційовність розв’язків диференціальних рівнянь за
93
початковими даними функції
T1 ( s, y ) і x(T1 ( s, y ), s, y ) будуть глад-
кими функціями, а отже і функція Беллмана – гладка. Однак в багатьох прикладних задачах оптимальне керування із зворотним зв’язком може мати розриви (наприклад, в задачі швидкодії). Тоді класичні теореми про залежність розв’язків диференціальних рівнянь від параметрів не діють, а тому цей випадок потребує окремого детального розгляду. Ідея дослідження в цьому випадку полягає в тому, що припускається існування розбиття множини
Q0 на скінчену кількість глад-
ких підмножин і точки розриву керування u (t , x ) є граничними точками цих підмножин. При виконанні певних умов, розв’язки рівняння (25) для майже всіх початкових даних з околу точки
x0
будуть визначені на кожній з таких підмножин і їх можна неперервно продовжити від підмножини до підмножини до тих пір, поки вони не досягнуть множини M . При цьому розв’язки перетинаються з множиною розривів керування не більше ніж в скінченій кількості точок. Із сказаного вище випливає, що функція Беллмана є майже всюди диференційовною і рівняння Беллмана можна розуміти як таке, що n 1
справедливе майже всюди відносно міри Лебега в R . Ясно, що реалізація вказаної вище ідеї накладає досить жорсткі вимоги на постановку задачі оптимального керування, які багато прикладних задач не дозволяють. Інша ідея розв’язування оптимізаційних задач, що ґрунтується на інших принципах, не пов’язаних з функцією
B(t , x) , дозволяє розв’язувати такі задачі навіть при неди-
ференційовності функції Беллмана. Такий підхід становить суть принципу максимуму Понтрягіна, до розгляду якого ми й перейдемо в наступному розділі.
94
Вправи до розділу 4 Виразити оптимальне керування через функцію Беллмана та записати рівняння Беллмана у вигляді, що не залежить від керування. 1. T inf,
x u,
x (0) x1 ,
u 2, x(0) x0 ,
x(T ) x (T ) 0 . 2.
T inf , xu,
T
u
2
(t ) dt 1 ,
x(0) x0 ,
x (0) x1 ,
0
x(T ) x (T ) 0 . T
3. J
1 2 1 u t dt x 2 (T ) inf , 20 2
x ax bu ,
x(0) x0 .
t1
4.
J f (t , x1 (t ), x2 (t ))dt inf ,
x1 x1u x2 ,
u 1,
x2 u 2 ,
t0
x1 t0 x0 , x2 t0 x1 . t1
5.
J f (t , x1 (t ), x2 (t ))dt inf ,
u1 1 ,
u2 1 ,
t0
x1 x1u1 x2 ,
x2 u2 ,
x1 t0 x0 ,
x2 t0 x1 .
t1
6.
J ( x(t ) c)2 u 2 (t ) dt sup ,
x ax bu ,
t0
x t1 x1 . t1
7.
J f (t , x1 (t ), x2 (t ))dt inf , t0
x1 t0 x0 ,
x1 (t1 ) x2 (t0 ) 0 . 95
x1 x1u ,
x2 u 2 ,
x t0 x0 ,
Розв’язати задачі оптимального керування: T
0 , x u , x(0) x0 .
8. J u (t ) dt x (T ) inf , 2
2
0
9.
2 u 2 (t ) J tx 2 (t ) dt inf , t 1
x u ,
x 1 x0 .
3
10. J
( x(t ) tg(t ) u (t ) ctg(t ))dt inf ,
x 3 2 . 4
x u ,
4
T
xx u,
11. J u (t ) dt x (T ) inf , 2
2
x(0) 1 ,
x (0) 0 .
0
2
12.
J
u
2
x x u,
(t )dt inf ,
x(0) x ( 2) 0 ,
0
x ( 2) 1 . 1
13. J ( x (t ) u (t )) dt inf , 2
2
x x u ,
x(1) 1 .
0
f (t , x, u ) f ( x, u ) , (t , x) ( x) і
14. Нехай для задачі (7)
M t , x : t R, x M R n . Показати, що в цьому випадку функція
B(t , x) стала по t , а отже може бути записана у вигляді B( x) .
15. У найпростішій задачі варіаційного числення розглянемо мінімум функціоналу як функцію від початкових значень Нехай правий кінець
t , x 1
1
s t0 , y x0 .
закріплений і sy – клас кусково-
гладких функцій x(t ) , визначених на
s, t1 ,
що задовольняють t1
умови x( s ) y , x(t 1 ) x1 . Нехай B ( s, y ) inf s y
96
L( x(t ), x (t )) dt . s
Показати, що рівняння динамічного програмування має вигляд
Bs ( s, y ) min L( y, u ) uBy ( s, y ) 0
(а)
u
і для оптимальної траєкторії
x(t ) із s y маємо
Bs (t , x(t )) L( x(t ), x (t )) x (t ) By (t , x(t )) 0 . Показати, що якщо B C , то з (а) і (б) випливає, що 2
вольняє рівняння Ейлера 16. Нехай
(б)
x(t ) задо-
d Lx Lx . dt
x u , U u 1 , а задача полягає у переході із стану
x(0) y на множину M R n за мінімальний час. а) Показати, що автономне рівняння динамічного програмування має вигляд By ( y ) 1 , де By ( y ) – градієнт. б) При
n 2 знайти мінімальний час переходу B( y1 , y2 ) зі стану
y ( y1 , y2 ) на множину M x1 , x2 : x12 x22 1 . Де порушується диференційовність функції
B( y1 , y2 ) ? 2
в) Нехай M складається з двох паралельних прямих в R . Де порушується диференційовність функції
97
B( y1 , y2 ) ?
Розділ 5. Принцип максимуму Понтрягіна 5.1. Задача Майєра Будемо розглядати наступну задачу оптимального керування
0 ( x(T0 ), x(T1 ), T1 ) inf i ( x(T0 ), x(T1 ), T1 ) 0, i 1, m j ( x(T0 ), x(T1 ), T1 ) 0, j m 1, s x f (t , x, u ), T0 t T1 u (t ) U R m t T , T , u KC T , T , 0 1 0 1 де
(27)
T0 – фіксований момент часу, T1 – нефіксований, функції i ,
i 0, s , будемо вважати неперервно диференційовними за своїми змінними. Функції f ,
f x – кусково-неперервні за t при фіксованому
x і неперервні по x при фіксованому t . Має місце теорема. Теорема (Принцип максимуму Понтрягіна). Для того щоб допустимий процес
T1 , u (t ), x(t )
вання множників Лагранжа
був оптимальним, необхідно існу-
(0 , 1 ,..., s ) ,
які одночасно не
обертаються в нуль, і вектора (t ) (1 (t ),..., n (t ))
T
– роз-
в’язку спряженої системи T
f (t , x(t ), u (t )) x таких, що виконуються: 1)
0 , i 0 , i m 1, s ;
2) умови доповнюючої нежорсткості
i i ( x(T0 ), x(T1 ), T1 ) 0 , i m 1, s ; 98
(28)
3) умови трансверсальності , , де
– функція Лагранжа,
,
– вектори; 4) умова максимуму
max H (t , (t ), x(t ), v) H (t , (t ), x(t ), u (t )) , vU
для всіх t T0 , T1 , де n
H (t , (t ), x(t ), v) ( (t ), f (t , x(t ), v)) i (t ) fi (t , x(t ), v) i 1
– функція Понтрягіна; 5) умова оптимальності закінчення процесу (виписується, якщо
T1 нефіксоване)
L
x1
( , x(T0 ), x(T1 ), T1 ), f (T1 , x(T1 ), u(T1 )) LT1 ( , x(T0 ), x(T1 ), T1 ) 0
де
.
Для загальної задачі оптимального керування
B0 ( x, u, t0 , t1 ) inf x (t , x, u ), t T ,
B i ( x, u, t0 , t1 ) 0, i 1, m , B j ( x, u, t0 , t1 ) 0, i m 1, s ,
u (t ) U , t [t0 , t1 ] , де
99
t1
B k ( x, u, t0 , t1 ) f k (t , x(t ), u (t )) dt k (t0 , t 1 , x(t0 ), x(t 1 )) , k 0, s , t0
принцип максимуму має вигляд: Теорема. Для того щоб допустимий процес оптимальним,
необхідно
існування
був
множників
Лагранжа
, які одночасно не обертаються в нуль, і вектора таких, що виконуються умови: 1)
,
,
;
2) стаціонарності по
Lx
(рівняння Ейлера–Лагранжа)
d Lx p f x px dt
де L f p (t ) x (t , x, u ) , а
;
3) доповнюючої нежорсткості ,
;
4) трансверсальності по
Lx (t0 ) lx(t0 )
p(t0 ) lx(t0 ) ;
Lx (t1 ) lx (t 1 )
p (t1 ) lx (t 1 ) ;
s
де
l i i ; i 0
5) оптимальності по
– принцип мінімуму в формі Лагранжа
min L(t , x(t ), x (t ), v) L(t , x(t ), x (t ), u (t )) vU
100
або принцип максимуму в формі Понтрягіна (Гамільтона)
де H p (t ) (t , x, v)
s
i 0
f (t , x, v) – функція Понтрягіна;
i i
6) стаціонарність по t0 , t 1 (виписується для рухомих кінців) ,
.
Приклад 1. Розв’язати задачу 4
J ( x ()) ( x 2 x )dt inf ,
x 1 ,
.
0
Розв’язання. Ввівши керування
x u , одержуємо загальну задачу
оптимального керування
1) Запишемо умову стаціонарності по
:
p f x px : Тоді маємо
.
.
2) Запишемо умови трансверсальності:
де
p(t0 ) lx(t0 ) :
,
p (t1 ) lx( t 1 ) :
,
.
3) Записуємо умову оптимальності по
: ,
101
з якої маємо, що мінімум досягається на
Знайдене
, що має вигляд
і може бути оптимальним керуванням.
4) Знайдемо траєкторію, що відповідає в рівняння
. Підставимо знайдене
. Отримаємо
З умови
тоді
маємо, що
; а з умови рівності
маємо
. Таким чином, оптимальною
може бути траєкторія
Оскільки кінці фіксовані, то умови оптимальності закінчення процесу ми не використовуємо, як і не використовуємо умов доповнюючої нежорсткості (оскільки немає обмежень типу нерівностей). 5) Покажемо, що знайдена функція доставляє мінімум функціоналу така, що
дійсно є розв’язком і
J ( x) . Нехай h(t ) KC1 [0, 4]
допустима, тобто
і
.
Оскільки
t h(t ), t [0, 2), x (t ) h(t ) 2 1 h(t ), t [2, 4], *
то
h(t ) 0 при
. Отже,
,
102
. Тому
4
4
4
J ( x h) J ( x) (2 x*h h h 2 )dt 2 x*dh hdt *
0
0
4
4
2
0
4
4
4 1 2 x*h x*hdt hdt 2 hdt hdt hdt 0 0 2 0 0 0 0 2
Отже, пара і
є оптимальним керованим процесом. Приклад 2. Розв’язати задачу оптимального керування 2
x
, x 2 ,
2
(t ) dt 2 ,
.
0
Розв’язання. Перейдемо до функціоналів Майєра. Нова змінна і керування
x u . Тоді
, ,
,
.
Маємо систему
Запишемо спряжену систему
0 0 0 0 1 0 0 1
.
Складаємо функцію Лагранжа . Умови трансверсальності мають вигляд 103
, або
,
Нехай
, .
, тоді
,
.
Складемо функцію Понтрягіна . Знайдемо
. Якщо
, то
, то
;
. Якщо
.
При
маємо
або
, що не задовольняє обме-
ження. Тому даний випадок розв’язків не дає. Аналогічно випадок розв’язків не дає. Нехай
, можемо покласти . Якщо
, тоді
. Тому
, то максимум досягається або в
вершині параболи, тобто
, або при
. Останній варі-
ант не задовольняє обмеження. Нехай
. Підставляючи
u в систему, матимемо
З початкових умов отримаємо: , тоді
, тоді
. Отже
,а
104
.
;
Якщо
. Тоді
Якщо
і
, що не є допустимим.
, то максимум досягається або при
або
. Обидва випадки не підходять. Таким чином, маємо лише два випадки: або ,
,
або
. Перший випадок виключаємо, врахувавши умову
мінімуму функціоналу. Отже підозрілою на розв’язок є пара
,
. доставляє мінімум функціоналу J ( x ) .
Покажемо, що Нехай h KC [0, 2] і 1
ємо, що
і
,
, тому пара
– допустима. З обмежень задачі ма-
і
і
J ( x* h) J ( x* ) h(2) 0 . Отже
є оптимальним керованим процесом.
5.2. Задача оптимальної швидкодії Розглянемо наступну задачу на швидкодію
(29)
– фіксований момент часу,
– невідомий,
– фіксовані.
Така задача нам уже неодноразово зустрічалася. Застосуємо до її розв’язання принцип максимуму Понтрягіна. Функція Лагранжа має вигляд ,
105
де
,
. За попередньою теоремою
, Умова
.
оптимальності
закінчення
процесу
має
вигляд
, або . Якщо
, тоді
неможливо. Тому
,
, що
. Таким чином має місце теорема про
необхідні умови екстремуму в задачі швидкодії. Теорема (Болтянського). Для того щоб допустимий процес був оптимальним в задачі швидкодії (29) необхідно існування нетривіального розв’язку такого, що: 1) виконана умова максимуму
спряженої
системи
(28)
; 2)
.
Приклад 1. Розв’язати задачу оптимальної швидкодії
Задача полягає у переведенні фазової точки з положення в початок координат, рухаючись по траєкторіях системи, за мінімально короткий час. Розв’язання. Застосуємо принцип максимуму до цієї задачі, а саме, теорему Болтянського. Спряжена система має вигляд:
106
Звідки
,
,
– довільні сталі. Функція
Понтрягіна має вигляд , а умова максимуму – . Отже,
1, 2 (t ) 0, u (t ) 1, 2 (t ) 0, або . Звідси маємо, що будь-яке оптимальне керування кусково-сталою функцією, що приймає значення
,
є
і має не більше
двох інтервалів сталості (оскільки лінійна функція
змінює
знак не більше одного разу на відрізку [0, T ] ). В точках розриву вважаємо неперервною справа. Отже фазова точка може рухатися лише по траєкторіях систем: 1)
2)
Фазові траєкторії для першої системи мають вигляд , а розв’язки системи 1) –
; . Отже,
кусок
Рис. 2 107
фазової
траєкторії
для якої
, представляє собою дугу параболи. По цим
параболам фазові точки рухаються знизу вверх, оскільки
,
(рис. 2). Для другої системи фазові траєкторії визначаються співвідношенням
,
а
розв’язки
,
системи
рівностями
. По цим параболам фазові
точки рухаються зверху вниз, оскільки
, (див. рис. 2). Отже, якщо керування спочатку,
протягом
деякого часу, рівне 1, а потім –1, то фазова траєкторія складається із двох кусків парабол, що примикають один до іншого, причому перший лежить на тій з парабол першої системи, що проходить через початРис. 3
кову точку
( x0 , y0 ) , остан-
ній лежить на тій з парабол другої сім’ї, що проходить через початок координат (оскільки шукана траєкторія повинна приводити в початок координат) (див. рис. 2). Якщо навпаки, спочатку
, а потім
, то фазова траєкторія замінюється центрально симетричною. Лінія
, що складається з дуг
розташованої в нижній півплощині і
параболи
,
– дуги параболи
розташованої у верхній півплощині, називається лінією переключень. Саме на неї, очевидно, повинна попасти фазова точка, щоб дійти до початку координат – кінцевої точки. Таким чином, якщо фазова точка лінії
розташована вище
, то вона спочатку рухається під дією керування 108
по
дузі параболи другої сім’ї, що проходить через початкову точку, до моменту перетину з лініїю під дією керування
, а далі рухається по дузі цієї лінії
. Якщо
розташована нижче
,
то фазова точка спочатку рухається по дузі першої сім’ї під дією керування
, а далі по цій дузі під дією
, до перетину з
керування
.
Знаючи конкретні значення оптимальне керування ,
ми зможемо явно знайти *
і T . Нехай, наприклад,
,
.
З вище сказаного випливає, що спочатку ми рухаємося за керуванням
, тобто по фазових кривих другої системи
(рис. 3). Знайдемо
з умови, що парабола
проходить через
:
. Отже, це парабола
точка перетину з
. Її
знаходиться з системи
а саме, це точка
.
Знайдемо момент переключення і оптимальну траєкторію. Для цього визначимо а
і
. Маємо
. Отже,
;
,
. Тому при
,
t [0, ) , де –
момент переключення керування. Знайдемо момент попадання цього розв’язку на криву . Очевидно, що
,
рухаємося під дією керування
. Тоді
. Далі ми
. Знайдемо розв’язок, по якому
йде рух. Для цього визначимо сталі
109
і
з умов:
;
. Маємо ,
, .
,
Отже,
,
при
t [ , T ] . Значення
знаходимо з умови
:
Отже,
. Тоді
,
Зауваження. Розв’язуючи дану задачу для довільних неважко
.
записати
явний
вигляд
функціоналу
, швидкодії
, а саме,
а отже, і явний вигляд функції Беллмана цієї задачі, а саме з означення функції Беллмана маємо, що
. Тепер не-
важко вияснити питання про диференційовність функції Беллмана, яке ми піднімали раніше. Зрозуміло, що поза лінією
функція
жемо, що в жодній точці лінії неперервних похідних по
і
гладка. Пока-
функція Беллмана не має
. Дійсно, нехай
110
– точка дуги
,
– її координати так, що
точці
, причому
. В цій
. Тоді
(30)
.
З другої формули в (30) маємо
,
Отже, при підході до точки
, тобто похідної
існує і похідної
.
зверху, маємо
в точці
, а знизу
не існує. Аналогічно не
в точці
. Така ж сама ситуація має місце і в
Не дивлячись на те, що
не є диференційовною лише на
точках дуги
лінії
.
, а в решті точок гладка, всі міркування стосовно методу
динамічного програмування тут втрачають сенс. Оскільки кожна оптимальна траєкторія протягом деякого проміжку часу проходить вздовж лінії
і припущення про диференційовність функції 111
Беллмана (яке там суттєве) вздовж оптимальної траєкторії не виконується. Отже, доведення теорем не проходить. Тому великою перевагою принципу максимуму є те, що в його формулюванні ні функція Беллмана ні її похідні участі не беруть, завдяки чому він не втрачає сенсу навіть при недиференційовності функції Беллмана.
5.3. Достатні умови оптимальності у формі принципу максимуму Розглянемо наступну задачу оптимального керування:
(31) , , – фіксовані моменти часу,
, i 1, m0
– афінні,
,
i m0 1, m – опуклі, гладкі функції. Має місце теорема. Теорема
(достатні
умови
оптимальності).
допустимий процес
Для
того
був оптимальним в задачі (31),
достатньо існування множників Лагранжа
і розв’язку
спряженої системи (28) таких, що: 1) 2)
,
щоб
,
; ,
;
3) умов трансверсальності ,
112
,
де
– функція Лагранжа;
4) виконана умова максимуму . Зауваження. З опуклості задачі випливає, що
доставляє
глобальний мінімум задачі (31).
5.4. Принцип максимуму Понтрягіна та необхідні умови екстремуму в класичному варіаційному численні В даному параграфі продемонструємо як працює принцип максимуму в задачах варіаційного числення. Зокрема, всі необхідні умови мінімуму (як сильного, так і слабкого) для найпростішої задачі варіаційного числення отримаємо з принципу максимуму. Як і раніше, розглянемо найпростішу задачу варіаційного числення
(32) , з виконанням всіх умов відносно неї, що були вказані при постановці цієї задачі в першій частині посібника. Подамо цю задачу, як задачу оптимального керування типу (27)
(33) ,
, . 113
.
Нехай
– оптимальний процес.
Застосуємо до задачі (33) принцип максимуму. Спряжена система має вигляд
Тоді
, а функція Понтрягіна
.
Умова максимуму має вигляд , для всіх
t [t0 , t1 ] .
Запишемо функцію Лагранжа: . Умови трансверсальності , Якщо
,
, то
,
і з умови максимуму отримуємо, що
, а тому
, що неможливо. Покладемо
. З умови максимуму отримаємо при
для кожного
або
і
. Це є умова Лежандра. Підставляючи значення
у друге рівняння спряженої системи, отри-
маємо ра. Умова оптимальності по
, що є рівнянням Ейлепри
нерівності
114
і
приводить до
, що є нічим іншим, як умовою Вейєрштраса сильного мінімуму. Таким чином, виконані всі необхідні умови сильного локального мінімуму найпростішої задачі варіаційного числення. Раніше було показано, що умова Лежандра є і необхідною умовою слабкого мінімуму. Виведемо з принципу максимуму умову Якобі . Нагадаємо, що задача (34)
називається спряженою до задачі (32). Рівняння Ейлера для неї називається рівнянням Якобі задачі (32). Воно має вигляд (35) Точка
називається спряженою до точки
має розв’язок
, для якого
, якщо рівняння (35)
, але
.
Покажемо виконання для задачі (32) умови Якобі. Тобто, якщо доставляє слабкий локальний мінімум задачі (34), то на інтервалі
не має спряжених до
Нехай це не так і
точок.
спряжена до
точка. Тоді неважко
показати, (це було доведено раніше) що функція
поряд з
доставляє сильний локальний мінімум задачі (35).
Знову застосуємо принцип максимуму до задачі (34). Згідно нього існують множник Лагранжа і
і кусково-диференційовні функції
– розв’язки спряженої системи (
що 115
),
(36)
Міркуваннями, аналогічними наведеним вище, можна показати, що
, і можна вважати, що
. Тоді з (36) випливає, що (37)
Але для
і
внаслідок неперервності
. З іншого боку
,
що суперечить неперервності
. Отримане протиріччя і доводить
виконання умови Якобі. Зауваження. Відзначимо, при якій гладкості інтегранта і екстремалі можна довести вказані вище твердження. Рівняння Ейлера і умову Вейєрштраса можна вивести, якщо функції
неперервні,
умови Лежандра і Якобі коли ,
і
Всі умови виконуються, якщо
. ,
.
Вправи до розділу 5 Використовуючи принцип максимуму, розв’язати задачі.
1.
;
.
2.
;
.
116
3.
;
4.
;
5.
;
6.
;
.
.
.
.
7.
;
8.
;
,
,
,
;
9.
;
10.
,
,
.
.
, ( A 0 ).
,
; x 1 ,
12.
.
,
; x 1 ,
11.
,
,
.
,
(T –
змінна). 13.
;
. 117
;
14.
,
,
.
;
15.
.
,
16.
,
,
. ,
17.
,
,
,
.
18.
;
,
19.
;
,
;
20.
.
.
,
.
Розв’язати задачі оптимальної швидкодії. 21.
,
22.
,
23.
,
24.
,
25.
,
,
, ,
.
,
.
, , ,
,
, , 118
. ,
,
. .
26.
,
,
,
27.
,
,
,
.
28.
,
,
,
.
119
,
.
Література 1. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. – М.: Наука, 1979. – 425с. 2. Янг Л. Лекции по вариационному исчислению и теории оптимального управления. – М.: Мир, 1974. – 315с. 3. Обен Ж.-П., Экланд И. Прикладной нелинейный анализ. – М.: Мир, 1979. – 385с. 4. Рокафеллар Р. Выпуклый анализ. – М.: Мир, 1973. – 250с. 5. Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. – М.: Наука, 1980. – 318с. 6. Моклячук М.П. Варіаційне числення. Екстремальні задачі. – К.: Либідь, 1994. – 328с. 7. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. – М.: Наука, 1972. – 544с. 8. Васильев Ф.П. Методы решения экстремальных задач. – М.: Наука, 1981. – 460с. 9. Алексеев В.М., Галеев Е.М., Тихомиров В.М. Сборник задач по оптимизации. – М.: Наука, 1984. – 265с. 10. Пономаренко А.И., Леоненко Н.Н., Борисенко А.Д. Учебные задания к лабораторным занятиям по курсу методы оптимизации. – К.: КГУ, 1986. – 40с. 11. Понтрягин Л.В., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. – М.: Наука, 1976. 12. Красовский Н.Н. Теория управления движением. – М.: Наука, 1968. 13. Летов А.М. Динамика полета и управления. – М.: Наука, 1969. 14. Бублик Б.Н., Кириченко Н.Ф. Основы оптимального управления. – К.: Вища школа, 1975. 120
15. Ашманов С.А., Тимохов С.А. Теория оптимизации в задачах и упражнениях. – М.: Наука, 1991. 16. Перестюк М.О., Станжицький О.М., Капустян О.В. Екстремальні задачі. Навчальний посібник – К.: ВПЦ Київський університет, 2004. – 50 с. 17. Перестюк М.О., Станжицький О.М., Капустян О.В. Задачі оптимального керування. Навчальний посібник – К.: ТВіМС, 2004. – 55 с.
121