МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М. В. ЛОМОНОСОВА Механико-математический факультет
Курс лекций по аналитической механике Лектор — Александр Владиленович Карапетян
IV курс, 8 семестр, поток математиков
Москва, 2006 г.
Оглавление 1.
2.
Лагранжев формализм 1.1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1. Учение о связях или принцип д’Аламбера – Лагранжа . . 1.1.2. Вывод общих теорем динамики из принципа д’Аламбера – Лагранжа . . . . . . . . . . . . 1.2. Уравнения Лагранжа второго рода . . . . . . . . . . . . . . . . . 1.2.1. Обобщенные координаты . . . . . . . . . . . . . . . . . . . 1.2.2. Вывод уравнений Лагранжа . . . . . . . . . . . . . . . . . 1.2.3. Структура кинетической энергии . . . . . . . . . . . . . . 1.2.4. Разрешимость уравнений Лагранжа относительно старших производных . . . . . . . . . . . . . 1.2.5. Уравнения Лагранжа для подвижной системы координат 1.2.6. Пример: плоская ограниченная круговая задача трех тел 1.3. Положения равновесия . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1. Принцип виртуальных перемещений . . . . . . . . . . . . 1.3.2. Малые колебания . . . . . . . . . . . . . . . . . . . . . . . 1.3.3. Пример: двойной математический маятник . . . . . . . . 1.3.4. Уравнения Рауса . . . . . . . . . . . . . . . . . . . . . . . . 1.3.5. Циклические координаты . . . . . . . . . . . . . . . . . . . 1.3.6. Пример: волчок Лагранжа в углах Крылова . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
8 10 10 11 13
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
14 15 15 16 16 17 18 19 20 22
Гамильтонов формализм 2.1. Уравнения Гамильтона . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Функционал действия и его вариации . . . . . . . . . . . . . . . . . . . 2.2.1. Принцип наименьшего действия Гамильтона – Остроградского 2.2.2. Интегральные инварианты . . . . . . . . . . . . . . . . . . . . . 2.2.3. Уравнения Уиттекера и Якоби . . . . . . . . . . . . . . . . . . . 2.2.4. Принцип наименьшего действия в форме Мопертюи – Лагранжа и Якоби . . . . . . . . . . . . . 2.3. Канонические преобразования . . . . . . . . . . . . . . . . . . . . . . . 2.3.1. Групповые свойства канонических преобразований . . . . . . . 2.3.2. Критерии каноничности . . . . . . . . . . . . . . . . . . . . . . 2.3.3. Сохранение гамильтоновой структуры при канонических преобразованиях . . . . . . . . . . . . . . . . 2.3.4. Теорема Лиувилля о сохранении фазового объёма . . . . . . . 2.4. Уравнения Гамильтона – Якоби и теорема Лиувилля . . . . . . . . . . 2.4.1. Свободные канонические преобразования . . . . . . . . . . . . 2.4.2. Характеристическая функция Гамильтона . . . . . . . . . . . . 2.4.3. Случай разделяющихся переменных . . . . . . . . . . . . . . . 2.4.4. Пример: математический маятник . . . . . . . . . . . . . . . . . 2.4.5. Обобщённый случай разделяющихся переменных . . . . . . . . 2.4.6. Теорема Лиувилля об интегрируемости в квадратурах . . . . . 2.5. Переменные «действие – угол» . . . . . . . . . . . . . . . . . . . . . . . 2.5.1. Пример: простейший гармонический осциллятор . . . . . . . . 2.5.2. Пример: математический маятник . . . . . . . . . . . . . . . . .
2
5 5 5
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
24 24 25 25 28 29
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
31 31 31 33
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
34 35 36 36 38 39 39 39 40 42 43 44
3.
Теория устойчивости 3.1. Основные понятия теории устойчивости . . . . . . . . . . 3.2. Теоремы Ляпунова и Четаева . . . . . . . . . . . . . . . . 3.3. Пример: волчок Эйлера . . . . . . . . . . . . . . . . . . . . 3.4. Еще несколько теорем об устойчивости . . . . . . . . . . . 3.5. Пример: система полудисков . . . . . . . . . . . . . . . . . 3.6. Теоремы Кельвина – Четаева о влиянии гироскопических и диссипативных сил на устойчивость . . . . . . . . . . . 3.7. Пример: Устойчивость треугольных точек либрации в плоской круговой ограниченной задаче трех тел . . . .
3
. . . . .
45 45 46 48 49 51
. . . . . . . . . . . . . .
52
. . . . . . . . . . . . . .
53
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Предисловие Это конспект курса лекций по аналитической механике, читаемых в 8 семестре 2005–2006 учебного года на механико-математическом факультете МГУ. Данная редакция отличается от предыдущей большим количеством существенных (можно сказать кардинальных) исправлений. Большое спасибо всем тем, кто способствовал исправлению ошибок в этом тексте (в основном Паше Наливайко). Последняя компиляция: 7 июня 2006 г. Обновления документа — на сайтах http://dmvn.mexmat.net, http://dmvn.mexmat.ru. Об опечатках и неточностях пишите на
[email protected]. Также об опечатках можно сообщать по адресу
[email protected].
Обозначения Сразу введем несколько обозначений, которые понадобятся нам в дальнейшем: • если имеется k различных величин, обозначаемых, скажем, p1 , . . . , pk , мы будем иногда использовать сокращенную запись p, подразумевая их полное перечисление — например, мы можем написать f (r) вместо f (r1 , . . . , rn ), не оговаривая ничего отдельно — но только в том случае, если раньше были введены величины r1 , . . . , rn и не вводилась величина r; • в произведениях вида ai bi — то есть включающих в себя величины с верхним и нижним индексом одновременно, всегда подразумевается суммирование по этому индексу; при этом верхний индекс, стоящий в знаменателе, приравнивается к нижнему; • скалярное произведение векторов a и b мы будем обозначать так: a · b ; • а векторное — так: a × b .
4
1. Лагранжев формализм 1.1. Введение 1.1.1. Учение о связях или принцип д’Аламбера – Лагранжа Принцип д’Аламбера – Лагранжа — один из многих подходов, позволяющих записывать уравнения движения системы точек под действием сил и связей. Его можно считать «первой ступенькой» на пути к лагранжевому формализму — вот почему он открывает этот раздел. Но прежде, чем описывать этот принцип, дадим несколько общих определений, которые понадобятся нам в дальнейшем. Будем рассматривать систему из n материальных точек, которые мы будем обозначать mi , i = 1, . . . , n. Массы этих этих точек будут обозначаться так же, как и сами точки (mi ), а их радиус-векторы — ri . Определение. Удерживающей (двусторонней) связью мы будем называть условие на координаты и скорости точек системы вида Φ(r1 , . . . , rn , r˙ 1 , . . . , r˙ n , t) = 0.
(1)
Определение. Неудерживающей (односторонней) связью мы будем называть условие на координаты и скорости точек системы вида Φ(r1 , . . . , rn , r˙ 1 , . . . , r˙ n , t) > 0.
(2)
Замечание. В дальнейшем мы будем рассматривать только удерживающие связи. Определение. Геометрическими мы будем называть связи, удовлетворяющие условию ∂Φ = 0, i = 1, . . . , n; ∂ r˙ i
(3)
связи, не удовлетворяющие этому условию, мы будем называть дифференциальными. Определение. Связь называется интегрируемой, если ее можно привести к виду ψ(r1 , . . . , rn , t) = 0, т. е. к виду геометрической связи. Таким образом, даже дифференциальная связь может являться интегрируемой. В дальнейшем это различие будет играть принципиальную роль. Замечание. Если на систему наложено две или более дифференциальных связи, то возможны случаи, когда каждая связь по отдельности не является интегрируемой, но тем не менее они интегрируемы в совокупности. Пример 1.1. Примером такой ситуации могут служить связи ( z˙ = xy, ˙ z˙ = xy. ˙ Каждая из них в отдельности, очевидно, неинтегрируема, в то время как вместе их можно проинтегрировать — при этом получим геометрические связи ( 2z = xy + const, x = const . y 5
Определение. Геометрические и дифференциальные связи, интегрируемые в совокупности, называют голономными. Пример 1.2. Примером системы с неголономными связями может служить шар на абсолютно шероховатой плоскости. Замечание. В дальнейшем нас будут интересовать только голономные связи. Замечание наборщика. Вообще говоря, здесь следовало бы отметить, что все связи будут также предполагаться независимыми; однако лектор об этом ничего не говорил.
Рассмотрим систему точек в пространстве с ограничениями вида ( fα (r1 , . . . , rn , t) = 0, α = 1, . . . , a, fβ (r1 , . . . , rn , r˙ 1 , . . . , r˙ n , t) = 0, β = 1, . . . , b,
(4)
то есть, фактически, отделим геометрические связи от дифференциальных. Но на этом мы не остановимся. Уравнения первого типа мы продифференцируем по t; что касается второго — далее всюду мы будем полагать, что их компоненты линейны по r˙ и перепишем их в соответствие с этим предположением. После этого, домножая все на dt, получим систему ограничений вида n X ∂fα (r, t) ∂fα (r, t) · dri + dt = 0, α = 1, . . . , a, ∂ri ∂t i=1 (5) n X bβi (r, t) · dri + bβ (r, t)dt = 0, β = 1, . . . , b. i=1
Определение. Действительными перемещениями мы будем называть траектории, удовлетворяющие соотношениям (5). Полагая в (5) dt = 0, получим соотношения n X ∂fα (r, t) · δri = 0, α = 1, . . . , a, ∂ri i=1 (6) n X bβi (r, t) · δri = 0, β = 1, . . . , b. i=1
Определение. Виртуальными перемещениями мы будем называть траектории, удовлетворяющие соотношениям (6). Замечание. Мы будем использовать обозначение δr вместо dr, чтобы подчеркнуть разницу между виртуальными и действительными перемещениями. Пример 1.3. Муха ползет по надуваемому шарику. Уравнение связи: x2 + y 2 + z 2 = a + bt (считаем, что шарик надувается линейно). В этом случае уравнения (5) и (6) будут выглядеть так: 2x dx + 2y dy + 2z dz = b dt, 2x δx + 2y δy + 2 zδz = 0. Таким образом, вектор действительных перемещений имеет две составляющих: радиальную и касательную, а вектор виртуальных перемещений имеет только касательную составляющую. 6
Замечание. Нетрудно заметить, что действительные перемещения являются также и виртуальными в том и только в том случае, когда связь стационарна: dri ∈ {δri } ⇔
∂fα = 0, bβ = 0. ∂t
Запишем аксиому освобождения от связей: mi¨ri = Fi + Ri , i = 1, . . . , n.
(7)
Здесь Ri — силы реакции связей. Определение. Связи идеальны, если работа сил реакции на виртуальном перемещении равна нулю: n X Ri · δri = 0 (8) i=1
для всех δri , удовлетворяющего условиям (6).
Замечание. В дальнейшем мы будем рассматривать только идеальные связи. Подставляя (7) в (8), получим, наконец, уравнение, которое и составляет суть принципа д’Аламбера – Лагранжа: n X (−mi¨ri + Fi ) · δri = 0. (9) i=1
Просуммируем уравнения (8) и уравнения системы (6), взятые с произвольными коэффициентами λα и µβ и с обратным знаком: ! X n a b X X ∂fα Ri · δri − λα µβ bβi · δri = · δri − ∂ri α=1 i=1 β=1 ! ! n a b X X ∂fα X = Ri − λα − µβ bβi · δri = 0. (10) ∂ri α=1 i=1 β=1
Всего у нас имеется 3n компонент приращений δri , на которые накладывается a+b ограничений вида (6). При этом мы предполагаем, что связи у нас независимы и a + b < 3n. Кроме того, в уравнении (10) фигурируют как раз a + b свободных параметров: выбирая их подходящим образом, мы можем обнулить коэффициенты при «зависимых» приращениях. Это оставляет нам ещё 3n − (a + b) независимых компонент приращений, некоторая линейная комбинация которых должна давать 0. Отсюда и следует равенство нулю всех её коэффициентов. Таким образом, получаем представление для сил реакции связей: Ri =
a X α=1
b
λα
∂fα X + µβ bβi . ∂ri β=1
Собирая воедино (4), (5), (7) и (11) получим уравнения Лагранжа первого рода: a b X ∂fα X ¨ mi ri = Fi + λα + µβ bβi , i = 1, . . . , n, ∂ri α=1 β=1 fα (r, t) = 0, α = 1, . . . , a, n X bβi (r, t) · r˙ i + bβ (r, t) = 0, β = 1, . . . , b. ϕβ := i=1
7
(11)
(12)
1.1.2. Вывод общих теорем динамики из принципа д’Аламбера – Лагранжа Теорема 1.1. Если связи, наложенные на систему, допускают перемещение системы как единого целого вдоль некоторой неподвижной оси, то скорость изменения проекции импульса системы на эту ось равна проекции равнодействующей всех внешних сил: (e) d (13) (mvS · e) = F · e , dt
где vS — скорость центра масс системы, e — орт той оси, вдоль которой допустимо переn P (e) (e) мещение системы, а F = Fi — равнодействующая внешних сил. i=1
Замечание наборщика. Напомню, что силы, действующие на точки некоторой системы принято разделять на внутренние и внешние: (i) (e) Fk = Fk + Fk . При этом, пользуясь вторым законом Ньютона, несложно показать, что равнодействующая внутренних сил равна нулю: X (i) (i) F = Fk = 0,
более того, нулю равен главный момент внутренних сил: i Xh (i) rk × Fk = 0.
Заметим, что δri коллинеарно e, то есть можно записать δri = eδs,
где s — некоторая скалярная переменная. Подставим это представление в принцип д’Аламбера – Лагранжа (9): n X i=1
так как
(e)
(i)
−mi¨ri + Fi + Fi
· e δs = 0
n X (i) Fi · e =
n X
i=1
n X
⇔
i=1
(i)
Fi
i=1
!
·e
n X (e) mi¨ri · e = Fi · e ,
(14)
i=1
!
= 0.
Вначале разберемся с правой частью равенства (14): ! ! n n (e) X X (e) (e) Fi · e = Fi ·e = F ·e . i=1
i=1
А теперь с левой: n X i=1
mi¨ri · e =
d dt
n X i=1
mi r˙ i
!
!
·e
d = mv˙ S · e = (mvS · e) . dt
Остается заметить, что мы получили соответственно правую и левую части доказываемого равенства (13). Замечание. Из только что доказанной теоремы очевидным образом следует такой факт: если связи допускают перемещение системы как единого целого вдоль трех неподвижных некомпланарных осей, то (e) mv˙ S = F . 8
Замечание наборщика. Напомним, что кинетическим моментом системы относительно точки O называется величина n X KO := ri × mi r˙ i , (15) i=1
при этом в качестве начала координат выбирается точка O.
Теорема 1.2. Если связи, наложенные на систему, допускают поворот системы как единого целого вокруг неподвижной оси, то скорость изменения проекции кинетического момента системы на эту ось равна проекции главного момента внешних сил: (e) d KO · e = MO · e , dt
где
(e) MO
(16)
n h i X (e) = ri × Fi , i=1
а e — орт оси вращения. В этом случае δri коллинеарно [e × ri ], то есть
δri = [e × ri ] δϕ. Вновь подставляем в (9): n X ¨ Fi · [e × ri ] . mi ri · [e × ri ] =
n X
i=1
i=1
Циклически переставим аргументы в обеих частях равенства: n X i=1
n X e · ri × mi¨ri = e · ri × Fi . i=1
Осталось лишь вынести e за знак суммы, воспользоваться тем, что главный момент внутренних сил равен нулю, и получить доказываемое равенство (16). Теорема 1.3. Если связи, наложенные на систему, являются стационарными, то дифференциал кинетической энергии системы равен работе всех заданных сил на действительном перемещении. То есть, если dri ∈ {δri }, то dT :=
n X i=1
n X (e) (i) ¨ mi ri · dri = Fi + Fi · dri .
(17)
i=1
Нужно просто подставить δri = dri в (9): n X i=1
(−mi¨ri + Fi ) · dri = 0, (e)
(i)
перенести слагаемые mi¨ri в другую часть равенства и вспомнить, что Fi = Fi + Fi .
9
1.2. Уравнения Лагранжа второго рода 1.2.1. Обобщенные координаты Мы рассмотрим случай, когда на систему наложены только геометрические связи: fα (r1 , . . . , rn , t) = 0,
(18)
α = 1, . . . , a.
При этом мы будем полагать, что связи эти удовлетворяют следующим условиям: 1. гладкость — то есть функции fα предполагаются гладкими (дифференцируемыми столько раз, сколько потребуется); 2. независимость — то есть предполагается, что ранг матрицы, составленной из частных α , равен a: производных ∂f ∂ri ∂fα rk = a; ∂ri αi 3. идеальность — то есть работа связей на виртуальном перемещении равна нулю. α Замечание наборщика. Следует понимать, что, когда речь идёт о матрице частных производных ∂f ∂ri , её размер равен a×3n, если расписать векторные компоненты покоординатно. Каждая её компонента с номером αi имеет вид: ∂fα ∂fα ∂fα ∂fα , , . = ∂ri ∂r1i ∂r2i ∂r3i
Определение. Конфигурационным пространством системы, на которую наложены геометрические связи, удовлетворяющие свойствам 1 и 2, называют подмногообразие в пространстве R3n , задаваемое уравнениями (18). Заметим, что свойства 1 и 2 дают нам возможность утверждать, что конфигурационное пространство будет гладким многообразием размерности m = 3n − a. Вот примеры конфигураϕ
ϕ ϕ ϕ ϕ
ϕ ϕ ϕ ϕ
ψ ψ ψ ψ
ψ ψ ψ ψ
Рис. 1
Рис. 2
Рис. 3
ционных пространств некоторых широко известных механических систем: 1. математический маятник: в этом случае конфигурационное пространство — это просто окружность — M 1 = S 1 (рис. 1 ); 2. в случае двойного маятника конфигурационное пространство есть тор: M 2 = T2 (рис. 2 ); 3. у сферического маятника M 2 = S 2 (рис. 3 ); 4. в случае твердого тела с одной неподвижной точкой конфигурационное пространство — M 3 = SO(3). Определение. Обобщенными координатами q = (q 1 , . . . , q m ) будем называть локальные координаты на конфигурационном пространстве. Очевидно, мы можем записать ri = ri (q 1 , . . . , q m , t). Замечание. Индексы были поставлены вверху не случайно. Позже мы этим воспользуемся, дабы лишний раз не писать знак суммирования.
10
Замечание. От абсолютных координат к обобщенным можно перейти всегда, а вот обратное, вообще говоря, неверно. Примером могут служить обобщенные координаты ϕ, ψ на S 2 (сфере): нам никак не справиться с особенностью в полюсах. Замечание наборщика. Кроме того, лектор высказал утверждение, что на S 1 такой проблемы не возникает, что не вполне понятно: ни на S 1 , ни на S 2 не существует глобального атласа из одной карты. Другое дело, что в случае окружности можно хотя бы использовать координату ϕ (длину дуги), опущенную с накрывающей R.
Замечание. Следует отметить, что обобщенные координаты могут иметь весьма неожиданную размерность. К примеру, в случае маятника (конфигурационное пространство — окружность) в качестве обобщенной координаты можно ввести не угол отклонения радиус-вектора от вертикали, как это делается обычно, а площадь сектора между этой вертикалью и радиус-вектором, взятую с соответствующим углу знаком. Размерность будет — м 2 . Дифференцируя ri (q, t) по t как сложную функцию, получим формулу для скоростей в обобщенных координатах: ∂ri ∂ri r˙ i = j q˙j + . (19) ∂q ∂t Для виртуальных перемещений получим (умножая предыдущую формулу на dt, а потом полагая dt = 0): ∂ri (20) δri = j δq j . ∂q Замечание. Если на систему наложены только геометрические связи, то δq 1 , . . . , δq m независимы. Замечание. Кратко поясним, что делать в случае, если имеются также дифференциальные ˙ t) = 0, β = 1, . . . , b. На время «забываем» о них и вводим обобщенные коордисвязи: ϕβ (r, r, наты q, а затем переписываем уравнения дифференциальных связей в виде Φβ (q, q, ˙ t) = 0. В этом случае число степеней свободы системы равно m − b, а δq, конечно, уже не являются независимыми: они удовлетворяют соотношениям ∂Φβ j δq = 0. ∂ q˙j До сих пор мы не пользовались предположением об идеальности накладываемых на систему связей. Из него, конечно, следует выполнение принципа д’Аламбера – Лагранжа (9). Определение. Кинетическая энергия системы n
T =
1 X ˙2 mi ri = T (q, q, ˙ t). 2 i=1
Такое представление возможно в силу (19). Определение. Обобщенные силы n X ∂ri Fi · j = Qj (q, q, ˙ t). Qj = ∂q i=1 1.2.2. Вывод уравнений Лагранжа При доказательстве следующей теоремы нам понадобится одна полезная лемма. Лемма 1.4. Имеют место соотношения ∂ r˙ i ∂ri d ∂ri ∂ r˙ i = j, = j. j j ∂ q˙ ∂q dt ∂q ∂q 11
Первое соотношение следует непосредственно из (19). Чтобы убедиться в справедливости второго соотношения, придётся долго дифференцировать: d ∂ri ∂ 2 ri k ∂ 2 ri ! ∂ 2 ri k ∂ 2 ri ∂ ∂ri k ∂ri !! ∂ r˙ i = k j q˙ + = j k q˙ + j = j q˙ + = j. dt ∂q j ∂q ∂q ∂t∂q j ∂q ∂q ∂q ∂t ∂q ∂q k ∂t ∂q Меняя в «!» порядок дифференцирования, мы воспользовались гладкостью, а при переходе «!!» — равенством (19). Теорема 1.5 (уравнения Лагранжа второго рода). Действительные перемещения системы удовлетворяют следующим соотношениям: d ∂T ∂T − j = Qj , j = 1, . . . , m. j dt ∂ q˙ ∂q
(21)
Подставим соотношение (20) в принцип д’Аламбера – Лагранжа (9) и раскроем все по линейности: X ! n n X ∂r ∂r i i δq j = 0. −mi¨ri · j + Fi · j ∂q ∂q i=1 i=1
Пользуясь тем, что δq j независимы, можем записать X n n X ∂r ∂r i i −mi¨ri · j + Fi · j = 0, j = 1, . . . , m. ∂q ∂q i=1 i=1 Вспоминая определение обобщенных сил, запишем n X ∂ri Fi · j = Qj . ∂q i=1
Таким образом, осталось показать, что первое слагаемое полученного равенства (взятое с обратным знаком) совпадает с левой частью (21). Тут-то мы и воспользуемся только что доказанной леммой. Итак, n X i=1
X n n d X ∂r d ∂r ! i i = mi r˙ i · j − mi r˙ i · = j dt i=1 ∂q dt ∂q i=1 |{z} | {z } ! n n n X X X ˙i ˙i ∂ r ∂ r d ∂ 1 ∂ 2 ! d = mi r˙ i · j − mi r˙ i · j = mi r˙ i − j j dt i=1 ∂ q˙ ∂q dt ∂ q˙ 2 i=1 ∂q i=1
∂ri mi¨ri · j ∂q
n
1X mi r2i 2 i=1
!
.
В переходе «!» мы воспользовались леммой. Остается вспомнить определение кинетической энергии и понять, что все доказано. Замечание. Если заданные силы не зависят от скоростей, то есть Fi = Fi (r1 , . . . , rn , t) и потенциальны, то есть ∂W (r1 , . . . , rn , t) , ∂ri то обобщенные силы также потенциальны: Fi = −
Qj = −
∂V (q, t) , ∂q j
12
где V = W (r(q, t), t). Уравнения Лагранжа в этом случае принимают вид d ∂L ∂L − j = 0, j dt ∂ q˙ ∂q
(22)
где L = T − V — функция Лагранжа. 1.2.3. Структура кинетической энергии Утверждение 1.6. Кинетическую энергию можно представить в виде T (q, ˙ q, t) = T2 + T1 + T0 , где
n X 1 ∂ri ∂ri j k T2 = ajk (q, t)q˙ q˙ — квадратичная форма, ajk = mi · k ; j 2 ∂q ∂q i=1 n X ∂ri ∂ri j T1 = aj (q, t)q˙ — линейная форма, aj = mi · ; j ∂q ∂t i=1 2 n 1X ∂ri mi T0 = a0 (q, t), a0 = . 2 i=1 ∂t
Кроме того, T2 > 0 при всех q, таких что q˙ 6= 0. Чтобы убедиться в корректности такого представления, достаточно подставить (19) в определение кинетической энергии. А вот положительность T2 следует, с одной стороны, из того, что 2 n 1X ∂ri j mi · q˙ > 0, T2 = 2 i=1 ∂q j а с другой стороны, в силу независимости q j , векторы T2 = 0
⇔
∂ri j q˙ = 0 ∂q j
∂ri ∂q
линейно независимы, поэтому
⇔
q˙j = 0.
Утверждение доказано. Следствие 1.1. Если обобщенные силы потенциальны, то есть Qj = −
∂V , ∂q j
то функция Лагранжа может быть представлена в виде L = L2 + L1 + L0 , где L2 = T2 , L1 = T1 , L0 = T0 − V.
Следствие 1.2. Если заданные силы потенциальны и не зависят от скоростей (то есть уравнения Лагранжа имеют вид (22)), то d ∂L (L2 − L0 ) = − . dt ∂t 13
Умножая j-е уравнение системы (22) на q˙j и суммируя по j, получим
d ∂L d ∂L ∂L ∂L ∂L j ∂L j ∂L 0 = q˙ − q˙ = q˙ − j q¨j − j q˙j − + = j j j dt ∂ q˙ ∂q dt ∂ q˙ ∂ q˙ ∂q ∂t ∂t d ∂L d d ∂L d j = q˙ (ajk q˙k + aj ) − L + = (2L2 + L1 ) − (L2 + L1 + L0 ) + . dt dt ∂t dt dt ∂t j
Следствие 1.3. Если функция Лагранжа не зависит от времени, то уравнения (22) допускают первый интеграл: ∂L = 0 ⇒ L2 − L0 = const, ∂t называемый обобщенным интегралом энергии или интегралом Пенлеве. Замечание. Если связи не зависят от времени, а силы консервативны (то есть потенциальны и не зависят от времени), то T = T2 , L0 = −V, L2 = T , и обобщенный интеграл энергии превращается в обычный: T + V = const . 1.2.4. Разрешимость уравнений Лагранжа относительно старших производных Теорема 1.7. Уравнения Лагранжа разрешимы относительно старших (то есть вторых) производных. Перепишем уравнения Лагранжа: d ∂T ∂T − s = Qs (q, ˙ q, t). s dt ∂ q˙ ∂q А теперь будем преобразовывать их левую часть, пользуясь утверждением 1.6. Во-первых, ∂T = asj q˙j + as . ∂ q˙s Дифференцируем это равенство по t: d ∂T ∂asj k j ∂asj j ∂as k ∂as j = a q ¨ + q˙ q˙ + q˙ + k q˙ + . sj dt ∂ q˙s ∂q k ∂t ∂q ∂t Замечание наборщика. На самом деле уже всё доказано: мы выделили старшую производную, и остаётся только перенести её в левую часть, а всё остальное — в правую. Далее мы просто приводим это дифференциальное уравнение к системе уравнений первого порядка.
Теперь перейдем ко второму слагаемому: ∂T 1 ∂akj k j ∂ak k ∂a0 = q˙ q˙ + s q˙ + s . s ∂q 2 ∂q s ∂q ∂q Наконец, выпишем еще одно очевидное тождество ∂asj k j 1 ∂asj ∂ask q˙ q˙ = + q˙k q˙j . ∂q k 2 ∂q k ∂q j Собирая все это воедино, мы можем переписать уравнения Лагранжа в следующей форме: asj q¨j = Fs (q, ˙ q, t), 14
где 1 Fs = 2
∂akj ∂asj ∂ask − − s k ∂q ∂q ∂q j
k j
q˙ q˙ +
∂ak ∂as − k ∂q s ∂q
q˙k + Qs −
∂as ∂asj j ∂a0 − q˙ + . ∂t ∂t ∂t
Теперь остались детали. Введем матрицу (ars ), обратную матрице (asj ), то есть такую, что ars asj = δjr и величины F r = ars Fs . Тогда наше уравнение можно переписать в виде системы ОДУ ( q˙r = v r , v˙ r = F r (q, v, t). Видно, что эти уравнения разрешены относительно вторых производных. 1.2.5. Уравнения Лагранжа для подвижной системы координат Пусть Oxyz — неподвижная система координат, Sξηζ — подвижная. Введем следующие обозначения: ri , как обычно, — радиус-векторы точек mi в неподвижной системе, ρi — их радиус-векторы в подвижной системе координат, rS — радиус-вектор начала подвижной системы координат (относительно неподвижной), наконец, vi — это их скорости в неподвижной системе координат. Теперь можно записать формулы перехода ri = rS + ρi (q, t), vi = vS +
dρi = vS + [ω × ρi ] + ρ˙ i , dt
причём точка в последнем равенстве означает дифференцирование по времени относительно подвижной системы координат. Отсюда следует, что при переходе к подвижной системе координат представление для кинетической энергии в виде T = T2 + T1 + T0 остается в силе. Это позволяет записать уравнения Лагранжа для подвижной системы координат1 . В качестве примера рассмотрим следующую задачу. 1.2.6. Пример: плоская ограниченная круговая задача трех тел Три тела назовем так: S — Солнце, J — Юпитер, и A — астероид. Будем считать, что mA ≪ mJ ≪ mS и пренебрегать влиянием астероида на движение Солнца и Юпитера (это и означает «ограниченность» задачи). Кроме того, для простоты считаем, что все они движутся в одной плоскости, а Солнце и Юпитер — по окружностям (тогда, очевидно, центр этих окружностей — это их общий центр масс). Введем подвижную систему координат Oxyz, где O совпадает с центром этой окружности, а ось Ox — с прямой SJ (рис. 4 ). Эта система вращается y A
S
O
J
x
Рис. 4
со скоростью ω Oxyz = ωez . Вспоминая последнее замечание, запишем v = (x˙ − ωy)ex + (y˙ + ωx)ey , 1
Нужно проделать ещё некоторое количество выкладок, чтобы в этом убедиться. Возможно, они будут приведены позже. — Прим. наб.
15
так как в нашем случае ρ = xex + yey , ρ˙ = xe ˙ x + ye ˙ y , [ω × ρ] = [ωez × (xex + yey )] = ω (−yex + xey ) , а скорость начала подвижной системы координат равна нулю. Теперь можно посчитать кинетическую энергию и потенциал: i mA h 2 T = x˙ + y˙ 2 + 2ω (xy˙ − y x) ˙ + ω 2 x2 + y 2 =: T2 + T1 + T0 , 2 mS mJ V = −γmA + . |AS| |AJ|
Здесь γ — это константа данной системы. Пришло, однако, время облегчить себе жизнь, введя удобные единицы измерения. А именно, мы положим равными единице следующие величины: γ, mS + mJ , |SJ|, ω. Кроме того, пусть µ = mJ , тогда, очевидно, можно записать mS = 1 − µ, xS = µ, xJ = 1 − µ. Теперь выражение для потенциальной энергии примет вид V = −mA
1−µ
µ
p +p (x + µ)2 + y 2 (1 − µ − x)2 + y 2
!
= V (x, y).
Запишем, наконец, уравнения Лагранжа для нашей системы ( x¨ − 2y˙ + x − ∂V = 0, ∂x ∂V y¨ + 2x˙ + y − ∂y = 0.
Или, через приведенный потенциал W = V − T0 = V − m2A (x2 + y 2) ( = 0, x¨ − 2y˙ − ∂W ∂x ∂W y¨ + 2x˙ − ∂y = 0. Замечание наборщика. На случай, если кому-то покажется, что в этих выкладках теряется множитель m2A , поясняю: мы на него просто сокращаем, так как он фигурирует во всех слагаемых.
1.3. Положения равновесия 1.3.1. Принцип виртуальных перемещений В этом разделе мы будем рассматривать голономные системы, то есть системы со связями вида fα (r1 , . . . , rn ) = 0, α = 1, . . . , a, причем связи предполагаются идеальными. Мы уже выяснили, что движения таких систем происходят в некотором конфигурационном пространстве, на котором можно ввести обобщенные координаты q 1 , . . . , q m , m = 3n − a. Силы, действующие на систему, будут предполагаться зависящими только от координат и потенциальными (таким образом, рассматриваемые системы будут ещё и консервативными): Fi = Fi (r1 , . . . , rn ). Определение. Положение системы ri = r0i называется положением равновесия, если при ri (t0 ) = r0i , r˙ i (t0 ) = 0 имеет место равенство ri (t) = r0i при любом t. 16
Вспоминая принцип д’Аламбера–Лагранжа (9), запишем n X i=1
Fi (r0 ) · δri = 0.
(23)
Это и есть принцип виртуальных перемещений: работа сил в положении равновесия равна нулю на виртуальных перемещениях. Выпишем теперь некоторые свойства, характерные для описанной только что системы. Вспоминая представление виртуальных перемещений через обобщенные координаты (20) и определение обобщенных сил, можно записать Qj (q0 )δq j = 0 ⇒ Qj (q0 ) = 0. Если обобщенные силы потенциальны, то есть Qj (q) = −
∂V (q) , ∂q j
получим, во-первых, δV (q0 ) = Qj (q0 )δq j = 0, а также
∂V ∂q j
q = q0
= −Qj (q0 ) = 0.
Так как система предполагается консервативной, справедливо следующее представление для кинетической энергии: 1 T = T2 + T1 + T0 = T2 + 0 + 0 = ajk (q)q˙j q˙k . 2 И последнее: при рассмотрении системы, имеющей в q 0 положение равновесия, целесообразно сделать замену q j = q0j + xj , j = 1, . . . , m. Замечание наборщика. Все результаты, полученные в этом параграфе, будут использоваться в последующих параграфах (до конца текущего раздела) без прямого на то указания, дабы не загромождать текст обилием ссылок на тривиальные факты.
1.3.2. Малые колебания Будем исследовать характер поведения системы вблизи положения равновесия. В терминах описанной выше замены это означает, что мы будем предполагать величины x и x˙ малыми. Ввиду этого факта, выражения для кинетической и потенциальной энергии можно переписать в следующем виде: 1 1 T = ajk (q0 + x)x˙ j x˙ k = ajk (q0 )x˙ j x˙ k + o(x2 + x˙ 2 ). 2 2 2 ∂V 1 ∂ V j V = V (q0 ) + ·x + · xj xk + o(x2 ). ∂q j q = q0 2 ∂q j ∂q k q = q0 | {z } =0
Замечание. Чтобы получить представление для потенциальной энергии, мы просто воспользовались разложением V (x) в ряд Тейлора в точке x = 0. А вот запись для кинетической энергии содержит небольшую неточность: размерности величин x и x, ˙ вообще говоря, раз2 2 личны, поэтому не вполне понятно, что такое o(x + x˙ ). Дабы упростить наши рассуждения, остановимся на том, чтобы все-таки считать эти величины приведенными к одной размерности. 17
Теперь перепишем полученные выражения в матричной форме. Для этого введем матрицы 2 1 ∂ V 0 0 A = (ajk ) = (ajk (q0 )), C = (cjk ) = . 2 ∂q j ∂q k q = q0 Сразу отметим, что обе они симметричны, а матрица A еще и положительно определена (утверждение 1.6). Получим 1 1 T ≈ a0jk x˙ j x˙ k , V ≈ c0jk xj xk . 2 2 Замечание наборщика. Здесь мы как-то мимоходом потеряли константное слагаемое V (q0 ) в выражении для V . Впрочем, потенциальная энергия все равно определена с точностью до константы, так что не жалко.
Подставляя полученные выражения в уравнения Лагранжа (21), получим их «линеаризацию» вблизи положения равновесия a0jk x¨k + c0jk xk = 0, или, в совсем уж матричной форме (24)
A¨ x + Cx = 0.
В силу симметричности матриц A и C найдется невырожденной ортогональное преобразование координат x = Bξ, такое что в новых координатах уравнения примут вид ξ¨ + Kξ = 0, где K = diag(κ1 , , . . . , κm ), а величины κj являются корнями уравнения det(Aκ − C) = 0. При этом координаты ξ называют нормальными. Замечание. Если все κj положительны, то уравнения (24) действительно описывают «малые колебания». В противном случае некоторые решения будут иметь экспоненциальный рост и ни о каких колебаниях речи уже быть не может. Это, впрочем, не мешает уравнениям (24) и в этом случае тоже называться «уравнениями малых колебаний». Теперь рассмотрим пример, демонстрирующий только что описанную технику. 1.3.3. Пример: двойной математический маятник Потенциал изображенной на рис. 5 системы имеет вид y
x g
ϕ1
l1 m1 ϕ2
l2 m2
Рис. 5
V = −m1 gl1 cos ϕ1 − m2 g(l1 cos ϕ1 + l2 cos ϕ2 ). Пользуясь тем, что ∂V ∂ϕ1
= ϕ1 = ϕ2 = 0
∂V ∂ϕ2 18
= 0, ϕ1 = ϕ2 = 0
запишем приближенное значение потенциала вблизи положения равновесия V ≈
1 (m1 + m2 )gl1 ϕ21 + m2 gl2 ϕ22 . 2
Теперь посчитаем кинетическую энергию. Ясно, что T = 12 (m1 v12 + m2 v22 ), а значит, необходимо найти скорости точек m1 и m2 . Чтобы упростить себе жизнь, скорость второй точки сразу будем искать приближенно. Опуская тривиальные выкладки, запишем окончательный результат v12 = l12 ϕ˙ 21 , v22 ≈ (l1 ϕ˙ 1 + l2 ϕ˙ 2 )2 , откуда
1 1 T ≈ m1 l12 ϕ˙ 21 + m2 (l1 ϕ˙ 1 + l2 ϕ˙ 2 )2 . 2 2 Для простоты будем полагать единицы измерения и свойства рассматриваемой системы такими, чтобы выполнялись равенства m1 = m2 = 1, l1 = l2 = 1, g = 1. В этом случае выражения для T и V станут короче: T ≈
1 1 2ϕ˙ 21 + 2ϕ˙ 1 ϕ˙ 2 + ϕ˙ 22 , V ≈ 2ϕ21 + ϕ22 . 2 2
Теперь уже ясно, что матрицы A и C, введенные в предыдущем параграфе, в данном случае имеют вид 2 1 2 0 A= , C= . 1 1 0 1 Решая систему
находим κ1,2 = 2 ±
√
2κ − 2 κ = 0, det(Aκ − C) = κ κ − 1
2 — квадраты частот малых колебаний.
1.3.4. Уравнения Рауса До сих пор мы рассматривали фазовые переменные вида q 1 , . . . , q m , q˙1 , . . . , q˙m . Посмотрим, что можно получить, перейдя2 от них к переменным q 1 , . . . , q m , q˙1 , . . . , q˙κ, pκ+1 , . . . , pm , где переменные pα определяются так: pα =
∂T = aαr q˙r + aαβ q˙β . ∂ q˙α
(25)
Замечание. Индексация переменных здесь такова: j, k = 1, . . . , m, r, s = 1, . . . , κ и (в отличие от предыдущих разделов!) α, β = κ + 1, . . . , m. «Недостающие» старые координаты находятся из системы q˙α = aαβ (pβ − aβs q˙s ) ,
(26)
где величины aαβ есть элементы матрицы, обратной к (aαβ ), то есть aαβ aβγ = δγα . Ясно, что такая система всегда разрешима (её матрица является угловым минором положительно определённой квадратичной формы). Определение. Функцией Рауса называется функция вида R = L − pα q˙α = R(q 1 , . . . , q m , q˙1 , . . . , q˙κ, pκ+1 , . . . , pm ), 2
Впервые это предложил сделать Раус (E. Routh).
19
(27)
где L = T − V — функция Лагранжа.
Утверждение 1.8. Функция Рауса представима в виде R = R2 + R1 + R0 ,
где • R2 = 21 brs (q)q˙r q˙s , brs = ars − aαβ aαr aβs ; • R1 = br (q, p)q˙r , br = −arα aαβ pβ ; • R0 = −W, W = V + 21 aαβ pα pβ . Величина W называется приведенной потенциальной энергией. На всякий случай не поленюсь и приведу опущенные лектором выкладки: 1 R = T − V − pα q˙α = ajk q˙j q˙k − pα aαβ (pβ − aβs q˙s ) − V = 2 1 1 = ars q˙r q˙s + aαβ q˙α q˙β − pα aαβ (pβ − aβs q˙s ) − V = 2 2 1 1 = ars q˙r q˙s + aαβ aαβ aβα (pβ − aβs q˙s )(pα − aαr q˙r ) − pα aαβ (pβ − aβs q˙s ) − V = 2 2 1 1 1 = ars q˙r q˙s − aαβ pα (pβ − aβs q˙s ) − aαr aαβ q˙r (pβ − aβs q˙s ) − V = 2 2 2 1 1 1 1 ars − aαβ aαr aβs q˙r q˙s − aαs aαβ pβ q˙s + aαr aαβ pβ q˙r − V + aαβ pα pβ . = 2| 2{z {z } | 2 {z 2 } | } brs
br q˙r
Теорема 1.9 (Уравнения Рауса). d ∂R ∂R − = 0, r = 1, . . . , κ; dt ∂ q˙r ∂q r ∂R ∂R q˙α = − , p˙α = α , α = κ + 1, . . . , m. ∂pα ∂q
W
(28)
Следует из уравнений Лагранжа (22) и определения функции Рауса (27). 1.3.5. Циклические координаты
Определение. Координата q α называется циклической, если от неё не зависит функция Лагранжа, то есть ∂L = 0. ∂q α Координаты, не являющиеся циклическими, называются позиционными. Утверждение 1.10. Если q α — циклическая координата, то pα = cα = const (так называемый циклический интеграл). Подставим определение pα (25) в уравнения Лагранжа: d d ∂T ∂L pα = = = 0, dt dt ∂ q˙α ∂q α 20
то есть pα постоянна на траекториях системы. Определение. Система называется приведенной по Раусу, если для всех α, таких, что координата q α — циклическая, и только для них, вместо фазовых координат q˙α взяты координаты pα . Уравнения (28) для такой системы имеют вид d ∂R ∂R − r =0 r ∂q dt ∂ q˙ ∂R (29) q˙α = − , ∂pα p˙α = 0.
Первая часть этих уравнений замкнута относительно q r . Можно переписать ее в следующем виде (пользуясь представлением R = R2 + R1 + R0 ): d ∂R2 ∂R2 d ∂R1 ∂R1 ∂W + r = 0. − + − r r r r dt ∂ q˙ ∂q dt ∂ q˙ ∂q ∂q | {z } grs q˙s
При этом элементы кососимметрической матрицы (grs ) задаются следующим образом: grs =
∂bs ∂br − r, s ∂q ∂q
а W — приведенная потенциальная энергия. В самом деле, R1 = br q˙r , поэтому d ∂R1 d ∂br = br = s q˙s r dt ∂ q˙ dt ∂q
и
∂R1 ∂bs = r q˙s . r ∂q ∂q
Определение. Состояние q0r называется положением равновесия приведённой системы (29), если ∂W q r = q0r , q˙r = 0, = 0. ∂q r q = q0 Определение. Положениям равновесия приведенной системы соответствуют стационарные движения исходной системы: подставляя q r = q0r в (29), получаем уравнения этих движений q r = q0r , q˙r = 0, q˙α = q˙0α , q α = q0α + q˙0α (t − t0 ). Замечание. Непосредственно из (26) получаем q˙β = aβγ cγ , где константы cγ — те самые, которые определяются в утверждении 1.10. Таким образом, стационарные движения образуют семейства, параметризованные константами циклических интегралов. Теперь, как и в случае обыкновенных положений равновесия, сделаем замену xr = q r − q0r и выпишем уравнения малых колебаний в окрестности положения равновесия приведенной системы. Все вычисления будем сразу проводить с точностью до o(x2 + x˙ 2 ). Итак, ∂br r r R1 = br (q0 + x)x˙ = br (q0 )x˙ + xs x˙ r . ∂q0s 21
Так будет выглядеть R1 , а сами уравнения движения будут такими: 0 s b0rs x¨s + grs x˙ + c0rs xs = 0,
r = 1, . . . , k,
где b0rs
0
0 grs
= brs (q ),
c0rs
= grs (q0 ),
∂2W = r s ∂q ∂q
. q = q0
Можно переписать их в матричном виде: B x¨ + Gx˙ + Cx = 0. По сравнению со случаем обычного положения равновесия здесь добавилась кососимметрическая матрица G — матрица так называемых гироскопических сил. «Нормальным» в этом случае называют следующий вид этих уравнений: ξ¨ + Γξ˙ + Kξ = 0, где K определяется так же, как и в случае обыкновенного положения равновесия, а вот матрица Γ, конечно, уже не будет диагональной. 1.3.6. Пример: волчок Лагранжа в углах Крылова z z1 η z2 = ζ
y1 = y2 α
γ
β
α y β
γ
x = x1 ξ x2
Рис. 6
Вначале определим углы Крылова (рис. 6 ). Обозначать их будем просто — α, β, γ. Они задаются следующим образом: поворот системы Oxyz вокруг оси x на угол α должен переводить ее в Ox1 y1 z1 , такую, что линия пересечения плоскостей Oξη и Ox1 y1 совпадает с Oy1; далее, поворот Ox1 y1 z1 вокруг Oy1 на угол β переведет ее в Ox2 y2 z2 , в которой Oz2 = Oζ; и, наконец, поворот вокруг Oz2 = ζ на угол γ окончательно совместит системы. В этих углах скорость подвижного (с закрепленным началом) репера Oeξ eη eζ имеет вид ˙ y + γe ˙ ζ = peξ + qeη + reζ . ω = αe ˙ x + βe 1 Выразим коэффициенты p, q, r через углы Крылова: ˙ p = α˙ cos β cos γ + β sin γ, q = −α˙ cos β sin γ + β˙ cos γ, r = α˙ sin β + γ. ˙ 22
В этих обозначениях кинетическая и потенциальная энергия волчка Лагранжа будут иметь следующий вид: 1 1 2 2 2 ˙ T = A α˙ cos β + β + (α˙ sin β + γ) ˙ 2 , V = mg cos α cos β. 2 2
Теперь уже легко видеть, что γ — циклическая переменная, а циклический интеграл имеет вид ∂L ∂L ∂T =0⇒ = = C (α˙ sin β + γ) ˙ = Cω = const . ∂γ ∂ γ˙ ∂ γ˙ Отсюда, пользуясь тем, что γ˙ = ω˙ − α˙ sin β, получим ˙ ω). R = T − V − Cω γ˙ = R(α, β, α, ˙ β, Слагаемые стандартного разложения R = R2 + R1 + R0 будут выглядеть так: 1 R2 = (α˙ 2 cos2 β + β˙ 2 ), R1 = Cω α˙ sin β, R0 = −mg cos α cos β. 2 Положение равновесия приведенной системы, таким образом, будет при ∂R0 ∂R0 = = 0, α = β = 0. ∂α ∂β Стационарные движения при этом будут такими: α = β = α˙ = β˙ = 0, γ˙ = ω. Отбрасывая члены старше второго порядка, вблизи положения равновесия приведенной системы получим: 1 1 R2 ≈ A(α˙ 2 + β˙ 2 ), R1 ≈ Cω αβ, ˙ R0 = mgS (α2 + β 2 ). 2 2 Можно, наконец, написать уравнения малых колебаний: ( A¨ α + Cωβ − mgS α = 0, Aβ¨ − Cω α˙ − mgS β = 0. Лучше переписать эту систему в комплексной форме, вводя угол ϕ = α + iβ: Aϕ¨ − Cωiϕ˙ − mgS ϕ = 0. Характеристическое уравнение этого диффура будет таким: Aλ2 − Cωiλ − mgS = 0, а его решения будут выглядеть так: λ1,2 =
Cωi ±
p
−C 2 ω 2 + 4AmgS . 2A
Следствие 1.4 (условие Майевского). Если C 2 ω 2 − 4AmgS < 0, то уравнения малых колебаний имеют экспоненциально растущие решения. 23
2. Гамильтонов формализм 2.1. Уравнения Гамильтона Рассмотрим голономную механическую систему под действием потенциальных сил; q j — обобщенные координаты, q˙j — обобщённые скорости. Как мы уже знаем, функция Лагранжа в этих координатах имеет вид: 1 L = L(q, q, ˙ t) = ajk (t, q)q˙j q˙k + aj (t, q)q˙j + a0 (t, q) 2 и удовлетворяет уравнению Лагранжа d ∂L ∂L − j = 0. j dt ∂ q˙ ∂q
(1)
Рассматривая функцию Рауса, мы, фактически, заменяли часть скоростей на импульсы; теперь заменим все: ∂L pj = j = ajk q˙k + aj . (2) ∂ q˙ Замечание наборщика. На всякий случай поясняю: первое равенство можно считать определением импульса, а второе следует из утверждения 1.6.
Равенство (2) можно обратить, получив выражение для скоростей через импульсы: q˙j = ajk pk − ajk ak ,
(3)
где ajk , как обычно, — элементы матрицы, обратной к (ajk ), то есть ajk akl = δlj . Определение. Функцией Гамильтона, или гамильтонианом описываемой системы будем называть функцию H = H(t, q, p) = pj q˙j − L. (4) Утверждение 2.1. H = H2 + H1 + H0 , где 1 1 H2 = ajk pj pk , H1 = −ajk ak pj , H0 = ajk aj ak − a0 . 2 2 Формы H2 и H1 называются, соответственно, квадратичной и линейной формами импульсов. Опять-таки, следует из утверждения 1.6, а также, разумеется, из (3) и (4). Теорема 2.2 (Уравнения Гамильтона). q˙j =
(5)
Первое уравнение следует непосредственно из (4), а второе из (1) и (2).
Следствие 2.1.
∂H ∂H , p˙j = − j , j = 1, . . . , m. ∂pj ∂q
∂H dH = . ∂t dt
Имеем dH ∂H ∂H j ∂H ∂H ∂H ∂H ∂H ∂H ∂H = + j q˙ + p˙j = + j − = , j dt ∂t ∂q ∂pj ∂t ∂q ∂pj ∂pj ∂q ∂t
что и требовалось доказать. Следствие 2.2. Если ∂H = 0 (то есть время не входит в гамильтониан явно), имеет ∂t место первый интеграл H = h = const. 24
2.2. Функционал действия и его вариации 2.2.1. Принцип наименьшего действия Гамильтона – Остроградского В этом разделе мы будем рассматривать голономную механическую систему под действием потенциальных сил. Пусть, как обычно, q = (q 1 , . . . , q m ) — обобщенные координаты и L = = L(t, q, q) ˙ — функция Лагранжа. Определение. Действием по Гамильтону называется функционал вида W = W (q) =
Zt1
L(t, q, q)dt. ˙
(6)
t0
При этом предполагается, что моменты времени t0 и t1 фиксированы, а функция q = q(t) удовлетворяет условиям q(t0 ) = q0 , q(t1 ) = q1 . Ясно, что функцию q(t) можно рассматривать как «траекторию» системы в пространстве обобщенных координат (см. рис. 10 ). Среди всех допустимых (то есть проходящих через точt A1
t1
q(t) t0
qr (t) A0 q0
q1
q
Рис. 10
ки A0 и A1 ) траекторий нам интересны прежде всего те, которые соответствуют реальным положениям системы. Сформулируем это более строго. Определение. Траекторию qr , удовлетворяющую уравнению Лагранжа (1), мы будем называть «прямой» или «действительной», все остальные тракетории — «окольными». Параметризуем все допустимые траектории с помощью некоторого вещественного параметра α: положим q = q(t, α), α ∈ [−γ, γ]; параметризацию выбираем так, чтобы q(t, 0) = qr . Параметр α выбираем не зависящим от времени. Определение. Вариацией траектории будем называть следующую величину: δq =
∂q δα. ∂α
Замечание наборщика. Вариацию можно понимать как дифференциал при замороженном времени. Пусть дана некоторая величина, скажем, y, которая зависит от независимых переменных x и t (t — время). В таком случае полный дифференциал этой величины, как известно, имеет вид: dy =
∂y ∂y dx + dt. ∂x ∂t
А вариация будет равна ∂y ∂y dx = δx, ∂x ∂x так как для величин, не зависящих от времени, очевидно, d = δ. Теперь становится понятно, что в определении вариации можно было бы написать: δy =
δq =
∂q dα. ∂α
25
При этом под функцией q(t, α) подразумевается функция вида q(t, α) := q(t) + αh(t), где h — произвольная гладкая функция, равная нулю на концах отрезка [t0 , t1 ].
Такая параметризация позволяет рассматривать функционал действия как функцию параметра α: W (q) = W (α). Замечание. Ясно, что вариация производной есть производная вариации: ∂ q˙ ∂2q δ q˙ = δα = δα = (δq) . ∂α ∂t∂α Этим фактом мы будем неоднократно пользоваться в дальнейшем. Все дело здесь в том, что, как уже упоминалось, параметр α не зависит от t (мы параметризуем траектории целиком, а не отдельные точки на них), поэтому операция варьирования является изохронной и перестановочна с дифференцированием по времени. Теперь мы можем сформулировать и доказать теорему, составляющую суть принципа наименьшего действия Гамильтона – Остроградского. Теорема 2.3. Вариация функционала действия равна нулю на решениях уравнений Лагранжа (1) и только на них: Zt1 δW = δ L(t, q, q)dt ˙ = 0 ⇔ (1). (7) t0
Ключевым соображением при доказательстве этого факта является использование изохронности вариации по α, в силу которой варьирование перестановочно с дифференцированием, а значит и с интегрированием по t. Поэтому можем записать:
δW = δ
Zt1
L(t, q, q)dt ˙ =
t0
Zt1
δL(t, q, q)dt ˙ =
t0
=
Zt1
t0 !!
=
Zt1 ∂L ∂L ∂L ∂L ! !! · δq + · δ q˙ dt = · δq + · (δq) dt = ∂q ∂ q˙ ∂q ∂ q˙
t1 ∂L · δq + ∂ q˙ t0
t0
Zt1
t0
Zt1 ∂L d ∂L ∂L d ∂L !!! · δq − · δq dt = − · δq dt. ∂q dt ∂ q˙ ∂q dt ∂ q˙ t0
При переходе «!» мы воспользовались перестановочностью операций варьирования и дифференцирования, «!!» — это просто интегрирование по частям, и, наконец, «!!!» следует из того, что вариация равна нулю в точках t0 и t1 . Теперь уже ясно, что на решениях уравнений Лагранжа δW = 0. Убедимся, что обратное утверждение также выполнено. Действительно, пусть это не так. Это означает, что найдутся такая точка t∗ и такой номер i в пределах от единицы до k, что d ∂L ∂L = 6 dt ∂ q˙i ∂q i
26
. t = t∗
В силу непрерывности всех всех входящих в него функций, это неравенство будет выполнено в некоторой ε-окрестности точки t∗ , откуда немедленно3 получаем, что вариация интеграла действия не будет равна нулю. Полученное противоречие доказывает теорему. Замечание. Вообще говоря, из доказанной теоремы следует только стационарность, но не минимальность функционала действия на траекториях, удовлетворяющих уравнениям Лагранжа. Однако, если краевые условия (t0 , q0 ) и (t1 , q1 ) достаточно близки друг к другу, то на таких траекториях действительно будет достигаться минимум. Тот же принцип наименьшего действия можно сформулировать в несколько другой форме. Для этого перейдем к обобщенным координатам (q, p), где p=
∂L , ∂ q˙
а вместо функции Лагранжа будем рассматривать функцию Гамильтона H = H(t, q, p), которая, как уже было доказано, удовлетворяет уравнениям Гамильтона (5). Введем также функцию Λ, которую определим следующим образом: Λ := (p · q) ˙ − H(t, p, q) = Λ(t, q, q, ˙ p, p), ˙ при этом в силу уравнений Гамильтона получаем ∂Λ = 0. ∂p В силу уравнений Гамильтона (5) эта функция удовлетворяет следующим соотношениям: d ∂Λ ∂Λ = , dt ∂ q˙ ∂q
d ∂Λ ∂Λ = . dt ∂ p˙ ∂p
Поэтому, действуя аналогично доказательству теоремы 2.3, можно убедиться в справедливости другой формулировки принципа Гамильтона – Остроградского: δ
Zt1
[(p · q) ˙ − H(t, q, p)] dt = 0.
t0
Замечание. Ясно, что в этой формулировке принцип наименьшего действия будет выполнен лишь в том случае, если мы зафиксируем не только начальный и конечный моменты времени t0 и t1 , но и соответствующие им положения системы (q0 , p0 ) и (q1 , p1 ), причем эти положения должны лежать на действительной траектории. Замечание. На действительных траекториях имеем: Λ = (p · q) ˙ − H = (p · q) ˙ − ((p · q) ˙ − L) = L. 3
Стандартный приём: нужно выбрать подходящую вариацию, не равную нулю там где надо. — Прим. вред.
27
2.2.2. Интегральные инварианты Рассмотрим задачу Коши на функции p = p(s, t) и q = q(s, t) (где s — некоторый параметр из отрезка [0, l]), определяемую уравнениями Гамильтона (5) и краевыми условиями вида q(0, s) = q0 (s), p(0, s) = p0 (s); q0 (l) = q0 (0), p0 (l) = p0 (0). t
C
t0
C0 p
q
Рис. 11
Теорема 2.4 (Универсальный интегральный инвариант Пуанкаре). Пусть C — некоторое сечение трубки решений плоскостью t = const (см. рис. 11). Тогда I I ∂q δs. (8) Ip = (p · δq) = const = (p · δq) , где δq = ∂s C
C0
Доказательство получаем прямой выкладкой, интегрируя по частям:
dIp d = dt dt
I C
=
I C
(p · δq) =
I C
δ (p · q) ˙ +
[(p˙ · δq) + (p · (δq) )] = I C
I
[(p˙ · δq)] + (p · δ q) ˙ =
C I I ∂H ∂H ! [(p˙ · δq) − (q˙ · δp)] = − · δq − · δp = − δH = 0. ∂q ∂p C
C
При переходе «!» мы воспользовались уравнениями Гамильтона, а так же тем, что первое слагаемое в левой части, очевидно, равно нулю. Обратное утверждение также будет верным. Теорема 2.5. Если трубка решений системы дифференциальных уравнений (9)
q˙ = Q(t, q, p), p˙ = P (t, q, p) удовлетворяет условию инвариантности I Ip = (p · δq) = const, C
то существует такая функция H, относительно которой уравнения (9) имеют форму уравнений Гамильтона (5). Вновь все сводится к аналогичной выкладке: I I I I dIp = [(p˙ · δq) + (p · δ q)] ˙ = δ (p · q) ˙ + [(p˙ · δq) − (δp · q)] ˙ = [(P · δq) − (Q · δp)] = 0. dt C
C
C
C
28
Так как последнее равенство выполнено для произвольного контура C, подынтегральное выражение должно иметь вид полного дифференциала. То есть для некоторой функции H получим (P · δq) − (Q · δp) = −δH(t, q, p), откуда немедленно следует, что P =−
∂H ∂H ,Q= , ∂q ∂p
что и требовалось доказать. Теорема 2.6 (Интегральный инвариант Картана). Если C — произвольный замкнутый контур на трубке решений, то I I Ic = [(p · dq) − Hdt] = const = [(p · dq) − Hdt] . (10) C
C0
Обратное утверждение также верно, а именно: если на трубке решений выполнено (10), то функция H удовлетворяет уравнениям Гамильтона (5). Без доказательства. Замечание наборщика. Интересующиеся могут прочесть доказательство, а также правильную интерпретацию всей этой науки, в книге В. И. Арнольда «Математические методы классической механики». Замечание наборщика. В такой формулировке этот инвариант приводился на лекциях: I I Ic = [(p · δq) − Hδt] = const = [(p · δq) − Hδt] . C
(11)
C0
Имеются, однако, все основания полагать, что данная формулировка не является верной. При написании текущей версии лекций были использованы дополнительные источники, в частности, лекции по теоретической механике Г. Н. Яковенко и книжка «Общая теория вихрей» В. В. Козлова.
2.2.3. Уравнения Уиттекера и Якоби В силу интеграла энергии H(q, p) = h = const, мы можем выразить p1 через остальные координаты: p1 = −K(q 1 , . . . , q n , p2 , . . . , pn , h).
(12)
Замечание. В связи с такими обозначениями, нам будет удобно везде в этом разделе полагать, что индекс k изменяется в пределах от двойки до n. Пользуясь таким представлением, можно записать I I (p · δq) = pk · δq k − Kδq 1 = const . C
Введем также величины
C
dq k qb = 1 , dq k
Имеем 0=
dH ! ∂H ∂H ∂K = k− k dq ∂q ∂p1 ∂q k
!!
⇔
pbk =
dpk . dq 1
∂H ∂K = −p˙k = q˙1 k k ∂q ∂q 29
⇔
−
∂ p˙k ∂K = k. 1 ∂ q˙ ∂q
Здесь «!» следует из правил дифференцирования сложной функции, а «!!» — из уравнений Гамильтона. Теперь, пользуясь тем, что qbk =
dq k dq k /dt q˙k = = , dq 1 dq 1 /dt q˙1
(13)
получаем так называемые уравнения Уиттекера (E. T. Whittacker): qbk =
∂K , ∂pk
pbk = −
∂K . ∂q k
(14)
Таким образом, с помощью интеграла энергии мы понизили порядок наших уравнений на два, пожертвовав при этом, однако, автономностью: в исходных уравнениях дифференцирование было по t, а само t в них не фигурировало, а в полученных переменная дифференцирования q1 , вообще говоря, присутствует как параметр функции K. Что касается t, его из этих уравнений можно выразить следующим образом. Пусть q k = ϕk (q 1 , h, c),
pk = ψk (q 1 , h, c),
где c — некоторый набор констант: c ∈ R2n−2 — некоторые решения уравнений (14). Кроме того, введем функцию p1 = ψ1 (q 1 , h, c). Наконец, можем записать: q˙1 = откуда получаем
∂H(q, p) ∂p1
= ϕ1 (q 1 , h, c), qk
=
ϕk , p
i
= ψi
Z
dq 1 + c2n−1 . t= ϕ1 Видно, что уравнения Уиттекера получены на основе уравнений Гамильтона; ничего не мешает, однако, построить аналогичную конструкцию для уравнений Лагранжа. Впервые это проделал Якоби, и получаемые таким образом уравнения носят его имя: d ∂P ∂P = k, 1 k dq ∂b q ∂q
k = 2, . . . , n,
где функция P определяется следующим образом: !
!!
P = P (q 1 , q 2 , . . . , q n , qb2 , . . . , qbn , h) := (pk qbk − K) = pi qbi =
pi qbi (p · q˙i ) !!! 2T aij (q)q˙iq˙j = = = . qb1 q˙1 q˙1 q˙1
Переход «!» следует из (12), кроме того, в «!» и «!!» используется тот очевидный факт, что qb1 = 1. В «!!!» мы пользуемся тем, что в данном случае мы предполагаем T = T2 = 12 (p · q). ˙ Введём еще одно обозначение: 2G := aij (q)b q i qbj , тогда
2T = aij (q)q˙iq˙j = (q˙1 )2 aij (q)b q i qbj = (q˙1 )2 · 2G ⇒ q˙1 =
Таким образом, окончательно функцию P можно записать в виде
p
T /G.
p √ 2T = 2 T G = 2 (h − V (q))G(q, qb) = P (q, qb, h). P =p T /G 30
2.2.4. Принцип наименьшего действия в форме Мопертюи – Лагранжа и Якоби Здесь мы также будем полагать, что T = T2 . Кроме того, мы зафиксируем начальное и конечное положения системы q0 и q1 , но не моменты времени, им соответствующие (то есть допустимыми будут любые траектории с началом на прямой q = q0 и окончанием на прямой q = q1 — см. рис. 12 ). Рассмотрим функционал действия в виде: 1
W∗ =
Zq1
P dq 1 .
q01 t
A1
q(t) qr (t) A0 q0
q1
q
Рис. 12
Заметим, что P dq 1 = 2T dt, поэтому можем записать δ
Zt1
2T dt = 0.
t0
Это и есть принцип наименьшего действия в форме Мопертюи – Лагранжа. Однако, такая форма для практических вычислений очень неудобна. Гораздо удобнее форма Якоби: Zq1 p δ 2(h − V (q))ds = 0, q0
где метрика определяется так: ds2 = aij (q)dq idq j .
2.3. Канонические преобразования 2.3.1. Групповые свойства канонических преобразований Итак, мы будем рассматривать механические системы, удовлетворяющие уравнениям Гамильтона ∂H ∂H q˙ = , p˙ = − , (15) ∂p ∂q где H = H(q, p, t) — гамильтониан, а q ∈ M n ⊂ Rn . Можно переписать их в векторной форме: z˙ = J
∂H , ∂z
где En — единичная матрица, а q z= , p
J= 31
0 En . −En 0
(16)
Ясно, что матрица J удовлетворяет следующим свойствам: J T = J −1 = −J,
J 2 = −E2n ,
det J = 1.
От координат q, p ничего не мешает перейти к новым координатам qe, pe : q, p
qe, pe:
qe = qe(p, q, t),
pe = pe(q, p, t).
(17)
Функции перехода также можно переписать в векторной форме: z
ze,
(18)
ze = ze(z, t).
Мы будем рассматривать только те преобразования, для которых ze(z, t) ∈ C2 и матрица ∂ qe ∂ qe ∂e z ∂q ∂p M= = ∂ p e ∂ pe ∂z ∂q
(19)
∂p
невырождена. Из этого следует существование обратного преобразования z = z(e z , t), удовлетворяющего тем же свойствам. Определение. Преобразование (17) (оно же (18)) называется каноническим, если для некоторой положительной константы c (называемой валентностью преобразования) оно удовлетворяет условию M T JM = cJ. (20) Преобразование называется унивалентным, если c = 1 (то есть M в точности сохраняет форму J). Непосредственно из определения можно получить следующее свойство канонических преобразований: (det M)2 = c2n ⇒ det M = ±cn . В дальнейшем мы ограничимся рассмотрением только унивалентных преобразований. Однако результаты, которые будем для них получать, без труда обобщаются на случай произвольных канонических преобразований путём добавления в некоторых равенствах множителя c. Теорема 2.7. Канонические преобразования образуют группу. Замечание. На самом деле, мы докажем, что унивалентные преобразования образуют группу. Впрочем, для канонических преобразований доказательство выглядело бы абсолютно аналогично. Замечание. Для немного искушенных в алгебре доказательство данной теоремы для унивалентных преобразований состоит из одной фразы: «дифференциалы наших преобразований лежат в группе SP2n ». Нам нужно проверить выполнение групповых аксиом для унивалентных преобразований относительно операции композиции. Единичным элементом, таким образом, будет тождественное преобразование, которое, очевидно, является каноническим. Убедимся, что обратное к унивалентному преобразованию также является унивалентным. Нужно проверить, что (M −1 )T JM −1 = J. В самом деле, согласно (20), имеем (M −1 )T JM −1 = (M −1 )T M T JMM −1 = J. 32
Остаётся убедиться, что композиция двух унивалентных преобразований есть преобразование унивалентное. Итак, пусть z1 = z1 (z, t), z2 = z2 (z, t) — унивалентные преобразования с матрицами M1 и M2 соответственно. Положим ze = ze(z, t) := z2 (z1 (z, t), t).
Этому преобразованию будет соответствовать матрица M=
∂z2 ∂z1 ∂e z = = M2 M1 . ∂z ∂z1 ∂z
Ясно, что для неё также будет выполнено условие унивалентности: M T JM = M1T M2T JM2 M1 = M1T JM1 = J, что и требовалось доказать. 2.3.2. Критерии каноничности Определение. Скобкой Пуассона функций ϕ = ϕ(q, p, t) и ψ = ψ(q, p, t) будем называть выражение вида ∂ϕ ∂ψ ∂ϕ ∂ψ (ϕ, ψ) = s − . ∂q ∂ps ∂ps ∂q s Если же qe, pe получены из q, p с помощью преобразования (17), а функции ξ, η есть некоторые из функций q i , pj , введём скобку Лагранжа: [ξ, η] =
ps ∂e q s ∂e ps ∂e q s ∂e − . ∂ξ ∂η ∂η ∂ξ
Лемма 2.8. Преобразование (17) является каноническим тогда и только тогда, когда для любых индексов i, j выполняются следующие три условия i j [q , q ] = 0, [pi , pj ] = 0, (21) i i [q , pj ] = δj .
Доказательство сводится к тому, чтобы прямой выкладкой убедиться в справедливости следующего равенства: [q, q] [q, p] T M JM = . [p, q] [p, p]
Замечание. Совершенно аналогично доказывается, что каноничность также эквивалентна следующим условиям: i j q , qe ) = 0, (e (e pi , pej ) = 0, (22) i i (e q , pej ) = δj . Но такой критерий нам не понадобится.
33
Теорема 2.9. Преобразование (17) является каноническим тогда и только тогда, когда существует такая функция F , что
pi dq i − pei de q i + pei
∂F ∂e qi dt + dt = dF (q, p, t). ∂t ∂t
(23)
Равенство (23) может быть представлено в виде
pi dq i − pei de q i + pei
∂e qi ∂F dt + dt = ∂t ∂t ∂e qi ∂e qi ∂e qi ∂F ∂e qi dpj − pei dt + pei dt + dt = = pi dq i − pei j dq j − pei ∂q ∂pj ∂t ∂t ∂t ∂F ∂F ∂F ∂F = Xj dq j + Yj dpj + dt = j dq j + dpj + dt, ∂t ∂q ∂pj ∂t
где
откуда получаем
Xj = pj − pes Xj =
∂e qs , ∂q j
∂F , ∂q j
Yj = −e ps Yj =
∂e qs , ∂pj
∂F . ∂pj
Замечание наборщика. Следует отметить, что индекс j у величины Y не является нижним в обычном смысле слова. Достаточно понимать, что в произведении Yj dpj по нему ведётся суммирование. В дальнейшем мы будем писать этот индекс вверху.
Функция F у нас достаточно гладкая (у нас обычно всё достаточно гладкое), так что вторые частные производные, взятые в разном порядке, у неё должны совпадать. Итак, имеем: ∂Xj − ∂Xi = 0, ∂q i ∂q j ∂Y j ∂Y i − = 0, (24) ∂pi ∂pj ∂Y j ∂Xj − = 0. ∂pi ∂q i Преобразуем левую часть первого из этих условий:
∂Xj ∂Xi ∂e ps ∂e qs ∂ 2 qes ∂e ps ∂e qs ∂ 2 qes − = − − p e + + p e = [q i , q j ]. s s i j i j i j j i j i ∂q ∂q ∂q ∂q ∂q ∂q ∂q ∂q ∂q ∂q
Совершенно аналогично можно убедиться, что левая часть второго условия равна [pi , pj ], а третьего — δij − [q j , pi ]. Остаётся заметить, что мы получили ни что иное, как уже доказанное условие каноничности (21). Замечание наборщика. Эта теорема также формулировалась (и доказывалась) на лекциях несколько иначе, и, по-видимому, неверно.
2.3.3. Сохранение гамильтоновой структуры при канонических преобразованиях Теорема 2.10. При канонических преобразованиях сохраняется гамильтонова структура уравнений движения. То есть, если некоторая система удовлетворяет уравнениям Гамильe что тона (15), то при каноническом преобразовании вида (17) найдется такая функция H, e ∂H qe˙ = , ∂e p
e ∂H pe˙ = − . ∂e q
34
В силу теоремы 2.9, преобразования (17) тогда и только тогда каноничны, когда существует функция F , такая что выполнено условие (23). Положим qi ∂F e q , pe, t) = H(q, p, t) + pei ∂e H(e + , ∂t ∂t
причём в правую часть этого равенства вместо переменных q и p нужно подставить их выражения через qe и pe (как уже отмечалось в самом начале, мы рассматриваем лишь обратимые преобразования). e Проинтегрируем, польВ пространстве qe, pe, t возьмём произвольный замкнутый контур C. зуясь соотношениями (17), (23): I I I I ∂F ∂F i i i e pei de q − Hdt = pi dq + dt − dF − Hdt − dt = pi dq − Hdt − dF = const . ∂t ∂t e C
C
C
C
Второй интеграл в последнем равенстве равен нулю по теореме Стокса, а первый равен константе в силу теоремы об интегральном инварианте Картана. Эта же теорема гарантирует нам, e удовлетворяет уравнениям Гамильтона. что, что функция H
Замечание наборщика. И вновь вынужденное расхождение с лекциями... Что неудивительно: эта теорема опирается на две другие, которые уже были исправлены.
Замечание. Доказанную только что теорему иногда принимают за определение каноничности. 2.3.4. Теорема Лиувилля о сохранении фазового объёма Сейчас мы покажем, что процесс движения есть унивалентное каноническое преобразования. Ясно, что уравнения Гамильтона с заданными начальными условиями t0 , p0 , q0 можно рассматривать как задачу Коши. Её решения представляются в виде некоторых непрерывных функций от начальных условий: q = q(q0 , p0 , t),
p = p(q0 , p0 , t).
(25)
Теорема 2.11. Преобразование (25) является унивалентным каноническим. Пусть ∂z M= ∂z0 — матрица этого преобразования, записанного в векторной форме (18). Продифференцируем эту матрицу по времени: ∂z ∂ z ˙ ∂ ∂H ∂2H ∂ 2 H ∂z ∂2H ! M˙ = = = J =J =J 2 = J 2 M. ∂z0 ∂z0 ∂z0 ∂z ∂z0 ∂z ∂z ∂z0 ∂z Здесь «!» следует из того, что z0 не зависит от времени. Следовательно, учитывая, что J = −J T , имеем ∂2H M˙ T = −M T J. ∂z 2 Воспользовавшись этими двумя равенствами, получаем: d ∂2H ∂2H (M T JM) = −M T 2 M + M T J 2 2 M = 0. dt ∂z ∂z 35
Таким образом, матрица M T JM в каждый момент времени остаётся неизменной и совпадает с исходной, соответствующей моменту t = t0 и тождественному преобразованию M = E: M T JM = const = EJE = J. Замечание. Из доказательства этой теоремы ясно, что (det M)2 = 1, то есть det M = ±1. Однако, нам известно, что в начальный момент времени det M = 1, а значит, в силу непрерывности, это равенство выполнено при любом t. Теорема 2.12 (Лиувилль). Фазовый объём гамильтоновой системы сохраняется вдоль её решений. Эта теорема является простым следствием предыдущей. Однако, прежде чем её доказывать, следует прояснить формулировку. Пусть G0 — некоторая область в пространстве фазовых переменных p, q в начальный момент времени t0 . Рассмотрим сечение G множества фазовых кривых, проходящих через эту область, плоскостью t = const и его объём обозначим Vt . Теорема Лиувилля утверждает, что объём области G совпадает с объёмом G0 . Применяя теорему о замене переменных, получаем Z Z 1 n Vt = dq . . . dq dp1 . . . dpn = det Mdq01 . . . q0n dp01 . . . dp0n = V0 , G
G0
ибо, как только что было отмечено, det M = 1.
2.4. Уравнения Гамильтона – Якоби и теорема Лиувилля 2.4.1. Свободные канонические преобразования Определение. Каноническое преобразование вида (17) называется свободным, если ∂e q 6= 0. det ∂p Замечание. Не нужно путать это условие с условием невырожденности преобразования. Здесь мы отдельно требуем, чтобы невырожденным был правый верхний угол матрицы преобразования (19). Из невырожденности всей матрицы это никак не следует. Итак, в силу того, что для свободного канонического преобразования функция qe зависит от p невырождено, мы можем записать: ( p = p(q, qe, t) (26) pe = pe(q, qe, t) В этом разделе нам понадобится именно такая запись свободного канонического преобразования. Учитывая (26), перепишем соотношение (23): pi dq i − pei de q i + pei
∂e qi ∂F dt + dt = dF (q, p(q, qe, t), t) =: dS(q, qe, t). ∂t ∂t
Замечание наборщика. Следует отметить, что
∂S ∂F ∂e qi = + pei dt, ∂t ∂t ∂t
36
(27)
поэтому dS = pi dq i − pei de q i + pei
∂e qi ∂S dt + dt. ∂t ∂t
Определение. Функция S = S(q, qe, t), определённая выше, называется производящей функцией свободного канонического преобразования (26). Ясно, что для производящей функции выполняются соотношения p=
∂S , ∂q
pe = −
∂S . ∂e q
(28)
Утверждение 2.13. Если существует функция S = S(q, qe, t) ∈ C 2 с невырожденной матрицей вторых производных: 2 ∂ S det 6= 0, ∂q∂e q то уравнения (28) задают свободное каноническое преобразование. Легко понять, что для функции S будут выполнены соотношения (27), откуда немедленно следует каноничность заданных с её помощью преобразований. Кроме того p=
∂p ∂2S ∂S ⇒ = , ∂q ∂e q ∂qδe q
а про эту матрицу нам известно, что она невырождена, и, значит, обратная матрица также существует и невырождена. Согласно теореме 2.10 о сохранении гамильтоновой структуры при канонических преобразованиях, для преобразованной по формулам (28) системы также будет существовать функция Гамильтона e q , pe, t) = H(q, p, t) + ∂S , H(e ∂t причём в правую часть этого равенства вместо q и p следует подставлять их представление через преобразованные координаты и импульсы: q = q(e p, qe, t),
p = p(e p, qe, t).
Предположим теперь, что с помощью некоторого свободного канонического преобразования e = 0. В силу уравнений Гамильтона в ней также нам удалось получить систему, для которой H будут выполнены соотношения qe˙ = 0,
pe˙ = 0 ⇒ pe = α,
qe = β,
где α и β — некоторые n-мерные константы. В этом случае функции p = p(α, β, t),
q = q(α, β, t)
будут решением исходного уравнения Гамильтона. Таким образом, мы можем переписать уравнения Гамильтона в форме ∂S ∂S + H q, , t = 0, (29) ∂t ∂q
называемой уравнением Гамильтона – Якоби. Определение. Функция S = S(q, α, t) называется полным интегралом уравнения Гамильтона – Якоби (29), если 37
1. S удовлетворяет уравнению Гамильтона – Якоби (29); 2. S зависит от n произвольных констант α; 2 ∂ S 3. det ∂q∂α 6= 0.
Теорема 2.14 (Якоби). Если функция S(q, α, t) является полным интегралом уравнения (29), то общее решение уравнений Гамильтона (15) определяется формулами ∂S ∂S p= , β=− , (30) ∂q ∂α где β — некоторая n-мерная константа. Всё необходимое для доказательства этой теоремы у нас уже есть. В силу невырожденности матрицы вторых производных функции S мы можем однозначно восстановить функцию q = q(α, β, t), после чего из соотношений (30) получаем функцию p = p(α, β, t). Уравнениям Гамильтона – Якоби они будут удовлетворять по построению. Замечание. Пока не совсем ясно, какая от всего этого польза: мы просто заменили 2n обыкновенных дифференциальных уравнений одним уравнением в частных производных; никакого понижения порядка при этом не происходит. Уравнения Гамильтона – Якоби становятся полезней, если часть координт — циклические. Действительно, пусть q = (r, s) и координаты s — циклические, то есть ∂H = 0. ∂s В этом случае производящая функция представляется в виде S =: (b, s) + S ∗ (r, a, t), где a и b — некоторые константы соответствующих размерностей. Определённая таким образом функция S ∗ будет удовлетворять уравнению Гамильтона – Якоби: ∂S ∗ ∂S ∗ + H r, , b, t = 0. ∂t ∂r При этом S ∗ зависит от меньшего числа переменных. 2.4.2. Характеристическая функция Гамильтона В этом разделе мы будем рассматривать консервативные гамильтоновы системы, то есть системы, для которых ∂H = 0. ∂t Для таких систем полный интеграл уравнения Гамильтона – Якоби (29) будет иметь вид S =: −ht + V (q, α),
(31)
где h — некоторая величина, не зависящая от времени. Определение. Определённая выше функция V называется характеристической функцией Гамильтона. Непосредственно из уравнения (29) и определения полного интеграла получаем следующие свойства характеристической функции: 1. V ∈ C2 ; 2 ∂ V 2. det ∂q∂α 6= 0; 3. h = H q, ∂V . ∂q 38
2.4.3. Случай разделяющихся переменных Предположим теперь, что переменные в функции Гамильтона разделяются, точнее, пусть 1 1 ∂V n n ∂V H = H f q , 1 ,...,f q , n = h, ∂q ∂q
иначе говоря,
H = H(α1 , . . . , αn ), где
∂V ) = αi . ∂q i Характеристическая функция Гамильтона в этом случае будет иметь вид f i (q i ,
V = V1 (q 1 , α1 ) + . . . + Vn (q n , αn ). Введём обозначение
dVi = gi (q i , αi ), Vi = i dq Теперь несложно заметить следующий факт:
Z
gi (q i , αi )dq i.
∂f i ∂gj df i = = δki , ∂pj ∂αk dαk ∂f i ∂pj
то есть матрицы частных производных
и
∂gj ∂αk
являются взаимнообратными.
2.4.4. Пример: математический маятник Попробуем применить вышеописанную технику к исследованию этого классического примера (см. рис. 1 ). Для простоты полагаем, что единицы измерения выбраны так, чтобы выполнялись равенства m = 1, l = 1, g = 1. Тогда функции Лагранжа и Гамильтона этой системы будут выглядеть так: 1 L = ϕ˙ 2 + cos ϕ, 2
1 H = p2 − cos ϕ = h. 2
Отсюда находим выражение для характеристической функции Гамильтона: Z p V = 2(h + cos ϕ)dϕ. Можно показать, что этот интеграл не берётся в элементарных функциях.
2.4.5. Обобщённый случай разделяющихся переменных Мы находимся в рамках этого случая, если имеет место представление H(q, p) = f n (f n−1 , q n , pn );
f k = f k (f k−1 , q k , pk ),
k = 2, . . . , n − 1;
Кроме того, накладывается существенное условие невырожденности: характеристическая функция Лагранжа будет выглядеть так: 1
1
V = V1 (q , α ) +
n X i=2
39
Vi (q i, αi−1 , αi ).
∂f i ∂pi
f 1 = f 1 (q 1 , p1 ). 6= 0. В этом случае
Для самих функций f i будут выполнены тождества: 1 1 dV1 i i−1 i dVi f q , 1 = α1 , f α , q , i = αi , dq dq
i = 2, . . . , n.
Аналогично случаю полностью разделяющихся переменных, введём функции gi : dV1 = g1 (q 1 , α1 ), 1 dq
dVi = gi (q i , αi−1, αi ), i dq
Ясно, что при этом αn = h, а матрица вторых производных
i = 2, . . . , n. ∂2V ∂q∂α
будет двухдиагональной.
2.4.6. Теорема Лиувилля об интегрируемости в квадратурах Пусть H = H(q, p, t) — функция Гамильтона некоторой механической системы, удовлетворяющей уравнениям Гамильтона (15), а функции u = u(q, p, t) = u0 , v = v(q, p, t) = v0 — её первые интегралы. Прежде всего, отметим, что для этих функций выполнено очевидное соотношение ∂u + (u, H) = 0, ∂t где (·, ·) — скобка Пуассона. Действительно, 0=
du ∂u ∂u ∂q ∂u ∂p ∂u ∂u ∂H ∂u ∂H = + + = + − . dt ∂t ∂q ∂t ∂p ∂t ∂t ∂q ∂p ∂p ∂q
Определение. Первые интегралы u и v находятся в инволюции, если (u, v) = 0. Теорема 2.15 (Лиувилль). Если система имеет n первых интегралов fi (q, p, t) = ci ,
i = 1, . . . , n,
все они попарно находятся в инволюции друг к другу: (fi , fj ) = 0,
16i<j6n
и матрица частных производных ∂f невырождена, то система интегрируема по Лиувиллю ∂p (в квадратурах). Прежде всего отметим, что, в силу условия det ∂f 6= 0 найдутся функции ϕi такие, что ∂p pi = ϕi (q, t, c), где c = (c1 , . . . , cn ) — константы первых интегралов. Введём обозначение H ∗ (q, c, t) = H q, ϕ(q, t, c), t .
Прежде чем продолжать доказательство этой теоремы, сформулируем и докажем две вспомогательные леммы. Лемма 2.16. В условиях теоремы имеем: ∂ϕi ∂ϕj = , j ∂q ∂q i
Имеем
i, j = 1, . . . , n.
fr q, ϕ(q, t, c), c = cr 40
⇒
dfr = 0. dq i
Раскрывая последнее равенство, получаем, с одной стороны 0=
∂fr ∂fr ∂ϕj + , ∂q i ∂pj ∂q i
0=
∂fs ∂fs ∂ϕi + . ∂q j ∂pi ∂q j
а с другой стороны
s Теперь первое из них домножим на ∂f и просуммируем по i, второе домножим на ∂pi суммируем по j, после чего из первой суммы вычтем вторую. Вот что получится: ∂ϕi ∂fr ∂fs ∂ϕj 0 = (fr , fs ) + − j . ∂pj ∂pi ∂q i ∂q
∂fr ∂pj
и про-
Остаётся заметить, что первое слагаемое равно нулю (интегралы находятся в инволюции). Зна∂ϕ i чит, нулю должно быть равно и второе слагаемое, то есть матрицы ∂ϕ и ∂qij должны совпадать. ∂q j Лемма доказана. Лемма 2.17. В условиях теоремы имеем: ∂H ∗ ∂ϕi =− i , ∂t ∂q
Воспользуемся леммой 2.16: −
откуда
i = 1, . . . , n.
∂H dpi ∂ϕi ∂ϕi ∂q j ∂ϕi ∂ϕi ∂H = = + = + j , ∂q i dt ∂t ∂q j ∂t ∂t ∂q ∂pj ∂ϕi ∂H ∂H ∂ϕj ∂H ∗ = i − = − . ∂t ∂q ∂pj ∂q i ∂q i
Теперь перейдём к доказательству самой теоремы. Две только что доказанные леммы дают нам право утверждать: может существовать такая C2 -гладкая функция S(q, c, t), что ∂S = ϕi , ∂q i
∂S = −H ∗ . ∂t
Замечание наборщика. Собственно, этот факт нам никак в дальнейшем не поможет — разве только морально. А вот леммами мы ещё воспользуемся — в более разумных целях.
Будем искать функцию S в следующем виде: Z S = − H ∗ (q, c, t)dt + V (q, c), где V (q, c) = V1 (q 1 , . . . , q n , c) + V2 (q 2 , . . . , q n , c) + . . . + Vn (q n , c). Теперь вопрос об интегрировании системы сводится к нахождению функций Vi . Покажем, как определяются функции V1 и V2 — дальнейшие выкладки полностью аналогичны. Итак, имеем: Z ∂S ∂H ∗ ∂V 1 1 n p1 = 1 = ϕ1 (q , . . . , q , c, t) = − dt + , ∂q ∂q 1 ∂q 1 41
откуда
∂V 1 = ϕ1 (q 1 , . . . , q n , c, t) + ∂q 1
Z
∂H ∗ dt =: ψ1 (q 1 , . . . , q n , c). ∂q 1
Тот факт, что ψ1 действительно не зависит от t, проверяется легко, нужно только вспомнить лемму 2.17: ∂ψ1 ∂ϕ1 ∂H ∗ = + = 0. ∂t ∂t ∂q 1 Таким образом V1 =
Z
ψ1 (q 1 , . . . , q n , c)dq 1 .
Найдём V2 . Теперь выкладки будут несколько сложнее: Z ∂H ∗ ∂V1 ∂V2 ∂S 1 n p2 = 2 = ϕ2 (q , . . . , q , c, t) = − + 2 + 2, ∂q ∂q 2 ∂q ∂q Z Z Z ∂V2 ∂H ∗ ∂V1 ∂H ∗ ∂ψ1 1 = ϕ + dt − = ϕ + dt − dq =: ψ2 (q 2 , . . . , q n , c). 2 2 ∂q 2 ∂q 2 ∂q 2 ∂q 2 ∂q 2
Независимость от времени проверяется так же, а чтобы убедиться в независимости от q 1 , нам потребуется лемма 2.16: Z Z ∂ϕ2 ∂ϕ1 ∂2H ∗ ∂2H ∗ ∂ψ2 = − + dt − dt = 0. ∂q 1 ∂q 1 ∂q 2 ∂q 1 ∂q 2 ∂q 2 ∂q 1 Итак, V2 =
Z
ψ2 (q 2 , . . . , q n , c)dq 2 ,
и теорему можно считать доказанной.
Замечание. Если ∂H = 0, система имеет интеграл энергии H = h и нам достаточно найти ∂t ещё n − 1 первых интегралов. Так, для тяжелого твёрдого тела с неподвижной точкой (n = 3) есть имеют место интегралы H = h и Kz = k. Однако третьего интеграла в общем случае не существует.
2.5. Переменные «действие – угол» Будем рассматривать консервативную гамильтонову систему и каноническое преобразование с характеристической функцией Гамильтона V (q, pe). Пусть новые координаты удовлетворяют условиям e ∂H qe˙ = = ω(e p), pe˙ = 0, ∂e p то есть pe = pe0 , qe = ω(e p0 )t + qe0 . Такие переменные принято называть переменными «действие – угол» и обозначать I, ω.
Замечание наборщика. То есть ω будет в дальнейшем обозначать qe, если qe — переменная угол. Не путать с тем ω, которое фигурирует в приведенных выше выкладках!
42
2.5.1. Пример: простейший гармонический осциллятор Уравнения движения гармонического осциллятора имеют вид m¨ x + kx = 0, функция Лагранжа
1 1 L = mx˙ 2 − kx2 . 2 2 Для простоты полагаем m = 1, k = 1 (этого всегда можно добиться выбором подходящих единиц измерения). Гамильтониан запишется так: 1 1 H = p2 + x2 = h. 2 2 Ясно, что фазовый портрет такой системы состоит из концентрических окружностей вида p2 + x2 = 2h.
Определим переменную действие так: 1 I= 2π
I
1 pdx = 2π
I √
2h − x2 dx = {x =
√
1 2h 2h sin y} = 2π
Z2π
cos2 ydy =
0
1 = 2h 2π
Z2π
1 + cos 2y dy = 2πh. 2
0
Таким образом, переменной действия в данном случае будет просто интеграл энергии и, следоe = I. Характеристическая функция Гамильтона будет равна вательно, H Z Z √ Z √ V (x, I) = pdq = 2h − x2 dx = 2I − x2 dx, откуда находим переменную угол: ∂V = ω(I) = ∂I
Z
√
dx x = arcsin √ . 2I − x2 2I
Выражая через «старые» переменные, окончательно имеем: I=
p2 + x2 , 2
x ω = arcsin p . 2 p + x2
Осталось убедиться, что это действительно переменные действие – угол: ω˙ =
e ∂H = 1, ∂I
e ∂H I˙ = − = 0. ∂ω
43
2.5.2. Пример: математический маятник Напомним, что гамильтониан для математического маятника имеет вид H=
1 p2 − mgl cos ϕ. 2 ml2
Как обычно, будем предполагать, что m = 1, l = 1, g = 1. Тогда гамильтониан станет проще: 1 H = p2 − cos ϕ = h. 2 Теперь нам придётся рассмотреть два случая. Первый случай соответствует условию |h| < 1. В силу этого условия фазовые траектории замкнуты и система совершает малые колебания вблизи положения равновесия (маятник «качается»). Введём величину β такую, что − cos β = h. Выражая через неё импульс (точнее, его квадрат), получим 2 ϕ 2 2 ϕ 2 2 β p = 2(cos ϕ − cos β) = 4 sin − sin = 4 k1 − sin , 2 2 2 где, как несложно догадаться, k12 = sin2 β2 . Теперь запишем выражение для переменной действие 2πI =
I
Zβ r I r ϕ ϕ pdϕ = 2 k12 − sin2 dϕ = 8 k12 − sin2 dϕ = 2 2 0
ϕ = {sin = k1 sin ψ} = 16 2
Zπ/2
Zπ/2 2 k12 (1 − sin2 ψ)dψ k1 − 1 + 1 − k12 sin ψ p p = 16 = 1 − k12 sin2 ψ 1 − k12 sin2 ψ 0 0 π/2 Z q Zπ/2 dψ . p = 16 1 + k12 sin2 ψdψ − (1 − k12 ) 1 − k12 sin2 ψ 0
Итак, окончательно запишем:
I = I(k1 ) =
0
8 E(k1 ) − (1 − k12 )K(k1 ) , π
где E(k1 ) и K(k1 ) — эллиптические интегралы первого и второго рода соответственно. Теперь найдём переменную угол: −1 e e dH dH/dk 4k1 π E−K E 1 − k12 2π 1 ω˙ = = = = 4k1 − + K + 2k1 K = . dI dI/dk1 dI/dk1 8 k1 k1 k1 K(k1 ) Для полноты картины, выпишем характеристическую функцию: Z Z r Z 2 k1 − 1 + 1 − k12 sin2 ψ 2 ϕ 2 p V (ϕ, h) = pdϕ = 2 k1 − sin dϕ = 4 dψ = 2 1 − k12 sin2 ψ = 4 E (ψ, k1 ) − (1 − k12 )K (ψ, k1 ) ,
где E и K — эллиптические интегралы первого и второго рода. Теперь перейдём ко второму случаю: h > 1. При ϕ = 0 и p = p0 имеем: 1 2 h = p20 − 1 = 2 − 1, 2 k2 44
где величину k2 по определению полагаем такой, чтобы выполнялось равенство p20 =
4 . k22
Найдём переменную действие: 1 I= 2π
I
1 pdϕ = 2π
I p
1 2(h + cos ϕ)dϕ = πk2
Zπ r
1 − k22 sin2
ϕ dϕ = {ϕ = 2θ} = 2
−π
1 = πk2
Zπ/2 q 4 1 − k22 sin2 θdθ = E(k2 ). πk2
−π/2
Теперь угол: ω˙ =
e ∂ H/∂k 1 k2 K(k2 ) − E(k2 ) 2 =− 3 = . ∂I/∂k2 k2 E − K K − 22
И, наконец, характеристическая функция (выкладки пропущены, так не содержат в себе ничего нового): 4 ϕ , k2 . V (ϕ, h) = E k2 2
3. Теория устойчивости 3.1. Основные понятия теории устойчивости Приводимые здесь определения относятся скорее к теории ОДУ, чем к аналитической механике, но тем не менее не лишним будет их напомнить. Итак, мы будем рассматривать уравнения вида (1)
z˙ = Z(t, z),
где под z подразумеваются все фазовые переменные системы, а под t — время. А если говорить формально, t ∈ I = [0, +∞), а z принадлежит некоторой области D n в n-мерном (действительном) пространстве. Также будем предполагать, что Z(t, z) : I × D n → Rn ,
Z ∈ C1,1 .
Мы будем использовать следующие стандартные обозначения: z0 (t) = z(t, t0 , z0 ) — решение уравнения (1), проходящее через точку z0 в момент времени t0 ; z∗ (t) = z(t, t0 , z∗ ) — решение уравнения (1), проходящее через точку z∗ в момент времени t0 . Зафиксируем функцию y(t, z) : I × D n → Rn , y ∈ C1,1
45
(2)
Определение. Движение (то есть решение уравнения (1)) z0 (t) называется устойчивым по Ляпунову относительно функции y(t, z), если для любого t0 ∈ I и любого достаточно малого ε существует δ = δ(t0 , ε) такое, что ∆(t) = ky(t, z0 (t)) − y(t, z∗ (t))k 6 ε для любых значений t ∈ J = [t0 , +∞) и любых решений z∗ , если только kz0 − z∗ k < δ. В противном случае движение называется неустойчивым. Определение. Движение называется асимптотически устойчивым, если оно устойчиво и lim ∆(t) = 0.
t→+∞
Замечание. В дальнейшем мы будем считать, что размерность вектор-функции y(t, z) совпадает с размерностью z (так делал и сам Ляпунов). Более того, мы положим y ≡ z. Определение. Пусть z = z0 (t) + x, тогда уравнения
x˙ = Z(t, z0 (t) + x) − Z(t, z0 (t)) = X(t, x)
(3)
будем называть уравнениями возмущенного движения. При этом полагаем, что t ∈ I, x ∈ Bρ = {x ∈ Rn : kxk < ρ} , а функция X удовлетворяет условиям X(t, x) : I × Bρ → Rn ,
X ∈ C1,1 ,
X(t, 0) = 0.
Определение. Говорят, что V (t, x) — функция Ляпунова (обозначение: V (t, x) ∈ L ), если V (t, x) : I × Bρ → R,
V ∈ C1,1 ,
V (t, 0) = 0.
Замечание. В силу (3), очевидно, имеем dV ∂V V˙ (t, x) = = + dt ∂t
∂V ·X . ∂x
Определение. Будем говорить, что a(r) — функция Хана (обозначение: a(r) ∈ K ), если a(r) : [0, r0] → R,
a ∈ C,
a(0) = 0
и строго возрастает на [0, r0 ].
3.2. Теоремы Ляпунова и Четаева В этих теоремах часто мы будем писать просто «V (t, x)». Естественно, нужно понимать, что вместо буковки x мы будем подставлять туда решение x(t) (в противном случае неясно, какое отношение функция имеет к решению уравнения). Значок нормы будет обозначать обычную норму в Rn . Теорема 3.1 (А. М. Ляпунов). Если найдутся функции V ∈ L и a ∈ K такие, что 1. V (t, x) > a(kxk), 2. V˙ (t, x) 6 0, 46
то невозмущенное решение x = 0 системы (3) устойчиво. Выберем t0 ∈ I и ε > 0, с тем условием, однако, чтобы ε < ε0 = min{r0 , ρ}. Тогда, согласно определению функции Хана, a(ε) > 0, а значит найдется такое δ = δ(ε, t0 ) > 0, что V (t0 , x∗ ) < a(ε) для любого x∗ ∈ Bδ . Для такого x∗ , в силу первого условия теоремы, можно записать a(kx∗ (t)k) 6 V (t, x∗ (t)). С другой стороны, в силу второго условия, выполняется неравенство V (t, x∗ (t)) 6 V (t0 , x∗ (t0 )). Собирая полученные неравенства воедино, запишем a(kx∗ (t)k) 6 V (t, x∗ (t)) 6 V (t0 , x∗ (t0 )) < a(ε)
⇒
kx∗ (t)k < ε,
что и требуется. Замечание. Здесь нам не понадобилась непрерывность функции Хана, мы использовали только ее неубывание. Теорема 3.2. Если найдутся функции V (t, x) ∈ L и a, b, c ∈ K такие, что 1. a(kxk) 6 V (t, x) 6 b(kxk), 2. V˙ (t, x) 6 −c(kxk), то невозмущенное решение x = 0 системы (3) асимптотически устойчиво. Согласно предыдущей теореме, такое решение будет устойчиво, то есть в любой момент времени t0 и для любого положительного ε найдется такое δ = δ(t0 , ε) > 0, что для всех x∗ ∈ Bδ и всех t ∈ J = [t0 , +∞) выполнено kx∗ (t)k < ε. Таким образом, пользуясь условиями теоремы, получаем, что функция V (t, x∗ ) строго убывает по t и при этом 0 6 V (t, x∗ (t)) 6 b(ε). Следовательно, у функции V (t, x∗ (t)) существует предел lim V (t, x∗ (t)) = v > 0. t→∞ Покажем, что на самом деле v = 0. Допустим, что v > 0. Тогда: V (t, x∗ (t)) > v > 0
⇒
b(kx∗ (t)k) > v > 0
⇒
kx∗ (t)k > γ > 0
⇒
c(kx∗ (t)k) > c > 0.
С другой стороны, согласно второму условию теоремы, можем записать: V (t, x∗ (t)) = V (t0 , x∗ ) +
Zt
V˙ (t, x∗ (t)) dt 6 V (t0 , x∗ (t0 )) − c(t − t0 ).
t0
Отсюда следует, что, при достаточно больших значениях t функция V становится отрицательной, что противоречит условиям теоремы. Итак, мы доказали, что lim V (t, x∗ (t)) = v = 0. C другой стороны, по условию, t→∞
0 6 a(kx∗ (t)k) 6 V (t, x∗ (t)), откуда lim a(kx∗ (t)k) = 0,
t→+∞
а значит и lim kx∗ (t)k = 0,
t→+∞
что и требовалось доказать. 47
Теорема 3.3 (Н. Г. Четаев). Если найдется такое t0 ∈ I и такое достаточно малое ε, а также открытая область Ω ⊂ Bε , такая, что 0 ∈ ∂Ω и функции V ∈ L , a ∈ K , удовлетворяющие условиям Bε 0
Ω
Рис. 7
1. 0 < V (t, x) 6 M для всех x ∈ Ω и t ∈ J, где M = const, 2. V˙ (t, x) > a(V ) для всех x ∈ Ω и t ∈ J, 3. V (t, x) = 0 при любых x ∈ ∂Ω ∩ Bε и t ∈ J, то невозмущенное движение x = 0 системы (3) неустойчиво. Для любого положительного δ < ε найдется такое x∗ ∈ Bδ ∩ Ω, что V (t0 , x∗ ) > 0. Если допустить, что x∗ (t) ∈ Ω при любом t ∈ J, получим V (t, x∗ (t)) = V (t0 , x∗ ) +
Zt
V˙ (t, x∗ (t)) dt > V (t0 , x∗ ) + a V t0 , x∗ (t0 )
t0
(t − t0 ),
что противоречит условию ограниченности V . Следовательно, найдется такое t1 ∈ J, что x∗ (t1 ) ∈ ∂Ω и при этом V (t1 , x∗ (t1 )) > 0, а значит, по третьему условию теоремы, x∗ (t1 ) ∈ / ∂Ω∩Bε . Таким образом, неизбежно получаем kx∗ (t1 )k = ε, что и завершает доказательство.
3.3. Пример: волчок Эйлера Замечание наборщика. Напомню, что волчок Эйлера — это твердое тело с неподвижным центром масс в однородном поле тяжести. Через A, B, C мы обозначаем главные моменты инерции (предполагая при этом, что все они попарно не равны друг другу), а через p, q, r — компоненты угловой скорости.
Уравнения движения волчка Эйлера в этих обозначениях записываются так: Ap˙ + (C − B)qr = 0, B q˙ + (A − C)rp = 0, C r˙ + (B − A)pq = 0.
А первые интегралы будут такими:
2H = Ap2 + Bq 2 + Cr 2 = 2h, K 2 = A2 p2 + B 2 q 2 + C 2 r 2 = k 2 . Положение равновесие у этой системы такое: p = q = 0, r = ω 6= 0; мы будем рассматривать близкие к нему решения p = x, q = y, r = ω + z. Перепишем для этого случая уравнения и первые интегралы: Ax˙ + (C − B)y(ω + z) = 0, B y˙ + (A − C)x(ω + z) = 0, C z˙ + (B − A)xy = 0, 2H = Ax2 + By 2 + 2Cωz + Cz 2 = 2h, K 2 = A2 x2 + B 2 y 2 + +2C 2 ωz + C 2 z 2 = k 2 . 48
Введем теперь функцию Ляпунова (в двух вариантах): V± =
1 (2H)2 ± (K 2 − 2CH) = 4C 2 z 2 + . . . ± (A(A − C)x2 + B(B − C)y 2 ) + . . . ω2
— члены старше второго порядка здесь сознательно опущены ввиду их незначимости вблизи положения равновесия. Условия теоремы Ляпунова будут выполнены, если A > C и B > C (в качестве функции Ляпунова берем V+ > a(kp; q; rk)), либо если A < C и B < C (берем V− ), следовательно, в этих случаях положение равновесия волчка Эйлера будет устойчивым. Осталось рассмотреть случай, когда (A − C)(B − C) < 0. Чтобы показать, что в данном случае применима теорема Четаева (а значит, имеет место неустойчивость), достаточно взять в качестве функции Четаева функцию V = xy.
3.4. Еще несколько теорем об устойчивости Рассмотрим систему вида x˙ = X(x),
X : Bρ → Rn ,
X ∈ C1 ,
X(0) = 0.
(4)
Выделим в ней линейную часть: x˙ = Ax + o(kxk), A =
∂X ∂x
x=0
и запишем характеристическое уравнение f (λ) = |A − Eλ| = 0.
(5)
Теорема 3.4 (А. М. Ляпунов). Если все корни характеристического уравнения (5) имеют отрицательную вещественную часть, то невозмущенное решение x = 0 системы (4) (асимптотически) устойчиво; если найдется хотя бы один корень с положительной вещественной частью, то неустойчиво. Без доказательства. Рассмотрим консервативную голономную систему, описываемую уравнением Лагранжа d ∂T ∂T ∂V − =− , dt ∂ q˙ ∂q ∂q где
1 (A(q)q˙ · q) ˙ , 2 имеющую положение равновесия при q = q0 , q˙ = 0, причем T =
∂V ∂q
= 0. q = q0
Теорема 3.5 (Лагранжа – Дирихле об устойчивости положения равновесия консервативной голономной системы). Если V (q) имеет в положении равновесия q0 строгий локальный минимум, то это положение равновесия устойчиво. Нужно применить теорему Ляпунова 3.1, взяв W (q, q) ˙ = T + V − V (q0 ) в качестве функции Ляпунова.
49
Замечание. Обратное утверждение неверно, и примером тому может служить функция Уитнера: e−1/kqk cos 1 , q 6= 0; kqk V (q) = 0, q = 0.
Пусть q = q0 — критическая точка потенциала V (q), то есть V ′ (q0 ) = 0. Сделаем замену q = q0 + x и разложим функцию V (x) в ряд Тейлора в точке x = 0: V (x) = V (0) +
xm (m) V (0) + . . . , m!
где V m (0) — первая ненулевая производная. Тогда, как видно из следующей теоремы, устойчивость точки равновесия x = 0 определяется знаком этой производной. Теорема 3.6. Если во всякой окрестности нуля найдётся точка x, в которой V (m) (x) < 0, то состояние равновесия x = 0 неустойчиво. Замечание. Эта теорема была доказана 1. для m = 2 — самим Ляпуновым; 2. для m = 2k + 1 — В. В. Козловым; 3. для m = 2k — В. В. Козловым и В. П. Паламодовым. Мы её докажем только для случая m = 2. В этом случае разложение имеет вид: V (q0 + x) = V (q0 ) + где
∂2V C= ∂q 2
1 (Cx, x) + . . . , 2 . q = q0
Как было установлено ранее, линеаризация уравнений движения вблизи точки равновесия будет в этом случае иметь вид A¨ x + Cx = 0. С помощью ортогонального преобразования координат это уравнение можно преобразовать к виду ξ¨ + Kξ = 0, где K = diag(κ1 , . . . , κk ). Его характеристическое уравнение будет таким: (λ2 + κ1 ) · . . . · (λ2 + κk ) = 0. В силу условия теоремы, среди κj будут отрицательные, а значит некоторые корни будут иметь положительную вещественную часть, откуда, по теореме 3.4, такое решение будет неустойчивым. Определение. Число отрицательных капп κj называется степенью неустойчивости системы. Утверждение 3.7. Для определения степени устойчивости системы вместо того, чтобы считать количество отрицательных корней уравнения det(Aκ − C) = 0 50
достаточно считать количество отрицательных корней уравнения det(Eθ − C) = 0. Рассмотрим ортогональную замену координат B, при которой матрица A диагонализуется. При этом в новом базисе матрица C будет иметь вид B −1 CB, и её сигнатура останется прежней. После этого с помощью положительной диагональной замены (которая тоже не поменяет сигнатуры), сделаем из неё единичную матрицу.
3.5. Пример: система полудисков Пусть два полудиска массы и радиуса, соответственно, m1 , r1 и m2 , r2 , расположены так, как показано на рис. 9. Положению равновесия этой системы, очевидно, соответствует равенство
O2 ϕ2
S2
O1 ϕ1
S1
Рис. 9
нулю углов ϕ1 и ϕ2 . Выясним, когда это положение равновесия будет устойчивым. Положения центров масс Si обоих дисков находятся из формул OriiSi = k = 1 − π2 . C учетом этого факта, несложно выписать потенциал этой системы: V = m1 gr1 (1 − k cos ϕ1 ) + m2 g(r1 + r2 ((1 − k cos ϕ2 ) cos ϕ1 + (k sin ϕ2 − ϕ2 ) sin ϕ1 )) = = m2 gr2 (p(1 − cos ϕ1 ) + (1 − k cos ϕ2 ) cos ϕ1 + (k sin ϕ2 − ϕ2 ) sin ϕ2 ) + m1 gr1 ,
m1 r1 где p = m , а последнее слагаемое можно не учитывать, так как оно является константой; 2 r2 кроме того, для упрощения расчетов, будем предполагать, что единицы измерения выбраны так, что m2 gr2 = 1. Чтобы воспользоваться теоремой 2.8 нам необходимо вычислить матрицу вторых производных в точке равновесия. Найдем вначале первые:
V1′ =
∂V = pk sin ϕ1 − (1 − k cos ϕ2 ) sin ϕ1 + (k sin ϕ2 − ϕ2 ) cos ϕ1 , ∂ϕ1
∂V = k sin ϕ2 cos ϕ1 + (k cos ϕ2 − 1) sin ϕ1 . ∂ϕ2 Заметим, кстати, что ϕ1 = ϕ2 = 0 действительно является решением уравнения V1′ = V2′ = 0. Вторые производные будем сразу выписывать в этой точке равновесия: V2′ =
V11′′ = pk + (k − 1); V12′′ = k − 1; V22′′ = k. 0
0
0
Нетрудно убедиться, что определитель матрицы вторых производных в этой точке будет равен pk 2 +k−1, откуда, в силу теоремы 3.6, немедленно получаем следующее условие на устойчивость: p > p0 =
1−k 2π = . 2 k (π − 2)2 51
Соответственно, при p < p0 имеет место неустойчивость.
3.6. Теоремы Кельвина – Четаева о влиянии гироскопических и диссипативных сил на устойчивость Рассмотрим голономную стационарную механическую систему под действием потенциальных сил, в которой выполняются уравнения Лагранжа вида ∂T ∂V d ∂T = − dt ∂ q˙ ∂q ∂q
(6)
и предположим, что в точке q0 эта система имеет положение равновесия. Выясним, как на устойчивости этого положения равновесия может сказаться появление в системе гироскопических и диссипативных сил, при наличии которых уравнения Эйлера – Лагранжа принимают вид d ∂T ∂T ∂V = − + Qg + Qd . dt ∂ q˙ ∂q ∂q
(7)
Здесь Qg = Qg (q, q) ˙ — гироскопические силы, то есть Qg (q, 0) = 0,
(Qg · q) ˙ =0
(8)
(Qd · q) ˙ 6 0.
(9)
а Qd = Qd (q, q), ˙ соответственно, диссипативные: Qd (q, 0) = 0,
Диссипативные силы называют силами с полной диссипацией, если при всех ненулевых значениях q˙ выполнено условие (Qd · q) ˙ < 0. Теорема 3.8. Если потенциальная энергия имеет строгий локальный минимум в положении равновесия, то оно остается устойчивым при добавлении гироскопических и (или) диссипативных сил. Воспользуемся теоремой Ляпунова 3.1, в качестве функции Ляпунова взяв W = T + V − V (q0 ). Действительно, в силу стационарности исходной системы, имеем ˙ = (Qd · q) W ˙ 6 0. Замечание наборщика. Откуда следует данное равенство, мы не совсем понимаем. Также не вполне понятно, почему найдётся функция Хана из теоремы Ляпунова. Возможно, мы поймём это когда-нибудь потом.
Теорема 3.9. Если потенциальная энергия имеет строгий локальный минимум в точке q0 и это положение равновесия является изолированным, то оно становится асимптотически устойчивым при добавлении диссипативных сил с полной диссипацией (вне зависимости от наличия либо отсутствия гироскопических сил). Без доказательства. Теорема 3.10. Если потенциальная энергия не имеет в положении равновесия q0 даже нестрогого локального минимума и это равновесие является изолированным, то оно становится неустойчивым при добавлении диссипативных сил с полной диссипацией (вне зависимости от наличия либо отсутствия гироскопических сил). 52
Без доказательства.
Теорема 3.11. Если степень неустойчивости положения равновесия системы при q = q0 является нечётной, это положение равновесия остается неустойчивым при добавлении гироскопических сил (в отсутствии диссипативных). Полагая x = q − q0 , выпишем уравнения малых колебаний в окрестности положения равновесия: A¨ x + Gx˙ + Cx = 0. Здесь G — матрица гироскопических сил: G=−
∂Qg ∂ q˙
. q = q0
Запишем характеристическое уравнение полученной системы: f (λ) = det(Aλ2 + Gλ + C) = 0. Теперь ключевое соображение: нам известно, что число отрицательных корней уравнения det(Aκ − C) = 0, а значит, в силу утверждения 3.7, также и уравнения det(Eθ − C) = 0, нечётно. Как несложно заметить, из этого следует, что det C < 0. Таким образом, имеем: f (0) = det C < 0, откуда следует, что найдется такое действительное значение λ0 > 0, что f (λ0 ) = 0, а значит, в силу теоремы Ляпунова 3.4, имеет место неустойчивость. Замечание. Если степень неустойчивости положения равновесия четна (и положительна), то, в некоторых случаях, при надлежащем выборе гироскопических сил это положение равновесия может быть сделано устойчивым.
3.7. Пример: Устойчивость треугольных точек либрации в плоской круговой ограниченной задаче трех тел Эта система уже рассматривалась нами ранее (мы воспользуемся теми же обозначениями, что и в параграфе 1.2.6), и сейчас мы воспользуемся полученными для этой системы уравнениями движения. Они имеют вид ∂W = 0, x¨ − 2y˙ + ∂x ∂W = 0, y¨ + 2x˙ + ∂y mA (x2 2
+ y 2) — приведенный потенциал. Потенциал V равен ! 1−µ µ V = −mA p +p . (x + µ)2 + y 2 (1 − µ − x)2 + y 2
где W = V − T0 = V −
p (x + µ)2 + y 2 , rJ = (x + µ − 1)2 + y 2 . Тогда 1−µ µ 1 1 ′ Wx = xmA −1 + + 3 + µ(1 − µ) 3 − 3 , rS3 rJ rS rJ
Пусть также rS =
p
53
Wy′
1−µ µ = ymA −1 + + 3 . rS3 rJ
Положения, удовлетворяющие условию Wx′ = Wy′ = 0, и есть точки либрации. Их принято разделять на линейные точки либрации L1,2,3 , для которых y = 0, и треугольные точки либрации L4,5 , для которых √ 1 3 rS = rJ = 1, y = ± , x = − µ. 2 2 О линейных точках либрации скажем лишь, что их степень неустойчивости равна единице, откуда следует, что они остаются неустойчивыми при добавлении гироскопических сил. Треугольные точки либрации мы исследуем более подробно. Выпишем значения вторых производных функции W в этих точках: √ 3 9 3 3 ′′ ′′ ′′ Wxx = − , Wxy =± (2µ − 1), Wyy =− . 4 4 4 Таким образом, определитель матрицы вторых производных равен 27 µ(µ−1) > 0. Следователь4 но, приведенный потенциал имеет в треугольных точках либрации строгий максимум и степень неустойчивости этих точек равна двум. Убедимся, что в наличие гироскопических сил действительно может сделать устойчивыми положения равновесия в этих точках. Уравнения малых колебаний примут вид: √ 3 3 3 x¨ − 2y˙ + x ± (2µ − 1)y = 0 4√ 4 y¨ + 2x˙ ± 3 3 (2µ − 1)x − 3 y = 0 4 4
и характеристическое уравнение будет таким:
f (λ) = λ4 + λ2 +
27 µ(1 − µ) = 0. 4
Устойчивость будет иметь место в том случае, если корни этого уравнения окажутся чисто мнимыми, что эквивалентно наличию только действительных отрицательных корней у уравнения ϕ(z) = z 2 + z +
27 µ(1 − µ) = 0. 4
Как несложно убедиться, для этого необходимо, чтобы 27µ(1 − µ) < 1. Для системы «Солнце – Юпитер» это условие действительно выполняется; в окрестности треугольных точек либрации этой системы наблюдаются большие скопления астероидов. Замечание наборщика. В связи с этой задачей уместно привести следующий интересный факт (он имеет отношение к гамильтоновым системам вообще и данной задаче в частности). Именно, гамильтонова система не может быть асимптотически устойчивой, потому что для асимптотически устойчивых систем отображение фазового потока будет сжимающим, а у гамильтоновых систем фазовый объём сохраняется (теорема Лиувилля).
54