Глава 4. Асимптотические методы Сложность задач небесной механики приводит, как правило, к невозможности получения общег...
9 downloads
213 Views
603KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Глава 4. Асимптотические методы Сложность задач небесной механики приводит, как правило, к невозможности получения общего аналитического решения. Но в ряде случаев оказывается достаточным исследование поведения решений на асимптотически больших или малых интервалах времени и (или) при определенных параметрах системы. Нахождение соответствующих аналитических решений требует разработки специальных асимптотических методов. Одним из наиболее фундаментальных аналитических методов является метод малого параметра, применимый для систем, описываемых дифференциальными уравнениями, содержащими малый параметр μ << 1. При этом в качестве параметра не обязательно должна выступать какая-либо физическая величина, а этот параметр μ (или несколько независимых параметров) может быть введен искусственно на основе преобразования переменных, зависящих от параметра так, чтобы при μ = 0 получаемая система была интегрируемой [11]. Сущность метода малого параметра состоит в следующем (см. также предыдущую главу). Пусть имеется каноническая система с n степенями свободы
dxi ∂F = , dt ∂ y i
dy i ∂F =− dt ∂ xi
(i = 1, n),
(4.1)
гамильтониан которой представим в виде
F = F0 ( x1 ,K, x n ) + μF1 ( x1 ,K, x n ; y1 ,K, y n ), μ << 1,
(4.2)
а переменные xi, yi (i = 1, n) — переменные типа действие-угол. Тогда при определенных начальных условиях найдется такая область T > 0 изменения t, в которой решение системы (4.1) представимо рядами ∞
xi = ∑ μ j xi( j ) ( t ), j =0
∞
yi = ni ( t − t 0 ) + ∑ μ y ( t ) (i = 1, n), j
(4.3)
( j) i
j =1
сходящимися при достаточно малых значениях параметра μ. В (4.3) ni = −(∂F0 ∂ xi( 0 ) ), xi( 0 ) (i = 1, n) — решения (4.1) при μ = 0, а все xi( j ) и yi( j ) (i = 1, n; j = 1, 2, K) представляются в виде тригонометрических функций. Заметное упрощение при исследовании квазипериодических (условнопериодических) решений системы (4.1) может быть достигнуто при переходе от непрерывных функций x(t) = (x1,...,xn), y(t) = (y1,...,yn) к дискретным путем введения так называемой секущей поверхности Пуанкаре — гладкой поверхности S ∈ R n в фазовом пространстве, рассекающей фиксированную траекторию l системы. Например, если рассмотреть плоскость (x,y) в фазовом пространстве и фиксировать точки ( x ( k ) , y ( k ) ) на плоскости (x,y) при k-ом (k = 1, 2, ...) прохождении траектории l через эту плоскость (см. рис. 5), то соотношение x ( k +1) , y ( k +1) = Lˆk x ( k ) , y ( k ) (4.4)
(
)
(
)
Глава 4. Асимптотические методы
95
будет задавать отображение фазового пространства в себя (отображение Пуанкаре) и заменит исходные дифференциальные уравнения движения. При этом оператор L$ k является оператором сдвига во времени. Определение решения тогда сведется к последовательному итерационному процессу вида
(x
(k )
)
(
)
, y ( k ) = Lˆ k x ( 0) , y ( 0) ,
(4.5)
где величины x ( 0) , y ( 0) определяются начальными условиями. Траектория системы будет представлять собой дискретную последовательность точек
(x
( 0)
)(
)
(
)
, y ( 0) , x (1) , y (1) , K, x ( k ) , y ( k ) , K t0 2 1
4 (x,y)
3
Рис. 5. Неподвижным точкам соответствуют, очевидно, периодические решения исходной системы. Интервалы между моментами времени (t0,t1,...,tk,...), характеризующими соответствующие точки пересечения траектории l с плоскостью (x,y), в общем случае не равны. Отображение Пуанкаре определяется в пространстве меньшей размерности, чем размерность фазового пространства, что упрощает исследование задачи и позволяет в ряде случаев наглядно представить динамическую картину эволюции рассматриваемой системы. 4.1. Схемы осреднения Идея осреднения, то есть представление в течение определенного периода времени возмущающего воздействия его средним значением, была реализована уже в работах основоположников небесной механики П. Лапласа, Ж. Лагранжа (доказательство известной в настоящее время теоремы Лапласа-Лагранжа об отсутствии вековых возмущений первого порядка у больших полуосей планет Солнечной системы основано на выделении с помощью операции осреднения по угловым переменным вековой части возмущающей функции). Получившая в небесной механике на протяжении двух последних столетий широкое распространение теория возмущений базируется на методах осреднения, предполагающих преобразование (упрощение) с помощью специальных операторов исходных уравнений задачи. При этом, естественно, требуется, чтобы получаемые более простые уравнения задачи описывали основные закономерности исследуемого явления.
96
Часть I. Методы небесной механики
С начала XX века методы осреднения получили также значительное распространение в теории колебаний, а в настоящее время эти методы широко применяются в различных теориях, оперирующих с нелинейными дифференциальными уравнениями. Общая схема осреднения в теории возмущений выражается в следующем виде:
R ( x, D ) =
1 (2π ) n − v
2π
2π
∫ K ∫ R1 ( x, D, y v +1 ,K, y n )dy v +1 K dyn , 0
(4.1.1)
0
при этом возмущающая функция R(x,y) зависит от медленно изменяющихся x = (x1,...,xm) и быстрых переменных y = (y1,...,yn). Так, например, в планетном варианте задачи N-тел к медленным переменным x относятся большие полуоси, эксцентриситеты, наклонности, аргументы и долготы перицентров оскулирующих орбит, а к быстрым переменным y — либо средние аномалии, либо истинные долготы, либо средние долготы планет. В (4.1.1) D = (D1,...,Dv) есть v-мерный вектор аномалий Делоне (v < n), вводимый выражением D = Avn (y). (4.1.2) Здесь (y) — вектор-столбец быстрых переменных, Avn — некоторая числовая матрица, имеющая ранг v. Функция R1 получается заменой в R(x,y) быстрых переменных y1, ..., yv выражениями вида y i = f i (D, y v +1 , K , y n ) i = 1, v , определяемыми из (4.1.2). Если Avn представляет собой нулевую матрицу, то из (4.1.1) непосредственно следует схема осреднения Гаусса
R ( x1 ,K, x m ) =
1 ( 2π ) n
2π
2π
0
0
∫ K ∫ R( x ,K, x 1
m
; y1 ,K, y n ) dy1K dy n ,
(4.1.3)
примененная в 1814 г. К. Гауссом для определения вековых возмущений первого порядка в планетной задаче трех тел. При этом в (4.1.3) в качестве быстрых переменных выбирались средние аномалии l1, l2 — так называемая двукратно осредненная схема. В схемах осреднения Фату, Рейн, Моисеева осреднение проводится не по всем, а лишь по части быстрых переменных, то есть в этом случае матрица Avn является единичной (v < n), и поэтому из (4.1.2) следует D1 = y1, D2 = y2, ..., Dv = yv. Таким образом, согласно (4.1.1) имеем
R ( x1 , K, x m ; y1 , K, y v ) =
1 (2π ) n − v
2π
2π
0
0
∫ K ∫ R( x, y)dy v +1 K dy n .
(4.1.4)
П. Фату рассматривал внешний вариант ограниченной круговой задачи трех тел, осредненной по долготе ( λ ′ = l ′ + λ ′0 ) возмущающего (а не пассивно гравитирующего) тела, так что 2π 1 R (a , e, i ,ω , l) = R( a , e, i ,ω , l, Ω − λ ′)dλ ′, (4.1.5) 2π ∫0
Глава 4. Асимптотические методы
97
при этом координаты пассивно гравитирующего тела (материальной точки) в процессе осреднения считаются постоянными величинами. В пространственном случае интегрирование осредненной модели (4.1.5) не удается свести к квадратурам, так как не хватает одного первого интеграла, однако для плоского варианта схемы Фату имеется полная система первых интегралов — интеграл площадей и интеграл Якоби. Если в процессе осреднения считать долготу возмущающего тела постоянной (в случае, когда скорость движения пассивно гравитирующего тела по невозмущенной орбите существенно превосходит n′), а интегрирование проводить по средней аномалии пассивно гравитирующего тела, предполагая, что за период осреднения элементы a, e, i, Ω, ω остаются неизменными, то есть
1 R (a , e, i , Ω − λ ′,ω ) = 2π
2π
∫ R(a, e,i , Ω − λ ′,ω , l)dl,
(4.1.6)
0
то получим схему осреднения внутреннего варианта ограниченной круговой задачи трех тел Моисеева. Как и в схеме Фату, для нахождения общего решения в схеме (4.1.6) недостает одного первого интеграла *) . В плоском случае интегрирование по схеме Моисеева проводится в квадратурах. Для слабоэллиптического варианта ограниченной плоской задачи трех тел, когда эксцентриситет орбиты возмущающего тела достаточно мал (e′ << 1), Н. Ф. Рейн была предложена схема осреднения, распространяющаяся лишь на ту часть движения возмущающего и центрального тел, которая соответствует отклонению этих движений от равномерного кругового. В осредненной схеме в равномерно вращающейся с угловой скоростью n прямоугольной системе координат xOy с началом в центре O масс центрального (P0 с массой m0) и возмущающего (P′ с массой m′ ) тел уравнения движения пассивно гравитирующего тела P уже не содержат явно переменную времени, а поэтому существует интеграл Якоби вида V 2 = 2(U + h), где U =
(
n2 x2 + y2 2
) + γm
2π
d ( nt ) γm′ + ∫ 2π 0 r1 2π 0
2π
∫ 0
(4.1.7)
d ( nt ) , h — постоянная Якоби, γ — гравитаr2
ционная постоянная, r1 и r2 — расстояния P0 и P′ от O. Притяжения P0 и P′ заменяются притяжением неподвижных эллиптических колечек, характеризующих отличие кеплеровского эллиптического движения от равномерного кругового с массами m0 и m′ так, что dm0/m0 = dm′/m′ = n⋅dt/(2π), то есть элемент массы dm, приходящийся на долю дуги ds, пропорционален времени пребывания dt на этом элементе. Интегралы, входящие в U , выражаются через полные эллиптические интегралы первого рода, а (4.1.7) позволяет провести качественный анализ движения пассивно гравитирующего тела P. Для резонансных систем интерес представляет схема осреднения Делоне-Хилла, которая выражается непосредственно (4.1.1) при условии, что выбор матрицы Avn про-
*)
Если некоторый интеграл движения позволяет понизить порядок уравнений движения, то он называется первым интегралом.
98
Часть I. Методы небесной механики
изводится с учетом соизмеримости средних движений. Для ограниченной круговой задачи трех тел A12 = (n′/n,−1) является вектором-строкой, так что из (4.1.2) имеем D=
где n ′ = [γ ( m0 + m′ ) ]
1/ 2
n′ l + ( Ω − λ ′ ), n
(4.1.8)
( a ′ ) 3/ 2 , n = γm0 a 3/ 2 — средние движения P′ и P, соответст-
венно. Поэтому, определяя из (4.1.8) переменную (Ω − λ′) через D и l, для возмущающей функции, представленной рядом Фурье ∞
∞
R ( a , e, i , Ω − λ ′ ,ω , l ) = ∑ ∑
∞
∑C
qrs
q = 0 r =−∞ s =−∞
( a , e, i ) cos(ql + r (Ω − λ ′ ) + sω ),
(4.1.9)
получим ∞
∞
R1 (a , e, i , D,ω , l ) = ∑ ∑
∞
∑C
qrs
q = 0 r =−∞ s =−∞
⎛ qn − rn ′ ⎞ (a , e, i ) cos⎜ l + rD + sω ⎟ . ⎝ n ⎠
(4.1.10)
Так как в общем случае отношение n′/n не является рациональным числом, то R1 относительно средней аномалии l, входящей явно в R1, строго говоря, не будет периодической функцией. Однако учитывая непрерывность функции R1 по l на всем интервале ⏐l⏐< ∞ и используя теорему о среднем значении квазипериодической функции, получим возмущающую функцию для схемы осреднения Делоне-Хилла в виде M
1 R ( a, e, i , D,ω ) = lim ∫ R1 ( a, e, i , D,ω , l )dl. l →∞ l 0
(4.1.11)
В подынтегральном выражении (4.1.11) элементы a, e, i, D, ω считаются постоянными величинами. Среднее значение R , определяемое (4.1.11), существенно зависит от отношения n′/n. Если n′/n является рациональным числом (n′/n = k1/k2, k1 и k2 — целые положительные числа), то, согласно (4.1.10), R1 является по l периодической функцией с периодом 2πk2. Следовательно, из (4.1.11) получим 1 R ( a , e, i , D,ω ) = 2πk 2
2 πk 2
∫ R (a , e,i , D,ω , l )dl
(4.1.12)
R = ∑ ∑ C jk1 , jk2 ,s (a , e, i ) cos( jk 2 D + sω ).
(4.1.13)
1
0
или, согласно (4.1.10), имеем ∞
∞
j = 0 s =−∞
Схему осреднения (4.1.12), когда k2D = k1l + k2(Ω − λ′),
(4.1.14)
принято называть первой схемой осреднения Делоне-Хилла для ограниченной круговой задачи трех тел. Если n и n′ несоизмеримы, то qn − rn′ = 0 только при q = r = 0, следовательно, учитывая (4.1.10), (4.1.11), получим
Глава 4. Асимптотические методы
R ( a , e, i , ω ) =
99 ∞
∑C
0, 0,s
(a , e, i ) cos( sω ).
s =−∞
Однако поскольку n ′ n = 1 + m′ / m0 (a / a ′) 3/ 2 — функция от оскулирующей большой полуоси a, то, как следует из (4.1.10), (4.1.11), в общем случае имеем R (a, e, i, D, ω ) =
∞
∞
~
∑ ∑C
r ,s
(a, e, i ) cos(rD + sω ).
(4.1.15)
r = −∞ s = −∞
Схему осреднения (4.1.15) принято называть второй (или обобщенной) схемой ДелонеХилла. В пространственном случае ограниченной круговой задачи трех тел осредненные модели (4.1.13) и (4.1.15) неинтегрируемы в квадратурах (интегрирование реализуется лишь в случае плоского варианта задачи). Нетрудно видеть, что первая схема осреднения Делоне-Хилла непосредственно содержит в себе схему Моисеева как частный случай, поскольку, полагая в (4.1.14) k1 = 0, представление (4.1.12) становится (при k2 = 1) эквивалентным (4.1.6). В случае задачи N-тел, для которой основные (невозмущенные) частоты системы n1 , K, nN −1 таковы, что между ними существует v < N − 1 независимых соотношений вида N −1
∑k j =1
(v ) j
n j = 0 ( v = 1, 2, K; k (j v ) ∈ Z ),
вводя v медленных новых переменных N −1
Dv = ∑ k (j v ) y j = 0 ( v = 1, 2, K)
(4.1.16)
j =1
и выражая на основании (4.1.16) v быстрых угловых переменных yj (например, y1, y2, ..., yv) через аномалии Делоне D = (D1,...,Dv), для схемы осреднения будет справедливо выражение (4.1.1). Таким образом, схемы осреднения, учитывающие резонансные соотношения между средними движениями (частотами) гравитирующих тел, сохраняют в осредненных уравнениях помимо слагаемых, обуславливающих вековые возмущения, и долгопериодические гармоники (содержащие аномалии D), вызывающие долгопериодические возмущения с большими амплитудами. При этом осредненные системы уравнений имеют большее количество известных первых интегралов, нежели исходные системы, поскольку каждое осреднение по одной угловой переменной порождает один первый интеграл. 4.2. Проблема обоснования Применение различных схем осреднения в теории возмущений является обоснованным лишь при условии, что за исследуемый интервал времени разность решений точных (исходных) и осредненных уравнений остается достаточно малой величиной. Построение эффективных оценок разности указанных решений, пригодных на асимптотически больших промежутках времени, реализуется в рамках так называемой ма-
100
Часть I. Методы небесной механики
тематической теории обоснования методов осреднения. Основы этой теории были заложены Н. Н. Боголюбовым и Н. М. Крыловым, которые установили существование определенной замены переменных, переводящей исходные уравнения в осредненные. Рассмотрим каноническую систему с n степенями свободы вида (4.1), (4.2), которую представим следующим образом: dx = μX ( x, y), dt
где x = ( x1 ,K, x n ),
ω = (ω 1 ,K, ω n ).
dy = ω ( x ) + μY ( x , y ), dt
Y ( x, y ) = − ∂F1 ∂ xi ,
y = ( y1 ,K, y n ),
(
)
(4.2.1)
ω ( x) = − ∂F0 ∂ xi ;
(
Пусть вектор-функции X = X (1) ,K, X ( n) , Y = Y (1) ,K, Y ( n)
)
i = 1, n,
относительно угло-
вых переменных (y1,...,yn) удовлетворяют в интервале (0,2π) условиям Дирихле, то есть в указанном интервале эти функции имеют конечное число точек разрывов первого рода и являются кусочно-монотонными, а следовательно, представляются n-кратными рядами Фурье X ( x, y) =
∞
∑X
k1 ,K, k n =−∞
Y ( x, y) =
k1 ,K, k n
∞
∑Y
k1 ,K, k n k1 ,K, k n =−∞
[
]
( x) exp i( k1 y1 +K+ k n y n ) ,
[
( x) exp i( k1 y1 +K+ k n y n )
]
(4.2.2) 2
(k1 ,K, k n ∈ Z , i = −1).
При μ = 0, то есть при отсутствии возмущений, из (4.2.1) имеем x = x0 = const, y = ω(x0 )t + y0 .
(4.2.3)
Ввиду специфики канонических преобразований понятие обобщенных координат и импульсов лишено первоначального смысла, в этой связи в дальнейшем переменные p и q мы будем рассматривать просто как канонически сопряженные величины. Тогда в новых переменных p = x − x0 , q = y − ω 0t − y0 (ω0 = ω(x0 )) , характеризующих возмущения (при μ ≠ 0), система (4.2.1) примет вид dp = μX ( p + x0 , q + ω 0 t + y0 ), dt dq = ω ( p + x0 ) − ω 0 + μY ( p + x0 , q + ω 0 t + y0 ). dt
(4.2.4)
(4.2.5)
Предположим далее, что вектор начальных частот ω 0 = (ω 10 ,K, ω n0 ) имеет соизмеримые компоненты, то есть существуют такие целочисленные значения k1, ..., kn (и n
при этом ∑ ki ≠ 0), для которых i =1
k1ω 10 + k 2ω 20 +K+ k nω n0 = 0.
(4.2.6)
Тогда с учетом (4.2.2) для средних значений X, Y по явно выраженному времени t будем иметь
Глава 4. Асимптотические методы
101
X = M t [X ( p + x0 , q + ω 0 t + y 0 )] = t 0 +T
1 = lim T →∞ T
∫
t0
∞
∑X
k1 ,K, k n k1 ,K, k n = −∞
( p + x0 ) ×
× exp{i[k1 (q1 + y10 + ω 10 t ) + K + k n (q n + y n 0 + ω n 0 t )]}dt =
∞
∑
=
/
k1 ,K, k n = −∞
Y =
∞
∑
/
(4.2.7)
X k1 ,K,k n ( p + x0 ) exp{i[k1 (q1 + y10 ) + K + k n (q n + y n 0 )]},
Yk1 ,K,kn ( p + x0 ) exp{i[k1 (q1 + y10 ) + K + k n (q n + y n 0 )]}.
k1 ,K, k n = −∞
В (4.2.7) штрих при знаке суммирования означает, что k1, ..., kn принимают не все целые значения, а лишь те, для которых выполняется условие (4.2.6). В то же время средние значения X, Y по угловым переменным q = (q1,...,q n) равны Mq[ X ] =
1 ( 2π ) n
2π
2π
∫ K∫
∑X
0 k1 ,K,kn
0
k1 ,K, kn
( p + x0 ) exp{ i[ k1 ( y10 + ω 10t + q1 ) +K+
+ k n ( y n0 + ω n0t + qn )]} dq1K dqn = X 0,K, 0 ( p + x0 ),
(4.2.8)
M q [Y ] = Y0,K, 0 ( p + x0 ). Следовательно, средние значения X, Y по времени и по угловым переменным q не совпадают в случае, если имеется соизмеримость частот, то есть при выполнении условия (4.2.6). Если же частоты ω 10 , K, ω n0 несоизмеримы (равенство (4.2.6) реализуется лишь при k1 = k2 = ... = kn = 0), то, как следует из (4.2.7), (4.2.8), средние значения M[X;Y] по t и по q равны между собой. Таким образом, если частоты ω1, ..., ωn в начальный момент t0 удовлетворяют условию резонанса, то следует проводить осреднение по времени или по одной быстрой переменной с учетом соизмеримости начальных частот, поскольку в этом случае непосредственное осреднение по быстрым (угловым) переменным не всегда дает удовлетворительный результат. Заменяя вектор-функции X, Y в (4.2.5) их осредненными значениями (4.2.7), получим осредненные уравнения первого приближения вида (осреднение проведено с учетом (4.2.3)) dp = μX ( p + x 0 , q + y 0 ) , dt (4.2.9) dq = ω ( p + x0 ) − ω 0 + μY ( p + x0 , q + y0 ). dt Тогда оказывается справедливой следующая теорема. Пусть вектор-функции X(x,y), Y(x,y) в некоторой 2n-мерной области G2 ⎛ n ⎞ ⎛ n ~⎞ (i ) (i ) ограничены ⎜ ∑ X + Y < C ⎟ и представимы конечными ⎜ ∑ k i ≤ N < ∞⎟ рядаG 2n ⎝ i =1 ⎠ ⎝ i =1 ⎠ ми (4.2.2) с дважды дифференцируемыми и конечными по величине коэффициентами X k1 ,K,kn ( x), Yk1 ,K, kn ( x ) в любой точке x = (x1,...,xn) ∈ Gn. Частоты ω1(x1,...,xn), …,
(
)
ωn(x1,...,xn) в области Gn пусть также дважды дифференцируемы и ограничены, а в на-
102
Часть I. Методы небесной механики
чальный момент времени t0 удовлетворяют условию соизмеримости (4.2.6) при n
∑k i =1
i
≠ 0. И, наконец, предположим, что векторы p = ( p1 ,K, pn ) и q = ( q1 , K , qn ) для
всех t ≥ 0 определены в G2 n . Тогда для сколь угодно малого ε > 0 существует μ0(ε ) > 0 такое, что при 0 ≤ μ ≤ μ0(ε) в области 0 ≤ t ≤ μ −1 справедливы неравенства n
∑ i =1
n
∑ q (t ) − q (t ) < ε ,
pi (t ) − pi (t ) < ε ,
i
i =1
i
(4.2.10)
где p(t), q(t) и p ( t ), q ( t ) — решения систем (4.2.5) и (4.2.9) соответственно. Для доказательства этой теоремы введем замену переменных ∞
p = p + ∑ μ j u j ( p, q , t ), j =1
∞
q = q + ∑ μ v j ( p, q , t ),
(4.2.11)
j
j =1
которая преобразовывает (4.2.5) в систему уравнений ∞ dp = μX ( p + x0 , q + y0 ) + ∑ μ j A j ( p , q ), dt j =2 ∞ dq = ω ( p + x0 ) − ω 0 + μY ( p + x0 , q + y0 ) + ∑ μ j B j ( p , q ), dt j=2
(4.2.12)
отличающуюся от (4.2.9) лишь наличием в правых частях сумм вида ∞
∑μj j=2
Aj Bj
( p , q ).
Если бы удалось обосновать сходимость указанных рядов, а также сходимость рядов, составляющих замену (4.2.11), то была бы установлена эквивалентность уравнений (4.2.5) и (4.2.12). Однако, как было показано Боголюбовым, рассматриваемые ряды являются асимптотическими и при любом положительном значении μ расходятся для t ∈ (0,∞). Именно поэтому в условиях теоремы исследуется более частный вопрос о получении оценок (4.2.10) на конечном интервале t ∈ [0,μ−1]. Следует отметить также, что введение рядов (4.2.12) с коэффициентами Aj, Bj преследует цель обеспечить асимптотическую сходимость рядов (4.2.11). Подставляя (4.2.11) в (4.2.5) с учетом (4.2.2) и (4.2.12) и приравнивая соответствующие выражения при одноименных степенях μ, получим бесконечную систему уравнений в частных производных первого порядка для последовательного определения вектор-функций u1, v1, u2, v 2, ..., uj, vj, ... В частности, для u1, v1 имеем B
Глава 4. Асимптотические методы
∑X
P{u1} = −
∑
k1 ,K, k n
k1 ,K, kn
n
P{v1} = ∑ u1( j ) j =1
∑Y
k1 ,K, kn
k1 ,K, kn
−
∑
/
k1 ,K,k n
( p + x0 ) exp{i[k1 (q1 + y10 + ω10 t ) + K + k n (qn + y n 0 + ω n 0t )]} −
X k1 ,K,kn ( p + x0 ) exp{i[k1 (q1 + y10 ) + K + k n (qn + yn 0 )]},
/
k1 ,K,k n
+
103
∂ω ( p + x0 ) + ∂p j
(4.2.13)
( p + x0 ) exp{i[k1 (q1 + y10 + ω10 t ) + K + k n (qn + y n 0 + ω n 0t )]} −
Yk1 ,K,kn ( p + x0 ) exp{i[k1 (q1 + y10 ) + K + k n (qn + yn 0 )]}.
Здесь P — дифференциальный оператор вида P=
n ∂ ∂ + ∑ [ω j ( p1 + x10 ,K , p n + x n 0 ) − ω j 0 ] , ∂ t j =1 ∂qj
а штрих при знаке суммирования означает, что k1, ..., kn принимают лишь те значения, для которых выполняется (4.2.6). Аналогично для u j = u (j1) ,K, u (jn ) , v j = v (j1) , K, v (jn ) j = 2, 3, ... получим диффе-
(
)
(
)
ренциальные уравнения вида
0 0⎞ ⎧u j ⎫ U j ⎛ ⎜ u1 , v1 ; K; u j −1 , v j −1 ; , A2 , B2 , K , A j , ⎟. P⎨ ⎬ = ⎜ uj B j ⎟⎠ ⎩v j ⎭ V j ⎝
(4.2.14)
При этом следует учитывать, что в уравнениях (4.2.13), (4.2.14)
(
)
) X k1 ,K,kn = X k(11,)K,kn ,K, X k(1n,K ,kn ,
(
(1) k1 ,K, k n
Yk1 ,K,kn = Y
(
(1)
, K, Y ( n)
A j = A j ,K, A j
),
ω = (ω 1 ,K, ω n ),
), = (B
( n) k1 ,K, k n
Bj
(1) j
( n)
,K, B j
),
p = ( p1 ,K, p n ), q = (q1 ,K, q n ).
Из первого уравнения (4.2.13) нетрудно видеть, что с точностью до произвольной вектор-функции f 1 ( p ), которую для определенности положим тождественно равной нулю, имеем u1 ( p, q , t ) = =
∑
k1 ,K, k n
//
X k1 ,K,kn ( p + x 0 )
{[
}.
exp i k1 (q1 + y10 + ω 10 t ) +K+ k n (qn + y n0 + ω n0 t )] i[ k1ω 1 ( p + x 0 ) +K+ k nω n ( p + x 0 )]
(4.2.15)
Здесь i2 = −1, а два штриха над знаком суммы означают, что суммирование производится лишь для тех k1, ..., kn, для которых
k1ω 10 + k 2ω 20 +K+ k nω n0 ≠ 0.
(4.2.16)
104
Часть I. Методы небесной механики
Подставляя (4.2.15) во второе уравнение (4.2.13) и разрешая его относительно v1, получим v1 ( p, q , t ) = =
∑
//
k1 ,K, kn
Yk1 ,K,kn ( p + x0 )
exp{i[k1 (q1 + y10 + ω10t ) + K + k n (qn + y n 0 + ω n 0t )]} − i[k1ω1 ( p + x0 ) + K + k nω n ( p + x0 )]
∂ω ( p + x0 ) ) × ∑ // X k( j,K , k ( p + x0 ) × ∂p j k ,K,k j =1
(4.2.17)
n
−∑
1
1
×
n
n
exp{i[k1 (q1 + y10 + ω10 t ) + K + k n (qn + yn 0 + ω n 0t )]} + f 2 ( p ). [k1ω1 ( p + x0 ) + K + k nω n ( p + x0 )]2
При f 2 ( p ) ≡ 0 и
n
∑k
i
< ∞ для функций u1 и v1 будем иметь чисто тригонометрические
i =1
выражения. Выбирая определенным образом вектор-функции Aj, Bj (j = 2, 3, ...), можно аналогично, на основании (4.2.14), в явном виде получить выражения для медленных (позиционных) переменных p (или uj) в чисто тригонометрическом виде. В осредненных уравнениях первого приближения (4.2.9) для медленных переменных, как видно из (4.2.12), не учтены слагаемые второго μ 2 A2 ( p , q ) и более высокого B
(
)
порядков. Определяя A2 ( p , q ) таким образом, чтобы в u2 ( p , q , t ) (см. (4.2.14)) отсутствовало бы вековое слагаемое (член, пропорциональный t), нетрудно показать, что при выполнении условий рассматриваемой теоремы функция A2 ( p , q ) на отрезке 0 ≤ t ≤ μ−1 ограничена n
∑A
( j) 2
< C ′.
(4.2.18)
j =1
При этом оказывается справедливой следующая оценка: ⎛ n ⎛ ∂ω ⎜ j k j ω j ( p + x0 ) = ∑ k j ⎜ ω j 0 + ∑ ⎜ ∑ ⎜ ⎜ j =1 j =1 s =1 ⎝ ∂ p s ⎝ n
n
≥
n
n
n
j =1
j =1 s =1
⎞ ⎞ ⎟ ⎟ ⋅ ps ⎟ ≥ ⎟ ⎟ ⎠ t∈( 0, p ) ⎠
∑ k jω j 0 −∑∑ k j −
(4.2.19)
∂ω j ps . ∂ ps
И так как для любого 0 ≤ t ≤ μ−1, с учетом, согласно (4.2.11), (4.2.15), в первом приближении n
∑ s =1
n
n
s =1
s =1
ps (0) ≤ ∑ ps (0) + μ ∑ u1( j ) ( p , q ,0) < μ C α n ,
n
где α n = min ∑ // k sω s 0 > 0, а два штриха означают, что суммирование распространяетs=1
ся лишь на те ks, для которых выполняется условие (4.2.16), имеем
Глава 4. Асимптотические методы t =1/ μ n
n
n
∑ p (t ) ≤ ∑ p (0) + μ ∫ ∑ X
105 ( j)
s
s
s =1
s =1
( p + x0 , q + y0 ) dt < C (1 + μ α n ) ,
(4.2.20)
j =1
t0
то n
∑kω j
j
( p + x0 ) ≥ α n − n 2 C1 NC (1 + μ / α n ) = C * .
(4.2.21)
j =1
n
Здесь было учтено, что по исходному предположению
∑k
j
≤ N , а по условию теоре-
j =1
мы
∂ω j ∂ ps < C1 . Следовательно, при α n ≠ n 2 CNC1 (1 + μ / α n ) все знаменатели
(4.2.15), (4.2.17) при 0 ≤ t ≤ μ−1 в области G2 n ограничены по абсолютной величине снизу положительным числом C*. Для оценки разности решений точных (4.2.5) и осредненных (4.2.9) уравнений, очевидно, будем иметь n
∑ j =1
n
p j (t ) − p j (t ) = ∑ p j (t ) − p1( j ) (t ) + p1( j ) (t ) − p j (t ) ≤ j =1
n
n
≤ ∑ p j (t ) − p (t ) + ∑ p (t ) − p j (t ) , ( j) 1
j =1
(4.2.22)
( j) 1
j =1
где, согласно (4.2.11), введено обозначение p1( j ) = p j + μu1( j ) ( p , q , t ). Как следует из (4.2.21) и (4.2.15), для любой точки из G2 n при 0 ≤ t ≤ μ−1 справедливо неравенство n
∑ j =1
n
p1( j ) (t ) − p j ( t ) = μ ∑ u1( j ) ( p , q , t ) ≤ μ C C ∗ .
(4.2.23)
j =1
С другой стороны, векторная функция p1 (t ) = p (t ) + μu1 ( p , q , t ) удовлетворяет векторному дифференциальному уравнению dp1 dp du ∂ u dp ∂ u dq = +μ 1 +μ 1 +μ 1 = dt dt dt ∂ p dt ∂ q dt ⎛ du ∂u ⎞ ∂u = μX ⎜⎜1 + μ 1 ⎟⎟ + μ 1 (ω − ω 0 + μY ) + μ 1 dt ∂p⎠ ∂q ⎝
или, учитывая (4.2.13), (4.2.11), имеем ⎛ ∂u ⎛ ∂u ∂u ⎞ ∂u ⎞ dp1 = μ 2 ⎜⎜ X 1 + Y 1 ⎟⎟ + μX ( p + x 0 , q + ω 0 t + y 0 ) = μ 2 ⎜⎜ X 1 + Y 1 ⎟⎟ + ∂q ⎠ ∂q ⎠ dt ⎝ ∂p ⎝ ∂p ⎡ ⎛ ∂X ⎞ ⎤ ⎛ ∂X ⎞ ⎟ ⎟u1 − μ ⎜ + μ ⎢ X ( p + x0 , q + ω 0 t + y 0 ) − μ ⎜⎜ ⎜ ∂ q ⎟ v 1 ⎥, ⎟ ∂ p ⎢⎣ ⎠ ⎥⎦ ⎝ ⎠ ⎝
106
Часть I. Методы небесной механики
(
)(
)
где ∂X ∂ p , ∂X ∂ q — некоторые средние значения вектор-функций ∂X ∂ p , ∂X ∂ q в области G2 n . Следовательно, учитывая (4.2.5), получим дифференциальное соотношение ⎧⎪ ⎛ ∂X ⎞ ⎛ ∂X ⎞ ∂u ∂u ⎫ dp dp1 ⎟ − X 1 − Y 1 ⎪⎬. ⎟ + v1 ⎜ − = μ 2 ⎨u1 ⎜⎜ ⎜ ∂q ⎟ ∂p ∂ q ⎪⎭ dt dt ⎪⎩ ⎝ ∂ p ⎟⎠ ⎠ ⎝
(4.2.24)
Из (4.2.15) и (4.2.17) с учетом (4.2.21) и ограниченности по условиям теоремы векторфункций X, Y, а также производных ∂ω i ∂ x j (i, j = 1, n) , имеем следующие оценки: n
C , C∗
∑ u1( j ) < j =1
n
∑v
( j) 1
<
j =1
C (1 + C1 C ∗ ). ∗ C
(4.2.25)
Для частных производных ∂ u1 ∂ p и ∂ u1 ∂ q согласно (4.2.15) нетрудно получить выражения
∂ u1 = ∑ ∂ p k ,K,k 1
[
// n
∂X k1 ,K,kn ⎧ ⎛ ∂ω ∂ω n ⎞⎫ ⎟⎬ × − X k1 ,K,k n ⎜⎜ k1 1 + K + k n ⎨(k1ω 1 + K + k nω n ) ∂p ∂ p ⎟⎠⎭ ⎝ ∂p ⎩
× i (k1ω 1 + K + k nω n )
]
exp{i[k1 (q1 + y10 + ω10 t ) + K + k n (q n + y n 0 + ω n 0 t )]},
2 −1
k j X k ,K,k ( p + x 0 ) ∂ u1 exp{i[k1 (q1 + y10 + ω 10 t ) + K + k n (q n + y n 0 + ω n 0 t )]}. = ∑ // ∂ q j k ,K,k k1ω 1 + K + k nω n 1
1
n
n
Здесь j = 1, n, p = ( p1 ,K, p n ). Следовательно,
∂ u1( j ) C ⎛ C ⎞ < ∗ ⎜1 + 1∗ N ⎟, ∑ C ⎝ C ⎠ j =1 ∂ p n
∂ u1( j ) NC < ∗. ∑ C j =1 ∂ q n
Таким образом, согласно (4.2.24) будем иметь n
∑ j =1
(
)[
dp j
dp1( j ) − < μ 2C , dt dt
(4.2.26)
]
где C = C C ∗ 3C + CN + CC1 (1 + N ) C ∗ . Для любого t ∈ [0,μ−1] тогда получим n
∑ p (t ) − p j
( j) 1
(t ) < μC0 .
(4.2.27)
j =1
Здесь C0 = C + O[ μ ]. Из (4.2.11) и (4.2.22) нетрудно видеть, что неравенство (4.2.27) характеризует влияние слагаемых порядка μ2u2 и выше (μ3u3, μ4u4, ...) на отрезке 0 ≤ t ≤ μ−1. И, наконец, для искомой оценки разности решений точных и осредненных уравнений для медленных переменных, согласно (4.2.22), (4.2.23) и (4.2.27), получим
Глава 4. Асимптотические методы n
∑p j =1
j
107
(t ) − p j (t ) < μ (C 0 + C C ∗ ) .
(4.2.28)
Задавая произвольное ε > 0, определим положительное число μ0(ε) > 0, удовлетворяющее, согласно (4.2.21), (4.2.28), (4.2.12) и (4.2.18), условиям ⎛
⎞ − 1⎟ , ⎝ n C1CN ⎠
μ 0 (ε ) ≠ α n ⎜
[
αn
2
]
μ 0 (ε ) C0 ( μ 0 ) + C C ∗ ( μ 0 ) < ε ,
(4.2.29)
μ 20 (ε )C ′ < ε 2 . Учитывая, что при μ0(ε) → 0 и C∗ ≠ 0 (за счет соответствующего выбора, например, N) C0 +C/C∗ < ∞, для любого ε > 0 система (4.2.29) имеет решение. Следовательно, для произвольного ε > 0 существует такое μ0(ε) > 0, что для всех 0 ≤ μ ≤ μ0(ε) на отрезке 0 ≤ t ≤ 1/μ выполняются неравенства n
∑ i =1
pi (t ) − pi (t ) < ε ,
n
μ 2 ∑ A2( i ) ( p, q ) < ε 2 . i =1
Тем самым утверждение теоремы для медленных переменных p(t) полностью доказано. Совершенно аналогично проводится доказательство и для быстрых (угловых) переменных q(t). Таким образом, осреднение равносильно осредняющей замене переменных вида (4.2.11), удовлетворяющей условию периодичности по быстрым переменным и приводящей исходную систему к виду, содержащему в окрестности фиксированного резонанса медленные переменные. Следует также отметить, что в рассмотренной выше теореме предполагалось, что правые части дифференциальных уравнений представляются конечными тригономет⎛ n ⎞ рическими многочленами ⎜ ∑ ki ≤ N < ∞⎟ . Если N→∞, а вектор-функции X(x,y), Y(x,y) ⎝ i =1 ⎠ являются аналитическими по всем переменным и 2π-периодическими по y в некоторой области G2 n , то в резонансном случае для проведения обоснования схем осреднения следует заменить правые части дифференциальных уравнений (4.2.5) такими тригонометрическими многочленами, чтобы при этом погрешность в правых частях уравнений имела бы порядок μ2. В частности, дифференциальные уравнения ограниченной круговой задачи трех тел содержат аналитические функции вида (4.1.9) во всем пространстве, за исключением тех точек, в которых возможно соударение пассивно гравитирующего тела с одним из притягивающих тел (см. главу 13). Следовательно, в области G2 n , расположенной вне квазицилиндрической поверхности Хилла, вектор-функции X(x,y) и Y(x,y), где x = (a,e,i,ω), y = (M, Ω−l′ ), аналитичны и ограничены по всем своим переменным, а также 2π-периодичны по y. Вектор средних движений (частот) бесконечное число раз дифференцируем и также ограничен вместе со своими производными для любого x,
108
Часть I. Методы небесной механики
принадлежащего G2 n . И если невозмущенные средние движения n (j 0) (j=1,2) пассивно гравитирующего и возмущающего тел удовлетворяют условию соизмеримости вида k1(1) n1( 0) − k 2(1) n2( 0) = 0,
(
)
где k (1) = k1(1) , k 2(1) — целочисленный ненулевой вектор, то на основании вышеприведенных результатов может быть непосредственно обоснована схема осреднения Делоне-Хилла для ограниченной круговой задачи трех тел. 4.3. Метод Цейпеля Рассмотрим неавтономную каноническую систему вида
dxi ∂F = , dt ∂ y i
dyi ∂F =− ∂ xi dt
(i = 1, n − 1),
(4.3.1)
где F = F ( x1 ,K, x n−1 ; y1 ,K, y n−1 , t ). Вводя дополнительные переменные xn, yn = t − t0, перейдем к новой канонической системе dx j
=
dt
∂F , ∂ yj
dy j dt
=−
∂F ∂ xj
( j = 1, n)
(4.3.2)
с гамильтонианом F = F − xn , являющейся уже автономной. Пусть гамильтониан F представим в виде ряда по степеням малого параметра μ, так что
F = F0 ( x1 ,K, x n ) + ∑ μ Fs ( x1 ,K, x n ; y1 ,K, y n ), s
(4.3.3)
s≥1
причем функции Fs являются 2π-периодическими функциями относительно переменных yj ( j = 1, n) и допускают разложения вида
Fs =
∞
∑C
k j =−∞
( s) ki ,K, kn
( x1 ,K, x n ) cos( k1 y1 + k 2 y 2 +K+ kn yn ).
(4.3.4)
Если в (4.3.3) положить μ ≡ 0, то уравнения (4.3.2) легко интегрируются. При этом xj ( j = 1, n) будут произвольными постоянными, а для yj получим yj = njt +cj ( j = 1, n) , где cj являются произвольными постоянными, а nj определяются формулой nj = −
∂F0 . ∂ xj
(4.3.5)
Если величина μ отлична от нуля, но достаточно мала, то уравнения (4.3.2) можно формально удовлетворить асимптотически сходящимися тригонометрическими рядами вида (4.3). Однако эти ряды будут расходиться при наличии соизмеримости между частотами (средними движениями)
Глава 4. Асимптотические методы
109
n1
∑k n ∗ j
j
= 0,
(4.3.6)
j =1
где k ∗j — целые, отличные от нуля числа, n1 ≤ n. Для резонансного случая с целью уменьшения, насколько это возможно, числа степеней свободы канонической системы (4.3.2), Хуго фон Цейпель предложил использовать заданные в неявной форме канонические преобразования ∂S ∂S , pj = xj = (4.3.7) ( j = 1, n), ∂ yj ∂qj переводящие переменные xj, yj в новые канонические (см. (1.5.18)) переменные qj, pj с помощью производящей функции S(y1,...,yn;q1,...,qn), так что вместо (4.3.2) будем иметь
∂F∗ = , dt ∂ pj
∂F ∗ =− dt ∂qj
dq j
dp j
( j = 1, n).
(4.3.8)
Так как S не зависит явно от переменной t, то справедливо уравнение F(x1,...,xn;y1,...,yn) = F* (q1,...,qn;p1,...,pn), или
⎛ ⎞ ⎛ ∂S ∂S ∂S ∂S , K, ; y1 , K, y n ⎟⎟ = F ∗ ⎜⎜ q1 , K, q n ; , K, F ⎜⎜ ∂ yn ∂ q1 ∂ qn ⎝ ⎠ ⎝ ∂ y1
⎞ ⎟⎟. ⎠
(4.3.9)
За счет соответствующего выбора S(y,q) возьмем функцию F* таким образом, чтобы число степеней свободы новой системы (4.3.8) значительно (максимально) снизилось и чтобы в выражение для производящей функции S не входили “малые делители”. Для этого разложим S и F* в формальные ряды по степеням μ:
S = S0 + μS1 + μ S2 +K , 2
∗
∗
∗
∗
F = F0 + μF1 + μ F2 +K , 2
(4.3.10)
и приравняем в уравнении (4.3.9) коэффициенты при одноименных степенях μ0, μ, μ2, ... Полагая F0∗ ≡ F0 (q1 ,K, q n ),
n
S0 = ∑ q j y j ,
(4.3.11)
j =1
мы придем к уравнению (4.3.9) при μ = 0. Приравнивая коэффициенты при μ, с учетом (4.3.5) получим n
− ∑nj j =1
∂ S1 + F1 (q1 ,K , q n ; y1 ,K, y n ) = F1∗ (q1 , K, q n ; p1 ,K, p n ). ∂ yj
(4.3.12)
При этом связь старых и новых переменных, согласно (4.3.7) и (4.3.10), определится выражениями
110
Часть I. Методы небесной механики
xj = qj + μ
∂ S1 + K, ∂ yj
yj = pj − μ
∂ S1 −K ∂qj
(4.3.13)
(следует отметить, что в общем случае (4.3.13) не означает близость с точностью лишь до μ старых и новых переменных, поскольку разложение S по μ проводится формально). Из (4.3.4) следует, что уравнения (4.3.12) можно с учетом (4.3.13) удовлетворить, выбирая S1 и F1* в виде (1) / Ck1 ,K, k n (q1 ,K, q n )sin( k1 y1 + k 2 y 2 +K+ k n y n ) , S1 = ∑ k1n1 + k 2 n2 +K+ k n nn (4.3.14)
(
)
F1∗ = ∑ // Ck(11,)K,kn cos k1∗ p1 + k 2∗ p2 +K+ k n∗ pn .
При этом в сумме Σ′ исключены все слагаемые, делители которых вида (4.3.6) малы (порядка μ1/2 или более высокого), то есть в сумме Σ′ содержатся лишь короткопериодические слагаемые. Слагаемые, содержащие "малые знаменатели" (а следовательно, долгопериодические и вековые слагаемые), включены в сумму Σ′′. Для величины порядка μ2 из (4.3.9), проводя соответствующие разложения, будем иметь уравнение n ∂ S 2 1 n n ∂ 2 F0 ∂ S1 ∂ S1 n ∂F1 ∂ S1 − ∑nj + ∑∑ +∑ + F2 = ∂ y j 2 i =1 j =1 ∂ q i ∂ q j ∂ y i ∂ y j j =1 ∂ q j ∂ y j j =1 (4.3.15) n ∂F1∗ ∂ S1 ∗ = F2 + ∑ . j =1 ∂ p j ∂ q j Если отнести к F2* совокупность тех членов разложения F1 и F2 в тригонометрический ряд вида (4.3.4), которые могли бы дать малые делители, то функция S2, определяемая из (4.3.15), не будет содержать возрастающих членов, а следовательно, взаимосвязь между новыми и старыми переменными регулярна, то есть не содержит особенностей. Очевидно, что проводя аналогичную процедуру выбора Si, Fi* (i = 3, 4, ...) разделением "быстрых" и "медленных" переменных, формально можно полностью определить функции S и F* (4.3.10). В новой канонической системе (4.3.8) разложение в тригонометрический ряд по кратным величин pj ( j = 1, n) гамильтониана F* будет содержать лишь те аргументы, которые порождают малые делители вида (4.3.6). Получившаяся система (4.3.8) будет проще исходной, поскольку она уже не содержит короткопериодических слагаемых. Существенным свойством приведенного метода понижения порядка системы дифференциальных уравнений (4.3.2), предложенного в 1921 г. Х. Цейпелем и ставшего ныне классическим, является использование канонической формы дифференциальных уравнений, что открывает возможность применения аппарата канонических преобразований. Метод Цейпеля является достаточно гибким. Его можно применять как в нерезонансных, так и в резонансных случаях. Можно даже не переходить к элементам и строить орбиты непосредственно в прямоугольных координатах. В прикладных задачах при численном интегрировании системы (4.3.8) независимость ее правых частей от быстроменяющихся переменных позволяет выбирать шаг проведения интегрирования достаточно большим, что значительно снижает время, затрачиваемое на решение сис-
Глава 4. Асимптотические методы
111
темы (см. главу 16). На основании соотношений (4.3.13), связывающих старые и новые переменные, можно затем определить и значения исходных переменных в заданные моменты времени. 4.4. Преобразования и ряды Ли Метод Цейпеля определяет каноническое преобразование в неявной форме. В связи с этим для получения явных соотношений, связывающих старые и новые переменные, в общем случае, с учетом слагаемых высоких порядков по μ, приходится проводить дополнительную вычислительную работу по обращению рядов. Необходимость в разработке методов, позволяющих строить канонические преобразования в виде явных соотношений, связывающих старые и новые переменные, становится особенно ощутимой в случае получения приближений высших порядков теории возмущений. Широкое распространение получили методы, сохраняющие идею Цейпеля о разделении быстрых и медленных переменных и основанные на построении канонических преобразований с помощью рядов, впервые рассмотренных С. Ли в связи с проблемой бесконечно малых преобразований. Рассмотрим каноническую систему с n степенями свободы вида dq j dt
=
∂W , ∂ pj
dp j dt
=−
∂W ∂qj
( j = 1, n),
(4.4.1)
где W(q,p) — произвольная непрерывно-дифференцируемая функция, q = (q1,...,qn), p = (p1,...,pn) — координаты на 2n-мерном многообразии M. Обозначим решение системы (4.4.1) при t = τ через (4.4.2) q = q ( Q, P,τ ,W ), p = p ( Q, P,τ , W ), при этом Q, P — векторы начальных значений:
q t = 0 = Q,
p t =0 = P .
(4.4.3)
Таким образом, в силу (4.4.2) произвольную функцию f от q, p можно рассматривать как функцию от Q1,...,Qn; P1,...,Pn, а также от τ и W, где W понимается как некая 2nмерная точка в соответствующем функциональном пространстве f (q, p) = f (Q, P, τ , W )
(4.4.4)
(черта над f соответствует замене переменных (4.4.2)). Если фиксировать τ, W, то соотношения (4.4.2) будут определять некоторое каноническое преобразование (τ,W) многообразия M в себя. Нетрудно видеть, что в окрестности начальной точки (Q,P) ∈ M и для малого интервала изменения τ преобразования (семейство контактных преобразований) (4.4.2) образуют непрерывную группу. При фиксированной функции W получается простая подгруппа — однопараметрическая коммутативная локальная группа Ли с законом композиции
(τ 1 ,W )∗ (τ 2 ,W ) = (τ 1 + τ 2 ,W ) .
(4.4.5)
Действительно, результат композиции есть движение по траектории системы (4.4.1) за время τ 1 + τ 2 .
112
Часть I. Методы небесной механики
Из (4.4.5) следуют два важных утверждения: а) тождественное преобразование (0,W) (единица группы) отвечает нулевому значению τ; б) обратное преобразование реализуется при изменении знака τ, так что (τ,W)∗(−τ,W) = (0,W).
(4.4.6)
Таким образом, обратное к (4.4.2) преобразование получается автоматически, без дополнительных вычислений: Q = Q ( q , p,−τ ,W ),
P = P ( q , p,−τ ,W ),
(4.4.7)
или f ( Q, P) = f ( q , p,−τ ,W ).
(4.4.8)
Так как для произвольного вещественного числа α из (4.4.1) непосредственно следует, что (4.4.9) (ατ ,W) = (τ, αW), то преобразование (4.4.5) можно также представить в виде (α1τ,W)∗(α2τ,W) = (τ,(α1+α2 )W).
(4.4.10)
Здесь α1, α2 — вещественные числа. В соответствии с (4.4.9) обратное преобразование (4.4.8) можно аналогично представить в форме f ( Q, P) = f ( q , p,τ ,−W ).
(4.4.11)
Определим явные выражения преобразований (4.4.2), используя так называемый ряд Ли по степеням τ. Для этого рассмотрим векторное уравнение вида dx = G( x ), dt
x t =0 = X ,
(4.4.12)
где x = (x1,...,xn), G — голоморфная вектор-функция своих аргументов в окрестности точки X = (X1,...,Xn). Решение (4.4.12) при t = τ представимо в форме τ
x − X = ∫ G( x )dt .
(4.4.13)
0
Последовательное интегрирование (4.4.13) после разложения вектор-функции G[x(t)] в тейлоровские ряды по степеням t = τ (в окрестности x t = 0 = X ) позволяет представить решение x(t=τ) (4.4.12) в виде сходящегося при достаточно малом τ ряда Ли ∞
x=∑ k =0
τk k!
D k X ≡ exp(τD) X .
(4.4.14)
Здесь D — линейный дифференциальный оператор: D = G( X ) так что
n ∂ ∂ = ∑ Gm ( X ) , ∂X m=1 ∂X m
(4.4.15)
Глава 4. Асимптотические методы
113
D 0 = 1, D k +1 = DD k . При этом произвольную аналитическую функцию от решения, как легко видеть, также можно представить в виде ряда Ли ∞
f ( x) = ∑ k =0
τk k!
D k f ( X ) ≡ exp(τD) f ( X ).
(4.4.16)
Если система (4.4.12) имеет вид (4.4.1), то, согласно (4.4.14), (4.4.16), будем иметь q = exp(τD) Q, p = exp(τD) P, (4.4.17) f ( q , p) = exp(τD) f ( Q, P), причем оператор D в этом случае (поскольку правые части (4.4.1) являются функциями как от q, так и от p) представляет собой скобку Пуассона (см. раздел 1.7) n ⎛ ∂W (Q, P) ∂ ∂W (Q, P) ∂ D = ∑ ⎜⎜ − ∂Pm ∂ Qm ∂ Qm ∂Pm m =1 ⎝
⎞ ⎟⎟, ⎠
n ⎛ ∂ f ∂W ∂ f ∂W − Df = { f ,W } = ∑ ⎜⎜ ∂Pm ∂ Qm m =1 ⎝ ∂ Qm ∂Pm
⎞ ⎟⎟. ⎠
так что (4.4.18)
Обратное к (4.4.17) преобразование, как следует из (4.4.7), определяется в виде Q = exp( −τd ) q, P = exp( −τd ) p,
(4.4.19)
f (Q, P ) = exp( −τd ) f (q, p ),
а оператор d определяется выражением n ⎛ ∂W ( q , p ) ∂ ∂W ( q , p ) ∂ d = ∑ ⎜⎜ − ∂ pm ∂ qm ∂ qm ∂ pm m =1 ⎝
⎞ ⎟⎟. ⎠
4.5. Метод Депри-Хори Рассмотрим автономную гамильтоновскую систему вида
dq j dt
=
∂F , ∂ pj
dp j dt
=−
∂F ∂qj
( j = 1, n),
(4.5.1)
F = F (q1 ,K q n ; p1 ,K, p n ).
Наряду с (4.5.1) рассмотрим также вспомогательную систему (4.4.1). Согласно предыдущему разделу, общее решение (4.4.1) для слабовозмущенной системы (при достаточно малом τ) представимо в виде (4.4.17), где Q = (Q1 , K , Qn ), P = ( P1 , K, Pn ) — новые переменные, определяемые (4.4.19) (переход от текущих к начальным значениям переменных q, p вспомогательной системы мы интерпретируем как переход от старых к новым переменным). В новых переменных Q, P гамильтониан (4.5.1), согласно (4.4.17), выражается в виде f (q, p ) = exp(τD) f (Q, P) = F ∗ (Q, P). (4.5.2)
114
Часть I. Методы небесной механики
Следовательно, система (4.5.1) может быть преобразована в каноническую систему
∂F ∗ (Q, P ) = , dt ∂ Pj
∂F ∗ (Q, P ) =− dt ∂Qj
dQ j
dPj
( j = 1, n),
(4.5.3)
в которой F ∗ = exp(τD ) F (Q, P). Если гамильтониан F исходной системы (4.5.1) разлагается в ряд по малому параметру μ = τ, то есть (4.5.4) F = F0 + τF1 + τ2F2 + ... , то и вспомогательный гамильтониан W ("генератор") и оператор D, определяемый (4.4.18), целесообразно представить рядами ∞
∞
W = ∑ τ j Wj ,
D = ∑τ j Dj ,
j=0
где
(4.5.5)
j=0
n ∂W j ∂ ⎞ ⎛ ∂W j ∂ ⎟. − D j = ∑ ⎜⎜ ∂ Qm ∂Pm ⎟⎠ m =1 ⎝ ∂Pm ∂ Qm
(4.5.6)
Тогда гамильтониан новой системы (4.5.3) представим, с учетом (4.4.16), в виде ∞
F =∑ ∗
k =0
k
∞ ⎞ ⎛ ∞ ⎞ ⎜ ∑ τ D j ⎟ ⎜ ∑ τ s Fs (Q, P )⎟ = ∑ τ l Fl ∗ (Q, P ). k ! ⎝ j =0 ⎠ l =0 ⎠ ⎝ s= 0
τk ⎛
∞
j
(4.5.7)
Выведем выражение для общего члена ряда (4.5.7). Для этого определим Fks как коэффициенты разложений ∞
D 0 F = ∑ τ s F0s , s= 0
∞ ⎞ ⎛ ∞ ⎛ ∞ ⎞ 1 1 D F = ⎜ ∑ τ j D j ⎟ ⋅ ⎜ ∑ τ s Fs ⎟ = ∑ τ s F1s , 1! ⎠ s= 0 ⎠ ⎝ s= 0 ⎝ j=0
(4.5.8)
⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ ⋅ k
∞ ⎞ ⎛ ∞ ⎞ 1 k 1⎛ ∞ D F = ⎜ ∑ τ j D j ⎟ ⋅ ⎜ ∑ τ s Fs ⎟ = ∑ τ s Fks . k! k ! ⎝ j=0 ⎠ s= 0 ⎠ ⎝ s= 0
Представляя степень ряда (4.5.7) в виде последовательного произведения рядов, для Fks, согласно (4.4.18) и (4.5.5), будем иметь Fks =
1 ∑ k!
{{{ F ,W },W },K,W }. i
j1
j2
jk
(4.5.9)
Скобки в (4.5.9) представляют собой скобки Пуассона вида (4.4.18), в общем случае неассоциативные и некоммутативные. Учитывая, что согласно (4.5.7), (4.5.8), Fos = Fs, по индукции нетрудно получить следующее рекуррентное соотношение:
Глава 4. Асимптотические методы
115
1 s Fks = ∑ {Fk −1,s−r ,Wr }. k ! r =0
(4.5.10)
Из (4.5.7) и (4.5.8) для искомого общего члена ряда (4.5.7) в итоге получим: l
Fl ∗ = ∑ Fs,l − s .
(4.5.11)
s= 0
Для определения F*(Q,P) с точностью до τl включительно достаточно вычислить, со1 гласно (4.5.11), ( l + 1)( l + 2) , то есть сумму членов арифметической прогрессии 1, 2, 3, 2 ..., l+1 элементов треугольной матрицы F00 F10 F20
F01 F11 K
F02 K
K
Для вычисления Fl ∗ необходимо сложить элементы на диагоналях (F01+F10, F02+F11+F20, ...). Полное выражение для Fl ∗ в виде слагаемых, представленных, согласно (4.5.10), через скобки Пуассона типа (4.5.9), как нетрудно видеть, содержит l
l!
∑ s!(l − s)! = 2
l
s= 0
слагаемых. На основании (4.5.10), (4.5.11) выпишем первые члены разложения (4.5.7): F ∗ (Q, P) = F0 + τ [F1 + {F0 , W0 }] + τ 2 [F2 + {F1 , W0 } + {F0 , W1 } + +
1 {{F0 , W0 }, W0 }⎤⎥ + τ 3 ⎡⎢ F3 + {F0 , W2 } + {F1 , W1} + {F2 , W0 } + 1 {{F1 , W0 }, W0 } + (4.5.12) 2 2 ⎦ ⎣ +
1 {{F0 , W0 }, W1}⎤⎥ + 1 {{F0 , W1}, W0 } + 1 {{{F0 , W0 }, W0 }, W0 }⎤⎥ + K 6 2 ⎦ 2 ⎦
Следует отметить, что по принятому ранее предположению (см. (4.5.4)) τ = μ — малый параметр, а следовательно, (4.4.17), (4.4.19) — канонические преобразования, близкие к тождественным. Генератор W в ряде случаев может быть выбран таким образом, чтобы система (4.5.3) была интегрируемой (см. ниже). В отличие от оператора (4.4.18), или (4.5.6), рассматриваемого Ж. Хори, А. Депри использовал обладающий, казалось бы, большей общностью дифференциальный оператор ΔW , связанный с оператором D соотношением Δ W f = { f ,W } + ∂ f ∂τ и учитывающий явную зависимость генератора преобразования от параметра τ. Однако генератор преобразования в (4.4.18) (в методе Хори) формально можно считать также функцией от τ, например, приняв время за добавочную каноническую координату (см. (4.3.1), (4.3.2)), что и обуславливает эквивалентность обеих версий ка-
116
Часть I. Методы небесной механики
нонических преобразований Хори и Депри. Под эквивалентностью здесь следует понимать существование определенной зависимости между генераторами (или производящими функциями) преобразований различных методов, обеспечивающей совпадение соответствующих канонических преобразований. В этом смысле для задач, связанных с возмущенным эллиптическим движением, установлена также эквивалентность метода Депри-Хори и метода Цейпеля, по крайней мере с точностью до членов третьего порядка. В качестве иллюстрации возможностей метода Депри-Хори применим его к задаче о движении спутника, близкого к планете, имеющей форму гидростатически равновесного сжатого эллипсоида. В этой задаче с тремя степенями свободы, ограничиваясь в разложении гравитационного потенциала планеты второй зональной гармоникой J2 , гамильтониан можно представить в виде (см. главу 7) F = F0 + τ F1,
(4.5.13)
где
F0 =
1 rэ2 J 2 ( 2 − 3sin 2 i ) + , 2a 4a 3 (1 − e 2 ) 3/ 2
3 ⎤ 3rэ2 sin 2 i ⎛ a ⎞ 3 r02 (2 − 3 sin 2 i ) ⎡⎛ a ⎞ 2 −3 / 2 F1 = ⎜ ⎟ cos 2( v + ω ), ⎢⎜ ⎟ − (1 − e ) ⎥+ 4a 3 4a 3 ⎝ r ⎠ ⎣⎢⎝ r ⎠ ⎦⎥
единица времени выбрана так, чтобы гравитационная постоянная обращалась в единицу, масса планеты P0 принята за единицу масс, τ = J2 , rэ — экваториальный радиус P0, оскулирующие кеплеровы элементы a, e, i, ω считаются функциями канонических элементов (xk, yk; k = 1,3 ) Делоне (2.3.47). Решим рассматриваемую задачу с точностью до τ 2 = J 22 включительно. Согласно (4.5.7) и (4.5.12), F0∗ совпадает с выражением F0 в (4.5.13), в котором все старые (оскулирующие) элементы xk, yk следует заменить на новые (средние) элементы Xk, Yk. Как следует из (4.4.18) и (4.5.12), связь между генератором W0 и F1∗ дается формулой (см. (4.3.19)) 3 ∂W (4.5.14) {F0 , W0 } ≡ ∑ ( −nk ) ∂Y 0 = F1∗ − F1 , k =1 k в которой средние движения ∂F nk = − 0 (k = 1,3) ∂X k могут быть непосредственно вычислены с рассматриваемой точностью на основании (4.5.13):
Глава 4. Асимптотические методы
117
2 ⎛ 3 1 − 3( X 3 X 2 ) ⎞ ⎟, n1 = X 1−3 ⎜ 1 + rэ2 J 2 X 1 X 23 ⎝ 4 ⎠
n2 =
3 rэ2 J 2 5 X 32 − X 22 , 2 3 4 ( X1 X 2 )
(
n3 = −
)
(4.5.15)
3 rэ2 J 2 X 3. 2 X 13 X 25
Полагая далее ∗ 1
F = M Yk ( F1 ) =
1 ( 2π ) 3
2π
∫ ∫ ∫ F dY dY dY 1
1
2
3
=0
(4.5.16)
0
(так как MY1 (a 3r −3 ) = (1 − e 2 ) −3/2 ) и учитывая, что, согласно (4.5.13), правая часть (4.5.14) не зависит от Y3, перепишем (4.5.14) в виде
n1
∂W0 ∂W0 + n2 = F1 (Y1 , Y2 ). ∂Y1 ∂Y2
(4.5.17)
Здесь остальные переменные, от которых зависит F1, рассматриваются как параметры. Функция F1 определяется (4.5.13), где все элементы должны быть выражены через новые (средние) элементы Xk, Yk k = 1,3 . Общее решение (4.5.17) с точностью до произвольной функции, не зависящей от Y1, Y2, можно представить в виде квадратуры *) :
W0 =
⎛ n ⎞ 1 F1 ⎜ Y1 , 2 Y1 + C⎟ dY1 . ∫ n1 ⎝ n1 ⎠
(4.5.18)
При этом после интегрирования следует считать, что
C = Y2 −
n2 Y1 . n1
Результаты интегрирования (4.5.18) приведены в [17]. Согласно (4.5.12) аналогично находим связь между W1 и F2∗ :
n1
∂W1 ∂W1 + n2 = F, ∂Y1 ∂Y2
(4.5.19)
где с учетом (4.5.14) имеем F = F2 − F2∗ + {F1 ,W0 } +
1 1 {F0 ,W0 },W0 } = {F1 ,W0 } − F2∗ . { 2 2
Выбирая
*)
В этом можно убедиться непосредственной проверкой, то есть подстановкой (4.5.18) в (4.5.17).
118
Часть I. Методы небесной механики 3rэ4 1 F = M Y1Y2 {F1 ,W0 } = 2 128n1 X 16 X 27 ∗ 2
⎧⎪ ⎛ X ⎞ 2 ⎡ ⎛ X ⎞ 2 ⎤ 3 ⎟ ⎢5⎜ 3 ⎟ − 1⎥ + ⎨8⎜ X ⎝ ⎥⎦ 2 ⎠ ⎢ ⎝ X2 ⎠ ⎪⎩ ⎣
(4.5.20) 2 2 ⎫ ⎡ ⎛ X ⎞ 2 ⎤⎡ ⎛ X ⎞ 2 ⎛ X ⎞ 4 ⎤ ⎡ ⎤ ⎛ ⎞ X X ⎪ + ⎢1 − ⎜ 2 ⎟ ⎥ ⎢18⎜ 3 ⎟ − 5⎜ 3 ⎟ − 5⎥ + 4 2 ⎢1 − 3⎜ 3 ⎟ ⎥ ⎬, X1 ⎢ ⎝ X2 ⎠ ⎝ X2 ⎠ ⎥ ⎪ ⎢⎣ ⎝ X 1 ⎠ ⎥⎦ ⎢⎣ ⎝ X 2 ⎠ ⎥⎦ ⎣ ⎦ ⎭ функцию W1 можно выразить через элементарные функции, что, однако, связано с проведением громоздких выкладок. Таким образом, с рассматриваемой точностью o[τ2] новый гамильтониан rэ J 2 1 − 3( X 3 X 2 ) 2 1 ∗ (4.5.21) F = − + J 22 F2∗ , 2 3 2 X1 4( X 1 X 2 )
[
]
где F2∗ определяется (4.5.20), не зависит от Yk ( k = 1,3 ), а следовательно, система в новых переменных для средних элементов интегрируется непосредственно:
X k = const
(a, e, i = const ),
Yk = Yk0 + ω k (t − t 0 ) (k = 1,3).
(4.5.22)
Здесь средние движения (частоты) ωk = −∂F∗/∂Xk могут быть вычислены на основании (4.5.21). Взаимосвязь старых (оскулирующих) и новых (средних) элементов, если обозначить их разность символом δ, согласно (4.4.17), (4.5.12), определяется соотношениями ⎫ ∂ τ 2 ⎧ ∂W δX k = x k − X k = τW0 + τ 2W1 + ⎨ 0 , W0 ⎬, 2 ⎩ ∂Yk ∂Yk ⎭ (4.5.23) 2 ⎫ ∂ τ ⎧ ∂W0 2 , W0 ⎬ ( k = 1,3). δYk = y k − Yk = − τW0 + τ W1 − ⎨ 2 ⎩ ∂X k ∂X k ⎭ Для установления обратного перехода от оскулирующих элементов к средним в соответствии с (4.4.19) достаточно поменять элементы местами и изменить знак W. Поэтому для δxk =Xk − xk , δyk = Yk − yk получим ⎫ ∂ τ 2 ⎧ ∂ W0 2 δx k = − τW0 + τ W1 + ⎨ , W0 ⎬, ∂ yk 2 ⎩ ∂ yk ⎭ (4.5.24) 2 ⎫ ⎧ ∂ W ∂ τ δy k = τW0 + τ 2W1 − ⎨ 0 , W0 ⎬ (k = 1,3). 2 ⎩ ∂ xk ∂ xk ⎭ В (4.5.24) правые части считаются функциями от оскулирующих элементов, в то время как в (4.5.23) они являются функциями от средних элементов.
[
]
[
]
[
[
]
]
4.6. Понятие о КАМ-теории В разделе 4.2 была обоснована сходимость схемы осреднения для гамильтоновских систем вида (4.1), (4.2). Доказательство сходимости процедуры осреднения указанных гамильтоновских систем впервые было получено в работах А. Н. Колмогорова, В. И. Арнольда, Ю. Мозера (КАМ-теория).
Глава 4. Асимптотические методы
119
Все результаты КАМ-теории в своей классической форме справедливы для чрезвычайно малых величин μ. Так, в задаче трех тел наиболее "слабая оценка" для параметра μ, если массу центрального тела принять за единицу, имеет вид: μ ≤ 10−118. Однако развитие методов КАМ-теории и, прежде всего, применение методов преобразований Ли позволило провести обоснование схем осреднения в реальных задачах небесной механики с планетарными массами. Рассмотрим более подробно гамильтониан системы (4.1). Невозмущенная часть гамильтониана (4.2) F0 = F0 (x1,...,xn) не зависит от y1, ..., yn, а следовательно, x1, ..., xn при μ = 0 являются независимыми первыми интегралами движения. В этом случае траектории невозмущенной системы все время остаются на n-мерном торе. При этом семейству различных значений интегралов соответствует семейство инвариантных торов. Их взаимное расположение в пространстве определяется размерностью фазового пространства. При n = 2 торы, соответствующие различным значениям интегралов x10 = const , x20 = const , вложены друг в друга и не пересекаются, разделяя пространство на три различные области (рис. 6). При n > 2 торы пересекаются, поскольку в 2n-мерном пространстве поверхность постоянной энергии F = E имеет размерность 2n−1. Поэтому границы, которые должны ее разделять на различные области, очевидно, имеют размерность 2n−2. Следовательно, для того чтобы торы делили пространство на различные области, то есть не пересекались, необходимо, чтобы их размерность n была не меньше 2n−2: n ≥ 2n − 2. Отсюда следует, что n ≤ 2 и случай двух степеней свободы оказывается выделенным (граничным).
I II
III
Рис. 6. Движение на двумерном торе имеет две частоты ωj = − ∂F0/∂xj (j = 1, 2), то есть характеризуется двумя средними движениями n1, n2. В общем случае они несоизмеримы, так что траектория за неограниченный промежуток времени всюду плотно покрывает поверхность тора и не замкнута. В резонансном случае, когда отношение частот рационально: ω 1/ω2 = k1/k2 (k1, k2 ∈ N), (4.6.1)
120
Часть I. Методы небесной механики
траектория замыкается через конечное число оборотов на торе. При наличии возмущений (при μ ≠ 0) устойчивость траекторий системы на неограниченном промежутке времени непосредственно связана с сохранением инвариантных торов. Согласно теореме Колмогорова, если невозмущенная гамильтоновская система невырождена, то есть все частоты ωi = −∂F0/∂xi (i = 1, n) независимы:
∂ 2 F0 det ≠ 0, ∂ xi ∂ y l
(4.6.2)
то при достаточно малом консервативном возмущении большинство нерезонансных инвариантных торов, которые расположены в некоторой малой области вне окрестности резонанса, не исчезает, а происходит их малая деформация. При этом в фазовом пространстве возмущенной системы также имеются инвариантные торы, заполненные всюду плотно фазовыми кривыми (условно-периодическими орбитами), характеризуемыми числом частот, равным числу степеней свободы. Условие достаточной малости возмущений означает существование некоторого такого граничного значения μ′, что теорема справедлива при μ < μ′. В. И. Арнольд впоследствии обобщил теорему Колмогорова, рассмотрев вырожденные случаи, когда не выполняется условие (4.6.2). В случае дифференцируемой конечное число раз (а не аналитической возмущающей) функции, а также для неканонических систем аналогичное утверждение о существовании (сохранении) инвариантных торов было доказано Мозером. Возмущения, согласно КАМ-теории, разрушают торы, располагающиеся в малой окрестности резонансных торов шириной ≤ μ1/2 (резонансные торы определяются услоn
вием
∑k ω i
i
= 0 ). Дальнейшие свойства областей разрушенных торов зависят, прежде
i =1
всего, от топологии невозмущенных инвариантных торов в фазовом пространстве. Это приводит к отличию случая n = 2 от n > 2. Поскольку при n = 2 торы разделяют фазовое пространство на три независимые области (см. рис. 6), то при этом значении n разрушенные торы располагаются между инвариантными торами и, следовательно, изменение xi (i = 1, n) на траектории имеет характерную величину порядка ширины области разрушения и поэтому ограничено. Траектория оказывается зажатой между инвариантными торами, а ее отклонение от невозмущенной траектории стремится к нулю при μ → 0, что и обуславливает глобальную устойчивость траекторий системы при n = 2 и μ < μ′. В случае числа степеней свободы n > 2 инвариантные торы уже не делят фазовое пространство на независимые области, поэтому зоны разрушения вблизи резонансных торов могут, соединяясь, пронизывать все фазовое пространство подобно паутине. Это приводит к появлению конечной меры траекторий, которые способны сколь угодно далеко уходить от своих невозмущенных значений. Это явление принято называть "диффузией Арнольда"; скорость диффузии экспоненциально убывает с уменьшением μ. Итак, при n > 2 основная часть торов также не разрушается, однако существует конеч-
Глава 4. Асимптотические методы
121
ная малая мера таких начальных условий, которые приводят к медленному уходу системы сколь угодно далеко от своей невозмущенной траектории. Собственно доказательство теоремы Колмогорова-Арнольда (а также Мозера) базируется на применении итерационного метода построения новых канонических координат вида q = x + μH ( x1 ,K, x n ; y1 ,K, y n ; μ ), (4.6.3) p = y + μG( x1 ,K, x n ; y1 ,K, y n ; μ ), в которых преобразованный гамильтониан, формально получающийся в результате бесконечной последовательности канонических замен переменных, в конечном итоге станет не зависящим от y1 ,K, y n . Следовательно, каноническая система относительно переменных q = (q1 ,K, qn ), p = ( p1 ,K, pn ) будет иметь решение того же характера, что и невозмущенное решение при μ = 0 относительно переменных x1 ,K, x n , y1 ,K, y n :
qi = const,
pi = pi 0 + ni (t − t 0 )
(i = 1, n).
Траектории преобразованной системы будут лежать на инвариантных n-мерных торах, выделяемых уравнениями qi = const (i = 1, n). В соответствии с заменой переменных (x,y) → (q,p) вида (4.6.3) наличие возмущения приводит для "почти всех" иррациональных чисел ω 1 , ω 2 , K, ω n , соответствующих нерезонансным частотам (то есть вне резонансных зон), лишь к соответствующим малым смещениям "невозмущенных торов", причем "возмущенные торы" в пространстве новых переменных q, p остаются заполненными условно-периодическими траекториями с прежними невозмущенными частотами ωi = − ∂F0/∂xi (i = 1, n) . Если обозначить все фазовое пространство через M, то можно построить такую бесконечную последовательность вложенных множеств M = M0 ⊃ M1 ⊃ ... ⊃ Mk ⊃ ... , которая обладает следующими свойствами. На каждом множестве Mk существуют канонические переменные q ( k ) , p ( k ) , близкие к переменным x, y и такие, что F = F0( k ) (q ( k ) ) + μF1( k ) (q ( k ) , p ( k ) , μ ), где в некоторой комплексной окрестности Mk имеет место оценка
F1( k ) ≤ μ (1+α )
k
−1
, 0 < α < 1.
(4.6.4)
∞
Множество M ∞ = I M k не пусто и, более того, мера M\M∞ мала вместе с μ. k =0
На основании неравенства (4.6.4) удается доказать, что M∞ состоит целиком из инвариантных n-мерных торов. Переменные q(0), p(0) совпадают с исходными переменными x, y. Координаты q ( k ) , p ( k ) строятся однотипной для всех k = 1, 2, ... заменой переменных вида (4.6.3) по координатам q ( k −1) , p ( k −1) . При этом оказываются справедливы неравенства
122
Часть I. Методы небесной механики n
∑q i =1
(k ) i
−q
( k −1) i
≤μ
(1+α ) k −1
n
,
∑p
(k ) i
k −1
− pi( k −1) ≤ μ (1+α ) ,
i =1
так что для μ < μ′ гарантируется сходимость бесконечной последовательности канонических замен переменных вида (4.6.3). 4.7. Локальная неустойчивость и динамический хаос В гамильтоновских системах с числом степеней свободы больше двух (точнее, более 3/2, см. раздел 1.10) наблюдается “динамический хаос” (динамическая стохастичность), когда траектории системы представляют собой случайные временные процессы несмотря на то, что в исходных уравнениях нет никаких внешних случайных сил или случайных источников. Динамический хаос возникает вследствие специфической локальной неустойчивости относительно сколь угодно малых возмущений орбит динамической системы. Он проявляется в определенных областях фазового пространства, а также в определенных областях значений параметров системы. Эти области могут быть чрезмерно малыми, однако при любых конечных значениях параметров и фиксированном гамильтониане системы они оказываются неустранимыми. Главная черта хаотических систем состоит в том, что малое возмущение начальных условий для динамической переменной приводит к непредсказуемости результирующего движения за конечное время. “Детерминируемость” отражает класс дифференциальных уравнений, которыми описывается исследуемый процесс и в которых нет случайных функций, “хаос” отвечает характеру процесса (локальная неустойчивость, фрактальная размерность, ограниченная предсказуемость). Динамический хаос присущ только нелинейным системам. В гамильтоновских системах “зародышами хаоса” являются “стохастические слои”, образующиеся в окрестности разрушенных сепаратрис, и “стохастические паутины” (система стохастических слоев, объединенная в некоторую связанную сеть). Наличие динамического хаоса непосредственно означает неинтегрируемость систем. Вблизи сепаратрисы (границы областей различных типов движений), где период колебаний стремится к бесконечности, даже малые изменения частоты колебаний могут привести к значительным изменениям фазы. Это и является причиной локальной неустойчивости. Если число степеней свободы задачи достаточно велико, то все фазовое пространство “покрывается сеткой стохастических слоев” на месте разрушенных (“расщепленных”) сепаратрис. “Расщепление сепаратрис” косвенно свидетельствует о неинтегрируемости системы. Обозначим через ρ(t) расстояние между двумя соответствующими точками фазового пространства, принадлежащими разным траекториям в момент времени t0. Локальная неустойчивость будет проявляться в существовании такого направления, вдоль которого расстояние между траекториями будет экспоненциально расти со временем
ρ(t) = ρ(t0) exp[h(t − t0)].
(4.7.1)
Инкремент неустойчивости h = h(x,y) является функцией точки в фазовом пространстве. Локальная неустойчивость системы, таким образом, означает существование конечномерной области фазового пространства системы, для любой из точек которой, выбранной в качестве начальной, ее малое возмущение приводит к значительному расхо-
Глава 4. Асимптотические методы
123
ждению соответствующих траекторий (то есть (4.7.1) может проявляться не для всех начальных условий). При ограниченном (финитном) типе движения изначально близкие траектории не могут разойтись дальше, чем на размер области движения. В этом случае локальная неустойчивость приводит к сильному запутыванию (перемешиванию) траекторий системы. Если отображение гамильтоновской системы (4.1), совершающей финитное движение, представить в виде (4.4), то собственные значения λ матрицы M$ отображения L$ k , элементы которой определяются выражением M ij ,k = ∂ ( x , y ) i ,k +1 ∂ ( x , y ) j ,k
(i , j = 1,2n) ,
находятся из уравнения M$ − λE$ = 0.
(4.7.2)
Здесь E$ — единичная матрица размерности 2n. В общем случае комплексные величины λr ( r = 1, 2n) можно расположить в порядке возрастания их абсолютных значений: ⏐λ1⏐≤⏐λ2⏐≤…≤⏐λm⏐≤…≤⏐ λ 2n ⏐, где λm — последнее собственное значение, для которого ⏐λm⏐≤ 1. Следовательно, растяжение фазового объема должно происходить вдоль (2n−m) направлений. Для определения показателя растяжения предположим, что это растяжение происходит вдоль направления собственного вектора с номером j на k-м шагу отображения (4.4), так что ⏐λj,k⏐> 1. Пусть также собственное значение λ не зависит от шага отображения k. Тогда через n шагов отображения элемент длины l вектора, характеризующего положение изображающей точки фазового пространства, увеличится в направлении j на величину
[ ]
n
l j (n) = λ j l j (0) = l j (0) exp σ j n ,
(4.7.3)
σ j = ln λ j
(4.7.4)
где является показателем Ляпунова. Если все (2n− m) направления имеют сохраняющиеся во времени показатели Ляпунова, то локальная неустойчивость будет, согласно (4.7.1), определяться выражением h=
2n
∑σ j =
j = m +1
2n
∑ ln λ
j
.
(4.7.5)
j = m +1
В общем случае канонических систем (в отличие от рассмотренной идеализированной ситуации) показатели Ляпунова зависят от положения исследуемой точки в фазовом пространстве и от номера n шага отображения (времени). 4.8. Дополнения Динамический хаос становится “шумом”, то есть процессом, для которого не имеется предсказательной модели, по истечении так называемого времени детермини-
124
Часть I. Методы небесной механики
рованного поведения τкр, когда корреляционные функции реального (регистрируемого) процесса f(t) и модели g(t) f (t ) g (t ) K (τ ) = , t = t0 + τ (4.8.1) 1/ 2 f 2 (t ) g 2 (t )
[
]
близки к нулю (здесь 〈…〉 — означает усреднение по фазовым переменным x, y, то есть фазовому объему Γ), тогда как при τ < τкр динамический хаос хотя бы частично предсказуем, то есть случайность и детерминированность являются полюсами единого свойства — “частичной детерминированности”. На рис. 7 область A соответствует полностью детерминированному поведению исследуемого процесса, область B — частично детерминированному поведению, область C — случайному (непредсказуемому) поведению системы.
K
1,0
0,5
A
C
B τ кр
0
τ
Рис. 7. Таким образом, существенная неустойчивость в канонических системах развивается на интервалах времени t − t0 >> τкр, что, безусловно, необходимо учитывать при проведении численных интегрирований в рамках исследуемой канонической системы на интервалах в миллионы и более лет (t − t0 >> τкр), когда значительное влияние должны оказывать реально существующие диссипативные факторы (как уже отмечалось, существует высокая чувствительность к начальным условиям, обуславливающая динамическую неустойчивость и возможность развития хаоса). Локальная неустойчивость непосредственно связана со свойством “перемешивания” в фазовом пространстве. Условие перемешивания имеет вид: lim Rk ( f , z ) = 0, k →∞
Rk = f ( L$ k ( x , y ) z ( x , y ) − f ( x , y ) z ( x , y) .
(4.8.2)
Здесь Rk ( f , z) — коррелятор двух произвольных функций траекторий системы f(x,y) и z(x,y), L$ k — оператор отображения (4.4) с матрицей (4.7.2). Из (4.8.2) следует, что перемешивание означает затухание коррелятора Rk, зависящего как от выбора функций f и z, так и от выбора последовательности моментов времени t0, t1, ..., tk, ... (см. (4.4) и (4.7.2)). Для непрерывных функций (непрерывного по времени отображения L$ рассматриваемой динамической системы) условие перемешивания имеет вид lim R( f , z, t ) = 0, R = f L$ ( x, y) z ( x, y) − f ( x, y) z ( x, y) . (4.8.3) t →∞
(
)
Глава 4. Асимптотические методы
125
Для эргодических движений Φ = {f, z}, когда среднее по фазовому объему (Γ) и среднее по времени совпадают: t +T 1 Φ ( x , y , t ) d Γ ( x , y ) = lim Φ( x , y , t ′)dt ′, (4.8.4) ∫Γ T →∞ T ∫ t средние значения 〈f〉 и 〈z〉 в (4.8.3) не зависят от момента времени, в который они вычисляются. Траектории, для которых выполнено свойство перемешивания (4.8.3), являются одновременно и эргодическими в смысле определения (4.8.4). (Обратное утверждение в общем случае несправедливо). Свойство перемешивания непосредственно проявляется в равномерном “расплывании” так называемой “фазовой капли”, когда сферически симметричная конечная область фазового пространства (фазовая капля), равномерно заполненная траекториями, принимает сильно изрезанную форму (на рис. 8 представлены соответствующие сечения фазового пространства).
Рис 8. Степень усложнения “фазовой капли” увеличивается со временем и может быть охарактеризована экспоненциальным законом перемешивания Здесь τ 0 ∝ τ kp
R(t ) = R0 exp(− t τ 0 ). называется “временем перемешивания”, или “временем забывания на-
чальных условий”. При этом в первом приближении можно считать, что имеет место соотношение (4.8.5) τ 0 ~ h −1 , где величина h определена в (4.7.1). Свойство траекторий динамических систем иметь затухающие корреляторы или локальную неустойчивость означает эквивалентность этих траекторий реализации некоторого случайного процесса. Поэтому в указанном смысле динамические системы называют стохастическими. Аналитического метода получения строгого критерия стохастичности в настоящее время не существует, хотя имеется несколько полукачественных критериев: в частности, “критерий перекрытия”, когда невозмущенные сепаратрисы двух соседних резонансов касаются друг друга, или критерий, связанный с определением момента потери линейной устойчивости периодических траекторий (см. главу 5). Для системы с более чем двумя (или ≥3/2) степенями свободы резкой границы стохастичности не существует, т.к. все стохастические слои сепаратрис в фазовом пространстве связаны между собой.
126
Часть I. Методы небесной механики
Описание систем с перемешиванием возможно с использованием понятия энтропии Колмогорова-Синая (КС-энтропии). Если предположить, что при t0 “фазовая капля” занимает в фазовом пространстве объем ΔΓ0, то ее энтропия по определению будет иметь вид (4.8.6) S = ln ΔΓ0. Объем, занимаемый сильно изрезанной в результате перемешивания фазовой капли ΔΓ(t ), с учетом многочисленных пустот будет расти, поскольку для него теорема Лиувилля уже неприменима *) . Согласно (4.7.1) огибающий (огрубленный) фазовый объем ΔΓ(t ) можно оценить в виде
[
]
ΔΓ (t ) = ΔΓ0 exp h (t − t 0 ) .
(4.8.7)
Следовательно, для энтропии фазовой капли, претерпевшей перемешивание (расплывание), будем иметь S = ln ΔΓ (t ) = S + h (t − t 0 ). (4.8.8) Тогда для скорости изменения S при t→∞ , предполагая исходный объем фазовой капли ΔΓ0 достаточно малым, но конечным (так что внутри него пустоты отсутствуют), получим энтропию Колмогорова-Синая в виде ⎛1 ⎞ (4.8.9) lim⎜ ln ΔΓ (t )⎟ = h . t →∞ ⎝ t ⎠ Таким образом, КС-энтропия определяет среднюю скорость изменения энтропии S (“макрообъема”) локально неустойчивой фазовой капли, при этом, согласно (4.8.5), 〈h〉 ~ 1/τ0. Последнее соотношение связывает перемешивание с энтропией Колмогорова-Синая и играет важную роль при анализе условий появления хаоса в динамических системах [18]. В общем случае любая динамическая система с невозмущенным гамильтонианом с числом степеней свободы не меньше единицы имеет неустранимую область стохастичности. Так как невозмущенный гамильтониан имеет сепаратрисы, то его возмущения разрушают эти сепаратрисы и образуют стохастические слои при любых конечных возмущениях. Несмотря на то, что существование областей стохастичности и является некоторым универсальным свойством динамических систем, это еще не означает наличия сильной неустойчивости в системе, поскольку области хаоса являются экспоненциально узкими. Поэтому дальнейшая судьба стохастических траекторий определяется топологией “слабого хаоса” в фазовом пространстве (то есть тем, как соединяются области хаоса между собой). Объединение всех стохастических слоев в фазовом пространстве может образовать единую сеть — стохастическую паутину, приводящую к неустранимой диффузии в фазовом пространстве [19].
*)
Теорема Лиувилля применима лишь непосредственно к фазовой жидкости: ΔΓ(t) = ΔΓ0.