Теория относительности для астрономов. М.В.Сажин Государственный Астрономический Институт им. П.К.Штернберга, Москва. Ре...
14 downloads
179 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Теория относительности для астрономов. М.В.Сажин Государственный Астрономический Институт им. П.К.Штернберга, Москва. Рецензенты: др. физ. мат. наук В.Е.Жаров, др. физ. мат. наук К.В. Куимов.
Содержание •
Оглавление
•
1. Принципы относительности o
1.1 Принцип относительности Галилея
o
1.2
Трудности
классической
механики
при
описании
распространения света o •
•
2. Специальная теория относительности o
2.1 Кинематика специальной теории относительности
o
2.2 Общие преобразования системы координат, бусты.
o
2.3 Преобразования векторов
o
2.4 Четырехмерная скорость
3. Ускоренные системы отсчета и СТО o
•
•
3.1 Включение гравитации в СТО.
4. Эксперименты по ОТО o
•
1.3 Специальная теория относительности
4.1 Эксперименты по проверке скорости хода времени
5. Неэвклидова геометрия o
5.1 Метрика искривленного пространства - времени
o
5.2 Геодезические линии в неэвклидовой геометрии
6. Анализ в неэвклидовой геометрии o
6.1 Ковариантное дифференцирование
o
6.2 Связь метрического тензора и символов Кристоффеля
•
•
•
•
o
6.3 Производная Лагранжа -Эйлера
o
6.4 Производная Ли
7. Тензор кривизны o
7.1 Тензор кривизны
o
7.2 Параллельный перенос вектора по замкнутой кривой
o
7.3 Свойства тензора кривизны
o
7.4 Вариации тензора кривизны
8. Уравнение движения в общей теории относительности o
8.1 Уравнение движения пробной частицы в СТО
o
8.2 Уравнение движения пробной частицы в ОТО
o
8.3 Девиация геодезический линий
9. Уравнения гравитационного поля o
9.1 Создание уравнений общей теории относительности
o
9.2 Вывод уравнений поля из вариационного принципа
o
9.3 Источник гравитационного поля
Рекомендуемая и цитируемая литература
1. Принципы относительности •
•
1.1 Принцип относительности Галилея o
1.1.1 Вращения в трехмерном пространстве
o
1.1.2 Преобразования на момент наблюдения
1.2 Трудности классической механики при описании распространения света
•
1.3 Специальная теория относительности o
1.3.1 Сверхсветовые движения и их интерпретация
1.1 Принцип относительности Галилея
Первый принцип относительности (ПО) был сформулирован еще в эпоху Возрождения Г.Галилеем. ПО относился к механике и гласил: "Законы механики в системе координат, движущейся равномерно и прямолинейно в пространстве, имеют тот же вид, что и в системе координат, покоящейся в пространстве". Из этого постулата можно сделать простой вывод, а именно: существует бесконечно
много
эквивалентных
систем
координат,
называемых
инерциальными и совершающими равномерное и прямолинейное движение или покоящихся друг относительно друга. В этих системах законы механики выполняются в простой классической форме. Определим сразу, что законами механики здесь будем называть законы движения в классической механике и законы сохранения. Принцип
относительности
Галилея
на
математическим
языке
преобразования координат обычно формулируется следущим образом. Пусть положение пробной частицы описывается в декартовой системе , кроме трех пространственных координат мы
координат
добавили временную координату, которая необходима в специальной теории относительности (СТО) и общей теории относительности (ОТО), В системе координат
=
неизменными, если система со скоростью
,
,
,
.
, законы механики остаются
движется относительно системы координат
, так, что две системы координат связаны между собой
преобразованием Галилея:
(1.1)
Рисунок 1.1: Здесь представлены оси и
оси
и
после
и
до преобразований Галилея преобразований
Галилея.
В частности из принципа относительности Галилея вытекал закон сложения скоростей: (1.2)
здесь
скорость пробной частицы в системе
частицы в системе
, а
,
скорость этой же
скорость движения одной системы координат
относительно другой, которая также входит в закон преобразования координат. Законы механики остаются неизменными также в системах координат, оси которых повернуты друг относительно друга. Поскольку астрономы наблюдатели с преобразованиями типа поворота имеют дело повседневно, обсудим их более подробно.
1.1.1 Вращения в трехмерном пространстве На
языке
математики
преобразования
Галилея
называются
преобразованиями трехмерной системы координат. Преобразования типа (1.1) называются преобразованием сдвига. Помимо сдвига в трехмерном пространстве также часто используют преобразование вращения.
Рассмотрим
все
вращения
трехмерного
пространства
вокруг
одной
фиксированной точки - начала координат. В ортогональной системе координат трехмерного пространства вращение задается уравнением (1.3)
где
-координаты вектора в системе
системе
. Матрица
вращение иногда буквой
,
координаты того же вектора в
определяет вращение. Будем обозначать , той же, что и матрицу. Напишем несколько
дополнительных условий на вращение. Так как вращение не меняет длин и углов между векторами, то оно не меняет и их скалярных произведений. Кроме того, при вращении остается инвариантной форма вида:
Поэтому можно получить уравнение для коэффицентов матрицы вида: (1.4)
где символом
называется число, равное 1, если
, и равное 0, если
. Матрицы удовлетворяющие уравнению (1.4) называются ортогональными матрицами. Если вычислить детерминант обеих частей уравнения (1.4), то получим условие вида детерминанта:
, что дает два возможных знака
Знак
соответствует
соответствует
собственным
несобственным
преобразованиям,
преобразованиям.
К
знак
несобственным
преобразованиям относятся, например, отражения. Нам они не нужны и в дальнейшем рассматриваться не будут. Рассмотрим вращения. Прежде всего проанализируем две системы координат на плоскости. Одну систему координат будем обозначать
, вторую -
. Будем считать, что
центры этих систем совпадают, а оси повернуты друг относительно друга на угол
против часовой стрелки. Тогда преобразования от координат без
крышечки к координатам с крышечкой записываются в виде системы линейных уравнений:
Рисунок 1.2: Здесь представлены оси поворота
и
оси
и
после
и
до преобразований
преобразований
поворота.
Представим это преобразование в матричном виде. Как видно из предыдущей системы уравнений, вращения совершаются вокруг некоторой
оси. Для начала выберем в качестве оси вращения ось вращение на угол
и совершим
. Матрица этого вращения имеет вид:
Детерминант такой матрицы равен единице. Математики характеризуют вращение как некоторый вектор, направленный вдоль оси вращения и равный по величине углу поворота. Для астрономов более привычным является представление вращения в виде трех последовательных
положительных
вращений
на
Эйлера1.1.
углы
Рассмотрим их подробнее. Полное вращение может быть представлено трех вращений. Первое вращение
1.2на
угол
вокруг оси
займет новое положение угол
. Затем вращение
в результате которого ось
наконец, вращение
, в результате которого ось
займет новое положение
вокруг новой оси
вновь переместится на угол
вокруг новой оси
на , и,
в результате которого ось
:
(1.5)
Элементы полной матрицы вращения произведение трех матриц поворотов вокруг осей
можно найти как ,
,
: (1.6)
(1.7)
(1.8)
При перемножении матриц необходимо помнить, что они перемножаются в обратном порядке. Перемножив матрицы, получим: (1.9)
При вращениях углы
и
могут изменяться от 0 до
, а угол
от 0 до
. Различным тройкам чисел, которые изменяются в указанных пределах, соответствуют различные вращения, кроме случая вращение есть поворот вокруг оси вращение есть поворот вокруг оси различным тройкам чисел
,
,
на угол на угол
и
. При
, а при . Поэтому
может отвечать одно вращение.
Вращение (1.9) имеет обратный элемент. Обратный элемент - это вращение на такие углы, которые приводят систему координат в прежнее
положение. Он задается другим вращением, которое совершается на углы Эйлера
,
,
.
Остается только добавить, что вращения образуют группу. Элементами группы являются повороты на углы Эйлера. Группа топологически эквивалентна
шару,
у
которого
отождествлены
диаметрально
противоположные точки.
1.1.2 Преобразования на момент наблюдения В качестве примера приведем матрицу преобразования от координат небесных тел, заданных в каталогах к текущим координатам на данный момент наблюдений. В каталогах обычно приводятся несколько характеристик некоторой звезды, две из которых - координаты звезды (ее положение) на небесной сфере (прямое восхождение) и
(склонение) приведенные на определенную
эпоху. Другими словами, указывается положение звезды на определенный момент времени, скажем, на 1 января 2000 года. Кроме указания эпохи, необходимо определить саму систему координат и указать начало отсчета координат1.3. Полюс мира - точка, на которую опирается полярная ось, вокруг которой вращается Земля - естественная ось для системы координат. Звезды в течении ночи меняют свое положение на небе (факт известный каждому, кто хоть раз наблюдал за ночным небом), лишь обна точка остается неподвижной - полюс мира. Наиболее близко к полюсу (но не точно в полюсе)
находится
Полярная
звезда.
Формально
полярная
ось
определяется как ось, проведенная через центр системы координат, параллельная оси вращения Земли [1]. Перпендикулярно полярной оси лежит плоскость экватора. В астрономии исторически выбирана сферическая система координат связанная с вращением Земли. Полярная ось и экватор служат основными
элементами этой системы координат. Угол, который отсчитывается в плсокости экватора называется прямым восхождением, а угол, который отсчитывается вдоль меридиана от плоскости экватора называется склонением. Повторим, что такая система небесных координат возникла исторически в древнем мире и сохраняется в астрономии до сих пор. Плоскость экватора (или положение полярной оси) определяет начало отсчета угла по склонению. Вторая основная точка системы координат, начало отсчета выбирается для того, чтобы указать точку от которой отсчитывается вращение Земли. Такая точка исторически была выбрана как точка пересечения небесного экватора и эклиптики. Экватор - плоскость перпендикулярная полярной оси и прекрасно подходит для задания угловой координаты. Кроме суточного вращения Земля испытывает еще и годовое вращение вокруг Солнца. В таком годовом вращении существует полюс эклиптики (ось орбиты Земли вокруг Солнца) и плоскость эклиптики, которая перпендикулярна полярной оси эклиптики. Экватор и эклиптика наклонены друг относительно друга на угол примерно
, точка
пересечения используется для определения начала отсчета прямого восхождения. Остается добавить, что в математической физике, в сферической системе координат, прямое восхождение обычно
обозначается
, эквивалентом второй астрономической координаты - склонения
является сферическая координата
.
Такое определение астрономической системы координат сохранялось в течение многих веков. В последнее десятилетие произошло существенное изменение. В 1991 г. Международный Астрономический Союз (МАС или IAU - английская абревиатура) принял новую астрономическую систему координат основанную на наблюдениях радиоисточников. Эту систему назвали ICRF
1.4.
Это высокоточная система координат, достаточно сказать,
что современная точность положений так называемых определяющих источников - десятки микросекунд дуги. По определению системы ICRF в
качестве экватора выбирается плоскость, которая совпадает со средним экватором на эпоху J2000.0, а также в качестве полярной оси выбирается ось совпадающая с полярной осью каталога FK5. Таким образом, начало отсчета склонения определяется также от экватора новой системы. Несколько по другому определяется точка отсчета прямого восхождения. В соответствии
с
рекомендациями
IAU
начало
отсчета
теперь
по
выбирается следущим образом. Оно выбирается как можно ближе к динамической точке весеннего равноденствия на эпоху J2000.0, хотя и другим способом. А именно, началом отсчета выбрано среднее положение 23 радиоисточников, входящих в список источников, определяющих ICRF. Причем в радиокаталогах, эти источники смещены так, чтобы прямое восхождение квазара 3C273 B совпадало с оптической координатой
этого
квазара. Звезды
обладают
меняются, движениями
собственным
движением,
изменение
положения
(угловыми
скоростями
поэтому
характеризуется звезд
по
небу).
их
положения
собственными Помимо
этого,
индивидуального для каждой звезды движения, существует единое движение всей небесной cистемы. Это движение связано с изменением ориентации Земли в космическом пространстве. Существует по крайней мере три движения - прецессия, нутация и движения полюса Земли. Если первые два движения являются детеминированными и могут быть предсказаны с высокой степенью точности, то третье движение - движение полюса - является стохастическим. Независимо от природы этих движений они эквивалентны вращениям на некоторые углы Эйлера. Рассмотрим как это можно сделать. Оси декартовой системы координат в некоторую текущую эпоху наблюдений можно определить через повороты осей той же декартовой системы координат по отношению к осям в другую эпоху соответствующую началу отсчета как (1.10)
Здесь мы написали только матрицы соответствующие нутации прецессии и
. Вектора
и
и
обозначают единичные вектора в эпохи
соответственно. По соглашению в астрономии первый вектор
называют средним вектором (в эпоху единичным вектором в эпоху
), а второй -
истинным
. Эти определения "средний" и "истинный"
используют также и для других астрономических терминов, определяя таким образом положения звезд, орты систем координат, небесный экватор, положение точки весеннего равноденствия, полюс и т.п. Матрица прецессии
в уравнении (1.10) представляет вращение за счет . Для правых экваториальных
общей прецессии за период времени систем
координат
(первая
ось
направлена
в
точку
весеннего
равноденствия, третья ось перпендикулярна небесному экватору) вращение определяется тремя последовательными поворотами: (1.11)
Здесь матрицы
являются вращениями вокруг оси
, так что (1.12)
отметим, что по сравнению с математическим определением угла Эйлера поворот здесь выбран в другую сторону. Отметим также поворот оси
:
осуществляется не вокруг оси оси
, а вокруг
(1.13)
Углы
,
,
являются функциями времени, они представляются в виде
многочленов [1]:
(1.14)
- J2000.0 выражено в юлианских столетиях временной шкалы
Здесь
TDB (аббревиатура TDB означает динамическое барицентрическое время, поодробнее об определении различных сиистем времени в астрономии можно будет прочитать в книге В.Е.Жарова). Матрица
представляет
вращение
обусловленное
нутацией.
Для
экваториальной системы координат она задается следущим уравнением: (1.15)
где
- средний наклон эклиптики,
,
- компоненты нутации по
наклону и долготе. Наклон эклиптики к экватору
является функцией
времени и вычисляется в виде многочлена. Для преобразования координат от декартовой системы к экваториальной системе
координат
можно
использовать,
например,
уравнение
для
единичного вектора указывающего направление на небесный источник: (1.16)
Мы сделали только преобразование от средней системы координат к истинной экваториальной системе координат. Необходимо также сделать преобразование от истинной экваториальной системы координат к земной системе координат, в которой, собственно, и ведутся наблюдения. Для этого придется сделать преобразование вида: (1.17)
здесь
- матрица описывающее суточное вращение Земли, в которую,
кстати, входит и движение полюса, а координат. Матрица
единичный вектор земной системы
задается в виде произведения трех матриц - две из
которых описывают движение полюса, а третья определяется часовым углом истинного весеннего равноденствия, которое отсчитывается от Гринвичского меридиана, этот часовой угол называется также истинным Гринвичским звездным временем (GAST). Параметры движения полюса отсчитываются относительно одной из осей условной земной системы координат. Преобразования типа (1.10, 1.11, 1.15) определяют преобразования координат звезд от положений указанных в каталогах, на момент времени наблюдений. Как видно из приведенных уравнений, для высокоточных наблюдений типа РСДБ - наблюдений, приведение источников на место согласно уравнениям (1.10, 1.11, 1.15) является необходимым условием для успешных наблюдений, поскольку разница от эпохи один год уже приводит к значительному уходу небесного источника от положения указанного в таблиицах. Причем в случае РСДБ наблюдений производится редукция от земной системы координат к небесной системе. Такие преобразования являются первым шагом на пути редукции небесных источников на истинное положение. Здесь они приведены для полноты. В дальнейшем
приведение
на
истинное
положение
(редукция)
будет
обобщена на случай учета релятивистских поправок, которые изменять тривиальные уравнения типа (1.10, 1.11, 1.15).
1.2
Трудности
классической
механики
при
описании распространения света Принцип относительности Галилея сыграл большую роль в создании механики как точной науки. Физика развивалась, после механики были открыты законы оптики и создана теория электромагнитного поля. Был экспериментально открыт факт, что скорость света - самого быстрого движения в нашем мире не зависит от скорости движения источника света. Этот факт явно противоречил закону сложения скоростей и принципу относительности Галилея. Более того, принцип относительности Галилея противоречил уравнениям электродинамики и электромагнитного поля. Основная трудность, которую надо было преодолет путем применения принципа относительности к электродинамике, заключалась в том, что надо было согласовать два противоречящих друг другу утверждения: 1. Согласно классической механике скорость любого тела относительно двух наблюдателей двигающихся относительно друг друга разная. 2. Скорость
света,
согласно
опыту,
не
зависит
от
движения
наблюдателя или источника света и является мировой физической постоянной. Первое утверждение носило теоретический, концептуальный характер, тогда как второе было основано на опыте. Поскольку второе утверждение основано на опыте, то его ценность выше и следует отказаться отпервого утверждения и тем самым от тех представлений о пространстве и времени, которые были приняты ранее. Одно из представлений от которых мы отказываемся - ньютоновское понятие
одновременности.
Ньютон,
постулируя
существование
абсолютного времени, или абсолютной длительности, писал: "время течет всегда одинаково, безотносительно к чему либо внешнему". В 1905 г. А.Эйнштейном был сформулирован принцип специальной относительности, который был справедлив для применения к теории электродинамики и теории электромагнитного поля и заложил новый взгляд на пространство и время.
1.3 Специальная теория относительности В специальной теории относительности появляется новое определение понятия одновременности. Одновременность событий. Два события происходят в один и тот же момент
времени
синхронизированных
часов
в
различных
точках
пространства. Возникает новое определение синхронизованных часов. и
Пусть в точках света из
в
есть часы. Определяем, что время прохождения
равно времени прохождения света из
на рис. 1.3. Пусть в момент времени он достигает точки в момент времени
в момент времени
из
в
. Поясним это
посылается световой сигнал, , отражается и достигает точки
. Часы по определению идут в точках
и
синхронно если (1.18)
Рисунок 1.3: На диаграмме и
изображен путь света от точки
до точки обратно
Принимаются также две аксиомы: 1. Если часы с часами 2. Если часы часами
идут синхронно с часами
, то часы
идут синхронно с часами
, а часы
идут синхронно
. , то часы
идут синхронно с часами
идут синхронно с .
А.Эйнштейн также сформулировал два принципа: принцип относительности и принцип постоянства скорости света. Принцип
относительности
Законы, по которым изменяются состояния физических систем, не зависят от того, к которой из двух координатных систем, движущихся друг относительно друга прямолинейно и равномерно, эти изменения относятся. Принцип
постоянства
скорости
света
Каждый луч света движется в избранной системе координат со скоростью , независимо от того, испускается ли этот луч покоящимся или движущимся телом. При этом скорость луча света определяется согласно: Скорость света=
Несмотря на абстрактность эти определения особенно важны для интерпретации
астрономических
наблюдений.
Продемонстрируем
это
утверждение на простом примере.
1.3.1
Сверхсветовые
движения
и
их
интерпретация Некоторое время назад он представлял из себя загадку для сообщества астрономов, которая бросила вызов теории относительности. Рассмотрим рис. 1.4. Пусть из источника
выбрасывается материя
(например, сгустки плазмы). Эти сгустки летят под углом
к направлению
на наблюдателя. Чему равна видимая поперечная скорость перемещения этих сгустков по небу? Рисунок 1.4: На рисунке изображено движение релятивистских выбросов из
квазара.
Эта задача возникла при анализе т.н. сверхсветовых движений в квазарах. Из многих квазаров наблюдаются выбросы большого количества вещества. При наблюдениях выбросов астрономы измеряли их угловые скорости. По их красному смещению определялось расстояние до квазаров. Умножая расстояние до квазаров на угловую скорость перемещения выбросов по небу астрономы получали поперечную скорость движения выброса. Стандартная процедура дала неожиданный результат. В нескольких случаях поперечная скорость движения выбросов оказалась больше скорости света! Астрономы были поставлены перед нелегкой задачей. Казалось, что надо сделать выбор из двух, одинаково плохих вариантов. Первый - признать, что в природе могут существовать скорости больше, чем скорость света. Просто они не встречаются ни в солнечной системе, ни тем более в лабораторных условиях. Второй вариант - признать, что красное смещение в квазарах - не результат космологического красного смещения, а следовательно квазары могут быть расположены к нам гораздо ближе. Оба варианта, как я уже сказал были плохими. Однако, решение задачи оказалось возможным в рамках как специальной теории относительности, так и в рамках космологического сценария существования квазаров. Решение, найденное П.Шейером, основывалось на правильном обращении с понятием одновременности. Рассмотрим движение одного сгустка вещества. Пусть в момент времени он выбрасывается из источника
под углом
к направлению
.
Сгусток представляет из себя плазму, излучающую радиоволны. Поэтому одновременно с выбросом сгустка, к наблюдателю по направлению идет световой сигнал (фотоны радиочастоты) о том, что сгусток выброшен. Сгусток движется со скоростью
и через некоторый интервал времени
оказывается в положении
. К этому времени световой сигнал прошел
и оказался в точке
. Сгусток продолжает излучать радиофотоны.
путь
Поэтому через время
из точки
в направлении наблюдателя вновь идет
сигнал
о
том,
перпендикуляр
что из
сгусток на
продольное расстояние
достиг
прямую
между точками
до
квазара
и
Построим
соединяющую
Поперечное расстояние между точками
Угол между прямыми
. и
и
вспомогательный и
.
Вычислим
. Оно равняется:
равняется величине:
ничтожно мал (мы считаем, что расстояние
значительно
превосходит
все
остальные
масштабы
рассматриваемой задачи). Поэтому сигналы о том, что сгусток вышел из и пришел в точку
источника
, а поперечное расстояние пройденное этим
времени сгустком
придут к наблюдателю через интервал
будет
.
составлять
Теперь
можно
разделить
поперечное расстояние на интервал времени между событие 1 (выход сгустка из источника) и событием 2 (появление сгустка в точке
) получаем
видимую скорость перемещения сгустка по небу:
Отсюдя видно, что когда скорость движения сгустка близка к скорости света, а угол
мал, видимая скорость движения сгустка по небу может
значительно превышать скорость света. Рассмотрим
подробнее
условия
при
которых
видимая
скорость
перемещения сгустка по небу будет превышать скорость света. Итак, будем считать, что (1.19)
Исходя из этого условия найдем в каких пределах должен меняться угол
.
Из условия (1.19) следует, что
Поскольку тригонометрические функции не превышают 1, то появляется первое условие для скорости сгустка
. Второе условие выглядит
как:
Значит, когда угол
находится в пределах 0
наблюдатель
видит сверхсветовое перемещение сгустка по небу. В этом примере сверхсветовое движение было объяснено без выхода за рамки специальной теории относительности. Здесь основную роль сыграло правильное обращение с понятием одновременных событий ( в данном случае одновременный приход сигналов к наблюдателю). Разделы
2. Специальная теория относительности •
2.1 Кинематика специальной теории относительности o
2.1.1 Преобразования между инерциальными системами
o
2.1.2 Интервал собственного времени
o
2.1.3 Длина движущегося стержня
•
2.2 Общие преобразования системы координат, бусты.
•
2.3 Преобразования векторов
•
2.4 Четырехмерная скорость
Астрономы наблюдают электромагнитное излучение (свет) небесных источников в различных диапазонах спектра. Хотя само излучение характеризуется целым набором параметров, для астрономии важны следущие: направление прихода света, его частота, а также иногда интенсивность. Для большинства астрономических задач волновая природа электромагнитного излучения также не играет решающей роли. Обычно большинство задач с успехом может быть решено в приближении геометрической оптики принимаемых фотонов, включая даже фотоны радиодиапазона. Лишь несколько задач требуют учета волновой природы, например, задачи интерферометрии. Однако, для вычисления многих задач интерферометрии
достаточно
знания
только
параметров
излучения,
найденных в пределе геометрической оптики. Поэтому мы будем работать с основным
параметром
характеризующими
излучение
в
пределе
геометрической оптики - волновым вектором излучения. Направление прихода лучей света и его частота в специальной теории относительности объединяются в единый вектор - 4
импульс фотона.
Поэтому одной из основных наших задач будем вывод уравнений редукции и их решения для четырехмерного вектора импульса фотона.
2.1
Кинематика
специальной
теории
относительности Прежде
чем
выводить
основные
кинематические
уравнения
СТО
сформулируем принцип постоянства скорости света на языке математики. Рассмотрим опять две системы, движущиеся равномерно и прямолинейно друг относительно друга. Будем считать, что система относительно наблюдателя, а система из точки с координатами достигает точки с координатами
неподвижна
движется со скоростью в момент в момент
. Пусть в
выходит луч света и . В системе
эти
два события выглядят следущим образом. В момент
из точки с
координатами
выходит луч света, который попадает в точку с
координатами
в момент времени
.
Из уравнений теории электромагнитного поля ( уравнений Максвелла) мы знаем, что пространственно - временная точка пространственно - временной точкой
,
,
связана с
равенством вида: (2.1)
Здесь
-скорость света. Постулат об одинаковости скорости света в обеих
системах координат можно сформулировать так, что равенство (2.1) справедливо и в системе координат
: (2.2)
Обратим внимание, что в системе
уравнение содержит
, а не
,
поскольку две эти величины равны друг другу. Теперь будем считать, что точки 1 и 2 лежат бесконечно близко друг к другу, а также будем считать, что интервал времени для распространения света из 1 в 2 является бесконечно малым. Тогда упомянутые равенства можно записать как: (2.3)
Введем теперь понятие 4
мерного интервала между двумя событиями.
Будем называть первым событием то, которое произошло в точке с координатами
в момент
, а вторым событием то, которое
произошло в точке с координатами . Определим 4
в момент
мерный интервал между первым и вторым событием
как расстояние в псевдоэвклидовом пространстве: (2.4)
Из инвариантности скорости света следует, что интервал между двумя событиями - излучением света из какой -либо пространственной точки и приемом света в другой точке равен нулю в любой инерциальной системе отсчета. Т.е. 4
мерный
в системе интервал
и
является
в системе инвариантом
при
. преобразованиях
координат, его величина не зависит от того в какой системах отсчета рассматриваются координаты между событиями. Воспользуемся этим свойством для вывода правильных преобразований координат между двумя системами, которые движутся относительно друг друга.
2.1.1
Преобразования
между
инерциальными
системами Рассмотрим две движущиеся системы координат. Из принципа постоянства скорости света, а также из инвариантности
мерного интервала можно
заключить, что в двух системах координат
и
,
связанных линейными преобразованиями вида 2.1: (2.5)
должны совпадать дифференциалы интервала между двумя событиями: (2.6)
Коэффиценты преобразования
проще всего выбрать в виде: (2.7)
Рассмотрим дифференциалы (2.5) и подставим их в выражения для 4 мерного интервала. Легко видеть, что равенство
обеспечивает инвариантность интервала:
в выражениях для гиперболических синуса
Раасмотрим теперь связь угла и косинуса со скоростью системы движение центра системы координат
находится в точке
относительно системы
в системе координат
. Рассмотрим
. Центр системы
. В системе координат
точка
движется согласно системе уравнений: (2.8)
Отсюда легко заключить, что центр системы координат системе
со скоростью:
движется в
Теперь выражая гиперболические синус и косинус через гиперболический тангенс приходим к уравнениям для преобразования координат:
(2.9)
Отметим, что преобразования (2.9) больше похожи на преобразования типа вращения (1.3), а не преобразования Галилея (1.1). Рассмотрим теперь предел малых скоростей, когда
, разложим преобразования (2.9) в
ряд Тэйлора по степеням этого малого параметра и оставим только линейные величины по
пренебрегая квадратичными и более
высокими степенями отношения взаимной скорости движения систем к скорости света: (2.10) (2.11) (2.12)
Второй член в пребразовании времени выписан специально для того, чтобы продемонстрировать, что в преобразовании времени содержатся следы от преобразований Лоренца, но они второго порядка по отношению
. Таким
образом, преобразования Лоренца сводятся к преобразованиям Галилея. Поэтому в пределе малых (по сравнению со скоростью света) скоростей зависимость
координаты
от
времени
приобретает
вид
преобразования типа сдвига, время становится внешним параметром по
отношению к преобразованиям трехмерных координат. Время становиться неизменным, внешнее влияние на этот параметр отсутствует.
2.1.2 Интервал собственного времени Рассмотрим покоящуюся систему отсчета
. Рассмотрим в ней два
события, скажем, колебание математического маятника, покоющегося относительно этой системы. Первое событие - прохождение маятника через точку
равновесия,
а
второе
-
его
повторное
прохождение
через
равновесную точку. Пространственное расстояние между двумя событиями равно нулю
,
,
. Тогда интервал между двумя этими
событиями определяет интервал собственного времени
.
Это определение принятое в специальной теории относительности остается справедливым и в общей теории относительности. Рассмотрим теперь зависимость интервалов времени и длины от состояния движения. Пусть в системе системе ,
покоятся часы. Рассмотрим два события в
. Первое событие - показание часов
в точке
. Второе событие - показание часов
пространства. Время в системе координат сек.
Интервал см/сек
между
,
сек в той же точке
между этими событиями есть этими
событиями
есть
сек=300 000 км. Найдем время, которое
прошло между этими событиями в системе
, в которой покоится
наблюдатель измеренное по часом этого наблюдателя. Преобразование времени из системы
в систему
осуществляется по формуле:
поскольку пространственное расстояние в системе
между двумя сек, то в системе
событиями равно нулю, а интервал времени равен часы покажут, что прошло время:
часы
Итак, для наблюдателя, который покоится в системе координат
показывают, что прошло больше времени, чем 1 сек. Это один из самых неожиданных
выводов
специальной
теории
относительности.
Для
неспециалистов этот вывод представлялся парадоксальным и послужил одним из поводов для попыток теоретически опровергнуть специальную теорию относительности, доказать ее внутреннюю противоречивость. Одним из наиболее распространенных способов опровергнуть СТО служил т.н. парадокс близнецов. Он формулировался следущим образом. Рассмотрим двух братьев - близнецов. Один из них улетает на ракете в длительное путешествие. Ракета двигается со скоростью близкой к
Второй остается на Земле. Первый
скорости света, так что
брат после путешествия возвращается на Землю. Его собственные часы показывают,
что
прошло,
скажем,
один
год.
Часы
второго
брата
показывают, что прошло 10 лет. Вывод: брат - близнец живщий на Земле постарел на 10 лет, в то время как его брат - путешественник постарел только на один год. "Хорошо" - говорит желающий опровергнуть СТО. "Теперь давайте рассмотрим ситуацию с точки зрения брата - путешественника. С его точки зрения Земля движется со скоростью близкой к скорости света, а следовательно,
на
Земле
часы
должны
идти
медленнее.
Брат
-
путешественник, вернувшись на Землю обнаружит, что у его брата -
близнеца
часы
показывают
только
365
дней."
"Парадокс!" восклицает "Это
опровергатель,
доказывает
внутреннюю
противоречивость
СТО!"
После чего делается вывод, что СТО не верна. Разумеется, этот вывод основан на ошибке. Ошибка заключается в том, что космонавт,
путешествующий
на
ракете,
часть
пути
находится
в
неинерциальной системе отсчета. Поэтому две системы неэквивалентны. Доказано это будет, когда мы познакомимся с вычислением собственного времени в ускоренных системах отсчета. Пока же ограничимся указанием на то, что брат - близнец оставшийся на Земле, постареет больше чем путешественник.
2.1.3 Длина движущегося стержня Рассмотрим
теперь
как
меняются
собственные
длины
стержней
в
движущейся и покоющейся системах отсчета. Для этого выпишем преобразование пространственной координаты (2.9) из движущейся в неподвижную систему:
(2.13)
Размер стержня в неподвижной системе обозначим
. В
покоящейся системе отсчета его размер определяется выражением:
(2.14)
поскольку размер стержня в движущейся системе в один и тот же момент времени
необходимо определять
. Поэтому длина стержня будет
максимальна в той системе отсчета в которой стержень покоится. В любой другой инерциальной системе отсчета, которая движется относительно покоящейся со скоростью
длина стержня будет меньше: (2.15)
Пусть стержень длиной скоростью
относительно
в собственной системе отсчета движется со фотоаппарата
далекого
наблюдателя.
За
стержнем параллельно ему расположена линейка с нанесенными метками длины, которая покоится относительно наблюдателя. Направление на фотоаппарат составляет угол
с направлением скорости стержня. Чему
равна кажущаяся длина стержня? Какая часть мерной линейки закрыта стержнем?
2.2 Общие преобразования системы координат, бусты. Рассмотрим теперь общие преобразования систем координат, которые включают в себя не только четырехмерные повороты связывающие ось времени и одну из пространственных осей, но также и трехмерные вращения. Такие общие преобразования позволяют сделать редукцию на момент наблюдений. Как и в параграфе посвященном обсуждению вращений рассмотрим линейное преобразование типа: (2.16)
где
-координаты вектора в системе
системе
. Матрица
вращение иногда буквой
,
координаты того же вектора в
определяет вращение. Будем обозначать , той же, что и матрицу. Кроме того, теперь
координаты нумеруются буквами греческого алфавита и пробегают . Всюду ниже будем придерживаться этого
значения
правила. Греческие буквы будут нумеровать четыре координаты (одну временную 0 и три пространственных 1, 2, 3), латинские (кроме специально оговоренных случаев) три пространственные координаты. В связи с этим греческие
индексы
будем
иногда
именовать
пространственно
-
временнными, а латинские - пространственными индексами. Напишем несколько дополнительных условий на вращение. Теперь преобразования такого типа должны оставлять инвариантной четырех форму вида: (2.17)
тогда такие преобразования называются преобразованиями Лоренца. Введем матрицу:
(2.18)
при преобразованиях Лоренца имеет место равество
здесь что
означает транспонированную матрицу. Отсюда легко заключить, , следовательно существует обратное преобразование
, которое также является преобразованием Лоренца. Произведение двух преобразований Лоренца также дает преобразование Лоренца, поэтому
преобразования
Лоренца
образуют
группу.
Уравнение
определяет в четырехмерном пространстве конус (его называют световым конусом). Световой конус делит все пространство время на две внутренние полы конуса, в которых области, в которых Пусть
и внешние
.
- матрица преобразования (вращение) трехмерного пространства.
Рассмотрим преобразование в четырехмерном пространстве вида:
Это преобразование принадлежит группе преобразований Лоренца. Оно оставляет без изменения координату .
Поскольку
с
каждым
в сумме (2.17) и не меняет сумму таким
преобразованием
можно
отождествить вращение, то легко видеть, что трехмерные вращения образуют подгруппу преобразований Лоренца. Напишем матрицу поворота с учетом четвертой координаты:
(2.19)
Здесь в качестве элементов матрицы четырехмерных поворотов использованы элементы матрицы трехмерных поворотов
.
Рассмотрим теперь четырехмерные линейные преобразования типа (2.16). Отметим, что такие линейные преобразования являются преобразованиями типа вращения, но не преобразованиями типа сдвига. Для начала найдем преобразование связанное с вращением временной координаты. Преобразования связанные с преобразованиями Лоренца включающими временную координату, но исключающие вращения пространственных координат математики называют преобразованиями гиперболического поворота, а физики бустами, т.е. преобразованиями меняющими скорость системы координат. Рассмотрим преобразование в плоскости не должно менять форму
. Такое преобразование
. Именно это преобразование математики
называют иногда гиперболическим поворотом. Матрицу гиперболического поворота можно записать аналогично матрицам обычного поворота, заменив тригонометрическое косинус и синус на гиперболические косинус и синус:
В четырехмерном виде эта матрица будет иметь вид
(2.20)
Подобным же образом будут выглядеть матрицы, которые описывают повороты в плоскостях
,
. Матрицу сложного поворота,
описываемую как тригонометрическими функциями, так и включающую гиперболический поворот, описываемый гиперболическими функциями можно получить пользуясь теоремами сложения тригонометрических и гиперболических функций. Тем не менее в астрономии проще использовать преобразования Лоренца найденные в другом виде, который мы сейчас обсудим. Рассмотрим вновь общие преобразования Лоренца вида (2.16), но записанные для дифференциалов координат. Пусть система относительно наблюдателя, а система произвольной скоростью
покоится
движется относительно него с
.
Преобразования описываются уравнением: (2.21)
У наблюдателя сопутствующего системе
меняется только время, которое
является собственным временем этого наблюдателя. Дифференциалы пространственных координат этого наблюдателя в системе поскольку
координаты
неизменны.
Поэтому
изменение дифференциалов наблюдателя есть
вектор
равны нулю, описывающий . В системе
дифференциалы наблюдателя есть: (2.22) (2.23)
Отношение
определяет скорость движения координатных систем
друг относительно друга. Поэтому можно записать равенство: (2.24)
Напомним, что Для
этого
. Выведем второе уравнение для связи
вычислим
дифференциалами
интервал
в системе
между
событиями
и дифференциалами
и
.
разделяемыми в системе
. Тогда можно записать уравнение вида: (2.25)
Отсюда легко найти (поскольку в системе сопутствующей наблюдателю справедливо равенство
), что: (2.26)
Теперь
подставляем
в
уравнение
(2.26)
уравнение
определяющие
различные элементы матрицы буста через скорости (2.24) и получаем уравнения для определения элементов матрицы
: (2.27)
где
.
Уравнения (2.25, 2.26) являются следствием более общего уравнения: (2.28)
Пользуясь этим уравнение можно найти элементы матрицы
с двумя
пространственными индексами. Следует, однако, сразу сказать, что элементы этой матрицы определяются неоднозначно. Они всегда могут быть умножены на матрицу трехмерного вращения. Выберем вид трехмерных элементов четырехмерной матрицы вращения как: (2.29)
Заметим, что векторные компоненты с нижними индексами отличаются знаком от векторных компонент с верхними индексами Произвольное
преобразование
Лоренца
может
быть
. выражено
как
произведение трехмерного вращения с бустом, который описывается матрицей
. Доказательство этого утверждения выходит за рамки курса,
но читатель, знакомый с теорией групп легко воспроизведет его. Представим произвольное преобразование Лоренца в виде: (2.30)
В таком виде преобразования Лоренца легко применять для получения уравнений редукции.
2.3 Преобразования векторов Из курса линейной алгебры известно, что при преобразованиях вида (2.21) вектора преобразуются как (2.31)
Кроме этого, общего, уравнения можно также привести еще несколько уравнений, которые являются очень полезными при выводе уравнений редукции, хотя они обладают меньшей общностью, чем (2.31). Одним из таких уранений является скалярное произведение векторов. Скалярное произведение двух векторов:
является инвариантом координатных преобразований. Докажем это для линейных преобразований вида (2.21). Пусть вектора системе
и
заданы в
, сделаем преобразование вида (2.21) к новой системе координат
, которая движется со скоростью оси системы
относительно системы
, кроме того,
повернуты относительно первой системы в произвольном
направлении, которое характеризуется тремя углами Эйлера. Теперь вычислим компоненты векторов
и
в новой системе
:
и
Скалярное
произведение
векторов
произведение векторов в системе
в
системе
выражается
с матрицами преобразования:
через
Прямым вычисление произведения мариц можно показать, что (2.32)
Здесь
- символ Кронекера или единичная матрица2.2:
(2.33)
Подставим (2.33) в (2.32) и полчим, что скалярное произведение векторов в двух системах координат равно друг другу. Это и означает, что скалярное произведение является инвариантом при преобразованиях Лоренца. Заметим сразу, что скалярное произведение является инвариантным при любых,
даже
нелинейных
преобразованиях.
Доказательство
этого
утверждения отложим до пятой лекции. Кроме векторов нам иногда придется производит вычисления с объектами более сложной природы - тензорами и тензорными плотностями. Тензор второго ранга эквивалентен четырехмерной квадратной матрице . Этот тензор преобразуется согласно правилу:
в случае, когда надо преобразовать тензоры второго ранга с двумя нижними индексами или с одним верхним и одним нижнем индексами необходимосуммировать их с
матрицами с двумя верхними индексами
суммирования или со смешанными индексами суммирования.
Тензоры более высокого ранга при преобразованиях содержать больше произведений матриц
. тензоры третьего ранга три матрицы, тензоры
четвертого ранга - четыре и т.п.
2.4 Четырехмерная скорость Кинематические и динамические величины в четырехмерном пространстве отличаются от соответствующих трехмерных величин. Вначале определим четырехмерную скорость. Обычная трехмерная скорость определяется как отношение пройденного пути на промежуток времени, за который этот путь пройден:
Из этой формулы видно, что для определения скорости в трехмерном пространстве
используется
внешний
по
отношению
трехмерному
пространству параметр - время. Если мы построим траекторию пробной частицы в трехмерном пространстве в виде трех функций времени, которые есть:
то скорость можно определить также как касательный вектор
к этой траектории.
По аналогии с этим определением определяют четырехмерную скорость как вектор, касательный к четырехмерной траектории частицы. В качестве параметра вдоль траектории выбирают некоторый афинный параметр. Для частиц, которые обладают массой и движутся со скоростью меньше чем скорость света в качестве афинного параметра вдоль траектории обычно выбирают интервал:
(2.34)
Отметим важное отличие четырехмерной скорости, определенной согласно (2.34) от трехмерной скорости. Абсолютная величина трехмерной скорости является произвольной величиной. Абсолютная величина четырехмерной скорости равна единице. (2.35)
В случае, когда мы рассматриваем пробную частицу, которая движется со скоростью света (например, фотон), то в качестве параметра вдоль траектории
выбирают
другой
афинный
параметр,
например,
путь,
пройденный фотоном. Четырехмерный интервал вдоль траектории частицы движущейся со скоростью света уже выбирать нельзя, поскольку он равен нулю. Приведем явный вид четырехмерной скорости через трехмерную: (2.36)
Приведем также уравнение для редукции волнового вектора фотона к наблюдателю. Для этого воспользуемся тем свойством, что векторное
произведение волнового вектора фотона
и четырехмерной скорости
наблюдателя является инвариантной величиной (2.37)
Инвариантность
относительно
означает, что
преобразования
системы
координат
не меняет своего значения при переходе от, скажем,
покоющейся системы координат, к движущейся. Рассмотрим некоторого наблюдателя
и его четырехмерную скорость
. В системе координат
сопутствующей наблюдателю вектор скорости принимает значение
Соответственно скалрное произведение двух четырехмерных векторов вырождается в произведение двух величин: нулевой компоненты волнового вектора фотона и нулевой компоненты четырехмерной скорости. Поскольку второй сомножитель равен единице, то остается только одна величина компонента волнового вектора фотона. Эта компонента отождествляется с наблюдаемой частотой фотона (или с энергией фотона в системе координат, сопутствующей наблюдателю) значение
. Таким образом определяется
, которая стоит в правой части уравнения (2.37).
Значение константы в правой стороне равенства (2.37), разумеется, будет другим для другого объекта. Рассмотрим в качестве другого тела источник фотонов. Вычислим правую часть (2.37) в системе координат, которая сопутствует источнику. Теперь константа в правой стороне равенства будет определять частоту излучения
. Естественно, что величина константы
будет уже другая. Cоставим теперь отношение двух величин. Числитель этого отношения произведение четырехмерной скорости источника фотонов на волновой
вектор
фотона.
четырехмерной
Знаменателем скорости
является
наблюдателя
в
скалярное системе
произведение координат
ему
сопутствующей.
(2.38)
Здесь
индекс
означает
"излучатель". Величина
"наблюдатель",
а
индекс
означает
обычно называется красным смещением, она
пришла в релятивистскую теорию из космологии, в космологии это один из основных параметров, который характеризует источник. Поскольку справа стоит отношение двух констант, которые мы уже вычислили, то напишем это отношение явно: (2.39)
Теперь для того, чтобы вычислить частоту фотона, которую будет измерять наблюдатель,
поступим
следущим
образом.
В
системе
координат,
сопутсвующей наблюдателю, волновой вектор фотона имеет компоненты
здесь
-вектор
в
направлении
излучения
фотона.
Все
величины
вычислены в системе координат сопутствующей наблюдателю. Излучатель имеет четырехмерную скорость
где
-трехмерная скорость источника фотонов относительно наблюдателя.
Скалярное произведение в системе координат наблюдателя есть
(2.40)
Теперь получаем, что отношение частоты излучателя к частоте того же фотона в системе наблюдателя есть: (2.41)
Это есть закон Допплера в специальной теории относительности. Рассмотрим уравнение (2.41) более подробно. Будем считать, что источник фотонов и наблюдатель находятся на оси и источник движется вдоль этой оси. Пусть излучатель движется по направлению к наблюдателю. Тогда
и наблюдаемая частоты
больше частоты излучателя:
Частота фотонов смещается в голубую сторону спектра, мы имеем дело с голубым смещением. В
том
случае,
когда
направление
противоположно движению источника
распространения
фотонов
возникает эффект красного
смещения частоты:
Рассмотрим еще один любопытный пример. А именно, под каким углом к направлению распространения фотонов должен двигаться источник, чтобы смещение частоты отсутствовало? Итак, на языке математики эту задачу
можно
сформулировать
следущим
при условии Из
условия
равенства
направлением
движения
образом:
Найти
, для которого частот
получаем,
источника
такое
значение
. что
фотонов
косинус и
угла
между
направлением
на
наблюдателя есть:
Из приведенного уравнения видно, что эффект смещения частоты может отсутствовать лишь для источника удаляющегося от наблюдателя. Уравнение
(2.41)
описывает
изменение
частоты
при
переходе
от
движущегося источника к неподвижному наблюдателю. В реальности обычно источник фотонов и наблюдателя разделяет некоторое расстояние. Изменение частоты фотона при рапространении формула (2.41) не описывает.
Если
наблюдателем
в
пространстве
присутствует,
между
например,
источником
фотонов
и
гравитационное
поле,
то
появляется дополнительное изменение частоты, которое должно быть учтено.
3. Ускоренные системы отсчета и СТО •
3.1 Включение гравитации в СТО.
Успех специальной теории относительности, правильное формулирование принципа относительности для инерциальных систем отсчета движущихся со скоростями близкими к скорости света побудил А.Эйнштейна на распространение этого принципа на ускоренные системы отсчета. Теперь вкратце расскажем как А.Эйнштейн смог описать ускоренные системы отсчета в терминах принципа относительности, как стало понятно, что это описание приводит к геометрической трактовке гравитационного
поля, необходимости введения неэвклидовой геометрии в физику и идеи искривленного пространства - времени. Основная идея стала понятной А.Эйнштейну в 1907 г., хотя в оригинальном виде она была опубликована только в 1972 г. в газете "New York Times". Это идея позже получила название релятивистского принципа эквивалентности Эйнштейна. Сам А.Эйнштейн описал то время и мысли в отрывке, который помещен ниже. Перевод этого на русский язык слишком красив, чтобы его опустить: " Я пытался модифицировать теорию гравитации Ньютона таким образом, чтобы она точно соответствовала специальной теории относительности. Попытки сделать это показали, что теория гравитации может быть согласована с принципами специальной теории относительности, но они не удовлетворяли
меня,
поскольку
требовали
введения
гипотез
не
содержащих физических основ. В это время ко мне пришла счастливейшая идея Точно
моей также,
жизни как
электрическое
в
3.1
поле
следущем
создается
виде:
электромагнитной
индукцией, гравитационое поле может существовать только относительно. Следовательно, для наблюдателя, находящегося в свободном падении с крыши дома, гравитационного поля не существует ( по крайней мере в бесконечно близкой его окрестности ) в течении всего времени падения. Если наблюдатель выпустит из рук какие - либо предметы они остануться относительно этого наблюдателя в состоянии покоя независимо от их химического состава или физического состояния
3.2.
Наблюдатель в этом
случае должен признать, что он находится в состоянии покоя. Чрезвычайно интересный эмпирический закон гласящий, что все тела в одном и том же гравитационном поле падают с одним и тем же ускорением, получал в этом случае глубокий физический смысл. Если бы нашелся хотя бы один предмет, который падал бы в гравитационном поле не так как другие, то наблюдатель сравнивая свое движение с движением этого предмета смог бы сказать, что он находится в гравитационном поле и что он падает под его воздействием. Но если такого предмета не существует, а
эксперимент подтверждает этот факт с большой степенью точности, наблюдатель теряет всякое объективное основание рассматриваться свое состояние как состояние падения в гравитационном поле. Скорее он имеет право рассматривать свое состояние как состояние покоя и считать, что в его ближайшем окружении гравитационное поле отсутствует. Таким образом, известный экспериментальный факт, что ускорение в гравитационном поле не зависит от химического состава или физического состояния становится могучим аргументом для распространения принципа относительности
на
координатные
системы,
которые
движутся
неравномерно одна относительно другой."
3.1 Включение гравитации в СТО. Рисунок 3.1: На рисунке изображен лифт, в котором ускорение моделирует поле
тяжести.
Рассмотрим на рис. 3.1 пояснения к принципу эквивалентности Эйнштейна, который распространяет принцип относительности на ускоренные системы координат.
На левом рисунке изображен лифт, ускоряемый вверх с величиной ускорения равной
. Свет, изображенный на рисунке пунктриной линией
движется в таком лифте по искривленной траектории. Эта искривленная траектория является идеально прямой линией, но в покоящейся системе отсчета. В ускоренной системе отсчета линия становится искривленной. На правом рисунке изображен тот же самый лифт, который находится в поле тяжести с однородным ускорением. Принцип относительности примененный к ускоренным системам отсчета гласит, что невозможно отличить две этих ситуации. Значит, в лифте, который находится в гравитационном поле свет тоже должен двигатся по искривленной траектории. Вычислим характеристики света при движении в однородном поле тяжести пользуясь характеристиками света в ускоренном лифте. Для этого рассмотрим фотоны, которые распространяются вдоль поля тяжести
. Это
гравитационное поле исходя из принципа эквивалентности можно заменить полем ускорения с равной величиной, но противоположным знаком. Рассмотрим лазер измеряется
, который излучает фотоны с частотой
наблюдателем,
находящимся
сопутствующего лазеру). На расстоянии
рядом
с
(эта частота лазером,
т.е.
от лазера (по направленнию
движения) находится другой наблюдатель
, который тоже измеряет
параметры света. Свет, который вышел из лазера в момент времени достигнет наблюдателя
в момент времени
будет иметь скорость относительно лазера равную
, а сам наблюдатель
.
Рассмотрим теперь две дополнительные инерциальные системы координат, которые двигаются равномерно и прямолинейно, так что ускорение в этих системах равно нулю. В первой системе координат находится наблюдатель
в начале системы
. Скорость и положение этой системы выбраны
так, чтобы в момент врмени малой
окрестности
наблюдатель ускоренной
точки
системы
инерциальная система движется со скоростью чтобы в момент времени наблюдатель
находился в бесконечно координат.
Вторая
относительно первой так,
ее начало, в котором нахордится
совпало с положением наблюдателя
, находящегося в
ускоренной системе координат. Привлечение дополнительных инерциальных систем координат сделано не для того, чтобы запутать студента, а для того, чтобы провести расчеты характеристик света пользуясь уже знакомыми формулами специальной теории относительности. Частота фотона измеренная наблюдателем есть
в момент времени
, согласно нашему определению. В момент времени
же фотона, измеренная наблюдателем
относительно
частота того
, движущемся со скоростью
есть
Лазер представляет из себя стандартный электромагнитный осциллятор с собственнолй частотой наблюдатель
Произведение
и с периодом
. Соответственно,
будет измерять период осциллятора:
ускорения
на
расстояние
представляет
разность
гравитационных потенциалов между двумя точками. В первой точке находится лазер, во второй нахаодится наблюдатель:
. Теперь
можно привести формулу определяющую темп течения времени в двух и
точках
: (3.1)
Подставим эту формулу в уравнение для четырехмерного интервала. Поскольку (3.1) представляет связь собственного времени точки координатным временем точки
, т.е.
с
(которое мы относим к собственному времени
, в которой потенциал нулевой), то можно записать четырехмерный
интервал как функцию собственного времени и как функцию координатного времени: (3.2)
Основное изменение по сравнению с прежней величиной, которая характеризовала "расстояние" между событиями в СТО - появление коэффицента
перед
квадратом
дифференциала
времени.
Этот
коэффицент, вообще говоря, является функцией всех четырех координат. Такие функции появляются в том случае, когда метрика является неэвклидовой, а геометрия описывает искривленное пространство - время. Поэтому новая физика - описание сильных гравитационных полей характеризуется неэвклидовой геометрией. Для работы в общей теории относительности необходимо владеть аппаратом неэвклидовой геометрии, которая будет излагаться позже в этом курсе. Вернемся к формуле (3.2). В том случае, когда наблюдатель движется в поле
со
скоростью
координатным временем
,
то
его
собственное
время
связано
с
как: (3.3)
Для того, чтобы оценить скорость течения времени в гравитационном потенциале различной величины проведем расчет на сколько "уходят" друг относительно друга часы, находящиеся на полуденной и полуночной стороне Земли в гравитационном поле Солнца. Будем считать, что член пропорциональный квадрату скорости наблюдателей различается для двух наблюдателей на пренебрежимо малую величину. Оценивать разность скорости течения времени будем только по формуле (3.3). (3.4)
Это значит, что, скажем, за 12 часов двое часов "разойдутся" на время равное
220 наносекунд. Это вполне обнаружимое, а для некоторых
процессов даже большое время. Б льшее время покажут часы, которые расположены дальше от Солнца - часы на полуночной стороне Земли. На рис. 3.1 показан график скорости хода часов в зависимости от расстояния от барицентра Солнца. Вот только для обнаружения этой разницы в скорости течения времени необходимо находиться далеко от Земли, например, на Солнце. Тем не менее измерить подобный эффект можно также и на Земле и в ближнем космосе. Рассмотрим два интересных эффекта - изменение скорости хода часов в зависимости от сезона и изменение скорости хода часов установленных на спутнике системы GPS по сравнению с часами установленными на Земле. Ось вращения Земли наклонена по отношению к плоскости земной орбиты на угол
. Поэтому часы, скажем 1 и 2 с собственным временем
, которые находятся на разных широтах, соответственно
и
и ,
находятся также при разных значениях гравитационного потенциала Солнца. Естественно, что при движении Земли по орбите возникает годовая гармоника в изменении скорости хода часов:
Здесь в качестве начала отсчета выбран день летнего солнцестояния. На коротких промежутках времени, значительно меньших длительности года такое изменение скорости течения времени воспринимается как линейный дрейф часов, зависящий от широты! Величина этого дрейфа
15
наносекунд в день. Такой эффект действительно наблюдается и природа его никак необъяснима, если "забыть" про эффекты общей теории относительности. Общая теория относительности изменила наши взгляды на структуру пространства и времени. В течении долгого времени ОТО оставалась теоретическим инструментом современной физики, который не имеет приложений в технологии. Ситуация существенно измениласьс появлением высокоточной навигации, с появлением спутниковых систем GPS и ГЛОНАСС. Теперь для целей точной навигации (на поверхности Земли) необходимо использовать уравнения общей теории относительности для редукции наблюдений. Особенно важно использовать их для пересчета стандартов времени на Земле и на спутниках. Высота полета спутников превышает земной радиус, а скорость значительно превышает скорость полета современных самолетов. Поэтому изменение скорости течения времени особенно заметны. Собственноре время на борту спутника обозначим
, а на поверхности Земли обозначим
. Отношение двух
интервалов составляет:
Здесь индексы
и
соответственно относятся к потенциалу Земли на
высоте полета спутника и скорости его полета, а также соответствующие величины для стандарта на Земле.
Итак, скорость течения времени на Земле и на спутнике различна. Для спутников системы GPS, которые находятся на высоте 14 000 км отличие двух темпов течения времени составляет 44 микросекунды в день. Естественно, для поддержания равномерной шкалы времени, единой для поверхности Земли и спутников необходимо учитывать это изменение.
4. Эксперименты по ОТО •
4.1 Эксперименты по проверке скорости хода времени o
4.1.1 Парадокс близнецов
Насколько все теоретические оценки, которые обсуждались в предыдущих главах соответствуют действительности? Подтверждены ли эти формулы экспериментом? Как мы уже писали, специальная теория относительности используется при расчетах больших машин для физического эксперимента. Использование общей теории относительности задержалось. Ее начали применять в технологии только последние двадцать лет. Использование ее началось с определения скорости течения времени в гравитационном поле с различным потенциалом. Расскажем об экспериментах, которые положили начало применению общей теории относительности в прикладных целях.
4.1 Эксперименты по проверке скорости хода времени Первый эксперимент был сделан в 1971 г.[3]. Четверо часов сделанных на основе цезиевых стандартов частоты были помещены на два самолета и совершили кругосветное путешествие. Одни часы путешествовали в восточном направлении, другие обогнули Землю в западном направлении. Разница в скорости хода времени возникала из-за добавочной скорости вращения
Земли.
Это
был
эффект,
скорее
специальной
теории
относительности, чем общей, однако, член зависящий от величины земного потенциала в изменении скорости хода часов также присутствовал и внес значимый вклад. Надо сказать, что в первом эксперименте было очень много неопределенностей связанных с неточностью измерения скорости самолетов, высотой самолетов над поверхностью Земли и их положением. Отсутствовал также внешний контроль хода часов и т.п. Тем не менее, удалось подтвердить общую теорию относительности, удалось измерить различие в скорости хода часов на борту двух самолетов. Теоретические вычисления задержки часов были: Эффект
Восток
Потенциальный 144
Запад 14 ns 179
18 ns
член Допплеровский -184
18 ns 96
10 ns
член Полная
-40
23 ns
275
21 ns
задержка Эксперимент дал следущий результат: Восток Запад Полная
-59 ns
273 ns
задержка Продемонстрируем на простых выкладках, как меняется собственное время часов, которые находятся на борту двух самолетов, один из которых летит на запад, другой на восток. Скорость самолета относительно земной поверхности
обозначим
.
Самолет
двигается
с
поверхности
вращающейся Земли, его скорость относительно покоющейся системы
координат складывается со скоростью вращения Земли
.
Выбирая соответсвующие знаки можно это равенство записать также . Здесь
- геоцентрическая широта, которая может быть
отождествлена с обычной географической широтой, поскольку сжатие Земли мало
и при наших вычислениях им можно пренебречь.
В системе координат, которая связана со центром Земли, который находится в состоянии свободного падения в поле тяжести Солнца и планет, время отсчитывается собственными часами
. В этой же системе
координат скорость самолета есть:
Разность
собственного
времени
двух
часов
и
определяется
равенством:
Подставляя формулу для скорости самолета относительно центра системы координат получаем, что на борту самолета который летит на восток, скорость течения времени отличается от скорости течения времени на борту самолета, который летит на запад. Эта разность составляет
Здесь
- компонента скорости самолета, направленная на восток. При
этом считается, что скорости самолета, который летит на запада и самолета, летящего на восток равны друг другу. Отсюда видно, что предсказания общей теории относительности были подтверждены с высокой (для того времени) точностью.
Измерения временной задержки зависящей от потенциала были сделаны четыре года спустя [4]. Исследователи синхронизовали двое часов, затем поместили одни часы на вершину горы, а вторые оставили на физическом факультете, расположенном у подножья горы. Разница в высоте составляла 3250 м. Время за которое измерялась задержка часов составляло 66 дней. Из - за различия в потенциале гравитационного поля Земли скорости хода часов были различны. Измерения опять подтвердили общую теорию относительности и измерили задержку с точностью
.
Два года спустя подобный эксперимент был повторен в Японии [5]. Исследователи поместили одни часы на гору, а другие под гору. Разница высот составляла 2818 м, а время измерения эффекта было две недели. Поскольку
часы,
значительно
используемые
точнее,
точность
японскими измерений
исследователями составляла
5%.
были Вновь
предсказания общей теории относительности были подтверждены. Одни из наиболее точных измерений были сделаны во время высотного полета ракеты [6]. На борту ракеты находился водородный мазер, который использовался в качестве высокостабильных часов. Ракета поднялась на 10 000
м,
а
затем
упала
в
Атлантический
океан.
Для
измерений
потенциального члена в задержке часов пришлось компенсировать вклад допплеровского члена (ракета двигалась быстро), а также ионосферные эффекты. Тем не менее измерения были благополучно проведены и правильность формулы для времени задержки была подтверждена с точностью 0.01%. Измерения времени задержки проводились также позже на самолетах. В полете осуществлялся постоянный контроль хода часов и стабильности параметров. В частности, был проведен эксперимент по проверке "парадокса близнецов". Были синхронизованы часы, после чего одни часы поместили на борт самолет, а вторые оставили на Земле. Часы, которые находились на борту самолета, по прилету показали, что на борту прошло больше времени, чем на Земле!
В чем дело? Может быть общая теория относительности неверна? Нет, измерения вновь полностью подтвердили справедливость общей теории относительности, просто надо делать правильные выводы из теоретических положений. Классическая формулировка парадокса близнецов относиться к системам координат, которые свободны от неоднородного гравитационного поля. На Земле, разумеется, неоднородное гравитационное поле присутствует. Поэтому надо не только сравнивать задержку времени возникающую на борту самолет из - за движения самолет, но также и задержку времени возникающую из - за потенциального члена. Если самолет движется относительно лаборатории (пробных часов), то часы на его борту будут
отставать от часов в лаборатории (это эффект пропорциональный
),
но самолет летит выше лаборатории, он летит в поле тяжести с ослабленным потенциалом, а значит, часы, находящиеся в лаборатории будут идти медленнее по сравнению с часами, находящимися на борту
(Здесь
-разница высот между самолетом и лабораторией).
Сравнить вклад потенциального члена и члена из - за скорости легко. Необходимо сравить величину характерной скорости в данном потенциале (вторая космическая скорость) с реальной скоростью аппарата. Для самолет потенциальный член всегда больше. Скорость самолет значительно меньше скорости ракеты, поэтому часы, поднятые на самолете над лабораторией (если они, конечно, подняты на достаточно большую высоту) будут отставать по сравнению с часами, находящимися в лаборатории. Теперь формулы для изменения темпа течения времени в зависимости от скорости и высоты используются в навигационной технологии GPS и ГЛОНАСС.
4.1.1 Парадокс близнецов Рассмотрим
теперь
"парадокс
близнецов"
в
его
классической
формулировке. Итак, рассматриваются двое часов, одни для простоты будем обозначать
, вторые
. Часы
инерциальной системы координат
все время покоются относительно . Часы
Часы синхронизируются, затем часы
начинают ускоряться вдоль
системы координат
положительных значений оси
время ускорение пропадает и часы вдоль оси
вначале тоже покоются. . Через некоторое
по инерции движутся со скоростью
некоторое время. Затем часы вновь ускоряются, но теперь в
противоположном направлении, что приводит к их замедлению и полной остановке, а затем к началу движения в противоположном направлении. Часы
ускоряются пока не достигнут скорости
движутся в направлении к часам времени
часы
противоположном
вновь
. В заранее расчитанный момент
начинают
движению
так,
ускоряться
в
направлении
скорость
их
уменьшалась.
чтобы
Ускорение вновь подбирается так, чтобы часы часами
. Затем часы
оказались в одной точке с
c нулевой скоростью. После этого показания часов сравниваются.
Ускорения в этом мысленном эксперименте можно сделать достаточно большими, так что влияние участков движения с ненулевым ускорением на процесс вычисления задержки часов можно считать пренебрежимо малым. Тогда часы
должны отстать от часов
на некоторый интервал времени.
Итак, для наблюдателя, сопутствующего часам
движущиеся часы
должны отстать. Рассмотрим этот же процесс с точки зрения наблюдателя сопутствующего часам
. Он имеет противоположные характеристики, так что с его точки
зрения "отстать" должны часы
. Ниже мы проанализируем правильный
ход рассуждений и покажем, что на самом деле для обеих наблюдателей часы
должны
отстать
по
сравнению
с
часами
.
Причиной
неправильных рассуждений является наличие поля ускорения в системе
координат сопутствующей часам
. Поэтому изменения интервалов
времени в системе сопутствующей
надо считать уже по формулам общей
теории относительности, а не только по формулам специальной теории относительности. Одно из лучших изложений "парадакса близнецов" привел А.Эйнштейн в своей популярной статье "Диалог по поводу возражений против теории относительности" приведенной в книге [7]. Будем следовать этому изложению, подкрепляя его расчетами. Весь процесс путешествия и возвращения часов можно разделить на пять стадий. С точки зрения
С точки зрения
1. Часы
1. В отрицательном направлении
ускоряются внешними
силами
в
направлении
оси
возникает гравитационное в
положительных значений оси
,
поле,
пока не приобретут скорость
.
ускоренно. Часы
Часы
котором
падает
удерживаются
внешними силами в покое. Когда
покоются.
приобретают
скорость
гравитационное поле исчезает. 2. Часы
движутся с постоянной
2. Часы
движутся с постоянной
скоростью до точки 2. Часы
скоростью до точки
покоятся.
покоятся.
3. Часы силами скорость
ускоряются внешними пока .
не
приобретут
. Часы
3. Появляется однородное поле тяжести направленое в сторону положительных значений оси под
действием
ускоряются
в
,
которого положительном
направлении до тех пор пока не приобретут скорость
. После
этого
Внешние
поле
исчезает.
силы удерживают часы
.
4.
Часы
движутся
постоянной скоростью приблизятся
к
.
назад
с
, пока не
4. Часы в
движутся со скоростью
направлении
значений оси
Часы
покоятся.
положительных , до тех пор, пока
не приблизятся к
. Часы
остаются в покое. 5.
Часы
останавливаются
5. Возникает поле тяжести, которое останавливает часы
внешними силами.
. Часы
удерживаются внешними силами. Как видим, две системы координат неэквивалентны друг другу. С точки зрения
наблюдателя
сопутсвующего
часам
гравитационное
поле
отсутствует, с точки зрения наблюдателя сопутствующего часам гравитационное поле не равно нулю. Для вычисления скорости хода часов с точки зрения наблюдателя
достаточно формул, выведенных в рамках
СТО, с точки зрения наблюдателя
при вычислении скорости хода
времени необходимо учитывать эффекты ОТО. Вновь аккуратно учитывая разницу между системами координат вычислим скорость хода часов в системе
и в системе
и сравним какие из часов
отстануть от других. Расчет будем вести применяя приближенные формулы СТО и ОТО для того, чтобы расчеты были легче и не затемнялся смысл формул, мы будем считать, что скорость
значительно меньше чем скорость света.
Вначале рассчитаем задержку времени по формулам СТО с точки зрения наблюдателя сопутствующего часам
. Будем считать, что время
ускорения пренебрежимо мало. Тогда разность скорости хода часов во время первой стадии, а также во время третьей и пятой стадии ппренебрежимо мало. Тогда интервал времени показанный часами в течении всего путешествия часами
как:
зависит от интервала времени показанному
Здесь
- полное время путешествия туда - обратно.
Итак с точки зрения наблюдателя сопутствующего часам
часы
отстают. Проведем расчет скорости хода обеих часов с точки зрения наблюдателя . Во время первой стадии разность хода
сопутствующего часам
пренебрежимо мала. Оба чдена дают пренебрежимо малый вклад. Потенциальный - потому что часы
и
находятся практически только в
одной точке, а вклад от потенциального члена пропорционален разности расстояний, член зависящий от скорости тоже мал. Во время второй стадии движения по инерции, которая длится время,
скажем,
часы
отстают от часов
как
.
Будем считать, что третья стадия длится интервал времени
. Во время
третьей стадии вклад члена пропорционального скорости часов в разность хода часов пренебрежимо мал. Однако велик вклад потенциального члена. Действительно за время расстояние на
составляет
потенциал
составляет величину направлено от
прошли относительно часов
. Ускорение, требуемое для изменения скорости с
в течении времени
Гравитационный
часы
к
между
. точками
двух
часов
. Знак плюс выбран потому, что ускорение . После окончания третьей стадии из - за
потенциального члена интервал времени интервал времени
нахождения
показанный часами
показанный часами связаны равенством
и
Обратим внимание, что второе слагаемое в этой формуле имеет положительный знак. Это означает, что часы часы
теперь идут быстрее, чем
.
В течении четвертой стадии часы
вновь отстают от часов
путь длится тот же интервал времени
. За этот интервал часы
вновь отстают. Интервал времени, который показывают часы
В течении пятой стадии часы
. Обратный
составляет:
вновь замедляются гравитационным полем.
Однако теперь разность хода часов
и
опять пренебрежимо мала, по
тем же причинам, что и на первой стадии. Посчитаем полный интервал времени, который показывают часы зрения наблюдателя, сопутствующего часам который показывают часы
с точки
. Промежуток времени,
складывается из промежутков времени
показываемых этими часами с первой по пятую стадии:
Поэтому полный интервал времени показанный часами наблюдателя сопутствующего часам
с точки зрения
есть:
Подставим значение полного врмени путеществия туда - обратно . Кроме того, подставим значения равенство только через
и
. Окончательно получаем, что
, выражая полное
оказывается
Теперь видно, что интервал времени показываемый часами больше, чем интервал времени показываемый часами
. Это значит, что
путешествующие часы покажут меньший промежуток времени, чем часы покоящиеся относительно инерциальной системы координат. Этот расчет демонстрирует отсутствие "парадокса близнецов" в релятивистской физике.
5. Неэвклидова геометрия •
5.1 Метрика искривленного пространства - времени o
•
5.2 Геодезические линии в неэвклидовой геометрии o
В
5.1.1 Примеры метрики искривленного пространства 5.2.1 Геодезические линии на поверхности сферы
классической
физике
пространство
было
эвклидовым,
а
время
абсолютным и единым для всего пространства. В релятивистской физике, как мы уже убедились из материала предыдущей главы пространство является неэвклидовым. В общем случае геометрия представляет из себя четырехмерное дифференцируемое многообразие, В
произвольной
геометрии
преобразования координат:
например,
рассматриваются
произвольные
как видно из приведенных преобразований, они описывают просто переход от сферических к декартовым координатам. Дифференциал в нетильдованной системе связан с дифференциалом в системе координат с тильдой уравнениями вида:
В геометрии вводится понятие геометрического объекта. Не перечисляя всех объектов геометрии назовем только скаляры, векторы и тензоры. Строго говоря, все перечисленные величины являются тензорами, так скаляр является тензором нулевого ранга, а вектор тензором первого ранга. Однако исторически принято выделять скаляры и векторы. Скалярная величина (или скаляр) при преобразованиях системы координат не преобразуется,
Вектором называется величина, которая содержит четыре компоненты, преобразуемые согласно правилу: (5.1)
для контравариантных компонент и (5.2)
для ковариантных компонент. Как можно заметить, из закона преобразования (5.1) преобразование контравариантных
компонент
какого
-
либо
вектора
подобно
преобразованию дифференциалов координат, представляющих разность положений двух точек. Следовательно контравариантные компоненты
вектора можно представить как систему из двух точек, с указанием какая из точек
является
первой,
а
какая
является
второй.
Примером
контравариантных компонент является четырехмерная скорость какого либо тела. Примером ковариантных компонет вектора является градиент некоторого поля:
Образом градиента от поля являются наборы двумерных поверхностей определяющих постоянство поля
. Следовательно геометрическим
образом
тензора
ковариантных
компонент
являются
двумерные
поверхности "раскрашенные" в различные "цвета" для того, чтобы определить какая из поверхностей является первой, а какая - второй. Выпишем также правило по которому преобразуются компоненты тензора второго ранга:
Геометрическая величина
, которая имеет
нижних индексов и преобразуется по закону:
верхних ипндексов и
называется
тензором
ранга
с
контравариантными
ковариантными индексами. В алгебре тензоров определяется суммирование тензоров одинакового ранга и с одинаково расположенными индексами:
умножение определено для тензоров любого ранга с произвольно расположенными индексами:
В тензорной алгебре определяют также свертку двух тензоров по правилу:
для произвольного расположения индексов важно только, чтобы индекс по которому проводится свертка в первом тензоре был верхним, во втором нижним (или наоборот, в первом - нижним, а во втором -верхним). Положение и количество остальных индексов переносится в свертку по их месту. Свертки могут быть образованы различными способами, однако каждое суммирование должно выполняться по верхнему и нижнему индексу. Например, сумма
не
является
тензором,
как
легко
убедиться
рассмотрев
закон
преобразования этой величины. В современной тензорной алгебре, анализе и физике пользуются правилом суммирования обозначение:
Эйнштейна,
который
для
удобства
ввел
следущее
называют мертвым индексом и по повторяющимся
при этом индекс
обозначает:
индексам производится суммирование. Так запись
Повсюду в этой книге мы будем использовать это правило, два повторяющихся индекса один верхний, другой - нижний будет означать, что по ним производится суммирование. Определим также обратные тензоры согласно уравнению:
Здесь
- символ Кронекера, который определяется следущими условиями если
и
если
. Можнл также выписать матрицу
символа Кронекера
(5.3)
Свертка двух тензоров понижает ранг произведения. Так, важный пример показывает,
что
произведение
ковариантных
компонент
вектора
на
контравариантные компоненты является инвариантом: (5.4)
Различные авторы [8], [9], [12] вводят также операцию симметрирования, албтернирования, выключения индексов и т.п. Для нас важной остается только
последняя
операция
над
тензорами
-
образование
следа,
образование поперечной части тензора и образование поперечно бесследовой части тензора, которые будут применяться во второй части книги. Однако для их определения нам придется использовать метрику, поэтому отложим введения этих понятий после обсуждения метрики.
5.1
Метрика
искривленного
пространства
-
времени Геометрия
четырехмерного
определяется
десятью
пространства
функциями,
которые
-
времени
являются
полностью
компонентами
симметричного тензора второго ранга. Метрика четырехмерного интервала есть:
(5.5)
Здесь
- ковариантные компоненты метрического тензора или, как
обычно говорят, метрический тензор второго ранга. Компоненты метрического тензора являются, вообще говоря, функциями всех четырех координат. Преобразованием
координат
всегда
можно
добиться
того,
чтобы
компоненты метрического тензора были приведены к виду метрики Минковского:
(5.6)
В пространстве с заданной метрикой можно определить связь между ковариантными и контравариантными компонентами тензоров, так для вектора связь между этими компонентами задается уравнениями:
Теперь можно определить норму вектора, аналогично тому, как это делается в эвклидовой геометрии. Норомой вектора по определению полагают величину [8], [9], [12]: (5.7)
В зависимости от того, чему равна норма ветора его называют:
•
времениподобным, если
•
пространственноподобным, если
•
изотропным, если
Норма называется также длиной вектора. Как видно из определения изотропного вектора он обладает нулевой длиной. Рассмотрим свертку двух векторов. Два вектора, которые удовлетворяют условию:
называются
ортогональными.
изотропный
вектор
Отсюда
ортогонален
можно
самому
себе
сделать и
вывод,
любому
что
другому
изотропному вектору. Следует заметить, что таким свойством обладают только изотропные вектора.
Кроме этого важного свойства приведем также уравнение описывающее угол
между двумя векторами
и
в неэвклидовой геометрии: (5.8)
Здесь
следует
заметить,
что
оба
вектора
и
являются
либо
пространственноподобными, либо изотропными.
5.1.1
Примеры
метрики
искривленного
пространства Приведем примеры метрики искривленного пространства. На самом деле в быту мы сталкиваемся с примера геометрии искривленного пространства значительно чаще, чем привыкли думать. Поверхность мяча, поверхность спинки кресла, поверхность кувшина или графина - вот неполный список двумерных искривленных пространств. Примеры идеальных плоскостей, таких как крышка стола или ровный листок бумаги в этом ряду выглядят, скорее исключениями, чем правилом. Приведем в качестве примера метрику на поверхности сферы. Для этого выпишем вначале метрику эвклидова пространства в сферической системе координат:
Будем считать, что мы вычисляем расстояние только между теми точками, которые лежат на поверхности сферы радиуса что
. Тогда можно полагать,
, а значит метрика получает вид: (5.9)
теперь метрика описывает поверхность сферы, а геометрия, которую описывает данный метрический тензор является неэвклидовой.
5.2
Геодезические
линии
в
неэвклидовой
геометрии В эвклидовой геометрии очень важным понятием является прямая между двумя точками, которая к тому же является кратчайшим расстоянием между этими точками. В неэвклидовой геометрии понятие прямой заменяется понятием геодезической линии, которая является экстремальным путем между двумя точками. Для нахождения уравнения геодезической линиии применим вариационное исчисление. Длина линии в геометрии общей теории относительности есть интеграл по интервалу
между
двумя
событиями
разделенными
по
времени
и
пространству:
Линии экстремального пути удовлетворяет условию:
Здесь символ
означает первую вариацию. Из этого условия получается
уравнение геодезической линии. Для
вычисления вариации величины
Проварьируем не дифференциал интервала
применим следущий прием. , а квадрат дифференциала
. Вариации самого дифференциала по вариациям квадрата можно получить согласно уравнению квадрата
есть:
. С другой стороны, вариации
правую часть этого равенства можно представить в виде суммы:
Воспользуемся равенствами
и
и получим
уравнение для вариации дифференциала интервала:
Третий член в круглых скобках уже приведен к виду пригодному для вычисления первой вариации. Для приведения к такому же виду первых двух членов воспользуемся равенством:
Воспользуемся теперь этими равенствами и вычислим первую вариацию полного пути:
В
этом
уравнении
первый
член
после
второго
знака
равенства
представляет из себя вариации в конечных точках пути, по определению эти вариации равны нулю [13], [14]. Член под знаком интеграла в фигурных скобках должен обращаться в нуль на геодезической линии. Это и дает нам уравнение геодезической линии: (5.10)
Здесь
- вектор касательный к геодезической линии.
Уравнение, которое мы получили является уравнением второго порядка. В случае эвклидовой геометрии, когда все компоненты метрического тензора являются диагональными и равны единице, правая часть равенства (5.10) равна нулю. Тогда решение этого уравнения есть
. Это
решение описывает прямые линии, которые являются линиями кратчайшего пути в эвклидовой геометрии. Приведем это уравнение к стандартной форме, принятой в неэвклидовой геометрии. Для этого воспользуемся тождеством:
Подставив его в левую часть уравнения (5.10) получаем уравнение вида:
Величина (5.11)
называется символом Кристоффеля. Символ Кристоффеля имеет три индекса и не является тензором. В алгебре такие величины носят название символы первого рода. Стандартный
вид
уравнения
геодезической
линии
в
неэвклидовой
геометрии записывается с помощью символа Кристоффеля: (5.12)
Кроме этого, стандартного вида уравнения геодезической линии, можно также записать как меняется дифференциал касательного вектора
при
переносе вдоль геодезической линии: (5.13)
5.2.1 Геодезические линии на поверхности сферы Рассмотрим в качестве примера геодезические линии на сфере - двумерной неэвклидовой поверхности. Метрический тензор на поверхности сферы имеет вид: (5.14)
Контравариантные компоненты метрического тензора на поверхности сферы есть: (5.15)
Вычисляя символ Кристоффеля получаем, что все компоненты равны нулю за исключением двух:
Уравнения геодезических линий имеют вид: (5.16)
и
(5.17)
Здесь
,
сферические координаты наклонения и азимута, а
- афинный
параметр вдоль геодезической линии. При приведении к первому интегралу уравнение (5.17) получает вид:
или
(5.18)
Здесь
обозначает константу интегрирования. Первый интеграл
уравнения (5.16) можно легко привести к удобной форме, если выбрать в качестве афинного параметра длину вдоль геодезической
. Тогда
интеграл первого уравнения становится: (5.19)
Рассмотрим два частных случая геодезических линий. Движение по экватору
Пусть наша линия начинается на экваторе
, причем направление
и
этой линии совпадает с направлением экватора, т.е.
.
Решение для геодезической линии получается из уравнений (5.18, 5.19). Действительно, правая часть равенства (5.18) есть 1. Подставляем
выражение для
в уравнение (5.19) и получаем уравнение:
Удовлетворяет этому уравнению только значения
. Таким образом
доказано, что экватор является геодезической линией на сфере. Движение по меридиану Рассмотрим теперь движение вдоль меридиана и покажем, что меридиан также является геодезической линией. Теперь вектор, касательный к линии имеет компоненты:
Начальную точку также выберем на экваторе
. Из уравнения (5.18)
получаем, что
откуда следует, что получаем, что
. Из второго интеграла системы (5.19)
откуда непосредственно следует, что
Не рассматривая общего случая решения системы (5.18, 5.19) упомянем только, что экватор и меридиан на поверхности сферы являются частными случаями большого круга - сечения поверхности сферы плоскостью, которая проходит через центр сферы. Рассматривая трехмерные вращения, можно показать, что только отрезок большого круга на сфере представляет кусок геодезической линии. Полная геодезическая линия представляет из себя большой круг. Движение по малому кругу Продемонстрируем отличие произвольной линии от геодезической линии на примере малого круга на сфере. Малый круг на сфере - это сечение сферы плоскостью, которая не проходит через центр сферы. Выберем малый круг так, чтобы он был сечением с
. Тогда
уравнения, которые описывают малый круг есть:
отсюда легко найти первые и вторые производные от координат по афинному параметру:
Подставляя
эти
значения
в
уравнения
геодезических
приходим
к
противоречию:
Таким образом малый круг на сфере не является геодезической линией.
6. Анализ в неэвклидовой геометрии •
6.1 Ковариантное дифференцирование o
•
6.1.1 Параллельный перенос вектора
6.2 Связь метрического тензора и символов Кристоффеля o
6.2.1 Ковариантная производная 4x скорости
•
6.3 Производная Лагранжа -Эйлера
•
6.4 Производная Ли
Вычисление различных величин в общей теории относительности - это вычисление тензорных величин различного ранга (скалярных, векторных, тензорных второго ранга, иногда более высоких рангов), включая операции дифференцирования и интегрирования. В эвклидовой геометрии операция дифференцирования для, например, векторов, определялась так же как для обычных математических функций - скалярных величин. В неэвклидовой геометрии процедура построения производных от вектора является более сложной. Она носит название ковариантного дифференцирования.
6.1 Ковариантное дифференцирование Напомним, что если в каждой точке некоторой области (которое может охватывать и все пространство) задана некоторая скалярная или векторная величина, то говорят, что задано поле этой величины. Аналогично можно
задать
поле
тензорной
величины.
Скажем
метрика
Минковского,
определяемая как (5.6), является тензорным полем второго ранга, определенным во всех пространстве. Каждая компонента этого поля является
постоянной
отличны от нуля (
величиной,
причем
диагональные
,
компоненты
), а недиагональные
равны нулю. Примером тензорного поля второго ранга, которое не является постоянным
может
служить
метрика
на
поверхности
сферы.
Недиагональные компоненты такой метрики, как и в предыдущем примере, равны нулю, но из диагональных компонент только компонента
,
тогда как вторая компонента является функцией одной из координат . В пространстве с эвклидовой или псевдоэвклидовой метрикой в векторном и тензорном анализе можно определить производные от соответствующего поля по стандартным правилам: (6.1)
при
. Здесь необходимо обратить внимание на то, что в правой
части стоит дробь, в числителе которой находится разность тензорных величин,
взятых
в
двух
соседних
точках,
. В пространстве с эвклидовой метрикой разность двух векторов, даже взятых в различных точках пространства является вектором. Эта разность при линейных преобразованиях координат преобразуется как вектор. При нелинейных преобразованиях координат или в пространстве с неэвклидовой метрикой разность двух векторов, взятых в различных точках пространства преобразуется уже не по закону преобразования векторов. Хотя подробное изложение правил тензорного анализа можно найти в
прекрасных учебниках [8], [9], [10], мы посвятим несколько абзацев демонстрации
особенностей
нелинейных
преобразований
и
преобразований в неэвклидовых пространствах. Вначале покажем, что при нелинейных преобразованиях дифференциал векторного поля уже не является векторным полем. Итак, введем стандартное обозначение:
и
сделаем
преобразование
координат
,
законы
преобразования для векторного поля есть
Поле
в точке
будет преобразовываться согласно
Дифференциал вычисляется в точке
, поэтому все функции необходимо
вычислить именно в этой точке. Для вычисления частной производной в точке
используем вычисления вряд Тэйлора по малому параметру -
величине дифференциала
:
аналогичные вычисления проделаем для самого векторного поля:
Все величины теперь вычислены в точке
, поэтому можем строить
дифференциал и производную векторного поля по обычным правилам:
а производная этого векторного поля вычисляется как:
Второй
член
в
этом
уравнении
обладает
признаками
тензора,
преобразуется как тензорное поле второго ранга. Первое слагаемое явно не является тензорным полем, поскольку преобразуется по другим правилам. Так
получилось
потому,
что
мы
пренебрегли
последовательными
рассуждениями в определении производных от векторнорго поля в неэвклидовой геометрии. При вычислении приращения векторного поля мы вычитали величины определенные в разных точках пространства. Первая величина определена в точке
, а вторая в точке
. В
эвклидовой геометрии при вычислении приращения векторного поля обычно опускается промежуточный шаг, который заключается в том, что векторы, заданные в соседних точках, сводятся по определенным правилам в одну точку. Таким
правилом
является
параллельный
перенос.
Дифференциал
векторного поля, полученный вычитанием значения векторного поля заданного в точке
и параллельно перенесенного из точки
из значения векторного поля в точке ковариантным дифференциалом.
в точку называется
Итак,
для
получения
из
тензорного
поля
дифференцирования тензорного поля ранга
ранга
путем
необходимо вычислять
не обычный дифференциал, а ковариантный дифференциал.
6.1.1 Параллельный перенос вектора Ковариантное
дифференцирование
тесно
связано
с
понятием
параллельного переноса вектора. Параллельный перенос вектора в эвклидовом пространстве определяется как перенос вдоль некоторой прямой таким образом, что угол между вектором и прямой остается при переносе постоянным. Соответственно, компоненты вектора при таком переносе остаются неизменными. В неэвклидовой геометрии эта операция несколько изменяется. Аналогом прямой
в
неэвклидовой
Параллельный
перенос
геометрии вектора
является
геодезическая
определяется
как
перенос
линия. вдоль
геодезической линии, которая соединяет две точки. Естественно, как и в эвклидовой геометрии, угол между переносимым вектором и геодезической линией остается постоянным. В качестве характеристики угла между выбранным вектором, скажем, геодезической линией принимем угол между вектором
и
и вектором
касательным к геодезической линии. Таким вектором является производная от уравнений геодезической линии по афинному параметру вдоль этой
линии
.
Угол
между
уравнению (5.8). Пусть норма вектора
и
определяется
согласно
равна единице6.1. Прежде чем
вести вычисления, заметим, что при параллельном переносе скалярные величины не меняются6.2. Поэтому скалярное произведение двух векторов тоже остается постоянным при параллельном переносе, а значит и норма одного вектора постоянна при таком переносе. Поэтому требование
постоянства угла между вектором
и вектором
можно заменить на
требование постоянства скалярного произведения этих векторов. Итак вычислим изменение произвольного вектора
при параллельном
переносе вдоль геодезической линии. Основное требонание, налагаемое параллельным перносом заключается в том, что скалярное произведение вектора
и вектора касательного к геодезической линии является
постоянным вдоль линии переноса:
Введем
обозначение
для
изменения
компонент
вектора
при
параллельном переносе. Теперь распишем уравнение сохрания скалярного произведения более подробно
Преобразуем правую часть уравнения, выделив член нулевого порядка малости по бесконечно малому смещению и два члена первого порядка малости, вторым порядком малости здесь будем пренебрегать. Первый член в правой части сократится с членом, который стоит в левой части, а :
два члена первого порядка малости дадут уравнение для вычисления
Подставим в это уравнение изменение касательного вектора вдоль геодезической (5.13) и получим уравнение для изменения вектора
Отсюда получаем решение:
:
В
современных
[10]
и
классических
курсах
[8]
по
общей
теории
относительности уравнение для вычисления изменений компонент вектора при параллельном перносе выводится методом переноса вдоль прямой в касательном пространстве [10] или в галилеевых координатах [8]. Эти две операции эквивалентны. Параллельный перенос приводит к тому, что компоненты вектора меняются. Ковариантный дифференциал будем обозначать большой буквой латинского алфавита. Ковариантный дифференциал векторного поля является разностью двух малых величин. Первая - обычный дифференциал поля
между двумя пространственно - временными точками
величина - изменение векторного поля
, вторая
при параллельном переносе его
из одной точки пространства в другую.
Контравариантные компоненты
от ковариантных отличаются знаком:
Теперь можно написать уравнения для ковариантных дифференциалов
а также уравнения для ковариантных производных от векторов
Знак ";" означает ковариантную производную. Мы будем в дальнейшем использовать этот знак "точка с запятой" для обозначения ковариантной производной, а для обозначения обычной производной будем использовать знак "," - "запятая". Легко видеть, что ковариантный дифференциал
подчиняется всем
основным правилам дифференцирования:
(6.2)
пользуясь
этими
правилами
можно
доказать
правило
образования
ковариантных производных от тензоров более высокого ранга чем вектора:
(6.3) (6.4) (6.5) (6.6)
(6.7)
Обратим внимание, что в случае смещанных индексов порядок может быть важен, в том случае, когда тензор не является симметричным. Тогда указание на то, что индекс должен следовать вторым показано отступом, верхний и нижний индексы не расположены в одной колонке. То же самое справедливо и для символом Кристоффеля. Теперь можно просто сформулировать словесное правило образования ковари антной производной от тензора любого ранга и содержащего произвольное количество нижних и верхних индексов. Ковариантная производная равняется сумме частной производной от тензора по некоторой
координате
плюс
(или
минус)
произведения
символов
Кристоффеля на сам тензор. Количество членов в этой сумме равняется количеству индексов плюс частная производная от самого тензора. Более точно, ковариантная производная от тензора ранга верхних и
, содержащего
нижних индексов равняется частной производной от этого
тензора, плюс произведение символа Кристоффеля (с верхним индексом таким же как один из верхних индексов дифференцируемого тензора и одним из нижних индексов таких же как у координаты, по которой ведется дифференцирование) с самим тензором у которого один из верхних индексов суммируется со вторым индексом символа Кристоффеля, минус произведение символа Кристофферя (теперь верхний индекс у связности является немым индексом суммирования, а один из нижних индексов такой же как у координаты по которой ведется дифференцирование) с самим тензором у которого очередный нижний индекс заменен на нем ой индекс суммирования, а остальные расположены по порядку. Коваринтные производные подчиняются тем же обычным правилам дифференцирования, которые справедливы для обычных производных от
векторных и тензорных полей в эвклидовам пространстве. Эти правила перечислены чуть выше для вариаций вектора (см. уравнение (6.2)). Добавим, что ковариантная производная от скалярного поля совпадает с обычной производной. Законы преобразований символов Кристоффеля при преобразованиях координат имеют вид:
В
обычной
неэвклидовой
геометрии
предпологается,
что
символ
которой
символ
Кристоффеля является симметричным по нижним индексам. Существует
обобщения
неэвклидовой
геометрии
в
Кристоффеля уже не является симметричным. Разность
называется тензором кручения. В отличие от символа Кристоффеля, который не является тензором и преобразуется по закону, содержащему является тензором и, как
вторую производную от координат, величина
легко проверить, преобразуется как тензор третьего ранга. В
общей
теории
относительности
тензор
кручения
равен
нулю,
эксперименты показывают, что введение этой величины излишне. Поэтому далее мы не будем рассматривать тензор кривизны и его наблюдательные проявления. В общей теории относительности символ Кристоффеля является симметричным по нижним индексам, что выражается уравнением вида
.
Всюду
симметричным по индексам
ниже .
будем
полагать,
что
является
6.2 Связь метрического тензора и символов Кристоффеля Для вычисления ковариантных производных в неэвклидовой геометрии необходимо
научиться
вычислять
символы
Кристоффеля.
Они
вычисляются очень просто в метрических пространствах, когда определяется через метрический тензор. Найдем связь
с метрическим
тензором. Ковариантный
дифференциал
является
тензором,
поэтому
согласно
правилу поднятия и опускания индексов в метрических пространствах можно написать уравнение: (6.8)
с другой стороны аналогичное уравнение можно написать для самих векторов (6.9)
Теперь продифференцирум (6.9) и применим правила (6.2). Получим уравнение вида (6.10)
Из
сравнений
уравнений
(6.8)
и
(6.10)
видно,
что
ковариантный
дифференциал от метрического тензора равен нулю. Следовательно равны нулю
ковариантные
производные
по
всем
координатам.
Вычислим
ковариантные производные в явном виде согласно уравнению (6.5). Эти ковариантные производные имеют вид:
(6.11)
Поскольку левая часть уравнения (6.11) равна нулю, как это следует из уравнения (6.10), то и правая тоже равна нулю. В результате получаем линейное уравнение для связи символов Кристоффеля с метрическим тензором и его частными производными первого порядка: (6.12)
Переставляя индексы в уравнении (6.12) получаем систему линейных уравнений вида:
(6.13)
(6.14)
(6.15)
Вычитая почленно из уравнения (6.13) уравнения (6.14) и (6.15), получаем уравнение
из которого легко находим связь символов Кристоффеля с метрическим тензором и его первыми производными по координатам: (6.16)
Как видно из уравнения (5.11) эти два символа совпадают.
6.2.1 Ковариантная производная 4x скорости Рассмотрим теперь ковариантную производную одного из самых важных для нас векторов - 4
скорости пробной частицы или вектора касательного
к геодезической линии. Ковариантный дифференциал этого вектора есть:
Теперь можно вычислить частную ковариантную производную по одной из координат:
в соответствии с общими правилами ковариантного дифференцирования. Умножим это уравнение на сам вектор 4
скорости:
Первый член в правой части этого уравнения, как легко видеть, равен полной
производной
от
скорости
по
афинному
параметру
вдоль
геодезической линии:
Оба члена вместе представляют уравнение геодезической линии, откуда имеем еще один вид уравнения геодезической: (6.17)
6.3 Производная Лагранжа -Эйлера
В математическом анализе и геометрии используют еще несколько видов производных. Для нас важными являются две из них, это производная Лагранжа -Эйлера и производная Ли. Вначале познакомимся с производной Лагранжа -Эйлера. координат
Рассмотрим множество функций
. Эти функции могут
быть компонентами скаляра, вектора или тензора. Они могут быть объектами другой природы, которые преобразуются к другой системе координат по собственным правилам. Для вычисления производной Лагранжа -Эйлера неважна природа этих функций. Мы опустим индекс но будем помнить, что функции Рассмотрим функцию
,
представляют из себя набор функций.
от аргументов, которые сами являются функциями
и их производными:
Еще раз подчеркнем, что
в общем случае является множеством функций,
а не обязательно одной функцией. Рассмотрим теперь функционал, например действие от функции
взятое по некоторой 4 Обозначим
области
вариацию поля
. и будем считать, что вариации самого
поля, а также всех его производных исчезают на границе области Вариации функции
:
имеют вид:
Отсюда получаем для вариаций функционала уравнение вида:
.
Интегрируя каждый из членов в круглых скобках по частям получаем:
Выражение, которое находится в круглых скобках в последней строчке называется
производной
Лагранжа
-Эйлера.
Итак
по
определению
величина:
называется производной Лагранжа -Эйлера от L. Она тесно связана c функциональной или вариационной производной вводимой в теории случайных полей [11]. Уравнение вида:
называется
уравнением
Эйлера.
Уравнения
такого
вида
являются
уравнениями движения в ньютоновской механике. Иногда в качестве величины
выступает переменная, которая вообще не преобразуется.
6.4 Производная Ли
Производная Ли для нас не так важна, как производная Лагранжа - Эйлера, но все же мы кратко проанализируем ее здесь, поскольку будем обращаться к ней несколько раз в течение курса. Более подробно о методе Ли и его применениях будет рассказано ниже. Производная Ли играет большое значение при исследовании свойств симметрии метрики. Для исследования этих свойств напомним вначале простейшее
понятие
симметрии,
например
зеркальной
симметрии.
Геометрическое тело называют симметричным относительно плоскости, если эта плоскость разбивает тело на две части, из которых каждая является зеркальным отражением другой относительно этой плоскости. Сама плоскость в этом случае называется плоскостью симметрии. Зеркальной симметрией обладают многие предметы из окружающего нас мира: самолет, лист клена, форма человеческого тела (внутреннее строение уже не обладает свойством зеркальной симметрии!). С формальной точки зрения зеркальную симметрию определяют как форминвариантность относительно преобразования координат вида:
Если
при
таком
неизменной,
то
преобразовании говорят,
что
координат
форма
геометрическое
тела
тело
остается
симметрично
относительно плоскости Отметим,
что
приведенное
выше
преобразование
не
является
непрерывным относительно некоторого параметра, как в большинстве случаев, которые мы рассматривали при преобразованиях координат в неэвклидовой геометрии. Поэтому свойства симметрии геометрических тел, точнее
функций
координат.
связаны
Зеркальная
с
инвариантностью
симметрия
относиться
при к
преобразованиях так
называемым
дискретным видам симметрии. Ниже мы будем рассматривать только точечные виды симметрии. Они связаны с непрерывными преобразованиями, непрерывно зависят от
одного или нескольких параметров. К таким видам симметрии относится, например, симметрия относительно вращения. Так, сфера - идеальный объект в трехмерном пространстве для изучения группы вращений. Вращения можно осуществлять на произвольный, сколь угодно малый, угол. Определим понятие симметрии для метрического тензора. Говорят, что является форминвариантной относительно преобразований
метрика
, если преобразованная метрика
координат вида же функция от аргумента
- та
, что и первоначальная функция
первоначального аргумента
от ее
, т.е. [12]
Заметим, что это равенство можно также переписать в двух эквивалентных формулировках:
и
Многие
геометрические
свойства
пространства
можно
определить
пользуясь понятиями симметрии. Симметрии пространства также важны для
определения
физических
свойств,
законов
сохранения,
поиска
наиболее общих интегралов уравнений движения. Свойства метрики пространства - времени можно определить не прибегая к решению уравнений
общей
теории
относительности,
а
пользуясь
только
соображениями симметрии. Поясним как это можно сделать на примере производных Ли. Производные
Ли
являются
обощениями
понятия
производных
по
направлению на тензоры. Рассмотрим две точки в пространстве
и
разделенные
точек
малым
расстоянием.
Пусть
координаты
этих
,
соединяются бесконечно малым вектором, квадратом которого можно пренебречь по сравнению с самим вектором6.3:
Пусть задано некоторое скалярное поле в точке
. Вычислим значение поля
если значение этого поля в точке
задано:
в ряд Тейлора можно пренебречь
Естественно, в этом разложении
квадратичными поправками и поправками более высоких степеней. Величина: (6.18)
называется производной Ли от скалярного поля. В курсах высшей математики этот оператор чаще называется производной по направлению . Рассмотрим смысл такой производной на примере скалярного поля, заданного в трехмерном пространстве. Пусть у нас задано цилиндрически симметричное
распределение
цилиндрическими координатами
температуры ,
температура может зависеть от радиуса
и
в
пространстве
с
. Интуитивно понятно, что , но она не будет зависеть от
координаты
или от координаты
температуры по координатам
,
. Это означает, что производная от равна нулю. В инвариантном виде это
означает, что существуют вектора, выделяющие направление вдоль которых производная Ли равна нулю. В данном частном случае это вектора описывающие движения вдоль оси
и вокруг нее. В общем случае
движение, которое описывает вектор
, описывает точечную симметрию,
если значение поля
в двух точках
и
вдоль этого вектора является
постоянным. Теперь определим производную Ли для векторного поля
. От случая
скалярного поля эта производная отличается тем, что теперь вычисляется величина, которая зависит от координатной системы. Итак, вновь у нас есть две точки, которые разделены бесконечно малым вектором векторного поля в точке
через значения в точке
. Значения
вычисляются как:
Рассмотрим теперь преобразование координат:
где
- тот же самый вектор бесконечно малой величины. Теперь, как
нетрудно видеть, точка
имеет те же значения координат в тильдованной
системе, что и точка
в нетильдованной системе. Коэффиценты в
матрице преобразования векторов для такого преобразования имеют вид:
Соответственно коэффиценты в матрице преобразования вектора в точке есть:
или
Запищем теперь значение вектора в точке
через значение в точке
,
тогда получим:
Разница между преобразованными компонентами векторного поля в точке и непреобразованными компонентами векторного поля в точке называется дифференциалом Ли или производной Ли: (6.19)
Аналогично можно определить производную Ли для тензорного поля. Рассмотрим теперь какое - либо тензорное поле, например, образованное из тензора второго ранга, которое в системе координат без тильды имеет компоненты
. В преобразованной системе координат оно имеет вид:
Так отличаются компоненты тензора
в тильдованной и нетильдованной
системах координат. Теперь вычислим компоненты этого тензора в точках и
.
Окончательно вычислим разницу между значениями компонент тензора в точке
в нетильдованной системе координат и значениями компонент
тензора в точке
в тильдованной системе координат. Эта величина
называется производной Ли для тензоров второго ранга: (6.20)
Теперь можно определить симметрию тензорного поля векторного поля
относительно
как равенство нулю производной Ли (6.20).
Вернемся теперь к симметриям метрического тензора. Производная Ли метрического тензора выглядит особенно просто: (6.21)
Это просто проверяется непосредственным вычислением. Равенство нулю производной Ли дает нам уравнение Киллинга: (6.22)
которое определяет симметрии метрического тензора.
7. Тензор кривизны •
7.1 Тензор кривизны o
•
7.1.1 Вторые ковариантные производные
7.2 Параллельный перенос вектора по замкнутой кривой
o
7.2.1 Параллельный перенос вектора по линии широты на сфере
o
7.2.2 Перенос вектора по бесконечно малому параллелограмму
o
7.2.3 Изменение вектора при переносе по замкнутой кривой
•
7.3 Свойства тензора кривизны
•
7.4 Вариации тензора кривизны
Неэвклидова геометрия полностью характеризуется метрическим тензором. Однако помимо этого тензора существует еще несколько важных тензоров, которые тоже используются для характеристики важных соотношений неэвклидовой геометрии. Самой важной величиной после метрического тензора является тензор кривизны или, как для краткости говорят релятивисты, кривизна. Тензор кривизны можно вводить несколькими путями. Мы обсудим здесь два способа определения тензора кривизны. Первый способ - через вторые ковариантные производные от вектора, второй
способ
более
традиционный
-
посредством
сравнения
ковариантного переноса вектора по двум путям, образующим замкнутую кривую.
7.1 Тензор кривизны 7.1.1 Вторые ковариантные производные Пусть в нашем пространстве задано векторное поле
. Рассмотрим
первые производные этого векторного поля и вторые производные поля . Поскольку большинство уравнений математической физики уравнения содержащие вторые производные от физической величины, то при обобщении уравнений описывающих какое - либо поле, например, электромагнитное, нам придется выводить уравнения, которые содержат вторые производные от полей по координатам. В эвклидовой геометрии
порядок производных был неважен, производные обладали свойством коммутации. В неэвклидовой геометрии это свойство, вообще говоря, теряется. Рассмотрим
ковариантные
производные
второго
порядка.
Такую
производную можно записать как (7.1)
так как
является тензором второго ранга. Теперь подставим уравнение
для первой ковариантной производной в (7.1) и получим уравнение вида:
в этой формуле, как и прежде, точка с запятой перед индексом означают ковариантное
дифференцирование
по
координате
именуемой
этим
индексом, запятая - частную производную по координате с одноименным индексом. Теперь выпишем разность ковариантных производных меняя индексы по которым ведется дифференцирование.
(7.2)
Проанализируем полученное уравнение. Прежде всего обратим внимание, что
в
левой
части
уравнения
первая
строчка,
которая
содержит
антикоммутатор от частным производных обращается в ноль. Таким образом антикоммутатор ковариантных производных понижает порядок дифференцирования.
Вторая
строчка
содержит
первые
частные
производные от векторного поля. Заметим, что первый и пятый члены взаимно сокращаются, также сокращаются поочередно второй и четвертый, а
также
третий
ковариантных
и
шестой
производных
члены. второго
Таким
образом
порядка
не
антикоммутатор
содержит
частных
производных вообще. Однако, уравнение (7.2) не обращается в ноль тождественно. Третья строчка полученного уравнения, которая содержит произведения частных производных от символа Кристоффеля на векторное поле не обращется
в
ноль
тождественно.
В
последней
строчке
взаимно
сокращаются второй и четвертый члены, но первый и третий члены не сокращаются.
Таким
образом,
получается,
что
антикоммутатор
ковариантных производных второго порядка равен произведению самого векторного поля на величину содержащую четыре индекса: (7.3)
Теперь
легко
доказать,
что
величина
является
тензором.
Действительно, сделаем преобразование координат из одной системы
(скажем,
) в другую
. Слева в уравнении (7.3) стоит тензорная
величина третьего ранга (напомним, что первая ковариантная производная от вектора является тензором второго ранга, соответственно вторая ковариантная производная от вектора является тензором третьего ранга). Справа в этом уравнении - произведение вектора на величину с четырьмя индексами. Сравнивая зависимость в двух системах координат получаем закон преобразования для
в виде:
Это доказывает, что величина
является тензором четвертого ранга.
Этот тензор называется тензором кривизны или тензором Римана7.1. Его можно записать в виде уравнения в частных производных символов Кристоффеля и бинарных произведений символов. (7.4)
Здесь знаки в определении тензора кривизны выбраны так, чтобы тензор совпадал с определением принятым в [8]. Некоторые авторы определяют тензор Римана с противоположным знаком.
7.2 Параллельный перенос вектора по замкнутой кривой В этой части мы рассмотрим второй, традиционный вывод тензора кривизны. В классических книгах, посвященных неэвклидовой геометрии и общей
теории
относительности,
тензор
кривизны
появляется
при
обсуждении параллельного переноса вектора по замкнутой кривой (см. например, [8], [10]). Итак, рассмотрим параллельный перенос вектора вдоль замкнутой кривой. Для пояснения выкладок вначале выберем двумерную поверхность сферы, а в качестве вектора единичный вектор касательный к траектории переноса в начальной точке. Кривую нарисуем на поверхности сферы и будем считать, что эта кривая - параллель или линия широты.
7.2.1 Параллельный перенос вектора по линии широты на сфере Метрику в координатах
можно записать как (5.9):
а метрический тензор будет иметь вид
Кроме того, выпишем вновь также компоненты символа Кристоффеля на поверхности единичной сферы:
Вектор
переносится вдоль широты на сфере параллельно. Это значит,
что ковариантная производная этого вектора вдоль выбранной кривой равна
нулю.
Поэтому
формально
условие
параллельного
записывается как:
Теперь напишем это формальное условие более детально:
перноса
(7.5)
Пусть на параллели, которая характеризуется одним параметром координатой
, задан вектор единичной длины: (7.6) (7.7)
Вектор переносится вдоль широты, а это значит, что изменение координаты отсутствует,
. Уравнения (7.5) принимают вид: (7.8) (7.9)
Вначале рассмотрим вспомогательный пример. Сдвинем вектор широты на расстояние
вдоль
. Его компоненты изменятся. Появится
компонента направленная вдоль первой оси:
а компонента вдоль второй оси останется неизменной (с точностью до малых величин второго порядка):
Теперь видно, что вектор повернулся ( поскольку появилась компонента вдоль первой оси). Угол между параллельно перенесенным вектором и вектором, касательным к широте есть:
Рассмотрим теперь математические операции более подробно и решим уравнения параллельного переноса вектора для вычисления его компонент после перенесения на конечное расстояние вдоль широты. Уравнения (7.8) становятся: (7.10)
(7.11)
Теперь уравнения описывающие параллельный перенос вектора - это два обыкновенных
дифференциальных
уравнения.
второе из уравнений (7.10) по переменной
Продифференцируем
и подставим его в первое.
Получим одно уравнение второго порядка:
Его решение - это решение уравнения колебаний, когда частота колебаний равна
. Это решение имеет вид:
Естественно, что решение зависит от двух постоянных величин
и
.
Соответственно решение для первой компоненты вектора получается дифференцированием по
и умножением на
:
Найдем теперь постоянные есть
,
и
. В точке
компоненты вектора
. Подставим эти условия в найденные решения
для компонент и получим, что
, а
. Поэтому решения
для компонент вектора имеют вид:
Найдем угол между вектором
. Этот угол будет определяться уравнением:
линии широты
Проекция вектора
и единичным вектором, касательным к
на вектор
уменьшается по мере переноса
широты. В то же время проекция вектора меридиана, назовем его
вдоль
на единичный вектор вдоль
растет:
Вектор, касательный к линии меридиана направлен от полюса. Посмотрим на сферу со стороны северного полюса. Пусть перенос осуществляется в направлении против часовой стрелки. Тогда поворот вектора по часовой стрелке.
происходит
Рассмотрим более подробно перенос вектора по широте расположенной близко к полюсу. Будем считать, что
, и будем пренебрегать
.
членами квадратичными по широте. Тогда
. При этом видно, что
Рассмотрим значения компонент в точке компонента, направленная вдоль
обращается в ноль, а компонента,
становиться почти единичной. При переносе
направленная вдоль вектора
вдоль широты значительно отстоящей от полюса, компонента обращается в ноль при значении угла
. и
При дальнейшем переносе угол между полного переноса вектора
продолжает расти. После
и возвращения его в точку
перенесенным вектором и вектором
вдоль
угол между
есть:
Отметим также, что угол между исходным положением вектора и его конечным положением есть
что в точности равно площади сегмента сферы единичного радиуса, ограниченного линией широты. Если вектор переносится параллельно самому себе на плоскости вдоль замкнутой кривой, то после возвращения в исходную точку, вектор совпадает
сам
Следовательно
с
собой.
геометрия
В на
неэвклидовой сфере
геометрии
неэквивалентна
это
не
геометрии
так. на
плоскости. Чуть ниже мы увидим, что выведенные уравнения имеют отношение к кривизне поверхности.
Рассмотрим теперь параллельное перенесение вектора вдоль замкнутой кривой в произвольной неэвклидовой геометрии.
7.2.2 Перенос вектора по бесконечно малому параллелограмму Прежде чем исследовать поведение вектора
при параллельном перносе
вдоль замкнутой кривой произвольной формы, мы рассмотрим перенос этого вектора вдоль бесконечно малого параллелограмма построенного на отрезках соответствующих координат. Рисунок 7.1: На рисунке изображен бесконечно малый параллелограмм. Вершины
параллелограмма
обозначены
Итак, пусть у нас задан вектор
. Вершины параллелограмма обозначим
(см. рис. 7.1). Точку вектор
. Точку
и точку
.
буквами
и точку
соединяет бесконечно малый
соединяет бесконечно малый вектор
.
Поскольку наша фигура - параллелограмм, то стороны, противоположные сторонам
и
соединяют
вектора
полученные
параллельным
переносом. Сторона, которая построена на векторе соединяющем точки
и
, противоположна стороне построенной на векторе , есть
параллельно перенесенный на которая
построена
на
. Этот вектор,
векторе,
. Сторона,
соединяющем
точки
противоположна стороне, построенной на векторе
и
. Этот вектор,
, есть
параллельно перенесенный на
,
. Таким
образом мы вычислили размер сторон параллелограмма. Вычислим теперь изменение компонент вектора при перенесении. Пусть вектор
заданный в точке
вначале через точку
в точку
переносится параллельно самому себе , а затем из точки
через точку
в точку
. Рассмотрим вначале перенос из перенесенного в
в
через точку
. Величина вектора,
есть:
Теперь этот вектор должен быть перенесен из точки точке
значения символов Кристоффеля уже другие:
После
перенесения
из
точки
в
Следовательно вектор, перенесенный из
вектор в
через
в точку
вновь
. Но в
изменяется.
имеет вид:
Здесь мы пренебрегли величинами третьего порядка малости. в
Для вектора перенесенного из выражение, в котором вектора
через точку и
получаем аналогичное
меняются местами. Теперь можно
вычислить разность между двумя векторами, перенесенными в
по двум
траекториям. Эта разность равна: (7.12)
Это выражение является вектором, так как построена как алгебраическая сумма векторов. Другими словами, выражение, которое стоит в фигурных скобках, является тензором четвертого ранга. Этот тензор: (7.13)
называется
тензором
кривизны.
Поэтому
пространство
является
эвклидовым, если (7.13) равен нулю в каждой точке этого пространства. Произведение двух векторов на которых построен параллелограмм есть площадь этого бесконечно малого параллелограмма.
7.2.3
Изменение
замкнутой кривой
вектора
при
переносе
по
Рассмотрим теперь изменение вектора при параллельном переносе вдоль замкнутой кривой конечного размера. Разобъем ее на бесконечно малые параллелограммы, как показано на рис. 7.2 Рисунок 7.2: На рисунке изображена замкнутая кривая конечных размеров . Разобъем ее на совокупность бесконечно малых параллелограммов так, чтобы перенос по соседним сторонам параллелограммов проходил в противоположных направлениях. Тогда, как легко видеть, полное изменение вектора при переносе вдоль
складывается из интеграла по площади,
стягиваемой этой кривой от произведения тензора кривизны на сам вектор.
Теперь
можно
получить
изменение
компонент
вектора
при
параллельном перносе вдоль замкнутой кривой конечных размеров в виде интеграла по поверхности, стягиваемой этой кривой:
7.3 Свойства тензора кривизны Свойства тензора кривизны мы уже немного обсудили при анализе второй ковариантной производной от вектора. Обсудим алгебраические свойства тензора кривизны более подробно. Для этого опустим верхний индекс и будем работать только с ковариантным тензором четвертого ранга. Из уравнения (7.4) следуют свойства симметрии тензора кривизны:
(7.14) (7.15) (7.16) (7.17)
До сих пор мы рассматривали общий случай неэвклидовой геометрии, теперь вспомним, что нам нужено только четырехмерное пространство. В этом случае пары индексов
и
пробегают 6 различных наборов
значений. Поэтому есть 6 компонент тензора кривизны с одинаковыми и компонент с различными значениями индексов. Три компоненты с четырмя различными индексами связаны уравнением (7.17), поэтому всего имеется 20 независимых компонент. Существует одно дифференциальное тождество, которое называется тождеством Бьянки: (7.18)
Из тензора кривизны четвертого ранга образуются дополнительно две величины. Одна является тензором второго ранга и образуется сверткой верхнему и второму нижнему индексам:
(7.19)
Тензор Риччи является симметричным тензором, поэтому в четырехмерном пространстве он имеет 10 независимых компонент (как и метрический тензор).
Сверткой
скалярную
по
величину,
оставшимся которая
двум
индексам
называется
можно
скалярной
получить кривизной
пространства:
(7.20)
Поскольку
(7.20)
является
скалярной
величиной,
то
она
является
одновременно инвариантной относительно координатных преобразований и называется также скалярной кривизной пространства. Из тождеств Бьянки можно получить важное равенство. Для этого свернем тождество (7.18) по индексам
. Тогда получим уравнение вида:
Свернем это уравнение еще раз с метрическим тензором, получим равенство: (7.21)
В этом уравнении четырехмерная дивергенция некоторого тензора второго ранга равна нулю. Этот тензор: (7.22)
играет важную роль в общей теории относительности. Иногда его называют тензором Эйнштейна.
7.4 Вариации тензора кривизны Рассмотрим теперь изменение символов Кристоффеля, а также тензоров кривизны, Риччи и скалярной кривизны при вариациях метрики. Полученные уравнения мы будем использовать в дальнейшем как для вывода уравнений
гравитационного
поля,
так
и
для
анализа
слабого
гравитационного поля и слабого гравитационного поля на фоне сильного поля. , на которую наложены небольшие изменения,
Пусть у нас есть метрика
и которые являются вариациями
которые мы будем обозначать
метрики. Отметим, что эти две величины по отдельности образуют тензора. Тем не менее сейчас мы будем рассматривать как один тензор, который состоит из "фоновой" метрики и малых поправок: (7.23)
Все величины, которые мы будем вычислять ниже, будем вычислять только до первого порядка малости по вариациям, пренебрегая вкладом вариаций более высокой степени. Рассмотрим
как
метрического
связаны
тензора
Контравариантные
вариации
с
контравариантных
вариация
компоненты
ковариантных
метрического
тензора
компонент компонент.
удовлетворяют
равенству вида:
Подставляя
сюда
ковариантный
метрический
тензор
и конравариантные компоненты между контравариантными и ковариантными вариациями:
с
вариациями
получаем связь
(7.24)
Отсюда видно, что конравариантные вариации отличаются от ковариантных знаком, а индексы поднимаются метрическим тензором, как и у любых других тензоров. Для вычисления вариации определителя метрического тензора введем абсолютно антисимметричный единичный тензор четвертого ранга [8]. Так называется тензор, компоненты которого меняют знак при перестановке любых двух индексов, причем отличные от нуля компоненты равны
. Тогда можно записать определитель метрического тензора как:
Теперь можно легко вычислить вариации определителя метрического тензора. Вариации определителя с точностью до линейных по
членов есть:
Приведем также одну полезную формулу, содержащую вариации плотности метрического тензора:
В этих двух уравнениях опущен индекс поскольку
мы
договорились
в символах фоновой метрики, но
оставлять
только
линейные
члены
по
вариациям, легко определить величины содержащие этот индекс. Рассмотрим теперь вариации символов Кристоффеля. Вновь оставляя только линейные члены по символов Кристоффеля:
получаем уравнение для вариаций
(7.25)
Отметим, что вариации символов Кристоффеля по отношению к "фоновой" являются
метрике
тензорами
третьего
ранга.
Ковариантные
.
производные построены с помощью фоновой метрики
Вариации тензора Риччи выражаются через ковариантные производные нового тензора - вариации символов Кристоффеля
: (7.26)
Это уравнение можно переписать в терминах вариаций метрики, в них оно имеет вид: (7.27)
8.
Уравнение
движения
в
общей
теории
относительности •
8.1 Уравнение движения пробной частицы в СТО
•
8.2 Уравнение движения пробной частицы в ОТО o
•
8.2.1 Уравнения движения в трехмерном виде
8.3 Девиация геодезический линий
Влияние гравитационного поля на движение частиц в ньютоновской механике хорошо изучено. Уравнение движения частицы представляет собой уравнение в левой части которого стоит ускорение пробной частицы умноженное на массу частицы (в данном случае это инертная масса), в
правой части уравнения стоит гравитационная сила. Гравитационная сила, в свою очередь, представляет из себя произведение массы пробной частицы (в данном случае - гравитационной массы) на ускорение со стороны тяготеющего тела:
Поскольку инертная масса тела равна его гравитационной массе (это формулировка
принципа
эквивалентности,
многократно
проверенного
экспериментально), то движение пробной частицы не зависит от массы этой частицы - перо птицы и кирпич падают в гравитационном поле с одинаковым
ускорением
(конечно,
если
пренебречь
сопротивлением
воздуха). В общей теории относительности роль гравитационной силы играет кривизна пространства - времени. Движение в гравитационном поле - это движение в искривленном пространстве, отклонение от движения по прямой линии - это отклонение в движении возникающее в искривленном пространстве времени. Вспомним
вначале
уравнения
движения
в
специальной
теории
относительности.
8.1 Уравнение движения пробной частицы в СТО В специальной теории относительности уравнение движения пробной частицы имеет вид: (8.1)
где
- 4
касательный Отметим, что
скорость частицы (физическое определение) или вектор, к
траектории
частицы
(математическое
- величина безразмерная, а
определение).
имеет размерность [см].
Другими словами, слева стоит величина, которая имеет размерность силы г . Уравнения движения электрона в электромагнитном поле имеют вид: (8.2)
Сила, которая стоит в левой части уравнения является 4 силой Лоренца, построенной из тензора Максвелла В случае, когда действующие силы равны нулю
инвариантной
. , то движение
частицы происходит по инерции. Тогда решение уравнения 8.1 имеет тривиальный вид: (8.3) (8.4)
Движение по инерции - это движение по прямой линии. Прямая линия является линией кратчайшей длины между двумя точками в эвклидовой и псевдоэвклидовой геометрии. В неэвклидовой геометрии линия кратчайшей длины называется геодезической линией. Движение в случае, когда внешние силы равны нулю, в неэвклидовой геометрии заменяется общековариантным уравнением - движением по геодезической линии. Отметим также, что решение (8.3) описывает также движение фотона, если полагать, что фотона, а
- единичный вектор в направлении распространения
- афинный параметр вдоль траектории.
8.2 Уравнение движения пробной частицы в ОТО Движение по геодезической линии описывает движение пробной частицы в гравитационном поле. Это движение является аналогом движения по инерции в пространстве с эвклидовой метрикой.
Выпишем уравнение движения в общей теории относительности, просто написав ковариантное обобщение уравнения 8.1: (8.5)
,
Здесь
как
мы
договорились
выше,
являются
обозначением
ковариантного дифференциала. Поэтому уравнения движения в общей теории относительности можно написать более детально в виде: (8.6)
Заметим, что теперь уравнения движения являются нелинейными (по скоростям), второй член в левой части уравнений содержит квадратичные произведения скоростей. Теперь уравнения движения, например, электрона в электромагнитном поле имеют вид: (8.7)
- тензор электромагнитного поля, а
Здесь
и
масса и заряд
электрона соответственно. Отметим, что теперь движение пробной частицы в отсутствии внешних сил уже не является движением по прямым линиям, как это было в эвклидовой
геометрии
(8.3).
Движение
в
отсутствии
внешних
сил
представляет из себя систему дифференциальных уравнений второго порядка для всех четырех координат, которые описывают четырехмерную траекторию пробной частицы.
8.2.1 Уравнения движения в трехмерном виде
Рассмотрим
уравнения
движения
пробных
частиц,
написанные
в
трехмерном виде. Будем считать, что частица является нерелятивистской и
(т.е. интервал между двумя событиями: выходом частицы из точки появление частицы в точке
не равен нулю). Уравнения движения
пробных частиц - уравнения геодезических линий имеют вид (8.6). В качестве афинного параметра вдоль геодезической возмем
- интервал
между событиями (т.к. он не равен нулю). Кроме того, напомним, что 4 скорость - это единичный вектор касательный к траектории движения, по определению:
Это значит, что уравнения движения можно переписать в виде, который содержит ускорения (вторую производную от координаты частицы по афинному параметру): (8.8)
Преобразуем вторую производную от координаты с пространственным индексом
по интервалу к второй производной по координате с нулевым
индексом:
Здесь
- нулевая компонента 4
скорости, а
- 4
мерное
уравнение движения с индексом 0. Это уравнение можно обратить, получая уравнения для ускорений пробной частицы в виде:
Подставим в это уравнение выражение для
и
После завершения всех выкладок, окончательно получаем уравнение движения в виде:
До сих пор дифференцирование проводилось по координате с нулевым индексом, поскольку эта координата имеет такую же размерность как и остальные координаты [см]. Однако, для получения обычного трехмерного уравнения движения необходимо перейти к дифференцированию по времени
. Умножим обе части полученного уравнения на квадрат
скорости света и получим уравнение движения в обычном трехмерном виде: (8.9)
Сравнивая обычное уравнение движения в ньютоновской гравитации:
можно сделать вывод о том, что аналогом ньютоновской силы является член вида:
Из приведенного уравнения видно, что (8.9) содержит члены разных порядков по отношению характерной скорости движения пробной частицы к скорости света. Самый большой член - сила Ньютона, но существуют и более слабые силы, которые, тем не менее вносят вклад в движение частицы в гравитационном поле. Они называются постньютоновскими поправками. Более
полный
анализ
уравнений
движения,
в
частности
вклада
постньютоновских поправок мы проделаем позже.
8.3 Девиация геодезический линий Девиацией двух бесконечно близких геодезических линий называется отклонение этих линий между собой. Рассмотрим две бесконечно близкие геодезические линии. Одна линия характеризуется несколькими параметрами. Выберем два из них. Один параметр назовем
, он будет афинным параметром вдоль линии. Второй
параметр выберем так, чтобы он отсчитывался вдоль направления вектора, который соединяет две указанные геодезические линии и является перпендикулярным вектору, касательному первой геодезической линии. Этот параметр назовем
. Теперь уравнение геодезической являетмя
функцией двух параметров
. Первый параметр
длину вдоль геодезической, второй параметр
отчитывает
отсчитывает "номер"
геодезической линии, координату в перпендикулярном направлении.
Вектор касательный к траектории геодезической линии, как прежде будем обозначать
. Введем второй вектор
, который будет касательным к
линии, соединяющие две геодезические. Отметим полезное равенство:
Докажем еще одно равенство, важное для наших рассуждений. Рассмотрим ковариантную производную от вектора
вдоль геодезической:
. Поскольку можно поменять
Спомним теперь, что вектор
частные производные местами, то производную от вектора можно записать, как производную от вектора
по параметру
по параметру
.
Поэтому можно продолжить верхнее равенство как:
Теперь выпишем само равенство, которое было доказано: (8.10)
Рассмотрим теперь как меняется вектор Поскольку
длина
этого
вектора
вдоль геодезической линии. является
расстояние
между
геодезическими, то сам вектор показывает как меняется расстояние и ориентация двух пробных частиц, которые движутся по геодезическим линиям в гравитационном поле. В обычной ньютоновской теории тяготения,
изменение
расстояния
между
пробными
частицами
вызывается
приливными силами. Найдем аналог приливных сил в ньютоновской механики в общей теории относительности. Для этого рассмотрим вначале первую ковариантную производную от вектора
вдоль геодезической:
Поскольку производная по параметру
может быть выражена как
производные по координатам, умноженные на вектор вдоль геодезической. Точно так же можно выразит и вторую производную. Рассмотрим
теперь
вторую
производную
от
вектора
вдоль
геодезической:
В этом равенстве прием перехода от дифференцирования по афинному параметру к дифференцированию по координатам применен дважды. Воспользуемся также равенством (8.10) и выразим величину в круглых скобках через производную от вектора касательного к геодезической, тогда получим:
В первом члене меняем порядок ковариантного дифференцирования:
а ко второму вновь применяем равенство (8.10). Получаем, что вторая ковариантная производная от вектора
есть:
Обратим внимание на то, что в тензоре кривизны изменен порядок индексов, поэтому и знак перед тензором поменялся. Первый член равен нулюб в силу уравнения геодезической линии (см. (6.17)). Поэтому окончательно вторая ковариантная производная от вектора равна: (8.11)
Умножая
это
уравнение
на
величину
-
расстояние
между
геодезическими получаем уравнение для вектора, который соединяет две пробные
частиц,
которые
свободно
движутся
по
двум
близким
геодезическим линиям. Это уравнение называется уравнение девиации близких геодезических линий.
9. Уравнения гравитационного поля •
9.1 Создание уравнений общей теории относительности o
•
9.1.1 Может ли скалярное поле описывать гравитацию?
9.2 Вывод уравнений поля из вариационного принципа o
9.2.1 Действие для гравитационного поля
o
9.2.2 Производная Эйлера - Лагранжа от действия и уравнения гравитационного поля в вакууме
o
9.2.3
Вывод
уравнений
гравитационного
Паллатини •
9.3 Источник гравитационного поля
поля
методом
Уравнение гравитационного поля в ньютоновской механике хорошо известно. Гравитационная сила, действующая со стороны точечной массы на пробную частицу массы
, расположенную на расстоянии
от этого
тела, представляется как:
Гравитационную силу от произвольного распределения масс можно получить взяв интеграл по плотности. Однако, чаще в теоретической , с помощью
физике вводят понятие гравитационного потенциала
которого уже вычисляют гравитационную силу действующую на пробную частицу:
Гравитационный потенциал создается распределением масс и уравнение для потенциала имеет вид уравнения типа скалярного поля. В отличие от современных
уравнений
гравитационного
поля
скалярного не
являются
поля,
уравнения
релятивистски
ньютоновского инвариантными,
поскольку гравитационная теория Ньютона существенно нерелятивистская теория. Поэтому уравнения поля есть уравнение типа Пуассона: (9.1)
Естественно, что ньютоновские уравнения гравитационного поля не могли быть согласованы с принципами релятивистской физики. Потребовалось создание новой теории гравитации - общей теории относительности.
9.1
Создание
относительности
уравнений
общей
теории
После создания специальной теории относительности А.Эйнштейн начал разработку идей связанных с распространением принципа относительности на ускоренные системы отсчета. Достаточно скоро стало понятно, что невозможно распространение принципа относительности на ускоренные системы отсчета без обсуждения гравитационного поля. Первая статья [15] относится лишь к однородноускоренным системам координат. Однако уже там появляется идея - отождествление ускорения и однородного
гравитационного
поля.
Эта
идея
оказалась
очень
плодотворной и решающей для обобщения принципа относительности создания общей теории относительности, которая включает в себя теорию релятивистского гравитационного поля. Там же (параграф 19 этой статьи) А.Эйнштейн
получает
связь
между
темпом
течения
времени
в
гравитационном поле с различным потенциалом:
В
следущем
параграфе
А.Эйнштейн
делает
вывод
о
том,
что
гравитационное поле надо, по - видимому, характеризовать переменной скоростью света:
Следущую
важную
работу,
посвященную
гравитации,
А.Эйнштейн
опубликовал только в 1912 г [16]. В ней он полемизирует с Абрагамом, который построил свою теорию гравитации и строит теорию гравитации для случая статического гравитационного поля. В этой статье все еще эксплуатируется идея переменности скорости света. А.Эйнштейн ищет уравнение для случая статического гравитационного поля, при этом руководствуется уравнением нерелятивистского гравитационного поля. Он приходит к выводу, что уравнение должно быть однородно по скорости света и приводит его в виде:
В следущей статье, опубликованной в том же 1912 году А.Эйнштейн учитывает вклад энергии самого гравитационного поля в гравитационное поле и впервые получает нелинейное уравнение вида:
Уравнения гравитационного поля становятся нелинейными. В следущем 1913 г. А.Эйнштейн в совместной статье с М.Гроссманом [17] ясно формулирует связь гравитационного поля с метрическим тензором . Таким образом тензор второго ранга становится величиной, которая описывает гравитационное поле. В этой же статье окончательно появляется идея тождественности искривленного пространства - времени и гравитации, появляется тензор кривизны и другие величины свойственные для неэвклидовой геометрии. Там же делается попытка вывести релятивистские уравнения гравитационного поля. Окончательно релятивистские уравнения гравитационного поля были выведены в 1916 г. В статье, опубликованной в "Анналах физики" [18], А.Эйнштейн сформулировал общую теорию относительности, придал окончательный вид уравнениям гравитационного поля, которыми мы пользуемся по сей день (а также ввел знаменитое правило суммирования по повторяющимся индексам). Весьма скоро после начала работы над общей теорией относительности, А.Эйнштейн понял значение гамильтонова подхода для вывода уравнений поля.
Этот
подход
оказался
очень
плодотворным
в
современной
теоретической физике. Он связан с понятием экстремума действия и принципом наименьшего действия. Именно таким образом мы и будем выводить уравнения гравитационного поля.
9.1.1
Может
ли
скалярное
поле
описывать
гравитацию? Уравнение (9.1) является существенно нерелятивистским урапвнением. Это легко показать. Решением уравнения (9.1) является интеграл:
любые изменения в источнике (
зависит от времени) могут быть
мгновенно обнаружены (здесь мы опускаем проблемы связанные с обнаружением сигнала) в тот же момент времени и на любом расстоянии от источника. Это прямо противоречит постулату о невозможности передачи информации со скоростью превышающей скорость света. Изменить это уравнение на релятивистское крайне просто. Необходимо добавить вторую производную по времени, превратив уравнение Пуассона в уравнение д'Аламбера: (9.2)
Слева в уравнении теперь стоит релятивистски инвариантный оператор, который обеспечивает релятивистскую инвариантность. Справа должен стоять источник поля (плотность), обладающий такими же свойствами как и поле. Если поле описывается скалярной величиной, то и источник поля также должен быть скалярной величиной. Если гравитационное поле описывается тензором ранга
, то и источник должен быть тензором ранга
. Поскольку одноименные заряды в гравитации притягиваются ( в отличие от электромагнитной теории, в которой одноименные заряды отталкиваются ), то гравитационное поле должно описываться тензором четного ранга скалярным полем, полем тензора второго ранга и т.п. 9.1
Поэтому при релятивистском обобщении ньютоновской теории гравитации, определяемой
уравнением
(9.2),
необходимо
свойства источника поля. Величина
тензорные
может быть нерелятивистским
пределом либо тензора энергии - импульса - следа этого тензора
определить
, либо скалярной величины
. В первом случае гравитационное поле
представляется тензором второго ранга, во втором случае - тензором первого
ранга.
Эксперимент
показывает,
что
справедлива
теория
гравитации с полем второго ранга в качестве полевой переменной.
9.2 Вывод уравнений поля из вариационного принципа 9.2.1 Действие для гравитационного поля Итак мы должны найти связь между метрическим тензором
и
распределением масс, которая заменит уравнение (9.1) классической ньютоновской
теории
тяготения.
Рассмотрим
вывод
уравнений
гравитационного поля в общей теории относительности ( уравнений Эйнштейна ) используя принцип наименьшего действия. Уравнения гравитационного поля получатся вариацией действия по метрическому тензору - полевой переменной. Это действие, как и для полей другого вида должно быть представлено в виде некоторого скаляра, который является интегралом по 4
пространству от некоторой скалярной плотности,
зависящей от метрического тензора и первых производных метрического тензора. Такой скалярной плотностью является только величина:
образуемая из скаляра кривизны. Действие
гравитационного поля
можно, следовательно, представить в виде: (9.3)
Здесь
-некоторая новая гравитационная постоянная. Определить ее
связь с кавендишевой гравитационной постоянной с точностью до безразмерного постоянного множителя достаточно просто - действие имеет размерность энергии, скаляр кривизны имеет размерность см
, а объем
при интегрировании см . Отсюда из соображений размерности находим,
что
, где
- гравитационная постоянная Кавендиша.
Скалярная кривизна наряду с метрическим тензором и его первыми производными содержит также и вторые производные от метрического производную Эйлера - Лагранжа можно
тензора. Применяя к
получить уравнеия гравитационного поля. Прямые вычисления очень трудоемкие и содержат большое количество выкладок. Мы несколько упростим вычисления, для чего воспользуемся двумя свойствами скаляра кривизны. Первый прием при выводе уравнений гравитационного поля впервые применили [8]. Он основан на том, что в скалярной кривизне вторые производные
метрического
тензора
входят
линейно,
что
позволяет
выделить полную дивергенцию, которая не влияет на уравнения движения. Поэтому действие
можно представить в виде:
Слева стоит скалярная величина9.2. Справа стоят два неинвариантных члена.
Хотя
их
сумма
является
инвариантом,
каждый
из
членов
неинвариантен. Для вывода уравнений поля нарушение инвариантности не страшно, поскольку при выводе используются вариации этих величин. Напомним, что вариации многих неинвариантных величин являются уже инвариантными, пример, символ Кристоффеля не являются тензором, в то время как вариации символа уже являются тензором третьего ранга. Кроме того, полную дивергенцию по теореме Остраградского можно преобразовать
в
интеграл
по
трехмерной
гиперповерхности.
При
вычислении вариаций этот член будет равен нулю, так как по определению вариации на гиперповерхности, охватывающей объем равны нулю. Поэтому вариация гравитационного действия равна:
Найдем величину
, которая определяет действие гравитационного поля и
вычислим ее вариацию относительно метрического тензора. Скалярная плотность кривизны выражается через метрический тензор и символы Кристоффеля как:
Находим величины
и
Производная Эйлера - Лагранжа величины
определяет уравнения
гравитационного поля.
9.2.2 Производная Эйлера - Лагранжа от действия и уравнения гравитационного поля в вакууме Производная Эйлера - Лагранжа от величины
Как видно из определения,
определяется как:
зависит от самого метрического тензора
и символов Кристоффеля. Вычислим частные производные от по метрическому тензору
и
.
Для вычисления частных производных от контравариантного метрического тензора
по ковариантному метрическому тензору
воспользуемся
равенством вида:
беря частную производную по ковариантному метрическому тензору по частям получаем уравнение вида:
в этом уравнении достаточно трудно усмотреть симметрию по паре индексов
и
. Для того, чтобы сделать эту симметрию явной,
образуем симметричную сумму в правой части этого равенства, тогда частная производная будет равна:
Для вычисления частной производной от корня из детерминанта воспользуемся равенством:
тогда получаем
по ковариантному
Частные производные от плотности действия метрическому тензору
формируются только из частных производных от
контраваиантных компонент метрического тензора символы Кристоффеля и в определитель
, которые входят в
. Производные от символа
Кристоффеля есть:
Выпишем теперь частную производную от плотности гравитационного действия
по метрическому тензору:
Несмотря на громоздкий вид структура этой формулы достаточна простая. Более
сложной
является
структура
частной
производной
от
гравитационного действия по производной от метрического тензора. Рассмотрим теперь ее. Рассмотрим как происходит дифференцирование функции производной метрического тензора, скажем,
по
. Поскольку производные
от метрического тензора по координатам содержатся только в символах Кристоффеля
, то и частная производная будет действовать только на
эти члены. Только для этих вычислений будем использовать латинские индексы в обозначениях метрического тензора. Только в этом параграфе будем считать, что они пробегают значения 0, 1, 2, 3. Выпишем частную производную от символов Кристоффеля по нашей динамической переменной - частной производной от метрического тензора по одной из координат:
Подставим эту формулу в выражение для частной производной от плотности гравитационного действия по нашей динамической переменной частной производной от метрического тензора по одной из координат
получим некоторое громоздкое выражение. Не выписывая его здесь целиком, свернем по мертвым индексам суммирования, что значительно упростит запись:
В этом уравнении введен новый тензор четвертого ранга
В производную Эйлера - Лагранжа член вида
входит не самостоятельно, в от него вычисляется частная производная по координате,
которая
стоит
в
динамической
переменной
-
частной
производной от метрического тензора по координате
После вычисления частных производных по координате
появляются
производные от символов Кристоффеля по координатам:
Частные производные от символов Кристоффеля входят в тензор кривизны. Этот тензор имеет ранг 4. Но производные, которые появлись в приведенной выше формуле входят в тензор Риччи. Запишем эту формулу через тензор Риччи
.
Выражая частные производные от символов Кристоффеля через тензор Риччи получим член в левой части равенства вида:
Выражая тензор
в виде произведений метрического тензора и
свертывая по индексам суммирования получаем член вида:
Оставшиеся
четыре
члена
представляют
произведения
символов
Кристоффеля, окончательно выпишем производную от гравитационного действия в виде:
Выпишем окончательно производную Эйлера - Лагранжа от плотности гравитационного действия:
Для упрощения дальнейших выкладок выберем систему координат, в которой удовлетворяется условие
во всем пространстве -
времени. Поскольку это только одно условие, то его можно удовлетворить подходящим выбором системы координат всегда. Доказательство этого утверждения не входит в наш курс. Следствием этого выбора является уравнение:
справедливое для любого значения индекса
. Тогда первый член в этом
уравнении обращается в нуль. Подставим уравнение для производной Эйлера - Лагранжа в вариацию действия:
Свертка второго и третьего членов с вариацией метрического тензора дает нуль, поскольку это сумма второго и третьего членов антисимметрична по индексам
. В результате вариация гравитационного действия по
метрическому тензору равна:
Заметим, что знак минус в последнем равенстве появляется, поскольку вариации
контравариантных
компонент
метрического
тензора
противоположна вариациям ковариантных компонент:
Из вариации действия гравитационного поля сразу можно получить релятивистские уравнения поля в пустом пространстве: (9.4)
Это уравнение эквивалентно уравнению:
в ньютоновской теории гравитационного поля. Вариация гравитационного действия вычислена в определенной системе координат, которая удовлетворяет условию
. Однако, уравнения
гравитационного поля получены в общековариантном виде, который справедлив независимо от выбора системы координат. Для вывода релятивистских уравнений, которые связывают гравитационное поле и распределение материи необходимо найти величину, которая получается при вариации плотности действия от материи по метрическому тензору.
9.2.3 Вывод уравнений гравитационного поля методом Паллатини Прежде чем перейти в выводу уравнений общей теории относительности, которые связывают распределение гравитационного поля (метрического тензора) с распределением материи приведем еще один вывод вариации действия гравитационного поля, который является общековариантным и не требует привлечения специальной системы координат. При этом, вывод уравнений
релятивистской
гравитации
методом
Паллатини
является
экономным с точки зрения выкладок. Уже в предыдущем параграфе читатель мог обратить внимание на то, что вывод
уравнений
гравитационного
поля
был
отягощен
многими
предположениями, в частности о выборе специальной системы координат. Это - необходимое следствие общей ковариантности теории. Если в теории, например, электромагнитного поля, вычисление амплитуд потенциала и их производных по времени и координатам достаточно, чтобы полностью определить эволюцию поля, то в общей теории относительности изменить значения метрического тензора и его производных можно с помощью координатного
преобразования.
Координатное
преобразование
метрического тензора не несет никакой физической нагрузки, оно целиком зависит от соображений удобства вычислений. Поэтому необходимо выделить ту часть в метрическом тензоре, которая обуславливает динамическую эволюцию. Эта проблема возникла потому, что в метрическим тензоре содержатся дополнительные степени свободы для того, чтобы обеспечить правильное поведение
его
компонент
при
координатных
преобразованиях.
Дополнительные степени свободы подчиняются некоторым связям, которые необходимо учитывать при выводе уравнений поля. В современной теории поля разработан метод, который позволяет отделить динамическую часть от части не несущей физической информации [20].
Этот формализм в современной теории поля называется каноническим. У него есть два существенных свойства. Первое заключается в том, что уравнения поля имеют первый порядок относительно производных по времени. Второе свойство заключается в явнов выделении времени в лоренц - инвариантной теории (так называемое 3+1 расщепление). В классической механике этот формализм совпадает с формализмом Гамильтона. Для получения этого формализма в общей теории относительности необходимо записать плотность действия в линейном относительно первых производных виде (этот вид называется записью в форме Паллатини). Обычный интеграл действия:
дает
уравнения
общей
метрического тензора
теории
относительности
при
варьировании
. Получившиеся уравнения Эйлера являются
дифференциальными уравнениями в частных производных второго порядка относительно метрического тензора. Однако, те же уравнения можно привести к каноническому гамильтонову виду:
Для этого представим плотность лагранжиана гравитационного поля в форме Палатини, при этом символы Кристоффеля рассматриваются как независимые переменные: (9.5)
где
Здесь следует отметить, что ковариантные компоненты тензора Риччи не содержат метрического тензора, а содержат только бинарные произведения символов Кристоффеля и их производных по координатам. Варьируя (9.5) по метрическому тензору получаем уравнения Эйнштейна: (9.6)
Дополнительно к этим уравнениям получаем уравнения связи, которые устанавливают соотношения между независимыми величинами
решая эти уравнения относительно величин
и
:
получаем обычную
зависимость между символами Кристоффеля и метрическим тензором:
9.3 Источник гравитационного поля В
предыдущем
параграфе
получены
уравнения
общей
теории
относительности в вакууме. Полные уравнения должны содержать также влияние материи на гравитационное поле. Они должны содержать источник гравитационного поля. Полное действие для системы гравитационное поле + материя представляет из себя сумму двух членов: действия для гравитационного поля
и действие для материи
. Полные уравнения
поля получаются как сумма вариаций действия для поля и действия для материи:
Вариации производятся по метрическому тензору, а сами уравнения получаются из приравниванием к нулю первых производных Эйлера Лагранжа от действия по метрическому тензору: (9.7)
Вариация от действия гравитационного поля по метрическому тензору есть (9.6):
Вариации от
по метрическому тензору называются тензором энергии -
импульса: (9.8)
Окончательно,
уравнения
гравитационного
поля
в
общей
теории
относительности имеют вид: (9.9)
Здесь постоянную слабых
полей
и
определяют из того условия, чтобы в пределе медленных
движений
уравнения
общей
теории
относительности совпадали с уравнениями Ньютона для гравитационного поля.
Приведем несколько примеров тензора энергии - импульса. Тензор энергии - импульса свободной частицы есть: (9.10)
Тензор энергии - импульса идеальной жидкости есть: (9.11)
Здесь
- плотность частицы в первом примере и плотность жидкости во
втором примере,
- давление в жидкости во втором примере.
Рекомендуемая и цитируемая литература 1 Справочное руководство по небесной механике и астродинамике. под ред. Г.Н.Дубошина, М.: Наука, 1976. 2 А.Лайтман, В.Пресс, Р.Прайс, С.Тюкольски. Сборник задач по теории относительности и гравитации. М.: Мир, 1979. 3 Hafele J.C., Keating R.E., Around - the world atomic clocks: Predicted relativistic time gains, Science, v.177, p.166, 1972; Hafele J.C., Keating R.E., Around - the world atomic clocks: Observed relativistic time gains, Science, v.177, p.168, 1972. 4 Briatore L., Leschiutta S., Evidence for the Earth gravitational shift by direct time - scale comparison, Il Nuovo Cimento, v. B37, p.219, 1979. 5 Iijima S., Fujiwara K., An experiment for the potential blueshift at the Norikura Corona Station. Annals of the Tokyo Astronomical Obsrvatory. Srcond Series. v.XVII, N 2, p.68, 1978. 6 Vessot R.F.C., Levine M.W., A test of the equivalence principle using space born clock. General relativity and Gravitation. v.10, p.181, 1979. 7 А.Эйнштейн. Физика и реальность. М.: Наука, 1965. 8 Л.Д.Ландау, Е.М.Лифшиц. Теория поля. М.: Наука, 1988.
9 Я.А.Схоутен. Тензорный анализ для физиков. М.: Наука, 1965. 10 Wald R.M. General Relativity. The University of Chicago Press. 1984. 11 С.М. Рытов, Ю.А. Кравцов, В.И. Татарский. Введение в статистическую радиофизику. часть II, Случайные поля. М.: Наука, 1978. 12 С.Вейнберг. Гравитация и космология, М.: Мир, 1975. 13
Эльсгольц
Л.С.
Дифференциальные
уравнения
и
вариационное
исчисление. М.: Наука, 1969. 14 Гельфанд И.М. Лекции по вариационному исчислению. М. Физматгиз, 1956. 15 А.Эйнштейн. Собрание научных трудов. т.I, стр. 65, статья 8, М.: Наука, 1965. 16 А.Эйнштейн. Собрание научных трудов. т.I, стр. 189, статья 17, М.: Наука, 1965. 17 А.Эйнштейн. Собрание научных трудов. т.I, стр. 227, статья 21, М.: Наука, 1965. 18 А.Эйнштейн. Собрание научных трудов. т.I, стр. 448, статья 37, М.: Наука, 1965. 20 Швингер Ю. Теория квантованных полей. М., 1956.