Allgemeine Relativit¨atstheorie Petr Hajicek M¨arz 2003
2
Einfu ¨ hrung Die Allgemeine Relativit¨atstheorie (ART) wu...
340 downloads
830 Views
1MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Allgemeine Relativit¨atstheorie Petr Hajicek M¨arz 2003
2
Einfu ¨ hrung Die Allgemeine Relativit¨atstheorie (ART) wurde am Anfang voriges Jahrhunderts von einem einzigen Mann in einem bewunderungswerten Alleingang geschaffen. Die Aufgabe war, die Newtonsche Theorie der Gravitation und die Spezielle Relativit¨atstheorie zu “verheiraten”. Die ersten Versuche waren etwa darauf ausgerichtet, das Gravitationspotential als ein Feld in der Minkowskischen Raumzeit zu betrachten. Nichts aber wollte gelingen; es dauerte etwa 10 Jahre, bis Einstein endlich das Problem l¨oste. Die Schwierigkeit war, dass dabei sowohl die alte Gravitationstheorie, als auch die junge Spezielle Relativit¨atstheorie modifiziert werden mussten. Die n¨achsten 50 Jahre waren schwierig f¨ ur die Theorie, da ihre experimentelle Basis recht d¨ unn blieb und ihre schwierige mathematische Struktur nicht gut verstanden wurde. In den letzten 40 Jahren bl¨ uhte aber die Theorie auf. Mit der Verbesserung der Technik und dem grossen Fortschritt in den astronomischen Beobachtungsmethoden erweiterte sich der Kreis der beobachtbaren Fakten, zu welchen die ART anwendbar ist, so dass sie heute eine der bestens experimentell unterst¨ utzten Theorien ist und viele konkurierende Theorien widerlegt wurden. Auch die konzeptuellen und mathematischen Grundlagen werden viel besser verstanden. Heute dient die ART als Basis der modernen Astrophysik und der Raumforschung, deren faszinierende Resultate auch immer mehr Leute interessieren. Die ART ist eine sehr fruchtbare Theorie; sie hat mehrere neue, u ¨berraschende Effekte vorhergesagt. Die bekanntesten Beispiele sind: Die dynamische Kosmologie Die L¨osungen der Einstein-Gleichungen, welche die Kosmologie beschreiben, sind nicht statisch. Die ersten sind von Friedmann gefunden worden, und sie alle beginnen in einem singul¨aren Punkt, wo alle Materie zusammengedr¨angt wird: in dem sog. Big Bang. Das heisst: unser Weltall is ein Ueberrest einer riesigen Explosion. Die Big Bang Kosmologie is heute eine erfolgreiche Theorie. Die Gravitationsstrahlung In der Newton-Theorie berechnet man das Gravitationspotential Φ(t, r), zur Zeit t aus der Massendichte ρ(t, r) zur gleichen Zeit mittels i
der Poisson-Gleichung: ∆Φ = 4πGρ. Eine Aenderung der Quelle ρ ¨aussert sich also augenblicklich in der Form des Gravitationspotentials u ¨ berall l¨angs der Gleichzeitigkeitsebene. Das Feld ist aber messbar; die Information u ¨ ber die Bewegung der Quelle breitet sich also unendlich schnell im Gravitationsfeld aus. In einer relativistischen Theorie kommt h¨ochstens die Lichtgeschwindigkeit f¨ ur eine Signalausbreitung in Frage. Diese gravitativen Signale, welche Energie und Information mit einer endlichen Geschwindigkeit tragen, heissen Gravitationswellen. Die Existenz einer solchen Strahlung ist eine starke Modifikation der Newton-Theorie. Die schwarzen L¨ ocher Betrachten wir eine Quelle mit Masse M und Gravitationspotential Φ(r) = −GM r −1 . Auf ein Probeteilchen mit Masse m wirkt in diesem Feld eine Anziehungskraft, welche Arbeit verrichten kann. Wenn wir das Teilchen von r = ∞ bis zur Distanz r von der Quelle heranbringen, kann im Prinzip die Arbeit A(r) = mΦ(∞) − mΦ(r) = −mΦ(r) = GM mr −1 geleistet werden. Die dazu notwendige Energie kann nicht vom Gravitationsfeld der Quelle kommen: im Unterschied zum analogen Versuch in der Elektrodynamik wird das Addieren des Teilchens zur Quelle deren Feld verst¨arken. Die “Ladungen” sind beide positiv im Gravitationsfall, hingegen ist die eine positiv und die andere negativ im elektrischen Fall. Die Arbeit muss also von der Ruheenergie des Teilchens stammen. Aus der Erhaltung der Energie folgt dann aber, dass GM mr −1 ≤ mc2 . Das ergibt die Existenz eines minimalen Radius, RG : RG =
G M, c2
(1)
so, dass man entweder aus einer gr¨osseren Tiefe als RG keine Energie mehr sch¨opfen, oder dass keine Quelle unter den Radius RG konzentriert sein kann. RG heisst Gravitationsradius der Masse M . Warum man etwa von unterhalb des Gravitationsradius keine Energie herausholen kann, zeigt eine andere Absch¨atzung. Berechnen wir die Entfernung von unserer kugelsymmetrischen Quelle, wo die Fluchtgeschwindigkeit den Wert v hat. Die Fluchtgeschwindigkeit ist bekanntlich die Geschwindigkeit der kreisf¨ormigen Bahn am gegebenen Radius. Diese Bahn erf¨ ullt die Gleichung: mv 2 Mm . G 2 = r r ii
(Gravitative Zentripetalkraft = Zentrifugalkraft). Dann gilt f¨ ur die gesuchte Entfernung r G r = 2 M, v und f¨ ur v = c haben wir r = RG . Kein energie- oder informationstragendes Signal kann also von unterhalb des Gravitationsradius zu uns vordringen. Die Objekte, deren Ausmasse mit deren Gravitationsradius vergleichbar sind, heissen schwarze L¨ocher. Bei der Existenz von schwarzen L¨ochern handelt sich es klar um eine Modifikation der Speziellen Relativit¨atstheorie. Die Existenz der Gravitationsstrahlung und der schwarzen L¨ocher ist heute relativ gut durch indirekte Beobachtungen belegt worden. Die ART steht auf zwei Beinen: Eines ist die geometrische Deutung der Gravitation, das andere die Einstein-Gleichungen. Der erste Teil des Skriptums versucht, die geometrische Deutung klar zu machen und die schwierige konzeptuelle Struktur aufzukl¨aren. Der zweite Teil enth¨alt dann die wichtigsten Anwendungen: Kosmologie, Gravitationskollaps und und schwarze L¨ocher. Die Gravitationsstrahlung ist konzeptuell wichtig aber sehr schwach in Wirkung; sie ist nicht einmal direkt beobachtet worden. W¨ahrend der vielen Jahre, in denen dieses Skript entstanden ist, haben mir einige Studenten geholfen sowohl durch ihre Fragen bei den Vorlesungen, als auch mit Formulationen und Grammatik der Deutschen Sprache. Zu erw¨ahnen sind insbesondere Martin Sch¨on, Matthias Z¨ urcher und Matthias Peter Burkhardt.
iii
Inhaltsverzeichnis I
Die Geometrische Deutung der Gravitation
1 Geometrisierung der Dynamik 1.1 Ausgew¨ahlte Tatsachen . . . . . . . . . . . . . . . . . 1.1.1 Cavendish Experiment . . . . . . . . . . . . . 1.1.2 E¨otv¨os Experiment . . . . . . . . . . . . . . . 1.1.3 Ablenkung des Lichtes . . . . . . . . . . . . . 1.1.4 Rotverschiebung . . . . . . . . . . . . . . . . 1.2 Das Aequivalenzprinzip . . . . . . . . . . . . . . . . . 1.3 Newton-Galilei-Raumzeit . . . . . . . . . . . . . . . . 1.4 Die kr¨aftefreien Bewegungen . . . . . . . . . . . . . . 1.5 Ein Affiner Zusammenhang . . . . . . . . . . . . . . 1.5.1 Krummlinige Koordinaten . . . . . . . . . . . 1.5.2 Kurven und Tangentvektoren . . . . . . . . . 1.5.3 Affiner Zusammenhang einer Mannigfaltigkeit 1.5.4 Der metrische AZ . . . . . . . . . . . . . . . . 1.6 Cartan-Friedrichs-Raumzeit . . . . . . . . . . . . . . 1.7 Kr¨ ummungstensor . . . . . . . . . . . . . . . . . . . 1.8 Das Aequivalenzprinzip . . . . . . . . . . . . . . . . . 1.8.1 Galilei-Aequivalenzprinzip . . . . . . . . . . . 1.8.2 Geod¨atische Systeme . . . . . . . . . . . . . . 1.8.3 Lokale Inertialsysteme . . . . . . . . . . . . . 1.8.4 Formulierung des Prinzips . . . . . . . . . . . 1.9 Paralleltransport . . . . . . . . . . . . . . . . . . . . 1.10 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . .
2 Relativistische Teilchendynamik im Gravitationsfeld 2.1 Relativistische Gravitationstheorie . . . . . . . . . . . . 2.2 Geometrie der Minkowski-Raumzeit . . . . . . . . . . . 2.3 Teilchendynamik in der ART . . . . . . . . . . . . . . . 2.4 Lokale Messungen . . . . . . . . . . . . . . . . . . . . . iv
ix . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . . . . . . . . . . . . . . . .
1 1 1 2 3 3 3 5 6 8 8 10 11 14 23 26 28 28 29 30 31 32 35
. . . .
41 41 41 46 52
2.4.1 Allgemeines Bezugsystem . . . . . . . . 2.4.2 Eigenzeit . . . . . . . . . . . . . . . . . . 2.4.3 Radarmessung . . . . . . . . . . . . . . . 2.4.4 Gleichzeitigkeit . . . . . . . . . . . . . . 2.4.5 Abst¨ande . . . . . . . . . . . . . . . . . 2.4.6 Spektra und Richtungen . . . . . . . . . 2.5 Statische Raumzeiten . . . . . . . . . . . . . . . 2.5.1 3-Raum . . . . . . . . . . . . . . . . . . 2.5.2 Freie F¨alle . . . . . . . . . . . . . . . . . 2.5.3 Gravitationsbeschleunigung . . . . . . . 2.5.4 Rotverschiebung . . . . . . . . . . . . . 2.5.5 Verlangsamung des Uhrganges in starkem Gravitationsfeld . . . . . . . 2.6 Isometrie (Mathematisches Intermezzo) . . . . . 2.6.1 Rotation in E2 . . . . . . . . . . . . . . 2.6.2 Diffeomorphismus . . . . . . . . . . . . . 2.6.3 Lie-Ableitung . . . . . . . . . . . . . . . 2.6.4 Killing-Vektorfeld . . . . . . . . . . . . . 2.7 Rotationssymmetrische Raumzeiten . . . . . . . 2.7.1 Rotationsfl¨achen . . . . . . . . . . . . . 2.7.2 Raumzeiten . . . . . . . . . . . . . . . . 2.7.3 Geod¨atische Gleichung im statischen Fall 2.8 Asymptotisch flache Raumzeiten . . . . . . . . . 2.8.1 Eddington-Robertson-Entwicklung . . . 2.8.2 Energie- und Impulsbilanz . . . . . . . . 2.9 Bewegung der Planeten . . . . . . . . . . . . . . 2.9.1 Vergleich mit der Newton-Theorie . . . . 2.9.2 Drehung des Perihels . . . . . . . . . . . 2.10 Lichtsignale im Sonnensystem . . . . . . . . . . 2.10.1 Ablenkung des Lichtes . . . . . . . . . . 2.10.2 Verz¨ogerung der Radarsignale . . . . . . 2.11 Aufgaben . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
53 54 54 55 56 57 58 59 60 60 62
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
63 66 66 67 68 71 73 73 74 77 78 78 79 83 83 85 88 88 90 91
. . . . . .
96 96 97 99 100 103 103
3 Dynamik der Felder 3.1 Beispiel: Elektrodynamik . . . . . . . . . . . . . . . . 3.1.1 Aequivalenzprinzip . . . . . . . . . . . . . . . 3.1.2 Maxwell-Gleichungen . . . . . . . . . . . . . . 3.1.3 Energie-Impuls-Tensor . . . . . . . . . . . . . 3.2 Variationsprinzip . . . . . . . . . . . . . . . . . . . . 3.2.1 Transformationseigenschaften der Tensorfelder v
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
3.3
3.4
3.5
3.6
3.7
3.2.2 Dynamik der Felder . . . . . . . . . . . . . . . . . . . . . 3.2.3 Die Wirkung . . . . . . . . . . . . . . . . . . . . . . . . 3.2.4 Variationsformel . . . . . . . . . . . . . . . . . . . . . . 3.2.5 Feldgleichungen der Materie . . . . . . . . . . . . . . . . Kovariante Ableitung . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Definition der kovarianten Ableitung . . . . . . . . . . . 3.3.2 Direkter Ausdruck f¨ ur die kovariante Ableitung . . . . . 3.3.3 Algebraische Eigenschaften . . . . . . . . . . . . . . . . . 3.3.4 Metrischer Affinzusammenhang . . . . . . . . . . . . . . Paralleltransport und die kovariante Ableitung . . . . . . . . . . 3.4.1 Generatoren der Tensoralgebra . . . . . . . . . . . . . . 3.4.2 Komponenten eines Affinzusammenhanges in Bezug auf beliebiges Basenfeld . . . . . . . . . . . . . . . . . . . . . 3.4.3 Kovariante Ableitung der Tensorfelder . . . . . . . . . . Energie-Impuls-Tensor . . . . . . . . . . . . . . . . . . . . . . . 3.5.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5.2 Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . 3.5.3 Bedeutung der Divergenzgleichung . . . . . . . . . . . . 3.5.4 Ideale Fl¨ ussigkeit . . . . . . . . . . . . . . . . . . . . . . Dynamik der Gravitation . . . . . . . . . . . . . . . . . . . . . . 3.6.1 Die Wirkung f¨ ur die Metrik . . . . . . . . . . . . . . . . 3.6.2 Die Einstein-Gleichungen . . . . . . . . . . . . . . . . . . 3.6.3 Allgemeine Kovarianz der Einstein-Gleichungen . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . ein . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
104 107 109 111 112 113 114 116 118 121 121
. . . . . . . . . . . .
126 127 129 129 131 133 135 137 138 140 147 150
II Kosmologie, Gravitationskollaps und schwarze L¨ ocher 154 4 Kosmologische Modelle 4.1 Homogene isotrope 3-R¨aume . . . . . . 4.1.1 Kosmologisches Prinzip . . . . . 4.1.2 Der Euklidische Raum . . . . . 4.1.3 Die Kugeloberfl¨ache S 3 . . . . . 4.1.4 Die Pseudokugel P 3 . . . . . . 4.2 Robertson-Walker-Raumzeiten . . . . . 4.2.1 Metrik . . . . . . . . . . . . . . 4.2.2 Bevorzugtes Bezugsystem . . . 4.2.3 Kosmologische Rotverschiebung 4.2.4 Kosmologische Horizonte . . . . vi
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
155 . 155 . 155 . 156 . 157 . 158 . 159 . 159 . 159 . 161 . 163
4.3
4.4
4.5
4.6
4.7
4.2.5 Einstein-Tensor der Robertson-Walker-Raumzeit Kosmische Dynamik . . . . . . . . . . . . . . . . . . . 4.3.1 Friedmann-Lemaˆıtre-Gleichungen . . . . . . . . 4.3.2 Die kosmische Beschleunigung . . . . . . . . . . 4.3.3 Einfache Zustandsgleichungen . . . . . . . . . . Die Staubmodelle . . . . . . . . . . . . . . . . . . . . . 4.4.1 Die Skalenklassen . . . . . . . . . . . . . . . . . 4.4.2 Qualitative Diskussion der Dynamik . . . . . . 4.4.3 Die relativen Dichten . . . . . . . . . . . . . . . 4.4.4 Das Ω-Diagramm . . . . . . . . . . . . . . . . . 4.4.5 Die Helligkeitsdistanz und die Messungen von Λ 4.4.6 Die Friedmann-Modelle . . . . . . . . . . . . . . Raumzeiten mit h¨ochster Symmetrie . . . . . . . . . . 4.5.1 Minkowski-Raumzeit . . . . . . . . . . . . . . . 4.5.2 DeSitter-Raumzeit . . . . . . . . . . . . . . . . 4.5.3 Anti-DeSitter-Raumzeit . . . . . . . . . . . . . Das fr¨ uhe Welttall . . . . . . . . . . . . . . . . . . . . 4.6.1 Horizontproblem . . . . . . . . . . . . . . . . . 4.6.2 Flachheitsproblem . . . . . . . . . . . . . . . . 4.6.3 Entropieproblem . . . . . . . . . . . . . . . . . 4.6.4 Inflationstheorie . . . . . . . . . . . . . . . . . . 4.6.5 Quantenkosmologie . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . .
5 Rotationssymmetrische Sternmodelle 5.1 Hydrostatisches Gleichgewicht nichtrotierender Sterne . . . . . . . . . . . . . . . . . . 5.1.1 Gleichungen des hydrostatischen Gleichgewichts 5.1.2 Bedingungen im Zentrum . . . . . . . . . . . . 5.1.3 Bedingungen an der Oberfl¨ache . . . . . . . . . 5.1.4 Die Metrik ausserhalb des Sternes . . . . . . . . 5.1.5 Vergleich mit der Newton-Theorie . . . . . . . . 5.1.6 Massenlimite . . . . . . . . . . . . . . . . . . . 5.1.7 Verbindungsbedingungen . . . . . . . . . . . . . 5.2 Eigenschaften der Schwarzschild-L¨osung . . . . . . . . 5.2.1 Birkhoff-Satz . . . . . . . . . . . . . . . . . . . 5.2.2 Radiale Lichtstrahlen . . . . . . . . . . . . . . . 5.2.3 Eddington-Finkelstein-Koordinaten . . . . . . . 5.2.4 Horizont . . . . . . . . . . . . . . . . . . . . . . 5.3 Oppenheimer-Snyder-Kollapsmodell . . . . . . . . . . . vii
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
165 165 165 166 168 170 170 173 176 177 181 185 186 186 187 193 195 196 196 197 198 200 200 203
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
203 203 205 206 206 208 209 211 212 212 213 214 215 218
5.4
5.3.1 Innen . . . . . . . . . . . . 5.3.2 Aussen . . . . . . . . . . . . 5.3.3 Oberfl¨ache . . . . . . . . . . 5.3.4 Radiale lichtartige Geod¨aten Aufgaben . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
218 219 219 222 227
6 Station¨ are schwarze L¨ ocher 229 6.1 Kausale Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 6.1.1 Zeitorientierung . . . . . . . . . . . . . . . . . . . . . . . . . . 230 6.1.2 Kausaler Einfluss . . . . . . . . . . . . . . . . . . . . . . . . . 231 6.2 Hyperfl¨achen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 6.2.1 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232 6.2.2 Tangentialvektoren . . . . . . . . . . . . . . . . . . . . . . . . 233 6.2.3 Induzierte Metrik . . . . . . . . . . . . . . . . . . . . . . . . . 233 6.2.4 Normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 6.2.5 Klassifikation von Hyperfl¨achen . . . . . . . . . . . . . . . . . 234 6.2.6 Orientierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 6.3 Kruskal-Raumzeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 6.3.1 Rotationssymmetrische Hyperfl¨achen in der Kruskal-Raumzeit 242 6.4 Rotierende, geladene schwarze L¨ocher . . . . . . . . . . . . . . . . . . 244 6.4.1 Wichtigste geometrische Eigenschaften . . . . . . . . . . . . . 246 6.5 Dynamik der geladenen Teilchen . . . . . . . . . . . . . . . . . . . . . 255 6.5.1 Bewegungsintegrale . . . . . . . . . . . . . . . . . . . . . . . . 255 6.5.2 Die Aequatorialebene und die Symmetrieachsen . . . . . . . . 258 6.6 Energetik der schwarzen L¨ocher . . . . . . . . . . . . . . . . . . . . . 263 6.6.1 Nutzbare Energie eines schwarzen Loches . . . . . . . . . . . . 263 6.6.2 Energie der Teilchen im Feld eines schwarzen Loches . . . . . 271 6.7 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274
viii
Teil I Die Geometrische Deutung der Gravitation
ix
Kapitel 1 Geometrisierung der Dynamik 1.1
Ausgew¨ ahlte Tatsachen
Tragen wir zun¨achst zusammen, was von der Seite der Beobachtung und des Experimentes u ¨ber die Natur der Gravitation bekannt ist. Wir wollen dabei im Rahmen der Newton-Vorstellungen von Raum, Zeit und Dynamik bleiben und nur diejenigen Aspekte erw¨ahnen, welche f¨ ur die Entwicklung der ART von unmittelbarer Bedeutung sind.
1.1.1
Cavendish Experiment
Im Jahr 1798 hat H. Cavendish die Anziehungskraft zwischen zwei massiven Kugeln mit einer Torsionswaage gemessen. Das Resultat war vertr¨aglich mit m1 m2 FG = −G 2 , r wo m1 und m2 die Massen, r deren Abstand und G die Newton-Konstante sind. Tats¨achlich wurde die Newton-Konstante gemessen. Diese Messung wurde seitdem mehrmals verbessert; ein moderner Wert wird in [3] and [4] gefunden; f¨ ur uns gen¨ ugt die Gr¨osenordnung G ≈ 10−10 N kg −2 m2 . Das Gravitationsgesetz ist formal analog zum Coulomb-Gesetz FC =
1 q1 q2 , 4π0 r 2
wo q1 und q2 die Ladungen und 0 die dielektrische Konstante f¨ ur Vakuum sind: 1 ≈ 1010 N C −2 m2 . 4π0 Unterschiede: 1
1. Das Vorzeichen. Zwei Massen ziehen einander an, zwei gleiche Ladungen aber stossen sich ab. Deshalb finden wir in der Natur kaum Anh¨aufungen der elektrischen Ladung, wogegen grosse Konzentrationen der Masse eine Regel sind (Gravitationsinstabilit¨at, Gravitationskollaps). 2. Die gravitative “Ladung” ist die Masse, welche positiv f¨ ur alle K¨orper ist. Das bewirkt die sog. Universalit¨at der Gravitation. Sie wirkt auf alle K¨orper und ist von allen produziert. 3. Vergleich der zwei Kr¨afte f¨ ur z.B. zwei Protonen: FG ≈ −10−36 . FC Es ist eigentlich Gl¨ uck, dass die Gravitation so schwach ist, sonst w¨ urde sie alles verschlingen.
1.1.2
E¨ otv¨ os Experiment
Ein anderer wichtiger Unterschied zur Elektrodynamik ist, dass die Masse in der Physik nicht nur die Funktion der gravitativen Ladung (schwere Masse) hat, sie kommt auch im zweiten Newtonschen Gesetz als die sog. tr¨age Masse vor: F = ma. Diese Eigenschaft der Masse hat, auf den ersten Blick, mit der Gravitation nichts zu tun und wird auch ganz anders gemessen. Wir k¨onnen also eigentlich nur von der Proportionalit¨at der tr¨agen und schweren Masse eines und desselben K¨orpers sprechen. Der universelle Koeffizient der Proportionalit¨at h¨angt von der Wahl der Einheiten ab, und kann zu eins reduziert werden. Wie genau ist die Proportionalit¨at experimentell best¨atigt? Zum ersten Mal hat solche Messungen R. E¨otv¨os (1889, 1922) durchgef¨ uhrt (1 : 2 × 108 ). Einige modernere Versionen findet man in [3] and [4]. Diese Experimente sind phantastisch genau (1 : 1012 ). Aus dieser Proportionalit¨at folgt, dass die Trajektorie eines K¨orpers, der in einem Gravitationsfeld f¨allt, nur von dem Feld, nicht aber vom K¨orper abh¨angt. Die Beschleunigung des K¨orpers ist n¨amlich dessen Masse umgekehrt, die Kraft aber direkt proportional. Die Bewegung in einem Gravitationsfeld ist also wesentlich einfacher als zum Beispiel in einem elektrostatischen Feld. Im ersten Fall bestimmt das Feld, der Anfangspunkt und die Anfangsgeschwindigkeit die Bewegung vollkommen, im zweiten Fall muss man dazu noch das Verh¨altnis q/m der Ladung zur Masse des Probek¨orpers kennen. 2
1.1.3
Ablenkung des Lichtes
Alles bisher Gesagte gilt f¨ ur massive K¨orper. Wie reagieren die Photonen auf das Gravitationsfeld? Sie werden durch das Feld abgelenkt, ganz ¨ahnlich wie massive K¨orper. Die existierenden Beobachtungen (die erste: Eddington & Dyson, 1919) betreffen das Feld der Sonne; die Photonen bewegen sich dabei tangential zur Oberfl¨ache und gemessen wird der Ablenkungswinkel δ. Sehr pr¨azise Messungen sind mit von einem Paar von Quasaren kommenden Radiosignalen durchgef¨ uhrt worden [3] and [4]. Das Resultat ist δ ≈ 1.7700 . Elektromagnetische Wellen sp¨ uren aber das Gravitationsfeld auch noch auf eine andere Weise.
1.1.4
Rotverschiebung
Wenn ein Photon im homogenen Gravitationsfeld steigt, muss es seine Energie verlieren, sonst k¨onnte man ein Perpetuum Mobile bauen. Man kann zeigen, dass die Rotverschiebung eines Photons, das die H¨ohe l ersteigt, muss deshalb genau glc−2 machen. Ein entsprechendes Experiment ist zum ersten Mal 1960 durchgef¨ uhrt worden [3] and [4]. Man liess die Photonen ein 22.5 hohen Turm aufsteigen und mass die Frequenz mittels des M¨ossbauer-Effektes.
1.2
Das Aequivalenzprinzip
Die Grundidee der ART ist die Einsteinsche Antwort auf die Frage, woher die Proportionalit¨at zwischen der tr¨agen und der schweren Masse kommt. Er hat bemerkt, dass die gleiche Proportionalit¨at auch f¨ ur die sog. scheinbaren Kr¨afte zutrifft. Zentrifugalkraft, Corioliskraft usw. sind alle proportional der tr¨agen Masse des Probek¨orpers. Die Annahme, dass die Gravitationskraft eine scheinbare Kraft ist (das heisst, sie kann auf eine beschleunigte Bewegung des Bezugsystems zur¨ uckgef¨ uhrt ¨ werden) ist—in groben Z¨ ugen—was man unter dem sog. Aquivalenzprinzip versteht ¨ (Aquivalenz von Gravitationsfeld und Erscheinungen in beschleunigten Systemen). Betrachten wir der Einfachheit halber das linear beschleunigte System. Seine Achsen x, y, und z bewegen sich mit Beschleunigung g im Bezug auf die Achsen x¯, y¯ und z¯ in die positive Richtung der z¯-Achse: x = x¯ y = y¯ z = z¯ −
1 2 gt . 2
(1.1)
Man stelle sich einen Physiker vor, der in einem auf diese Weise beschleunigten Kasten eingeschlossen ist. Er kann nicht sehen, dass z.B. eine Kraft ausserhalb des 3
Kastens ihn beschleunigt, aber er kann die Erscheinungen innerhalb eines solchen Kastens untersuchen. Das ist der sog. Einstein-Kasten (Gedankenexperiment). Der Beobachter sieht, dass alle Gegenst¨ande zu Boden fallen (in Richtung der negativen z-Achse) mit einer Beschleunigung g , welche unabh¨angig von ihrer Masse und anderen Eigenschaften ist. Wenn er diesen Effekt als Wirkung einer Kraft F~ deuten will, muss er setzen F~ = m~g , worin ~g ein Vektor mit Komponenten (0, 0, −g) ist. ~g kann “Intensit¨at des Gravitationsfeldes,” m die “Gravitationsladung des Probek¨orpers” genannt werden. Wie reagiert das Licht auf diese Gravitation? Ein Lichtstrahl mit der Trajektorie x¯ = ct,
y¯ = 0,
z¯ = 0
in Bezug auf (¯ x, y¯, z¯) bewegt sich gem¨ass der Transformation (1.1) bez¨ uglich (x, y, z) folgendermassen 1 x = ct, y = 0, z = − g t2 , 2 zeigt also eine Ablenkung in Richtung der Gravitationsbeschleunigung. Beobachten wir auch eine Rotverschiebung, wenn das Licht vom Boden des Kastens (z = 0) zur Decke (z = l) wandert? Ja und man kann zeigen (Aufgabe), dass der entsprechende Dopplereffekt zu einer Rotverschiebung f¨ uhrt: ∆λ = glc−2 . λ Damit haben wir eine Erkl¨arung der Rotverschiebung! Bedeutet das, dass man die Gravitation an der Erdoberfl¨ache durch eine Beschleunigung der Erdoberfl¨ache nach oben, also weg vom Erdzentrum, erkl¨aren kann? M¨ ussten dann nicht auch alle Abst¨ande an der Erdoberfl¨ache mit einer solchen Beschleunigung zunehmen? Das w¨are allerdings ein Paradox. Dieses Paradox folgt aber nicht aus der alleinigen Annahme, dass die Gravitationskraft eine scheinbare Kraft ist. Es resultiert eher aus der Kombination dieser Annahme mit der Newtonschen Vorstellung u ¨ber den Raum und die Zeit. Man kann sogar ganz exakt und explizit zeigen, wie das Einreihen der Gravitationskraft unter die scheinbaren Kr¨afte die Geometrie der Raumzeit ¨andert, so dass eine ganz bestimmte Kr¨ ummung der Raumzeit erscheint. In diesem Teil der Vorlesung wollen wir die notwendigen geometrischen Begriffe und Eigenschaften einf¨ uhren. Wir arbeiten dabei direkt mit der Dynamik - geometrisieren die Dynamik sozusagen - so dass die Geometrie eine physikalische Bedeutung bekommt. Eine Bekanntschaft mit der Differentialgeometrie wird nicht vorausgesetzt. Auf diese Weise werden sowohl die relevanten geometrischen Begriffe und Tatsachen als auch die zentrale Idee der ART auf Grund bekanntes Materials der nichtrelativistischen Dynamik eingef¨ uhrt. 4
1.3
Newton-Galilei-Raumzeit
Es ist vorteilhaft, den dreidimensionalen Raum und die eindimensionale Zeit in eine einzige vierdimensionale Konstruktion zusammenzuschliessen, in die sog. Raumzeit. Dieser Schritt ist f¨ ur die Geometrisierung wesentlich. Wir wollen nun die Newtonschen Vorstellungen u ¨ber die Zeit und den Raum in Postulate u ¨ber diese Raumzeit (im Weiteren mit M bezeichnet) u ¨ bersetzen. Postulat 1.1 M ist ein topologischer Raum homeomorph zu R4 . Elemente von M heissen Ereignisse (oder Punkte). Mit Hilfe des Homeomorphisms kann man Koordinaten auf M aufstellen. Postulat 1.2 Auf M × M ist eine Funktion ∆T : M × M 7→ R definiert, welche Zeitabstand heisst. Ihre Eigenschaften sind: 1. ∆T (p, q) ist glatt, auf, und hat ein u ¨berall nichtverschwindenden Gradienten (in Bezug auf die Koordinaten, welche oben definiert sind). 2. ∆T (p, q) = −∆T (q, p), f¨ ur alle p und q, 3. ∆T (p, q) + ∆T (q, r) = ∆T (p, r), f¨ ur alle p, q und r. Es folgt, dass ∆T (p, p) = 0, f¨ ur alle p. Der Zeitabstand ist mit einer absoluten Uhr von Newton zu messen. Wir k¨onnen dann eine Zeitfunktion definieren, T : M 7→ R, indem wir ein Ereignis p0 w¨ahlen und setzen: T (q) := ∆T (p0 , q). Zwei verschiedene Zeitfunktionen k¨onnen sich nur um eine additive Konstante unterscheiden: sie ist ∆T (p1 , p2 ) gleich, wenn die zwei Zeitfunktionen mit den zwei Ereignissen p1 und p2 zusammenh¨angen. Auch die Zukunft (oder Vergangenheit) eines Ereignisses p l¨asst sich dann definieren als {q ∈ M | ∆T (p, q) > (<)0}. Interessanter ist die Definition der Gleichzeitigkeit: Zwei Ereignisse p und q sind gleichzeitig, wenn ∆T (p, q) = 0. Das ist ¨ ¨ eine Aquivalenzrelation, und so wird M dadurch in disjunkte Teilmengen—Aquivalenzklassen—verteilt. Diese Teilmengen heissen Gleichzeitigkeitsfl¨achen, und sie bilden tats¨achlich Hyperfl¨achen in M. Sie repr¨asentieren die wohlbekannte absolute Gleichzeitigkeit der Newton-Physik. Postulat 1.3 Jede Gleichzeitigkeitsfl¨ache R tr¨agt die Struktur des Euklidischen Raumes. V 3 sei der dreidimensionale Vektorraum ¨ uber reale Zahlen mit dem Skalarprodukt (·, ·), dann 5
1. f¨ ur jedes R gibt es eine Abbildung E : R × R 7→ V 3 , welche wir bezeichnen so: E(p, q) = q − p ∈ V 3 . Es gilt: 2. die Abbildung E(p, q) ist differenzierbar in beiden Argumenten, 3. (p-q) = -(q-p), 4. (p-q) + (q-r) = (p-r), 5. sei p fest in R. Dann ist die Abbildung q − p : R 7→ V 3 , welche q in V 3 sendet, bijektiv f¨ ur fedes p. Diese Struktur definiert also einen Abstand D(p, q) f¨ ur jede zwei gleichzeitige Ereignisse p und q durch p D(p, q) := (p − q, p − q) ,
der durch Masst¨abe messbar ist. Ein allgemeines Bezugsystem in M ist durch einen Ereignis (Zeitanfang), je einen Ereignis pro Gleichzeitgkeitsfl¨ache (der Ursprung) und ein kartesisches Achsenkreuz in jedem dieser Ereignisse gegeben. Man kann dann jedem Ereignis p eine 4-Zahl (x0 , x1 , x2 , x3 ) zuordnen, wobei x0 = T (p) und T ist eine der Zeitfunktionen, und die Koordinaten x1 , x2 , x3 des Ereignisses im entsprechenden Achsenkreuz. Umgekehrt bestimmen vier Zahlen (x0 , x1 , x2 , x3 ) und ein allgemeines Bezugsystem genau ein Ereignis in M. Die Beziehung zwischen Koordinaten (x0 , x1 , x2 , x3 ) und (y 0 , y 1 , y 2 , y 3 ) von einem Eregnis in zwei verschiedenen Bezugsystemen ist durch vier differentierbare Funktionen von vier Variablen gegeben. In der Newton-Physik spielen die sog. kr¨aftefreien Bewegungen (KB) eine besondere Rolle: sie dienen zur Definition eines Inertialsystems (IS). Ein IS ist ein Bezugsystem mit der Eigenschaft: Die Bahn jeder KB hat in den entsprechenden Koordinaten die Form xµ = v µ λ + b µ ,
µ = 0, 1, 2, 3,
(1.2)
mit λ als Bahnparameter. Die zwei 4er-Vektoren v µ und bµ werden durch die KB definiert (bis auf affine Parametertransformation). Postulat 1.4 Es gibt mindestens ein IS.
1.4
Die kr¨ aftefreien Bewegungen
Manchmal werden die KB gerade dadurch definiert, dass sie in einem IS gleichf¨ormig und geradlinig aussehen. Damit wir keine Kreisdefinition bekommen, setzten wir voraus, dass eine dynamische Definition der KB m¨oglich ist. Das heisst, dass man 6
alle m¨oglichen Kr¨afte kennt und eliminieren kann. Beispielsweise werden elektromagnetische Kr¨afte dadurch ausgeschaltet, dass man nur Probek¨orper zul¨asst, deren elektrische und magnetische Multipole alle verschwinden. Kontaktkr¨afte wie Reibung, Luftwiderstand usw. werden durch die Verwendung kontaktfreier Probek¨orper eliminiert. Studieren wir n¨aher die Gleichung (1.2). 1. Man sieht, dass eine und dieselbe KB verschiede Darstellungen vom Typ (1.2) haben kann. Wichtig ist nur der Weg, d.h. die Menge der Punkte in M, nicht aber die Werte des Parameters λ. Die Wahl des Parameters ist beliebig, beschr¨ankt nur durch die Bedingung, dass (1.2) linear ist. Damit wird λ bis auf eine affine Transformation bestimmt: λ 7→ λ0 = αλ + β,
α 6= 0.
Man nennt λ einen affinen Parameter. Diese Willk¨ urlichkeit in Beschreibung ist ein Preis daf¨ ur, dass wir die Zeit und die r¨aumlichen Koordinaten auf eine symmetrische Weise behandeln wollen. 2. Die Gleichungen (1.2) k¨onnen durch vier Differentialgleichungen ersetzt werden: d2 x µ = 0, ∀µ. (1.3) dλ2 Jede L¨osung xµ (λ) hat die Form (1.2), und beliebige vier Funktionen der Form (1.2) l¨osen umgekehrt das System (1.3). Die bedeutung der KB ist, dass sie bez¨ uglich eines IS andere Beschreibungen haben als bez¨ uglich eines Nicht-IS, so dass wir diese zwei Klassen von Bezugsystemen unterscheiden k¨onnen. Welche Gestalt hat die KB in einem beliebigen Bezugsystem (BS)? ¯ mit den Koordinaten x¯µ und ein Nicht-IS K mit xµ . Betrachten wir also ein IS K Die Transformation zwischen diesen Koordinaten lautet im Allgemeinen x¯µ = x¯µ (x0 , . . . , x3 ), und f¨ ur die Bahn einer KB haben wir x¯µ (x0 (λ), . . . , x3 (λ)). Setzen wir diese Beziehung f¨ ur x¯µ (λ) ein in die Gl. (1.3), erhalten wir µ
x¨ +
3 X 3 X
Γµρσ x˙ ρ x˙ σ = 0,
ρ=0 σ=0
7
(1.4)
wobei Γµρσ =
3 X ∂xµ ν=0
∂ 2 x¯ν . ∂ x¯ν ∂xρ ∂xσ
Es ist leicht zu zeigen, dass die so definierten Komponenten von Γµρσ unabh¨angig ¯ sind. Die Koeffiziente Γµ werden eine wichtige Rolle weiter spielen. Man vom IS K ρσ kann zeigen, dass sie mit den sog. scheinbaren Kr¨aften zu tun haben (Aufgabe). Zusammenfassend: Die IS haben Γµρσ gleich null, die Nicht-IS aber nichtverschwindend. Die Differentialgleichung (1.4) der KB hat noch einen formal mathematischen Aspekt. Ihre Koeffizienten definieren ein geometrisches Objekt, einen sog. affinen Zusammenhang (AZ, engl. connection). Der AZ spielt eine wichtige Rolle in mehreren Gebieten der Mathematik und der modernen theoretischen Physik. Beilspielsweise sind die sog. Eichfelder oder Yang-Mills-Felder AZ. Als geometrische Strukturen der Newton-Raumzeit haben wir insgesamt 1. Absoluter Zeitabstand in der Raumzeit (bestimmt durch die Uhr), 2. Abst¨ande und Winkel in den Gleichzeitigkeitsebenen (bestimmt durch die Massst¨abe), 3. Affiner Zusammenhang in der Raumzeit (bestimmt durch die KB). Wir wollen im n¨achsten Abschnitt den AZ n¨aher betrachten.
1.5 1.5.1
Ein Affiner Zusammenhang Krummlinige Koordinaten
Die allgemeinen BS der Newton-Theorie sind Beispiele von krummlinigen Koordinaten, denn die Koordinatenlinien xk = const, k = 1, 2, 3, sind keine Geraden. Die Transformation zwischen zwei Systemen von krummlinigen Koordinaten ist nicht linear. Die Nichtlinearit¨at der erlaubten Koordinatentransformationen ist die wichtigste neue Eigenschaft. Bisher hatten wir die Newton-Theorie, beherrscht von der Galilei-Transformation, und die Relativit¨atstheorie, beherrscht von der Poincar´eTransformation. Diese Theorien sind linear. Wir beginnen an diesem Punkt vorsichtig, das vertraute Land der linearen Theorien zu verlassen. Ein anderes Beispiel: die Kugeloberfl¨ache mit den sph¨arischen Koordinaten ϑ und ϕ. Wenn ϑ und ϕ die Intervalle 0 < ϑ < π,
0 < ϕ < 2π
(1.5)
durchlaufen, ist die ganze Kugeloberfl¨ache bedeckt bis auf das abgeschlossene Segment 0 ≤ ϑ ≤ π, ϕ = 0. (1.6) 8
Versuchen wir u ¨ber dieses Gebiet hinauszugehen, erhalten einige Punkte auf der Kugeloberfl¨ache mehrere Paare von Koordinaten: Der Pol ϑ = 0 beispielsweise l¨asst jeden beliebigen Wert von ϕ zu, usw. Man kann die ganze Kugeloberfl¨ache aber mit zwei verschiedenen “Koordinatenkarten” {ϑ1 , ϕ1 } und {ϑ2 , ϕ2 } bedecken, wobei die entsprechenden Segmente (1.6) nicht u urfen. Auf diese Weise stossen wir ¨berlappen d¨ auf den Begriff der Mannigfaltigkeit. Definition 1 Eine differenzierbare n-Mannigfaltigkeit ist ein topologischer Raum M und eine Familie {Ui } von offenen Teilmengen, welche M ¨ uberdecken: M=
[
Ui .
i
F¨ ur jede Teilmenge Ui gibt es einen Homeomorphismus (beidseitig stetige Bijektion) hi : Ui 7→ Rn . Das Paar (Ui , hi ) heisst Koordinatenkarte. Wenn zwei Koordinatenkarten ¨ uberlappen, Ui ∩ Uj 6= ∅, dann ist die Abbildung n n hi ◦ h−1 j : R 7→ R
mit Definitionsbereich hj (Ui ∩ Uj ) differenzierbar (C ∞ , d.h. alle Ableitungen stetig), und die Jacobi-Determinante der Abbildung verschwindet in keinem Punkt von h j (Ui ∩ Uj ). ¨ Auf diese Weise hat man auf dem Uberlappungsgebiet Ui ∩ Uj zwei Koordinatenn µ systeme: {x }, das durch die Abbildung hi von R auf M “gebracht” wird, und n {¯ xµ }, das von hj stammt. Die Abbildung hi ◦ h−1 j ist auf hj (Ui ∩ Uj ) ⊂ R durch die Funktionen xµ (¯ x1 , . . . , x¯n ), µ = 1, . . . , n, repr¨asentiert, und die Jacobi-Determinante ist ∂(x1 , . . . , xn ) . ∂(¯ x1 , . . . , x¯n ) Wir wollen die Ableitungen der Transformationsfunktionen xµ (¯ x1 , . . . , x¯n ) wie folgt abk¨ urzen: ∂xµ = Xν¯µ . ∂ x¯ν Bemerke, dass der Strich u ¨ber der Koordinate zu einem Strich u ¨ber dem Index wird! Wir werden im weiteren viel mit diesen Symbolen rechnen. Oft ben¨ utzte Beziehungen sind n n X X Xν¯µ Xρν¯ = δρµ , Xρν¯ Xµ¯ρ = δµν . ρ=1
ν=1
Sie folgen aus der Kettenregel f¨ ur die Ableitung von zusammengesetzten Funktionen. 9
1.5.2
Kurven und Tangentvektoren
Im ersten Teil der Vorlesung wollen wir uns haupts¨achlich mit der Dynamik der Massenpunkte besch¨aftigen. Die Kurven, welche als Bahnen dienen, werden also zu einem Grundbegriff. Zun¨achst definieren wir eine Kurve. Definition 2 M sei eine n-Mannigfaltigkeit. Eine Kurve C ist eine Abbildung C : R 7→ M, st¨ uckweise differenzierbar im folgenden Sinn: in den Koordinaten {xµ } wird die Abbildung durch n Funktionen xµ (λ) dargestellt, und diese Funktionen sind st¨ uckweise ∞ C . Aus der Definition folgt, dass die Funktionen x¯µ (λ), welche die Kurve C in anderen Koordinaten, {xµ }, darstellen, durch die Funktionen xµ (λ) bestimmt sind: x¯µ (λ) = x¯µ (x1 (λ), . . . , xn (λ)).
(1.7)
Hier sind die x¯µ (x1 , . . . , xn ) die Transformationsfunktionen von {xµ } zu {¯ xµ }. Der Tangentvektor tµ zu C in einem Punkt p der Kurve wird durch seine Komponenten bez¨ uglich {xµ } bestimmt. Der Punkt p entspreche dem Wert λ0 des Parameters λ. Dann gilt tµ = x˙ µ (λ0 ), µ = 1, . . . , n. Eine grosse Bedeutung in der Differentialgeometrie hat die Frage, wie sich eine Gr¨osse transformiert, wenn die Koordinaten wechseln. Die Gleichung (1.7) gibt: t¯µ = x¯˙ µ (λ0 ) =
n X ∂ x¯µ ν=1
∂xν
ν
x˙ (λ0 ) =
n X
Xνµ¯ tν .
ν=1
Somit ist der Tangentvektor ein Beispiel einer Gr¨osse mit den Eigenschaften: 1. Sie ist immer mit einem bestimmten Punkt p von M verbunden. 2. Bez¨ uglich den Koordinaten {xµ } um p ist sie durch n Komponenten (t1 , . . . , tn ) dargestellt. 3. Diese Komponennten transformieren sich wie folgt t¯µ =
n X ν=1
10
Xνµ¯ (p) tν .
Eine solche Gr¨osse heisst Vektor. Neu ist bei dieser Definition die Tatsache, dass jeder Vektor einen festen “Heimatsort” hat. In der Speziellen Relativit¨atstheorie z.B. wird das nicht verlangt. In der Differentialgeometrie m¨ ussen wir einen Vektor immer mit einem bestimmten Punkt von M verbinden. Sonst wissen wir n¨amlich nicht, wie er sich transformiert: die Matrix Xνµ¯ ist nicht konstant auf M wie in der Speziellen Relativit¨atstheorie, weil die Transformation der Koordinaten im allgemeinen nichtlinear ist.
1.5.3
Affiner Zusammenhang einer Mannigfaltigkeit
Definition 3 M sei eine n-Mannigfaltigkeit. Durch physikalische oder geometrische Gr¨ unde werde eine Klasse von Kurven ausgesondert dergestalt, dass die Koordinatendarstellung xµ (λ) einer jeden solchen Kurve das System von Differentialgleichungen n n X X µ Γµρσ x˙ ρ x˙ σ = 0, ∀µ, x¨ + (1.8) ρ=1 σ=1
erf¨ ullt und jede L¨osung des Systems eine Kurve dieser Klasse ist. Dabei sollen die µ Γρσ (x) C ∞ -Funktionen von xµ sein und es soll Γµρσ (x) = Γµσρ (x),
∀x, µ, ρ, σ
gelten. Dann definieren die Kurven einen AZ auf M . Γµρσ heissen Komponenten des AZ und die Kurven Autoparallelen des AZ. Das System (1.8) besteht aus n gekoppelten, gew¨ohnlichen, nichtlinearen Differentialgleichungen 2. Ordnung. Sie sind alle aufgel¨ost nach 2. Ableitungen; es ist also durch jeden Punkt p mit Koordinaten xµp und jeden Vektor v µ in diesem Punkt genau eine Autoparallele bestimmt1 . Sie erf¨ ullt (1.8) mit den Anfangsbedingungen xµ (0) = xµp , x˙ µ (0) = v µ . Ferner ist die Differentialgleichung (1.8) invariant unter affinen Transformationen des Parameters λ. Die Parametrisierung der Autoparallelen ist demnach durch (1.8) h¨ochstens bis auf eine affine Transformation festgelegt. Die Komponenten des AZ sind nur in Bezug auf die gew¨ahlten Koordinaten bestimmt. Unsere Frage, wie sich die Gr¨ossen denn bei einem Koordinatenwechsel transformieren, ist wieder f¨allig. Die Antwort ist in der Definition des AZ enthalten. 1
Wir benutzen einen Existenzsatz aus der Theorie der gew¨ ohnlichen Differentialgleichungen, siehe z. B. [2], S 501.
11
Um sie zu finden, brauchen wir etwas mehr Technik. Es lohnt sich, diese Technik schon jetzt einzuf¨ uhren, da sie immer wieder benutzt wird. Wir definieren eine indexbeh¨angte Gr¨osse (IG) als eine mehrdimensionale Tabelle von Zahlen, den sog. Komponenten der IG, welche durch Indexwerte identifiziert werden. Z.B. ist tµ eine eindimensionale Zahlentabelle mit n Elementen (t1 , . . . , tn ), Xνµ¯ eine zweidimensionale mit n2 Elementen und Γµρσ eine dreidimensionale. Jeder Index l¨auft durch die Werte {1, . . . , n}. Die Reihenfolge aller Indizes ist wesentlich. Es gibt Indizes, welche oben und solche, die unten beim Symbol der Gr¨osse stehen. Die Anzahl p der oberen und q der unteren Indizes gibt den sog. Typ (p, q) der IG. So ist tµ von Typ (1, 0) und Γµρσ vom Typ (1, 2). Man hat die folgenden Rechenregeln f¨ ur die IG. Gleichheit Zwei IG sind gleich, wenn sie vom gleichen Typ sind und wenn jede Komponente der einen gleich der entsprechenden Komponente der zweiten ist. Die Gleichheit kann man so ausdr¨ ucken, dass man die Gleichheit der Komponenten mit allgemeinen Indizes aufschreibt, z. B. µ Aµρσ = Bρσ .
Die Namen der Indizes rechts und links m¨ ussen u ¨bereinstimmen. Die Gleichung γ Aµρσ = Bαβ
kann nur einen Sinn machen, wenn µ, ρ, σ und α, β, und γ bestimmte Werte annehmen; dann bedeutet diese Gleichung, dass die betreffenden Komponenten gleich sind, aber nicht unbedingt die ganzen IG. Summe Zwei IG vom gleichen Typ k¨onnen addiert werden und somit eine neue IG vom denselben Typ definieren, z. B.: µ µ µ Zρσ = Xρσ + Yρσ .
Diese Gleichung stellt nichts anderes dar, als die Addition der entsprechenden Komponenten. Produkt Zwei beliebige IG vom Typ (p1 , q1 ) und (p2 , q2 ) k¨onnen multipliziert werden. Das ergibt eine IG vom Typ (p1 + p2 , q1 + q2 ), z.B.: ρσ σ Zµνκ = Xκρ Bµν . ρσ Diese Gleichung ist eine Vorschrift, wie man eine Komponente von Zµνκ durch ρ σ Multiplikation von Komponenten von Xκ und Bµν bekommt.
12
Algebra Eine wichtige Beobachtung ist, dass die Rechnung mit den indexbeh¨angten Gr¨ossen nicht Rechnung mit den ganzen Tabellen ist, ¨ahnlich wie z. B. Matrixrechnung, sondern immer nur von und mit den einzelnen Komponenten. Die beiden eingef¨ uhrten Operationen sind also die u ¨ blichen Operationen mit Zahlen. Deshalb gelten auch die Standardregeln daf¨ ur: je zwei kommutative und assoziative Gesetze und ein distributives Gesetz. Verju ¨ngung Gegeben sei eine IG vom Typ (p, q), wobei p > 0 und q > 0, dann k¨onnen wir eine IG vom typ (p − 1, q − 1) bilden, indem wir einen der oberen und einen der unteren Indizes w¨ahlen, und die Komponenten mit gleichen Werten dieser Indizes summieren. Z.B. Wβα
=
n X
µα Zβµ .
µ=1
Je nach Wahl des oberen und des unteren Index k¨onnen dabei verschiedene IG enstehen, und so ist es wichtig, alle Indizes explizit anzugeben. Es gibt einen besonderen Namen f¨ ur diese Summationsindizes: stumme, und f¨ ur die u ur die Verj¨ ungung hat Einstein die folgende Regel ¨brigen: freie Indizes. F¨ vorgeschlagen: man l¨asst einfach das Summationszeichen weg. Beispielsweise µα schreibt man die IG Wβα als Zβµ . Das ist die sog. Einsteinkonvention. Diese Konvention verk¨ urzt Rechnungen und macht Ausdr¨ ucke u ¨ bersichtlich. Die obigen Rechenregeln und Konventionen wollen wir jetzt anwenden, um das Transformationsgesetz f¨ ur die Komponenten des AZ zu berechnen. Wir haben also zwei Koordinatensysteme {xµ } und {¯ xµ }. Eine Autoparallele C sei in Bezug auf {xµ } durch die Funktionen xµ (λ) dargestellt. Diese Funktionen erf¨ ullen die Gleichungen µ µ (1.8). Dieselbe Autoparallele ist in Bezug auf {¯ x } durch x¯ (λ) dargestellt. Welche Gleichung erf¨ ullen diese Funktionen? Wir wissen, dass xµ (λ) = xµ (¯ x1 (λ), . . . , x¯n (λ)). Berechnen wir die Ableitungen, x˙ x¨
µ
µ
= =
n X ∂xµ
ρ=1 n X ρ=1
∂ x¯ρ
x¯˙ ρ = Xρ¯µ x¯˙ ρ , n
n
∂xµ ρ X X ∂ 2 xµ ρ σ x¨¯ + x¯˙ x¯˙ = Xρ¯µ x¨¯ρ + Xρ¯µσ¯ x¯˙ ρ x¯˙ σ , ρ ρ σ ∂ x¯ ∂ x¯ x¯ ρ=1 σ=1
und setzen in die Gleichung (1.8) ein, so erhalten wir Xρ¯µ x¨¯ρ + Xρ¯µσ¯ x¯˙ ρ x¯˙ σ + Γµαβ Xρ¯α x¯˙ ρ Xσ¯β x¯˙ σ = 0. 13
Durch die Anwendung des Kommutativgesetzes und des Distributivgesetzes erhalten wir Xρ¯µ x¨¯ρ + (Xρ¯µσ¯ + Γµαβ Xρ¯α Xσ¯β )x¯˙ ρ x¯˙ σ = 0. Die linke Seite ist eine IG vom Typ (1, 0). Wenn wir sie mit der IG Xκν¯ multiplizieren und die Verj¨ ungung in den Indizes µ und κ durchf¨ uhren, kommen wir zu x¨¯ν + (Xµν¯ Xρ¯µσ¯ + Γµαβ Xµν¯ Xρ¯α Xσ¯β )x¯˙ ρ x¯˙ σ = 0. Diese Gleichung hat schon die Form von (1.8). Somit ist ¯ ν = Γµ X ν¯ X α Xσ¯β + X ν¯ Xρ¯µσ¯ , Γ ρσ µ ρ¯ µ αβ
(1.9)
und das ist das gew¨ unschte Transformationsgesetz. Dieses Gesetz ist nichthomogen, wie wir erwarten sollten. H¨atten wir n¨amlich nur das erste Glied auf der rechten Seite, m¨ ussten die Komponenten des AZ bez¨ uglich aller Koordinatensysteme verschwinden, sobald sie in einem System gleich Null sind. Der AZ der NewtonRaumzeit ist ein Gegenbeispiel: seine Komponenten verschwinden in den IS, aber nicht in beliebigen BS.
1.5.4
Der metrische AZ
Ein wichtiges Beispiel von AZ ist das folgende. Als Mannigfaltigkeit betrachten wir wieder die Kugeloberfl¨ache. Eine Sonderklasse von Kurven auf der Kugel besteht aus den Grosskreisen. Sie sind durch geometrische Eigenschaften unter allen anderen Kurven auf der Kugel ausgezeichnet. Definieren sie einen AZ? Dazu m¨ ussen wir die Differentialgleichung der Grosskreise finden. Kurvenl¨ ange p und q seien zwei beliebige Punkte auf der Kugel. Jede Kurve, welche p und q verbindet (Verbindende) hat eine bestimmte L¨ange. Die Grosskreise sind dadurch ausgezeichnet, dass ihre Segmente die k¨ urzesten Verbindenden ergeben. Wir k¨onnen also die Differentialgleichung der Hauptkreise als Euler-Lagrange-Gleichung eines bestimmten Variationsprinzips herleiten. Die L¨ange der Verbindenden wird die Rolle der Wirkung u ¨ bernehmen. Die L¨ange einer beliebigen Kurve C, welche in Bezug auf die Koordinaten ϑ und ϕ durch die Parameterdarstellung ϑ = ϑ(λ),
ϕ = ϕ(λ),
a ≤ λ ≤ b,
gegeben ist, berechnen wir wie folgt. Die Beziehung zwischen den Koordinaten ϑ und ϕ auf der Kugel und y k , k = 1, 2, 3 in dem Euklidischen Raum E3 , in dem die 14
Kugel eingebetet ist, lautet y 1 = r sin ϑ cos ϕ, y
2
= r sin ϑ sin ϕ,
y 3 = r cos ϑ,
(1.10) (1.11) (1.12)
wo r Radius der Kugel ist. C hat somit in E3 die folgende Darstellung y 1 (λ) = r sin ϑ(λ) cos ϕ(λ), y 2 (λ) = r sin ϑ(λ) sin ϕ(λ), y 3 (λ) = r cos ϑ(λ). Ihre L¨ange L ist gegeben durch Z b p dλ (y˙ 1 )2 + (y˙ 2 )2 + (y˙ 3 )2 . L= a
Das Einsetzen f¨ ur die Funktionen y k (λ) ergibt Z b q dλ r 2 ϑ˙ 2 + r 2 sin2 ϑϕ˙ 2 . L= a
F¨ ur eine allgemeine n-dimensionale Fl¨ache F in Em haben wir die Einbettungsgleichungen (Analogie zu Gln. (1.10)–(1.12)): y k = y k (xµ ),
k = 1, . . . , m,
und die Kurve hat die Darstellung xµ = xµ (λ),
µ = 1, . . . , n.
Der Ausdruck unter der Wurzel wird zu (y˙ 1 )2 + . . . + (y˙ m )2 =
m X ∂y k ∂y k µ ν x˙ x˙ . µ ∂xν ∂x k=1
Metrik Es lohnt sich, diesen Ausdruck zu studieren. Er ist eine quadratische Form in den Komponenten x˙ µ des Tangentvektors zur Kurve. Die Koeffizienten der quadratischen Form bezeichnen wir durch gµν , d.h. gµν
3 X ∂y k ∂y k = . ∂xµ ∂xν k=1
15
(1.13)
Diese Gleichung bestimmt eine IG gµν in jedem Punkt xµ der Fl¨ache—nicht nur l¨angs der Kurve. Dieses Feld gµν (x) heisst Metrik auf der Fl¨ache F induziert durch ihre Einbettung in 3 . Eigentlich ist die Metrik unabh¨angig von der Kurve und kann zur Berechnung der L¨ange aller Kurven dienen. Wir k¨onnen also diese Information in der Metrik speichern, was den Vorteil hat, dass man dazu nicht wissen braucht, wie die Mannigfaltigkeit im Euklidischen Raum eingebettet ist, insbesondere braucht sie nicht eingebettet werden. Ein Beispiel ist die Metrik des Euklidischen Raumes n selber. Die Komponenten der Metrik h¨angen aber von dem gew¨ahlten Koordinatensystem ab. Berechnen wir diese Abh¨angigkeit. W¨ahlen wir neue Koordinaten {x0µ } auf F . Die Transformationsformeln zu den alten Koordinaten sind xµ = xµ (x0 ). Die Kettenregel ergibt
∂y k ∂y k ρ = X 0. ∂x0µ ∂xρ µ Wenn wir diese Gleichung in die Definition von gµν einsetzen, erhalten wir 0 gµν = Xµρ0 Xνσ0 gρσ .
Das ist das Transformationsgesetz der Komponenten der Metrik. Es ist linear homogen wie dasjenige f¨ ur Vektoren, nur etwas komplizierter. Tensoren Solche IG, welche mit einem Koordinatensystem verbunden sind und deren Komponenten sich linear homogen transformieren, wobei die Koeffizienten der Trans0 formation aus den Produkten der Matrixelemente von Xµρ0 oder Xρµ gebildet sind, repr¨asentieren die sogenannten Tensoren. Genauer, ein Tensor A vom Typ (p, q) ist eine Gr¨osse, welche in jeden Koordinaten durch eine IG vom Typ (p, q) dargestellt ρ wird. Das Transformationsgesetz von der Darstellung Aρ... σ... in Bezug auf {x } und 0µ A0µ... ν... in Bezug auf {x } lautet 0
µ σ ρ... A0µ... ν... = Xρ . . . Xν 0 . . . Aσ... , 0
wobei die Matrix Xρµ p-mal und die invertierte Xνσ0 q-mal mit entsprechenden Indizes auf der rechten Seite vorkommt. So ein Tensor heisst dann auch vom Typ (p, q) oder p-fach kontravariant q-fach kovariant. Somit ist ein Vektor ein einfach kontravarianter und die Metrik ein zweifach kovarianter Tensor. Die Summe p + q bezeichnet man als Stufe des Tensors. Diese Terminologie dr¨ uckt gewisse Transformationseigenschaften von physikalischen oder geometrischen Gr¨ossen aus und nichts mehr: ganz 16
verschiedene physikalische oder geometrische Gr¨ossen k¨onnen durch Tensoren vom gleichen Typ beschrieben werden. Beipiele von Gr¨ossen, welche kein tensor sind: Γ, X. Aus dem Transformationsgesetz folgt, dass jeder Tensor mit einem bestimmten Punkt der Mannigfaltigkeit verbunden ist, genau wie dies schon bei Vektoren besprochen wurde. Ein Tensorfeld ordnet dann jedem Punkt der Mannigfaltigkeit einen Tensor zu, der mit diesem Punkt verbunden ist. Ein Tensorfeld ist glatt, wenn die Komponenten einer seiner Koordinatendarstellung glatte Funktionen der Koordinaten sind. Wir haben Tensoren als Gr¨ossen definiert, welche von IG in Bezug auf Koordinatensysteme dargestellt werden, und diese IG m¨ ussen sich von Koordinaten zu Koordinaten auf eine ganz bestimmte Weise transformieren. Wir k¨onnen von Tensoreigenschaften dann sprechen, wenn die Eigenschaften unabh¨angig von der Darstellung sind (in allen Darstellungen gelten). Einige Beispiele von Tensoreigenschaften folgen. F¨ ur die IG haben wir einige Operationen eingef¨ uhrt: Gleichheit, Summe, Produkt und Verj¨ ungung. Wenn wir die IG, welche Tensoren darstellen, durch diese Operationen in jedem Koordinatensystem kombinieren—werden dann daraus wieder Tensoren resultieren, d.h. werden die entsprechenden Transformationseigenschaften f¨ ur diese Kombinationen gelten? Wir wollen diese Frage jetzt f¨ ur die einzelnen Operationen studieren. Gleichheit Zwei Tensoren S und T verbunden mit einem Punkt und vom gleiµ... chem Typ seien in einem festen Koordinatensystem {xµ } durch zwei IG, Sν... µ... und Tν... dargestellt, und diese IG seien gleich. Dann sind die Darstellungen der Tensoren in jedem Koordinatensystem gleiche IG. Das folgt daraus, dass die Transformationsgesetze f¨ ur die Komponenten gleich sind. Solche Tensoren nennen wir gleich. Auf diese Weise stimmt die Gleichheit der IG mit der Gleichheit der Tensoren u ¨berein. Summe Betrachten wir lieber ein Beispiel. S und T seien zwei Tensoren verbunden mit einem Punkt und vom Typ (1, 2). Im Koordinatensystem {xµ } sind sie µ µ durch die IG Sρσ und Tρσ dargestellt. Diese IG sind vom gleichen Typ und k¨onnen summiert werden: µ µ µ Wρσ = Sρσ + Tρσ . 0µ In einem anderen Koordinatensystem {x0µ } haben wir zwei andere IG, Sρσ und 0µ 0µ Tρσ und ihre Summe kann durch Wρσ bezeichnet werden. Ist die Darstellung µ des Tensor W als eine solche Summe eindeutig? D.h., erf¨ ullen die IG Wρσ und 0µ Wρσ die richtige Transformationsregel? Rechnen wir: α α 0µ 0µ 0µ , + Xαµ Xρβ0 Xσγ0 Tβγ Wρσ = Sρσ + Tρσ = Xαµ Xρβ0 Xσγ0 Sβγ 0
17
0
weil S und T Tensoren sind. Nach den Rechenregeln f¨ ur die IG k¨onnen wir jetzt die Transformationsmatrizen ausklammern: α α α α Xαµ Xρβ0 Xσγ0 Sβγ + Xαµ Xρβ0 Xσγ0 Tβγ = Xαµ Xρβ0 Xσγ0 (Sβγ + Tβγ ) 0
0
0
α = Xαµ Xρβ0 Xσγ0 Wβγ , 0
und das ist das richtige Transformationsgesetz. Damit ist die Summe zu einer Tensoroperation gemacht. Man kann Tensoren vom gleichen Typ (p, q) summieren, und die Summe hat wieder diesen Typ. Produkt Seien beispielsweise S und T Tensoren verbunden mit einem Punkt und vom Typ (2, 1) und (1, 1), und bilden wir die Produkte ihrer IG-Darstellungen in den obigen zwei Koordinatensystemen: µνκ Vρσ = Sρµν Tσκ ,
0µνκ Vρσ = Sρ0µν Tσ0κ .
Dann gilt: 0µνκ Vρσ = Sρ0µν Tσ0κ = Xαµ Xβν Xργ0 Sγαβ Xδκ Xσ 0 Tδ 0
0
0
= Xαµ Xβν Xργ0 Xδκ Xσ 0 Sγαβ Tδ = Xαµ Xβν Xργ0 Xδκ Xσ 0 Vγαβδ 0
0
0
0
0
0
Das Produkt ist also auch eine Tensoroperation, und man erh¨alt einen Tensor vom Typ (p1 + p2 , q1 + q2 ) als Produkt der Tensoren vom Typ (p1 , q1 ) und (p2 , q2 ). Verju ¨ngung Nehmen wir den Tensor S vom vorigen Beispiel und berechnen die Verj¨ ungung der entsprechenden IG in den Koordinatensystemen {xµ } und {x0µ }: U µ = Sνµν ,
U 0µ = Sν0µν .
Dann gilt U 0µ = Sν0µν = Xαµ Xβν Xνγ0 Sγαβ = (Xβν Xνγ0 )Xαµ Sγαβ . 0
0
0
0
Es gilt aber Xβν Xνγ0 = δβγ . 0
Also 0
0
U 0µ = Xαµ Sγαγ = Xαµ U α , und die Verj¨ ungung ist eine Tensoroperation, welche den Typ (p, q) in den Typ (p − 1, q − 1) umwandelt. 18
Symmetrie Die Metrik in jedem Punkt ist ein sog. symmetrischer Tensor. Aus der Definition (1.13) geht n¨amlich hervor gµν (x) = gνµ (x),
∀x, µ, ν.
Diese Eigenschaft bleibt bei jeder Koordinatentransformation erhalten: 0 0 gµν = Xµρ0 Xνσ0 gρσ = Xµρ0 Xνσ0 gσρ = Xνσ0 Xµρ0 gσρ = Xνρ0 Xµσ0 gρσ = gνµ .
Aehnlich wie symmetrische k¨onnen wir auch antisymmetrische Tensoren definieren: z. B. Aµν ist antisymmetrisch, wenn Aµν = −Aνµ . Jede IG kann in Bezug auf zwei Indizes auf demselben Niveau (d.h. oben oder unten) eindeutig in seinen symmetrischen und antisymmetrischen Teil aufgespaltet werden. Beispielsweise sei Bµρσ eine beliebige IG vom Typ (2, 1). Dann k¨onnen wir schreiben Bµρσ = Sµρσ + Aρσ µ , wobei Sµρσ = Sµσρ ,
σρ Aρσ µ = −Aµ .
ρσ Sµρσ und Aρσ µ sind eindeutig durch die Komponenten von Bµ bestimmt:
1 ρσ σρ Aρσ µ = (Bµ − Bµ ). 2
1 Sµρσ = (Bµρσ + Bµσρ ), 2
Eine oft ben¨ utzte Eigenschaft der symmetrischen und antisymmetrischen IG ist die folgende. Sei z.B. S ρσ symmetrisch und Aρσ antisymmetrisch. Dann gilt S ρσ Aρσ = 0. Ganz allgemein ist die Verj¨ ungung zwischen zwei symmetrischen und zwei antisymmetrischen Indizes immer gleich null. Beweis f¨ ur den obigen Fall: S ρσ Aρσ = −S ρσ Aσρ = −S σρ Aσρ = −S ρσ Aρσ . Wenn diese IG Tensoren in einem Koordinatensystem representieren, dann gelten alle Beziehungen in allen Koordinaten. Kontravariante Metrik Mit dem Tensorfeld gµν (x) ist ein anderes, die sog. kontravariante Metrik, verbunden. Diese wollen wir jetzt definieren. 19
Die rechte Seite der Definitionsgleichung (1.13) f¨ ur die Metrik auf der Fl¨ache F 3 kann als Skalarprodukt zweier Vektoren im E aufgefasst werden: 3 X ∂y k ∂y k ~µ , Y ~ν ), = (Y µ ∂xν ∂x k=1
~µ , µ = 1, 2, Tangentvektoren zu Kurven x1 = λ, x2 = const, bzw. wo die Vektoren Y x1 = const, x2 = λ auf der Fl¨ache F sind. Sobald die Koordinaten {xµ } ein erlaubtes System bilden (unabh¨angig sind), sind auch diese zwei Vektoren linear unabh¨angig. Die Determinante det gµν der Metrik gµν ist nicht anderes als die Gram-Determinante dieser Vektoren, sie darf also nicht verschwinden. Ganz allgemein gilt f¨ ur die symmetrischen kovarianten Tensoren Tµν zweiter Stufe auf einer beliebigen n-Mannigfaltigkeit: Wenn die Determinante det Tµν 6= 0 in Bezug 0 auf ein Koordinatensystem {xµ }, dann ist det Tµν 6= 0 in Bezug auf jedes beliebige 0µ andere Koordinatensystem {x }. In der Tat, es gilt 0 Tµν = Xµρ0 Xνσ0 Tρσ .
Das l¨asst sich als ein Matrixprodukt von drei n × n Matrizen schreiben, wenn wir die Matrizen T und X so definieren: T11 · · · T1n .. , T := ... . Tn1 · · · Tnn und
Dann, offensichtlich,
X11 · · · Xn1 .. . X := ... . n X1 · · · Xnn T0 = X> TX.
Somit ist2 0 det Tµν = det2 Xµρ0 det Tρσ .
(1.14)
det2 Xµρ0
X ist aber immer eine regul¨are Matrix, > 0, und so ist sogar das Vorzeichen von det Tρσ unabh¨angig vom Koordinatensystem. Die Metrik gµν (x) im Punkt x, als Matrix betrachtet, hat also immer eine Inverse; bezeichnen wir die Elemente dieser Inversen durch g µν (x), d.h. gµν (x)g νρ (x) = δµρ . 2
Wir benutzen den Satzt u ¨ber die Determinante eines Produktes von Matrizen, sieh z. B. [1], S. 133.
20
Auf diese Weise wird eine neue IG g µν (x) in jedem Punkt und in bezug auf jedes Koordinatensystem definiert. Man kann zeigen (Aufgabe), dass die neue Gr¨osse sich als ein Tensor vom Typ (2, 0) transformiert; sie ist als die sog. kontravariante Metrik bekannt. Allgemeine Definition der Metrik Bisher haben wir die Metrik nur auf den Fl¨achen im E3 definiert. Eine allgemeine Definition der Metrik ist wie folgt. Definition 4 M sei eine n-Mannigfaltigkeit und gµν (x) ein symmetrisches nichtausgeartetes (det gµν 6= 0) Tensorfeld vom Typ (0, 2), das ¨ uberall auf M wohldefiniert und glatt ist. Dann heisst das Paar (M, gµν ) eine Riemann-Mannigfaltigkeit und gµν (x) die Metrik auf M. Die Metrik definiert eine Art Skalarprodukt im Raum aller Vektoren in einem Punkt. Denn seinen V µ und U µ zwei Vektoren im Punkt p. Der Ausdruck gµν (p)V µ U ν ist ein Skalar, das linear von jedem der Vektoren abh¨agt und symmetrisch in Bezug auf Vertauschung der beiden ist. Es braucht nicht positiv definit sein; wir erlauben ausdr¨ ucklich auch indefinite Metriken. Definition 5 (M, gµν ) sei eine Riemannsche n-Mannigfaltigkeit und C : [λ1 , λ2 ] 7→ M eine beliebige st¨ uckweise glatte Kurve in M . Dann ist die L¨ange L(C) der Kurve definiert wie folgt: Z λ2 q dλ gµν (x(λ))x˙ µ x˙ ν , L(C) = (1.15) λ1
unabh¨angig von der gew¨ahlten Parametrisierung xµ (λ) (die L¨ange ist nur f¨ ur nichtnegative Ausdr¨ ucke unter der W¨ urzel wohldefiniert). Um also L¨angen von Kurven auf einer Mannigfaltigkeit definieren zu k¨onnen, ist es nicht notwendig, dass die Mannigfaltigkeit eine Fl¨ache im E3 ist. Allerdings sind alle solche Fl¨achen Beispiele von Riemann-Mannigfaltigkeiten. Geod¨ aten Wir wollen jetzt die Differentialgleichung der Verbindenden mit der extremalen L¨ange auf einer allgemeinen Riemann-Mannigfaltigkeit herleiten. Die Verbindenden heissen Geod¨aten und die Gleichung heisst die geod¨atische Gleichung. Die gew¨ unschte Gleichung der Grosskreise auf der Kugeloberfl¨ache ist ein Sonderfall davon. Seien also p und q zwei Punkte auf einer Riemannschen n-Mannigfaltigkeit (M, g), µ {x } sei ein Koordinatensystem und C : [λ1 , λ2 ] 7→ M eine beliebige Verbindende zwischen p und q, C(λ1 ) = p, C(λ2 ) = q, und xµ (λ) die Darstellung der Kurve C in 21
Bezug auf {xµ }. Die L¨ange von C ist durch das Integral (1.15) gegeben. Wir haben also eine typische Variationsaufgabe mit festen Enden. Die Lagrangefunktion L ist q L(x(λ), x(λ)) ˙ = gµν (x(λ))x˙ µ (λ)x˙ ν (λ). Die L¨osung x(λ) ist durch die Euler-Lagrange-Gleichungen gegeben d ∂L ∂L − = 0. κ ∂x dλ ∂ x˙ κ Rechnen wir: 1 ∂gµν µ ν ∂L = x˙ x˙ , κ ∂x 2L ∂xκ 1 1 ∂L = (gκν x˙ ν + gµκ x˙ µ ) = gκν x˙ ν , κ ∂ x˙ 2L L d ∂L 1 1 ∂g 1 ˙ κν ν µ ν = g x ¨ + x ˙ x ˙ − Lgκν x˙ ν κν dλ ∂ x˙ κ L L ∂xµ L2
(alles unter der Voraussetzung, dass gµν (x)x˙ µ x˙ ν > 0 ist). Das Einsetzen in die EulerLagrange-Gleichung ergibt 1 ∂gκν ν µ 1 ∂gµν ν µ 1 ˙ 1 gκν x¨ν + x ˙ x ˙ − x ˙ x ˙ = Lgκν x˙ ν . µ κ 2 L L ∂x 2L ∂x L
Wir k¨onnen diese Gleichung nach den zweiten Ableitungen x¨ν aufl¨osen, indem wir mit Lg ρκ multiplizieren: 1 ρκ ∂gκν ∂gµν d log L ρ ρ x¨ + g x˙ µ x˙ ν = 2 µ − x˙ . κ 2 ∂x ∂x dλ Das zweite Glied auf der rechten Seite kann noch umgeformt werden. Die Klammer ist nicht symmetrisch in den Indizes µ und ν, wohl aber der Ausdruck x˙ µ x˙ ν . Somit spielt nur der symmetrische Teil der Klammer eine Rolle. Bezeichnen wir den so entstandenen Koeffizienten bei x˙ µ x˙ ν durch {ρµν }, das sogenannte ChristoffelSymbol. Dann haben wir {ρµν }
1 = g ρκ 2
∂gκν ∂gκµ ∂gµν + − ∂xµ ∂xν ∂xκ
,
(1.16)
und x¨ρ + {ρµν }x˙ µ x˙ ν =
d log L ρ x˙ . dλ
(1.17)
Das ist die geod¨atische Gleichung. W¨are die rechte Seite der geod¨atischen Gleichung Null, dann w¨ urde diese Gleichung formal mit der Gleichung (1.8) der Autoparallelen eines AZ u ¨ bereinstimmen. 22
Warum ist die rechte Seite nicht null? Wir haben ein Funktional variiert, das die L¨ange einer Kurve darstellt und so invariant in Bezug auf beliebige Reparametrisation der Kurve ist. Reparametrisation ist die Transformation des Parameters, beispielsweise λ = λ(κ). Auch die resultierende Gleichung hat diese Symmetrie. Andererseits hat die Gleichung der Autoparallelen diese Symmetrie nicht; sie bestimmt jeweils eine Klasse von Kurvenparametern, die sog. affinen Parameter. Gibt es eine besondere Klasse von Parametern, f¨ ur welche die rechte Seite der geod¨atischen Gleichung verschwindet? Es m¨ ussen genau diejenigen Parameter sein, ˙ f¨ ur welche L = 0, also L = const. Wenn wir dies in den Ausdruck (1.15) f¨ ur die L¨ange einsetzen, erhalten wir Z λ dξL = L(λ − β). s(λ) = β
also λ = αs + β, wo α = L−1 und s ist die Kurvenl¨ange. Wir haben also das folgende Resultat. Die Geod¨aten auf einer Riemann-Mannigfaltigkeit, wenn sie durch ihre L¨ange oder durch eine Affintransformation davon parametrisiert werden, sind Autoparallelen eines AZ. Die Komponenten des AZ sind durch die Christoffel-Symbole gegeben. Dieser AZ heisst metrisch. Es ist wichtig zu bemerken: ein AZ braucht zu seiner Existenz keine Metrik. Die Mannigfaltigkeiten mit affinem Zusammenhang sind allgemeiner als Riemannsche.
1.6
Cartan-Friedrichs-Raumzeit
Wir sind jetzt mit Mathematik ausreichend ausger¨ ustet, um endlich der Idee einen mathematischen Ausdruck verleihen, dass die Gravitationskraft eine scheinbare Kraft ist. Dazu schreiben wir zun¨achst das zweite Gesetz von Newton in einem allgemeinen BS auf, so dass alle scheinbaren wie auch alle physikalischen Kr¨afte in einer Gleichung erscheinen. Dann versuchen wir, die Grenze zwischen den Kr¨aften anders zu ziehen als in der Newton-Theorie. Die Bewegung eines Massenpunktes mit Masse µ unter dem Einfluss einer Gesamtkraft f~ ist, in Bezug auf ein IS {¯ xµ }, durch die folgenden Gleichungen bestimmt: x¨¯0 = 0,
x¨¯k = µ−1 f¯k (x¯˙ 0 )2 .
(1.18)
(x¯˙ 0 )2 auf der rechten Seite ist die Korrektur daf¨ ur, dass λ nicht die Zeit und somit k x¨¯ nicht die Beschleunigung ist (Punkt bezeichnet die Ableitung nach λ). Wir haben eine spezielle Klasse der Parameter λ durch die erste Gl. (1.18) gew¨ahlt: sie sind bis auf eine Affintransformation durch eine Zeitfunktion bestimmt. 23
Die Transformation der linken Seite von (1.18) zu einem beliebigen BS (mit kartesischen Achsen!) ist dieselbe wie die Transformation der KB. Wir setzen (1.18) in die zweimal abgeleiteten Gleichungen x0 = x¯0 − T,
xk = xk (¯ x0 , x ¯1 , x¯2 , x¯3 )
ein und erhalten x¨0 = 0, x¨k + ΓkNρσ x˙ ρ x˙ σ = µ−1 f k (x˙ 0 )2 ,
(1.19)
wobei gilt f k = X¯lk f¯l ; ΓµNρσ sind die Komponenten des Newton-AZ; X¯lk ist eine (zeitabh¨angige) orthogonale Matrix. In der Gleichung (1.19) stehen die scheinbaren Kr¨afte auf der linken Seite, die physikalischen auf der rechten. Die Gesamtkraft f~ kann in die Gravitationkraft und den Rest aufgespaltet werden: f k = −µ∂k Φ + F k , (1.20) wo Φ das Newton-Potential ist. Setzen wir (1.20) in die Gleichung (1.19) ein: x¨k + ΓkNρσ x˙ ρ x˙ σ = −∂k Φ(x˙ 0 )2 + µ−1 F k (x˙ 0 )2 . Wie erwartet, hat das Gravitationsglied die gleiche Form wie die geometrischen Glieder auf der linken Seite, inbesondere enth¨alt es keine Information u ¨ ber das Probeteilchen. Wenn wir es zur linken Seite bringen, haben wir x¨k + (ΓkNρσ + δρ0 δσ0 ∂k Φ)x˙ ρ x˙ σ = µ−1 F k (x˙ 0 )2 .
(1.21)
Die Koeffizienten der quadratischen Form auf der linken Seite der Gleichung (1.21) definieren einen neuen AZ, den wir Einstein-AZ nennen. Die Komponenten ΓµEρσ davon sind also gegeben durch Γ0Eρσ = Γ0Nρσ = 0,
ΓkEmn = ΓkNmn = 0,
ΓkE00 = ΓkN00 + ∂k Φ,
ΓkE0l = ΓkN0l .
(1.22)
Die Autoparallelen des Einstein-AZ sind die freien F¨alle der Newton-Theorie (F k = 0). Wir haben auf diese Weise eigentlich eine andere Raumzeit erhalten. Sie hat wieder die drei Strukturen: die absolute Zeit wie Newton-Raumzeit, die E3 -Struktur 24
in den Hyperebenen der Gleichzeitigkeit wie Newton-Raumzeit, aber den EinsteinAZ anstatt des Newtonschen. Die Raumzeit mit dieser Geometrie heisst CartanFriedrichs-Raumzeit. In der Cartan-Friedrichs-Raumzeit wird also die Gravitation nicht mehr als ein Kr¨aftefeld aufgefasst, sondern als ein Teil der Geometrie der Raumzeit. Die Gleichungen (1.21) und (1.19) sind mathematisch ¨aquivalent: die L¨osungen davon beschreiben dieselben Bewegungen der Massenpunkte. Die messbaren Vorhersagen haben sich nicht ge¨andert. Trotzdem haben wir eine bedeutende Verschiebung in der Interpretation. Was in der Newton-Theorie eine Bewegung unter Einfluss der Gravitationskraft ist (freier Fall), wird in der Cartan-Friedrichs-Theorie eine kr¨aftefreie Bewegung. War die Geometrie der Raumzeit in der Newton-Theorie starr und immer diegleiche, wird diese in der Cartan-Friedrichs-Theorie abh¨angig von der Verteilung der Massen. Betrachten wir beispielsweise die Bewegung eines Mannes, der auf dem Boden des H¨orsaals steht. Vom Standpunkt der Newton-Theorie aus ist diese Bewegung kr¨aftefrei: die Gravitationskraft der Erde ist durch die Kontaktkraft der Oberfl¨ache genau aufgehoben. Aber vom Standpunkt der Cartan-Friedrichs-Theorie aus ist der Mann nicht kr¨aftefrei: es wirkt die Kontaktkraft und sie beschleunigt den Mann nach oben. Die Beschleunigung ist jetzt direkt durch den AZ (die linke Seite von Gl. (1.21)) definiert, nicht durch ein IS. Das rettet uns vom Paradox der sich aufblasenden Erde! Gibt es in der Cartan-Friedrichs-Theorie etwas Gleichwertiges zu den Inertialsystemen? Wir wollen dieser Frage jetzt nachgehen. Die formale Definition des IS geht von AZ aus und lautet: IS ist ein BS, in dem alle Komponenten des Newton-AZ u ¨berall verschwinden, Γρµν (x) = 0,
∀ρ, µ, ν, x.
(1.23)
Die Frage ist wichtig f¨ ur die l¨osung des Problems mit der sich aufblasender Erde. ¯ E verswindet, dann lautet Wenn es n¨amlich ein kartesisches System x¯µ g¨abe, wo Γ Gl. (1.21) x¨¯k = µ−1 F¯ k (x¯˙ 0 )2 . Die Kraft F¯ k ist die Kontaktkraft, welche u ¨berall weg vom Zentrum der Erde gerichtet ist. Dann m¨ ussen sich die Koordinaten x¯k der Oberfl¨ache ¨andern genau in diese Richtung, und so wird sich die Erde wieder aufblasen. Es d¨ urften also keine IS dieser Art existieren. Ein Koordinatensystem, das Gl. (1.23) erf¨ ullt, heisst in der Differentialgeometrie global geod¨atisches System. Unsere Frage l¨asst sich also mathematisch formulieren: erlaubt der Einstein-AZ die Existenz von global geod¨atischen Systemen? Um diese Frage zu beantworten, brauchen wir wieder einmal etwas mehr Mathematik. 25
1.7
Kru ¨ mmungstensor
Das Problem im vorhergehenden Abschnitt l¨asst sich allgemein und pr¨azise wie folgt formulieren. Gegeben sei eine affin zusammenh¨angende n-Mannigfaltigkeit M . Seien Γµρσ die Komponenten des AZ in Bezug auf ein BS {xµ }. Gibt es Koordinaten {¯ xµ } so, dass die entsprechenden Komponenten des AZ u ¨berall verschwinden? Das heisst ¯ µ (¯ Γ ρσ x) = 0
∀¯ x, µ, ρ, σ.
Das l¨asst sich umformulieren als die Aufgabe, die Transformationsfunktionen x¯µ (x) zu finden. Das Einsetzen in die Transformationsformel f¨ ur die Γ’s ergibt ν µ ¯ λ κ µ ¯ ν ¯ µ (¯ 0=Γ ρσ x) = Γ λκ Xν Xρ¯ Xσ ¯ + Xν Xρ¯σ ¯.
Das sieht aus wie eine schwierige Differentialgleichung f¨ ur die Transformationsfunkµ tionen x¯ (x). Wir k¨onnen sie aber vereinfachen. Das letzte Glied k¨onnen wir transformieren: Xνµ¯ Xρ¯νσ¯ = Xλµ¯ (∂σ¯ Xρ¯λ ) = ∂σ¯ (Xλµ¯ Xρ¯λ ) − (∂σ¯ Xλµ¯ )Xρ¯λ = µ ¯ µ ¯ ∂σ¯ (δρµ ) − (Xλκ Xσ¯κ )Xρ¯λ = −Xλκ Xσ¯κ Xρ¯λ .
Einsetzen ergibt: ¯ Γνλκ Xνµ¯ Xρ¯λ Xσ¯κ + Xνµ¯ Xρ¯νσ¯ = (Γνλκ Xνµ¯ − X µλκ )Xσ¯κ Xρ¯λ .
Wir erhalten also die Gleichung ∂ 2 x¯µ ∂ x¯µ ν = Γ (x) . λκ ∂xλ ∂xκ ∂xν
(1.24)
Das ist ein lineares System von Differentialgleichungen f¨ ur die Funktionen x¯µ (x). Eine notwendige Bedingung f¨ ur die L¨osbarkeit dieses Systems erhalten wir, inα dem wir beide Seiten nach x ableiten und die Symmetrie in den Indizes α und κ verlangen. Zun¨achst das Ableiten: ∂ 3 x¯µ µ ¯ = ∂α Γνλκ (x)Xνµ¯ + Γνλκ (x)Xνα = ∂xλ ∂xκ ∂xα ∂α Γνλκ (x)Xνµ¯ + Γνλκ (x)Γρνα (x)Xρµ¯ = (∂α Γρκλ (x) + Γνλκ (x)Γρνα (x))Xρµ¯ . µ ¯ Dabei haben wir f¨ ur Xνα aus der Gleichung (1.24) eingesetzt. Die Symmetriebedingung ergibt
∂α Γρλκ (x) + Γνλκ (x)Γρνα (x) − ∂κ Γρλα (x) − Γνλα (x)Γρνκ (x) = 0. ρ Der Ausdruck auf der linken Seite, den wir durch Rλακ abk¨ urzen, spielt eine grosse Rolle in der Differentialgeometrie. Wir haben die zwei S¨atze:
26
Theorem 1 M sei eine n-Mannigfaltigkeit mit AZ, und Γρνκ seien die Komponenten des AZ in Bezug auf ein beliebiges Koordinatensystem {xµ }. Eine IG Rρλακ sei durch ihre Komponenten in Bezug auf das System {xµ } wie folgt definiert Rρλακ (x) = ∂α Γρλκ (x) − ∂κ Γρλα (x) + Γνλκ (x)Γρνα (x) − Γνλα (x)Γρνκ (x).
(1.25)
Dann ist Rρλακ ein Tensor von Typ (1, 3), antisymmetrisch in den letzten zwei Indizes. Rρλακ heisst Kr¨ ummungstensor des AZ Γρλκ . Der Beweis ist direkt, wenn auch etwas m¨ uhsam: man ben¨ utzt die Transformationsρ formel (1.9) f¨ ur Γ λκ und jene f¨ ur die Koordinatenableitung. Alle Glieder, welche die zweiten und dritten Ableitungen der Transformationsfunktionen enthalten, heben sich gegenseitig weg! Theorem 2 Die notwendige und hinreichende Bedingung daf¨ ur, dass die Differentialgleichung (1.24) mindestens eine L¨osung in einer Umgebung U von p hat, lautet Rρλακ (x) = 0
∀x ∈ U, ρ, λ, α, und κ.
Wir haben nur die notwendige Bedingung bewiesen. Die umgekehrte Richtung ist schwierig. (Siehe z.B. [5]). Der AZ, dessen Komponenten sich so zu Null transformieren lassen, heisst integrierbar oder flach. Wir bemerken, dass Rρλακ als Tensor entweder in allen Koordinatensystemen verschwindet oder in keinem. Die Integrabilit¨at eines AZ ist also eine koordinatenunabh¨angige Eigenschaft. Berechnen wir die Kr¨ ummung der Cartan-Friedrichs-Raumzeit. Wir wollen f¨ ur den AZ die Beziehungen (1.22) in die Formel (1.25) einsetzen und die Tatsache ben¨ utzen, dass der Kr¨ ummungstensor f¨ ur den Newton-AZ verschwindet. Wir erhalten beispielsweise f¨ ur die Komponenten RE k0l0 RE k0l0 = ∂l ΓE k00 − ∂0 ΓE k0l + ΓE klρ ΓE ρ00 − ΓE k0ρ ΓE ρ0l
= ∂l (ΓN k00 + ∂k Φ) − ∂0 ΓN k0l + ΓN kl0 ΓN 000 + ΓN klr (ΓN r00 + ∂r Φ) − (ΓNk00 + ∂k Φ)ΓN00l − ΓNk0r ΓNr0l
= ∂l ∂k Φ + (∂l ΓNk00 − ∂0 ΓNk0l + ΓNklρ ΓNρ00 − ΓNk0ρ ΓNρ0l ) + ΓNklr ∂r Φ − ∂k ΦΓN00l . (1.26) Die letzten zwei Glieder sind aber gleich Null, und die vier Glieder in der Klammer ummungstensors, welche nat¨ urlich sind gleich der Komponente RNk0l0 des Newton-Kr¨ verschwindet. Wir erhalten so RE k0l0 = ∂l ∂k Φ. 27
(1.27)
Auf analoge Weise k¨onnen alle anderen Komponenten des Kr¨ ummungstensors berechnet werden mit dem einfachen Resultat: RE kmln = RE0lmn = RE k0mn = RE kl0m = RE 00mn = RE 0l0m = RE 000l = 0.
(1.28)
Wie erwartet, ist also der Einstein-AZ krumm f¨ ur jedes inhomogene Gravitationsfeld; es gibt dort keine globalen IS. Es ist etwas u ummung sozusagen nur in der Zeitrichtung ¨berraschend, dass die Kr¨ existiert. Das deutet das Verschwinden aller rein r¨aumlichen Komponenten RE kmln des Tensors an. Wenn wir die Eigenschaft der Komponenten des Newtonschen AZ benutzen, dass nur ΓkN00 und ΓkN0l von null verschieden sind (Aufgabe) und das dasselbe f¨ ur den Einstein-AZ gilt, sehen wir schnell ein: die Geraden in jeder Gleichzeitigkeitsebene (die ja der dreidimensionale Euklidische Raum ist) sind Autoparallelen des Einstein-AZ, genau wie des Newtonschen. Diese Eigenschaft wird allerdings in der relativistischen Theorie nicht mehr bestehen, weil Zeit und Raum sich dann nicht voneinander trennen lassen. Doch in denjenigen F¨allen, wo die Newton-Theorie eine gute Approximation ist, wird die Kr¨ ummung des Raumes immer einige Potenzen der Lichtgeschwindigkeit kleiner sein als in der Zeitrichtung. Was ist die Bedeutung der einzelnen Komponenten des Kr¨ ummungstensors? Bisher wissen wir nur, dass das Verschwinden des Kr¨ ummungstensors die Existenz von IS garantiert. Das ergibt nur ein sehr grobes Verst¨andnis der Komponenten. Wir k¨onnen auf die folgende Weise mehr erfahren. Welche ist die physikalische Bedeutung der Matrix RE k0l0 ? Betrachten wir zwei Punkte, einen mit Koordinaten xm , einen anderen mit xm + δxm . Die relative Beschleunigung ak von zwei freifallenden K¨orpern durch diese Punkte ist ak = −∂k Φ(xm + δxm ) + ∂k Φ(xm ) = −∂k ∂l Φ(xm )δxl = −RE k0l0 δxl . Die Komponenten des Kr¨ ummungstensors ergeben also die Aenderung der Beschleunigung vom freien Fall bei Ver¨anderung der Position. Auf der Erde nehmen wir solche relative Beschleunigungen wahr beispielsweise im Felde des Mondes als Kr¨afte, welche die Gezeiten hervorrufen. Deshalb sagt man manchmal, der Kr¨ ummungstensor der ART beschreibt die Gezeitenkr¨afte. Auch im allgemeinen Fall enthalten die Komponenten des Kr¨ ummungstensors eines beliebigen AZ die Auskunft u ¨ber die relativen Beschleunigungen seiner Autoparallelen.
1.8
Das Aequivalenzprinzip
1.8.1
Galilei-Aequivalenzprinzip
Die Newton-Mechanik konnte auf die Cartan-Friedrichs-Form gebracht werden und die Gravitation zur Geometrie der Raumzeit gemacht, nur wenn die fogende Vor28
aussetzung erf¨ ullt ist: Galilei-Aequivalenzprinzip Die Bewegung eines beliebigen freifallenden Probeteilchens ist unabh¨angig von seiner Zusammensetzung und Struktur. Dazu gen¨ ugt, dass die Probeteilchen a) elektrisch neutral sind, b) ihre gravitative Bindungsenergie vernachl¨assigbar gegen die Masse ist, c) ihr Drehimpuls venachl¨assigbar ist, d) ihr Radius klein genug ist, damit die Inhomogenit¨aten im Gravitationsfeld keinen Einfluss auf die Bewegung haben. Das ist das so genannte GalileiAequivalenzprinzip (oder schwaches Aequivalenzprinzip). Die ersten Experimente (Pendelexperimente, Pisa-Turm war nur ein Gedankenexperiment) dazu waren von Galilei gemacht. Wir stehen nun vor zwei Problemen. Erstens, wenn die Gravitationseinwirkung auf alle Systeme, nicht nur auf die dynamischen Trajektorien, einfach von fallschbewegten Bezugsystemen stammt, m¨ usste man das Galilei-Prinzip verallgemeinern k¨onnen: aber wie? Zweitens, eine vollst¨andige Abschaffung der IS ist nicht u ¨ berzeugend: die IS spielen eine allzu wichtige Rolle, inbesondere in der SRT und die SRT hat sich experimentell sehr gut bew¨ahrt. Sie sollten nicht total fallsch sein, aber m¨oglicherweise als eine N¨aherung weiter bestehen. Die Antworten auf beide Fragen sind verwandt. Wir brauchen ein bischen Mathematik.
1.8.2
Geod¨ atische Systeme
Die Gleichung (1.27) zeigt, dass in der Cartan-Friedrichs-Raumzeit keine volle Analogie zu den IS existiert. K¨onnen wir die Bedingung (1.24) abschw¨achen und doch eine vern¨ unftige Klasse von IS erhalten? Folgende Definition taugt dazu: Definition 6 M sei eine n-Mannigfaltigkeit mit dem AZ Γ und p ein beliebiger Punkt von M . Das Koordinatensystem {xµ } heisst geod¨atisch in p, wenn Γµρσ (p) = 0. Theorem 3 F¨ ur jeden Punkt p jeder affinzusammenh¨angenden Mannigfaltigkeit M gibt es mindestens ein Koordinatensystem, welches geod¨atisch in p ist. Beweis: W¨ahlen wir Koordinaten {xµ } um den Punkt p; die Komponenten des AZ in Bezug auf {xµ } seien Γµρσ , und sei Γµρσ (p) 6= 0. Wir wollen zeigen, dass neue ¯ µ (p) = 0. Koordinaten {¯ xµ } existieren, so dass Γ ρσ ¯ µ (p) = 0 ist ¨aquivalent der Gleichung (1.24), beschr¨ankt auf Die Bedingung Γ ρσ den Punkt p: ∂ x¯µ ∂ 2 x¯µ (p) = (p)Γνρσ (p). ρ σ ν ∂x ∂x ∂x 29
Diese Bedingung ist erf¨ ullt durch die folgende Transformation 1 x¯µ = xµ − xµ (p) + Γµρσ (p) xρ − xρ (p) xσ − xσ (p) 2
(1.29)
und so sind die Funktionen {¯ xµ }, welche durch diese Transformation definiert werden, die gesuchten Koordinaten, WZZW.
1.8.3
Lokale Inertialsysteme
Was ist die physikalische Bedeutung der geod¨atischen Koordinaten im CartanFriedrichs-Raumzeit? Betrachten wir eine solche Raumzeit mit einem gegebenen Gravitationsfeld Φ. W¨ahlen wir unseren Punkt p. W¨ahlen wir die Koordinaten auf eine kluge Weise: {xµ } sei ein IS in der entsprechenden Newton-Raumzeit. Dann haben wir ΓN µρσ = 0. Die Formel (1.22) gibt dann ΓE k00 = ∂k Φ, wobei alle anderen Komponenten von ΓE verschwinden. Setzen wir das ein in die Transformationsformel (1.29), erhalten wir x¯0 = x0 − x0 (p), 2 1 x¯k = xk − xk (p) + ∂k Φ(p) x0 − x0 (p) . 2
Die Bahn des Ursprungs x¯κ = 0 ist
2 1 xk = xk (p) − ∂k Φ(p) x0 − x0 (p) . 2
Es ist die Bahn des freien Falles durch p um x0 = x0 (p), wo die beiden Achsensysteme u ¨bereinstimmen. Die relative Drehung der r¨aumlichen Achsen ist durch die konstante Matrix gegeben ∂ 2 x¯k ∂ x¯k ¯ k Xlk = = δ , = 0, l ∂xl ∂xl ∂x0 denn die Koordinate xk ist nur im ersten Term der Transformationsfunktion enthalten. Somit ist das lokal geod¨atische System nichts als ein frei fallendes, nichtrotierendes System durch den Punkt p. Solche System nennen wir lokale Inertialsysteme, LIS. 30
1.8.4
Formulierung des Prinzips
Welche Bedeutung k¨onnen solche Systeme f¨ ur die Physik haben? Alle Gr¨ossen in unseren Ueberlegungen sind glatt. Wenn eine solche Gr¨osse in einem Punkt p verschwindet, ist sie auch in einer ganzen Umgebung von p unmessbar klein. Dass heisst: wenn man sich auf gen¨ ugend kleine Umgebungen in einer beliebigen affinzusammenh¨angenden Mannigfaltigkeit beschr¨ankt, dann ist der AZ (oder die Geometrie) beliebig genau durch einen flachen AZ approximiert. Anschaulich auf der Kugel: je kleiner die Umgebung von p, desto besser ist sie durch die Tangentialebene approximiert. Diese Betrachtungen f¨ uhren zu folgender Hypothese.
Starkes Aequivalenzprinzip. Kein physikalisches Experiment, welches mit einer beliebigen aber festen Genauigkeit innerhalb eines freifallenden nichtrotierenden Kastens durchgef¨ uhrt wird, kann das Gravitationsfeld a¨usserer Quellen detektieren, wenn nur der Kasten genug klein und die Gesamtdauer des Experimentes genug kurz sind.
Mit anderen Worten, der Einfluss der Gravitation auf physikalische Systeme oder Prozesse l¨asst sich mit beliebiger Genauigkeit durch eine passende Wahl des Koordinatensystems lokal wegtransformieren oder herbeif¨ uhren. Es muss sich aber um Systeme oder Prozesse handeln, welche gen¨ ugend lokalisierbar sind, und zwar sowohl im Raum als auch in der Zeit. Dieses Prinzip ist die pr¨azise Form unserer Behauptung, dass die Gravitation eine scheinbare Kraft ist. Das Prinzip hat aber auch eine grosse praktische Bedeutung. Mit seiner Hilfe k¨onnen wir den Einfluss der Gravitation auf beliebige physikalische Systeme oder Prozesse vorhersagen, sobald wir wissen, wie man diese Systeme oder Prozesse in krummlinigen Koordinaten beschreibt. Das Prinzip hat mehrere schw¨achere Formen. Wenn die “physikalischen Experimente” so beschr¨ankt werden, dass keine Versuche mit Gravitation zugelassen sind (d.h., das Gravitationsfeld der Messger¨ate und der ben¨ utzten Gegenst¨ande f¨ ur das Experiment ohne Bedeutung ist), sprechen wir vom Einstein-Aequivalenzprinzip. Wenn wir die Experimente noch weiter nur zur Beobachtung der Bahnen von Probeteilchen in der Mechanik beschr¨anken, dann heisst es Galileisches (schwaches) Aequivalenzprinzip. Das Einstein-Aequivalenzprinzip wird zur Grundlage der relativistischen Theorie der Gravitation. Das Aequivalenzprinzip (in jeder der drei Formen) ist heute wohl das am genauestens getestete physikalische Gesetz u ¨ berhaupt (siehe [4]). 31
1.9
Paralleltransport
Eine der wichtigsten Aufgaben der globalen IS der Newton-Theorie bestand darin, den Vergleich der Werte von verschiedenen physikalischen Gr¨ossen in voneinander entfernten Punkten zu erm¨oglichen. Betrachten wir beispielsweise die Bahn xµ = xµ (λ) eines Massenpunktes in einem beliebigen BS in der Newton Raumzeit. Seine Geschwindigkeiten zur Zeit t1 = t(λ1 ) und zur Zeit t2 = t(λ2 ) sind sind x˙ µ (λ1 ) und x˙ µ (λ2 ). Sind diese Geschwindigkeiten gleich oder verschieden? Aehnliche Fragen sind wichtig, wenn es z.B. um eine Impulsbilanz geht, usw. Das bekannte Rezept der Newton-Theorie ist: man soll die Geschwindigkeitsvektoren in ein IS transformieren und die entsprechenden Komponenten vergleichen. Diese Art Gleichheit ist offensichtlich unabh¨angig vom gew¨ahlten IS wegen der Linearit¨at der Transformation zwischen zwei IS. So lassen sich eigentlich die Vektoren in verschiedenen Punkten des Mikowski-Raumes identifizieren, so dass ein gemeinsamer Vektorraum f¨ ur alle Punkte resultiert; man kann so auch Vektoren in verschiedenen Punkten addieren, wie man eben in Minkowski-Raum gew¨ohnt ist. Auch l¨asst sich diese Definition der Gleichheit auf beliebige Tensoren ausdehnen. In der Differentialgeometrie heissen die Tensoren in verschiedenen Punkten, deren Komponenten in Bezug auf global geod¨atische Koordinaten gleich sind, nicht gleich, sondern parallel. Der Terminus “gleich” ist f¨ ur die gleichen Tensoren in gleichen Punkten reserviert. Wir wollen also weiterhin u ¨ber parallele Tensoren sprechen. Wann zwei Tensoren in zwei verschiedenen Punkten parallel sind, wird also auf einer flachen affinzusammenh¨angenden Mannigfaltigkeit durch ein global geod¨atisches System bestimmt. Diese Systeme sind wiederum durch den AZ bestimmt. Es gibt aber einen direkten Weg vom flachen AZ zu Parallelit¨at: der sogenannte Paralleltransport. Wir definieren den Paralleltransport zun¨achst f¨ ur einen Vektor. F¨ ur andere Tensoren ist die Ueberlegung analog. Sei also (M, Γ) eine flache affinzusammenh¨angende Mannifaltigkeit, p und q zwei Punkte darauf, und {xµ } ein beliebiges Koordinatensystem. W¨ahlen wir eine Verbindende C der zwei Punkte, d.h. C : [λ1 , λ2 ] 7→ M, C(λ1 ) = p und C(λ2 ) = q. In Bezug auf die Koordinaten {xµ } sei C durch die Funktionen xµ (λ) gegeben. Sei weiter V µ ein Vektor in p. Dieser Vektor bestimmt einen zu ihm parallelen Vektor in jedem Punkt von C einschliesslich q. Das so erhaltenen Vektorfeld l¨angs C wird durch die n Funktionen V µ (λ) dargestellt: seine Komponenten bez¨ uglich {xµ } im Punkt C(λ) f¨ ur jeden Wert von λ. Dieses Vektorfeld l¨angs C heisst der Paralleltransport von V µ l¨angs C. Wir wollen den Paralleltransport direkt durch die Γµρσ bestimmen. Dazu f¨ uhren µ µ ¯ wir ein beliebiges global geod¨atisches System {¯ x } um C ein. Da Γ ρσ verschwindet, 32
folgt aus der Transformationsformel (1.9) f¨ ur AZ ν¯ Γµρσ = Xν¯µ Xρσ .
Nach der Definition der Parallelit¨at erf¨ ullen die Komponenten V¯ µ (λ) vom Paralleltransport in Bezug auf {¯ xµ } die folgende Gleichung dV¯ µ = 0. dλ Wir haben V¯ µ (λ) = Xνµ¯ V ν (λ). Setzen wir f¨ ur V¯ µ (λ) die rechte Seite dieser Gleichung ein. Nach der Durchf¨ uhrung der Ableitung ergibt sich: dV ν µ¯ µ ¯ ρ ν X + Xνρ x˙ V = 0. dλ ν Durch Multiplikation mit Xµ¯κ erhalten wir dV κ µ ¯ + (Xµ¯κ Xνρ )x˙ ρ V ν = 0, dλ also
dV κ + Γκνρ x˙ ρ V ν = 0 , dλ
(1.30)
und das ist die gew¨ unschte Beziehung. Sie heisst Gleichung des Paralleltransports l¨angs C. (1.30) stellt ein System von n gew¨ohnlichen linearen Differentialgleichungen 1. Ordnung f¨ ur V ν (λ) dar, welche nach den Ableitungen aufgel¨ost sind. Ihre L¨osung ist also eindeutig durch den Anfangswert V κ (λ1 ) bestimmt, und so k¨onnen wir aus den Werten von Γµνρ direkt parallele Vektoren in beliebigen zwei Punkten finden. Da der Paralleltransport nur durch Γµνρ bestimmt ist, kann er auf beliebige affinzusammenh¨angende Mannigfaltigkeiten ausgedehnt werden. Definition 7 (M, Γ) sei eine n-Mannigfaltigkeit mit AZ. {xµ } seien beliebige Koordinaten, und Γµνρ die Komponenten des AZ in Bezug auf {xµ }. Gegeben seien weiter eine Kurve C durch die Funktionen xµ (λ), und ein Vektor V µ im Punkt xµ (λ1 ). Das Vektorfeld V µ (λ) l¨angs C, das eindeutig durch die Differentialgleichung (1.30) und den Anfangswert V µ bestimmt ist, heisst Paralleltransport von V µ l¨angs C. Ein Beispiel dieses Paralleltransports ist das Vektorfeld, dass tangential zu einer Autoparallelen steht. In der Tat, die Gleichung der Autoparallelen ist ein Sonderfall der Gleichung des Paralleltransports, wobei der zu transportierende Vektor Tangente zur Kurve ist. Das erkl¨art auch den Namen “Autoparallele”. 33
K¨onnen wir nun durch diesen Paralleltransport auch auf krummen Mannigfaltigkeiten parallele Vektoren in verschiedenen Punkten definieren? Eine Schwierigkeit k¨onnte darin bestehen, dass sich zwei Punkte durch mehrere Kurven verbinden lassen. In der Tat, der Paralleltransport h¨angt in den krummen Mannigfaltigkeiten vom Wege ab: Theorem 4 (M, Γ) sei eine n-Mannigfaltigkeit mit AZ. Ein infinitesimales Viereck sei durch seine Eckpunkte p = (xµ ), q1 = (xµ + δxµ1 ), q2 = (xµ + δxµ2 ) und r = (xµ + δxµ1 + δxµ2 ) in den Koordinaten {xµ } gegeben. Die Komponenten des Kr¨ ummungstensors im Punkt p in Bezug auf {xµ } seien Rµνρσ . Der Paralleltransport eines beliebigen Vektors V µ von p nach r via q1 sei V1µ (r), via q2 , V2µ (r). Dann gilt es (mit Genauigkeit bis zu zweiter Ordnung in δx1,2 ) V2µ − V1µ = Rµνρσ V ν δxρ1 δxσ2 .
(1.31)
Beweis: V µ sei ein Vektor in (xµ ) und V µ + dV µ ein paralleler Vektor in einem beliebigen benachbarten Punkt (xµ + dxµ ). F¨ ur dV µ ergibt sich aus der Gleichung des Paralleltransportes dV µ = −Γµρσ V ρ dxσ .
Der Paralleltransport via q1 sei V µ (p), V1µ (q1 ), V1µ (r) und jener via q2 V µ (p), V2µ (q2 ), V2µ (r). Dann haben wir (man sollte eigentlich bis zu zweiter Ordnung entwickeln, aber die Resultate sind gleich) V1µ (q1 ) = V µ (p) − Γµρσ (p)V ρ (p)δxσ1 und V1µ (r) = V1µ (q1 ) − Γµρσ (q1 )V1ρ (q1 )δxσ2 = V µ (p) − Γµρσ (p)V ρ (p)δxσ1 − ρ β µ µ τ ρ α Γ ρσ (p) + ∂τ Γ ρσ (p)δx1 V (p) − Γ αβ (p)V (p)δx1 δxσ2 = V µ (p) − Γµρσ (p)V ρ (p)δxσ1 − Γµρσ (p)V ρ (p)δxσ2
−∂τ Γµρσ (p)δxτ1 V ρ (p)δxσ2 + Γµρσ (p)Γραβ (p)V α (p)δxβ1 δxσ2 + O 3 , ur den Weg via q2 erhalten wo O 3 Glieder h¨oherer Ordnung in δxτ1,2 darstellen. F¨ wir denselben Ausdruck, nur die Indices 1 and 2 werden vertauscht. Auf diese Weise erhalten wir V2µ (r) − V1µ (r) = (∂τ Γµρσ − ∂σ Γµρτ + Γµατ Γαρσ − Γµασ Γαρτ )δxτ1 V ρ (p)δxσ2 . und das ist die gew¨ unschte Formel, WZZW. Aus dem Beweis geht auch hervor, dass die parallelen Vektoren in benachbarten Punkten eindeutig bestimmt sind und in Bezug auf ein lokal geod¨atisches System 34
gleiche Komponenten haben. Dank dem AZ kann man also Tensoren in benachbarten Punkten vergleichen. Das ist eine der Hauptrollen des AZ: er stellt einem Zusammenhang zwischen den benachbarten Punkten her. Damit ist auch erkl¨art, warum man mit Hilfe des AZ die Beschleunigung definieren kann. Um Tensoren in entfernten Pukten einer Raumzeit zu vergleichen, braucht man besondere Umst¨ande; wir kommen sp¨ater darauf zu sprechen.
1.10
Aufgaben
1. Eine Reihe von Gewichten l¨auft u ¨ ber zwei R¨ader mit H¨ohendifferenz l. Die Gewichte, die von unten ankommen, strahlen je ein Photon von Frequenz ν1 nach oben aus und verlieren so an Ruhemasse. Sie werden leichter und steigen nach oben, wo sie wieder ein Photon (von einem anderen Gewicht stammend, mit der Frequenz ν2 ) absorbieren. Dadurch werden sie schwerer und ziehen das Ganze nach unten. Frage: Welche Rotverschiebung z=
ν1 − ν 2 ν2
ist n¨otig, um ein Perpetuum mobile gerade zu verhindern? 2. Ein Gedankenexperiment: verbinde einen Massenpunkt mit negativer Masse −m durch festen masselosen Stab mit einem zweitem Massenpunkt von Masse m > 0. Der Stab habe die L¨ange l. Man berechne die Bewegung des Systems mit Hilfe der u ¨blichen Formeln Newtonscher Mechanik und Gravitationstheorie. Was kann man aus dem Resultat schliessen? 3. Ein Kasten der H¨ohe l bewege sich in Richtung seiner H¨ohe mit konstanter Beschleunigung a. Eine Quelle am Boden des Kastens sendet ein Lichtsignal zur Decke mit Frequenz ν1 . Frage: mit welcher Frequenz ν2 wird das Signal an der Decke absorbiert? (Im Sinne der Einfachheit bitte alle Formeln, d.h. Bewegungsgleichungen und Dopplereffekt, in nicht-relativistischer N¨aherung!) 4. Finden Sie die konkrete Gestalt der Transformation zwischen zwei BS ausgedr¨ uckt durch die Verschiebung T0 des Ursprungs der Zeit, zeitabh¨angige Verschiebung rk (x0 ) der Urspr¨ unge der Gleichzeitigkeitsebenen, und die zeitabh¨angi0 ge Rotation Okl (x ) der r¨aumlichen Achsen. 5. Benutzen Sie die Resultate der Vorhergehenden Aufgabe und Berechnen Sie die Koeffizienten Γµρσ in der Gleichung x¨µ +
3 X 3 X ρ=0 σ=0
35
Γµρσ x˙ ρ x˙ σ = 0
der kr¨aftefreien Bewegungen in Bezug auf K und bestimme ihre Beziehung zu den bekannten scheinbaren Kr¨aften. Beweisen Sie die Richtigkeit der folgenden Definition der Winkelgeschwindigkeit ωk (x0 ): X X Okr (x0 )O˙ lr (x0 ) = rkl ωr (x0 ). r
r
6. Identifiziere die freien und die Summationsindizes bei den folgenden Ausdr¨ ukken: C α Dα = 5; Λρσ Aσ = B ρ ; T αµλ Aµ Cλγ = Qαγ . Wieviele verschiedene Gleichungen representiert jeder Ausdruck? 7. Gegeben seien die numerischen Werte: Aµ = (5, 0, −1, −6),
Bµ = (1, −2, 4, 0), 1 0 2 3 5 −2 −2 0 Cρσ = 5 2 2 4 −1 −1 −3 0
;
Berechne: Aρ Bρ , Aρ Cρσ f¨ ur alle σ, Aα Cαβ f¨ ur alle β und Aλ Bκ f¨ ur alle λ und κ. 8. Welche der folgenden Beziehungen erf¨ ullen die Bedingungen einer Koordinatentransformation (x, y) 7→ (ξ, η)? (a) ξ = x,
η = 1,
(b) ξ= (c)
p x2 + y 2 ,
η = arctan
ξ = log x,
y x
η = y.
9. Bestimme die Metrik auf den folgenden Fl¨achen in E3 : a) x2 + y 2 = 1, b) x2 + y 2 − z 2 = −1; (x, y, z) sind die kartesischen Koordinaten. 36
,
10. Wie transformiert sich ein Tensor vom Typ (0, 0)? 11. Sei Dµν ein Tensor vom Typ (0, 2). Man zeige, dass kein Tensor ist.
Pn
µ=1
Dµµ im allgemeinen
12. Beweise, dass die Gr¨osse, deren Komponenten in Bezug auf ein beliebiges Koordinatensystem die folgende Tabelle bilden, ein Tensor ist: 1 0 ··· 0 0 0 1 ··· 0 0 .. .. . . 0 0 ··· 0 1
(n-dimensionale Einheitsmatrix). Welchen Typ hat der Tensor? 13. Sei Tµν ein Tensor vom Typ (0, 2). Seine Komponenten bilden eine n × nMatrix: T11 , · · · , T1n .. .. . . Tn1 , · · · , Tnn
und sei
T 11 , · · · , T 1n .. .. . . n1 nn T , ··· , T
die inverse Matrix dazu. Zeige, dass die so definierte Gr¨osse T µν auch ein Tensor ist. Von welchem Typ? 14. Wie transformiert sich det(Tνµ ), wobei Tνµ ein Tensor vom Typ (1, 1) ist? 15. Berechne den AZ Γµρσ auf der Kugeloberfl¨ache von Radius r = 1. Zeige, dass die Grosskreise die geod¨atische Gleichung l¨osen. Hinweis: Die Funktion ϑ(λ) kann direkt aus der Definition der Grosskreise berechnet werden, wenn die Funktion ϕ(λ) irgendwie gew¨ahlt wird (diese Wahl ist beliebig und kann zu Vereinfachung der Gleichungen benutzt werden). µν 16. Wρστ sei ein Tensor vom Typ (2, 3) und seien die Gr¨ossen U, V und X wie folgt definiert: µν µν Uρστ = Wστ ρ; µν ρν Vρστ = Wµστ ; µν νµ Xρστ = Wρστ .
37
Dies gelte in beliebigen Koordinaten. Welche der Gr¨ossen U, V und X ist ein Tensor? Unter welchen Bedingungen ist eine der neuen Gr¨ossen mit W identisch? 17. Berechne den Kr¨ ummungstensor f¨ ur die zweidimensionale Metrik mit den Komponenten g11 = ±1,
g22 = f (x1 ),
g12 = g21 = 0,
und f (x1 ) ist beliebige Funktion. (a) f¨ ur welche f verschwindet die Kr¨ ummung? (b) f¨ ur welche f hat die Kr¨ ummung die Form µ Rνρσ = K(δρµ gνσ − δσµ gνρ ),
wobei K = K(x1 , x2 ) eine (von f abh¨angige) Funktion der Koordinaten ist? K heiss “Gauss-Kr¨ ummung”. 18. Kann man auf der vertrauten Kugeloberfl¨ache S 2 mit Radius R Koordinaten finden, so dass die Metrik die Form aus Aufgabe 16 hat? Welche Eigenschaft hat die Gauss-Kr¨ ummung? 19. Die dreidimensionale Minkowski-Raumzeit bei −1 0 η= 0 1 0 0 Untersuche die Fl¨achen
ist die Riemann-Mf. (R3 , ηkl ), wo 0 0 . 1
(a) (x0 )2 − (x1 )2 − (x2 )2 = R2 ,
(b) (x0 )2 − (x1 )2 − (x2 )2 = −R2 . Finde Koordinaten, so dass die Metrik auf den Fl¨achen die Form aus Aufgabe 16 hat. Berechne die Gauss-Kr¨ ummung. Hinweis: Versuche “Kugelkoordinaten” mit hyperbolischen Funktionen (sinh θ oder cosh θ). 20. Berechne den numerischen Wert der Kr¨ ummung der Cartan-Friedrichs Raumzeit auf der Erdoberfl¨ache (in der “kugelsymmetrischen N¨aherung”). 21. Bestimme die konkrete Form der Paralletransportgleichung f¨ ur den Vektor µ V = (1, 0) l¨angs der Kurve ϑ(λ), ϕ(λ) gegeben durch ϑ = a(= konst), 38
ϕ = λ,
in einer Riemann-Mf. mit der Metrik ds2 = dϑ2 + f (ϑ)dϕ2 . 22. Sei die Mf. in Aufgabe 20 so, dass die Punkte (ϑ, 0) und (ϑ, 2π) u ¨ bereinstimmen (wie an der Kugel). Berechne den Paralleltransport l¨angs der nun geschlossenen Kurve λ ∈ [0, 2π] aus der Aufgabe 20 f¨ ur die Werte der Funktion f (ϑ) (a) f = k 2 ϑ2 , (b) f = R2 sin2 (ϑ/R), (c) f = R2 sinh2 (ϑ/R). Welche Form haben die drei Fl¨achen? Wie h¨angt der Transport vom Parameter a ab? 23. M sei eine beliebige n-Mf., {xµ } Koordinaten darauf, und C1 und C2 zwei Kurven gegeben durch: C1 :
xµ = uµ (λ),
C2 :
xµ = v µ (λ),
λ ∈ [0, 1]
λ ∈ [0, 1]
wobei uµ (λ) und v µ (λ) beliebige 2n Funktionen sind, die erf¨ ullen: uµ (1) = v µ (0),
∀µ;
weiter seien V µ . . . ein Vektor in uµ (0); V1µ . . . parallel zu V µ in uµ (1) l¨angs C1 ; V2µ . . . parallel zu V1µ in v µ (1) l¨angs C2 . Zeige: (a) V2µ ist parallel zu V µ in v µ (1) l¨angs der zusammengesetzten st¨ uckweise glatten Kurve C gegeben durch xµ = z µ (λ),
λ ∈ [0, 2],
wobei z µ (λ) = uµ (λ), µ
µ
λ ∈ [0, 1],
z (λ) = v (λ − 1), 39
λ ∈ [1, 2].
(b) V µ ist parallel zu V1µ l¨angs der Kurve C −1 definiert durch xµ = uµ (1 − λ),
λ ∈ [0, 1].
24. Benutze ein IS der Newton-Theorie als Koordinatensystem in einer CartanFriedrichs-Raumzeit mit einem festen allgemeinen Gravitationspotential Φ(~x). Studiere den Paralletransport in diesen Koordinaten (a) l¨angs beliebigen r¨aumlichen Kurven, d.h. x0 = const, und von beliebigen Vektoren; (b) l¨angs einer geschlossenen Kurve, die aus zwei freien F¨allen und zwei r¨aumlichen Kurven besteht; betrachte insbesondere die 4-er Geschwindigkeit der freien F¨alle.
40
Kapitel 2 Relativistische Teilchendynamik im Gravitationsfeld 2.1
Relativistische Gravitationstheorie
Im Kapitel 1 haben wir gelernt, dass sich die Newtonsche Gravitation als Geometrie der Raumzeit auffassen l¨asst. Auch die Grundlagen des entsprechenden mathematischen Apparates, der Differentialgeometrie, haben wir dabei kennengelernt. In diesem Kapitel wollen wir diese Methoden auf die relativistische Teilchendynamik anwenden. Im Unterschied zum nichtrelativistischen Fall kommen wir dabei aber zu einer neuen Theorie, genannt “Allgemeine Relativit¨atstheorie”, welche sowohl die Spezielle Relativit¨atstheorie als auch die Newton-Gravitationstheorie modifizieren wird. Das bedeutet, dass die Allgemeine Relativit¨atstheorie neue physikalische Erscheinungen vorhersagt.
2.2
Geometrie der Minkowski-Raumzeit
In diesem Abschnitt wollen wir die bekannten Eigenschaften der relativistischen Raumzeit mit Hilfe von differentialgeometrischen Begriffen umformulieren. Wir w¨ahlen die Einheiten so, dass c = 1. Die Spezielle Relativit¨atstheorie (SRT) basiert genauso wie die Newton-Theorie auf dem Begriff des IS. Diese privilegierten BS sind wieder durch die KB mitbestimmt. Physikalisch k¨onnen sie im Prinzip durch die folgende Ausr¨ ustung realisiert werden: 1. ein kr¨aftefrei schwebendes Radarger¨at, 2. eine ideale Uhr, 41
3. ein orthonormales, rotationsfreies Achsenkreuz (Gyroskopen...). Die Koordinaten {¯ xµ } eines jeden Ereignisses, welche diesem IS entsprechen, k¨onnen durch geeignete Manipulationen mit dieser Ausr¨ ustung gemessen werden. Die Transformation zwischen den Koordinaten, welche zu zwei verschiedenen IS geh¨oren, ist ein Element der Poincar´e-Gruppe und umgekehrt, jedes Element der Gruppe ergibt ein IS, wenn man es an ein beliebiges IS anwendet. Die Zeitintervalle (insbesondere die Gleichzeitigkeit) und die Abst¨ande von Ereignissen in der Minkowski-Raumzeit sind relativ: sie h¨angen vom gew¨ahlten IS ab. Die einzige absolute, d.h. BS-unabh¨angige Gr¨osse, welche sich auf die Zeitintervalle und Abst¨ande bezieht, ist das sog. Intervall. Das Intervall I zwischen zwei Ereignissen mit Koordinaten {¯ xµ } und {¯ y µ } in Bezug auf ein IS ist I = (¯ x0 − y¯0 )2 − (¯ x1 − y¯1 )2 − (¯ x2 − y¯2 )2 − (¯ x3 − y¯3 )2 . Die geometrische Bedeutung des Intervalls ist folgendes. Wenn das Intervall zwischen zwei Ereignissen positiv ist (I > 0) dann gibt es ein IS, in dem die r¨aumlichen Koordinatenunterschiede verschwinden x¯1 − y¯1 = x¯2 − y¯2 = x¯3 − y¯3 = 0 und I = T 2 , wo T gleich der Zeitdifferenz zwischen diesen auf gleichem Ort vorkommenden Ereignissen ist. Wenn I < 0, dann gibt es ein IS, in dem die Ereignisse gleichzeitig sind, x¯0 − y¯0 = 0, so dass I = −d2 , wo d der Abstand dieser gleichzeitigen Ereignisse ist. Endlich, wenn I = 0, dann k¨onnen die Ereignisse mit einem Lichtsignal verbunden werden. Eine andere geometrische Struktur ist durch die KB bestimmt; diese spielen eine wesentliche rolle bei der Definition der IS. Wir kennen die folgenden Eigenschaften davon: 1. in Bezug auf ein IS ist jede KB gleichf¨ormig und geradlinig, also x¯µ = a¯µ λ + ¯bµ , wobei a¯µ und ¯bµ konstante Vierzahlen sind und λ ein Parameter ist, 2. die Vierzahl a ¯µ erf¨ ullt die Ungleichung: X (¯ a 0 )2 − (¯ ak )2 ≥ 0. k
Wir wollen jetzt diese nichtlokalen geometrischen Objekte durch lokale differentialgeometrische ersetzen, so dass sich alle IS daraus rekonstruieren lassen (und 42
somit die ganze Geometrie der Minkowski-Raumzeit). Alle Gr¨ossen und Gleichungen sollen dabei so geschrieben werden, dass ihre Transformationsart in Bezug auf beliebige (nichtlineare) Koordinatentransformationen ersichtlich wird. Wir k¨onnen die Minkowski-Raumzeit M als eine Manigfaltigkeit betrachten; es gibt globale Koordinaten, z.B. die eines IS, welche M auf R4 abbildet. Damit ist die Mannigfaltigkeit definiert! Dann bestimmt das Intervall eine Riemansche Metrik gµν (x) in jedem Punkt von M durch ihre Komponenten in Bezug auf den IS: 1 0 0 0 0 0 −1 0 ∀¯ x ∈ M. (2.1) g¯µν (¯ x) = 0 0 −1 0 0 0 0 −1
(Die Elemente der Matrix auf der rechten Seite bezeichnen wir auch durch ηµν ). Bemerke, dass diese Gleichung in jedem Punkt von M gilt, so dass die Metrik konstante Komponenten in Bezug auf den IS hat. Diese Metrik ist klar nichtdegeneriert und unabh¨angig vom IS, in welchem sie definiert wurde. Das folgt daraus, dass jede Poincar´e-Transformation dieses Tensorfeld invariant l¨asst. Die Metrik (2.1) heisst Minkowskische Metrik. Die Minkowskische Metrik kann man benutzen, um die Vektoren X µ in einem Punkt x zu klassifizieren, n¨amlich je nach dem Vorzeichen des Ausdrucks gµν (x)X µ X ν in zeitartige, lichtartige und raumartige. Die “L¨ange” einer Kurve in MinkowskiRaumzeit ist von dieser Metrik nur dann wohldefiniert, wenn die Kurve nichtraumartig ist, d.h. ihr Tangentvektor in jedem Punkt nichtraumartig. Dann ist das Integral Z λ2 p dλ gµν x˙ µ x˙ ν τ12 = (2.2) λ1
koordinatenunabh¨angig. Seine physikalische Bedeutung ist aber die Eigenzeit l¨angs der Kurve von λ1 zu λ2 ; sie wird von einer mitfliegenden idealen Uhr gemessen. Die KB k¨onnen wieder (wie in der Newton-Theorie) durch eine Differentialgleichung beschrieben werden; in Bezug auf ein IS {¯ xµ } sind ihre Bahnen durch x¨¯ = 0
(2.3)
gegeben. Man hat allerdings die zus¨aztliche Bedingung g¯µν x¯˙ µ x¯˙ ν ≥ 0. Die Differentialgleichung (2.3) bestimmt einen AZ. In Bezug auf das IS sind die entsprechenden ¯ µ gleich Null. Nicht alle autoparallelen dieses AZ’s sind aber KB! Komponenten Γ ρσ Trotzden k¨onnen wir diesen AZ bestimmen, indem wir nur die KB studieren (Aufgabe). Der so bestimmte AZ ist global flach; er l¨asst global geod¨atische koordinaten zu (Beispiel: ein IS). 43
Wir haben nun zwei differentialgeometrische Objekte identifiziert: die Minkowskische Metrik gµν (x) und den KB-AZ Γµρσ (x). Es zeigt sich aber, dass diese Objekte nicht unabh¨angig sind: Γµρσ ist gerade der metrische AZ zur Metrik gµν (x). Beweis: In einem beliebigen IS haben wir ¯µ = 0 Γ ρσ und
1 {µρσ } = g¯µν (∂¯ρ g¯σν + ∂¯σ g¯ρν − ∂¯ν g¯ρσ ) = 0, 2 da g¯ρσ f¨ ur alle ρ und σ konstant ist. Die Komponenten des metrischen AZ und des AZ, der durch die KB definiert ist, stimmen also in einem Koordinatensystem u ussen sie in jedem ¨berein. Sie haben aber gleiches Transformationsgesetz, deshalb m¨ Koordinatensystem u ¨bereinstimmen: Γµρσ = {µρσ }.
(2.4)
Die Gleichung (2.4) bedeutet, dass die ganze Geometrie der Minkowski-Raumzeit in einem einzigen Objekt gespeichert ist—in der Minkowski-Metrik. Zusammenfassend: Die Geometrie der Minkowskischen Raumzeit ist vollst¨andig durch ein Paar (M, g) bestimmt, wobei M eine 4-Mannigfaltigkeit und g eine Metrik auf M ist. Die Metrik g auf M heisst Minkowskisch, wenn es eine Karte h : M 7→ R4 existiert, so dass 1) h als Bereich die ganze Mannigfaltigkeit M hat und auf ist (globale Karte), und 2) die Komponenten gµν (x) der Metrik in Bezug auf diese Karte erf¨ ullen: gµν (x) = ηµν . Insbesondere sind auch die IS durch die Metrik bestimmt. Oeffensichtlich definiert h selber ein IS, bezeichnen wir die Koordinaten durch xµ . Alle anderen IS m¨ ussen µ erstens global geod¨atische Systeme sein, und somit ergeben sie sich aus x durch eine lineare Transformation xµ = Aµν x0ν + B µ , wobei Aµν und B µ konstante Matrizen sind. Die entsprechende Transformation der Metrik lautet 0 gµν = Aρµ Aσν ηρσ . 0 Das System x0µ ist aber nur dann IS, wenn auch gµν = ηµν . Dann muss Aµν eine Lotentzmatrix sein, denn sie Definitionsgleichung f¨ ur die Lorentzmatrizen ist
ηµν = Aρµ Aσν ηρσ . So erhalten wir alle IS aus dem lokalen Objekt gµν , und somit auch das Intervall. Zum Abschluss dieses Abschnittes wollen wir noch einen kleinen technischen Punkt kl¨aren. Die KB sind Geod¨aten der Minkowski-Metrik. Bei der Herleitung der geod¨atischen Gleichung haben wir also das Integral (2.2) zu variieren. Bei der 44
Variation kommt die Wurzel in den Nenner (vergleiche S. 19). Sobald die Bahn zeitartig ist, ergibt sich keine Schwierigkeit—die Wurzel ist positiv. F¨ ur die lichtartigen Bahnen l¨asst sich aber die Variation nicht durchf¨ uhren. Der meistben¨ utzte Ausweg ist, ein anderes Variationsprinzip der Dynamik zugrundezulegen, n¨amlich das mit der Wirkung Z 1 S= dλ gµν x˙ µ x˙ ν . 2 In der Tat, die entsprechende Euler-Lagrange-Gleichung ist 1 d µ ν gµν x˙ x˙ (gµρ x˙ µ ) = 0, − ∂ρ 2 dλ und das ergibt direkt die Gleichung der Autoparallelen: x¨ρ + {ρµν }x˙ µ x˙ ν = 0.
(2.5)
Wir erhalten also die richtige Dynamik samt Affinparameter. Die Euler-Lagrange-Gleichungen zum obigen Lagrangian gegen uns den schnellsten Weg, die Christoffelsymbole zu berechnen. Man l¨ost sie einfach nach den zweiten Ableitungen der Koordinaten und liest die Γ’s ab. Wir bemerken, dass der kanonische Impuls, ∂L pµ = µ = gµρ x˙ ρ , ∂ x˙ eng mit dem Tangentvektor zusammenh¨angt; wir k¨onnen sogar schreiben: pµ = x˙ µ .
(2.6)
Dabei ist eine Konvention benutzt: in der Riemannschen Geometrie, wo einem die Metrik zur Verf¨ ugung steht, kann man Indices heben und senken: die Gr¨osse wird dabei mit dem gleichen Kernbuchstaben bezeichnet. So ist der kovariante Impuls, pµ , und der kontravariante Impuls, pµ , durch die Beziehungen pµ = gµν pν und pµ = g µν pν verbunden. Man kann f¨ ur den kanonischen Impuls den Wert des 4-Impulses pµ erhalten, wenn man die Bahn mit dem sog. physikalischen Parameter parametrisiert. F¨ ur massive Teilchen haben wir beispielsweise dxµ pµ = µ , ds wobei s die Eigenzeit und dxµ /ds die sog. 4er-Geschwindigkeit sind. In diesem Fall erhalten wir also f¨ ur den physikalischen Parameter λ die Gleichung ds = µ. (2.7) dλ F¨ ur lichtartige Teilchen muss man den Parameter λ so w¨ahlen, dass x˙ µ = hk µ , wobei h die Planck-Konstante und k µ der Wellenvektor ist. 45
2.3
Teilchendynamik in der ART
Die Allgemeine Relativit¨atstheorie (ART) ist die relativistische Theorie der Gravitation, welche wir jetzt konstruieren werden. Wir ben¨ utzen die gleiche Methode, welche im nicht-relativistischen Fall von der Newton- zur Cartan-Friedrichs-Theorie f¨ uhrte: Man modifizierte die geometrische Struktur der gravitationsfreien NewtonRaumzeit—den AZ—so, dass der freie Fall in einem Gravitationsfeld sich als Autoparallele des neuen AZ darstellen liess. Wegen der relativen Beschleunigung zwischen zwei freifallenden Teilchen verlor man die Existenz der globalen IS. Die Eigenschaften der IS konnten nur n¨aherungsweise in kleinen frei fallenden, nicht-rotierenden Kasten wiedergefunden werden, sofern die Messzeiten nicht lang waren. Wir wollen also die geometrische Struktur der gravitationsfreien Minkowski-Raumzeit a¨hnlich modifizieren, um die Auswirkungen der Gravitation zu erhalten. Der Einfachheit halber wollen wir versuchen die Modifikation so zu machen, dass der neue AZ auch metrisch sit. Wenn wir so einen AZ modifizieren wollen, k¨onnen wir die Metrik nicht ohne Aenderung lassen. Es bietet sich dann der folgende Ansatz an. Die Raumzeit ist eine 4-Mannigfaltigkeit M mit Metrik gµν , welche die folgende Eigenschaft hat: f¨ ur jeden Punkt p ∈ M, gibt es ein Koordinatensystem {xµ } so dass die entsprechenden Komponenten der Metrik und des AZ erf¨ ullen: gµν (p) = ηµν ,
(2.8)
{ρµν }(p) = 0 .
(2.9)
Wir nennen solche Systeme wieder “lokal inertiale Systeme” (LIS). In einer kleinen Umgebung von p haben dann Metrik und AZ ann¨ahernd die gleiche Form wie in einem IS der SRT. Die Forderung, dass es Koordinaten gibt, so dass (2.8) und (2.9) u ¨berall gelten (SRT), lassen wir fallen. Wie wir sp¨ater sehen werden, erlaubt der neue Ansatz eine breite Klasse von Raumzeiten, welche alle bekannten Gravitationsfelder zu beschreiben vermag. Das Gravitationsfeld kann also als das Tensorfeld gµν (x) auf einer Mannigfaltigkeit M betrachtet werden; verschiedene metrische Felder bedeuten demnach auch verschiedene Geometrien; die Mannigfaltigkeiten sind nur durch die Bedingung beschr¨ankt, dass sie eine solche Metrik zulassen. Das erlaubt eine breite Klasse von Topologien, nicht nur die triviale Topologie von 4 . Die Metrik gµν bekommt also zwei verschiedene Aufgaben: erstens, die Geometrie der Raumzeit wie in der SRT zu beschreiben und zweitens, das Gravitationsfeld zu beschreiben. Wir wollen unseren Ansatz auch mathematisch einwandfrei formulieren. Dazu dient erstens der Begriff der Signatur einer Metrik. Definition 8 M sei eine n-Mannigfaltigkeit mit der Metrik gµν und p ein Punkt 46
aus M. Wenn es Koordinaten {xµ } gibt, so dass gµν (p) = Diag(+1, . . . , +1, −1, . . . , −1) mit n+ mal +1 und n− mal −1, wobei Diag(a1 , . . . , an ) eine Abk¨ urzung f¨ ur die diagonale Matrix mit den Elementen a1 , . . . , an an auf der Diagonale bedeutet, dann hat die Metrik die Signatur σ = n+ − n− in p. (Es darf keine Null vorkommen, denn die Metrik muss regul¨ar sein in p.) Die Signatur ist nicht davon abh¨angig, wie man die Metrik auf die obige diagonale Form bringt. Die Transformation der Metrik in einem Punkt p ist n¨amlich eine reale allgemeine lineare Transformation: 0 gµν (p) = Xµρ0 (p)Xνσ0 (p)gρσ (p).
Es ist bekannt aus der linearen Algebra (siehe z.B., [1]), dass eine symmetrische Matrix durch eine solche Transformation immer auf die Form Diag(+1, . . . , +1, −1, . . . , −1, 0, . . . , 0) gebracht werden kann, und dass die Anzahl von +1, von −1 und von 0 Invarianten der Matrix sind (Tr¨agheitsgesetz f¨ ur quadratische Formen [1]). F¨ ur u ¨ berall regul¨are Metriken ist σ auch unabh¨angig vom Punkt! (Aufgabe). Sobald wir die Signatur σ der Metrik und die Dimension n der Mannigfalltigkeit kennen, k¨onnen wir die Zahlen n+ und n− aus n+ + n− = n, n+ − n− = σ. bestimmen. Wir k¨onnen also die Forderung (2.8) so formulieren: die Metrik hat Signatur −2 in jedem Punkt von M. Die Forderung (2.9) f¨ ur sich alleine ist immer erf¨ ult; den entsprechenden Satz haben wir im Kapitel 1 gezeigt. Wir wollen jetzt beweisen, dass die beiden Forderungen (2.8) und (2.9) erf¨ ullt werden, wenn die Signatur der Metrik den Wert −2 hat. Der erste Schritt ist, geod¨atische Koordinaten {˜ xµ } f¨ ur den Punkt p zu finden. Dann haben wir ˜ }(p) = 0. {ρµν In diesen Koordinaten braucht g˜µν nicht gleich der Matrix ηµν sein. Der zweite Schritt besteht in der Beobachtung, dass eine lineare Transformation der Koordinaten die G¨ ultigkeit der Gleichung (2.9) nicht ¨andert. In der Tat, das zweite Glied auf der rechten Seite der Transformationsformel (1.9) f¨ ur die Komponenten eines AZ verschwindet, wenn die Transformation linear ist, d.h. nach jeder Transformation der Form x˜µ = Aµρ x¯ρ . 47
wobei Aµρ eine konstante Matrix ist, erhalten wir wiederum {ρµν }(p) = 0. Der dritte Schritt besteht darin, die Existenz einer geeigneten Matrix Aµρ zu zeigen. Die Tatsache, dass die Metrik g˜µν im Punkt p die Signatur −2 hat und dass die Dimension der Mannigfaltigkeit 4 ist, bedeutet: es gibt eine reelle regul¨are Matrix Aµρ , so dass Aρµ Aσν g˜ρσ = ηµν ; somit haben wir die existanz gezeigt. Wir k¨onnen also unseren Ansatz wie folgt formulieren. Postulat 2.1 Die Raumzeiten der ART sind differenzierbare 4-Mannigfaltigkeiten mit den Metriken gµν , welche in jedem Punkt die Signatur −2 haben. Wir k¨onnen diese Aussage als das erste grundlegende Postulat der Allgemeinen Relativit¨atstheorie betrachten. Das LIS wird im weiteren eine wichtige Rolle spielen. Wir k¨onnen es direkt durch Eigenschaften der Metrik charakterisieren, denn die folgende Identit¨at gilt: ∂ρ gµν = gµσ {σρν } + gνσ {σρµ }.
(2.10)
(Aufgabe). Es fogt, dass ein LIS x¯µ in p ∈ M kann auf ¨aquivalente Weise charakterisiert durch die Beziehungen ∂¯ gµν (p) = 0 : ∂ x¯ρ
g¯µν (p) = ηµν ,
im gegebenen Ereignis hat die Metrik die Minkowskische Form, und ihre ersten Ableitungen verschwinden. Die LIS, deren Existenz durch das Postulat 1 garantiert ist, werden genauso wie in der nicht-relativistischen Theorie als die freifallenden nichtrotierenden BS physikalisch interpretiert. Wir ben¨ utzen dann das Einstein-Aequivalenzprinzip, um die Wirkung der Gravitation auf beliebige physikalische Erscheinungen zu finden. Das Aequivalenzprinzip kann ohne jede Aenderung vom ersten Kapitel u ¨bernommen werden. Es wird als ein heuristisches Prinzip betrachtet. Wir wenden das Aequivalenzprinzip oft in der Form des sog. Prinzips der allgemeinen Kovarianz an. Das geht in zwei Schritten. 1. Wir setzen voraus, dass eine Behauptung der SRT f¨ ur eine Situation ohne Gravitation in der Form einer lokalen (d.h., benachbarte Punkte betreffend) Gleichung vorliegt. Wir transformieren diese Gleichung in allgemeine krummlinige Koordinaten, so dass sie eine kovariante Form annimmt, d.h., sie gilt 48
in dieser Form in allen Koordinaten (auch in einem IS). Wir setzen weiter voraus, dass die Gleichung in dieser neuen, kovarianten Form keine h¨oheren Ableitungen der Metrik als die ersten enth¨alt. 2. Wir postulieren, dass die Gleichung in dieser Form in den gekr¨ ummten Raumzeiten der ART gilt. Damit erhalten wir eine ganz bestimmte Aussage dar¨ uber, wie sich die studierte Erscheinung in einem beliebigen Gravitationfeld verh¨alt. Es ist auch klar, dass das Einstein-Aequivalenzprinzip erf¨ ullt ist: in einem LIS verschwinden die ersten Ableitungen der Metrik und ihre Komponenten haben dieselbe Form wie in einem IS der SRT. Wenn man die Kopplung anderer Systeme zur Gravitation auf diese Weise bestimmt, dann heisst die Kopplung minimal. Wir wollen jetzt verschiedene Gleichungen und Ungleichungen der SRT auf diese Weise auf ART u ¨bertragen. Bemerken wir, dass das Wort “kovariant” in der Mathematik zwei ziemlich verschiedene Bedeutungen hat: kovariante Indizes, Tensors, usw. bedeutet Indizes auf dem niederen Niveau. Kovariante Gleichung bedeutet eine Gleichung, welche eine Form hat, die f¨ ur beliebige Koordinaten g¨ ultig ist. Eine kovariante Gleichung kann beliebeig viele, oder nur, kontravariante Tensoren enthalten. Die Klassifikation der Vektoren und Kurven k¨onnen wir ohne Aenderung u ¨ bernehmen; das Vorzeichen des Ausdrucks gµν x˙ µ x˙ ν entscheidet also dar¨ uber, ob eine Kurve zeit-, licht- oder raumartig ist. Die Bedeutung dieser Klassifikation zeigt das folgende Postulat: Postulat 2.2 Massive (masselose) Probeteilchen bewegen sich immer (auch unter Wirkung von Kr¨aften) entlang zeitartigen (lichtartigen) Kurven. Die kausale Struktur der Raumzeit, welche bestimmt, welche Ereignisse von einem Ereigniss aus kausal beeinfl¨ usst werden k¨onnen, ist also durch die Metrik gegeben, und ein Teil der Geometrie damit. F¨ ur die Zeitmessung in Abwesenheit der Gravitation gilt die Formel (2.2), welche schon in kovarianter Form geschrieben ist und keine Ableitungen der Metrik enth¨alt. In Anwesenheit der Gravitation haben wir also (minimale Kopplung des Uhrmechanismus): Postulat 2.3 Die Eigenzeit ds zwischen λ und λ + dλ entlang der zeitartigen Bahn xµ = xµ (λ) einer idealen Uhr, welche sie misst, ist p ds = dλ gµν x˙ µ x˙ ν . 49
(2.11)
Wir werden sehen, dass dieses Postulat die Rotverschiebung in einem statischen Gravitationsfeld richtig wiedergibt. F¨ ur die kr¨aftefreien Bewegungen “in Abwesenheit der Gravitation” gilt die Formel (2.5). Sie hat schon eine kovariante Form und enth¨alt nur die Komponenten der Metrik und ihre ersten Ableitungen. Sie ergibt sich aus dem gleichen Variationsprinzip, wie diejenige der flachen Raumzeit. In Anwesenheit der Gravitation haben wir also: Postulat 2.4 Die Bahn xµ (λ) eines massiven oder masselosen Probeteilchens, auf welches keine Kr¨afte wirken (freier Fall), erf¨ ullt die Gleichung (2.5) x¨ρ + {ρµν }x˙ µ x˙ ν = 0 , ihr Veirerimpuls p(λ)µ ist proportional der Geschwindigkeit, pµ = k x˙ µ ,
(2.12)
wobei k eine beliebige Zahl ist, abh¨angig vom Parameter der Autoparallelen, und es ist paralleltransportiert: p˙ ρ + {ρµν }pµ x˙ ν = 0 . (2.13) Es folgt erstens, dass die Bahn die Wirkung extremalisiert: S= wobei
Z
λ2
dλL, λ1
1 L = gµν (x(λ))x˙ µ (λ)x˙ ν (λ). 2
(2.14)
Zweitens, k˙ = 0 entlang der Bahn jedes freien Falles. Alle Probeteilchen bewegen sich also entlang der Geod¨aten der Metrik gµν . Eine L¨osung der Gleichung (2.5) ist eindeutig durch die Anfangsdaten bestimmt xµ (λ0 ) = xµ0 , x˙ µ (λ0 ) = pµ0 ,
(2.15)
wobei pµ0 der 4er-Impuls des Probeteilchens im Anfangspunkt xµ0 ist, und die Trajektorie ist dann durch den physikalischen Parameter parametrisiert. Der Tangentvektor und somit auch der kanonische Impuls werden also parallel transportiert. Das gilt nur f¨ ur den freien Fall. F¨ ur Photonen werden wir nur solche Bewegungen oder Streuung untersuchen. F¨ ur massive Teilchen wollen wir aber auch beschleunigte Bewegungen betrachten. Dazu brauchen wir noch die folgenden zwei Postulate. 50
Postulat 2.5 Die Bewegungsgleichung eines massiven Teilchens verallgemeinert sich zu dxσ dpµ (2.16) + {µρσ }pρ = fµ , ds ds wobei f µ die Summe aller wirkenden 4er-Kr¨afte (ausgenommen Gravitation), pµ der 4er-Impuls des Teilchens, dxρ pρ := µ ds und s die Eigenzeit l¨angs der Teilchentrajektorie sind. Es folgt: Die 4er-Kraft erf¨ ullt die Gleichung gµν f µ pν = 0.
(2.17)
Das k¨onnen wir beweisen, indem wir Gl. (2.16) mit gνµ pν multiplizieren und u ¨ber µ summieren: dpµ + gνµ pν {µρσ }pρ x˙ σ ds 1 = gµν pν p˙ µ + gµν {µρσ } + gµρ {µνσ } pν pρ x˙ σ 2 1 d 1 d 2 1 (gµν pµ pν ) = µ = 0, (2.18) = (gµν p˙ µ pν + gµν p˙ ν pµ + ∂σ gνρ pν pρ x˙ σ ) = 2 2 ds 2 ds
gµν f µ pν = gνµ pν
denn gµν pµ pν = µ2 . F¨ ur Streuprozesse haben wir: Postulat 2.6 Werden r Teilchen mit 4er-Impulsen p1 , . . . , pr im Punkt x gestreut, so dass s Teilchen mit 4er-Impulsen q1 , . . . , qs entstehen, dann gilt in x p1 + . . . + p r = q 1 + . . . + q s . Man kann fragen, ob die Postulate 4 und 5 mit dem Postulat 2 vertr¨aglich sind. Wenn z.B. die Bewegung eines massiven Teilchens als zeitartige Kurve beginnt, bleibt sie f¨ ur immer zeitartig? Die Antwort is positiv (Aufgabe). Man beweist, dass der Ausdruck gµν uµ v ν , den man als Skalarprodukt (u, v) betrachten kann, bei Paralleltransport erhalten bleibt. Wir haben dann insbesondere f¨ ur die Autoparallelen gµν x˙ µ x˙ ν = const;
(2.19)
wenn die Anfangsbedingungen (2.15) erf¨ ullt sind, dann gilt gµν x˙ µ x˙ ν = µ2 , 51
(2.20)
q1
q2
qs
•••
S C S C S C S C S C S C S C SC SC x % A % A % A % A % A % A % A % A % A
p1
p2
•••
pr
Abbildung 2.1: Streuung von Probeteilchen wo µ die Masse des Probeteilchen ist. Die Masse ist dann bei Bewegung erhalten. Es folgt daraus auch, dass die Autoparallelen zeitartig (lichtartig) bleiben, wenn sie als zeitartig (lichtartig) angefangen haben. Gl. (2.19) ist ein wichtiges Erhaltungsgesetz; dieses Gesetz gilt immer und wir werden es oft ben¨ utzen. Mit diesen ersten sechs Postulaten und der Interpretation des LIS als ein freifallendes, nichtrotierendes System mit orthonormalen Achsen geben wir uns vorl¨aufig zufrieden. Sie gen¨ ugen, um die Struktur der gekr¨ ummten Raumzeiten zu erforschen und eine erste Orientierung darin zu gewinnen. Sie betreffen aber nur die Teilchendynamik im Gravitationsfeld. Man muss noch die Dynamik der Felder im Gravitationsfeld und die Dynamik des Gravitationsfeldes selber postulieren, um die Theorie vollst¨andig zu machen.
2.4
Lokale Messungen
Die Messungen, welche ein Beobachter in seiner unmittelbaren Raumzeitumgebung macht, bilden die Grundlage f¨ ur alle Beobachtungen. Wenn wir beispielsweise ein entferntes Objekt beobachten, dann werten wir die Lichtsignale aus, die in unser Observatorium gelangen. Die ganze Beobachtung l¨asst sich also auf lokale Messungen zur¨ uckf¨ uhren. In diesem Abschnitt werden wir eine oft benutzte N¨aherung kennenlernen, welche “kleine” Umgebungen als “infinitesimale” Umgebungen betrachtet. Eine solche Methode ist f¨ ur Physiker naheliegend, ihre streng mathematische Begr¨ undung in der Differentialgeometrie ist aber langwierig. Wir wollen auf diese Begr¨ undung verzich52
ten; man findet sie in [6].
2.4.1
Allgemeines Bezugsystem
Von der Newton-Theorie oder von der SRT her sind wir gew¨ohnt, ein Koordinatensystem einfach als ein physikalisches Bezugsystem zu betrachten, d.h. es mit irgendwelcher Messapparatur zur Bestimmung der Koordinaten zu verbinden. In der ART ist die Lage komplizierter. Im Allgemeinen tragen die Koordinaten Information nur u ¨ber die topologische und die differenzierbare Struktur der Raumzeit, und haben mit keinem physikalischem Bezugsystem zu tun! Die Wahl der Koordinaten ist in der ART viel n¨aher zur Wahl der Eichung in der Elektrodynamik als zur Wahl des Bezugsystems. Komponenten der Tensore in Bezug auf Koordinaten haben dann keine messbare Bedeutung; messbar wird nur, wass invariant in Bezug auf Transformationen dieser Koordinaten ist. Diese Ideen finden einen Ausdruck in der Dimension der Koordinaten: im Allgemeinen, sie sind dimensionsfrei und die Metrik hat die Dimension von Quadrat der L¨ange. ¨ Ahnlich wie die Eichung k¨onnen die Koordinaten aber so gew¨ahlt werden, dass es die Probleme, welche zu l¨osen sind, vereinfacht. Zum Beispiel k¨onnen sie an ein wirkliches Bezugsystem angepasst werden. Das erleben wir in diesem Abschnitt. In solchen F¨allen k¨onnen Koordinaten eine nichttriviale Dimension erhalten, und die Dimension der verschiedenen Komponenten der Metrik kann dann verschieden sein. Z.B., LIS Koordinaten haben Dimension L¨ange (c = 1!), und alle Komponenten der Metrik sind dimensionsfrei, wie in SRT und IS. {xµ } sei ein Koordinatensystem und gµν die entsprechenden Komponenten der Metrik. Wir beschr¨anken uns in diesem Abschnitt auf Systeme, deren x0 -Kurven zeitartig sind. x0 -Kurven sind die Kurven mit der parametrischen Darstellung x0 = λ, xk = xk0 ,
k = 1, 2, 3,
wo xk0 beliebige Konstanten sind. Der Tangentvektor x˙ µ hat Komponenten x˙ µ = (1, 0, 0, 0).
(2.21)
Die Kurven sind zeitartig, gµν x˙ µ x˙ ν > 0, und das impliziert g00 > 0.
(2.22)
Setzen wir auf jede dieser Kurven einen Beobachter oder einen Masenpunkt. So f¨ ullen die Beobachter die Raumzeit dicht. Man spricht manchmal von “Beobachterstaub” oder “Referenzfl¨ ussigkeit”. Diese Referenzfl¨ ussigkeit soll gen¨ ugend “d¨ unn” 53
sein, damit der Einfluss davon auf die Geometrie der Ramzeit vernachl¨assigbar ist. Die drei Zahlen xk k¨onnen als Name des Beobachters oder des Massenpunkts betrachtet werden; Angabe der Koordinate x0 legt dann f¨ ur jeden Beobachter ein Ereignis fest. Ein solches Koordinatensystem wird allgemeines BS genannt. Die Werte der Koordinaten f¨ ur verschiedene Ereignisse werden in der Beobachterfamilie abgemacht; z.B. kann ein davon ein Radiosignal regelm¨assig aussenden, das bestimmte Werte von x0 u ¨berall bestimmt. Wir lassen diese Koordinaten beliebeig. Wenn ein “Puritaner” ein solches Bezugsystem beschreiben wollte, m¨ usste er die Koordinaten beliebig lassen, und unser BS dann als eine Familie (Kongruez) von Kurven darstellen, parametrisiert durch einen Zeitparameter t; eine solche Struktur w¨are dann koordinatenunabh¨angig.
2.4.2
Eigenzeit
Mit seiner idealen Uhr misst der Beobachter das Zeitintervall ds zwischen den zwei benachbarten Werten x0 und x0 + dx0 . Die Gl. (2.11) ergibt ds =
p √ gµν x˙ µ x˙ ν dλ = g00 dx0 .
So kann die Komponente g00 der Metrik im Prinzip gemessen werden: g00 =
2.4.3
ds dx0
2
.
(2.23)
Radarmessung
x0 + ∆x0
x0 +
∆x0 2
r
l l l l l l l
x0
x0 + dx0 q
p
xk
xk + dxk
Abbildung 2.2: Radarmessung 54
Die Beobachterin (xk ) sendet ein Radarsignal um Koordinatenzeit x0 (Ereignis p mit Koordinaten (x0 , xk )) zu ihrem Nachbar (xk + dxk ), der es reflektiert und den Wert (x0 + dx0 ) seiner Koordinatenzeit, wann das Signals kam (Ereignis q mit Koordinaten (x0 + dx0 , xk + dxk )) der Beobachterin mitteilt. Das Echo erreicht die Beobachterin im Ereignis r mit den Koordinaten (x0 +∆x0 , xk ). Die (infinitesimalen) Koordinatenunterschiede xµ (q) − xµ (p) = (dx0 , dxk ), xµ (r) − xµ (q) = (∆x0 − dx0 , −dxk ), bilden also lichtartige Vektoren. Die folgenden zwei Gleichungen sind deshalb erf¨ ullt g00 (dx0 )2 + 2g0k dx0 dxk + gkl dxk dxl = 0, g00 (dx0 − ∆x0 )2 + 2g0k (dx0 − ∆x0 )dxk + gkl dxk dxl = 0.
(2.24)
Subtraktion der beiden Gleichungen ergibt 1 g0k dxk = g00 ( ∆x0 − dx0 ). 2
(2.25)
Berechnen wir dx0 aus Gl. (2.25) und setzen zur¨ uck in (2.24), so erhalten wir 2 1 0 k l −ˆ gkl dx dx = g00 ∆x , (2.26) 2 wo wir eine Abk¨ urzung eingef¨ uhrt haben: gˆkl := gkl −
g0k g0l . g00
(2.27)
Die Gln. (2.25) - (2.27) k¨onnen wir benutzen, um die Komponenten g0k und gkl der Metrik aus den gemessenen Werten von g00 , dx0 und ∆x0 und aus den bekannten Werten von dxk zu ermitteln. Dazu muss allerdings die Messung gleichzeitig mit 6 geeignet gew¨ahlten Nachbarn verwirklicht werden. Alle Komponenten der Metrik in Bezug auf dieses allgemeine BS k¨onnen also im Prinzip gemessen werden. Wir wollen noch die physikalische und geometrische Bedeutung von g0k und gˆkl finden.
2.4.4
Gleichzeitigkeit
Wir definieren in der ART: die zwei Ereignisse mit den Koordinaten 1 (x0 + ∆x0 , xk ), (x0 + dx0 , xk + dxk ) 2 sind gleichzeitig f¨ ur die Beobachterin. Diese Definition ist wie in der SRT, sie gilt aber jetzt nur f¨ ur die benachbarten Ereignisse. Wenn also ∆x0 = 21 ∆x0 , sind die beiden 55
Koordinatenzeiten im Augenblick x0 synchron. Gl. (2.25) ergibt dann g0k dxk = 0. Somit ist die Gr¨osse g0k dxk ein Mass, wie asynchron die Koordinatenzeiten von den zwei Beobachtern (xk ) und (xk + dxk ) laufen. Die Bedingung der Gleichzeitigkeit der benachbarten Ereignisse f¨ ur die Beobachk terin (x ) k¨onnen wir ¨aquivalent formulieren, indem wir bemerken, dass der infinitesimale Vektor dlµ , 1 dlµ = (dx0 − ∆x0 , dxk ), (2.28) 2 der die zwei gleichzeitige Ereignisse verbindet, senkrecht auf der 4er-Geschwindigkeit der Beobachterin steht. Die Gl. (2.25) bedeutet n¨amlich, dass 1 g00 (dx0 − ∆x0 ) + g0k dxk = 0. 2 Das ist aber wegen (2.28) a¨quivalent zu g0µ dlµ = 0 und (2.21) ergibt dann gµν x˙ µ dlν = 0. Die Vektore, die senkrecht auf ihrer 4er-Geschwindigkeit stehen, sind f¨ ur die Beobachterin also r¨aumlich.
2.4.5
Abst¨ ande
Aus der obigen Radarmessung erhalten wir auch den Abstand da zwischen den Beobachtern (xk ) und (xk +dxk ). In unserem Fall ist da die halbe Eigenzeit zwischen den Augenblicken x0 und x0 + ∆x0 (multipliziert mit der Lichtgeschwindigkeit): da =
1√ g00 ∆x0 . 2
Dann aber erhalten wir aus (2.26), dass da2 = −ˆ gkl dxk dxl . Die Metrik gˆkl misst also die augenblickliche Distanz der Beobachter (xk ) und (xk + dxk ). Wir k¨onnen diese Distanz auch direkt aus der Metrik gµν ausrechnen; sie ist n¨amlich gleich der L¨ange des Vektors dlµ (Aufgabe). 56
2.4.6
Spektra und Richtungen
Betrachten wir einen Beobachter mit der Bahn xµ (λ). Seine 4er-Geschwindigkeit eµ(0) im Punkt λ0 seiner Bahn erf¨ ullt eµ(0) = N x˙ µ (λ0 ), wobei die Normalisierungskonstante N durch gµν eµ(0) eν(0) = 1 bestimmt wird. Richtungen senkrecht an eµ(0) empfindet der Beobachter als r¨aumlich. Er kann daraus drei aufeinander senkrechte Achsen w¨ahlen und durch Einheitsvektoren eµ(k) , k = 1, 2, 3, darstellen. Die 4 Vektoren eµ(α) , α = 0, 1, 2, 3, erf¨ ullen dann die Gleichungen (2.29) gµν eµ(α) eν(β) = ηαβ . Die so konstruierten Vektoren eµ(α) nennen wir ein Vierbein im Punkt xµ (λ0 ). Dieses Vierbein repr¨asentiert ein Ruhesystem des Beobachters; der Beobachter kann Komponenten verschiedener Tensoren im Ereignis xµ (λ0 ) auf dieses Vierbein beziehen.
e0
e3
6
p
e1
* e2
Photon Beobachter
Abbildung 2.3: Frequenz und Richtungen Betrachten wir beispielsweise ein Lichtsignal mit 4er-Impuls pµ , das im Augenblick λ0 beim Beobachter ankommt. Wie h¨angt die von ihm gemessene Frequenz ν und den r¨aumlichen Einheitsvektor nk , der die Richtung des Photons angibt, mit dem 4er-Impuls zusammen? Er zerlegt pµ in die Elemente des Vierbeins: pµ = hν(eµ(0) + nk eµ(k) ). 57
(2.30)
Aus Gl. (2.29) erhalten wir hν = gµν pµ eν(0) ,
(2.31)
nk = −(hν)−1 gµν pµ eν(k) .
(2.32)
Es gilt allgemein, dass die Komponenten der Tensore in Bezug auf ein Vierbein mit direkt messbaren Zahlen zu tun haben. Man nennt sie deshalb manchmal physikalische Komponenten der Tensoren.
2.5
Statische Raumzeiten
Wir wollen zun¨achst einige besondere, symmetrische Raumzeiten betrachten, und ihre physikalischen Eigenschaften studieren. Die mathematische Theorie der Symmetrie wollen wir in diesem Abschnitt nur streifen; wir postulieren einfach eine bestimmte Form der Metrik, versuchen klar zu machen, dass sie eine Symmetrie aufweist, und dann gehen wir gleich zu den beobachtbaren Eigenschaften u ¨ber. Unser Ziel ist, zu verstehen, wie man z.B. die ballistische Kurve im Raum aus der entsprechenden Autoparallelen in einer Raumzeit bekommen kann. Bei der Definition der statischen Raumzeiten m¨ ussen wir zwichen station¨aren und statischen Feldern unterscheiden. “Station¨ar” bedeutet “zeitunabh¨angig”. Auch eine Bewegung kann station¨ar sein: z.B. eine station¨are Kreisbewegung eines elektrischen Stromes in einem supraleitenden Ring, oder die Drehung der Sterne. “Statisch” bedeutet noch mehr Symmetrie, so dass die station¨aren Bewegungen auch ausgeschlossen werden. Zur Definition einer statischen Situation kann man die Tatsache benutzen, dass alle station¨are Bewegungen bei Zeitumkehr umkehren. Definition 9 Eine Raumzeit heisst statisch, wenn sie ein Koordinatensystem {xµ } mit den folgenden Eigenschaften zul¨asst: 1. die x0 -Kurven sind zeitartig, 2. die Komponenten gµν der Metrik sind unabh¨angig von der Zeitkoordinate x0 ∂0 gµν = 0,
(2.33)
3. und invariant in Bezug auf die Zeitumkehr x0 → −x0 . Die Zeitumkehr wird hier als eine Koordinatentransformation betrachtet: x00 = −x0 ,
x0k = xk .
(2.34)
Die nichtverschwindenden Transformationskoeffizienten f¨ ur Tensoren sind ∂x0 = −1, ∂x00 58
∂xk = 1. ∂x0k
(2.35)
Die Komponenten der Metrik in Bezug auf {x0µ } also erf¨ ullen 0 g00 = g00 ,
0 g0k = −g0k ,
0 gkl = gkl .
Die Invarianz der Metrik in Bezug auf Zeitumkehr bedeutet dann, dass g0k (p) = 0 ∀p.
(2.36)
Zusammenfassend k¨onnen wir (2.33) und (2.36) wie folgt ausdr¨ ucken: In einer staµ tischen Raumzeit gibt es Koordinaten {x }, in welchen die Metrik die Form ds2 = g00 (x1 , x2 , x3 )(dx0 )2 + gkl (x1 , x2 , x3 )dxk dxl
(2.37)
hat. {xµ } heissen statische Koordinaten und die Beobachter entlang der x0 -Kurven heissen statische Beobachter.
2.5.1
3-Raum
Der Spezialfall der statischen Raumzeiten erm¨oglicht eine physikalisch sinnvolle Spaltung der Raumzeit in Raum und Zeit. Die Komponenten der Metrik (2.37) erf¨ ullen g0k = 0 u ur alle statischen Beobachter sind synchroni¨berall. D.h., die Zeitkoordinaten x0 f¨ siert, und die Hyperfl¨ache Σt , definiert durch die Gleichung x0 = t, ist die Gleichzeitigkeitshyperfl¨ache f¨ ur diese Beobachter. Genauer, die Raumrichtungen f¨ ur jeden einzelnen statischen Beobachter stehen zur Hyperfl¨ache Σt tangential (wir haben ja die Gleichzeitigkeit im allgemeinen nur lokal definiert). Die Abst¨ande entlang Σt werden durch die Metrik gkl bestimmt, denn gˆkl = gkl und gkl ¨andert sich nicht mit der Zeit. Das Paar (Σt , gkl ) kann also interpretiert werden als der Raum dieser Beobachter. Es ist unabh¨angig von t. Man kann die zeitunabh¨angigen Punkte des drei-Raumes als die Trajektorien der statischen Beobachter betrachten: jeder Beobachter sitzt an einem festen Punkt und hat wohldefinierte Abst¨ande zu seinen Nachbarn. Ein Modell f¨ ur die Verh¨altnisse, die ¨ahnlich zur Newton-Theorie sind (mindestens was den Raum betrifft), erhalten wir offensichtlich, wenn wir (Σt , gkl ) flach w¨ahlen. Dann gibt es Koordinaten, in welchen die ganze Metrik die Form hat ds2 = g00 (x1 , x2 , x3 )(dx0 )2 − δkl dxk dxl , wobei g00 (x1 , x2 , x3 ) eine noch unbestimmte Funktion ist. 59
(2.38)
2.5.2
Freie F¨ alle
Die Autoparallelengleichung ergibt sich in einer statischen Raumzeit aus dem Lagrangian 1 1 L = g00 (x1 , x2 , x3 )x˙ 0 x˙ 0 + gkl (x1 , x2 , x3 )x˙ k x˙ l . 2 2 Die Variation nach x0 ergibt ∂L = g00 x˙ 0 = e, 0 ∂ x˙
(2.39)
wo e eine Konstante ist. Die Variation nach xk f¨ uhrt nach einfacher Berechnung zu 1 k r s x¨k + γrs x˙ x˙ = g kl g00,l (x˙ 0 )2 , 2
(2.40)
k wobei γrs die Christoffel-Symbole f¨ ur die dreidimensionale Metrik gkl sind
1 k γrs = g kl (∂r gls + ∂s glr − ∂l grs ). 2 und g00,l = ∂l g00 eine oft benutzte Abk¨ urzung f¨ ur die Ableitungen nach Koordinaten ist. Die rechte Seite der Gl. (2.40) ist aus −Γk00 (x˙ 0 )2 entstanden. Somit ist die Gleichung der Autoparallelen in eine zeitliche und drei r¨aumlichen Gleichungen aufgespalten.
2.5.3
Gravitationsbeschleunigung
Wir k¨onnen jetzt eine Interpretation der Gl. (2.40) geben. Jede Kurve xµ = xµ (λ) in der vierdimensionalen Raumzeit M definiert eine Kurve xk = xk (λ) im 3-Raum (Σt , gkl ) durch Projektion l¨angs der Bahnen der statischen Beobachter. Die linke Seite von (2.40) ist die λ-Beschleunigung dieser Kurve. Wenn die rechte Seite verschwindet, haben wir genau die Autoparallelengleichung f¨ ur (Σt , gkl ). Die Projektion der Bahn eines frei fallenden Teilchens sieht aber in diesem Raum nicht aus wie eine Autoparallele. Z.B. f¨ ur die r¨aumliche Metrik −δkl in Gl. (2.38) w¨are jede Autoparallele eine Gerade. Eine Autoparallele der ganzen Raumzeitmetrik (2.38) ergibt aber eine gekr¨ ummte Kurve, wenn auf den Raum projiziert: man “sieht” eine Beschleunigung, welche durch die rechte Seite von (2.40) beschrieben ist. Studieren wir die Beschleunigung. Der Faktor (x˙ 0 )2 ist die Korrektur daf¨ ur, dass 0 λ keine Zeit ist. x ist aber auch keine; wir sollen die lokalen Gleichzeitigkeitsebenen des statischen Beobachters durch die Eigenzeit des Beobachters anstatt durch x0 beschreiben. Um dann die Beschleunigung ak zu berechnen, welche der statische 60
6
ds
x0 = t + dt
dλ x0 = t
xk
Abbildung 2.4: Definition von ds/dλ Beobachter mit seiner idealen Uhr misst, m¨ ussen wir den Ausdruck auf der rech2 ten Seite durch s˙ dividieren, wobei s die Eigenzeit des statischen Beobachters im betreffenden Punkt ist: 1 ak s˙ 2 = g kl g00,l (x˙ 0 )2 . 2 Wir meinen dabei den Beobachter, am welchen das Teilchen gerade vorbeifliegt: dann ist x0 (s) eine wohldefinierte Funktion. Diese Zeit ist nur f¨ ur den Augenblick benutzt. Die Gl. (2.23) impliziert ak = g kl ∂l log
√
g00 .
(2.41)
Wir bemerken, dass die Gravitationsbeschleunigung von Punkten mit grosserem g00 zu denjenigen mit kleinerem g00 gerichtet ist, da die Metrik gkl negativ definit ist. Um die Newton-Theorie mit Gravitationspotential Φ zu modellieren, m¨ ussten wir deshalb setzen √ log g00 = Φ, also g00 = e2Φ .
(2.42)
Das ergibt f¨ ur die Metrik, welche die Newton-artige Physik ungef¨ahr reproduziert ds2 = e2Φ (dx0 )2 − δkl dxk dxl . 61
(2.43)
2.5.4
Rotverschiebung
6
uµ2
MB
uµ1
B
B B
B
pµ2
µ
p1
B
xk1
xk2
Abbildung 2.5: Rotverschiebung Betrachten wir zwei statische Beobachter (xk1 ) und (xk2 ) mit 4-Geschwindigkeiten uµ1 und uµ2 . Lassen wir (xk1 ) zu (xk2 ) ein Photon schicken. Dieses verl¨asst (xk1 ) mit dem 4er-Impuls pµ1 , l¨auft l¨angs einer lichtartigen Autoparallelen und trifft mit dem 4er-Impuls pµ2 bei (xk2 ) ein. Die Frequenz ν1 des Photons im Ruhesystem von (xk1 ) und ν2 im Ruhesystem von (xk2 ) ist nach der Formel (2.31) gegeben durch hν1 = gµν uµ1 pν1 ,
hν2 = gµν uµ2 pν2 .
Setzen wir die Werte f¨ ur gµν und uµ ein, so erhalten wir p hνi = g00 (xi )p0i , i = 1, 2.
Daraus wollen wir die Rotverschiebung z=
ν1 − ν 2 λ2 − λ 1 = λ1 ν2
berechnen. Die lichtartige Bahn des Photons wollen wir durch die parametrische Darstellung beschrieben xµ = xµ (λ). 62
Die Funktionen xµ (λ) m¨ ussen die Gln. (2.40) und (2.41) erf¨ ullen. λ sei physikalischer Parameter: pµ = x˙ µ . Dann gilt wegen (2.39) e = g00 x˙ 0 =
√
√ √ g00 ( g00 p0 ) = h g00 ν.
Somit ergibt sich f¨ ur die zwei Frequenzen q q k g00 (x1 )ν1 = g00 (xk2 )ν2 ,
und f¨ ur die Rotverschiebung erhalten wir
p p g00 (xk2 ) − g00 (xk1 ) p z= . g00 (xk1 )
(2.44)
Die Rotverschiebung ist also in den statischen Raumzeiten nur vom Verh¨altniss der g00 -Komponenten der Metrik in den entsprechenden Punkten abh¨angig, und sie ist positiv, wenn das Signal im Gravitationsfeld steigt (d.h. vom Punkt mit kleinerem g00 zu demjenigen mit gr¨osserem g00 l¨auft). Wir haben eigentlich nirgends die Tatsache benutzt, dass die Geod¨ate lichtartig ist. Die Gl. (2.44) gilt also auch f¨ ur massive Teilchen, wenn wir definieren z=
1 − 2 , 2
wobei die (kinetische) Energie des Teilchens in Bezug auf das Ruhesystem des statischen Beobachters im betreffenden Punkt ist, = gµν uµ pν .
2.5.5
Verlangsamung des Uhrganges in starkem Gravitationsfeld
Die Formel (2.43) zeigt, dass das Newton-Gravitationspotential und die Komponente g00 der Metrik der statischen Raumzeiten eng zusammenh¨angen. Diese Komponente hat aber auch mit der Zeitmessung zu tun. Es scheint also, dass der Gang der Uhren vom Gravitatationsfeld beeinflusst wird. Wir wollen jetzt diese Erscheinung untersuchen. Wir wollen den Gang von zwei Uhren, eine bei dem statischen Beobachter (xk(1) ), die andere bei (xk(2) ), vergleichen. Das macht man am besten mit den Lichtsignalen: der Beobachter (xk(1) ) schickt im Intervall von ∆s(1) Sekunden, wie es von seiner idealen Uhr angegeben wird, ein Lichtsignal zu (xk(2) ). Der Beobachter (xk(2) ) misst 63
x0(2)3 x0(2)2 x0(2)1
x0(1)3 x0(1)2 x0(1)1 xk(1)
xk(2)
Abbildung 2.6: Velangsamung des Uhrganges mit seiner Uhr die Intervalle ∆s(2) zwischen den Ankunftzeiten der Signale. Das n-te Signal l¨auft entlang der lichtartigen Geod¨ate xµ = ynµ (λ), welche erf¨ ullt ynµ (λ(1) ) = (x0(1)n , xk(1) ), wobei
ynµ (λ(2) ) = (x0(2)n , xk(2) ),
∆s(1) . x0(1)n − x0(1)(n−1) = q g00 (xk(1) )
Nehmen wir an, dass die Bahn des ersten Signals bekannt ist. Die Bahn des zweiten k¨onnen wir offensichtlich durch die Verschiebung ∆s(1) , y20 (λ) = y10 (λ) + q g00 (xk(1) )
y2k (λ) = y1k (λ)
erhalten. In der Tat, die verschobene Kurve wird dieselben Werte von y˙ 2µ und y¨2µ wie die erste haben, und die Koeffizienten der geod¨atischen Gleichung (2.40) und (2.41) sind unabh¨angig von y20 (λ), welche sich bei der Verschiebung ge¨andert haben. Somit l¨ost die verschobene Kurve y2µ (λ) die Gleichung mit den richtigen Anfangsund Endwerten. 64
Die Werte der Zeitkoordinate x0 f¨ ur die Ankunft der Signale bei (xk2 ) werden dann gegeben durch x0(2)n = yn0 (λ(2) ), also 1 x0(2)n = x0(2)1 + (n − 1) q ∆s(1) , k g00 (x(1) )
und ihre Zeitdifferenz ist
∆s(2) ∆s(1)
q g00 (xk(2) ) . =q g00 (xk(1) )
(2.45)
Dieses Verh¨altnis dr¨ uckt also die relative Gang-Schnelligkeit der zwei untersuchten Uhren aus. Wir sehen, dass die Uhr dort langsamer geht, wo die Komponente g00 kleiner ist, d.h. in der Richtung der Gravitationsbeschleunigung. Dieser Effekt kann auch eine Erkl¨arung der Rotverschiebung geben, welche auf der Wellentheorie des Lichtes basiert. Die Maxima der Lichtwellen breiten sich entlang lichtartiger Geod¨aten aus. Wir k¨onnen also die Formel (2.45) auch f¨ ur das Verh¨altnis der Perioden der elektromagnetischen Schwingungen ben¨ utzen. Das f¨ uhrt wieder zur Formel (2.44). Die Tatsache, dass das Gravitationsfeld den Gang der Uhren beeinflusst, hat eine tiefe Bedeutung. Wie wir noch sehen werden, ist auch der Gang des Lichtes durch die Gravitation beeinflusst. Die Eigenzeitmessungen und der Lichtgang aber bestimmen die Geometrie der Raumzeit den Interpretationen der SRT nach. Wenn nun die Gravitation anwesend ist—und das ist immer der Fall—dann kommen wir zu Widerspr¨ uchen mit den Postulaten der Minkowskischen Geometrie. Es gigt im Prinzip zwei Auswege aus diesem Dilemma. 1. Wir k¨onnten die Minkowskische Geometrie beibehalten und versuchen, die Gravitation als ein Feld auf der Minkowskischen Raumzeit zu beschreiben. Die Wirkung der Gravitation auf den Gang des Lichtes und auf die Eigenzeitmessung sollte dann aus einer geeigneter Wechselwirkung zwischen den Uhren und dem elektrodynamischen Feld einerseits und dem Gravitationsfeld andererseits erkl¨art werden. Dann ist aber die Geometrie der Minkowskischen Raumzeit nicht mehr durch die Messungen bestimmt, wie es in der SRT vorgeschrieben ist. Was bestimmt die Geometrie dann? Wenn die Gravitation schwach ist, dann zeigt es sich, dass eine Minkowskische Hilfsmetrik eingef¨ uhrt werden kann, aber diese Metrik ist nicht eindeutig (als ein Feld auf der Mannigfaltigkeit) und sie ist nicht messbar; die kausale Struktur, Abst¨ande und Zeitintervalle sind sowieso vom Gravitationsfeld bestimmt. 2. Der Gang des Lichtes und die Eigenzeitmessungen bestimmen die Geometrie 65
der Raumzeit analog wie es in der SRT ist, sie ist aber dann keine Minkowskische Geometrie. (Das ist der Weg von ART.) Bemerken wir noch, dass die messbaren Eigenschaften der Raumzeitgeometrie die folgenden Strukturen einschliessen: 1. die kausale Struktur (welche Ereignisse welche beeinflussen), 2. die Zeitintervalle, 3. die Abst¨ande.
2.6
Isometrie (Mathematisches Intermezzo)
Im vorigen Abschnitt sind wir zum ersten Mal mit der Symmetrie der Raumzeiten in Ber¨ uhrung gekommen. Es lohnt sich, die Erscheinung etwas eingehender zu studieren. Dazu m¨ ussen wir zun¨achst lernen, wie man Objekte wie Tensoren durch eine Abbildung u ¨ bertr¨agt. Beginnen wir mit einem Beispiel.
2.6.1
Rotation in E2
Betrachten wir die Euklid-Ebene E2 mit den Kartesischen Koordinaten {x1 , x2 } und eine Drehung φ dieser Ebene um Winkel α. Ein Punkt p ∈ E2 mit Koordinaten xµ (p) geht u ¨ber in den Punkt q = φ(p) mit Koordinaten xµ (q), wobei (x1 (q), x2 (q)) = (x1 (p) cos α − x2 (p) sin α, x1 (p) sin α + x2 (p) cos α),
(2.46)
(x1 (p), x2 (p)) = (x1 (q) cos α + x2 (q) sin α, −x1 (q) sin α + x2 (q) cos α).
(2.47)
und
Diese Formel beschreiben eine sog. aktive Transformation; dabei werden die Punkte bewegt, nicht aber die Koordinaten ge¨andert; eine passive Transformation ist nichts als eine Koordinatentransformation, wobei die Punkte stehen und die Koordinaten sich ¨andern. Sei nun in p ein Vektor V µ durch seine Komponenten bez¨ uglich {xµ } gegeben. Wie u ¨bertragen wir V µ von p nach φ(p) durch φ? Man muss zwei Schritte machen. 1) Wir drehen das Koordinatensystem {xµ } und so erhalten wir das sog. φ-Bild {x0µ } davon: x01 = x1 cos α + x2 sin α,
x02 = −x1 sin α + x2 cos α,
(2.48)
x1 = x01 cos α − x02 sin α,
x2 = x01 sin α + x02 cos α.
(2.49)
66
Dann gilt x0µ (q) = xµ (p).
(2.50)
2) Im Punkt φ(p) definieren wir einen Vektor U µ durch seine Komponenten bez¨ uglich {x0µ } durch die Gleichung U 0µ = V µ .
(2.51)
Also, U µ = Xνµ0 U 0ν = Xνµ0 V ν , so dass nach (2.49), (U 1 , U 2 ) = (V 1 cos α − V 2 sin α, V 1 sin α + V 2 cos α).
(2.52)
Man bezeichnet diesen Vektor U µ im Punkt φ(p) durch (φ? V )µ . Auf diese Weise wird also die Abbildung von Tensoren durch φ definiert. Betrachten wir jetzt ein ganzes Vektorfeld V µ (x) auf E2 . Wir sagen, dass V µ (x) invariant in Bezug auf φ ist, wenn f¨ ur jeden Punkt p ∈ E2 gilt, dass der Vektor (φ? V (p))µ im Punkt φ(p) mit dem Vektor V µ (φ(p)) dort u ¨bereinstimmt. Definieren µ wir beispielsweise V (x) durch die Gleichungen: V 1 (x1 , x2 ) = x1 ,
V 2 (x1 , x2 ) = x2 .
Dann erhalten wir nach (2.52) und (2.46), dass ((φ? V (p))1 , (φ? V (p))2 ) = (V 1 (p) cos α − V 2 (p) sin α, V 1 (p) sin α + V 2 (p) cos α)
= (x1 (p) cos α − x2 (p) sin α, x1 (p) sin α + x2 (p) cos α) = (x1 (q), x2 (q))
= (V 1 (q), V 2 (q)).
unser Vektorfeld ist also invariant.
2.6.2
Diffeomorphismus
Wir wollen diese Ideen auf eine breitere Klasse der Abbildungen, R¨aume und Objekte ausdehnen. Dabei ist es g¨ unstig, die Koordinatensysteme als Abbildungen zu betrachten, wie schon auf S.8 gemacht. Ein Koordinatensystem {xµ } auf einer n-Mf. M hat einen Definitionsereich U , und es gibt eine Bijektion h : U → Rn , welche jedem Punkt p ∈ U seine Koordinaten, xµ (p), zuordnet. Gegeben zwei solche Karten, (U , h) zu Koordinaten {xµ } und (V, k) zu Koordinaten {y µ }, dann sind die Transformationsfunktionen y µ (x1 , . . . xn ) U ∩ V, identisch mit der zusammengesetzten Abbildung k ◦ h−1 . 67
Definition 10 M und N seien zwei n-Mannigfaltigkeiten, φ : M → N eine Bijektion. φ heisst ein Diffeomorphismus (Abk¨ urzung Diffeo), wenn die folgenden Bedingungen f¨ ur jeden Punkt p ∈ M erf¨ ullt sind: 1) Wenn (U , h) eine Karte um p und (V, k) eine Karte um φ(p) ist, dann sind die Funktionen k ◦ φ ◦ h−1 : Rn → Rn differenzierbar (C∞ ), 2) Die Matrix der ersten Ableitungen der Funktionen k ◦ φ ◦ h−1 hat eine nichtverschwindende Determinante. Dabei k¨onnen sowohl M und N als auch (U , h) und (V, k) u ¨bereinstimmen. Die rechte Seite von (2.46) ist ein Beispiel der Funktionen k ◦ φ ◦ h−1 . M und N seien zwei n-Mannigfaltigkeiten, φ : M → N ein Diffeo. Ferner sei p ∈ M und (U , h) eine Karte um p in M. Dann ist (φ(U ), h ◦ φ−1 ) eine Karte um φ(p) in N . Das folgt direkt aus der Definition von Diffeo, weil die Transformationsfunktionen zwischen den Karten (φ(U ), h ◦ φ−1 ) und (V, k) (Verallgemeinerung von (2.48)) mit den Funktionen k ◦ φ ◦ h−1 u ullen alle Bedingungen f¨ ur ¨bereinstimmen, und diese erf¨ −1 erlaubte Koordinaten. Wir nennen die Karte (φ(U ), h◦φ ) φ-Bild von (U , h). Wenn {xµ } die Koordinaten f¨ ur die Karte (U , h) und {x0µ } diejenigen f¨ ur (φ(U ), h ◦ φ−1 ) sind, dann gilt wieder Gl. (2.50). Definition 11 M und N seien zwei n-Mannigfaltigkeiten, φ : M → N ein Diffeo. O sei ein Objekt im Punkt p ∈ M, das durch eine wohl-definierte IG in Bezug auf beliebige Karte um p dargestellt wird. (U , h) sei eine Karte um p. Dann ist das Objekt φ? O durch die Bedingung definiert: die Darstellung von φ? O in Bezug auf (φ(U ), h ◦ φ−1 ) stimmt mit der Darstellung von O in Bezug auf (U , h) ¨ uberein. Die Bedingung, dass das Objekt wohldefinierte Komponenten in Bezug auf beliebige Koordinatensysteme besitzt, ist nicht trivial. Wenn auch alle Objekte, welche wir bisher kennengelernt haben (Tensoren und AZ), diese Bedingung erf¨ ullen, gibt es wichtige Objekte, welche es nicht tun (n¨amlich Spinoren). Endlich kommen wir zur Definition der Symmetrie. Definition 12 M sei eine n-Mannigfaltigkeit und φ : M → M ein Diffeo. Ferner sei O(x) ein Feld des Objektes O auf M. Wir sagen, dass das Feld O(x) invariant in bezug auf φ ist, wenn (φ? O)(x) = O(x). (2.53)
2.6.3
Lie-Ableitung
Studieren wir etwas eingehender infinitesimale Diffeos. Eine solche Transformation kann durch dφ bezeichnet werden. W¨ahlen wir einen Punkt p ∈ M und sei q = dφ(p). 68
W¨ahlen wir ferner eine feste Karte (U, h) um p; die entsprechenden Koordinaten seien {xµ }, und die Funktionen h ◦ dφ ◦ h−1 seien von der Form xµ (q) = xµ (p) + ξ µ (p)d.
(2.54)
ξ µ (p)d sind die Unterschiede der Koordinaten des (beliebigen) Punktes p und seines dφ-Bildes; da dφ infinitesimal ist, bilden diese Unterschiede einen Vektor in jedem Punkt, und so ist ξ µ (x) ein Vektorfeld auf M. Umgekehrt k¨onnen wir mit jedem glatten Vektorfeld auf M einen infinitesimalen Diffeo nach Gl. (2.54) verbinden. Dieses Vektorfeld heisst Erzeugende des infinitesimalen Diffeos. Die Inverse der Abbildung (2.54) ist xµ (p) = xµ (q) − ξ µ (q)d (2.55) In den Formeln (2.54) und (2.55) spielt es keine Rolle, in welchem Punkt, p oder q, man das Vektorfeld ξ µ nimmt, weil der Unterschied wieder von der Gr¨ossenordnung d ist; wir rechnen alles nur bis zu linearen Beitr¨agen in d aus. Bezeichnen wir das dφ-Bild von {xµ } durch {x0µ }. Aus der Definition folgt, dass x0µ (q) = xµ (p) Um die Transformation zwischen der Koordinatensystemen zu berechnen, m¨ ussen wir die beiden Koordinatensysteme in einem Punkt vergleichen. Die Beziehung (2.55) ergibt, dass die Transformationsformel und ihre Inverse haben die Form x0µ = xµ − ξ µ (x)d,
xµ = x0µ + ξ µ (x0 )d.
(2.56)
Die Ableitung davon ergibt ∂x0µ ∂xµ µ µ µ (p) = δν − ξ,ν (p)d, (p) = δνµ + ξ,ν (p)d, ν 0ν ∂x ∂x
(2.57)
∂ 2 x0ρ ρ (p) = −ξ,µν (p)d, (2.58) ∂xµ ∂xν wo es wiederum egal ist, ob man die gestrichenen oder ungestrichenen Komponenten µ µ der Ableitungen ξ,ν und ξ,µν , und ob man deren Werte im Punkt p oder q nimmt. Mit Hilfe der Formeln (2.54), (2.55), (2.57) und (2.58) k¨onnen wir das dφ-Bild verschiedener Felder berechnen. Sei beispielsweise χ(x) ein Skalarfeld auf M und ψ(x) sein dφ-Bild. Aus der Definition folgt, dass ψ(q) = χ(p). Wir wollen die Felder aber in einem Punkt vergleichen. Berechnen wir also den Wert von χ im Punkt q mit Hilfe der Gl. (2.55): ψ(q) = χ(q) − χ,µ (q)ξ µ (q)d. 69
(2.59)
Betrachten wir nun ein Vektorfeld U µ (x); sein dφ-Bild V µ (x) erf¨ ullt nach der Definition die Gleichung V 0µ (q) = U µ (p). wo wir jetzt auch die Komponenten der beiden Felder in verschiedenen Koordinaten schreiben m¨ ussen. Rechnen wir alles in ein Koordinatensystem {xµ } und einen Punkt q um. Wir erhalten V µ (q) = Xρµ0 V 0ρ (q) = Xρµ0 U ρ (p) µ ρ = (δρµ + ξ,ρ (q)d)(U ρ (q) − U,σ (q)ξ σ (q)d)
µ = U µ (q) − (U,ρµ (q)ξ ρ (q) − U ρ (q)ξ,ρ (q))d.
Die Argumente brauchen nicht mehr ausgeschrieben zu werden, da sie u ¨bereinstimen: µ V µ = U µ − (U,ρµ ξ ρ − U ρ ξ,ρ )d
(2.60)
Da AZ wohldefinierte Komponenten in Bezug auf Koordinatensysteme hat, k¨onnen wir eine analoge Berechnung auch f¨ ur AZ machen. Sei Γµρσ (x) ein AZ und ∆µρσ (x) sein dφ? -Bild. Nach der Definition muss gelten, dass µ ∆0µ ρσ (q) = Γρσ (p).
Das Umrechnen zum einen Punkt und einem Koordinatensystem beginnt jetzt so: µ α ∆µρσ (q) = Xαµ0 Xρβ Xσγ ∆0α βγ (q) + Xα0 Xρσ 0
0
0
α = Xαµ0 Xρβ Xσγ Γαβγ (p) + Xαµ0 Xρσ . 0
0
0
Weiter geht alles analog, und wir erhalten τ τ µ ∆µρσ = Γµρσ − (Γµρσ,τ ξ τ − Γτρσ ξ,τµ + Γµτσ ξ,ρ + Γµρτ ξ,σ + ξ,ρσ )d.
(2.61)
Wir brauchen noch eine Formel f¨ ur die kovarianten Tensorfelder zweiter Stufe (Typ (0,2)). Sie lautet: ρ ρ Tµν = Sµν − (Sµν,ρ ξ ρ + Sρν ξ,µ + Sµρ ξ,ν )d.
(2.62)
Der Unterschied zwischen einem Feld Φ und seinem φ? -Bild Ψ definiert die sog. LieAbleitung. Genauer: Die Lie-Ableitung Lξ Φ des Feldes Φ in Bezug auf das Vektorfeld ξ ist definiert durch Φ(x) − Ψ(x) = (Lξ Φ)(x)d. (2.63) Die Gln. (2.59) - (2.62) ergeben beispielsweise: Lξ χ = χ,ρ ξ ρ , 70
(2.64)
µ Lξ U µ = U,ρµ ξ ρ − U ρ ξ,ρ
τ τ µ Lξ Γµρσ = Γµρσ,τ ξ τ − Γτρσ ξ,τµ + Γµτσ ξ,ρ + Γµρτ ξ,σ + ξ,ρσ , ρ ρ Lξ Sµν = Sµν,ρ ξ ρ + Sρν ξ,µ + Sµρ ξ,ν .
(2.65) (2.66) (2.67)
Aus der Definition der Lie-Ableitung folgt, dass die Lie-Ableitung eines Tensorfeldes vom Typ (p, q) wieder ein Tensorfeld vom Typ (p, q) ist, weil sein Wert in einem Punkt der Unterschied von zwei Tensoren in diesem Punkt ist.
2.6.4
Killing-Vektorfeld
Im Abschnitt u ¨ber die statischen Raumzeiten haben wir ein Sonderfall der Metrik kennengelernt, welche von einer der Koordinaten unabh¨angig war. Wir konnten zwei n¨ utzliche Folgerungen davon ausn¨ utzen: 1. ein erstes Integral der geod¨atischen Gleichung, 2. beim Verschieben um einen konstanten Wert dieser Koordinate bleiben metrische Eigenschaften erhalten (die Verschiebung einer Geod¨ate ist wieder eine Geod¨ate). Wir wollen jetzt der Idee der Symmetrie eine kovariante Form geben. Sei (M, g) eine Raumzeit; nehmen wir an, dass es Koordinaten gibt, {¯ xµ }, so dass die Komponenten g¯µν der Metrik nicht von einer der Koordinaten, x¯κ , abh¨angen: ∂¯κ g¯ρσ (¯ x) = 0 ∀ρ, σ, x¯,
(2.68)
und ein festes κ. Die Metrik ist dann symmetrisch in Bezug auf die eindimensionale Gruppe von Transformationen x¯µ −→ x¯µ ,
µ 6= κ
x¯κ −→ x¯κ + t.
Jede Transformation einer solcher Gruppe heisst Isometrie. (Es ist einfach zu zeigen, dass dies eine Symmetriegruppe im Sinne des vorherigen Teiles dieses Abschnittes ist.) Definieren wir ein Vektorfeld ξ µ durch die Gleichung ξ¯µ = δκµ ; d.h., die Komponenten von ξ in Bezug auf {¯ xµ } sind durch die obige Gleichung gegeben: das definiert einen Vektor in jedem Punkt. Dann, ∂¯κ g¯ρσ (¯ x) = ξ¯µ ∂¯µ g¯ρσ (¯ x), 71
Die entsprechende Transformation ist vom Vektorfeld ξ¯µ generiert. Die Koordinaten {¯ xµ } heissen zur Symmetrie adaptiert. Wir wollen jetzt die Eigenschaft (2.68) des Vektorfeldes ξ in allgemeinen Koordinaten {xµ } ausdr¨ ucken. Wir erhalten: ξ ν = δκµ Xµ¯ν = Xκ¯ν , und ∂κ¯ g¯ρσ = ∂κ¯ (Xρ¯α Xσ¯β gαβ ) = Xρ¯α Xσ¯β Xκ¯ν gαβ,ν + Xρ¯ακ¯ Xσ¯β gαβ + Xρ¯α Xσ¯βκ¯ gαβ = Xρ¯α Xσ¯β Xκ¯ν gαβ,ν + Xρ¯γκ¯ Xσ¯β gγβ + Xρ¯α Xσ¯γκ¯ gαγ ¯
¯
= Xρ¯α Xσ¯β (Xκ¯ν gαβ,ν + Xαλ Xκ¯γλ¯ gγβ + Xβλ Xκ¯γλ¯ gαγ ) γ γ = Xρ¯α Xσ¯β (gαβ,ν ξ ν + gγβ ξ,α + gαγ ξ,β ).
Daraus folgt: die Gl. (2.68) ist ¨aquivalent zu ν ν gαβ,ν ξ ν + gνβ ξ,α + gαν ξ,β =0.
(2.69)
Diese Gleichung heisst Killing-Gleichung und das Vektorfeld ξ µ heisst Killing-Vektorfeld. (Ein Vergleich mit der Formel (2.67) zeigt, dass (2.69) ¨aquivalent zu Lξ g = 0 ist.) Isometrien haben Erhaltungsgesetze der Dynamik zu Folge. Die Wichtigkeit der Killing-Felder f¨ ur uns liegt in ihrer Eigenschaft, Integrale der geod¨atischen Gleichung zu liefern. Theorem 5 ξ µ (x) sei ein Killing-Vektorfeld. Dann ist die Gr¨osse Pξ := gµν ξ µ x˙ ν entlang jeder Autoparallelen erhalten. Beweis: W¨ahlen wir eine Autoparallele und beschreiben wir sie durch die Funktionen xµ (λ). Diese Funktionen m¨ ussen der Euler-Lagrange-Gleichung d 1 (gρν x˙ ν ) = gµν,ρ x˙ µ x˙ ν dλ 2 zum Lagrangian 12 gµν x˙ µ x˙ ν gen¨ ugen. Berechnen wir die Ableitung d d µ ν ρ (gµν ξ µ x˙ ν ) = gµν ξ,ρ x˙ x˙ + (gµν x˙ ν )ξ µ dλ dλ d 1 ρ ρ + gµρ ξ,ν )x˙ µ x˙ ν + (gρν x˙ ν )ξ ρ . = (gρν ξ,µ 2 dλ 72
Wenn wir ins letzte Glied aus der Euler-Lagrange-Gleichung einsetzen, erhalten wir: d 1 ρ ρ (gµν ξ µ x˙ ν ) = (gρν ξ,µ + gµρ ξ,ν + gµν,ρ ξ ρ )x˙ µ x˙ ν . dλ 2 Der Ausdruck im Klammer verschwindet, wenn ξ µ ein Killing-Feld ist, und somit verschwindet auch die Ableitung, WZZW. F¨ ur die statischen Raumzeiten in adaptierten Koordinaten gilt, dass gµν ξ µ x˙ ν = g0ν x˙ ν . (Die Konstanz dieser Gr¨osse haben wir ben¨ utzt, um die Rotverschiebung zu berechnen.)
2.7
Rotationssymmetrische Raumzeiten
Wie die Metrik einer rotationssymmetrischen Raumzeit in etwa aussieht k¨onnen wir intuitiv einsehen, indem wir die Metrik auf zweidimensionalen Rotationsfl¨achen studieren.
2.7.1
Rotationsfl¨ achen
E3 sei der 3-dimensionale Euklid-Raum und x, y, und z seien rechtwinklige Koordinaten in E3 . Die Profilkurve einer Rotationsfl¨ache F mit der Achse x = 0, y = 0 sei durch die Gleichung z = z(r) gegeben, wo r der Abstand von der Achse bedeutet. Ferner sei ϑ der Winkel der Drehung mit dem Wert Null an der xz-Ebene. Wir w¨ahlen die Funktionen r und ϑ als Koordinaten auf F . Die Koordinaten x, y, z eines Punktes r, ϑ der Fl¨ache sind gegeben durch: x = r cos ϑ,
y = r sin ϑ,
z = z(r).
(2.70)
Die Metrik, welche auf F von E3 induziert wird, berechnet man, indem man die Differentiale dx, dy und dz der E3 -Metrik aus den Beziehungen (2.70) berechnet: ds2 = dx2 + dy 2 + dz 2 = (cos ϑdr − r sin ϑdϑ)2 + (sin ϑdr + r cos ϑdϑ)2 + (z 0 dr)2
= [1 + z 02 (r)]dr 2 + r 2 dϑ2 . Die Metrik hat also die Form
ds2 = A(r)dr 2 + r 2 dϑ2 , wo A(r) = 1 + z 02 (r). 73
(2.71)
Die Drehungen um die z-Achse bilden eine Gruppe, welche jeden Punkt der Fl¨ache F in einen anderen Punkt von F bringt. Wenn wir die ganze Gruppe auf einen festen Punkt p in F wirken lassen, resultiert eine ganze Menge Punkte von F , wobei jeder Punkt davon eine Abbildung von p durch ein Element der Gruppe ist. Wir bezeichnen diese Menge durch O(p) und nennen sie der Orbit der Gruppe durch p. In unseren Fall sind die Orbits die Kreise r = konst. Die Funktion r ist konstant entlang der Orbits, sie ist also eine Invariante der Gruppe. Die Funktion ϑ spielt die Rolle einer Koordinate entlang der Orbits. Die Bedeutung der Glieder der Metrik (2.71) kann man wie folgt beschreiben. Das Glied r 2 dϑ2 misst die Gr¨osse (d.h. die L¨ange) des Orbits. In der Tat, Z √ L(p) = dϑ gϑϑ . Das Glied A(r)dr 2 misst den Abstand zwischen dem Orbit mit dem Wert r und dem mit r + dr. Wir beobachten, dass es keine Glieder der Form grϑ dr dϑ gibt. Das bedeutet geometrisch: ϑ konnte entlang verschiedener Orbits gerade so gew¨ahlt werden, dass die Kurven ϑ = konst. senkrecht auf die Orbits stehen. Was ist die geometrische Bedeutung der Invariante r? Im Einbettungsraum E3 ist r(p) z.B. der Abstand des Punktes p von der z-Achse. Um diesen Abstand zu messen, m¨ ussen wir aber aus der Fl¨ache F hinaustreten. Hat r auch eine Bedeutung innerhalb der Fl¨ache F ? Hier beschreibt sie im allgemeinen keinen Abstand von einem Zentrum: F braucht nicht einmal ein Zentrum zu haben. Doch die L¨ange L(p) des Orbits O(p) ist 2πr(p). L(p) kann im Prinzip gemessen werden, ohne dass man die Fl¨ache F verlassen w¨ urde. Diese L¨ange ergibt also die gesuchte geometrische Bedeutung von r.
2.7.2
Raumzeiten
Ein einfaches Beispiel einer rotationssymmetrischen Raumzeit ist die Minkowskische. Wenn wir die Kugelkoordinaten t, r, ϑ, ϕ einf¨ uhren, erhalten wir die MinkowskiMetrik in der Form: ds2 = dt2 − dr 2 − r 2 (dϑ2 + sin2 ϑdϕ2 ). Die Orbits sind jetzt 2-Fl¨achen r = konst., t = konst., die Funktionen r und t sind Invarianten der Drehgruppe. Das Glied r 2 (dϑ2 + sin2 ϑdr 2 ) in der Metrik ist die Metrik innerhalb des Orbits und das Glied dt2 − dr 2 misst die Abst¨ande zwischen den Orbits (t, r) und (t+dt, r +dr). Wiederum konnte man die Koordinaten ϑ und ϕ entlang der verschiedenen Orbits so w¨ahlen, dass die Fl¨achen ϑ = konst., ϕ = konst. senkrecht auf die Orbits stehen. Das ¨aussert sich darin, dass die Komponenten gtϑ , gtϕ , grϑ und grϕ der Metrik verschwinden. Und wiederum hat die Funktion r mit 74
der Gr¨osse der Orbits zu tun: das Fl¨acheninhalt des Orbits durch einen Punkt p ist 4πr 2 . Jetzt sind wir intuitiv vorbereitet, die folgende Definition anzunehmen: Definition 13 Die Raumzeit (M, g) ist rotationssymmetrisch, wenn darauf Koordinaten t, r, ϑ, und ϕ existieren, in welchen die Metrik die folgende Form hat: ds2 = g00 dt2 + 2g01 dt dr + g11 dr 2 − r 2 (dϑ2 + sin2 ϑdϕ2 ) ,
(2.72)
wobei die Komponenten g00 , g01 und g11 unabh¨angig von ϑ und ϕ sind. Die 2-Fl¨achen t = konst., r = konst. sind die Orbits der Drehgruppe. Die Metrik zerf¨allt in zwei Teile: einer misst die Abst¨ande entlang der Orbits, der andere die Abst¨ande zwischen den Orbits, und die Orbitkoordinaten ϑ und ϕ k¨onnen so gew¨ahlt werden, dass es keine Kreuzglieder gibt. Die Funktion r h¨angt mit dem Fl¨acheninhalt F (r) der Orbits durch den Punkt r zusammen: F (r) = 4πr 2 (p). Auch eine Raumzeit braucht kein Zentrum zu besitzen (z.B. schwarze L¨ocher). Die Metrik (2.72) ¨andert ihre Form nicht, wenn man die Koordinaten ϑ und ϕ “dreht”. Das ist die folgende Transformation. Wir stellen uns eine gedachte Einheitskugel um Ursprung des E3 Raumes vor. Die kartesischen Achsen seien x, y und z, und die entsprechenden Kugelkoordinaten seien ϑ und ϕ (d.h. ϑ ist der Winkel zwischen dem Ortsvektor und der z-Achse usw.). Die Metrik auf der Kugeloberfl¨ache ist ds2 = dϑ2 + sin2 ϑdϕ2 . (2.73) Seien x0 , y 0 und z 0 neue, beliebige kartesische Achsen; sie entstehen aus den vorherigen durch eine Drehung O (O ist eine orthogonale Matrix). Seien weiter ϑ0 und ϕ0 die entsprechenden neuen Kugelkoordinaten. Die Drehung f¨ uhrt zu einer Koordinatentransformation ϑ0 = ϑ0O (ϑ, ϕ), ϕ0 = ϕ0O (ϑ, ϕ), (2.74) welche kompliziert aber durch die Drehung wohldefiniert ist. Wir k¨onnen jetzt die Transformation (2.74) in der krummen Raumzeit (2.72) zusammen mit t0 = t und r 0 = r benutzen! Es ist klar, dass die Metrik in den neuen Kugelkoordinaten wieder die Form (2.73) hat, und dass dies auch durch das Eisetzen der Transfomationsformeln (2.74) in (2.73) resultiert. Die infinitesimalen Generatoren der Drehungen um die drei Koordinatenachsen sind die drei Vektorfelder ξxµ , ξyµ und ξzµ auf E3 , welche erf¨ ullen, z.B., r 7→ r, ϑ 7→ ϑ + ξxϑ dλ und ϕ 7→ ϕ + ξxϕ dλ. Durch Einsetzen in die Killing-Gleichung kann man leicht best¨atigen, dass die drei Vektoren ξx = (0, 0, − sin ϕ, − cot ϑ cos ϕ), (2.75) ξy = (0, 0, cos ϕ, − cot ϑ sin ϕ), 75
(2.76)
ξz = (0, 0, 0, 1),
(2.77)
Killing-Vektoren der Metrik (2.72) sind (Aufgabe). Wir bemerken insbesondere, dass die Killing-Felder unabh¨angig davon sind, wie die Komponenten g00 , g01 und g11 in den Raumzeiten (2.71) gew¨ahlt werden; sie haben also die gleiche Form f¨ ur flache und krumme Raumzeiten. Man kann zeigen, dass es keine Koordinaten gibt, welche gleichzeitig zu allen drei obigen Killing-Feldern angepasst sind. ¨ Die vorherige Uberlegung hilft uns, eine wichtige Eigenschaft jeder Geod¨ate (ob zeit-, licht- oder raumartig) in einer Raumzeit mit der Metrik (2.71) zu zeigen: Theorem 6 Zu jeder Geod¨ate t(λ), r(λ), ϑ(λ) und ϕ(λ) in einer kugelsymmetrischen Raumzeit gibt es eine Drehung (2.74), so dass diese Geod¨ate erf¨ ullt: ϑ0 (λ) = π/2 ∀ λ .
(2.78)
Beweis Die drei Killing-Felder (2.75), (2.76) und (2.77) f¨ uhren zu den ersten Integralen jx = −gµν ξxµ x˙ ν , jy = −gµν ξyµ x˙ ν , jz = −gµν ξzµ x˙ ν . Das Einsetzen f¨ ur die Metrik ergibt, dass ˙ jx = −r 2 (λ) sin ϕ(λ) ϑ(λ) − r 2 (λ) sin ϑ(λ) cos ϑ(λ) cos ϕ(λ) ϕ(λ), ˙ 2 2 ˙ jy = r (λ) cos ϕ(λ) ϑ(λ) − r (λ) sin ϑ(λ) cos ϑ(λ) sin ϕ(λ) ϕ(λ), ˙ jz = r 2 (λ) sin2 ϑ(λ) ϕ(λ), ˙
wobei jx , jy und jz eine konstante Dreizahl ist. Es gilt: jx sin ϑ(λ) cos ϕ(λ) + jy sin ϑ(λ) sin ϕ(λ) + jz cos ϑ(λ) = 0, wie das Einsetzen zeigt. Das kann wie folgt interpretiert werden: die Funktionen ϑ(λ) und ϕ(λ) beschreiben eine Kurve auf einer gedachten Kugeloberfl¨ache von Radius 1 und Zentrum (0, 0, 0) in E3 . Der Ortsvektor (sin ϑ(λ) cos ϕ(λ), sin ϑ(λ) sin ϕ(λ), cos ϑ(λ)) jedes Punktes der Kurve muss nach der obigen Gleichung in der Ebene liegen, welche senkrecht zur Vektor (jx , jy , jz ) steht und durch den Ursprung geht. Die Bewegung spielt sich also auf einem Hauptkreis ab. Wir k¨onnen jetzt die kartesischen Achsen so drehen, dass die z 0 -Achse parallel zum Vektor (jx , jy , jz ) ist; dann hat die neue ϑ0 Koordinate l¨angs des Hauptkreises den Wert (2.78), wzzw. 76
2.7.3
Geod¨ atische Gleichung im statischen Fall
Wir wollen jetzt zeigen, wie die Integration der geod¨atischen Gleichung im Falle einer statischen und rotationssymmetrischen Raumzeit durch die Existenz dieser Killing-Felder zu Quadraturen reduziert wird. Die Metrik einer sowohl statischen als auch rotationssymmetrischen Raumzeit kann, nach dem was f¨ ur diese zwei F¨alle schon gesagt worden ist, auf die folgende Form gebracht werden: ds2 = B(r)dt2 − A(r)dr 2 − r 2 (dϑ2 + sin2 ϑdϕ2 ) .
(2.79)
Diese Metrik l¨asst vier Killing-Felder zu: die drei (2.75)–(2.77) und ξt = (1, 0, 0, 0). Wir nennen das vierte Integral der Bewegung e: e = gµν ξtµ x˙ ν . Das Einsetzen f¨ ur die Metrik ergibt, dass ˙ e = B t.
(2.80)
Es gibt noch eine erhaltene Gr¨osse: das Lagrangian (S. 20), oder B t˙2 − Ar˙ 2 − r 2 (ϑ˙ 2 + sin2 ϑϕ˙ 2 ) = µ2 .
(2.81)
Betrachten wir nun eine konkrete Geod¨ate und w¨ahlen wir die Kugelkoordinaten, so dass die Gleichung (2.78) gilt. Das ergibt jx = 0, jy = 0 und jz , das wir ab jetzt einfach j nennen werden, ist j = r 2 ϕ. ˙ (2.82) Dann haben wir auch aus Eq. (2.81) B t˙2 − Ar˙ 2 − r 2 ϕ˙ 2 = µ2 . ˙ r˙ und φ˙ gel¨ost Die drei Gleichungen (2.80), (2.82) und (2.83) k¨onnen f¨ ur t, mit dem Resultat: s e2 j2 µ2 − 2 − , r˙ = ± A(r)B(r) r A(r) A(r) e , t˙ = B(r) j ϕ˙ = 2 . r Das sind die versprochenen Quadraturen. 77
(2.83) werden (2.84) (2.85) (2.86)
2.8
Asymptotisch flache Raumzeiten
In diesem Abschnitt wollen wir das Gravitationsfeld eines statischen, rotationssymmetrischen, isolierten Objektes studieren. Isoliert bedeutet, dass das Objekt alleine im Weltall ist, und dass sein Feld abnimmt, wenn man sich von ihm entfernt. In der Cartan-Friedrich-Theorie haben wir Rµνρσ ∼
1 ∂2Φ ∼ 3 → 0. 2 ∂r r
In der ART also wollen wir ¨ahnlich verlangen, dass die Raumzeit in grossem Abstand vom Zentrum der Quelle praktisch flach ist. Wir wollen jetzt diese Bedingung genauer formulieren. Es wird sich dabei zeigen, dass die Metrik schon gleich u ¨ber die Oberfl¨ache normaler K¨orper sehr nahe an der flachen Metrik ist. Das liegt daran, dass solche K¨orper im gewissen Sinn sehr stark verd¨ unnte Objekte sind.
2.8.1
Eddington-Robertson-Entwicklung
Zun¨achst sollten wir bestimmen, was “grosser Abstand” bedeutet. Ist das ein Kilometer, ein Lichtjahr, oder Millionen Lichtjahre? Das wird wohl von der Gr¨osse der Quelle abh¨angen. Jeder Quelle sollte eine L¨ange zugeordnet werden, welche ihre St¨arke ber¨ ucksichtigt. Eine solche L¨ange kennen wir: es ist der Gravitationsradius RG . Versuchen wir also den Abstand eines Punktes mit dem Wert der Radialkoordinate r von der Quelle als gross zu definieren, wenn r RG . Das Gebiet mit r RG bezeichnen wir als asymptotisches Gebiet. Im asymptotischen Gebiet ist demnach das Verh¨altnis (RG /r) ein kleiner Parameter. Wo ist das asymptotische Gebiet f¨ ur konkrete Systeme? Wir haben beispielsweise: Sonne Erde
RG = 1.477 × 103 m RG = 4.437 × 10−3 m
R = 6.960 × 108 m R = 6.371 × 106 m
Alle Punkte u ¨ber der Oberfl¨ache dieser zwei Himmelsk¨orper liegen also bereits tief im asymptotischen Gebiet. Setzen wir nun voraus, dass die Funktionen A(r) und B(r) in der Metrik (2.79) im asymptotischen Gebiet analytische Funktionen von (RG /r) sind, sich also in eine Reihe entwickeln lassen: A(r) = a0 + a1 (RG /r) + a2 (RG /r)2 + . . . B(r) = b0 + b1 (RG /r) + b2 (RG /r)2 + . . . Wir fordern, dass die Metrik im Limes r → ∞ gegen die Minkowski-Metrik strebt. Diese Bedingung bestimmt a0 und b0 : a0 = b0 = 1. 78
Wir fordern weiter, dass die Metrik die Newton-Physik richtig wiedergibt, mindestens bis zur ersten Ordnung im kleinen Parameter RG /r. Der Vergleich mit der Formel (2.43) zeigt, dass daf¨ ur A(r) = 1 und B(r) = exp 2Φ gen¨ ugt, wobei Φ das Newton-Potential ist. F¨ ur eine statische und rotationssymmetrische Quelle mit Masse M haben wir aber: GM = −(RG /r). Φ=− r Bis zur ersten Ordnung heisst das, dass B(r) = 1 − 2(RG /r), also b1 = −2. Es wird sich zeigen, dass die Glieder mit a1 und b2 kleinere Korrekturen zur Newton-Theorie ergeben, und dass die Glieder h¨oherer Ordnung mit heutigen Mitteln im Sonnensystem nicht messbar sind. Wir haben also die folgende Entwicklung: A(r) = 1 + 2γ(RG /r) + . . . (2.87) B(r) = 1 − 2α(RG /r) + 2(β − αγ)(RG /r)2 + . . .
(2.88)
wobei α, β und γ Konstanten sind. Die Formeln (2.87) und (2.88) heissen EddingtonRobertson-Entwicklung. Soll sie in erster Ordnung die Newton-Theorie wiedergeben, muss α = 1 sein. Die Form, in welcher die Konstanten β und γ vorkommen, hat vorwiegend geschichtliche Gr¨ unde. Ihre physikalische oder geometrische Bedeutung k¨onnen wir aus ihrem Platz in der Metrik ablesen. Die Konstante γ h¨angt mit der Kr¨ ummung des Raumes zusammen; der r¨aumliche Teil der Metrik, ds2 = (1 + 2γRG r −1 )dr 2 + r 2 (dϑ2 + sin2 ϑdϕ2 ). ist flach, wenn γ = 0 ist; wenn γ < 0, ist der Abstand zwischen den Orbits r und r + dr kleiner als dr; wenn γ > 0, ist dieser Abstand gr¨osser als dr. Durch die Konstante β h¨angt die Intensit¨at des Feldes auf eine nichtlineare Weise von der St¨arke der Quelle ab. Wir werden sp¨ater Messmethoden beschreiben, wie diese Konstanten bestimmt werden k¨onnen.
2.8.2
Energie- und Impulsbilanz
Asymptotisch flache Raumzeiten bilden eine wichtige Klasse von Models, wo eine Menge gew¨ohnlicher Begriffe der Physik einen guten Sinn hat, wie z.B. die Gravitationswellen und ihre Energie, Energie- und Impulsbilanz, Interpretation der Erhaltungsgesetze, und vieles mehr. F¨ ur unsere Zwecke sehen wir formal mathematisch die Entwicklung (2.87) und (2.88) als eine Art Definition der asymptotisch flachen Raumzeiten an (eine viel allgemeinere Definition ist m¨oglich). 79
Im Allgemeinen unterscheidet sich die Problematik der Energie- und Impulsbilanz in der ART wesentlich davon, was man von der Newton- oder SRT-Physik her gewohnt ist. Eine neue Schwierigkeit ensteht dadurch, dass Energie oder Impuls Komponenten eines 4-Vektors, also eines Tensors sind, und dass man im allgemeinen Tensoren in verschiedenen Punkten nicht vergleichen kann. Bei der Bilanz aber m¨ ussen wir diese am Anfang und am Ende des untersuchten Prozesses vergleichen, und der Anfang unterscheidet sich vom Ende mindestens in der Zeit; sie bilden verschiedene Punkte der Raumzeit. Betrachten wir ein Teilchen, das im einem Punkt, sagen wir p, startet, durch ein Feld beeinflusst, und in einem anderen Punkt, q, der Raumzeit wieder eingefangen wird. Hat es Energie verloren oder gewonnen? In der flachen Raumzeit l¨asst sich diese Frage immer sinnvoll beantworten, indem man die 0-Komponenten des 4er-Impulses des Teilchens in Bezug auf ein und dasselbe IS in beiden Punkten vergleicht. In der Tat, der Unterschied dieser zwei 4-Vektoren ist wieder ein 4er-Vektor und hat deshalb eine invariante Bedeutung. Man kann den Vergleich auch ohne IS durchf¨ uhren: man stellt ein Vierbein in p auf und transportiert dieses Vierbein parallel zu q. Dann zerlegt man die zwei 4er-Impulse bez¨ uglich dieser beiden Vierbeine und vergleicht ihre Komponenten. In einer krummen Raumzeit scheitern wir an der Schwierigkeit, dass es dort keinen eindeutigen Paralleltransport gibt—er h¨angt von der Verbindenden zwischen p und q ab. Man k¨onnte hier einzuwenden versuchen: durch das Experiment selber ist eine einzige Verbindende zwischen p und q ausgew¨ahlt und eindeutig bestimmt, n¨amlich die Bahn des Teilchens selbst. Warum sollen wir also diese nicht benutzen, um das Vierbein von p zu q zu transportieren? Man wird aber bemerken, dass man auf diese Weise nie zu einem Zuwachs oder Verlust von Energie oder Impuls in einem Gravitationsfeld kommt—sowohl der 4er-Impuls des Teilchens als auch das Vierbein werden dabei beide entlang der Bahn parallel transportiert, so dass die Komponenten des 4er-Impulses in Bezug auf das Vierbein konstant bleiben. Die Definition w¨are formal in Ordnung, aber trivial. Trotzdem gibt es manchmal Bedingungen, unter welchen eine Energiebilanz sinnvoll und nichttrivial ist. Nehmen wir an, dass die Kr¨ ummung in einem endlichen (kompakten) Gebiet G des Raumes in einer statischen Raumzeit konzentriert ist, und dass diese Raumzeit flach ausserhalb dieses Gebietes ist. Betrachten wir ein Teilchen, das ausserhalb von G startet, durch G fliegt und wieder ausserhalb von G eingefangen wird. Ein Vierbein kann jetzt von p zu q parallel transportiert werden, wobei man verlangt, dass die Verbindende ausserhalb von G verl¨auft. Dann ist das Vierbein in q durch eines in p eindeutig bestimmt, und somit die Bilanz wohldefiniert. Es ist diese Art Bilanz, welche physikalisch interessant ist. Die asymptotischen Raumzeiten kann man als einen Limesfall der obigen speziellen Bedingungen auffassen. In der Tat, wir k¨onnen z.B. die folgende Transformation 80
der Koordinaten in (2.79) machen: x = r sin ϑ cos ϕ, y = r sin ϑ sin ϕ, z = r cos ϑ.
(2.89)
(Trotz der Tatsache, dass diese Formeln die Form der Transformation von den krummlinigen Kugelkoordinaten zu den “geradlinigen” kartesischen Koordinaten haben, sind die neuen Koordinaten t, x, y und z auch krummlinig!) Dann gilt r= so dass dr =
p x2 + y 2 + z 2 ,
(2.90)
xdx + ydy + zdz , r
und wir erhalten, dass ds2 = dt2 − dx2 − dy 2 − dz 2 2 xdx + ydy + zdz 2 + (B − 1)dt − (A − 1) . r
(2.91)
Wenn nun Gln. (2.87) und (2.88) gelten, verschwinden alle Glieder in der zweiten Zeile der Gl. (2.91) im Limes r → ∞, und die Metrik wird die Form der MinkowskiMetrik in einem IS annehmen. Wenn das Teilchen also bei r = ∞ startet und bei r = ∞ wieder eintrifft, k¨onnen wir f¨ ur Energie und Impuls Bilanz ziehen, indem wir die Komponenten des 4er-Impulses am Anfang und am Ende in bezug auf die Koordinaten t, x, y und z vergleichen. Wie eindeutig sind die Koordinaten t, x, y und z im asymptotischen Gebiet bestimmt? Erstens, die Komponenten der Metrik h¨angen von t nicht ab, d.h., die Quelle bewegt sich nicht relativ zu diesen Koordinaten, und wir haben eine Analogie eines Ruhesystems des Zentralk¨orpers in der ART, wie wir es von der SRT her kennen. Damit sind die Boosts ausgeschlossen und die Koordinate t ist bis auf Verschiebungen t → t + ∆t bestimmt. Zweitens, die Funktion r, definiert durch Gl. (2.90), ist konstant entlang den Orbits der Drehgruppe. Das schliesst die r¨aumlichen Verschiebungen aus. Da alles rotationssymmetrisch ist, w¨ urde in einer analogen Situation in der SRT das Massenzentrum der Quelle bei r = 0 liegen, und so haben wir eine ART-Analogie eines massenzentrierten BS vor uns. Bleiben nur die r¨aumlichen Drehungen. Ein Koordinatensystem dieser Art nennen wir asymptotisches Bezugsystem (AB). Betrachten wir eine Autoparallele, welche durch die Funktionen t(λ), r(λ), ϑ(λ) und ϕ(λ) gegeben ist und welche erf¨ ullt, dass lim r(λ) = ∞
λ→∞
lim r(λ) = ∞.
λ→−∞
81
(2.92)
Wir k¨onnen das AB so drehen, dass 1 ϑ(λ) = π. 2 und die Transformationsformeln (2.89) werden zu: x(λ) = r(λ) cos ϕ(λ),
y(λ) = r(λ) sin ϕ(λ),
z(λ) = 0.
(2.93)
Die Komponenten des Tangentvektors x˙ µ zur Autoparallelen sind in Bezug auf das AB gegeben durch: ˙ t(λ), x(λ) ˙ = r(λ) ˙ cos ϕ(λ) − r(λ) sin ϕ(λ)ϕ(λ), ˙ y(λ) ˙ = r(λ) ˙ sin ϕ(λ) + r(λ) cos ϕ(λ)ϕ(λ), ˙
(2.94) (2.95)
z(λ) ˙ = 0. Wenn λ ein physikalischer Parameter ist, dann sind das Komponenten des 4erImpulses des Teilchens. Wir k¨onnen definieren: Definition 14 F¨ ur ein Probeteilchen, das die Bedingung (2.92) erf¨ ullt, ist der Asymµ µ ptotische 4er-Impuls p− am Anfang und p+ am Ende definiert durch ˙ pµ± = lim (t(λ), x(λ), ˙ y(λ), ˙ z(λ)) ˙ , λ→±∞
(2.96)
und das asymptotische Drehimpuls durch j±k = lim [y(λ)z(λ) ˙ − y(λ)z(λ), ˙ λ→±∞
z(λ)x(λ) ˙ − z(λ)x(λ), ˙ x(λ)y(λ) ˙ − x(λ)y(λ)] ˙ , (2.97) wobei die Koordinaten als diejenigen des asymptotischen Bezugsystems verstanden sind. ˙ Z.B. ist e− := t(−∞) die Energie des Teilchens gemessen am Anfang im AB. Aehnlich ist j− := x(−∞)y(−∞) ˙ − y(−∞)x(−∞) ˙ die z-Komponente des Drehimpulses des Teilchens in Bezug auf das gedrehte AB und somit der ganze Drehimpuls. Es ist der wirkliche Drehimpuls, nicht einer in Bezug auf einen Hilfsraum. Wir k¨onnen die Energie und den Drehimpuls in unserem statischen und rotationssymmetrischen Raumzeit bilanzieren ohne die Autoparallelengleichung explizit l¨osen zu m¨ ussen. Aus dem Erhaltungsgesetz (2.85) haben wir n¨amlich, dass ˙ ˙ e = B(∞)t(−∞) = t(−∞). 82
und ˙ ˙ e = B(∞)t(∞) = t(∞). Daraus sehen wir erstens, dass e+ = e− , also ist die asymptotische Energie erhalten, zweitens, dass das erste Integral E die Bedeutung der Energie in Bezug auf das AB hat (asymptotische Energie). Die Erhaltung der Energie folgt hier auch aus der Symmetrie des Feldes in Bezug auf Zeitverschiebungen (statische Raumzeit). ¨ Ahnlich f¨ ur den Drehimpuls: die Formeln (2.93) - (2.95) ergeben, dass x(λ)y(λ) ˙ − y(λ)x(λ) ˙ = r 2 (λ)ϕ(λ) ˙ = j. Der Drehimpuls ist also auch erhalten—j+ = j− —(das folgt aus der Rotationssymmetrie), und j ist nichts als das Drehimpuls in Bezug auf AB. Auf diese Weise kann man in asymptotisch flachen Raumzeiten die Energie- und Impulsbilanz machen. Die Eddington-Robertson-Entwicklung erm¨oglicht uns ausserdem, konkrete Funktionen von r f¨ ur A(r) und B(r) einzusetzen.
2.9
Bewegung der Planeten
Unsere n¨achste Aufgabe ist, die Metrik in einer Umgebung der Sonne durch Messungen und Beobachtungen zu bestimmen. Die Sonne kann man in einer sehr guten N¨aherung als statisch und rotationssymmetrich ansehen. Das Feld um die Sonne wird dann durch unser Linienelement (2.79) beschrieben. Ausserdem ist die Raumzeit ausserhalb der Sonne ein asymptotisches Gebiet, und man kann die Formeln (2.87) und (2.88) benutzen. Das Feld der Planeten st¨ort das statische und rotationssymmetrische Bild nur wenig. F¨ ur die meisten Zwecke kann diese St¨orung vernachl¨assigt werden. Die Planeten selber werden wir als Massenpunkte betrachten. Dann wird ihre Bewegung durch die Gln. (2.84) - (2.86) beschrieben. Es ist g¨ unstig, aus diesen Gleichungen den Parameter λ eliminieren. Wir dividieren (2.85) und (2.86) durch (2.84) und erhalten, dass √ dr e A p , (2.98) dt = µ B e2 µ−2 B −1 − j 2 µ−2 r −2 − 1
2.9.1
√ j A dr p dϕ = , 2 2 −2 −1 µ r e µ B − j 2 µ−2 r −2 − 1
(2.99)
Vergleich mit der Newton-Theorie
Die vollrelativistischen Gleichungen (2.98) und (2.99) sollen jetzt f¨ ur den Sonderfall von kleinen Geschwindigkeiten v 1 und schwachen Gravitationsfeldern (RG /r) 83
1 angewandt werden. In diesem Fall wird n¨amlich die Newton-Theorie eine gute N¨aherung sein. Das Gravitationsfeld muss auch deshalb schwach sein, damit die Gravitationsbeschleunigung keine zu hohen Geschwindigkeiten erzeugt. Aus Beobachtung folgt, dass v und (RG /r) nicht unabh¨angig sind: die kinetische und potentielle Energie der Planeten sind etwa vergleichbar: µv 2 ≈ µ(RG /r). (Das folgt auch aus der Newton-Mechanik—es ist der sogenannte Virialsatz, aber wir wollen die obige Beziehung nicht durch Newton-Mechanik begr¨ unden, denn diese soll erst hergeleitet werden.) Wenn der kleine Parameter durch δ bezeichnet wird und wir setzen v ≈ δ, dann ist RG /r ≈ δ 2 . Wir wollen die rechten Seiten von (2.98) und (2.99) nach Potenzen von δ entwikkeln, indem wir die Beziehungen (2.87) und (2.88) benutzen. Zun¨achst bemerken wir, dass e die totale relativistische Energie des Planeten in Bezug auf Unendlichkeit ist, und so gilt in nichtrelativistischer N¨aherung, dass e ≈ µ + , wobei
1 = µv 2 2 die kinetische Energie ist. Weiter haben wir j ≈ µr 2 ϕ˙ ≈ µrv ≈ µrδ, wobei der Punkt hier die Zeitableitung bezeichnet. Den Ausdruck unter der Wurzel in (2.98) und (2.99) k¨onnen wir umformen: 2 2 −2 −1 2 −2 −2 e µ B −j µ r −1≈ 1+ (1 + 2α(RG /r)) − j 2 µ−2 r −2 − 1 µ ≈ 2µ−1 + 2α(RG /r) − j 2 µ−2 r −2 . Hier sind alle Glieder von Gr¨ossenodnung δ 2 , und h¨ohere Korrekturen sind vernachl¨assigt worden. Die f¨ uhrenden Terme in den Gln. (2.98) und (2.99) lauten dann: dr dt ≈ p , 2µ−1 + 2α(RG /r) − j 2 µ−2 r −2 84
(2.100)
dϕ ≈
dr j p . 2 −1 µ r 2µ + 2α(RG /r) − j 2 µ−2 r −2
(2.101)
Eine wichtige Eigenschaft dieser Beziehungen ist, dass die Konstanten β und γ darin nicht vorkommen: sie werden erst in den Gliedern h¨oherer Ordnung erscheinen, welche hier weggelassen sind. Bei β versteht man es ohne weiteres, da β als Koeffizient bei einem Glied h¨oherer Ordnung schon in der Formel (2.88) vorkam. γ erscheint erst in Korrekturen h¨oherer Ordnung, weil die Geschwindigkeiten als klein gegen die Lichtgeschwindigkeit angenommen worden sind. Das Probeteilchen lotet dann die Raumzeit viel st¨arker in der Zeitrichtung als in den Raumrichtumgen aus. Da γ die Kr¨ ummung des Raumes beschreibt, muss sie relativ zu α unterdr¨ uckt werden. Wie man leicht beweisen kann (Aufgabe), stimmen die Formeln (2.100) und (2.101) (wenn α = 1) mit den Beziehungen u ¨berein, welche die Newton-Theorie liefert.
2.9.2
Drehung des Perihels
Wir kommen jetzt zu den relativistischen Korrekturen zur Newton-Theorie. Betrachten wir einen Planeten mit der Bahn, welche durch die Funktionen t(λ), r(λ), ϑ(λ) und ϕ(λ) gegeben ist. Es lohnt sich, die radiale Gleichung (2.84) zu studieren. Wir k¨onnen sie in der folgenden Form schreiben: r˙ 2 + Veff = E. wobei Veff (r) = e2 −
e2 j2 µ2 + + − µ2 , AB Ar 2 A
und E = e 2 − µ2 . (Wir w¨ahlen die Konstante E so, dass Veff (∞) = 0.) Diese Gleichung hat die Form der radialen Gleichung f¨ ur ein Teilchen von der Masse 1/2 im Potential Veff in der Newton-Theorie. Wie es bekannt ist, wird sich ein solches Teilchen so lange in einer Richtung in der Hohe E bewegen, bis es auf das Potential st¨osst, dann kehrt es um (Umkehrpunkt) und bewegt sich zur¨ uck, bis es wieder auf das Potential st¨osst, u.s.w. F¨ ur die Planetenbewegung brauchen wir genau ein solches Segment zwischen zwei Umkehrpunkten. Setzen wir also voraus, dass es in der Bahn ein Segment [a, b] von λ gibt, das die folgenden Bedingungen erf¨ ullt: (i) r(λ) ˙ > 0 λ ∈ (a, b), (ii) r(a) ˙ = r(b) ˙ = 0. 85
Wir bezeichnen durch R1 den kleineren der Werte r(a), r(b) und durch R2 den gr¨osseren. R1 heisst “Perihel” und R2 “Aphel”. Die ganze Bahn des Planeten besteht dann aus Kopien dieses Segments und seiner Zeitumkehr. Wir k¨onnen die zwei Funktionen in der Form einer Kurve in der euklidischen Hilfsebene mit Winkelkoordinaten r und ϕ eintragen. Die Anfangsdaten f¨ ur die Autoparallele sind in beiden Endpunkten gegeben durch: t = ti , t˙ = t˙i ,
ϑ = 21 π, ϕ = ϕi , ϑ˙ = 0, ϕ˙ = ϕ˙ i ,
r = R1,2 , r˙ = 0,
wobei i = 1, 2. Die Lagrangefunktion 1 1 1 1 L = B(r)t˙2 − A(r)r˙ 2 − r 2 ϑ˙ 2 − r 2 sin2 ϑϕ˙ 2 2 2 2 2 ist unter jeder einzelnen der folgenden drei Spiegelungen invariant: ϕ − ϕ0 → −(ϕ − ϕ0 ),
t − t0 → −(t − t0 ),
(λ − b) → −(λ − b). Die gespiegelten Kurven sind also wieder eine L¨osung der Gleichung der Autoparallelen. In Bezug auf eine zusammengesetzte Spiegelung, die aus allen dreien besteht, sind ebenfalls die Anfangsdaten invariant. Das so gespiegelte Segment stellt also eine Fortsetzung des urspr¨ unglichen dar (weil es zu gleichen Anfangsdaten geh¨ort). Als n¨achstes wollen wir den Winkel δϕ zwischen zwei nacheinanderfolgenden Perihel-Durchg¨angen berechnen. Wenn ∆ϕ der Unterschied der Winkelkoordinaten ϕ zwischen einem Aphel und einem Perihel ist, dann gilt: δϕ = 2∆ϕ − 2π. δϕ wird positiv, wenn sich das Perihel in der positiven Richtung dreht, Null, wenn das Perihel keine Drehung macht, und negativ, wenn das Perihel sich r¨ uckw¨arts dreht. ∆ϕ k¨onnen wir aber aus der Gl. (2.99) berechnen: Z R2 √ L dr ∆ϕ = A p 2 2 −2 −1 r e µ B − j 2 µ−2 r −2 − 1 R1 µ
Die unbekannten Konstanten E/µ und L/µ k¨onnen durch die Werte R1,2 ausgedr¨ uckt werden. Die Gleichung (2.84) impliziert n¨amlich, dass e2 µ−2 B −1 − j 2 µ−2 r −2 − 1 = 0 in den Punkten r = R1,2 . Somit haben wir zwei lineare Gln. f¨ ur (E/µ)2 und (L/µ)2 . Eine l¨angere Berechnung, welche aus dem Einsetzen f¨ ur E/µ und L/µ in das Integral, der Entwicklung in die Potenzen des kleinen Parameters RG /r und einigen 86
Quadraturen besteht, ergibt, dass 1 1 1 1 δϕ = 6πRG + (2α + 2γ − βα−1 ) . 2 R1 R2 3
(2.102)
Wenn sich das Perihel in der positiven Richtung dreht, muss β < 2α2 + 2αγ, wenn es sich in der negativen dreht, dann β > 2α2 + 2αγ, und wenn sich die Bahn nach einem Umlauf schliesst, dann β = 2α2 + 2αγ. Ist die Periheldrehung u ¨berhaupt messbar? Der grosse Vorteil des Periheldrehung besteht darin, dass sie kumulativ ist. Auch wenn der Winkelunterschied zwischen zwei benachbarten Perihel-Durchg¨angen sehr klein ist, erhalten wir nach einer grossen Anzahl Umdrehungen einen grossen Winkel. F¨ ur Merkur ist beispielsweise 1 RG RG + = 1.8 × 10−11 2 R1 R2 und er macht 415 Uml¨aufe pro Jahrhundert. Das ergibt: 1 (2α + 2γ − βα−1 ); (2.103) 3 Das ist der theoretische Wert f¨ ur Merkur. Die relevanten Resultate von optischen Beobachtungen von Merkur haben sich seit 1667 erhalten. Nachdem man die St¨oreffekte der anderen Planeten abzieht, wird die residuale Drehung daraus mit der folgenden Genauigkeit heute bestimmt: 415δϕ = 42.9800
415δϕ = 1.0034 ± 0.0033. 42.9800 Ausserdem laufen seit 1966 Radarmessungen, welche zum folgenden Wert f¨ uhren 415δϕ = 1.000 ± 0.002. 42.9800
(2.104)
Das heisst: unsere theoretischen Modelle des Sonnenfeldes (welche durch die drei Parameter α, β und γ voneinander unterschieden werden), sind nur dann im Einklang mit der Beobachtung, wenn α ≈ γ ≈ 1 zu β ≈ 1 f¨ uhrt. Sonne-Merkur ist nicht das einzige System, wo man relativistischen Korrekturen zu Newton-Theorie beobachten kann. Seit 1974 ist das sog. Doppelpulsar PSR 1913+16 eingehend studiert. Es ist ein Doppelstern, jeder der zwei Neutronensterne hat etwa die Masse einer Sonne und Radius 10 Km und sie laufen uneinander mit der Periode um 8 Stunden. Die Felder sind also wesentlich starker (aber immer noch “asymptotisch”), und die Geschwindigkeiten viel gr¨osser (aber immer noch nicht-relativistisch). Weitere Systeme dieser Art sind im Jahr 1990 entdeckt (PSR 2127+11C und PSR 1534+12). Mehrere Effekte k¨onnen beobachtet werden, nicht nur “α − β − γ”, z.B. die Gravitationswellen (indirekt, durch verkleinerung der Periode). F¨ ur Einzelheiten siehe [3]. 87
2.10
Lichtsignale im Sonnensystem
Betrachten wir ein Lichtsignal, das an der Sonne vorbeifliegt. Seine Bahn sei durch die Funktionen t(λ), r(λ), ϑ(λ) und ϕ(λ) beschrieben. Dann sollen diese Funktionen die Gleichungen (2.84)–(2.86) mit µ = 0 erf¨ ullen. F¨ ur die Autoparallele sollen wieder die Beziehungen (2.92) gelten. Wir setzen weiter voraus, dass sich das Photon f¨ ur λ ∈ (−∞, λ0 ) der Quelle n¨ahert, r˙ < 0, dann einen minimalen Wert R der Koordinate r bei λ = λ0 erreicht, und sich anschliessend, f¨ ur λ ∈ (λ0 , ∞), wieder zu r = ∞ entfernt, r˙ > 0. Wiederum ist die Bahn im Hilfsraum (t, r, ϕ) spiegelsymmetrisch um den Punkt, wo r = R. In der Beziehung (2.84) gilt also zun¨achst das untere Vorzeichen und sp¨ater das obere. F¨ ur R erhalten wir aus (2.84) die Formel: B(R) e2 = , j2 R2
(2.105)
weil r(λ ˙ 0 ) = 0 ist. Die Gln. (2.84), (2.85) (2.86) und (2.105) ergeben, dass dt = ± dϕ = ±
s R
A(r)B(R) rdr p , B(r) B(R)r 2 − R2 B(r)
p
(2.106)
A(r)B(r) dr p . r B(R)r 2 − R2 B(r)
(2.107)
So konnten wir die unbekannte Kostante E/L durch den bekannten Impaktparameter R ausdr¨ ucken, und den Parameter λ ausschliessen.
2.10.1
Ablenkung des Lichtes
Zun¨achst wollen wir berechnen, wie das Gravitationsfeld der Quelle die Bahn des Photons ablenkt, d.h., wie sich die Richtung des Signals am Anfang von derjenigen am Ende unterscheidet. Das ist im Grunde die Bilanz des linearen Impulses, weil die Richtung des 3er-Impulses mit der Richtung des Signals u ¨bereinstimmt. Studieren wir das Funktionenpaar (x(λ), ˙ y(λ)). ˙ Die Gln. (2.94) und (2.95) ergeben
x(λ) ˙ y(λ) ˙
= r(λ) ˙
sin ϕ(λ) cos ϕ(λ) − r(λ) dϕ dr dϕ sin ϕ(λ) + r(λ) dr cos ϕ(λ) 88
.
Die Ablenkung erhalten wir als Winkel zwischen den Vektoren (x(−∞), ˙ y(−∞)) ˙ und (x(∞), ˙ y(∞)). ˙ Wegen Gl. (2.107) ist r(±∞)
dϕ (±∞) = 0. dr
also (x(±∞), ˙ y(±∞)) ˙ = r(±∞)(cos ˙ ϕ(±∞), sin ϕ(±∞)). Da r(−∞) ˙ < 0 und r(+∞) ˙ > 0 und |r(−∞)| ˙ = |r(∞)| ˙ wegen der Spiegelsymmetrie ist, k¨onnen wir schreiben (x(−∞), ˙ y(−∞)) ˙ = |r(−∞)| ˙ [cos(ϕ(−∞) + π), sin(ϕ(−∞) + π)] (x(∞), ˙ y(∞)) ˙ = |r(∞)|(cos ˙ ϕ(∞), sin ϕ(∞)). Die Richtungen dieser zwei Vektoren in sehr entfernten Punkten k¨onnen trotz der Kr¨ ummung der Raumzeit verglichen verden, da ihre Komponenten in bezug auf AB gegeben sind. Die Lichtablenkung δϕ ist somit gegeben durch: δϕ = ϕ(∞) − ϕ(−∞) − π. Den Unterschied ϕ(∞) − ϕ(−∞) berechnen wir wie folgt: Z ∞ Z ∞ Z R Z ∞ dϕ dϕ dϕ dλ r˙ dλ ϕ˙ = dr dr ϕ(∞) − ϕ(−∞) = = + dr dr dr −∞ −∞ ∞ R p Z ∞ R A(r)B(r) =2 dr p r B(R)r 2 − R2 B(r) R
(2.108)
(die letzte Gleichheit gilt wegen der Spiegelsymmetrie). Die Berechnung des Integrals bis zu ersten Korrekturen in (RG /R) ist eine l¨angere, aber relativ einfache Aufgabe. Als Resultat erhalten wir, nach Einsetzen in Gl. (2.108), dass R α+γ δϕ = 4 G . (2.109) R 2 F¨ ur die Sonne, deren Oberfl¨ache vom Signal gerade gestrichen wird, wenn also R gleich dem Sonnenradius ist, haben wir (wenn die Radians in die Graden umgerechnet werden): α+γ δϕ = 1.75100 × . (2.110) 2 Der ganze Effekt besteht aus zwei Summanden: dem α-Teil und dem γ-Teil. Den α-Teil f¨ ur α = 1 kann man aus der Newton-Theorie und dem Aequivallenzprinzip herleiten, indem man die Ablenkung eines massiven Teilchens berechnet, das mit Lichtgeschwindigkeit fliegt. Die Bahn wird unabh¨angig von der Masse des Teilchens sein, so k¨onnen wir zum Limes µ → 0 u ¨bergehen. Die neuesten Messungen sind 89
1. Die Sonnenfinsternis Beobachtung 1973, mit den Resultat α+γ = 0.95 ± 0.11, 2 2. und die VLBI Method (1991) mit α+γ = 1.0001 ± 0.001, 2 Die Messung ist einerseits ein Test, dass auch der Raum gekr¨ ummt sein muss: α kann die Messung alleine nicht erkl¨aren, man muss auch noch γ ≈ 1 setzen. Die Lichtablenkung ist andererseits f¨ ur die theoretische Physik von grosser Bedeutung. Nach der SRT n¨amlich kann kein kausales Signal schneller als Licht laufen. Somit ist die Grenze des Zukunftlichtkegels eines Punktes p die absolute Grenze jenes Teils der Raumzeit, welche von p beeinflusst werden kann. Wegen des Lichtablenkungseffektes deformiert die Gravitation diese Grenze. D.h., das Gravitationsfeld bestimmt die kausale Struktur der Raumzeit. Die schwarzen L¨ocher liefern Beispiele der kausalen Strukturen, welche sich wesentlich von derjenigen der MinkowskiRaumzeit unterscheiden.
2.10.2
Verz¨ ogerung der Radarsignale
Man kann heute Radarsignale zu verschiedenen Objekten im Sonnensystem senden, die reflektierten Impulse empfangen und die dazwischen liegende Zeitdauer genau messen. Betrachten wir den folgenden Versuch: man sendet von der Erde bei dem Radius R1 ein Signal aus, das knapp vorbei an der Sonne (Impaktparameter R) fliegt, durch einen K¨orper am Radius R2 gespiegelt wird und l¨angs der gleichen Bahn zur¨ uckkommt. Da die Planeten und Satelliten langsam relativ zur Lichtgeschwindigkeit laufen, k¨onnen wir sie als statisch betrachten. Die Koordinatenzeit, welche das Radarsignal von R1 zu R braucht, ist durch (2.106) gegeben: Z R1 s A(r)B(R) dr p t(R, R1 ) = r . (2.111) 2 B(r) B(R)r − R2 B(r) R
Die ganze Hin- und Herzeit ∆s ist also:
∆s = 2[t(R, R1 ) + t(R, R2 )]
p B(R1 ),
(2.112)
p wobei der Faktor B(R1 ) die Koordinatenzeit in die Eigenzeit des Beobachters umrechnet. Nach l¨angeren Berechnungen erhalten wir 4R1 R2 R2 + 2(α + γ)RG log , (2.113) ∆s = 2D + 2αRG 1 − R1 R2 90
wobei
q q 2 2 D = R1 − R + R22 − R2
der “Euklidische Abstand” zwischen der Erde und dem Spiegelobjekt ist. Wenn man α = 1 setzt, ist die Formel geeignet zur Messung von γ. Man sieht, dass die Kr¨ ummung des Raumes den Weg des Lichtes l¨anger macht. Die Verz¨ogerung der Radarsignale war im Unterschied von den anderen bisher besprochenen Effekten nicht von Einstein vorhergesagt worden. Die Existenz eines solchen Effektes wurde erst von I. I. Shapiro (Phys. Rev. Letters 13, 789 (1964)) theoretisch begr¨ undet. Um ihn zu messen, hat man drei Typen von Spiegelobjekten ben¨ utzt: a) die Planeten Merkur und Venus (passives Spiegeln), b) Sonnensatelliten als aktive Retransmitter (Mariner 6, 7, 1975), α+γ = 1.00 ± 0.02, 2 c) Satelliten von Planeten (Viking bei Mars, Mariner 9 bei Venus). Das Viking-Resultat (Shapiro I.I. et al: J: Geophys. Res. 82, 4329 - 4334 (1977)) ist: α+γ = 1.00 ± .01 2 Das entspricht in etwa dem Ergebnis aus Messungen von γ mittels Lichtablenkung.
2.11
Aufgaben
1. M sei eine n-Mf. mit der Metrik gµν . Beweise: die Signatur von gµν (x) ist unabh¨angig von x ∈ M .
Hinweis: ben¨ utze den folgenden Satz aus der linearen Algebra: Die Eigenwerte λ1 , . . . , λn und die Eigenvektoren V1µ , . . . , Vnµ einer symmetrischen Matrix gµν , gµν Viν = λi δµν Viν , h¨angen stetig von gµν ab, λi sind allesamt real und Viµ erf¨ ullen δµν Viµ Vjν = δij .
2. M sei eine n-Mf. mit Metrik gµν , p ∈ M , und {xµ } sei ein Koordinatensystem um p. Beweise, dass die folgenden zwei Gleichungen ¨aquivalent sind: ∂ρ gµν (p) = 0, {ρµν }(p) = 0, 91
∀ρ, µ, ν;
∀ρ, µ, ν.
3. M sei n-Mf. mit AZ Γµρσ und der Metrik gµν . Beweise: die folgenden Aussagen sing ¨aquivalent: (a) Der AZ ist metrisch, Γµρσ = {µρσ }; (b) gµν uµ v ν ist l¨angs jeder Kurve C in M konstant, sofern uµ und v µ l¨angs C parallel transportierte Vektoren sind. 4. Sei lµ = (∆x0 − 21 dx0 , dxk ) der Vektor, der senkrecht auf die 4er-Geschwindigkeit des Beobachters xk steht. Beweise, dass f¨ ur den Abstand dl der zwei k k k Beobachter x und x + dx gilt dl2 = −ˆ gkl dxk dxl = −gµν lµ lν . 5. Eine Raumzeit habe die Metrik ds2 = dt2 − R2 (dχ2 + sin2 χ dϑ2 + sin2 χ sin2 ϑ dϕ2 ), wo R eine Konstante ist. Das ist die Metrik des sog. Einstein-Weltalls, dessen Mf. M = R × SR3 ist, wo SR3 die dreidimensionale Kugeloberfl¨ache ist, also wenn in E4 eingebettet, SR3 = {x ∈ E4 |kxk2 = R2 }, und die Metrik auf SR3 ergibt sich, wenn man durch die vierdimensionalen Kugelkoordinaten 0 ≤ χ ≤ π, 0 ≤ ϑ ≤ π und 0 ≤ ϕ ≤ 2π parametrisiert. Berechne:
(a) die Autoparallelgleichung, (b) die Komponenten des AZ’s, (c) die Metrik gˆkl f¨ ur die Beobachter l¨angs der t-Kurven, (d) alle Lichtstrahlen, welche die Bedingung ϑ˙ = ϕ˙ = 0 erf¨ ullen; wie lange braucht das Licht, um um das ganze Weltall herumzulaufen? 6. Schreibe die statische Metrik wie folgt ds2 = V 2 dt2 − γkl dxk dxl , k,l=1,2,3, wobei V = V (x1 , x2 , x3 ) und γkl = γkl (x1 , x2 , x3 ). Berechne alle Christoffel-Symbole Γµρσ der 4er-Metrik in Abh¨angigkeit von V und γkl und zeige: Γkij = γijk , wobei γijk die Christoffel-Symbole der 3er-Metrik γkl sind. 92
7. Schreibe die Bewegungsgleichungen eines Probek¨orpers in der statischen Raumzeit der Aufgabe 6 um als ein System von 3 Gleichungen f¨ ur die 3 Funktionen 1 2 3 0 x (λ), x (λ) und x (λ) (x (λ) nicht mehr vorhanden; das Erscheinen einer Integrationskonstante soll nicht verwirren). Finde eine erhaltene Gr¨osse f¨ ur dieses System, welche nur von xk (λ) und x˙ k (λ), k = 1, 2, 3 abh¨angt. 8. Benutze die Resultate aus Aufgabe 7 um den 4er-Kr¨ ummungstensor zu berechnen. (a) Zeige: k k Rlmn = rlmn , k k wobei rlmn der Kr¨ ummungstensor des 3er-AZ’s γmn ist.
(b) Zeige: 0 Rlmn = 0.
(c) Zeige: 0 Rk0l
m −V,kl + γlk V,m . = V
9. Berechne die Vektorfelder ξxk , ξyk und ξzk , welche die Drehungen um die drei Achsen x, y und z der E3 erzeugen. Rechne in den kartesischen Koordinaten x, y und z und transformiere das Resultat in die Kugelkoordinaten r, ϑ und ϕ. Beweise: (a) Die drei Vektorfelder ξxk , ξyk und ξzk sind Killing-Vektoren der Metrik ds2 = dx2 + dy 2 + dz 2 . (b) Die drei Vektorfelder ηxµ , ηyµ und ηzµ definiert durch ηx0 = ηy0 = ηz0 = 0, und ηxk = ξxk ,
ηyk = ξyk ,
ηzk = ξzk ,
(in den Kugelkoordinaten!) sind Killing-Vektoren der Metrik ds2 = g00 (t, r)dt2 + 2g01 (t, r)dtdr − g11 (t, r)dr 2 − r 2 (dϑ2 + sin2 ϑ dϕ2 ). Die Aufgaben 10–13 betreffen eine beliebige statische, rotationssymmetrische und asymptotisch flache Raumzeit. 93
10. Ein kr¨aftefreies Teilchen mit Masse m zerfalle an einem Punkt der Raumzeit in zwei kr¨aftefreie Teilchen mit Massen m1 und m2 . Die Trajektorien der drei Teilchen seien mit dem physikalischen Parameter parametrisiert; E, E1 und E2 , Lx , Ly und Lz , L1x , L1y und L1z , L2x , L2y und L2z seien die entsprechenden Integrale der Bewegung. Beweise die Gleichungen: E = E 1 + E2 , Lx = L1x + L2x , Ly = L1y + L2y , Lz = L1z + L2z . 11. Ein kr¨aftefreies Teilchen mit Masse m startet von r = ∞ mit Energie E, erreicht dann einen Punkt mit Koordinate r = R, und zerf¨allt in ein gebundenes (d.h., es kann r = ∞ nie erreichen), kr¨aftefreies Teilchen mit Masse m1 und ein zweites kr¨aftefreies Teilchen mit Masse m2 , dass aber nun r = ∞ mit Energie E2 erreichen kann. (a) K¨onnen die asyptotischen Beobachter durch diesen Prozess Energie gewinnen? (b) Gleiche Fragestellung f¨ ur Drehimpuls Lx , Ly , Lz . 12. Berechne die 4er-Beschleunigung einer rein kreisf¨ormigen Bewegung am Radius r = R f¨ ur ein kr¨aftefreies Teilchen. (Muss man denn viel rechnen?) 13. Berechne die Energie E und den Drehimpuls L einer rein kreisf¨ormigen Bewegung am Radius r = R f¨ ur ein kr¨aftefreies Teilchen mit Masse µ im asymptotischen Gebiet. Benutze dabei die Metrik, wo alle quadratische und hohere Glieder in RG /r vernachl¨assigt sind. Hinweis: Analogie zum “Keplerproblem und effektives Potential” der Mechanik. 14. Schreibe die Newtonsche Lagrange-Funktion f¨ ur die Bewegung eines Massenpunktes mit Masse µ im Gravitationsfeld einer Zentralmasse M . Benutze die Erhaltungsgesetze f¨ ur die Energie E und den Drehimpuls L, um die dynamischen Gleichungen auf die Form dt = Ft (µ, M, E, L; r)dr, dϕ = Fϕ (µ, M, E, L; r)dr zu bringen. Finde die Funktionen Ft und Fϕ und vergleiche sie mit den relativistischen Formeln. 94
15. Der Doppelpulsar PSR1913+16 ist ein System von zwei Neutronensternen mit Massen etwa je 1.4 MSonne und Radius etwa 10 km, welche umeinander kreisen. Die Drehung des Periastron wurde beobachtet: δϕ ≈ 4.2o /Jahr! Benutze unsere Formel f¨ ur die Periastrondrehung und das Newtonsche Keplergesetz, um daraus a) den Abstand der zwei Sterne, b) die Periode der Bewegung abzusch¨atzen. 16. Veranschaulichung der Kr¨ ummung des Raumes um einen Stern: Finde die Rotationsfl¨ache in E3 , deren Metrik bis auf die Glieder von Gr¨ossenordnung RG /r mit derjenigen u ¨bereinstimmt, welche von der Aequatorialfl¨ache ϑ = π/2, t =const in der Raumzeit getragen wird (Robertson-Eddington-Entwicklung).
95
Kapitel 3 Dynamik der Felder Im letzten Kapitel haben wir die Bewegung der Massenpunkte in krummen Raumzeiten studiert; das gab uns bestimmte Vorstellung dar¨ uber, wie die Dynamik der Massenpunkte und der Lichtstrahlen durch die Kr¨ ummung der Raumzeit beeinflusst wird. In der modernen theoretischen Physik sind aber nicht die Massenpunkte, sondern Felder Grundbausteine der Natur. In diesem Kapitel wollen wir zu den Feldern u ¨bergehen; dabei soll keine systematische Feldtheorie aufgebaut, sondern nur einige Grundbegriffe eingef¨ uhrt werden, welche unentbehrlich f¨ ur die weitere Entwicklung der ART sind. Darunter f¨allt die kovariante Ableitung f¨ ur beliebige Tensorfelder, der Energie-Impuls-Tensor, und einiges u ¨ber Variationsprinzipien. Es wird vorausgesetzt, dass man die wichtigsten Fakten u ¨ber relativistische Feldtheorie wie z.B. Elektromagnetismus weiss. Wir schliessen mit dem Postulieren und einer Diskussion der Einstein-Gleichungen; das sind die dynamischen Gleichungen der ART.
3.1
Beispiel: Elektrodynamik
In diesem Abschnitt wollen wir die Elektrodynamik als Beispiel einer Feldtheorie in der SRT betrachten. Wir benutzen hier ausschliesslich den Viererformalism; z.B. wird aus dem Potential φ und dem Vektorpotential Ak ein Viererpotential Aµ mit vier Komponenten A0 = φ, Ak . Das elektromagnetische Feld in der SRT wird durch dieses 4er-Potential Aµ (x) beschrieben. Es ist ein Kovektorfeld, d.h., jedem Punkt x der Minkowskischen Raumzeit wird ein Kovektor zugeordnet, der durch seine Komponenten Aµ (x) in Bezug auf ein IS gegeben ist. Der Tensor des elektromagnetischen Feldes ist dann definiert durch Fρσ = ∂ρ Aσ − ∂σ Aρ . 96
(3.1)
Die Bedeutung der Komponenten von Fµν in einem IS ergibt sich aus der sogenannten 3+1 Spaltung davon: X Ek = F0k , Bk = (1/2) εkrs Frs , r,s
wobei Ek und Bk das elektrische Feld und die magnetische Induktion sind; εkrs ist eine sehr n¨ utzliche Gr¨osse, welche total antisymmetrisch in allen drei Indizes k = 1, 2, 3, r = 1, 2, 3, und s = 1, 2, 3 ist, und ε123 = 1. Damit ist die Gr¨osse eindeutig definiert. Man kann die wichtige Identit¨at daf¨ ur zeigen: X εkmn εkrs = δmr δns − δms δnr . (3.2) k
(Beweis: Uebung). Der physikalische Inhalt des Potentials wird nicht durch eine Eichtransformation ge¨andert: Aµ 7→ Aµ + ∂µ Λ,
(3.3)
wobei Λ eine beliebige Funktion ist. Fµν ist eichinvariant. Die Dynamik des (freien) Feldes wird bestimmt durch das Wirkungsprinzip δS = 0, wobei Z 1 S=− d4 x F ρσ Fρσ , (3.4) 16π und F ρσ = g ρκ g σλ Fκλ . (3.5) Da wir in einem IS arbeiten, hat die Metrik gµν der flachen Raumzeit die kanonische Form gµν = Diag(1, −1, −1, −1).
3.1.1
Aequivalenzprinzip
Wir wollen die Lagrangefunktion (3.4) in der Wirkung so verallgemeinern, dass es auch noch bei Anwesenheit von Gravitation g¨ ultig ist. Dazu versuchen wir das Aeqivalenzprinzip in der Form des Prinzips der allgemeinen Kovarianz zu benutzen: Wir schreiben die Lagrangefunktion (3.4) in ein beliebiges krummliniges Koordinatensystem in der flachen Raumzeit um, und zwar so, dass die Transformationskoeffizienten Xνµ durch Ausdr¨ ucke in den Komponenten der Metrik ersetzt werden. Dann postulieren wir, dass die so erhaltene Lagrangefunktion ebenfalls f¨ ur gekr¨ ummte Raumzeiten die richtige Dynamik liefert (minimale Kopplung). Seien also {xµ } die Koordinaten eines IS und {x0µ } diejenige eines beliebigen BS. Aµ (x) transformiert sich als Kovektor, d. h.: 0
Aµ (x) = Xµρ A0ρ (x0 ), 97
wobei x und x0 Koordinaten eines und desselben Punktes in Bezug auf die zwei Systeme sind. Wir erhalten 0 0 0 Fµν = Xµρ Xνσ Fρσ , (3.6) wobei 0 Fρσ = ∂ρ0 A0σ − ∂σ0 A0ρ
(3.7)
in krummlinigen Koordinaten genau wie in einem IS definiert wird (wir haben ∂/∂x0ρ als ∂ρ0 abgek¨ urzt). Die Gleichungen (3.6) und (3.7) gelten allgemein: antisymmetrisierte Ableitungen eines Kovektorfeldes transformieren sich wie ein Tensor. Wir k¨onnen also den Skalar F ρσ Fρσ in der Lagrangefunktion (3.4) transformieren: 0 0 F ρσ Fρσ = g ρκ g σλ Fκλ Fρσ = g 0ρκ g 0σλ Fκλ Fρσ ,
da die beiden Gr¨ossen g und F Tensoren sind. Hier kommen nun keine Transfor0 mationskoeffizienten Xµρ oder Ableitungen davon mehr vor. Es bleibt uns noch die Aufgabe, das Volumenelement d4 x in krummlinige Koordinaten umzuschreiben. Wir haben das folgende Theorem: Theorem 7 Die Gr¨osse des folgenden Ausdrucks ist unabh¨angig von Koordinaten: √ d4 x −g (Beweis: Aufgabe 2). Hier ist die n¨ utzliche Abk¨ urzung eingef¨ uhrt g = det(gµν ).
(3.8)
Wenn also x Inertial- und x0 krummlinige Koordinaten sind, dann haben wir: p d4 x = d4 x0 −g 0 . (3.9) Diese wichtige Formel liefert das invariante Volumenelement in Bezug auf beliebige Koordinaten, ausgedr¨ uckt durch die Komponenten der Metrik in diesen Koordinaten. Damit k¨onnen wir nun die Wirkung (3.4) in Bezug auf beliebige Koordinaten schreiben (die Striche lassen wir weg): 1 S=− 16π
Z
√ d4 x −gg ρκ g σλ Fκλ Fρσ .
(3.10)
Postulat 3.1 Die Dynamik des elektromagnetischen Feldes in gekr¨ ummten Raumzeiten ist durch das Variationsprinzip mit der Wirkung (3.10) bestimmt. Die Wirkung ist als ein Funktional des Potentials Aµ (x), wobei Fµν = ∂µ Aν − ∂ν Aµ . 98
(3.11)
Die Wirkung (3.10) ist invariant in Bezug auf die Eichtransformation (3.3), und die messbare Bedeutung des Feldtensors im Punkt p in bezug auf ein LIS in p ist X F0k = Ek , Fkl = εklm Bm , (3.12) m
wobei Ek und Bk die Komponenten des elektrischen resp. magnetischen Feldes f¨ ur den entsprechenden Beobachter darstellen.
3.1.2
Maxwell-Gleichungen
Den ersten Satz der verallgemeinerten Maxwell-Gleichungen erhalten wir durch die Variation der Wirkung (3.10) nach Aµ . Um die Berechnung zu vereinfachen, setzen wir voraus, dass die Variation δAµ (x) einen kompakten Tr¨ager in unserer krummen Raumzeit hat. So verschwindet sie u ¨berall am Rande und damit verschwinden auch s¨amtliche bei der Variation auftretenden Oberfl¨achenintegrale. Wir variieren bei konstanter Metrik, δgµν (x) = 0 und erhalten schrittweise: Z √ 1 δS = − d4 x −gg ρκ g σλ δ(Fκλ Fρσ ) 16π Z √ 1 d4 x −gg ρκ g σλ Fκλ δFρσ = − 8π Z √ 1 = − d4 x −gg ρκ g σλ Fκλ (∂ρ δAσ − ∂σ δAρ ) 8π Z √ 1 = − d4 x −gg ρκ g σλ Fκλ ∂ρ δAσ 4π Z √ 1 = d4 x∂ρ ( −gg ρκ g σλ Fκλ )δAσ . 4π Es folgt also die Gleichung: √ ∂ρ ( −gg ρκ g σλ Fκλ ) = 0 ,
(3.13)
und das ist die gesuchte Verallgemeinerung des ersten Satzes der Maxwell-Gleichungen auf krumme Raumzeiten. F¨ ur flache Raumzeit und in Bezug auf ein IS, oder f¨ ur gekr¨ ummte Raumzeiten in Bezug auf ein LIS ergeben sich richtig die Gleichungen ρ ∂ρ Fσ = 0 f¨ ur das freie Feld. Der zweite Satz der Maxwell-Gleichungen folgt direkt aus der Definition von Fρσ , denn Gl. (3.11) impliziert ∂τ Fρσ + ∂ρ Fστ + ∂σ Fτ ρ = 0 .
(3.14)
Die Metrik kommt also nur u ¨ber den ersten Satz ins Spiel. Die Gleichungen (3.13) und (3.14) sollen die Dynamik des Elektromagnetischen Feldes im Gravitationsfeld beschreiben. Insbesondere sollen sie die Abweichung des 99
Lichtes im Feld der Sonne und die Rotverschiebung richtig wiedergeben. Wir bemerken hier ohne Beweis, dass sie das wirklich tun. Die Gleichungen (3.13) und (3.14) gelten offenbar in beliebigen Koordinaten, da wir keine Beschr¨ankungen bei deren Herleitung brauchten. Die Form der Gleichungen aber dr¨ uckt diese Tatsache nicht durchsichtich aus: Von den auftretenden Koordinatenableitungen der Tensorfelder wissen wir, dass sie sich nicht im allgemeinen wie Tensoren transformieren. Es ist somit nicht von vornherein klar, ob die linken Seiten in jedem Koordinatensystem verschwinden, wenn sie das in einem tun. Diesem Problem werden wir uns in diesem Kapitel widmen (auch Aufgabe).
3.1.3
Energie-Impuls-Tensor
Der Energie-Impuls-Tensor spielt in der ART eine ¨ahnliche Rolle wie der 4-Strom der Ladung in der Elektrodynamik: er ist die Quelle der Gravitation. In der nichtrelativistischen Theorie ist ja die Massendichte eine solche Quelle; sie steht in der Poisson-Gleichung auf der rechten Seite. In einer nichtrelativistischen Theorie ist es vollst¨andig befriedigend, dass jede gegebene (extensive) Gr¨osse eine entsprechende Dichte besitzt; z.B. die Ladung Q, welche ein Skalar ist, definiert eine Ladungsdichte ρ, welche ein Skalarfeld ist, durch die Beziehung: die totale Ladung dQ in einem Volumenelement dV im Punkt p ist dQ = ρ(p)dV . In der SRT ist aber der 3-Volumen nicht absolut: es h¨angt vom Beobachter ab. F¨ ur einen Beobachter mit der 4er-Geschwindigkeit uµ liegt er senkrecht zu uµ . Das heisst nun, dass ein 3er-Volumenelement nicht nur durch seine Gr¨osse, dV , bestimmt ist, aber auch durch seine Normale uµ . Die Gesamtladung dQ in einem 3er-Volumenelement dV eines Beobachters im Punkt p mit der 4er-Geschwindigkeit uµ ist bekanntlich gegeben durch dQ = j µ (p)uµ dV , wobei j µ (x) ein Vektorfeld ist, genannt Strom der Ladung. Dieser vierkomponentige Strom u ¨bernimmt in der SRT die rolle der Ladungsdichte ρ(x). Analoges gilt f¨ ur die Dichten von Gr¨ossen, welche einen Tensorcharakter haben: sie bestimmen Str¨ome, welche immer um je ein Index mehr haben. Z.B. die Energie: das ist die 0-Komponente des 4er-Vektors des Impulses, P µ . Die entsprechende Dichte muss ein 4er-Tensorfeld T µν (x) zweiter Stufe sein, dass durch die Gleichung definiert wird: dP µ = T µν (p)uν dV , (3.15) wobei dP µ der Gesamtimpuls in Richtung µ im 3er-Volumenelement dV des Beobachters im Punkt p und mit der 4er-Geschwindigkeit uµ ist. Diese Gleichung u ¨ bernehmen wir in die ART. Ganz allgemein wird ein Strom, d.h. die Quelle f¨ ur ein Feld ϕ gewonnen, indem man die Wirkungen f¨ ur andere Felder nach ϕ variiert. Das r¨ uhrt davon her, dass die 100
totale Wirkung eines Feldsystems sich als Summe der Wirkungen f¨ ur die einzelnen Felder darstellen l¨asst: Stot = S[ϕ] + S1 [ψ1 , . . . , ψn , ϕ], wobei ψ1 , . . . , ψn die Felder im System sind, welche zu ϕ eine nichttriviale Kopplung besitzen. Die Feldgleichung f¨ ur ϕ lautet dann δS1 δS =− . δϕ δϕ Die linke Seite dieser Gleichung stimmt u ¨berein mit der linken Seite der freien dynamischen Gleichung, δS =0 δϕ f¨ ur das Feld ϕ. Die rechte Seite ist dann die Summe der Quellen, welche aus den anderen Feldern gebildet sind. Das elektromagnetische Feld tr¨agt Energie, und so wird es eine nichttriviale Kopplung zur Gravitation haben—es wird Gravitationsfeld erzeugen. Den entsprechenden Quellenterm erhalten wir, wenn wir die Wirkung (3.10) nach gµν (oder nach g µν ) variieren. D.h. wir m¨ ussen die Variation von S mit δg µν 6= 0 und mit δAµ (x) = 0 berechnen. Wir erhalten zun¨achst, dass Z √ 1 δS = − d4 xδ( −gg ρκ g σλ )Fκλ Fρσ . 16π Um weiterzukommen, brauchen wir die Variation der Determinante. Daf¨ ur gibt es eine wichtige Formel (Aufgabe): √ √ δ −g = −(1/2) −ggµν δg µν . (3.16)
Die Berechnung der Variation verl¨auft dann folgendermassen: δS = = = = =
Z √ 1 − d4 xδ( −gg ρκ g σλ )Fκλ Fρσ 16π Z √ √ √ 1 d4 x(−(1/2) −ggµν g ρκ g σλ + −gδµρ δνκ g σλ + −gδµσ δνλ g ρκ )Fκλ Fρσ δg µν − 16π Z √ 1 − d4 x −g(Fν σ Fµσ + F ρν Fρµ − (1/2)gµν F ρσ Fρσ )δg µν 16π Z 1 1 1 4 √ σ ρσ d x −g − (Fµσ Fν − gµν F Fρσ ) δg µν . 2 4π 4
Der Ausdruck in der eckigen Klammer ist als der elektromagnetische Energie-ImpulsEM Tensor, Tµν , bekannt: EM Tµν =−
1 1 (Fµσ Fν σ − gµν F ρσ Fρσ ) . 4π 4 101
(3.17)
Es ist klar ein Tensorfeld, symmetrisch in seinen zwei Indizes. Die erhaltene Beziehung k¨onnen wir dann wie folgt schreiben: p δSM −g(x) Tµν . = (1/2) δg µν (x)
(3.18)
Auf der linken Seite steht die sog. Variationsableitung des Funktionals S nach den Ver¨anderlichen g µν (x) (welche jetzt nicht nur durch die Indizes, sondern auch durch die Argumente xµ unterschieden werden). Diese Variationsableitung ist als der Koeffizient in δS bei der Variation der Ver¨anderlichen g µν (x) definiert—in Analogie zur partiellen Ableitung einer Funktion mehrerer Variablen: die partielle Ableitung ist ja der Koeffizient beim Differential der Ver¨anderlichen im totalen Differential der Funktion. Die Gleichung (3.18) kann als allgemeine Definition des Energie-ImpulsTensors betrachtet werden; sie bestimmt die Faktoren vor den Wirkungsintegralen, d.h., die Normalisierung der Wirkungen, f¨ ur einzelne Felder, denn die Form des Energie-Impuls-Tensors f¨ ur aller bekannter Felder ist bekannt. Durch die u ¨bliche Dimensionabsch¨atzung (in einen LIS und mit c=1) ergibt sich allgemein, dass die Variationsableitung (3.18) die Dimension der Energiedichte haben muss: Die Dimension der Wirkung ist [E × T ], die Dimension von d4 x ist √ L3 × T , wogegen δg µν (x) und −g dimensionsfrei sind. Somit ist die Dimension √ von δS/( −gδg µν (x)) gleich [E × T ]/[L3 × T ] = [E/L3 ]. Die Bedeutung der Komponenten des Energie-Impuls-Tensors, welche durch die Gleichung (3.15) gegeben ist, wird best¨atigt, wenn wir diese Komponenten in Bezug auf ein LIS ausrechnen. In einem solchen System haben wir die Beziehungen (3.12). Wir berechnen zun¨achst 1 [F0k F0 k − (1/4)(F 0k F0k + F k0 Fk0 + Fkl F kl )] 4π X X 1 X = [ F0k F0k + (1/4)(−2 F0k F0k + Fkl Fkl )]. 4π k k kl
EM T00 = −
Wir schliessen aus Eq. (3.2), dass: X
εklm εkln = 2δmn .
kl
Alles zusammen eingesetzt ergibt EM T00 =
1 (E 2 + B 2 ). 8π
Das ist die Energiedichte (oder Massendichte, c = 1) des elektromagnetischen Feldes. Auf ¨ahnliche Weise erhalten wir: EM T0k =
1 ~ ~ k. [E × B] 4π 102
Das ist der sog. Poynting-Vektor, der die 3-Impulsdichte oder, ¨aquivalent, die Energiestromdichte angibt. In der SR erf¨ ullt der Energie-Impuls-Tensor die Divergenzgleichung; diese folgt aus den Maxwell-Gleichungen. Wir haben n¨amlich die folgende Identit¨at: 1 1 ∂ν (F µ ρ F νρ − η µν F ρσ Fρσ ) = −F µ ρ (∂ν F ρν ) − η µν F ρσ (∂ν Fρσ + ∂ρ Fσν + ∂σ Fνρ ). 4 2 Daraus folgt die Behauptung unmittelbar. Die Divergenzgleichung impliziert die Erhaltung der Gesamtenergie, Z Z 3 00 k E := d x T , P := d3 x T 0k , Σ
Σ
wobei Σ eine Zeitebene x0 = const ist, via Gauss-Theorem.
3.2
Variationsprinzip
Wir beginnen mit der Definition und den Transformationseigenschaften von Tensorfeldern. Die Transformationseigenschaften sind die wichtigsten Eigenschaften der Felder. Sie beeinflussen auch andere, weniger formale Eigenschaften der Felder, wie beispielsweise deren Dynamik: die Dynamik ist durch ein Lagrangian bestimmt, und das Lagrangian muss (wie wir sp¨ater sehen werden) eine Invariante sein. Wie man eine Invariante aus den Komponenten eines Feldes und dessen Ableitungen konstruieren kann, h¨angt stark davon ab, wie sich das Feld transformiert. Wir beschr¨anken uns auf die Tensorfelder; das sind die Felder, welche in diesem Skript betrachtet werden. Die Spinorfelder und Dichten sind mindestens genauso wichtig in der theoretischen Physik, aber wir m¨ ussen den Stoff beschr¨anken.
3.2.1
Transformationseigenschaften der Tensorfelder
Betrachten wir eine feste Raumzeit M mit der Metrik gµν ; w¨ahlen wir ein Koordinatensystem {xµ }. Definition 15 Ein Tensorfeld vom Typ (p, q) ist eine Abbildung, welche jedem µ... Punkt r aus einem Gebiet G ⊂ M einen Tensor Tν... in r vom Typ (p, q) zuordnet. G heisst Definitionsbereich des Tensorfeldes. In Bezug auf ein Koordinatensystem {xµ } wird das Tensorfeld durch 4p+q C ∞ µ... 0 µ... Funktionen Tν... (x , x1 , x2 , x3 ) beschrieben, wobei Tν... (r) die Komponenten des Ten0 1 2 3 sors im Punkt r und (x , x , x , x ) die Koordinaten von r in Bezug auf {xµ } sind. Diese Funktionen heissen Komponenten des Tensorfeldes in Bezug auf {xµ }. 103
Z.B. ist Φ(r), ein Skalarfeld, durch eine Funktion, Φ(x0 , x1 , x2 , x3 ) (Tensor von Typ (0, 0)), und Aµ (r), ein Vektorpotential, durch 4 Funktionen, A0 (x0 , x1 , x2 , x3 ), . . ., A3 (x0 , x1 , x2 , x3 ), beschrieben. Sei {x0µ } ein neues Koordinatensystem; in Bezug auf {x0µ } wird dasselbe Tensorfeld durch andere Funktionen repr¨asentiert. Die Transformation von einem zum anderen Satz von Funktionen erhalten wir in zwei Schritten. Erstens muss man die Argumente der Funktionen transformieren: xµ = xµ (x00 , x01 , x02 , x03 ).
(3.19)
Zweitens muss man die resultierenden Funktionen linear kombinieren gem¨ass dem Transformationsgesetz f¨ ur den entsprechenden Tensortyp. So beispielsweise f¨ ur das Vektorpotential: A0µ (x00 , x01 , x02 , x03 ) = Xµρ0 x00 , x01 , x02 , x03 )Aρ (x0 (x0 ), x1 (x0 ), x2 (x0 ), x3 (x0 ) ,
wobei wir rechts f¨ ur xµ (3.19) einsetzen m¨ ussen. Die (einzige) Komponente des Skalarfeldes transformiert sich ebenfalls nichttrivial: Φ0 (x00 , x01 , x02 , x03 ) = Φ x0 (x0 ), x1 (x0 ), x2 (x0 ), x3 (x0 ) , usw.
3.2.2
Dynamik der Felder
In diesem Abschnitt wollen wir die Frage studieren, was die Dynamik eigentlich ist, und ob so was von den krummen Raumzeiten u ¨ berhaupt zugelassen wird. Betrachten wir zun¨achst die Dynamik eines Probeteilchens. Die geod¨atische Gleichung bestimmt die Weltbahn des Teilchens eindeutig, sobald gewisse Anfangsdaten gegeben werden, n¨amlich die Lage und die Geschwindigkeit, xµ (0) und x˙ µ (0). D.h. es gibt so etwas wie einen Zustand des Systems zu einem Moment der Zeit—hier durch die Daten xµ (0) und x˙ µ (0) beschrieben—und eine dynamische Gleichung— hier die geod¨atische Gleichung—, welche aus dem Zustand zu einem Augenblick den Zustand des Systems zu einem beliebigen anderen Augenblick bestimmt. Gibt es etwas ¨ahnliches f¨ ur die Felder? Sei beispielsweise Φ(x) ein Skalarfeld in der flachen Raumzeit. Die dynamische Gleichung sei die Klein-Gordon-Gleichung: ∂2Φ ∂2Φ ∂2Φ ∂2Φ − − − 2 + m2 Φ = 0, ∂t2 ∂x2 ∂y 2 ∂z wobei {t, x, y, z} ein IS ist. Wenn m = 0, haben wir die bekannte Wellengleichung. Eine solche Gleichung wird man auch erhalten, wenn man eine geeignete Eichung 104
f¨ ur das 4-Potential in der Maxwell-Gleichungen w¨ahlt. In der Theorie der partiellen Differentialgleichungen der mathematischen Physik lernt man, dass alle diese Gleichungen vom symmetrisch hyperbolischen Typ sind, dass also das sog. CauchyProblem f¨ ur sie ein wohlgestelltes Problem ist. Das Cauchy- oder Anfangswertproblem ist die Aufgabe, das Feld in der ganzen Raumzeit zu bestimmen, wenn l¨angs einer raumartigen Hyperfl¨ache S seine Werte und seine zu S normalen Ableitungen gegeben sind, z.B. Φ(0, x, y, z) = ϕ(x, y, z),
∂Φ (0, x, y, z) = ψ(x, y, z), ∂t
wobei Σ hier die Hyperfl¨ache t = 0 ist und ϕ(x, y, z) und ψ(x, y, z) zwei Funktionen auf Σ, eben die Anfangswerte oder Cauchy-Daten sind. Ein wohlgestelltes Problem ist ein solches, welches eine eindeutige L¨osung besitzt. Somit ist die Situation analog zu derjenigen des Teilchens: Ein Zustand des Feldes zur Zeit t ist durch die Anfangswerte auf der Hyperfl¨ache t = konst beschrieben, und die dynamische Gleichung erlaubt uns, den Zustand zu jeder beliebigen anderen Zeit zu berechnen. Ein wichtiger Unterschied ist aber, dass die Anfangswerte f¨ ur ein Teilchen in einem beliebigen Punkt gen¨ ugen, w¨ahrend jene f¨ ur ein Feld auf einer ganzen Hyperfl¨ache gegeben werden m¨ ussen. Welche Hyperfl¨achen sind aber als Anfangshyperf¨achen f¨ ur Felder geeignet? Klarifizieren wir zun¨achst, was eine Hyperfl¨ache ist. Definition 16 Sei M eine m-Mannigfaltigkeit und N eine n-Mannigfaltigkeit, wobei m < n. Sei φ : M 7→ N so dass die Functionen xµ (y k ), welche die Abbildung in den Koordinaten {xµ } auf N und {y k } auf M ausdr¨ ucken, alle C ∞ und die m Vektoren ∂xµ ∂xµ , . . . , , ∂y 1 ∂y m alle linear unabh¨angig in allen Punkten von φ(M ) sind. Dann ist Σ := φ(M ) eine Teilmannigfaltigkeit von N . Wenn N eine Raumzeit mit der Metrik gµν ist, m = n − 1 (d.h. 3 f¨ ur n = 4) und die induzierte Metrik γkl on Σ definiert durch γkl (y) = gµν (x(y))
∂xµ ∂xν ∂y k ∂y l
die Signatur -3 hat, dann ist Σ raumartige Hyperfl¨ache genannt. Betrachten wir der Einfachheit halber die zweidimensionale flache Raumzeit mit den kartesischen Koordinaten t und x und ein Skalarfeld Φ(x) mit der dynamischen Gleichung ∂2Φ ∂2Φ − = 0. (3.20) ∂t2 ∂x2 Die allgemeine L¨osung lautet Φ(t, x) = f (t − x) + h(t + x), 105
(3.21)
wobei f und h beliebige Funktionen einer Ver¨anderlichen sind. Anfangsdaten f¨ ur die Gleichung (3.21) m¨ ussen l¨angs raumartigen Hyperfl¨achen (welche in einer zweidimensionaler Raumzeit eindimensional—also Kurven—sind) gegeben werden. Die Kurve Σ1 , welche parametrisch durch t = 0, x = λ, λ ∈ (0, 1) gegeben wird, ist raumartig, sie ist aber nicht als Anfangshyperfl¨ache geeignet. W¨ahlen wir z.B. die Anfangsdaten ∂Φ (0, x) = 0, (0 < x < 1). Φ(0, x) = 0, ∂t Die Gleichung (3.20) wird gel¨ost durch (3.21) mit f (z) = a f¨ ur z ∈ (−1, 0) und h(z) = −a f¨ ur z ∈ (0, 1), a ∈ (−∞, ∞), sonst beliebig. Die L¨osung (3.21) ist nur im Gebiet eindeutig bestimmt, Φ(t, x) ≡ 0, wo sowohl f als auch h vorgegeben ist, also f¨ ur −1 < t − x < 0, 0 < t + x < 1. Dieses Gebiet D(Σ1 ) heisst Abh¨angigkeitsgebiet von Σ1 Betrachten wir eine andere Hyperfl¨ache Σ2 , definiert durch t = −coshλ,
x = sinhλ,
λ ∈ (−∞, ∞).
Es ist eine raumartige Hyperfl¨ache in unserer zweidimensionalen Raumzeit und diesmal eine “unbeschr¨ankte”. Doch die 0-Anfangsdaten l¨angs Σ werden durch die L¨osung der Form (3.21) erf¨ ullt, wenn f (z) = 0 f¨ ur z ∈ (−∞, 0) und h(z) = 0 f¨ ur z ∈ (−∞, 0). Die Dom¨ane D(Σ2 ), wo die L¨osung eindeutig durch die Anfangsdaten l¨angs Σ2 bestimmt wird, ist nun −∞ < t − x < 0,
−∞ < t + x < 0.
Wie k¨onnen wir den Begriff des “Abh¨angigkeitsgebiet” allgemein definieren? Betrachten wir z.B. einen Punkt p in D(Σ1 ). Wenn wir von p aus eine kausale Kurve starten und lange genug fortsetzen, dann stossen wir—entweder in Zukunft oder in Vergangenheit von p—auf die Hyperfl¨ache Σ1 . Unter einer kausalen Kurve verstehen wir eine st¨ uckweise glatte Kurve, deren Tangentvektor u ¨ berall, wo er existiert, nicht raumartig ist (also entweder zeit- oder lichtartig) und in die Zukunft gerichtet. Die Kurve darf allerdings nicht “vorzeitig” enden. Wir k¨onnen das so ausdr¨ ucken, dass sie “maximal” sein soll, d.h. es gibt keine andere kausale Kurve, welche sie als ein echtes Teilst¨ uck enth¨alt. Definition 17 Σ sei eine raumartige Hyperfl¨ache in der Raumzeit (M, g). Abh¨angigkeitsgebiet D(Σ) von Σ in M ist die Menge der Punkte p ∈ M mit der Eigenschaft: jede maximale kausale in die Zukunft gerichtete Kurve durch p schneidet Σ. In den obigen Beispielen waren die Abh¨angigkeitsgebiete D(Σ1 ) und D(Σ2 ) echte Teilmengen von M . Die Minkowskische Raumzeit hat nun die folgende Eigenschaft: 106
{t, x, y, z} sei ein IS und Σ sei definiert durch t = konst. Dann gilt D(Σ) = M . Der Beweis ist einfach (Uebung). Danach kann man also Φ u ¨berall in M berechnen, wenn die Anfangsdaten auf Σ vorgegeben werden. Definition 18 Eine Hyperfl¨ache Σ in einer Raumzeit (M, g) heisst Cauchy-Hyperfl¨ache f¨ ur M , wenn D(Σ) = M . Eine Raumzeit (M, g) heisst global hyperbolisch, wenn sie mindestens eine Cauchy-Hyperfl¨ache hat. Somit ist die Minkowskische Raumzeit global hyperbolisch. Beispiel einer Raumzeit, welche nicht global hyperbolisch ist: Wir schneiden in der zweidimensionalen flachen Raumzeit die Halbebenen x ≤ −1 und x ≥ 1 weg. Uebrig bleibt der Streifen −∞ < t < ∞, −1 < x < 1. Das ist eine wohldefinierte Mannigfaltigkeit. Die Metrik ist in Bezug auf die Koordinaten t und x wie vorher ds2 = dt2 − dx2 . Diese Raumzeit ist nicht global hyperbolisch. Das letzte Beispiel hat den Nachteil, dass der Raum x ∈ (−1, 1) endlich ist (L¨ange 2), und man kommt schnell zum Rande. Es gibt aber auch krumme Raumzeiten, welche in jeder Richtung unbeschr¨ankt sind, sich als L¨osungen der dynamischen Gravitationsgleichungen ergeben und trotzdem nicht global hyperbolisch sind (z.B. die sog. anti-DeSitter-Raumzeit). F¨ ur die global hyperbolischen Raumzeiten gilt der folgende Satz: Theorem 8 (Geroch) (M, g) sei gobal hyperbolisch und Σ eine Cauchy-Hyperfl¨ache f¨ ur M . Dann ist jede andere Cauchy-Hyperfl¨ache zu Σ diffeomorph, und es gibt eine Funktion t : M 7→ R mit Definitionsbereich M , so dass t = t0 eine Cauchy-Hyperfl¨ache von M ist, wenn t0 ∈ t(M ). “Diffeomorph” bedeutet: man kann beide Fl¨achen aufeinander bijektiv und glatt abbilden. Wir setzen stillschweigend voraus, dass alle Raumzeiten, mit welchen wir weiter arbeiten, global hyperbolisch sind.
3.2.3
Die Wirkung
Das Variationsprinzip f¨ ur eine Wirkung S dient zur Formulierung der Dynamik. Es bildet eine gemeinsame Ausgangsbasis f¨ ur die Mechanik und f¨ ur die Feldtheorie, sowohl f¨ ur die klassische als auch f¨ ur die quantenmechanische Theorie. (M, g) sei eine Raumzeit und ψ a (x) ein System von Feldern. Der Index a nummeriert die Komponenten eines ganzen Systems von Feldern, das auch eine Metrik einschliesst, z.B. a ψ (x) a
1 Φ
2 g00
3 g01
107
4 g02
... ...,
ein System aus einem Skalarfeld Φ(x) und der Metrik gµν (x). Fassen wir zun¨achst zusammen, welche die wichtigsten Voraussetzungen u ¨ber die Wirkung in der theoretischen Physik sind. Form der Wirkung In der Feldtheorie werden wir mit den Wirkungen der folgenden Form arbeitten: Z √ S= d4 x −gL, (3.22) V µ
wobei V ein offenes Gebiet in M ist, x Koordinaten in einer Umgebung von V sind und L die sogenannte Lagrange-Funktion ist, eine Funktion der Felder ψ a (x) und a deren ersten Ableitungen ψ,µ (x), an der Stelle xµ : a L = L(ψ a (x), ψ,µ (x)).
(3.23)
Es sollen also keine h¨oheren Ableitungen in der Lagrange-Funktion vorkommen. √ √ Die Determinante −g ist von L abgespaltet. Der Grund daf¨ ur ist, dass −gd4 x ein invariantes Volumenelement ist, wie wir im Abschnitt 3.1 gesehen haben. In √ jedem Fall kann man auch definieren L = L −g und mit L anstatt L arbeiten. (L ist die sog. Lagrange-Dichte). Das Wichtige an der Lagrange-Funktion (oder Dichte) ist die funktionale Form: sie ist immer gleich, unabh¨angig davon, in welchen Koordinaten wir arbeiten. Allgemeine Kovarianz L(x) sei die zusammengesetzte Funktion von xµ die durch (3.23) gegeben ist. Dann ist L(x) ein Skalarfeld auf M bis auf eine Divergenz, also 1 L(x) = σ(x) + √ ∂µ V µ (x), (3.24) −g wobei σ(x) ein Skalarfeld ist der Form
a a (x), . . .) σ(x) = σ(ψ a (x), ψ,µ (x), ψ,µν
und die 4-komponentige Gr¨osse V µ (x) sich so transformieren muss, dass die Gleichung (3.24) in beliebigen Koordinatensystemen gilt. Diese Vorausetzung impliziert, dass die Wirkung eine Invariante in Bezug auf Koordinatentransformationen bis auf Oberfl¨achenintegrale l¨angs der Grenze ∂V von V ist. Sonderstellung der Gravitation Die Lagrange-Funktion L soll aus zwei Summanden bestehen: L = L G + LM , (3.25) wobei LG = L(gµν , gµν,ρ ) eine Lagrange-Funktion f¨ ur das Gravitationsfeld ist und LM den “Rest der Welt” beschreibt (die Materie). Bemerken wir, dass die LagrangeFunktion f¨ ur das Gravitationsfeld keine andere Felder als die Metrik enth¨allt. Feldgleichungen ψ a (x) sei ein Feldsystem. Das dynamisch m¨ogliche Feld ψ a (x) realisiert dann ein Extremum der Wirkung (3.22) unter allen Variationen mit dem kompakten Tr¨ager in V . 108
Jetzt k¨onnen wir die Bedeutung der Invarianz der Wirkung in Bezug auf Koordinatentransformationen einsehen. ψ a (x) sei ein Extremalfeld. Machen wir eine glatte Koordinatentransformation, welche ausserhalb eines kompakten Teilgebiets des Integrationsbereiches V der Wirkung die Identit¨at ist. Dann ¨andert sich der Wert der Wirkung nicht, d.h. die transformierten Komponenten ψ 0a (x0 ) realisieren wieder ein Extremum. Die Eigenschaft, ein dynamisch m¨ogliches Feld zu sein, bleibt invariant unter solchen Transformationen. Beispiel: Aus einem Skalarfeld Φ(x) und seinen ersten Ableitungen Φ,µ (x) k¨onnen wir leicht Skalare der Form (3.23) bilden. Jede Funktion F (Φ(x)) ist ein Skalarfeld. Φ,µ (x) ist ein Kovektor; der einfachste Skalar wird mit der Metrik gebildet als Quadrat der Norm des Kovektors: g µν Φ,µ (x)Φ,ν (x). Wenn wir verlangen, dass der Skalar (3.23) quadratisch in Φ(x) und Φ,ν (x) ist, erhalten wir eine zweiparametrige Familie von Lagrange-Funktionen: L = a(g µν Φ,µ (x)Φ,ν (x) + bΦ2 ). Die Konstante a normalisiert die Wirkung so, dass der richtige wert des Energie√ Impuls-Tensors herauskommt; b ist dagegen ein messbarer Parameter, −b heisst Masse des Feldes.
3.2.4
Variationsformel
Wir werden sehr allgemeine Variationen der Wirkung brauchen. Z.B. die Variation, die durch eine (infinitesimale) Koordinatentransformation definiert ist: Variationen solcher Art vertauschen nicht mit der Ableitungen nach Koordinaten δ∂µ 6= ∂µ δ . Wir m¨ ussen also einen allgemeineren Weg der Umformung von δS finden. Wir wollen die Aenderung von Z S = d4 xL berechnen, welche durch eine infinitesimale Variation sowohl der unabh¨angigen als auch der abh¨angigen Ver¨anderlichen zustandekommt: x0µ = xµ + δxµ (x),
(3.26)
ψ 0a (x0 ) = ψ a (x) + δψ a (x),
(3.27)
0a 0 ψ,µ (x )
(3.28)
=
a ψ,µ (x)
+
a δψ,µ (x).
Diese Art von Variation entsteht, wenn wir die neuen und alten Werte der Felder (einschliesslich der Koordinaten) in festen Punkten der Raumzeit vergleichen. Die 109
so definierte Variation von ψ a (x) kommutiert nicht mit der Ableitung. Um das zu sehen, differenzieren wir beide Seiten von (3.27) nach xµ . Links ergibt sich mit (3.26) und (3.28) ∂x0ν 0a 0 ∂ 0a 0 0a 0a 0 ψ (x ) = ψ (x ) = ψ,µ (x0 ) + ψ,ν (x )∂µ δxν (x) ∂xµ ∂xµ ,ν a a a = ψ,µ (x) + δψ,µ (x) + ψ,ν (x)∂µ δxν (x) (wir haben also Terme zweiter Ordnung in den Variationen vernachl¨assigt). Rechts erhalten wir einfach a ψ,µ (x) + ∂µ δψ a (x). Es folgt f¨ ur den Kommutator: a a ∂µ δψ a (x) − δψ,µ (x) = ψ,ν (x)∂µ δxν (x)
(3.29)
Wir f¨ uhren deshalb noch eine andere Art Variation ein, die sogenannte Formvariation δ∗ . Sie ist in unserem Fall wie folgt definiert: δ∗ ψ a (x) = ψ 0a (x) − ψ a (x),
a δ∗ ψ,µ (x)
=
0a ψ,µ (x)
−
a ψ,µ (x),
(3.30) (3.31)
Es sind Variationen der Form der Darstellungsfunktionen der Tensorfelder, wobei man diese Funktionen f¨ ur gleiche werte deren Argumente vergleicht. δ∗ kommutiert nun mit der Ableitung—das sieht man unmittelbar aus der Definition. Wir haben nur zu berechnen, wie die zwei Arten von Variation zusammenh¨angen: δψ a (x) = ψ 0a (x0 ) − ψ a (x) = ψ 0a (x) + ∂µ ψ 0a (x)δxµ (x) − ψ a (x) a = δ∗ ψ a (x) + ψ,µ (x)δxµ (x).
(3.32)
Aehnlich erhalten wir a a a δψ,µ (x) = δ∗ ψ,µ (x) + ψ,µν (x)δxν (x).
(3.33)
Mit diesem Apparat k¨onnen wir die folgende Variation der Wirkung berechnen: Z Z 4 0 0a 0 0a 0 a δS = d x L(ψ (x ), ψ,µ (x )) − d4 xL(ψ a (x), ψ,µ (x)). V0
V
Im ersten Integral integriert man u ur ¨ber die Werte von x0 , welche dem Gebiet V f¨ 0µ µ µ x entsprechen. Der erste Integrand wird nach der Substitution x = x + δx (x) umgeformt wie folgt: 0a 0 L(ψ 0a (x0 ), ψ,µ (x )) = a L(ψ a (x), ψ,µ (x)) +
∂L ∂L a a δψ (x) + δψ,µ (x). a (x) ∂ψ a (x) ∂ψ,µ 110
Weiter erhalten wir 0
d4 x0 = det(Xνµ )d4 x = det(δνµ + ∂ν δxµ )d4 x = det(δνµ )d4 x + ∂ det(Aµν ) |Aµν =δνµ ∂ν δxµ d4 x = d4 x + δµν ∂ν δxµ d4 x µ ∂Aν = (1 + ∂µ δxµ )d4 x. Alles zusammen ergibt (Ausdr¨ ucke h¨oherer Ordnung in den Variationen sind weggelassen): Z ∂L ∂L 4 µ a a δS = d x L∂µ δx + δψ (x) + δψ,µ (x) . a (x) ∂ψ a (x) ∂ψ,µ V Jetzt dr¨ ucken wir die Variationen durch die Formvariationen aus: Z a (x) ∂L ∂ψ,ν ∂L ∂ψ a (x) 4 µ + δxµ (x) δS = d x L∂µ δx + a ∂ψ a (x) ∂xµ ∂ψ,ν ∂xµ V ∂L ∂L a a δ∗ ψ (x) + δ ψ (x) . + a (x) ∗ ,µ ∂ψ a (x) ∂ψ,ν Den Ausdruck in der runden Klammer identifizieren wir als die sog. totale Ableitung von L nach xµ : a (x) ∂ ∂L ∂ψ a (x) ∂L ∂ψ,ν L = + . a (x) ∂xµ ∂xµ ∂ψ a (x) ∂xµ ∂ψ,ν Sie ist immer noch partiell, in Bezug auf andere Koordinaten xλ , λ 6= µ. Wenn wir noch die Vertauschbarkeit zwischen ∂µ und δ∗ ausnutzen, k¨onnen wir das Resultat in der u ¨bersichtlichen Form schreiben: Z ∂L ∂ µ a 4 Lδx + δ ψ (x) δS = dx a ∗ ∂xµ ∂ψ,µ V ∂L ∂ ∂L a + − δ∗ ψ (x) . (3.34) a (x) ∂ψ a (x) ∂xµ ∂ψ,µ Das ist die sogenannte Hillsche Variationsformel.
3.2.5
Feldgleichungen der Materie
Wir benutzen jetzt das Variationsprinzip und die Hillsche Formel, um die dynamischen Gleichungen f¨ ur die Materiefelder zu erhalten Zun¨achst spalten wir das System auf in die Materie-Felder ϕa (x) und die Metrik gµν (x). Wir variieren die Wirkung in V , so dass δxµ ≡ 0,
δgµν ≡ 0,
111
(3.35)
die Koordinaten und die Metrik bleiben also fest. Wegen (3.35) liefert (3.32) δ∗ ϕa = δϕa , und von der Hillschen Formel (3.34) bleibt noch stehen: Z ∂ ∂L ∂L ∂L ∂ a 4 a δϕ (x) . (3.36) δS = dx δϕ (x) + − ∂xµ ∂ϕa,µ (x) ∂ϕa (x) ∂xµ ∂ϕa,µ (x) V S ist extremal, wenn δS f¨ ur beliebige Variationen δϕa (x) mit kompaktem Tr¨ager innerhalb von V verschwindet. Das ergibt ∂L ∂L ∂ − µ a = 0. a ∂ϕ (x) ∂x ∂ϕ,µ (x)
(3.37)
Gleichung (3.37) ist die gesuchte Feldgleichung. Der Divergenzterm ergibt ein Oberfl¨achenintegral u ¨ber den Rand vom Tr¨ager der Variation, und das verschwindet. Beispiel Skalarfeld Φ(x) mit der Lagrange-Funktion L = (1/2)g µν Φ,µ Φ,ν − (1/2)m2 Φ2 . Wir haben
√ ∂L = − −gm2 Φ, ∂Φ
√ ∂L = −gg µν ∂ν Φ, ∂Φ,µ
also lautet die Feldgleichung (3.37): √ 1 √ ∂µ ( −gg µν ∂ν Φ) + m2 Φ = 0. −g
(3.38)
Das ist eine Verallgemeinerung der Klein-Gordon-Gleichung zu gekr¨ ummten Raumzeiten.
3.3
Kovariante Ableitung
Die dynamischen Gesetze f¨ ur die Felder—die sog. Feldgleichungen—haben die Form von Differentialgleichungen: die Fortpflanzung der Felder h¨angt von der Differenz der Anregungen in benachbarten Punkten ab. (Man kann sich vereinfacht ein gekoppeltes System von Pendeln vorstellen.) In krummen Raumzeiten stossen wir aber auf die folgende Schwierigkeit. Betrachten wir das uns bekannte Beispiel des Kovektorfeldes Aµ (x); die Transformation seiner Ableitung ist ∂A0µ (x) ∂Aρ (x) (p) = Xµρ0 (p)Xνσ0 (p) (p) + Xµρ0 ν 0 (p)Aρ (p). (3.39) 0µ σ ∂x ∂x Man sieht, dass man diese Ableitung in einem Punkt p beliebig gross machen kann, wenn man nur die Ableitungen Xµρ0 ν 0 (p)
∂ 2 xρ := 0µ 0ν (p) ∂x ∂x 112
in p geeignet w¨ahlt, auch wenn die Ableitung des Feldes ∂A∂xρ (x) σ (p) selber in p verschwindet. Es folgt, dass die einfache Ableitung der Feldkomponenten nach Koordinaten kein geeigneter Differentialoperator f¨ ur die Feldgleichungen ist und dass die Differentialoperatoren in den bisher hergeleiteten Feldgleichungen eine mehr geometrische Bedeutung haben m¨ ussen. Wir werden sehen, dass sie sich durch die sogenannte kovariante Ableitung ausdr¨ ucken lassen.
3.3.1
Definition der kovarianten Ableitung
In der SRT gilt der obige Einwand gegen die Koordinatenableitung der Tensorfelder nicht: wenn wir ausschiesslich mit den IS arbeiten, dann sind alle Transformationen linear, und so haben wir ∂ 2 xρ (p) = 0, ∀p. ∂x0µ ∂x0ν Der Unterschied der Komponenten der Tensore in benachbarten Punkten, den wir so errechnen, ist sinnvoll und n¨ utzlich. In der ART gibt es eine Analogie zu IS: die LIS. Sie sind zwar nur “lokal”, aber das wird sich hier als gen¨ ugend zeigen. Betrachten wir, um das zu zeigen, zwei LIS, µ 0µ x¯ und x¯ in p. Die Transformation dazwischen sei x¯0µ = x¯0µ (¯ x0 , · · · , x ¯3 ), wobei immer
∂ 2 x¯ρ (p) = 0. ∂ x¯0µ ∂ x¯0ν ¯ 0µ (p) = 0 und Γ ¯ µ (p) = 0, und Aus der Definition von LIS folgt n¨amlich, dass Γ νρ νρ das Transformationsgesetz der Affinzusammenh¨ange ist durch die Gleichung (1.9) gegeben. Das impliziert ∂ 2 x¯ρ 0 Xρ¯α¯ (p) = 0 ∂ x¯0µ ∂ x¯0ν und das ist a¨quivalent zur obigen Gleichung. Dann haben wir ∂ A¯0µ (¯ x0 ) ∂ A¯ρ (¯ x) ρ¯ σ ¯ (p) = X (p)X (p). (p) 0 ν¯ µ ¯0 0µ σ ∂ x¯ ∂ x¯ Also: die (ersten)Ableitungen nach LIS-Koordinaten transformieren sich wie Tensoren, genau wie in der SRT. Wir m¨ ussen nur die LIS im Punkt p benutzen, wenn wir die Ableitung des Feldes in p berechnen wollen. Auf diese Weise w¨ urden wir aber die Ableitung nur f¨ ur eine beschr¨ankte Klasse der Koordinatensysteme definieren. Wie k¨onnten wir diese Definition auf allgemeine Koordinatensysteme erweitern? Das ist einfach: wir postulieren dass die Ableitung 113
ein Tensor ist. Die logische Struktur dieser Definition ist wie folgt. Zun¨achst berechnet man die Komponenten einer Gr¨osse in Bezug auf ein bestimmtes Koordinatensystem. Dann sagt man: die Komponenten in Bezug auf ein anderes, beliebiges System ergeben sich durch das und das Transformationsgesetz. Somit ist die Gr¨osse in der Differentialgeometrie wohldefiniert, denn ihre Komponenten in Bezug auf jedes System sind wohlbekannt. µ... Definition 19 Seien Tν... (x) die Darstellungsfunktionen eines Tensorfeldes vom µ... Typ (p, q) in den Koordinaten xµ . Dann sind ∇ρ Tν... (x) Darstellungsfunktionen eiµ nes Tensorfeldes vom Typ (p, q + 1) in x , wobei es gilt: in Bezug auf ein beliebiges LIS x¯µ in einem beliebigen Punkt r: µ... ∂ T¯ν... µ... ¯ ¯ ∇ρ Tν... (¯ x) := (¯ x). ∂ x¯ρ µ... Das so definiertes Tensorfeld ist die kovariante Ableitung vom Tensorfeld T ν... (x).
3.3.2
Direkter Ausdruck fu ¨ r die kovariante Ableitung
Die obige Definition hat ein paar n¨ utzliche Aspekte, sie ist aber nicht immer einfach zu gebrauchen. Z.B. wollte man zeigen, dass das so definierte Tensorfeld glatte Darstellungsfunktionen hat, wenn das abgeleitete Feld glatt ist, w¨ urde das grosse M¨ uhe bedeuten. Dazu m¨ usste man n¨amlich die kovariante Ableitung in einem Koordinatensystem in einer ganzen Umgebung eines Punktes kennen. Die Definition h¨angt offensichtlich vom Affinzusammenhang der Mannigfaltigkeit zusammen: wenn wir Γ’s kennen, berechnen wir das LIS, und die kovariante Ableitung. Es gibt aber auch eine direkte Formel, welche in einem einzigen Koordinatensystem gilt, und die Γ’s enth¨ahlt. Eine solche Formel wollen wir jetzt herleiten. Sei p ein beliebiger Punkt, x¯µ ein LIS in p und xµ ein beliebiges Koordinatensystem um p. Dann fogt aus der Definition, dass die Komponenten der kovarianten µ... Ableitung ∇ρ Tν... (p) erf¨ ullen: ¯ µ... α... ∇ρ Tν... (p) = Xα¯µ . . . Xνβ . . . Xργ¯ ∂γ¯ T¯β... (p). Den Ausdruck rechts k¨onnen wir wie folgt umformen: ∂ ¯α... µ µ β¯ γ ¯ α... β¯ ¯ Xα¯ . . . Xν . . . (Xρ ∂γ¯ Tβ... ) (p) = Xα¯ . . . Xν . . . ρ (Tβ... ) (p) ∂x ∂ ¯ α... ) (p) = ρ Xα¯µ . . . Xνβ . . . T¯β... ∂x ! µ β¯ ∂Xα¯ ∂X ¯ µ ν α... α... − . . . Xνβ . . . T¯β... . . . T¯β... (p) − · · · , (p) − · · · − Xα¯ . . . ∂xρ ∂xρ 114
wobei die Punkte in der Summe analoge Terme vertreten, welche durch die entsprechenden Ableitungen der restlichen Transformationskoeffiziente Xλκ¯ oder Xλ¯κ der Reihe nach entstehen. F¨ ur die Ableitungen der Transformationskoeffiziente aber gilt: ∂δρµ ∂ ∂Xα¯µ µ γ ¯ γ ¯ µ γ µ γ ¯ γ ¯ ¯ λ = X X = − Xγ¯µ Xρλ Xα¯λ = −Xγ¯µ Xρλ Xα¯λ . X X − X X X = α¯ ¯γ ρ γ ¯ ρ γ ¯ ρλ α ¯ ∂xρ ∂ x¯α ∂xα¯
F¨ ur die andere Ableitung k¨onnen wir schreiben ¯
∂Xνβ ¯ β¯ γ ¯ = Xνρ = Xσβ Xγ¯σ Xρν . ∂xρ Diese Ableitungen k¨onnen wir nun durch Γ’s ausdr¨ ucken, denn die Transformationsformel f¨ ur den AZ ergibt einfach: γ ¯ Γµνρ = Xγ¯µ Xνρ ,
also
¯
∂Xνβ ∂Xα¯µ ¯ µ λ = −Γ X , = Γσνρ Xσβ . ¯ λρ α ∂xρ ∂xρ Damit ergibt sich die gew¨ unschte allgemeine Formel: µ... µ... λ... µ... ∇ρ Tν... = ∂ρ Tν... + Γµλρ Tν... + · · · − Γσνρ Tσ... − ··· .
(3.40)
Besprechen wir diese wichtige Formel noch ein bischen. Die Struktur der rechten Seite ist einfach: der erste Term ist die entsprechende Koordinatenableitung des Feldes; dann kommen Korrekturterme, einer f¨ ur jedes Index des Feldes, mit dem Vorzeichen “+” f¨ ur die kontravarianten Indizes, mit “−” f¨ ur die kovarianten. Die Korrekturterme werden aus Produkten des Tensors und der Γ’s so gebildet, dass Γ das jeweilige Index des Tensors, einen Summationsindex, dass auch am Tensor dann vorkommt, und das Ableitungsindex tr¨agt; das Ableitungsindex (hier ρ) wollen wir immer als der letzte Index unten am Γ schreiben. Beispiele: Ein Skalarfeld Φ(x): ∇ρ Φ(x) = ∂ρ Φ(x), ein Vektorfeld V µ (x): ∇ρ V µ (x) = ∂ρ V µ (x) + Γµσρ V σ (x), ein Kovektorfeld Uµ (x): ∇ρ Uµ (x) = ∂ρ Uµ (x) − Γσµρ V σ (x), usw. 115
3.3.3
Algebraische Eigenschaften
Durch die Operationen der Tensoralgebra—Linearkombination, Produkt und Verj¨ ungung—k¨onnen wir aus Tensorfeldern andere Tensorfelder konstruieren, indem wir diese Operationen in jedem Punkt auf die Werte der Tensorfelder dort anwenden. Wie wirkt die kovariante Ableitung auf solche Konstrukte? Linearkombination µ...ν µ...ν Tρ...σ (x) und Sρ...σ (x) seien zwei Tensorfelder vom Typ (p, q), a und b zwei Konstanµ...ν ten (unabh¨angig von den Koordinaten). Dann ist die Linearkombination aTρ...σ (x)+ µ...ν bSρ...σ (x) wieder ein Tensorfeld vom Typ (p, q) und es gilt: µ...ν µ...ν µ...ν µ...ν ∇λ (aTρ...σ (x) + bSρ...σ (x)) = a∇λ Tρ...σ (x) + b∇λ Sρ...σ (x)
Die kovariante Ableitung ist also eine lineare Operation. Der Beweis ist sehr einfach, wenn wir den u ¨blichen Trick benutzen, wobei man die Komponenten eines Tesors in einem besonderen Koordinatensystem ausrechnet, findet, dass die erhaltene Beziehung einen Tensorcharakter hat, und schreibt sie somit als g¨ ultig in beliebige Koordinaten um. Das spezielle System ist ein LIS, und so k¨onnen wir die Definition direkt benutzen. Da sich die kovariante Ableitung in einem LIS zur Koordinatenableitung reduziert, und die Koordinatenableitung ist linear, folgt die Behauptung unmittelbar. Man kann aber auch die Gleichung (3.40) f¨ ur den Beweis benutzen. Wir wollen das f¨ ur zwei Vektorfelder machen. Der allgemeine Beweis geht analog. Seien also V µ (x) und U µ (x) zwei Vektorfelder. Berechnen wir die kovariante Ableitung einer Linearkombination davon mit der Formel (3.70): ∇λ (aV µ (x) + bU µ (x)) = ∂λ (aV µ (x) + bU µ (x)) + Γµρλ (aV ρ (x) + bU ρ (x))
= a∂λ V µ (x) + b∂λ U µ (x) + aΓµρλ V ρ (x) + bΓµρλ U ρ (x) = a∇λ V µ (x) + b∇λ U µ (x).
wzzw. Tensorprodukt α...β µ...ν Tρ...σ (x) und Sγ...δ (x) seien zwei Tensorfelder vom Typ (p1 , q1 ) und (p2 , q2 ). F¨ ur ihr Tensorprodukt gilt: α...β α...β α...β µ...ν µ...ν µ...ν ∇λ (Tρ...σ (x)Sγ...δ (x)) = (∇λ Tρ...σ (x))Sγ...δ (x) + Tρ...σ (x)(∇λ Sγ...δ (x)) .
Die kovariante Ableitung erf¨ ullt also die Leibniz-Regel genau wie die Koordinatenableitung. Wiederum folgt der allgemeine Beweis direkt aus der Definition und der Tatsache, dass die partielle Koordinatenableitung die Leibtniz-Regel erf¨ ullt. 116
Ein alternativer Beweis mit hilfe der Formel (3.40) f¨ ur die zwei Vektorfelder V µ (x) und U µ (x): ∇λ (V µ (x)U α (x))
= ∂λ (V µ (x)U α (x)) + Γµρλ (V ρ (x)U α (x)) + Γαρλ (V µ (x)U ρ (x)) = (∂λ V µ (x))U α (x) + V µ (x)(∂λ U α (x)) + Γµρλ V ρ (x)U α (x) + Γαρλ V µ (x)U ρ (x) = (∇λ V µ (x))U α (x) + V µ (x)(∇λ U α (x)),
wzzw. Verju ¨ngung µ Sei Wρσ (x) ein Tensorfeld vom Typ (1, 2). Wir k¨onnen eine Verj¨ ungung davon in jeρ dem Punkt bilden: Uσ (x) = Wρσ (x). Uσ (x) ist ein Tensorfeld vom Typ (0, 1). Welcher ist der Zusammenhang zwischen den kovarianten Ableitungen der zwei Tensorfelder? Wir haben: µ µ α µ µ ∇λ Wρσ (x) = ∂λ Wρσ (x) + Γµαλ Wρσ (x) − Γαρλ Wασ (x) − Γασλ Wρα .
Das ist ein Tensorfeld vom Typ (1, 3), und wir k¨onnen es in den zwei Indizes µ und ρ verj¨ ungen: ρ ρ α ρ ρ ∇λ Wρσ (x) = ∂λ Wρσ (x) + Γραλ Wρσ (x) − Γαρλ Wασ (x) − Γασλ Wρα
= ∂λ Uσ (x) − Γασλ Uα (x) = ∇λ Uσ (x).
In diesem Fall konnten wir also zeigen: wenn man zuerst kovariant ableitet und nachher verj¨ ungt, bekommt man das gleiche, wie wenn man zuerst verj¨ ungt und dann kovariant ableitet. Diese Regel—die Vertauschbarkeit von Verj¨ ungung und kovarianter Ableitung—gilt allgemein, nur muss man aufpassen, um immer in den gleichen Indizes zu verj¨ ungen. Mehrfache kovariante Ableitung Wenn man die kovariante Ableitung auf ein Tensorfeld T (x) vom Typ (p, q) anwendet, ergibt sich ein Tensorfeld vom Typ (p, q + 1). Man kann also die Ableitung nochmals anwenden, und das Resultat wird ein Tensorfeld vom Typ (p, q + 2). Es zeigt sich aber, dass die zwei kovarianten Ableitungen miteinander nicht kommutieren, wie das die Koordinatenableitungen tun. Stattdessen gilt die folgende Formel: µ...ν µ...ν ∇λ ∇κ Tρ...σ (x) − ∇κ ∇λ Tρ...σ (x)
µ α...ν ν µ...α α µ...ν α µ...ν = Rαλκ Tρ...σ + . . . + Rαλκ Tρ...σ − Rρλκ Tα...σ − . . . − Rσλκ Tρ...α .
117
(3.41)
µ wobei Rαλκ der Kr¨ ummungstensor des AZ’s ist. D.h. zwei kovariante Ableitungen kommutieren auch auf glatten Tensorfeldern nicht, sobald die Raumzeit krumm ist. Die Gleichung (3.41) kann man nicht mit Hilfe der direkten Definition der kova¯ µ∇ ¯ ν T¯ (p) = rianten Ableitung und LIS-Koordinaten herleiten: es gilt nicht, dass ∇ ∂¯µ ∂¯ν T¯ (p), weil wir die erste Ableitung in einer ganzen Umgebung von p kennen m¨ ussen, um die zweite Ableitung berechnen zu k¨onnen.
3.3.4
Metrischer Affinzusammenhang
Bisher haben wir mit einem allgemeinen AZ gearbeitet; wir brauchten keine Metrik. In diesem Abschnitt wollen wir uns auf den wichtigen Sonderfall des metrischen AZ beschr¨anken. Wir haben also eine n-Mannigfaltigkeit M mit Metrik gµν (x), und die Komponenten des AZ sind durch die Christoffel-Symbole gegeben (vergl. (1.16)): Γµρσ = {µρσ }. Kovariante Ableitung der Metrik Theorem 9 Kovariante Ableitung des Tensorfeldes δσρ , dessen Komponenten in jedem Punkt und in Bezug auf jedes Koordinatensystem Kronecker-Delta bilden, ist null: ∇µ δσρ = 0 (3.42) f¨ ur jeden AZ auf M . F¨ ur die kovariante Ableitung f¨ ur den metrischen AZ Γµρσ zur Metrik gµν (x) gilt aber noch zus¨atzlich: ∇ρ gµν (x) = 0,
∇ρ g µν (x) = 0
(3.43)
Beweis Alle drei Formeln folgen direkt aus der Definition der kovarianten Ableitung, denn die Komponenten aller drei Tensore in einem LIS haben verschwindende Ableitungen nach allen Koordinaten. Ein alternativer Beweis geht wie folgt. Die Formel (3.70) liefert: ∇µ δσρ = ∂µ δσρ + Γρλµ δσλ − Γλσµ δλρ = 0. Aehnlich erhalten wir ∇ρ gµν (x) = ∂ρ gµν − Γλµρ gλν − Γλνρ gµλ .
(3.44)
Die Identit¨at (2.10) impliziert aber, dass die rechte Seite verschwindet, WZZW. Mit diesem Resultat ergibt (3.44) die erste Gleichung von (3.43). Durch kovariante Ableitung der Identit¨at gµν (x)g νρ (x) = δµρ 118
ergibt sich (∇λ gµν (x))g νρ (x) + gµν (x)(∇λ g νρ (x)) = ∇λ δµρ . Die schon bewiesenen Gleichungen eingesetzt liefern: gµν (x)(∇λ g νρ (x)) = 0 Da aber gµν eine regul¨are Matrix ist, folgt die zweite Gleichung von (3.43) unmittelbar. Kovariante Divergenz Wir wollen jetzt die Differentialoperatoren deuten, welche durch Variation der invarianten Lagrangians entstanden sind. Betrachten wir zun¨achst ein Vektorfeld V µ (x). Seine kovariante Ableitung, ∇ν V µ (x), ist ein Tensorfeld vom Typ (1, 1) und l¨asst eine Verj¨ ungung zu: die sog. kovariante Divergenz ∇µ V µ (x) von V µ (x). Diese Operation ordnet jedem Vektorfeld ein Skalarfeld zu. Die Bedeutung der kovarianten Divergenz eines Vektorfeldes ist einfach die einer Quelle f¨ ur dieses Vektorfeld (Gesamtfluss des √ Vektors durch die Oberfl¨ache einer infinitesimalen n-W¨ urfel ist (∇µ V µ ) gdn x). Man kann die kovariante Divergenz direkt durch die Metrik ausdr¨ ucken, wenn man in der Formel ∇µ V µ (x) = ∂µ V µ (x) + Γµαµ V α (x), (3.45) die oft benutzte Beziehung einsetzt: Γµαµ
√ 1 ∂ −g =√ . −g ∂xα
(3.46)
Somit erhalten wir f¨ ur die kovariante Divergenz √ 1 ∂ −g α µ µ ∇µ V (x) = ∂µ V (x) + √ V (x) −g ∂xα √ 1 √ = √ ( −g∂µ V µ (x) + (∂µ −g)V µ (x)), −g oder endlich
√ 1 ∇µ V µ (x) = √ ∂µ ( −gV µ (x)) . −g
(3.47)
Nat¨ urlich eignet sich diese Formel viel besser zur Berechnung der kovarianten Divergenz als (3.45). Ein anderer Gebrauch f¨ ur die kovariante Divergenz k¨onnen wir mit Hilfe der Formel (3.47) ergr¨ unden. Sei uµ ein normalisiertes aber sonst beliebiges Vektorfeld; seien xµ Koordinaten, welche zu uµ angepasst sind so dass, erstens, uµ = δ0µ 119
und, zweitens, die Hyperfl¨achen x0 = const stehen senktrecht zu uµ , d.h., ds2 = (dx0 )2 + gkl dxk dxl . Solche Koordinaten existieren immer in einer Umgebung jedes Punktes. Dann gilt: p 1 ∇µ uµ = p ∂0 3 g, 3g
wobei 3 g die Determinante der drei-Metrik gkl ist, welche in der Hyperfl¨ache x0 = const induziert ist. Die Divergenz ist also gleich dem relativen Wachstum des dreiVolumens det gkl d3 x in den angepassten Koordinaten. Wenn wir ein Tensorfeld statt des Vektors haben, k¨onnen wir eine einfache Formel nur in Sonderf¨allen bekommen. Betrachten wir z.B. ein Feld T µν (x) vom Typ (2, 0): ∇µ T µν (x) = ∂µ T µν (x) + Γµαµ T αν (x) + Γναµ T µα (x) √ 1 = √ ∂µ ( −gT µν (x)) + Γναµ T µα (x). −g
Der letzte Term rechts wird verschwinden, wenn das Tensorfeld T µν (x) antisymmetrisch ist, denn Γ ist symmetrisch in den zwei unteren Indizes. Es gilt allgemein: ist T µ...ν (x) ein total antisymmetrisches Tensorfeld vom Typ (p, 0), p ≤ n, d.h. T µ...ρ...σ...ν (x) = −T µ...σ...ρ...ν (x) f¨ ur jedes Paar von Indizes ρ und σ, dann kann die kovariante Divergenz in der Form √ 1 ∇µ T µ...ν (x) = √ ∂µ ( −gT µ...ν (x)) −g
(3.48)
durch die Metrik ausgedr¨ uckt werden. Z.B. ist der Elektromagnetische Tensor Fµν total antisymmetrisch. Seine kontravariante Form, F µν = g µκ g νλ Fκλ , ist auch antisymmetrisch, und vom Typ (2, 0). Also: √ 1 ∇µ (g µκ g νλ Fκλ ) = √ ∂µ ( −gg µκ g νλ Fκλ ) . −g Das ist, bis auf den Vorfaktor, der Differentialoperator in der verallgemeinerten Maxwell-Gleichung (3.13). Man kann diese Gleichung also auch schreiben: ∇µ F µν = 0.
(3.49)
Bemerke, dass eine ¨aquivalente Gleichung lautet ∇µ Fνµ = 0. wo Fνµ = gνκ F µκ . Das folgt aus der kovarianten Konstanz (3.43) der Metrik. Nur die Gleichung (3.49) l¨asst sich aber in der Form (3.48) schreiben! 120
Kovarianter Laplace-Operator µ...ν Sei nun Tρ...σ (x) ein beliebiges Tensorfeld vom Typ (p, q). Zweimalige kovariante Ableitung davon ist ein Tensorfeld vom Typ (p, q + 2). Wir k¨onnen das folgende Tensorfeld vom Typ (p, q) bilden µ...ν µ...ν g κλ ∇κ ∇λ Tρ...σ (x) = ∆Tρ...σ (x).
Der entsprechende Differentialoperator heisst kovarianter Laplacian. Beispiel: Skalarfeld Φ(x). Wegen (3.43) ist ∆Φ = g κλ ∇κ ∇λ Φ(x) = ∇κ (g κλ ∇λ Φ(x)). Der Ausdruck in der Klammer ist ein Vektorfeld, die rechte Seite hat also die Form der kovarianten Divergenz. Wir erhalten so mit der Formel (3.47) √ 1 ∆Φ(x) = √ ∂κ ( −gg κλ ∂λ Φ(x)) . −g
(3.50)
Das ist der Differentialoperator, der in der verallgemeinerten Klein-Gordon-Gleichung (3.38) aufgetaucht ist. Die Formel (3.50) gilt nur f¨ ur das Skalarfeld. Sie ist sehr n¨ utzlich und wird oft ben¨ utzt.
3.4
Paralleltransport und die kovariante Ableitung
Wenn man auch die Spinorfelder kovariant ableiten will, muss man die Definition der kovarianten Ableitung auf dem Begriff des Paralleltransports der Vektoren l¨angs Kurven gr¨ unden. In diesem Anschnitt zeigen wir, wie das f¨ ur beliebige Tensorfelder in einer n-dimensionalen affinzusammenh¨angenden Mannigfaltigkeit gemacht werden kann. Diese Methode ist klar und geometrisch, und auch leicht ausdehnbar zu anderen Objekten, wie z.B. Spinorfelder. Wir beschr¨anken us auf die Tensorfelder und bedienen uns der einfachen Tatsache, dass die ganze Tensoralgebra in einem Punkt durch Elemente einer einzigen Vektorbasis generiert werden kann. Es gen¨ ugt also zu wissen, wie man Vektoren parallel transportiert, um zu definieren, wie man das mit beliebigen Tensoren machen kann. Dazu brauchen wir aber mehr Mathematik.
3.4.1
Generatoren der Tensoralgebra
Vektoren M sei eine n-Mannigfaltigkeit und r ∈ M . Den Raum aller Vektoren X in r haben wir durch Tr M bezeichnet und Tangentraum zu M in r genannt. Er ist zugleich der 121
Raum aller Tensoren vom Typ (1, 0), den wir durch Tr (1, 0) bezeichnen. Die Menge Tr (1, 0) ist ein linearer Raum in Bezug auf Linearkombination der Tensoren vom gleichen Typ. Da jeder Vektor n linear unabh¨angige Komponenten hat, haben wir dimTr (1, 0) = n. F¨ ur einen solchen Raum gibt es immer eine Basis {eα }, α = 1, ..., n: n linear unabh¨angige Vektoren in Tr (1, 0). Die n mal n Zahlen eµα sind die Komponenten der Basisvektoren in Bezug auf ein Koordinatensystem {xµ } um r. Jeder Vektor X ∈ Tr (1, 0) kann also zerlegt werden: ¯ α eα , X=X in Komponenten, ¯ α eµ . Xµ = X α ¯ α sind durch die Basis {eα } und den Vektor X eindeutig Die n reellen Zahlen X bestimmt, und umgekehrt bestimmen solche Zahlen und eine Basis den Vektor ein¯ α heissen Komponenten von X in Bezug auf die Basis {eα }. deutig. Die X Sei nun {e0α } eine andere Basis f¨ ur Tr (1, 0). Jeder Vektor, also auch eα , kann in 0 die Basis {eα } zerlegt werden: eα = cβα e0β .
(3.51)
Die Zahlen cβα bilden die sog. Matrix der Basistransformation. Jede solche Matrix ist regul¨ar, da ja die Basen je linear unabh¨angig sind. Wir haben also die Inverse: e0α = (c−1 )βα eβ .
(3.52)
Die entsprechende Transformation der Vektorkomponenten erhalten wir folgendermassen. Sei X ∈ Tr (1, 0). Dann ¯ α eα = X ¯ 0α e0 . X =X α Das Einsetzen von (3.51) f¨ ur eα ergibt ¯ 0α e0 . ¯ α cβ e0 = X X α α β Da die Zerlegung eines Vektors in eine Basis eindeutig ist, erhalten wir ¯ α, ¯ 0β = cβ X X α und das ist das gesuchte Transformationsgesetz. 122
(3.53)
Kovektoren Den Raum aller Kovektoren im Punkt r bezeichnen wir im Einklang mit der eingef¨ uhrten Notation durch Tr (0, 1). Er wird oft auch durch Tr∗ M bezeichnet und Kotangentraum zu M in r genannt. Analog zu Tr (1, 0) ist er ein linearer Raum in Bezug auf Linearkombination der Tensoren vom gleichen Typ und hat Dimension n. Die Operationen Tensorprodukt und Verj¨ ungung geben den Kovektoren aber eine besondere Beziehung zu den Vektoren: es sind die linearen Funktionen auf Tr (1, 0). Betrachten wir einen beliebigen Kovektor ξ ∈ Tr (0, 1) und einen beliebigen Vektor X ∈ Tr (1, 0). In Bezug auf ein Koordinatensystem {xµ } haben sie die Komponenten ξµ und X µ . Wir definieren: hξ, Xi = ξµ X µ . (3.54) Danach ist hξ, Xi wohldefiniert f¨ ur beliebige Paare (ξ, X), unabh¨angig vom gew¨ahlten Koordinatensystem, und linear in beiden Argumenten: hαξ + βη, Xi = αhξ, Xi + βhη, Xi,
hξ, αX + βY i = αhξ, Xi + βhξ, Y i.
Durch diese Operation wird jeder Kovektor zu einer linearen Funktion auf Tr (1, 0). Der Raum aller linearer Funktionen auf einem linearen Raum V heisst Dualraum zu V und wird bezeichnet durch V ∗ . Wenn V n-dimensional ist, ist auch V ∗ ndimensional. Wir setzen diese Tatsachen als bekannt voraus (siehe beliebiges Lehrbuch u ¨ber die lineare Algebra). Da die Kovektoren als lineare Funktionen auf Tr (1, 0) aufgefasst werden k¨onnen, haben wir Tr (0, 1) ∈ (Tr (1, 0))∗ . Beide diese R¨aume sind aber n-dimensional, und die Operationen der linearen Kombination stimmen in beiden R¨aumen u ¨berein; deshalb muss gelten, dass Tr (0, 1) = (Tr (1, 0))∗
(3.55)
(wieder ein Resultat der linearen Algebra). Der Kovektorraum Tr (0, 1) kann also mit dem Raum aller linerarer Funktionen auf dem Vektorraum Tr (1, 0) identifiziert werden. Wir werden die Kovektoren oft so auffassen. Diese Auffassung erm¨oglicht es, jeder Basis {eα } in Tr (1, 0) eindeutig eine Basis α {e } in Tr (0, 1) zuzuordnen, die sog. duale Basis. Betrachten wir lineare Funktionen eα , welche durch die Gleichungen definiert werden: heα , eβ i = δβα , β = 1, ..., n.
(3.56)
Das sind f¨ ur jedes α n linear unabh¨angige Gleichungen, es gibt also f¨ ur jedes α genau eine L¨osung. Diese L¨osungen sind selber linear unabh¨angig; denn setze voraus, dass 123
eine lineare Kombination die Null-Funktion ist: cα eα = 0. Wirken wir damit auf einen Vektor eβ , so erhalten wir gem¨ass (3.56) hcα eα , eβ i = cβ . Somit muss jeder Koeffizient cβ in der Kombination verschwinden. {eα } ist also eine Basis f¨ ur Tr (0, 1), oder Kobasis. Eine Kobasis, welche (3.56) erf¨ ullt, heisst dual zu {eα }. Mit Hilfe einer Basis und der dazu dualen Kobasis k¨onnen wir Komponenten von Vektoren und Kovektoren direkt berechnen. Sei V ein Vektor und v ein Kovektor. Die Komponenten davon sind definiert durch die Zerlegung: V = V α eα ,
v = v α eα .
Mit (3.56) erhalten wir V α = heα , V i,
vα = hv, eα i.
(3.57)
Die neuen Basisvektoren seien folgende Linearkombination der alten e0α = (c−1 )βα eβ . Wir berechnen die entsprechende Transformation der dualen Kobasis e0α = c˜αβ eβ durch Einsetzen in die Definitionsgleichung (3.56): δβα = he0α , e0β i = c˜αγ (c−1 )δβ heγ , eδ i = c˜αγ (c−1 )γβ Das bedeutet, dass c˜αγ = cαγ , und wir haben e0α = cαβ eβ .
(3.58)
Tensoren vom Typ (p, q) Betrachten wir die Menge Tr (p, q) aller Tensoren fom Typ (p, q) im Punkt r ∈ M . In Bezug auf die lineare Kombination der Tensoren vom gleichen Typ ist Tr (p, q) ein linearer Raum. Ein allgemeiner Tensor aus Tr (p, q) ist gegeben durch seine np+q Komponenten. Dies ist die Dimension von Tr (p, q). Wir zeigen jetzt, wie sich aus einer Basis {eα } f¨ ur Tr (0, 1) eine Basis f¨ ur Tr (p, q) konstruieren l¨asst. Theorem 10 {eα } sei eine Basis f¨ ur Tr (1, 0) und {eα } die duale Kobasis. Dann ist ur Tr (p, q), wobei eµα , · · · , eνβ die Menge der Tensoren {eµα · · · eνβ eγρ · · · eδσ } eine Basis f¨ eine geordnete p-Zahl der Elemente der Basis und eγρ , · · · , eδσ eine geordnete q-Zahl der Elemente der Kobasis ist, so dass die Indizes α, . . . β, γ, . . . δ die Elemente der Menge und µ, . . . , ν, ρ, . . . , σ die Komponenten der Tensoren bezeichnen. 124
Beweis eµα . . . eνβ eγρ . . . eδσ ist als Tensorprodukt von p Vektoren und q Kovektoren ein Tensor vom Typ (p, q). Die Menge {eµα · · · eνβ eγρ · · · eδσ }
(3.59)
aller solchen Produkte enth¨alt genau np+q Elemente. Wir m¨ ussen noch zeigen, dass alle diese Tensoren linear unabh¨angig sind. Wir nehmen also an, dass eine lineare Kombination dieser Tensoren verschwindet: µ ν γ δ cα...β γ...δ eα · · · eβ eρ · · · eσ = 0,
(3.60)
wobei cα...β ahlen wir eine beliebige aber feste p-Zahl γ...δ irgendwelche Zahlen sind. W¨ 0 0 α , . . . , β und eine beliebige geordnete q-Zahl γ 0 , . . . , δ 0 , und bilden den Tensor eαµ · · · eβν eργ 0 · · · eσδ0 0
0
(3.61)
vom Typ (q, p). Multiplizieren wir die Gl. (3.60) tensoriell mit (3.61) und verj¨ ungen in den gleichnamigen Indizes. Die linke Seite wird zu: γ ρ δ σ ν β µ α cα...β γ...δ (eα eµ ) · · · (eβ eν )(eρ eγ 0 ) · · · (eσ eδ 0 ). 0
0
Jeder Klammerausdruck steht nach (3.56) f¨ ur ein Kronecker-Delta, und aus der ganzen Summe bleibt nur 0 ...β 0 cαγ 0 ...δ 0 = 0. Aber die Indexkombination α0 , . . . , β 0 , γ 0 , . . . , δ 0 war beliebig, und so m¨ ussen alle Koeffizienten in der Linearkombination (3.60) verschwinden, wzzw. Die Tensorkomponenten in Bezug auf die Basis (3.59) nennen wir auch Komponenten in Bezug auf {eα }. Wie transformieren sich diese Komponenten? Seien {eα } und {e0α } zwei Basen mit der Transformation (3.52), T ein Tensor vom Typ (p, q), β... 0β... T¯δ... seine Komponenten in bezug auf {eα } und T¯δ... diejenigen in Bezug auf {e0α }. Dann gilt: β... 0α... T¯γ... = cαβ · · · (c−1 )δγ · · · T¯δ... . (3.62) Der Beweis ist analog demjenigen f¨ ur Vektoren, und wir lassen ihn aus. Alle Tensoren in einem Punkt r ∈ M zusammen mit den Operationen lineare Kombination f¨ ur Tensoren von gleichen Typ, Tensorprodukt und Verj¨ ungung bilden die sog. Tensoralgebra Tr . D.h. als Menge, [ Tr = Tr (p, q). (p,q)
Wir haben gesehen, dass jedes Element der Algebra mit Hilfe der drei Operationen aus den Elementen der Basis {eα } konstruiert werden kann. Wir nennen diese n Vektoren deshalb Generatoren der Algebra Tr . 125
3.4.2
Komponenten eines Affinzusammenhanges in Bezug auf ein beliebiges Basenfeld
Um die Komponenten eines AZ’s oder eines Tensorfeldes zu definieren, brauchen wir eine Basis in jedem Punkt einer Umgebung U ⊂ M . {xµ } seien Koordinaten in U und {eα (x)} sei eine Basis in jedem Punkt x ∈ U . eµα (x1 , . . . , xn ) seien die Komponenten des Vektors eα (x) in Bezug auf {xµ } und x1 , . . . , xn die entsprechenden Koordinaten von x. Wir definieren: Wenn die n2 Funktionen eµα (x1 , . . . , xn ) C ∞ sind, heisst {eα (x)} ein Basenfeld (Vielbeinfeld, n-Beinfeld, manchmal ohne -feld). Betrachten wir jetzt eine affinzusammeh¨angende n-Mannigfaltigkeit (M, Γ), wobei Γ ein allgemeiner, nichtmetrischer AZ sein kann, ein Basenfeld {eα (x)} in einer Umgebung U ⊂ M , und ein Koordinatensystem {xµ }, das U bedeckt. Die Basen {eα (x)} im Punkt mit Koordinaten xµ und {eα (x + δx)} im benachbarten Punkt mit den Koordinaten xµ + δxµ brauchen nicht parallel zu sein. Bezeichnen wir durch e˜α (x+δx) die n Vektoren, welche in xµ +δxµ zu eα (x) parallel sind. Diese n Vektoren bilden eine Basis in xµ + δxµ , und so ist die Transformation zwischen e˜α (x + δx) und eα (x + δx) wohldefiniert und invertierbar: e˜α (x + δx) = cβα eβ (x + δx)
(3.63)
F¨ ur die Koeffizienten in (3.63), die wir als Funktionen der Variablen xµ und δxµ betrachten, k¨onnen wir ansetzen ¯ β (x)δxσ , cβα (x, δx) = δαβ − Γ ασ
(3.64)
indem wir die Entwicklung mit dem linearen Glied in δxσ abbrechen. Die Koeffizi¯ β (x) heissen die Komponenten des AZ in Bezug auf das Basenfeld {eα (x)}. enten Γ ασ Die Gleichungen (3.63) und (3.64) ergeben: ¯ βασ (x)δxσ )eµ (x + δx), e˜µα (x + δx) = (δαβ − Γ β oder ¯ β eµ (x)δxλ . e˜µα (x + δx) = eµα (x) + ∂λ eµα (x)δxλ − Γ αλ β
(3.65)
¯ β (x) durch Γµ (x) ausdr¨ Als n¨achstes wollen wir die Komponenten Γ ucken. Dazu ασ ρσ benutzen wir die Tatsache, dass der Paralleltransport von Vektoren entlang einer Kurve durch Γµρσ (x) bestimmt ist. Wir w¨ahlen also eine Kurve, parametrisch gegeben durch die Funktionen xµ (λ), welche unsere zwei benachbarten Punkte verbindet: xµ (0) = xµ ,
x˙ µ (0)δλ = δxµ .
Ein entlang dieser Kurve parallel transportiertes Vielbein e˜α (λ) erf¨ ullt die Gleichung: e˜˙ µα + Γµρσ e˜ρα x˙ σ = 0. 126
(3.66)
Die Basis eµα soll von xµ zu xµ + δxµ parallel transportiert werden, die Anfangsbedingung f¨ ur die Gleichung (3.66) also ist: e˜µα (0) = eµα (x). Rechnen wir: e˜µα (x + δx) = e˜µα (λ + δλ) = e˜µα (0) + e˜˙ µα (0)δλ = e˜µα (0) − Γµρσ e˜ρα (0)x˙ σ δλ. Wenn wir die Anfangsdaten einsetzen, erhalten wir e˜µα (x + δx) = eµα (x) − Γµρσ eρα (x)δxσ .
(3.67)
Der Vergleich zwischen (3.67) und (3.65) f¨ uhrt zu: ¯ β (x)eµ (x) − ∂λ eµα (x) − Γµ eρα (x))δxλ = 0. (Γ αλ β ρλ Multiplizieren wir diese Gleichung mit eγµ (x), summieren u ¨ber µ, und benutzen die λ Tatsache, dass δx beliebig war, dann erhalten wir die gew¨ unschte Beziehung: ¯ γ (x) = eγ (x)∂λ eµ (x) + Γµ (x)eρ (x)eγ (x). Γ µ α α µ αλ ρλ
3.4.3
(3.68)
Kovariante Ableitung der Tensorfelder
(M, Γ) sei eine affinzusammenh¨angende Mannigfaltigkeit (auch nichtmetrische), {xµ } ein Koordinatensystem, Γµρσ die Komponenten vom AZ in Bezug auf {xµ }, sowie T (x) ein tensorfeld vom Typ (p, q), je in einer Umgebung U ⊂ M . Wir wollen die Werte des Tensorfeldes in zwei benachbarten Punkten xµ und xµ + dxµ vergleichen. Eine sinnvolle M¨oglichkeit besteht darin, dass wir die Komponenten des Feldes in Bezug auf zwei parallele Basen in den zwei Punkten voneinander subtrahieren. α... (x) sind die Komponenten von Wir w¨ahlen in Punkt xµ ∈ U eine Basis {eα (x)}. T¯β... ˜ α... T (x) in Bezug auf {eα (x)}, und T¯ (x + dx) jene von T (x + dx) in Bezug auf die β...
dazu parallele Basis {˜ eα (x + dx)} in xµ + dxµ . Die Differenz davon definiert die sog. kovariante Ableitung von T (x) durch die Gleichung: α... α... α... T˜¯β... (x + dx) − T¯β... (x) = ∇λ T¯β... (x)dxλ ,
(3.69)
α... (x) zun¨achst einfach eine indexbeh¨angte Gr¨osse vom Typ (p, q + 1) in wobei ∇λ T¯β... x ist, welche mit der Basis {eα (x)} und dem Koordinatensystem {xµ } verbunden ist. Somit ist die kovariante Ableitung f¨ ur alle Tensorfelder wohldefiniert, f¨ ur andere µ...ν µ ¯ ur ∂λ Tρ...σ (x), usw. ist sie hingegen nicht Felder und Objekte wie z.B. Γρσ (x) oder f¨ ¯ α ausdr¨ ucken und ihre definiert. Wir wollen jetzt die kovariante Ableitung durch Γ βγ Eigenschaften studieren.
127
Direkter Ausdruck fu ¨r die kovariante Ableitung Die Komponenten von T (x + dx) in Bezug auf {eα (x + dx)} bezeichnen wir durch α... T¯β... (x + dx). Die Formeln (3.52), (3.62), (3.63) und (3.64) liefern: α... T˜¯β... (x + dx) ¯ α dxλ ) · · · (δ δ − Γ ¯ δ dxλ ) · · · T¯ γ... (x + dx) = (δγα + Γ γλ β βλ δ... α... = T¯ (x + dx) β...
¯ δ T¯ α... (x + dx)dxλ − . . . , ¯ α T¯ γ... (x + dx)dxλ + . . . − Γ + Γ βλ δ... γλ β... wobei alle Terme h¨oherer Ordnung in dxλ weggelassen sind. Wenn wir rechts u ¨berall einsetzen α... α... α... T¯β... (x + dx) = T¯β... (x) + ∂λ T¯β... (x)dxλ , ergibt sich in erster Ordnung noch α... α... α... T˜¯β... (x + dx) = T¯β... (x) + ∂λ T¯β... (x)dxλ α... ¯ αγλ T¯ γ... (x)dxλ + . . . − Γ ¯ γ T¯γ... + Γ (x)dxλ − . . . β... βλ
Vergleich mit der Definition (3.69) und die Tatsache, dass dxλ beliebig war, liefert das Endresultat: α... α... ¯ α T¯ γ... (x) + . . . − Γ ¯ γ T¯ α... (x) − . . . . ∇λ T¯β... (x) = ∂λ T¯β... (x) + Γ γλ β... βλ γ...
(3.70)
Transformationseigenschaften Unsere n¨achste Aufgabe ist, die Transformationseigenschaften der kovarianten Ableitung zu bestimmen. Theorem 11 Wenn sich das Basisfeld transformiert e0α (x) = (c−1 )βα (x)eβ (x),
(3.71)
wobei die Transformationsmatrix (c−1 )βα (x) glatt von den Punktkoordinaten abh¨angt und die Koordinaten {xµ } fest bleiben, dann transformiert sich die kovariante Abα... (x) vom Typ (p, q) wie folgt: leitung eines Tensorfeldes T¯β... γ... 0α... ∇λ T¯β... (x) = cαγ (x) · · · (c−1 )δβ (x) · · · ∇λ T¯δ... (x).
(3.72)
α... D.h. die kovariante Ableitung ∇λ T¯β... (x) transformiert sich bei festgehaltenen Koα... ¯ ordinaten genau wie das Tensorfeld Tβ... (x) selbst (vergl. mit (3.62)). Beweis Parallelverschiebung ist eine lineare Abbildung, also gilt mit (3.71) ebenfalls e˜0α (x + dx) = (c−1 )βα (x)˜ eβ (x + dx)
128
Die entsprechenden Gleichungen f¨ ur die Tensorkomponenten sind: γ... 0α... T¯β... (x) = cαγ (x) · · · (c−1 )δβ (x) · · · T¯δ... (x), T¯˜0α... (x + dx) = cα (x) · · · (c−1 )δ (x) · · · T¯˜γ... (x + dx). β...
γ
β
δ...
Subtraktion der Gleichungen voneinander und Vergleich mit (3.69) ergibt (3.72), wzzw. Theorem 12 Wenn das Basenfeld {eα (x)} festgehalten wird und die Koordinaten transformiert werden, x0µ = x0µ (x), dann transformiert sich die kovariante Ableitung des Tensorfeldes T (x) wie folgt: α... 0 α... ∇0λ T¯β... (x ) = Xλκ0 (x)∇κ T¯β... (x).
(3.73)
D.h. bei festgehaltener Basis transformiert sie sich wie ein Kovektor (deshalb “kovariante Ableitung”). Beweis Die Definition (3.69) ergibt: α... 0 α... (x )δx0λ = ∇λ T¯β... (x)δxλ , ∇0λ T¯β...
da die Unterschiede der Komponenten der Tensoren nicht von den Koordinaten abh¨angig sind. Wenn wir f¨ ur δxλ einsetzen δxλ = Xκλ0 δx0κ , und die Tatsache benutzen, dass δx0κ beliebig ist, erhalten wir (3.73), wzzw.
3.5 3.5.1
Energie-Impuls-Tensor Definition
In der Feldtheorie auf Minkowskischer Raumzeit ist der sog. kanonische EnergieImpuls-Tensor als eine vier N¨other-Str¨ome umfassende Gr¨osse Θµν definiert, wobei diese Str¨ome mit der Invarianz der Wirkung in Bezug auf die vier Poincar´e-Verschiebungen verbunden sind. Der kanonische Energie-Impuls-Tensor Θµν wird dadurch aber nicht eindeutig bestimmt. Wohldefiniert sind nur die Integrale davon u ¨ber Cauchy-Hyperfl¨achen, welche die Rolle von Gesamtenergie und -impuls spielen. Der Energie-Impuls-Tensor gibt z.B. die Verteilung der Energie und des Impulses eines Feldes im Raum an. Eine solche Verteilung kann allerdings nur dann einen physikalischen Sinn haben, wenn feststeht, wie sie gemessen wird. Einen solche Messprozess kann uns wohl die Gravitationstheorie liefern, weil die Dichte der Energie 129
die Quelle der Gravitation ist. Man k¨onnte also die Verteilung der Energie im Raum im Prinzip messen, indem man das dadurch erzeugte Gravitationsfeld misst. F¨ ur ein Feldmodell, das Gravitation einschliesst, setzt sich die Wirkung aus zwei Teilen zusammen: S = SG + SM , wobei SG die Wirkung f¨ ur die Gravitation und SM diejenige f¨ ur alle anderen Felder im Modell ist. Wenn wir nach der Metrik variieren, erhalten wir δSG δSM =− . δgµν (x) δgµν (x) Die linke Seite ergibt die linke Seite der dynamischen Gleichung f¨ ur die Metrik, die rechte Seite ist also der Quellenterm zu dieser Gleichung. Der Energie-Impuls-Tensor h¨angt irgendwie mit dieser rechten Seite zusammen; Das Beispiel der Elektrodynamik motiviert, dass wir postulieren: δSM 2 . T µν (x) = − √ −g δgµν (x)
(3.74)
√ Der Faktor ( −g)−1 macht aus der Variation einen Tensor, wie wir noch sehen werden. Der Faktor -2 ist eine Konvention, welche den Vorfaktor in der Wirkung f¨ ur die Materie bestimmt. Die Variationsableitung auf der rechten Seite der Gleichung (3.74) ist wie folgt definiert. Man spaltet das Feld ψ a (x) in der Variationsformel (3.34) in zwei Teile, ψ a (x) = (gµν (x), φA (x)), und setzt f¨ ur die Variationen ein: δxµ = 0,
δφA (x) = 0;
δgµν (x) soll innerhalb des (offenen) Integrationsgebietes der Wirkung einen kompakten Tr¨ager haben. Dann ist δ∗ = δ, und die Variation der Wirkung wird zu Z δS = d4 x W µν (x)δgµν (x). Die Koeffizienten W µν (x) sind damit noch nicht eindeutig bestimmt, da die Metrik gµν (x) symmetrisch in den Indizes µ und ν ist—man kann zu W µν (x) eine beliebige antisymmetrische Gr¨osse addieren. Diese Freiheit beseitigen wir durch die Forderung, dass W µν symmetrisch in µ und ν ist. Mit diesen Konventionen wird dann der Energie-Impuls-Tensor (3.74) wohldefiniert, wobei δSM := W µν (x). δgµν (x) Aus der Variationsformel (3.34) entnehmen wir: W µν (x) =
∂LM ∂ tot ∂LM − ρ . ∂gµν (x) ∂x ∂gµν,ρ (x) 130
(3.75)
Bemerke, dass wir auf diese Weise den Energie-Impuls-Tensor nur f¨ ur die Materie definiert haben—ein solcher f¨ ur Gravitation ist ausgeblieben. Insbesondere ist die Variation der gesamten Wirkung nach gµν (x) gleich null, wenn die dynamischen Gleichungen erf¨ ullt sind. Diese Prozedur resultiert also in keine Gr¨osse, wie ein EnergieImpuls-Tensor des gesamten Systems eingeschlossen Gravitation. Bisher hat niemand eine vern¨ unftige Gr¨osse definiert, welche die Rolle des Energie-Impuls-Tensors der Gravitation spielen k¨onnte. Das ist wohl auf die Tatsache zur¨ uckzuf¨ uhren, dass der Tensor z.B. die Energie der Gravitation bestimmen m¨ usste, welche in einem gegebenen infinitesimalen Volumen vorhanden ist. Das Aequivalenzprinzip besagt aber, dass ein Gravitationsfeld sich in einem solchen Volumen durch eine Koordinatentransformation wegtransformieren l¨asst.
3.5.2
Eigenschaften
Unmittelbar aus der Definition ergibt sich: 1. T µν (x) ist symmetrisch in den Indizes µ und ν. Weiter gilt: 2. T µν (x) ist ein Tensorfeld vom Typ (2, 0). Beweis Nach Gleichung (3.74) ist Z √ 1 d4 x −gT µν (x)δgµν (x). δSM = − 2 δSM ist ein Skalar f¨ ur jede Variation δgµν (x). Es fogt, dass wir auch haben Z p 1 0 δSM = − (x0 ), d4 x0 −g 0 T 0µν (x0 )δgµν 2
wobei x0µ andere Koordinaten im Integrationsbereich sind. Im zweiten Integral f¨ uhren wir die Substitution x0µ = x0µ (x) durch: Z 00 03 p ∂(x , . . . , x ) 1 −g 0 (x0 (x))T 0µν (x0 (x))X ρ0 Xνσ0 δgρσ (x) δSM = − d4 x µ 0 3 2 ∂(x , . . . , x ) Z p 1 d4 x −g(x) T 0µν (x0 (x))Xµρ0 Xνσ0 δgρσ (x). = − 2 (Wir haben die Formel (1.14) f¨ ur die Transformation der Determinante g benutzt.) Es folgt: Z p d4 x −g(x) T 0µν (x0 (x))Xµρ0 Xνσ0 − T ρσ (x) δgρσ (x) = 0 131
f¨ ur alle δgµν (x). Dann muss das Koeffizient bei δgµν (x) gleich null sein, und wir erhalten T 0µν (x0 (x))Xµρ0 Xνσ0 = T ρσ (x) wzzw. Der folgende Satz gibt die wichtigste Eigenschaft von T µν (x): Theorem 13 Wenn SM ein Skalar ist und die dynamischen Gleichungen f¨ ur die Materiefelder ∂ tot ∂LM ∂LM − = 0, (3.76) ∂ϕA (x) ∂xρ ∂ϕA ,ρ (x) erf¨ ullt sind, dann ∇µ T µν (x) = 0 .
(3.77)
Beweis Die Koordinatenunabh¨angigkeit von SM k¨onnen wir ausn¨ utzen, indem wir die Variation δSM bei einer infinitesimalen Koordinatentransformation (3.26) mittels Variationsformel (3.34) ausrechnen und gleich null setzen. Dabei verlangen wir von der Variation δxµ (x), dass sie kompakten Tr¨ager hat, der innerhalb vom Integrationsgebiet V der Wirkung liegt. Die entsprechenden Variationen der u ¨ brigen µ Felder lassen sich aus dem Vektorfeld δx (x) ermitteln. Z.B. f¨ ur gµν (x) haben wir 0 gµν (x0 ) = Xµρ0 Xνσ0 gρσ (x),
wobei Xµρ0 = δµρ − ∂µ δxρ (x). Somit haben wir δgµν (x) = −gαν (x)∂µ δxα (x) − gµα (x)∂ν δxα (x), und die entsprechende Formvariation (Formel (3.32)) ist: δ∗ gµν (x) = −gαν (x)∂µ δxα (x) − gµα (x)∂ν δxα (x) − ∂α gµν (x)δxα (x). Man kann die rechte Seite umformen, so dass die folgende wichtige Formel resultiert (Aufgabe): δ∗ gµν (x) = −∇µ δxν − ∇ν δxµ , (3.78) wobei δxµ = gµν δxν . Die Variationen δϕA (x) und δ∗ ϕA (x) werden auch nichttrivial, da sich die Felder ϕA (x) bei einer Koordinatentransformation nichttrivial verhalten, wir werden aber die explizite Form davon nicht brauchen. 132
Die Variationsformel (3.34) liefert dann: tot Z ∂LM (x) ∂ tot ∂LM (x) ∂ µ 4 (. . .) + − µ δSM = dx δ∗ ϕA (x) µ A (x) A (x) ∂x ∂ϕ ∂x ∂ϕ V ,µ tot ∂LM (x) ∂ ∂LM (x) + δ∗ gρσ (x) . − ∂gρσ (x) ∂xµ ∂gρσ,µ (x) Die totale Divergenz verschwindet, weil δxµ (x) kompakten Tr¨ager hat, der zweite Term in der Klammer ist null dank (3.76), und im Rest setzen wir (3.75) und (3.78) ein: Z √ δSM = 1/2 d4 x −gT µν (x)(∇µ δxν (x) + ∇ν δxµ (x)). V
Wegen der Symmetrie des Energie-Impuls-Tensors k¨onnen wir 1/2 und den letzten Term in der Klammer auslassen; der Rest l¨asst sich schreiben wie folgt: Z Z √ √ 4 µν d4 x −g(∇µ T µν )δxν δSM = d x −g∇µ (T δxν ) − ZV ZV √ √ = d4 x ∂µ ( −gT µν δxν ) − d4 x ( −ggνρ ∇µ T µν )δxρ . V
V
Das erste Glied ist aber null, und das zweite verschwindet f¨ ur alle δxρ nur wenn es √ gilt: −ggνρ ∇µ T µν = 0 . Aber das ist a¨quivalent zur Gl. (3.77), wzzw.
3.5.3
Bedeutung der Divergenzgleichung
Sei p ein Punkt der Raumzeit und {xµ } ein Koordinatensystem, das geod¨atisch in p ist (Γµρσ (p) = 0) und erf¨ ullt: gµν (p) = ηµν . Wir k¨onnen immer setzen: xµ (p) = 0. In diesen speziellen Koordinaten lautet (3.77) im Punkte p ∂µ T µν (p) = 0. Multiplizieren wir diese Gleichung mit dem invarianten 4-Volumenelement d4 x und schreiben die Summe aus: X ∂µ T µν (p)d4 x = (∂µ T µν (0)dxµ )d3µ x, µ
wobei d3µ x = (dx1 dx2 dx3 , dx0 dx2 dx3 , dx0 dx1 dx3 , dx0 dx1 dx2 ) die Fl¨achenelemente der vier Koordinatenhyperfl¨achen sind; sie geben auch die richtige Mass der drei-Fl¨achen in den entsprechenden Einheiten (cm3 oder cm2 s, wenn 133
c 6= 1) und die Fl¨ache d3µ ist senkrecht auf die µ-Achse). Der Ausdruck in der Klammer kann als Unterschied der Werte vom Feld T µν (x) in den Punkten p und pµ aufgefasst werden, wobei pµ die zu p benachbarten Eckpunkte des infinitesimalen Koordinatenw¨ urfels sind: xµ (p0 ) = (dx0 , 0, 0, 0), xµ (p1 ) = (0, dx1 , 0, 0), xµ (p2 ) = (0, 0, dx2 , 0), xµ (p3 ) = (0, 0, 0, dx3 ), also X µ
(∂µ T µν (0)dxµ )d3µ x =
X µ
(T µν (pµ ) − T µν (p))d3µ x.
Die nunmehr 8 Summanden geben offenbar den Fluss der Stromdichte (also den Strom) der ν-Komponente des 4-Impulses durch je eine Seitenfl¨ache des Koordinatenw¨ urfel an. Da die Summe verschwinden muss, ist die ν-Komponente des 4Impulses lokal erhalten. Das ist die Interpretation der Divergenzgleichung (3.77). Das entspricht dem Resultat, das wir f¨ ur Teilchen erhalten haben; ∇pµ = 0. ds Im allgemeinen l¨asst sich diese Erhaltungsgleichung nicht u ¨ber ein endliches Integrationsgebiet so integrieren, dass ein globales Erhaltungsgesetz resultiert, wie in der Minkowski-Raumzeit. Dort n¨amlich gibt es ein global geod¨atisches System, wo (3.77) lautet: ∂µ T µν (x) = 0. Integrieren wir diese Gleichung u ¨ber das Volumen zwischen zwei Hyperfl¨achen x0 = t1 und x0 = t2 , finden wir mit dem Satz von Gauss, die Erhaltung des Gesamtimpulses (resp. Energie) des Feldes: Z ν P = d30 x T 0ν = konst. In einer krummen Raumzeit gibt es aber kein global geod¨atisches System; f¨ ur jeden Punkt m¨ ussen wir ein neues geod¨atisches System aufstellen, und die elementaren W¨ urfel passen nicht zusammen. Wenn wir mit einem allgemeinen Koordinatensystem zu arbeiten versuchen, dann verschwinden die Γ-Korrekturen zu ∂µ T µν (x) in (3.77) nicht, und das Volumenintegral l¨asst sich nicht in ein Oberfl¨achenintegral transformieren. Dass Gesamtenergie und -impuls der Materie nur in der flachen Raumzeit erhalten (und u ¨berhaupt wohldefiniert) sind, ist eigentlich verst¨andlich: Ein materielles System in einem Gravitationsfeld ist nicht isoliert, es kann Energie und Impuls mit dem Gravitationsfeld austauschen. Dieser Austausch findet aber nach Gleichung 134
(3.77) nur auf eine nichtlokale Weise statt, d.h. das Gravitationsfeld besitzt keinen Energie-Impuls-Tensor, so dass seine Summe davon mit T µν —ein “totaler” EnergieImpuls-Tensor—lokal erhalten w¨are, so wie das f¨ ur zwei materielle Systeme in der Minkowski-Raumzeit der Fall ist.
3.5.4
Ideale Flu ¨ ssigkeit
Bisher haben wir nur den Energie-Impuls-Tensor der Felder studiert. Das sollte allerdings f¨ ur alle Zwecke gen¨ ugen, weil die Felder in der heutigen theoretischen Physik als Grundelemente aller Systeme betrachtet werden. Doch als Quelle f¨ ur die klassische (unquantisierte) Gravitation kommt der Energie-Impuls-Tensor der Felder nur indirekt in Frage: Man m¨ usste die Materiefelder zun¨achst quantisieren und dann den Mittelwert des Energie-Impuls-Tensors in dem zu betrachtenden Quantenzustand berechnen. Ein solcher Mittelwert w¨are immer noch viel zu fein strukturiert: Elementarteilchen, Atome, Molekeln, Staubk¨orner, Sterne, Galaxien usw. Klassische Mittelwerte rechnet man u ugend grosse Volumina, um eine glatte lang¨ber gen¨ µν sam ver¨anderliche Gr¨osse zu gewinnen. Dieser effektive Tensor Teff erbt von seinem µν “Vorfahren” T die physikalische Bedeutung—Stromdichte der Komponenten des 4er-Impulses—die Tensoreigenschaft und die lokale Erhaltung (3.77). Die Erfahrung lehrt, dass die effektive Materie meistens die Form der sogenannten idealen Fl¨ ussigkeit (ideal = Viskosit¨at null) hat. Die wollen wir jetzt definieren. Die ideale Fl¨ ussigkeit ist durch zwei Eigenschaften ausgezeichnet: Sie besitzt in jedem Punkt ein Ruhesystem (eindeutig bis auf eine Drehung der r¨aumlichen Achsen), und sie sieht in diesem Ruhesystem vollst¨andig isotrop aus. Ein Ruhesystem eines materiellen Systems im Punkt p ist ein LIS x¯µ in p, in Bezug auf welches die Komponenten des Energiestromes T 0µ die Form haben: T¯ 0µ (p) = (ρ, 0, 0, 0).
(3.79)
u ¯µ := (1, 0, 0, 0) heisst 4er-Geschwindigkeit der idealen Fl¨ ussigkeit in p. Die reelle Zahl ρ heisst Massendichte (oder Energiedichte oder schlicht “Dichte”) der Fl¨ ussigµν ¯ keit. Isotrop bedeutet, dass der Tensors T invariant ist gegen¨ uber Drehungen der drei r¨aumlichen Achsen, d.h. Transformationen: X x¯00 = x¯0 , x¯0k = Olk x¯l , (3.80) l
wobei Olk eine orthogonale Matrix ist. Somit ist {¯ x0µ } wieder ein LIS und ebenfalls ein Ruhesystem in p, da die Gleichung (3.79) durch die Transformation (3.80) nicht gest¨ort wird. Aus der Definition der idealen Fl¨ ussigkeit folgt, dass Energie-Impuls-Tensor T¯ µν und 4er-Geschwindigkeit u ¯µ in Komponenten (in Bezug auf ein Ruhesystem) die 135
Form haben:
T¯ µν =
ρ 0 0 0
0 p 0 0
0 0 p 0
0 0 0 p
,
u¯µ =
1 0 0 0
.
(3.81)
Die Zahl p heisst Druck der Fl¨ ussigkeit (die Isotropie ist also nichts anderes als das Pascal-Gesetz). In jedem Punkt haben wir ein Ruhesystem; Dichte ρ, Druck p und 4er-Geschwindigkeit uµ sind somit Funktionen auf der Raumzeit M . Wir setzen voraus, dass sie glatt (C ∞ ) sind. ρ(x) und p(x) sind dann irgendwelche Skalarfelder, uµ (x) ein Vektorfeld auf M mit Norm 1. In jedem Punkt haben wir ein anderes Ruhesystem. Es gibt aber keine Koordinaten, in denen T µν (x) u ur manche Berechnungen ist ¨ berall die Form (3.81) hat. F¨ es wichtig, einen Ausdruck f¨ ur den Energie-Impuls-Tensor in ρ, p, und uµ zu haben, der in beliebigen Koordinaten {xµ } g¨ ultig ist. Einen solchen Audruck finden wir, wenn wir bemerken, dass in einem Ruhesystem gilt: 1 0 0 0 1 0 0 0 0 0 −1 0 0 0 0 0 g¯µν = u ¯µ u ¯ν = , , −1 0 0 0 0 0 0 0 0 0 0 −1 0 0 0 0 also
T¯ µν = ρ¯ uµ u ¯ν − p(¯ g µν − u ¯µ u¯ν ). Auf beiden Seiten dieser Gleichung stehen Tensoren vom Typ (2, 0). Die Gleichung besagt, dass die Komponenten dieser Tensoren in Bezug auf ein Koordinatensystem u ussen sie in jedem ¨ bereinstimmen. Da sie sich aber gleich transformieren, m¨ Koordinatensystem u unschte Beziehung: ¨bereinstimmen. Damit haben wir die gew¨ T µν (x) = (ρ(x) + p(x))uµ (x)uν (x) − p(x)g µν (x).
(3.82)
Studieren wir jetzt, wie ein Zustand der Fl¨ ussigkeit in einem Punkt beschrieben werden kann und wie k¨onnen wir die dynamischen Gesetze f¨ ur die Fl¨ ussigkeit formulieren. Der Druck und die Dichte sind f¨ ur konkrete physikalische Systeme nicht unabh¨angig voneinander. Sie sind durch die sogenannte Zustandsgleichung verbunden, z.B. p = p(ρ). Der Zustand der idealen Fl¨ ussigkeit im Punkt x ist bestimmt, 1 2 3 wenn wir ρ(x), u (x), u (x) und u (x) angeben: Der Druck ist dann durch die Zustandsgleichung gegeben, und u0 (x) ergibt sich aus der Normierungsbedingung f¨ ur uµ (zeitartiger Einheitsvektor). Die Zeitentwicklung der Funktionen ρ(x), u1 (x), u2 (x) und u3 (x) aus ihren Anfangsdaten sollte durch irgendwelche dynamische Gleichungen beschrieben werden. Wir brauchen daf¨ ur nicht bis zu den elementaren Feldern 136
zur¨ uck zu gehen: die Divergenzgleichung (eine Konsequenz der dynamischen Gleichungen f¨ ur diese Felder) gen¨ ugt vollst¨andig, die Dynamik unserer einfachen idealen Fl¨ ussigkeit zu bestimmen. Setzen wir (3.82) in die linke Seite von (3.77) ein, so ergibt sich: ∇µ [(ρ + p)uµ uν − pg µν ] =
= (∂µ ρ + ∂µ p)uµ uν + (ρ + p)uν ∇µ uµ + (ρ + p)uµ ∇µ uν − g µν ∂µ p
= [uµ ∂µ ρ + (ρ + p)∇µ uµ ]uν + [(ρ + p)uµ ∇µ uν − (g µν − uµ uν )∂µ p].
Das zweite Glied ist ein auf uµ senkrechter Vektor. Das kann man wie folgt sehen. ullt die Gleichungen: Der Tensor Pνµ = gνµ − uµ uν er¨ Pνµ uν = 0,
Pνµ sν = sµ
f¨ ur alle Vektoren sµ , die senkrecht auf uµ stehen, uν sν = 0. Pνµ ist also ein Projektionsoperator auf die Richtungen, welche r¨aumlich sind in Bezug auf einen Beobachter mit 4er-Geschwindigkeit uµ . Auch uµ ∇µ uν ist senkrecht auf uν (Aufgabe). Die Folgerung uν ∇µ T µν = 0 der Divergenzgleichung bekommt also die Form: uµ ∂µ ρ + (ρ + p)∇µ uµ = 0,
(3.83)
und wenn wir dies zur¨ uck in die Divergenzgleichung einsetzen, bleibt davon nur (ρ + p)uµ ∇µ uν = (g µν − uµ uν )∂µ p.
(3.84)
Die erste Gleichung besagt, dass die Zeitableitung der Energiedichte proportional ist zur Divergenz der Integralkurven des Vektorfeldes uµ plus die Arbeit, welche der Druck leistet. Sie heisst Energiegleichung. Die zweite Gleichung hat nur drei unabh¨angige Komponenten. Auf der linken Seite steht die 4er-Beschleunigung der Integralkurven (Stromlinien der Fl¨ ussigkeit) mulitipliziert mit der Massendichte plus µ eine relativistische Korrektur pu ∇µ uν . Auf der rechten Seite steht der Gradient des Druckes, in die r¨aumliche Richtung projiziert. Somit ist (3.84) die allgemein relativistische Version der Euler-Gleichung. Sie beschreibt die Bewegung der idealen Fl¨ ussigkeit (keine Viskosit¨at) in beliebigen Gravitationsfeldern.
3.6
Dynamik der Gravitation
Bisher haben wir verschiedene Materiesysteme (Teilchen, Felder) in einem vorgegebenen Gravitationsfeld studiert. Die Materie war vom Gravitationsfeld beeinflusst— sie war zur Gravitation minimal gekoppelt—aber ihr eigener Einfluss wiederum auf das Gravitationsfeld wurde nicht besprochen. Und doch wissen wir, dass die Sonne 137
und die Planeten durch ihre Massen ein sp¨ urbares Gravitationsfeld erzeugen. In der Newton-Theorie beschreibt man diesen Effekt durch die Poisson-Gleichung. In diesem Abschnitt wollen wir die entsprechenden relativistischen Gleichungen f¨ ur die Gravitation aufstellen und einige Grundeigenschaften davon studieren. Damit sind wir endlich nach einer langen aber notwendigen Vorarbeit am Herz der Einstein-Theorie angekommen. Genau wie die Maxwell-Gleichungen das Kernst¨ uck der Maxweell-Theorie bilden, so sind die sog. Einstein-Gleichungen das Zentrum der ART. Diese Gleichungen sind von Generationen der Physiker studiert bis ihr Inhalt heute einigermassen verstanden wird. Sie sind n¨amlich schwierig: nicht-linear und recht verschieden von anderen Feldgleichungen der Theorie. Die Nichtlinearit¨at l¨asst sich nur in relativ seltenen F¨allen als kleine St¨orung behandeln. Das n¨achste Semester wird vollst¨andig dem Studium einiger wichtiger L¨osungen dieser Gleichungen gewidmet.
3.6.1
Die Wirkung fu ¨ r die Metrik
Man kann die Lagrange-Funktion f¨ ur die Gravitation nicht “herleiten”, nur postulieren. Um aber vern¨ unftige Kandidaten u ¨berhaupt zu finden, trifft man vereinfachende und naheliegende Voraussetzungen. Als erstes verlangen wir, dass sich aus der Lagrange-Funktion Differentialgleichungen zweiter Ordnung f¨ ur die Metrik ergeben. Das ist die gew¨ohnliche und bei allen anderen Feldern und dynamischen Systemen bew¨ahrte Wahl. Dann: L(x) = F0 (gµν (x), gµν,ρ (x)).
(3.85)
F0 ist also eine Funktion von 10 + 40 = 50 Argumenten. Als zweites wollen wir, dass √
−gF (gµν (x), gµν,ρ (x), gµν,ρσ (x)) √ ∂ tot √ −gF0 (gµν (x), gµν,ρ (x)) + σ −gF σ (gµν (x), gµν,ρ (x)), = ∂x
(3.86)
wobei F σ irgendwelche f¨ ur Funktionen von gµν (x) und gµν,ρ (x) sind und F (x) ein Skalarfeld ist. D.h. der Wert von F in einem Punkt p muss unabh¨angig davon sein, in welchen Koordinaten die Komponenten gµν (p) der Metrik und deren Ableitungen gµν,ρ (p) und gµν,ρσ (p) berechnet sind, die man als Argumente in der Funktion F einsetzt: 0 0 0 F (gµν (x0 ), gµν,ρ (x0 ), gµν,ρσ (x0 )) = F (gµν (x), gµν,ρ (x), gµν,ρσ (x))
(auf beiden Seiten steht dieselbe Funktion—nur die Argumente sind verschieden), und zwar f¨ ur jeden Punkt x. Wir nennen solche Funktionen invariant. Die Bedeutung 138
dieser Bedingung ist: wenn die zehn Funktionen gµν (x) eine L¨osung der resultieren0 0 den Gleichungen bilden, dann sind die Funktionen gµν (x0 ) auch eine, wobei gµν (x0 ) aus gµν (x) durch eine Koordinatentransformation entsteht. Solche dynamische Feldmodelle heissen allgemein kovariant. Wir bemerken, dass die Funktion F der Form (3.86) eine lineare Funktion der Variablen gµν,ρσ (x) ist: ∂ tot σ ∂F σ ∂F σ F (g (x), g (x)) = g (x) + gµν,ρσ (x) µν µν,ρ µν,σ ∂xσ ∂gµν (x) ∂gµν,ρ (x) Von den invarianten Funktionen ist das Folgende bekannt: Theorem 14 M sei eine n-Mannigfaltigkeit, gµν (x) eine Metrik auf M und F eine invariante Funktion, abh¨angig von den folgenden Argumenten: 1. F (gµν (x), gµν,ρ (x)), 2. F (gµν (x), gµν,ρ (x), gµν,ρσ (x)). Dann muss F die Form haben: 1. F = konst, µ 2. F = F (gµν (x), Rνρσ (x)).
F kann also nur im Fall 2. nichttrivial sein (zwischen verschiedenen Metriken unterscheiden), und sie kann von den Argumenten gµν,ρ (x) und gµν,ρσ (x) nur u ¨ber den Kr¨ ummungstensor in x abh¨angen. Der Teil 1. des S¨atzes ist evident: man kann in jedem festen Punkt jede Metrik durch eine Koordinatentransformation zum Wert ηµν und gleichzeitig alle ersten Ableitungen davon zum Verschwinden bringen. Dann ist F (gµν (x), gµν,ρ (x)) = F (ηµν , 0) = const. Der Teil 2. ist schwieriger: man muss zeigen, dass man in irgendwelchen Koordinaten (das sind die sog. Normalkoordinaten) alle von null verschiedenen ersten und zweiten Ableitungen der Metrik aus dem Kr¨ ummungstensor berechnen kann. Somit sind wir gezwungen, die Form (3.86) anzunehmen: die ganze Summe F muss eine invariante Funktion, F0 alleine dagegen braucht es nicht sein. F muss dann aber nur linear von den Variablen gµν,ρσ (x) abh¨angen. Ueber solche invariante Funktionen gibt der folgende Satz Bescheid: Theorem 15 Alle invarianten Funktionen F vom Typ 2., welche linear von gµν,ρσ (x) abh¨angen, haben die Form F = aR + b, wobei a und b zwei Konstanten sind und R der Kr¨ ummungsskalar der Metrik gµν (x) ist. 139
F¨ ur jeden metrischen AZ, das Kr¨ ummungsskalar R ist definiert durch R := g µν Rµν , wobei Rµν der sogenannte Ricci-Tensor ist, ρ Rµν := Rµρν .
Die zwei Konstanten a und b sind also das Einzige, was wir noch frei w¨ahlen k¨onnen. Aus historischen Gr¨ unden wollen wir diese Konstanten durch andere zwei ausdr¨ ucken, G und Λ: Λ 1 , b=− . a=− 16πG 8πG Es wird sich zeigen, dass G mit der Newton-Konstante u ¨bereinstimmt; Λ ist die sogenannte kosmologische Konstante. Um aber diese Behauptung zu beweisen, lassen wir die Konstanten G und Λ vorl¨aufig unbestimmt. Die Wirkung SG f¨ ur die Gravitation muss also die Form haben: Z √ 1 SG = − d4 x −g(R + 2Λ) . (3.87) 16πG
3.6.2
Die Einstein-Gleichungen
Die Feldgleichungen ergeben sich, wenn wir die Metrik gµν (x) in der Wirkung (3.87) variieren. Wir schreiben die Variation in der folgenden Form: Z √ 1 δSG = d4 x −gAµν (x)δgµν (x), (3.88) 16πG
wobei Aµν (x) irgendein Tensorfeld ist. In Anwesenheit von Materie muss man die ganze Wirkung nach gµν (x) variieren und gleich null setzen: δSG + δSM = 0, was zusammen mit den Beziehungen (3.88) und (3.74) liefert: Aµν (x) = 8πGT µν (x).
Das Tensorfeld Aµν (x) m¨ ussen wir direkt berechnen; die Hillsche Formel hilft uns nicht, weil sie nur auf Lagrange-Funktionen mit hochstens ersten Ableitungen der Felder anwendbar ist, unsere enth¨alt aber eben auch die zweiten. Berechnen wir die Variation: Z √ 1 d4 x δ −g(g µν Rµν + 2Λ) = δSG = − 16πG Z √ 1 d4 x −g(R(µν) − 1/2 Rgµν − Λgµν )δg µν − 16πG Z √ 1 − d4 x −gg µν δRµν . (3.89) 16πG 140
Es gilt δg µν = −g µκ g µλ δgκλ . Wenn wir das f¨ ur δg µν (x) einsetzen, erhalten wir Z √ 1 δSG = d4 x −g(R(µν) − 1/2 Rg µν − Λg µν )δgµν 16πG Z √ 1 d4 x −gg µν δRµν , − 16πG
(3.90)
(3.91)
wobei R(µν) den symmetrischen Teil des Ricci-Tensors bezeichnen soll (erst sp¨ater zeigen wir, dass der Ricci-Tensor symmetrisch ist). Die Variation des Ricci-Tensors berechnen wir wie folgt. Wir haben ρ Rµν = Rµρν = ∂ρ Γρµν − ∂ν Γρµρ + Γρκρ Γκµν − Γρκν Γκµρ ,
also, δRµν = ∂ρ δΓρµν − ∂ν δΓρµρ + δΓρκρ Γκµν + Γρκρ δΓκµν − δΓρκν Γκµρ − Γρκν δΓκµρ . Was ist aber δΓρµν ? Das ist die Differenz von zwei verschiedenen Affinzusammenh¨angen Γρµν [gκλ ] und Γρµν [gκλ +δgκλ ] im gleichen Koordinatensystem. Dann transformiert sich aber δΓρµν als ein Tensor vom Typ (1, 2), weil das nichthomogene Glied im Transformationsgesetz von Γρµν (siehe Gleichung (1.9)) unabh¨angig von Γρµν ist und in der Differenz heben sich die zwei entsprechenden Terme gegenseitig auf. Dann macht die kovariante Ableitung von δΓρµν einen Sinn, und wir bemerken, dass δRµν = ∇ρ δΓρµν − ∇ν δΓρµρ . So erhalten wir Z Z √ µν 4 √ d4 x −gg µν (∇ρ δΓρµν − ∇ν δΓρµρ ) d x −gg δRµν = Z √ = d4 x −g[∇ρ (g µν δΓρµν ) − ∇ν (g µν δΓρµρ )] Z √ = d4 x −g∇ρ (g µν δΓρµν − g µρ δΓνµν ). Der Ausdruck in der Klammer, δV ρ = g µν δΓρµν − g µρ δΓνµν , ist ein Vektorfeld. Die Formel (3.47) liefert dann: Z Z √ 4 √ µν d x −gg δRµν = d4 x ∂ρ ( −gδV ρ ), 141
also hat der letzte Term in (3.91), als ein Integral u ¨ber eine totale Divergenz, keinen Einfluss auf die Feldgleichungen. Wir erhalten einfach Aµν = R(µν) − 1/2 Rg µν − Λg µν = Gµν − Λg µν , wobei R(µν) der symmetrische Teil des Ricci-Tensors ist, R(µν) = 1/2 (Rµν + Rνµ ) und Gµν der sogenannte Einstein-Tensor ist, Gµν = R(µν) − 1/2 Rg µν . Resultat: Die Feldgleichungen f¨ ur Gravitation mit Materie lauten: Gµν − Λg µν = 8πG T µν .
(3.92)
Sie heissen Einstein-Gleichungen. Wir m¨ ussen noch zwei ganz allgemeine Bemerkungen u ¨ber diese Gleichungen machen. Dazu brauchen wir aber einige Eigenschaften des Kr¨ ummungstensors. Eigenschaften des Kru ¨mmungstensors Wir brauchen einiges mehr u ummungstensor zu wissen, um die wichtig¨ ber den Kr¨ sten Eigenschaften der Einsten-Gleichungen besprechen zu k¨onnen. Theorem 16 Der Kr¨ ummungstensor resp. der Ricci-Tensor eines metrischen AZ hat die folgenden Symmetrien: Rµνρσ = −Rνµρσ ,
Rµνρσ = Rρσµν ,
Rµν = Rνµ .
(3.93) (3.94)
Beweis Zun¨achst brauchen wir das folgende Lemma Lemma 1 F¨ ur die Kr¨ ummung eines metrischen Affinzusammenhangs gilt: Rµνρσ = 1/2 (∂νρ gµσ + ∂µσ gνρ − ∂νσ gµρ − ∂µρ gνσ ) + ∆Rµνρσ ,
(3.95)
wobei alle Glieder in ∆Rµνρσ quadratisch sind in den ersten Ableitungen der Metrik, ∂ν gµσ , und keine zweiten Ableitungen mehr enthalten. (Beweis: Aufgabe). W¨ahlen wir nun einen beliebigen Punkt p der Raumzeit und ein geod¨atisches Koordinatensystem {xµ } um p. Dann ergibt das Resultat der Aufgabe 142
2 zum Kapitel 2, dass ∂µ gνρ = 0. Somit liefert (3.95) f¨ ur die Komponenten des µ Kr¨ ummungstensors in Bezug auf {x }: Rµνρσ (p) = 1/2 (∂νρ gµσ + ∂µσ gνρ − ∂νσ gµρ − ∂µρ gνσ )|p . Daraus folgen die Gleichungen (3.93) mindestens in p und f¨ ur die Komponenten µ in Bezug auf {x }. Aber p war beliebig, und Symmetrieeigenschaften der Tensoren invariant—wenn sie in einem Koordinatensystem gelten, dann gelten sie in jedem. F¨ ur den Ricci-Tensor haben wir Rµν = g ρσ Rµρνσ .
(3.96)
Wenn wir die zweite Gleichung (3.93) und die Symmetrie der Metrik ben¨ utzen, erhalten wir: g ρσ Rµρνσ = g ρσ Rνσµρ = g σρ Rνσµρ , und das ist nach (3.96) gleich Rνµ , wzzw. Wegen (3.94) k¨onnen wir fortan die runden Klammern bei den Indizes des RicciTensors weglassen. Die weiteren wichtigen Eigenschaften eines nunmehr allgemeines (auch von einem nichtmetrischen AZ) Kr¨ ummungstensors gibt der folgende Satz. Theorem 17 Der Kr¨ ummungstensor erf¨ ullt die Identit¨aten µ µ µ Rνρσ + Rρσν + Rσνρ = 0,
(3.97)
µ µ µ ∇τ Rνρσ + ∇ρ Rνστ + ∇σ Rντ ρ = 0.
(3.98)
Sie heissen die erste und zweite Bianchi-Identit¨at. (3.97) gilt allerdings nur, wenn Γµρσ = Γµσρ .
(3.99)
Beweis W¨ahlen wir wieder einen beliebigen Punkt p und ein geod¨atisches Koordinatensystem {xµ } um p. Dann ist µ Rνρσ (p) = ∂ρ Γµνσ (p) − ∂σ Γµνρ (p).
(Γµνσ (p) ist zwar null, aber nicht die Ableitung ∂τ Γµνσ (p)). Wenn wir diese Beziehung in die linke Seite von (3.97) einsetzen, erhalten wir aus (3.99), dass sie verschwindet. µ Wegen ∇τ = ∂τ in p und der Tatsache dass der Rest in Rνρσ quadratisch in Γ ist, folgt aus der obigen Relation auch µ ∇τ Rνρσ |p = ∂τ ρ Γµνσ (p) − ∂τ σ Γµνρ (p).
Die linke Seite von (3.98) verschwindet dann aufgrund der Symmetrie des Ausdrucks ∂τ ρ Γµνσ (p) in τ und ρ, wzzw. 143
Die eben bewiesenen Symmetrien des Kr¨ ummungstensors und seiner kovarianten Ableitung sind nicht alle unabh¨angig. Z.B. folgt klar die erste Gleichung von (3.93) aus der zweiten Gleichung (3.93) und der uns schon bekannten Antisymmetrie in den zwei letzten Indizes. Man kann auch zeigen, dass die zweite Gleichung (3.93) aus der Antisymmetrie im ersten und zweiten Paar von Indizes zusammen mit der ersten Bianchi-Identit¨at folgt. Aus der zweiten Identit¨at von Bianchi folgt eine wichtige Eigenschaft der EinsteinGleichungen. Gleichung (3.98) in ρ und µ verj¨ ungt ergibt µ ∇τ Rνσ − ∇σ Rντ + ∇µ Rνστ = 0.
(3.100)
Nochmaliges Verj¨ ungen in τ und ν liefert 2∇τ Rστ − ∇σ R = 0.
(3.101)
Diese Gleichung kann aber in der Form geschrieben werden ∇τ (Rστ − 1/2 δστ R) = 0, und das heisst ∇µ Gµν = 0.
(3.102)
Der Einstein-Tensor ist also divergenzfrei, unabh¨angig davon, aus welcher Metrik er gebildet ist—(3.102) ist ja eine Identit¨at. Somit folgt aus den Einstein-Gleichungen (3.92) auch die Divergenzgleichung (3.77) f¨ ur den Energie-Impuls-Tensor T µν , ohne dass die dynamischen Gleichungen f¨ ur die Materie ben¨ utzt werden m¨ ussen. Die Konstanten Λ und G Betrachten wir zun¨achst die kosmologische Konstante Λ. Ihre Interpretation ist die folgende. Wenn wir keine Materie, also reines Vakuum in irgendwelchem Gebiet einer Raumzeit haben, dann ist T µν = 0, und die Einstein-Gleichungen lassen sich schreiben wie folgt: Λ µν µν G = 8πG . g 8πG Man kann dies auffassen als Einstein-Gleichungen mit Λ = 0, aber mit einem Energie-Impuls-Tensor des Vakuums: vac Tµν =
Λ gµν . 8πG
(3.103)
Unter dem Vakuum hat man urspr¨ unglich einfach “Nichts” verstanden, aber heute weiss man aus der Quantenfeldtheorie, dass ein Vakuumzustand etwas wie ein 144
Gleichgewicht der Felder beschreibt, und dass solche Zust¨ande eine Menge Struktur und auch von Null verschiedene Energiedichte aufweisen k¨onnen. F¨ ur die Interpretation spricht auch die hohe Symmetrie des Tensors (3.103): er hat gleiche Komponenten in einem beliebigen orthonormalen Vierbein, ist also lokal invariant in Bezug auf alle Lorentztransformationen. Er definiert also insbesondere keine 4erGeschwindigkeit der Materie und dergleichen. Die Energiedichte des Vakuums kann eine bedeutende Rolle am Anfang und am vac Ende der kosmischen Entwicklung spielen. Am Anfang ist der Wert von Tµν sehr hoch und sein dominierender Einfluss f¨ uhrt zum exponentiellen Aufblasen des Kosmos von einer m¨oglicherweise mikroskopischen Fluktuation bis zu makroskopischen Ausmassen—das ist die sogennannte Inflationstheorie. Das falsche Vakuum aber zerf¨allt sehr bald, und seine Vakuumenergie ist die Quelle der heute beobachteten vac Materie. Am Ende scheint Tµν auch bei einem relativ kleinen Wert von Λ alle Materie im Kosmos wieder zu dominieren. Das ist prinzipial m¨oglich, denn die normale Materie wird durch die kosmologische Ausdehnung stark verd¨ unnt, die Vakuumdichte bleibt aber konstant. In der Tat sind die m¨oglichen Werte von Λ durch die vac durch seine Gravitationswirkung keinen Einfluss Bedingung eingeschr¨ankt, dass Tµν auf die Bewegungen in gen¨ ugend kleinen Systemen hat—zum Beispiel in den sog. ¨ galaktischen Sternkugelhaufen, wo eben keine Anderungen im Vergleich zu NewtonTheorie beobachtet worden sind. Das f¨ uhrt zum Absch¨atzung: |Λ| ≤ 3 × 10−52 m−2 . Das scheint wirklich ein sehr kleiner Wert zu sein, aber die entsprechende Massendichte des Vakuums ρvac := Λc2 /(8πG) hat den Wert: ρvac = 2 × 10−29 g cm−3 . Das ist wieder ein relativ grosser Wert, wenn man bedenkt, dass z.B. die mitlere Massendichte der sichtbaren Materie heute etwa bei 10−31 g cm−3 liegt. Die Messungen der letzten Jahre zeigen nun, dass ρvac schon ein paar Milliarden Jahre die gesamte mitlere Massendichte dominieren musste, und der dazu notwendige Wert von Λ konnte ermittelt werden. Λ ist also von Null verschieden. F¨ ur die Konstante G bleibt dann keine andere Interpretation als die NewtonKonstante: Die Newton-Konstante ist n¨amlich die einzige Naturkonstante, welche im Gravitationsgesetz vorkommt, wo sie die Materiedichte auf eine analoge Weise multipliziert, wie in den Einstein-Gleichungen. Um zu beweisen, dass G mit der Newton-Konstante u ¨ bereinstimmt, wollen wir zeigen, wie sich die Newton-Theorie als N¨aherung aus der Einstein-Theorie herleiten l¨asst, und dass G dabei die Rolle der Gravitation-Konstante u ¨ bernimmt. Wir wollen dazu voraussetzen: 145
1. Λ = 0. 2. Die Gravitationsfelder sind schwach und statisch. Das bedeutet: es gibt Koordinaten, so dass gkl ≈ −δkl , (3.104) und g00 = e2Φ ≈ 1 + 2Φ,
(3.105)
wobei Φ(x) die Rolle des Newton-Potentials hat (siehe Gleichung (2.42)). 3. Die Materie ist nichtrelativistisch und nimmt die Form der idealen Fl¨ ussigkeit an. F¨ ur nichtrelativistische ideale Fl¨ ussigkeit gilt p ρ. (Der Druck hat die gleiche Dimension wie die Energiedichte. In gew¨ohnlichen Einheiten m¨ ussen wir also die Massendichte ρ mit c2 multiplizieren, um eine Gr¨ossen zu erhalten, welche die gleiche Dimension wie der Druck hat.) Bemerke, dass dies nur f¨ ur die nichtrelativistische Materie gilt; z.B. die Hohlraumstrahlung erf¨ ullt p = 31 ρ. Die Koordinaten k¨onnen so gew¨ahlt werden, dass das assoziierte Vierbein in der leitenden Ordnung mit dem Ruhesystem der Materie u ¨bereinstimmt, d.h. T00 ≈ ρ,
Tk0 = 0,
Tkl ≈ pδkl .
(3.106)
Unter diesen Voraussetzungen ergibt sich aus den Einstein-Gleichungen, dass G00 von Gr¨ossenordnung Gρ ist, w¨ahrend Gkl ≈ Gp (alle Komponenten), also vernachl¨assigbar gegen G00 ist. Wir haben aber Rρσ = Gρσ − 1/2 Gµµ gρσ . Daraus folgt mit (3.104) X 1 R00 ≈ G00 − 1/2 (G00 − Gkk ) ≈ G00 . (3.107) 2 k Wir berechnen R00 . Dabei beachten wir (3.105): Die Metrik ist zwar von Gr¨ossenordnung 1, aber nicht konstant sind lediglich Beitr¨age kleinerer Ordnung. Die Ableitungen der Metrik sind also klein, und die Produkte der Ableitungen noch kleiner. Die Formel (3.95) f¨ uhrt uns also zur Beziehung Rµν ≈ 1/2 g ρσ (∂νρ gµσ + ∂µσ gνρ − ∂µν gρσ − ∂ρσ gµν ). Somit ergibt sich R00 ≈ 1/2 g ρσ (∂0ρ g0σ + ∂0σ g0ρ − ∂00 gρσ − ∂ρσ g00 ) X ≈ 1/2 ∂kk g00 ≈ ∆Φ, k
146
weil alle Zeitableitungen verschwinden (statische Situation). Die Gleichung G00 = 8πGρ f¨ uhrt also nach Einsetzen von (3.107) zu ∆Φ ≈ 4πGρ, und das stimmt mit der Poisson-Gleichung nur dann u ¨ berein, wenn G die NewtonKonstante ist. F¨ ur die restlichen Komponenten der Einstein-Gleichungen sind beide Seiten in dieser N¨aherung vernachl¨assigbar. Somit ergibt sich nur eine PoissonGleichung aus den zehn Einstein-Gleichungen.
3.6.3
Allgemeine Kovarianz der Einstein-Gleichungen
Die Form der Einstein-Gleichungen k¨onnen wir symbolisch so darstellen: g ·· ∂·· g·· + g ··g ·· ∂· g·· ∂· g·· − Λg·· = 8πGT·· ; es gibt drei Sorten von Termen auf der linken Seite, und alle haben feste Zahlen wie 1/2, -1, Λ, usw. als Koeffiziente. Das heisst, wenn man die Darstellungsfunktionen gµν (x) der Metrik in Bezug auf irgendwelche Koordinaten xµ kennt, kann man die linke Seite daraus bilden. Zwei Tatsachen sind bemerkenswert: 1. Die Gleichungen werden auf immer gleiche Weise gebildet, unabh¨angig davon, welche Koordinaten xµ gew¨aht sind. 2. Die linken Seiten, welche mit den Koordinaten x0µ gebildet sind (es gibt 10 unabh¨angige Ausdr¨ ucke), gleichen bestimmten linearen Kombinationen derjenigen, welche mit xµ gebildet sind (in der Tat, es ist eine Tensortransformation!). Eben diese Eigenschaft heisst allgemeine Kovarianz. Die allgemeine Kovarianz der Feldgleichungen hat eine unerwartete Konsequenz, welche Einstein sehr beunruhigte. So sehr, dass er relativ lange Zeit vermutete, dass die Feldgleichungen f¨ ur die Metrik nicht allgemein Kovariant sein d¨ urfen! Das wollen wir jetzt verstehen, aber dazu brauchen wir etwas mehr Mathematik. Im Abschnitt 2.6.2 haben wir schon den begriff des Diffeos eingef¨ uhrt und auch die Wirkung ϕ∗ des Diffeos ϕ auf Tensorfelder erkl¨art. Das m¨ ussen wir etwas ausf¨ uhren. Es sei M eine n-Mannigfaltigkeit. Betrachten wir die Diffeos, welche M auf M abbilden, ϕ : M 7→ M ; sie haben die ganze Mannigfaltigkeit als Definitionsbereich, sind auf, und sind dann auch invertierbar. Man kann also zwei solche, ϕ1 und ϕ2 , zusammensetzen, ϕ := ϕ2 ◦ ϕ1 , 147
und die zusammengesetzte Abbildung ist wieder ein Diffeo. Die Menge aller dieser Diffeos bildet eine Gruppe mit der Zusammensetzung als Multiplikation. Denn die Zusammensetzung der Abbildungen is immer associativ, die identische Abbildung id ist ein Diffeo, und die Inverse, ϕ−1 , zu ϕ hat die Eigenschaft, dass ϕ−1 ◦ ϕ = id. Man bezeichnet diese Gruppe mit DiffM . DiffM ist eine grosse Gruppe. Ihre Dimension ist unendlich. Wir erw¨ahnen ohne Beweis zwei interessante Eigenschaften, welche diese M¨achtigkeit belegen. Es seien (p1 , · · · , pm ) und (q1 , · · · , qm ) zwei m-Zahlen von Punkten auf M . Gibt es dann ϕ ∈ DiffM , so dass ϕ(pi ) = qi ∀i = 1, · · · , m? Die Antwort ist: f¨ ur beinahe alle m-Zahlen ja. Insbesondere also wird ein Punkt von DiffM durch die ganze Mannigfaltigkeit getrieben. Die zweite Eigenschaft ist diese. Es sei U ⊂ M eine beliebige Umgebung in M (ein “Loch”). Es gibt dann ϕ ∈ DiffM , so dass ϕ|M \U = id, und ϕ|U 6= id. Es ist dann klar, dass ϕ(U ) = U . Wenn es n¨amlich einen Punkt p ∈ U g¨abe, so dass ϕ(p) 6∈ U , dann muss ϕ−1 am ϕ(p) nichttrivial sein, aber es muss auch trivial (id) sein wegen der Definition von ϕ, und das ist ein Widerspruch. Kommen wir jetzt zur¨ uck zu den Einstein-Gleichungen. Wir wollen das Folgende zeigen. Theorem 18 Es sei gµν (x) eine L¨osung der Gleichungen zur Quelle Tµν (x) auf einer Mannigfaltigkeit M und ϕ ∈ DiffM ein beliebiges Diffeo. Dann ist (ϕ∗ g)µν (x) auch eine L¨osung, n¨amlich zur Quelle (ϕ∗ T )µν (x). Der Beweis basiert auf der allgemeinen Kovarianz. Es folgt daraus, dass (ϕ∗ g) und (ϕ∗ T ) die Gleichungen l¨osen, wenn sie sie in einem geschickt gew¨ahten Koordinatensystem l¨osen. Wir wissen, dass die Darstellungsfunktionen g und T in, sagen wir, Koordinaten xµ die Gleichungen um einen Punkt p erf¨ ullen. Das geschickt gew¨ahte µ System ist aber das ϕ-Bild von x um Punkt ϕ(p): in diesem haben die Darstellungsfunktionen (ϕ∗ g)µν (x) und (ϕ∗ T )µν (x) exakt die gleiche Form, wie g und T in Bezug auf xµ und m¨ ussen deshalb Gleichungen der gleichen Form erf¨ ullen. Wir haben so eigentlich bewiesen, dass DiffM eine Symmetriegruppe der EinsteinGleichungen ist, in dem Sinn, dass (ϕ∗ g) immer eine L¨osung, wenn g eine ist. Man kriegt so ein Rezept, aus einer bekannten L¨osung eine relativ grosse Menge neuer L¨osungen zu konstruieren. In der Tat, (ϕ∗ g) ist ein anderes Tensorfeld auf M als g, wenn ϕ keine Isometrie von g ist, und das ist nur selten der Fall. 148
Aber jetzt ergibt sich eine unangenehme Konsequenz: die Einstein-Gleichungen scheinen dann zu viele L¨osungen zu haben. Betrachten wir das folgende Beispiel. Es sei eine rotationssymmetrische Anrodnung mit einer zentralen Quelle von Masse µ und Radius R und die entsprechende Raumzeit sei asymptotisch flach. Wenn wir diese Situation in der Newton-Theorie h¨atten, dann ergibt sich f¨ ur diese Quelle und diese Randbedingungen nur eine einzige L¨osung der Poisson-Gleichung, was auch aus physikalischen Gr¨ unden einleuchtend scheint. Betrachten wir aber die gleiche Situation in der ART, und setzen wir voraus, dass gµν (x) auf M eine der Situation entsprechende L¨osung der Einstein-Gleichungen ist. Nehmen wir jetzt eine kleine Umgebung U ⊂ M ausserhalb der Quelle. Dann gibt es ¨ ϕ ∈ DiffM , dass keine Anderungen der Quelle und des asymptotischen Feldes macht, aber g in U nichttrivial ¨andert! Es scheint also, dass die Einstein-Gleichungen zu einer physikalisch eindeutigen Situation viele verschiedene L¨osungen zulassen. Das ist, in groben Z¨ ugen, das ber¨ uhmte Einsteinsche Lochargument. Der einzige Ausweg aus dieser Schwierigkeit besteht darin, anzunehmen, dass keine zwei Metriken g und ϕ∗ g f¨ ur beliebiges ϕ ∈ DiffM sich durch irgendwelche messbare Eigenschaften unterscheiden. Das heisst: DiffM ist eine Eichgruppe der ART. Das ist zun¨achst schwierig zu glauben. Denn die zwei Felder, g und ϕ∗ g, sind verschieden auf M . Es gibt also mindestens einen Punkt p ∈ M , wo g(p) 6= (ϕ∗ g)(p). Da die Metrik messbar ist scheint die obige Voraussetzung widerlegt. Wenn man sich unsere Beschreibung der Messungen der metrischen Komponenten im Abschnitt 2.4 anschaut, findet man aber, dass dazu eine materielle Familie der Beobachter n¨otig war. Insbesondere waren die Punkte der Mannigfaltigkeit M durch diese Beobachter identifiziert. Wenn man nun ein Diffeo ϕ ∈ DiffM anwendet, so soll man nicht nur die Metrik zu ϕ∗ g ¨andern, aber auch die Beobachter damit verschieben. Dann wird die ganze Messung u ¨ berall die gleichen Komponenten der Metrik ergeben, n¨amlich die der ϕ∗ g in Bezug auf das ϕ-Bild der Beobachter. Das f¨ uhrt zum folgenden Postulat: Postulat 3.2 Die nackten Mannigfaltigkeitspunkte von M sind durch keine physikalische Messungen und Beobachtungen identifizierbar und unterscheidbar. Um einen physikalischen Punkt anzugebem, muss man gen¨ ugende Anzahl Eigenschaften irgendwelcher Felder (einschliesslich der Geometrie einer Metrik) in disem Punkt beschreiben. Solche physikalischen Punkte stimmen nicht u ¨berein mit den nackten Punkten von M , denn die nackten Punkte werden von DiffM beweft, die physikalischen aber nicht. 149
3.7
Aufgaben
1. Seien Vµ (x) und Wµν (x) kovariante Tensorfelder, wobei Wµν (x) = −Wνµ (x) f¨ ur alle µ, ν, x. Beweise, dass die folgenden Gleichungen, welche in jedem Koordinatensystem gelten, wieder kovariante Tensorfelder definieren und dass diese Tensorfelder in allen Indizes antisymmetrisch sind: Tµν := ∂µ Vν − ∂ν Vµ ,
Uµνρ := ∂µ Wνρ + ∂ν Wρµ + ∂ρ Wµν . 2. Seien {xµ } Koordinaten, gµν (x) Komponenten der Metrik in Bezug auf {xµ }, g(x) := det(gµν (x)) und d4 x das 4er-Volumenelement. Zeige, dass dann der √ Ausdruck −g d4 x eine Invariante ist. 3. Beweise, dass √ √ d −g = −(1/2) −g gµν dg µν √ = (1/2) −g g µν dgµν . (Hinweis: benutze die bekannten Subdeterminantenformel f¨ ur Ableitung einer Determinante nach ihrem Element und f¨ ur inverse Matrix.) 4. Finde das Abh¨angigkeitsgebiet der Menge S in der Minkowskischen Raumzeit M f¨ ur die folgenden F¨alle (a) S ist die Zukunftsh¨alfte des Lichtkegels vom Ursprung; (b) S ist die lichtartige Hyperebene t − x = 0. 5. Beweise: die Hyperebene t = 0 in der Minkowskischen Raumzeit ist eine Cauchy-Hyperfl¨ache. Hinweis: IS-Koordinaten jeder kausalen Kurve erf¨ ullen ein System von Ungleichungen, weil die Kurve innerhalb des Lichtkegels jedes ihrer Punkte liegt. Benutze diese Ungleichungen um zu zeigen, dass jede kausale Kurve, l¨angs deren die Koordinate t beschr¨ankt ist, einen Limespunkt (d.h. Endpunkt) hat. Benutze diesen Endpunkt, um die Kurve zu verl¨angern. 6. Seien zwei Raumzeiten gegeben mit der Metrik auf derselben Mannigfaltigkeit M: ds21 = gµν dxµ dxν , und ds22 = Ω2 (x) gµν dxµ dxν , wobei Ω(x0 , x1 , x2 , x3 ) eine nirgends verschwindende Funktion auf M (der sogenannte Konformfaktor) und {xµ } ein Koordinatensystem auf M ist. 150
Zeige: jede Kurve auf M hat in beiden Metriken die gleiche Signatur (d.h., bleibt zeit- licht- oder raumartig). Was folgt daraus f¨ ur die Abh¨angigkeitsgebiete, Cauchy-Hyperfl¨achen und globale Hyperbolizit¨at der beiden Raumzeiten? 7. Studiere die zweidimensionale Raumzeit mit dem Linienelement ds2 = R2 cosh2 (x) dt2 − R2 dx2 , wobei −∞ < t < ∞ and −∞ < x < ∞. Diese Raumzeit heisst (zweidimensionale) Anti-de-Sitter-Raumzeit. Beweise, das die Anti-de-Sitter-Raumzeit nicht global hyperbolisch ist. Benutze die Resultate der Aufgabe 6 und den Konformfaktor Ω = 1/(R coshx). 8. Benutze die Variationsformel, um die Variationen der Wirkung Z 1 d4 x F αβ Fαβ S=− 16π f¨ ur das Maxwell-Feld Aµ (x) in der Minkowskischen Raumzeit in Bezug auf infinitesimale Poincar´e-Transformationen zu berechnen, wenn die Feldgleichungen ∂L d ∂L − ρ ∂Aµ dx ∂Aµ,ρ erf¨ ullt sind. Hinweis: zeige zun¨achst, dass ∂(F αβ Fαβ ) = 4F µν . ∂(∂µ Aν ) 9. F¨ ur jedes gegebene Koordinatensystem {xµ } um einen Punkt r ∈ M , definiere die Basis {eα } wie folgt: eα ist der Tangentvektor der Kurve xµ = xµ (r) + δαµ λ,
α = 1, . . . , n
im Punkt r. {eα } heisst die mit {xµ } assozierte Basis. (a) Bestimme die Komponenten der Vektoren eα in Bezug auf {xµ }. (b) Wie transformieren sich assozierte Basen, wenn man Koordinaten wechselt? (c) Welche Beziehung verbindet die Komponenten eines Vektors in Bezug auf {eα } mit denjenigen in Bezug auf {xµ }, wenn {eα } assoziert mit {xµ } ist? 10. Definiere die Kobasis {eα } assoziert mit {xµ } als die duale Kobasis zu {eα }, wobei {eα } wieder die Basis ist, welche mit {xµ } assoziert ist. 151
(a) Bilde die analogen Fragen zu Aufgabe 9 f¨ ur die assozierten Kobasen und antworte sie. (b) Finde Funktionen, deren Gradienten mit den Elementen der mit {xµ } assozierten Kobasis {eα } u ¨bereinstimmen. 11. Sei Γ ein beliebiger Zusammenhang um Punkt r ∈ M . Sei {xµ } ein Koordinatensystem um r, und sei {eα } das mit {xµ } assozierte Basenfeld um r. Zeige, dass die Komponenten des Zusammenhangss Γ in Bezug auf {eα } mit denjenigen in Bezug auf {xµ } u ¨ bereinstimmen. 12. Berechne die Transformation der kovarianten Ableitung, wenn das erste Basenfeld mit den Koordinaten {xµ }, das zweite Basenfenfeld mit den Koordinaten {x0µ } assoziert ist, und zugleich die Koordinaten entsprechend transformiert werden. (F¨ uhre die Transformation in zwei Schritten aus.) 13. Beweise die folgenden drei Formeln: (a) ∇λ ∇κ ϕ(x) = ∇κ ∇λ ϕ(x) f¨ ur alle Skalarfelder ϕ(x).
µ (b) ∇λ ∇κ V µ (x) − ∇κ ∇λ V µ (x) = Rνλκ (x) V ν (x) f¨ ur alle Vektorfelder V µ (x).
Benutze dabei die Gleichungen:
∇λ V µ = ∂λ V µ + Γµρλ V ρ ,
µ Rνλκ = ∂λ Γµνκ − ∂κ Γµνλ + Γµλρ Γρνκ − Γµκρ Γρνλ .
ν Uν f¨ ur alle Kovektorfelder Uµ (x), (c) ∇λ ∇κ Uµ (x) − ∇κ ∇λ Uµ (x) = −Rµλκ und zwar direkt aus den beiden vorherigen Resultaten.
14. Beweise die Formel Γµνµ = ∂ν log
p |g|.
15. Sei ξ µ (x) ein Killing-Vektorfeld. Beweise, dass dann ∇µ ξν + ∇ν ξµ = 0, wobei ξµ = gµν ξ ν (und der AZ ist metrisch). 16. Finde den Energie-Impuls-Tensor f¨ ur das Klein-Gordon-Skalarfeld ϕ(t, x) mit der Wirkung Z √ Sϕ = κ d4 x −g(g µν ∂µ ϕ∂ν ϕ − m2 ϕ2 ). Welches Vorzeichen muss das Koeffizient κ haben, damit die Energiedichte nicht negativ ist? 152
17. Sei ξ µ (x) ein Killing-Vektorfeld. Beweise, dass die Divergenzfreiheit von T µν dann impliziert: ∇µ (T µν ξν ) = 0. 18. Sei uµ (x) ein Vektorfeld mit konstanter Norm: gµν uµ uν = const f¨ ur alle x. Beweise, dass dann uρ ∇ρ uµ senkrecht auf uµ steht. 19. Sei u(x) eine Funktion mit lichtartigem Gradienten: g µν ∂µ u∂ν u = 0, wobei uµ = g µν ∂ν u. Beweise nun, dass uρ ∇ρ uµ = 0, also sind die Integralkurven von uµ lichtartige Autoparallelen. 20. Beweise, dass 1 µν g (∇ρ δgνσ + ∇σ δgνρ − ∇ν δgρσ ), 2 = ∇ρ δΓµνσ − ∇σ δΓµνρ .
δ{µρσ } =
µ δRνρσ
Benutze dabei die Gleichung δg µν = −g µκ g νλ δgκλ (zeigen!) und die Tatsache, dass die Variation mit der Ableitung kommutiert. 21. Beweise, dass f¨ ur die Kr¨ ummung des metrischen Zusammenhanges gilt: 1 Rµνρσ = (∂ν ∂ρ gµσ + ∂µ ∂σ gνρ − ∂µ ∂ρ gνσ − ∂ν ∂σ gµρ ) + ∆Rµνρσ , 2 wobei alle Glieder in ∆Rµνρσ quadratisch sind in den ersten Ableitungen der Metrik, ∂ρ gµν , und keine zweiten Ableitungen mehr enthalten. 22. Beweise: die drei Beziehungen Rµνρσ = −Rνµρσ ,
Rµνρσ = −Rµνσρ ,
Rµνρσ + Rµρσν + Rµσνρ = 0,
(3.108) (3.109) (3.110)
implizieren die Symmetrie Rµνρσ = Rρσµν . 23. Finde die Anzahl unabh¨angiger Komponenten von Rµνρσ in n-dimensionaler Mannigfaltigkeit unter der Voraussetzung, dass alle unabh¨angigen Symmetrien durch die Gleichungen (3.108), (3.109) und (3.110) beschrieben werden. Hinweis: u ¨berlege, wieviel unabh¨angige Komponenten ein total antisymmetrischer Tensor eines beliebigen Typs in einer n-dimensionaler Mf. hat.
153
Teil II Kosmologie, Gravitationskollaps und schwarze L¨ ocher
154
Kapitel 4 Kosmologische Modelle In diesem Kapitel wollen wir das Problem studieren, welche L¨osungen der EinsteinGleichungen das Weltall beschreiben k¨onnen, das wir um uns beobachten. Wir wollen dabei die Details der Raumzeitgeometrie wie das Gravitationsfeld der einzelnen Galaxien, Sternen und Planeten als kleine St¨orungen u ¨ber einer glatten mittleren Raumzeit betrachten. Ueber diese grobe Geometrie machen wir Hypothesen, welche heute vern¨ unftig erscheinen. Wir werden sehen, dass die Konsequenzen dieser Hypothesen erstaunlich gut mit vielen Beobachtungen u ¨ bereinstimmen. Moderne Kosmologie ist ein Gebiet, wo die ganze Physik Anwendung findet, und das unser ganzes Weltbild beeinflusst. In diesem Abschnitt wollen wir einige allgemein-relativistische Aspekte der Kosmologie besprechen, n¨amlich die groben Z¨ uge der Dymamik der Materie unter dem Einfluss der Gravitation, sowie die Geometrie der entsprechenden Raumzeiten—der sog. kosmologischen Modelle. Die thermische Geschichte des Weltalls, die Baryonensynthese, sowie die Entstehung der Elemente oder der Galaxien werden nicht behandelt.
4.1 4.1.1
Homogene isotrope 3-R¨ aume Kosmologisches Prinzip
Die Starthypothese der Kosmologie: vom mathematischen Standpunkt aus sind die kosmologischen Modelle diejenigen L¨osungen der Einstein-Gleichungen, welche die gr¨osste (oder n¨achstgr¨osste) m¨ogliche Symmetrie aufweisen. Diese Voraussetzung der Symmetrie entspricht unserem ¨asthetischen Gef¨ uhl—die Welt als ganzes sollte symmetrisch sein, und alle Strukturen, die diese Symmetrie st¨oren, sollten relativ klein sein. Es gibt aber auch eine Beobachtung, die diese Annahme stark unterst¨ utzt: n¨amlich die Isotropie der sog. kosmischen Hintergrundstrahlung (cosmic microwave background, CMB). 155
Die kosmische Hintergrundstrahlung ist in 1964 von Penzias und Wilson entdeckt worden. Die Forscher haben einen Radioempf¨anger f¨ ur die Wellenl¨ange λ = 7.25 cm mit einem sehr niedrigen Rauschpegel konstruiert. Sie haben aber immer ein Rauschen vernommen, das ungef¨ahr der Temperatur T = 2.5 − 4.50 K entsprach. Die Entdeckung ist mit einem Nobelpreis geehrt worden. Seitdem ist diese thermische Strahlung an allen Wellenl¨angen und in allen Richtungen ausgemessen. Man findet das Spektrum einer weitgehend perfekten Schwarzk¨orperstrahlung der Temperatur 2.70 K, weitgehend Isotropie und keine Polarisierung. Man interpretiert die Strahlung als ein Relikt aus fr¨ uhen Zeiten des Weltalls, wo grosse Dichten und Temperaturen herrschten und die Strahlung im thermischen Gleichgewicht mit der Materie war und dominierte (“thermische Geschichte des Weltalls”, siehe z.B. [7]). Setzt man voraus, dass wir uns in keinem ausgezeichneten Punkt oder Zentrum des Weltalls befinden, dann muss diese Strahlung auch sonst u ¨berall im All isotrop erscheinen, und das ist nur m¨oglich, wenn die r¨aumliche Geometrie des Weltalls, u ¨ber grosse Distanzen gemittelt, selber homogen und isotrop ist. Das ist das sogenannte Kosmologische Prinzip. Wir wollen Beispiele solcher 3-R¨aume untersuchen.
4.1.2
Der Euklidische Raum
Das einfachste Beispiel ist E3 , d.h. die Mannigfaltigkeit R3 mit der Metrik d3 s2 = (dx1 )2 + (dx2 )2 + (dx3 )2 in den kanonischen Koordinaten x1 , x2 , x3 , und d3 s2 = dρ2 + ρ2 dϑ2 + ρ2 sin2 ϑdϕ2
(4.1)
in den Polarkoordinaten. Je zwei Punkte p und q von E3 definieren eine Verschiebung, φ : E3 7→ E3 , welche p in q schickt, φ(p) = q, und welche die Metrik unver¨andert l¨asst. Das ist der mathematische Ausdruck daf¨ ur, dass jeder Punkt jedem anderen gleichwertig ist, also der Ausdruck f¨ ur die sog. Homogenit¨at des Raumes. Aehnlich k¨onnen wir in jedem Punkt p zwei beliebige Richtungen durch zwei Einheitsvektoren uk und v k repr¨asentieren, und eine Drehung φ : E3 7→ E3 finden, welche p stehen l¨asst, φ(p) = p, aber uk in v k transformiert, φ(uk ) = v k . Die Metrik bleibt bei einer Drehung unver¨andert. Diese Eigenschaft heisst Isotropie des Raumes im Punkt p. Wenn der Raum in allen Punkten isotrop ist, nennen wir ihn einfach isotrop. Wir bemerken, dass die Isometriegruppe E3 von E3 6-dimensional ist: sie wird durch drei voneinander unabh¨angige infinitesimale Verschiebungen und drei voneinander unabh¨angige infinitesimale Drehungen generiert. 156
4.1.3
Die Kugeloberfl¨ ache S 3
Ein anderer 3-Raum mit so viel Symmetrie ist die 3-dimensionale Kugeloberfl¨ache S 3 . Viele Eigenschaften von S 3 sehen wir unmittelbar, wenn wir S 3 als eine Teilmannigfaltigkeit von E4 betrachten. Das ist allerdings nur eine Methode—alle Eigenschaften, die f¨ ur uns interessant sind, w¨ urden sich auch direkt aus der Metrik 4 3 von S ergeben. Betrachten wir also E mit den kartesischen Koordinaten {X µ } und der Metrik X dS 2 = (dX µ )2 . (4.2) µ
S 3 selber besteht aus Punkten, deren Koordinaten die folgende Gleichung erf¨ ullen X (X µ )2 = a2 , (4.3) µ
wobei a > 0 den Radius der Sph¨are bedeutet. Die so konstruierte S 3 ist invariant in Bezug auf alle Drehungen um den Ursprung in E4 . Das ist die Gruppe SO(4), welche von 6 unabh¨angigen infinitesimalen Drehungen generiert ist (in E4 gibt es 6 verschiedene Paare von Koordinatenachsen). Wir brauchen noch die Metrik auf S 3 in irgendwelchen Koordinaten. Die folgenden Koordinaten bieten sich an (Bild 4.1): definieren wir r(p) als den durch a dividierten Abstand des Punktes p von der X 4 -Achse. Alle Punkte mit gleichem Abstand ar von der X 4 -Achse liegen auf einer 2-Sph¨are, welche in die Hyperfl¨ache X 4 = 0 projiziert werden kann. Auf dieser Projektion w¨ahlen wir die u ¨blichen Kugelkoordinaten ϑ und ϕ. Dann h¨angen die µ Koordinaten X und r, ϑ und ϕ auf der S 3 wie folgt zusammen: √ X 4 = ±a 1 − r 2 , X k = arnk , (4.4) wobei n1 := sin ϑ cos ϕ,
n2 := sin ϑ sin ϕ,
n3 := cos ϑ.
(4.5)
Manche Berechnungen k¨onnen sehr vereinfacht werden, wenn man von einigen Eigenschaften der drei Funktionen nk (ϑ, ϕ) Gebrauch macht (Aufgabe). Wenn r die Werte aus dem Intervall [0, 1] durchl¨auft und ϑ und ϕ die u ¨blichen Intervalle, dann erhalten wir die obere (untere) Hemisph¨are f¨ ur das obere (untere) Vorzeichen. Selbstverst¨andµ lich erf¨ ullen die Koordinaten X , welche durch die obigen Einbettungsbeziehungen gegeben sind, die Gleichung (4.3) f¨ ur jeden Wert von r, ϑ und ϕ. Die Metrik der Sph¨are in Bezug auf diese Koordinaten erhalten wir, indem wir die Differentiale von X µ durch die von r, ϑ, und ϕ ausdr¨ ucken und in die Gleichung (4.2) einsetzen. Das Resultat lautet dr 2 2 2 2 2 2 2 d3 s = a + r (dϑ + sin ϑ dϕ ) . (4.6) 1 − r2 157
4.1.4
Die Pseudokugel P 3
Das n¨achste Beispiel ist der 3-Raum P 3 , der gelegentlich Pseudosph¨are, hyperbolische Ebene oder Lobachewski-Raum genannt wird. Wieder ben¨ utzen wir die Methode der Einbettung. Betrachten wir die Minkowski- Raumzeit mit einem IS {xµ } und der Metrik ds2 = (dx0 )2 − (dx1 )2 − (dx2 )2 − (dx3 )2 . P 3 ist definiert durch die Gleichung
(x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 = a2
(4.7)
und x0 > 0. Da der Minkowski-Anstand vom Ursprung in Bezug auf alle Lorentztransformationen invariant ist, ist auch diese Hyperfl¨ache invariant, und ihre Isometriegruppe ist die Lorentzgruppe SO(1, 3). Diese ist 6-dimensional, von drei infinitesimalen Boosts und drei infinitesimalen Drehungen generiert. Die Koordinaten k¨onnen auf P 3 auf analoge Weise eingef¨ uhrt werden wie auf der Sph¨are (Bild 4.2). Wie bezeichnen durch ar den Minkowski-Abstand von der x0 -Achse und durch ϑ und ϕ die Kugelkoordinaten auf der 2-Kugeloberfl¨ache in x0 = 0. Dann lauten die Einbettungsbeziehungen xk = arnk , √ x0 = a 1 + r 2 . Die Gleichung (4.7) ist durch diese Beziehungen identisch erf¨ ullt. Alle Punkte der Pseudosph¨are ergeben sich, wenn r ∈ [0, ∞]. F¨ ur die Metrik erhalten wir dr 2 2 2 2 2 2 2 d3 s = a + r (dϑ + sin ϑ dϕ ) . (4.8) 1 + r2
Alle drei Metriken (4.1), (4.6) und (4.8) lassen sich als eine Formel schreiben: dr 2 2 2 2 2 2 2 d3 s = a + r (dϑ + sin ϑ dϕ ) . (4.9) 1 − kr 2
wobei k = 1 ergibt (4.6), k = −1 (4.8), und k = 0 (4.1) mit ρ = ar,
(4.10)
und a ist in diesem Fall eine beliebige, irrelevante Konstante. Die Transformation der Koordinaten (4.10) ¨andert die Geometrie nicht, sondern nur die Form der Metrik. Wir werden noch den Kr¨ ummungstensor dieser R¨aume brauchen. Eine l¨angere aber direkte Berechnung (Aufgabe) ergibt: Rklmn = ka2 (˜ gkm g˜ln − g˜kng˜lm ),
(4.11)
wobei g˜km die Metrik in der eckigen Klammer von (4.9) ist. Man kann zeigen, dass die drei angef¨ uhrten Beispiele lokal die einzigen homogenen und isotropen 3-R¨aume mit positiv definiter Metrik sind. Die Mathematik dazu heisst “Theorie der R¨aume konstanter Kr¨ ummung”. 158
4.2 4.2.1
Robertson-Walker-Raumzeiten Metrik
Im vorhergehenden Abschnitt haben wir die Geometrie der 3-R¨aume studiert. Als n¨achstes wollen wir Raumzeiten konstruieren, welche raumartige Hyperfl¨achen besitzen, deren Geometrie durch die Formel (4.9) gegeben ist. Die einfachste M¨oglichkeit ist die folgende: dr 2 2 2 2 2 2 2 2 ds = dt − a (t) + r (dϑ + sin ϑ dϕ ) . (4.12) 1 − kr 2 Raumzeiten mit der Metrik (4.12) heissen Robertson-Walker-Raumzeiten. (4.12) stellt eigentlich eine ganze Familie von Raumzeiten dar. Erstens ist hier die uns schon bekannte M¨oglichkeit, f¨ ur k die drei Werte zu w¨ahlen; k = 1 heisst dann geschlossenes Modell, k = 0 r¨aumlich flaches, und k = −1 hyperbolisches; k ≤ 0 sind die offenen Modelle. Neu kommt die Funktion a(t) dazu. Sie kann beliebig sein, wir haben also eine grosse Familie. a(t) heisst der Skalenfaktor. Bei k 6= 0 beschreibt die Funktion a(t), wie sich der “Radius” der Welt mit der Zeit ¨andert. Bei k = 0 sind nur die relativen Werte von a messbar (wir sehen sp¨ater, wie). In jedem Fall kann der Raum expandieren und schrumpfen. Wie er das genau tut, das ergibt sich erst aus den dynamischen Gleichungen (Einstein-Gleichungen). Die Metrik (4.12) hat die folgende Eigenschaft. Wenn ξ¯k (r, ϑ, ϕ) ein KillingVektorfeld der Metrik (4.9) ist, und wir definieren ξ 0 (t, r, ϑ, ϕ) = 0,
ξ k (t, r, ϑ, ϕ) = ξ¯k (r, ϑ, ϕ),
dann ist ξ µ (t, r, ϑ, ϕ) ein Killing-Vektorfeld von (4.12). (Zeige das als Uebung!). Die Robertson-Walker-Raumzeiten haben also mindestens soviel Symmetrie wie unsere 3-R¨aume. Man kann wiederum zeigen, dass die so charakterisierten Raumzeiten bereits alle mit (4.12) erfasst werden. Die Metrik (4.12) kann aber eine gr¨ossere Symmetrie haben. Ein Beispiel ist die Minkowskische Raumzeit, welche wir aus (4.12) erhalten, wenn wir k = 0 und a = konst setzen. Eine Bemerkung bez¨ uglich der Dimensionen: in der Kosmologie geben wir t und a die Dimension der L¨ange (c = 1!), dagegen bleiben r, ϑ und ϕ dimensionsfrei. Das entspricht der Dimension L¨ange2 f¨ ur die Metrik und dimensionsfreien Koordinaten.
4.2.2
Bevorzugtes Bezugsystem
F¨ ur allgemeine Funktionen a(t) stimmt die Isometriegruppe der Raumzeit (4.12) mit derjenigen der 3-R¨aume t = konst u ¨berein. Sie ist also kleiner als die Symmetriegruppe von Minkowski-Raumzeit. Das kann man auch so formulieren. F¨ ur jeden 159
festen Punkt p der Raumzeit gilt: Die Bildpunkte von p unter s¨amtlichen Transformationen der Isometriegruppe von (4.12) ergeben gerade die Hyperfl¨ache t = konst, welche p enth¨alt. Diese Hyperfl¨achen sind also die Orbits der Isometriegruppe, und somit eindeutig (und geometrisch) bestimmt. In Minkowski-Raumzeit haben die x0 = const Hyperfl¨achen auch eine sechsdimensional Symmetriegruppe, aber die Familie x0 = ist nicht eindeutig bestimmt: ein Boost transformiert sie in eine andere. Es folgt, dass allgemeine RobertsonWalker Raumzeiten ein bevorzugtes Bezugsystem {ea (p)} in jedem Punkt p haben, n¨amlich das, dessen zeitliche Achse senkrecht auf dieser Hyperfl¨ache steht. In den Koordinaten t, r, ϑ, ϕ gilt eµ0 (t, r, ϑ, ϕ) = (1, 0, 0, 0). Die Beobachter mit der 4er-Geschwindigkeit e0 heissen kosmologische Beobachter, und es sind eben nur diese Beobachter, welche das Weltall homogen und isotrop sehen. Nach dem von der kosmologischen Hintergrundstrahlung Gesagten darf unser Kosmos nicht mehr Symmetrie haben als Homogenit¨at und Isotropie. Eine solche thermische Strahlung definiert n¨amlich in jedem Punkt ein Ruhesystem (nur in diesem Bezugssystem ist sie isotrop). Das Ruhesystem der Strahlung muss also mit dem bevorzugten Bezugsystem u ¨bereinstimmen. Daraus ergibt sich die M¨oglichkeit, das bevorzugte System zu bestimmen, und das ist auch wirklich schon getan worden. Im Jahr 1986 hat man festgestellt, dass eine schwache dipolartige (cos α) Abweichung von der perfekten Isotropie der kosmischen Hintergrundstrahlung vorhanden ist (gemessen in Ruhesystem der Erde). Die Abweichung entspricht einer Bewegung der Erde mit der Geschwindigkeit vErde ≈ 361 km/s relativ zum bevorzugten BS. Subtrahiert man davon die Bewegung der Erde innerhalb unserer Galaxie, erh¨alt man vGalaxie ≈ 500km/s. Das sind u ¨berraschend grosse Geschwindigkeiten. Sonst ist die kosmische Hintegrundstrahlung sehr genau isotrop und sehr genau thermisch. Die Messungen des Sateliten COBE (COsmic Background Explorer) 1992 ergaben, dass die Fluktuationen um die Isotropie, wenn man die Eigengeschwindigkeit subtrahiert, nur noch von relativer Gr¨ossenordnung ∆T ≈ 10−5 T sind, und die Temperatur T = 2.726 ± 0.010 K 160
ist, was eigentlich ein perfekteres Schwarzk¨orperspektrum ist, als man je in einem Labor erzeugen kann! Die Fluktuationen der Isotropie kann man viel genauer messen. Die Strukrur davon gibt Auskunft u uhe Weltall. ¨ber das fr¨
4.2.3
Kosmologische Rotverschiebung
Wenn a0 6= 0, dann haben kosmologische Beobachter nichtverschwindende Geschwindigkeiten in Bezug aufeinander. Diese relative Bewegung zeigt sich in einer (positiven oder negativen) Rotverschiebung ihrer Lichtsignale. Berechnen wir diese Rotverschiebung. Betrachten wir zu diesem Zweck ein Lichtsignal l¨angs einer lichtartigen Geod¨ate, die durch die Funktionen t(κ), r(κ), ϑ(κ) und ϕ(κ) parametrisch dargestellt wird. Das Licht sei bei dem Wert κ1 emittiert und bei κ0 empfangen und analysiert worden ˙ ϕ) ˙ r, (Bild 4.3). κ sei ein physikalischer Parameter (Seite 45), so dass der Vektor (t, ˙ ϑ, ˙ der 4er-Impuls des Lichtes ist. Dann ist also t˙ = hν, wobei ν die Frequenz des Lichtes in Bezug auf das bevorzugte BS in jedem Punkt der Bahn ist, insbesondere am Anfang und am Ende. Die Rotverschiebung z ist definiert durch λ0 − λ 1 z= , λ1 also z=
t˙1 − t˙0 ν1 − ν 0 = . ν0 t˙0
(4.13)
Die Beziehung zwischen t˙1 und t˙0 k¨onnen wir aus der geod¨atischen Gleichung ausrechnen. Diese ergibt sich als die Euler-Lagrange-Gleichung zum Lagrangian (Gl. (2.14)) L = (1/2)t˙2 − (1/2)a2g˜kl x˙ k x˙ l , wobei g˜kl die Metrik in der eckigen Klammer auf der rechten Seite von (4.12) ist (xk steht f¨ ur die Koordinaten r, ϑ und ϕ). Die entsprechenden Euler-LagrangeGleichungen sind t¨ + aa0 g˜kl x˙ k x˙ l = 0, (4.14) ˜m ˙ k x˙ l = 0, x¨m + 2a0 a−1 t˙x˙ m + Γ kl x
(4.15)
˜ m die Christoffel-Symbole der Metrik g˜kl sind. F¨ ur eine lichtartige Geod¨ate wobei Γ kl muss noch gelten: t˙2 − a2 g˜kl x˙ k x˙ l = 0. (4.16) 161
Setzen wir dies in (4.14) ein, so ergibt sich t¨ + a0 a−1 t˙2 = 0, und das impliziert einfach: at˙ = konst. Damit wird nun (4.13)
a0 − a 1 . (4.17) a1 Das ist die allgemeine und exakte Formel f¨ ur die kosmologische Rotverschiebung. Danach ist die Rotverschiebung durch das Verh¨altnis der Skalenfaktoren a0 zur Zeit des Empfangs und a1 zur Zeit der Emmission gegeben und unabh¨angig von der ganzen Geschichte dazwischen. Aus (4.17) ersehen wir, dass die Rotverschiebung bei der kosmologischen Ausdehnung positiv (und bei Schrumpfung negativ) ist, wie wir erwartet haben. Dies gilt auch f¨ ur k = 0, man kann also das Verh¨altnis a0 /a1 durch Beobachtung der Rotverschiebung bestimmen. Der Index 0, der in dieser Berechnung benutzt worden ist, hat in der Kosmologie eine besondere Bedeutung: er bezeichnet die Gr¨ossen, welche sich auf die Gegenwart beziehen. Dieser Konvention schliessen wir uns also an. Eine andere wichtige Eigenschaft der Robertson-Walker-Metrik ist die Beziehung zwischen der Gr¨osse der Rotverschiebung und dem Abstand. F¨ ur kleine Abst¨ande k¨onnen wir eine einfache Beziehung herleiten. Die Gleichung (4.16) impliziert die folgende Beziehung zwischen dem r¨aumlichen Abstand ds, definiert durch z=
ds2 = a2 g˜kl dxk dxl , und der Zeit dt, welche das Lichtsignal verbraucht: ds = dt. F¨ ur infinitesimale Abst¨ande erhalten wir dann aus (4.17) dz =
da a0 a0 dλ = = dt = ds. λ a a a
Wenn man die sog. Hubble-Konstante H0 definiert H0 =
1 da |t , a dt 0
erh¨alt man das Hubblesche Gesetz: dλ = H0 ds. λ 162
(4.18)
Es besagt, dass die Rotverschiebung proportional zum Abstand ist. Die Gleichung (4.18) ist nur f¨ ur die infinitesimalen Abst¨ande geschrieben, sie gilt aber approximativ f¨ ur endliche kleine Abst¨ande, wobei “klein” als “klein in Bezug auf den kosmischen Radius a” verstanden werden kann. Das ist f¨ ur alle unsere Messungen g¨ ultig. Um die Hubble-Konstante zu messen, tr¨agt man die Rotverschiebung z von Galaxien als Funktion deren Entfernung (das sog. Hubble-Diagramm, siehe Bild 4.4). Die neuesten Messungen ergeben H0 = 65 ± 10km s−1 MPc−1 (Pc ist “Parsec” = 3.26 Lichtjahre; MPc = 106 Pc ist die typische Distanz zwischen den Galaxien). Die Schwierigkeiten der Messung liegen sowohl in der eigenen Geschwindigkeiten der Galaxien (vergl. die Geschwindigkeit 500 km/s unserer lokalen Gruppe von Galaxien), als auch in der Abstandmessung.
4.2.4
Kosmologische Horizonte
Wir wollen uns jetzt mit den folgenden Fragen besch¨aftigen: Welche Teile des Weltalls sind f¨ ur einen kosmologischen Beobachter sichtbar? In welche Teile des Weltalls kann ein kosmologischer Beobachter Signale schicken? Betrachten wir einen Beobachter B; von welchen Ereignissen kann er im Prinzip Kenntnis haben, wenn er den Punkt (Ereignis) p auf seiner Bahn erreicht? Diese Ereignisse sind offensichtlich durch den Vergangenheitslichtkegel durch p begrenzt. Andererseits kann ein Beobachter B, deren Leben im Punkt p beginnt, nur die Ereignisse des Weltalls beeinflussen, welche innerhalb des Zukunftslichtkegels durch p liegen (Bild 4.5). Berechnen wir, wie diese Lichtkegel in der Robertson-WalkerRaumzeit laufen. Zu diesem Zweck wird die Robertson-Walker-Metrik am besten wie folgt umgeschrieben: dr 2 2 2 2 2 2 2 2 2 ds = a (t) dη − − r dϑ − r sin ϑ dϕ , 1 − kr 2 wobei
dη =
dt . a(t)
0 Wir sagen, dass zwei Metriken gµν und gµν in konformer Beziehung sind (oder dass 0 0 gµν eine konforme Deformation von gµν ist), wenn gµν (x) = F (x)gµν (x) mit einer positiven Funktion F (x). Dann ist also die Robertson-Walker-Metrik in konformer Beziehung zur Metrik in der Klammer oben. Man kann zeigen, dass die lichtartigen Geod¨aten (nicht Autoparallelen—der Affinparameter ist anders!) von zwei Metriken in konformer Beziehung u ¨bereinstimmen. Dann ist also der Gang des Lichtes in Bezug auf die Koordinaten η, r, ϑ und ϕ unabh¨angig von a(t). In der Klammer
163
steht die Metrik einer statischen Raumzeit: f¨ ur k = 1 haben wir die Topologie 3 4 R × S und f¨ ur k = 0, −1 R , und k = 0 gibt sogar die Minkowskische Raumzeit. Betrachten wir den Beobachter mit der Bahn r = 0 (wegen der vollst¨andigen Homogenit¨at repr¨asentiert diese Bahn alle m¨oglichen kosmologischen Beobachter). Die radialen Lichtstrahlen durch den Punkt mit η = η0 seiner Bahn erf¨ ullen die Gleichungen ϑ = ϑ0 , ϕ = ϕ 0 , η˙ 2 − die letzte kann schnell gel¨ost werden: r=
r˙ 2 = 0; 1 − kr 2
k=1 k=0 k = −1 ± sin(η − η0 ) ±(η − η0 ) ± sinh(η − η0 )
Damit sind die Lichtkegel des Punktes mit η = η0 und r = 0 gegeben; das obige Vorzeichen gilt f¨ ur den Zukunfts-, das untere f¨ ur den Vergangenheitslichtkegel. Diese Grenzen sind offensichtlich nicht besonders bedeutend: wenn der Beobachter etwas wartet, so dass seine Bahn den Punkt p passiert, wird sich sein “Horizont” erweitern. Aehnlich k¨onnte der Beobachter sein Signal fr¨ uher als in p senden und somit mehr Teilchen beeinfussen. Eine interessante Frage ist, ob man solche Erweiterungen unbeschr¨ankt machen kann. Studieren wir diese Frage f¨ ur den einfachsten Fall k = 0 (die anderen F¨alle sind, im Grunde, analog): in diesen Fall haben wir einfach die gew¨ohnlichen Lichtkegel in der Minkowski-Raumzeit mit den Koordinaten η, r, ϑ uns ϕ. Die t-Abh¨angigkeit von η ist gegeben durch Z t dτ η(t) = η0 ± ; t0 a(τ ) der springende Punkt ist, dass das Integral konvergieren kann, wenn sich t einer “Grenze” des Weltalls n¨ahert. Das kann drei Formen haben. Entweder bleibt a(t) regul¨ar und positiv im ganzen Bereich t ∈ (−∞, ∞), aber Z t dτ |ηs | := lim < ∞; t=±∞ t0 a(τ )
oder a(ts ) = 0 f¨ ur ein endliches ts und
Z |ηs | := lim t=ts
t t0
dτ < ∞; a(τ )
oder endlich a(ts ) = ∞ f¨ ur ein endliches ts —dann ist sicher |ηs | < ∞. Das w¨ urde bedeuten: die ganze Robertson-Walker-Raumzeit ist nur durch einen Teil der Minkowskischen Raumzeit repr¨asentiert, entweder η > ηs oder η < ηs oder beides. Im 164
ersten Fall haben wir einen wohldefinierten Zukunftslichtkegel des Punktes η = ηs , r = 0 in der Raumzeit; die Oberfl¨ache davon heisst Teilchenhorizont des Teilchens an der Bahn r = 0. Im zweiten Fall gibt es einen wohldefinierten Vergangenheitslichtkegel des Punktes η = ηs , r = 0 in der Raumzeit; die Oberfl¨ache davon heisst Ereignishorizont des Beobachters an der Bahn r = 0 (Bild 4.6). Die Teilchenhorizonte k¨onnen zum ernsthaften Problem in der Kosmologie werden: weite Teile des Weltalls k¨onnen im Prinzip nicht von Teilchen beeinfusst werden; weite Teile des Kosmos k¨onnen also nicht miteinander wechselwirken. Wie k¨onnte sich aber unter solchen Umst¨anden u ¨berall die gleiche Dichte, Temperatur usw. etablieren? Die Ereignishorizonte wiederum bedeuten, dass ein Beobachter gewisse Teile des Weltalls nie beobachten kann. Dann k¨onnen also weite Teile der Natur unserer Erkenntnis entzogen sein. Ob solche Horizonte existieren, das wird erst durch das Verhalten der Funktion a(t) bestimmt; diese ergibt sich als L¨osung der Einstein-Gleichungen.
4.2.5
Einstein-Tensor der Robertson-Walker-Raumzeit
Die Gleichungen (4.14) und (4.15) erlauben uns, die Komponenten des AZ f¨ ur die Metrik (4.12), welche wir in der Form schreiben ds2 = dt2 − a2 g˜kl dxk dxl , abzulesen: Γ0kl = aa0 g˜kl ,
Γk0l =
a0 k δ , a l
˜m Γm kl = Γkl ,
(4.19)
˜ m die Christoffel-Symbole der Metrik g˜kl sind. Daraus ergibt sich (Aufgabe): wobei Γ kl G00 = 3a−2 (a02 + k),
(4.20)
Gkl = −(2aa00 + a02 + k)˜ gkl .
(4.21)
Diese Ausdr¨ ucke werden wir bei der Aufstellung der Einstein-Gleichungen brauchen. Man sieht daraus, das der 3-Raum flach, aber die Raumzeit selber gekr¨ ummt ist f¨ ur k = 0.
4.3 4.3.1
Kosmische Dynamik Friedmann-Lemaˆıtre-Gleichungen
In diesem Abschnitt wollen wir die Einstein-Gleichungen f¨ ur die Robertson-WalkerMetrik aufstellen und die resultierende Dynamik diskutieren. Zur Aufgabe, EinsteinGleichungen zu l¨osen, wollen wir zun¨achst ganz allgemein ein paar Worte sagen. Am 165
besten vergleichen wir es mit L¨osung von Maxwell-Gleichungen. Maxwell-Gleichungen sind linear; man kann also ein f¨ ur allemal eine Standardl¨osung finden, am besten in der Form einer Greensfunktion. Dann, gegeben eine Quelle in Minkowskiraum, die L¨osung ist bestimmt als ein Integral u ¨ber den Produkt der Quelle und der Greensfunktion. Die L¨osungen der Einstein-Gleichungen kann man erstens nicht als Linearkombination von anderen L¨osungen davon schreiben. Zweitens, eine Angabe der Quelle ist nicht m¨oglich, ohne die Metrik zu kennen: eine Verteilung der Masse besagt ja auch, wie weit voneinander die einzelnen Massenelemente sind. Die Methode, welche wir in diesem Skript zur L¨osung der Einstein-Gleichungen verwenden ist, zun¨achst eine Symmetrie der ganzen L¨osung anzunehmen und dann die Gleichungen f¨ ur beide Felder—Metrik und Energie-Impuls-Tensors—gleichzeitig zu l¨osen. Dazu m¨ ussen wir also auch den Energie-Impuls-Tensor der Materie n¨aher beschreiben: Wir setzen voraus, dass er die Form (3.82) der idealen Fl¨ ussigkeit hat. Weiter soll die Materie die gleiche Symmetrie haben wie die Metrik: Das Ruhesystem der Fl¨ ussigkeit soll mit dem kosmologischen Bezugsystem u ¨ bereinstimmen. µ D.h., u = (1, 0, 0, 0) (in Bezug auf die Koordinaten t, r, ϑ, ϕ), und die Skalarfelder ρ und p sollen konstant l¨angs den t = const. Hyperfl¨achen sein: ρ = ρ(t), p = p(t). Einsetzen dieser Werte und (4.20) und (4.21) in die Einstein-Gleichungen (3.92) ergibt zwei unabh¨angige Gleichungen, welche am besten in der folgenden Form geschrieben werden: Λ 4πG (ρ + 3p)a + a, 3 3 8πG 2 Λ 2 02 ρa + a . a +k = 3 3 a00 = −
(4.22) (4.23)
Eine andere wichtige Gleichung ist die Energiegleichung (3.84), welche in unserem Sonderfall auf die Form gebracht werden kann (a3 ρ)0 + p(a3 )0 = 0.
(4.24)
Wenn a0 6= 0, dann sind nur zwei dieser drei Gleichungen unabh¨angig. (4.22), (4.23) und (4.24) heissen Friedmann-Lemaˆıtre-Gleichungen; im Falle, dass Λ = 0, heissen diese Gleichungen Friedmann-Gleichungen. Sie bestimmen die Dynamik, wenn noch eine Zustandsgleichung p = p(ρ) vorliegt.
4.3.2
Die kosmische Beschleunigung
Studieren wir Gl. (4.22). Setzen wir zun¨achst Λ = 0. Auf der linken Seite steht die Beschleunigung a00 der kosmischen Ausdehnung. Auf der rechten Seite steht der Quellenterm ρ + 3p multipliziert mit einer negativen Zahl. Ist die Quelle positiv, dann wird die Ausdehnung gebremst oder die Schrumpfung beschleunigt. Man kann 166
es so interpretieren, dass die Gravitation bei einer positiven Quelle anziehend und bei einer negativen Quelle abstossend wirkt. Neu ist, dass der Druck auch zum Quellenterm geh¨ort. Das ist notwendig in einer relativistischen Theorie, da sich die Massendichte bei einem Boost mit dem Druck mischt. Interessant ist aber die folgende Beobachtung. Nehmen wir an, dass das System schrumpft, a0 < 0, wobei ρ > 0 und p > 0. Die Positivit¨at des Terms ρ + 3p f¨ uhrt dann dazu, dass a0 noch negativer wird: die Kontraktion wird beschleunigt. Die Kontraktion hat aber noch dazu die Tendenz, beide Gr¨ossen ρ und p zu erh¨ohen. Dabei wird die Massendichte teils direkt durch die Kontraktion erh¨oht, teils indirekt durch die Arbeit, welche die Kontraktion gegen p macht. Die Energie wird offensichtlich von der Gravitation in die Materie so gepumpt; die Energie der Gravitation wird mehr und mehr negativ. Was resultiert ist die Unstabilit¨at gegen den Kollaps. Umgekehrt sei jetzt a0 > 0 und ρ + 3p negativ (das passiert in DeSitter-L¨osung). Dann haben wir a00 > 0 und a0 wird noch positiver: die Expansion wird beschleunigt. Diese Expansion macht gegen den negativen Druck Arbeit und so wird wieder Energie von der Gravitation in die Materie gepunmt. Die sogenannte inflation¨are Instabilit¨at ist das Resultat. F¨ ur normale Zust¨ande der Materie aber gelten die Ungleichungen ρ > 0,
p > 0,
da die Existenz von negativer Masse Konstruktion eines “Perpetuum Mobile” erm¨oglicht, und negative Dr¨ ucke thermodynamisch unstabil sind. (Die Konstruktion: Man bildet aus einem positiven und einem negativen Gewicht einen Massen-Dipol. Wie man durch einfache auf der Newton-Theorie basierte Berrechnung feststellt, bewegt sich der Dipol mit einer Beschleunigung, deren Richtung mit der Dipolrichtung u ¨bereinstimmt.) Die Voraussetzung, dass die Materie immer in einem solchen normalen Zustand ist, hat eine interessante Folgerung. Der Graph der Funktion a(t) ist dann konvex (Bild 4.7); wenn also heute gilt, dass a0 > 0, dann musste der Graph in der Vergangenheit die t-Achse schneiden. Dort war also a = 0, eine Singularit¨at (unendliche Kr¨ ummung und Dichte). Diese Art Big Bang (Grosser Knall) kann nicht fr¨ uher −1 0−1 stattgefunden haben als vor der Zeit ∆t = a (t0 )a(t0 ) = H0 . ∆t ist als die sog. Hubble-Zeit bekannt, und sie gibt eine obere Grenze f¨ ur das Alter des Alls an (unter den gemachten Voraussetzungen). Die Hubble-Zeit betr¨agt etwa 15 × 109 Jahre f¨ ur die Hubble-Konstante von 65 km/s/Mpc. Es ist interessant, dass die uns bekannten Alter aller m¨oglichen Gesteine oder astronomischen Systeme (z.B. galaktische Kugelhaufen) kleiner oder vergleichbar mit der Hubble-Zeit sind. Betrachten wir den Λ-Term in Gl. (4.22). Wenn Λ > 0, dann wird die negative Beschleunigung des Alls dadurch vermindert, und wenn er sogar dominierent, haben 167
wir (positive) Beschleunigung. Dann ist das obige Argument ung¨ ultig. In der Tat war diese Idee von Herrn Lemaˆıtre schon von vielen Jahren vorgeschlagen, weil die ersten Messungen der Hubble-Konstante einen so niedrigen Wert gegeben haben, dass nicht einmal die Erde mit ihrem 4.5 Milliarden Jahren in der entschprechenden HubbleZeit ein Platz fand. Heute bestimmt man den Wert von Λ aus einer unabh¨angigen Messung. Dazu kommen wir sp¨ater. In der Kosmologie ist es u ¨blich, die kosmische Beschleunigung durch eine dimensionsfreie Gr¨osse, den sog. Verz¨ogerungsparameter q, darzustellen: aa00 q = − 02 . a
(4.25)
Eine wichtige Beziehung zwischen q, den Dichten und der Hubble-Konstante ergibt sich, wenn wir Gl. (4.22) mit −a/a02 multiplizieren: q=
4πG Λ (ρ + 3p) − . 2 3H 3H 2
(4.26)
Die kosmologische Konstante Λ wird oft durch die entsprechende Energiedichte des Vakuums ρΛ ausgedr¨ uckt. Wir k¨onnen n¨amlich den Λ-Term als effektiven Energie-Impuls-Tensor (3.103) schreiben. Dann haben wir im kosmologischen Ruhesystem (wie in jedem anderen orthonormalen Vierbein): 1 0 0 0 Λ 0 0 0 −1 µν Tvac = . 0 −1 0 8πG 0 0 0 0 −1
µν Tvac hat also die Form der idealen Fl¨ ussigkeit (3.81) mit
ρΛ =
Λ , 8πG
pΛ = −
Λ , 8πG
(4.27)
Dann kann Gl. (4.26) auf die folgende Form gebracht werden: q=
4πG (ρ + 3p − 2ρΛ ) , 3H 2
(4.28)
welche oft benutzt wird.
4.3.3
Einfache Zustandsgleichungen
Die einfachste Zustandsgleichung lautet: p = 0. Die Materie mit dieser Zustandsgleichung heisst Staub (auch inkoh¨arente Materie). Man sagt manchmal, dass die “kalte” Materie diese Zustandsgleichung hat; damit meint man, dass einzelne St¨ ucke oder 168
Teilchen der Materie massiv sind, kleine (nichtrelativistische) Geschwindigkeiten haben, und die masselosen Teilchen vernachl¨assigbar sind (“kalte, nichtrelativistische Materie”). Z. B. die heutigen Galaxien bilden eine solche Art Staubteilchen. Betrachten wir einige Konsequenzen dieser einfachen Gleichung. Die Gleichung (4.24) hat dann die L¨osung 3 M, (4.29) a3 ρ = 4π wobei M eine Konstante mit der Dimension einer Masse ist, und ihre Bedeutung ist offensichtlich die der Gesamtmasse in der (gedachten) Kugel vom Radius a. Gl. (4.29) besagt unter anderem, dass die Punkte mit a = 0 singul¨ar sind (unendliche Massendichte ρ). Die Gl. (4.23) hat in diesem Fall die Form 2GM Λ a02 + k = + a2 . (4.30) a 3 Man kann sich aber auch vorstellen, dass die Materie “heiss” ist: die massiven Teilchen haben relativistische Geschwindigkeiten und sie unterscheiden sich praktisch nicht in ihrer Dynamik von masselosen Teilchen; oder es gibt nur masselose Teilchen. Die Zustandsgleichung der heissen Materie lautet: 1 p = ρ. 3 Gl. (4.24) hat dann die L¨osung 3 ρa4 = K, (4.31) 4π wobei K eine Konstante mit der Dimension kgm ist (K hat ¨ahnlich wie M beim Staub nur f¨ ur k 6= 0 eine physikalische Beteutung). Dann erh¨alt man aus Gl. (4.23): 2GK Λ 2 (4.32) + a . a02 + k = a2 3 Die Gleichungen (4.30) und (4.32) sind in vielen qualitativen Z¨ ugen a¨hnlich. Die kosmologischen Modelle, mit welchen man arbeitet, bestehen meistens aus drei Komponenten, welche eine vernachl¨assigbare Wechselwirkung miteinander haben. Die Vakuumkomponente ist die erste; ihre Energiedichte ρΛ ist unabh¨angig ¨ vom Skalenfaktor a (mindestens w¨ahrend ganzer kosmologischen Aras). Die nichtrelativistische Materie ist die zweite; ihre Energiedichte ρM erf¨ ullt Gl. (4.29) mit irgendwelcher Konstante M als ob sie alleine im Weltall w¨are. Endlich haben wir die Strahlung mit der Dichte ρS , welche durch Gl. (4.31) beschrieben ist. Wir beobachten, dass die Abh¨angigkeit der drei Dichten von a verschieden ist, und dass dies zu verschiedenen Rollen der drei Sorten der Materie bei sehr kleinen oder sehr gr¨ossen a f¨ uhren kann. F¨ ur gen¨ ugend kleine Werte von a, die Strahlung wird dominieren; f¨ ur sehr gr¨osse Werte von a, die Vakuumdichte wird dominieren; dies ist unabh¨angig davon, wie gross die Konstanten Λ, M und K sind. 169
Horizonte Betrachten wir noch die Frage der Horizonte. Die Resultate sind gleich f¨ ur die Staubund die Strahlungsmodelle, so k¨onnen wir uns auf die Staubmodelle beschr¨anken. Man soll aber beachten, dass im Fall a → 0 eher die Strahlung dominiert, wogegen im Fall a → ∞ wieder die Vakuumdichte herrschen wird. F¨ ur die Staubmodelle kann Gl. (4.30) so geschrieben werden 2GM Λ − k + a2 . a 3 Wenn a → 0, dann wird die rechte Seite vom ersten Term dominiert: a02 =
a02 ≈
2GM . a
Setzen wir a ≈ Atx , dann erhalten wir x = 2/3, und
A=
9 GM 2
1/3
,
dt 3 = t1/3 → 0. 2/3 At A Es gibt also Horizonte, Teilchenhorizonte bei Big Bang und Ereignishorizonte bei Big Crunch. Umgekehrt, wenn a → ∞, dann dominiert der letzte Term, wir erhalten a ∼ p ur Λ > 0 wieder konvergieren. Genauere Beexp( Λ/3t) und das Integral wird f¨ trachtungen f¨ ur exakte L¨osungen werden diese Absch¨atzungen best¨atigen. η(t) =
4.4
Z
Die Staubmodelle
Wir beschr¨anken uns hier auf die Staubmodelle (Gl. (4.30)); die Diskussion der Gl. (4.32) ist analog.
4.4.1
Die Skalenklassen
Wir wollen die Eigenschaften der L¨osungen von Gl. (4.30) studieren; diese Eigenschaften repr¨asentieren alle Vorhersagen, welche die Einstein-Gleichungen zu Staubmodellen machen. Gl. (4.30) bestimmt die Robertson-Walker-Geometrie bei gegebenen Konstanten k, M und Λ eindeutig, denn die Integrationskonstante h¨angt mit dem Ursprung der Zeitskala zusammen und ist bedeutunglos. Um das zu sehen, bringen wir die Gleichung durch die Separationsmethode zur Form dt = q
da 2GM a
+
170
Λ 2 a 3
. −k
Die Integrationskonstante repr¨asentiert also eine Verschiebung der Zeitkoordinate t, und das ist eine blosse Koordinatentransformation, welche keine Aenderung der Geometrie bedeutet. Eine wichtige Frage nun ist, ob zwei verschiedene Dreizahlen k, M und Λ auch zwei verschiedene L¨osungen bestimmen. Die Konstanten k und Λ sind messbar, aber wie ist es mit M ? Wenn k 6= 0, dann ist auch der Skalenfaktor a zu jeder Zeit (im Prinzip) messbar und die Masse in einer Kugel mit radius a ist eine wohldefinierte Mass der Dichte. In Fall k = 0 aber hat a f¨ ur sich keine messbare Bedeutung. Wenn wir a mit einer Konstante x multiplizieren, erhalten wir die gleiche Raumzeitgeometrie. Es folgt, dess wir im Fall k 6= 0 zwei zweidimensionale Familien von L¨osungen haben, jede definiert durch den Wert von k = 1, −1 und beschrieben bijektiv durch die Werte von (M, Λ). Dagegen gibt es im Fall k = 0 nur eine eindimensional Familie, bijektiv durch die werte von Λ beschrieben bei festen Werten von M . Eine der sehr praktischen Eigenschaften der L¨osungen der Einstein-Gleichungen ist ihr Skalenverhalten. Eine Skalentransformation ist ein Spezialfall der konformen Deformationen: Multiplikation der Metrik durch einen konstanten Faktor. Zwei Metriken geh¨oren zur gleichen Skalenklasse, wenn sie sich nur um einen solche Faktor unterscheiden. Es gilt: 1. wenn gµν eine L¨osung ist, dann ist y 2 gµν auch eine (zu anderen Werten von M und Λ) f¨ ur jedes konstante y 6= 0, und 2. Metriken gleicher Skalenklasse haben gleiche qualitative Eigenschaften. Das wollen wir jetzt f¨ ur die Staubkosmologie zeigen. 2 2 Seien ds1 und ds2 zwei Metriken in der gleiche Skalenklasse, dh.: ds21 = dt2 − a2 (t)d˜ s2 und ds22 = y 2 [dt2 − a2 (t)d˜ s2 ]. Die erste Metrik ist eine Robertson-Walker-Metrik, und wir setzen voraus, dass a(t) Gl. (4.30) f¨ ur die Werte k, M , und Λ der Konstanten erf¨ ullt. Die zweite Metrik beschreibt eine Robertson-Walker-Raumzeit mit dem Skalenfaktor t a1 (t) = ya , (4.33) y wie die Koordinatentransformation yt = t1 zeigt. Es folgt: Zwei Robertson-Walker-Metriken mit gleichen Werten von k und zwei Skalenfaktoren a(t) und a1 (t) liegen in der gleichen Skalenklasse, wenn Gl. (4.33) erf¨ ullt ist. 171
Eine weitere Frage ist, ob der Skalenfaktor a1 (t) auch Gl. (4.30) erf¨ ullt. Setzen wir −1 f¨ ur a(t) den Ausdruck y a1 (yt) in diese Gleichung ein. Wir benutzen die Beziehung: 1 a0 = a01 y = a01 . y Dann erhalten wir (a01 )2 + k =
2G(M y) Λ + 2 a21 . a1 3y
a1 (t) ist also die L¨osung von (4.30) mit den abge¨anderten Konstanten k1 = k,
M1 = M y,
Λ1 =
Λ . y2
(4.34)
Es ist nicht schwierig zu zeigen, dass auch umgekehrt die zwei Paare (M, Λ) und (M1 , Λ1 ), welche durch die obigen Beziehungen verbunden sind, Metriken der gleichen Skaleklasse entsprechen. Eine g¨ unstige Parametrisierung der Modelle w¨are also eine solche, dessen erster Parameter die Skalenklassen und der zweite die Unterschiede innerhalb der Klassen beschreiben w¨ urde. Zu diesem Zweck w¨ahlen wir eine y-invariante und dimensionslose Kombination 1 C := G2 M 2 Λ 3 als den ersten, und die Skale L := GM als den zweiten Parameter. Mit diesen Parametern lautet Gl. (4.30) so:
dα dτ
2
+k =
2 + Cα2 , α
(4.35)
wobei α und τ sich ergeben aus a = Lα,
t = Lτ
und dimesionslos sind; die Funktion α(τ ) beschreibt die Eigenschaften der Klasse, welche zu den Werten k 6= 0 und C der Konstanten geh¨ort; sie ist selber ein Skalenfaktor entsprechend dem Wert von L = 1. Jede andere L¨osung a(t) ergibt sich aus α(τ ) so: a(t) = Lα(t/L). F¨ ur k = 0 hat L keine messbare bedeutung und keinen Einfluss auf die geometrischen Eigenschaften. Wir k¨onnen setzen GM = 1. Die kosmologische Konstante Λ ¨andert sich aber bei Skalentransformationen so, dass all positiven Λ’s, alle negativen 172
Λ’s und der Fall Λ = 0 eine Skalenklasse bilden. Die entsprechenden Repr¨asentanten erf¨ ullen die Gleichungen: 2 Λ a02 = + a2 a 3 f¨ ur Λ > 0 mit der L¨osung a(t) =
p 6 sinh2 3Λ/4t Λ
1/3
,
f¨ ur Λ < 0 mit der L¨osung a(t) =
p 6 sin2 −3Λ/4t −Λ
1/3
,
und f¨ ur Λ = 0 mit der L¨osung a(t) =
9t2 2
1/3
Damit sind die Eigent¨ umlichkeiten des falles k = 0 ersch¨opft.
4.4.2
Qualitative Diskussion der Dynamik
Die Zeitabh¨angigkeit des Skalenfaktors in den Modellen der gleichen Skalenklasse hat die gleichen qualitativen Eigenschaften: alle haben die gleiche Menge der Maxima und Minima, alle gehen gleiche Menge mal durch Null, und alle divergieren gleiche Menge mal zur Unendlichkeit. Wir wollen jetzt diese Eigenschaften studieren. Schreiben wir dazu Gl. (4.35) in der folgenden Form: 1 2
dα dτ
2
k + V (α) = − , 2
wobei V (α) := −
(4.36)
1 C 2 − α α 2
ein sog. effektives Potential ist. Gl. (4.36) hat n¨amlich die bekannte Form des Energieintegrals der Newtonschen dynamischen Gleichung f¨ ur nichtrelativistische Bewegung eines Massenpunktes mit Masse 1 und der Gesamtenergie −k/2 entlang der α-Achse unter Wirkung des Potentials V (α). Die qualitative Diskussion basiert auf dieser Newton-Analogie (vergleiche die Diskussion von Periheldrehung im ersten Teil). Betrachten wir die folgenden F¨alle. 173
1. C < 0 Das kann nur passieren, wenn Λ negativ ist. Das Diagramm von V (α) f¨ ur diesen Fall zeigt Bild 4.8. V steigt monoton von V = −∞ bei α = 0 bis zu V = ∞ bei α = ∞. Die m¨oglichen Bewegungen sind durch die Teile der horizontalen Kurve E = −k/2 bestimmt, welche u ¨ber der Potentialkurve liegen. Alle diese Kurven starten bei α = 0 (Big Bang), erreichen ein maximales α, den sog. Umkehrpunkt bei αU , wobei V (αU ) = −k/2, kehren dann um und erreichen α = 0 wieder. Der Zeitverlauf (Bild 4.8) ist symmetrisch um den Umkehrpunkt. Das Resultat in diesem Fall: Alle Modelle k = ±1, 0 laufen vom Big Bang zu Big Crunch (rekollabieren) in einer endlichen Zeit. Die kosmische Beschleunigung α00 = −
dV dα
ist die ganze Strecke negativ, q > 0. 2. C = 0 Das heisst also, dass Λ = 0 ist, und somit 1 V (α) = − . α Das Diagramm (Bild 4.9) zeigt dann, dass es zwei Teilf¨alle gibt: k = 1: das Modell ist geschlossen und rekollabiert wie oben. k ≤ 0: das Modell ist offen und expandiert f¨ ur immer zu α → ∞ (siehe Bild 4.9). Das Resultat in diesem Fall: 1. Geschlossene Modelle rekollabieren von Big Bang zu Big Crunch, 2. offene Modelle starten bei Big Bang und expandieren f¨ ur immer zu α → ∞, 3. q > 0 f¨ ur die ganze Geschichte. 3. C > 0 Da heisst also, dass Λ > 0 ist. Das V -Diagramm ¨andert sich hier stark (Bild 4.10): Die V -Kurve hat ein Maximum VMax bei αMax . Eine einfache Berechnung ergibt: αMax = C −1/3 ,
3 VMax = − C 1/3 . 2 174
Die kosmische Beschleunigung ist jetzt negativ f¨ ur α ∈ (0, αMax ) und positiv f¨ ur 00 α ∈ (αMax , ∞), weil α = −dV /dα, f¨ ur alle drei F¨alle k = ±1, 0. Die F¨alle k = −1, 0 liegen u ¨ ber der Potentialkurve im ganzen Interwal α ∈ (0, ∞) und repr¨asentieren so die ewige expansion von Big Bang zu α → ∞. F¨ ur k = +1 sind drei F¨alle zu unterscheiden VMax < −1/2. Benutzt man den Wert von VMax , ergibt es die folgende Ungleichung f¨ ur C: 1 C> . 27 Dann kann die Teilchentrajektorie E = −k/2 bei keinem Wert von k den Potentialberg treffen; alle starten bei Big Bang und expandieren f¨ ur immer zu α → ∞. VMax = −1/2. Das heisst C=
1 , 27
und wir m¨ ussen drei Teif¨alle unterscheiden: 1. Das Modell startet bei Big Bang und expandiert dann f¨ ur immer aber nicht zur Unendlichkeit, sondern zum Wert α = αMax = 3 (Bild 4.11). 2. Das Modell ist statisch mit α = αMax = 3. Es ist aber unstabil, da es nicht bei einem Minimum, sondern bei einem Maximum der Potentialkurve liegt. 3. Das Modell startet bei α = αMax = 3 f¨ ur τ → −∞ und expandiert f¨ ur immer zu α → ∞. Die zwei letzten F¨alle sind also alles Modelle ohne Big Bang, aber sie scheinen nicht wichtig, da sie Grenzf¨alle, also nicht generisch sind. VMax > −1/2. Das heisst also, dass 0
1 . 27
Dann haben wir zwei Teilf¨alle: 1. α < αMax ; alle Modelle starten bei Big Bang und rekollabieren bei Big Crunch. 2. α > αMax ; alle Modelle schrumpfen von α → ∞ und τ → −∞, erreichen einen Umkehrpunkt und expandieren wieder zu α → ∞. Das sind also wieder Modelle ohne Big Bang, aber diesmal generische (Bild 4.10). 175
4.4.3
Die relativen Dichten
Vom Standpunkt der Beobachtungen, d.h., welche kosmologische Situation man beobachtet, gen¨ ugt es nicht nur zu wissen, in welchen Modell man ist, also die Werte der Parameter k, C und L, sondern man muss auch wissen, in welchem Zeitpunkt τ man sich im Modell befindet, denn die Modelle sind nicht statisch. Mit anderen Worten: unsere bisherigen Parameter unterscheiden ganze L¨osungen; jetzt wollen wir Parameter, welche die augenblicklichen Situationen unterscheiden. Es ist weiterhin g¨ ustig vom Stadpunkt der Beobachtung und besser m¨oglich f¨ ur augenblickliche Situationen, diese Parameter durch mehr oder weniger direkt messbare zu ersetzen. Zum Beispiel die Skale L ist sehr schwierig zu messen, und man ersetzt sie deshalb in der Kosmologie immer durch die Hubble-Konstante, im Allgemeinen, durch den Absolutwert dieser Konstante: |H| =
|a0 | 1 |α0 | = . a L α
Andere augenblickliche Parameter kann man skaleninvariant machen. Praktisch bedeutet das, dass man jede Gr¨osse, welche ein nichttriviales Skalenverhalten zeigt, mit einer Potenz von G und der Hubble-Konstante multipliziert, bis man eine skaleninvariante Gr¨osse bekommt. Diese relativen Gr¨ossen sind es, die und dessen Eigenschaften man aus dem theoretischen Modell rechnet. Die aktuellen Werte, welche mit der Beobachtung zu vergleichen sind, bekommt man durch die Multiplikation mit der geigneten Potenz von Hubble-Konstante. Das ist die allgemeine Praxis, die in der Kosmologie schon lange benutzt wird. Die “ganze” Hubble-Konstante H enth¨alt also noch eine kleine weitere Auskunft, und das ist die u ¨ber das Vorzeichen von α0 : sgn(α0 ) = sgn(H). Wenn man eine Blauverschiebung der Galaxien beobachtet, befindet man sich in der kollabierenden Phase der kosmischen Geschichte mit α0 < 0. Ein Beispiel f¨ ur dieses Vorgehen bilden die sog. relativen (augenblicklichen) Dichten ΩM und ΩΛ , welche wir jetzt definieren und beschreiben. Dazu transformieren wir die Friedmann-Lemaˆıtre-Gleichung (4.23) wie folgt: 3k 3 = (ρM + ρΛ ) − 2 8πGa 8πG
0 2 a . a
(4.37)
Alle Terme darin haben die Dimension der Massendichte. Das erm¨oglicht uns, weitere augenblicklichen Gr¨ossen zu definieren: die kritische Dichte, 3 ρc := 8πG
0 2 a , a
176
(4.38)
und die Kr¨ ummungsdichte, 3k . (4.39) 8πGa2 Warum heisst ρc “kritisch”? Schreiben wir Gl. (4.37) mit Hilfe der kritischen Dichte um: 3k = (ρM + ρΛ ) − ρc . 8πGa2 In der Klammer steht dei gesamte Massendichte, die Vakuumdichte eingeschlossen. Ist diese also gr¨osser als die kritische Dichte, wird der Raum positiv gekr¨ ummt, ist sie gleich der kritischen Dichte, ist der Raum flach, und ist sie kleiner als die kritische Dichte, dann ist der Raum negativ gekr¨ ummt. Es ist also der kritische Wert der Gesamtdichte einer, bei welchem der Raum geschlossen wird. Die Kr¨ ummungsdichte hat zugegebenermassen weniger direkte physikalische Bedeutung, sie vereinfacht nur viele Gleichungen. Jetzt kann man dimensionsfreie Parameter einf¨ uhren, indem man alle Dichten auf die kritische bezieht: ρK := −
ΩM :=
ρM , ρc
ΩΛ :=
ρΛ , ρc
ΩK :=
ρK . ρc
Diese heissen einfach Ω-Parameter. Wir sehen, dass sie wirklich ein Beispiel der oben beschriebenen Methode bilden: das Dividieren mit der kritischen Dichte ist nur wenig mehr als Multiplikation mit der Potenz -2 von Hubble-Konstante und 1 von G, wie Gl. (4.38) zeigt. Die Parameter H, ΩM , ΩΛ und ΩK haben alle die gemeinsame Eigenschaft, dass sie abh¨angig von der kosmischen Zeit τ sind, sich also nicht mehr wie k, L und C auf die ganzen L¨osungen beziehen. Durch die Ω-Parameter ausgedr¨ uckt, haben die Friedmann-Lemaˆıtre-Gleichungen eine sehr einfache Form: ΩK + ΩM + ΩΛ = 1, und
1 q = ΩM − Ω Λ . 2 Man kann also ΩK und q aus ΩM und ΩΛ ausrechnen. Auch viele andere skalenfreie G¨ossen kann man daraus berechnen. Das ist die Grundlage f¨ ur das sog. Ω-Diagramm.
4.4.4
Das Ω-Diagramm
Es wird zunehmend popul¨ar, verschiedene graphische Darstellungen in der Form des Ω-Diagramms anzugeben. Diesen wollen wir jetzt vorstellen. Formal ist es eigentlich nichts als die Ebene mit den Achsen ΩM und ΩΛ . Aber es enth¨alt in u ¨bersichtlicher Form alle Zust¨ande (alle Zeitmomente in aller L¨osungen). 177
Wir beginnen, indem wir z. B. die Geraden darin ziehen, welche den Werten ΩK = 0 und q = 0 entsprechen, Bild 4.12. Es ist klar, dass diese Kurven Grenzen ¨ ganzer wichtiger Teilmengen sind. Uber der ersten Kurve liegen die geschlossenen Modelle, denn da ist ΩK < 0, und analog liegen unter der Kurve die offenen Modelle. ¨ Ahnlich liegen u ¨ber der zweiten Kurve Zust¨ande mit Beschleunigung (q < 0), und unter ihr die mit Verz¨ogerung. Wir m¨ ussen aber die Bedeutung der Punkte im Diagramm verstehen, um es zu geniessen. In der Tat, jeder Punkt des Diagramms bestimmt vollst¨andig eine Skalenklasse als auch die (augenblicklichen) Werte der Funktionen α und α 02 . Um das zu sehen, dr¨ ucken wir die Ω-Parameter durch diese Gr¨ossen. Aus der Definition der Parameter und der Dichten ergibt sich unmittelbar: 2GM 2 = , 02 aa αα02 Λa2 α2 = = C , 3a02 α02 k k = − 02 = − 02 . a α
ΩM =
(4.40)
ΩΛ
(4.41)
ΩK
(4.42)
Wie erwartet, sind diese Gr¨ossen unabhangig von L, also skalenfrei. Sie sind aber auch unabh¨angig vom Vorzeichen der kosmichen Geschwindigkeit α0 , den sie enthalten nur Quadrate von α0 . Umgekehrt k¨onnen wir aus ΩM und ΩΛ die Parameter k und C, welche die Skalenklassen unterscheiden, als auch die augenblicklichen Werte von α und |α 0 | ermitteln.
Im Fall k 6= 0, also ΩK = 1 − ΩM − ΩΛ 6= 0 erhalten wir direkt aus Gln. (4.40),(4.41) und (4.42): k = sgn(ΩM + ΩΛ − 1), ΩΛ Ω2M 1 , C = 4 |ΩM + ΩΛ − 1|3 |ΩM + ΩΛ − 1| α = 2 , ΩM |α0 | = |ΩM + ΩΛ − 1|−1/2 .
(4.43) (4.44) (4.45) (4.46)
Man erkennt, dass auch der Wert von α(τ ), und somit auch τ , ein Teil der Information ist, welche in einem Punkt von Ω-Diagramm gespeichert ist. F¨ ur den Fall k = 0 m¨ ussen wir unsere speziellen Formeln mit der Funktion a benutzen. Dann sind wir an der Linie ΩM + ΩΛ = 1 und es gibt zwei Teilf¨alle zu unterscheiden. Wir aber lassen diese Diskussion aus. 178
Die dynamischen Typen im Ω-Diagramm Wir haben gesehen, dass jeder Punkt des Ω-Diagramms die Werte von k und C bestimmt und so auch den dynamischen Typ des Modells. Wir wissen schon, wo im Diagramm verschiedene Werte von k liegen. Wenn wir dies also auch noch f¨ ur C herausfinden, wissen wir, wo welcher dynamischer Typ im Diagramm liegt. Das wollen wir jetzt tun. Die rekollabierenden Modelle haben einerseits C < 0 und beliebige k, andererseits C ∈ (0, 1/27) und k = 1, wenn α < αMax . Die Modelle, welche f¨ ur immer expandieren, haben C > 1/27 und k = 1, oder C > 0 und k = 0, −1. Endlich die Modelle, welche kein Big Bang haben, erf¨ ullen C ∈ (0, 1/27) und k = 1, wenn α > αMax . Wir m¨ ussen also nur die Grenze C = 1/27 im Gebiet k = 1 ermitteln, das ist, f¨ ur ΩM + ΩΛ > 1. Diese Kurve (oder Kurven) sind durch Gl. (4.44) bestimmt, welche zur Gleichung dritten Grades f¨ uhrt: 1 1 (ΩΛ + ΩM − 1)3 − ΩΛ Ω2M = 0. 27 4 Die Substitution 3x = ΩΛ + ΩM − 1 f¨ ur ΩΛ ergibt die Gleichung x3 + Ax + B = 0, mit
1 3 A := − Ω2M , B := Ω2M (ΩM − 1), 4 4 welche die kanonische Form hat, so dass die Cardanische Formel angewandt werden kann: √ A , x = 3 u− √ 33u wobei r B 2 A3 B + . u := − + 2 4 27 ¨ Im Bereich x > 0 gibt es nur zwei Aste. Der kleinere beginnt im Grenzpunkt (ΩM , ΩΛ ) = (1, 0), und ist gegeben durch x = ΩM cos ψ2 (ΩM ) f¨ ur alle Werte von ΩM ∈ (1, ∞), wobei
√ 2πn 1 2ΩM − 1 ψn (ΩM ) := − arctan . 3 3 ΩM − 1
Daraus erhalten wir: ΩΛ = 3ΩM cos
√ π 1 2ΩM − 1 + arctan − ΩM + 1. 3 3 ΩM − 1 179
Der gr¨ossere Ast beginnt im Grezpunkt (ΩM , ΩΛ ) = (0, 1) und ist, im Intervall ΩM ∈ (0, 1/2), gegeben durch 1 4/3 1 2/3 x = ΩM v 1/3 + ΩM v −1/3 , 2 2 wobei v := 1 − ΩM +
p 1 − 2ΩM .
Am Ende des Intervalls ist ΩM = 1/2 und x = 1/2, also ΩΛ = 2. Der reale Ast durch diesen Punkt im Intervall ΩM ∈ (1/2, ∞) ist: x = ΩM cos ψ0 (ΩM ). Wenn auch ψ0 springt von π/6 zu −π/6 bei ΩM = 1, cos ψ0 ist stetig. Die resultierende Karte der dynamischen Typen ist Bild 4.13. Das Alter des Alls im Ω-Diagramm F¨ ur alle Modelle mit Big Bang kann man das Alter TA als die Eigenzeit vom Big Bang, a = 0, zum heutigen Moment definieren. Beschr¨anken wir uns auf die einfachen F¨alle mit k 6= 0. Um TA zu berechnen, f¨ uhren wir zun¨achst die Funktion T (k, C, α) ein: Z α dx q T (k, C, α) := (4.47) 2 2 0 + Cx − k x im Bereich α ∈ (0, ∞) f¨ ur die ewig expandierende, und α ∈ (0, αU ) f¨ ur die rekollabierenden Modelle. T (k, C, α) ist offensichtlich ein Integral der reskalierten FriedmannLemaˆıtre-Gleichung (4.35), und wir sehen, dass αU die folgende Gleichung erf¨ ullt: 2 + CαU2 − k = 0, αU also dass das Denominator im Integral (4.47) bei α = αU divergiert (das Integral selber aber konvergiert). F¨ ur die Modelle mit ewiger Ausdehnung haben wir dann einfach TA = LT (k, C, α). F¨ ur die Modelle, die rekollabieren, gilt die gleiche Formel nur wenn α ∈ (0, αU ). Wenn aber α ∈ (αU , 2αU ), dann folgt aus der Spiegelsymmetrie um den Umkehrpunkt: TA = 2LTU − LT (k, C, α), 180
wobei TU = T (k, C, αU ). Die Information, ob man sich in (0, αU ) oder (αU , 2αU ) gibt uns sgn(H). Mit Hilfe dieser Vorzeichenfunktion k¨onnen wir eine allgemeine Formel schreiben: TA = [1 − sgn(H)]LTU + sgn(H)LT (k, C, α). Das Alter skaliert also als L, und eine praktische skalenfreie Gr¨osse ergibt sich, wenn wir TA mit der Hubble-Konstante multiplizieren. Physikalisch bedeutet das, dass man den wirklichen Alter in der entsprechenden Hubble-Zeit misst. Definieren wir also: χ := |H|TA . Einfache Berechnung ergibt: χsgn(H) (k, C, α, α0) = [1 − sgn(H)]
|α0 | |α0 | TU + sgn(H) T (k, C, α). α α
Wenn man jetzt f¨ ur die Gr¨ossen k, C, α und |α0 | aus den Gln. (4.43), (4.44), (4.45) und (4.46) eisetzt, kann man χ als eine Funktion χ± (ΩM , ΩΛ ) ausrechnen und die Kurven χ± = const im Ω-Diagramm zeichnen; das sind die sog. isochronen. Bei rekollabierenden Modellen hat man zwei Sorten von Isochronen, je eine f¨ ur ein Vorzeichen von H. Unter der Voraussetzung, das wir uns im Punkt (ΩM , ΩΛ ) befinden, und das die Hubble-Konstante einen bestimmten Wert hat, k¨onnen wir dann das Alter dieses Punktes bestimmen. Die Isochronen mit der entsprechenden Zeiten f¨ ur H = 63 sind im Bild 4.12 zu sehen.
4.4.5
Die Helligkeitsdistanz und die Messungen von Λ
Die Messungen von vielen kosmologischen Parameter, wie der Hubble-Konstante, oder des Vez¨ogerungsparameter q, braucht die Messung der Distanzen. Man muss dabei sorgf¨altig bestimmen, was man durch Distanz meint. Meisten handelt es sich um die sog. Helligkeitsdistanz. Sie kann wie folgt definiert werden. Die Definition hier ist etwas vereinfacht, einerseits im Vergleich mit den astronomischen Konventionen, andererseits aber auch im Vergleich mit einigen Kosmologen (welche die Korrekturen auf die Kr¨ ummung des Raumes in die Definition der Helligkeitsdistanz einbauen [7]). Setzen wir voraus, dass der Raum (und die Raumzeit) flach ist und dass eine Quelle der Strahlung eine totale Leistung dE/dt hat. In der Distanz R von der Quelle muss sich diese Strahlung auf die Fl¨ache 4πR2 verteilen. Nennen wir den entsprechenden Strom der Energie pro Fl¨acheneinheit scheinbare Helligkeit Ls : Ls =
dE/dt 4πR2
181
Andererseits k¨onnen wir die absolute Helligkeit La als den Energiestrom durch eine Fl¨ache mit Radius 1 (die Astronomen nehmen hier 10 Parsec) um die Quelle definieren: dE/dt La = . 4π Dann ist: r La . R= Ls
F¨ ur unsere Zwecke k¨onnen wir die Helligkeitsdistanz DL ganz allgemein durch dieselbe Formell definieren, das heisst auch im Falle des krummen und zeitabh¨angigen Raumzeit der Kosmologie: r La DL := . Ls
Bei Quellen, deren absolute Helligkeit man kennt, kann man dann einfach die scheinbare Helligkeit messen und die entsprechende Helligkeitsdistanz aus der obigen Formel berechnen. Das ist, in groben Z¨ ugen, was man auch macht. Es hat nicht viel Sinn, die Euklidische Formel f¨ ur die K¨ ummung des Raumes zu korrigieren, denn in der Robertson-Walker-Raumzeit gibt es keine eindeutige Weise die Distanz zu definieren, und es ist auch nicht n¨otig: eine Distanzfunktion, die man messen und die man aus dem Modell berechnen kann dient unseren Zwecken genausogut. Die Quellen mit bekannter absoluter Helligkeit, welche auch gen¨ ugend stark strahlen um weit beobachtbar zu sein, sind aber recht selten. Man nennt sie daher Standardkerzen der Astronomie. Die sog. Cepheiden und die Supernovae der Klasse IA sind die Standardkerzen, welche man heute mit einiger Zuversicht benutzt. Die Cepheiden sind periodisch ver¨anderliche Sternen. Es gibt eigentlich zwei Sorten davon, und nur eine ist zuverl¨assig. Wir wollen aber nicht in Einzelheiten gehen. Die Supernovae IA entstehen aus einer Art der sog. weissen Zwerge; das sind Sterne, welche schon ihren Sternenbrennstoff verbraucht haben und Masse kleiner als 1.2 Sonnenmassen haben. Solche Sterne k¨onnen sich gegen den Gravitationskollaps halten. Wenn aber ein solcher weisser Zwerg eine Komponente eines Doppelsterns ist, und vom Doppelstern zus¨atzliche Masse darauf stromt, kann diese Limesmasse von 1.2 Sonnenmassen mal u ¨berschritten werden, und der Stern beginnt zu kollabieren. Die weissen Zwerge in den Supernovae IA bestehen vorwiegend aus Kohlenstof und Sauerstof. Bei dem Kollaps wird eine Kernreaktion gez¨ undet, und zwar ziemlich gleichzeitig im ganzen Stern. Das Resultat ist eine riesige Explosion—eben die Supernova. Berechnen wir die “theoretische” Helligkeitsdistanz. Die wird vom Modell, aber auch vom Zeitpunkt der Messung im Modell und von der Rotverschiebung der Quelle abh¨angen. Setzen wir voraus, dass die Quelle sich im Punkt r = 0 und t = t1 in einem 182
Friedmann-Lemaˆıtre-Modell mit den Parametern k, L, und C befindet, der Bahn eines kosmologischen Beobachters B1 folgt, und dass sie die Leistung dE1 /dt1 hat. Die Energie pro Sekunde, welche dann am Wert r0 der Koordinate r, und der Zeit t0 von kosmologischen Beobachter B0 gemessen wird, ist zweifach rotverschoben: einereseits ist die Energie jedes einzelnen Photons rotverschoben und das f¨ uhrt zur Gleichung a1 dE0 = dE1 ; a0 andererseits ist die Zeit der Ankuft der einzelnen Photone bei dem kosmischen Beobachter B0 “blauverschoben”. Wenn n¨amlich die Zeiten t0 und t1 durch Lichtstrahlen verbunden werden, so dass t0 (t1 ) die Ankunftzeit eines Lichtstrahls beim kosmischen Beobachter B0 bedeutet, wobei t1 die Sendezeit beim Beobechter B1 ist (Bild 4.3), dann gilt es: a0 dt0 = dt1 . a1 a0 , bzw. a1 sind die Werte des Skalenfaktors in der Zeitaugenblicks des Empfangens, bzw. Sendens (Aufgabe). Das heisst also: 2 a1 dE0 /dt0 = (dE1 /dt1 ). a0 Diese Leistung muss sich auf der Fl¨ache 4πa20 r02 verteilen, und so erhalten wir f¨ ur die scheinbare Helligkeit 2 dE1 /dt1 a1 . Ls = a0 4πa20 r02 Es ergibt sich also die einfache Formell: DL = a 0 r 0
a0 . a1
(4.48)
Wir ersehen daraus, dass DL mit der Potenz 1 von L skaliert. Die entsprechende skalenfreie Gr¨osse dL ist dann definiert durch (wir setzen voraus, dass H >=) dL := HDL , oder dL = α00 r0
α0 . α1
Die rechte Seite soll noch durch die Ω-Parameter und z ausgedr¨ uckt werden. a1 kann mit Hilfe der Rotverschiebung z und des Skalenfaktors a0 ausgedr¨ uckt werden: a0 . a1 = 1+z 183
F¨ ur die Ausbreitung des Lichtes gelten die Formel des Abschnitts u ¨ber die Horizonte: r0 = Sk (η0 − η1 ), wobei S−1 (η) = sinhη, S0 (η) = η und S1 (η) = sinη, und η0 − η 1 =
Z
t0 t1
dt . a
Das Integral kann durch die Substitution t = Lτ auf die Form gebracht werden: Z t0 Z τ0 dt dτ = . α t1 a τ1 Die Werte von τ h¨angen mit denjenigen von α, k und C durch die Funktion T (k, C, α) zusammen, welche im vorigen Abschnitt definiert wurde. Zum Beispiel, α0 τ1 = T (k, C, α1 ) = T k, C, . 1+z Auf diese Weise k¨onnen wir die Grenzen des Integrals berechnen. Im Integrand m¨ ussen wir die Funktion α(τ ) durch die Umkehrung der Funktion T (k, C, α) in Bezug auf α gewinnen. Das f¨ uhrt zur Funktion der skalenfreien Helligkeitsdistanz 0 dL von den Gr¨ossen α0 , α0 , z, k und C. Diese lassen sich durch ΩM , ΩΛ und z ausdr¨ ucken; so erhalten wir die theoretische Funktion dL (ΩM , ΩΛ , z). Wenn man eine Messung mit einer Quelle macht, bekommt man die zwei Werte z und dL . Die theoretische Funktion dL (ΩM , ΩΛ , z) ergibt dann eine Beziehung zwischen ΩM und ΩΛ , und diese kann als eine Kurve im Ω-Diagramm eingetragen werden. Mehrere Messungen ergeben mehrere Kurven, welche dann ein l¨angliches Gebiet im Diagramm ergeben. Ein Beispiel davon gibt das Bild 4.13. Weitere unabh¨angige Messunge und Voraussetzungen u ¨ber die detailierte Struktur der Fl¨ache der letzten Streuung ergeben, dass ΩK ≈ 0. Daraus und aus der obigen Messungen resultieren die Werte: 1 ΩM 0 ≈ , 3
2 ΩΛ0 ≈ . 3
Das sind die Werte, welche man heute als g¨ ultig annimmt. Es folgt, dass wir in der Λ-dominierten Phase eines Modells mit ewiger Ausdehnung leben, und dass wir schon einige Zeit eine beschleunigte Ausdehnung durchmachen. 184
4.4.6
Die Friedmann-Modelle
In diesem Abschnitt kommen wir zum Spezialfall Λ = 0, und wir betrachten nicht nur die staubdominierten Modelle (p = 0), aber auch die von Strahlung dominierten (p = ρ/3). Sie beschreiben die kosmologische Entwicklung im Falle, dass der ΛTerm gegen¨ uber den M -Term und den K-Term vernachl¨assigbar ist. Diese Modelle dienten fr¨ uher als das sog. Standardmodell, sie haben aber nicht nur eine historische Bedeutung. Die Gln. (4.30) und (4.32) haben in diesem Fall die folgenden exakten L¨osungen: 1. k = 1. Staub:
Strahlung:
a = GM (1 − cos η),
(4.49)
t = GM (η − sin η).
(4.50)
q √ a = t(2 2GK − t).
(4.51)
Das ist das geschlossene Friedmann-Modell. Es beginnt durch einen Big Bang mit t = 0, a = 0 und a0 = ∞, erreicht den maximalen Radius aU bei tU und schrumpft dann bei tEnd zu a = 0 und a0 = −∞ (Bild 4.14). Die Werte sind in der folgenden Tabelle widergegeben: Material Staub Strahlung
tU πGM √ 2GK
2. k = 0. Staub: a= Strahlung:
aU 2GM √ 2GK
3t √ 2GM 2
2/3
tEnd 2πGM √ 2 2GK
.
(4.52)
q √ a = 2t 2GK.
(4.53)
a = GM (coshη − 1),
(4.54)
Das ist das sog. Einstein-DeSitter-Modell. Es hat flache r¨aumliche Hyperfl¨achen, beginnt mit einem Big Bang bei t = 0, a = 0 und a0 = ∞ und dehnt sich f¨ ur immer aus bis zu t = ∞, a = ∞ und a0 = 0 (Bild 4.15). 3. k = −1. Staub: t = GM (sinhη − η). 185
(4.55)
Strahlung:
q √ a = t(t + 2 2GK).
(4.56)
Das ist das offene Modell von Friedmann. Es beginnt mit einem Big Bang bei t = 0, a = 0 und a0 = ∞, und dehnt sich f¨ ur immer aus bis zu t = ∞, a = ∞ 0 und a = 1 (Bild 4.15). Die Modelle mit k = +1, −1 bilden eine √ Ein-Parameter-Familie (eigentlich je eine Skalenklasse—die Skalen sind GM oder GK), wogegen die mit k = 0 nur eine Raumzeit ist (eine Skalentransformation von a wird durch eine Koordinatentransformation geschluckt).
4.5
Raumzeiten mit h¨ ochster Symmetrie
Wenn es keine Materie gibt (z. B. M = 0 in den Staubmodellen) und die kosmologische Konstante beliebig ist, erhalten wir die Raumzeiten mit h¨ochster Symmetrie. In diesem Fall haben wir ρ = p = 0, die Gleichung (4.24) wird identisch erf¨ ullt und die Gleichungen (4.22) und (4.23) vereinfachen sich zu Λ a, 3
(4.57)
Λ 2 a = −k. 3
(4.58)
a00 = a02 −
F¨ ur Λ 6= 0 erhalten wir aus (4.57) r ! r ! Λ Λ a = c+ exp t + c− exp − t , 3 3
(4.59)
und aus (4.58) 4Λ c+ c− = k. (4.60) 3 Gl. (4.60) bedeutet, dass nur eine Integrationskonstante beliebig ist, und die Invarianz der Gleichungen (4.57) und (4.58) in Bezug auf die Zeitverschiebung t → t + t1 erlaubt uns, durch diese Konstante den Ursprung der Zeit t festzulegen. Je nach dem Wert von Λ unterscheiden wir drei F¨alle.
4.5.1
Minkowski-Raumzeit
Setzen wir Λ = 0. Dann folgt aus (4.58), dass k = 0 oder k = −1. F¨ ur k = 0 erhalten wir a =const; die Robertson-Walker-Metrik wird zu ds2 = dt2 − a2 (dr 2 + r 2 dΩ2 ). 186
Das ist die Minkowskische Raumzeit, wo die IS-Koordinaten xµ auf folgende Weise transformiert werden x0 = t, xk = arnk , wobei nk durch die Beziehung (4.5) gegeben ist. F¨ ur k = −1 ergibt Gl. (4.58) a0 = ±1, also a = ±t, und die Robertson-WalkerMetrik heisst dr 2 2 2 2 2 2 + r dΩ . ds = dt − t 1 + r2
Das ist die Metrik im Inneren des Lichtkegels vom Ursprung in der Minkowskischen Raumzeit: transformieren wir die IS-Koordinaten xµ wie folgt √ x0 = t 1 + r 2 , xk = trnk ;
f¨ ur t > 0 (t < 0) bedecken die Koordinaten t, r, ϑ und ϕ nur das Innere des Zukunftslichtkegels (Vergangenheitsichtkegels), da (x0 )2 − ~x · ~x = t2 > 0. Die Pseudokugeln sind also die Fl¨achen des konstanten Minkowski-Abstands vom Ursprung. Diese Raumzeit wird manchmal Milne-Modell genannt (Bild 4.15).
4.5.2
DeSitter-Raumzeit
Die DeSitter-Raumzeit spielt eine Rolle in der Inflations¨ara der Kosmologie, sie ist wohl auch die Geometrie, zu welcher unsere Raumzeit konvergiert f¨ ur sp¨ate Zeiten und ist ausserdem ein beliebtes Spielzeug der theoretischen Physiker. Wir wollen auch deshalb ihre Geometrie etwas eingehender untersuchen. q
Λ Jetzt setzen wir also Λ > 0 und f¨ uhren die Bezeichnung H = ein. Die 3 Exponenten in (4.59) sind reell, und die Gleichung (4.60) hat die reellen L¨osungen c+ und c− f¨ ur alle drei M¨oglichkeiten k = −1, 0, 1. Beginnen wir mit k = 1 und w¨ahlen z.B. c+ = c− = 1/(2H), dann erhalten wir
a = H −1 cosh(Ht); die Integrationskonstante ist so gew¨ahlt, dass bei t = 0 der minimale Radius erreicht wird. Die Robertson-Walker-Metrik (4.12) hat dann die Form cosh2 (Ht) dr 2 2 2 2 2 2 2 + r (dϑ + sin ϑdϕ ) . (4.61) ds = dt − H2 1 − r2 Die Koordinaten haben die Bereiche t ∈ (−∞, ∞), r ∈ [0, 1) und (ϑ, ϕ) ∈ S 2 (und bedecken so nur eine H¨alfte der Raumzeit). Die ganze Raumzeit (bis auf Polen) 187
bekommt man, wenn man anstatt r die Koordinate χ := arcsinr einf¨ uhrt; χ ∈ (0, π) f¨ ur die ganze DeSitter-Raumzeit, und wir erhalten die Metrik: cosh2 (Ht) 2 dχ + sin χ(dϑ2 + sin2 ϑdϕ2 ) . 2 H Die Raumzeit mit der Metrik (4.61) heisst DeSitter-Raumzeit. Die exponentielle Ausdehnung zeigt einmal mehr, wie instabil die Gravitation ist. Es entsteht beliebig viel Raum mit einer konstanten Energiedichte! Den Gang des Lichtes (kausale Struktur) der DeSitter-Raumzeit k¨onnen wir durch eine konforme Deformation herausbringen: wir schreiben die Metrik in der Form ds2 = dt2 −
cosh2 Ht 2 2 2 2 dη − dχ − sin χdΩ , H2 Z Hdt η= = arctan sinh Ht. cosh Ht
ds2 = wobei Es folgt, dass
sinh Ht = tan η
cosh Ht =
1 1 , t = arcsinh tan η. cos η H
und
1 arcsinh tan η. H Mit t ∈ (−∞, ∞) l¨auft η im Intervall (−π/2, π/2). Die Lichtkegel der Punkte mit r = 0 und η = ±π/2 (Horizonte) sind gegeben durch (siehe auch die Tabelle auf S. 164): η0 = ±π/2, χ = ±(η ∓ π/2). t=
Das Bild 4.16, das die kausale Struktur der DeSitter-Raumzeit veranschaulicht, ist nach einer oft benutzten Methode erarbeitet; diese Methode gilt praktisch nur f¨ ur rotationssymmetrische Raumzeit, aber das sind beinahe alle in diesem Skript! Jeder Punkt im Bild repr¨asentiert eine Kugeloberfl¨ache (S 2 ) mit Radius sin χ. Lichtartige kugelsymmetrische Hyperfl¨achen (Lichtkegel der Punkte mit r = 0) werden durch Geraden der Neigung 1 dargestellt, also χ = ±(η − η0 ). Wie lernen sp¨ater noch viele solche Diagramme kennen. Sie heissen Penrose-Diagramme. Die Horizonte kreuzen einander bei η = 0, r = 1. Berechnen wir die Metrik auf einem solchen Horizont; als Koordinaten entlang der Horizonte nehmen wir die Funktionen η, ϑ und ϕ; die Einbettungsfunktionen sind 1 arcsinh tan η, H χ = ±η − π/2, t =
θ = ϑ,
φ = ϕ. 188
Dann haben wir ds2 = −H −2 dΩ2 . Diese Metrik ist also degeneriert, denn die Koordinaten auf der Fl¨ache sind η, ϑ und ϕ, aber die Metrik enth¨alt nur zwei Terme, ein mit dϑ und ein anderer mit ϕ. Eine solche Hyperfl¨ache heisst lichtartig (wir werden eine richtige Definition und Eigenschaften im n¨achsten Kapiten geben). Die r¨aumlichen Schnitte η =const des “Kegels” sind Kugeloberfl¨achen mit einem konstanten Radius 1/H! Die DeSitter-Raumzeit kann als eine 4-dimensionale Hyperfl¨ache in einer 5-dimensionalen Minkowski-Raumzeit veranschaulicht werden. Die Metrik der Einbettungsraumzeit lautet dS 2 = dT 2 − dU 2 − (dX 1 )2 − (dX 2 )2 − (dX 3 )2 ,
(4.62)
und die Gleichung der Hyperfl¨ache, T 2 − U 2 − (X 1 )2 − (X 2 )2 − (X 3 )2 = −H −2 ,
(4.63)
ist durch die Endpunkte raumartiger Radiusvektoren mit der gleichen L¨ange H −1 beschrieben (Bild 4.17). Sie hat also eine hohe Symmetrie: Die ganze “LorentzGruppe” der 5-dimensionalen flachen Raumzeit (4.62). Eine solche Raumzeit enth¨alt 10 aufeinander senkrechte 2-Fl¨achen, die Gruppe hat also 10 Generatoren (10 Dimensionen). Davon sind 4 Boosts und 6 Drehungen. Man bezeichnet diese Gruppe durch SO(1, 4) und nennt sie DeSitter-Gruppe. Wir wollen zeigen, dass die induzierte Metrik auf dem Hyperboloid (4.63) mit (4.61) u ¨ bereinstimmt. Das machen wir so, dass wir herausfinden, in welchem Punkt (T, U, X k ) des Einbettungsraumes jeder Punkt (t, r, ϑ, ϕ) kommen kann. Das sind die sog. Einbettungsformeln, T = T (t, r, ϑ, ϕ),
U = U (t, r, ϑ, ϕ),
X k = X k (t, r, ϑ, ϕ).
Die (t=const)-Fl¨achen der DeSitter-Raumzeit sind 3-Sph¨aren; solche ergeben sich als Schnitte des Hyperboloids mit den Ebenen T = const. Versuchen wir also T = T (t), oder besser T = H −1 f (t) (4.64) mit einer vorerst unbekannten Funktion f (t). Welche Geometrie haben dann die Schnitte? Dazu setzen wir f¨ ur T Gl. (4.64) in die Gleichung des Hyperboloides (4.63), und erhalten U2 +
X
X k X k = H −2 (1 + f 2 (t)).
k
189
(4.65)
p Das ist die Gleichung einer 3-Sph¨are mit dem Radius H −1 1 + f 2 (t). Die Einbettungsformeln f¨ ur die 3-Sph¨are, welche den r¨aumlichen Teil der Metrik (4.61) ergeben, kennen wir aber: das sind die Gln. (4.4) mit U = X 4 , wobei einerseits a(t) =
cosh(Ht) H
sein muss, damit man (4.61) bekommt, andererseits p a(t) = H −1 1 + f 2 (t), √ U = ±a(t) 1 − r 2 , X k = a(t)rnk ,
um die Gleichheit (4.65) zu erreichen. Dass l¨asst sich machen: f (t) = sinh(Ht). Alles zusammen f¨ uhrt zu T = H −1 sinh(Ht), √ U = ±H −1 1 − r 2 cosh(Ht),
X k = H −1 rcosh(Ht)nk .
Das Vorzeichen “+” (“−”) ergibt die rechte (linke) H¨alfte des Hyperboloides (Bild 4.17). Aus der Herleitung ist klar, dass diese Funktionen die Gleichung (4.63) f¨ ur alle Werte von t, r, ϑ und ϕ erf¨ ullen, und Einsetzen dieser Funktionen in (4.62) ergibt (4.61). Wenn wir die Gleichungen der Horizonte, t = H −1 arcsinh tan η,
r = cos η,
in die Einbettungsformel einsetzen, erhalten wir T = H −1 tan η, U = ±H −1 tan η,
X k = H −1 nk .
Die Horizonte sind also die Schnitte des Hyperboloids mit den lichtartigen Ebenen T ∓ U = 0 (Bild 4.17). Die Gleichung (4.60) erlaubt auch k = 0. Das wird also zu einer Foliation der DeSitter-Raumzeit mit Euklidischen Ebenen f¨ uhren, was f¨ ur manche Anwendungen g¨ unstig ist. Wir w¨ahlen c− = 0 und c+ = 1/H, so dass a = H −1 eHt , 190
und die Robertson-Walker-Metrik heisst ds2 = dt2 − H −2 e2Ht (dr 2 + r 2 dΩ2 ).
(4.66)
F¨ ur diese Metrik haben wir offensichtlich: a0 =H a und die Hubble-Konstante ist wirklich konstant. Als n¨achstes zeigen wir die Richtigkeit folgender Behauptung: Die Einbettungsformeln, welche diese Metrik auf dem Hyperboloid ergeben, erhalten wir, wenn wir es durch die Familie der lichtartigen Ebenen T − U = ±H −1 eHt schneiden (Bild 4.17); jede Ebene ist durch ein konstantes t definiert. Als t ∈ (−∞, ∞), laufen diese Ebenen von T − U = 0 zu T − U = ±∞. Wir setzen weiter (inspiriert durch Gl. (4.66)) r X k = eHt nk H und erhalten aus Gl. (4.63): T +U =±
1 2 Ht (r e − e−Ht ). H
Das ergibt die Einbettungsformeln; die resultierende Metrik stimmt wirklich mit (4.66) u ¨berein. Man sieht, dass die Schnittfl¨achen E3 sind, und dass sie im Limes t → −∞ zum Horizont mit T − U = 0 konvergieren. Dieser bildet auch die Grenze des Gebietes in der DeSitter-Raumzeit, die mit diesen Kordinaten bedeckt sind (eine H¨alfte!). Gl. (4.60) erlaubt auch k = −1, was zur Foliation von der DeSitter-Raumzeit mit Pseudosph¨aren f¨ uhrt. Dazu w¨ahlen wir c+ = −c− , c+ = 1/(2H), so dass a = H −1 sinh(Ht), und
1 dr 2 2 2 2 ds = dt − 2 sinh (Ht) + r dΩ . H 1 + r2 2
2
(4.67)
Die Einbettungsformeln, welche diese Metrik ergeben, erhalten wir auf dem Hyperboloid, wenn wir es mit den zeitartigen Ebenen U=
1 cosh(Ht) H 191
schneiden (Bild 4.17); wieder ergibt sich f¨ ur jedes t ∈ (0, ∞) eine Ebene. Wenn wir setzen r sinh(Ht) k Xk = n , H erhalten wir aus Gl. (4.63) 1√ 1 + r 2 sinh(Ht), T = H und nach einiger Berechnung die Metrik (4.67). Diese Metrik bedeckt ein Gebiet am Hyperboloid, das von Lichtkegel T 2 − (X 1 )2 − (X 2 )2 − (X 3 )2 = 0 des Punktes mit T = X k = 0 in der Ebene U = 1/H der f¨ unfdimensionalen Raumzeit begrenzt ist. Diese Ebene ist die gew¨ohnliche Minkowski-Raumzeit mit Koordinaten T und X k und der Metrik dS 2 = dT 2 − dX k dX k . Der obige Lichtkegel liegt auch auf dem Hyperboloid und ist dort auch ein Lichtkegel, n¨amlich der des Punktes P mit U = H −1 und T = X k = 0. Bemerke, dass dieser Lichtkegel von P als Schnitt des Hyperboloids mit der Ebene entsteht, welche tangential zum Hyperboloid in P ist. Da alle Punkte vom Hyperboloid durch die Symmetrie aus P erhalten werden k¨onnen, wobei das Bild einer Tangentialebene tangential bleibt, resultiert eine ganz allgemeine Aussage: der Lichtkegel eines beliebigen Punktes Q auf dem Hyperboloid ist der Schnitt des Hyperboloids mit der Ebene, welche tangential zum Hyperboloid in Q steht. Dieser Fakt, dass es Teile von DeSitter-Raumzeit gibt, die Robertson-WalkerRaumzeiten zu jedem Wert von k darstellen, hat die folgende Bedeutung: Jeder kTyp von Robertson-Walker-Raumzeit kann die DeSitter-Raumzeit als Limes haben, gegen welchen sie f¨ ur t → ∞ strebt. Ein noch anderes aber sehr wichtiges Koordinatensystem auf der DeSitter-Raumzeit erhalten wir wie folgt. Betrachten wir die Ebenen T cosh τ − U sinh τ = 0 f¨ ur alle konstanten τ ; das sind (T, U )-Boosts der Ebene T = 0 (Bild 4.17); das heisst, die Schnittebenen τ = const werden ineinander durch eine Untergruppe der Symmetriegruppe des Hyperboloids gebracht. Die obige Gleichung kann durch 1p T = 1 − ρ2 sinh τ, (4.68) H 1p U = 1 − ρ2 cosh τ (4.69) H befriedigt werden, wobei wir eine weitere Koordinate ρ eingef¨ uhrt haben. Gl. (4.63) ergibt ρ2 ~ ~ X · X = 2, H 192
also
ρ k n . H Das Einsetzen von Gln. (4.68), (4.69) und (4.70) in (4.62) f¨ uhrt zu dρ2 1 2 2 2 2 2 − ρ dΩ . ds = 2 (1 − ρ )dτ − H 1 − ρ2 Xk =
(4.70)
Das ist eine statische Metrik! Sie ist singul¨ar bei ρ = 1, und die Koordinatenbereiche τ ∈ (−∞, ∞), ρ ∈ (0, 1) und (ϑ, ϕ) ∈ S 2 bedecken den Quadranten I des DeSitterRaumzeit (Bild 4.16).
4.5.3
Anti-DeSitter-Raumzeit q
Λ Wir setzen Λ < 0 und definieren die Konstante H durch = iH, H > 0. Die 3 ∗ L¨osung (4.59) ist nur reell, wenn c− = c+ , so dass (4.60) nur f¨ ur k = −1 eine L¨osung besitzt. Sie lautet a = H −1 cos(Ht),
wo wir diesmal den maximalen Skalenfaktor dem Wert t = 0 zugeordnet haben. Die Metrik (4.12) wird dann zu dr 2 2 2 2 2 2 2 −2 2 + r (dϑ + sin ϑdϕ ) . (4.71) ds = dt − H cos (Ht) 1 + r2 Das ist die Metrik der sog. Anti-DeSitter-Raumzeit. Die Metrik ist regul¨ar in einem endlichen Intervall Ht ∈ − π2 , π2 . Diese Metrik k¨onnen wir als die einer hochsymmetrischen Hyperfl¨ache finden. Der Einbettungsraum ist 5-dimensional, mit der Metrik (flach) dS 2 = dT 2 + dU 2 − (dX 1 )2 − (dX 2 )2 − (dX 3 )2 ,
(4.72)
und die Gleichung der Hyperfl¨ache ist T 2 + U 2 − (X 1 )2 − (X 2 )2 − (X 3 )2 = H −2
(4.73)
(Bild 4.18). Die Symmetriegruppe dieser Hyperfl¨ache ist wieder 10-dimensional. Es ist die “Drehgruppe” um den Ursprung im Raum mit der Metrik (4.72). Sie heisst Anti-DeSitter-Gruppe und wird durch das Symbol SO(2, 3) bezeichnet. Die Metrik (4.71) erhalten wir, wenn wir das Hyperboloid mit den Ebenen T = const schneiden. Die entsprechenden Einbettungsformeln lauten: T = H −1 sin(Ht), √ U = H −1 1 + r 2 cos(Ht), X k = H −1 rcos(Ht)nk . 193
(4.74) (4.75)
Die Koordinaten t, r, ϑ und ϕ bedecken nur das Intervall T ∈ [− H1 , H1 ]. Wir wollen also diese Formeln nur im entsprechenden Intervall −
π π
(4.76)
π sind gegeben durch T = gelten lassen, wo auch a 6= 0. Die Hyperfl¨achen t = ± 2H −1 ±H im Einbettungsraum (Bild 4.18). Wenn wir diese Werte in (4.73) einsetzen, erhalten wir als Grenzen des Gebietes (4.76) die folgenden Lichtkegelh¨alften in den Hyperebenen T = ±H −1 :
U 2 − (X 1 )2 − (X 2 )2 − (X 3 )2 = 0,
T = ±H −1 ,
U > 0.
(4.77)
Wiederum sind die Ebenen T = ±H −1 Minkowskische Raumzeiten und die Schnittfl¨achen mit dem Hyperboloid die Lichtkegel in diesen Raumzeiten (das Innere ist, wo |U | > |X| gilt!); diese Schnittfl¨achen liegen auch auf dem Hyperboloid und spielen dort die Rolle der Lichtkegel der Punkte mit T = ±H −1 und U = X k = 0. Und wiederum gilt ein analoger Satz u ur den Lichtkegel eines ¨ber die Schnittfl¨ache f¨ allgemeinen Punktes, wie im Fall des DeSitter-Raumes. π schneiden alle t-Kurven einander in den Spitzen U = X k = Im Limes t → 2H 0 dieser Lichtkegel, und das ist die Ursache, warum a verschwindet (Bild 4.18). Das besagen die Gln. (4.74) und (4.75). Die Koordinaten t, r, ϑ und ϕ bedecken also nur den Teil des Hyperboloids (4.73), der zwischen den zwei Lichtkegeln (4.77) liegt. Bemerken wir, dass die Hyperfl¨achen t = const, wobei die Konstante zwischen den Schranken (4.76) liegt, vollst¨andige Pseudosph¨aren sind, welche nie von den Lichtkegeln der Punkte (±H −1 , 0, 0, 0) geschnitten sind. Aber der Hyperbolloid ist noch nicht die ganze Anti-DeSitter-Raumzeit! Bemerken wir, dass die Einbettung zur Existenz von geschlossenen zeitartigen Kurven f¨ uhrt (Akausalit¨at!). Das ist nur eine Eigenschaft dieser Einbettung. Wir k¨onnen diesen Hyperbolloid so transformieren, dass sie beseitigt wird. F¨ uhren wir zun¨achst andere Koordinaten auf dem Hyperboloid ein, welche das ganze bedecken; wir versuchen die Ebenen T cos τ − U sin τ = 0: T =
sin τ , H cos χ
U=
cos τ , H cos χ
wobei τ ∈ (0, 2π) und χ ∈ [0, π/2). Dann ist T 2 + U2 =
H2
1 cos2 χ
und Gl. (4.73) ergibt: Xk =
tan χ k n , H 194
Die Metrik in diesen Koordinaten lautet: dτ 2 dχ2 1 2 2 2 − − tan χdΩ . ds = 2 H cos2 χ cos2 χ
(4.78)
Das ist eine statische Raumzeit; der Hyperboloid ergibt sich, wenn man τ periodisch macht, d.h., wenn man die Punkte mit τ = 0 und die mit τ = 2π miteinander identifiziert. Das brauchen wir aber mit der Metrik (4.78) nicht zu machen; stattdessen definieren wir: die ganze Anti-DeSitter-Raumzeit ist gegeben durch die Metrik (4.78) mit den Koordinatenbereichen τ ∈ (−∞, ∞), χ ∈ [0, π/2) und (ϑ, ϕ) ∈ S 2 . Das ist dann eine kausale Raumzeit. F¨ uhren wir die folgende konforme Deformation ein: ds2 =
2 1 2 2 2 dτ − dχ − sin χdΩ . H 2 cos2 χ
Die letzten zwei Terme in der Klammer ergeben die Metrik auf einer dreidimensionalen Kugeloberfl¨ache (S 3 ) (vergleiche Gl. (4.6)) aber χ ∈ [0, π/2) ist nur eine halbe 3-Sph¨are, gerade vom Pol zum Aequator. Die Raumzeit hat also eine zeitartige Grenze, f¨ ur jedes konstane τ eine 2-Sph¨are, n¨amlich der Aequator der 3-Sph¨are τ = const. Betrachten wir das Penrose-Diagramm (Bild 4.19) dieser Raumzeit. Dazu brauchen wir die konformdeformierte Metrik ds2 = dτ 2 − dχ2 − sin2 χdΩ2 . Die Hyperfl¨ache τ = 0 liegt zwischen zwei Lichtkegeln L1 und L2 , welche asymptotisch dazu sind; L1 ist durch χ = τ + π/2 und L2 durch χ = −τ + π/2 gegeben. Das ergibt f¨ ur T : 1 1 sin τ =± . T = H cos(±τ + π/2) H Diese zwei Lichtkegel heissen Cauchy-Horizonte der Hyperfl¨ache τ = 0.
4.6
Das fru ¨ he Welttall
(Englisch “early Universe”). Moderne Kosmologie heisst manchmal auch “Big-BangKosmologie”, denn der Big Bang ist ein dominierender Zug davon und eine sehr gut bew¨ahrte Voraussetzung. Man u ¨berlegt also gerne, wie unser Weltall h¨atte beginnen k¨onnen und was war die Ursache f¨ ur diese Riesenexplosion. Einen Anlass zu diesen Ueberlegungen gibt auch die Tatsache, dass der entsprechende Lemaˆıtre-FriedmannModell in mehreren Aspekten zu sehr speziellen Anfangsbedingungen f¨ uhrt. Das sind die sog. Probleme der speziellen Anfangsbedingungen: 1. Horizonte, 2. Flachheit und 3. Entropie. Wir beschreiben diese Probleme der Reihe nach. 195
4.6.1
Horizontproblem
Die kosmische Hintergrundstrahlung hat heute eine vernachl¨assigbare Wechselwirkung mit dem Rest der Materie (Wasserstoffgas ist durchsichtig...); sie bildet also eine abgeschlossene Komponente des ganzen Systems. F¨ ur die Strahlung im Gleich4 gewicht gilt das Stefan-Boltzmann-Gesetz, ρstrahl ∼ Tstrahl ; das f¨ uhrt, zusammen −4 mit der Gleichung ρstrahl = (3K/4π)a zur Beziehung Tstrahl a = const. Daraus und aus dem Wert der heutigen Temperatur schliessen wir, dass bei aR = 1500−1 a0 die Temperatur der Strahlung die sog. Rekombinationstemperatur TR = 4500 0 K erreicht hat, bei welcher das Wasserstoff ionisiert wird. Ueber TR haben wir ein undurchsichtiges Gemisch von Protonen und Elektronen—Plasma. Die Hyperfl¨ache t = tR ist dann die sog. Fl¨ache der letzten Streuung. Die kosmische Hintergrundstrahlung, welche heute zu uns kommt, stammt von einem Teil der Fl¨ache der letzten Streuung; bezeichnen wir das Volumen dieses Teils der Fl¨ache durch VR0 und sein Radius durch RR0 . Von der anderer Seite kommen die Teilchenhorizonte zur Fl¨ache. Definieren wir den Horizontradius RH (t) als Radius des Volumens, der einen Teilchenhorizont in der Fl¨ache t =const schneidet. Eine einfache Berechnung ergibt, dass RH (tR ) RR0 ; Die Berechnung basiert auf der Voraussetzung, dass der strahlugsdominierte Friedmannmodell eine gute N¨aherung f¨ ur die Periode vor der Rekombination ist. Das bedeutet: wenn das Friedmannmodell bis zum Anfang gilt, dann haben die Teilchen in verschiedenen Teilen von VR0 keine M¨oglichkeit miteinander zu wechselwirken. Wie haben sie aber “erfahren”, dass sie alle die gleiche Temperatur haben sollen? Dieses Problem kann dann nur durch eine sehr spezielle Anfangsbedingung gel¨ost werden, und das ist etwas unangenehm!
4.6.2
Flachheitsproblem
Die Werte, welche wir f¨ ur den Parameter ΩM erhalten, wenn wir ihn direkt messen, liegen etwa im Intervall (0.2–4). Das ist recht nahe am Wert 1. Das Verhalten der Friedmann-Lemaˆıtre-Modells zeigt aber eine starke Instabilit¨at von ΩM : sobald k 6= 0, l¨auft ΩM mit der Zeit sehr schnell weg vom Wert 1. Das ¨aussert sich auch im Ω-Diagramm durch die Unstetigkeit verschiedener Eigenschaften in der N¨ahe von ΩK = 0. Um diese Instabilit¨at zu illustrieren, beschr¨anken wir uns auf ein besonders einfaches Beispiel: ein strahlungdominiertes Friedmann-Modell. F¨ ur alle anderen Modelle 196
sind ¨ahnliche Ergebnisse g¨ ultig, aber schwieriger zu erhalten. Der Skalenfaktor f¨ ur alle k ist (Gln. (4.51), (4.53), (4.56)) q √ a = t(2 2GK − kt);
die Definition von ΩM liefert (Gl. (4.42)): ΩM =
ρ 2GK = 2 02 . ρc aa
Einfache Berechnung ergibt: ΩM (t) =
t 1 − k√ 2GK
−2
.
Man sieht, dass ΩM f¨ ur alle k bei 1 beginnt, aber schnell davon wegl¨auft, wenn k 6= 0. Setzen wir voraus, dass k = −1, dann ergibt die Bedingung ΩM > 1/5: √ 1017 < 5, 1+ √ 2GK wobei wir benutzt haben, dass t0 = 1010 J oder t0 = 1017 s = 1025 m. Dann √ √ muss 17 2GK > 10 s. Somit sollte schon am Anfang feststehen, dass der Wert von 2GK vergleichbar mit dem heutigen Alter des Weltalls ist. Das mutet etwas unnat¨ urlich, −33 damals w¨ urde sich eher die Planck-Zeit 10 s als nat¨ urliche Vergleichzeit. Man musste also wieder am Anfang schon wissen, dass aus dem Keim einmal ein grosser Kosmos wird. Es w¨are angenehmer, wenn sich der grosse Wert von K durch irgendein nat¨ urlicher Prozess selber ergibt.
4.6.3
Entropieproblem
Die Entropie Sstrahl der Strahlung im mitbewegten Volumen a3 betr¨agt (die Boltzmann-Konstante ist gleich 1 gesetzt) Sstrahl =
4 a3 ρ . 3 T strahl
Wenn man die heutigen Werte (Temperatur der Hintergrundstrahlung und a0 ) einsetzt, erh¨alt man einen riesigen Wert Sstrahl = 2 × 1087 . Wenn wir die Anzahl Baryonen im gleichen Volumen absch¨atzen, dann kommen wir auf eine Entropie pro Baryon von etwa 109 . Wir leben also in einem heissen Weltall. Diese Zahlen bleiben konstant mit der Zeit, da alle Prozesse adiabatisch laufen. Woher kam so viel W¨arme am Anfang? 197
4.6.4
Inflationstheorie
Eine der wichtigen Spekulationen, die im Umlauf ist und von welcher man glaubt, dass sie diese Probleme l¨osen k¨onnte, ist die sog. Inflationstheorie. Es gibt mehrere Versionen der Inflationstheorie (“alte”, “neue”, “chaotische”, usw.). Wir wollen nur eine sehr kurze vereinfachte Darstellung geben, wobei wir nur die (f¨ ur alle der Versionen g¨ ultigen) Grossenordnungen absch¨atzen. Die Idee basiert auf dem DeSitterModell: der Skalenfaktor w¨achst exponentiell und die Dichte bleibt dabei konstant! Innerhalb kurzer Zeitintervalle kann man so aus einem mikroskopischen St¨ uck Materie ein makroskopisches gewinnen. (Die Energie ist dabei erhalten; die notwendige Arbeit wird durch den negativen Druck und die Gravitation geleistet.) Man spekuliert, dass die Materie durch die sog. GUT-Theorie bei hohen Temperaturen beschrieben wird. Das ist eine Vereinigung der starken und der elektroschwachen Wechselwirkungen, wobei alle Yang-Mills-Felder zu einer einzigen grossen Gruppe geh¨oren. Diese Gruppe kann auch zwischen den Sektoren transformieren, d.h., die Leptonen in die Quarks, usw. Bei den niedrigen Temperaturen, welche heute herrschen, ist das nicht so, die starken Wechselwirkungen haben “ihre” Gruppe, SU (3), und die elektroschwachen U (1) × SU (2). Es musste also ein Phasen¨ ubergang 15 kommen, bei der kritischen Temperatur Tc ≈ 10 GeV. Das alte, symmetrische Vakuum wird durch das neue, weniger symmetrische ersetzt. Es sollte ein Phasen¨ ubergang der ersten Art sein, mit viel latenter W¨arme und der M¨oglichkeit, dass das alte metastabile Vakuum noch einige Zeit bei der niedrigeren Temperatur “unterk¨ uhlt” bleiben kann ehe es zerf¨allt. (Die latente W¨arme eines Phasen¨ uberganges I. Art ist die W¨armeenergie, welche man braucht, um 1 Kg Material bei der Temperatur des Ueberganges in die andere Phase bei der gleichen Temperatur zu u uhren. Zum ¨berf¨ 0 Beispiel braucht man endliche W¨armeenergie, um 1 Kg Eis von 0 C in 1Kg Wasser von 0 0 C zu verwandeln.) Die kritische Temperatur Tc w¨are im strahlungsdominierten Friedmann-Modell etwa um die Zeit tc = 10−35 s erreicht. Wenn man annehmen darf, dass dass alte Vakuum noch etwa ∆t = 10−33 s bleibt, k¨onnten viele Probleme gel¨ost werden. In ¨ dieser kurzen Ara—der Inflations¨ara n¨amlich—dominiert die Vakuumenergiedichte 15 4 ρvac ≈ (10 GeV) die Materie. Am Anfang, da die Strahlung die gleiche Temperatur hat, ist ρstrahl vergleichbar mit ρvac , aber die Strahlung wird schnell verd¨ unnen. Wir u ¨bernehmen von der QFT die zwei Zahlen ρvac und Tc . Wir messen alles in den Potenzen von GeV ( und c sind 1); dann sind die Grossenordnungen der Transformationsbeziehungen n¨ utzlich: 1 GeV ≈ 10−27 Kg ≈ 1016 m−1 ≈ 1024 s−1 , G ≈ 10−38 GeV−2 , m−1 ≈ 108 s−1 . Die Energiedichte des Vakuums ergibt eine kosmologische Konstante, Λ = 8πGρvac ≈ 1023 (GeV)2 ≈ 1055 m−2 ≈ 1071 s−2 . 198
Das ist eine riesige kosmologische Konstante: der heutige Wert erf¨ ullt Λ < 10−52 m−2 . Mit dieser Konstante und dem approximativen Wert des DeSitter-Skalenfaktors a ≈ p −1 H exp(Ht) erhalten wir (H = Λ/3 ist etwa 1035 s−1 ) den Vergr¨osserungsfaktor f¨ ur ∆t = 1033 a(tc + ∆t) ≈ 1029 . a(tc ) Eine winzige Quantenfluktuation k¨onnte auf diese Weise zu einem durchaus makroskopischen System aufgeblasen werden. Z.B., ein sehr kleines St¨ uck mit Radi−1 −19 −35 us von einigen Planckl¨angen (10 GeV ≈ 10 m) auf die makroskopischen −1 10 −6 15 ≈ 10 GeV ≈ 10 m und die Gesamtmasse ≈ (10 GeV)4 × (10−19 GeV−1 )3 ≈ 10−24 Kg wird auf stattliche ≈ (1015 GeV)4 × (1010 GeV−1 )3 ≈ 1063 Kg aufgeblasen. Die L¨osung des Horizontproblems ergibt sich dann aus der trivialen Eigenschaft, dass die Volumenelemente der Materie sich l¨angs zeitartigen Bahnen bewegen und so k¨onnen sie den Horizont nicht u ¨berschreiten. Wenn wir also mit einem kleinen St¨ uck Materie beginnen, das innerhalb des Horizontradius vor der Inflations¨ara liegt, dann bleibt das St¨ uck w¨ahrend des Aufblasens innerhalb des Teilchenhorizontes. Das gewonnene Volumen ist dann aber gr¨osser als der von uns heute sichtbare Teil des Raumes zu dieser Zeit. Die L¨osung des Flachheitsproblem liegt in der sch¨onen Eigenschaft des DeSitterRaumes, dass zu jeder Zeit Ω = 1 gilt. Denn ρ=
Λ 8πG
und ρc =
3 Λ 3 H2 = = ρ. 8πG 8πG 3
Nach dem Ende der Inflations¨ara ist die Dichte der Strahlung durch den Faktor (1029 )4 verd¨ unnt und die totale Dichte ist sehr genau durch die Vakuumdichte gegeben. Dann startet das Weltall nach der Inflation mit den Wert von ΩM sehr sehr genau gleich 1! Endlich, die L¨osung des Entropieproblems sollte durch die latente W¨arme geliefert werden. Die grosse Vakuumdichte der Energie zerf¨allt ganz in die Strahlung, was eine gen¨ ugende Aufheizung ergibt. Der Endzustand der Inflations¨ara ist fest und praktisch unabh¨angig davon, was ¨ geschah. Um alles einfach zu halten, haben wir zwar ein strahlungsdomivor der Ara niertes Friedmann-Modell (daf¨ ur mit einer beliebigen Konstante K) vorausgesetzt. Diese Voraussetzung kann aber abgeschw¨acht werden—z.B., k¨onnen die Homogenit¨at und Isotropie ganz weggelassen werden. 199
4.6.5
Quantenkosmologie
Noch viel fr¨ uher als die Inflations¨ara haben wir das Gebiet der sog. Quantenkosmologie. Grob gesprochen beruht die Quantenkosmologie auf dem folgenden Trick. Anstatt die ganze Gravitationstheorie zu quantisieren, was heute niemand kann und was auch zu sehr schwierigen Gleichungen f¨ uhren k¨onnte, quantisiert man nur den symmetrischen Robertson-Walker-Sektor der Theorie. Das f¨ uhrt zu einer Quantenmechanik, und nicht zu einer Quantenfeldtheorie, was alle Berechnungen stark verk¨ urzt. Eine popul¨are Idee im Rahmen einer solchen Theorie ist eine spontane Entstehung des Weltalls durch eine Art Tunneleffekt (Vilenkin, Hawking). Quantenkosmologie wird auch als ein Spielzeugmodell f¨ ur die Quantentheorie der Gravitation aufgefasst und hat als solche zum Verst¨andnis des Problems beigetragen, Quantentheorie und Gravitation zu vereinigen.
4.7
Aufgaben
1. Beweisen Sie die folgenden Eigenschaften vom “Vektor” nk (4.5): (a) Die drei Vektoren nk , mk und lk in dieser Reihenfolge bilden ein positiv orientiertes orthonormales 3-Bein, wobei ∂nk m := , ∂ϑ k
1 ∂nk l := . sin ϑ ∂ϕ k
(b) Benutzen Sie dieses Resultat, um die folgende Identit¨at herzuleiten ~ · dn) ~ = dϑ2 + sin2 ϑdϕ2 . (dn (c) Benutzen Sie diese Identit¨at, um die Metrik (4.6) herzuleiten. 2. Berechnen Sie die Kr¨ ummung von S 3 und P 3 in den Koordinaten r, θ und φ und zeige, dass k Rijmn = 2 (gim gjn − gin gjm ) a 3 3 u ¨berall auf S , bzw. P . Benutzen Sie die Metrik dr 2 2 2 2 2 2 2 + r (dθ + sin θ dφ ) , ds = a 1 − kr 2 sowie die Symmetrie. (Rechnen Sie nur in einem Punkt, mit Komponenten des Kr¨ ummungstensors in Bezug auf eine geeignete orthonormale Basis und n¨ utzen Sie die Isotropie aus, um die Anzahl der unabh¨angigen Komponeten des Kr¨ ummungsensors zu bestimmen.) 200
3. Beweisen Sie : wenn ξ¯k (r, ϑ, ϕ) ein Killing-Vektorfeld der Metrik (4.9) ist, dann ist ξ µ (t, r, ϑ, ϕ) ein Killing-Vektorfeld der Metrik (4.12), wobei ξ 0 (t, r, ϑ, ϕ) := 0,
ξ k (t, r, ϑ, ϕ) := ξ¯k (r, ϑ, ϕ).
4. Beweisen Sie , dass der Einstein-Tensor f¨ ur die Metrik ds2 = dt2 − a2 g˜kl dxk dxl die Form hat G00 = 3a−2 (a02 + k), Gkl = −(2aa00 + a02 + k)˜ gkl . Hinweis: Lesen Sie die Γµνρ von der geod¨atischen Gleichung ab. Sammeln Sie dann die Terme mit g˜kl und benutzen Sie unsere Formel ˜ klmn = k(˜ R gkmg˜ln − g˜kng˜lm ), ˜ klmn der Kr¨ wo R ummungstensor f¨ ur die 3-er Metrik g˜kl ist. 0 5. Seien gµν (x) und gµν (x) zwei Metriken auf gemeinsamer Mannigfaltigkeit M , welche in konformer Beziehung stehen: 0 gµν (x) = F (x)gµν (x),
F (x) > 0 ∀x.
In welcher Beziehung stehen die lichtartigen Geod¨aten dieser zwei Metriken, und die entsprechenden Affinparameter? 6. Untersuchen Sie die Existenz der Horizonte f¨ ur die strahlungsdominierten Modelle. 7. F¨ uhren Sie die Skalenklassen f¨ ur die strahlungsdominierten Modelle ein auf eine analoge Weise als es f¨ ur die Staubmodelle geschah. 8. Berechnen Sie die Distanz zwischen zwei kosmologichen Beobachtern zur Zeit t0 in einem Robertson-Walker-Modell mit a(t) = a1 + a2 t + a3 t2 mit zwei Methoden: (a) Geod¨atische Distanz in der Hyperfl¨ache t = t0 , (b) Radarwiederhallzeit. 9. Studieren Sie die Punkte mit C = 0 (Λ = 0) im Ω-Diagramm. a) Berechnen Sie die Altersfunktion χ, und b) die skalenfreie Helligkeitsdistanz dL . 201
10. Ein zweidimensionaler Modell von DeSitter- oder Anti-DeSitter-Raumzeit ergibt sich aus den Einbettungsformeln dS 2 = dT 2 − (dX 1 )2 − (dX 2 )2 , T 2 − (X 1 )2 − (X 2 )2 = −H −2 , und dS 2 = dT 2 + dU 2 − dX 2 , T 2 + U 2 − X 2 = H −2 ,
(a) Finden Sie die Symmetriegruppe und die Killing-Vektorfelder der so definierten zweidimensionalen Raumzeiten. (b) Beweisen Sie: die Abbildung (T, X 1 , X 2 ) 7→ (−T, −X 1 , −X 2 ) im Einbettungsraum induziert eine Isometrie I der zweidimensionalen DeSitterRaumzeit, und analog f¨ ur die Anti-DeSitter-Raumzeit. 11. Beweisen Sie: jede Geod¨ate in der zweidimensionalen DeSitter-Raumzeit, bzw. Anti-DeSitter-Raumzeit, ist ein Schnitt der zweidimensionalen DeSitter-Raumzeit, bzw. Anti-DeSitter-Raumzeit, mit der 2-Ebene durch den Ursprung des Einbettungsraumes. (Zeigen Sie dies zun¨achst f¨ ur alle Geod¨aten durch einen Punkt, und ben¨ utze dann die Symmetrie) 12. Benutzen Sie das Resultat der Aufgabe 11, um zu zeigen: p sei ein Punkt der zweidimensionalen DeSitter-Raumzeit (Anti-DeSitter-Raumzeit) und q sei ein Punkt, der innerhalb (ausserhalb) des Lichtkegels von I(p) in der zweidimensionalen DeSitter-Raumzeit (Anti-DeSitter-Raumzeit) liegt (die Abbildung I ist in der Aufgabe 6). Dann gibt es keine (zusammenh¨angende!) Geod¨ate in der Raumzeit, welche p mit q verbindet.
202
Kapitel 5 Rotationssymmetrische Sternmodelle In diesem Kapitel wollen wir Sternmodelle bauen, statische als auch dynamische (Gravitationskollaps). Wir beschr¨anken uns auf Situationen, in welchen die Rotationssymmetrie eine gute N¨aherung ist. Dann werden also die sogenannten Schwarzschild-L¨osungen dieses Kapitel dominieren. Die Schwarzschild-L¨osungen sind die rotationssymmetrischen L¨osungen der Einstein-Gleichungen. Man hat durch das Studium dieser L¨osungen u ¨berraschend vieles u ¨ber die Gravitation gelernt und sie sind bis heute sehr interessant geblieben. Wieder, wie schon in der Kosmologie, konzentrieren wir uns auf die geometrischen Aspekte der Sterne, auf das Gravitationsfeld. Die Einzelheiten der materiellen Zusammensetzung der Sterne werden hier durch eine Zustandsgleichung p = p(ρ) repr¨asentiert und eingentlich nur angedeutet. Wir setzen in diesem Abschnitt Λ = 0, weil Λ keine Bedeutung in der Astrophysik der Sterne hat. Wir beginnen mit dem Inneren der rotationssymmetrischen statischen Sterne.
5.1 5.1.1
Hydrostatisches Gleichgewicht nichtrotierender Sterne Gleichungen des hydrostatischen Gleichgewichts
Wir betrachten Sternmodelle aus idealer Fl¨ ussigkeit, welche statisch und rotationssymmetrisch sind. Die Metrik im Innern der Sterne muss also die Form (2.79) haben und die Einstein-Gleichungen (3.92) mit Λ = 0 l¨osen. (Man kann zeigen, dass f¨ ur statische ideale Fl¨ ussigkeit mit vern¨ unftiger Zustandsgleichung die EinsteinGleichungen automatisch die Rotationssymmetrie implizieren, die Beweise sind aber 203
schwierig. Deshalb setzen wir die Rotationssymmetrie einfach voraus.) Der EnergieImpuls-Tensor muss ebenfalls diese Symmetrie aufweisen, d.h. die 4er-Geschwindigkeit der Fl¨ ussigkeit muss parallel zum statischen Killing-Vektorfeld sein, sonst k¨onnten die statischen Beobachter Energiestr¨ome messen. In Bezug auf die Koordinaten t, r, ϑ und ϕ haben wir dann (Normierung!): 1 uµ = p (1, 0, 0, 0). B(r)
Der Druck p und die Massendichte ρ d¨ urfen nicht von t, ϑ und ϕ abh¨angen: p = p(r),
ρ = ρ(r).
Die Form der Zustandsgleichung lassen wir offen. Man muss eigentlich viel mehr von der Materiezusammensetzung angeben, um einen ernsthaft zu nehmenden Modell zu bilden, z.B. die Temperatur, erhaltene Teilchenstr¨ome u.s.w. Wir wollen hier nur das einfachste Schema darstellen und die ganze Theorie des Materials durch eine Zustandsgleichung repr¨asentieren. Die Einstein-Gleichungen nehmen eine besonders einfache Form an, wenn wir anstatt A(r) und B(r) die Funktionen Φ(r) und m(r) gem¨ass der Formel einf¨ uhren: B(r) = e2Φ(r) , r . A(r) = r − 2m(r)
(5.1) (5.2)
Dann lauten die Komponenten tt und rr der Einstein-Gleichungen m0 = 4πGr 2 ρ, m + 4πGr 3 p , Φ0 = r(r − 2m)
(5.3) (5.4)
Die r-Komponente der Euler-Gleichung (3.84) ist p0 = −(ρ + p)Φ0 , und wenn man (5.4) einsetzt, erh¨alt man die sog. Oppenheimer-Volkoff-Gleichung: p0 = −
(ρ + p)(m + 4πGr 3 p) . r(r − 2m)
(5.5)
Die Gleichungen (5.3), (5.4) und (5.5) (zusammen mit einer oder mehreren Zustandsgleichungen) bilden ein vollst¨andiges System f¨ ur das hydrostatische Gleichgewicht der relativistischen Sterne. (Die Euler-Gleichung ersetzt die ϑϑ-Komponente der Einstein-Gleichungen auf eine ¨ahnliche Weise wie die Energiegleichung (4.24) die rr-Komponente (4.22) in der Kosmologie ersetzen konnte.) Sie k¨onnen zu einem System von zwei gew¨ohnlichen Differentialgleichungen f¨ ur zwei Funktionen p(r) und m(r) reduziert werden. 204
5.1.2
Bedingungen im Zentrum
Die Gleichungen (5.3), (5.4) und (5.5) bilden ein System von gew¨ohnliche Differentialgleichungen erster Ordnung mit der unabh¨angigen Ver¨anderlichen r. Dann bestimmt ein Wert der gesuchten Funktionen f¨ ur ein gegebenen Wert von r eine L¨osung. Diesen speziellen Wert von r w¨ahlen wir universal: r = 0. Welche Werte k¨onnen die gesuchten Funktionen im Zentrum haben? Beginnen wir mit m(0). Die Raumzeit ist regul¨ar, wenn sie lokal flach ist. Insbesondere soll die Oberfl¨ache Fr einer kleinen 3-Kugel r = konst, t = konst vom Radius Rr im Limes die Euklidische Beziehung erf¨ ullen: lim r=0
Fr = 4π. Rr2
Fr und Rr haben die Form: Fr = 4πr 2 , und Rr =
Z
r
dx 0
p A(x).
Daraus erhalten wir, indem wir die l’Hospital-Regel ben¨ utzen, √ Fr √ 1 lim = 4π lim p . r=0 Rr r=0 A(r)
Das Zentrum ist also nur regul¨ar, wenn
lim A(r) = 1, r=0
und daraus folgt: m(0) = 0.
(5.6)
Der Anfangswert Φ(0) hat keine Bedeutung. In der Tat, eine Aenderung der Funktion Φ(r) um eine Konstante ist einer Koordinatentransformation ¨aquivalent. Wenn wir n¨amlich eine neue Zeitkoordinate t0 einf¨ uhren gem¨ass t = t0 eC , dann transformiert sich g00 wie folgt 0 g00 = e2C g00 = e2(Φ+C) .
Φ(r) ist also bis auf eine additive Konstante bestimmt, genau wie in der NewtonTheorie, und wir k¨onnen z.B. als Anfangswert setzen Φ(0) = 0.
(5.7)
Es gibt keine Bedingungen (ausser p > 0), welche den Anfangswert p(0) f¨ ur die Funktion p(r), den Zentraldruck, beschr¨anken. F¨ ur jeden Zentraldruck erhalten wir 205
aber ein anderes Modell. Bei einer festen Zustandsgleichung ergibt sich so eine eindimensionale Familie von Sternmodellen. Man muss nur die Gleichungen (5.3), (5.4) und (5.5) mit den Anfangswerten (5.6), (5.7) und mit einem gew¨ahlten Zentraldruck vom Zentrum weg integrieren. Wie erkennt man dabei, dass man an der Sternoberfl¨ache angelangt ist?
5.1.3
Bedingungen an der Oberfl¨ ache
Sei r = ro an der Sternenoberfl¨ache. In ro m¨ ussen offensichtlich die folgenden Bedingungen gelten. 1. Die Dichte ρ kann einen Sprung auf der Oberfl¨ache haben. Der Druck p(r) ist stetig in ro . Sonst erscheinen unendliche Kr¨afte an der Oberfl¨ache (die Kraft ist proportional zu p0 ). Wenn wir voraussetzen, dass ausserhalb des Sternes Vakuum ist, dann muss dort gelten p(r) ≡ 0. Die Oberfl¨ache ist also mit der ersten Nullstelle der Funktion p(r) zu identifizieren. 2. Die Metrik induziert in jeder Hyperfl¨ache r = konst ist eine stetige Funktion von r im Punkt ro . Sonst k¨onnte man verschiedene Zeiten oder Abst¨ande unter und u ¨ber der Oberfl¨ache messen. Es folgt: Die Funktionen r und Φ(r) sind stetig in ro .
5.1.4
Die Metrik ausserhalb des Sternes
Ausserhalb des Sternes setzen wir ρ = p = 0. Im Allgemeinen erhalten aus (5.3): Z r m(r) = 4πG dx x2 ρ(x), 0
was eine stetige Funktion von r ist, und dann aus (5.4) f¨ ur r > ro : Φ0 =
m r(r − 2m)
wobei m eine Konstante ist, gegeben durch Z ro dr r 2 ρ(r). m = 4πG
(5.8)
(5.9)
0
Die L¨osung von (5.8) ist r
r − 2m + Φ0 , r wobei die Konstante Φ0 so zu w¨ahlen ist, dass Φ(r) stetig an der Oberfl¨ache des Sternes ist. F¨ ur die Geometrie ausserhalb des Sternes ist sie aber belanglos und Φ = ln
206
kann gleich null gesetzt werden. Die Metrik ausserhalb des Sternes sieht also folgendermassen aus ds2 =
r r − 2m 2 dt − dr 2 − r 2 (dϑ2 + sin2 ϑ dϕ2 ). r r − 2m
(5.10)
Das ist die sog. Schwarzschild-L¨osung. Die Form der Funktionen A(r) und B(r) ist also durch die Einstein-Gleichungen vollst¨andig bestimmt. Betrachten wir diese Funktionen im Limes r → ∞ und entwickeln sie in den Potenzen von 1/r: Wir erhalten: 1 2m + ..., 2m = 1 + r 1− r 2m . B(r) = 1 − r A(r) =
Der Vergleich mit der Eddington-Robertson-Entwicklung (2.87) und (2.88) ergibt: −
2m RG = −2α , r r 0 = 2(β − αγ) 2
RG m = 2γ . r r
RG r
2
,
Die erste dieser Gleichungen kann benutzt werden, um die Masse des Sternes zu bestimmen, denn α muss 1 sein, damit die richtigen Kepler-Bahnen resultieren. Dann also ist, weil RG = GM M = 4π
Z
ro
dr r 2 ρ .
(5.11)
0
Das ist die relativistische Beziehung zwischen der Massenverteilung ρ im Innern des Sternes und der Masse des Sternes, welche durch die Eigenschaften der KeplerBahnen der Sateliten des Sternes bestimmt wird. Die restlichen Gleichungen stellen die Vorhersage der Einstein-Gleichungen f¨ ur β und γ dar, n¨amlich β = γ = 1, in Uebereinstimmung mit Beobachtungen. 207
(5.12)
5.1.5
Vergleich mit der Newton-Theorie
Die Newtonsche Theorie der Gravitation f¨ uhrt zu den folgenden Gleichungen des hydrostatischen Gleichgewichts M 0 = 4πr 2 ρ, M Φ0N = G 2 , r ρM p0 = −G 2 , r
(5.13) (5.14) (5.15)
wobei M (r) die Gesamtmasse innerhalb des Radius r, ΦN das Newton-Potential ist, und ρ und p die Newtonianische Massendichte und der Druck sind. Die Gr¨ossen ρ, p und Mtot der Newton-Theorie k¨onnen als ¨aquivalent zu ρ, p und Mtot der Einsteinschen betrachtet werden, denn sie sind gleich gemessen und definiert. Der Vergleich zwischen (5.3) und (5.13) zeigt, dass mtot = GMtot ist, aber dass in der relativistischen Theorie Mtot nicht einfach ein Integral von ρ u ¨ ber ein r¨aumliches Volumen ist. Die L¨osung von (5.13) kann als ein solches Integral geschrieben werden: Z M (r) = dVN ρ, wobei VN das Newton-Volumenelement ist, weil dVN = dr dϑ dϕ r 2 sin ϑ, und
Z Z
dϑ dϕ sin ϑ = 4π.
Die L¨osung von (5.3) hat eine analoge Form: Z Z Z m(r) = G dr dϑ dϕ r 2 sin ϑ ρ,
(5.16)
doch das Einstein-Volumenelement der Hyperfl¨ache t = konst ist durch die Wurzel aus der Determinante der induzierten Metrik, ds2 = A(r)dr 2 + r 2 dϑ2 + r 2 sin2 ϑdϕ2 , gegeben, also dVE = dr dϑ dϕ r 2 sin ϑ oder m(r) < G
Z
208
√ A,
dVE ρ;
da m(r) > 0, ergibt (5.2) A(r) > 1, also dVN < dVE . Trotzdem ist die Gr¨osse mtot /G als die Gesamtmasse unter dem Radius ro zu betrachten. Der Grund daf¨ ur ist, grob gesprochen, dass in der relativistischen Theorie alle Energieformen zur Gesamtmasse beitragen und der Beitrag der Gravit¨at—die Bindeenergie des Sternes—negativ ist. Dann muss die Gesamtmasse in der relativistischen Theorie kleiner als die Summe der Massen innerhalb des Radius r sein. Der Vergleich zwischen (5.4) und (5.14) zeigt, dass das Potential Φ in der relativistischen Theorie steiler mit r ansteigt als ΦN in der Newton-Theorie: erstens tr¨agt der Druck auch zum Quellenterm bei, und zweitens korrigiert die Massenfunktion m(r) den Nenner. Die Kraft p0 , welche im Gleichgewicht mit der gravitativen Anziehung stehen soll, muss also in der Einstein-Theorie gr¨osser sein. Das zeigt auch die Oppenheimer-Volkoff-Gleichung, wobei ausser Φ0 noch ein zus¨atzlicher Term p im ersten Faktor vorkommt. Die relativistischen Sterne werden also mehr zum Gravitationskollaps als die Newtonschen neigen.
5.1.6
Massenlimite
Die Gleichungen des hydrostatischen Gleichgewichts mit geeigneten Zustandsgleichungen f¨ uhren zu den sog. Massenlimiten: Existenz der maximalen Masse, welche durch einen Stern mit einer vern¨ unftigen Zustandsgleichung erreicht werden kann. Wir wollen jetzt verstehen, woher das kommt. Gleichzeitig wollen wir die relativistische und die nichtrelativistische Theorie weiter vergleichen. Ein wichtiger Unterschied zwischen der Oppenheimer-Volkoff-Gleichung (5.5) und der Gl. (5.15) ist, dass der Druck p auch auf der rechten Seite der Gl. (5.5) vorkommt; das f¨ uhrt zu einer positiven R¨ uckkopplung: ein grosser Wert des Drucks p verst¨arkt das Wachstum des Druckes in der Richtung zum Sternzentrum. Diese Aspekte k¨onnen am besten am einfachen Beispiel der inkompressiblen Fl¨ ussigkeit illustriert werden; die Zustandsgleichung lautet ρ = const.
(5.17)
Integrieren wir zun¨achst die Newtonschen Gln. (5.13)–(5.15); wir erhalten aus Gl. (5.13) γρ 3 M (r) = r G wobei γ := 4πG/3. Eingesetzt in Gl. (5.15), ergibt sich 1 p(r) = P − γρ2 r 2 ; 2 wir haben die Integrationskonstante durch den Druck P = p(0) in der Mitte ausgedr¨ uckt. 209
Der Radius ro des Sternes ist bei p(ro ) = 0 erreicht. Das ergibt die Beziehung 1 P = γρ2 ro2 2 zwischen P und ro bei gegebener Dichte der Masse ρ. Daraus ergibt sich f¨ ur Mtot := 3 (γρ/G)r0 : r 6 P 3/2 Mtot = . πG3 ρ2 Bemerken wir, dass P f¨ ur beliebige Werte von ro endlich bleibt. Im Prinzip kann also ro beliebig gross sein, und somit auch die Gesamtmasse. Wenn der Druck P in der Mitte durch die jeweiligen realistischen (endlichen) Werte beschr¨ankt wird, wird auch der Sternradius ro gem¨ass der obigen Gleichung beschr¨ankt, und somit auch die Gesamtmasse. Das ergibt ein Massenlimit auch in der Newton-Theorie. Die Integration von Gl. (5.3) ergibt auch dass m(r) = γρr 3 . Gl. (5.5) dann lautet: (p + ρ)(3p + ρ)r . 1 − 2γρr 2 Integration dieser Gleichung durch die Separationsmethode ergibt p0 = −γ
p 3p + ρ = C 1 − 2γρr 2 , p+ρ
wobei C eine Integrationskonstante ist. Sie kann durch P ausgedr¨ uckt werden: 3P + ρ = C. P +ρ Daraus resultiert r0 , r0 = und Mtot ,
s
2 P (2P + ρ) < γρ (3P + ρ)2
r
1 2γρ
s
3/2 6 P (2P + ρ) Mtot = . πρG3 (3P + ρ)2 Studieren wir die Funktion Mtot P ! F¨ ur relativ kleine Werte vom Zentraldruck, P ρ,
welche eigentlich sehr gross sein k¨onnen, haben wir r 6 P 3/2 P 1− 6 +... , Mtot = ρ πG3 ρ2 210
was sich mit der Newton-Formel in erster N¨aherung deckt. F¨ ur die Ableitung erhalten wir im ganzen Bereich P ∈ (0, ∞) dMtot > 0, dP Mtot ist also eine zunehmende Funktion von p(0). Endlich, lim Mtot =
P →∞
1 4 √ ρ−1/2 . 9 3πG3
Der Limes ist endlich! Das k¨onnen wir so interpretieren, dass der Druck im Zentrum divergiert, wenn wir die Masse des Sternes bis zum Limeswert vergr¨ossern wollen. Das ist der Sinn der relativistischen Korrekturen. Es ist aber klar, dass eine gew¨ahlte Form der Zustandsgleichung nicht f¨ ur beliebeig grosse Werte des Drucks g¨ ultig sein kann und viel fr¨ uher zusammenbricht, als bei P = ∞. Wenn sie im nichtrelativistischen Bereich schon bricht, dann gen¨ ugt die Newton-Theorie f¨ ur die Berechnung der Massenlimiten, wenn das erst im relativistischen Bereich passiert, m¨ ussen wir die Newton-Gleichungen korrigieren. F¨ ur die sog. weissen Zwergen ist der Druck vom Druck der degenerierten Elektronen dominiert; diese Zustandsgleichung bricht in nichtrelativistischen Bereich zusammen und das ergibt den sog. Chandrasekhar-Massenlimit (ChandrasekharMasse) von 1.2 MSonne . Auch die Zustandsgleichung f¨ ur die Kernmaterie (Neutronensterne) ergibt ein Massenlimit von 2-6 MSonne (hierf¨ ur sind die relativistischen Korrekturen wichtig). Weisse Zwerge und die Neutronensterne sind die einzigen Sterne, welche ohne eine laufende Kernreaktion im Innern existieren k¨onnen.
5.1.7
Verbindungsbedingungen
Wenn Spr¨ unge im Material vorkommen, brauchen wir die sog. Verbindungsbedingungen. Sie verfolst¨andigen die Einstein-Gleichungen im Fall einer Unstetigkeitsfl¨ache auf eine a¨hnliche Weise, wie z.B. die Poisson-Gleichung der Elektrostatik durch die Bedingung verfolst¨andigt werden muss, dass das Potential C 1 an der Oberfl¨ache des Dielektrikum ist. Wir k¨onnen diese Verbindungsbedingungen wie folgt formulieren: In einer Umgebung jedes Punktes einer Unstetigkeitsfl¨ache existieren Koordinaten so, dass die Komponenten der Metrik in Bezug auf die Koordinaten C 1 in der Umgebung sind. Wir postulieren diese Bedingungen als allgemeing¨ ultig. Studieren wir jetzt, ob die erhaltene Metrik die Bedingungen erf¨ ullt. Die Metrik hat die Form ds2 = B(r)dt2 − A(r)dr 2 − r 2 dϑ2 − r 2 sin2 ϑdϕ2 ; 211
die Sternoberfl¨ache liegt bei r = ro . Untersuchen wir die Eigenschaften der Komponenten der Reihe nach. F¨ ur B(r) haben wir die Gl. (5.1) und (5.4); da m(r) und p(r) bei r = ro stetig sind, ist auch Φ0 und somit B 0 stetig. Die Komponenten gϑϑ und gϕϕ , d.h. die Funktionen r 2 und r 2 sin2 ϑ haben sogar alle stetige Ableitungen. Endlich erhalten wir f¨ ur A(r) aus Gl. (5.2), dass dA rm0 − m =2 . dr (r − 2m)2 Die Funktion m0 (r) ist aber nicht stetig: dm = 4πGr 2 ρ, dr r
dm = 0, dr r>ro
denn ρ darf einen Sprung haben. D.h., in den Koordinaten t, r, ϑ und ϕ ist die Metrik nicht C 1 . Wir versuchen aber eine neue radiale Koordinate l einzuf¨ uhren, welche in einer Umgebung von r = ro durch die Gl. Z rp A(x)dx l(r) := ro
definiert wird. Sie ist stetig, gleich Null bei r = ro , und ihre Ableitung dl = A(r) dr
ist auch stetig und von Null verschieden. Daraus folgt, dass eine beliebige Funktion f (r), welche C 1 bei r = ro ist, eine C 1 Funktion f (r(l)) von l bei l = 0 definiert. Die transformierte Metrik lautet: ds2 = B(r(l))dt2 − dl2 − r 2 (l)dϑ2 − r 2 (l) sin2 ϑ2 dϕ2 ; alle Komponenten davon sind jetzt C 1 . Die Verbindungsbedingungen sind also erf¨ ullt.
5.2
Eigenschaften der Schwarzschild-L¨ osung
Wir wollen jetzt die besondere Metrik (5.10) n¨aher studieren, und zwar im Bereich (0, ∞) von r, d.h., wir setzen ro = 0.
5.2.1
Birkhoff-Satz
Die erste wichtige Eigenschaft der Schwarzschild Metrik, welche wir beschreiben sollen (welche wir aber nicht herleiten—das w¨are zu lang; man findet einen Beweis z.B. in [8]), kann wie folgt dargestellt werden: 212
Theorem 19 Jede rotationssymmetrische L¨osung der Einstein-Gleichungen mit Λ = 0,
Tµν = 0
ist identisch mit (einem St¨ uck) der Schwarzschild-L¨osung. Man braucht also die Zeitunabh¨angigkeit nicht vorauszusetzen! Das bedeutet, dass auch ein Stern, der sich so bewegt, dass er die ganze Zeit rotationssymmetrisch bleibt (rein radiale Bewegungen), aussen die Schwarzschildsche Metrik erzeugt. Das motiviert das Studium der Metrik bis zu r = 0.
5.2.2
Radiale Lichtstrahlen
Wie im Abschnitt 5.1.4 gezeigt, weit ausserhalb des Gravitationsradius liefert die Schwarzschild-Metrik die uns schon bekannte Geometrie. Wie sieht aber die L¨osung in der N¨ahe des Gravitationsradius aus? Die rr-Komponente der Metrik (5.10) divergiert. Das kann entweder bedeuten, dass die Geometrie in diesen Punkten singul¨ar ist, oder dass man ein singul¨ares Koordinatensystem hat. Um die Frage, was vorliegt, zu beantworten, studieren wir die radialen lichtartigen Geod¨aten der Metrik (5.10). Diese helfen uns nicht nur ein besseres Koordinatensystem zu finden, sondern auch eine Menge u ¨ber die Eigenschaften der Geometrie herauszufinden. Zun¨achst betrachten wir einfach zwei Raumzeiten, eine mit r > 2m, andere mit r < 2m, die sog. externe und interne Schwarzschild-Raumzeit. Die Geod¨aten der Metrik (5.10) sind durch die Gleichungen (2.84), (2.85) und (2.86) beschrieben. Die Wahl der Konstanten f¨ ur den Fall von radialen und lichtartigen Geod¨aten ist j = 0 und µ = 0, so dass man erh¨alt r˙ = ±e, e t˙ = , 1 − 2m r wobei e > 0 eine beliebige Konstante ist. Die erste Gleichung aber besagt, dass r selbst ein Affinparameter ist. Wir k¨onnen also den Affinparameter λ = ±r w¨ahlen, und zwar so dass λ immer in die Zukunft gerichtet wird; das bedeutet e = 1. Somit erhalten wir zwei Arten von radialen lichtartigen Geod¨aten: 1. r˙ = +1, so dass dr > 0 f¨ ur r > 2m und die Geod¨ate ist auslaufend in der exdt ternen Schwarzschild-Raumzeit. Die L¨osung ist dann (in beiden Raumzeiten): r − 1 = u, (5.18) t − r − 2m log 2m wobei u eine beliebige Konstante ist und ¨ahnlich 213
< 0 f¨ ur r > 2m, die Geod¨ate ist einlaufend in der externen 2. r˙ = −1, so dass dr dt Schwarzschild-Raumzeit, und r t + r + 2m log (5.19) − 1 = v, 2m wobei v eine beliebige Konstante ist.
F¨ ur konstante Radien r stimmen u und v mit der Koordinate t bis auf eine additive Konstante u ur sehr grosse r ist t die Eigenzeit f¨ ur die ¨berein und, in r > 2m, f¨ statischen asymptotischen Beobachter. u ist also die retardierte und v die avancierte Zeit in der Raumzeit mit r > 2m.
5.2.3
Eddington-Finkelstein-Koordinaten
Die Gleichung (5.19) definiert eine Funktion v auf der Raumzeit; wir versuchen, die Funktionen v, r, ϑ und ϕ als neue Koordinaten einzuf¨ uhren. Diese heissen EddingtonFinkelstein-Koordinaten. Um die Metrik (5.10) in diese Koordinaten zu transformieren, berechnen wir aus (5.19) dt = −
dr + dv, 1 − 2m r
und setzen das in (5.10) ein f¨ ur beide regul¨are Gebiete r ∈ (0, 2m) und r ∈ (2m, ∞). Das Resultat ist ds2 =
r − 2m 2 dv − 2dv dr − r 2 (dϑ2 + sin2 ϑ dϕ2 ), r
(5.20)
Die neuen Komponenten der Metrik sind alle glatt bei r = 2m, und die Determinante g = −r 4 sin2 ϑ verschwindet nur bei r = 0 und ϑ = 0, π. Die Metrik ist also selber regul¨ar bei r = 2m. Die externe und interne Schwarzschild-Raumzeiten k¨onnen nun als Teile von Eddington-Finkelstein-Raumzeit betrachtet werden. Wir betrachten nun die Koordinaten v, r 0 = r, ϑ0 = ϑ und ϕ0 = ϕ als regul¨ar (erlaubt) um die Punkte mit r = 2m. Die alten Koordinaten t, r, ϑ und ϕ sind dann dort als singul¨ar (nicht erlaubt) zu betrachten, denn erstens ! ∂v ∂v r 1 r−2m ∂t ∂r = , ∂r 0 ∂r 0 0 1 ∂t ∂r d.h., die Matrix der Ableitungen der Koordinatentransformationfunktionen ist singul¨ar bei r = 2m, und zweitens, die Metrik ist regul¨ar in den Koordinaten (v, r, ϑ, ϕ) 214
und singul¨ar in (t, r, ϑ, ϕ). Die Klasse der regul¨aren (erlaubten) Koordinaten ist eindeutig durch die Bedingung der Regularit¨at der Metrik bestimmt, sobald mindestens ein regul¨ares Koordinatensystem existiert. Das gilt in jedem generischen Fall, aber der Beweis ist schwierig, so wollen wir darauf verzichten. Warum ist die Metrik singul¨ar in den Schwarzschild-Koordinaten? Da diese Koordinaten der Symmetrie angepasst sind, muss mit der Symmetrie am r = 2m etwas passieren. Wir k¨onnen leicht sehen, was das ist, wenn wir die Komponenten des Killing-Vektorfeldes der Zeitverschiebung berechnen. In den Eddington-Finkelstein Koordinaten lauten sie ξ 0µ = (1, 0, 0, 0). Der Vektor verschwindet nirgends und ist u ¨berall glatt; Sein Quadrat, gµν ξ µ ξ ν = (r − 2m)/r a¨ndert aber das Vorzeichen, wenn man durch den Wert r = 2m geht. Das heisst, die Symmetrie ist zeitartig ausserhalb 2m, lichtartig bei 2m, und raumartig unter 2m (Bild 5.1). Das erinnert uns an den Boost in der, sagen wir, tx-Ebene, wo der entsprechende Generator auch seine Signatur ¨andert. Die Schwarzschild-Raumzeit ist also nicht global statisch. Die Metrik hat eine echte Singularit¨at bei r = 0, wo auch die Kr¨ ummung divergiert und wo die Raumzeit also nicht mehr lokal flach ist.
5.2.4
Horizont
Wir k¨onnen jetzt ein v − r-Diadramm von Eddington-Finkelstein-Raumzeit machen (Bild 5.2); die Bereiche der Koordinaten r und v sind r ∈ (0, ∞) und v ∈ (−∞, ∞). Die Geraden v = const representieren einlaufende lichtartige rotationssymmetrische Hyperfl¨achen; die Zukunftsrichtung l¨angs dieser Hyperfl¨achen ist die Richtung des abnehmenden r. Um zu verstehen, was bei r = 2m passiert, untersuchen wir die auslaufenden radialen Lichtstrahlen (5.18) um r = 2m, indem wir sie in die Eddington-FinkelsteinKoordinaten umschreiben. Das Einsetzen f¨ ur t aus (5.19) in (5.18) ergibt r − 1 = u (5.21) v − 2r − 4m log 2m und so haben wir entlang den (u = konst)-Kurven
dr r − 2m = . (5.22) dv 2r Somit ergeben sich 3 Arten von auslaufenden radialen Lichtstrahlen (Bild 5.2): 1. r > 2m. Dann ist
dr >0 dv und die radiale Koordinate r nimmt in Zukunftsrichtung l¨angs des Strahles zu. F¨ ur die “Enden” des Strahles erhalten wir aus (5.21) v→∞ v → −∞
r=∞ r = 2m 215
r 0 = 12 r 0 = 0.
Jeder Strahl, der in einem Punkt mit r > 2m beginnt, erreicht f¨ ur gen¨ ugend grosse v beliebig entfernte Punkte, bleibt aber auch in der Vergangenheit in diesem Gebiet f¨ ur alle Werte von v. 2. r = 2m. Man kann best¨atigen, das diese Gleichung zusammen mit ϑ = const, ϕ = const eine lichtartige Geod¨ate in der Eddington-Finkelstein Raumzeit definiert. Es entspricht dem Koordinatenwert u = ∞. Das Licht bleibt am konstanten Radius r = 2m h¨angen. 3. r < 2m. Dann ist
dr < 0, dv und die radiale Koordinate r nimmt in Zukunftsrichtung l¨angs des Strahles ab. F¨ ur die “Enden” des Strahles erhalten wir v→u v → −∞
r=0 r = 2m
r 0 = −∞ r 0 = 0.
Jeder auslaufender Strahl u = konst, der in einem Punkt mit r < 2m beginnt, f¨allt also f¨ ur v = u ins Zentrum, und bleibt auch in der Vergangenheit in diesem Gebiet f¨ ur alle werte von v. Wir k¨onnen leicht zeigen, dass bei keinem (auch nichtradialen) kausalen Signal die Koordinate r schneller mit v als bei dem auslaufenden radialen zunehmen kann. Ein solches Signal laufe l¨angs einer Kurve, welche durch die Funktionen v(λ) r(λ), ϑ(λ) und ϕ(λ) gegeben ist. Da sie kausal und zukuftsgerichtet ist, muss ihr Tangentvektor ˙ ϕ) (v, ˙ r, ˙ ϑ, ˙ erf¨ ullen: v˙ ≥ 0, bei v = const r˙ < 0, und
2m 1− r
v˙ 2 − 2v˙ r˙ ≥ 0;
die Gleichheit in der letzten Ungleichung ist nur m¨oglich, wenn ϑ˙ = ϕ˙ = 0. Unterscheiden wir die F¨alle: 1. v˙ = 0. Das ist nur bei ϑ˙ = ϕ˙ = 0 m¨oglich, ist also ein radialer Strahl. 2. v˙ > 0. Dann haben wir innen, r < 2m, und aussen, r > 2m, aus der Ungleichung oben r˙ r − 2m ≤ , v˙ 2r und der gr¨osste m¨ogliche Zuwachs von r ist durch die Gleichheit gegeben, aber das ist wieder der radiale Strahl. 216
Wir sehen so ein, dass das Licht aus dem Gebiet mit r ≤ 2m nie die Punkte ausserhalb dieses Gebietes erreichen kann. Die Hyperfl¨ache r = 2m ist ein Ereignishorizont f¨ ur die Beobachter ausserhalb: sie k¨onnen das Geschehen in allen Ereignissen mit r > 2m verfolgen, aber sie sehen nie hinter diese Hyperfl¨ache. Die Tatsache, dass die Koordinate r im Gebiet r ∈ (0, 2m) entlang jeder kausalen in die Zukunft orientierten Kurve zunimmt, bedeutet, dass r dort zu einer Zeitkoordinate geworden ist. Das best¨atigt die Form der Metrik: das Koeffizient vor dr 2 ist positiv. Man kann durch eine “akustische Analogie” anschaulich machen, was um den Horizont passiert (Bild 5.3). Man stelle sich zwei Glasplatten in parallelen Anordnung horizontal vor; in der Mitte der unteren Platte befindet sich ein rundes Loch; von allen Seiten her str¨omt eine Fl¨ ussigkeit unter Druck aber laminar zwischen die Platten. Wir nehmen an, dass die Geschwindigkeit der Fl¨ ussigkeit an einem bestimmten Radius Rs (der sogenannte sonic point) die Schallgeschwindigkeit erreicht und sie unter diesem Radius sogar u ¨bertrifft. Eine Schallquelle kann jetzt in verschiedene Punkte zwischen den Platten gebracht werden. Wenn sie u ¨ber Rs liegt, kann der Schall nach aussen vordringen; vom Radius Rs wird der Schall nur das innere des Kreises unter Rs erreichen, und unter Rs geht fast alles vom Schall direkt ins Loch. Eine Denkweise hat sich durchgesetzt, den Ereignishorizont als Oberfl¨ache eines eigenst¨andigen physikalischen Objektes zu betrachten mit dem Namen schwarzes L¨och. Das ist nicht selbstverst¨andlich, denn der Horizont ist nur eine gedachte Fl¨ache. Es hat sich aber sehr gur bew¨ahrt in der Astrophysik und auch in der Theorie allgemein. Die Existenz der schwarzen L¨ocher kann betrachtet werden als praktisch durch Beobachtung bewiesen. Sehr gute Kandidaten sind unter st¨andiger Beobachtung. Diese Kandidaten sind meistens sehr starke Quellen der Strahlung und Energie (galaktische Zentren, Quasare, Doppelsternr¨ontgenquellen...). Die Umgebung eines Horizontes stellt n¨amlich eine sehr tiefe Potentialgrube dar; die Energie, welche durch den Fall in die Grube gewonnen wird, kann die Quelle dieser sehr aktiven Objekte im Himmel sein. Ein guter Kandidat f¨ ur ein schwarzes Loch ist ein Objekt, von dem man zeigen kann, dass es eine gen¨ ugend grosse Masse und ein gen¨ ugend kleines Volumen hat. Verschiedene Arten von Massenlimiten k¨onnen dazu herangezogen werden. Beobachtungen vom Zentrum unserer Galaxie: Es gibt eine starke punktf¨ormige R¨ontgenquelle, Sagittarius A, in der Mitte; das Feld im Umkreis von 3 LJ wird seit 1992 untersucht. Einzelne Sterne konnten identifiziert werden. Insbesondere sind f¨ ur die sechs n¨ahsten Sterne die beobachteten Bahnsegmente zur vollst¨andigen Keplerbahnen extrapoliert worden (Bild). Aus diesen Bahnen berechnet man die Masse des zentralen Objekts M ≈ 3×106 MSonne . Z.B., der Stern S2 mit der Masse 15−20MSonne 217
hat die Umlaufzeit ≈ 17 Jahre. Vier von diesen Sternen sind w¨ahrend der Beobachtungsperiode durch ihr Perizenter gegangen, was zur Absch¨atzung des Objektradius von R ≤ 20 RS ≈ 10Lm f¨ uhrt, wobei RS das Schwarzschild-Radius f¨r die Masse M ist und Lm Lichtminuten bedeutet. Es ist schwierig, ein Objekt zu konstruieren mit so viel Masse und so kleinem Radius, das kein schwarzes Loch ist.
5.3
Oppenheimer-Snyder-Kollapsmodell
In diesem Abschnitt wollen wir das Entstehen eines Horizonts w¨ahrend eines stellaren Kollaps studieren. Dazu benutzen wir ein sehr einfaches Modell des Sternes. Die hohe Symmetrie des Modells und die triviale Zustandsgleichung werden die dynamischen Gleichungen so vereinfachen, dass eine exakte L¨osung m¨oglich wird. Die wesentlichen Z¨ uge dieser L¨osung haben aber eine viel allgemeinere G¨ ultigkeit. Um ein realistischeres Modell durchzurechnen, w¨ urden wir einen leistungsf¨ahigen Computer brauchen; es w¨ urden jedoch gleiche qualitative Eigenschaften herauskommen. Der Modell besteht aus drei Teilen: dem inneren, dem ¨ausseren und der Grenze dazwischen.
5.3.1
Innen
Wir setzen voraus, dass die Materie des Sternes eine lokal isotrope homogene Staubverteilung ist. Die Verbindungsbedingung p = 0 an der Oberfl¨ache ergibt p = 0 u ¨berall, so ist die Metrik im Innen also ein Teil einer Friedmann-L¨osung (Bild 5.4). Die entsprechende Metrik (4.12) schreiben wir in der Form ds2 = dt2 − a2 (t)
dx2 − a2 (t)x2 dΩ2 . 1 − kx2
Anstatt r haben wir die Radialkoordinate durch x bezeichnet, so dass r f¨ ur den Radius der 2-Sph¨are t = konst, x = konst, reserviert werden kann, also r(t) = a(t)x.
(5.23)
Die Funktion a(t) muss die Gleichung (4.30) mit Λ = 0 erf¨ ullen:
da dt
2
−
2GM + k = 0. a
(5.24)
Da es sich um einen Kollaps handelt, wollen wir, dass a0 < 0. Dem entspricht im geschlossenen Modell (4.49) und (4.50) die zweite H¨alfte des kosmischen Zyklus, π < η < 2π, und die Zeitumkehr (t → −t) der anderen zwei L¨osungen (die Gleichung (5.24) ist invariant gegen¨ uber der Zeitumkehr). Wir setzen weiter voraus, dass der 218
Kollaps in einem Augenblick startet, in welchem a0 = 0. Solche Augenblicke gibt es nur f¨ ur k = 1 (η = π) und k = 0 (t = −∞). Der maximale Wert von a(t) ist f¨ ur k = 1 endlich; wir bezeichnen ihn durch aM und erhalten aus (5.24) aM = 2GM.
(5.25)
Wir wollen die L¨osung (4.49) und (4.50) noch so transformieren, dass sowohl die Zeit t als auch der Parameter η beim Start des Kollapses gleich null sind:
5.3.2
a = GM (1 + cos η),
(5.26)
t = GM (η + sin η).
(5.27)
Aussen
F¨ ur die Metrik ausserhalb des Sternes setzen wir (wegen des Theorems von Birkhoff) die Form (5.20) an. F¨ ur r > 2m ist diese Metrik statisch, mit dem entsprechenden µ Killing-Vektorfeld ξ .
5.3.3
Oberfl¨ ache
An einer solchen Oberfl¨ache m¨ ussen die Einstein-Gleichungen durch die Verbindungsbedingungen vervollst¨andigt werden. Nur dann ist die L¨osung eindeutig bestimmt. Damit der Stern rotationssymmetrisch ist, muss es auch seine Oberfl¨ache sein. Sie bildet eine Grenze zwichen dem Friedmann- und dem Schwarzschild-Teil. Von innen ist sie also durch die Staubtrajektorien t = τ,
x = xo ,
ϑ = ϑ0 ,
ϕ = ϕ0 ,
generiert, wobei xo eine feste Konstante ist, welche den benutzten Ausschnitt der Friedmann-Raumzeit bestimmt, und ϑ0 und ϕ0 haben Werte in den Intervallen 0 ≤ ϑ0 < π,
0 ≤ ϕ0 < 2π.
Diese Staubtrajektorien sind zeitartige Geod¨aten, da p = 0 ist und keine Kraft (ausser der Gravitation) auf die Staubk¨orner wirkt. Der Radius r(t) der Sph¨are t = konst ist nach (5.23) gegeben durch r(t) = a(t)xo .
(5.28)
Gl. (5.24) ergibt folgende Gleichung f¨ ur die Funktion r(t): r˙ 2 2GM xo + k = 0; − 2 xo r 219
(5.29)
Ihre L¨osung ist durch Gln. (5.26) und (5.27) gegeben: r = GM xo (1 + cos η),
(5.30)
t = GM (η + sin η).
(5.31)
Die Funktion r(t) bestimmt die Geometrie der Oberfl¨ache: d3 s2 = dt2 − r 2 (t)dΩ2 . Die Verbindungsbedingungen implizieren das Folgende: Von aussen ist die Oberfl¨ache auch durch zeitartige Geod¨aten generiert. Physikalisch bedeutet das, dass die Staubk¨orner etwas ausserhalb der Sternenoberfl¨ache parallel zur Oberfl¨ache fliegen. Mehr allgemein m¨ ussen die freien F¨alle in den Punkten der Oberfl¨ache glatt ineinander u ¨bergehen, wenn man einen Limes von oben oder von unten macht (wenn die 4er-Geschwindigkeit springt, haben wir unendliche Beschleunigung und brauchen unendliche Kr¨afte). Ausserdem m¨ ussen die zwei Hyperfl¨achen “aneinander passen”, d.h. die 3-Metrik von innen gleicht der 3-Metrik von aussen—sonst “entstehen Falten”, wenn man die zwei Oberfl¨achen aneinander zu kleben versucht (Bild 5.4). Schlussendlich muss die Oberfl¨ache der x = konst-Sph¨are gleich schnell von innen wie nach aussen wachsen, wenn man senkrecht zur Oberfl¨ache gleicher Distanz geht. Rechnen wir die Form der Oberfl¨ache von aussen aus. Die zeitartigen Geod¨aten, welche sie generieren, seien gegeben durch v = v(t),
r = r(t),
ϑ = ϑ0 ,
ϕ = ϕ0 ,
wobei t die Eigenzeit l¨angs der Geod¨aten sei. Die Funktionen v(t) und r(t) erf¨ ullen die geod¨atische Gleichung der Metrik (5.20), die zu den folgenden ersten Integralen reduziert werden kann 2m 1− v˙ 2 − 2v˙ r˙ = 1, (5.32) r 2m 1− v˙ − r˙ = e . (5.33) r Wenn wir v˙ aus diesen Gleichungen ausschliessen, erhalten wir die radiale Gleichung r˙ 2 + 1 −
2m − e2 = 0. r
(5.34)
Setzen wir voraus, dass der Radius des Sternes beim Start des Kollapses einen endlichen Wert rM hat. Dabei muss r˙ = 0. Einsetzen in (5.34) ergibt e2 = 1 − 220
2m , rM
und somit wird (5.34) zu
rM 2 rM r˙ − + 1 = 0. (5.35) 2m r Gln. (5.29) und (5.35) m¨ ussen gleiche L¨osungen ergeben. Das f¨ uhrt, f¨ ur k = 1, zu 1 rM = 2 , 2m x0
rM = 2GM x0 .
Nur das (k = 1)-Friedmann-Modell kommt also in Frage. (Die Friedmann-Gleichung mit k = 0, a = r und m = GM w¨ urden wir erhalten, wenn wir den Wert rM = ∞ erlaubten.) Ferner k¨onnen wir die Parameter M und x0 der L¨osung im Innern aus den Parameter m und rM im Aussen berechnen: r r rM rM 2m , xo = M= . (5.36) 2G 2m rM Die L¨osung von (5.35) ergibt sich aus Gln. (5.30) und (5.31), wenn wir Gl. (5.36) einsetzen: 1 rM (1 + cos η), 2 r rM 1 rM (η + sin η). t = 2 2m
r =
(5.37) (5.38)
Die Gesamtmasse m/G des Sternes und sein Vorkollapsradius rM bestimmen also die Friedmann-Metrik im Innern (M ) und die x-Koordinate der Oberfl¨ache (xo ) eindeutig f¨ ur 0 < xo < 1. Die gleiche x-Koordinate der Oberfl¨ache xo kann aber zwei sehr verschiedene Ausschnitte aus der Friedmann-Raumzeit bedeuten: an der S 3 gibt es ja zwei gleich grosse S 2 -Fl¨achen mit gleicher Koordinate x. Wir m¨ ussen die n¨ahere nehmen, da die Fl¨ache der Sph¨aren x = konst bei dieser zunimmt, bei der anderen abnimmt, wenn man sich dazu von innen n¨ahert. Man kann zeigen, dass dann alle Verbindungsbedingungen erf¨ ullt sind. Damit ist unsere Konstruktion fertig: F¨ ur jedes Paar (m, rM ) gibt es genau ein Modell; die Metrik und Materie des inneren Teiles sind eindeutig durch die Verbindungsbedingungen (5.36) bestimmt. Die Gleichungen (5.37) und (5.38) erlauben noch die folgenden Schlussfolgerungen u Parame¨ber die letzten Stadien vom Kollaps. Der Kollaps beginnt beim Wert desp 1 ters η = 0, wobei t = 0 und r = rM ist, und endet bei η = π, ts = 2 πrM rM /2m und r = 0. Das Ende des Kollapses ist eine sogenannte Singularit¨at: Die Massendichte ρ und die Kr¨ ummung werden unendlich. Die Oberfl¨ache kreuzt den Horizont, wenn r = 2m, der entsprechende Wert ηH des Parameters η ist r 2m 1 . cos ηH = 2 rM 221
Die Metrik im Innern ist regul¨ar zu dieser Zeit. Das und ηH ∈ (0, π) ergibt r 2m . ηH = π − 2 arcsin rM Wenn wir das in Gl. (5.38) einsetzen, erhalten wir die Eigenzeit tH des Beobachters an der Sternoberfl¨ache, wenn diese den Horizont kreuzt: r r r r rM π 2m 2m 2m + . − arcsin tH = r M 1− 2m 2 rM rM rM Wir setzen voraus, dass der Stern “normal” vor dem Kollaps war, also 2m 1, rM und entwickeln den arcsin: 1 arcsin x = x + x3 + . . . . 6 Dann ist tH ≈ ts − 4m/3. Dabei ist m in unseren Einheiten die Zeit, welche das Licht braucht, um den Abstand m zu durchqueren. Das letzte Stadium des Kollapses, von rM ≈ 2m bis zu r = 0 geht also scheinbar mit der beinahe zweifachen Lichtgeschwindigkeit.
5.3.4
Radiale lichtartige Geod¨ aten
Betrachten wir zun¨achst solche Geod¨aten in der ganzen Friedmann-Raumzeit. Wir k¨onnen uns dann immer auf das Innere des Sternes beschr¨anken. Da x = 0 den Nordbeziehungsweise S¨ udpol der 3-Sph¨are t = konst bedeutet, generieren die radialen lichtartigen Geod¨aten die Lichtkegel dieser Punkte (Zukunfts- oder Vergangenheitslichtkegel). Es ist g¨ unstig, anstatt t und x andere Koordinaten einzuf¨ uhren gem¨ass den Beziehungen t = GM (η + sin η), x = sin χ. Dann lautet die Metrik so: ds2 = [GM (1 + cos η)]2 (dη 2 − dχ2 − sin2 χdΩ2 ).
(5.39)
Die ganze Raumzeit ist durch die folgenden Bereiche der Koordinaten η und χ abgedeckt (Bild 5.5), −π < η < π, 0 ≤ χ ≤ π, (5.40)
da die ganze 3-Sph¨are η = konst die zwei Hemisph¨aren mit 0 ≤ x ≤ 1 enth¨alt. Jeder Punkt (η, χ) in dem Quadrant (5.40) stellt eine 2-Sph¨are in der Raumzeit dar, deren Radius r aus der Metrik (5.39) abzulesen ist: r = GM (1 + cos η) sin χ; 222
(5.41)
die rechte Seite ist positiv, wenn Gl. (5.40) gilt. An den Grenzen des Vierecks (5.40) ist also r = 0. Bei χ = 0, π gilt es, weil diese Punkte die Pole der 3-Sph¨are sind; bei η = −π, +π sind wir in der Singularit¨at, wo der Radius der ganzen 3-Sph¨are verschwindet. Die radialen lichtartigen Geod¨aten sind in Bezug auf die neuen Koordinaten durch vier Funktionen η(λ), χ(λ), ϑ(λ) und ϕ(λ) gegeben, welche die Beziehungen [GM (1 + cos η)]2 (η˙ 2 − χ˙ 2 ) = 0,
ϑ(λ) = ϑ0 ,
ϕ(λ) = ϕ0
erf¨ ullen m¨ ussen. Es folgt χ = ±(η − η0 ).
(5.42)
Den Affinparameter brauchen wir nicht, und so gen¨ ugt uns dieses Resultat vollst¨andig. Im Viereck (5.40) bestimmen die (+)-L¨osungen (5.42) (vom Nordpol gesehen) auslaufende radiale lichtartige Hyperfl¨achen. Wenn sie einen Punkt mit χ = 0 erreichen, k¨onnen sie als Zukunftslichtkegel des Punktes, wenn χ = π, als Vegangenheitslichtkegel des Punktes interpretiert werden. Alle Geod¨aten, welche vom Nordpol gestartet sind, treffen sich wieder am S¨ udpol (sobald η0 < 0). Analog bei den (−)L¨osungen. Wir sehen, dass das Licht das η-Intervall 2π braucht, um um die ganze 3-Sph¨are zu umlaufen—das ist der ganze kosmische Zyklus. Eine Hyperfl¨ache (5.42) beginnt mit r = 0, dann dehnt sie sich aus, d.h. der Radius r(η) ihrer Schnitte mit den Hyperfl¨achen η = konst nimmt zu, erreicht ein Maximum—den sog. Umkehrpunkt, und dann schrumpft sie wieder zu r = 0. Wir wollen die Umkehrpunkte bestimmen. Dazu setzen wir (5.42) f¨ ur χ in (5.41) ein: r(η) = ±GM (1 + cos η) sin(η − η0 ). Die Umkehrpunkte sind durch die Gleichung bestimmt r 0 (ηu ) = 0 , oder cos(2η − η0 ) = − cos(η − η0 ) . Die L¨osungen, welche im Innern von (5.40) liegen, sind 1 2 ηu = η0 + (2n + 1)π , 3 3
(5.43)
wobei n nur eine ganze Zahl sein kann. (5.42) impliziert χu = ±(ηu − η0 ).
(5.44)
Wenn wir η0 aus den beiden Gleichungen (5.43) und (5.44) ausschliessen, erhalten wir die Gleichungen der Umkehrpunkte. Umkehrpunkte f¨ ur auslaufende Hyperfl¨achen: 1 ηu+ = −2(χu − π), 2 223
(5.45)
und f¨ ur einlaufende:
1 ηu− = 2(χu − π). 2 Das Innere des Sternes bildet das folgende Rechteck in (5.40) 0 ≤ η ≤ π,
0 ≤ χ ≤ χo ,
(5.46)
(5.47)
wobei χo = arcsinxo . Wir m¨ ussen offensichtlich w¨ahlen χo <
π , 2
da sonst die Ableitungen der Metrik nicht stetig an der Oberfl¨ache sein k¨onnen. Das Rechteck (5.47) wird dann nur von der Kurve (5.45) geschnitten. Das bedeutet, dass die einlaufenden lichtartigen Hyperfl¨achen u ¨berall im Inneren des Sternes schrumpfen. Dagegen ist das Verhalten der auslaufenden lichtartigen Hyperfl¨achen nicht einfach. Wir haben 4 F¨alle, je nachdem, wann die Hyperfl¨ache beim Nordpol (χ = 0) startet (Bild 5.5). 1. η0 < π −3χo . Diese Hyperfl¨achen dehnen sich aus und erreichen die Oberfl¨ache des Sternes mit r 0 > 0. Sie werden glatt mit den (u = konst)-Hyperfl¨achen aussen verbunden, und zwar ausserhalb des Horizontes. 2. η0 = π − 3χo . Diese Hyperfl¨ache dehnt sich im Innern des Sternes aus, erreicht aber seine Oberfl¨ache mit r 0 = 0 und r = 2m. Sie wird glatt mit dem Horizont r = 2m ausserhalb des Sternes verbunden. 3. π−3χo < η0 < π−χo . Diese Hyperfl¨achen dehnen sich aus, erreichen einen Umkehrpunkt innerhalb des Sternes, dann schrumpfen sie und kommen schrumpfend an die Oberfl¨ache mit r < 2m. Sie werden glatt durch die schrumpfenden (u = konst)-Hyperfl¨achen aussen fortgesetzt. 4. η0 ≥ π − χo . Diese Hyperfl¨achen sind innerhalb des Sternes wie die unter 3), aber sie erreichen die Oberfl¨ache des Sternes nicht, sonder fallen in die Singularit¨at η = π. Wir sehen also, wie sich der Horizont im Kollaps bildet. Es ist die Hyperfl¨ache vom Typ 2 (Bild 5.5). Sie beginnt als ein ganz normaler Lichtkegel im Zentrum des Sternes um die Zeit η0 = π − 3χo und taucht an der Oberfl¨ache des Sternes divergenzfrei auf (d.h. mit r 0 = 0), um sich mit der Hyperfl¨ache r = 2m in der Eddington-Finkelstein-Raumzeit glatt zu verbinden. Die Verminderung der Divergenz der Strahlen, welche den Lichtkegel erzeugen, ist verursacht durch die Materie, 224
welche den Lichtkegel kreuzt. Keines der Ereignisse hinter dieser Hyperfl¨ache kann von aussen beobachtet werden. Deshalb heisst diese Hyperfl¨ache Ereignishorizont. Wir bemerken insbesondere, dass die ganze Singularit¨at sich hinter dieser Hyperfl¨ache befindet, sie kann also keine Ereignisse, die ausserhalb des Horizontes liegen, beeinflussen und kann auch von aussen nicht beobachtet werden. Wir wollen noch studieren, wie der Kollaps f¨ ur einen ¨ausseren Beobachter aussieht. Betrachten wir eine Lichtquelle an der Oberfl¨ache des Sternes. Ihre Trajektorie ist durch die Funktionen v(t) und r(t) gegeben, welche durch die Gln. (5.32) und (5.33) bestimmt sind; insbesondere ist t die Eigenzeit der Quelle. Die Eigenzeit des asymptotischen Beobachters stimmt, bis auf eine additive Konstante, mit der retardierten Zeit u u ¨berein. Das Licht, das die Quelle sendet, l¨auft l¨angs der Hyperfl¨achen u = const, bis sie den asymptotischen Beobachter erreicht. Die Beziehung zwischen der Ankunftszeit beim asymptotischen Beobachter und der Sendezeit an der Quelle ist also durch die Funktion u(t) gegeben, die sich ergibt, wenn wir die Funktionen v(t) und r(t) in die Gleichung (5.21) f¨ ur die Ver¨anderlichen v und r einsetzen. Wir haben l¨angs der ganzen Trajektorie: r˙ < 0,
v˙ > 0,
Die Gleichung (5.34) ergibt also, dass s
e > 0.
2m , r˙ = − e2 − 1 − r e + r˙ v˙ = . 1 − 2m r
(5.48) (5.49)
Gln. (5.48) und (5.49) ergeben f¨ ur die Werte der Ableitungen am Horizont r = 2m: r˙H = −e , denn lim
x→0
e−
v˙ H =
1 , 2e
√
e2 − x 1 = . x 2e
Wir haben also r ≈ 2m − e(t − tH ) + . . . , und v ≈ vH + Einsetzen wir in u,
1 (t − tH ) + . . . 2e
r − 1 ; u = v − 2r − 4m ln 2m 225
es ergibt sich e 1 u ≈ −4m ln |t − tH | + vH − 4m − 4m ln + 2e + (t − tH ). 2m 2e
Der leitende Term auf der rechten Seite ist unabh¨angig von der einfallenden Geod¨ate, nur die Korrekturen h¨agen davon ab (durch die Konstante E). Die Rotverschiebung z ist gegeben durch z = u˙ − 1, sie divergiert also, wenn sich die Oberfl¨ache des Sternes dem Horizont n¨ahert. Wir k¨onnen die folgenden Schl¨ usse ziehen: der asymptotische Beobachter wird nie den Fall des Sternes durch den Horizont erleben: das Lichtsignal, das die Information tr¨agt, wird ihn zu keiner endlichen Zeit erreichen! Er wird aber schon fr¨ uher keine Lichtsignale mehr von der Sternenoberfl¨ache empfangen k¨onnen, weil diese Signale zunehmend rotverschoben werden (Verdunkelung!). Zusammenfassend: wir haben die folgenden vier wichtigen Eigenschaften unseres Modells erhalten: 1. Singularit¨at als Endzustand des Kollapses. 2. Bildung eines regul¨aren Horizontes, der die Singularit¨at vor den ¨ausseren Beobachtern versteckt und den Einfluss der Singularit¨at auf den Rest der Raumzeit beschr¨ankt. 3. Divergierende Rotverschiebung und das Einfrieren der Sternenbewegung f¨ ur den asymptotischen Beobachter, wenn sich die Sternenoberfl¨ache dem Horizont n¨ahert, 4. Unbeobachtbarkeit des Falles durch den Horizont f¨ ur die a¨usseren Beobachter. Der erste Punkt soll noch etwas ausgef¨ uhrt werden. Die Singularit¨at bedeutet unendliche Dichte und Kr¨ ummung. Sie ist aus regul¨aren Anfangsdaten entstanden. Das ergibt einen innerer Widerspruch der ART: regul¨are Anfangdaten zusammen mit Einstein-Gleichungen, d.h., gewisse Axiome der Theorie, haben einen Zustand als Folgerung, der andere Axiome der Theorie verletzt—die singul¨aren Punkte haben ja keine beinahe flache Umgebung. Es ist wichtig zu betonen, dass wir hier einen vollst¨andigen Kollaps meinen (vollst¨andiger Kollaps heisst: der Horizont ist erreicht). Eine realistischere Zustandsuhren, dass der Kollaps in einer seiner Phasen gleichung kann in Sonderf¨allen dazu f¨ aufgehalten wird; sobald aber der Horizont u ¨berschritten wird, gibt es keine Hilfe mehr. Man sollte auch den wesentlichen Unterschied beispielsweise zur klassischen Elektrodynamik verstehen. Denn es k¨onnte einwendet werden, dass die Punktladungen 226
der Elektrodynamik auch singul¨are Felder um sich bilden. In der klassischen Elektrodynamik werden aber die Ladungen als kontinuierliche Str¨ome dargestellt. Eine Punktladung zu erzeugen kostet dann unendliche Energie: die gleichen Ladungen stossen ja einander ab. Es gibt konsequenterweise keine Punktladungen in der klassischen Elektrodynamik. In der Gravitationstheorie aber ziehen die gleichen “Ladungen”, d.h., Massen, einander an: sie bilden eine Punktmasse—d.h., Singularit¨at— spontan. Man glaubt, dass die Quantentheorie dieses Problem beseitigen k¨onnte. Diese Eigenschaften bleiben auch f¨ ur viel allgemeinere Modelle des vollst¨andigen Gravitationskollapses erhalten, und werden als allgemein betrachtet. Eine Verallgemeinerung des Punktes 2 auf einen beliebigen vollst¨andigen Gravitationskollaps heisst Hypothese der kosmischen Zensur (keine “nackten” Singularit¨aten sind erlaubt).
5.4
Aufgaben
1. (M, g) sei eine statische, rotationssymmetrische Raumzeit mit der Metrik ds2 = B(r)dt2 − A(r)dr 2 − r 2 dϑ2 − r 2 sin2 ϑdφ2 . Ferner sei Wµν (x) ein beliebiges symmetrisches Tensorfeld vom Typ (0, 2) auf M. Beweisen Sie: wenn Wµν (x) die gleiche Symmetrie hat wie gµν , dann muss es die Form haben: Wµν (x) = 0 f¨ ur alle µ 6= ν und alle x, und Wϑϑ sin2 ϑ = Wφφ . Hinweis: Arbeiten Sie mit Komponenten in Bezug auf eine geeignete orthonormale Basis; rotieren oder spiegeln Sie die Basis und studieren Sie, wie sich die Komponenten des Tensors dabei ¨andern. 2. Berechnen Sie die Christoffel’s {µρσ } und benutzen Sie dann das Resultat oben, um alle Komponenten des Ricci-Tensors Rµν zu berechnen. 3. Benutzen Sie die Resultate aus Aufgabe 1, um die Einstein-Gleichungen f¨ ur die Funktionen A(r), B(r), ρ(r) und p(r) aufzustellen. 4. Beweisen Sie, dass die zwei folgenden Gleichungssysteme ¨aquivalent sind: (1) tt-, rr-, und ϑϑ-Komponenten der Einstein-Gleichungen; (2) tt-, rr-Komponenten der Einstein-Gleichungen, und die Euler-Gleichung. 5. Transformieren Sie die Metrik der externen Schwarzschild-Raumzeit (ESR) in die retardierten Eddington-Finkelstein-Koordinaten u, r, ϑ und ϕ, und 227
konstruieren Sie die ensprechende Erweiterung (REF) von ESR in Analogie zu unserer Erweiterung (AEF) in den avancierten Eddington-FinkelsteinKoordinaten v, r, ϑ und ϕ. Welche Art von Horizont findet man in REF? 6. Berechnen Sie die Dichte ρH des Sternes im Oppenheimer-Snyder-Kollapsmodell im Augenblick, wo die Oberfl¨ache des Sternes den Horizont kreuzt. Die Gesamtmasse m und der Anfangsradius rM sind gegeben. Setzen Sie dann f¨ ur die Masse m = mGalaxie und m = mSonne ein, und rechnen Sie die Resultate in kg/m3 um. 7. Berechnen Sie die Gezeitenkr¨afte (in N/kgm), welche auf einen mitbewegten Beobachter wirken, der sich auf der Sternoberfl¨ache befindet, wobei f¨ ur die Masse die zwei Werte aus Aufgabe 6 einzusetzen sind. Wann wird es unangenehm? Hinweis: Setzen Sie voraus, dass sich der Beobachter im Schwarzschild-Teil der Raumzeit befindet. Rechnen Sie zun¨achst f¨ ur einen ruhenden Beobachter (r = const), und zeigen Sie, dass die Gezeitenkr¨afte im speziellen Fall der Schwarzchild Raumzeit unabh¨angig von der radialen Geschwindigkeit des Beobachters sind.
228
Kapitel 6 Station¨ are schwarze L¨ ocher Im vorhergehenden Kapitel haben wir zwei Raumzeiten studiert, welche schwarze L¨ocher enthalten haben: das war erstens die avancierte Eddington-FinkelsteinRaumzeit (AEF) und zweitens die Oppenheimer-Snyder-Raumzeit (OS). Die Erfahrung erlaubt uns jetzt ein isoliertes schwarzes Loch etwas genauer definieren, als das bisher gemacht worden ist (S. 217): Definition 20 (M, g) sei eine asymptotisch flache Raumzeit und M∞ sei ein asymptotisch flaches Gebiet in M. H sei eine lichtartige Hyperfl¨ache in M, welche M in zwei Gebiete teilt, M+ und M− , wobei M∞ ⊂ M+ . Wenn jedes Ereignis p ∈ M+ f¨ ur einen Beobachter in M∞ sichtbar ist, aber kein Ereignis q ∈ M− , dann heisst H ein absoluter Ereignishorizont in Bezug auf M∞ und M− heisst ein isoliertes schwarzes Loch. Wir wollen jetzt solche schwarze L¨ocher studieren, welche station¨ar sind. Das schwarze Loch, das im Kollaps entstanden ist, ist als ein schlichter Lichtkegel eines Ereignisses im Zentrum des kollabierenden Sternes geboren und somit nicht station¨ar. Ein Beispiel eines station¨aren Loches ist das in AEF, da ein der KillingVektorfelder lichtartig am Horizont ist. Dieses Begriff wollen wir etwas genauer ausf¨ uhren, und dazu brauchen wir mehr u ¨ber Hyperfl¨achen wissen.
6.1
Kausale Struktur
Die Frage, welche Ereignisse einer Raumzeit vom gegebenen Ereignis beeinflusst werden k¨ onnen, ist eine ganz wichtige in der Theorie der schwarzen L¨ ocher, und es ist die zentrale Frage, mit der sich die Theorie der sogenannten kausalen Struktur besch¨ aftigt. Wir haben verstreut schon einige Begriffe der kausalen Struktur kennengelernt: Abh¨ angigkeitsgebiet, Cauchy-Hyperfl¨ ache oder Horizont. F¨ ur das Verst¨ andnis der Raumzeiten von schwarzen L¨ ochern brauchen wir einen systematischeren Zugang. Wir wollen zun¨ achst die Grundbegriffe am Beispiel der Minkowskischen Raumzeit (M, g) erkl¨ aren. Sei p ∈ M; betrachten wir den Lichtkegel von p (Bild 6.3). Er ist durch p in zwei Halb-
229
lichtkegel gespalten: den Zukunfts- (ZLK) und Vergangenheitskegel (VLK). Nehmen wir an, dass q ∈ ZLK; dann und nur dann kann q von p heraus kausal beeinflusst werden. Aehnlich wenn q ∈ VLK: dann und nur dann kann p von q aus kausal beeinflusst werden. Die Beziehungen sind offensichtlich nicht symmetrisch, sie h¨ angen davon ab, welche H¨ alfte des Lichtkegels die ZLK und welche die VLK ist. Welcher nun welcher ist k¨ onnen wir aber nicht einfach aus der Metrik ablesen! Man braucht dazu eine zus¨ atzliche Struktur: die Zeitorientierung. In der Minkowskischen Raumzeit ist die Zeitorientierung einfach mit der Orientierung der X 0 -Achse gegeben: X 0 nimmt in der Zukunftsrichtung zu (wenn nichts anderes gesagt wird). Wie k¨ onnen wir diesen Begriff zu krummen Raumzeiten erweitern? Klar muss lokal alles qualitativ gleich wie in der Minkowski-Raumzeit sein, d.h., in gen¨ ugend kleinen Umgebungen. Global k¨ onnen aber grosse Abweichungen von der gewohnten kausalen Struktur der Minkowski-Raumzeit vorkommen; der tiefe Grund daf¨ ur ist die Lichtablenkung durch Gravitation.
6.1.1
Zeitorientierung
Das ist also eine neue Struktur, die zus¨ atzlich zur Metrik angegeben werden muss. Lokal ist sie physikalisch durch den Entropiesatz oder durch die Eigenschaften des QFT-Vakuumzustands bestimmt, welche sich im β-Zerfall und K-Mesonenzerfall a ¨ussert. Mathematische Beschreibung der Struktur: gegeben die Raumzeit (M, g), p ∈ M sei beliebig. Der Tangentraum Tp M mit der Metrik gµν (p) ist eine Kopie der Minkowski-Raumzeit. In dieser Raumzeit hat p wieder die zwei Halblichtkegel, so dass jeder zeitartige Vektor in p entweder im ZLK oder im VLK liegt. Wenn wir einen solchen Vektor als zukunftsgerichtet w¨ ahlen, definieren wir den entsprechenden Kegel als zukunftsgerichtet. Somit bestimmt ein stetiges, zeitartiges Vektorfeld in M eine Zeitorientierung. Den entsprechenden Halblichtkegel in jedem Punkt nennen wir zukunftsgerichtet. Definition 21 Eine Raumzeit (M, g) ist zeitorientiert, wenn ein stetiges zeitartiges Vektorfeld T µ (x) u ¨berall in M angegeben ist. Wir bezeichnen eine solche Raumzeit oft durch das Symbol (M, g, T ). Manipulationen mit der Zeitorientierung basieren auf dem folgenden Satz. Theorem 20 Seien uµ und v µ nichtraumartige, nichtverschwindende Vektoren in p. Wenn gµν uµ v ν > 0, dann liegen beide im gleichen Halblichtkegel. Wenn gµν uµ v ν < 0, dann liegen sie in verschiedenen Halblichtkegeln. Die Gleichung gµν uµ v ν = 0 ist ¨aquivalent dazu, dass uµ und v µ zwei linear abh¨angige lichtartige Vektoren sind. Umgekehrt: wenn beide Vektoren im gleichen Halblichtkegel liegen, dann ist gµν uµ v ν ≥ 0, und wenn beide in verschiedenen Halblichtkegeln liegen, dann gµν uµ v ν ≤ 0. Beweis: Zun¨ achst brauchen wir eine geeignete Notation. Wir w¨ ahlen Inertialkoordinaten in µ (Tp M, g(p)). Wir k¨ onnen dann einen 4er-Vektor u durch ein Paar (u0 , ~u) darstellen, wobei u0 eine Zahl und ~u ein 3er-Vektor ist. Dass die Vektoren u und v beide im gleichen Halblichtkegel liegen, k¨ onnen wir jetzt durch die Ungleichung u0 v 0 > 0, dass sie in verschiedenen Halblichtkegeln liegen durch u0 v 0 < 0 ausdr¨ ucken, und das Skalarprodukt der 4er-Vektoren ist gegeben durch gµν uµ v ν = u0 v 0 − ~u · ~v . Da die beiden Vektoren nicht raumartig sind, haben wir (u0 )2 ≥ ~u · ~u und (v 0 )2 ≥ ~v · ~v . Das ergibt: p |u0 v 0 | ≥ (~u · ~u)(~v · ~v ),
230
die Gleichheit gilt nur, wenn beide Vektoren lichtartig sind. Die Schwarz-Ungleichung ergibt weiter p (~u · ~u)(~v · ~v ) ≥ |~u · ~v |, die Gleichheit gilt nur, wenn ~u und ~v linear abh¨ angig sind. Die beiden Ungleichungen implizieren |u0 v 0 | ≥ |~u · ~v |,
(6.1)
die Gleichheit gilt nur, wenn beide Vektoren lichtartig und ~u und ~v linear abh¨ angig sind. 1. gµν uµ v ν > 0. Annahme f¨ ur den Beweis durch Widerspruch: u0 v 0 ≤ 0. Dann folgt aus (6.1) u0 v 0 = −|u0 v 0 | ≤ −|~u · ~v | ≤ ~u · ~v , also u0 v 0 − ~u · ~v ≤ 0, und das ist der Widerspruch. 2. gµν uµ v ν < 0. Der Beweis ist analog. 3. gµν uµ v ν = 0. Dann ist u0 v 0 = ~u · ~v , also |u0 v 0 | = |~u · ~v |. Die Ungleichung (6.1) impliziert dann, dass u und v beide lichtartig und ~u und ~v linear abh¨ angig sind. Es gibt also zwei 2 2 Zahlen a und b so, dass a~u + b~v = 0 und a + b 6= 0. Betrachten wir den Vektor au + bv; er ist lichtartig: gµν (auµ + bv µ )(auν + bv ν ) = a2 gµν uµ uν + 2abgµν uµ v ν + b2 gµν v µ v ν = 0. Aber: au+bv = (au0 +bv 0 , 0, 0, 0). Er ist nur lichtartig, wenn au0 +bv 0 = 0 und die Vektoren u und v sind linear abh¨ angig. 4. Der Rest des Beweises ist einfach (Aufgabe), QED. Sei nun (M, g, T ) eine zeitorientierte Raumzeit und uµ ein nichtraumartiger Vektor in p. Wie erkennen wir, ob uµ zukunfts- oder vergangenheitsgerichtet ist? Wir berechnen den Ausdruck gµν T µ uν ; ist er positiv, so ist uµ zukunftsgerichtet; ist er negativ, so ist u vergangenheitsgerichtet. Es besteht keine weitere M¨ oglichkeit (T ist zeitartig). Diese Eigenschaften von u sind unabh¨ angig davon, welches Vektorfeld T wir zur Bestimmung der Zeitorientierung gew¨ ahlt haben. Es gibt Raumzeiten, welche keine stetigen zeitartigen Vektorfelder zulassen (Aufgabe); solche heissen nicht zeitorientierbar. Beispiel: Kruskal-Raumzeit ist zeitorientierbar: das Vektorfeld T µ = (1, 0, 0, 0) in Bezug auf Kruskal-Koordinaten ist glatt u ¨berall auf M und gµν T µ T ν =
32m3 − r(τ,ξ) e 2m > 0 r(τ, ξ)
f¨ ur jedes r > 0, also zeitartig.
6.1.2
Kausaler Einfluss
(M, g, T ) sei eine zeitorientierte Raumzeit. Wir nennen eine Kurve xµ (λ) orientierte kausale Kurve (OKK), wenn a) die Funktionen xµ (λ) stetig und st¨ uckweise glatt sind, so dass x˙ µ± (λ) u ¨berall wohldefiniert ist (“±” bezeichnet Ableitungen von links und von rechts), und b) gµν T µ x˙ ν± gµν x˙ µ± x˙ ν±
231
≥ 0,
≥ 0.
Es ist klar, dass die Gleichheit in der ersten Ungleichung nur dann gelten kann, wenn x˙ µ± = 0; auch triviale Kurven xµ (λ) = xµ (p) sind OKK: jedes Ereignis kann sich selbst kausal beeinfl¨ ussen. Dann k¨ onnen wir definieren: die kausale Zukunft J + (p) von p ist die Menge der Punkte, die von p her beeinflusst werden k¨ onnen, also J + (p) := {q ∈ M|∃OKK von p zu q}, und die kausale Vergangenheit J − (p) von p ist die Menge der Punkte, die p beeinflussen k¨ onnen, also J − (p) := {q ∈ M|∃OKK von q zu p}. In der Minkowski-Raumzeit sind J ± (p) identisch mit den Halblichtkegeln von p; in einer allgemeinen Raumzeit u ¨bernehmen sie die Rolle dieser Halblichtkegel. Es gilt p ∈ J + (p) und p ∈ J − (p). Wir nennen eine Raumzeit (M, g, T ) kausal, wenn J + (p) ∩ J − (p) = {p} f¨ ur alle p ∈ M. Wenn man n¨ amlich annimmt, dass q 6= p, q ∈ J + (p) und zugleich q ∈ J − (p), dann gibt es eine kausale Schleife: es gibt OKK von p zu q und eine andere von q zu p. Es gibt Beispiele von Raumzeiten, welche nicht kausal sind (Aufgabe). Ein n¨ utzlicher Begriff ist die sog. Zeitfunktion: das ist eine Funktion τ : M 7→ R, die glatt ist und l¨ angs jeder nichttrivialen OKK zunimmt, genauer, τ,µ x˙ µ± ≥ 0, die Gleichheit gilt nur, wenn x˙ µ± = 0. Wenn eine Zeitfunktion existiert, dann muss die Raumzeit kausal sein, da keine stetige Funktion u angs einer Schleife zunehmen kann. In den Raumzeiten, welche eine Zeitfunktion ¨berall l¨ besitzen, sehen die Mengen J ± (p) in gen¨ ugend kleiner Umgebung von p aus wie die Halblichtkegeln in der Minkowski-Raumzeit (Bild 6.4).
Beispiel: Die Kruskal-Raumzeit ist kausal. Die Koordinatenfunktion τ ist u ¨berall auf der Raumzeit definiert und nimmt l¨ angs jeder OKK zu. Sei n¨ amlich die OKK gegeben durch τ = τ (λ), ξ = ξ(λ), ϑ = ϑ(λ), und ϕ = ϕ(λ). Dann ist gµν x˙ µ T ν > 0, und wenn wir den Ausdruck f¨ ur die Metrik in den Kruskal-Koordinaten darin einsetzen, ergibt sich τ˙ > 0. Also: τ nimmt zu.
6.2
Hyperfl¨ achen
Es ist g¨ unstig, die Hyperfl¨achen etwas anders als durch eine Gleichung u = 0 zu definieren (z.B., die letzteren sind immer orientiert und damit weniger allgemein). Das wollen wir tun, und auch einige wichtige Eigenschaften der Hyperfl¨achen in Raumzeiten beschreiben.
6.2.1
Definition
(M, g) sei eine Raumzeit und S¯ eine dreidimensionale Mannigfaltigkeit. Eine glatte ¯ in M ist durch eine Abbildung ι : S¯ 7→ M mit den EigenHyperfl¨ache S = ι(S) schaften definiert; a) ι hat eine Inverse ι−1 auf S, und b) wenn {y k } Koordinaten in einer Umgebung von p ∈ S¯ in S¯ und {xµ } Koordinaten in einer Umgebung von ι(p) ∈ S in M sind, dann kann die Abbildung ι durch die Einbettungsfunktionen xµ (y 1 , y 2 , y 3 ) dargestellt werden; wir verlangen, dass die (3 × 4)-Matrix ∂xµ /∂y k den Rang 3 hat. Man kann y 1 , y 2 und y 3 als Funktionen auf S und so dort als Koordinaten betrachten (Bild 6.5). 232
6.2.2
Tangentialvektoren
Ein Tangentvektor zu S kann als Tangentvektor in M zu einer Kurve definiert werden, welche in S liegt. Die vier Funktionen xµ (λ, y 2 , y 3 ) einer Variablen λ, wobei y 2 und y 3 festgehalten werden m¨ ussen, definieren eine solche Kurve auf S. Eine 2 3 ur y und y ergibt, dass die drei Vektoren mit Komponenten ¨ahnliche Ueberlegung f¨
∂x3 ∂x0 , . . . , ∂y k ∂y k
,
k = 1, 2, 3,
drei Tangentvektoren zu S in jedem Punkt sind. Die Bedingung b) bedeutet also, dass die drei Vektoren ∂xµ /∂y k , k = 1, 2, 3, u ¨berall auf S linear unabh¨angig sind. Jede Kurve C auf S definiert eindeutig eine Kurve C¯ auf S¯ durch C¯ := ι−1 ◦ C, und es gilt dann xµ (λ) = xµ (y(λ)), ¯ ◦ ι−1 ◦ C. Somit l¨asst sich jeder Tangentvektor wobei xµ (λ) = h ◦ C und y k (λ) = h zu S als eine lineare Kombination von ∂xµ /∂y k , k = 1, 2, 3 schreiben, denn x˙ µ (λ) =
∂xµ k y˙ (λ). ∂y k
Die Vektoren ∂xµ /∂y k , k = 1, 2, 3 bilden also eine Basis f¨ ur die Tangentvektoren zur Hyperfl¨ache im entsprechendem Punkt (Bild 6.6). Jeder Tangentvektor uµ zu S in p ∈ S kann also geschrieben werden: µ
u =u ¯
k ∂x
µ
∂y k
,
wobei die u ¯k als Komponenten von u in Bezug auf die Koordinaten {y k } aufgefasst werden k¨onnen.
6.2.3
Induzierte Metrik
Die L¨ange der Kurven, welche auf der Hyperfl¨ache S liegen, ist bekanntlich gegeben durch ∂xµ ∂xν γkl := gµν k l . ∂y ∂y γkl heisst die von gµν auf S induzierte Metrik. D.h., die Komponenten von γkl sind µ Skalarprodukte der Basisvektoren ∂x . Wie wir sehen werden, braucht γkl keine ∂y k Metrik in unserem Sinne zu sein (nichtdegeneriert). Wir wollen deshalb den Begriff der Metrik ein bisschen erweitern, so dass eine degenerierte Metrik erlaubt wird. 233
6.2.4
Normale
Eine Normale N µ zu S ist jeder nichtverschwindender Vektor, der der Gleichung ν = 0 f¨ ur alle k. D.h., sie ist orthogonal auf alle Tangentvektoren gen¨ ugt: gµν N µ ∂x ∂y k zu S. Es gibt viele solche Vektoren in jedem Punkt p ∈ S, die aber alle in einem eindimensionalen Unterraum von Tp M liegen. Die Menge Np S aller m¨oglichen Normalen in diesem Punkt ist dieser Unterraum ohne den Ursprung; das ist eine Menge in zwei Komponenten. Gegeben die Normale N µ und ein Vektor tµ in p ∈ S, der die Gleichung gµν N µ tν = 0 erf¨ ullt, dann ist tµ tangential zu S. Beweis: ein solcher Vektor tµ erf¨ ullt die Bedinµ gung Nµ t = 0. Das ist eine nichttriviale lineare Gleichung, und die L¨osungen f¨ ullen also einen dreidimensionalen Unterraum von Tp M. Die Tangentialvektoren erf¨ ullen diese Bedingung auch, und auch sie f¨ ullen einen dreidimensionalen Unterraum! Die Unterr¨aume m¨ ussen also u ¨bereinstimmen.
6.2.5
Klassifikation von Hyperfl¨ achen
Wir definieren die zeitartige, raumartige und lichtartige Hyperfl¨ache durch die Signatur ihrer Normale: N µ muss, der Reihe nach, u ¨berall auf S raumartig, zeitartig und lichtartig sein. Wir benutzen auch die sog. nichtzeitartige Hyperfl¨ache, deren Normale u ¨berall nichtraumartig sein muss. Was sind die Konsequenzen dieser Definition f¨ ur die Signaturen der induzierten Metrik und die relative Lage der Hyperfl¨ache in Bezug auf den lokalen Lichtkegel? Sei p ∈ S; wir w¨ahlen ein Lokalinertialsystem xµ in p. Die Metrik in p hat dann die Form gµν (p) = ηµν . Wir bezeichnen die Basis in p, die mit den Koordinaten assoziiert ist, durch (e0 , e1 , e2 , e3 ); diese Vektoren sind durch ihre Komponenten in Bezug auf xµ durch: eµα := δαµ . Der Tangentraum Tp M zusammen mit der Metrik gµν (p) in Tp M bildet Minkowskische Raumzeit (Tp M, gµν (p)). Eine wichtige Rolle spielt der Lichtkegel Lp M des Punktes p in dieser Minkowskischen Raumzeit. Die Tangentvektoren aller kausalen Kurven, welche durch p laufen, m¨ ussen in diesem Lichtkegel liegen, und zwar im Zukunfthalblichtkegel L+ p M. Der Lichtkegel ist begrenzt durch die Vektoren der Form l eµ0 + nk (ϑ, ϕ)eµk ,
wobei l ∈ R und nk (ϑ, ϕ) durch Gl. (4.5) definiert ist. Die Grenze des Zukunftshalblichkegels ist gegeben durch l ∈ (0, ∞). Sei zuerst die Hyperfl¨ache zeitartig. Dann kann das LIS so gew¨ahlt werden, dass µ N = (0, 0, 0, n), wobei n eine Zahl ist. Dann ist Nµ = (0, 0, 0, −n), die Gleichung Nµ tµ = 0 wird somit zu t3 = 0, und alle L¨osungen davon haben die Form t0 eµ0 + t1 eµ1 + t2 eµ2 , wobei (t0 , t1 , t2 ) ∈ R3 . Sie bilden den Tangentraum Tp S zu S in p; Tp S 234
ist also eine zeitartige Ebene in Tp M; eµ0 , eµ1 und eµ2 sind drei linear unabh¨angige orthonormale Tangentialvektoren zu S in p. Die induzierte Metrik kann dann zur Form diag(1, −1, −1) gebracht werden und hat also die Signatur -1. Welche ist die relative Lage von Tp S und Lp M, bzw. L+ p M? Die Ebene Tp S schneidet Lp M quer durch. Die gemeinsamen Vektoren von Lp M und Tp S erf¨ ullen leµ0 + lnk (ϑ, ϕ)eµk = t0 eµ0 + t1 eµ1 + t2 eµ2 , also n3 (ϑ, ϕ) = 0 oder ϑ = π/2 und t0 = l, t1 = l cos ϕ, und t2 = l sin ϕ. Die Komponente der Vektoren im Zukunfthalblichkegel in Richtung der Normale N µ = eµ3 ist l cos ϑeµ3 . Da l > 0, zeigt diese Komponente in Richtung von N µ , wenn ϑ < π/2. Es gibt also Kurven, welche S im Punkt p in Richtung der Normale N µ kreuzen, aber auch solche, welche das gegen die Richtung tun: eine zeitartige Hyperfl¨ache kann von kausalen zukunftgerichteten Kurven in beiden Richtungen gekreuzt werden. F¨ ur eine raumartige Hyperfl¨ache ist das Vorgehen analog, sie f¨ uhrt zu drei raumartigen orthonormalen Tangentialvektoren und zur Signatur -3. Wir haben also Tp S von den Vektoren der Form t1 eµ1 + t2 eµ2 + t3 eµ3 und die Normale N µ = eµ0 . Die Gleichung leµ0 + lnk (ϑ, ϕ)eµk = t1 eµ1 + t2 eµ2 + t3 eµ3 hat jetzt nur die L¨osung l = 0 und t1 = t2 = t3 = 0. Eine raumartige Hyperfl¨ache trennt den Lichtkegel Lp M in seine Zukunfts- und Vergangenheitshalblichtkegel. Die Normale N µ = eµ0 ist so gew¨ahlt, dass sie in der Zukunftsh¨alfte liegt. Die raumartige Hyperfl¨ache kann also nur in einer Richtung von Teilchen und Licht gekreuzt werden, n¨amlich in der der zukunftsorientierten Normale. Endlich, f¨ ur eine lichtartige Hyperfl¨ache k¨onnen wir das LIS so w¨ahlen, dass µ N = n(1, 0, 0, 1) und Nµ = n(1, 0, 0, −1). Dann ergibt die Gleichung Nµ tµ = 0, dass t0 − t3 = 0. Alle L¨osungen dazu sind gegeben durch t0 (eµ0 + eµ3 ) + t1 eµ1 + t2 eµ2 mit (t0 , t1 , t2 ) ∈ R3 . Diese bilden eine lichtartige Hyperebene in Tp M; die drei linear unabh¨angigen Tangentialvektoren sind eµ0 +eµ3 , eµ1 und eµ2 . Sie sind aufeinander orthogonal, und die Quadrate ihrer Normen sind, der Reihe nach: 0, -1, -1. Die induzierte Metrik l¨asst sich also zur Form diag(0, −1, −1) bringen, sie hat keine wohldefinierte Signatur und ist degeneriert. Der Tangentialvektor eµ0 +eµ3 ist zu jedem anderen Tangentialvektor orthogonal, einschliesslich sich selbst: es eine die Normale! Die Normale ist also zugleich tangential zu S und annihiliert die induzierte Metrik, γkl N k = 0. Betrachten wir wieder die Gleichung leµ0 + lnk (ϑ, ϕ)eµk = t0 (eµ0 + eµ3 ) + t1 eµ1 + t2 eµ2 . Es folgt, dass l = t0 und n3 = 1, d.h., ϑ = 0. Es gibt also eine einzige gemeinsame Richtung im Tp S und Lp M, t0 (eµ0 + eµ3 ) = t0 N µ , d.h., die Normale. Die Ebene Tp S 235
ber¨ uhrt Lp M in dieser Richtung. Damit liegt der Zukunftshalblichtkegel auf einer Seite von Tp S, und die kausalen Kurven k¨onnen S in p wieder nur in einer Richtung kreuzen. Man kann die Art der Hyperfl¨ache aus der Form der darauf induzierten Metrik ablesen, weil es keine andere M¨oglichkeit gibt ausser dieser drei in einem Punkt einer beliebigen Hyperfl¨ache. Insbesondere ist Det(γkl ) > 0 f¨ ur zeit-, Det(γkl ) < 0 f¨ ur raum- und Det(γkl ) = 0 f¨ ur lichtartige Hyperfl¨achen. Wir haben einen wichtigen Satz gezeigt: Theorem 21 Kausale, zukunftsorientierte Kurven k¨onnen eine zeitartige Hyperfl¨ache in beiden Richtungen, eine raum- oder lichtartige Hyperfl¨ache aber nur in einer Richtung in jedem Punkt kreuzen. Jetzt k¨onnen wir auch eine Definition eines station¨ares schwarzen Loches geben. Definition 22 (M, g) sei eine asymptotisch flache Raumzeit mit einem absoluten Ereignishorizont H. Das isolierte schwarze Loch heisst station¨ar, wenn es ein Killing-Vektorfeld in M gibt, das u ¨berall normal zum Horizont H steht. Beispiele: 1. AEF-Raumzeit enth¨alt ein statin¨ares schwarzes Loch nach unserer Definition. 2. Kosmologische Horizonte in DeSitter-Raumzeit sind nicht Horizonte von isolierten station¨aren schwarzen L¨ochern, wenn auch Killing-Felder existieren, welcher orthogonal zu diesen Horizonten stehen, denn die Raumzeit ist nicht asymptotisch flach!
6.2.6
Orientierung
S sei eine Hyperfl¨ ache in M, p ein Punkt in S; wenn eine der zwei H¨ alften von Np S ausgesondert ist, heisst das, dass S orientiert in p wird. Das k¨ onnen wir tun, indem wir eine feste Normale nµ in p angeben (welche in der entsprechenden H¨ alfte liegt). Eine Hyperfl¨ ache S heisst orientierbar, wenn die Normale dazu in jedem Punkt von S gew¨ ahlt werden kann, so dass sie ein stetiges Vektorfeld auf S bildet. Damit haben wir in jedem Punkt der Hyperfl¨ ache eine Orientierung. Beispiel einer nichtorientierbaren Fl¨ ache ist das M¨ obiusband in E3 : wenn man l¨ angs einer geschlossenen Kurve auf dem Band mit einer Orientierung stetig fortschreitet, kommt man zur¨ uck mit umgekehrter Orientierung. Von einer solchen Schleife sagen wir, dass sie die Orientierung umkehrt. Wir bemerken, dass dieses stetige Fortschreiten die Orientierung eindeutig l¨ angs einer Kurve vom Anfangspunkt transportiert. Man kann schnell sehen, dass eine Hyperfl¨ ache dann und nur dann orientierbar ist, wenn es keine Schleifen darauf gibt, welche die Orientierung umkehren w¨ urden. Eine Orientierung kann dann aus einem Punkt stetig und eindeutig l¨ angs Verbindenden in einen beliebigen Punkt der Hyperfl¨ ache gebracht werden. Theorem 22 (M, g) sei zeitorientierbar. Dann sind alle nichtzeitartigen Hyperfl¨achen im M orientierbar.
236
Beweis: Sei eine Zeitorientierung durch ein Vektorfeld T µ definiert. T µ (x) bestimmt ein stetiges Vektorfeld auf S, das nirgends tangential zu S ist (nichtzeitartige Hyperfl¨ achen haben keine zeitartigen Tangentialvektoren). Sei C eine geschlossene Kurve auf S, gegeben durch die Funktionen y k (λ), λ ∈ [0, 2π] mit einem Normalenfeld nµ (λ), das stetig im Intervall [0, 2π] ist und den Sprung nµ (0) = −nµ (2π) hat. Definieren wir die Funktion f (λ) durch f (λ) := gµν T µ nν . f (λ) ist eine stetige Funktion von λ im Intervall (0, 2π), und erf¨ ullt f (0) = −f (2π). Nehmen wir an, dass f (0) > 0 (sonst kann man die Normale umkehren). Dann ist u ¨berall f (λ) > 0, weil f nirgends null sein darf. Das ist der Widerspruch. Daraus folgt, dass das stetige Normalenfeld zu einer solchen Hyperfl¨ ache immer in die Zukunft gerichtet werden kann. Die entsprechende Seite der Hyperfl¨ ache heisst Zukunftsseite. Man kann den folgenden Satz zeigen (der Beweis ist schwieriger): Theorem 23 (M, g, T ) sei eine zeitorientierte Raumzeit, welche eine Zeitfunktion zul¨asst. S sei eine nichtzeitartige Hyperfl¨ache, welche M in zwei disjunkte Teilraumzeiten M+ und M− trennt, wobei M+ an der Zukunfts- und M− an der Vergangenheitsseite von S liegt. Sei C eine OKK, welche die Punkte p ∈ M+ und q ∈ M− verbidet. Dann schneidet C die Hyperfl¨ache S in einer zusammenh¨angenden Menge, und l¨auft von q zu p.
6.3
Kruskal-Raumzeit
In diesem Abschnitt wollen wir die Schwarzschild-Mannigfaltigkeit maximal analytisch erweitern, so dass keine Materie vorhanden ist. Das Resultat dieser Erweiterung, die sog. Kruskal-Mannigfaltigkeit, ist ein lehrreiches Beispiel einer Raumzeit mit einem schwarzen Loch. Zu diesem Zweck erinnern wir uns, dass das statische Killing-Vektorfeld zeitartig u ¨ber, lichtartig auf, und raumartig unter dem Horizont ist, und dass dieses Verhalten beispielsweise f¨ ur das KillingVektorfeld eines Boostes charakteristisch ist. Auf der Hypothese, dass das Killing-Feld in der N¨ ahe des Horizonts wie eines des Boostes aussieht, basiert die Transformation zu Kruskal-Koordinaten. Betrachten wir zun¨ achst den Boost einer 2-dimensionalen flachen Raumzeit mit den Koordinaten τ und ξ, und der Metrik ds2 = dτ 2 − dξ 2 , und f¨ uhren die Koordinaten t und r ein, welche der Boostsymmetrie angepasst sind, so dass der Boost durch die Transformation t 7→ t + s and r 7→ r beschrieben wird. Das Bild 6.1 zeigt, dass es 4 verschiedene Quadrante gibt. Die allgemeinste M¨ oglichkeit einer solchen Koordinatentransformation in den Quadranten I und II ist τ
= X(r) sinh(xt),
ξ
= X(r) cosh(xt),
wobei X > 0 in I und X < 0 in II eine Funktion von r und x eine Konstante ist; in den Quadranten III und IV ist: τ
= Y (r) cosh(yt),
ξ
= Y (r) sinh(yt),
wobei Y > 0 in III und Y < 0 in IV eine Funktion von r und y eine Konstante ist. Wir suchen die Funktionen X(r) und Y (r), so dass u ¨berall (ausser r = r0 ) die Metrik resultiert ds2 =
r − r0 2 r0 dt − dr2 , r0 r − r0
die offensichtlich eine a at bei r = r0 hat, wie die Schwarzschild-Metrik ¨hnliche Art von Singularit¨ bei r = 2m. Es folgt, dass √ √ X = a r − r0 , Y = a r0 − r,
237
x=y=
√ a = ±2 r0 .
1 , 2r0
Wir erhalten dann in den Quadranten I und II τ ξ
√ t = a r − r0 sinh , 2r0 √ t = a r − r0 cosh , 2r0
und in den Quadranten III und IV: τ ξ
√ t , = a r0 − r cosh 2r0 √ t , = a r0 − r sinh 2r0
wobei a > 0 im Quadrant I und III, und a < 0 im Quadrant II und IV. Man sieht, dass dann r = r0 −
τ 2 − ξ2 , a2
also dass r eine differenzierbare Funktion im ganzen Bereich ist, gr¨ osser (kleiner) als r0 im Quadrant I und II (III und IV), Das motiviert den Versuch, Analogie zu τ und ξ im Schwarzschild-Fall zu suchen. Seien also t ∈ (−∞, ∞) und r > 2m die Schwarzschild-Koordinaten; wir machen den Ansatz τ ξ
√ t = a(r) r − 2m sinh , 4m √ t . = a(r) r − 2m cosh 4m
Jetzt ist a eine Funktion von r, damit wir unsere Freiheit nicht zu viel beschr¨ anken. Das impliziert √ a √ 1 t t √ dτ = dt + dr, a + a0 r − 2m sinh r − 2m cosh 4m 4m 4m 2 r − 2m √ a √ t t 1 √ dξ = r − 2m sinh dt + a + a0 r − 2m cosh dr, 4m 4m 4m 2 r − 2m und a2 r dτ − dξ = 16m2 2
2
"
r − 2m 2 16m2 dt − r r
1 a0 √ √ r − 2m + a 2 r − 2m
2
dr
2
#
.
Wir wollen, dass der Ausdruck in der eckigen Klammer mit dem (t − r)-Teil der SchwarzschildMetrik u ¨bereinstimmt, d. h., 2 16m2 r 1 a0 √ √ r − 2m = . + r a r − 2m 2 r − 2m Das f¨ uhrt auf die Gleichung
a0 1 = a 4m r mit der L¨ osung a = a0 exp 4m . Die Konstante a0 kann beliebig gew¨ ahlt werden; die einfachste 2 Wahl, welche τ und ξ dimensionsfrei macht ist a0 = 1/2m. Das ergibt: r 32m3 − r r − 2m 2 dt − dr2 = e 2m (dτ 2 − dξ 2 ) r r − 2m r
238
und die Transformation zwischen den Kruskal und Schwarzschild-Koordinaten in der ESR wird im Bereich t ∈ (−∞, ∞) und r ∈ (2m, ∞) zu:
wobei
τ
=
ξ
=
t , 4m p t |κ(r)| cosh , 4m p
|κ(r)| sinh
(6.2) (6.3)
r − 2m r e 2m . (6.4) 2m Die Funktionen τ und ξ heissen Kruskal-Koordinaten. Die ESR ist durch die Ungleichungen gegeben: ξ > 0 und τ 2 − ξ 2 < 0 (Bild 6.2). Die ESR ist durch diese Transformation auf den Quadranten QI der (τ, ξ)-Ebene (Bild 6.2) abgebildet. Die Metrik von ESR hat in den Kruskal-Koordinaten die Form (Kruskal-Metrik): κ(r) :=
ds2 =
32m3 − r(τ,ξ) e 2m (dτ 2 − dξ 2 ) − r2 (τ, ξ)dΩ2 . r(τ, ξ)
(6.5)
Die Funktion r(τ, ξ) ergibt sich, wenn wir die Gleichung κ(r) = −τ 2 + ξ 2 , welche sich aus Gln. (6.2) und (6.3) ergibt, nach r aufl¨ osen. Das ist m¨ oglich und eindeutig. Innerhalb von ESR ist n¨ amlich κ(r) eine positive, streng monotone steigende Funktion von r; sie hat also eine Inverse κ−1 , welche die Funktion r(τ, ξ) durch r(τ, ξ) = κ−1 (−τ 2 + ξ 2 ) definiert. Jetzt kommen wir zum wichtigen Begriff der analytischen Fortsetzung; das ist die mathematische Methode, “neues Land” zu betreten und zu erforschen. Im vorliegenden Fall sind n¨ amlich die 1 Komponenten der Metrik (6.5) analytische Funktionen der Koordinaten τ, ξ. Das folgt daraus, dass die Funktion κ(r) wohldefiniert, steigend, und analytisch im Bereich (0, ∞) ihres Argumentes ist. Sie hat also eine Inverse im Bereich −1 < −τ 2 + ξ 2 < ∞ ihrer Werte. Dann ist die Funktion r(τ, ξ) wohldefiniert und analytisch im Bereich K der (τ, ξ)-Ebene, die durch K := {(τ, ξ) | τ 2 − ξ 2 < 1} definiert ist, denn die Beziehung (6.4) impliziert, dass r > 0 gleichwertig mit τ 2 − ξ 2 < 1 ist. Wir k¨ onnen die Metrik (6.5) zur dieser Ebene analytisch fortsetzen. Auf solche Weise erhalten wir nicht nur eine gr¨ ossere Raumzeit als die ESR, sondern auch automatisch eine L¨ osung der EinsteinGleichungen: diese Gleichungen haben analytische Funktionen der Metrik als Koeffizienten bei den Ableitungen der Metrik, und so ist jede analytische Fortsetzung u osung. Spr¨ unge in ¨berall eine L¨ den Ableitungen der Metrik sind sicher nicht verboten, aber sie haben immer eine Interpretation: eine Quelle, sei sie nun von materieller oder gravitativer Art. Eine analytische Fortsetzung ist also eine nat¨ urliche Methode, eine L¨ osung zu erweitern. Ein Blick auf die erhaltene Metrik zeigt, dass sie regul¨ ar im Bereich K ist. Wir erhalten so die Kruskal-Raumzeit: das ist die Raumzeit mit der Kruskal-Metrik im Gebiet K. Es gibt also noch drei weitere Quadranten, beschr¨ ankt durch die zwei 2 2 Kurven τ − ξ = 1, wo zwei getrennte, echte Singularit¨ aten sitzten. Man sieht schnell, dass die Funktion r(τ, ξ) durch die Transformation (τ, ξ) 7→ (−τ, −ξ), die sog. Inversion I, nicht ge¨ andert wird, und dass sie das Innere der Kruskal-Raumzeit auf sich selbst abbildet. Somit ist die Inversion Realanalytische Funktionen heissen C ω und bilden eine kleine Teilmenge von C ∞ der Funktionen deren alle Ableitungen stetig sind. Eine C ω -Funktion f (x)ist dadurch definiert, dass ihre Taylorentwicklung um jeden Punkt in einer offenen Menge U zur Funktion f (x) in U konvergiert. 1
239
Isometrie der Kruskal-Raumzeit. Die Quadranten QI und QII sind dabei aufeinander abgebildet, und so isometrisch: man kann in QII die Koordinaten so transformieren, dass die ESR resultiert: t , 4m p t . = − |κ(r)| cosh 4m
= −
τ ξ
p
|κ(r)| sinh
(6.6) (6.7)
Das ist die Transformation (6.2) und (6.3), zusammengesetzt mit der Inversion. Die KruskalRaumzeit enth¨ alt damit zwei verschiedene, getrennte Kopien der ESR samt der asymptotischen Gebiete; sie verbindet somit zwei getrennte “Welten” mit ihren Familien von asymptotischen Beobachtern. Wir werden sehen, dass dieses Verhalten typisch f¨ ur die Raumzeiten der station¨ aren schwarzen L¨ ocher ist. Aehnlich sind die Quadranten QIII und QIV isometrisch; die Metrik im QIII wird zur Schwarzschild-Metrik im Bereich t ∈ (−∞, ∞) und r ∈ (0, 2m) (innere SchwarzschildRaumzeit) durch die Transformation umgewandelt: τ
=
ξ
=
und ¨ ahnlich im QIV : τ ξ
p t |κ(r)| cosh , 4m p t . |κ(r)| sinh 4m
p t = − |κ(r)| cosh , 4m p t = − |κ(r)| sinh . 4m
(6.8) (6.9)
(6.10) (6.11)
Die Raumzeit kann nicht mehr erweitert werden: die Grenzen sind echte Singularit¨ aten; somit hat man die maximale analytische Erweiterung der ESR. Die Existenz der zwei Quadranten Q I und QIII mit ihrer gemeinsamen Grenze innerhalb der Kruskal-Raumzeit u ¨berrascht uns nicht, sie sind auch in der AEF vorhanden. Eine echte Ueberraschung sind aber die zwei weiteren Kopien, d.h., die Quadranten QII und QIV . Es sind auch zwei Kopien der Eddington-Finkelstein-Raumzeit in der Kruskal-Raumzeit enthalten: die Quadrantenpaare QI , QIII und QII , QIII . Es gibt auch noch die “retardierte” Eddington-Finkelstein-Raumzeit (REF); sie enth¨ alt auf analoge Weise die Quadranten QI und QIV , oder QII und QIV (Aufgabe). Welche Funktionen sind die Schwarzschild-Koordinaten t und r auf der Kruskal-Mannigfaltigkeit? Die Beziehungen (6.2), (6.3), (6.6) und (6.7) ergeben τ t = 4m arctanh , ξ −1 2 r = κ (−τ + ξ 2 ) in QI und QII . Aehnlich ergeben die Beziehungen (6.8), (6.9), (6.10) und (6.11): τ t = −4m arccoth , ξ r = κ−1 (−τ 2 + ξ 2 ) in QIII und QIV . Die Kurven t = const in QI , QII , QIII und QIV sind also “Geraden” durch den Ursprung, wobei t = ∞ auf H + und t = −∞ auf H − ist; r = const sind die Hyperbeln mit den Asymptoten H + und H − (Bild 6.2). Warum sind also die Koordinaten t und r singul¨ ar? Bei r = 2m sind sie erstens nicht unabh¨ angig, und zweitens ist dort t = ±∞.
240
Die Kruskal-Raumzeit erbt alle Symmetrien der ESR oder der ISR. Das k¨ onnen wir wie folgt zeigen. A) Die Rotationssymmetrie. Die drei Vektorfelder (2.75)–(2.77) sind Killing-Vektorfelder der Metrik (6.5) u ¨berall in K; das findet man leicht durch Einsetzen in die Killing-Gleichung (2.69). Dass Symmetriezentrum—wo die Killing-Vektorfelder der Drehungen verschwinden, oder ¨ aquivalent, wo die Orbits der Gruppe zu einem Punkt degenerieren—ist an der Singularit¨ at r = 0, das heisst an den zwei getrennten “raumartigen” Kurven. Die Tatsache, dass es zwei getrennte “Zentren” gibt, ist auf den krummen Fl¨ achen nichts Aussergew¨ ohnliches: auch die Sph¨ are, als eine Rotationsfl¨ ache betrachtet, hat zwei getrennte Zentren (Nord- und S¨ udpol). Etwas schwieriger ist zu verdauen, dass die Zentren raumartig sind, also keine Punktteilchenobjekte. B) Die Zeitverschiebung t 7→ t + ∆t in der ESR oder der ISR. (In der ISR ist diese Transformation raumartig, also eigentlich keine Zeitverschiebung.) Das entsprechende Killing-Feld X µ hat in den Schwarzschild-Koordinaten die Komponenten (1, 0, 0, 0). Die Transformation (6.2)–(6.3) zu Kruskal-Koordinaten in QI ergibt 1 X 0µ = (ξ, τ, 0, 0). 4m Es kann in dieser Form auf die ganze Kruskal-Raumzeit ausgedehnt werden; es ist einfach zu zeigen, dass das Resultat ein Killing-Vektorfeld auf der ganzen Kruskal-Raumzeit ist. X µ ist also nur zeitartig in den Quadranten I und II, es ist raumartig in III und IV, und lichtartig an den zwei einander kreuzenden Hyperfl¨ achen H + und H − , wo r = 2m ist. Es sieht wirklich aus wie ein Boost. C) Die Parit¨ at. Diese Abbildung ist in den Schwarzschild-Koordinaten durch t 7→ t,
r 7→ r,
ϑ 7→ π − ϑ,
ϕ 7→ ϕ + π
gegeben. In den Kruskal-Koordinaten haben wir also τ 7→ τ,
ξ 7→ ξ,
ϑ 7→ π − ϑ,
ϕ 7→ ϕ + π.
Wir bezeichnen diese Abbildung durch P . P ist klar eine Symmetrie der Metrik (6.5) in der ganzen Kruskal-Raumzeit. D) Die Zeitspiegelung t 7→ −t in der ESR und der ISR. In der ESR ist diese Zeitspiegelung wirklich zeitartig, und sie schickt jeden Punkt der ESR in einen Punkt der ESR. Die Transformationsformeln (6.2)–(6.3) ergeben dann die Form dieser Abbildung in den Kruskal-Koordinaten: τ 7→ −τ,
ξ 7→ ξ,
ϑ 7→ ϑ,
ϕ 7→ ϕ.
Wir bezeichnen diese Abbildung durch T1 . T1 ist aber eine Isometrie der Metrik (6.5) in der ganzen Kruskal-Raumzeit, wie man leicht sieht. Als solche transformiert sie die Quadrante wie folgt: QI 7→ QI ,
QII 7→ QII ,
QIII 7→ QIV ,
QIV 7→ QIII .
T1 ist keine Symmetrie der AEF, weil sie sie in die REF schickt! Die Zeitspiegelung in der ISR ist eigentlich keine Zeit-, sondern eine Raumspiegelung. Die Transformationsformeln (6.8)–(6.9) ergeben daf¨ ur τ 7→ τ, ξ 7→ −ξ, ϑ 7→ ϑ, ϕ 7→ ϕ. Wir bezeichnen diese Abbildung durch T2 . T2 ist wiedrum eine Isometrie der ganzen KruskalRaumzeit; die entsprechende Transformation der Quadrante ist: QI 7→ QII ,
QII 7→ QI ,
QIII 7→ QIII ,
241
QIV 7→ QIV .
Sie schickt die AEF in die REF und umgekehrt. Unsere Inversion I ist nicht unabh¨ angig von den Zeitspiegelungen: I = T 1 ◦ T2 . Wir k¨ onnen also das u ¨berraschende Erscheinen der Quadranten QIII und QIV in der maximalen analytischen Fortsetzung von der ESR als eine Folgerung der Zeitspiegelunssymmetrie betrachten.
6.3.1
Rotationssymmetrische Hyperfl¨ achen in der KruskalRaumzeit
F¨ ur jede rotationssymmetrische Hyperfl¨ ache in der Kruskal-Raumzeit hat die Abbildung ι die Form: τ ξ
= h0 (y 1 ), 1
= h1 (y ),
(6.12) (6.13)
2
ϑ = y , ϕ = y3 und die Abbildung ι hat die Mannigfaltigkeit S¯ = R × S 2 als Definitionsbereich. (Die Fl¨ ache ist durch die Profilkurve bestimmt.) Die Tangentialvektoren zu Hyperfl¨ achen (6.12) und (6.13) sind gegeben durch (h00 , h01 , 0, 0), (0, 0, 1, 0), (0, 0, 0, 1), und die Normale durch nµ = (n0 , n1 , 0, 0), wobei n0 h00 − n1 h01 = 0.
(6.14)
Betrachten wir zun¨ achst die Hyperflachen, l¨ angs deren r = const. Im Quadranten I sind sie 1 1 1 gegeben durch h0 (y ) = a sinh(y ) und h1 (y ) = a cosh(y 1 ), wobei a > 0. Die Normale, welche die Gleichung (6.14) erf¨ ullt, ist z.B. (sinh(y 1 ), cosh(y 1 ), 0, 0). Das ist ein raumartiger Vektor, also sind es zeitartige Hyperfl¨ achen, wie auch in Minkowski-Raumzeit in den Kugelkoordinaten analoge Fl¨ achen w¨ aren. Im Quadranten II ist die Profilkurve analog, nur a < 0; die Hyperfl¨ achen sind wieder 1 1 zeitartig. Im Quadranten III aber m¨ ussen wir w¨ ahlen h0 (y ) = a cosh(y ) und h1 (y 1 ) = a sinh(y 1 ), wobei a > 0. Diese Hyperfl¨ achen sind raumartig, mit der induzierten Metrik ds2 = −
32m3 − r 2 1 2 e 2m a (dy ) − r2 dΩ2 , r
also Zylinder mit einem konstanten Radius r(a), der mit zunehmendem a abnimmt (Bild 6.7). Die sind homogene, nichtisotrope dreidimensionale R¨ aume. Aehnlich im Quadranten IV, wo a < 0. Alle rotationssymmetrischen lichtartigen Hyperfl¨ achen lassen sich schnell finden (Bild 6.8); sie sind gegeben durch die Funktionen h0 (y 1 ) = y 1 , 1
(6.15) 1
h1 (y ) = ±y + ξ0 ,
(6.16)
wobei ξ0 ∈ (−∞, ∞). Beweis: Die Gleichung (n0 )2 − (n1 )2 = 0 dr¨ uckt die Bedingung aus, dass die Normale lichtartig ist; wir haben also n0 = ±n1 . Die Gl. (6.14) hat dann die L¨ osung: h00 = ±h01 .
242
Als h00 6= 0 (sonst haben wir keine Hyperfl¨ ache!) d¨ urfen wir umparametrisieren, so dass h00 = 1. Das f¨ uhrt auf (6.15) und (6.16). Wir wollen die Hyperfl¨ achen mit dem positiven Vorzeichen auslaufend, die mit dem negativen einlaufend nennen; das ist selbstverst¨ andlich relativ: hier in Bezug auf die Beobachter im Quadranten I. Das Resultat zeigt, dass alle lichtartigen Hyperfl¨ achen im Bild 6.8 als Geraden mit dem Winkel 45o zur Senkrechten erscheinen. Insbesondere sind die zwei Hyperfl¨ achen H ± lichtartig (ξ0 = 0 in beiden F¨ allen). D.h., die Gleichung r = 2m wird durch zwei sich kreuzende lichtartige Hyperfl¨ achen erf¨ ullt. Alle lichtartige Hyperfl¨ achen sind orientierbar: die Zukunftsseite ist “oben” (τ steigend). Betrachten wir jetzt die zwei Hyperfl¨ achen H ± . Sie haben in Bezug auf die asymptotischen Beobachter in Quandrant I zwei wichtige Eigenschaften : a) Die kausalen Signale kreuzen H + nur von Quadranten IV zu II und von I zu III; die Beobachter im ESR (Quadrant I) sehen nichts davon, was in den Quadranten II und III passiert. b) Ein Beobachter im Quadranten I, der am konstanten Radius r = const weilt, bewegt sich l¨ angs der Hyperbeln τ 2 − ξ 2 = const; er wird alle auslaufenden lichtartigen Hyperfl¨ achen mit ξ0 > 0 kreuzen (wenn er unsterblich ist), aber H + nie. Er kann also einige kausale Signale sehen, welche von Ereignissen beliebig nahe an H + innerhalb der Quadranten IV un I gesandt werden. Das sind die zwei Eigenschaften, welche begr¨ unden, dass man H + Ereignishorizont in Bezug auf diese asymptotische Beobachter nennt. Die asymptotischen Beobachter im Quadranten I k¨ onnen umgekehrt nichts in den Quadranten IV und II beeinflussen; H − ist somit ein sog. Einflusshorizont f¨ ur diese Beobachter. Bemerke: die zwei “Zivilisationen” von asymptotischen Beobachtern (eine in I, andere in II) sind vollst¨ andig kausal getrennt: keine Signale der einen k¨ onnen je die andere erreichen. Wir wollen diese Eigenschaften mit der Minkowskischen Raumzeit vergleichen. F¨ uhren wir die Kugelkoordinaten t, r, ϑ und ϕ ein; dann sind alle Hyperfl¨ achen r = const zeitartig, d.h., f¨ ur alle kausalen Signale beidseitig durchl¨ assig. Die induzierte Metrik auf den rotationssymmetrischen lichtartigen Hyperfl¨ achen ist ds2 = −r2 (h0 (y 1 ), h1 (y 1 ))[(dy 2 )2 + sin2 y 2 (dy 3 )2 ], also wie erwartet degeneriert. Die Oberfl¨ ache eines rotationssymmetrischen Schnittes an der Stelle (τ, ξ) ist durch 4πr 2 (τ, ξ) gegeben. Aus dem Bild (6.8) folgt, dass die auslaufenden lichtartigen Hyperfl¨ achen im Quadranten I in Zukunft zunehmen und die einlaufenden abnehmen, wie wir es von der Minkowski-Raumzeit gewohnt sind. Der Querschnitt vom H ± bleibt aber konstant, gleich 16πm2 . Im Quadranten III nehmen beide Hyperfl¨ achen, sowohl die aus- als auch die einlaufenden, ab. Jede raumartige Fl¨ ache F bestimmt zwei lichtartige Hyperfl¨ achen, welche F enthalten. Ist 2 F topologisch S , dann nehmen normalerweise die raumartigen Schnitte einer der lichtartigen Hyperfl¨ achen in der Zukunft zu, der anderen ab (Minkowski-Raumzeit). Wenn beide Hyperfl¨ achen konvergieren, wie im Quadrant III, dann heisst F eingefangene Fl¨ache. Dieses Verhalten ist durch die akustische Analogie anschaulich darstellbar (Bild 6.9). Die Fl¨ ussigkeit fliesst mit zunehmender Geschwindigkeit vf zum Loch im Zentrum, wobei am Schallpunkt (sonic point) vf = vs und vs die Schallgeschwindigkeit in der Fl¨ usigkeit ist. Wenn ein akustisches Signal gleichzeitig an jedem Punkt eines Kreises in alle Richtungen ausgesendet wird, bilden sich zwei kreisf¨ ormige Wellenfronten. Am Schallpunkt bleibt die auslaufende Wellenfront stehen; unter dem Schallpunkt nimmt der Radius der einlaufenden als auch der auslaufenden Wellenfront ab. Die Profilkurve, welche die Oberfl¨ ache eines station¨ aren Sternes darstellt, der im Moment t = 0 zu kollabieren beginnt, liegt ganz in den Quadranten I und III (Aufgabe). Das Aeussere des Sternes ist dann der entsprechende Teil dieser Quadranten. Das Innere ist ein Teil einer anderer Raumzeit: es enth¨ alt nichts von den Quadranten II und IV! Deshalb gen¨ ugte es, f¨ ur das Kollapsmodell nur die AEF-Raumzeit zu kennen. Von den raumartigen Hyperfl¨ achen betrachten wir zun¨ achst die mit t = const; sie sind alle isometrisch, es gen¨ ugt also nur die mit t = 0 zu nehmen. Diese ist gegeben durch h0 (y 1 ) = 0
243
und h1 (y 1 ) = y 1 . Wenn die Koordinate y 1 von +∞ abnimmt, nimmt auch die Oberfl¨ ache der rotationssymmetrischen Schnitte ab, wie in der Minkowski-Raumzeit. Anstatt aber in der Mitte r = 0 glatt abzuschliessen, erreicht die Funktion r(τ, ξ) nie den Wert 0 l¨ angs dieser Hyperfl¨ ache, 1 1 sondern hat ein Minimum 2m bei y = 0, und dann nimmt sie wieder Richtung y → −∞ zu (Bild 6.10). Die Fl¨ ache y 1 = 0 ist eine minimale Fl¨ache in der Hyperfl¨ ache t = 0. Wir verstehen jetzt, warum die Ableitung der Kurvenl¨ ange s nach dem Radius r r ds r = dr r − 2m an dieser Stelle divergiert! Wir sehen, dass die raumartige Hyperfl¨ ache t = konst eine Br¨ ucke zwischen den zwei Zivillisationen bildet; es ist die sog. Einstein-Rosen-Br¨ ucke. Die ganze Familie τ = const der raumartigen Hyperfl¨ achen ist im (Bild 6.11) dargestellt. Wir sehen auch, dass die Topologie der Kruskal-Raumzeit S 2 × R2 ist: das Gebiet zwischen
den zwei Kurven τ 2 − ξ 2 = 1 ist topologisch R2 und jeder Punkt darauf ist eine 2-Sph¨ are (die
Singularit¨ at ist, nach eingelebten Sitten, ausgeschnitten und mit Ekel weggeworfen).
6.4
Rotierende, geladene schwarze L¨ ocher
Betrachten wir einen K¨orper in einer asymptotisch flachen Raumzeit, der einen vollst¨andigen Gravitationskollaps durchmacht. Nach der Hypothese der kosmischen Zensur bildet sich in einem sp¨aten Stadium des Kollapses ein schwarzes Loch. Im rotationssymmetrischen Fall wird die Raumzeit ausserhalb des K¨orpers nicht unbedingt von der Schwarzschild-L¨osung beschrieben: Wir erwarten eine starke, aber rotationssymmetrische Strahlung (in diesem Fall kann keine Gravitationsstrahlung vorkommen) um den Stern und den Horizont. Mit der Zeit zerstreut sich die Strahlung: teils vom Loch geschluckt, teils zur Unendlichkeit entweicht. F¨ ur sehr sp¨ate Zeiten wird also eine rotationssymmetrische Vakuuml¨osung eine sehr gute N¨aherung darstellen, und das ist, nach dem Birkhoff-Theorem, die Schwarzschild-Metrik. Der Endzustand des Kollapses wird also das Schwarzschildsche Loch sein. In einem nichtsymmetrischen Fall sollte aber die Geometrie ausserhalb des K¨orpers stark zeitver¨anderlich und von den Einzelheiten des Kollapses abh¨angig sein. Wir erwarten also, dass grosse Mengen von Energie (auch in der Form von Gravitationsstrahlung) abgestrahlt werden k¨onnen. Doch die physikalische Intuition sagt uns, dass nach gen¨ ugend langer Zeitperiode sich der Sturm legen und die Metrik und Materie zu einem station¨aren Zustand tendieren wird. Die herumfliegende Materie und Strahlung wird entweder vom Loch geschluckt, oder in die Unendlichkeit entweichen. Man erwartet also, dass eine station¨are Vakuuml¨osung, oder m¨oglicherweise eine station¨are Elektrovakuuml¨osung im Falle einer starken Ladung des kollabierten K¨orpers, die Raumzeit lange nach dem Kollaps zufriedenstellend beschreibt. Diese Erwartungen werden von Modellrechnungen unterst¨ utzt. Das f¨ uhrt uns zu einer Grundannahme der Theorie vom Gravitationskollaps: 244
F¨ ur gen¨ ugend sp¨ate Zeiten nach einem Gravitationskollaps eines isolierten Objekts wird die Raumzeit mit beliebiger Genauigkeit mit einem Teil einer Elektrovakuuml¨osung u ¨ bereinstimmen. Diese L¨osung ist station¨ar, asymptotisch flach, enth¨alt einen glatten Ereignishorizont, und sie ist glatt zwischen dem Horizont und dem asymptotische Gebiet.
Eine Elektrovakuuml¨osung ist eine L¨osung der Gleichungen:
Gµν = 8πGTµν , ∇ρ F µρ = 0,
Fµν = ∂µ Aν − ∂ν Aµ , 1 1 ρ ρσ Fµρ Fν − gµν Fρσ F Tµν = − . 4π 4
Wir wollen auf die Schilderung verzichten, wie man solche L¨osungen sucht, und wie man die konkreten Raumzeiten gefunden hat, welche in diesem Kapitel eine Rolle spielen: das ist viel, viel komplizierter, als unsere Suche nach den kosmologischen L¨osungen oder der Schwarzschild-L¨osung. Es gen¨ ugt f¨ ur uns zu wissen, dass alle L¨osungen der Einstein-Maxwell-Gleichungen mit den obengenannten Eigenschaften heute bekannt sind: sie bilden die sogenannte Kerr-Newman-Familie. Dass es wirklich alle sind, das ist der Gegenstand der sogenannten Eindeutigkeitss¨atze. Diese S¨atze sind schwierig zu beweisen, und wir werden auch dieses Resultat einfach annehmen. Die Eindeutigkeitss¨atze sind in zwei Hinsichten bemerkenswert. Erstens weiss man also in diesem Sinn alles u ¨ ber die station¨aren schwarzen L¨ocher. Zweitens gibt es eine Unmenge (unendlich-dimensionale Familie) von station¨aren Elektrovakuuml¨osungen die asymptotisch flach sind; die Kerr-Newman-Familie bildet davon eine Teilmenge von Mass null (sehr kleine Teilmenge). Aehnlich bilden alle L¨osungen, welche vollst¨andig kollabierende Sterne enthalten, eine unendlich-dimensionale Familie. Trotzdem konvergiert jede zu einer der Kerr-Newman-L¨osungen. Wenn das wahr ist (ein mathematisch perfekter Beweis ist noch nicht in Sicht, aber Modellrechnungen best¨atigen es), dann geht in einem vollst¨andigen Kollaps eine grosse Menge Information verloren, wenn man annimmt, dass das Resultat des kollapses ein schwarzes Loch ist, deren Zustand dadurch bestimmt wird, was u ¨ber dem Horizont ist. 245
6.4.1
Wichtigste geometrische Eigenschaften
Metrik und Symmetrie Die Metrik eines rotierenden elektrisch geladenen schwarzen Loches im Gleichgewicht lautet ds2 =
∆ (dt − a sin2 ϑ dϕ)2 Σ Σ sin2 ϑ [a dt − (r 2 + a2 ) dϕ]2 − dr 2 − Σ dϑ2 , − Σ ∆
(6.17)
und das elektromagnetische Potential ist Aµ dxµ =
Qr (dt − a sin2 ϑdϕ). Σ
(6.18)
Diese sog. quasidiagonale Form ist f¨ ur viele Berechnungen g¨ unstig (Aufgabe). Die Koordinaten t, ϕ, r, ϑ, welche hier benutzt werden, heissen verallgemeinerte BoyerLindquist-Koordinaten (die Reihenfolge der Koordinaten ist anders als wir bisher gew¨ohnt sind: x0 = t, x1 = ϕ, x2 = r und x3 = ϑ). Die folgenden Abk¨ urzungen werden oft benutzt: Σ = r 2 + a2 cos2 ϑ,
(6.19)
∆ = r 2 − 2M r + a2 + Q2 .
(6.20)
Die Symbole M , a und Q sind Konstanten mit Dimension L¨ange. Die Kerr-Newman-Familie ist nur dreidimensional—sie enth¨alt nur drei unabh¨angige Parameter: M , a und Q. Das ist die erstaunliche Einfachheit der Struktur von schwarzen L¨ochern im Gleichgewicht (“schwarze L¨ocher haben keine Haare”). Wir sehen unmittelbar, dass das Setzen a = Q = 0 zu Aµ = 0 f¨ uhrt, und aus der Metrik (6.17) wird die Schwarzschild-Metrik; der Schwarzschild-Horizont liegt bei der L¨osung r = 2M der Gleichung ∆ = 0. Es gibt weitere interessante Teilfamilien: Q = 0 gibt die sog. Kerr-Metrik und a = 0 die sog. Reissner-Nordstr¨om-Metrik. Die Reissner-Nordstr¨om-Familie (a = 0) ist rotationssymmetrisch und statisch; die Orbits der Drehgruppe sind durch die Gleichungen t = const und r = const gegeben. Die Koordinate r hat dann die bekannte Beziehung zur Oberfl¨ache der Orbits; diese erlaubt nur r ≥ 0. Die allgemeine Kerr-Newman-Metrik und Potential sind unabh¨angig von den Koordinaten t und ϕ: die Vektorfelder (1, 0, 0, 0) und (0, 1, 0, 0) sind also Killing-Felder; wir bezeichnen sie, der Reihe nach, ξ µ und ϕµ . Es gibt noch zwei wichtige diskrete Symmetrien: Spiegelung um die Aequatorialebene, ϑ 7→ −ϑ + π, und die Inversion (t, ϕ) 7→ (−t, −ϕ). Wenn a 6= 0, dann gibt es keine weiteren Killing-Felder, und die Metrik ist nur axialsymmetrisch. (Die zwei Symmetrieachsen sind durch ϑ = 0, π 246
gegeben.) Die Koordinate r hat in diesem Fall keine einfache geometrische Bedeutung; sie kann auch negative Werte haben, ohne dass ein Widerspruch entsteht. Die Hyperfl¨achen r = const sind aber die u ¨blichen Zylinder R × S 2 . Asymptotische Eigenschaften Eine wichtige Eigenschaft der Metrik (6.17) ist, dass sie asymptotisch flach ist, und zwar sowohl bei r → ∞, als auch (wenn a 6= 0)bei r → −∞. In der Tat, entwickeln wir die Komponenten der Metrik in Potenzen von r −1 : 1 + O(r −2 ), r 1 (2M a sin2 ϑ) + O(r −2 ), r 2 2 −r sin ϑ 1 + O(r −2 ) , 1 −2 − 1 + 2M + O(r ) , r 2 −r 1 + O(r −2 ) ;
gtt = 1 − 2M gtϕ = gϕϕ = grr = gϑϑ =
die letzteren drei Glieder zeigen, dass r die gew¨ohnliche Kugelkoordinate im asymptotischen Gebiet ist. Das Potential (6.18) hat die Entwicklung: 1 1 2 Aµ = Q , −aQ sin ϑ , 0, 0 + O(r −2 ). r r Wir beobachten, dass das Koeffizient bei 1/r im elektrostatischen Potential A0 gleich Q ist. Aus der Elektrodynamik in der flachen Raumzeit wissen wir, dass eine a¨hnliche Entwicklung eine Ladung der Quelle vom Wert Q bedeuten w¨ urde; dasselbe gilt auch im asymptotischen Gebiet von asymptotisch flachen Raumzeiten. Unsere Quelle hat also die elektrische Ladung Q, und das ist auch die Bedeutung des Parameters Q. In der ART gilt eine analoge Relation auch f¨ ur die Metrik; dar¨ uber sagt der folgende Satz etwa aus: Theorem 24 Jede station¨are L¨osung der Einstein-Maxwell-Gleichungen, welche asymptotisch flach ist, erlaubt die Koordinaten t, x1 , x2 und x3 , so dass die asymptotische Entwicklung die folgende Form annimmt: l 2M −2 2 kx 2 −3 + O(r dt + 4jkl J 3 + O(r ) dt dxj ds = 1− r r 2M + O(r −2 ) δkl dxk dxl , (6.21) − 1+ r wobei r :=
p δkl xk xl . 247
Diese Form stimmt mit der asymptotischen Entwicklung der Metrik um einen station¨ar rotierenden axisymmetrischen isolierten Stern mit der totalen Masse c 2 M /G und dem totalen Drehimpuls c3 J k /G ¨ uberein. (Beweis eines ¨ahnlichen Satzes befindet sich in [9]) Wenn man die Koordinaten x1 , x2 und x3 in die Kugelkoordinaten transformiert und dabei J k = Jδ3k setzt, dann findet man im Gebiet r → +∞: Die Koordinaten t, x1 , x2 und x3 , welche durch die obige Transformation mit t, r, ϑ und ϕ in der Metrik (6.17) verbunden sind, erf¨ ullen die Bedingungen des Satzes. Es entspricht einer Quelle mit der Masse M , dem Drehimpuls J = aM und der Ladung Q. Die asymptotischen Beobachter auf der anderen Seite, r → −∞ sehen dagegen ein Objekt mit der Masse −M , dem Drehimpuls J = −aM und der Ladung −Q (Aufgabe). Man soll beachten, dass die Einheiten so gew¨aht sind, dass G = c = 1. Dann kann man alles in den Einheiten der L¨ange und ihrer Potenzen beschreiben. Singularit¨ at Wir haben es also mit einer sich drehenden geladenen Quelle zu tun; was ist es f¨ ur eine Quelle? Die Singularit¨aten der Metrik (6.17) k¨onnen uns Bescheid geben. Dazu bemerken wir, dass die Metrik singul¨ar wird, wenn Σ = 0 oder ∆ = 0. Ist es eine echte Singularit¨at oder nur das Resultat einer falschen Koordinatenwahl (wie bei der Schwarzschild-Metrik am Horizont)? Das kann man aus den Komponenten des Kr¨ ummungstensors und den entsprechenden Invarianten ersehen (die Berechnung macht man am besten mit Computer): sie divergieren nur bei Σ = 0; das Untersuchen der Punkte mit ∆ = 0 verlegen wir in den n¨achsten Abschnitt. Betrachten wir also Σ = 0. Wenn a = 0 ist, dann ist es bei r = 0 wie bei der SchwarzschildL¨osung. F¨ ur a 6= 0 haben wir eine interessantere Situation: die Singularit¨at liegt bei (r = 0, ϑ = π/2); inbesondere bei r = 0 und ϑ 6= π/2 ist die Metrik regul¨ar und dasselbe kann man u ¨ ber das Potential sagen. Studieren wir die Fl¨ache r = t = 0; die Metrik darauf ist: ds2 = −a2 cos2 ϑ dϑ2 − tan2 ϑ(a2 cos2 ϑ − Q2 sin2 ϑ)dϕ2 . Das ist die Metrik von zwei isometrischen Scheiben, die erste gegeben durch ϕ ∈ [0, 2π], ϑ ∈ [0, π/2) und die zweite durch ϕ ∈ [0, 2π], ϑ ∈ (π/2, π], die beide singul¨ar am Rande ϑ = π/2 sind. Die Singularit¨at hat die Form eines Rings. Der Wert 0 der Koordinate r beschreibt also nicht unbedingt einen Punkt (“Ursprung”), und man kann durch die Scheibe analytisch l¨angs den Kurven der konstanten ϑ zu negativen Werten von r gelangen, denn die Metrik und das Potential sind regul¨ar im Gebiet r < 0 (Bild 6.12). Das hat insbesondere die Folgerung, dass die zwei Achsen ϑ = 0 und ϑ = π einander nie begegnen, wie es der Fall im (r = 0)-Punkt des flachen Raumes ist. 248
Kerr-Newman-Koordinaten Betrachten wir die Signatur der Hyperfl¨achen r = const. Sie ist durch die Determinante D der Metrik darauf eindeutig bestimmt: die Hyperfl¨ache ist zeitartig, wenn D > 0, raumartig, wenn D < 0 und lichtartig, wenn D = 0. Eine einfache Berechnung ergibt (Aufgabe) D = ∆Σ sin2 ϑ. Nehmen wir an, dass a2 + Q 2 > M 2 .
(6.22)
Dann hat die Gleichung ∆ = 0 aber keine L¨osung. In diesem Fall ist D > 0, und die Hyperfl¨achen sind alle zeitartig; kausale Signale k¨onnen von beiden Seiten durch, und das macht plausibel, dass der singul¨are Ring von r = ±∞ sichtbar und beeinflussbar ist (wir finden die entsprechenden lichtartigen Geod¨aten sp¨ater)! Die Singularit¨at heisst dann “nackt”, und wir k¨onnen den singul¨aren Ring als die Quelle der L¨osung betrachten. Im umgekehrten Fall hat die Gleichung die Wurzeln: p (6.23) r± = M ± M 2 − a 2 − Q 2 .
Im weiteren beschr¨anken wir uns auf die F¨alle mit M 2 > a2 + Q2 ; die sogenannten extremen L¨ocher mit M 2 = a2 + Q2 sind zwar sehr interessant, aber ihre Bedeutung f¨ ur die Astrophysik ist marginal. Das heisst, dass die Metrik (6.17) in den drei folgenden getrennten Gebieten wohldefiniert ist: die externe Kerr-Newman-Raumzeit mit negativer Radialkoordinate (EKN−), wo −∞ < r < r− und die Hyperfl¨achen r = const zeitartig sind, die interne Kerr-Newman-Raumzeit (IKN), wo r− < r < r+ und die Hyperfl¨achen raumartig sind, und die externe Kerr-Newman-Raumzeit mit positiver Radialkoordinate (EKN+), wo r+ < r < ∞ und die Hyperfl¨achen wieder zeitartig sind. Diese Gebiete vermuten wir als Teilmengen einer grosseren Raumzeit, wo sie durch regul¨are Hyperfl¨achen r = r± getrennt sind, etwas analog zur Eddington-FinkelsteinRaumzeit. Um das zu ermitteln, versuchen wir zun¨achst Koordinaten (u, ξ, r, ϑ) und (v, η, r, ϑ) zu finden, welche analog zur Eddington-Finkelsteinschen sind (und sie gehen auch in die EF-Koordinaten u ¨ber, wenn man a = Q = 0 setzt); sie heissen retardierte und avancierte Kerr-Newman-Koordinaten (das sind die Koordinaten in welchen die Kerr-Newman-L¨osung urspr¨ unglich ver¨offentlicht worden ist). F¨ ur die Transformation machen wir die folgenden Ans¨atze: wir halten r und ϑ fest, und setzen f¨ ur die retardierten Koordinaten t = u + X(r),
ϕ = ξ + Y (r),
(6.24)
t = v − X(r),
ϕ = η − Y (r),
(6.25)
und f¨ ur die avancierten
249
wobei X(r) und Y (r) erf¨ ullen r 2 + a2 , ∆ a Y 0 (r) = . ∆
X 0 (r) =
Die so erhaltene Koordinaten ξ und η sind wieder Winkelkoordinaten, insbesondere repr¨asentieren die Werte (u, ξ, r, ϑ) und (u, ξ + 2π, r, ϑ) gleiche Punkte. Die entsprechenden Transformationen der Differentialformen in der Metrik (6.17) lauten: Σ dr, ∆ adt − (r 2 + a2 )dϕ = adu − (r 2 + a2 )dξ, Σ dt − a sin2 ϑdϕ = dv − a sin2 ϑ dη − dr, ∆ adt − (r 2 + a2 )dϕ = adv − (r 2 + a2 )dη. dt − a sin2 ϑdϕ = du − a sin2 ϑ dξ +
Nach Einsetzung erhalten wir f¨ ur die Metrik ∆ (du − a sin2 ϑ dξ)2 + 2(du − a sin2 ϑ dξ)dr Σ sin2 ϑ [a du − (r 2 + a2 )dξ]2 − Σ dϑ2 , − Σ ∆ = (dv − a sin2 ϑ dη)2 − 2(dv − a sin2 ϑ dη)dr Σ sin2 ϑ − [a dv − (r 2 + a2 )dη]2 − Σ dϑ2 , Σ
ds2 =
ds2
(6.26)
(6.27)
und f¨ ur das Potential Aµ dxµ =
Qr Qr (du − a sin2 ϑdξ) + dr, Σ ∆
Qr Qr (dv − a sin2 ϑdη) − dr. (6.28) Σ ∆ Man sieht, dass die Metrik regul¨ar u ¨berall bis auf die Punkte mit Σ = 0 und ϑ = 0, π 2 ist, denn (Aufgabe) det gµν = Σ sin2 ϑ, und alle Terme mit ∆ im Nenner verschwunden sind. Die “Singularit¨at” bei ϑ = 0, π ist die wohlbekannte Koordinatensingularit¨at der Kugelkoordinaten. Bei dem Potential ist der letzte Term auf den rechten Seite zwar singul¨ar, kann aber durch eine Eichtransformation beseitigt werden. Somit haben wir zwei analytische Fortsetzungen der EKN+: die retardierte KerrNewman-Metrik (RKN), gegeben durch die Gl. (6.26) im Bereich r ∈ (−∞, ∞), und die avancierte Kerr-Newman-Metrik (AKN), gegeben durch (6.27) im gleichen Bereich. Die Transformation der Killing-Felder in Kerr-Newman Koordinaten ergibt: ξ µ = (1, 0, 0, 0) und ϕµ = (0, 1, 0, 0). Aµ dxµ =
250
Die Bedeutung der Koordinaten u und v im asymptotischen Gebiet r → ∞ ersieht man, indem man nur die leitenden Glieder in der Metrik (6.26) oder (6.27) l¨asst: ds2 → du2 + 2dudr − r 2 dϑ2 − r 2 sin2 ϑdξ 2 , und ds2 → dv 2 − 2dvdr − r 2 dϑ2 − r 2 sin2 ϑdη 2 . Im Innern der Raumzeit aber sind die Fl¨achen u = const oder v = const nicht lichtartig sondern zeitartig, denn die induzierte Metrik auf z.B. v = const lautet in den Koordinaten η, r, und ϑ: dS 2 = F dη 2 − Σdϑ2 + 2a sin2 ϑdrdη, mit
sin2 ϑ 2 ∆ 2 4 a sin ϑ − (r + a2 )2 . Σ Σ 4 2 Die Determinante davon ist a Σ sin ϑ, und das ist positiv f¨ ur a 6= 0. Die Kurve aber, welche parametrisch (Parameter λ) gegeben ist durch F =
v = v0 ,
η = η0 ,
r = −λ,
ϑ = ϑ0 ,
(6.29)
ist eine lichtartige Geod¨ate, und wird zu einer analogie der radialen lichtartigen Geod¨aten in der Kerr-Newman-Raumzeiten mit a = 0 (Aufgabe). Diese Geod¨ate ist bei r → ∞ in die Zukunft orientiert , und so l¨auft sie u ¨berall in die Zukunft. Analog ist es f¨ ur die retardierte Kerr-Newman-Raumzeit. F¨ ur viele Berechnungen ist die Kenntnis der kontravarianten Metrik n¨otig. Ihre Komponenten in Bezug auf die Koordinaten (v, η, r, ϑ) lauten (Aufgabe): 2 2ϑ a r 2 +a2 − a sin , − , − , 0 Σ Σ Σ a a 1 , − − , − , 0 2 µν Σ Σ Σ sin ϑ g = (6.30) . 2 2 − r +a , − Σa , −∆ , 0 Σ Σ 0, 0, 0, − Σ1 Maximale Erweiterung
Die Fortsetzungen RKN und AKN sind nicht die maximalen analytischen Fortsetzungen der EKN+, ahnlich wie die REF und AEF keine von ESR waren. Um die maximale Fortsetzung zu konstruieren, ¨ brauchen wir zun¨ achst die Eigenschaften der Funktionen X(r) und Y (r). Eine einfache Integration ergibt: X(r) = r − A log |r − r− | + B log |r − r+ |, wobei A = B
=
2m2 − Q2 − m > 0, r+ − r − 2m2 − Q2 + m > 0, r+ − r −
251
und
r − r+ a . Y (r) = log r+ − r − r − r−
Es folgt
lim X(r) = −∞ ,
r=∞
lim X(r) = ∞ ,
r=r+
r=−∞
r=r−
lim X(r) = ∞,
(6.31)
lim X(r) = −∞.
(6.32)
und lim Y (r) = 0 ,
r=−∞
lim Y (r) = ∞ ,
r=r−
lim Y (r) = 0,
(6.33)
lim Y (r) = −∞.
(6.34)
r=∞
r=r+
Die Transformationen (6.24) und (6.25) sind also immer nur innerhalb von einzelnen Quadranten regul¨ ar, und sie identifizieren die Quadranten I und IV mit der EKN+, II und V mit IKN, und III und VI mit der EKN−. Es folgt, dass wir die zwei Raumzeiten RKN und AKN auf drei verschiedene Weisen zusammenkleben k¨ onnen. Die entsprechnede Transformation ist immer u = v − 2X(r),
ξ = η − 2Y (r),
(6.35)
r und ϑ bleiben gleich, aber die Raumzeiten werden entweder l¨ angs den Quadranten I und IV, oder II und V, oder III und VI zusammengeklebt. Um das machen zu k¨ onnen, f¨ uhren wir die Koordinaten (u, v, ϑ, ϕ) in jedem der drei Raumzeiten EKN± und IKN ein. Die Gl. (6.24) und (6.25) ergeben 1 1 t = (u + v), X(r) = (−u + v). 2 2 Die Funktion X(r) ist steigend in EKN± und fallend in IKN, sie hat also innerhalb dieser Raumzeiten eine Inverse. Eine Darstellung der drei Raumzeiten ist im Bild 6.14 gegeben: man hat drei quadratische “Fliessen”, welche l¨ angs der Seiten “nebeneinandergelegt” werden k¨ onnen, an denen entweder das Funktionenpaar (u, r) oder (v, r) stetig durch die Verbindung wird. Daraus ergibt sich zwangsl¨ aufig eine Raumzeit, welche aus unendlich vielen Fliessen besteht (Bild 6.15). Diese Erweiterung ist immer noch nicht maximal, ¨ ahnlich wie das Zusammenkleben von je zwei Kopien von AEF und REF nur einen Teil der Kruskal-Raumzeit ergibt. Man braucht noch einen Flicken auf die Kreuzung der zwei Hyperfl¨ achen mit r = r+ und der zwei mit r = r− . Das wollen wir nicht explizit tun, es ist kompliziert; es gen¨ ugt zu wissen, das es m¨ oglich ist. Das Resultat ist die sogenannte Carter-Raumzeit. Wir sollen noch zeigen, dass die Carter-Raumzeit zeitorientierbar ist. Dazu verwenden wir zwei Vektorfelder, Trµ (x) in der RKN und Taµ (x) in der AKN. Sie sind, in Bezug auf die jeweiligen Kerr-Newman-Koordinaten, gegeben durch: Q2 − 2M r , 0), 2Σ Q2 − 2M r Taµ = (1, 0, , 0). 2Σ Die Norm von beiden Vektoren ist 1 und sie sind glatt u ¨berall in den jeweiligen Raumzeiten (die Singulartit¨ at ist ausgeschnitten). Das Skalarprodukt der zwei Vektorfelder in den u ¨berlappenden Gebieten ist (Q2 − 2M r)2 . gµν Trµ Taν = 1 + 2Σ∆ Man kann diese Verktorfelder benutzen, um eine Zeitorientierung in der Carter-Raumzeit einTrµ
= (1, 0, −
zuf¨ uhren (Aufgabe).
252
Die Horizonte Betrachten wir die Punkte mit r = r± in den Raumzeiten RKN und AKN. Sie bilden regul¨are dreidimensionale Hyperfl¨achen. Die Signatur dieser Hyperfl¨achen finden wir, indem wir die Metrik berechnen, welche darauf von der Metrik der Raumzeit induziert wird. Dazu setzen wir in den Formeln (6.26) oder (6.27) einfach r = r± ein: sin2 ϑ 2 ds2 = − [a du − (r± + a2 ) dξ]2 − Σ dϑ2 , (6.36) Σ oder ds2 = −
sin2 ϑ 2 [a dv − (r± + a2 ) dη]2 − Σ dϑ2 . Σ
(6.37)
Das sind Metriken mit der Signatur (−1, −1, 0) (Aufgabe), also lichtartige Hyperfl¨achen. Wie wir gesehen haben, wirken die lichtartigen Hyperfl¨achen als halbdurchl¨assige Schichten: die Sign¨ale k¨onnen sie nur in einer Richtung kreuzen. In der AKNRaumzeit sind beide Hyperfl¨achen nur von Aussen nach innern durchl¨assig. Das erkennen wir danach, dass die zukunftsorientierte lichtartige Geod¨ate (6.29) eben nach innen kreuzt. Ein Beobachter, welcher bei grossen (positiven) Werten von r weilt, kann also hinter keine der beiden Hyperfl¨achen sehen. Andererseits kann er beliebig nahe zur ¨ausseren Hyperfl¨ache mit der Radialkoordinate r+ sehen: dass kann man ermitteln auf eine analoge Weise wie wir es in der avancierten EddingtonFinkelstein-Raumzeit gemacht haben. Dann ist also die Hyperfl¨ache r = r+ ein absoluter Ereignishorizont und das Innere davon ist ein schwarzes Loch. Einige geometrische Eigenschaften des Horizontes spielen in der Theorie der schwarzen L¨ocher eine wichtige Rolle. Dazu geh¨ort insbesondere der Fl¨acheninhalt eines raumartigen Schnitts durch den Horizont. Wir zeigen die folgende wichtige Eigenschaft. Sei S eine beliebige raumartige Schnittfl¨ache des Horizontes (Bild 6.17). Sei A(S) der Fl¨acheninhalt davon. Dann ist 2 A(S) = 4π(r+ + a2 ),
(6.38)
also unabh¨angig von S. Sei n¨amlich v = v(ϑ, η) die Gleichung des Schnittes, d.h., v(ϑ, η) ist eine glatte Funktion auf der Sph¨are. Die induzierte Metrik darauf ist ds2 = −
sin2 ϑ 2 [av,ϑ dϑ + (av,η − r+ − a2 )dη]2 − Σdϑ2 . Σ
Man kann dann eine neue Koordinate ψ einf¨ uhren: ψ := η −
2 r+
a v(ϑ, η); + a2
253
ψ ist eine Winkelkoordinate wie η, insbesondere ist ψ(0) = ψ(2π). Die Metrik hat dann die Form sin2 ϑ 2 2 dψ − Σdϑ2 (6.39) ds2 = −(r+ + a 2 )2 Σ Diese Metrik h¨angt gar nicht von v = v(ϑ, η) ab! Wir haben so gezeigt, dass alle Schnitte des Horizonts isometrisch sind. Insbesondere haben alle den gleichen Fl¨acheninhalt. F¨ ur die Metrik (6.39) erhalten wir 2 detgkl = (r+ + a2 )2 sin2 ϑ.
Der Fl¨acheninhalt des Schnittes ist ein Integral u ¨ ber die Determinante: Z p A(S) = dϑdψ det(gkl ) S Z π Z 2π 2 2 = (r+ + a ) sin ϑdϑ dψ 0
=
2 4π(r+
0
2
+ a ).
Das zeigt die Behauptung. Wir bezeichnen diese vier Hyperfl¨ achen wie folgt: Raumzeit RKN RKN AKN AKN
r r+ r− r+ r−
Name + H+ − H+ + H− − H−
Betrachten wir jetzt die asymptotischen Beobachter in einer EKN+. Der Quadrant dieser Be+ + obachter hat die Grenze in der Carter-Raumzeit, welche von einer Hyperfl¨ ache H− und einer H+ gebildet ist. Jede davon hat eine Fortsetzung durch eine Hyperfl¨ ache gleicher Art, so dass ein Kreuz + bilden, zusammen mit entsteht a hnlich wie in der Kruskal-Raumzeit. Die zwei Hyperfl¨ achen H− ¨ der Sph¨ are in der Mitte des Kreuzes, eine einzige lichtartige Hyperfl¨ ache, deren Zukunftseite von den Beobachtern abgewandt ist: es ist also ein Ereignishorizont f¨ ur sie. Die zwei Hyperfl¨ achen + H+ bilden analog eine lichtartige Hyperfl¨ ache, deren Zukunftseite den Beobachtern zugewandt ist: dies ist also der Einflusshorizont. Die Beobachter k¨ onnen jeden Punkt unter dem Ereignishorizont sehen: eine Hyperfl¨ ache u = const, welche durch diesen Punkt geht, erreicht das asymptotische Gebiet. Aehnlich k¨ onnen die Beobachter jeden Punkt u ¨ber den Einflusshorizont beienflussen, da eine Hyperfl¨ ache v = const, welche durch diesen Punkt l¨ auft, vom asymptotischen Gebiet kommt. Die Situation ist voll analog zu der in der Kruskal-Raumzeit bis auf die Kleinigkeit, dass die Hyperfl¨ achen u = const und v = const im Allgemeinen zeitartig sind. Aehnlich ist die Lage der asymptotichen Beobachter in einem der EKN−. Die zwei Hyperfl¨ achen − − H+ bilden ihren Ereignishorizont und H+ ihren Einflusshorizont. Die Singularit¨ at liegt aber u ¨ber dem Einflusshorizont und unter dem Ereignishorizont: Sie ist sowohl beeinflussbar als auch sichtbar f¨ ur diese Beobachter: es ist eine nackte Singularit¨ at f¨ ur sie. Die Situation muss also interpretiert werden als ein schwarzes Loch umgegeben von einem singul¨ aren Ring. Ein einsames schwarzes Loch gibt es also nur in Bezug auf die Beobachter in EKN+. Wir wollen uns im Weiteren auf diese Beobachter beschr¨ anken.
254
Betrachten wit jetzt eine der KNE+ Welten in der Carter-Raumzeit; das sind die vier Quadranten, welche zwei KNE+ Quadranten einschliessen (Bild 6.16). Diese Welt ist ¨ ahnlich zur KruskalRaumzeit mit dem Unterschied, dass sie durch zwei lichtartige Hyperfl¨ achen mit r = r− abgeschlossen ist anstatt durch eine Singulartit¨ at. Welche ist die Rolle dieser zwei Grenzhyperfl¨ achen? Es sind klar die sog. Cauchy-Horizonte, da sie das Abh¨ angigkeitsgebiet der raumartigen Hyperfl¨ achen begrenzen, welche in der KNE+ Welt liegen: es gibt kausale Signale durch die Punkte hinter diesen Hyperfl¨ achen, welche zu r = −∞ laufen und keinen Punkt in der KNE+ Welt erreichen. Aehnlich ist es bei einem der KNE− Welten: die lichtartigen Hyperfl¨ achen r = r+ bilden eine Grenze davon, einen Cauchy-Horizont. Es ist nun bekannt, dass diese Cauchy-Horizonte instabil sind: wenn man die KNE+ Welt ein bisschen st¨ ort, dann sammelt sich eine divergierende St¨ orung an den Cauchy-Horizonten, und eine Singularit¨ at entsteht, so dass die resultierende Raumzeit analog zur Kruskal-Raumzeit ist. Es folgt, dass die ganze Carter-Raumzeit nicht existieren kann, da sie unstabil ist. Verl¨ asslich k¨ onnen wir voraussetzen, dass immer nur eine KNE+, oder eine KNE− Welt existieren kann. Das ist gut so: denn man kann von einer KNE+ Welt in eine KNE− Welt durch die CarterRaumzeit l¨ angs einer Geod¨ ate gelangen (siehe den n¨ achsten Abschnitt), und in einer dieser Welten ist dann die totale Masse des isolierten Objektes in der Mitte negativ. (Das gilt aber nur f¨ ur die rotierenden L¨ ocher). Dann existiert f¨ ur die Beobachter in der Umgebung von r = −∞ ein
Objekt, dass isoliert ist und negative Gesamtmasse hat; daraus k¨ onnte man beliebig viel Energie extrahieren.
6.5
Dynamik der geladenen Teilchen
Alle weiteren Ueberlegungen werden von unserem Verst¨andnis der Dynamik der Testteilchen in der Kerr-Newman-Raumzeit abh¨angig; das ist der Gegenstand dieses Abschnittes.
6.5.1
Bewegungsintegrale
Unsere Aufgabe ist es, die Bewegung eines Probeteilchens mit der Ruhemasse µ und der Ladung q in einer Raumzeit mit der Metrik gµν und dem elektromagnetischen Potential Aµ zu studieren. Es wird keine Geod¨ate sein, denn die Lorentz-Kraft erzeugt eine 4er-Beschleunigung. Betrachten wir zun¨achst den nichttrivialen Fall µ 6= 0. Um die dynamische Gleichung “herzuleiten”, benutzen wir das Aequivalenzprinzip. Wir setzen also zun¨achst voraus, dass die Raumzeit flach ist, w¨ahlen ein IS und schreiben die bekannte Lorentz-Kraft in Bezug auf dieses IS in der relativistischen Form auf: F µ = qF µ ν
dxν , ds
wobei F µν der Tensor des elektromagnetischen Feldes ist, xµ (s) beschreibt die Trajektorie des Teilchens, und s ist die Eigenzeit l¨angs der Trajektorie. Die dynamische 255
Gleichung ist also
ν d 2 xµ µ dx = qF . ν ds2 ds Das m¨ ussen wir in die allgemein kovariante Form umschreiben. Bis auf den Ausdruck f¨ ur die 4er-Beschleunigung ist aber schon alles kovariant, und die Beschleunigung sollen wir lediglich mit Hilfe der kovarianten Ableitung schreiben; so erhalten wir: ν D 2 xµ µ dx = qF , (6.40) µ ν ds2 ds wobei die praktische Abk¨ urzung
µ
ρ σ d 2 xµ D 2 xµ µ dx dx := + Γρσ ds2 ds2 ds ds
benutzt wird. Die Bewegungsgleichung (6.40) postulieren wir einfach als g¨ ultig in beliebigen Raumzeiten. Man sieht, dass sie bei q = 0 in die geod¨atische Gleichung u ¨bergeht. Bemerke auch die Rolle des Parameters: es muss die Eigenzeit sein. Wir k¨onnen auch zeigen, dass die Beschleunigung senkrecht auf den Tangentvektor steht: q dxµ dxν dxν D dxµ gµν = Fµν = 0. ds ds ds µ ds ds Die Gleichung (6.40) folgt aus dem Variationsprinzip mit der Wirkung: Z p S = dλ µ gµν x˙ µ x˙ ν + qAµ x˙ µ .
Hier ist x˙ µ = dxµ /dλ, λ ist ein beliebiger Parameter und Aµ ist ein elektromagnetisches Potential, das das Feld Fµν ergibt. Das kann man wie folgt zeigen. F¨ uhren p µ ν wir das K¨ urzel l f¨ ur den Ausdruck gµν x˙ x˙ ein; bemerke, dass s˙ = l. Dann heisst der Lagrangian L = µl + qAµ x˙ µ . Die linken Seiten der Euler-Lagrange-Gleichungen sind: d ∂L ∂L − = ∂xµ dλ ∂ x˙ µ µ d gρσ,µ x˙ ρ x˙ σ + q∂µ Aρ x˙ ρ − (µl−1 gµρ x˙ ρ + qAµ ) = 2l dλ ◦ µ µ x˙ ρ − gµρ,σ x˙ ρ x˙ σ − q∂ρ Aµ x˙ ρ = gρσ,µ x˙ ρ x˙ σ + q∂µ Aρ x˙ ρ − µgµρ 2l l l ρ ◦ x˙ µ −µgµρ − (gµρ,σ + gµσ,ρ − gρσ,µ )x˙ ρ x˙ σ + qFµρ x˙ ρ . l 2l Daraus folgt: µ l
x˙ µ l
◦
+
µ µ ρ σ q µ ρ Γ x˙ x˙ = Fρ x˙ . l2 ρσ l 256
Die Gleichung (6.40) resultiert, wenn man s˙ f¨ ur l einsetzt, wzzw. Der praktische Wert des Variationsprinzips ist, dass wir mit seiner Hilfe schnell zu Erhaltungsgesetzen kommen: wenn der Lagrangian unabh¨angig von einer Koordinate ist, dann ist der entsprechende Impuls erhalten. Sei also ∂κ L = 0 f¨ ur ein bestimmtes κ, dann ist ∂ L = const. ∂ x˙ κ Wenn man f¨ ur den Lagrangian einsetzt, bekommt man ∂ dxρ L = µg + qAκ , κρ ∂ x˙ κ ds p weil s˙ = gµν x˙ µ x˙ ν . Wir k¨onnen die rechte Seite als eine skalare Funktion schreiben, wenn wir den Vektor χµ = δκµ einf¨ uhren; dann wird Pχ := χµ (µgµρ
dxρ + qAµ ) ds
l¨angs der Teilchentrajektorie erhalten. Der kovariante 4er-Impuls des Testteilchens aber ist dxν pµ = µgµν , ds also k¨onnen wir schreiben Pχ = χµ (pµ + qAµ ). Man kann nun unter die Teilchen auch Photonen mischen: da dann q = 0 und χµ ein Killing-Vektorfeld ist, muss Pχ auch f¨ ur die Photonen erhalten sein. Beispiel: aus der Form der Metrik und des Potentials in Bezug auf die KerrNeuman-Koordinaten sehen wir, dass ξ µ und ϕµ den Bedingungen auf χ gen¨ ugen. Die entsprechenden erhaltenen Gr¨ossen k¨onnen durch die Komponenten in Bezug auf die avancierten Kerr-Newman-Koordinaten so ausgedr¨ uckt werden: e = pv + qAv ,
−j = pη + qAη .
(6.41)
Die Gr¨osse Pχ ist auch in Stossprozessen erhalten. Setzen wir voraus, dass n geladene Teilchen mit 4er-Impulsen pµ1 , . . . , pµn und Ladungen q1 , . . . , qn in einem 0µ Punkt p zusammenstossen, und dabei n0 Teilchen mit p0µ 1 , . . . , pn0 und Ladungen q10 , . . . , qn0 0 entstehen (Bild 6.18). Es muss gelten: 0µ pµ1 + . . . + pµn = p0µ 1 + . . . + p n0 ,
und q1 + . . . + qn = q10 + . . . + qn0 0 , 257
Multiplizieren wir die erste Glechung mit gµν χν im p und addieren die zweite multipliziert mit Aµ χµ in p, dann erhalten wir 0 P1χ + . . . + Pnχ = P1χ + . . . + Pn0 0 χ ,
und das ist die gew¨ unschte Erhaltung. Wir wollen noch die Bedingungen an χµ in beliebigen Koordinaten ausdr¨ ucken. µ In adaptierten Koordinaten {¯ x } ist sie ¨aquivalent zu drei Gleichungen: χ¯µ = δκµ , χ¯µ ∂µ¯ g¯ρσ = 0, χ ¯µ ∂µ¯ A¯ρ = 0. Wir haben schon einmal die ersten zwei Gleichungen in die allgemeinen Koordinaten transformiert: es resultierte die Killing-Gleichung, gµν,ρ χρ + gρν χρ,µ + gµρ χρ,ν = 0. Auf eine analoge Weise (Aufgabe) erhalten wir die Symmetriegleichung f¨ ur das Potential: Aµ,ρ χρ + Aρ χρ,µ = 0. Das Vektorfeld, das diese Gleichung erf¨ ullt, heisst Symmetrievektorfeld des Potentiµ als. Wenn das Vektorfeld χ gleichzeitig ein Killing-Vektorfeld und ein Symmetrievektorfeld des Potentials ist—wir nennen χµ dann “Symmetrievektor”—, dann ist die entsprechende Gr¨osse Pχ l¨angs der Teilchentrajektorien erhalten. Das kann man auch direkt aus der Killing-Gleichung und der Symmetriegleichung des Potentials beweisen (Aufgabe).
6.5.2
Die Aequatorialebene und die Symmetrieachsen
Im Allgemeinen existieren also nur zwei unabh¨angige Symmetrievektorfelder in der AKN-Raumzeit. Die Erhaltungsgesetze, welche mit diesen Feldern verbunden sind, gen¨ ugen nicht, das allgemeine Problem zu Quadraturen zu reduzieren. Es gibt zwar noch ein Bewegungsintegral, das quadratisch in den Komponenten des Impulses ist— das sog. Carter-Integral—, aber im Sonderfall der Bewegung in der Aequatorialebene ϑ = π/2 oder l¨angs der Symmetrieachsen ϑ = 0 oder ϑ = π kommen wir ohne weiteres mit den zwei aus. Zun¨achst m¨ ussen wir aber zeigen, dass eine Bewegung in der jeweiligen Untermannigfaltigkeit bleibt, wenn sie einmal dort und tangetial dazu gestartet ist. Das l¨asst sich allgemein beweisen. Wir setzen voraus 258
1. das Lagrangian des Teilchens ist invariant in Bezug auf eine Transformation xµ 7→ x0µ im Konfigurationsraum M, 2. die Transformation l¨asst die Untermannigfaltigkeit N des Konfigurationsraumes M punktweise invariant, 3. es gibt eine Umgebung U von N in M, so dass jeder Punkt r ∈ U \ N von der Transformation nichttrivial bewegt wird. Setzen wir nun voraus, dass die Trajektorie xµ (λ) eine L¨osung der Euler-LagrangeGleichungen f¨ ur die Anfangdaten xµ (0) = r ∈ N und x˙ µ ∈ Tr N ist, und dass xµ (λ0 ) 6∈ N f¨ ur ein λ0 . Ohne Einschr¨ankung der Allgemeinheit k¨onnen wir voraussetzen, dass xµ (λ0 ) ∈ U . Dann ist aber x0µ (λ0 ) 6= xµ (λ0 ). Das heisst, dass die L¨osung, welche man aus xµ (λ) durch die Abbildung bekommt, verschieden von der Urspr¨ unglichen ist; sie hat aber die gleichen Anfangsdaten, und dass ist der Widerspruch. Diese allgemeine Aussage l¨asst sich auf die Aequatorialebene anwenden, indem man die Spiegelung um die Aequatorialebene ϑ 7→ π − ϑ, und auf die Symmetrieachsen, indem man die Drehung η 7→ η + c benutzt. Wir k¨onnen gleichzeitig in den retardierten und avancierten Koordinaten rechnen, indem wir die Variablen (u, ξ) und (v, η) mit dem Paar (x, y) symbolisieren und die zwei Metriken (6.26) und (6.27) schreiben ∆ (dx − a sin2 ϑdy)2 + 2(dx − a sin2 ϑdy)dr Σ sin2 ϑ − [adx − (r 2 + a2 )dy]2 − Σdϑ2 ; Σ
ds2 =
wenn = +1, dann (x, y) = (u, ξ), und wenn = −1, dann (x, y) = (v, η). Analog schreibt man die entsprechenden zwei Potentiale: Aµ dxµ =
Qr (dx − a sin2 ϑ dy). Σ
Die Aequatorialebene Die Bewegungsintegrale mit ϑ = π/2 lauten: Qq = e, r aQq gyx x˙ + gyy y˙ + gyr r˙ − = −j, r gxx x˙ 2 + 2gxy x˙ y˙ + gyy y˙ 2 + 2(gxr x˙ + gyr y) ˙ r˙ = µ2 , gxx x˙ + gxy y˙ + gxr r˙ +
(6.42) (6.43) (6.44)
wobei wir f¨ ur λ einen Parameter gew¨ahlt haben, der folgendermassen definiert wird: F¨ ur massive Teilchen, λ := s/µ und f¨ ur Photonen, λ ist einfach der physikalische 259
Parameter. Somit umgehen wir die Schwierigkeit, dass massive Teilchen geladen sein k¨onnen und nicht entlang Geod¨aten laufen. Es ist g¨ unstig, die Gleichungen (6.42), (6.43) und (6.44) in Matrixform zu schreiben. Wir definieren die folgenden Matrizen: gxx gxy 1 e x˙ g= , h= , p= , u= , gyx gyy −a −j y˙ wobei gxx dx2 + 2gxy dxdy + gyy dy 2 :=
1 ∆ (dx − ady)2 − 2 [adx − (r 2 + a2 )dy]2 , 2 r r
und bemerken, dass
gxr gyr
= h.
Dann k¨onnen die Gleichungen (6.42) und (6.43) und (6.44) wie folgt geschrieben werden: Qq gu + h r˙ + = p, r u> gu + 2h> ur˙ = µ2 . Ausserhalb von ∆ = 0 k¨onnen wir diese Gleichungen l¨osen: r˙ 2 + Veff (r) = 0, u = g−1 (p − wobei
p Qq h) − 0 g−1 h −Veff , r
∆ > Qq > −1 Qq ∆ (p − h )g (p − h) + 2 µ2 , 2 r r r r 0 und die radiale Richtung der Bewegung festlegt: p r˙ = 0 −Veff ; Veff (r) = −
(6.45) (6.46) (6.47)
Bei der Herleitung von Gl. (6.47) haben wir die Beziehung h> g−1 (h = r 2 /∆. Ausgewertet ergibt die Gl. (6.47): 2 Q Veff (ae (r) − = j)2 r −4 + 2[Qaq(ae − j) − M (ae − j)2 ]r −3 +
[j 2 − a2 e2 + µ2 (a2 + Q2 ) − Q2 q 2 ]r −2 + 2(Qqe − M µ2 )r −1 − e2 + µ2 . (6.48)
Veff (r) ist ein effektives Potential, da es nicht f¨ ur alle Teilchen mit gegebener Masse µ und Ladung q gilt, sondern verschieden f¨ ur verschiedene S¨atze von e und j ist. Es divergiert an der Ringsingularit¨at bei r = 0 und ist gleich µ2 − e2 bei r = ±∞. Die 260
Bewegung ist u ¨ berall m¨oglich, wo Veff (r) negativ ist. Z.B. k¨onnen alle Teilchen mit |e| > µ die asymptotischen Gebiete x = 0 erreichen. Alle unsere Gleichungen gelten nur ausserhalb der Horizonte. Studieren wir jetzt, ob eine Trajektorie mit (m, e, j, q) durch einen Horizont bei r = ρ laufen kann. Dazu m¨ ussten die Komponenten r˙ und u regul¨are Limes am Horizont besitzen. Wenn Veff (ρ) < 0, dann ist r˙ regul¨ar. Es bleibt noch zu untersuchen, ob der Limes r → ρ von u in der Gleichung (6.46) auch regul¨ar sein kann. Das ist der Fall wenn 0 = 00 , wobei 00 die Orientation der Trajektorie bestimmt, d.h. 00 = +1 (00 = −1), wenn sie zukunfts- (vergangenheits-) gerichtet ist; das ist ¨aquivalent zu 00 = sgn(gµν lµ x˙ ν ). Das zeigt man, indem man die Beobachtung macht, dass der leitende Term in g −1 g−1 =
(ρ2 + a2 )2 > 1 ll +... ρ2 ∆
ist (Aufgabe), wobei l=
1 a ρ2 +a2
!
und (1, a/(ρ2 + a2 ), 0, 0) die Komponenten eines zukunftsgerichteten Normalvektors zum Horizont bei r = ρ; das folgt direkt aus den Gln. (6.36) und (6.37). Bemerke, dass eines der zwei Paare der Funktionen (u, ξ) und (v, η) l¨angs einer gegebenen Trajektorie an jedem Horizont divergieren muss. Das effektive Potential (6.48) enth¨alt eine Menge Information u ¨ber die Physik der Testteilchen beschrieben durch die Parameter µ, e, q und j im Feld des Loches mit den Parametern M , a und Q. Wir wollen einige Aspekte davon studieren. Bemerken wir zun¨achst, dass die Ladung q des Teilchens immer im Produkt mit der Ladung Q des Loches vorkommt. Das ist verst¨andlich, denn die Trajektorien der Teilchen k¨onnen von ihrer Ladung ja nur abh¨angen, wenn es ein nichtverschwindendes elektromagnetisches Feld gibt. Somit beschreiben die Terme Qq[2a(ae − j)r −3 − Qqr −2 + 2er −1 ] elektromagnetische Erscheinungen, als auch den Einfluss der Geometrie darauf. Weiter gibt es im Potential Terme, welche den Einfluss der Ladung des Loches auf ungeladene Teilchen beschreiben: Q2 [(ae − j)2 r −2 + µ2 r −1 ]. 261
Sie sind alle quadratisch in Q2 und stammen aus dem Einfluss des elektromagnetiEM schen Feldes auf die Metrik via Einstein-Gleichungen und Tµν ; der elektromagnetische Energie-Impuls-Tensor ist ja quadratisch im elektromagnetischen Feld Fµν . F¨ ur die Astrophysik ist aber wichtiger, welchen Effekt die Drehung des Loches (a 6= 0) auf die Bewegung der Teichen hat. Das ist eine Erscheinung, welche auch f¨ ur ungeladene L¨ocher existiert, also eine rein gravitative. Um Sachen zu vereinfachen, setzen wir Q = 0: Veff (r) = −2M (ae − j)2 r −3 + (j 2 − a2 e2 + a2 µ2 )r −2 − 2M µ2 r −1 − e2 + µ2 , (6.49) ¨ und studieren die Anderungen in Veff , welche durch die transformation j 7→ −j oder ¨ a 7→ −a hervorgerufen werden. Was ist die Bedeutung dieser Anderungen? Man kann sehen, dass die Metrik (6.17) nicht ge¨andert wird, wenn die Transformation a 7→ −a zusammen mit ϕ 7→ −ϕ gemacht wird. Somit beschreibt a 7→ −a eine ¨ Anderung, welche nur die Drehrichtung des Loches betrifft, wobei alles Andere fest bleibt. Dasselbe gilt f¨ ur j: Gl. (6.41) zeigt, dass η 7→ −η das Vorzeichen von j ¨andert, und so h¨angt das Vorzeichen von j mit der Bewegung des Teilchens in Bezug auf die Koordinate η (oder ϕ) zusammen. Andererseits ist ja das Potential invariant unter gleichzeitigen Abbildungen j 7→ −j und a 7→ −a. F¨ ur die Form der Bahn ist also nur die relative Richtung der Drehung des Loches und des Teilchens von Bedeutung. Wenn aj > 0, ist die Bewegung des Teilchen mitdrehend, d.h., J und j haben gleiche Vorzeichen, wogegen wenn aj < 0, dann ist sie gegendrehend und J und j haben verschidenen Vorzeichen. Der einzige Term im Potential (6.49), der vom Vorzeichen des Produkts aj abh¨angig ist, heisst +4M eajr −3 . 0 /2 des Teilchens durch den Dieser Term tr¨agt zur radialen Beschleunigung r¨ = −Veff Term bei +6M eajr −4 .
Wenn also aj > 0, dann ist dieser Beitrag positiv, und die Anziehung wird kleiner, wenn aj > 0 aber, ist er negativ und die Anziehung wird gr¨osser. Wir haben also gezeigt: Theorem 25 Die mitdrehenden Teilchen werden von einem ungeladenen Loch weniger angezogen als die gegendrehenden. Das bedeutet, z.B., dass ein drehendes Loch in einer Drehimpulsneutraler Umgebung eher die gegendrehenden Teilchen schluckt als die mitdrehenden. Dadurch wird die Drehung des Loches gebremst. Das ist ¨ahnlich dazu, was in einer elektrisch neutralen Umgebung mit einem geladenen Loch passiert: seine Ladung wird alm¨ahlich 262
abgeschw¨acht, weil es mehr die Teilchen anzieht, welche die umgekehrte Ladung haben. Die Symmetrieachsen Analog kann man die Bewegung l¨angs der Symmetrieachsen (ϑ = 0, π) studieren. Die Koordinaten in dieser zweidimensionalen Untermannigfaltigkeit sind x, r, wobei x = u wenn = 1 und x = v wenn = −1. Die Bewegungsintegrale ergeben: a r˙ 2 + Veff (r) = 0, p r 2 + a2 Qqr 0 a x˙ = e− 2 − −Veff , ∆ r + a2 wobei
a Veff (r)
Qqr =− e− 2 r + a2
2
+ µ2
r2
∆ , + a2
und 0 analog zum vorherigen Fall ist (Aufgabe). Ungeladene Teilchen mit gen¨ ugend a grosser Energie e k¨onnen also den ganzen Bereich von r durchlaufen (Veff ist dann u ¨berall regul¨ar und negativ).
6.6
Energetik der schwarzen L¨ ocher
Die schwarzen L¨ocher spielen in der Astrophysik die Rolle eines reichen Energiespenders. Immer, wo man eine sehr effiziente Energiequelle braucht, um die unglaubliche Energieleistung eines Objekts im Himmel zu erkl¨aren (Quasare, Zentren der aktiven Galaxien, usw.), postuliert man ein schwarzes Loch. Wir wollen jetzt lernen, warum. Im Ganzen gibt es zweierlei M¨oglichkeiten, Energie aus dem Gebiet mit einem schwarzen Loch zu gewinnen: 1. Energie der Probeteilchen im Feld des Loches, 2. Eigene Energie des Loches.
6.6.1
Nutzbare Energie eines schwarzen Loches
(Nach der Diplomarbeit von Ch. Farrugia, Bern 1978) F¨ ur den Rest der Theorie von schwarzen L¨ochern k¨onnen wir uns auf die AKN L¨osung beschr¨anken; sie enth¨alt alle Ereignisse ausserhelb eines schwarzen Loches, dass in einem Kollaps entstanden ist (¨ahnlich wie AEF). Ergosph¨ are Die Symmetrievektorfelder der AKN-L¨osung sind χµ = αξ µ + βϕµ . Studieren wir die Integralkurven dieser Vektorfelder. Das sind solche Kurven xµ = xµ (λ), deren 263
Tangentialvektor mit dem Vektorfeld u ¨ berall u ¨ bereinstimmt. Eine Integralkurve also, welche dem Vektorfeld mit zwei beliebigen Konstanten α und β entspricht, heisst v = αλ, η = βλ, r = const und ϑ = const. Die Kurve ist nur geschlossen, wenn α = 0, und wenn dazu noch β = 1, dann χµ = ϕµ und ϕµ generiert asymptotisch die Drehung um die Symmetrieachse. Da heisst: die Transformation λ 7→ λ + ψ ist eine solche Drehung um den Winkel ψ. Somit ist der Vektor ϕµ einmalig samt Normalisierung. Aehnlich ist der Vektor ξ µ einmalig, Normalisierung eingeschlossen, da es die Eigenzeitverschiebung der asymptotischen Beobachter generiert. Studieren wir die Bedeutung der entsprechenden erhaltenen Gr¨ossen; sie werden eine wichtige Rolle spielen. Wir haben Pχ f¨ ur χµ = ξ µ durch e und f¨ ur χµ = ϕµ durch −j bezeichnet. Man sieht, dass der elektromagnetische Term in Pχ im Limes r = ∞ verschwindet, da das Potential wie r −1 abnimmt; der Rest ist mit den erhaltenen Gr¨ossen f¨ ur ungeladene Teilchen identisch; die Bedeutung davon kennen wir schon (vergl. Abschnitt 2.8.2): e ist die Energie des Teilchens, und j der Drehimpuls um die Symmetriachse, beide in Bezug auf die asymptotischen Beobachter. Betrachten wir ein ungeladenes massives Teilchen mit der 4er-Geschwindigkeit u im Punkt p der Raumzeit. Das Teilchen hat die Energie e = µgµν ξ µ uν . Setzen wir voraus, dass ξ µ zeitartig ist in p; dann hat e ein positives Minimum gleich p µξ, wobei ξ = gµν ξ µ ξ ν die Norm des Killing-Vektors ist; dieses Minimum ist f¨ ur das Teilchen mit uµ = ξ −1 ξ µ erreicht (Aufgabe), das also in Bezug auf die asymptotischen Beobachter “ruht”. Wir wollen deshalb ξ Gravitationspotential in Bezug auf asymptotische Beobachter nennen, in Analogie zur Newton-Theorie, wo die Minimalenergie eines Teichens im Gravitationsfeld in einem festen Punkt gleich der Masse des Teilchens mal das Potential ist. µ
Ist aber der Vektor ξ µ raumartig in p, dann hat die Energie des Teilchens in p gar kein Minimum: wir k¨onnen negative Energie mit beliebig grossem absolutem Wert haben (Aufgabe). F¨ ur das Gebiet wo ξ µ raumartig ist, gibt es also keine Analogie zum Gravitationspotential. Der Teil dieses Gebietes, der ausserhalb des p Horizontes liegt, 2 2 2 heisst Ergosph¨ p are; sie ist definiert durch die Ungleichung M + M − a − Q < r < M + M 2 − a2 cos2 ϑ − Q2 (Bild 6.19). Die Grenze der Ergosph¨are ist also gegeben durch r 2 + a2 cos2 ϑ − 2M r + Q2 = 0, sie ber¨ uhrt den Horizont an den Polen ϑ = 0, π, und liegt ausserhalb des Horizontes f¨ ur alle andere Werte von ϑ, wenn a 6= 0. Es gibt keine Ergosph¨are, wenn a = 0.
Betrachten wir jetzt ein geladenes Teilchen; seine minimale Gesamtenergie im Punkt p (sobald ξ µ dort zeitartig ist), lautet µξ + qAµ ξ µ . Das ist analog zur Energie eines a¨hnliches Teilchen in der nichtrelativistischen Theorie, welche gleich µ× Gravitationspotential + q×elektrostatisches Potential ist. Wir k¨onnen also den Term Φ = Aµ ξ µ das elektrostatische Potential in Bezug auf asyptotische Beobachter nennen. Das Gebiet ausserhalb des Horizontes, wo µgµν ξ µ uν + qAµ ξ µ —die Energie (in Be264
zug auf asymptotische Beobachter) eines Teilchens mit Ladung q—negativ sein kann, heisst verallgemeinerte Ergosph¨are. Es ist klar, dass die verallgemeinerte Ergosph¨are die Ergosph¨are immer enth¨alt. Die Grenze der verallgemeinerten Ergosph¨are ist also entweder durch die Gleichung µξ + qΦ = 0 gegeben, wenn n¨amlich der Beitrag von qΦ negativ in Punkten mit ξ = 0 ist, oder sonst ξ = 0. Penrose-Prozesse Die Bedeutung der Ergosph¨are besteht darin, dass man, wenn sie existiert, Energie aus den L¨ochern gewinnen kann. Alles basiert auf der folgenden Voraussetzung: wenn ein Teilchen mit den kleinen Werten e, j und q den Horizont nach Innen durchkreuzt, dann a¨ndern sich die Parameter M , J und Q des Loches um δM = e,
δJ = j,
δQ = q.
Diese Voraussetzung klingt nat¨ urlich: sie bedeutet, dass die totale Energie, der totale Drehimpuls und die totale Ladung erhalten bleiben; wenn ein Teilchen im Loch verschwindet, wachsen die Parameter des Loches entsprechend. Der Beweis ist aber zu schwierig f¨ ur uns; man darf die kleinen St¨orungen nicht mehr vernachl¨assigen, welche ein Teilchen in der Metrik und dem Potential hervorruft. Wir wollen es ohne Beweis annehmen. Dann folgt aber unsere Behauptung unmittelbar, da e nur in der Pr¨asenz einer Ergosph¨are negativ sein kann. Solche Teilchen k¨onnen aber nur innerhalb der Ergosph¨are existieren, weil e erhalten ist und nur nichtnegativ ausserhalb der Ergosph¨are sein kann. Man kann also kein solches Teilchen vom asymptotischen Gebiet ins Loch werfen! Wenn der Energiegewinn aber nur in der unmittelbaren N¨ahe des Loches m¨oglich ist, hat er nicht viel praktische Bedeutung: wir sehen ja z.B. die Quasare bis zu uns stark strahlen. Die gewonnene Energie soll also ins asymptotische Gebiet transformierbar sein (mindestens im Prinzip). Dazu sind die sog. Penrose-Prozesse erdacht. Die Idee ist, die Erhaltung von e, j und q in Stossprozessen auszun¨ utzen. Man wirft ein Teilchen mit e1 , j1 und q1 vom asymptotischen Gebiet in die Ergosph¨are; diese zerf¨allt dort in zwei Teilchen, ein mit e2 , j2 und q2 und ein anderes mit e3 , j3 und q3 . Es gilt: e1 = e2 + e3 , j1 = j2 + j3 und q1 = q2 + q3 . Wenn e3 < 0, dann ist e2 > e1 . Wenn das dritte Teilchen ins Loch f¨allt, braucht es die Ergosph¨are nicht zu verlassen. Wenn das zweite Teilchen wieder das asymptotische Gebiet erreicht, haben die Beobachter dort Energie gewonnen. Solche Prozesse sind wirklich m¨oglich, aber wir wollen nicht in Details gehen. 2. Gesetz der Schwarzlochenergetik Als n¨achstes wollen wir ermitteln, welche Teilchen vom Loch eingefangen werden k¨onnen und welche Aenderungen der Parameter des Loches deshalb m¨oglich sind. 265
Wenn die Trajektorie des Teilchens durch v(λ), η(λ), r(λ) und ϕ(λ) gegeben ist, dann geht es durch den Horizont bei r = r+ , wenn dr/dλ < 0 in diesem Punkt ist. Das heisst: pr |r=r+ < 0. Wir wollen diese Bedingung durch e, j und q der Trajektorie ausdr¨ ucken. Dazu r schreiben wir p mit Hilfe der kovarianten Komponenten des Impulses und der kontravarianten Metrik (6.30), pr = −
r 2 + a2 ∆ a pv − pr − pη , Σ Σ Σ
(6.50)
und benutzen die Gleichung (6.41), um pv und pη durch e, j und q auszudr¨ ucken: qQr , Σ qQra sin2 ϑ = −j + . Σ
pv = e − pη
Alles am Horizont ausgewertet ergibt die Ungleichung: e>
aj + Qr+ q . 2 a2 + r +
(6.51)
Die Gleichung (6.51) heisst Eintrittbedingung. Gl. (6.51) gilt f¨ ur alle, auch raumartige, Kurven. Um zu zeigen, dass es die Eintrittbedingung ist, braucht es noch ein bischen Arbeit: wir m¨ ussen zeigen, dass es zeitartige Trajektorien gibt zu jedem Wert der Gr¨ossen e, j, q, M , a, Q, v η und ϑ welche die Ungleichung erf¨ ullen. Die Bedingung, dass die Kurve nichtraumartig ist, heisst g µν pµ pν ≥ 0. Ausgewertet am Horizont ergibt sie 2 (apv + pη )2 + 2pr [(r+ + a2 )pv + apη ] + p2ϑ ≤ 0.
Aus Gl. (6.50) folgt, dass 2 (r+ + a2 )pv + apη = −(Σpr )r=r+ ;
die rechte Seite ist positiv, also pr ≤ −
(apv + pη )2 + p2ϑ . 2 2[(r+ + a2 )pv + apη ]
Die Koordinaten (v, η, ϑ) des Eintritpunktes, die Parameter des Loches (M, a, Q) und die Parameter des Teilchens (e, j, q) bestimmen die Komponenten pv und pη . Die Komponenten pϑ und pr k¨onnen noch beliebig gew¨ahlt werden. Das kann aber 266
so gemacht werden, dass die obige Bedingung erf¨ ullt wird. Dann also existiert mindestens ein Teilchen, welches Gl. (6.51) erf¨ ullt, was zu zeigen war. Es gibt eine u ¨berraschende Interpretation der Eintrittbedingung (6.51). Berechnen wir den Zuwachs des Fl¨acheninhalts des Loches (Formel (6.38), dA = 8π(r+ dr+ + ada). F¨ ur dr+ erhalten wir, indem wir nach dem Differenzieren u ¨berall durch r+ − M ersetzen: dr+ = Dann ist
p M 2 − a2 − Q2
a Q r+ dM − da − dQ. r+ − M r+ − M r+ − M
2 r+ + a2 a Qr+ dM − dJ − dQ, r+ dr+ + ada = r+ − M r+ − M r+ − M
wobei wir da = d(J/M ) eingesetzt haben. Alles zusammen ergibt dA =
8π 2 [(r+ + a2 )dM − adJ − Qr+ dQ]. r+ − M
(6.52)
Wir benutzen weiter die Annahme, dass dM = e, dJ = j und dQ = q und erhalten, dass 2 8π(r+ + a2 ) aj + Qr+ q dA = e− 2 . r+ − M r+ + a 2
Dann ist aber die Ungleichung (6.51) ¨aquivalent zur einfachen Ungleichung dA > 0,
(6.53)
oder: der Fl¨acheninhalt des Loches muss in jedem Prozess mit eintretenden Teilchen zunehmen. Das ist das sogenannte 2. Gesetz der Schwarzlochenergetik. In dieser Form, Gl. (6.53), ist das Gesetz viel allgemeiner beweisbar (auf z.B. f¨ ur Kollisionen von zwei schwarzen L¨ochern). 1. Gesetz der Schwarzlochenergetik Wir k¨onnen die Gl. (6.52) nach dem Differential der Masse aufl¨osen: dM =
κ dA + ωdJ + φdQ, 8π
(6.54)
wobei die Koeffiziente κ, ω und φ wie folgt definiert sind: κ=
r+ − M , 2 r+ + a2
ω=
2 r+
a , + a2
267
φ=
Qr+ . + a2
2 r+
Gl. (6.54) ist die sogenannte differentiale Massenformel: sie beschreibt die Aenderung der Gesamtmasse des Loches in Abh¨angigkeit von Aenderungen der Oberfl¨ache, des Drehimpulses und der Ladung. Sie heisst manchmal auch 1. Gesetz der Schwarzlochenergetik. Wir wollen nun die Bedeutung der Koeffiziente κ, ω und φ in der differentialen Massenformel studieren. Aus der Metrik des Ereignishorizonts, welche durch die Gl. (6.37) gegeben ist, k¨onnen wir ablesen, dass ein lichtartiger Vektor l µ , der tangential zum Horizont ist, in Bezug auf die Koordinaten (v, η, r, ϑ) die Komponenten hat: lµ = (1,
2 r+
a , 0, 0). + a2
Er ist so normiert, dass lµ = ξ µ +
2 r+
a ϕµ , + a2
(6.55)
wobei ξ µ = (1, 0, 0, 0) das Killing-Vektorfeld der Stationarit¨at und ϕµ = (0, 1, 0, 0) dasjenige der Axisymmetrie ist. Der Vektor l µ representiert die einzige zukunftsgerichtete kausale Richtung am Horizont; sie kann also als die Bewegungsrichtung des Horizonts intuitiv interpretiert werden (Bild 6.20). Die Beziehung (6.55) besagt dann, dass sich der Horizont in Bezug auf Unendlichkeit (d.h., in Bezug auf das Killing-Vektorfeld der Stationarit¨at) dreht, und zwar mit der Winkelgeschwindigkeit ω: das ist also die Bedeutung von ω. Man sieht, dass die Drehung starr ist, d.h., ω = const l¨angs des Horizonts. Eine andere wichtige Eigenschaft des Vektorfeldes l µ ist, dass es ein Symmetriefeld in der ganzen Raumzeit ist, wenn wir ihn als lineare Kombination von zwei Symmetrievektorfeldern mit konstanten Koeffizienten betrachten; es ist das einzige kausale Symmetriefeld am Horizont mit der oben beschriebenen Normalisierung. Der Quadrat der Norm dieses Vektors ist λ = gµν lµ lν 2 2 2 2 + a2 cos2 ϑ ∆ r+ a2 sin2 ϑ r 2 − r+ = − 2 2 Σ r+ Σ r+ + a2 + a2 = b(ϑ)(r − r+ ) + O(r − r+ )2 , wobei b(ϑ) =
r+ − r − (r 2 + a2 cos2 ϑ) > 0, 2 (r+ + a 2 )2 +
und O(xn ) ein Term der Ordnung xn bedeutet. Es folgt, dass λ > 0 u ¨ber dem µ Horizont, am Horizont selber ist λ = 0. l ist also das einzige Symmetrievektorfeld, das nichtraumartig in einer ganzen Umgebung des Horizontes in EKN+ (d.h., r ≥ r+ ) ist! 268
Das Killingfeld lµ ist also zeitartig f¨ ur Beobachter, welche sich beliebig nahe u ¨ber den Horizont √befinden. F¨ ur diese Beobachter, welche in Bezug auf den Horizont ruhen, spielt λ die Rolle des Gravitationspotentials und Aµ lµ die Rolle des elektrischen Potentials. Es gilt weiter, dass √ √ lim g µν λ,µ λ,ν = −κ2 , r=r+
lim Aµ lµ = φ
r=r+
(Aufgabe). Das ergibt die Bedeutung der Koeffiziente κ und φ: κ ist die sogenannte Oberfl¨achengravitation (surface gravity), und φ das elektrische Potential des Loches (f¨ ur die lokalen Beobachter um den Horizont). Wichtig ist zu bemerken, dass alle drei Gr¨ossen, ω, κ und φ, nach ihrer Definition, nicht konstant am Horizont zu sein brauchen. Dass sie konstant sind, wird manchmal als “0-tes Gesetz” der Dynamik der schwarzen L¨ocher erw¨ahnt. Formal erinnert dieses Konstantsein an eine Gleichgewichtsbedingung, ¨ahnlich wie die Konstanz der Temperatur und des Druckes in der Thermodynamik. Irreduzible Masse Man kann die Eintrittbedingungen benutzen, um die Frage nach dem maximalen Energiegewinn zu beantworten. Die Ungleichung (6.51) besagt, dass die Energie des ins Loch fallenden Teilchens nicht beliebig klein sein kann. Die gewonnene Energie bei gegebenen Werten von j und q (und bei gegebenem Loch) kann nie die Grenze esup = −
aj + Qr+ q 2 a2 + r +
u ¨berschreiten. Dieser Wert kann aber nicht erreicht werden, man kann nur beliebig nahe kommen, da dabei (pr )r=r+ = 0 sein muss, das Teilchen am Horizont muss also zum Horizont tangential laufen; das geht nur lichtartig. Das ist also unm¨oglich f¨ ur massive Teilchen, und auch f¨ ur die lichtartigen kann man dieser Bewegungszustand nicht von Aussen erzeugen. Solche ideale Prozesse heissen reversibel aus dem folgenden Grund. Betrachten wir ein Prozess, wobei ein Teilchen mit e1 , j1 und q1 vom Loch mit den Parametern M , J und Q verschluckt wird; dabei ¨andern sich die Parameter des Loches zu M 0 = M +e1 , J 0 = J + j1 und Q0 = Q + q1 . Gibt es nachher einen Prozess, wobei ein Teilchen mit e2 , j2 und q2 verschluckt wird, so dass die Endparameter M 00 = M + e1 + e2 , J 00 = J + j1 + j2 und Q00 = Q + q1 + q2 des Loches mit den Anfangsparametern u ¨bereinstimmen? Das heisst offensichtlich, dass e1 = −e2 , j1 = −j2 und q1 = −q2 . Die letzten zwei Gleichungen zusammen mit der Ungleichung (6.51) implizieren: aj1 + Qr+ q1 e1 > , 2 a2 + r +
0 a 0 j1 + Q 0 r + q1 e2 > − , 02 02 a + r+
269
0 wobei a0 = J 0 /M 0 und r+ = r+ (M 0 , J 0 , Q0 ). Mit der Genauigkeit bis zur ersten Ordnung in e1 , j1 und q1 k¨onnen wir die Striche in der zweiten Ungleichung weglassen. Es folgt dann, dass e1 + e2 > 0, eine Gleichheit k¨onnte nur gelten, wenn beide Prozesse eben reversibel w¨aren. Um weiter zu kommen, brauchen wir die Gleichung, welche die Energie des Loches als Funktion der Parameter A, J and Q gibt. Dazu schreiben wir die Beziehung (6.38) mit Hilfe von M , J und Q um, 2 p J2 2 2 2 2 + 2 A = 4π M + M − J /M − Q M p = 4π 2M 2 − Q2 + 2 M 4 − J 2 − M 2 Q2 ,
und l¨osen dies Gleichung nach M auf: v " # u 2 1u 4π A M= t + Q2 + 4J 2 . 2 A 4π
(6.56)
Das ist die sogenannte Massenformel. Die differentiale Massenformel ist einfach das Differential davon. Die Massenformel k¨onnen wir benutzen, um die totale nutzbare Energie eines Loche zu ermitteln. Betrachten wir ein Loch mit den Parametern A, J, und Q; die Gesamtenergie davon ist durch die Massenformel gegeben. Man kann nun Energie durch die Penrose-Prozesse extrahieren, aber nie mehr, als die reversiblen Prozesse erlauben. Dabei vermindert sich die Rotationsenergie und die elektrische Energie des Loches, so dass A konstant bleibt, bis der Zustand mit der minimalen Masse bei dem konstanten A erreicht ist. Wo dieses Minimum liegt, berechnet man aus der Gl. (6.56): die ersten Ableitungen der Funktion M sind: Q 4π J ∂M 4π A ∂M 2 = , = +Q . ∂J AM ∂Q A 4π 2M Es folgt, dass das einzige Extremum der Funktion bei J = Q = 0 liegt. Es ist ein absolutes Minimum, denn man zeigt sehr schnell die Ungleichung M (A, J, Q) > M (A, 0, 0) f¨ ue alle J 6= 0 und Q 6= 0, wenn man den Ausdruck f¨ ur M quadriert. Das ist ein Schwarzschild-Loch, wovon keine Energie mehr gewonnen werden kann und das den Fl¨acheninhalt A hat. Nach der Massenformel ist die Energie davon 2 Mirr =
A . 16π
270
Diese Energie nennt man irreduzible Energie des Loches mit den Parametern A, J und Q. Die verf¨ ugbare Energie eines solchen Loches ist also die Differenz der Gesamtmasse, gegeben durch die Massenformel, und der irreduziblen Masse. Die Aehnlichkeit unserer Formeln mit den Grundgesetzen der Thermodynamik springt ins Auge. Wenn man irgendwie sinnvoll eine Entropie des Loches S einf¨ uhren k¨onnte, so dass S = bA, (6.57) wobei b eine Konstante w¨are, und die Gr¨osse T , T =
κ , 8πb
(6.58)
sich irgendwie als Temperatur verstehen l¨asst, dann h¨atten wir auch eine nicht nur formale Aehnlichkeit. Bisher konnte das Wesen der Temperatur einigermassen begr¨ undet werden: es hat sich gezeigt (theoretisch), dass ein Quantengas nur bei der Temperatur (6.58) mit b = αklP−2 (k = Boltzmann-Konstante, α = ein numerischer Faktor nahe eins, lP = Planck-L¨ange) in Anwesenheit des Loches im Gleichgewicht sein kann. Ein vergleichbares Verst¨andnis der Formel (6.57) ist bisher noch nicht ereicht worden.
6.6.2
Energie der Teilchen im Feld eines schwarzen Loches
Wir haben gesehen, dass der Teil der Energie eines schwarzen Loches, welcher in seiner Rotation und Ladung gespeichert ist, gewonnen werden kann. Eine Menge Energie l¨asst sich aber auch gewinnen, wenn ein schwarzes Loch nur anwesend ist, ohne dass dabei seine Energie vermindert wird (sie will meistens sogar wachsen). Die Quelle dieser Energie ist die Ruhemasse der Teilchen, welche sich dem Loch n¨ahern. Die minimale Energie, welche ein ungeladenes Teilchen in Bezug auf die asymptotischen Beobachter im Allgemeinen in der N¨ahe eines Loches hat, ist durch das Gravitationspotential ξ gegeben (wir wollen ausserhalb der Ergosph¨are bleiben). Im asymptotischen Gebiet ist ξ = 1, also ist die Energie gleich der Ruhemasse µ. An der Ergosph¨are ist ξ = 0, also ist die Energie gleich Null. Wenn der Rest µ(1−ξ) total zum asymptotischen Gebiet transformiert werden kann, dann k¨onnen wir bis 100% der Ruheenergie des Teilchens gewinnen. Im Prinzip kann man dieser Effektivit¨at beliebig nahe kommen. Eine reale Anordnung hat aber immer eine kleinere Effektivit¨at. Das Problem ist, die Teilchen zur Energie µξ abzubremsen. Wir wollen ein Modell einer solchen Anordnung konstruieren: eine Akkretionsscheibe. Da es uns um Prinzipien geht, wird dieses Modell stark vereinfacht. (Die Akkretionsscheiben sind heute ein Gegenstand einer grossen, komplizierten Wissenschaft.) Wir setzen voraus, dass um ein Schwarzschildsches Loch in der Aequatorialebene sich ungeladene Staubteilchen auf 271
praktisch kreisf¨ormigen Trajektorien drehen. Sie reiben sich aneinander, erw¨armen sich, strahlen Energie ab, und sinken langsam zu niedrigeren kreisf¨ormigen Trajektorien. Da sie nicht exakt diesen Kreisbahnen folgen, m¨ ussen es stabile Kreisbahnen sein. Das geht also so lange, bis sie die sogenannte letzte stabile Kreisbahn erreichen; dann fallen sie praktisch ohne viel Strahlung schnell ins Loch. Das Loch wird dabei in eine immer schnellere Drehung versetzt und seine Energie wird wachsen. Doch wird ein Anteil der Ruhemasse der Teilchen ins asymptotische Gebiet abgestrahlt. Studieren wir also die Kreisbahnen in der Schwarzschild-Raumzeit. Wir k¨onnen Gln. (2.84)–(2.86) f¨ ur die Autoparallele in statischen rotationssymmetrischen Raumzeiten benutzen, wobei wir die Schwarzschild-Werte A(r) =
2M 1− r
−1
,
B(r) =
2M 1− r
nehmen. Dann ergeben die Gleichungen: r˙ 2 + Veff (r) = 0 ,
e t˙ = , 1 − 2M r j ϕ˙ = 2 , r
(6.59) (6.60) (6.61)
wobei Veff (r) = −2M j 2 r −3 + j 2 r −2 − 2M µ2 r −1 − e2 + µ2
(6.62)
(Bild 6.21). Das effektive Potential ist dasselbe wie Gl. (6.48) mit a = Q = 0 und q = 0. Die Formeln (6.60) und (6.61) sind ¨aquivalent zu Eqs. (6.42) und (6.43) in Schwarzschild-Koordinaten. 0 (r) = 0 oder Aus Gl. (6.59) haben wir f¨ ur die Beschleunigung 2r¨ ˙ r + Veff 1 0 r¨ = − Veff (r) . 2 Die stabilen Kreisbahnen entsprechen also den Minimas der Funktion Veff (r). F¨ ur die Ableitung ergibt sich: 0 Veff (r) =
2 (M µ2 r 2 − j 2 r + 3M j 2 ) r4
0 (r) ist unabh¨angig von e; die Lage der Extrema ist also auch unabh¨angig davon, Veff und so kann e zum Verstellen der H¨ohe der Extrema benutzt werden. Die Gleichung 0 Veff (r) = 0 l¨osen wir zun¨achst nach µ2 :
j2 (R − 3M ). µ = M R2 2
272
Diese Gleichung bedeutet, dass die Kreisbahn r = R zeitartig ist (µ2 > 0), wenn R > 3M , lichtartig (µ2 = 0), wenn R = 3M , und raumartig (µ2 < 0), wenn R < 3M . 0 Jetzt betrachten wir die Gleichung Veff (r) = 0 anders: Die Wurzeln des Polynoms in der Klammer liegen bei r = R± , R± =
6M p , 1 ∓ 1 − 12M 2 µ2 j −2
wobei die Wurzel ist real nur wenn
√ |j| ≥ 2 3M µ. Veff (r) steigt also von −∞ bei r = 0 bis zum Maximum bei r = R− , 3M < R− ≤ 6M (instabile Kreisbahn), dann nimmt es ab bis zum Minimum bei r = R+ , R+ ≥ 6M (stabile Kreisbahn), und dann steigt es wieder bis zum Wert µ2 − e2 bei r = ∞. Wenn die Parameter µ und j so sind, dass √ |j| = 2 3M µ, dann ist R− = R+ = 6M , und dieser Punkt ist der Punkt der Inflexion; das Potential wird nichtfallend im ganzen Bereich (0, ∞), und die Kreisbahn bei R = 6M ist instabil; man nennt sie trotzdem die “letzte stabile Kreisbahn.” F¨ ur R > 6M wollen wir jetzt e(R) und j(R) an der stabilen zeitartigen Kreisbahn 0 (r) = 0 lassen mit Radius R berechnen. Die zwei Gleichungen Veff (r) = 0 und Veff sich in Bezug auf j und e l¨osen: r M R − 2M , |j(R)| = µR . (6.63) e(R) = µ p R − 3M R(R − 3M )
F¨ ur R > 6M sind e(R) und |j(R)| beide steigende Funktionen von R. F¨ ur die letzte stabile Kreisbahn ergibt sich R0 = 6M, √ j0 = ±2 3 M µ. und
√ 2 2 µ = 0.943µ. e0 = 3 Im Idealfall erhalten wir f¨ ur jedes Teilchen den ganzen Rest durch die Strahlung (das Loch f¨angt nur einen kleinen Teil), das macht 5.6% der Ruhemasse. Dies ist keine schlechte Effektivit¨at, wenn man bedenkt, dass die Effektivit¨at der Kernreaktionen h¨ochstens etwa 1% ist. In einem realistischen Disk ist die Temperatur nicht gleichm¨assig verteilt, sondern gibt es heissere und k¨ uhlere Stellen. Die heissen Flecken erzeugen die meiste 273
Strahlung. Diese Strahlung zeigt dann eine ungef¨ahr periodische struktur, welche mit der Umlaufperiode u ¨bereinstimmt. Berechnen wir die entsprechende Frequenz. Die Winkelgeschwindigkeit der Kreisbahnen, die in Bezug auf die Zeit t genommen ist, ergibt sich aus den Formeln (6.60) und (6.61): dϕ R − 2M j = . dt R3 e Das ist genau die Winkelgeschwindigkeit, welche im asymptotischen Gebiet beobachtet wird—siehe den Abschnitt 2.5.4 u ¨ber die Rotverschiebung in Teil I. Die Werte von j(R) und e(R) sind von Gl. (6.63) gegeben. Das ergibt endlich r 1 M |ω| = . R R Die gesuchte Frequenz ν = ω/2π ist dann r |ν| =
M 1 . R 2πR
Diese Formel l¨asst sich sehr einfach deuten. Die Wurzel ist ein numerischer Faktor √ mit dem maximalen m¨oglichen Wert 1/ 6 ≈ 1/2.45. Der Rest ist die Frequenz, mit welcher das Licht (c = 1) die Kreisl¨ange 2πR uml¨auft. Somit bewegen sich die heissen Flecken mit der Geschwindigkeit r M c R herum. Das ergibt sehr hohe Frequenzen f¨ ur sternartige L¨ocher; diese sind wirklich beobachtet, und sind als ein typisches Merkmal einer Akkretionsscheibe um ein schwarzes Loch ben¨ utzt (eine Akkretionsscheibe um ein Neutronenstern w¨ urde sich viel langsamer bewegen).
6.7
Aufgaben
1. Finden Sie die retardierte Eddington-Finkelstein-Raumzeit REF, indem Sie die retardierte Zeitkoordinate u anstatt v benutzen, in einer analogen Weise, wie die AEF-Metrik (5.20) gefunden wurde. Finden Sie alle isometrischen Abbildungen von AEF- und REF-Raumzeiten in die Kruskal-Raumzeit. 2. uµ und v µ seien zwei nichtraumartige, nichtverschwindende Vektoren in einem Punkt p einer Raumzeit. Beweisen Sie: Wenn beide Vektoren im gleichen Halblichtkegel liegen, dann ist gµν uµ v ν ≥ 0, und wenn beide in verschiedenen Halblichtkegeln liegen, dann gµν uµ v ν ≤ 0. 274
3. Die zweidimensionale Raumzeit (M, g) sei durch zwei Karten (U1 , g1 ) und (U2 , g2 ) und durch zwei Koordinatentransformationen φ1 : U11 7→ U21 und φ2 : U12 7→ U22 in zwei Paaren u ¨ berlappender Gebiete U11 ⊂ U1 , U12 ⊂ U1 , und U21 ⊂ U2 , U22 ⊂ U2 definiert, wobei: (a) (U1 , g1 ) := t1 ∈ (−∞, ∞), x1 ∈ (−2, 0), ds2 = dt21 − dx21 ,
(U2 , g2 ) := t2 ∈ (−∞, ∞), x2 ∈ (0, 2), ds2 = dt22 − dx22 ,
U11 := t1 ∈ (−∞, ∞), x1 ∈ (−1, 0), U21 := t2 ∈ (−∞, ∞), x2 ∈ (0, 1),
φ1 := (t1 , x1 ) 7→ (t2 , x2 ) = (t1 , x1 + 1),
U12 := t1 ∈ (−∞, ∞), x1 ∈ (−2, −1),
U22 := t2 ∈ (−∞, ∞), x2 ∈ (1, 2),
φ2 := (t1 , x1 ) 7→ (t2 , x2 ) = (−t1 , x1 + 3).
Beweisen Sie: i. (M, g) hat eine wohldefinierte Metrik in jedem Punkt. ii. (M, g) ist nicht zeitorientierbar. (Hinweis: Finden Sie eine geschlossene Kurve, l¨angs deren kein stetiges zeitartiges Vektorfeld existiert.) iii. (M, g) ist nicht kausal. (b) (U1 , g1 ) := t1 ∈ (−2, 0), x1 ∈ (−∞, ∞), ds2 = dt21 − dx21 ,
(U2 , g2 ) := t2 ∈ (0, 2), x2 ∈ (−∞, ∞), ds2 = dt22 − dx22 ,
U11 := t1 ∈ (−1, 0), x1 ∈ (−∞, ∞), U21 := t2 ∈ (0, 1), x2 ∈ (−∞, ∞),
φ1 := (t1 , x1 ) 7→ (t2 , x2 ) = (t1 + 1, x1 ),
U12 := t1 ∈ (−2, −1), x1 ∈ (−∞, ∞), U22 := t2 ∈ (1, 2), x2 ∈ (−∞, ∞),
φ2 := (t1 , x1 ) 7→ (t2 , x2 ) = (t1 + 3, x1 ).
Beweisen Sie: 275
i. (M, g) hat eine wohldefinierte Metrik in jedem Punkt. ii. (M, g) ist zeitorientierbar. iii. (M, g) ist nicht kausal. 4. S sei eine Hyperfl¨ache in der Raumzeit (M, g), so dass die induzierte Metrik γkl a) zeitartig (σ = −1) oder b) raumartig (σ = −3) in jedem Punkt von S ist. Beweisen Sie: S ist zeitartig im Fall a) und raumartig im Fall b) 5. Zeichnen Sie auf der (τ, ξ)-Ebene die Profilkurve der Oberfl¨ache eines rotationssymmetrischen Sternes, welcher von t = −∞ bis t = 0 statisch im Quadranten I ist und dann kollabiert. Zeigen Sie rigoros, dass die Profilkurve ganz in der Menge liegt, die aus den Quadranten I und III und deren gemeinsamen Grenze besteht. 6. Zeigen Sie, dass die Metrik (6.17) auch bei r → −∞ asymptotisch flach ist, und dass die asymptotischen Beobachter dort das Feld eines Objekts mit der Masse −M , dem Drehimpuls J = −aM und der Ladung −Q wahrnehmen. Hinweis: F¨ uhren Sie eine neue Radialkoordinate r 0 = −r ein.
7. Gegeben sei eine Metrik in der Form ds2 = Aαβ (x)(eαµ dxµ )(eβν dxν ), wobei Aαβ (x) eine Matrix mit skalaren Elementen und {eαµ (x)} eine Kobasis ist. Zeigen Sie: (a) Die Signatur der Metrik ist gleich der Signatur von Aαβ ; (b) det gµν = det Aαβ (det eαµ )2 ; (c) g µν = (A−1 )αβ eµα eνβ , wobei {eµα } eine Basis ist, zu welcher die Kobasis {eαµ } dual ist. 8. Benutzen Sie die Resultate der vorigen Aufgabe, um die Determinante und die kontravariante Metrik zur Metrik (6.26) zu berechnen. 9. Beweisen Sie, dass die Kurve v = v0 , η = η0 , r = −λ und ϑ = ϑ0 eine lichtartige Geod¨ate der Kerr-Newman-Metrik ist. 10. Konstruieren Sie eine Zeitorientierung f¨ ur die Carter-Raumzeit: W¨ahlen Sie µ µ eines der Vektorfelder ±Tr und ±Ta in jedem der RKN und AKN. Flicken 276
Sie die Raumzeit so, dass ihr Skalarprodukt in jedem u ¨berlappenden Gebiet positiv ist (das l¨asst sich durch den Wert des Skalarproduktes in einem einzigen Punkt beweisen!). 11. Beweisen Sie, dass das Vektorfeld ξ µ (x) eine Symmetrie des Potentials Aµ (x) ist, wenn und nur wenn ρ Aµ,ρ ξ ρ + Aρ ξ,µ = 0. 12. Leiten Sie das Erhaltungsgesetz P˙ ξ = 0 direkt aus der Killing-Gleichung f¨ ur die Metrik und der Symmetriegleichung f¨ ur das Potential her. 13. Leiten Sie die Bewegunsgleichungen (6.45) und (6.46) her und zeigen Sie, dass l¨angs einer zukunftsgerichteten Trajektorie mit abnehmender (oder zunehmender) Koordinate r nur eines der Paare (u, ξ) und (v, η) an jedem Horizont regul¨ar sein kann. 14. Beweisen Sie, dass die Energie e = pµ ξ µ eines Teilchens in Bezug auf asymptotische Beobachter ein Minimum in jedem Punkt der Raumzeit hat, wo das Killing-Vektorfeld nichtraumartig ist und dass kein Minimum existiert, wenn ξ µ raumartig ist. 15. Vergleichen Sie die Rotationsenergie der schwarzen L¨ocher mit der Rotationsenergie eines einfachen Newtonschen Sternmodells: einer starren Kugel mit Masse MS , Radius RS und konstanter Dichte. Dr¨ ucken Sie die Sternenergie als eine Funktion des Radius und des Drehimpulses aus (seien Sie vorsichtig: die Geschwindigkeit am Aequator soll nichtrelativistisch sein!). Setzen Sie die irreduzible Masse des Loches gleich MS , und w¨ahlen Sie interessante Zahlen, z.B. eine Sonnenmasse, u.s.w.
277
Literaturverzeichnis [1] I. M. Gel’fand, Lectures on Linear Algebra. Interscience Publishers, New York, 1961. [2] H. Heuser, Gew¨ohnliche Differentialgleichungen. Teubner, Stuttgart, 1989. [3] C. M. Will, Theory and Experiment in Gravitational Physics. Cambridge University Press, Cambridge, 1993. [4] I. Ciufolini und J. A. Wheeler, Gravitation and Inertia. Princeton University Press, Princeton, 1995. [5] L. P. Eisenhart, Riemannian Geometry. Princeton University Press, Princeton, 1949. [6] Relativity: The General Theory. North-Holland, Amsterdam, 1960. [7] S. Weinberg, Gravitation and Cosmology. Wiley, New York, 1072. [8] S. W. Hawking and G. F. R. Ellis, The large scale structure of space-time, Cambridge University Press, Cambridge, 1973. [9] C. W. Misner, K. S. Thorne, J. A. Wheeler, em Gravitation, Freeman, San Francisco, 1973.
278