Mathematische Physik: Klassische Mechanik
Andreas Knauf
Mathematische Physik: Klassische Mechanik
123
Prof. Dr. Andreas Knauf Department Mathematik FAU Erlangen-Nürnberg Cauerstr. 11 91058 Erlangen Deutschland
[email protected]
ISBN 978-3-642-20977-2 e-ISBN 978-3-642-20978-9 DOI 10.1007/978-3-642-20978-9 Springer Heidelberg Dordrecht London New York Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Mathematics Subject Classification (2010): 37N05 c Springer-Verlag Berlin Heidelberg 2012 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Einbandentwurf: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier Springer ist Teil der Fachverlagsgruppe Springer Science+Business Media (www.springer.com)
Inhaltsverzeichnis Bemerkungen zur Mathematischen Physik Motive und Ziele . . . . . . . . . . . . . Inhalte des Buches ,Klassische Mechanik’ Inhalte der Lehrbuchreihe . . . . . . . . . Zur Notation . . . . . . . . . . . . . . . . Kleines Englisch-W¨ orterbuch . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
1 Einleitung
xi xi xiii xiv xv xvi 1
2 Dynamische Systeme 2.1 Iterierte Abbildungen, dynamische Systeme . . . . . . . . . . . . 2.2 Stetige dynamische Systeme . . . . . . . . . . . . . . . . . . . 2.3 Differenzierbare dynamische Systeme . . . . . . . . . . . . . . .
11 12 16 25
3 Gew¨ ohnliche Differentialgleichungen 3.1 Definitionen und Beispiele . . . . . . . . . . . . . . . . 3.2 Lokale Existenz und Eindeutigkeit der L¨osung . . . . . 3.3 Globale Existenz und Eindeutigkeit der L¨osung . . . . . 3.4 Transformation in ein dynamisches System . . . . . . . 3.5 Das maximale Existenzintervall . . . . . . . . . . . . . 3.6 Der Hauptsatz der Differentialgleichungstheorie . . . . 3.6.1 Linearisierung der DGL entlang einer Trajektorie 3.6.2 Aussage und Beweis des Hauptsatzes . . . . . . 3.6.3 Folgerungen aus dem Hauptsatz . . . . . . . .
. . . . . . . . .
29 30 35 42 45 48 50 51 53 55
4 Lineare Dynamik 4.1 Homogene lineare autonome DGLn . . . . . . . . . . . . . . . . 4.2 Explizit zeitabh¨angige lineare DGLn . . . . . . . . . . . . . . . 4.3 Quasipolynome . . . . . . . . . . . . . . . . . . . . . . . . . .
57 58 65 70
5 Klassifikation linearer Fl¨ usse 5.1 Konjugationen linearer Fl¨ usse . . . 5.2 Hyperbolische lineare Vektorfelder 5.3 Lineare Fl¨ usse in der Ebene . . . . 5.4 Beispiel: Feder mit Reibung . . . .
73 74 76 80 84
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . . . . . .
. . . .
. . . . . . . . .
. . . .
. . . . . . . . .
. . . .
. . . . . . . . .
. . . .
. . . .
v
vi
Inhaltsverzeichnis
6 Hamiltonsche Gleichungen und Symplektische Gruppe 6.1 Gradientenfl¨ usse und hamiltonsche Systeme . . . . . . . 6.1.1 Gradienten–Differentialgleichungen . . . . . . . . 6.1.2 Hamiltonsche Systeme . . . . . . . . . . . . . . 6.2 Die symplektische Gruppe . . . . . . . . . . . . . . . . . 6.2.1 Lineare hamiltonsche Systeme . . . . . . . . . . 6.2.2 Symplektische Geometrie . . . . . . . . . . . . . 6.2.3 Die symplektische Algebra . . . . . . . . . . . . 6.3 Lineare hamiltonsche Systeme . . . . . . . . . . . . . . . 6.3.1 Harmonische Oszillatoren . . . . . . . . . . . . . 6.3.2 Harmonische Gitterschwingungen . . . . . . . . . 6.3.3 Teilchen im konstanten elektromagnetischen Feld 6.4 Unterr¨aume symplektischer Vektorr¨aume . . . . . . . . . 6.5 * Der Maslov–Index . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
. . . . . . . . . . . . .
89 90 90 93 95 95 96 101 103 104 110 113 116 119
7 Stabilit¨ atstheorie 7.1 Stabilit¨at linearer Differentialgleichungen . 7.2 Liapunov-Funktionen . . . . . . . . . . . 7.3 Verzweigungen . . . . . . . . . . . . . . . 7.3.1 Verzweigungen von Ruhelagen . . 7.3.2 Verzweigungen periodischer Orbits 7.3.3 Verzweigungen des Phasenraums .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
127 128 131 134 134 138 141
8 Variationsprinzipien 8.1 Lagrange- und Hamilton–Gleichungen 8.2 Holonome Zwangsbedingungen . . . . 8.3 Das hamiltonsche Variationsprinzip . . 8.4 Die Geod¨atische Bewegung . . . . . . 8.5 Die Jacobi–Metrik . . . . . . . . . . . 8.6 Das fermatsche Prinzip . . . . . . . . 8.7 Die geometrische Optik . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
143 144 149 152 159 164 169 171
9 Ergodentheorie 9.1 Maßerhaltende dynamische Systeme 9.2 Ergodische dynamische Systeme . . 9.3 Mischende dynamische Systeme . . . 9.4 Der birkhoffsche Ergodensatz . . . . 9.5 Der poincar´esche Wiederkehrsatz . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
177 178 181 184 191 197
10 Symplektische Geometrie 10.1 Symplektische Mannigfaltigkeiten . . . . . 10.2 Lie–Ableitung und Poisson–Klammer . . . 10.3 Kanonische Transformationen . . . . . . . 10.4 Lagrange–Mannigfaltigkeiten . . . . . . . 10.5 Erzeugende kanonischer Transformationen
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
201 202 208 213 219 221
. . . . .
Inhaltsverzeichnis
vii
11 Bewegung im Potential 11.1 Allgemein g¨ ultige Eigenschaften . . . . . . . . . . . . . . 11.1.1 Existenz des Flusses . . . . . . . . . . . . . . . . 11.1.2 Reversibilit¨at des Flusses . . . . . . . . . . . . . 11.1.3 Erreichbarkeit . . . . . . . . . . . . . . . . . . . 11.2 Bewegung im periodischen Potential . . . . . . . . . . . 11.2.1 Existenz der asymptotischen Geschwindigkeiten . 11.2.2 Verteilung der asymptotischen Geschwindigkeiten 11.2.3 Ballistische und diffusive Bewegung . . . . . . . 11.3 Himmelsmechanik . . . . . . . . . . . . . . . . . . . . . 11.3.1 Geometrie des Kepler–Problems . . . . . . . . . 11.3.2 Zwei Gravitationszentren . . . . . . . . . . . . . 11.3.3 Das n–K¨ orper-Problem . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
225 226 226 227 228 228 229 231 235 238 239 247 252
12 Streutheorie 12.1 Potentialstreuung . . . . . . . . . . . . . . . . . . . . . 12.2 Die Møller-Transformationen . . . . . . . . . . . . . . . 12.3 Der differentielle Wirkungsquerschnitt . . . . . . . . . . 12.4 Zeitverz¨ ogerung, Radon–Transform., Inverse Streutheorie 12.5 Kinematik der Streuung von n Teilchen . . . . . . . . . 12.6 * Asymptotische Vollst¨andigkeit . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
259 260 268 275 279 286 291
13 Integrable Systeme und Symmetrien 13.1 Was bedeutet Integrabilit¨at? Ein Beispiel 13.2 Der Satz von Liouville-Arnol’d . . . . . 13.3 Winkel-Wirkungskoordinaten . . . . . . 13.4 Die Impulsabbildung . . . . . . . . . . . 13.5 * Reduktion des Phasenraums . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
305 306 309 315 322 330
14 Starre und bewegliche K¨ orper 14.1 Bewegungen des Raumes . . . . . . . . . 14.2 Kinematik starrer K¨ orper . . . . . . . . . 14.3 L¨osung der Bewegungsgleichungen . . . . 14.3.1 Kr¨aftefreie Kreisel . . . . . . . . . 14.3.2 Schwere (symmetrische) Kreisel . 14.4 Bewegliche K¨ orper, anholonome Systeme . 14.4.1 Geometrie beweglicher K¨ orper . . 14.4.2 Anholonome Zwangsbedingungen .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
343 344 345 351 352 358 361 361 364
15 St¨ orungstheorie 15.1 Bedingt-periodische Bewegung des Torus . . . 15.2 St¨orungstheorie f¨ ur eine Winkelvariable . . . . 15.3 Hamiltonsche St¨ orungstheorie erster Ordnung 15.4 KAM-Theorie . . . . . . . . . . . . . . . . . 15.4.1 * Ein Beweis des KAM–Satzes . . . . 15.4.2 Maß der KAM–Tori . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
367 368 376 379 387 388 399
viii
Inhaltsverzeichnis 15.5 Diophantische Bedingung und Kettenbr¨ uche . . . . . . . . . . . 403 15.6 Cantori: Am Beispiel der Standardabbildung . . . . . . . . . . . 408
16 Relativistische Mechanik 16.1 Die Lichtgeschwindigkeit . . . . . . . 16.2 Die Lorentz– und die Poincar´e–Gruppe 16.3 Geometrie des Minkowski–Raumes . . 16.4 Die Welt in relativistischer Sichtweise . 16.5 Von Einstein zu Galilei — und zur¨ uck 16.6 Relativistische Dynamik . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
411 412 414 419 425 430 435
17 Symplektische Topologie 437 17.1 Das symplektische Kamel und das Nadel¨ohr . . . . . . . . . . . 438 17.2 Der Satz von Poincar´e–Birkhoff . . . . . . . . . . . . . . . . . . 442 17.3 Die Arnol’d–Vermutung . . . . . . . . . . . . . . . . . . . . . . 446 A Topologische R¨ aume und A.1 Topologie und Metrik A.2 Mannigfaltigkeiten . . A.3 Das Tangentialb¨ undel
Mannigfaltigkeiten 449 . . . . . . . . . . . . . . . . . . . . . . . 449 . . . . . . . . . . . . . . . . . . . . . . . 457 . . . . . . . . . . . . . . . . . . . . . . . 463
B Differentialformen ¨ B.1 Außere Formen . . . . . . . . . . . . . . B.2 Differentialformen auf dem Rn . . . . . . B.3 Integration von Differentialformen . . . . B.4 Differentialformen auf Mannigfaltigkeiten . B.5 Innere Ableitung und Lie–Ableitung . . . . B.6 Der Satz von Stokes . . . . . . . . . . . . B.7 Das Poincar´e–Lemma . . . . . . . . . . . B.8 de-Rham–Kohomologie . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
471 472 477 482 485 486 489 493 497
C Konvexit¨ at und Legendre–Transformation 500 C.1 Konvexe Mengen und Funktionen . . . . . . . . . . . . . . . . . 500 C.2 Die Legendre-Fenchel–Transformation . . . . . . . . . . . . . . 501 D Fixpunkt- und Urbilds¨ atze
505
E Gruppentheorie E.1 Gruppen . . . . . . . . E.2 Lie–Gruppen . . . . . . E.3 Lie–Algebren . . . . . . E.4 Lie–Gruppenwirkungen
508 508 511 514 519
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Inhaltsverzeichnis F B¨ undel, Zusammenhang, Kr¨ ummung F.1 Faserb¨ undel . . . . . . . . . . . . . . . . F.2 Zusammenh¨ange auf Faserb¨ undeln . . . . F.3 Distributionen und der Satz von Frobenius F.4 Holonomie und Kr¨ ummung . . . . . . . .
ix
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
522 522 526 532 534
G Morse–Theorie 537 G.1 Morse–Ungleichungen . . . . . . . . . . . . . . . . . . . . . . . 537 G.2 Singul¨are Homologie . . . . . . . . . . . . . . . . . . . . . . . . 541 G.3 Geod¨atische Bewegung und Morse–Theorie . . . . . . . . . . . . 545 H L¨ osungen der Aufgaben
552
Literaturverzeichnis
609
Namensregister
620
Symboltabelle
622
Abbildungsnachweis
623
Sachregister
624
Bemerkungen zur Mathematischen Physik Motive und Ziele The laws of nature are constructed in such a way as to make the universe as ” interesting as possible.” Freeman Dyson, in Imagined Worlds (1997) In der Mathematischen Physik wird versucht, ausgehend von physikalischen Grundgleichungen und -Annahmen (wie der newtonschen Gleichung, der Boltzmann–Verteilung oder der Schr¨ odinger–Gleichung) physikalische Sachverhalte mathematisch abzuleiten. Im Mittelpunkt steht also das physikalische Problem (zum Beispiel die Frage nach der Stabilit¨at des Sonnensystems, dem Grund f¨ ur die Existenz von Kristallen oder der Lokalisierung von Elektronen im amorphen Festk¨orper). Die zur L¨osung des jeweiligen Problems ben¨otigten Methoden lassen sich mehrheitlich Analysis oder Geometrie zuordnen, aber auch algebraische Techniken spielen eine Rolle. In grober Zuordnung entspricht mathematisch der • Klassischen Mechanik die Theorie der gew¨ ohnlichen Differentialgleichungen, • der Quantenmechanik die Funktionalanalysis und • der (klassischen) Statistischen Mechanik die Wahrscheinlichkeitstheorie. Zu einem Zyklus u ¨ber Theoretische Physik geh¨ort aber auch die Elektrodynamik und damit mathematisch gesehen die Theorie der Maxwell–Gleichung, einer linearen partiellen Differentialgleichung. Die Allgemeine Relativit¨atstheorie, eins der Fundamente der modernen Physik, f¨ uhrt wie viele andere Fragestellungen auf eine nichtlineare partielle Differentialgleichung. Die Quantenfeldtheorie beruht auf einer Vielfalt analytischer, geometrischer wie algebraischer Methoden. Bei dieser Uferlosigkeit des Gebietes stellt sich die Frage, wie es m¨oglich ist, hier in vern¨ unftiger Zeit Boden unter den F¨ ußen zu bekommen, und ob sich die Besch¨aftigung mit Mathematischer Physik lohnt. Der vorliegende erste Band des geplanten dreib¨andigen Kurses zur Mathematischen Physik gibt ein Angebot zur ersten Frage. xi
xii
Bemerkungen zur Mathematischen Physik
Die zweite Frage muß jeder f¨ ur sich entscheiden. Studierende der Mathematik und der Physik haben hier oft unterschiedliche Motive: • In den Kursusvorlesungen der Theoretischen Physik kann ein mathematisch rigoroser Unterbau aus Zeitgr¨ unden nicht geschaffen werden. Notgedrungen werden etwa Schr¨ odinger-Operatoren wie endliche Matrizen behandelt. Hier bietet die Mathematischen Physik eine sinnvolle Erg¨anzung. Der f¨ ur eine h¨ ohere mathematische Genauigkeit zu zahlende Preis besteht darin, dass ein Kurs zur Mathematischen Physik bei Bachelor-regulierter Zeit nicht die gleiche Vielfalt physikalischer Ph¨anomene behandeln kann, wie das in einem Kurs zur Theoretischen Physik m¨ oglich ist. Stattdessen werden begriffliche Grundlagen gekl¨art und exemplarische Modelle untersucht. • Im Mathematik-Studium wird aus gutem Grund eine deduktive Entwicklung mathematischer Begriffe gew¨ahlt. Hier kann die problem- und nicht methodenorientierte Mathematische Physik die praktische Relevanz dieser Begriffe motivieren, etwa die dynamische Bedeutung der Spektralanteile eines selbstadjungierten Operators. Ein weiterer Grund f¨ ur das Interesse an der Mathematischen Physik ist ein Ph¨anomen, das Eugene Wigner zum Titel eines 1960 erschienenen Essays machte, n¨amlich The Unreasonable Effectiveness of Mathematics in the Natural Sciences” ” Oder mit Albert Einstein: Wie ist es m¨oglich, daß die Mathematik, die doch ein von aller Erfahrung un” abh¨angiges Produkt des menschlichen Denkens ist, auf die Gegenst¨ande der Wirklichkeit so vortrefflich paßt?” 1 Unmittelbar bezieht sich das Zitat Einsteins auf alle ,Gegenst¨ande der Wirklichkeit’. Aber seine beste Best¨atigung findet es in der Physik. Hier weisen mathematische Strukturen (wie die Differentialgeometrie f¨ ur die Relativit¨atstheorie oder die Gruppentheorie f¨ ur die Quantenfeldtheorie) oft vor experimentellen Beobachtungen den Weg zur angemessenen Theorie.2 Dagegen sind etwa in der Biologie als neuer Leitwissenschaft naturhistorisch entstandene Strukturen entscheidend. Auch wenn sich viele Ph¨anomene mathematisch modellieren lassen, ist die Voraussagekraft der Modelle begrenzt. Gleiches gilt in verst¨arktem Maß etwa f¨ ur die Wirtschaftswissenschaften. Zwar l¨aßt sich auch die Vielfalt technischer Erfindungen in mathematischer Sprache beschreiben, auch hier wird mehr problem- als methodenorientiert gearbeitet. Ein Unterschied liegt aber in der Zielsetzung. Ziel Mathematischer Physik ist zun¨achst Erkenntnis von Naturvorg¨angen, w¨ahrend es in der Technomathematik letztlich um die Simulation und Optimierung von Strukturen und Prozessen geht. 1 A. Einstein: Geometrie und Erfahrung. Festvortrag, gehalten an der Preussischen Akademie der Wissenschaften zu Berlin, am 27. Januar 1921. Berlin: Julius Springer 1921. 2 Dass umgekehrt ,physikalische Beweise’ mathematischer Sachverhalte m¨ oglich sind, zeigt auf sehr unterhaltsame Weise das Buch [Lev] von Mark Levi.
Bemerkungen zur Mathematischen Physik
xiii
Inhalte des Buches ,Klassische Mechanik’ Als μηχαν η´ (mˆechanˆe) bezeichnet man vorwissenschaftlich im Griechischen ” eine Konstruktion, einen Kunstgriff oder auch einen — illegitimen — Trick. Wenn griechische Staatsvertr¨age hinterlistiges Verhalten ausschließen wollten, verboten sie den Einsatz von τ ´χνη (technˆe) oder mˆechanˆe, von Hinterlist und T¨ucke.” [Me], Seite 129 Dies ist der erste Band der geplanten dreib¨andigen Lehrbuchreihe zur Mathematischen Physik. Die logischen Beziehungen zwischen den Kapiteln dieses Buches werden in erster N¨aherung durch den folgenden Baum dargestellt. 2: Dynamische Systeme
3: Gew¨ ohnliche Differentialgleichungen
4: Lineare Dynamik
6: Hamiltonsche Gleichungen und Symplektische Gruppe
5: Klassifikation linearer Fl¨ usse
7: Stabilit¨ atstheorie
8: Variationspr.
13: Integrable Systeme
10: Symplektische Geometrie
14: Der starre K¨ orper
9: Ergodentheorie
17: Symplektische Topologie
11: Potentialbew.
16: Relativistik
12: Streutheorie
15: St¨ orungstheorie
Einer vierst¨ undigen Vorlesung kann beispielsweise (falls Grundkenntnisse u ¨ber gew¨ohnliche Differentialgleichungen vorausgesetzt werden k¨onnen) die folgende Stoffauswahl zugrunde gelegt werden: • Kapitel 2: Dynamische Systeme • Kapitel 6: Hamiltonsche Gleichungen und Symplektische Gruppe • Kapitel 8: Variationsprinzipien • Kapitel 9: Ergodentheorie • Kapitel 10: Symplektische Geometrie • Kapitel 13: Integrable Systeme Erg¨anzend zu den Anh¨angen dieses Buches sei das Taschenbuch der Mathematik [Zei] von Eberhard Zeidler [Hg] empfohlen.
xiv
Bemerkungen zur Mathematischen Physik
Inhalte der Lehrbuchreihe Die geplante Lehrbuchreihe eignet sich als Basis einer dreisemestrigen vierst¨ undigen Vorlesung zur Mathematischen Physik, wie sie an mehreren deutschsprachigen Universit¨aten angeboten wird. Mit dieser Beschr¨ankung des Stoffes ist eine Integration in das Lehrangebot der Mathematik oder der Physik realisierbar. Zus¨atzlich sind die drei B¨ande weitgehend unabh¨angig voneinander, wodurch sie leichter in eine andere Unterrichtsplanung integriert werden k¨onnen. Explizit vorausgesetzt werden nur die Vorlesungen zur Analysis und zur Linearen Algebra. Anh¨ange fassen die wichtigsten Voraussetzungen etwa aus Differentialgeometrie, Gruppentheorie, Topologie und Wahrscheinlichkeitstheorie zusammen. Essentials etwa aus der Theorie gew¨ ohnlicher Differentialgleichungen oder der Funktionalanalysis werden an Ort und Stelle eingef¨ uhrt. Bei entsprechenden Vorkenntnissen k¨ onnen die entsprechenden Kapitel ausgelassen werden. Die B¨ande eignen sich auch zum Selbststudium. Die geplante Lehrbuchreihe kann vorhandene Literatur wie etwa die bekannten vierb¨andigen Werke ,Methods of Modern Mathematical Physics’ von M. Reed und B. Simon oder ,Lehrbuch der Mathematischen Physik’ von W. Thirring nicht ersetzen. W¨ahrend Ersteres wegbereitend f¨ ur die Mathematisierung der Quantenmechanik war, spannte das zweite Werk einen Bogen von den Grundgleichungen bis zum Beweis von Eigenschaften physikalisch realistischer Modelle. Es wird hier ein etwas geringeres mathematisches Ausgangsniveau vorausgesetzt, gleichzeitig aber versucht, die Breite aktueller Fragestellungen abzubilden und Voraussetzungen f¨ ur das Verst¨andnis spezialisierterer Literatur zu schaffen. Die durch einen Stern (*) gekennzeichneten Kapitel sind mathematisch anspruchsvoller, werden aber im Weiteren nicht vorausgesetzt. ¨ Die (in diesem Band u werden teilweise durch ¨ber 100) Ubungsaufgaben L¨ osungstipps erg¨anzt, denn sie variieren stark in ihrem Schwierigkeitsgrad. In einem Anhang findet man die L¨ osungen. Die (f¨ ur den vorliegenden Band etwa 340) Illustrationen sind – soweit m¨ oglich – quantitativ exakt. Danksagung Die geplante Lehrbuchreihe hat ihren Ursprung im Vorlesungszyklus ,Mathematische Physik’, der von Ruedi Seiler am Fachbereich Mathematik der TU Berlin etabliert wurde. Ihm verdanke ich und verdankt die Lehrbuchreihe sehr viel. Robert Schrader, der am Fachbereich Physik der FU Berlin meine Diplomarbeit und Dissertation betreute, hat meine Sicht der Mathematischen Physik entscheidend geformt. Ich danke Frau Irmgard Moch, die in detektivischer Arbeit meine Handschrift entzifferte und dieses Buch schrieb. Christoph Schumacher hat unter Anderem mehrere Aufgaben beigetragen. Viviane Baladi, Tanja Dierkes, Jacques F´ejoz, Herbert Lange, Zhiyi Tang, Stefan Teufel, Stephan Weis sowie zahlreiche weitere Kolleginnen und Kollegen fanden Fehler im Manuskript oder trugen anderweitig zu seiner Verbesserung bei. Frau Herrmann und Herrn Heine vom Springer–Verlag danke ich f¨ ur ihre freundliche Hilfe bei der Ver¨ offentlichung des Buches. Alle Fehler gehen nat¨ urlich auf mein Konto. F¨ ur entsprechende Hinweise bin ich dankbar. Erlangen, im Mai 2011, A.K.
Bemerkungen zur Mathematischen Physik
xv
Zur Notation Teilmengen: Sind A und B Mengen, dann heißt A Teilmenge von B (in Zeichen A ⊆ B), wenn gilt: x ∈ A ⇒ x ∈ B. Insbesondere gilt B ⊆ B. Die echte Inklusion A B bedeutet, dass A ⊆ B, aber A = B gilt. In der mathematischen Literatur findet man auch das Teilmengenzeichen A ⊂ B. Dies benutzen wir statt ⊆ als Hinweis auf eine echte Teilmenge. Potenzmengen: Ist A eine Menge, dann ist die Potenzmenge von A 2A := {B | B ⊆ A}. Synonym findet man auch die Notationen P(A) und P(A). Funktionen: F¨ ur f : M → N und A ⊆ M ist f (A) := {f (a) | a ∈ A}. F¨ ur B ⊆ N ist f −1 (B) := {m ∈ M | f (m) ∈ B}. F¨ ur b ∈ N ist f −1 (b) := −1 f ({b}). Zahlen: Menge N = {1, 2, . . .} der nat¨ urlichen Zahlen, N0 = {0, 1, 2, . . .}, Ring Z = {0, 1, −1, 2, −2, . . .} der ganzen Zahlen. K¨orper Q, R, C der rationalen, reellen beziehungsweise komplexen Zahlen. F¨ ur einen K¨orper K bedeutet K∗ die multiplikative Gruppe K∗ := K \ {0}, und R+ := {x ∈ R | x > 0} = (0, ∞). Intervalle: F¨ ur a, b ∈ R, a < b ist (a, b) := {x ∈ R | x > a, x < b}
, (a, b] := {x ∈ R | x > a, x ≤ b}
etc.
(Synonym findet man auch die Notation ]a, b[= (a, b), ]a, b] = (a, b] etc.) Matrizen: Mat(m × n, K) bezeichnet den K–Vektorraum der m × n–Matrizen mit Eintr¨agen aus dem K¨ orper K, und Mat(n, K) den Ring Mat(n × n, K). Sph¨ aren und Kugeln: F¨ ur d ∈ N0 ist S d := {x ∈ Rd+1 | x = 1} = ∂B d+1 , also Rand der abgeschlossenen Vollkugel Brd := {x ∈ Rd | x ≤ r} vom Radius r > 0, und B d := B1d . Wir schreiben S 1 ⊂ C f¨ ur {c ∈ C | |c| = 1}, aber auch S 1 := R/Z (mit der Identifikation [x] → exp(2πix)) f¨ ur die multiplikative bzw. additive Gruppe. Das griechische Alphabet: a) Kleinbuchstaben α β γ δ , ε
Alpha Beta Gamma Delta Epsilon
ζ η θ,ϑ ι κ
Zeta Eta Theta Jota Kappa
λ μ ν ξ o
Lambda My Ny Xi Omikron
π ρ, σ,ς τ υ
Pi Rho Sigma Tau Ypsilon
φ, ϕ χ ψ ω
Phi Chi Psi Omega
Ω
Omega
b) Großbuchstaben (soweit verschieden von den lateinischen) Γ Δ
Gamma Delta
Θ Λ
Theta Lambda
Ξ Π
Xi Pi
Σ Υ
Sigma Ypsilon
Φ Ψ
Phi Psi
xvi
Bemerkungen zur Mathematischen Physik
Kleines Englisch-W¨ orterbuch abelian absolute value acceleration accumulation point angular momentum area assertion associativity as. completeness asymptotic value average ball barycenter bifurcation billiard bound bounded box bundle cardinality cartesian product centroid chain rule circle closed complete conditionally periodic connected connection constraint continuity convergent convolution countable covering critical point critically damped cross section curvature degree derivative disjoint disk distance divergent domain empty set equilibrium equivalence class escape time expectation value fibre field fixed point flow force forced oscillation friction function golden ratio/mean graph group group action ill-posed
abelsch Betrag Beschleunigung H¨ aufungspunkt Drehimpuls Fl¨ ache Aussage Assoziativit¨ at as. Vollst¨ andigkeit Grenzwert Mittelwert Vollkugel Schwerpunkt Verzweigung Billard Schranke beschr¨ ankt W¨ urfel B¨ undel M¨ achtigkeit kartesisches Produkt Schwerpunkt Kettenregel Kreislinie abgeschlossen vollst¨ andig bedingt-periodisch zusammenh¨ angend Zusammenhang Zwangsbedingung Stetigkeit konvergent Faltung abz¨ ahlbar ¨ Uberlagerung Ruhelage; kr. Punkt Aperiodischer Grenzfall Wirkungsquerschnitt Kr¨ ummung Abbildungsgrad Ableitung disjunkt Kreisscheibe Abstand divergent Definitionsbereich leere Menge Ruhelage ¨ Aquivalenzklasse Fluchtzeit Erwartungswert Faser K¨ orper Fixpunkt Fluss Kraft erzwungene Schwingung Reibung Funktion Goldener Schnitt Graph Gruppe Gruppenwirkung schlecht gestellt
image imaginary part imgaginary unit inequality initial condition intersection interval inverse mapping limit linking number manifold map measure metric metric space mixing moment of inertia momentum monotonous neighborhood numbers - complex - integer - irrational - natural - rational - real one-to-one onto open order overdamped partition proposition power series power set primes principal bundle proper map real part relation residue class ring root scattering section semicontinuous sequence set sign solution speed stable subsequence subset theorem time delay time reversal triangle inequality underdamped union unit velocity well defined
Bild Imagin¨ arteil imagin¨ are Einheit Ungleichung Anfangsbedingung Durchschnitt Intervall Umkehrabbildung Limes Verschlingungszahl Mannigfaltigkeit Abbildung, Karte Maß Metrik metrischer Raum mischend Tr¨ agheitsmoment Impuls monoton Umgebung Zahlen - komplexe - ganze - irrationale - nat¨ urliche - rationale - reelle injektiv surjektiv offen Ordnung Kriechfall Zerlegung Satz Potenzreihe Potenzmenge Primzahlen Hauptfaserb¨ undel eigentliche Abb. Realteil Relation Restklasse Ring Wurzel Streuung Schnitt halbstetig Folge Menge Signum L¨ osung Betrag der Geschw. stabil Teilfolge Teilmenge Satz Zeitverz¨ ogerung Zeitumkehr Dreiecksungleichung Schwingfall Vereinigung Einheit Geschwindigkeit wohldefiniert
Kapitel 1
Einleitung
Newtons eigenes Exemplar der ersten Auflage seines Buches Philosophiae Naturalis Principia Mathematica, mit handschriftlichen Korrekturen f¨ ur die zweite Auflage.
Wie alles anfing Und nachdem ihm gesagt worden war, er m¨oge die Wahrheit sagen, sonst ” werde man zur Folter schreiten, Antwortete er: Ich bin hier, um Gehorsam zu leisten, und ich habe besagte Meinung nach der getroffenen Entscheidung nicht aufrechterhalten”. Gerichtsprotokoll des Heiligen Offiziums der Inquisition zum Fall Galilei (1633) 1 Gut f¨ unfzig Jahre vergingen zwischen Galileis Verurteilung und dem Erscheinen der Principia Newtons. In dieser Zeit etablierte sich die moderne Naturforschung, mit der Klassischen Mechanik als Leitwissenschaft. Wir beginnen diese 1 Zitiert
nach Sobel [Sob2], Seite 289.
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 1,
1
2
1. Einleitung
Einf¨ uhrung mit der L¨ osung der Bewegungsgleichung f¨ ur die Planeten, also der Best¨atigung und Pr¨azisierung des heliozentischen Weltbilds von Galileo Galilei. Sowohl die Untersuchung von Differentialgleichungen als auch die physikalisch begr¨ undete Himmelsmechanik gehen auf Isaac Newton (1643–1727) zur¨uck. • Der Mathematiker Newton ist (zusammen mit Leibniz) als Begr¨under der Differentialrechnung bekannt. • Der Physiker Newton gab dem Gesetz Kraft
=
Masse
×
Beschleunigung
(1.1)
seinen Namen. Diese beiden T¨atigkeitsfelder Newtons h¨angen miteinander zusammen. Ist n¨amlich • x(t) ∈ R3 der Ort eines Massenpunktes zur Zeit t ∈ R, dann sind (in 3 Newtons Schreibweise f¨ ur Zeitableitungen) x(t) ˙ = dx dt (t) ∈ R seine Ged2 x 3 schwindigkeit und x ¨(t) = dt2 (t) ∈ R seine Beschleunigung zu diesem Zeitpunkt. • Andererseits kann die Kraft F von Ort und Geschwindigkeit des Teilchens und auch direkt von der Zeit abh¨angen, sodass Gleichung (1.1) die Form F (x, x, ˙ t) = m¨ x besitzt. Dabei ist die Kraftfunktion F als bekannt vorausgesetzt. Dies ist ein Beispiel einer Differentialgleichung, denn es handelt sich um eine Gleichung, die von der gesuchten, hier vektorwertigen Funktion t → x(t) und ihren Ableitungen erf¨ ullt wird. Beispielsweise wirkt auf die Erde (mit demMittelpunkt 2 bei x, der Masse m > 0, und mit der euklidischen Norm x = x21 + x22 + x23 ) die Kraft F (x) = −mγ
x
x 3
wobei vereinfachend vorausgesetzt wird, dass die Sonne im Ursprung des Koordinatensystems ruht. Eine genauere Behandlung zeigt, dass sich das echte 2–K¨ orperproblem, bei dem Erde und Sonne sich um ihren gemeinsamen Schwerpunkt bewegen, auf das diskutierte
x ∈ R3 \{0} ,
(1.2)
Kraft Sonne Geschwindigkeit Erde Schwerpunkt
2 In Aufgabe 12.37 auf Seite 289 wird gezeigt, dass f¨ ur eine zentralsymmetrische Masseverteilung die Gravitation so wirkt, als ob die Masse im Mittelpunkt konzentriert w¨ are.
1. Einleitung
3
Zentralkraftproblem reduzieren l¨asst, wenn man statt der Erdmasse m die reduzierte Masse mM/(m + M ) einsetzt 3 . Die positive Konstante γ ist das Produkt von Gravitationskonstante und Sonnenmasse. Gleichung (1.1) besitzt hier also nach K¨ urzung durch m die Form x x ¨ = −γ x 3 .
(1.3)
Newton l¨oste diese Differentialgleichung und leitete damit die bisher nur empirisch aus den Beobachtungsdaten abgelesenen keplerschen Gesetze der Planetenbewegung aus dem mechanischen Grundgesetz (1.1) und (1.2) ab. Dies war der erste Triumph der neuen Naturwissenschaft — 1687 in seinem Hauptwerk Philosophiae naturalis principia mathematica”(kurz: Principia) [Ne] ” ver¨offentlicht. Newton war sich der Bedeutung seiner Erkenntnis bewusst, und da er außer zu Mathematik und Physik auch zum Geheimnisvollen und Mystischen neigte, verschl¨ usselte er einen lateinischen Satz in einem Anagramm4 . Der Satz lautete, frei u ¨bersetzt: Es ist n¨ utzlich, Differentialgleichungen zu l¨osen.” ”
Ableitung der keplerschen Gesetze Wir wollen Newtons Rat folgen und (1.3) l¨ osen. 1. Als erstes stellen wir fest, dass der Planet f¨ ur alle Zeiten in der durch seinen Anfangsort und seine Anfangsgeschwindigkeit aufgespannten Bahnebene 5 bleibt, denn x×x d [x × x] ˙ = x˙ × x˙ + x × x ¨ = x˙ × x˙ − γ = 0, dt
x 3
(1.4)
der auf dieser Ebene senkrechte Vektor x(t) × x(t) ˙ ∈ R3 ist also zeitlich konstant. 2. Nun ist es n¨ utzlich, den Ort x(t) in dieser Bahnebene durch eine komplexe Zahl z(t) zu beschreiben, wobei z(t) := x1 (t) + ix2 (t), falls ohne Einschr¨ankung x × x˙ in 3–Richtung weist. Damit ist in Polarkoordinaten z(t) = r(t)eiϕ(t) , also ¨ eiϕ . z˙ = (r˙ + i rϕ)e ˙ iϕ und z¨ = r¨ − rϕ˙ 2 + i(2r˙ ϕ˙ + rϕ) Nach Division durch eiϕ und Trennung von Real- und Imagin¨arteil f¨ uhrt die newtonsche Kraftgleichung z¨ = −γ |z|z 3 damit zu den beiden verkoppelten 3 Siehe
Beispiel 12.39 auf Seite 291. nach der Einleitung des Buches [Ar3] von Arnol’d. Interessante biographische Notizen zu Newton findet man in [Ar6]. 5 Falls x ˙ parallel zu x ist, erhalten wir statt einer Ebene eine Gerade. 4 Zitiert
4
1. Einleitung reellen Differentialgleichungen (I): r¨ − rϕ˙ 2 +
γ =0 , r2
(II): 2r˙ ϕ˙ + rϕ¨ = 0.
(1.5)
d (r 2 ϕ) ˙ = r(2r˙ ϕ˙ + rϕ) ¨ = 0 ist := r 2 ϕ˙ = const eine Konstante 3. Wegen dt der Bewegung. Die Multiplikation dieser Gr¨ oße mit der Masse m des Planeten ergibt definitionsgem¨aß den Drehimpuls. Dieser ist also zeitlich konstant.
4. Substitution von ϕ˙ = /r2 in (I) ergibt die Gleichung r¨ −
γ 2 + 2 = 0. r3 r
Auch hier l¨asst sich eine Konstante der Bewegung finden, denn mit 2 γ und H (r, r) − ˙ := 12 r˙ 2 + U (r) 2r 2 r 2 d ˙ = r˙ r¨ − r 3 + rγ2 = 0, H r(t), r(t) ist dt sodass H zeitlich konstant ist: H r(t), r(t) ˙ = H r(0), r(0) ˙ =: E. Physikalisch wird E m als die Gesamtenergie des Planeten interpretiert, und alle reellen Zahlen treten als Energiewerte auf. U (r) :=
5. Nun sind wir zun¨achst weniger an der L¨ osung der Differentialgleichung (1.6) r˙ = ± 2(E − U (r)), also der Zeitabh¨angigkeit des Radius interessiert, als an der Bahnform R(ϕ) := r(t(ϕ)). Wir k¨onnen zu ϕ als unabh¨angiger Variable u ¨bergehen, wenn wir voraussetzen, dass = r 2 ϕ˙ = 0 ist. Dann ergibt sich aus (1.6) ±R2 r˙ dR = = dϕ ϕ˙
2(E − U (R))
oder durch Separation der Variablen und Einsetzen von U dR = dϕ = ϕ − ϕ0 . ±R 2ER2 + 2γR − 2 Mit den Konstanten e := 1 + der linken Seite umformen:
2E2 γ2
und p := 2 /γ l¨asst sich der Integrand
p/R = . 2 2 2 2 e R − (p − R)2 R 2ER + 2γR −
1. Einleitung
5
Laut Integraltabelle ist arccos
p/R(ϕ)−1 e
R(ϕ) =
= ϕ − ϕ0 oder
p . 1 + e cos(ϕ − ϕ0 )
(1.7)
Dies ist aber die Gleichung eines Kegelschnittes, wobei die Konstante e als Exzentrizit¨at und p als Parameter des Kegelschnittes bezeichnet wird. Der Winkel ϕ − ϕ0 heißt in der astronomischen Literatur wahre Anomalie.
Ergebnisse 1. Es ergibt sich f¨ ur Energien • E < 0 : 0 ≤ e < 1 (Ellipse)
, mit dem Kreis f¨ ur e = 0
• E = 0 : e = 1 (Parabel) • E>0: e>1
(Hyperbel)
Damit haben wir das erste Keplersche Gesetz abgeleitet.
Parabel Kraft Geschwindigkeit Massenpunkt Schwerpunkt
Hyperbel Kraft
Geschwindigkeit
Massenpunkt Schwerpunkt
2. Das zweite Keplersche Gesetz besagt, dass die Verbindungsstrecke zwischen Sonne und Planet in gleichen Zeiten gleiche Fl¨achen u ¨berstreicht. ˙ denn die im Zeitintervall [t1 , t2 ] Es ergibt sich aus der Konstanz von = r 2 ϕ, u ¨berstrichene Fl¨ache ist ϕ2 t2 dϕ 2 1 1 R(ϕ) dϕ = r(t)2 (t) dt = 12 (t2 − t1 ). 2 2 dt ϕ1 t1 3. Ebenso best¨atigen wir das dritte Keplersche Gesetz, nach dem sich die Quadrate der Umlaufzeiten6 wie die dritten Potenzen der großen Halbachsen verhalten. Wir substituieren f¨ ur eine L¨ osung t → x(t) der Kraftgleichung (1.3) X(t) := cx x(t/ct ), mit positiven Parametern cx und ct . Genau f¨ ur c2t = c3x erf¨ ullt die 2 d2 X Kurve t → X(t) wieder die Kraftgleichung, denn dt2 (t) = ccx2 ddt2x (t) und X X3
x = c−2 x x3 .
t
Dies beweist das Gesetz f¨ ur gr¨ oßenskalierte Orbits gleicher Form. 6 Merkregel
f¨ ur die zu quadrierende Gr¨ oße: Times Square.
6
1. Einleitung
1.1 Aufgabe (Drittes Keplersches Gesetz) Zeigen Sie, dass die Umlaufzeit auf einer Kepler–Ellipse nur von deren großer Halbachse abh¨angt7 . Tipp: Zeigen Sie zun¨achst, dass (a) mit den Minimal- und Maximalabst¨anden rmin := R(ϕ0 ), rmax := R(ϕ0 + π) die L¨ange der großen Halbachse gleich dem arithmetischen Mittel a := 12 (rmin + rmax ), die der kleinen Halbachse gleich dem geometrischen Mittel b := (rmin rmax )1/2 ist;
b
p
a
rmax
rmin
(b) Wegen des zweiten Keplerschen Gesetzes die Umlaufzeit gleich 2πab/ ist. −1 (c) Benutzen sie dann die Beziehung 2 = γ 2 e2E zwischen Drehimpuls und Exzentrizit¨at. 3 2
Wir haben also die Differentialgleichung des Kepler–Problems gel¨ost. Ohne dass dies vielleicht klar wurde, profitierten wir von der Symmetrie des untersuchten Systems, n¨amlich der Invarianz von (1.3) unter den orthogonalen Transformationen des R3 , indem wir feststellten, dass bestimmte Gr¨ossen zeitlich konstant sind, und damit die Zahl der Variablen reduzieren konnten. Die newtonsche Gleichung mit einer Zentralkraft ist immer integrabel. In (1.2) kommen maximal zweite zeitliche Ableitungen von x vor, und entsprechend m¨ ussen als Anfangswerte zur Zeit 0 Anfangsort x(0) ∈ R3 und Anfangsgeur alle Zeiten eine schwindigkeit x(0) ˙ ∈ R3 vorgegeben werden. Dann existiert f¨ eindeutige L¨osung von (1.3) (außer f¨ ur den bei linearer Abh¨angigkeit von x(0) und x(0) ˙ auftretenden Fall der Kollision mit der Zentralmasse bei x = 0).
Das n-K¨ orper-Problem Diesem Erfolg Newtons steht aber ein Misserfolg gegen¨ uber. Verallgemeinert kann man die Bewegung von n Massenpunkten untersuchen, die sich gegenseitig anziehen. Man stelle sich zum Beispiel das Sonnensystem mit Sonne und Planeten vor. Da die Kraft auf den i–ten Himmelsk¨ orper mit Position qi ∈ R3 gleich dem Produkt aus seiner Masse mi und seiner Beschleunigung q¨i ist, ergibt sich 8 mit 7 Aus den Formeln f¨ ur die Halbachsen folgt, dass ihr Quotient b/a gleich 1 + O(e2 ) ist, w¨ ahrend der Quotient von rmin und rmax von der Exzentrizit¨ at e in der Form 1−e = 1 − 2e + 1+e
angt. Planetenbahnen mit ihren Exzentrizit¨ aten e < 14 sind also in erster N¨ aherung O(e2 ) abh¨ Kreise, wobei die Sonne um die Ordnung e aus dem Mittelpunkt verschoben ist. Die abgebildete Ellipse hat die Exzentrizit¨ at e = 12 , die Erde e = 0.017. 8 in Einheiten, in denen die Gravitationskonstante Eins ist.
1. Einleitung
7
(1.1) und (1.2) das Differentialgleichungssystem q¨i =
j=i
mj
qj − qi
qj − qi 3
(i = 1, . . . , n).
(1.8)
Daß die Planeten so viel leichter als die Sonne sind, f¨ uhrt zwar dazu, dass die N¨aherungsl¨osung des Zwei-K¨ orperproblems so pr¨azise ist. Jupiter — der schwerste Planet — ist aber immerhin knapp 1/1000 so schwer wie die Sonne. Man kann also erwarten, dass schon nach ca. 1000 Jahren seine Anwesenheit die Erdbahn merklich beeinflusst. Die L¨osung des n¨achst einfachen Problems von drei K¨ orpern w¨are f¨ ur uns also von besonderer Bedeutung. Das 3–K¨orperproblem widerstand aber in den 200 auf das Erscheinen der ,Principia’ folgenden Jahren allen L¨ osungsversuchen 9 . 1885 wurde dem franz¨ osischen Mathematiker Henri Poincar´e ein von K¨onig Oskar II. von Schweden auf die L¨ osung dieses Problems ausgesetzter Preis verliehen. Poincar´e hatte das Problem aber nicht allgemein gel¨ost, sondern Indizien daf¨ ur gefunden, dass L¨ osungsans¨atze divergieren mussten (Diacu und Holmes erz¨ahlen in [DH] die interessante Geschichte). 1.2 Bemerkung (Dreik¨ orperproblem) Tats¨achlich sind die Bahnformen schon des sogenannten restringierten Dreik¨ orperproblems (bei dem sich ein Satellit mit verschwindend kleiner Masse im Gravitationsfeld zweier um ihren Schwerpunkt kreisenden Himmelsk¨ orpern bewegt), sehr kompliziert. In der nebenstehenden numerischen L¨osung der Differentialgleichung sieht man eine Bahnform des Satelliten im mitgedrehten Koordinatensystem, in dem die Orte der beiden Himmelsk¨ orper fix sind. 3 Die Feststellung Poincar´es leitete eine neue Epoche ein, in der mehr Gewicht auf qualitative Eigenschaften von Differentialgleichungen gelegt wurde. Beispielsweise wird gefragt, ob das Sonnensystem stabil ist oder nicht, ob ohne Reibungskr¨afte Himmelsk¨orper eingefangen werden k¨ onnen etc. Beide Typen von Fragen, die nach den expliziten L¨ osungen von Differentialgleichungen und die nach ihren qualitativen Eigenschaften, werden im Buch ihren Platz haben.
Zwangsbedingungen und Reibung Ziel der Klassischen Mechanik ist es also, aus der Form der zwischen den Massenk¨orpern wirkenden Kr¨afte auf die Gestalt ihrer Bewegungen zu schließen. Eine erste Teilaufgabe besteht darin, die Bewegungsgleichung aufzustellen. 9 Siehe
Kapitel 11.3, beginnend auf Seite 238.
8
1. Einleitung
Stellen wir uns etwa die Bewegungen eines Balls vor. Zwar besteht dieser aus einer riesigen Zahl von Atomen. Insoweit deren Abst¨ande aber zeitlich konstant sind, der Ball also als ein sogenannter starrer K¨orper aufgefasst werden kann, reichen sechs Gleichungen zweiter Ordnung aus, um seine Bewegung im Raum zu beschreiben. Davon beschreiben drei die Lage seines Schwerpunktes und drei die Drehung gegen¨ uber seiner Ausgangslage 10 . Rollt der Ball auf einer Unterlage, wird durch diese Zwangsbedingung die Zahl dieser Freiheitsgrade um Eins erniedrigt. Rollt er ohne Schlupf, dann ist eine Schwerpunktbewegung nur bei gleichzeitiger Drehung m¨oglich. Eine Frage ist, ob der Ball durch geeignete Bewegungen jede vorgegebenen Punkt in seinem Konfigurationsraum erreichen kann. W¨ahrend im Fall der Bewegung der Erde um die Sonne in guter N¨aherung von Reibung abgesehen werden konnte, ist dies f¨ ur den auf der Erde rollenden Ball nicht der Fall. Hier ist die Abbremsung proportional zur Geschwindigkeit. Der Ball gibt im Lauf der Zeit durch Reibung Energie an seine Umgebung ab und kommt daher allm¨ahlich zur Ruhe. Wir werden uns zwar vorzugsweise mit hamiltonschen Systemen herumschlagen, bei denen die Energie eine zeitlich erhaltene Gr¨oße ist. Wir werden dabei sehen, dass diese eine geometrische Beschreibung zulassen, wobei diese sogenannte symplektische Geometrie des Phasenraums sich wesentlich von der gewohnteren riemannschen Geometrie unterscheidet. Trotzdem wollen wir auch, und gerade am Anfang, allgemeinere dynamische Systeme, zum Beispiel solche mit Energieverlust, betrachten. Nur so k¨onnen wir die Besonderheit der hamiltonschen Dynamik richtig erkennen.
Diskrete dynamische Systeme Ein letztes Beispiel: In der Hochenergiephysik werden Teilchen auf hohe Energien beschleunigt, um sie dann kollidieren zu lassen. Aus verschiedenen Gr¨ unden m¨ ochte man die Teilchen oft nicht sofort zur Kollision bringen. Daher werden Speicherringe verwandt, in denen die bis fast auf Lichtgeschwindigkeit beschleunigten Teilchen durch ein Magnetfeld auf eine Kreisbahn gezwungen werden (der abgebildete Speicherring steht in Melbourne). Ein konstantes Magnetfeld erzeugt eine spiralf¨ormige Bahn, wobei die Geschwindigkeitskomponente in Magnetfeldrichtung konstant ist 11 . Nach wenigen Uml¨aufen w¨ urden die geladenen Teilchen daher den Speicherring verlassen. Daher werden kompliziertere Anordnungen von Magneten benutzt. Um diese zu studieren, kann man an einer Stelle des Ringes Ort und Geschwindigkeit des Teilchens senkrecht zur Strahlrichtung messen. Wir erhalten 10 Siehe 11 Das
Kapitel 14, beginnend auf Seite 343. wird in Kapitel 6.3.3 auf Seite 113 gezeigt.
1. Einleitung
9
so eine Abbildung, die es gestattet, aus Ort qn und Geschwindigkeit vn des Teilchens beim n–ten Umlauf auf die Werte dieser Gr¨oßen beim (n + 1)–ten Umlauf zu schließen: qn+1 = f1 (qn , vn )
, vn+1 = f2 (qn , vn )
oder kurz xn+1 = F (xn )
mit
xk :=
qk vk
und F :=
f1 f2
.
Um die Abbildung F zu bestimmen, muss die Wirkung der Magnete auf die relativistischen Teilchen berechnet werden. Wo befinden sich die Teilchen am Ende der Speicherung, zum Beispiel nach ussen wir im Prinzip die obige 108 Uml¨aufen? Zur Beantwortung dieser Frage m¨ Abbildung iterieren. Wir setzen F n+1 := F ◦ F n
mit
F 0 := Id.
Ist F invertierbar, dann definieren wir analog F −n−1 := F −1 ◦ F −n . Wir erhalten also ein sozusagen stroboskopisches Modell der Bewegung. Bei diesem nimmt der Zeitparameter n Werte in den ganzen Zahlen Z an, w¨ahrend im ersten Fall t ∈ R war. Wieder kann in guter N¨aherung Energieerhaltung vorliegen oder, zum Beispiel durch Abstrahlung, Energie verloren gehen. Eine Ingenieursaufgabe besteht darin, die Magnete so auszulegen, dass Stabilit¨at vorliegt, die Teilchen also nicht den Speicherring verlassen. Es ist dabei rechnerisch ineffektiv, F tats¨achlich 108 mal zu iterieren. Denn es muss ja Stabilit¨at f¨ ur ein Kontinuum von Anfangsbedingungen gezeigt werden. Eine tiefergehende Analyse der Dynamik ist notwendig. Nehmen wir an, dass F (0) = 0 ist, also die ohne Auslenkung von Ort und Geschwindigkeit startenden Teilchen auch wieder so ankommen. Eine erste N¨aherung besteht dann in der Linearisierung von F , das heißt der Untersuchung der Matrix M := DF (0). W¨ urde diese nur komplexe Eigenwerte besitzen, deren Betrag kleiner als Eins ist, dann w¨are die Bewegung stabil. Dies ist aber bei Energieerhaltung nicht der Fall. Das Beste, was hier konstruktiv erreicht werden kann, ist marginale Stabilit¨at, bei der sich alle komplexen Eigenwerte auf dem Einheitskreis befinden. Kann dann immer noch von M auf F geschlossen werden? Dies ist mit der hamiltonschen St¨orungstheorie m¨ oglich, nach dem ber¨ uhmten Satz von Kolmour alle Zeiten. In der Tat stellt man bei gorov, Arnol’d und Moser 12 sogar f¨ Variation der Parameter von F (also der Anordnung der Magnete) fest, dass dies f¨ ur bestimmte Parameterwerte eine Verzweigung von instabilen zu stabilen Verhalten stattfindet. Die Ingenieursaufgabe ist also im Prinzip l¨osbar. 12 Die
KAM-Theorie wird in Kapitel 15.4 behandelt, beginnend auf Seite 387.
10
1. Einleitung
Verh¨ altnis zur Statistischen Mechanik und Quantenmechanik W¨ahrend der aus vielen Atomen bestehende starre K¨orper durch nur sechs verkoppelte Differentialgleichungen beschrieben werden konnte, ist dies etwa f¨ ur Gase nicht der Fall. Trotzdem werden diese in der Statistischen Mechanik sehr effektiv beschrieben. Die Basis ist aber nicht mehr deterministisch sondern wahrscheinlichkeitstheoretisch. Man geht davon aus, dass der Gleichgewichtszustand des Gases durch wenige Parameter wie Dichte und Energie beschrieben werden kann und auf der durch diese Parameter definierten Mannigfaltigkeit gleichverteilt ist. Diese erfolgreiche Annahme muss aber gerechtfertigt werden, indem die ergodischen Eigenschaften des mechanischen Systems analysiert werden. In Wirklichkeit ist die Natur nicht klassisch sondern quantenhaft. Die Newton– Gleichung der Klassischen Mechanik erscheint nur in einer Asymptotik der quantenmechanischen Schr¨ odinger–Gleichung. Trotzdem w¨ urde niemand auf die Idee kommen, etwa die mechanischen Eigenschaften eines Fahrrads quantenmechanisch zu untersuchen. Und auch bei mikroskopischen Objekten wie Atomen und Molek¨ ulen ist es oft effektiv, die Quantendynamik als St¨orung der klassischen Bewegung anzusetzen.
Kapitel 2
Dynamische Systeme
Seeschnecken (Links: Oliva porphyria, Rechts: Conus marmoreus) Jeweils Links: Fotografie, Rechts: Simulation durch ein dynamisches System. Quelle: Fowler und Prusinkiewicz in Meinhardt [FP].
2.1 Iterierte Abbildungen, dynamische Systeme . . . . . . . . 12 2.2 Stetige dynamische Systeme . . . . . . . . . . . . . . . . 16 2.3 Differenzierbare dynamische Systeme . . . . . . . . . . . 25
Dynamiken kann man unter verschiedenen Blickwinkeln und mit unterschiedlichen Zusatzstrukturen betrachten, und entsprechend gibt es auch verschiedene Definitionen dynamischer Systeme. Wir werden in diesem Kapitel zwar haupts¨achlich sogenannte topologische und differenzierbare dynamische Systeme untersuchen, beginnen aber noch etwas allgemeiner. Erst ab Kapitel 6 r¨ ucken die in der Klassischen Mechanik dominierenden hamiltonschen dynamischen Systeme ins Zentrum. Das sind L¨osungen von speziellen Differentialgleichungen erster Ordnung. Sie besitzen ein zeitinvariantes Maß, was f¨ ur einen Vektorraum als Phasenraum das Lebesgue-Maß ist. Das Kapitel 9 widmet sich solchen (nicht notwendig hamiltonschen) maßerhaltenden dynamischen Systemen. 2.1 Weiterf¨ uhrende Literatur Die Lehrb¨ ucher von Katok und Hasselblatt [KH] und von Robinson [Ro] behandeln allgemeine (nicht notwendig hamiltonA. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 2,
11
12
2.1. Iterierte Abbildungen, dynamische Systeme 26
1
0
52
17
34
11
22
7
9
2 5
5
4
6
10
11
16
8
4
7
40 9
28
3
2
13
8
14
20
10
1 3
6
12
Abbildung 2.1.1: Iterierte Abbildungen. Links: Beispiel 2.2. Rechts: Collatz–Graph aus Beispiel 2.3 sche) dynamische Systeme, und auch iterierte nicht invertierbare Abbildungen (die oft ebenfalls als dynamische Systeme bezeichnet werden). 3
2.1
Iterierte Abbildungen, dynamische Systeme
Wir m¨ ussen also den gegenw¨artigen Zustand des Weltalls als die Wirkung ” seines fr¨ uheren und als die Ursache des folgenden Zustandes betrachten. Eine Intelligenz, welche f¨ ur einen gegebenen Augenblick alle in der Natur wirkenden Kr¨afte sowie die gegenseitige Lage der sie zusammensetzenden Elemente kennte, und u ¨berdies umfassend genug w¨are, um diese gegebenen Gr¨oßen der Analysis zu unterwerfen, w¨ urde in derselben Formel die Bewegungen der gr¨oßten Himmelsk¨orper wie des leichtesten Atoms umschließen; nichts w¨ urde ihr ungewiß sein und Zukunft und Vergangenheit w¨ urden ihr offen vor Augen liegen.” Pierre-Simon Laplace (1814), [Lap], Seite 1 Gegeben sei eine Abbildung f : M → M einer Menge M in sich. Diese k¨onnen wir iterieren, indem wir die iterierte Abbildung f (0) := IdM
, f (t) := f ◦ f (t−1)
(t ∈ N)
definieren. F¨ ur jedes m ∈ M erhalten wir eine Folge a : N → M, at = f (t) (m). Wir nennen dann M Phasenraum, t Zeitparameter und m Anfangspunkt. Wir haben nicht vorausgesetzt, dass f injektiv ist. Dass verschiedene Anfangspunkte also die gleiche Zukunft haben k¨ onnen, kann man am Graphen von f ablesen. 2.2 Beispiel F¨ ur f : N0 → N0 , m → m/2 ergibt sich der in Abbildung 2.1.1 (links) durch Pfeile von m nach f (m) dargestellte gerichtete Graph. 3 Schon einfache iterierte Abbildungen k¨ onnen zu sehr schwierigen Fragen f¨ uhren. 2.3 Beispiel (Collatz–Vermutung) Auf dem Phasenraum M := N ist f definiert durch f (m) := m/2, falls m gerade und f (m) := 3m+1, falls m ungerade.
2. Dynamische Systeme
13
Zum Beispiel beginnt die Folge mit Anfangspunkt 7 mit 7, 22, 11, 34, 17, 52, 26, 13, 40, 20, 10, 5, 16, 8, 4, 2, 1, 4 . . . und wird nach Erreichen der Eins zyklisch, siehe Abbildung 2.1.1 (rechts). Die Vermutung von Lothar Collatz, dass jede Folge die 1 enth¨alt, ist seit 1937 weder bewiesen noch widerlegt worden. 3 2.4 Beispiel (Calkin-Wilf-Folge) F¨ ur die Zerlegung x = x + {x} von x ∈ R, mit x ∈ Z und {x} ∈ [0, 1) iterieren wir die Abbildung f : R+ → R+
, x →
f
1 ,
x + 1 − {x}
beginnend mit 1. Die ersten Folgenglieder sind also 1, 12 , 2, 13 , 32 , 23 , 3, 14 , 43 , 35 , 52 , 25 , 53 , 34 , .. . Diese Folge z¨ahlt die positiven rationalen Zahlen ab. Einen Beweis findet man in Calkin und Wilf [CW]. 3
3 =
2 1 1
2.5 Aufgabe (Cantor–Menge) Im Intervall I := [0, 1] befindet sich das Loch L := (1/3, 2/3). Wir iterieren die Abbildung f : R → R, x → 32 1 − 2 |x − 1/2|
3 2
2
3
x
f
1 =
so oft, bis wir das Loch erreichen. Wir betrachte also f¨ ur den Startwert x0 ∈ I die Folge (xn )n∈N , xn+1 := f (xn ). Zeigen Sie, dass die Menge C := {x0 ∈ I \ L | ∀n ∈ N : xn ∈ I \ L}
0
1 3
2 3
1
der nie in das Loch fallenden Anfangswerte die Cantorsche 1/3–Menge ist.
x 3
2.6 Bemerkung (Invertierbarkeit) Die Grundgleichungen der Natur geben keine Zeitrichtung vor. Daher spielen nicht bijektive, eine Dynamik definierende Abbildungen nur als grobe Modelle physikalischer Geschehnisse eine Rolle. Statt allgemeiner iterierter Abbildungen stehen in der Klassischen Mechanik eher dynamische Systeme im Sinn der folgenden Definition im Mittelpunkt des Interesses. Trotzdem kommen wir gelegentlich auf nicht injektive iterierte Abbildungen zur¨ uck (so die logistische Familie aus Beispiel 2.26). Denn diese k¨onnen schon in Dimension Eins komplizierte Dynamiken aufweisen und eignen sich daher besonders zur Veranschaulichung. 3 2.7 Definition F¨ ur die Gruppen G := (Z, +) beziehungsweise G := (R, +) heißt eine Familie von Abbildungen Φt : M → M (t ∈ G) auf einer Menge M dynamisches System, wenn gilt: Φ0 = IdM
und Φt2 ◦ Φt1 = Φt1 +t2
(t1 , t2 ∈ G).
(2.1.1)
14
2.1. Iterierte Abbildungen, dynamische Systeme
M heißt dann Phasenraum. F¨ ur G = Z heißt das dynamische System diskret, f¨ ur G = R kontinuierlich oder Fluss auf M . 2.8 Beispiel (Diskretes dynamisches System) (Φt )t∈Z ist genau dann ein dynamisches System, wenn f := Φ1 : M → M 3 bijektiv ist mit Φt = f (t) und Φ−t = (f −1 )(t) (t ∈ N0 ). 2.9 Bemerkungen 1. Der Phasenraumpunkt Φ(t, m) gibt den Zustand des dynamischen Systems (also z.B. die Orte und Geschwindigkeiten der betrachteten Himmelsk¨ orper) zur Zeit t an, wenn zur Zeit 0 der Zustand m war. 2. Die Forderung Φ0 (m) = m ist nur billig und stellt sicher, dass die Abbildungen Φt bijektiv sind. ur Die Forderung Φt2 ◦ Φt1 = Φt1 +t2 der Invarianz unter Zeittranslationen ist f¨ G = R erf¨ ullt, wenn Φ die L¨ osung eines autonomen Differentialgleichungssystems ist. Um beispielsweise die Position und Geschwindigkeit der Erde in zehn Monaten zu berechnen, k¨ onnen wir zun¨achst ihren Zustand in sieben Monaten bestimmen, um danach diesen Zeitpunkt als neuen Zeitnullpunkt zu w¨ahlen und den Zustand in drei Monaten zu berechnen. F¨ ur L¨osungen Φ explizit zeitabh¨angiger Differentialgleichungen ist diese Forderung aber nicht erf¨ ullt. Nehmen wir etwa an, dass in acht Monaten ein schneller Komet die Erde ablenkt und sei Φ(t, m) der Zustand der Erde zum Zeitpunkt t. Dann erf¨ ullt diese Abbildung Φ die obige Bedingung nicht. Erst nach Einbeziehung der Kometendynamik durch Vergr¨oßerung des Phasenraums um dessen Ort und Geschwindigkeit erhalten wir wieder ein autonomes Differentialgleichungssystem und als L¨ osung ein dynamisches System. 3 2.10 Definition F¨ ur ein dynamisches System (Φt )t∈G auf dem Phasenraum M und m ∈ M heißt • die Abbildung G → M, t → Φt (m) die Bahnkurve durch m. • ihr Bild O(m) := {Φt (m) | t ∈ G} der Orbit oder die Trajektorie durch m, • m heißt Ruhelage oder Fixpunkt, wenn O(m) = {m}. • m ∈ M heißt periodisch (oder geschlossen) mit Periode T ∈ G, wenn T > 0 und ΦT (m) = m. T heißt dabei Minimalperiode, wenn f¨ ur alle t ∈ (0, T ) gilt: Φt (m) = m. Analoge Definitionen ergeben sich f¨ ur nicht invertierbare iterierte Abbildungen, wenn man von der Gruppe Z zu N0 u ¨bergeht. 2.11 Beispiel (Matrixpotenzen als dynamische Systeme) F¨ ur eine invertierbare positive Matrix A ∈ Mat(n, R) und M := Rn ist
t Φ : Z × M → M , Φ(t, x) := At x mit At = λ∈spek(A) λ Pλ
f¨ ur die Spektraldarstellung A = λ∈spek(A) λPλ von A ein dynamisches System. Falls 1 ∈ spek(A), also kein Eigenwert ist, ist x = 0 die einzige Ruhelage. 3
2. Dynamische Systeme
15
2.12 Aufgaben (Periode) 1. Auf dem Phasenraum S 1 = {c ∈ C | |c| = 1} sei f¨ ur einen Parameter α ∈ R die Drehung um Vielfache von 2πα gegeben durch Φt : S 1 → S 1 , Φt (m) := exp(2πitα) m
(t ∈ Z),
(2.1.2)
siehe Abbildung. Zeigen Sie: (a) Die Abbildungen (2.1.2) bilden ein dynamisches System. (b) F¨ ur rationale Parameterwerte α ∈ Q, also α = pq , q ∈ Z, p ∈ N, q und p teilerfremd, ist jeder Phasenraumpunkt periodisch, mit Minimalperiode p. (c) F¨ ur irrationale α ∈ R \ Q ist kein Phasenraumpunkt periodisch.
Φ1 (m)
S1 m
Φ2 (m) Φ3 (m)
2. Die Abbildung C → C, z → z m mit m ∈ N \ {1} induziert durch Einschr¨ankung auf |z| = 1 eine (nicht invertierbare) Abbildung fm : S 1 → S 1 der Kreislinie auf sich. Berechnen Sie f¨ ur n ∈ N die Anzahl Pn (fm ) der periodischen Punkte von fm mit Periode n (wobei n nicht die Minimalperiode zu sein braucht) und zeigen 3 Sie, dass die Menge der periodischen Punkte von fm dicht in S 1 liegt. 2.13 Satz (Orbiten dynamischer Systeme) 1. Die Relation m1 ∼ m2 , falls m2 ∈ O(m1 ) der Zugeh¨origkeit zum gleichen ¨ Orbit ist eine Aquivalenzrelation auf M . 2. Ist m periodisch mit Periode T , dann gilt dies auch f¨ ur alle Punkte des Orbits O(m) (wir sprechen dann von einem periodischen Orbit). 3. Besitzt der Orbit O die Minimalperiode T > 0, dann ist diese eindeutig, und die Perioden von O bilden die Menge T N = {T n | n ∈ N}. Beweis: ur alle m ∈ M ). 1. • Wegen Φ0 = IdM ist die Relation ∼ reflexiv (d.h. m ∼ m f¨ • Ist m2 = Φt (m1 ), dann gilt Φ−t (m2 ) = Φ−t ◦ Φt (m1 ) = Φt−t (m1 ) = m1 , die Relation also symmetrisch. • Mit m2 = Φt1 (m1 ) und m3 = Φt2 (m2 ) ist m3 = Φt1 +t2 (m1 ), ∼ also transitiv. 2. Ist m = Φt (m), dann ist ΦT (m ) = ΦT +t (m) = Φt ◦ΦT (m) = Φt (m) = m , also T auch Periode von m .
16
2.2. Stetige dynamische Systeme
3. Ist S > 0 ebenfalls Minimalperiode von O, dann gilt T ∈ (0, S), also T ≥ S und umgekehrt S ≥ T . Letzteres gilt f¨ ur alle Perioden S. W¨are S ∈ T N, dann g¨abe es eine eindeutige Darstellung S = nT +r mit n ∈ N und r ∈ (0, T ). Damit w¨are auch r Periode von m ∈ O: Φr (m) = ΦS−nT (m) = ΦS ◦ Φ−nT (m) = ΦS (m) = m, was einen Widerspruch zur Minimalit¨at von T ergeben w¨ urde.
2
F¨ ur die Gruppe G = Z von Zeiten haben die Ruhelagen eine Minimalperiode, n¨amlich 1, f¨ ur G = R haben sie keine. 2.14 Definition Eine Teilmenge N ⊆ M des Phasenraums M heißt • vorw¨ artsinvariant, wenn f¨ ur alle t ∈ G, t ≥ 0 gilt: Φt (N ) ⊆ N . • invariant, wenn f¨ ur alle t ∈ G gilt: Φt (N ) ⊆ N . Invariante Teilmengen N haben die Eigenschaft Φt (N ) = N f¨ ur alle t ∈ G, denn aus Φ−t (N ) ⊆ N folgt N = Φt Φ−t (N ) ⊆ Φt (N ). Wir nennen eine nicht leere invariante Teilmenge N von M (mengentheoretisch) minimal, wenn sie nicht ihrerseits eine echte solche Teilmenge besitzt. Die minimalen Teilmengen sind also gerade die Orbits. Wir haben also ein dynamisches System (Φt )t∈G verstanden, wenn wir dessen Orbits und die Restriktionen von Φt : M → M auf diese Orbits kennen. 2.15 Aufgabe (Minimalperiode eines dynamischen Systems) Wir nennen T > 0 Periode des dynamischen Systems, wenn ΦT = IdM gilt. Zeigen Sie, dass ein diskretes dynamisches System Φ : Z × M → M auf einer endlichen Menge M = ∅ als Minimalperiode das kleinste gemeinsame Vielfache der Minimalperioden seiner Orbits besitzt. 3
2.2
Stetige dynamische Systeme
Die Zahl der Fragen an ein dynamisches System erh¨oht sich enorm, wenn wir eine Topologie zur Verf¨ ugung haben (siehe Anhang A.1), also zum Beispiel von Grenzwerten sprechen k¨ onnen. 2.16 Definition Ein dynamisches System (Φt )t∈G auf dem Phasenraum M heißt stetiges oder topologisches dynamisches System, wenn M ein topologischer Hausdorff–Raum ist und Φ:G×M →M
,
Φ(t, m) := Φt (m)
stetig 1 ist. 1 Dabei wird (R, +) beziehungsweise (Z, +) als topologische Gruppe (Definition E.16) aufgefasst und die Produkttopologie (Anhang A.1) auf G × M benutzt.
2. Dynamische Systeme
17
2.17 Bemerkungen (Topologische dynamische Systeme) 1. Da Z als topologischer Raum diskret ist, also jede Teilmenge offen ist, ist die Stetigkeit von Φ f¨ ur G = Z gleichbedeutend mit der Stetigkeit der Φt (t ∈ Z). Dies wiederum ist ¨aquivalent dazu, dass Φ1 : M → M ein Hom¨oomorphismus (siehe Definition A.17) ist. Umgekehrt erzeugt jeder Hom¨oomorphismus f : M → M durch Iteration ein stetiges dynamisches System. 2. In fast allen Anwendungen ist der Phasenraum eines dynamischen Systems in nat¨ urlicher Weise ein Hausdorff–Raum. Ob aber die Dynamik stetig ist, muss von Fall zu Fall entschieden werden. Dies ist zum Beispiel bei Billards oder bei St¨oßen von Punktmassen nicht immer der Fall. 3. Verzichtet man auf die Topologie, also auch auf die Forderung der Stetigkeit von Φ, dann verliert man aber die Kontrolle dar¨ uber, dass f¨ ur endliche Zeit t die Φ(t, m ) nahe bei Φ(t, m) bleibt, wenn die Anfangspunkte m, m ∈ M nahe beieinander liegen. Dies ist aber von praktischem Interesse, denn m kann im Experiment nur mit endlicher Genauigkeit gemessen werden. 4. In allen einleitenden Beispielen ist M der Raum der Orte q und Geschwindigkeiten v der betrachteten Massenk¨ orper. Etwa im Fall der Erde im dreidimensionalen Raum ist also M der topologische Raum R3 × R3 und m = (q, v). Der Wert Φ(t, m) gibt den Zustand (also hier Ort und Geschwindigkeit) des K¨orpers nach der Zeit t an, wenn er sich zur Zeit 0 im Zustand m befand. Wir m¨ochten aber auch zum Beispiel die Bewegung einer Perle auf einem kreisf¨ormigen Draht betrachten. Dort ist ihr Ort durch einen Punkt auf dem Kreis S 1 := {x ∈ R2 | x = 1} gegeben und der Phasenraum ist die ur die Geschwindigkeit der Kreisbewegung). Mannigfaltigkeit M := S 1 ×R (R f¨ Im Anhang A.2 wird der Begriff der Mannigfaltigkeit eingef¨ uhrt. 5. Es kommen auch Phasenr¨aume vor, die keine Mannigfaltigkeiten sind. Beispielsweise definiert die quantenmechanische Schr¨odinger–Gleichung dΦt = −i H Φt dt
, Φ0 = 1lH
eines selbstadjungierten Operators H = H ∗ : H → H eine unit¨are Zeitentwicklung Φt = exp(−iHt) (t ∈ R) auf dem C-Hilbert–Raum (H, ·, ·). Letzterer ist als normierter Vektorraum ein topologischer Raum, und die Abbildung Φ : R × H → H , Φ(t, ψ) = Φt (ψ) ur dim(H) < ∞ der Phasenraum eine (endlichist stetig 2 . Allerdings ist nur f¨ dimensionale) Mannigfaltigkeit im Sinn der Definition A.25. 2 Im Fall der in der Quantenmechanik ublichen unbeschr¨ ankten selbstadjungierten Opera¨ toren H ist der Fluss Φ zwar nicht mehr bez¨ uglich der Normtopologie, aber der sogenannten starken Topologie auf H stetig.
18
2.2. Stetige dynamische Systeme
6. Teil unserer Aufgabe wird es sein, Φ zu bestimmen, f¨ ur die Gruppe G = R durch Integration gew¨ ohnlicher Differentialgleichungen und f¨ ur G = Z durch Iteration einer Abbildung. Die Abbildungen Φ werden dabei nicht nur stetig, sondern beliebig oft differenzierbar (,glatt’) sein, falls entsprechendes f¨ ur die Differentialgleichung beziehungsweise f¨ ur die zu iterierende Abbildung gilt. 7. L¨asst man in Definition 2.16 beliebige topologische Gruppen3 (G, ◦) zu (und fordert verallgemeinert Φt2 ◦ Φt1 = Φt2 ◦t1 ), dann kommt man zum Begriff der (topologischen) Gruppenwirkung, genauer Linkswirkung oder -operation, im Gegensatz zur Rechtswirkung mit Φt2 ◦ Φt1 = Φt1 ◦t2 . Solche Gruppenwirkungen k¨onnen z.B. als Symmetrien eines dynamischen Systems auftreten. Der Spezialfall dynamischer Systeme ist zwar insofern einfacher, weil die topologischen Gruppen R und Z abelsch sind. Allerdings sind sie nicht kompakt, was die Analyse erschwert. 3 2.18 Beispiele (Topologische dynamische Systeme) 1. Ein einfaches Beispiel ist die freie Bewegung eines Himmelsk¨ orpers im Vakuum. Der Phasenraum ist wieder M := R3q × R3v . Da nach Voraussetzung am K¨orper keine d2 Kr¨afte angreifen, ist seine Beschleunigung dt 2 q = 0. Damit ist die Geschwind q des Ortes nach der Zeit, zeitlich konstant: digkeit, also die Ableitung v = dt d osung dt v = 0, und wir haben die in Anfangswert m und Zeit t stetige L¨ Φ(t, m) = (q + v t, v) t ∈ R, m = (q, v) ∈ M . 2. Das einleitende Beispiel des himmelsmechanischen Zweik¨orperproblems liefert dagegen im strengen Sinn noch nicht einmal ein dynamisches System im Sinn von Definition 2.7, denn die beiden Himmelsk¨orper k¨onnen in endlicher Zeit kollidieren. Restringiert man aber den Phasenraum durch die (flussinvariante) Bedingung q × v = 0 nicht verschwindenden Drehimpulses, dann erh¨alt man ein stetiges dynamisches System. 3. F¨ ur eine endliche Menge A = ∅ ist auf dem Folgenraum M := AZ = {a : Z → A} = {(ak )k∈Z | ak ∈ A} durch Φt : M → M
,
Φt (a) k := ak+t
(t ∈ Z)
(2.2.1)
eine diskrete Dynamik definiert. Versieht man das sogenannte Alphabet A mit der diskreten Topologie und den Folgenraum oder Shiftraum M mit der Produkttopologie, dann ist M ein topologischer Raum und der Shift Φ ein stetiges dynamisches System. Nach dem Satz von Tychonoff (Satz A.19) ist dabei der Phasenraum X kompakt. Obwohl sein Phasenraum (f¨ ur |A| > 1) keine Mannigfaltigkeit bildet, kann es, wie wir sehen werden, auch f¨ ur die Analyse physikalisch relevanter chaotischer dynamischer Systeme benutzt werden. 3 3 siehe
Anhang E.1 und E.2.
2. Dynamische Systeme
19
2.19 Aufgabe (Shift) Es sei wie in Beispiel 2.18.3 A ein Alphabet, M := AZ . ¨ (a) Uberpr¨ ufen Sie, dass d : M × M → [0, ∞), gegeben durch 2−|j| dA (xj , yj ) x = (xj )j∈Z , y = (yj )j∈Z ∈ M , d(x, y) := j∈Z
mit dA (a, b) := 0 falls a = b, sonst dA (a, b) := 1, eine Metrik auf M definiert. Zeigen Sie, dass der Shift Φ stetig ist. (b) Wie viele periodische Punkte m ∈ M und wie viele periodische Orbits der Periode n ∈ {2, 3, 4} hat Φ aus (2.2.1) f¨ ur das Alphabet A := {0, 1}? Geben Sie alle Punkte der Minimalperiode n f¨ ur n ∈ {2, 3, 4} an. (c) Zeigen Sie, dass ein x ∈ M mit in M dichtem Orbit existiert, das heißt, es gilt {Φt (x) | t ∈ Z} = M . Bemerkung: Damit ist das stetige dynamische System Φ : Z × M → M topologisch transitiv, das heißt f¨ ur offene, nicht leere A, B ⊆ M gibt es ein t ∈ Z mit Φt (A) ∩ B = ∅. 3 Das Langzeitverhalten eines Punktes im Phasenraum M wird (zumindest f¨ ur kompakte M ) durch seine Limesmengen beschrieben: 2.20 Definition F¨ ur ein stetiges dynamisches System Φ : G × M → M und x ∈ M heißen
α(x) := y ∈ M ∃(tn )n∈N mit lim tn = −∞ und lim Φ(tn , x) = y , n→∞
n→∞
ω(x) := y ∈ M ∃(tn )n∈N mit lim tn = +∞ und lim Φ(tn , x) = y n→∞
n→∞
α–Limesmenge von x beziehungsweise ω–Limesmenge von x. Diese Mengen sind einerseits Invarianten des Orbits O(x) (das heißt α(y) = α(x) und ω(y) = ω(x) f¨ ur y ∈ O(x)), andererseits selbst invariant. Man ist aber nicht nur an den einzelnen Orbits interessiert, sondern auch am Verhalten benachbarter Orbits. Zum Beispiel ist es beruhigend, dass auch bei einer kleinen Ver¨anderung der Geschwindigkeit der Erde, etwa durch Meteoriteneinschlag, ihre neue Bahn auf Dauer in der N¨ahe der alten bleibt. Zun¨achst untersuchen wir die Stabilit¨at von Fixpunkten, sp¨ater von periodischen Orbits. 2.21 Definition (Stabilit¨ at) Sei m0 ∈ M ein Fixpunkt des stetigen dynamischen Systems Φ : G × M → M . ur jede Umgebung U ⊆ M von m0 eine 1. m0 heißt liapunov–stabil, wenn f¨ (kleinere) Umgebung V von m0 existiert, so dass f¨ ur alle t ≥ 0 Φt (V ) ≡ {Φt (m) | m ∈ V } ⊆ U.
20
2.2. Stetige dynamische Systeme 2. Andernfalls heißt m0 instabil. 3. m0 heißt asymptotisch stabil, falls m0 liapunov–stabil ist und eine vorw¨artsinvariante Umgebung V ⊆ M von m0 existiert mit lim Φt (m) = m0
t→∞
(m ∈ V ).
2.22 Aufgabe (Stabilit¨ at) Auf dem Phasenraum M := C seien f¨ ur den Parameter λ ∈ C \ {0} die Abbildungen Φt : M → M , Φt (m) := λt m (t ∈ Z) gegeben. Zeigen Sie: (a) Diese bilden ein stetiges dynamisches System, und 0 ∈ M ist ein Fixpunkt. (b) Dieser Fixpunkt ist genau dann liapunov–stabil, wenn |λ| ≤ 1. (c) Der Fixpunkt ist genau dann asymptotisch stabil, wenn |λ| < 1.
3
2.23 Definition • Eine kompakte invariante Teilmenge A ⊆ M heißt Attraktor des stetigen dynamischen Systems Φ : G×M → M , wenn eine offene Umgebung U0 ⊆ M von A existiert mit 1. U0 ist vorw¨arts invariant. 2. F¨ ur jede offene Umgebung V von A, A ⊆ V ⊆ U0 gibt es ein τ > 0 mit Φt (U0 ) ⊆ V f¨ ur alle t ≥ τ . • Das Bassin eines Attraktors A ist die Vereinigung aller offenen Umgebungen von A, die 1. und 2. erf¨ ullen. Damit ist das Bassin B selbst eine offene Umgebung von A, die die Eigenschaft 1. besitzt. Wie das n¨achste Beispiel zeigt, ist aber die Eigenschaft 2. f¨ ur B im Allgemeinen nicht erf¨ ullt. 2.24 Beispiel (Attraktor) Auf dem Phasenraum C ist ein stetiges dynamisches System Φ : Z × C → C mit Parameter λ ∈ R gegeben C durch Iteration des Hom¨ oomorphismus Φ1 (m) iλ m e √ , m = 0 |m| Φ1 (m) := m 0 , m = 0, siehe Abbildung. Hier ist A := S 1 ⊂ C Φ2 (m) ein Attraktor, und sein Bassin ist C \ {0}. Denn Φt : C → C bildet Kreise vom Radius Φ3 (m) −t r > 0 auf solche vom Radius r(2 ) ab, die (abgeschlossene) Kreislinie S 1 ist also invariant, und die Bilder der offenen Kreisringe U (r1 , r2 ) := {c ∈ C | |c| ∈ (r1 , r2 )} ⊂ C \ {0}
2. Dynamische Systeme
21
Sinn gegen A: konvergieren f¨ ur 0 < r1 < 1 < r2 im folgenden F¨ ur alle c > 1 existiert ein τ ∈ N mit Φt U (r1 , r2 ) ⊆ U (1/c, c) falls t ≥ τ . Wegen Kompaktheit von A enth¨alt aber jede offene Umgebung V von A ein U (1/c, c). Das Bassin von A kann den Fixpunkt 0 ∈ C nicht enthalten, enth¨alt aber die Mengen U (r1 , r2 ), ist also gleich C \ {0}. Der Parameter λ beschreibt die Drehung um den Ursprung. Sein Wert ist wesentlich f¨ ur die Frage, welche Teilmengen von A ebenfalls Attraktoren sind. 3 2.25 Aufgaben (Attraktor) 1. Finden Sie zum dynamischen System aus Beispiel 2.24 alle Fixpunkte und zwei weitere Attraktoren mit Bassin. 2. Es sei Φ : G × M → M ein stetiges dynamisches System. (a) Ist die Vereinigung zweier Attraktoren wieder ein Attraktor? (b) Zeigen Sie A = t≥0 Φt (U0 ) f¨ ur einen Attraktor A ⊆ M und eine zugeh¨orige offene Menge U0 aus der Definition 2.23 eines Attraktors. 3 2.26 Beispiel (Logistische Familie) F¨ ur Parameterwerte p ∈ [0, 4] betrachten wir die (nicht invertierbare) logistische Abbildung auf M := [0, 1] fp : M → M
, fp (x) := p x (1 − x).
(2.2.2)
ur jeden Parameterwert p auf sich abgebildet, • Der Punkt 0 ∈ M wird von fp f¨ ist also Fixpunkt. • Ist nun der Parameter p ≤ 1, dann ist f¨ ur x > 0 immer fp (x) < x, sodass f¨ ur (t) alle Startwerte m ∈ M folgt: limt→∞ fp (m) = 0. • Dar¨ uber hinaus gibt es f¨ ur Parameterwerte p ∈ (1, 4] einen zweiten Fixpunkt von fp in f , Id p M , n¨amlich yp := p−1 p , siehe nebenstehen- 1 de Abbildung. • F¨ ur p ∈ (1, 3] gilt f¨ ur alle Folgen mit Anfangspunkt m ∈ (0, 1), dass (t) ur limt→∞ fp (m) = yp . Dies sieht man f¨ p ∈ (1, 2] so: Da fp das rechte Intervall [1/2, 1) in das linke Intervall (0, 1/2] ab- 13 bildet, brauchen wir nur Anfangswerte x ∈ (0, 1/2] zu betrachten. F¨ ur x ∈ (0, yp ) gilt: fp (x) ∈ (x, yp ), f¨ ur x ∈ (yp , 1/2] gilt: fp (x) ∈ (yp , x). Der allgemeine Fall soll in Aufgabe 2.27 bearbeitet werden.
p1.5
p1 p 1 3
1 2
1
x
22
2.2. Stetige dynamische Systeme
• F¨ ur Werte p ∈ (3, 4] besitzt die zweifach iterierte Abbildung fp ◦ fp vier Fixpunkte. Diese sind in nebenstehender Abbildung als die Schnittpunkte zwischen der Diagonale und dem Graphen von fp ◦ fp sichtbar. Zwei dieser Fixpunkte sind die schon diskutierten Fixpunkte von fp . Die beiden ande(1) (2) ren, nennen wir sie yp und yp , werden durch die logistische Abbildung aufeinander (1) (2) abgebildet, das heißt fp yp = yp und (2) (1) = yp . fp yp
p3.5 f p f p , Id
1
1 2
0
fp
y1 p
y p y2 p 1 2
1
x
Wegen des Satzes von Bolzano–Weierstraß wissen wir, dass die Folgen t → (t) fp (m) immer einen H¨aufungspunkt besitzen. Wir interessieren uns f¨ ur Menge ihrer H¨aufungs- Häufungspunkte 1 punkte, in Abh¨angigkeit vom Parameter p und vom Startwert m. Wegen fp (0) = 0 exi1 2 stiert f¨ ur m = 0 nur der H¨aufungspunkt 0. F¨ ur typische Startwerte m ergibt sich in Abh¨angigkeit von p p 0 eine komplizierte Struktur 1 2 3 4 der H¨aufungspunkte, siehe nebenstehende Abbildung (mit Startwert m = 0.01). Nebenbei: Die iterierte ¨ logistische Abbildung dient in der Physik als einfaches Modell f¨ ur den Ubergang von laminarer zu turbulenter Str¨ omung von Fl¨ ussigkeiten, wobei große Werte von p dem turbulenten Regime zugeordnet werden, siehe Feigenbaum [Fei]. 3 (n)
2.27 Aufgaben (Logistische Familie) 1. Wir betrachten die n-te Iterierte f4 der logistischen Abbildung (2.2.2). (n) Zeigen Sie, dass f4 genau 2n Fixpunkte in [0, 1] hat, indem Sie die Mono(n) tonieintervalle von f4 untersuchen. 2. Zeigen Sie, dass die logistische Abbildung (2.2.2) f¨ ur Parameterwerte p ∈ (n) (1, 3) den Fixpunkt yp = (p − 1)/p besitzt und dass limn→∞ fp (x) = yp f¨ ur alle x ∈ (0, 1). 3 Tipp: Welche Werte nimmt fp (yp ) im Intervall 1 ≤ p ≤ 3 an? Wir wollen nun stetige dynamische Systeme miteinander vergleichen. 2.28 Definition F¨ ur zwei stetige dynamische Systeme Φ(i) : G × M (i) → M (i) (i = 1, 2)
2. Dynamische Systeme
23
• heißt Φ(2) (topologischer) Faktor von Φ(1) , und Φ(2) zu Φ(1) semikonjugiert, (2) (1) wenn es eine stetige Surjektion h : M (1) → M (2) gibt mit Φt ◦ h = h ◦ Φt f¨ ur alle t ∈ G, das heißt wenn das folgende Diagramm kommutiert: (1)
Φ
M (1) −−−t−→ M (1) ⏐ ⏐ ⏐ ⏐ h h
(2.2.3)
(2)
Φ
M (2) −−−t−→ M (2) • heißt Φ(2) konjugiert zu Φ(1) , wenn Φ(2) sogar f¨ ur einen Hom¨oomorphismus h : M (1) → M (2) Faktor von Φ(1) ist. h heißt dann Konjugation. 2.29 Bemerkungen (Konjugation) 1. Da die Inversen (und die Komposition) von Hom¨oomorphismen wieder Hom¨ oomorphismen sind, ist die Definition der Konjugation unabh¨angig von der Nummerierung der beiden dynamischen Systeme, und wir erhalten eine Einteilung in Klassen zueinander konjugierter stetiger dynamischer Systeme. 2. Wenn zwei stetige dynamische Systeme u ¨berhaupt konjugiert sind, gibt es im Allgemeinen viele Konjugationen. Denn mit h aus (2.2.3) sind zum Beispiel (1) (1) auch hs := h ◦ Φs , s ∈ G Konjugationen, die aber f¨ ur Φs = IdM (1) von h verschieden sind. 3. Im Beweis des Satzes 2.31 u ¨ber Kreisrotationen wird eine Semikonjugation als Beweistechnik benutzt werden. 3 Da die in diesem Kapitel definierten Begriffe rein topologischer Natur sind, gelten sie gleichermaßen f¨ ur konjugierte Systeme. Insbesondere gilt: 2.30 Aufgabe (Konjugation) Es sei h : M (1) → M (2) eine Konjugation der stetigen dynamischen Systeme Φ(i) : G × M (i) → M (i) . Beweisen Sie: (a) x1 ∈ M (1) ist genau dann Ruhelage von Φ(1) , wenn x2 := h(x1 ) ∈ M (2) Ruhelage von Φ(2) ist. Konjugierte Ruhelagen unterscheiden sich nicht hinsichtlich ihrer Liapunov–Stabilit¨at oder asymptotischen Stabilit¨at. (b) Der Φ(1) –Orbit O(x1 ) durch x1 ∈ M (1) ist genau dann geschlossen, wenn der Φ(2) –Orbit O(x2 ) durch x2 := h(x1 ) ∈ M (2) geschlossen ist. Dann sind auch die Perioden gleich. (c) Das Bild der ω–Limes–Menge ω(x1 ) von x1 ∈ M (1) ist gleich h ω(x1 ) = ω h(x1 ) .
3
Um zu zeigen, dass zwei stetige dynamische Systeme nicht konjugiert sind, gen¨ ugt es, eine Konjugationsinvariante zu benutzen. Zum Beispiel sind nach
24
2.2. Stetige dynamische Systeme
Aufgabe 2.30.b) die Systeme nicht konjugiert, wenn im ersten System ein periodischer Orbit einer bestimmten Periode existiert, aber nicht im zweiten. Im Beweis des folgenden Satzes ist die sogenannte Rotationszahl (fast) eine solche Invariante. Als Beispiel untersuchen wir n¨amlich, wann die Kreisrotationen aus Aufgabe 2.12.1 konjugiert sind. F¨ ur diese stetigen dynamischen Systeme Φ(γ) : Z × S 1 → S 1
,
Φ(γ) (t, m) = exp(2πiγt) m
(γ ∈ R)
ist genau dann sogar Φ(α) = Φ(β) , falls α − β ∈ Z ist. Wir nehmen also ohne Einschr¨ankung γ ∈ [0, 1) an. 2.31 Satz (Kreisrotationen) Zwei solche Kreisrotationen Φ(α) und Φ(β) sind genau dann konjugiert, wenn α = β oder α = 1 − β gilt. Beweis: • F¨ ur α = β ist IdS 1 eine Konjugation, f¨ ur α = 1 − β die Abbildung S 1 → S 1 , z → z. (β) (α) • Gilt dagegen Φt = h ◦ Φt ◦ h−1 (t ∈ Z) f¨ ur einen Hom¨oomorphismus h : S 1 → S 1 , dann liften wir diese dynamischen Systeme auf den Phasenraum R. Darunter ist Folgendes zu verstehen: Die Abbildung π : R → S1
,
x → exp(2πix)
ist stetig und wickelt anschaulich die Zahlengerade auf der Kreislinie auf. π ist ein Gruppenhomomorphismus von (R, +) auf (S 1 , ·), denn wegen der Funktionalgleichung von exp ist π(x + y) = π(x)π(y). • Wir nennen ein stetiges dynamisches System ˜ (γ) : Z × R → R Φ ˜ t(γ) = Φt(γ) ◦ π π–Lift der Kreisrotation Φ(γ) : Z × S 1 → S 1 , wenn π ◦ Φ gilt, also ˜ (γ) (x) = exp 2πi(x + α) exp 2πiΦ (x ∈ R),
(t ∈ Z)
1
˜ (γ) (x) = x + α − nγ f¨ ˜ (γ) das heißt Φ ur ein nγ ∈ Z (wegen der Stetigkeit von Φ 1 h¨angt nγ nicht von x ab). ˜ : R → R einen π–Lift der Konjuga¨ • Ahnlich nennen wir eine stetige Abbildung h 1 1 ˜ ˜ tion h : S → S , wenn gilt: π ◦ h = h ◦ π, also exp 2πih(x) = h exp(2πix) . ˜ + 1) = h(x) ˜ ˜ streng monoton ist, Damit muss h(x + n f¨ ur ein n ∈ Z gelten. Da h ˜ ˜ folgt n = 0. Da andererseits kein y ∈ (x, x + 1) existiert mit h(y) − h(x) ∈ Z, kommen f¨ ur n nur n = −1 und n = 1 in Frage. ˜ (γ) ist definiert als • Die Rotationszahl des π–Lifts Φ ˜ (γ) (t, x) Φ t→∞ t
R(γ) := lim
(2.2.4)
2. Dynamische Systeme
25
und in der Tat unabh¨angig vom Startpunkt x ∈ R, n¨amlich R(γ) = γ − nγ . ur zu Φ(α) konjugierte dynamische Systeme Sinnvollerweise w¨ahlen wir nγ := 0. F¨ (β) ˜ Φ kommt also, je nachdem ob h streng monoton steigend oder fallend ist, nur ˜ −1 (x) α + Z , h ˜ ◦ Φ(α) ◦ h ˜ steigend h t R(β) = lim ∈ ˜ fallend. t→∞ −α + Z , h t in Frage. Das zeigt, dass nur β = α und β = 1 − α L¨osungen sein k¨onnen.
2
Die meisten Kreisrotationen unterscheiden sich also topologisch voneinander. Andererseits kann man auch f¨ ur andere Diffeomorphismen (siehe Def. 2.36) f : S 1 → S 1 der Kreislinie als die Rotationen die Rotationszahl R(f ) der iterierten Abbildung analog zu (2.2.4) definieren, und es gilt folgender erstaunliche Satz (siehe Herman [Her]): 2.32 Satz (Denjoy) Ist f¨ ur den Diffeomorphismus f ∈ C 2 (S 1 , S 1 ) die Rotationszahl R(f ) irrational, dann ist das von f definierte dynamische System zur Kreisrotation Φ(R(f )) konjugiert.
2.3
Differenzierbare dynamische Systeme
Um Techniken der Analysis auf stetige dynamische Systeme anzuwenden, ist es nat¨ urlich anzunehmen, dass deren Phasenraum eine differenzierbare Mannigfaltigkeit ist. Mannigfaltigkeiten werden in Anhang A systematisch eingef¨ uhrt. Hier betrachten wir nur den Fall von Untermannigfaltigkeiten des Rn . Dies ist aber keine wirkliche Einschr¨ankung (siehe Satz A.49). 2.33 Definition F¨ ur eine offene Teilmenge W ⊆ Rn und f ∈ C 1 (W, Rm ) heißt m y ∈ R regul¨ arer Wert von f , wenn f¨ ur alle q ∈ W mit f (q) = y die Ableitung Dq f : Rn → Rm surjektiv ist. Dieser Begriff dient zun¨achst zur Definition von Untermannigfaltigkeiten des Rn . Er wird in (A.45) auf Abbildungen zwischen Mannigfaltigkeiten verallgemeinert. 2.34 Definition F¨ ur p ∈ {0, . . . , n} heißt eine Teilmenge M ⊆ Rn p–dimensionale Untermannigfaltigkeit des Rn , wenn jeder Punkt x ∈ M eine Umgebung Vx ⊆ Rn besitzt, so dass f¨ ur eine geeignete Abbildung f ∈ C 1 Vx , Rn−p mit regul¨arem Wert 0 gilt: M ∩ Vx = f −1 (0). Im einfachsten Fall ist M = f −1 (0), aber man m¨ochte auch Mengen wie im folgenden Beispiel als Mannigfaltigkeiten bezeichnen.
26
2.3. Differenzierbare dynamische Systeme
2.35 Beispiel (M¨ obius–Band) F¨ ur U := R × (−1, 1) und f ∈ C ∞ (U, R3 ), x (2−y sin 2 ) sin x f (x, y) := (2−y sin x2 ) cos x y cos
x 2
ist M := f (U ) ⊂ R3 das sogenannte 1 f3 2 M¨obius–Band. F¨ ur die Parametrisierung w¨ urde der Win- -1 kelbereich x ∈ [0, 2π) ausreichen, denn -2 f2 zwar kommen Winkel x/2 in f vor, aber 0 -2 f1 f (x + 2π, y) = f (x, −y). f (R × {0}) ist 2 eine Kreislinie vom Radius 2. Da die Fl¨ache M nur eine Seite besitzt, kann sie nicht Niveaumenge f −1 (0) eines regul¨aren Wertes 0 sein, denn sonst w¨ urde ∇f (x) = 0 an jedem Punkt x ∈ M senkrecht auf der Fl¨ache stehen und damit eine von zwei Seiten auszeichnen. 3 2.36 Definition Es sei U ⊆ Rn offen und f ∈ C 1 (U, Rn ). • f heißt Diffeomorphismus auf das Bild V := f (U ) ⊆ Rn , wenn V offen, f : U → V bijektiv und auch f −1 : V → U stetig differenzierbar ist. • f heißt lokaler Diffeomorphismus, wenn jeder Punkt x ∈ U eine offene Umgebung Ux ⊆ U besitzt, f¨ ur die f Ux ein Diffeomorphismus auf das Bild ist. • F¨ ur r ∈ N und U, V ⊂ Rn offen heißt eine Abbildung f ∈ C r (U, V ) ein C r – Diffeomorphismus, wenn f Diffeomorphismus auf das Bild V ist (also die inverse Abbildung f −1 ∈ C r (V, U ) ist). Man kann Diffeomorphismen als Koordinatenwechsel ansehen, und da man gerne dem jeweiligen Problem angepasste Koordinaten verwendet, sind Diffeomorphismen eine h¨aufig verwendete Klasse von Abbildungen. 2.37 Beispiel (Affine Abbildungen) Eine affine Abbildung f : Rn → Rn besitzt die Form f (x) = Ax + b mit A ∈ Mat(n, R) und b ∈ Rn . Sie ist genau dann ein Diffeomorphismus, wenn sie bijektiv ist, d.h. wenn A ∈ GL(n, R) ist. 3 Aus diesem Beispiel liest man ab, dass die Regularit¨at der Jacobi–Matrix Df Einfluss auf die Invertierbarkeit der Abbildung f hat, denn hier ist Df = A. 2.38 Satz (Lokale Diffeomorphismen) F¨ ur U ⊆ Rn offen ist f ∈ C 1 (U, Rn ) genau dann ein lokaler Diffeomorphismus, wenn f¨ ur alle x ∈ U gilt: Df (x) ∈ GL(n, R) Beweis: • Es sei f ein lokaler Diffeomorphismus, x ∈ U , und g : Vx → Ux die Umkehrfunktion des Diffeomorphismus f Ux : Ux → Vx . Dann gilt nach der Kettenregel Dg f (x) Df (x) = D(g ◦ f )(x) = D IdUx (x) = 1l, also Df (x) ∈ GL(n, R).
2. Dynamische Systeme
27
• Es gelte umgekehrt Df (z) ∈ GL(n, R). Um die lokale Inverse von f bei z ∈ U zu finden, wenden wir den Satz u ¨ber die implizite Funktion auf F : Rn × U → R n
, (y, z) → −y + f (z) an. Nach Voraussetzung ist f¨ ur X := f (z), z D2 F (X) = Df (z) ∈ GL(n, R)
, und F (X) = 0.
Anwendung des Satzes u ¨ber die implizite Funktion ergibt die Existenz einer auf der Umgebung Vz := Ury (f (z)) des Bildpunktes definierten Abbildung ur die F (y, g(y)) = f (g(y)) − y = 0 ist. g ∈ C 1 (Vz , W ) mit W = Urz (z), f¨ Wir setzen Uz := g(Vz ) ⊆ W . Sowohl g als auch f Uz sind injektiv, denn sonst k¨onnte nicht f ◦ g = IdVz gelten. Damit ist auch g ◦ f Uz = IdUz und nach der Kettenregel Dg(y) ∈ GL(n, R) f¨ ur alle y ∈ Vz . Damit ist Uz nach dem folgenden Satz eine offene Umgebung von z. 2 ar, d.h. gilt 2.39 Satz Es sei U ⊆ Rn offen und f ∈ C 1 (U, Rn ). Ist f regul¨ Df (x) ∈ GL(n, R) f¨ ur alle x ∈ U , dann ist f (V ) offen, falls V ⊆ U offen ist. 2
Beweis: Siehe zum Beispiel Hildebrandt [Hil], Band 2, Kapitel 1.9.
2.40 Bemerkung (Lokale Koordinaten) Wir nehmen an, dass f¨ ur eine offene Teilmenge W ⊆ Rn 0 ∈ F (W ) regul¨arer Wert von F : W → Rm ist. Dann muss offensichtlich m ≤ n sein, und wegen des Satzes u ¨ber die implizite Funktion k¨onnen wir f¨ ur q ∈ M := F −1 (0) eine Umgebung U ⊆ W von q und einen ur n − m < i ≤ n und Diffeomorphismus ϕ : U → Rn finden, sodass ϕ(z)i = 0 f¨ alle z ∈ U ∩M . Die ersten n−m Komponenten von ϕ dienen dann, eingeschr¨ankt auf U ∩ M , als lokale Koordinaten der Mannigfaltigkeit M . Beispielsweise kann man bei q immer geeignete n − m der n kartesischen Koordinaten verwenden.3 2.41 Beispiel (Sph¨ are) Null ist regul¨arer Wert von F : R3 → R, F (x) := 2 u r die Urbilder x ∈ F −1 (0) = S 2 ist DF (x) = 2x = 2. Der
x − 1, dennf¨ 0 Nordpol q := 0 ∈ S 2 besitzt die Umgebung U := {x ∈ R3 | x3 > 0}. Der 1 Diffeomorphismus auf das Bild ϕ : U → V, ϕ(x) := x1 , x2 , F (x) wird durch die Abbildung ϕ−1 (y) = y1 , y2 , y3 + 1 − y12 − y22 invertiert. Da wir durch Drehung in jedem Punkt q ∈ S 2 eine analoge Konstruktion durchf¨ uhren k¨onnen, haben wir gezeigt, dass S 2 eine zweidimensionale Unter3 mannigfaltigkeit des R3 ist. 2.42 Beispiel Ein Gegenbeispiel hierzu ist F : R2 → R , F (x1 , x2 ) := x21 − x32 , also mit F −1 (0) = {(x1 , x2 ) ∈ R2 | x21 = x32 }. Auch hier ist F unendlich oft differenzierbar, aber 0 kein regul¨arer Wert von F . Nebenstehend sieht man die Niveaumenge F −1 (0), die keine Untermannigfaltigkeit ist. 3
x2 1 1 2
=
1
x23 1
x1
28
2.3. Differenzierbare dynamische Systeme
2.43 Definition Ein stetiges dynamisches System Φ : G × M → M heißt differenzierbar, wenn M eine differenzierbare Mannigfaltigkeit ist und Φ stetig differenzierbar ist. 2.44 Bemerkungen (Differenzierbare dynamische Systeme) 1. Auf differenzierbare dynamische Systeme kann man also die Methoden der Analysis anwenden. Ein Beispiel sind Stabilit¨atsuntersuchungen. So wird im Satz von Liapunov (Satz 7.6) von den Eigenwerten der totalen Ableitung eines Vektorfeldes bei einer Gleichgewichtslage auf die asymptotische Stabilit¨at bez¨ uglich des durch dieses Vektorfeld definierten Flusses geschlossen. 2. Die Diffeomorphismen f : M → M einer Mannigfaltigkeit (siehe Def. A.36) bilden unter Komposition eine Gruppe, die Diffeomorphismengruppe Diff(M ). Ist M kompakt, dann kann man Diff(M ) als unendlich-dimensionale Lie– Gruppe auffassen, deren Lie–Algebra der Raum X (M ) der Vektorfelder ist. Ein differenzierbares dynamisches System Φ : G × M → M ist damit ein Gruppenhomomorphismus G → Diff(M )
, g → Φg .
Diese Sichtweise hilft manchmal beim Verst¨andnis dynamischer Systeme. • Man kann untersuchen, welche Eigenschaften dynamischer Systeme typisch sind. Beispielsweise gilt f¨ ur kompakte M , dass die Diffeomorphismen F ∈ Diff(M ), die nur endlich viele Fixpunkte besitzen, eine offene dichte Teilmenge von Diff(M ) bilden. Allgemein heißt eine Eigenschaft, die diskreten dynamischen Systemen zukommen kann, generisch, wenn die durch sie definierte Teilmenge von Diff(M ) Schnitt abz¨ahlbar vieler offener dichter Mengen ist. • Man kann statt der mengentheoretischen die algebraische Topologie von Diff(M ) untersuchen und beispielsweise feststellen, dass die Diffeomorphismen F ∈ Diff(S 1 ) der Kreislinie S 1 ⊂ C entweder in der Zusammenhangskomponente der Identit¨at oder der der Konjugationsabbildung 3 S 1 → S 1 , z → z liegen. 2.45 Aufgabe (Diffeomorphismengruppe) Zeigen Sie, dass die Diffeomorphismengruppe Diff(M ) einer zusammenh¨angenden Mannigfaltigkeit M transitiv wirkt, das heißt, es f¨ ur alle x, y ∈ M ein f ∈ Diff(M ) gibt mit f (x) = y. Tipp: Beweisen Sie zun¨achst f¨ ur alle y in einer kleinen Umgebung von x ∈ M die Existenz eines Vektorfeldes auf M , dessen Zeit-1-Fluss f ein Diffeomorphismus mit f (x) = y ist. 3 ¨ 2.46 Weiterf¨ uhrende Literatur Eine sehr lesenswerte fr¨ uhe Ubersichtsarbeit zu differenzierbaren dynamischen Systemen ist [Sm1] von Steven Smale. 3
Kapitel 3
Gew¨ ohnliche Differentialgleichungen
Bewegung in einem zuf¨alligen Potential (siehe Seite 231) 3.1 3.2 3.3 3.4 3.5 3.6
Definitionen und Beispiele . . . . . . . . . . . . ¨ Lokale Existenz und Eindeutigkeit der Losung . ¨ Globale Existenz und Eindeutigkeit der Losung . Transformation in ein dynamisches System . . . Das maximale Existenzintervall . . . . . . . . . Der Hauptsatz der Differentialgleichungstheorie
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
30 35 42 45 48 50
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 3,
29
30
3.1. Definitionen und Beispiele
Differentialgleichungen sind so vielf¨altig wie die Naturvorg¨ange, die sie beschreiben. Dieses Kapitel beginnt damit, diese begrifflich zu sortieren, und gew¨ohnliche Differentialgleichungen in eine Normalform (explizite DGL 1. Ordnung) zu u uhren. Danach werden Existenz, Eindeutigkeit und Glattheit der L¨osung ¨berf¨ des Anfangswertproblems untersucht. Es geht dabei noch weniger um konkrete L¨osungstechniken. Sind entsprechende Kenntnisse vorhanden, kann Kapitel 3 problemlos u ¨berschlagen werden.
3.1
Definitionen und Beispiele
Wir beginnen mit (etwas informellen) Definitionen und einer Grobeinteilung: 3.1 Definition • Eine Differentialgleichung (DGL) ist eine Gleichung, in der Ableitungen einer oder mehrerer Funktionen von einer oder mehreren Variablen auftreten. Die gesuchten Unbekannten sind hierbei die Funktionen. • H¨angen die Funktionen von nur einer Variablen ab, so heißt die Differentialgleichung gew¨ ohnlich, sonst partiell. • Werden mehrere Funktionen gesucht, so spricht man von einem Differentialgleichungssystem, sonst von einer Einzel-DGL. 3.2 Beispiele (Differentialgleichungen) 1. F¨ ur c > 0 beschreibt die gew¨ohnliche Einzel–Differentialgleichung dx dt (t)
= −c x(t)
zum Beispiel radioaktiven Zerfall, mit der Stoffmenge x als Funktion der Zeit t und Zerfallskonstante c. Ist die Stoffmenge x zur Zeit t = 0 gleich x0 ∈ R, dann ist 1 x(t) = x0 e−ct
(t ∈ R)
die eindeutige L¨ osung. Wir erhalten also eine einparametrige Schar von L¨ osungen, die linear vom Anfangswert x0 abh¨angt (siehe Abbildung).
1 2
0 0
1
2
t
2. Die Bahn eines geworfenen K¨ orpers im konstanten Schwerefeld der Erde mit Erdbeschleunigung 1 g > 0 wird unter Vernachl¨assigung der Luftreibung durch das gew¨ohnliche DGL–System, d2 x1 dt2 (t)
=0 ,
d2 x2 dt2 (t)
= −g
beschrieben. Dabei bezeichnet x1 die Horizontalkomponente und x2 die Vertikalkomponente des Ortes als Funktionen der Zeit t. 1 In
Bodenh¨ ohe ist g = 9.81m/s2 .
3. Gew¨ohnliche Differentialgleichungen F¨ ur Anfangsort x0 = R2 ist die L¨osung:
x1,0 x2,0
x1 (t) = x1,0 + v1,0 t
31
∈ R2 und Anfangsgeschwindigkeit v0 = , x2 (t) = x2,0 + v2,0 t − 12 gt2
v1,0 v2,0
∈
(t ∈ R).
Dies entspricht den Geschwindigkeiten v1 (t) :=
d x (t) dt 1
= v1,0
,
v2 (t) :=
d x (t) dt 2
Die Zeichnung zeigt verschiedene Wurfx2 bahnen bei gleichem Anfangsort und Betrag der Anfangsgeschwindigkeit, 0.2 aber unterschiedlicher Richtung der An0.1 fangsgeschwindigkeit. Der Wurf mit Winkel α = π/4 f¨ uhrt dabei am weitesten, denn f¨ ur die Zeit t := 2v2,0 /g α ist x2 (t) = x2,0 , und wegen v0 = v0 ( cos sin α ) ist
= v2,0 − gt
(t ∈ R).
=
x1 (t) − x1,0 =
0.2
0.4
0.6
x1
2v1,0 v2,0
v0 2 sin(2α) = . g g 2
2
3. Die eindimensionale Wellengleichung ∂∂t2u (x, t) = c2 ∂∂xu2 (x, t) mit Parameter c > 0 (Ausbreitungsgeschwindigkeit) ist ein Beispiel einer partiellen Differentialgleichung. F¨ ur beliebige Funktionen f± ∈ C 2 (R) ist u(x, t) := f+ (x − ct) + f− (x + ct)
(x, t ∈ R)
eine L¨osung. Eine physikalische Anwendung ist die Ausbreitung elektrischer Signale f± in einem Telegraphendraht, wobei die Position mit x, die Zeit mit t bezeichnet wird. 3 Wir werden in diesem Buch nur gew¨ ohnliche Differentialgleichungen (englisch: ordinary differential equations oder o.d.e.) behandeln. 3.3 Definition Die h¨ochste Ordnung eines in der DGL auftretenden Differentialquotienten wird Ordnung der Differentialgleichung genannt. 3.4 Beispiele 1. Die DGL aus Beispiel 3.2.1. ist von erster Ordnung, 2. die aus 3.2.2. ist von zweiter Ordnung. 3. Die Differentialgleichung (1.3) und ihr durch Spezialisierung auf verschwin2 denden Drehimpuls entstehender Radialteil ddt2r (t) = − r2γ(t) sind von zweiter Ordnung. Letztere DGL beschreibt z.B. die Bewegung eines sich radial mit Geschwindigkeit dr dt vom Erdmittelpunkt wegbewegenden Raumschiffes. γ ist das Erde Raumschiff Produkt von Gravitationskonstante und r Erdmasse M > 0, r der Abstand des Raumschiffes vom Erdmittelpunkt und r˙ d r die Radialgeschwindigkeit. 3 r˙ = dt
32
3.1. Definitionen und Beispiele
3.5 Definition • Ein gew¨ohnliches Differentialgleichungssystem f¨ ur die Funktionen x1 , . . . , xm heißt linear, wenn es die Form n
A(i) (t) x(i) (t) = b(t)
i=0 i
i
d d hat. Dabei bezeichnet x(i) := ( dt den Vektor der i–ten Abi x1 , . . . , dti xm ) (i) leitungen; t → A (t) ∈ Mat(m, R) und t → b(t) ∈ Rm sind vorgegebene Matrix– beziehungsweise vektorwertige Funktionen.
• Andernfalls heißt das Differentialgleichungssystem nicht linear. • Eine lineare DGL heißt homogen, wenn b(t) = 0 f¨ ur alle t, sonst inhomogen. • Die Komponenten bl von b heißen St¨ orfunktionen. So ist Beispiel 3.2.1. linear homogen, Beispiel 3.2.2. ist linear inhomogen und Beispiel 3.4.3. ist nicht linear. Ab jetzt werden viele Begriffe nur f¨ ur Einzel–Differentialgleichungen eingef¨ uhrt. Das meiste u ¨bertr¨agt sich aber auf DGL–Systeme. 3.6 Definition 1. Eine Differentialgleichung heißt implizit, wenn sie die Form (3.1.1) F t, x, x , . . . , x(n) = 0 hat, explizit, wenn sie die Form x(n) = f t, x, x , . . . , x(n−1)
(3.1.2)
hat. 2. Eine n–mal differenzierbare auf dem offenen Intervall I definierte Funktion x : I → R heißt explizite L¨ osung der DGL (3.1.1) bzw. (3.1.2), wenn gilt: F t, x(t), x (t), . . . , x(n) (t) = 0 (t ∈ I) (t ∈ I). bzw. x(n) (t) = f t, x(t), x (t), . . . , x(n−1) (t) Beispiele 3.2.1.–2. und Beispiel 3.4.3 sind explizite Differentialgleichungen. F¨ ur 3.2.1.–2. wurden auch (die) expliziten L¨ osungen angegeben. 3.7 Bemerkung (L¨ osungsbegriff) Algebraische Gleichungen, wie etwa ax2 + bx + c = 0 mit Koeffizienten a, b, c ∈ R, sind uns vertraut. Diese sind Aussageformen u ¨ber dem Variablenbereich R, es entsteht also eine (entweder wahre oder falsche) Aussage, wenn wir eine Zahl x ∈ R einsetzen. ¨ Ahnlich betrachten wir z.B. eine Differentialgleichung vom Typ (3.1.2) mit stetigem f als Aussageform u ¨ber dem Variablenbereich C n (I, R), wobei die L¨osungen wieder die wahren Aussagen liefern, siehe W¨ ust [Wu], Kap. 5.2. 3
3. Gew¨ohnliche Differentialgleichungen
33
dy + x = 0 ist eine impli3.8 Beispiel (Implizite und explizite L¨ osungen) y dx 2 2 zite nichtlineare DGL. Die Kreisgleichung x + y = c ≥ 0 ist die √ allgemeine L¨o√ sung, aber in impliziter Form. Explizite L¨osung: y(x) = ± c − x2 f¨ ur |x| < c, also
x x dy =− . = ∓√ dx y c − x2
3
3.9 Definition • Eine einzelne L¨osung (ohne frei w¨ahlbare Konstanten) heißt spezielle oder partikul¨ are L¨osung. • Eine parameterabh¨angige L¨osung einer Differentialgleichung n–ter Ordnung heißt allgemeine L¨osung, wenn sie n frei w¨ahlbare Konstanten enth¨alt, • eine parameterabh¨angige L¨osung heißt vollst¨ andig, wenn alle speziellen L¨osungen durch Wahl geeigneter Parameterwerte aus ihr hervorgehen. • Eine nicht zu einer parameterabh¨angigen L¨osung geh¨orende spezielle L¨osung heißt singul¨ ar. Beispiele 3.2.1. und 2.: Die allgemeinen und auch vollst¨andigen L¨osungen wurden angegeben. Eine partikul¨are L¨ osung von 2. ist z.B. x1 (t) = 0, x2 (t) = − 12 gt2 . Beachte: In 2. gab es vier Parameter x1,0 , x2,0 , v1,0 , v2,0 , denn es waren zwei Differentialgleichungen zweiter Ordnung, 2 × 2 = 4. Beispiel 3.8.4.: Hier war c ≥ 0 Parameter der allgemeinen = vollst¨andigen L¨osung. 3.10 Beispiel (implizite Differentialgleichung) (y )2 − 4xy + 4y = 0 ist eine implizite nichtlineare DGL erster Ordnung. y Die allgemeine L¨ osung: y(x) = 2cx − 1 c2 , c ∈ R ist eine durch c parametrisierte Geradenschar. 1 2 Dies ist aber nicht die vollst¨andige L¨ osung, denn es existiert noch die sinx gul¨are L¨osung y(x) = x2 . Diese Parabel 1 1 ist die Einh¨ ullende der Geradenschar, siehe Abbildung. 3 Frage:
• Wie findet man L¨ osungen? • Woher weiß man, dass man alle gefunden hat?
Diese Frage besch¨aftigt seit der Zeit Newtons viele Mathematiker (und uns in diesem Kapitel). 2
34
3.1. Definitionen und Beispiele
Wir betrachten zun¨achst die expliziten Einzel-Differentialgleichungen erster Ordnung y = f (x, y)
y 1
(x, y) ∈ U ⊆ R2 , U offen.
Geometrische Interpretation: Zeichnet man an jedem Punkt (x, y) ∈ U eine Gerade der Steigung f (x, y), dann ist der graph(˜ y ) = (x, y˜(x)) | x ∈ I ⊂ U
1
x
1
jeder speziellen osung L¨ y˜ : I → R der Differentialgleichung das Bild einer Kurve I → U, x → x, y˜(x) , die u ¨berall tangential an den lokalen Geraden ist. Beispiel y = −cy, also f : R2 → R, f (x, y) = −cy, siehe Abbildung. Um also die durch den Punkt (x, y) gehende spezielle L¨osung zu finden, bewegt man sich, von (x, y) ausgehend, tangential zum Richtungsfeld. Vorsicht: Woher wissen wir u ¨berhaupt, dass durch jeden Punkt (x, y) ∈ U ⊂ R2 nur eine L¨osungskurve geht? 3.11 Beispiele (Gegenbeispiele zur eindeutigen L¨ osbarkeit) 1. Implizite Differentialgleichung aus Beispiel 3.10. (3.1.3) (y )2 − 4xy + 4y = 0 Hier gehen durch jeden Punkt (x0 , y0 ) unterhalb des Graphen der Parabel y = x2 zwei L¨ osungskurven, das heißt an die Parabel tangentiale Geraden. Deren Steigungen entsprechen den zwei L¨osungen der quadratischen Gleichung (3.1.3) f¨ ur y am Punkt (x0 , y0 ). Oberhalb des Graphen der Parabel gibt es keine L¨osung.
y
1 1 2
1
1
x
2. Explizite Differentialgleichung mit nicht lipschitz–stetigem f √ 3 Eine allgemeine L¨ osung der DGL v˙ = f (v) mit f (v) := 3 v 2 ist v(t) = (t − c)3 , c ∈ R. 2 Numerische Methoden zur L¨ osung von Differentialgleichungen werden zum Beispiel in Deuflhard und Bornemann [DB] behandelt.
3. Gew¨ohnliche Differentialgleichungen Daneben gibt es aber eine singul¨are L¨osung: v(t) = 0. Durch jeden Punkt auf der t– Achse gehen damit mindestens zwei L¨osungskurven! In diesem Beispiel f¨allt auf, dass die Funktion f zwar stetig, aber bei 0 nicht differenzierbar ist.
35
v 1 2
0
1
t
12
Der Vergleich mit dem (eindeutigen) Fall f (t) := |t| legt aber nahe, dass nicht die mangelnde Differenzierbarkeit sondern die fehlende Lipschitz–Stetigkeit die Nichteindeutigkeit verursacht. Physikalisch modelliert dieses Beispiel das Wachstum des Volumens v von Regentropfen durch Kondensation von Wasserdampf an der Oberfl¨ache. Dabei wird angenommen, dass die Rate kondensierten Wassers proportional zur Oberfl¨ache des Tropfens, also zu v2/3 ist. Zur eigentlichen Entstehung von Tropfen kann das Modell also nichts aussagen. 3 3.12 Aufgaben (Einzeldifferentialgleichungen erster Ordnung) 1. Skizzieren Sie die Graphen der Geschwindigkeitsfunktionen fi : R → R mit f1 (x) := (x2 − 1)2
,
f2 (x) := (x2 + 1)2 .
Bestimmen Sie die Fixpunkte und die minimalen invarianten Mengen der Differentialgleichungen x˙ = fi (x). Beschreiben Sie, ohne die Differentialgleichungen explizit zu l¨osen, das qualitative Verhalten ihrer L¨ osungen xi (t, x0 ) f¨ ur Zeiten t und Anfangswert x0 . 2. Geben Sie in Abh¨angigkeit von α ≥ 0 und dem Anfangswert x0 > 0 das maximale Zeitintervall an, f¨ ur das das Anfangswertproblem x˙ = f (x) f¨ ur osung besitzt. 3 f : R+ → R, f (x) := xα eine L¨ ¨ Nach dieser informellen Ubersicht u ¨ber die bei gew¨ohnlichen Differentialgleichungen auftretenden Ph¨anomene zeigen wir nun mathematisch rigoros die (lokale) Existenz und Eindeutigkeit der L¨ osung gen¨ ugend regul¨arer expliziter gew¨ohnlicher DGLn 1. Ordnung. Sp¨ater werden wir sehen, dass damit auch die gleiche Frage f¨ ur explizite Differentialgleichungen h¨ oherer Ordnung beantwortet wird.
3.2
Lokale Existenz und Eindeutigkeit der L¨ osung
Wir werden nun sehen, dass bei etwas mehr Regularit¨at von f die Differentialgleichung lokal eindeutig l¨ osbar ist. Dazu schauen wir uns aber gleich die n–dimensionale Situation an:
36
3.2. Lokale Existenz und Eindeutigkeit der L¨osung
3.13 Definition • Ist U ⊆ Rt × Rnx offen und f : U → Rn stetig, dann heißt U erweiterter Phasenraum, f zeitabh¨ angiges Vektorfeld und die Gleichung x˙ = f (t, x) nichtautonome oder explizit zeitabh¨ angige Differentialgleichung. ˜ mit Phasenraum U ˜ ⊆ Rn offen und f von der Form • Ist speziell U = Rt × U x f (t, x) = f˜(x), dann heißt die DGL autonom oder dynamisches System. • Eine differenzierbare Funktion ϕ : I → Rnx auf dem Intervall I ⊆ Rt wird eine L¨ osung der Differentialgleichung genannt, wenn graph(ϕ) ⊂ U und dϕ = f τ, ϕ(τ ) (τ ∈ I). dt t=τ ugt der Anfangsbedingung (t0 , x0 ), wenn t0 ∈ I, (t0 , x0 ) ∈ • ϕ : I → Rnx gen¨ U und ϕ(t0 ) = x0 gilt. ϕ l¨ ost das Anfangswertproblem (AWP), wenn gilt: dϕ = f τ, ϕ(τ ) (τ ∈ I) und ϕ(t0 ) = x0 (3.2.1) dt t=τ • Das zeitabh¨angige Vektorfeld f : U → Rn erf¨ ullt - global eine Lipschitz–Bedingung mit Konstante L, wenn (t, xi ) ∈ U
f (t, x0 ) − f (t, x1 ) ≤ L x0 − x1
- und (lokal) eine Lipschitz–Bedingung, wenn jeder Punkt (τ, x) aus U eine Umgebung V ⊆ U besitzt, sodass f¨ ur eine Konstante L = L(τ, x)
f (t, x0 ) − f (t, x1 ) ≤ L x0 − x1
(t, xi ) ∈ V . (3.2.2) 3.14 Lemma Ist das zeitabh¨angige Vektorfeld f : U → Rnx stetig differenzierbar, dann ist die lokale Lipschitz–Bedingung (3.2.2) auf einer kompakten konvexen Teilmenge V ⊆ U des erweiterten Phasenraums mit Lipschitz–Konstante L := sup(t,x)∈V Dx f (t, x) erf¨ ullt. Beweis: • Da Dx f : V → Mat(n, R) stetig und V kompakt ist, gilt L < ∞. • F¨ ur die Punkte xs := (1 − s)x0 + sx1 (s ∈ [0, 1]) der Verbindungsstrecke ist wegen der Konvexit¨atsannahme (t, xs ) ∈ V . 1 d • Der Hauptsatz der Integralrechnung sagt: f (t, x1 )−f (t, x0 ) = 0 ds f (t, xs ) ds 1 1 dxs = 0 Dx f (t, xs ) ds ds = 0 Dx f (t, xs )(x1 − x0 ) ds, woraus (3.2.2) folgt: 1 2
f (t, x1 ) − f (t, x0 ) ≤ 0 Dx f (t, xs ) ds x1 − x0 ≤ L x1 − x0 . 3.15 Bemerkungen (Existenz und Eindeutigkeit) 1. Man beachte, dass die Lipschitz–Stetigkeit nur bez¨ uglich der x–Variablen gefragt ist.
3. Gew¨ohnliche Differentialgleichungen
37
2. Die lokale Lipschitz–Bedingung garantiert nach dem Satz von Picard–Lindel¨of (Satz 3.17) schon die Existenz und Eindeutigkeit (siehe Definition 3.16) einer zeitlokalen L¨osung des Anfangswertproblems. Die bloße Existenz einer solchen L¨ osung folgt sogar schon aus unserer Generalannahme, dass f stetig ist (Satz von Peano). 3. Es war schon festgestellt worden, dass aus einer L¨osung ϕ : I → Rnx des AWP durch Restriktion ϕI˜ auf ein kleines, t0 enthaltendes Intervall I˜ ⊆ I eine von ϕ im strengen Sinn verschiedene L¨ osung entsteht, denn die Definitionsbereiche der beiden Funktionen ϕ und ϕI˜ sind ja unterschiedlich. In diesem Sinn ist die L¨osung des Anfangswertproblems also nicht eindeutig. Da wir aber nach dem gr¨ oßtm¨ oglichen Zeitintervall I suchen, f¨ ur das die L¨osung von (3.2.1) definiert ist (siehe Kapitel 3.5), interessiert uns diese triviale Verschiedenheit der L¨ osungen nicht. Daher wird sie wegdefiniert: 3 3.16 Definition Die L¨osung des Anfangswertproblems (3.2.1) ist eindeutig, wenn f¨ ur je zwei L¨osungen ϕ1 : I1 → Rnx und ϕ2 : I2 → Rnx des Anfangswertproblem auf dem Intervall I3 := I1 ∩ I2 gilt: ϕ1 I3 = ϕ2 I3 . Wir werden im Beweis des Satzes 3.17 die eindeutigen lokalen L¨osungen des Anfangswertproblems als Fixpunkte einer kontrahierenden Abbildung auf einem Raum stetiger Funktionen finden. Damit wir sicher sein k¨onnen, dass der Fixpunkt u ¨berhaupt existiert, benutzen wir gem¨aß dem banachschen Fixpunktsatz (Satz D.3 des Anhangs) die in Satz D.1 auf Seite 505 konstatierte Vollst¨andigkeit dieses Raumes. 3.17 Satz (Picard–Lindel¨ of) Das zeitabh¨angige Vektorfeld f : U → Rn auf dem erweiterten Phasenraum uge einer Lipschitz–Bedingung auf U . U ⊆ Rt × Rnx gen¨ Dann existiert f¨ ur (t0 , x0 ) ∈ U ein ε > 0, sodass das Anfangswertproblem x˙ = f (t, x)
, x(t0 ) = x0
(3.2.3)
eine eindeutige L¨osung ϕ : [t0 − ε, t0 + ε] → Rnx besitzt. Beweis: Wir bezeichnen das gesuchte Zeitintervall mit I ≡ Iε := [t0 − ε, t0 + ε]. • Existiert eine solche L¨ osung, dann muss sie die Integralgleichung t f s, ϕ(s) ds (t ∈ I) ϕ(t) = x0 +
(3.2.4)
t0
erf¨ ullen, wie man durch Differentiation bzw. Einsetzen von t0 feststellt. Andererseits ist nach dem Hauptsatz der Differential– und Integralrechnung jede stetige L¨osung von (3.2.4) auch schon differenzierbar und damit eine L¨osung des Anfangswertproblems (3.2.3).
38
3.2. Lokale Existenz und Eindeutigkeit der L¨osung
• Es soll nun die L¨ osung ϕ als Fixpunkt einer Abbildung A aufgefunden werden. x A wird stetige Kurven im Phasenraum in solche abbilden. Um den U Definitionsbereich von A g¨ unstig zu x0 w¨ahlen, soll der Phasenraumbereich Vr Vε,r ψ die abgeschlossene Vollkugel V ≡ Vr := Ur (x0 ) sein. Wir setzen Vε,r := Iε × Vr ,
t
und w¨ahlen r so klein, dass Vr,r ⊆ U. Weiter sei L > 0 Lipschitz–Konstante von f Vr,r , N := max(t,x)∈Vr,r f (t, x)
und 3
t0 Iε
r 1 . ε := min r, , N 2L
(3.2.5)
Damit ist insbesondere Vε,r ⊆ Vr,r ⊆ U . M := C(I, V ) ⊆ C(I, Rn ) bezeichne wieder den metrischen Raum der stetigen Funktionen ψ : I → V , mit Supremumsmetrik d(ψ, ϕ) := sup ψ(t) − ϕ(t) . t∈I
Nach Satz D.1 ist (M, d) ein vollst¨andiger metrischer Raum (denn V ⊆ Rn ist abgeschlossen). • Wir f¨ uhren durch (Aψ)(t) := x0 +
t t0
f s, ψ(s) ds
(t ∈ I)
eine Abbildung A : M → C(I, Rn ) ein. Von dieser zeigen wir zun¨achst, dass ihr Bild in M bleibt. Der Abstand zwischen (Aψ)(t) und x0 ist t t f s, ψ(s) ds f s, ψ(s) ds ≤ t0 t0 t max(t˜,x)∈Vr,r f (t˜, x) ds ≤ |t − t0 |N ≤ εN ≤ r, ≤ t0
unter Verwendung der Definition (3.2.5) von ε. Damit gilt f¨ ur alle Zeiten t ∈ I: (Aψ)(t) ∈ Uε (x0 ) = V , also Aψ ∈ M . 3 mit
r/N := +∞ f¨ ur N = 0
3. Gew¨ohnliche Differentialgleichungen
39
• Jetzt fehlt uns als Voraussetzung des banachschen Fixpunktsatzes nur noch, dass diese sogenannte Picard–Abbildung A:M →M kontrahierend ist, dass also f¨ ur ein geeignetes 0 < θ < 1 gilt d Aϕ, Aψ ≤ θ d(ϕ, ψ) (ϕ, ψ ∈ M ). Tats¨achlich ergibt sich d Aϕ, Aψ = sup Aϕ(t) − Aψ(t)
t∈I t ≤ ε sup f s, ϕ(s) − f s, ψ(s)
= sup f s, ϕ(s) − f s, ψ(s) ds t∈I s∈I t0
≤ ε L sup ϕ(s) − ψ(s) = ε L d(ϕ, ψ) ≤ s∈I
1 2
d(ϕ, ψ).
Die Definition (3.2.5) von ε wurde wieder in der letzten Ungleichung verwendet. A ist damit eine kontrahierende Abbildung auf dem vollst¨andigen metrischen Raum M . • A besitzt also nach dem banachschen Fixpunktsatz (siehe Seite 506) einen eindeutigen Fixpunkt ϕ ∈ M . Diese Funktion ϕ erf¨ ullt die Integralgleichung (3.2.4) und l¨ost damit das Anfangswertproblem. 2 Die Picard–Iteration xi+1 := Axi , die hier benutzt wurde, um den Fixpunkt ϕ = limi→∞ xi von A zu finden, wurde, kann auch zur L¨osung von Differentialgleichungen verwendet werden: 3.18 Beispiele (Picard–Iteration) 1. Wir approximieren die L¨osung des Anfangswertproblems x˙ = x , x(0) = x0 ∈ R durch x0 (t) := x0
t
und xi+1 (t) := x0 +
xi (s) ds
(t ∈ R),
0
tk n k0 , n0,...,3 k
also (siehe Abbildung) x1 (t) = x0 (1 + t) t2 x2 (t) = x0 1 + t + 2 .. . n ti xn (t) = x0 . i! i=0
2
1
1
0
1
t
40
3.2. Lokale Existenz und Eindeutigkeit der L¨osung
∞ i Da x(t) = x0 i=0 ti! = x0 · et , konvergiert f¨ ur alle t ∈ R die n–te Iterierte osung x(t), und zwar gleichm¨aßig auf jedem kompakten xn (t) gegen die L¨ Zeitintervall (aber nicht gleichm¨aßig auf R).
2. Das Anfangswertproblem x˙ = 1 + x2 , x0 = 0 besitzt nur eine L¨osung auf π π − 2 , 2 , und zwar den Tangens. Wir optimieren die Konstanten im Beweis des Satzes von Picard–Lindel¨of. F¨ ur r > 0 ist N = max|x|≤r f (x) = 1 + r2 , und die Lipschitz–Konstante L = max|x|≤r f (x) = 2r. Also ist gem¨aß Definition (3.2.5) ε = min
ε wird maximal f¨ ur r =
√1 , 3
das heißt ε =
√ 3 4 .
.
√
F¨ ur Zeiten |t| <
wir also Konvergenz garantieren. Picard– Iteration mit Anfangswert x0 (t) := x0 ergibt
r 1 1+r 2 , 4r
3 4
k¨onnen
tant 4
x0 (t) = 0
t x1 (t) = (Ax0 )(t) = 0 1 + x20 (s) ds = t Π2 t x2 (t) = (Ax1 )(t) = 0 1 + s2 ds = t + t3 /3 t x3 (t) = (Ax2 )(t) = 0 1 + (s + s3 /3)2 ds = t+
t3 3
+
2 5 t 15
+
2 2
3 Π 4 4
Π 2
t
4
1 7 t , 63
etc. Faktisch konvergiert diese Funktionenfolge nicht nur auf [−ε, ε] gegen den Tangens,die L¨ osung des Anfangswertproblems, sondern auf dem gesamten Intervall − π2 , π2 . 3 3.19 Aufgabe (Picard–Lindel¨ of) Wir betrachten die Differentialgleichung x˙ = f (x)
mit
f : R → R , f (x) := exp(−x)
und Anfangsbedingung x(0) = 0. Da f lokal lipschitz–stetig ist, existiert nach Satz 3.17 ein ε > 0 und eine Funktion ϕ : [−ε, ε] → R, welche dieses Anfangswertproblem l¨ost. (a) Finden Sie eine untere Schranke an ε, die von diesem Satz garantiert wird. (b) Wie sieht die Picard–Iteration f¨ ur dieses Anfangswertproblem aus? (c) Wie lautet die maximale L¨ osung des Anfangswertproblems?
3
In den naturwissenschaftlichen oder technischen Anwendungen von Differentialgleichungen kennen wir deren Anfangswerte normalerweise nicht genau. Der folgende Satz besagt, dass dies auch gar nicht n¨otig ist. 3.20 Satz Unter den Voraussetzungen des Satzes 3.17 (Picard–Lindel¨of) existiert f¨ ur jeden Punkt (T0 , X0 ) ∈ U des erweiterten Phasenraums eine kompakte Umgebung V ⊂ U und ein Intervall Iε := [−ε, ε], sodass die Familie Φ : Iε × V → U
,
(s; t0 , x0 ) → ϕ(t0 + s)
3. Gew¨ohnliche Differentialgleichungen
41
der L¨osungen des Anfangswertproblems (3.2.3) eine stetige Abbildung ist. Die L¨osungen h¨angen also stetig von ihren Anfangswerten und der Zeit ab. Beweis: • F¨ ur kleine R > 0 und ε > 0 ist [T0 − 2ε, T0 + 2ε] × UR (X0 ) Teilmenge des erweiterten Phasenraums U . Die Menge Vε,r := [T0 − ε, T0 + ε] × Ur (X0 ) von Anfangswerten (t0 , x0 ) ist f¨ ur r ∈ (0, R) darin enthalten. Außerdem ist sie beschr¨ankt und abgeschlossen, also kompakt. F¨ ur die Picard–Iteration benutzen wir statt des Raumes der Kurven den metrischen Raum M := C Iε × Vε,r , UR (X0 ) mit der Supremumsmetrik d(Φ, Ψ) := sup{ Φ(t; y) − Ψ(t; y) | (t; y) ∈ Iε × Vε,r }
(Φ, Ψ ∈ M ).
• (M, d) ist ein vollst¨andiger metrischer Raum, denn (a) die Bildmenge ist eine abgeschlossene Teilmenge des Rn , also vollst¨andig. (b) der Definitionsbereich ist kompakt. Jede Cauchy–Folge (Φm )m∈N in M besitzt also einen punktweisen Limes Φ mit Φ(t; y) := limm→∞ Φm (t; y). (c) auch das ε/3–Argument aus Satz D.1 u ¨bertr¨agt sich auf diese Situation, Φ ist also stetig und Φ ∈ M . • Wir betrachten f¨ ur Ψ ∈ M die Picard–Abbildung s f t0 +τ, Ψ(τ ; t0 , x0 ) dτ (AΨ)(s; t0 , x0 ) := x0 +
(s; t0 , x0 ) ∈ Iε ×Vε,r .
0
Ist Φ ein Fixpunkt von A, dann bedeutet dies Φ(0; t0 , x0 ) = AΦ(0; t0 , x0 ) = x0 und d d Φ(s; t0 , x0 ) = (AΦ)(s; t0 , x0 ) = f t0 + s, Φ(s; t0 , x0 ) . ds ds Die Abbildung t → Φ(t−t0 ; t0 , x0 ) l¨ ost also das AWP mit Anfangswert (t0 , x0 ). • Mit der gleichen Argumentation wie im Beweis von Picard–Lindel¨of wird f¨ ur kleine Parameter ε, r > 0 die Picard–Abbildung zu einer Kontraktion A : M → M. Sie hat also nach dem banachschen Fixpunktsatz einen eindeutigen Fixpunkt Φ ∈ M. 2
42
3.3
3.3. Globale Existenz und Eindeutigkeit der L¨osung
Globale Existenz und Eindeutigkeit der L¨ osung
Es ist naheliegend, auch Differentialgleichungen auf Mannigfaltigkeiten zu untersuchen. 3.21 Definition • Ist f : M → T M ein (zeitunabh¨angiges) Vektorfeld auf der Mannigfaltigkeit M (siehe Definition A.39), dann wird eine Kurve ϕ ∈ C 1 (I, M ) L¨ osung der Differentialgleichung x˙ = f (x) genannt, wenn f¨ ur d ϕ(t) = f ϕ(t) . alle Zeiten t ∈ I gilt: dt • Ein Vektorfeld f : M → T M auf der Mannigfaltigkeit M heißt vollst¨ andig, wenn f¨ ur alle x0 ∈ M das Anfangswertproblem x˙ = f (x), x(0) = x0 eine eindeutige L¨osung ϕ : R → M besitzt. In diesem Abschnitt stellen wir Kriterien f¨ ur die Vollst¨andigkeit von Vektorfeldern vor. Wir beginnen mit dem Fall des Phasenraums M = Rn . 3.22 Beispiele 1. Am Beispiel 3.18.2 der DGL x˙ = f (x) = 1 + x2 des Tangens sehen wir, dass die L¨ osung nicht f¨ ur alle Zeiten existiert (sondern in der Zeit π von Null nach ∞ divergiert), da x → f (x) superlinear w¨achst. Dies steht 2 nicht im Widerspruch zur lokalen Lipschitz–Stetigkeit von f . 2. Dagegen ist in Beispiel 3.18.1 f (x) = x sogar global lipschitz–stetig, und dieses lineare Vektorfeld ist vollst¨andig. Dies ist ganz allgemein so: 3 3.23 Satz • Lipschitz–stetige Vektorfelder f : Rn → Rn sind vollst¨andig. • Allgemeiner sei I ⊆ R ein Intervall, und das zeitabh¨angige Vektorfeld ulle die zeitabh¨angige globale Lipschitz–Bedingung f : I × Rn → Rn erf¨
f (t, x1 ) − f (t, x2 ) ≤ L(t) x1 − x2
t ∈ I, x1 , x2 ∈ Rn mit stetiger Lipschitz–Konstante L : I → R+ . Dann hat das Anfangswertproblem f¨ ur alle Anfangswerte (t0 , x0 ) ∈ I × Rn eine eindeutige L¨osung ϕ : I → Rn . Beweis: • Der zeitunabh¨angige Fall ergibt sich aus dem zeitabh¨angigen Fall mit I = R und konstantem L. • Es gen¨ ugt, kompakte Intervalle I zu betrachten, denn jedes Intervall I t0 l¨asst sich als Vereinigung kompakter Intervalle Ik t0 darstellen. • Dann ist wegen der Stetigkeitsannahme supt∈I L(t) endlich. Es gibt also eine ˜ ≥ 1 mit Lipschitz-Konstante L ˜ x1 − x2
f (t, x1 ) − f (t, x2 ) ≤ L
(t ∈ I, x1 , x2 ∈ Rn ).
Wir w¨ahlen r := f (x0 ) + 21L˜ , sodass N := maxx∈Ur (x0 ) f (x) die Ungleichung N
≤
f (x0 ) + maxx∈Ur (x0 ) f (x) − f (x0 )
≤
˜ max ˜
x − x0 ≤ r + Lr
f (x0 ) + L x∈Ur (x0 )
3. Gew¨ohnliche Differentialgleichungen
43
erf¨ ullt, und die das Zeitintervall definierende Konstante ε aus (3.2.5) unabh¨angig von x0 wird: r 1 1 1 1 1 ε = min r , , + f (x0 ) , , . = min = ˜ ˜ ˜ ˜ ˜ N 2L 2L 1 + L 2L 2L • F¨ ur beliebige Zeiten tk ∈ I und Anfangswerte xk ∈ Rn k¨onnen wir nach Satz 3.17 die eindeutige lokale L¨ osung ϕk : Ik → Rn des Anfangswertproblems x˙ = f (t, x) mit ϕk (tk ) := xk auf dem Intervall Ik := [tk − ε, tk + ε] ∩ I finden. ur k ∈ N bei Kenntnis der Mit den Zeiten tk := t0 + 2ε k ∈ I setzen wir nun f¨ L¨osung ϕk−1 den Anfangswert xk := ϕk−1 (tk ). Analog w¨ahlen wir f¨ ur ganzzahlige k < 0 den Anfangswert xk := ϕk+1 (tk ). • Es ist also ϕk−1 (tk ) = ϕk (tk ). Wegen der Eindeutigkeit der L¨osung des Anfangswertproblems im Sinn von Definition 3.16 erhalten wir mit ϕ : I → Rn
,
ϕ(t) := ϕk (t) falls t ∈ Ik
eine eindeutige L¨ osung des Anfangswertproblems x˙ = f (t, x), x(t0 ) = x0 .
2
3.24 Bemerkungen 1. Analog zu Lemma 3.14 hat man das folgende hinreichende Kriterium f¨ ur globale Lipschitz–Stetigkeit. Ist f ∈ C 1 (Rn , Rn ), dann ist f lipschitz–stetig, wenn gilt: sup Df (x) < ∞ .
x∈Rn
2. Insbesondere folgt, dass f¨ ur alle linearen Differentialgleichungen das Anfangswertproblem x˙ = Ax , x(0) = x0 f¨ ur alle Zeiten eindeutig l¨ osbar ist, denn das Vektorfeld f (x) = Ax ist lipschitz– stetig mit Konstante L = A := supv∈S n−1 Av , der Matrixnorm von A ∈ Mat(n, R). In Kapitel 4.1 wird gezeigt, dass diese L¨osung von der Form x(t) = exp(At)x0 ist. 3. Satz 3.23 garantiert die eindeutige globale L¨ osbarkeit unter Voraussetzung der Existenz einer stetig von der Zeit abh¨angigen Lipschitz–Konstante L : I → ur inhomogen-lineare Differentialgleichungen x(t) ˙ = A(t)x(t) + b(t) R+ . F¨ gen¨ ugt es sogar anzunehmen, dass A und b lokal integrabel sind, siehe Weidmann [Weid], Theorem 2.1. 3 3.25 Aufgabe Finden Sie die L¨ osung des Anfangswertproblems x˙ = sin x mit 3 x(0) = π/2. Berechnen Sie limt→−∞ x(t) und limt→∞ x(t). Wie das folgende Beispiel zeigt, ist die Lipschitz–Stetigkeit des Vektorfeldes auf dem gesamten Phasenraum Rn eine hinreichende, aber keineswegs notwendige Voraussetzung f¨ ur seine Vollst¨andigkeit.
44
3.3. Globale Existenz und Eindeutigkeit der L¨osung
3.26 Beispiel (Vollst¨ andiges Vektorfeld) x2 Das Vektorfeld f : P → R2 , x → x 2 ( −x ) auf dem Phasenraum P = R2 ist 1 glatt. Es ist aber nicht global lipschitz–stetig, denn seine Ableitung 2x x2 x21 +3x22 Df : P → Mat(2, R) , Df (x) = −3x12 −x 2 −2x x 1
2
1
2
ist nicht beschr¨ankt. Daher k¨ onnen wir seine Vollst¨andigkeit nicht mit Satz 3.23 beweisen. Wir stellen aber fest, dass f tangential zu den Kreislinien Sr1 := {x ∈ P | x = r} vom Radius r ist, denn es steht senkrecht auf deren Normalenvektoren: f (x), x = 0. In Polarkoordinaten x1 = r cos ϕ, x2 = r sin ϕ lautet die DGL x˙ = f (x) r˙ = 0 ,
ϕ˙ = −r 2 .
Die eindeutige L¨ osung r(t) = r0 , ϕ(t) = ϕ0 − r02 t des Anfangswertproblems existiert f¨ ur alle Zeiten t ∈ R. 3 Entscheidend f¨ ur die globale L¨ osbarkeit war hier die M¨oglichkeit, das Vektorfeld f auf die kompakten Untermannigfaltigkeiten Sr1 des Phasenraums einzuschr¨anken.
3.27 Satz Lipschitz–stetige Vektorfelder auf kompakten Mannigfaltigkeiten sind vollst¨andig. Beweis: • Zun¨achst macht man sich klar, dass lokale Lipschitz–Stetigkeit (und um diese geht es hier) kartenunabh¨angig definiert ist. Denn Kartenwechsel sind Diffeomorphismen offener Teilmengen des Rn , deren Ableitungen auf Kompakta beschr¨ankt sind. • F¨ ur jeden Punkt x ∈ M gibt es nach Satz 3.20 eine kompakte Umgebung Kx und ein εx > 0, sodass das Anfangswertproblem f¨ ur alle x0 ∈ Kx eine eindeutige L¨osung mit Zeitintervall (−εx , εx ) besitzt. Ebenso gibt es im (maximalen) Atlas von M zu jedem x ∈ M Karten (Ux , ϕx ) mit offenen, x enthaltenden Kartengebieten Ux ⊂ Kx und Kartenabbildungen ϕx : Ux → Rn . Da die Mannigfaltigkeit M kompakt ist, werden von diesen Karten nur end¨ lich viele f¨ ur einen Atlas ben¨ otigt (denn jede offene Uberdeckung von M besitzt wegen der Kompaktheit eine endliche Teil¨ uberdeckung). Wir k¨onnen also annehmen, dass die Indexmenge I des Atlas {(Ui , ϕi ) | i ∈ I} von M endlich ist. • Da das Minimum der εi immer noch positiv ist, kann man mit der St¨ uckelungsmethode des Beweises von Satz 3.23 eine eindeutige L¨osung des Anfangswertproblems mit Zeitintervall R konstruieren. 2 2n 3.28 Aufgabe (Existenz des Flusses) Es sei H : R → R eine glatte Funk−1 (−∞, E] f¨ ur alle E ∈ R kompakt ist. tion, so dass H
(a) Geben Sie ein Beispiel f¨ ur eine solche Funktion H.
3. Gew¨ohnliche Differentialgleichungen
45
(b) Zeigen Sie, dass der Fluss, der von den (hamiltonschen) Differentialgleichungen x˙ j = −
∂H (x) ∂xj+n
,
x˙ j+n =
∂H (x) ∂xj
(j ∈ {1, . . . , n}) 3
generiert wird, f¨ ur alle Zeiten existiert.
3.4
Transformation in ein dynamisches System
Reduktion der Ordnung Auch Differentialgleichungen h¨ oherer als erster Ordnung lassen sich mit den beschriebenen Methoden behandeln, indem man aus einer expliziten Differentialgleichung n–ter Ordnung ein System von n DGLn erster Ordnung macht. 3.29 Satz Die Differentialgleichung der Ordnung n > 1 n−1 dn x = F t, x, dx , . . . , ddtn−1x dtn dt
(3.4.1)
mit F ∈ C 1 (Rn+1 ) ist zum Differentialgleichungssystem ⎛ y2 .. dy . = f (t, y) mit f (t, y) := ⎝ yn dt
⎞ ⎠
(3.4.2)
F (t,y1 ,...,yn )
im folgenden Sinn ¨aquivalent: ⎛ • Ist ϕ : I → R L¨osung von (3.4.1), dann ist ψ := ⎝
ϕ ϕ
.. .
⎞ ⎠ : I → Rn L¨osung
ϕ(n−1)
von (3.4.2). ψ 1 .. • Ist umgekehrt ψ = L¨osung von (3.4.2), dann ist ψ1 L¨osung von (3.4.1). . ψn
Beweis: Nach Definition ist ϕ n–mal differenzierbar, also ψ : I → Rn differend ψk−1 (k = 2, . . . , n), zierbar, und ψk = dt d dt ψn
=
dn ϕ dtn
= F (t, ϕ, ϕ , . . . , ϕ(n−1) ) = F (t, ψ1 , . . . , ψn ).
Die Argumentation l¨asst sich umkehren.
2
3.30 Aufgabe Betrachten Sie die eindimensionale Bewegung x ¨ = x. Finden Sie die L¨osung mit Anfangsbedingung (x0 , x˙ 0 ) = (1, −1). Wieviel Zeit braucht sie, um x = 0 zu erreichen? 3
46
3.4. Transformation in ein dynamisches System
3.31 Beispiel (Kepler–Problem) Das himmelsmechanische 2–K¨orper–Problem beschreibt die z.B. die Bewegung von Erde und Sonne um ihren gemeinsamen Schwerpunkt. Es l¨aßt sich auf das in der Einleitung behandelte sogenannte 1– Zentren-Problem der Bewegung einer Punktmasse am Ort x ∈ R3 \{0} im Schwerefeld eines im Koordinatenursprung befindlichen Himmelsk¨orpers reduzieren. Es gilt dann nach (1.3) x . x ¨ = −γ
x 3 Dieses DGL–System zweiter Ordnung l¨asst sich auf die Differentialgleichung erster Ordnung mit Phasenraum U := (R3 \{0}) × R3 v x z = (x, v) ∈ U (3.4.3) z˙ = f (z) := −γ x 3 umformen. Der Phasenraum U ist eine offene Teilmenge des R6 , mit einem Vektorfeld f ∈ C ∞ (U, R6 ). Damit k¨onnen wir (3.4.3) mit Picard–Iteration oder einem anderen Verfahren f¨ ur kleine Zeiten l¨ osen. Analoges gilt auch f¨ ur das n–K¨orper-Problem (1.8). 3
¨ Ubergang zu einem zeitunabh¨ angigen System Wir k¨onnen auch explizite zeitabh¨angige Differentialgleichungen auf autonome zur¨ uckf¨ uhren. Statt der DGL x˙ = f (t, x) mit f : U → Rn , U ⊆ Rt × Rnx offen betrachten wir dazu das autonome Differentialgleichungssystem 1 . (3.4.4) g(y) := f (y) y˙ = g(y) mit g : U → Rn+1 , y := ( xs ) Wir erh¨ohen also die Dimension des Phasenraums um Eins, indem wir den Zeitparameter s zum Phasenraumpunkt x hinzuf¨ ugen. Ausgeschrieben hat (3.4.4) die Form d d (3.4.5) dt s = 1 , dt x = f (s, x). s(t) Ist nun ψ : I → U eine L¨ osung von (3.4.4), dann gilt mit ψ(t) = x(t) s(t) = s(0) + t, bis auf eine zu w¨ahlende additive Konstante ist also die Phasenraumkoordinate s gleich der t. Die L¨ osung ψ = ( xs˜ ) des Anfangswertpro t Zeit 0 blems y˙ = g(y), ψ(0) = x0 ergibt daher eine L¨osung x des Anfangswertpro˜(t − t0 ). blems x˙ = f (t, x), x(t0 ) = x0 . Man setzt einfach x(t) := x Umgekehrt kann man aus einer L¨ osung des AWP x˙ = f (t, x), x(t0 ) = x0 durch Erg¨anzung eine L¨ osung des Anfangswertproblems von (3.4.4) konstruieren. Ist f : U → Rn (in allen Argumenten) lipschitz–stetig, dann auch g. Damit u ¨bertr¨agt sich der Existenz– und Eindeutigkeitssatz (man beachte aber, dass wir f¨ ur nicht autonome DGLn keine Lipschitz–Stetigkeit bez¨ uglich t forderten).
Grundbegriffe f¨ ur autonome Differentialgleichungen Existiert f¨ ur alle x0 ∈ M eine eindeutige L¨ osung ϕx0 : R → M des Anfangswertproblems x˙ = f (x), x(0) = x0 auf der Mannigfaltigkeit M , dann heißt die
3. Gew¨ohnliche Differentialgleichungen
47
Abbildung Φ:R×M →M
, (t, x) → ϕx (t)
(3.4.6)
Phasenfluss oder kurz Fluss der Differentialgleichung. Sie bildet dann ein kontinuierliches dynamisches System im Sinn der Definition 2.7. Es ist aber oft praktisch, die folgenden bis jetzt nur f¨ ur dynamische Systeme definierten Begriffe auch dann zu verwenden, wenn die L¨osung des Anfangswertproblems nicht f¨ ur alle Zeiten existiert: 3.32 Definition Das Vektorfeld f : M → T M auf einer Mannigfaltigkeit M sei lokal lipschitz–stetig. Wir betrachten die Differentialgleichung x˙ = f (x). 1. ϕ : I → M sei eine L¨osungskurve der Differentialgleichung mit maximalem Zeitintervall I. Das Bild ϕ(I) ⊆ U heißt dann Orbit. F¨ ur x ∈ ϕ(I) heißt O(x) := ϕ(I) der Orbit durch x. arer Punkt des Vektorfeldes f , wenn f (xs ) = 0 ist. 2. xs ∈ M heißt singul¨ Ist xs ∈ M singul¨arer Punkt von f , dann heißt xs auch Ruhelage oder Gleichgewichtslage der Differentialgleichung. 3. x ∈ M heißt periodischer Punkt mit (Minimal)-Periode T > 0, wenn ϕx (T ) = x (und ϕx (t) = x falls t ∈ (0, T )). Ein Orbit O(x) heißt geschlossen, wenn x ∈ M ein periodischer Punkt ist 3.33 Bemerkungen 1. F¨ ur einen singul¨aren Punkt xs des Vektorfelds f ist die konstante Funktion x(t) = xs die (einzige) L¨osung des Anfangswertproblems. 2. Singul¨ar heißt der Punkt nicht etwa deswegen, weil das Vektorfeld f dort eine Singularit¨at bes¨aße, sondern weil dessen Richtungsfeld 4 x → f (x)/ f (x)
dort undefiniert ist und sich auch im Allgemeinen nicht stetig auf xs fortsetzen l¨asst. 3. Wie schon in Satz 3.27 verwendet, ist der Definition 3.32 zugrundeliegende Begriff der lokalen Lipschitz–Stetigkeit auch f¨ ur Vektorfelder auf Mannigfaltigkeiten wohldefiniert. 3 3.34 Satz Wenn das durch ein lokal lipschitz–stetiges Vektorfeld f : M → T M definierte Anfangswertproblem x˙ = f (x) eine L¨osung Φ : R × M → M besitzt, ist Φ ein stetiges dynamisches System (im Sinn von Definition 2.16). Beweis: Nach Satz 3.20 ist die Abbildung Φ aus (3.4.6) stetig. Die Bedingung Φ0 = IdM ist wegen der Eigenschaft ϕx0 (0) = x0 der L¨osung des Anfangswertproblems erf¨ ullt, die Kompositionseigenschaft Φt1 ◦ Φt2 = Φt1 +t2 (t1 , t2 ∈ R) wegen der Eindeutigkeit und Translationsinvarianz der L¨osung. 2 4 mit
einer zum Beispiel von einer riemannschen Metrik kommenden Norm
48
3.5. Das maximale Existenzintervall
!n 3.35 Beispiele 1. F¨ ur ein reelles Polynom f (x) = i=1 (x − ai ) mit den Nullstellen a1 < . . . < an ist die Differentialgleichung x˙ = f (x) lokal eindeutig l¨osbar und besitzt f¨ ur x ∈ [a1 , an ] sogar L¨ osungen t → Φt (x) f¨ ur alle t ∈ R. ur x ∈ (ai , ai+1 ) ist f (ai ,ai+1 ) > Die Ruhelagen sind die Punkte a1 , . . . , an . F¨ 0, falls n − i gerade ist. In diesem Fall ist damit ω(x) = {ai+1 } und α(x) = {ai }. Ist dagegen n − i ungerade, also f (ai ,ai+1 ) < 0, dann gilt umgekehrt ω(x) = {ai }, α(x) = {ai+1 }. Periodische Punkte existieren nicht. 2. F¨ ur das (in Polarkoordinaten (r, ϕ) notierte) Differentialgleichungssystem mit Phasenraum R2 r˙ = r(1 − r 2 ) , ϕ˙ = 1 ist der Ursprung (r = 0) die einzige Ruhelage, und {1} × [0, 2π) der einzige periodische Orbit. F¨ ur alle x ∈ R2 \{0} ist ω(x) gleich diesem periodischen Orbit, f¨ ur x < 1 ist α(x) = {0}. 3
3.5
Das maximale Existenzintervall
Zur Vorbereitung des Hauptsatzes bestimmen wir zun¨achst die Struktur des maximalen Definitionsbereichs von Φ. Wir betrachten das Vektorfeld f ∈ C 1 (U, Rn ) auf dem Phasenraum U ⊆ Rn (oder allgemeiner ein Vektorfeld auf einer Mannigfaltigkeit), und wollen f¨ ur die Anfangszeit t0 = 0 allen Anfangswerten x0 aus U das maximale Zeitintervall zuordnen, f¨ ur das die L¨ osung des Anfangswertproblems definiert ist. Nach dem Satz von Picard–Lindel¨ of ist dies eine Umgebung der Null, und (da dies auch f¨ ur alle Punkte des Orbits gilt) offen. Wir k¨ onnen es also in der Form T − (x0 ), T + (x0 ) mit −∞ ≤ T − (x0 ) < 0 < T + (x0 ) ≤ +∞ schreiben. Die entsprechende L¨ osung des Anfangswertproblems wird auch die maximale L¨osung genannt. Wir untersuchen die Fluchtzeiten T ± : U −→ R := {−∞} ∪ R ∪ {+∞}
(3.5.1)
mit Werten in der erweiterten Zahlengerahx de. Dazu wird R mit einer Topologie verse1 hen, bez¨ uglich derer R zum Intervall [−1, 1] hom¨oomorph ist, mit Hom¨ oomorphismus x ⎧ 2 1 1 2 −1 , x = −∞ ⎨ tanh(x) , x ∈ R h : R → [−1, 1], x → ⎩ 1 , x = +∞. 1 Wir sehen an folgendem Beispiel, dass T + und T − im Allgemeinen nicht stetig sind: =
3. Gew¨ohnliche Differentialgleichungen
49
3.36 Beispiel (Fluchtzeiten) Auf dem Phasenraum U := R2 \{0} betrachten wir das Anfangswertproblem f¨ ur das konstante Vektorfeld f (x) := e1 , also Φt (x) = x + e1 t. Dies ist f¨ ur alle t definiert, falls x = xx12 mit x2 = 0 ist. F¨ ur x2 = 0 und x1 < 0 ist T − (x), T + (x) = − ∞, |x1 | . 3 In diesem Beispiel springt T + nur nach oben, nicht nach unten. Dies ist typisch f¨ ur alle Differentialgleichungen: 3.37 Definition Eine Funktion f : U → R auf einem topologischen Raum 5 U heißt oberhalbstetig beziehungsweise unterhalbstetig bei x0 ∈ U , wenn f (x0 ) ≥ lim sup f (x) x→x0
bzw.
f (x0 ) ≤ lim inf f (x), x→x0
und oberhalbstetig (beziehungsweise unterhalbstetig), wenn sie f¨ ur alle x0 ∈ U oberhalbstetig (bzw. unterhalbstetig) bei x0 ist. 3.38 Beispiel (floor und ceil) In der Zerlegung von x ∈ R in x = x + {x} mit x ∈ Z und {x} ∈ [0, 1) x x ist die floor –Funktion · : R → 1 1 R (auch Gauss–Klammer genannt) 1 2x oberhalbstetig, w¨ahrend x → {x} 2 1 2 1 1 2x (ebenso wie die ceil–Funktion · : 2 R → R) unterhalbstetig ist. 3 3.39 Satz Die Fluchtzeit T + : U → R aus (3.5.1) ist unterhalbstetig, die Fluchtzeit T − : U → R ist oberhalbstetig. Damit ist der Definitionsbereich D := (t, x) ∈ R × U | t ∈ T − (x), T + (x) des sogenannten maximalen Flusses Φ : D → U eine offene Teilmenge des erweiterten Phasenraums. Beweis: • Es sei x0 ∈ U . Dann existiert wegen der Offenheit von U eine Umgebung Ur (x0 ) mit Ur (x0 ) ⊂ U . Da Ur (x0 ) kompakt ist, ist die Einschr¨ankung des Vektorfeldes auf diese Menge lipschitz–stetig. Nach dem Satz von Picard– Lindel¨of gibt es ein ε > 0, sodass f¨ ur alle y ∈ Ur/2 (x0 ) das Anfangswertproblem x˙ = f (x), x(0) = y f¨ ur t ∈ (−ε, ε) eindeutig l¨osbar ist. • Wir betrachten nun eine aufsteigende Folge von Zeiten (tn )n∈N mit t1 = 0, limn→∞ tn = T + (x0 ), sodass f¨ ur geeignete rn > 0 und εn > 0 das AWP x˙ = f (x)
,
x(0) = y
f¨ ur alle t ∈ (−εn , εn )
und y ∈ Urn /2 (xn )
l¨osbar ist, wobei wir xn := Φtn (x0 ) setzen. Nach Konstruktion der maximalen L¨osung k¨onnen wir annehmen, dass tn+1 − tn < εn ist. 5 Wir haben es durchweg mit R¨ aumen zu tun, deren Topologie metrisierbar ist, verstehen also lim supx→x0 f (x) und im Sinn von limε0 sup f (x) | x ∈ Uε (x0 ) \ {x0 } . Allgemein ist eine solche Funktion genau dann unterhalbstetig, wenn ihr Epigraph abgeschlossen ist.
50
3.6. Der Hauptsatz der Differentialgleichungstheorie
• Es sei nun T + nicht unterhalbstetig bei x0 , also Tˆ := lim inf x→x0 T + (x) < T + (x0 ) und k ∈ N so gew¨ahlt, dass tk ≤ Tˆ < tk+1 . Nach Annahme ist tk + εk > Tˆ . Wegen der Stetigkeit des Flusses in den Anfangsbedingungen (Iteration von Satz 3.20) existiert eine Umgebung V ⊂ U von x0 mit Φtk (V ) ⊂ ur alle y ∈ V gilt Urk /2 (xn ), und f¨ T + (y) = tk + T + (Φtk (y)) ≥ tk + εk > Tˆ . Widerspruch! • Die Oberhalbstetigkeit von T − zeigt man analog. • W¨are D nicht offen, dann w¨ urde eine Folge (tn , xn )n∈N in R × Rn \ D mit Grenzwert (t, x) := limn→∞ (tn , xn ) ∈ D existieren. Wegen der Offenheit von U ⊆ Rn k¨onnen wir (durch Weglassen der ersten Folgenglieder) annahmen, dass xn ∈ U . Also muss f¨ ur jedes n gelten: Entweder ist tn ≥ T + (xn ) oder tn ≤ T − (xn ). Einer der beiden F¨alle tritt unendlich oft auf, zum Beispiel tn ≥ T + (xn ). Wir gehen wieder zur entsprechenden Teilfolge u ¨ber. Wegen (t, x) ∈ D ist t ∈ (0, T + (x)), was wegen lim inf T + (xn ) ≤ lim inf tn = t < T + (x) n→∞
n→∞
der Unterhalbstetigkeit von T + bei x widerspricht.
2
3.40 Bemerkung In diesem Abschnitt haben wir angenommen, dass die Differentialgleichung autonom ist. Ganz analoge Aussagen stimmen aber auch f¨ ur Anfangswertprobleme nicht autonomer Differentialgleichungen, wenn wir eine Anfangszeit t0 fixieren. Denn durch Hinzunahme einer abh¨angigen Variable k¨onnen wir die DGL in autonomer Form schreiben. Diese Tatsache werden wir uns beim Beweis des Hauptsatzes zunutze machen. 3 mit Para3.41 Aufgabe (Fluchtzeit) H : R×(0, ∞) → R, H(p, q) := 12 p2 − m q meter m ∈ (0, ∞) und zugeh¨ origer hamiltonscher Differentialgleichung p˙ = −m/q 2 , q˙ = p beschreibt die radiale Bewegung im Gravitationsfeld. (a) Geben Sie eine obere Schranke f¨ ur die Fluchtzeit (also Kollisionszeit) an. (b) Finden Sie eine untere Schranke an die Fluchtzeit. (c) Finden Sie eine DGL auf R mit – je nach Anfangswert – nur f¨ ur die Vergangenheit, die Zukunft oder immer unendlichen Fluchtzeiten. 3
3.6
Der Hauptsatz der Differentialgleichungstheorie
Wir wissen aus Satz 3.20, dass f¨ ur stetig differenzierbare zeitabh¨angige Vektorfelder f auch die L¨ osungen Φ(t, x0 ) des Anfangswertproblems (3.6.1) x(t) ˙ = f t, x(t) , x(t0 ) = x0
3. Gew¨ohnliche Differentialgleichungen
51
stetig in der Zeit t und im Anfangswert x0 sind. Der Hauptsatz besagt nun, dass die L¨ osung Φ genauso glatt wie f ist. Die beim Beweis benutzte Gronwall–Ungleichung ist eine in der Differentialgleichungstheorie wichtige Absch¨atzung. Sie ¨ahnelt M¨ unchhausens Methode, sich an den eigenen Haaren aus dem Sumpf zu ziehen. 3.42 Satz (Gronwall–Ungleichung) F¨ ur F, G ∈ C [t0 , t1 ), [0, ∞) gelte mit einem geeigneten a ≥ 0 die Ungleichung
t
F (t) ≤ a +
F (s)G(s) ds
t ∈ [t0 , t1 ) .
(3.6.2)
t ∈ [t0 , t1 ) .
(3.6.3)
t0
Dann ist
t
F (t) ≤ a exp
G(s) ds
t0
t Beweis: • Ist a > 0, dann gilt f¨ ur die rechte Seite h(t) := a + t0 F (s)G(s) ds der Voraussetzung (3.6.2): h(t) > 0 und h (t) = F (t)G(t) ≤ h(t)G(t), also h (t) h(t) ≤ G(t). t t G(s) ds, oder h(t) ≤ a exp G(s) ds . Integration ergibt ln h(t) ≤ a t0 t0 Zusammen mit der Ungleichung F (t) ≤ h(t) zeigt dies die Behauptung (3.6.3). • F¨ ur a = 0 gelten Voraussetzung und Resultat f¨ ur alle a ˆ > 0. Also ist F = 0. 2 3.43 Bemerkung (Gronwall–Gleichung) Man kann sich die Absch¨atzung leicht merken, wenn man Gleichheit annimmt. Die Integralgleichung t F (t) = a + t0 F (s)G(s) ds F˙ = F G, F (t0 ) = a mit der L¨osung entspricht ja dem Anfangswertproblem t F (t) = a exp t0 G(s) ds . 3
3.6.1
Linearisierung der DGL entlang einer Trajektorie
Zur Vorbereitung des Beweises des Hauptsatzes lernen wir zun¨achst, welcher Differentialgleichung die Ableitung der L¨ osung nach dem Anfangswert gen¨ ugen sollte. Nehmen wir dazu schon einmal an, dass sowohl das Vektorfeld f in (3.6.1) als auch die L¨osung Φ stetig differenzierbar sind und setzen M (t, x) := D2 Φ(t, x) ∈ Mat(n, R). ˜ x) := D2 f (t, x) ∈ Mat(n, R) aus Dann folgt mit A(t,
t
Φ(t, x) = x + t0
f s, Φ(s, x) ds
(3.6.4)
52
3.6. Der Hauptsatz der Differentialgleichungstheorie
die Integralgleichung
t
A(s, x)M (s, x) ds
M (t, x) = 1l +
(3.6.5)
t0
mit A(s, x) := A˜ s, Φ(s, x) . A ist als Komposition stetiger Abbildungen stetig. Wir untersuchen Integralgleichungen vom Typ (3.6.5) zun¨achst f¨ ur beliebige stetige A. Sie sind ¨aquivalent zum linearen Anfangswertproblem D1 M (t, x) = A(t, x)M (t, x)
,
M (t0 , x) = 1l.
(3.6.6)
Die im folgenden Lemma konstatierte Stetigkeit der L¨osung von (3.6.6) in Zeit t und Parameter x folgt nicht aus schon bewiesenen Aussagen wie Satz 3.34. 3.44 Lemma Es sei D ⊆ Rt ×Rnx eine offene Umgebung von (t0 , x0 ), die (wie D aus Satz 3.39) die Zeitachsen Rt × {x} in t0 enthaltenden Intervallen schneidet. F¨ ur A ∈ C D, Mat(n, R) besitzt dann das Anfangswertproblem (3.6.6) eine eindeutige L¨osung M ∈ C D, Mat(n, R) . Beweis: • Nach Satz 3.23 besitzt f¨ ur den Anfangswert (t0 , 1l) das Anfangswertproblem (3.6.6) eine eindeutige L¨ osung. Denn x ist nur ein Parameter, und A ist stetig in t, das zeitabh¨angige Vektorfeld (t, M ) → A(t, x)M also lipschitz–stetig. • Um auch Stetigkeit von M in (t, x) zu zeigen, gen¨ ugt es, sich auf kompakte Umgebungen K ⊂ D von (t0 , x0 ) der Form K := Uδt (t0 ) × Uδx (x0 ) zu beschr¨anken. Es ist k := sup(t,x)∈K A(t, x) < ∞, also nach (3.6.5) t
M (t, x) ≤ 1 + k
M (s, x) ds t0
und mit dem Gronwall–Lemma (Satz 3.42) sup M (t, x) ≤ ekδt .
(3.6.7)
(t,x)∈K
• Aus (3.6.5) folgt die Identit¨at M (t, x) − M (t, x0 )
t
= t0 t
+
t0
A(s, x0 ) M (s, x) − M (s, x0 ) ds A(s, x) − A(s, x0 ) M (s, x) ds. (3.6.8)
3. Gew¨ohnliche Differentialgleichungen
53
Der zweite Term besitzt eine radiusabh¨angige obere Schranke a(δx ) > 0 mit limδx 0 a(δx ) = 0. Denn die stetige Funktion A ist auf dem Kompaktum K gleichm¨aßig stetig, und die Norm von M ist durch (3.6.7) beschr¨ankt. Damit ergibt sich f¨ ur Fx (t) := M (t, x) − M (t, x0 ) aus (3.6.8): t Fx (t) ≤ a(δx ) + k Fx (s) ds . t0
Die Gronwallsche Ungleichung macht daraus Fx (t) ≤ a(δx ) exp(k|t − t0 |) ≤ a(δx ) exp(kδt )
x ∈ Uδx (x0 ) ,
also limx→x0 M (t, x) = M (t, x0 ) gleichm¨aßig in t ∈ [t0 − δt , t0 + δt ].
2
Damit sind wir in der Lage, den Hauptsatz der Theorie der gew¨ohnlichen Differentialgleichungen zu beweisen.
3.6.2
Aussage und Beweis des Hauptsatzes
Das zeitabh¨angige Vektorfeld f auf dem erweiterten Phasenraum U ⊆ R × Rn sei in C r (U, Rn ). Wir fixieren eine Anfangszeit t0 ∈ R und ur An betrachten f¨ fangswert (t0 , x0 ) ∈ U das maximale L¨ osungsintervall T − (x0 ), T + (x0 ) des AWP (3.6.9) x˙ = f (t, x) , x(t0 ) = x0 . Wie im zeitunabh¨angigen Fall bekommen wir einen in U offenen maximalen Definitionsbereich D = (t, x) ∈ U | t ∈ T − (x), T + (x) des nichtautonomen Flusses Φ : D → Rn , mit Φ(t0 , x0 ) = x0
und
d Φ(t, x0 ) = f t, Φ(t, x0 ) . dt
(3.6.10)
Der nichtautonome Fluss ist so glatt wie das Vektorfeld: 3.45 Satz (Hauptsatz der Theorie gew¨ ohnlicher Differentialgleichungen) ur r ∈ N, dann ist Ist in (3.6.9) das zeitabh¨angige Vektorfeld f ∈ C r (U, Rn ) f¨ Φ ∈ C r (D, Rn ). Beweis: • Wir wissen von Satz 3.20, dass f¨ ur r = 1 gilt: Φ ∈ C 0 (D, Rn ). Auch die Zeitableitung der L¨ osung existiert, mit D1 Φ ∈ C 0 (D, Rn ), denn dies folgt aus der zweiten Formel in (3.6.10). Unser erstes Ziel ist zu zeigen, dass aus f ∈ C 1 (U, Rn ) auch Φ ∈ C 1 (D, Rn ) folgt. Da die Zeitableitung D1 Φ stetig ist, muss nur noch die Existenz und
54
3.6. Der Hauptsatz der Differentialgleichungstheorie
Stetigkeit der Ableitung D2 Φ : D → Mat(n, R) nachgewiesen werden. Falls D2 Φ existiert, muss diese Abbildung auch stetig sein, denn dann ist D2 Φ = M mit der L¨osung M der Integralgleichung t M (t, x) = 1l + A(s, x)M (s, x) ds, t0
siehe Lemma 3.44. Nach Definition der totalen Ableitung muss gezeigtwerden, dass f¨ ur Anfangs wert (t0 , x0 ) ∈ U und Zeiten t ∈ T − (x0 ), T + (x0 ) gilt: Φ(t, x0 + h) − Φ(t, x0 ) = M (t, x0 )h + o ( h ).
(3.6.11)
• Wir k¨onnen das zeitabh¨angige Vektorfeld bei (t, x) nach Taylor entwickeln und erhalten f (t, y) = f (t, x) + D2 f (t, x)(y − x) + R(t, x, y)
(3.6.12)
mit Restterm R(t, x, y) = o ( y − x ).
Es ergibt sich wegen A(s, x0 ) = D2 f s, Φ(s, x0 ) und (3.6.12) aus (3.6.4) und (3.6.5) die folgende Abweichung von der Linearit¨at: Φ(t, x0 + h) − Φ(t, x0 ) − M (t, x0 )h t f s, Φ(s, x0 + h) − f s, Φ(s, x0 ) − A(s, x0 )M (s, x0 )h ds = t0 t
=
& % D2 f s, Φ(s, x0 ) · Φ(s, x0 + h) − Φ(s, x0 ) − M (s, x0 )h ds
t0
t
+
R s, Φ(s, x0 ), Φ(s, x0 + h) ds.
(3.6.13)
t0
Die Stetigkeit von Φ verbessert sich durch eine Gronwall–Absch¨atzung zun¨achst zur Lipschitz–Stetigkeit s ∈ [t0 − δt , t0 + δt ] ,
Φ(s, x0 + h) − Φ(s, x0 ) = O( h ) gleichm¨aßig im Zeitintervall. Wegen der Resttermabsch¨atzung ist daher der zweite Term in (3.6.13) von der Ordnung o ( h ). Mit der Abk¨ urzung F (x) := Φ(t, x0 + h) − Φ(t, x0 ) − M (t, x0 )h
schreiben wir damit f¨ ur k := sups D2 f (s, Φ(s, x0 )) den Betrag von (3.6.13) in der Form t F (s) ds , F (t) ≤ o ( h ) + k t0
3. Gew¨ohnliche Differentialgleichungen
55
also nach Gronwall F (t) = o ( h )ek|t−t0 | = o ( h )
t ∈ [t0 − δt , t0 + δx ] .
Damit ist (3.6.11) bewiesen. • Um f¨ ur r ≥ 2 und f ∈ C r (U, Rn ) zu zeigen, dass auch der Fluss r–mal stetig differenzierbar ist, benutzen wir ein Induktionsargument. Dazu setzen wir f˜ : U × Rn → Rn × Rn , f˜(t, x, h) := f (t, x), D2 f (t, x)h . ˜ , Rn × Rn ) ein zeitabh¨angiges Vektorfeld auf dem erDamit ist f˜ ∈ C r−1 (U ˜ := U × Rn . Nach dem eben Bewiesenen ist f¨ weiterten Phasenraum U ur n ˜ := D × R D ˜ x0 , h0 ) := Φ(t, x0 ), D2 Φ(t, x0 )h0 ˜ :D ˜ → Rn × Rn , Φ(t, Φ eine stetige Abbildung, die das Anfangswertproblem d (x, h) = f˜(t, x, h) dt
, (x, h)(t0 ) = (x0 , h0 )
˜ stetig ist. Um Φ ˜ ∈ l¨ost. Wir wissen auch schon, dass die Zeitableitung D1 Φ 1 ˜ n n ˜ C (D, R ×R ) zu zeigen, m¨ ussen wir nur die Existenz und Stetigkeit von D2 Φ zeigen. Dies geht wie der obige Beweis der Existenz und Stetigkeit von D2 Φ. Der Induktionsschritt l¨asst sich r–mal anwenden, und wir erhalten Dr Φ ∈ C 0 , also Φ ∈ C r (D, Rn ). 2
3.6.3
Folgerungen aus dem Hauptsatz
In der N¨ahe einer Gleichgewichtslage k¨ onnen wir ein autonomes Differentialgleichungssystem zwar linearisieren, aber der Zusammenhang zwischen den L¨osungen der beiden Differentialgleichungen ist nicht immer sehr eng (siehe Kapitel 7). Anders ist die Situation in der N¨ahe einer Nichtgleichgewichtslage: 3.46 Satz (Satz u ¨ber die Begradigung) Es sei U ⊆ Rn offen und f¨ ur ein r ∈ N das Vektorfeld f ∈ C r (U, Rn ). Ist dann x0 ∈ U keine Gleichgewichtslage, dann existiert ein C r –Diffeomorphismus G:V →W von einer Umgebung V von x0 auf W ⊆ R mit DGx f (x) = e1 = n
f¨ ur alle x ∈ V .
1 0
.. .
∈ Rn
0
3.47 Bemerkung In geeigneten Koordinaten auf V ist also das Vektorfeld f konstant und damit die L¨ osung eine affine Funktion der Zeit. 3
56
3.6. Der Hauptsatz der Differentialgleichungstheorie
ur kleine ε > 0 Beweis: Da f (x0 ) = 0 ist, ist f¨ Fε := {x ∈ Uε (x0 ) | x − x0 , f (x0 ) = 0} eine Kreisscheibe der Dimension n − 1, und f (x), f (x0 ) > 0
x ∈ Uε (x0 ) .
(3.6.14)
Durch eine euklidische Transformation T des R , also eine Komposition einer Translation onnen wir erreichen, dass T (x0 ) = 0 und und einer Drehung, k¨ T f (x0 ) = λe1 mit λ > 0 gilt, also T (Fε ) = y ∈ Rn | y1 = 0, y < ε . n
Zur Vereinfachung der Notation nehmen wir an, dass f und x0 selbst schon die Eigenschaften x0 = 0 und f (x0 ) = λe1 mit λ > 0 haben. Wir betrachten den ur kleine δ > 0 ist ΦZδ : Zδ → Uε (x0 ) injektiv, Zylinder Zδ := (−δ, δ) × Fδ . F¨ denn solange Φt (x) ∈ Uε ist, gilt wegen (3.6.14) d Φ(t, x) = f1 Φ(t, x) > 0, dt 1 wir k¨onnen also mit der Trajektorie nicht zum zweiten Mal Fδ schneiden. Nach dem Hauptsatz ist ΦZδ ein C r –Diffeomorphismus auf sein Bild V := Φ(Zδ ), und auch die Umkehrabbildung G ist ein C r –Diffeomorphismus. 2 Oft h¨angen Differentialgleichungen von Parametern p ∈ P ab, wie etwa Masse und L¨ange eines Pendels. Wir betrachten also das parametrisierte Anfangswertproblem (3.6.15) x˙ = f (t, x, p) , x(t0 ) = x0 mit U ⊆ R × Rn und P ⊆ Rd offen und f ∈ C r (U × P, Rn ). 3.48 Satz Es sei D ⊆ U × P der maximale Definitionsbereich des parametrisierten Anfangswertproblems (3.6.15). Dann ist die L¨osung Φ ∈ C r (D, Rn ). ¨ Beweis: Dies folgt direkt durch Ubergang zum Anfangswertproblem (x, ˙ p) ˙ = f˜(t, x, p) , (x, p)(t0 ) = (x0 , p0 ) mit dem zeitabh¨angigen Vektorfeld ˜ , Rn × Rd , f˜(t, x, p) := f (t, x, p), 0 f˜ ∈ C r U ˜ := U × P , denn dieses l¨asst den Parameterwert invariant und besitzt eine auf U ˜ ∈ C r (D, Rn+d ). 2 L¨osung Φ Die wichtigste Folgerung aus dem Hauptsatz ist aber: In der N¨ahe eine Nichtgleichgewichtslage besitzen glatte Differentialgleichungen keine lokale Struktur. Alle interessanten Fragen sind globaler Natur, also Fragen an das Verhalten der L¨osung f¨ ur große Zeiten. 3.49 Weiterf¨ uhrende Literatur Standardtexte sind die B¨ ucher von Amann [Am], Arnol’d [Ar1], Heuser [Heu], Perko [Per] und Walter [Wa1].
Kapitel 4
Lineare Dynamik
4.1 Homogene lineare autonome DGLn . . . . . . . . . . . . . 58 ¨ 4.2 Explizit zeitabhangige lineare DGLn . . . . . . . . . . . . . 65 4.3 Quasipolynome . . . . . . . . . . . . . . . . . . . . . . . . 70
Eine besonders wichtige Klasse von Differentialgleichungen sind die linearen, und wir k¨onnen mit Satz 3.29 annehmen, dass das System von erster Ordnung ist. Das inhomogene Anfangswertproblem lautet dann x(t) ˙ = A(t) x(t) + b(t) ,
x(t0 ) = x0 ,
(4.0.1)
mit Systemmatrix A : I → Mat(n, R) und St¨orfunktion b : I → Rn , t0 im Intervall I und x0 ∈ Rn . Die L¨ osungsstrategie besteht darin, zun¨achst das homogene AWP (4.0.2) y˙ = A(t)y , y(t0 ) = x0 A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 4,
57
58
4.1. Homogene lineare autonome DGLn
zu l¨osen, und danach (4.0.1) mittels des so genannten Duhamel–Prinzips, d.h. durch eine Integration. Formal ist f¨ ur den Fall einer konstanten Systemmatrix A y(t) := exp (t − t0 )A x0 (t ∈ R) (4.0.3) die L¨osung von (4.0.2), denn Anwendung der Differentiationsregel exp = exp auf y ergibt Ay, und y(t0 ) = x0 .
4.1
Homogene lineare autonome DGLn
Exponentiation von Matrizen Zur Definition und Rechtfertigung von (4.0.3) untersuchen wir jetzt matrixwertige Funktionen, und zwar f¨ ur Vektorr¨aume u ¨ber den K¨orpern K = R und K = C. Die Exponentialfunktion ist wie in Dimension n = 1 durch ihre Potenzreihe erkl¨art: 4.1 Definition • F¨ ur einen Endomorphismus M ∈ Lin(V ) eines endlich-dimensionalen K–Vektorraums V ist exp(M ) ∈ Lin(V ) definiert durch exp(M ) :=
∞ M (k) k=0
(4.1.1)
k!
(mit M (0) = IdV und M (k+1) = M ◦ M (k) ). • Analog wird das Matrixexponential von Matrizen in Mat(n, K) gebildet. Warum aber l¨ost das Matrixexponential f¨ ur konstante Systemmatrix das homogene Anfangswertproblem (4.0.2)? Diese Frage ist nicht rein akademisch, denn t ist die Matrix A zeitabh¨angig, dann l¨ ost die Abbildung t → exp t0 A(s) ds x0 (4.0.2) nicht, außer f¨ ur Spezialf¨alle wie Dimension n = 1. Wir haben mit (4.1.1) eine Reihe vor uns, deren Summanden Elemente von Lin(V ), dem Raum der (beschr¨ankten) linearen Abbildungen von V in V sind. Sei etwa V = Kn , mit euklidischer Norm · . Die Operatornorm auf Lin(Kn )
M :=
sup v∈Kn \{0}
M (v) v
=
sup
M (v)
v∈Kn , v=1
ist dann zus¨atzlich zu den Eigenschaften M ≥ 0, M = 0 ⇐⇒ M = 0,
λM = |λ| M
(λ ∈ K)
und M + N ≤ M + N
jeder Norm noch submultiplikativ : 4.2 Lemma F¨ ur M, N ∈ Lin(Kn ) gilt: M N ≤ M N .
4. Lineare Dynamik
59
Beweis: Durch Erweitern ergibt sich f¨ ur M N = supv=0
M N = sup v: N v=0
M N v N v
·
N v v
≤ supw=0
M w w
· supv=0
M N v v : N v v
= M N , 2
außer f¨ ur N = 0, wo sowieso beide Seiten Null sind. Die obige Definition von exp(M ) ist sinnvoll, weil konvergent:
4.3 Lemma (Matrixexponential) F¨ ur M ∈ Lin(Kn ) bilden die Partialsummen
k M () sk := =0 ! (k ∈ N) von exp(M ) eine Cauchy–Folge. Beweis: F¨ ur k1 ≥ k0 ≥ M gilt nach der Dreiecksungleichung und Lemma 4.2
sk1 − sk0
=
k k1 1 M () ≤ ! =k0 +1
≤
M k0 +1 (k0 +1)!
M () !
≤
k1 =k0 +1
=k0 +1
k1 −k0 −1 m=0
M m (k0 +1)m
≤
M k0 +1 (k0 +1)!
1−
M ! M k0 +1
−1
.
Dieser Ausdruck geht f¨ ur k0 → ∞ gegen Null, denn die Fakult¨at w¨achst schneller als die (reelle) Exponentialfunktion. 2 Nebenbei stellen wir fest, dass wir an keiner Stelle vorausgesetzt haben, dass der lineare Endomorphismus beziehungsweise die Matrix reell ist. Dies ist g¨ unstig, denn die Jordan–Normalform von A in (4.0.2), und damit von exp(At), kann auch komplex sein. Um nun zu sehen, dass (4.0.3) das Anfangswertproblem (4.0.2) tats¨achlich l¨ost, m¨ ussen wir in der Lage sein, die Abbildung R −→ Lin(Kn )
, t −→ exp(At)
nach dem Zeitparameter zu differenzieren. Sp¨ater werden wir uns auch fragen, wie die L¨osungen von eventuellen Parametern der linearen DGL abh¨angen. F¨ ur diese Art von Fragestellungen wertet man die Exponentialfunktion f¨ ur mehr als ein Argument aus, man betrachtet also die Abbildung exp : Lin(Kn ) → Lin(Kn )
, M → exp(M )
in ihrer Abh¨angigkeit vom Argument M . Hier hilft das Weierstraß–Kriterium: 4.4 Satz (Weierstraß) Es sei (V, · ) ein Banach–Raum, X ⊆ V und fl : X → V
(l ∈ N0 )
seien Funktionen
∞ mit supx∈X fl (x) ≤ al mit die Reihe l=0 fl auf X gleichm¨aßig.
∞ l=0
al < ∞. Dann konvergiert
60
4.1. Homogene lineare autonome DGLn
Beweis: Das Beweisargument f¨ ur reelle Funktionenreihen l¨asst sich verallgemeinern: Wegen der Vollst¨andigkeit des metrischen Raumes V haben wir punktweise
l Konvergenz der Partialsummen sl := m=0 fm , das heißt: s(x) := lim sl (x) l→∞
(x ∈ X).
n F¨ ur alle ε > 0 gibt es nach Annahme
n ein m ∈ N mit l=m+1 al < ε (n > m). Daher folgt sn (x) − sm (x) ≤ l=m+1 al < ε (x ∈ X), also gleichm¨aßige Konvergenz auf X. 2 4.5 Satz (Exponentialabbildung) F¨ ur A ∈ Lin(Kn ) ist die Abbildung , t → exp(At)
R → Lin(Kn ) stetig differenzierbar, und es gilt d dt
exp(At) = A exp(At).
(4.1.2) (l)
Beweis: • Setzen wir V := Lin(Kn ) und fl : X → V, M → Ml! in Satz 4.4 ein, so gilt f¨ ur alle l ∈ N: supM ∈V fl (M ) = ∞. Wir k¨onnen also im Satz von Weierstraß als Definitionsbereich X nicht den gesamten Vektorraum V w¨ahlen. • F¨ ur die Vollkugel X := {M ∈ V | M ≤ r} mit Radius r > 0 ist aber al := sup fl (M ) =
∞
M ∈X
1 rl sup M (l) ≤ , l! M ∈X l!
ur jede Wahl von r. und die Reihe l=0 al ≤ exp(r) konvergiert f¨ • Deshalb ist die Exponentialabbildung als Limes gleichm¨aßig konvergenter stetiger Funktionen sl X : X → V auch stetig, und, da die Ableitungen Dsl auf X ebenfalls gleichm¨aßig konvergent sind, auch differenzierbar. Damit ist die Formel (4.1.2) richtig, und aus ihr ergibt sich auch die Stetigkeit der Ableitung. 2 Verwendung der Jordan–Normalform Die konkrete Berechnung von exp(At) kann mittels der Jordan–Normalform von A erfolgen. ⎞ ⎛λ 1 0 .. .. ⎠ . .1 ∈ 4.6 Definition • F¨ ur λ ∈ K und r ∈ N heißt Jr (λ) := ⎝ .. . 0 λ Mat(r, K) r × r–Jordan–Block mit Eigenwert λ. • Eine Jordan–Matrix ist eine quadratische Matrix der Form ⎛ J (λ ) ⎞ 0 r1
1
⎜ J =⎝
⎟ ⎠ ≡ Jr1 (λ1 ) ⊕ . . . ⊕ Jrk (λk ).
Jr2 (λ2 )
.. 0
. Jrk (λk )
(4.1.3)
4. Lineare Dynamik
61
• Eine Jordan–Basis eines Operators A ∈ Lin(V ) auf dem K–Vektorraum V ist eine Basis von V , in der die darstellende Matrix von A eine Jordan–Matrix ist. Aus der Linearen Algebra ist der (konstruktive) Beweis des folgenden Satzes bekannt: 4.7 Satz Sei V ein endlich–dimensionaler C–Vektorraum und A ∈ Lin(V ). Dann existiert eine Jordan–Basis f¨ ur A. Da der Vektorraum V isomorph zu Cn mit n := dim(V ) ist, k¨onnen wir A in der Form A = W JW −1
, mit Jordan–Matrix J ∈ Mat(n, C) und W ∈ GL(n, C)
schreiben, wenn wir die darstellende Matrix ebenfalls mit A bezeichnen. Wegen Mat(n, R) ⊂ Mat(n, C) k¨ onnen wir insbesondere reelle quadratische Matrizen A Jordan-diagonalisieren, aber J ist im Allgemeinen nicht mehr reell (wir komplexifizieren A also im Sinne der Linearen Algebra). 0 −1 4.8 Beispiel (Jordan–Basis) A = besitzt die komplexen 1 0 1 1 1 i Eigenwerte 1 1 −1 √ √ ±i. Die Matrix W := 2 −i i ∈ GL(2, C), mit W = 2 1 −i , diagonalisiert A: 0 W −1 AW = 0i −i 3 = J1 (i) ⊕ J1 (−i). Wie in diesem Beispiel existiert allgemein zu jedem nicht reellen Eigenwert λ von A ∈ Mat (n, R) und Jordan–Block Jr (λ) ein Eigenwert λ gleicher Multiplizit¨at 1 und ein Jordan–Block Jr (λ), denn das charakteristische Polynom von A l¨asst sich in R in Faktoren h¨ ochstens zweiten Grades zerlegen (siehe Abbildung 4.1.1).
Imλ
(2)
(3)
(4)
Reλ (1) (3)
(2)
Abbildung 4.1.1: Komplexe Eigenwerte (mit Multiplizit¨aten) einer reellen Matrix 1 Die algebraische Vielfachheit oder Multiplizit¨ at von λ ∈ C ist die Ordnung der Nullstelle λ des charakteristischen Polynoms x → det(A − x1l), die geometrische der Defekt von A − λ1l.
62
4.1. Homogene lineare autonome DGLn exp(At) = W exp(Jt)W −1
Es gilt
(t ∈ R).
Das folgt aus der Potenzreihe des Matrixexponentials unter Benutzung von Am = (W JW −1 )m = W J m W −1 . Da f¨ ur die Jordan–Matrix J aus (4.1.3) exp(Jt) gleich ⎛ ⎞ exp Jr1 (λ1 )t 0 ⎜ ⎟ .. ⎝ ⎠ ≡ exp Jr1 (λ1 )t ⊕ . . . ⊕ exp Jrk (λk )t . 0
exp Jrk (λk )t
(4.1.4) = J (0) + λ1 l. Jr (0) ist, gen¨ ugt es, exp Jr (λ)t zu berechnen. Nun gilt Jr (λ) r und λ1l kommutieren aber, was die Berechnung von exp Jr (λ)t erleichtert: 4.9 Lemma F¨ ur kommutierende (BC = CB) Matrizen B, C ∈ Mat (n, C) gilt exp(B + C) = exp(B) exp(C). Beweis: Formal ergibt sich die Identit¨at durch Einsetzen in die Definition von exp: ∞ ∞ n 1 1 n BC=CB B i C n−i (B + C)n = exp(B + C) = i n! n! n=0 n=0 i=0 ⎞ ⎛ ∞ ∞ ∞ n 1 1 1 = B i C n−i = Bi ⎝ Cj⎠ , i!(n − i)! i! j! n=0 i=0 i=0 j=0 also exp(B) exp(C). Diese formale Rechnung ist nach einem Satz u ¨ber das Cauchy–Produkt von Reihen erlaubt, denn diese sind absolut konvergent. 2 4.10 Bemerkungen 1. Als Gegenbeispiel gilt f¨ ur die Dreiecksmatrizen B := ( 00 10 ) und C := B = ( 01 00 ): exp(Bt) = ( 10 1t ) und exp(Ct) = ( 1t 01 ), also 2 t t und exp(Ct) exp(Bt) = 1t 1+t . exp(Bt) exp(Ct) = 1+t 2 t 1 10 ( 0 1 ) , n gerade n Dagegen folgt aus (B + C)n = ( 01 10 ) = ( 01 10 ) , n ungerade
∞
∞ t2m t2m+1 t sinh t exp (B+C)t = ( 10 01 ) m=0 (2m)! + ( 01 10 ) m=0 (2m+1)! = cosh sinh t cosh t . (4.1.5) 2. F¨ ur alle A ∈ Mat (n, K) gilt die Funktionalgleichung exp(At1 ) exp(At2 ) = exp A (t1 + t2 )
(t1 , t2 ∈ R),
da Vielfache einer Matrix miteinander kommutieren. Der f¨ ur A ∈ Mat (n, R) die Differentialgleichung x˙ = Ax l¨osende lineare Fluss Φt : Rn → Rn
, Φt (x) = exp(At)x
bildet also eine einparametrige Gruppe.
(t ∈ R) 3
4. Lineare Dynamik
63
F¨ ur die Jordan–Bl¨ ocke in (4.1.4) gilt exp Jr (λ)t = exp Jr (0)t exp λt1l . ∞ 1 n n exp(λt1l) ist gleich exp(λt)1l und exp Jr (0)t = n=0 n! Jr (0) t mit n i, k ∈ {1, . . . , r} , Jr (0) i,k = δi,k−n also
⎛
1 t
··· ···
⎜ ⎜0 1 t ⎜ exp Jr (λ)t = exp(λt) ⎜ .. . . . . . . ⎜. . . . ⎝. .. .. .. . . 0 ··· ···
tr−1 (r−1)!
.. . .. .
⎞ ⎟ ⎟ ⎟ ⎟. ⎟ ⎠
(4.1.6)
t 1
0
4.11 Aufgabe (Matrixexponential) 1 0 0 L¨osen Sie das Differentialgleichungssystem x˙ = Ax mit A = 1 1 0 . 111
3
Verwendung der reellen Jordan–Normalform F¨ ur A ∈ Mat (n, R) ist es oft sinnvoll, die reelle Jordan–Normalform von exp(At) zu benutzen. Dabei setzt man f¨ ur reelle Eigenwerte einfach JrR (λ) := Jr (λ)
(λ ∈ R).
F¨ ur λ ∈ C\R transformiert man Paare von Jordan–Bl¨ocken der Gestalt Jr (λ) 0 , 0 J (λ) r
unter Benutzung von X := JrR (λ) := X
√1 2
Jr (λ) 0 0 Jr (λ)
1lr 1lr −i1lr i1lr
X −1 =
in die reelle Normalform
Jr (μ) −ϕ1lr ϕ1lr Jr (μ)
(λ ∈ C\R)
mit μ := Re(λ) und ϕ := Im(λ). Es ist exp JrR (λ)t gleich J (0)t Jr (λ) 0 − sin(ϕt)eJr (0)t −1 μt cos(ϕt)e r Xexp t X , = e Jr (0)t Jr (0)t 0 J (λ)
(4.1.7)
also im Spezialfall r = 1 einfacher Multiplizit¨at − sin(ϕt) . exp J1R (λ)t = eμt cos(ϕt) sin(ϕt) cos(ϕt)
(4.1.8)
sin(ϕt)e
r
cos(ϕt)e
Bedeutung der Spur Unter einem Diffeomorphismus g : Rn → Rn besitzt das Bild g(Λ) einer kompakten Teilmenge Λ ⊂ Rn das Volumen det Dg(x) dx, Vn g(Λ) = Λ
64
4.1. Homogene lineare autonome DGLn
der Betrag der Funktionaldeterminante bei x ∈ Λ ist also der Faktor, um den bei x das Volumen durch g vergr¨ oßert wird (Transformationssatz). Betrachten wir nun f¨ ur die Zeit t ∈ R den L¨ osungsoperator der Differentialgleichung x˙ = Ax, also die lineare Abbildung Φt ∈ Lin(Rn )
, Φt (x) = exp(At)x.
Wie bei jeder linearen Abbildung ist die Ableitung konstant: DΦt (x) = exp(At)
(x ∈ Rn ),
(4.1.9)
und es gilt 4.12 Satz F¨ ur A ∈ Lin(Cn ) gilt
det exp(A) = exp tr(A) .
Beweis: Dies folgt aus der Existenz einer Jordan–Basis, also von W ∈ GL(n, C) mit W −1 AW = J und Jordan–Matrix J. Es ist in der Notation (4.1.3) f¨ ur J −1 det exp(A) = det W exp(A)W = det exp(W −1 AW ) = det exp(J) !k !k = =1 det exp(Jr (λ )) = =1 exp(r λ )
und andererseits tr(A) = tr(W −1 AW ) = tr(J) = tr Jr (λ ) = r λ , sodass sich die Aussage aus der Funktionalgleichung der komplexen Exponentialfunktion ergibt. 2 Folgerung: Der von A ∈ Mat(n, R) erzeugte lineare Fluss Φt (x) = exp(At)x auf dem Phasenraum Rn ist genau dann volumenerhaltend, wenn tr(A) = 0. 4.13 Bemerkung (reelle Allgemeine Lineare Gruppe) GL(n, R), die Gruppe der invertierbaren Matrizen in Mat(n, R), ist das wichtigste Beispiel einer Lie–Gruppe. GL(n, R) ist die offene Teilmenge derjenigen Matrizen ur die det(A) = 0 gilt. Damit A im n2 –dimensionalen Vektorraum Mat(n, R), f¨ wird GL(n, R) zu einer Untermannigfaltigkeit von Mat(n, R), siehe Definition 2.34. Matrizenmultiplikation und Inversion sind in den Matrizeneintr¨agen glatt (letzteres folgt aus der Cramerschen Regel der Linearen Algebra). Betrachten wir die Abbildung Mat(n, R) → GL(n, R) , u → exp(u), dann liegt das Bild der Exponentialfunktion tats¨achlich in GL(n, R), denn det exp(u) = exp tr(u) > 0. Da g ∈ GL(n, R) mit det(g) < 0 existieren, ist klar, dass exp nicht surjektiv ist (sondern das Bild die Untergruppe GL+ (n, R) ist, siehe Beispiel E.18). Andererseits ist die Exponentialabbildung mindestens f¨ ur A ∈ GL(n, R) mit
1l − A < 1 invertierbar, denn die Potenzreihe der Umkehrfunktion konvergiert dann: ∞ (1l − A)k ln(A) = ln 1l − (1l − A) = − . k k=1
4. Lineare Dynamik
65
Mat(n, R) mit dem Kommutator bildet eine sogenannte Lie–Algebra 2 . Der Kommutator [u1 , u2 ] = u1 u2 − u2 u1 von u1 , u2 ∈ Mat(n, R) misst den Mangel an Kommutativit¨at in der Gruppenmultiplikation, denn exp(εu1 ) exp(εu2 ) exp(−εu1 ) exp(−εu2 ) = 1l + ε2 [u1 , u2 ] + O(ε3 ). Man nennt daher Mat(n, R) die Lie–Algebra von GL(n, R).
4.2
3
Explizit zeitabh¨ angige lineare DGLn
Das homogene Problem Wir betrachten zun¨achst auf dem t0 enthaltenden Zeitintervall I das homogene, lineare, aber nichtautonome (das heißt explizit zeitabh¨angige) Anfangswertproblem y(t) ˙ = A(t)y(t) , y(t0 ) = y0 , (4.2.1) wobei A : I → Mat(n, R) eine stetige matrixwertige Funktion ist. 4.14 Satz Das Anfangswertproblem (4.2.1) hat eine eindeutige L¨osung t (4.2.2) y : I → R mit y(t) ≤ exp t0 A(s) ds y0 . Beweis: • Es gen¨ ugt, t ≥ t0 zu betrachten, denn (4.2.2) ist invariant unter Zeitumkehr. • Die eindeutige L¨ osbarkeit des Anfangswertproblems f¨ ur das zeitabh¨angige Vektorfeld (t, x) → A(t)x auf dem Intervall I folgt mit der zeitabh¨angigen Lipschitz–Konstante L(t) := A(t) aus Satz 3.23. t • z(t) := exp − t0 A(s) ds y(t) erf¨ ullt f¨ ur t ∈ I das Anfangswertproblem z(t) ˙ = N (t)z(t)
,
z(0) = y0
mit
N (t) := A(t) − A(t) 1l,
wie man durch Differentiation nachpr¨ uft. Die Absch¨atzung (4.2.2) folgt, wenn wir (t ≥ t0 , t ∈ I) (4.2.3)
z(t) ≤ y0
bewiesen haben. Nun ist mit S(t) := N (t) + N (t) f¨ ur t ≥ t 0 d 2 dt z(t)
= z(t), ˙ z(t) + z(t), z(t) ˙ = N (t)z(t), z(t) + z(t), N (t)z(t) = z(t), S(t)z(t) ≤ 0,
(4.2.4)
denn S(t) ist selbstadjungiert und besitzt nur Eigenwerte E ≤ 0. 2 Definition: Eine Lie–Algebra ist ein Vektorraum E mit einer bilinearen alternierenden Abbildung [·, ·] : E × E → E, die die Jacobi–Identit¨ at [A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0 erf¨ ullt (siehe auch Anhang E.3).
66
4.2. Explizit zeitabh¨angige lineare DGLn
Letzteres sieht man so: W¨are S(t)v = Ev mit v ∈ Rn \ {0} und E > 0, dann w¨ urde auch (A(t) + A(t) )v = (E + 2 A(t) )v gelten, also
A(t) + A(t) > 2 A(t) = A(t) + A(t) , im Widerspruch zur Dreiecksungleichung der Operatornorm. Aus (4.2.4) folgt aber (4.2.3). 2 Sind ϕ1 , ϕ2 : I → Rn L¨ osungen der DGL y(t) ˙ = A(t)y(t) und c1 , c2 ∈ R, dann ist auch c1 ϕ1 + c2 ϕ2 : I → Rn L¨ osung der Differentialgleichung. Die Menge ˙ = A(t)ϕ(t), t ∈ I (4.2.5) L0 := ϕ ∈ C 1 (I, Rn ) | ϕ(t) der L¨osungen bildet also einen R–Untervektorraum von C 1 (I, Rn ), den (homogenen) L¨osungsraum. Ist t0 ∈ I, so ist wegen der lokalen Existenz und Eindeutigkeit der L¨osung des Anfangswertproblems die lineare Abbildung Bt0 : L0 → Rn
,
ϕ → ϕ(t0 )
ein Isomorphismus, es ist also dim(L0 ) = n. 4.15 Definition Eine Basis des homogenen L¨osungsraumes L0 heißt Fundamentalsystem von L¨osungen der Differentialgleichung. Da die L¨osung des homogenen Differentialgleichungssystems (4.2.1) linear von osung in der Form y0 abh¨angt, erhalten wir die allgemeine L¨ yh (t) = Φ(t, s)yh (s) mit dem L¨osungsoperator Φ : I ×I → Mat(n, R). Im Fall einer zeitunabh¨angigen Matrix A ist Φ(t, s) = exp (t − s) A (t, s ∈ R). Allgemein gilt d dt Φ(t, s)
= A(t)Φ(t, s) und Φ(s, s) = 1l .
(4.2.6)
4.16 Bemerkungen 1. Auch wenn diese Familie von Matrizen von zwei Parametern, der Anfangszeit s und der Endzeit t abh¨angt, gen¨ ugt es, f¨ ur ein einziges t0 ∈ I die einparametrige Familie t → Φ(t, t0 )
(t ∈ I)
zu kennen, denn es gilt Φ(t, s) = Φ(t, t0 ) Φ(t0 , s) = Φ(t, t0 ) Φ(s, t0 )−1 . 2. Trotzdem ist die L¨ osung dieses homogenen nicht autonomen Problems oft eine Matrix, deren Eintr¨age keine elementaren Funktionen sind, auch wenn die Eintr¨age von A elementare Funktionen sind. Tats¨achlich werden viele sogenannte h¨ohere Funktionen als L¨osungen solcher DGLn definiert, etwa die Bessel–Gleichung und die Mathieu–Gleichung. 3
4. Lineare Dynamik
67
Die Wronski–Determinante 4.17 Definition F¨ ur ein Intervall I und Kurven v1 , . . . , vn ∈ C(I, Rn ) ist die Wronski–Determinante die stetige Funktion w : I → R , t → det v1 (t), . . . , vn (t) . Wir sind hier an der Wronski–Determinante w von L¨osungen v1 , . . . , vn der DGL (4.2.1) interessiert. Da diese L¨ osungen sogar stetig differenzierbar von der Zeit ullt selbst eine Differentialgleichung. abh¨angen, ist w ∈ C 1 (I, R), und erf¨ 4.18 Satz F¨ ur die Wronski–Determinante w gilt d w(t) = tr A(t) w(t) dt
also
t
w(t) = exp
(t ∈ I),
tr A(s) ds w(t0 ).
(4.2.7)
(4.2.8)
t0
Beweis: Da die L¨ osungen vi ∈ C 1 (I, Rn ) der Differentialgleichung die Ableitung v˙ i (t) = A(t)vi (t)
(i = 1, . . . , n)
besitzen, gilt nach der Produktregel d w(t) dt
=
n i=1
=
n
det v1 (t), . . . , vi−1 (t), v˙ i (t), vi+1 (t), . . . , vn (t) det v1 (t), . . . , vi−1 (t), Avi (t), vi+1 (t), . . . , vn (t) .
i=1
F¨ ur die kanonische Basis e1 , . . . , en des Rn gilt tr(A) =
n
(A)i,i =
i=1
n
det e1 , . . . , ei−1 , Aei , ei+1 , . . . , en ,
i=1
was sich nach der Determinantenproduktregel auf beliebige Vektoren v˜1 , . . . , v˜n ∈ Rn u ¨bertr¨agt: tr(A) det(˜ v1 , . . . , v˜n ) =
n
det (˜ v1 , . . . , v˜n )(e1 , . . . , ei−1 , Aei , ei+1 , . . . , en )
i=1
=
n n
det v˜1 , . . . , v˜i−1 , (A)k,i v˜k , v˜i+1 , . . . , v˜n
i=1 k=1
=
n
det v˜1 , . . . , v˜i−1 , A˜ vi , v˜i+1 , . . . , v˜n .
i=1
Die L¨osung (4.2.8) der DGL (4.2.7) erfolgt durch Separation der Variablen.
2
68
4.2. Explizit zeitabh¨angige lineare DGLn
4.19 Bemerkungen 1. Die Wronski–Determinante eines Fundamentalsystems l¨asst sich also durch Integration berechnen, auch wenn man nur die Anfangswerte v1 (t0 ),. . . , vn (t0 ) kennt. Weil w(t0 ) = det v1 (t0 ), . . . , vn (t0 ) = 0 ist, folgt aus der Gestalt (4.2.8) der L¨ osung auch w(t) = 0 f¨ ur alle t ∈ I. 2. Der Quotient w(t)/w(t0 ) der Wronski–Determinante eines Fundamentalsystems gibt den Faktor an, um den sich das Volumen von Φ(t, t0 )(K) zum Zeitpunkt t gegen¨ uber dem des Kompaktums K ⊂ Rn ver¨andert hat. 3. F¨ ur eine lineare Differentialgleichung n–ter Ordnung der Form y (n) (t) +
n−1
ai (t)y (i) (t) = 0
i=0
mit stetigen Koeffizienten a0 , . . . , an−1 ist die zugeordnete Differentialgleichung erster Ordnung nach Satz 3.29 von der Form ⎛ 0 1 ⎞ x1 x˙ 1 .. .. ⎠. . = A ... mit xi = y (i−1) und A = ⎝ . 1 x˙ n
xn
−a0 −a1 ... −an−1
Hier ist also die Wronski–Determinante von L¨osungen y1 , . . . , yn : I → R gleich ⎛ ⎞ y1 (t)
w(t) = det ⎝
...
yn (t)
.. .
(n−1) y1 (t)
⎠
.. . ...
, und
d dt w(t)
= −an−1 (t)w(t).
3
(n−1) yn (t)
Das inhomogene Problem Das inhomogene Anfangswertproblem mit stetiger St¨orfunktion b : I → Rn z(t) ˙ = A(t)z(t) + b(t)
, z(t0 ) = z0
(4.2.9)
l¨asst sich bei Kenntnis des homogenen L¨ osungsoperators aus (4.2.6) leicht l¨osen:
4.20 Satz (,Duhamel–Prinzip’) Die L¨osung des Anfangswertproblems (4.2.9) ist t (t ∈ I). (4.2.10) z(t) = Φ(t, t0 )z0 + t0 Φ(t, s)b(s) ds Beweis: • Wegen Φ(s, s) = 1l ist in (4.2.10) z(t0 ) = z0 . d Φ(t, s) = A(t)Φ(t, s) • Zus¨atzlich gilt wegen dt
t
z(t) ˙ = A(t)Φ(t, t0 )z0 + A(t)
Φ(t, s)b(s) ds + Φ(t, t)b(t) = A(t)z(t) + b(t). t0
Damit ist (4.2.10) die L¨ osung von (4.2.9).
2
4. Lineare Dynamik
69
Die Menge der L¨osungen der inhomogenen linearen Differentialgleichung Lb := {ϕ ∈ C 1 (I, Rn ) | ϕ(t) ˙ = A(t)ϕ(t) + b(t), t ∈ I} ist also von der Form Lb = L0 + ϕb , mit dem in (4.2.5) definierten homogenen L¨ osungsraum L0 und der partikul¨aren L¨osung t ϕb ∈ C 1 (I, Rn ) , ϕb (t) = Φ(t, s)b(s) ds t0
Der inhomogene L¨osungsraum Lb ist damit ein affiner Unterraum von C 1 (I, Rn ).
1 x(t)+x(t) ˙ = cos(t) 4.21 Beispiel (Inhomogenes Problem) Die DGL x ¨(t)+ 10 eines ged¨ampften harmonischen Oszillators mit ¨außerer Anregung ist zum System
z(t) ˙ = A(t)z(t) + b(t)
x(t) mit z(t) := x(t) und A(t) = ˙ die komplexen Eigenwerte
λ1/2 =
1 − 20
±
0 1 −1 −1/10
1 2 20
und Eigenvektoren
W1/2 =
, b(t) =
−1=
0 cos(t)
1 20 (−1
±
√
¨aquivalent. A besitzt
399 i),
√ 399i) ,
1 20 (+1∓
1
sodass mit der diagonalisierenden Matrix W := (W1 ; W2 ) = und W −1 AW = exp(At) = W
λ1
0 0 λ2
1−
√ 399i 20
√ 1+ 399 i 20
1
e λ1 t 0 0 e λ2 t
1
, also W −1 =
gilt. Damit ist mit ω :=
W
−1
=e
−t/20
−10i √ 399 √10i 399
1 √i 2 − 2 399 1 √i 2 + 2 399
√ 399 20
cos(ωt)+
sin(ωt) √ 399
1 sin(ωt) −ω
1 ω
sin(ωt)
√ 399 t sin 20 √ cos(ωt)− 399
.
Aus (4.2.10) ergibt sich
t z(t) = exp(At)z0 + exp A(t − s) b(s) ds = 0 sin(ωt) 1 −t/20 1 √ sin(t)− ω e sin(ωt) ω sin(ωt) −t/20 cos(ωt)+ 399 e z . + 10 sin(ωt) 0 sin(ωt) 1 cos(t)+e−t/20 − cos(ωt)+ √ √ − ω sin(ωt)
cos(ωt)−
399
399
70
4.3. Quasipolynome
Damit ist die allgemeine L¨ osung der DGL zweiter Ordnung von der Form x(t) = e−t/20 c1 cos(ωt)−c2 sin (ωt) +10 sin t.
x 5
Die L¨osung des Anfangswertproblems f¨ ur x0 = x0 = 0 ist nebenstehend abgebildet. Die Integration bereitet zwar keine grunds¨atzli- 5 chen Probleme, ist aber schon in diesem einfachen Beispiel rechenintensiv. 3
4.3
75
t
Quasipolynome
Um den Rechenaufwand bei der L¨ osung einer inhomogenen linearen Differentialgleichung zu verringern, benutzt man die Methode der Quasipolynome. Erinnerung: Der L¨ osungsoperator exp(At) der linearen DGL x˙ = Ax hat die Form exp(At) = W exp(Jt)W −1 mit der Jordan–Matrix J = exp Jr1 (λ1 ) ⊕. . .⊕exp Jrk (λk ) , und nach (4.1.6) ⎛
gilt exp Jr (λ)t = eλt
⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎝
⎞ tr−1 (r−1)! ⎟ ⎟ 0 1 t ⎟ ⎟ ⎟ . . . . . ⎟ . . . . . ⎟ . . . . . ⎟ ⎟ ⎟ . . . ⎠ . . . . . t . 0 ··· ··· 0 1
1 t ··· ···
.
Folgerung: Ist A ∈ Mat(n, C) und sind λ1 , . . . , λk ∈ C die Eigenwerte von A mit den Vielfachheiten ν1 , . . . , νk , dann haben die Eintr¨age der Matrix exp(At)
k die Form l=1 eλl t pl (t), wobei pl (t) ein Polynom vom Grad ≤ νl − 1 ist. Diese Folgerung k¨ onnen wir uns zunutze machen, nur unter Benutzung eines entsprechenden L¨ osungsansatzes direkter eine L¨osung linearer DGLn zu finden. 4.22 Definition F¨ ur λ ∈ K und ein Polynom p ∈ K[t] heißt die Funktion t → eλt p(t) λ–Quasipolynom vom Grad grad(p) u ¨ber K. Kennt man nun durch Auswertung des charakteristischen Polynoms von A die Eigenwerte λ1 , . . . , λk und die Multiplizit¨aten ν1 , . . . , νk , dann kann man die L¨osung in der oben angegebenen Form ansetzen. Der K-Vektorraum der λ–Quasipolynome wird durch Differentiation linear in sich abgebildet, und es gilt d dt
eλt p(t) = eλt p (t) + λp(t) .
Einsetzen des L¨osungsansatzes ergibt f¨ ur jeden Eigenwert λl eine Gleichung f¨ ur die Polynome pl (im Allgemeinen mehrere, denn x(t) = x1 (t), . . . , xn (t) ). Daraus lassen sich im Prinzip deren Koeffizienten bestimmen.
4. Lineare Dynamik
71
Besonders leicht ist der L¨ osungsansatz f¨ ur lineare Einzel-Differentialgleichungen h¨oherer Ordnung. Ist n¨amlich x(n) + an−1 x(n−1) + . . . + a0 x = 0, y1 .. , y := dk−1 x dann ergibt sich das ¨aquivalente System y˙ = Ay mit y = k dtk−1 . yn ⎛ 0 1 0 ... ⎞ 0 .. .. ⎜ 0 0 1 . . ⎟ ⎜ ⎟. Es ist damit das charakteristische Polyund A = ⎝ . . . . ⎠ .. .. . . . . 0 nom
0 0 ... 0 1 −a0 −a1 ... −an−2 −an−1
⎛
λ −1 0
...
0
⎜ 0 λ −1 . . . ⎜ det(λ1l − A) = det ⎜ . . . . ⎝ .. . . . . . .
.. .
0 0 0 λ −1 a0 a1 ... an−2 λ+an−1
⎞ ⎟ ⎟ ⎟ = λn + an−1 λn−1 + . . . + a0 , ⎠
also das Polynom mit den Koeffizienten der Differentialgleichung. Wir brauchen also nicht den Umweg u ¨ber ein Differentialgleichungssystem erster Ordnung zu machen, wenn wir die allgemeine L¨osung in Form eines Quasipolynoms schreiben wollen. 4.23 Beispiele 1. x(4) − ax = 0, a > 0. Die Nullstellen des charakteristischen Polynoms λ4 − a = 0 sind √ (k = 1, . . . , 4). λk = ik 4 a
4 λk t mit Koeffizienten Jede L¨osung besitzt also die Form x(t) = k=1 ck e ck ∈ C. Ist eine reelle L¨ osung gefragt, dann muss offensichtlich c2 , c4 ∈ R und c1 = c3 gelten. 2. Die Differentialgleichung x ¨ + k x˙ + x = 0 mit k > 0 (siehe Beispiel 4.21) beschreibt einen ged¨ampften harmonischen Oszillator (ohne ¨außere Anregung). 0 1 2 sind nur Die Eigenwerte λ1/2 = − k2 ± k4 − 1 der Matrix A = −1 −k im aperiodischen Grenzfall k = 2 einander gleich: Dann ist λ1 = λ2 = −1, sodass die allgemeine L¨ osung von der Form x(t) = (c1 + c2 t)e−t ist (siehe auch Kapitel 5.4). 3 F¨ ur λ ∈ R (sogar f¨ ur λ ∈ C!) ist cosh(λt) = 12 eλt + e−λt und sinh(λt) = 1 1 λt −λt iλt −iλt e , und nach der Euler–Formel cos(λt) = e und − e + e 2 2 iλt 1 −iλt sin(λt) = 2i e − e . L¨ osungen linearer DGLn k¨onnen also insbesondere Produkte dieser vier elementaren Funktionen mit t–Potenzen enthalten, denn diese erh¨alt man durch Linearkombination geeigneter Quasipolynome. Das hat eine weitere Konsequenz. Ist n¨amlich x˙ = Ax + b(t), wobei b(t) sich als Summe von Quasipolynomen schreiben l¨asst, dann l¨asst sich die L¨osung dieser
72
4.3. Quasipolynome
inhomogenen Differentialgleichung mit konstanten Koeffizienten als Summe von λ–Quasipolynomen schreiben (wobei λ Eigenwert von A ist oder als Exponent in b(t) auftaucht). Dies ergibt sich unmittelbar aus der in diesem Fall g¨ ultigen L¨osungsformel (siehe (4.2.10)) t ϕ(t) = exp(At) x0 + 0 exp(−As)b(s) ds f¨ ur das Anfangswertproblem mit ϕ(0) = x0 , denn Produkte und Integrale von Quasipolynomen sind Quasipolynome. 4.24 Beispiele (inhomogene lineare Differentialgleichungen) 1. x ¨+x = t2 . Eine partikul¨are L¨ osung dieser inhomogenen Differentialgleichung ist xp (t) := t2 − 2, die allgemeine a1 cos t + a2 sin t + xp (t), mit a1 , a2 ∈ R. 2. x(4) + x = t2 et cos t. Die rechte Seite ist von der Form 12 t2 eλt + eλt mit λ := 1 + i. Allgemein hat ein Quasipolynom eλt p(t) die k–te Ableitung dk dtk
k k l (k−l) (t), eλt p(t) = eλt l=0 l λ p
denn nach der Leibniz–Regel gibt es alfaktor l–mal abzuleiten.
k l
(4.3.1)
Wahlm¨oglichkeiten, den Exponenti(4)
Wir setzen die partikul¨are L¨ osung xp in der Form xp = yp + y p mit yp (t) + t2 λt yp (t) = 2 e an, wobei yp (t) := eλt (a2 t2 + a1 t + a0 ) sein soll. Nach Formel (4) (4.3.1) ist die linke Seite yp (t) + yp (t) = eλt (λ4 + 1)a2 t2 + [(λ4 + 1)a1 + 8λ3 a2 ]t + [(λ4 + 1)a0 + 4λ3 a1 + 12λ2 a2 ] . Vergleich mit der rechten Seite ergibt wegen λ2 = 2i, λ4 = −4 a2 =
1/2 λ4 +1
= − 16 , a1 =
−8λ3 a2 λ4 +1
= 89 (1 − i) und a0 = − 4λ
2 Damit ist xp (t) = 2Re e(1+i)t (− t6 + 89 (1 − i)t + 2 et (− t3 +
16 9 t) cos t
+ ( 16 9 t−
3
a1 +12λ2 a2 λ4 +1
=
92 27 i.
92 27 i)
184 27 ) sin t
= .
3
Kapitel 5
Klassifikation linearer Flu ¨sse
5.1 5.2 5.3 5.4
Konjugationen linearer Flusse ¨ . . . Hyperbolische lineare Vektorfelder . Lineare Flusse ¨ in der Ebene . . . . Beispiel: Feder mit Reibung . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
74 76 80 84
Wir kennen den von einer linearen Differentialgleichung x˙ = Ax mit Systemmatrix A ∈ Mat(n, R) auf dem Phasenraum Rn erzeugten Fluss Φt : Rn → Rn
, x → exp(At)x
(t ∈ R),
wollen aber ein vertieftes geometrisches Verst¨andnis erlangen. Insbesondere werden wir f¨ ur kleine Dimensionen n die Phasenportraits von Φ untersuchen. Allgemein versteht man unter dem Phasenportrait eines dynamischen Systems Φ : G × M → M die Zerlegung des Phasenraums M in Orbits. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 5,
73
74
5.1. Konjugationen linearer Fl¨usse
Abbildung 5.1.1: Phasenportraits von stabilen Spiralen der Differentialgleichung −1 x˙ = Ax. Links: A = −1/5 ; rechts: eine zu A ¨ahnliche Matrix 1 −1/5
5.1
Konjugationen linearer Fl¨ usse
Zun¨achst fragen wir etwas unpr¨azise, wann eine zweite lineare Differentialgleichung x˙ = Bx auf dem Phasenraum Rn ein ¨ahnliches Phasenportrait hat wie das von x˙ = Ax. Naheliegend erscheint dabei zun¨achst vielleicht die folgende Klasseneinteilung. Die Matrizen A, B ∈ Mat(n, R) heißen ¨ahnlich, wenn ein S ∈ GL(n, R) existiert mit B = SAS −1 . Dann gilt f¨ ur den von B erzeugten Fluss Ψt (y) := exp(Bt)y Ψt (y) = S exp(At)S −1 y = SΦt (S −1 y). (5.1.1) Also geht das Phasenportrait von B aus dem von A durch eine Basistransformation des Rn hervor. In Abbildung 5.1.1 sehen wir Phasenportraits zweier ¨ahnlicher Matrizen. ¨ Da bei der Ahnlichkeitstransformation die Eigenwerte mit ihrer Multiplizit¨at ¨ invariant gelassen werden, ist diese Aquivalenzklasseneinteilung linearer Fl¨ usse f¨ ur viele Zwecke zu fein. Angemessener f¨ ur den Vergleich zweier stetiger dynamischer Systeme Φ(i) : R × M (i) → M (i) ist dagegen oft der Begriff der Konjugation mit einem Hom¨oomorphismus h ∈ C M (1) , M (2) (siehe Definition 2.28). Sind die dynamischen Systeme differenzierbar und ist hsogar ein Diffeomor phismus (das heißt h ∈ C 1 M (1) , M (2) und h−1 ∈ C 1 M (2) , M (1) ), dann (2) (1) folgt aus Φt ◦ h = h ◦ Φt f¨ ur die Vektorfelder fk : d (2) d (1) f2 ◦ h = Φt ◦ h = h ◦ Φt = Dh ◦ f1 dt dt t=0 t=0 oder
f2 = Dh ◦ f1 ◦ h−1 .
(5.1.2)
5. Klassifikation linearer Fl¨ usse
75
Die den Fluss erzeugenden Vektorfelder werden also durch die Linearisierung von h aufeinander abgebildet. Ist insbesondere x1 ∈ M (1) eine Ruhelage von Φ(1) , dann ist nach Aufgabe 2.30 auch x2 = h(x1 ) eine Ruhelage von Φ(2) , und die Linearisierungen Df1 (x1 ) und Df2 (x2 ) sind ¨ahnliche Matrizen aus Mat(n, R). Angewandt auf die Ruhelage 0 ∈ Rn impliziert dies f¨ ur lineare Fl¨ usse auf dem Rn , dass diese genau dann durch Diffeomorphismen konjugiert sind, wenn die ihre Vektorfelder definierenden Matrizen ¨ahnlich sind. In diesem Fall k¨onnen wir statt allgemeiner Diffeomorphismen des Rn aber gleich die in (5.1.1) durch S ∈ GL(n, R) definierte lineare Abbildung als konjugierenden Diffeomorphismus verwenden. Anders sieht die Situation bei Verwendung nicht differenzierbarer Hom¨oomorphismen h aus. 5.1 Beispiel (Lineare DGLn auf R) F¨ ur Parameter a ∈ R betrachten wir die (a) lineare Differentialgleichung x˙ = ax auf R, mit Fluss Φt (x) = eat x. Dann ist der Ursprung x = 0 f¨ ur alle a ∈ R Ruhelage. Ist nun x ∈ R\{0}, dann ist die α– bzw. ω–Limesmenge von x (siehe Definition 2.20) parameterabh¨angig: • f¨ ur a < 0 :
α(x) = ∅, ω(x) = {0}
• f¨ ur a = 0 :
α(x) = ω(x) = {x}
• f¨ ur a > 0 :
α(x) = {0}, ω(x) = ∅.
Nach Aufgabe 2.30 k¨ onnen also Φ(a) (b) und Φ h¨ochstens dann konjugiert sein, wenn sign(a) = sign(b) gilt. Dann sind die Abbildungen aber auch wirklich konjugiert. Sind n¨amlich a und b beide gr¨oßer als Null oder beide kleiner als Null, k¨onnen wir den f¨ ur α > 0 definierten Hom¨oomorphismus
hΑ 1
=
1
1
x
1
Der konjugierende Hom¨oomorphismus ur α = 1/2, 1 und 2 hα , f¨ hα : R → R , x → sign(x)|x|α −1 von R benutzen. Es ist hα = h1/α und daher f¨ ur α := ab > 0 (a)
hα ◦ Φt
◦ h−1 α (x)
=
hα (eat sign(x)|x|1/α )
=
sign(x)(eat |x|1/α )α = ebt sign(x)|x| = ebt x = Φt (x).
(b)
Wir beachten, dass dieser konjugierende Hom¨ oomorphismus außer an der Stelle Null glatt ist. Der (eindimensionale, da durch a ∈ R parametrisierte) Parameterraum der ¨ eindimensionalen linearen dynamischen Systeme x˙ = ax wird also in drei Aquivalenzklassen zueinander konjugierter Systeme zerlegt. 3
76
5.2
5.2. Hyperbolische lineare Vektorfelder
Hyperbolische lineare Vektorfelder
Wir verallgemeinern jetzt das Beispiel 5.1 auf beliebige Dimensionen. 5.2 Definition • Eine Matrix A ∈ Mat(n, R), das Vektorfeld x → Ax und der Fluss (t, x) → Φt (x) = exp(At)x heißen hyperbolisch, wenn f¨ ur alle Eigenwerte λ ∈ C von A gilt: Re(λ) = 0. • Die Summe der algebraischen Vielfachheiten der Eigenwerte λ mit Re(λ) < 0 heißt der Index von A und wird Ind(A) geschrieben. • E s := {x ∈ Rn | limt→∞ Φt (x) = 0} heißt stabiler Unterraum, E u := {x ∈ Rn | limt→−∞ Φt (x) = 0} instabiler Unterraum von A. 5.3 Satz F¨ ur alle n ∈ N ist die Menge der hyperbolischen Matrizen in Mat(n, R) offen und dicht. Beweis: • Sei A ∈ Mat(n, R) hyperbolisch und λ ∈ iR. Dann ist λ kein Eigenwert von A, und es gilt sogar I(A) := inf{| det(A − λ 1ln )| | λ ∈ iR} > 0. Da die Abbildung det : Mat(n, C) → C stetig ist, gibt es Λ > 0 und eine Umgebung U ⊂ Mat(n, R) von A mit I(B) = inf{| det(B − λ 1ln )| | λ ∈ iR, |λ| ≤ Λ} > 0 f¨ ur B ∈ U . Die Matrizen B ∈ U sind also auch hyperbolisch. • Sei A ∈ Mat(n, R) nicht hyperbolisch. Dann ist f¨ ur c ∈ R die Matrix A+c1ln ∈ Mat(n, R) hyperbolisch, falls |c| ∈ (0, C) mit C := inf |Re(λ)| | λ ∈ C Eigenwert von A, Re(λ) = 0 ∈ (0, ∞]. Die Menge dieser Matrizen besitzt A als H¨aufungspunkt.
2
5.4 Bemerkungen 1. Wenn auch typische Matrizen in Mat(n, R) hyperbolisch sind, gilt dies nicht mehr, wenn wir uns auf den Untervektorraum der in der Klassischen Mechanik als Systemmatrizen auftretenden infinitesimal symplektischen Matrizen (siehe Seite 95) beziehen. 2. Eine Matrix A ∈ Mat(n, R) ist genau dann hyperbolisch, wenn gilt: Ind(A) + Ind(−A) = n. 3. Im Beispiel 5.1 waren die hyperbolischen dynamischen Systeme mit gleichem Index zueinander konjugiert. Dies werden wir jetzt auch f¨ ur beliebige Dimensionen n zeigen. 4. Die (gebr¨auchlichen) Indices s bzw. u stehen f¨ ur stable bzw. unstable. 5. Der Index einer Ruhelage x0 eines dynamischen Systems x˙ = f (x) ist definiert als Index von Df (x0 ). F¨ ur ein lineares Vektorfeld (f (x) = Ax) ist damit der Index jeder Ruhelage, insbesondere der Null, gleich dem Index der Systemmatrix A. 3
5. Klassifikation linearer Fl¨ usse
77
5.5 Aufgabe (Index) Bestimmen Sie ein Fundamentalsystem der L¨osungen zu 1 1 −1 x˙ = 0 −1 2 x . −2 −1 1
Welche L¨osungen bleiben f¨ ur t → ∞ beschr¨ankt? Ist die Matrix hyperbolisch? Wenn ja, welchen Index hat sie? 3 5.6 Lemma (Index) F¨ ur eine hyperbolische Matrix A gilt dim(E s ) = Ind(A). Beweis: Zun¨achst sind wegen der Linearit¨at des Flusses Φt tats¨achlich E u und E s Unterr¨aume des Phasenraums Rn . • Ist x ∈ Rn Element der direkten Summe der verallgemeinerten Eigenr¨aume zu den Eigenwerten λi mit Re(λi ) < 0, dann sind die Komponenten der vektorwertigen Funktion t → Φt (x) Summen von λi –Quasipolynomen, also x ∈ E s . Damit ist dim(E s ) ≥ Ind(A). • Andererseits ist mit der analogen Argumentation f¨ ur die Eigenwerte mit positivem Realteil dim(E u ) ≥ Ind(−A) = n − Ind(A).
• Außerdem gilt f¨ ur jede Summe f (t) := i pi (t)eλi t von λi –Quasipolynomen: Falls limt→∞ f (t) = limt→−∞ f (t) = 0, dann ist auch f = 0. Also ist E u ∩ E s = {0} und damit dim(E u ) + dim(E s ) = n, was dim(E s ) = Ind(A) und dim(E u ) = n − Ind(A) impliziert. 2 5.7 Beispiel Die Abbildung am Kapitelanfang (Seite 73) zeigt Orbits eines linearen Flusses auf dem R3 , mit Index 3. 3 Betrachten wir das rechte Phasenportrait in Abbildung 5.1.1, dann ist die Trajektorie zwar stabil, n¨ahert sich aber nicht die ganze Zeit dem Ursprung. Der ¨ Ubergang zur ¨ahnlichen Systemmatrix der linken Abbildung behebt diesen Defekt. Dies ist allgemein m¨ oglich: 5.8 Lemma Es sei A ∈ Mat(n, R), und Λ := max{Re(λ) | λ Eigenwert von A}. ur dessen Norm Dann gibt es f¨ ur alle Λ > Λ ein Skalarprodukt auf dem Rn , f¨ gilt: d
Φt (x) ≤ Λ Φt (x)
(x ∈ Rn , t ∈ R). (5.2.1) dt d d Beweis: Wegen dt Φt (x) = ds Φt+s (x)|s=0 = gen¨ ugt es, (5.2.1) f¨ ur t = 0 zu zeigen.
d ds Φs (y)|s=0
mit y := Φt (x)
• (5.2.1) gilt f¨ ur x = 0. Es gen¨ ugt also, die Ungleichung f¨ ur x ∈ Rn \ {0} zu beweisen. Stattdessen zeigen wir sogar, dass f¨ ur ein geeignetes Skalarprodukt auf dem Cn gilt 1 2
d exp(At)x, exp(At)x |t=0 ≤ Λ x, x dt
(x ∈ Cn ).
(5.2.2)
78
5.2. Hyperbolische lineare Vektorfelder
Ohne Beschr¨ankung der Allgemeinheit k¨ onnen wir voraussetzen, dass der Basiswechsel zur Jordan–Normalform schon vorgenommen wurde. Es ist d exp(At)x, exp(At)x |t=0 = 2Re x, Ax . dt • Ist das Skalarprodukt so gew¨ahlt, dass die Unterr¨aume zu den verschiedenen Jordan–Bl¨ocken orthogonal sind, ist dieser Term eine Summe u ¨ber die Beitr¨age der Jordan–Bl¨ocke. Mit dem Jordan–Block Jr (λ) f¨ ur den Eigenwert λ ist f¨ ur μ := Re(λ) ≤ Λ Re x, Jr (λ)x = Re x, Jr (μ)x . • F¨ ur ε > 0 konjugieren wir Jr (μ) = μ1lr + Jr (0) mit der Diagonalmatrix Dε := diag(1, ε, ε2 , . . . , εr−1 ) ∈ GL(r, C) (also Dε−1 = D1/ε ): Dε−1 Jr (μ)Dε = μ1lr + Dε−1 Jr (0)Dε = μ1lr + εJr (0). Die Nebendiagonale wurde also mit ε multipliziert. Wir bezeichnen das kanonische Skalarprodukt auf Cr mit ·, ·can . Die Cauchy-Schwarz–Ungleichung impliziert Re x, Jr (0)xcan ≤ x can Jr (0)x can ≤ x 2can . Also ist f¨ ur ε ∈ 0, Λ − Λ = μ x, xcan + ε Re x, Jr (0)xcan Re x, (μ1lr + εJr (0))xcan ≤ (Λ + ε) x, xcan ≤ Λ x, xcan . ) * Wir definieren also das Skalarprodukt durch x, y := Dε−1 x, Dε−1 y can und erhalten f¨ ur x ˜ := Dε−1 x x, Jr (μ)x = ˜ x, (μ1lr + εJr (0))˜ xcan ≤ Λ ˜ x, x ˜can = Λ x, x , insgesamt also
1 d 2 2 dt exp(At)x |t=0
≤ Λ x 2 , das heißt (5.2.2).
2
5.9 Satz (Konjugationsklassen) Die linearen Fl¨ usse zweier hyperbolischer Matrizen A(1) , A(2) ∈ Mat(n, R) sind genau dann konjugiert, wenn gilt: Ind A(1) = Ind A(2) . (i)
Beweis: Wir bezeichnen die linearen Fl¨ usse mit Φt (x) := exp(A(i) t)x und (i) deren stabile Unterr¨aume mit E (i = 1, 2). · (i) : E (i) → [0, ∞) bezeichnen Normen, die die Ungleichung aus Lemma 5.8 f¨ ur ein Λ < 0 erf¨ ullen. • Existiert ein konjugierender Hom¨ oomorphismus h : Rn → Rn , dann gilt h(0) = (1) (2) 0 und auch h E = E , denn die Punkte x ∈ E (i) haben die definierende Eigenschaft {0} = ω(x), und es gilt nach Aufgabe 2.30 h ω(x) = ω h(x) . Es ist eine wichtige Eigenschaft von Hom¨ oomorphismen, die Dimension von Vektorr¨aumen invariant zu lassen. Damit ist bei Existenz einer Konjugation h Ind A(1) = dim E (1) = dim h(E (1) ) = dim E (2) = Ind A(2) .
5. Klassifikation linearer Fl¨ usse
79
• Wir nehmen jetzt umgekehrt Ind A(1) = Ind A(2) an und konstruieren einen konjugierenden Hom¨ oomorphismus h. Da beide Phasenr¨aume Rn direkte Summen ihrer stabilen beziehungsweise instabilen Unterr¨aume sind, schreiben wir uglich dieser Zerlegungen den Hom¨oomorphismus in der Form bez¨ h = h(s) , h(u) mit h(s) : E (1) → E (2) , w¨ahrend h(u) die instabilen Unterr¨aume aufeinander abbildet. • Wir definieren h(s) und zeigen, dass die Abbildung ein Hom¨oomorphismus ist. Zun¨achst ist h(s) (0) := 0, denn Ruhelagen werden auf Ruhelagen abgebildet. (1) Ist x ∈ E (1) \{0}, dann ist limt→∞ Φt (x) = 0 und (1) (1) limt→−∞ Φt (x) = ∞. Nach Lemma 5.8 gibt es genau ein
(1) T (x) ∈ R mit ΦT (x) (x) ∈ S (1) := y ∈ E (1) y (1) = 1 , und T : E (1) \ {0} → R ist glatt. ¨ Geometrisch ist S (1) die Sph¨are vom Radius 1 in E (1) . Ahnlich bezeichnet (2) (2) (2) (2) S := {z ∈ E | z = 1} die Einheitssph¨are in E . Da die beiden R–Vektorr¨aume E (1) und E (2) die gleiche Dimension besitzen, gibt es einen Isomorphismus I : E (1) → E (2) , und entsprechend den Diffeomorphismus I(y) . I˜ : S (1) → S (2) , y →
I(y) (2) Wir setzen (2) (1) h(s) (x) := Φ−T (x) ◦ I˜ ◦ ΦT (x) (x)
x ∈ E (1) \{0} .
Als Verkettung glatter Abbildungen ist h(s) auf E (1) \{0} glatt, und h(s) (x) → 0 f¨ ur x → 0. Analoge Aussagen gelten f¨ ur die Umkehrabbildung von h(s) . (s) Damit ist h ein Hom¨ oomorphismus. (u) ¨ h definiert man analog, durch Ubergang von den Systemmatrizen A(i) zu (i) oomorphismus. −A . Daher ist schließlich auch h ein Hom¨ (1)
• h konjugiert die Fl¨ usse. Denn f¨ ur y := Φs (x) und x ∈ E (1) \ {0} ist (1)
(1)
(1)
(1)
ΦT (x)−s (y) = ΦT (x) ◦ Φ−s (y) = ΦT (x) (x)
, also T (y) = T (x) − s. (2)
F¨ ur alle t ∈ R und (zun¨achst nur) f¨ ur x ∈ E (1) ist daher Φt ◦ h(x) gleich (2)
(1)
(2)
(1)
(1)
(1)
Φt−T (x) ◦ I˜ ◦ ΦT (x) (x) = Φt−T (x) ◦ I˜ ◦ ΦT (x)−t ◦ Φt (x) = h ◦ Φt (x). Daraus folgt mit analoger Argumentation f¨ ur den instabilen Unterraum die Konjugationseigenschaft f¨ ur alle x ∈ Rn . 2 ¨ Es gilt also bez¨ uglich Konjugation genau n + 1 Aquivalenzklassen hyperbolischer Matrizen A ∈ Mat(n, R).
80
5.3. Lineare Fl¨ usse in der Ebene
5.10 Weiterf¨ uhrende Literatur Eine weitergehende Analyse, insbesondere eine Verallgemeinerung auf die lokale Theorie nichtlinearer Differentialgleichungen in der N¨ahe eines hyperbolischen singul¨aren Punktes, findet sich in Palis und de Melo [PdM], sowie in Amann [Am]. 3
5.3
Lineare Fl¨ usse in der Ebene
Nach dem in Beispiel 5.1 behandelten Fall der Phasenraumdimension n = 1 untersuchen wir jetzt den n¨achst einfachen Fall n = 2. a12 ) ∈ Mat(2, R) den Fluss Φ(A) : R × Wir betrachten also f¨ ur A = ( aa11 21 a22 2 2 R → R der linearen DGL x˙ = Ax. Zueinander ¨ahnliche Matrizen f¨ uhren zu Fl¨ ussen, die sich nur durch eine Basistransformation unterscheiden. Die Gr¨oßen tr(A) = a11 + a22 , det(A) = a11 a22 − a12 a21 und D(A) := tr(A)2 − 4 det(A) sind invariant unter Konjugationen A → SAS −1 , und die Eigenwerte λ1/2 ∈ C sind gleich √ λ1/2 = 12 tr(A) ± D . Nur wenn die Diskriminante D = 0 ist, kann also die komplexe Jordan–Normalform von A aus einem Jordan–Block der Gr¨ oße 2 bestehen, und nur dann ist die Konjugations-Klasse von A nicht schon durch tr(A) und det(A) festgelegt. Nicht hyperbolisch ist die Matrix A genau dann, wenn mindestens einer der Eigenwerte verschwindenden Realteil hat. Dies ist genau dann der Fall, wenn 1. det(A) = 0, also sogar ein Eigenwert 0 ist oder 2. det(A) > 0, aber tr(A) = 0 gilt, also die Eigenwerte rein imagin¨ar sind. In der (tr, det) ∈ R2 –Ebene bilden diese Bedingungen die Abszisse bzw. die positive Ordinate und trennen damit drei Gebiete1 ab, siehe Abbildung 5.3.1. • Ind(A) = 0 gilt f¨ ur den Quadranten mit det(A) > 0 < tr(A). • Ind(A) = 1 gilt f¨ ur det(A) < 0. Hier sind beide Eigenwerte reell. • Ind(A) = 2 entspricht dem Quadranten mit det(A) > 0 > tr(A). Wie im letzten Abschnitt bewiesen, sind die Fl¨ usse innerhalb jedes dieser drei Gebiete untereinander konjugiert, aber Fl¨ usse f¨ ur Matrizen mit verschiedenen Indices sind nicht konjugiert. Der Fall Ind(A) = 1 ist, entsprechend dem Vorzeichen von tr(A), noch weiter unterteilbar. In der Situation tr(A) = 0 zweier Eigenwerte λ1 = −λ2 ∈ R wird das Phasenraumvolumen durch den Fluss erhalten, w¨ahrend es f¨ ur tr(A) < 0 1 Unter einem Gebiet wird eine offene, nichtleere und zusammenh¨ angende Teilmenge eines topologischen Raumes verstanden.
5. Klassifikation linearer Fl¨ usse
81
DetA
Sattel
Spirale ten o Kn D0 . g i e Knoten un
Zentrum
Spirale un eig .K no Knoten ten
trA
Abbildung 5.3.1: Verzweigungsdiagramm f¨ ur Matrizen A ∈ Mat(2, R), mit Diskriminante D ≡ D(A) = tr(A)2 − 4 det(A). tr(A) < 0: Senke; tr(A) = 0: Volumenerhaltender Fluss; tr(A) > 0: Quelle gem¨aß Lemma 4.12 im Limes großer Zeiten mit exponentieller Rate gegen Null geht. Der Fall tr(A) > 0 ist in Abbildung 5.3.2 dargestellt. Die durch die Gleichung D = 0 definierte Parabel trennt die KonjugationsKlassen Ind(A) = 0 und Ind(A) = 2 noch weiter auf. F¨ ur D > 0, also reelle Eigenwerte, erhalten wir sogenannte Knoten als Phasenraumportraits, siehe Abbildung 5.3.3. Diese werden stabil genannt, wenn dim(E s ) = 2, also Ind(A) = 2 ist und instabil f¨ ur Ind(A) = 0. F¨ ur D = 0 kann die Jordan–Normalform von A ein nichttrivialer Jordan– Block sein. Ein entsprechendes Phasenportrait, uneigentlicher Knoten genannt, findet sich ebenfalls in Abbildung 5.3.3. Ist zus¨atzlich tr(A) = 0, sind also beide Eigenwerte gleich Null, erh¨alt man einen eindimensionalen Eigenraum von Gleichgewichtslagen, wie in Abbildung 5.3.4 (links). Der Fall tr(A) = 0, det(A) > 0 f¨ uhrt zu imagin¨aren Eigenwerten und periodischen Orbits (Abbildung 5.3.4 rechts), auch Zentren genannt. Endlich ist f¨ ur D < 0 und tr(A) < 0 die Bewegung spiralf¨ormig und stabil (Abb. 5.3.5), w¨ahrend D < 0 und tr(A) > 0 zu sog. instabilen Spiralen f¨ uhrt. Der reibungsfreie (hamiltonsche) Fall der Klassischen Mechanik entspricht einer Matrix A ∈ Mat(2, R) mit tr(A) = 0. Wir befinden uns also auf der Ordinate des Verzweigungsdiagramms 5.3.1. 5.11 Beispiel (hamiltonsche lineare Differentialgleichungen) Wir betrachten einen Massenpunkt der Masse 1 am Ort q ∈ R, der durch eine Kraft F (q) := a q beschleunigt wird, mit Parameter a ∈ R. Physikalisch kann man etwa an einen Gegenstand denken, der unter dem Einfluss der Schwerkraft reibungsfrei auf einer parabolisch geformten Unterlage gleitet. Nach Newton gilt
82
5.3. Lineare Fl¨ usse in der Ebene
Abbildung 5.3.2: Phasenportrait von Satteln der Differentialgleichung x˙ = Ax. Links: Systemmatrix A = 03 −20 ; Rechts: zu A ¨ahnliche Matrix.
Abbildung 5.3.3: Phasenportraits von Knoten der DGL x˙ = Ax. Links: instabiler 0 Knoten, f¨ ur A = 01 1/2 ; Rechts: instabiler uneigentlicher Knoten, f¨ ur A = 10 11
Abbildung 5.3.4: Phasenportraits von x˙ = Ax. Fall rein imagin¨arer Eigenwerur antisymmetrische te. Links: Nilpotente Matrix A = 00 10 ; Rechts: Zentrum, f¨ 0 1 Matrix A = −1 0
5. Klassifikation linearer Fl¨ usse
83
Abbildung 5.3.5: Phasenportraits von stabilen Spiralen der Differentialgleichung −1 x˙ = Ax. Links: A = −1/5 ; rechts: eine nicht zu A ¨ahnliche Matrix 1 −1/5 1
p
0
1
1
1
h q 1
1
q
=
p
0
q
1
1
Abbildung 5.3.6: Abstoßende Kraft (a = 1): Vektorfeld q˙ = p, p˙ = q und Phasenportrait also die DGL zweiter Ordnung q¨ = a q. Durch Einf¨uhrung der Geschwindigkeit p = q˙ ergibt sich das lineare Differentialgleichungssystem erster Ordnung q˙ = p ,
p˙ = a q
oder x˙ = A x mit x = ( pq ) und A := ( a0 10 ).
3
5.12 Aufgabe (Hookesches mit A = ( a0 10 ) f¨ur Kraftgesetz) Zeigen Sie, dass q0 den linearen Fluss q(t), p(t) = Φt (q0 , p0 ) = exp(A t) ( p0 ) gilt: √ (a) F¨ ur a > 0 (siehe Abbildung 5.3.6) ist mit ω := a p0 q(t), p(t) = q0 cosh(ωt) + sinh(ωt) , ωq0 sinh(ωt) + p0 cosh(ωt) . ω (b) F¨ ur a = 0 (siehe Abbildung 5.3.7) ist q(t), p(t) = (q0 + p0 t, p0 ).
84
5.4. Beispiel: Feder mit Reibung
√ (c) F¨ ur a < 0, (siehe Abbildung 5.3.8) ist mit ω := −a p0 sin(ωt) , −ωq0 sin(ωt) + p0 cos(ωt) . 3 q(t), p(t) = q0 cos(ωt) + ω 1
p
1
1
q
=
0
1
p
q˙ q
1
0
1
q
Abbildung 5.3.7: Freie Bewegung (a = 0): Vektorfeld q˙ = p, p˙ = 0 und Phasenportrait
1
p
0
1
1
1
h 1
q
1
q
=
1
p
0
q
1
Abbildung 5.3.8: Anziehende Kraft (a = −1): Vektorfeld q˙ = p, p˙ = −q und Phasenportrait Wir bemerken, dass in allen drei F¨allen det(exp(At)) = 1 (t ∈ R) ist. Das folgt aus Satz 4.12. Eine anschauliche Interpretation dieser Tatsache ist die Feststellung, dass der Fluss in R2 fl¨achenerhaltend ist.
5.4
Beispiel: Feder mit Reibung
Als Anwendungsbeispiel der Theorie linearer Differentialgleichungen diskutieren wir den Fall eines an einer Feder aufgeh¨angten Gewichts der Masse m > 0, das sich im Ruhezustand in der H¨ ohe x = 0 befinde. Die Kraft F (x, x), ˙ die auf die Masse wirkt, ist in der einfachsten N¨aherung eine lineare Funktion der Auslenkung x ∈ R und der Geschwindigkeit x˙ ∈ R. Die
5. Klassifikation linearer Fl¨ usse
85
erste Proportionalit¨atskonstante −D mit D > 0 nennt man Federkonstante. Sie ist ein Maß f¨ ur die Steifheit der Feder. Die zweite Konstante −R mit R ≥ 0 beschreibt die Reibung des Massenk¨orpers an der umgebenden Luft und die innere Reibung des Federmaterials2 . Autonomer Fall 2
2
d d d D Es gilt also nach Newton m dt 2 x(t) = −Dx(t) − R dt x(t), oder dt2 x = − m x − m R d d urzt ds x(t(s)) m dt x. Setzt man als neuen Zeitparameter s = D t an, und k¨ mit x˙ ab, so ergibt sich
x ¨ = −x − k x˙
k := √
, mit
R ≥ 0. mD
Eine solche Umskalierung wird h¨aufig benutzt, um eine Differentialgleichung auf eine m¨oglichst einfache Form zu bringen. Mit der Geschwindigkeit v := x˙ ergibt sich das lineare System erster Ordnung 0 1 ( xv˙˙ ) = A ( xv ) mit A := −1 −k . 2 Die Eigenwerte von A ergeben sich als die Nullstellen λ1/2 = − k2 ± i 1 − k4 des charakteristischen Polynoms det(λ1l − A) = λ2 + kλ + 1. Es gilt det(A) = 1 und tr(A) = −k, wir bewegen uns also im Diagramm 5.3.1 auf einer horizontalen Geraden. Je nach Gr¨ oße des Reibungsterms m¨ ussen also drei F¨alle unterschieden werden: 1. Schwingfall:, Kleine Reibung, 0 ≤ k < 2, (siehe auch Aufgabe 5.12). 2 Die allgemeine L¨ osung hat hier mit ω := Im(λ1 ) = 1 − k4 die Form x(t) = e−kt/2 a cos(ωt) + b sin(ωt) wobei die Koeffizienten a und b aus den Anfangswerten x(0), x(0) ˙ zu bestimmen sind. F¨ ur den reibungsfreien Fall k = 0 liegt ein Zentrum vor, sonst eine Spirale. Die Schwingungsfrequenz ω(k) ist gegen¨ uber ω(0) = 1 verkleinert, aber es gilt noch ω(k) > 0. Die an der Feder aufgeh¨angte Masse pendelt sich allm¨ahlich in ihre Ruhelage (x, x) ˙ = (0, 0) ein.
x 1
=
Π
2Π
4Π
t
Zwei L¨ osungen f¨ ur den Schwingfall (k = 1/2)
2 Im Gegensatz zu dieser geschwindigkeitsproportionalen, nach Stokes benannten Reibung wird die Reibung in einer turbulenten Str¨ omung empirisch durch die zum Quadrat der Geschwindigkeit proportionale Reibung beschrieben.
86
5.4. Beispiel: Feder mit Reibung
2. Aperiodischer k = 2. 0 Grenzfall: 1 Es ist A = −1 −2 , und dieMatrix 1 1 V := −1 mit V −1 = 12 11 −1 1 1 , f¨ uhrt A in obere Dreiecksform u ¨ber: 2 J := V −1 AV = −1 0 −1 . Damit ist eJt = e−t ( 10 2t 1 ) und t exp(At) = V eJt V −1 = e−t 1+t −1 1−t .
x 1
1 2
Π 2Π 3Π Zwei L¨osungen f¨ ur den Aperiodischen Grenzfall
Beispielsweise ist bei verschwindender Anfangsgeschwindigkeit v0 = 0 x(t) = x0 (1 + t)e−t .
t
Es findet also keine Schwingung mehr statt. Wegen der Nichttrivialit¨at des Jordan–Blockes ist die Bewegung zur Ruhelage hin gegen¨ uber der L¨osung x(t) = x0 e−t verlangsamt. 3. Kriechfall: Große Reibung, k > 2. Hier hat A die beiden reellen negativen Eigenwerte λ1/2 = −
k±
+ √ 4 k2 − 4 k 1± 1− 2 . =− 2 2 k
F¨ ur k → ∞ ist also λ1 ∼ −k −1
,
λ2 ∼ −k.
Das Phasenportrait ist das eines Knotens. Physikalisch bedeutet dies, dass, außer f¨ ur sehr spezielle Anfangswerte (x0 , v0 ) die einem Eigenvektor zum kleineren Eigenwert λ2 entsprechen, die Ann¨aherung an die Ruhelage sich bei Vergr¨ oßerung von k verlangsamt: x(t) = aeλ1 t + beλ2 t .
x 1
1 2
Π Zwei L¨osungen f¨ ur den Kriechfall (k = 2.5)
2Π
t
Nicht autonomer Fall Eine in der Praxis wichtige Erweiterung des eben besprochenen Beispiels besteht darin, dass auf den Massenpunkt zus¨atzlich eine ¨außere Kraft wirkt. Soll beispielsweise dauerhaft eine Schwingung aufrechterhalten werden, kann man den
5. Klassifikation linearer Fl¨ usse
87
Aufh¨angungspunkt zeitperiodisch nach oben und unten bewegen. Die zu behandelnde Differentialgleichung hat dann die Normalform x ¨ + k x˙ + x = f (t) mit einer vorgegebenen ¨außeren Kraft f , etwa f (t) = a cos ωt. Es ist ja cos ωt = urzung der Rechnung nahe, eine partikul¨are Re(eiωt ). Es liegt also zur Verk¨ L¨osung y : R → C der komplexen Differentialgleichung y¨ + k y˙ + y = aeiωt zu suchen, und danach x(t) := Re(y(t)) zu setzen. Physikalisch ist wegen der Reibung zu erwarten, dass der Massenpunkt r, nach einiger Zeit haupts¨achlich eine harmonische Schwingung mit der Kreisfrequenz ω durchf¨ uhrt, die ihm 2 von außen aufgepr¨agt wird. Setzen Π = iωt 2 wir an: y(t) := Be , so ergibt sich y (k) (t) = (iω)k y(t), also 1 (1 − ω 2 + ikω)y(t) = Aeiωt
1
oder, nach Aufl¨osen nach B: A B= = Ar(ω)e−iϕ(ω) 1 − ω 2 + ikω 1 mit Amplitude r(ω) := √ 2 2
(1−ω ) +(kω)
2
Ω
Amplitude und Phasendifferenz der Erzwungenen Schwingung (k = 12 ) kω der und Phase ϕ(ω) := arctan 2 1−ω 2
erzwungenen Schwingung (siehe Abbildung, ein sogenanntes Bode–Diagramm). Offensichtlich spielt ω = 1 eine besondere Rolle; das ist nicht verwunderlich, denn die homogene Gleichung ohne Reibung hatte ja diese Frequenz ihrer L¨osungen. Wir interpretieren jetzt Amplitude und Phase der L¨osung physikalisch: • Amplitude: F¨ ur kleine anregende Frequenz ω schwingt die Masse etwa mit der Amplitude der Anregung. Ist ω nahe bei der auf 1 normierten Eigenfrequenz, dann kommt es zur Resonanz. Die Schwingungsamplitude wird gr¨ oßer als die anregende Amplitude und zwar um so gr¨ oßer, je geringer die D¨ampfung ist.3 Das Maximum von r(ω) liegt an der Stelle ω0 = 1 − k 2 /2, also zwischen der Eigenfrequenz mit und ohne Reibung. Die Maximalamplitude ist f¨ ur verschwindende D¨ampfung k ! 0 asymptotisch zu 1 1 ∼ . r(ω0 ) = 2 k k 1 − k /4 3 Voraussetzung:
k<
√
2.
88
5.4. Beispiel: Feder mit Reibung
kω zwischen der ¨außeren • Phase: Die Phasendifferenz ϕ(k) = arctan 1−ω 2 Kraft und der Schwingung hat folgende Eigenschaften. - Es ist limω0 ϕ(ω) = 0. F¨ ur ω " 1 sind ¨außere Kraft und Schwingung also in Phase. ur ω # 1 gegenphasig. - Wegen limω+∞ ϕ(ω) = π sind sie f¨ - F¨ ur ω = 1 sind sie um
π 2
gegeneinander verschoben.
Wir erhalten also als allgemeine L¨ osung der Differentialgleichung x ¨ + k x˙ + x = A cos ωt x = xH + xI mit xI (t) = r(ω)A cos ωt − ϕ(ω) , und einer L¨osung xH des homogenen Problems.
Kapitel 6
Hamiltonsche Gleichungen und Symplektische Gruppe
Die symplektische Gruppe Sp(2, R) = SL(2, R), mit den Matrizen ±1l und der Hyperfl¨ache der Matrizen mit degenerierten Eigenwerten +1 (rechte H¨alfte) beziehungsweise −1 (linke H¨alfte). 6.1 6.2 6.3 6.4 6.5
Gradientenflusse ¨ und hamiltonsche Systeme Die symplektische Gruppe . . . . . . . . . . Lineare hamiltonsche Systeme . . . . . . . ¨ ¨ Unterraume symplektischer Vektorraume . . * Der Maslov–Index . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. 90 . 95 . 103 . 116 . 119
Der Energiebegriff ist vielleicht das wichtigste Konzept der Physik. Jedenfalls legt die Hamilton–Funktion (also die Gesamtenergie) eines Systems die TeilA. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 6,
89
90
6.1. Gradienten߬ usse und hamiltonsche Systeme
chendynamik fest. Das Vektorfeld der Differentialgleichung entsteht dabei durch Drehung aus dem Gradienten der Hamilton–Funktion. Im linearen Fall spielt sich die Dynamik in der symplektischen Gruppe ab.
6.1
Gradienten߬ usse und hamiltonsche Systeme
In diesem Kapitel werden wir Differentialgleichungen mit Vektorfeldern behandeln, die jeweils durch Angabe einer einzigen Funktion fixiert sind: Gradienten– beziehungsweise hamiltonsche Differentialgleichungen. Diese werden einerseits h¨aufig betrachtet, und letztere bilden die Basis der Klassischen Mechanik. Andererseits besitzen sie besondere dynamische Eigenschaften.
6.1.1
Gradienten–Differentialgleichungen
Wir betrachten die Gradienten–Differentialgleichung von H ∈ C 2 (M, R) auf dem in Rn offenen Phasenraum M : ⎧ ∂H ⎪ ⎨ x˙ 1 = ∂x1 (x1 , . . . , xn ) .. oder kurz 1 x˙ = ∇H(x) (6.1.1) . ⎪ ⎩ ∂H x˙ n = ∂xn (x1 , . . . , xn ) Erf¨ ullt H geeignete Bedingungen, so definiert die obige Differentialgleichung ein differenzierbares dynamisches System Φ : R × M → M , den Gradientenfluss. Wir stellen fest, dass H entlang der Bahnkurven anw¨achst: 6.1 Lemma Entweder ist ein Orbit einer Gradienten-Differentialgleichung (6.1.1) eine Ruhelage, oder H steigt entlang der L¨osungskurve streng monoton. d ϕ(t) = ∇H ϕ(t) . Dann gilt Beweis: Es sei t → ϕ(t) eine L¨ osungskurve, also dt ) * d H ϕ(t) = ∇H ϕ(t) , ϕ(t) ˙ = ∇H ϕ(t) 2 ≥ 0. dt Ist der Gradient von H an der Stelle ϕ(t) Null, dann ist der Orbit eine Gleichgewichtslage. Sonst gilt (f¨ ur den ganzen Orbit!) die strikte Ungleichung. 2 Die Mengen Mc := {m ∈ M | H(m) ≥ c}
(c ∈ R)
sind also vorw¨artsinvariant (Φt (Mc ) ⊆ Mc (t ≥ 0)), das heißt die Trajektorien sind f¨ ur positive Zeiten gewissermaßen in Mc gefangen. Da, wie wir gesehen haben, H entlang der Bahnkurven anw¨achst, gilt: Folgerung: Außer Ruhelagen besitzt (6.1.1) keine periodischen Orbits. 6.2 Beispiel H : R2 → R, H(x1 , x2 ) := x22 + (x21 − 1)2 . Der Gradientenfluss existiert nur f¨ ur alle negativen Zeiten und besitzt die Gleichgewichtslagen (0, 0), (1, 0) und (−1, 0), siehe Abbildung 6.1.1. 3 1 Hierbei
ist ∇ der Gradient bez¨ uglich der kanonischen Metrik auf dem Rn , siehe Seite 470.
6. Hamiltonsche Gleichungen und Symplektische Gruppe 1
0
91
1 1
x2
0
1
x1 Abbildung 6.1.1: Gradientenvektorfeld ∇H(x) und Niveaulinien von H(x) = x22 + (x21 − 1)2 Kriterien, Eigenschaften und Beispiele Wie stellt man nun fest, ob ein vorgegebenes Vektorfeld f Gradienten-Vektorfeld ist? Hilfreich ist daf¨ ur die Theorie der Differentialformen (Anhang B). In kartesischen Koordinaten ist ∇H ja bis auf Transposition gleich der exakten Eins–Form ∂H ∂H dx1 + · · · + ∂x dxn . Die dem Vektorfeld f = (f1 , . . . , fn ) assoziierte dH = ∂x 1 n Eins–Form ω := f1 dx1 + · · · + fn dxn muss also geschlossen sein (dω = 0), wenn f Gradienten-Vektorfeld sein soll. Diese Bedingung ist beispielsweise f¨ ur konvexe Phasenr¨aume auch hinreichend: 6.3 Satz Ist M ⊆ Rn offen und einfach zusammenh¨angend (zum Beispiel konvex), dann ist das Vektorfeld f ∈ C 1 (M, Rn ) genau dann Gradienten-Vektorfeld, wenn ω geschlossen ist, das heißt, wenn gilt ∂fk ∂fi = ∂xk ∂xi
(i, k ∈ {1, . . . , n}).
Beweis: • Dass diese Bedingung notwendig ist, folgt aus fj = Vertauschbarkeit der partiellen Ableitungen von H ∈ C 2 (M, R). • Umgekehrt folgt die Aussage aus dem Poincar´e-Lemma B.48.
(6.1.2) ∂H ∂xj
und der 2
Die Forderung des einfachen Zusammenhangs von M kann man nicht weglassen:
6.4 Beispiel (rotationsfreies Vektorfeld) Das Vektorfeld f ∈ C 1 (M, R2 ), −x2 1 f (x) := x2 +x1 auf dem Phasenraum M := R2 \{0} besitzt die partiellen Ableitungen
∂f1 ∂x2 (x)
=
x22 −x21 x4
=
∂f2 ∂x1 (x),
erf¨ ullt also (6.1.2).
92
6.1. Gradienten߬ usse und hamiltonsche Systeme
Das Vektorfeld f ist senkrecht zur ra1 . dialen Richtung, und f (x) = x Daher ist das Wegintegral H(x) := * 1) f γx (t) , γx (t) dt (x ∈ M ) nur 0 vom durch γx [0, 1] → M u ¨berstrichenen Winkel abh¨angig. Auf der einfach zusammenh¨angenden geschlitzten Ebene ˜ := R2 \ {0} × [0, ∞) ⊂ M M
x2 2
2
2
x1
ist das Integral daher gleich dem Winkel zwischen Anfangs- und Endpunkt. f M˜ ist 2 also ein Gradienten-Vektorfeld. Auf M ist H allerdings nicht stetig definierbar. f selbst ist also kein GradientenVektorfeld. 3 Die Orbits des Vektorfeldes im letzten Beispiel sind die Kreise um den Ursprung. Dergleichen kann bei Gradienten-Vektorfeldern nach Lemma 6.1 nicht geschehen. Lineare Gradienten-Vektorfelder Welche linearen Vektorfelder sind Gradienten-Vektorfelder? Nach Satz 6.3 muss ∂fi k = ∂f oder entsprechend mit f (x) = Ax f¨ ur alle Indexpaare (i, k) gelten: ∂x ∂xi k Ai,k = Ak,i . Die linearen Gradienten-Vektorfelder zeichnen sich also dadurch aus, dass ihre Systemmatrix selbstadjungiert ist. f ist dann Gradient der Funktion H : Rn → R
,
H(x) :=
1 2
x, Ax ,
also einer quadratischen Form auf dem Phasenraum Rn . Durch eine Drehung k¨ onnen wir erreichen, dass die Systemmatrix diagonal ist, also ohne Beschr¨ankung der Allgemeinheit A = diag(λ1 , . . . , λn )
mit
λi ∈ R.
(6.1.3)
Damit ist exp(At) = diag(eλ1 t , . . . , eλn t ). Sind nun die λi alle = 0, dann spaltet der Phasenraum in die direkte Summe Rn = E s ⊕ E u zweier Unterr¨aume auf, wobei A die Aufspaltung invariant l¨asst, und AE s < 0, AE u > 0, also Ind(A) = dim(E s ). Es gilt E s = x ∈ Rn | lim exp(At) x = 0 , E u = x ∈ Rn | lim exp(At) x = 0 , t→∞
t→−∞
so dass E s bzw. E u der stabile bzw. instabile Unterraum aus Definition 5.2 ist. 6.5 Beispiel (Lineare Gradientenfl¨ usse in der Ebene) Da die Diskriminante D(A) = tr(A)2 − 4 det(A) einer symmetrischen Matrix A ∈ Mat(2, R)
6. Hamiltonsche Gleichungen und Symplektische Gruppe
93
nichtnegativ ist, sind die Systemmatrizen der Gradientenfl¨ usse in Abbildung 5.3.1 auf Seite 81 unterhalb der Parabel D = 0 angesiedelt. Andererseits l¨aßt sich jeder Punkt unterhalb dieser Parabel als Gradientensystem realisieren. Nach ist A = diag(λ1 , λ2 ), also die L¨osungen gleich Diagonalisierung (6.1.3) x(t) = eλ1 t x1 (0), eλ2 t x2 (0) , siehe Abbildung 6.1.2. 3
x2
x2
1
1
1
1
x1
x 1 1
1
1
1
Abbildung 6.1.2: Links: Gradientenvektorfeld ∇H(x) mit H(x) = −x21 − 0.3x22 . Rechts: Orbits
Gradientenvektorfelder auf riemannschen Mannigfaltigkeiten werden in Anhang G untersucht.
6.1.2
Hamiltonsche Systeme
¨ Durch eine kleine, aber entscheidende Anderung des Differentialgleichungssystems kommen wir zum f¨ ur die Mechanik zentralen Begriff der hamiltonschen Systeme: 6.6 Definition Es sei M ⊆ R2n offen und H ∈ C 2 (M, R). Das DGL-System p˙ i = −
∂H (p, q) ∂qi
, q˙i =
∂H (p, q) ∂pi
(i = 1, . . . , n)
oder, in den Koordinaten x ≡ (p1 , . . . , pn , q1 , . . . , qn ) ≡ (p, q) x˙ = XH (x) mit dem hamiltonschen Vektorfeld XH := J∇H l ∈ Mat(2n, R), heißt hamiltonsche Differentialgleichung. und J := 10l −1 0 6.7 Bemerkungen 1. H wird Hamilton–Funktion genannt, was auf den Zusammenhang mit der obigen Differentialgleichung hinweisen soll.
94
6.1. Gradienten߬ usse und hamiltonsche Systeme
2. H ist ein gebr¨auchliches Symbol f¨ ur die Hamilton–Funktion, das auf Lagranuckgeht. Wie schon aus dessen Lebensdaten 3 hervorgeht, konnte Lage 2 zur¨ grange bei H nicht an Hamilton gedacht haben. 3. Satz 6.3 liefert uns (wegen des Zusammenhangs ∇H = −JXH mit dem Gradientenvektorfeld) ein Kriterium daf¨ ur, ob ein Vektorfeld X : M → R2n auf einem einfach zusammenh¨angenden Phasenraum M hamiltonsch ist. 3 Wir nehmen im Folgenden einfachheitshalber an, dass das Vektorfeld XH vollst¨andig im Sinn der Definition 3.21 ist, H also ein dynamisches System definiert. 6.8 Satz H ist entlang eines Orbits konstant. Beweis: Mit y := Φ(t, x) ∈ M ist d d H Φ(t, x) = DHy Φ(t, x) = DHy J ∇H(y) = ∇H(y), J ∇H(y) . dt dt Es gilt aber f¨ ur v := ∇H(y) ∈ R2n : ) * v, Jv = J v, v = − Jv, v = − v, Jv = 0.
2
Satz 6.8 erlaubt uns, das dynamische System auf die (oft Energieschalen genannten) Niveaumengen H −1 (E) (E ∈ R) zu restringieren. Nach dem Satz u ¨ber die implizite Funktion sind dies f¨ ur regul¨are Werte E von H Untermannigfaltigkeiten von M . ur eine gegebene Dies erm¨oglicht es f¨ ur den Fall n = 1, also M ⊆ R2 , f¨ Funktion H die Orbits, allerdings ohne Zeitparametrisierung, aufzufinden: • Ist ∇H(x) = 0, so ist der Orbit von der Form O(x) = {x}. • Ist dagegen ∇H(x) = 0, dann ist der Orbit O(x) die Zusammenhangskomponente von Σ := {y ∈ M | H(y) = H(x), ∇H(y) = 0}, zu der x geh¨ort. Die Orientierung erhalten wir durch die Richtung, die durch Drehung des Gradienten im Uhrzeigersinn um π/2 entsteht (J entspricht einer solchen Drehung). 1
6.9 Beispiel F¨ ur die Hamilton–Funktion H : R2 → R, H(p, q) := p2 + (q 2 − 1)2 , siehe die nebenstehende Abbildung und Abb. 6.1.1, be3 steht H −1 (1) aus drei Orbits.
0
1
1
p
0
Zusammenfassung der Begriffe: F¨ ur den Phasenraum M ⊆ R2n = Rnp × Rnq nennen wir
1
• n Zahl der Freiheitsgrade, • q ∈ Rnq Ort und p ∈ Rnp Impuls, 2 Joseph
q Niveaulinien von H
Lagrange (1736–1813), franz¨ osischer Mathematiker und mathematischer Physiker. Hamilton (1805–1865), irischer Mathematiker, Physiker und Astronom.
3 William
6. Hamiltonsche Gleichungen und Symplektische Gruppe • q˙ =
∂H ∂p
95
Geschwindigkeit und q¨ Beschleunigung,
• H : M → R Hamilton–Funktion oder Gesamtenergie. • Besitzt der Phasenraum die Form M = Rnp × N mit N ⊆ Rnq , so heißt N Konfigurationsraum.
6.2
Die symplektische Gruppe
6.2.1
Lineare hamiltonsche Systeme
Damit die hamiltonschen DGLn linear werden, muss die Hamilton–Funktion von der Form H : R2n → R , H(x) = H(0) + 12 x, Ax sein mit A ∈ Mat(2n, R) und, ohne Einschr¨ankung der Allgemeinheit, A = A . • Es ergibt sich ∇H(x) = Ax und x˙ = ux mit der Systemmatrix u := JA ∈ Mat(2n, R). • Die Differentialgleichungen bleiben invariant, wenn wir zu H eine Konstante dazuaddieren. Das entspricht physikalisch der Tatsache, dass nicht absolute Energiewerte, sondern nur Energiedifferenzen messbar sind. Wir setzen der Einfachheit halber H(0) := 0. • Die Systemmatrix u erf¨ ullt die Identit¨at u J + Ju = A J J + J2 A = A − A = 0. Das f¨ uhrt uns zu folgender Definition 4 : 6.10 Definition (Symplektische Algebra) Eine Matrix u ∈ Mat(2n, R) und der entsprechende Endomorphismus des R2n heißen infinitesimal symplektisch, wenn (6.2.1) u J + Ju = 0. Da die Bedingung an u linear ist, bilden die infinitesimal symplektischen Endomorphismen einen Unterraum, sp(2n) ⊂ Lin(R2n ). 6.11 Satz tr(u) = 0 f¨ ur u ∈ sp(2n). Beweis: tr (u) = −tr (uJ2 ) = −tr(JuJ) = −tr (u ) = −tr (u).
2
Folgerung: (Lineare) hamiltonsche Systeme sind volumenerhaltend. Beweis: Nach Satz 4.12 ist det exp(ut) = exp tr(u)t = 1.
2
4 Im Buch [Art] von E. Artin wird die symplektische Algebra uber allgemeinen K¨ orpern ¨ statt dem K¨ orper R der reellen Zahlen untersucht.
96
6.2. Die symplektische Gruppe
Der Fluss eines linearen hamiltonschen Systems hat nicht nur die Eigenschaft, volumenerhaltend zu sein. Es gilt auch
exp(ut) J exp(ut) = J
(t ∈ R),
(6.2.2)
denn exp(ut) = exp(u t), also wegen (6.2.1)
−1 . exp(ut) J = J exp(−ut) = J exp(ut)
Gleichung (6.2.2) besagt, dass ein linearer hamiltonscher Fluss die antisymmetrische Bilinearform ω0 : R2n × R2n → R
,
ω0 (u, v) := u, Jv
invariant l¨asst, das heißt ω0 Φt (u), Φt (v) = ω0 (u, v), ¨ahnlich wie eine orthogonale Transformation das kanonische Skalarprodukt des Rn invariant l¨asst. Den mechanischen Bewegungen entspricht damit eine besondere Art von Geometrie, die wir im n¨achsten Kapitel eingehender untersuchen.
6.2.2
Symplektische Geometrie
Die den mechanischen Bewegungen zugrundeliegende symplektische Geometrie ¨ besitzt gewisse Ahnlichkeiten mit der riemannschen Geometrie. Diese werden wir im Folgenden herausarbeiten. 6.12 Definition (Bilinearformen) Sei E ein R–Vektorraum endlicher Dimension n und ω : E × E → R eine Bilinearform. • Die Transponierte ω von ω ist durch ω (e1 , e2 ) := ω(e2 , e1 ) gegeben. • ω heißt symmetrisch, wenn ω = ω, antisymmetrisch, wenn ω = −ω. • Durch ω wird die lineare Abbildung ω : E → E ∗ , ω (e1 ) · e2 := ω(e1 , e2 ) in den Dualraum E ∗ von E induziert. • ω heißt nicht degeneriert, wenn ω (e) = 0 nur f¨ ur e = 0 gilt. • Bez¨ uglich einer Basis (b1 , . . . , bn ) von E ist die darstellende Matrix J ∈ Mat(n, R) von ω durch (J)ik := ω(bi , bk ), (i, k = 1, . . . , n) gegeben. • Der Rang von ω ist der (basisunabh¨angige) Rang der darstellenden Matrizen von ω. • Ist ρ eine Bilinearform auf F und f ∈ Lin(E, F ), dann heißt die Bilinearform f ∗ ρ : E × E → R , f ∗ ρ(e1 , e2 ) := ρ f (e1 ), f (e2 ) der pull-back von ρ mit f .
6. Hamiltonsche Gleichungen und Symplektische Gruppe
97
6.13 Satz (Normalformen) Sei ω Bilinearform auf einem n–dimensionalen R–Vektorraum E. 1. (Tr¨ agheitssatz von Sylvester) Ist ω symmetrisch mit Rang r, dann besitzt bez¨ uglich einer geeigneten Basis die darstellende Matrix von ω die Form, mit ηi ∈ {−1, +1}: ⎞ ⎛ η1 .. ⎟ . ⎜ ⎟ ⎜ ηr J = diag η1 , . . . , ηr , 0 . . . , 0 = ⎜ ⎟ ∈ Mat(n, R). 0 ⎠ ⎝ .. . 0
2. (Satz von Darboux — lineare Version) Ist ω antisymmetrisch mit Rang uglich einer geeigneten Basis besitzt die r, so ist r = 2m, m ∈ N0 und bez¨ darstellende Matrix von ω die Form (mit Einheitsmatrix 1l ∈ Mat(m, R)) J=
0
−1l 0 1l 0 0 0 0 0
∈ Mat(n, R).
Beweis: Diese Aussagen werden oft in der Vorlesung Lineare Algebra bewiesen. 1. Es gilt die Polarisationsidentit¨at ω(e, f ) = 14 ω(e+f, e+f )−ω(e−f, e−f ) . Ist also ω= 0, dann existiert ein Vektor eˆ1 mit c1 := ω(ˆ e1 , eˆ1 ) = 0. Setze e1 := eˆ1 / |c1 | und η1 := ω(e1 , e1 ). Wir betrachten den von e1 aufgespannten eindimensionalen Unterraum E1 ⊂ E und E2 := {e ∈ E | ω(e, e1 ) = 0}. Es gilt E1 ∩E2 = {0} und E1 +E2 = E, denn f¨ ur z ∈ E gilt z − ω(z, e1 )e1 ∈ E2 . Wir betrachten die Einschr¨ankung von ω auf E2 und fahren induktiv fort. 2. F¨ ur ω = 0 existieren eˆ1 , eˆm+1 ∈ E mit c1 := ω(ˆ em+1 , eˆ1 ) = 0. Setze e1 := eˆ1 /c1 und em+1 := eˆm+1 . Es ist ω(e1 , e1 ) = ω(em+1 , em+1 ) = 0 und ω(em+1 , e1 ) = −ω(e1 , em+1 ) = 1. Sei P1 := span(e1 , em+1 ) ⊂ E und E2 := e ∈ E | ω(e, f ) = 0 f¨ ur alle f ∈ P1 . ur z ∈ E gilt Es gilt E2 ∩ P1 = {0} und E2 + P1 = E, denn f¨ z + ω(e1 , z)em+1 − ω(em+1 , z)e1 ∈ E2 . Wir behandeln induktiv die Einschr¨ankung von ω auf E2 etc.
2
6.14 Definition • Eine symplektische Form auf einem endlich–dimensionalen R–Vektorraum E ist eine nicht degenerierte antisymmetrische Bilinearform ω : E × E → R.
98
6.2. Die symplektische Gruppe
• (E, ω) heißt dann symplektischer Vektorraum. • Sind (E, ω) und (F, ρ) symplektisch, so heißt eine lineare Abbildung f : E → F symplektisch, wenn f¨ ur den pull-back gilt: f ∗ ρ = ω. 6.15 Bemerkungen 1. Auf dem arithmetischen R–Vektorraum E := Rnp × Rnq ist die symplektische Normalform ω0 gleich n ω0 (p, q), (p , q ) := qj pj − pj qj
(p, q), (p , q ) ∈ E .
(6.2.3)
j=1
l Auf E entspricht die Multiplikation mit der Matrix J = 10l −1 dem Au0 tomorphismus E → E, (p, q) → (−q, p). Die Abbildung id : E → Cn , (p, q) → p + iq konjugiert also die Multiplikation mit J und die Multiplikation mit der imagin¨aren Einheit i ∈ C. Man bezeichnet daher J als eine komplexe Struktur . Bez¨ uglich des Standard-Skalarproduktes u, v =
n
uj vj
u, v ∈ Cn
j=1
besitzt damit bei Identifikation von E mit Cn die symplektische Form ω0 die Gestalt u, v ∈ Cn . ω0 (u, v) = Im(u, v) 2. Die symplektischen Abbildungen f ∈ Lin(E) sind diejenigen, die die symplektische Form ω erhalten, das heißt f ∗ ω = ω. Nach Satz 6.13 finden wir eine l Basis von E, in der die darstellende Matrix von ω gleich J = 10l −1 ist. Es 0 sei A die darstellende Matrix von f . Dann gilt A JA = J.
(6.2.4)
3. Zwar sind symplektische Abbildungen volumenerhaltend, aber im Allgemeinen sind volumenerhaltende Abbildungen nicht symplektisch. Betrachten wir beispielsweise einen vierdimensionalen Vektorraum E mit Basis e1 , . . . , e4 und symplektischer Bilinearform ω mit Matrix J. Dann ist f : E → E, (e1 , e2 , e3 , e4 ) → (−e1 , −e2 , e3 , e4 ) volumenerhaltend, aber ω f (e1 ), f (e3 ) = −ω(e1 , e3 ). L¨asst dagegen ein Endomorphismus f des R2 die orientierte Fl¨ache invariant, so ist f auch symplektisch. Denn f¨ ur alle Matrizen A ∈ Mat(2, R) gilt (A JA)J−1 = det(A)1l. Daraus folgt (6.2.4) genau dann, wenn der durch A gegebene Endomorphismus f eine fl¨achenerhaltende Abbildung ist. 3 6.16 Satz Sei (E, ω) ein symplektischer Vektorraum, dann bildet die Menge der symplektischen Endomorphismen f : E → E unter der Komposition eine Gruppe, genannt die symplektische Gruppe Sp(E, ω).
6. Hamiltonsche Gleichungen und Symplektische Gruppe
99
6.17 Bemerkung (Orthogonale Gruppe) F¨ ur einen Euklidischen Raum (E, ω) mit positiv definiter symmetrischer Bilinearform ω erhalten wir analog die Orthogonale Gruppe O(E, ω) der Drehspiegelungen von E, siehe Beispiel E.19. 3 Beweis: • Ist f symplektisch, so ist f ∈ GL(E), also existiert f −1 . Es gilt dann (f −1 )∗ ω = (f ∗ )−1 ω = (f ∗ )−1 (f ∗ ω) = ω. Also ist auch f −1 symplektisch. • F¨ ur symplektische f, g ist (f ◦ g)∗ (ω) = g ∗ ◦ f ∗ (ω) = g ∗ ω = ω. • Außerdem ist die Identische Abbildung symplektisch, also Sp(E, ω) = ∅. 2 Wegen Satz 6.13 ist Sp(E, ω) isomorph zur Gruppe Sp(2n) := Sp(2n, R) := Sp(R2n , ω0 ),
(6.2.5)
wobei ω0 bez¨ uglich der kanonischen Basis des R2n die darstellende Matrix J besitzt (ganz analog braucht man nach Satz 6.13 statt O(E, ω) nur die orthogonale Gruppe O(n) := O(Rn , ω0 ) zu betrachten, deren kanonisches inneres Produkt ω0 die darstellende Matrix 1l hat). 6.18 Beispiel Der Zeit–t–Fluss Φt (x) = exp(ut)x, u = JA eines linearen hamiltonschen Systems mit Hamilton–Funktion H(x) = 12 x, Ax, A ∈ Sym(2n, R) ist Element der symplektischen Gruppe Sp(2n), denn es gilt (6.2.2). 3 Der Betrag der Determinante eines symplektischen Endomorphismus ist gleich 1, denn es gilt mit (6.2.4) (det A)2 = (det A)2 det(J) = det(A JA) = det(J) = 1. Wie in Aufgabe B.16 gezeigt werden soll, gilt sogar det(A) = +1. Es folgt unmittelbar, dass das Produkt der C–Nullstellen des charakteristischen Polynoms eines symplektischen Endomorphismus 1 ist. 6.19 Satz (Eigenwerte symplektischer Endomorphismen) Sei f ∈ Sp(E, ω) und λ ∈ C Eigenwert von f mit (algebraischer) Vielfachheit k. Dann sind auch λ, 1/λ und 1/λ Eigenwerte mit Vielfachheit k. Die Multiplizit¨aten etwaiger Eigenwerte +1 und −1 sind gerade. Beweis: Die Zahl der Freiheitsgrade von (E, ω) nennen wir n :=
1 2
dim(E).
• Dass mit λ auch λ Eigenwert ist, folgt aus der Tatsache, dass f reell ist. • Wir beweisen, dass 1/λ Eigenwert ist, indem wir das charakteristische Polynom von f betrachten. Wir w¨ahlen dazu (mit dem Normalform-Satz 6.13) eine Basis von E, in der ω die darstellende Matrix J besitzt und f die Matrix A. Es gilt dann f¨ ur λ ∈ C\{0} det(A − λ1l) = det J(A − λ1l)J−1 = det JAJ−1 − λ1l da A JA = J oder JAJ−1 = (A )−1 = det (A )−1 − λ1l = det A−1 − λ1l = det A−1 (1l − λA) = det(A−1 ) det(1l − λA) = det(1l − λA) = λ2n det(λ−1 1l − A) = λ2n det(A − λ−1 1l).
100
6.2. Die symplektische Gruppe
• Das charakteristische Polynom P (λ) := det(A − λ1l) erf¨ullt also die Gleichung P (λ) = λ2n P (1/λ).
(6.2.6)
Einen Eigenwert λ0 ∈ C der Vielfachheit k k¨ onnen wir abspalten: P (λ) = (λ0 − λ)k Q(λ),
(6.2.7)
so dass mit (6.2.6) und (6.2.7) k 1 1 1 P = λ−2n P (λ) = λ−2n (λ0 − λ)k Q(λ) = λk0 − λk−2n Q(λ). λ λ λ0 Da Q ein Polynom vom Grad 2n −k in λ ist, ist λ → λk−2n Q(λ) ein Polynom in 1/λ. Also ist 1/λ0 Nullstelle der Multiplizit¨at l ≥ k von P (1/λ). Vertauschen der Rollen von λ0 und 1/λ0 zeigt l = k. • Es gilt genau dann λ0 = 1/λ0 , wenn λ0 ∈ {±1}. Da insgesamt 2n Eigenwerte existieren und die Zahl der Eigenwerte = ±1 gerade ist, muss die Multiplizit¨at der 1 zusammen mit der der −1 gerade sein. Wegen det A = 1 folgt dann auch einzeln gerade Multiplizit¨at. 2 F¨ ur dim(E) = 2 k¨ onnen also die in Abbildung 6.2.1 skizzierten F¨alle auftreten.
λ=
1 λ
λ=
1 λ
(2)
1/λ
(2)
λ=λ
Abbildung 6.2.1: Komplexe Eigenwerte von f ∈ Sp(2) Als Matrixgruppe ist Sp(2n) = {A ∈ Mat(2n, R) | F (A) = J} mit F : Mat(2n, R) → Alt(2n, R)
, A → A JA,
siehe (6.2.4). Da J regul¨arer Wert von F ist, wird die symplektische Gruppe gem¨aß Definition 2.34 zu einer Untermannigfaltigkeit von Mat(2n, R). Sie ist damit sogar eine Lie–Gruppe (siehe Definition E.16), das heißt, Multiplikation und Inversenbildung sind glatte Abbildungen. F¨ ur einen Weg in Sp(E, ω), also eine stetige Abbildung c : [0, 1] → Sp(E, ω), k¨onnen bei Ver¨anderung des Parameters t isolierte Eigenwerte von c(t) auf der reellen Achse beziehungsweise dem Einheitskreis diese nicht verlassen, siehe Bild 6.2.2. Wir werden sehen, dass aus dieser Eigenschaft eine Form von Stabilit¨at hamiltonscher Systeme unter kleinen St¨ orungen folgt.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
101
(2) (2)
Abbildung 6.2.2: Komplexe Eigenwerte von f ∈ Sp(4)
6.2.3
Die symplektische Algebra
In Verallgemeinerung von Definition 6.10 definieren wir: 6.20 Definition • Eine lineare Abbildung u ∈ Lin(E) heißt infinitesimal symplektisch bez¨ uglich einer symplektischen Bilinearform ω, wenn (e1 , e2 ∈ E). (6.2.8) ω u(e1 ), e2 + ω e1 , u(e2 ) = 0 Die Menge dieser Abbildungen bezeichnen wir mit sp(E, ω). • Der Kommutator von u, v ∈ Lin(E) ist [u, v] := u ◦ v − v ◦ u. Wegen der Linearit¨at von (6.2.8) in u ist sp(E, ω) ein Unterraum von Lin(E). Es gilt sogar 6.21 Lemma sp(E, ω), [·, ·] ist eine Lie–Algebra. Beweis: • Lin(E), [·, ·] ist eine Lie–Algebra, da der Kommutator bilinear und alternierend ([u, u] = u ◦ u − u ◦ u = 0) ist, und f¨ ur u, v, w ∈ Lin(E) die Jacobi–Identit¨at erf¨ ullt ist: [u, [v, w]] + [v, [w, u]] + [w, [u, v]] = u ◦ v ◦ w − u ◦ w ◦ v −v ◦ w ◦ u + w ◦ v ◦ u + v ◦ w ◦ u − v ◦ u ◦ w − w ◦ u ◦ v + u ◦ w ◦ v +w ◦ u ◦ v − w ◦ v ◦ u − u ◦ v ◦ w + v ◦ u ◦ w = 0 • Da f¨ ur u, v ∈ sp(E, ω) ⊂ Lin(E) und beliebige e1 , e2 ∈ E gilt ω [u, v]e1 , e2 + ω e1 , [u, v]e2 = ω u ◦ v(e1 ), e2 − ω v ◦ u(e1 ), e2 + ω e1 , u ◦ v(e2 ) − ω e1 , v ◦ u(e2 ) = −ω v(e1 ), u(e2 ) + ω u(e1 ), v(e2 ) − ω u(e1 ), v(e2 ) + ω v(e1 ), u(e2 ) = 0, ist auch [u, v] ∈ sp(E, ω).
2
Analog zu Satz 6.19 u ur sp(E, ω) die ¨ber die symplektische Gruppe erh¨alt man f¨ folgende Aussage:
102
6.2. Die symplektische Gruppe
6.22 Satz (Symplektische Algebra) Sei (E, ω) ein symplektischer Vektorraum. • Ist λ ∈ C Eigenwert von u ∈ sp(E, ω) mit (algebraischer) Multiplizit¨at k, so sind auch −λ, λ, −λ Eigenwerte der Multiplizit¨at k. • Ist Null Eigenwert von u ∈ sp(E, ω), so besitzt er gerade Multiplizit¨at. 3
6.23 Aufgabe (Symplektische Algebra) Beweisen Sie Satz 6.22.
6.24 Beispiel u ∈ sp(R2 ). Hier kann das Eigenwertpaar nur reell oder rein imagin¨ar sein, siehe Abbildung 6.2.3. 3
λ = −λ λ = −λ
λ=λ (2)
−λ = −λ
Abbildung 6.2.3: Eigenwerte von u ∈ sp(R2 ) Analog zur in Bemerkung 4.13 besprochenen Abbildung exp : Mat(u, R) → GL(n, R) betrachten wir die Exponentialabbildung (siehe deren allgemeine Definition (E.3.1)) sp(E, ω) → Sp(E, ω) , u → exp(u) von der symplektischen Lie–Algebra in die symplektische Lie–Gruppe. Tats¨achlich ist exp(u) ∈ Sp(E, ω), denn wegen (6.2.8) ist ω exp(u)e1 , exp(u)e2 = ω e1 , exp(−u) exp(u)e2 = ω(e1 , e2 ). Wir sehen, dass die Eigenwerte λ von u mit Re(λ) > 0 zu Eigenwerten exp(λ) von exp(u) mit Betrag | exp(u)| > 1 werden. 6.25 Bemerkung (Liapunov-Stabilit¨ at) Erinnern wir uns nun an die Tatsache (Beispiel 6.18), dass f¨ ur die quadratische Hamilton–Funktion H(x) = 12 x, Ax die Differentialgleichung x˙ = XH (x) = JAx die L¨osung Φt (x) = exp(ut)x mit u := JA ∈ sp(R2n ) besitzt, dann wird klar, dass der Fixpunkt 0 h¨ochstens dann liapunov-stabil sein kann, wenn alle Eigenwerte von u rein imagin¨ar sind. 3 6.26 Aufgabe (Symplektische Matrizen) Es sei J =
0
−1l 1l 0
∈ Mat(2n, R).
(a) Zeigen Sie, dass u ∈ Mat(2n, R) genau dann infinitesimal symplektisch ist A B ) mit A, B, C, D ∈ Mat(n, R), D = −A (u J + Ju = 0), wenn u = ( C D und B, C symmetrisch sind. Daraus folgt dim sp(2n) = n(2n + 1).
6. Hamiltonsche Gleichungen und Symplektische Gruppe
103
(b) Zeigen Sie, dass a ∈ Mat(2n, R) genau dann symplektisch ist, also a Ja = A B ) mit A, B, C, D ∈ Mat(n, R), A C und B D symmeJ, wenn a = ( C D trisch sind und A D − C B = 1l. (c) Zeigen Sie mit Hilfe von (b) Sp(2, R) ∼ = SL(2, R). Zeigen Sie außerdem, dass Sp(2, R) hom¨ oomorph zum 3–dimensionalen Volltorus S 1 × B, mit der offenen Kreisscheibe B := {x ∈ R2 | x < 1} ist. Verwenden Sie dazu den Satz u ¨ber die Polarzerlegung aus Anhang E.18: Jede Matrix M ∈ GL(n, R) besitzt eine eindeutige Produktzerlegung M = OP mit O ∈ O(n) und P ∈ Sym(n, R) positiv. (d) Zeigen Sie, dass genau dann die Eigenwerte von M ∈ Sp(2, R) degeneriert sind, das heißt beide gleich +1 bzw. gleich −1, wenn in der Polarzerlegung b cos(ϕ) − sin(ϕ) gilt: cos(ϕ) = ±1/ cosh a2 + b 2 . M = sin(ϕ) cos(ϕ) exp ab −a Die beiden Hyperfl¨ache dieser parabolischen Matrizen trennen Sp(2, R) in vier offene Zusammenhangskomponenten auf. Zwei von diesen bestehen aus elliptischen Matrizen M , d.h. solchen mit von ±1 verschiedenen Eigenwerten auf dem Einheitskreis. Zwei bestehen aus hyperbolischen Matrizen, das heißt solchen mit von ±1 verschiedenen Eigenwerten auf der reellen Achse. Dies ist in der Illustration am Kapitelanfang, Seite 89, dargestellt. 3 6.27 Weiterf¨ uhrende Literatur Die Normalformen von infinitesimal symplektischen und von symplektischen Abbildungen unter symplektischen Konjugationen werden in den Artikeln [Wil] von Williamson und [LaMe] von Laub und Meyer klassifiziert und konstruiert. 3
6.3
Lineare hamiltonsche Systeme
Die linearen hamiltonschen Vektorfelder X : E → E auf dem symplektischen Vektorraum (E, ω) entsprechen den Elementen von sp(E, ω). Ohne Beschr¨ ankung l der Allgemeinheit nehmen wir an, dass (E, ω) der R2d mit der durch J = 10l −1 0 gegebenen symplektischen Struktur ist. Dann besitzt das Vektorfeld eine Darstellung X(x) = J∇H(x)
mit
H(x) =
1 2
x, Ax
(x ∈ R2d )
und A ∈ Sym(2d, R), also ∇H(x) = Ax. Wie jede lineare Differentialgleichung mit konstanten Koeffizienten wird auch die hamiltonsche Differentialgleichung x˙ = X(x) durch x(t) = exp(Xt)x0 = Φt (x0 ) gel¨ost. Hinter diesen Allgemeinheiten verstecken sich aber viele physikalische und mathematische Besonderheiten, denen wir in diesem Kapitel nachgehen. Zun¨achst bedeutet die Linearit¨at f¨ ur die Bewegung auf der Energiefl¨ache ΣE := H −1 (E), E = 0, dass sich diese durch Skalierung aus der auf Σe , e :=
104
6.3. Lineare hamiltonsche Systeme
sign(E) ergibt. Ist n¨amlich x ∈ ΣE , dann ist xe := x/ |E| ∈ Σe und Φt (x) = |E|Φt (xe ). Es gen¨ ugt also immer, die Energien 1, 0 und −1 zu betrachten.
6.3.1
Harmonische Oszillatoren
In der Physik werden harmonische Oszillatoren benutzt, um n¨aherungsweise die Dynamik hamiltonscher Systeme bei kleinen Schwankungen um eine stabile Ruhelage zu beschreiben. Nach Bemerkung 6.25 f¨ uhrt ein solches lineares hamiltonsches Vektorfeld X ∈ sp(E, ω) bestenfalls dann zur Liapunov–Stabilit¨at der Ruhelage 0 bez¨ uglich der Differentialgleichung x˙ = X(x), wenn alle Eigenwerte von X rein imagin¨ar sind. 6.28 Definition Eine lineare Abbildung X ∈ Lin(E) heißt halbeinfach, wenn ihr Minimalpolynom 5 keine quadratischen Faktoren enth¨alt, also die algebraischen und geometrischen Multiplizit¨aten der Eigenwerte u ¨bereinstimmen. 6.29 Lemma 1. Ist X ∈ sp(E, ω) halbeinfach und sind die Eigenwerte von X rein imagin¨ar, dann besitzt X eine symplektische Basis pˆ1 , . . . , pˆd , qˆ1 , . . . , qˆd ∈ E mit X(ˆ pk ) = −ωk qˆk
, X(ˆ qk ) = ωk pˆk
(k = 1, . . . , d)
und den Eigenwerten ±iω1 , . . . , ±iωd von X. 2. Die Voraussetzungen in 1. sind z.B. erf¨ ullt, wenn X hamiltonsches Vektorfeld einer positiv (oder negativ) definiten quadratischen Form H : E → R ist. Beweis: 1. Jedenfalls k¨onnen wir die Eigenwerte von X in der Form ±iωk mit ωk ≥ 0 schreiben und wir w¨ahlen komplexe Eigenvektoren eˆ± k zu diesen Eigenwerten, also X(ˆ e± ˆ± ur ωk = 0 existieren linear unabh¨angige eˆ± k ) = ±iωk e k . Auch f¨ k, denn nach Satz 6.22 ist die Multiplizit¨at des Eigenwertes 0 gerade. ˆk ± iˆ qk mit pˆk , qˆk ∈ Bei Zerlegung in Real- und Imagin¨arteil, das heißt eˆ± k =p E, ergibt sich durch Koeffizientenvergleich X(ˆ pk ) = ∓ωk qˆk
,
X(ˆ qk ) = ±ωk pˆk .
Da X halbeinfach ist, erhalten wir eine symplektische Basis. 2. Nach Voraussetzung gilt ω(X, ·) = dH. Ist H positiv definit, dann definiert diese quadratische Form das Skalarprodukt ·, ·H : E × E → R , x, yH = 12 H(x + y) − H(x − y) . (6.3.1) 5 das
normierte Polynom p kleinsten Grades, f¨ ur das p(X) = 0 ist.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
105
Wir w¨ahlen eine Orthonormalbasis von E, ·, ·H . In dieser hat H(x) = 1 1 x, xH die ˜ x, x ˜, und die symplektische Form die Darstellung 2 2 - Gestalt . ˜ ˜ ω(x, y) = x ˜, J˜ y mit J = −˜ J ∈ Mat(2d, R). Also hat das hamiltonsche Vektorfeld X die Darstellung x ˜ → ˜ J˜ x. Als antihermitesche Matrix ist ˜J nor6 mal und damit halbeinfach, mit rein imagin¨aren Eigenwerten. F¨ ur eine negativ definite quadratische Form H ¨andert man das Vorzeichen in (6.3.1). 2 Unter den Voraussetzungen des ersten Teils von Lemma 6.29 besitzt das hamiltonsche Vektorfeld X in der angegebenen Basis die Hamilton–Funktion H : R2d → R
, H(p, q) =
d
ωk 2 k=1 2 (pk
+ qk2 ).
(6.3.2)
(6.3.2) ist eine Normalform-Darstellung eines harmonischen Oszillators in d Freiheitsgraden und mit den Frequenzen ωk ∈ R. Seine hamiltonschen Gleichungen p˙k = −ωk qk
,
q˙k = ωk pk
besitzen die L¨osungen cos(ωk t) pk (t) = qk (t) sin(ωk t)
(k = 1, . . . , d)
− sin(ωk t) cos(ωk t)
pk (0) qk (0)
.
(6.3.3)
Diese sind also alle beschr¨ankt, und die Ruhelage ist liapunov–stabil. Nur dann sind aber alle Energiefl¨achen ΣE = H −1 (E) kompakt, wenn H positiv oder negativ definit ist, die Frequenzen ωk also alle das gleiche Vorzeichen besitzen. 6.30 Bemerkung (Indefinite Hamilton–Funktion) Der Fall einer indefiniten quadratischen Funktion (6.3.2) tritt zum Beispiel bei der Linearisierung himmelsmechanischer Probleme auf (siehe Siegel und Moser [SM], §36). Dann ist es schwieriger zu entscheiden, ob eine kleine St¨orung von (6.3.2) zu einer hamiltonschen Dynamik f¨ uhrt, deren Ruhelage immer noch stabil ist. 3 Wir schauen uns den definiten Fall genauer an und nehmen ohne Beschr¨ankung an, dass alle Frequenzen positiv sind. Die Phasenraumfunktionen ωk 2 pk + qk2 (k = 1, . . . , d) (6.3.4) Fk : R2d → R+ , Fk (p, q) := 2 f 1 .. ∈ Rd ist genau dann sind Konstanten der Bewegung (6.3.3), und f = . fd
regul¨arer Wert im Bild von
F 1 .. F := : R2d → (R+ )d , . Fd
6A
∈ Mat(n, C) heißt normal, wenn A A = AA .
(6.3.5)
106
6.3. Lineare hamiltonsche Systeme
wenn die fk > 0 sind. Dann ist F −1 (f ) ⊂ R2d eine d–dimensionale Untermannigfaltigkeit des Phasenraums, die flussinvariant und diffeomorph zu einem d–dimensionalen Torus ist. Es ist nun wichtig zu verstehen, dass qualitative Eigenschaften der Dynamik stark von zahlentheoretischen Beziehungen zwischen den Frequenzen abh¨angen. Wir werden dies im Kapitel 13 u ¨ber integrable Systeme noch genauer sehen, erlauben uns aber jetzt schon einen Vorgriff. ω1 .. ∈ Rd heißt rational un6.31 Definition Der Frequenzvektor ω := . ωd
d abh¨ angig, wenn es kein k ∈ Zd \{0} gibt mit ω, k ≡ i=1 ωi ki = 0. 6.32 Satz F¨ ur jede positiv definite Hamilton–Funktion (6.3.2) des harmonischen Oszillators und Werte E > 0 der Energie gilt: • Es gibt auf ΣE mindestens d periodische Orbits. • Wenn ω rational unabh¨angig ist, gibt es auf ΣE nur d periodische Orbits. Beweis: • F¨ ur k = 1, . . . , d betrachten wir x(0) = p(0), q(0) ∈ ΣE , gegeben durch pi (0) = 0 (i = 1, . . . , d) und qi (0) = 2E f¨ ur i = k und qi (0) = 0 sonst. ωk Dann ist der Orbit durch x(0) nach (6.3.3) periodisch mit Minimalperiode 2π/ωk . T > 0, dann muss T ein ganzzahliges • Ist x(0) ∈ ΣE periodisch mit Periode Vielfaches von 2π/ωk sein, falls Fk X(0) > 0 gilt. Ist dies f¨ ur genau ein k der Fall, entspricht dies den obigen Normalschwingungen. Sonst sei Fki X(0) > 0 ur geeignete k1 , k2 ∈ N: f¨ ur k1 = k2 , also f¨ T = 2πk1 /ωk1
und T = 2πk2 /ωk2 ,
das heißt ωk1 k2 − ωk2 k1 = 0. Damit ist ω nicht rational unabh¨angig.
2
6.33 Bemerkungen 1. Die im rational unabh¨angigen Fall auftretende Zahl von nur d periodischen Orbits auf ΣE ⊂ R2d ist sehr niedrig, und es wurde gezeigt, dass sie auch f¨ ur große Klassen nichtlinearer hamiltonscher Differentialgleichungen nicht unterschritten wird (siehe Ginzburg [Gi]). 2. Betrachten wir die Bahnkurve t → q(t) im Konfigurationsraum Rd , dann sind deren Bilder f¨ ur den Fall der Normalschwingungen Strecken auf der kten Achse. Im Fall rational unabh¨angiger Frequenzen f¨ ullt allgemeiner die Bahnkurve mit Anfangsbedingungen x0 ∈ R2d undf := F (x0 ) ∈ (R+ )d den Quader
k (6.3.6) Q(x0 ) := q ∈ Rd ∀k = 1, . . . , d : |qk | ≤ 2f ωk dicht aus (siehe Abbildung 6.3.1 links). Denn dieser Quader ist die Projektion des Torus F −1 (f ) ⊂ R2d auf den Konfigurationsraum, und die Bahn ist nach 3 Korollar 15.8 auf F −1 (f ) dicht.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
107
Wir schauen uns als N¨achstes Frequenzen ω1 , . . . , ωd > 0 an, die alle ganzzahlige Vielfache einer Grundfrequenz ω0 > 0 sind. Dann sind alle Orbits geschlossen und T := 2π/ω0 ist eine Periode (nicht notwendig die Minimalperiode). In diesem Fall f¨ ullen die Ortsraumtrajektorien den Quader (6.3.6) nicht dicht aus, außer wenn eine Normalschwingung vorliegt. F¨ ur d = 2 heißen die (geschlossenen) Kurven im R2 Lissajous-Figuren (siehe Abbildung 6.3.1 rechts). 6.34 Aufgaben (Lissajous–Figuren) 1. Lesen Sie das Frequenzverh¨altnis ω2 /ω1 ∈ Q des harmonischen Oszillators aus der Lissajous–Figur einer Trajektorie ab (dies ist nur m¨ oglich, wenn keine Normalschwingung vorliegt). 2. Gegeben sei ein harmonischer Oszillator mit zwei Freiheitsgraden und irrationalem Frequenzverh¨altnis ω2 /ω1 . Wir betrachten f¨ ur E > 0 einen Punkt ur die Hamilton–Funktion (6.3.2). Welche Teilq ∈ R2 mit H(0, q) ≤ E f¨ menge des elliptischen Gebiets {Q ∈ R2 | H(0, Q) ≤ E} kann man mit den Anfangswerten {(p, q) | H(p, q) = E} erreichen? Schließen Sie aus diesem Beispiel, dass der Satz G.15 von Hopf und Rinow u ¨ber die Existenz einer Verbindungsgeod¨ate zwischen zwei vorgegebenen Punkten kein allgemeing¨ ultiges Analogon f¨ ur die Bewegung im Potential besitzt (siehe aber Satz 11.6). 3 Dabei beginnen wir mit dem einfachsten Fall ω1 = . . . = ωd = ω0 gleicher Frequenzen. Dann ist die Bewegung (6.3.3) periodisch mit Periode T = 2π/ω0 , und f¨ ur E > 0 sind alle Orbits in ΣE diffeomorph zur Kreislinie S 1 . Ohne Einschr¨ankung nehmen wir E = 12 an, also ΣE = S 2d−1 = {x ∈ R2d | x = 1} ∼ = {y ∈ Cd | y = 1}. ¨ Der Ubergang zu komplexen Koordinaten yk = pk +iqk (k = 1, . . . , d) erm¨oglicht die Darstellung der Bewegung (6.3.3) in der Form t ∈ R, z0 ∈ S 2d−1 . (6.3.7) z(t) = eiω0 t z0
q2
q2
q1
q1
Abbildung 6.3.1: Lissajous-Figuren: Trajektorien endlicher L¨ange von√harmonischen Oszillatoren mit zwei Freiheitsgraden und Frequenzverh¨altnis 2 (links) beziehungsweise 5/3 (rechts)
108
6.3. Lineare hamiltonsche Systeme
Der Orbit durch z0 ist also die Schnittmenge der Sph¨are S 2d−1 mit dem durch z0 aufgespannten eindimensionalen Unterraum Cz0 ⊂ Cd . Wir erhalten damit folgende Aussage (vergleiche auch mit dem Satz E.36 im Anhang): 6.35 Satz Sind in der Hamilton–Funktion (6.3.2) des harmonischen Oszillators alle Frequenzen ωk gleich, dann ist der Raum aller Orbits auf ΣE der projektive Raum CP(d − 1). Dies ist eine kompakte Mannigfaltigkeit der reellen Dimension dimR CP(d − 1) = 2(d − 1), was ja aus der Darstellung CP(d − 1) ∼ = S 2d−1 /S 1 folgt. 6.36 Bemerkung (Orbits des harmonischen Oszillators f¨ ur ω1 = ω2 ) Im Fall d = 2 ist damit die Mannigfaltigkeit der Orbits auf ΣE die Zwei-Sph¨are CP(1) ∼ = S 2 . Dies ergibt sich aus (6.3.7), wenn man beachtet, dass nicht beide Komponenten von z(t) = zz12 (t) verschwinden, und dass (z.B. f¨ ur z2 = 0) der (t)
x3 ∈ C zeitunQuotient zz12 (t) (t) abh¨angig wird. Dieser charakterisiert den Orbit, und mittels zweidimensionaler stereographischer Projektion kann man die Quotienten zz12 und zz21 als zwei die Fl¨ache S 2 u ¨berdeckende Koordinatensystex2 me auffassen. Mittels dreidimensionaler stereographischer Projektion kann man die Energiefl¨ache ΣE ∼ = S 3 mit R3 ∪ {∞} identifizieren und damit die Orbits des harmonischen Oszillators darstellen, siehe x1 Abbildung. Die Surjektion 3 2 π:S →S , (z1 , z2 ) → 2Re(z1 z 2 ) , 2Im(z1 z 2 ) , |z2 |2 − |z1 |2 (mit S 3 = {z ∈ C2 | z = 1} und S 2 = {x ∈ R3 | x = 1}) ist wegen der Konstanz von π flussinvariant (π ◦ Φt = π) und heißt Hopf-Abbildung. Diese besitzt zahlreiche geometrische Anwendungen (siehe auch Kapitel I von Bates und Cushman [CB]). Zwar sind f¨ ur die Basispunkte o ∈ S 2 die Fasern π−1 (o) ⊂ S 3 , also die Orbits, von der Form S 1 , aber das B¨ undel ist nicht trivial, denn S 3 ist nicht diffeomorph 7 7 Das folgt zum Beispiel aus der Feststellung, dass S 3 im Gegensatz zu S 1 , also auch zu angend ist, siehe Definition A.22. S 2 × S 1 , einfach zusammenh¨
6. Hamiltonsche Gleichungen und Symplektische Gruppe
109
zu S 2 × S 1 . Wie man in der (stereographisch auf den R3 projizierten) Abbildung sieht, winden sich die Orbits umeinander. 3 6.37 Bemerkung (Verschlingungszahl) F¨ ur zwei sich nicht schneidende stetig differenzierbare geschlossene Kurven c1 , c2 : S 1 → R3 ist die Gauss–Abbildung G : T2 → S 2
,
(t1 , t2 ) →
c1 (t1 ) − c2 (t2 )
c1 (t1 ) − c2 (t2 )
eine Abbildung zwischen zwei kompakten Fl¨achen, deren Jacobi-Determinante f¨ ur t := (t1 , t2 ) ∈ T2 = S 1 × S 1 und Δc(t) := c1 (t1 ) − c2 (t2 ) gleich c1 (t1 ) c2 (t2 ) , det DG(t) = det G(t), Δc(t) Δc(t) ist. Da der Fl¨acheninhalt der Sph¨are S 2 gleich 4π ist, ist das Verschlingungsintegral 1 LK(c1 , c2 ) := det DG(t) dt1 dt2 (6.3.8) 4π T2 ganzzahlig. Sein Wert wird Verschlingungszahl genannt und beschreibt anschaulich die Anzahl der Verschlingungen (englisch: linking number ) der beiden Raumkurven.8 Das im Kasten abgedruckte Zitat von Gauss zeigt, dass auch dieses topologische Konzept durch ein mechanisches Problem angeregt wurde. F¨ ur zwei sich nicht schneidende differenzierbare geschlossene Kurven c1 , c2 : S 1 → S 3 gibt es immer einen Punkt n ∈ S 3 , der nicht im Bild der Kurven liegt. uglich n stereographisch auf R3 , so k¨onnen wir analog Projizieren wir S 3 \{n} bez¨ LK(c1 , c2 ) definieren. Diese Zahl ist unabh¨angig von der Wahl von n, denn der Wert ist ganzzahlig und stetig in n. 3 Die Anf¨ ange der Knotentheorie Die m¨oglichen geozentrischen Positionen der Bahn eines Planeten oder Asteroiden bilden eine Teilmenge der Himmelskugel, die von C.F. Gauss Zodiacus genannt wurden. Im Fall der Planeten ist dieser bandf¨ ormig. Um die analoge Fragestellung f¨ ur die neu beobachteten Asteroiden zu erl¨autern, traf Gauss in seiner 1804 erschienenen astronomischen Arbeit eine Unterscheidung: In Ansehung der Lage der Planetenbahn gegen die Erdbahn sind drei ” F¨alle zu unterscheiden. Entweder schließt jene diese ein, oder diese jene, oder beide einander (gleich Kettenringen).” ... Wie sich schon aus Gr¨ unden der ” Geometrie der Lage darthun l¨asst”, nimmt der Zodiacus im letzteren Fall den ” ganzen Himmel” ein. Zitiert nach M. Epple [Ep], Seite 65.
8 F¨ 2 der Gauss–Abbildung G ist die Verschlingungsur einen beliebigen regul¨ aren Wert s ∈ S
zahl gleich ihrem Abbildungsgrad deg(G) = t∈G−1 (s) sign det(DG(t)) .
110
6.3. Lineare hamiltonsche Systeme
6.38 Aufgabe (Verschlingungszahl) Berechnen Sie f¨ ur die Minimalperiode die Verschlingungszahl der beiden Normalschwingungen eines harmonischen Oszillators. Die Frequenzen seien ω1 = n1 ω0 , ω2 = n2 ω0 , mit teilerfremden n1 , n2 ∈ N. Schließen Sie aus der Stetigkeit von (6.3.8) auf die Verschlingungszahl f¨ ur beliebige Paare voneinander verschiedener Orbits in ΣE . Vergleichen Sie mit der Abbildung auf Seite 108. 3
6.3.2
Harmonische Gitterschwingungen
Wir wissen, dass sich lineare hamiltonsche Differentialgleichungen im Prinzip mit algebraischen Methoden l¨ osen lassen, aber f¨ ur viele Freiheitsgrade ist eine explizite L¨osung des Eigenwertproblems oft schwierig oder unm¨oglich. Manchmal hilft aber eine zus¨atzliche Symmetrie der Hamilton–Funktion. Ein Beispiel bieten die Schwingungen der Atome eines Kristallgitters um ihre Ruhelagen. Eine naheliegende Modellierung des Kristalls ist ein regul¨ares Gitter L ⊂ Rd , zum Beispiel Z3 ⊂ R3 , wobei die Gitterpunkte die Ruhelagen bezeichnen. In diesem Fall m¨ ussten wir aber die Bewegung von unendlich vielen Atomen modellieren, was durch eine gew¨ ohnliche Differentialgleichung nicht m¨oglich ist. Wir benutzen stattdessen ein ,endliches Gitter’ L := (Zn )d mit n ∈ N und der Restklassengruppe Zn := Z/nZ ∼ = {0, 1, . . . , n − 1} (siehe Anhang E.1), also periodische Randbedingungen. Wir nehmen zun¨achst an, dass sich an jedem Gitterplatz ∈ L ein Atom der Masse m > 0 befindet, und dass sein Abstand von der Ruhelage q ∈ Rd sei. Die Wechselwirkung zwischen den Atomen bei und m ∈ L sei harmonisch und nur abh¨angig von − m, also translationsinvariant. d Auf dem Phasenraum P := R2dn ergibt sich die Hamilton–Funktion H:P →R
, H(p, q) =
p 2 ∈L
2m
+
1 2
r∈L
cr
q − q+r 2 ,
∈L
wobei cr ≥ 0 die St¨arke der jeweiligen Wechselwirkung beschreibt. Die hamiltonschen Gleichungen cr (2q − q+r − q−r ) ( ∈ L) (6.3.9) q˙ = p /m , p˙ = − r∈L
werden im Allgemeinen durch den Ansatz q,k (t) mit q (t) := k∈L
(6.3.10)
q,0 (t) := d0 + d0 t , q,k (t) := dk exp 2πi k, /n exp(iωk t) k ∈ L\{0} (mit k, =
d j=1
kj j (mod n) und dk ∈ Cd ) im Komplexen gel¨ost.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
111
6.39 Bemerkung (Translationsinvarianz und Fourier–Transformation) Der Ansatz in (6.3.10) kommt dadurch zustande, dass die Gittertranslationen um den Vektor ∈ L, also die linearen Abbildungen (r ∈ L), T : P → P , T (p, q) r = (pr+ , qr+ ) die Hamilton–Funktion und damit die Systemmatrix des linearen Vektorfeldes d invariant lassen. Im komplexifizierten Phasenraum PC := C2dn ∼ = C2d ⊗ CL sind die T unit¨are Abbildungen. Diese besitzen die gemeinsamen orthogonalen Eigenfunktionen ϕk,r,j := ϕk δr δj ∈ PC , wobei (k, m ∈ L) ϕk ∈ CL , ϕk (m) := exp 2πi k, m /n unabh¨angig von den Indices r ∈ {1, 2}, j ∈ {1, . . . , d} der Impuls- und Ortskomponenten ist. Die L¨ osung der Differentialgleichung l¨asst daher die von den ϕk,j,m aufgespannten Eigenr¨aume invariant. 3 Die Frequenzen ωk in (6.3.10) werden durch Einsetzen in (6.3.9) gefunden: Die L¨osungen dieser Frequenz erf¨ ullen die Gleichungen p˙ = m¨ q = −mωk2 q . Andererseits ist cr 2q − q+r − q−r = − 2cr 1 − cos(2π k, r /n) q . p˙ = r∈L
r∈L
Zusammengenommen ergibt das ωk2 =
2 cr 1 − cos(2π k, r /n) . m
(6.3.11)
r∈L
Im einfachsten Fall haben wir eine Kette (das heißt d = 1) von n Atomen, bei der nur die n¨achsten Nachbarn gekoppelt sind, zum Beispiel c1 = 0, cr = 0 (r ∈ Zn \{0}). Es ergibt sich + c1 ωk = 2 | sin(πk/n)|, m siehe Abbildung 6.3.2 (links). Im Limes großer Teilchenzahl n → ∞ folgt die sogenannte Dispersionsrelation + c1 | sin(πK)| ω(K) := 2 m in der Variable K := k/n. Die Ableitung ω (K) wird Gruppengeschwindigkeit genannt, sie l¨asst sich als Geschwindigkeit des Energietransportes f¨ ur Wellen mit der durch 1/K gegebenen Wellenl¨ange verstehen. c1Langwellige Gitterschwingungen breiten sich also hier mit fast konstanter, zu ahrend f¨ ur K → 1 die Gruppengem proportionaler Geschwindigkeit aus, w¨ schwindigkeit gegen Null geht. Auf Seite 57, am Anfang von Kapitel 4, sieht
112
6.3. Lineare hamiltonsche Systeme
Ω
Ωo,Ωa
2
2 ]=
1
1
25
50
k
25
50
k
Abbildung 6.3.2: Dispersionsrelationen f¨ ur eindimensionale Gitter mit Teilchenzahl n = 50. Links: N¨achste–Nachbar–Kopplung. Rechts: Zwei Atome verschiedener Masse in der Elementarzelle. Oben: optischer Zweig, unten: akustischer Zweig. man die Dynamik von Atomen, die anfangs in Form einer Gauss-Funktion in der Bildmitte komprimiert sind. Diese bewegen sich nach außen, so dass nach einiger Zeit Kompressionswellen nach links und rechts laufen. Befindet sich in jeder Zelle des Gitters eine Zahl A > 1 von Atomen, dann ergibt sich ein komplizierteres Bild der Dispersionsrelation. 6.40 Aufgabe (Dispersionsrelation) (a) F¨ ur A = 2 Atome pro Gitterzelle sei 2n die Dynamik der Kette durch die Hamilton–Funktion H : R2n p × Rq → R, H(p, q) =
n−1 =0
2 (a) |p |2
a=1
2m(a)
/ 2 2 0 c (1) (2) (1) (2) q − q+1 + q − q + 2
gegeben. Dabei sind m(1) , m(2) > 0 die Massen der beiden Atomsorten und c > 0 die Kopplung zwischen ihnen. Zeigen Sie, dass die Dispersionsrelation aus den L¨osungen ⎛ c m(1) +m(2) ±
ωo/a (k) :=⎝
2πk (m(1) −m(2) )2 +m(1) m(2) (cos( 2πk n )(2+cos( n ))+1)
m(1) m(2)
⎞1 2
⎠
besteht, siehe Abbildung 6.3.2, rechts. Die L¨osung ωa heißt in der physikalischen Literatur akustischer, ωo optischer Zweig.9 (b) Berechnen Sie bei Kenntnis der Funktion k → ωk aus der Dispersionsrelation 3 (6.3.11) die Kopplungskonstanten cr . 9 Wenn die Atome der beiden Teilgitter unterschiedlich geladen sind, dann kann durch eine Schwingung des optischen Zweiges eine Lichtwelle erzeugt werden, daher der Name.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
113
6.41 Bemerkungen 1. Der Fall k = 0 in (6.3.10) entspricht einer Bewegung des gesamten Gitters mit konstanter Geschwindigkeit. 2. In einer physikalisch genaueren Beschreibung sind die Gitterschwingungen quantisiert und werden dann Phononen genannt. 3
6.3.3
Teilchen im konstanten elektromagnetischen Feld
Das n¨achste Beispiel f¨ uhrt eigentlich zu affinen Vektorfeldern X : Rk → Rk , also solchen von der Form X(x) = Ax + b
mit A ∈ Mat(k, R) und b ∈ Rk .
Die affine Differentialgleichung x˙ = X(x) ist aber ebenso mit Methoden der Linearen Algebra l¨ osbar wie die linearen Differentialgleichungen. Es gilt n¨amlich nach Satz 6.19 t exp(−As)b ds . (6.3.12) x(t) = exp(At) x0 + 0
Konkret betrachten wir Hamilton–Funktionen der Form H : R2d → R
, H(p, q) = 12 p − e0 Bq 2 + e0 E, q ,
wobei B ∈ Mat(d, R), und E ∈ Rd . Physikalisch wird B als konstantes Magnetfeld und E als konstantes elektrisches Feld interpretiert.10 e0 ∈ R ist dann die Ladung des Teilchens. Die Bewegungsgleichungen haben damit die Form q˙ = p − e0 Bq , p˙ = e0 B (p − e0 Bq) − E oder, als Differentialgleichung zweiter Ordnung die Lorentzsche Kraftgleichung (6.3.13) q¨ = −e0 (B − B )q˙ + E . Zur Vereinfachung der weiteren Diskussion nehmen wir jetzt ohne Beschr¨ankung der Allgemeinheit an, dass der Magnetfeldtensor B ∈ Mat(d, R) antisymmetrisch ist, denn nur der antisymmetrische Anteil von B geht in (6.3.13) ein (in der Raumdimension d = 1 gibt es also kein Magnetfeld). Ebenso nehmen wir e0 = 1 an. • Ist zun¨achst B = 0, dann besitzt (6.3.13) f¨ ur Anfangswerte q(0) = q0 , q(0) ˙ = v0 die L¨osung q(t) = q0 + v0 t − 12 Et2 . Das Teilchen wird also in Richtung des elektrischen Feldes beschleunigt. • Ist dagegen E = 0, aber B = 0, dann ist 10 Das
lineare Vektorfeld A : Rd → Rd , q → Bq nennt man auch ein Vektorpotential von B.
114
6.3. Lineare hamiltonsche Systeme
0 b − f¨ ur d = 2 die antisymmetrische Matrix B von der Form B = 12 −b 0 , sodass f¨ ur die Geschwindigkeit v(t) = q(t) ˙ die Differentialgleichung v ˙ = cos(bt) − sin(bt) v und L¨ o sung v(t) = b J v mit J = 01 −1 gilt. Also ist 0 0 sin(bt) cos(bt)
t
q(t) = q0 +
v(s) ds = q0 + 0
1 sin(bt) cos(bt)−1 v0 . b 1−cos(bt) sin(bt)
Dies ist die Drehung um das Zentrum bei c := q0 + 1b J v0 , mit Periode 2π/|b| und Radius v|b|0 , auch Larmor–Radius genannt. − F¨ ur gerade d > 2 k¨ onnen wir nach einem Satz der Linearen Algebra durch eine orthogonale Transformation O ∈ SO(d) die antisymmetrische Matrix 1d/2 0 bk 1 −1 = B in die Form OBO bringen, f¨ ur k=1 Bk mit Bk = 2 −bk 0 d−1 1 2 Bk . ungerade d in die Form OBO−1 = 0 ⊕ k=1 Wenden wir diese Transformation nicht nur auf den Ortsvektor q ∈ Rd , sondern auch auf den Impulsvektor p ∈ Rd an, dann bleibt die Form der Bewegungsgleichungen erhalten und wir k¨ onnen diese blockweise l¨osen. − Physikalisch interessant ist davon nur der Fall d = 3. B1 1 Hier gilt zwischen dem Vektor B := 2 B2 ∈ R3 und der antisymmetriB3 0 −B3 B2 1 schen Matrix B := i(B) := 2 B3 0 −B1 die Beziehung −B2 B1
×V =BV B
0
∈ R3 , V
(6.3.14)
wir erkennen also die gewohnte vektorielle Form des Magnetfeldes wie der. Durch Drehung mit O ∈ SO(d) wird die B–Richtung zur 1–Richtung: 0 0 0
OBO−1 = 12 0 0 b . Wir sehen, dass wir in 1–Richtung eine freie Be0 −b 0 wegung, in (2 − 3)–Richtung aber die schon beschriebene Kreisbewegung erhalten. Insgesamt sind die Teilchenbahnen t → q(t) also Schraubenlinien im R3 .
• Wir betrachten f¨ ur d = 2 den Fall nicht verschwindender elektrischer und magnetischer Felder. Wir schreiben (6.3.13) als Differentialgleichung f¨ ur die Geschwindigkeit w := q, ˙ also w˙ = b J w − E. Die L¨ osung der zugeh¨origen homogenen Gleichung v˙ = b J v haben wir schon bestimmt, n¨amlich − sin(bt) . v(t) = O(t)v0 mit O(t) := cos(bt) sin(bt) cos(bt) Nach (6.3.12) ist also t 1 w(t) = O(t) v0 + O(−s)E ds = O(t)v0 + J 1l − O(t) E. b 0
6. Hamiltonsche Gleichungen und Symplektische Gruppe
115
Nochmalige Integration ergibt t 1 1 1l − O(t) q(t) = q0 + w(s) ds = q0 + J 1l − O(t) v0 + J Et + E. b b b2 0 ¨ Es handelt sich also um die Uberlagerung einer Kreisbewegung und einer Bewegung in Richtung JE, das heißt senkrecht zum elektrischen Feld, siehe Abbildung 6.3.3.
Abbildung 6.3.3: Bewegung in der Ebene, bei konstanten elektromagnetischen Feldern und vertikaler Richtung des elektrischen Feldes.
6.42 Aufgabe (Obere Halbebene und M¨ obius–Transformationen) Nach Aufgabe 6.26 ist Sp(2, R) = SL(2, R) = {M ∈ Mat(2, R) | det M = 1}. Die Obere Halbebene ist H := {z ∈ C | Im z > 0}, und H := {z ∈ C | Im z ≥ 0} ∪ {∞}. (a) Zeigen Sie, dass f¨ ur jedes M = ac db ∈ SL(2, R) die M¨obius–Transformation 2: H → H , M 2z := az + b M cz + d (siehe auch Beispiel 16.17) wohldefiniert ist. 2z (b) Zeigen Sie, dass die Abbildung SL(2, R) × H → H, die durch (M, z) → M gegeben wird, eine Gruppenwirkung ist. (c) M¨obius–Transformationen lassen sich stetig auf H fortsetzen. Eine Matrix M ∈ SL(2, R) mit |tr M | < 2 heißt elliptisch, mit |tr M | = 2 parabolisch und mit |tr M | > 2 hyperbolisch. Zeigen Sie, dass die M¨ obius–Transformation zu einer elliptischen Matrix genau einen Fixpunkt in H hat, w¨ahrend die M¨obius–Transformationen zu parabolischen Matrizen = ±1l genau einen Fixpunkt und zu hyperbolischen Matrizen genau zwei Fixpunkte haben, die alle in ∂H := H \ H liegen.
116
6.4. Unterr¨aume symplektischer Vektorr¨aume
(d) Auf H wird eine Metrik g(z) := (Im z)−2 gEuklid (z)
(z ∈ H)
definiert, wobei gEuklid die euklidsche Metrik auf H ⊂ bC ist. 0 c Zeigen Sie, dass die M¨ obius–Transformationen zu a0 a−1 und −c−1 0 mit a, b, c ∈ R, a, c = 0 Isometrien von g sind. Folgern Sie, dass alle M¨obius– Transformationen Isometrien von g sind. (e) sp(R2 ) bezeichnet die Gruppe der infinitesimal symplektischen 2×2–Matrizen. Zeigen Sie sp(R2 ) = sl(R2 ) := {m ∈ Mat(2, R) | tr m = 0}. (f) Eine infinitesimal symplektische Matrix m ∈ sp(R2 ) erzeugt die einparametrige Gruppe {exp(tm) | t ∈ R} ⊆ Sp(2, R). Welche einparametrigen Gruppen werden von 0 1 0 0 01 m ∈ { −1 0 , ( 1 0 ) , ( 1 0 )} erzeugt? Klassifizieren Sie nach elliptisch, parabolisch und hyperbolisch. Welches sind die Fixpunkte der zugeh¨ origen M¨ obius–Transformationen auf H? 3 Wie sehen die Orbits {exp(tm)∧ v | t ∈ R} durch v ∈ H aus?
6.4
Unterr¨ aume symplektischer Vektorr¨ aume
In einem Vektorraum E ist die Gruppe der strukturerhaltenden Abbildungen die Allgemeine Lineare Gruppe GL(E). Zwei Unterr¨aume von E lassen sich genau dann mit einer Abbildung aus GL(E) ineinander u uhren, wenn ihre Dimen¨berf¨ sionen gleich sind. In einem symplektischen Vektorraum (E, ω) ist die Gruppe der strukturerhaltenden Abbildungen, die symplektische Gruppe Sp(E, ω), eine echte Untergruppe von GL(E). Es gibt f¨ ur dim(E) ≥ 4 auch mehr Sp(E, ω)–Invarianten von Unterr¨aumen als nur ihre Dimension, n¨amlich den Rang der auf den Unterraum restringierten Bilinearform ω. Die Unterr¨aume mit Rang Null beziehungsweise mit maximalem Rang sind besonders wichtig: 6.43 Definition Sei (E, ω) ein symplektischer Vektorraum und F ⊆ E ein Unterraum. • Das ω–orthogonale Komplement von F ist der Unterraum F ⊥ := e ∈ E | ∀f ∈ F : ω(e, f ) = 0 . • F heißt isotrop, wenn F ⊥ ⊇ F , lagrangesch, wenn F ⊥ = F . • F heißt symplektisch, wenn F ⊥ ∩ F = {0}.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
117
uckSymplektische Unterr¨aume (F, ωF ) von E mit Einbettung ı : F → E und zur¨ gezogener Zwei–Form ωF := ı∗ (ω) sind also selbst symplektische Vektorr¨aume, und es kann (außer im Fall dim(E) = 0) ein Unterraum nicht gleichzeitig isotrop und symplektisch sein. 6.44 Beispiele Wir betrachten den Standardfall eines sym ) 2n–dimensionalen * 0 1l plektischen Vektorraums, also (E, ω0 ) = Rnp × Rnq , ·, −1 l 0 · . 1. F¨ ur 0 ≤ k, ≤ n und F := Rkp × {0}n−k × {0}n− × Rq ist × {0} × {0}k × Rn−k . F ⊥ = Rn− p q Ein Unterraum F von dieser Form ist also genau dann isotrop, wenn k + ≤ n und genau dann lagrangesch, wenn k + = n. Insbesondere sind die Unterr¨aume Rnp × {0}q und {0} × Rnq von E lagrangesch. 2. Die eindimensionalen Unterr¨aume sind isotrop, da ω0 antisymmetrisch ist. Ist dim E = 2, so sind genau die eindimensionalen Unterr¨aume lagrangesch, denn ω0 ist nicht degeneriert. 3. F¨ ur eine Matrix A ∈ Mat(n, R) sei FA := {(q, Aq) | q ∈ Rn }, also der Graph der A zugeordneten linearen Abbildung. Dieser ist genau dann lagrangesch, wenn f¨ ur alle q, q gilt: 0 = ω0 (q, Aq), (q , Aq ) = q, Aq − Aq, q , das heißt wenn A symmetrisch ist. 4. F¨ ur die Unterr¨aume F := Rkp × {0}n−k × Rkq × {0}n−k ist × {0}k × Rn−k , F ⊥ = {0}k × Rn−k p q sie sind also symplektisch.
3
6.45 Aufgabe (Symplektische Abbildungen und Unterr¨ aume) Es sei (E, ω) ein symplektischer Vektorraum. (a) Zeigen Sie, dass es zu zwei beliebigen Vektoren v, w ∈ E \ {0} eine symplektische Abbildung f ∈ Sp(E, ω) gibt mit f (v) = w. (b) Zeigen Sie (durch Angabe eines Gegenbeispiels), dass f¨ ur dim(E) > 2 nicht jeder beliebige 2–dimensionale Unterraum F von (E, ω) durch eine symplektische Abbildung f ∈ Sp(E, ω) auf jeden 2–dimensionalen Unterraum F abgebildet werden kann. (c) Zeigen Sie, dass jeder symplektische Unterraum F auf jeden symplektischen Unterraum F mit dim(F ) = dim(F ) durch eine symplektische Abbildung f ∈ Sp(E, ω) abgebildet werden kann. 3 6.46 Satz Sei (E, ω) ein symplektischer Vektorraum und F ⊆ E ein Unterraum. Dann ist
118
6.4. Unterr¨aume symplektischer Vektorr¨aume
1. dim(F ) + dim(F ⊥ ) = dim(E). 2. F ⊆ E ist genau dann lagrangesch, wenn F isotrop ist und dim F =
1 2
dim E.
Beweis: 1. Wir f¨ uhren die Dimensionsformel auf die f¨ ur orthogonale Unterr¨aume zur¨ uck. Mit dem Normalform-Satz 6.13.2 k¨ onnen wir annehmen, dass E = R2n = uglich des euklidischen Rnp × Rnq und ω von der Form (6.2.3) Dann gilt bez¨ l inneren Produktes ·, · auf R2n : ω0 (X, Y ) = X, JY mit J = 10l −1 . 0 F¨ ur n = 1 ist J eine Drehung der E–Ebene um π/2, f¨ ur n > 1 eine Drehung um π/2 in allen (pi , qi )–Ebenen. Damit ist F ⊥ = {X ∈ E | ∀ Y ∈ F : X, JY = 0} der auf JF bez¨ uglich ·, · senkrecht stehende Unterraum, was die 1. Behauptung beweist. 2. Ist dim F = 12 dim E, also wegen 1. auch dim F ⊥ = 12 dim E, dann folgt aus der Isotropie F ⊆ F ⊥ von F schon F = F ⊥ . Ist umgekehrt F lagrangesch, 2 also nach Definition isotrop, folgt dim F = 12 dim E aus 1. 6.47 Aufgabe (Dimensionsformel) Im Beweis von Satz 6.46, Teil 1. wurde ¨ die Antisymmetrie von ω benutzt. Uberlegen Sie sich einen Beweis, der ohne dies auskommt und nur die Nichtdegeneriertheit von ω verwendet, also auch zum Beispiel f¨ ur Orthogonalr¨aume bez¨ uglich des Skalarproduktes (oder einer Lorentz–Metrik) gilt. 3 Die Graphen symplektischer Abbildungen lassen sich als Lagrange–Unterr¨aume auffassen: 6.48 Satz Seien (E1 , ω1 ) und (E2 , ω2 ) symplektische Vektorr¨aume und πi : E1 × E2 → Ei , i = 1, 2, die Projektionen. Dann ist ω1 & ω2 := π1∗ ω1 − π2∗ ω2 . eine symplektische Form auf dem Vektorraum E1 ⊕ E2 . Beweis: Es ist nachzuweisen, dass die antisymmetrische Bilinearform ω := ω1 & ω2 auf E := E1 ⊕E2 nicht degeneriert ist. F¨ ur einen Vektor e = (e1 , e2 ) ∈ E\{0} ist e1 = 0 oder e2 = 0. Im ersten Fall gibt es einen Vektor f1 ∈ E1 mit ur f := (f1 , 0) ω1 (e1 , f1 ) = 0, denn (E1 , ω1 ) ist ein symplektischer Vektorraum. F¨ ist damit ω(e, f ) = ω1 (e1 , f1 ) = 0. Der Fall e2 = 0 ist analog. 2 6.49 Satz Ein Isomorphismus A : E1 → E2 ist genau dann symplektisch, wenn sein Graph ΓA = {(e1 , Ae1 ) | e1 ∈ E1 } ⊂ E1 × E2 ein lagrangescher Unterraum des symplektischen Vektorraums E1 ⊕E2 , ω1 &ω2 ist.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
119
Beweis: Da die lineare Abbildung A ein Isomorphismus ist, gilt dim(E1 ) = dim(E2 ). Weil damit ΓA ein linearer Unterraum der Dimension dim(ΓA ) = 1 2 dim(E1 ⊕ E2 ) ist, ist er lagrangesch genau dann, wenn er isotrop ist, das heißt ω1 & ω2 (e1 , Ae1 ), (e1 , Ae1 ) = 0 (e1 , e1 ∈ E1 ), oder ¨aquivalent ω1 (e1 , e1 ) − ω2 (Ae1 , Ae1 ) = 0
(e1 , e1 ∈ E1 )
gilt. Das ist genau dann der Fall, wenn A symplektisch ist.
6.5
2
* Der Maslov–Index
Oft tauchen Lagrange–Unterr¨aume als Tangentialr¨aume von flussinvarianten Tori integrabler hamiltonscher Systeme auf (ein Beispiel f¨ ur solche invarianten Tori ur F aus (6.3.5)). In solchen F¨allen betrachten wir ist die Urbildmenge F −1 (f ) f¨ die Abh¨angigkeit des Lagrange–Unterraums vom Punkt des Torus. Um dies vorzubereiten, untersuchen wir jetzt die Menge aller (nicht orientierten) Lagrange– Unterr¨aume. 6.50 Definition • F¨ ur einen R-Vektorraum 11 v mit m := dim(v) < ∞ heißen die Mengen Gr(v, n) := {u ⊆ v | u ist n–dimensionaler Unterraum} n ∈ {0, . . . , m} die Grassmann–Mannigfaltigkeiten von v, und Gr(m, n) := Gr(Rm , n). • Speziell heißt RP(m − 1) := Gr(m, 1) projektiver Raum. • F¨ ur einen symplektischen Vektorraum (E, ω) heißt Λ(E, ω) := {u ⊆ E | u ist Lagrange–Unterraum} Lagrange–Grassmann–Mannigfaltigkeit von E, und Λ(m) := Λ R2m , ω0 . Da alle m–dimensionalen R–Vektorr¨aume zueinander isomorph sind, reicht es aus, die Gr(m, n) zu untersuchen, und analog Λ(m), da alle 2m–dimensionalen symplektischen Vektorr¨aume zueinander isomorph sind (siehe Aufgabe 6.45 (c)).
6.51 Satz In nat¨ urlicher Weise ist • Gr(m, n) eine kompakte Mannigfaltigkeit der Dimension n(m − n), mit Gr(m, m − n) ∼ = Gr(m, n) 11 Analoge
Definitionen gibt es f¨ ur C–Vektorr¨ aume.
120
6.5. * Der Maslov–Index
• und Λ(n) ⊆ Gr(2n, n) eine kompakte Untermannigfaltigkeit der Dimension 1 n(n + 1). 2 6.52 Beispiele (Grassmann–Mannigfaltigkeiten) 1. Nach Beispiel 6.44.2 sind alle eindimensionalen Unterr¨aume eines zweidimensionalen symplektischen Vektorraums lagrangesch, das heißt Λ(1) = Gr(2, 1) = RP(1). Die eindimensionalen nicht orientierten Unter¨aume von R2 werden durch ihren Winkel ϕ ∈ [0, π] gegen die 1-Achse parametrisiert, wobei ϕ = 0 und ϕ = π die 1-Achse selbst beschreibt. Damit ist in nat¨ urlicher Weise der projektive Raum RP(1) ∼ = S1. 2. F¨ ur R4 , ω0 ist die vierdimensionale Mannigfaltigkeit Gr(4, 2) die disjunkte Vereinigung der 3-dim. Untermannigfaltigkeit Λ(2) und der in Gr(4, 2) offenen und dichten Menge der zweidimensionalen symplektischen Unterr¨aume. 3 Beweis von Satz 6.51: • Zun¨achst einmal l¨asst sich Gr(m, n) als eine Teilmenge des Vektorraums Lin(Rm ) auffassen, denn die n–dimensionalen Teilr¨aume u ⊂ Rm und die Orthogonalprojektionen Pu ∈ Lin(Rm ) auf diese stehen in Eins–zu–Eins– Beziehung zueinander. Damit wird Gr(m, n) zum metrischen Raum, mit dem Abstand d(u, v) := Pu − Pv . • Gr(m, n) ⊂ Lin(Rm ) ist aber eine Mannigfaltigkeit, wenn man mit dem bez¨ uglich des euklidischen Skalarproduktes auf u senkrechten Unterraum us := {x ∈ Rm | ∀y ∈ u : x, y = 0} die Umgebung
U := v ∈ Gr(m, n) | d(u, v) < 1
von u ∈ Gr(m, n) mit der (implizit definierten) Kartenabbildung 12 Φ : U → Lin(u, us ) , v = Graph Φ(v)
(6.5.1)
versieht. Die Bedingung Pv − Pu < 1 garantiert dabei, dass nur der Nullvektor in v orthogonal zum Unterraum u ist, also v Graph einer eindeutigen linearen Abbildung aus Lin(u, us ) ist. Der zum n–dimensionalen Unterraum u orthogonale us hat die Dimension m − n, also ist Unterraum dim Gr(m, n) = dim Lin(u, us ) = n(m − n). Als Menge der Orthogonalprojektionen des Rangs n ist Gr(m, n) beschr¨ankt (mit Schranke 1 in der Operatornorm) und abgeschlossen, also kompakt. 12 Genau genommen wird Φ erst dann zu einer Kartenabbildung, wenn man durch Basiswahl Lin(u, us ) mit Mat n×(m−n), R ∼ = Rn(m−n) identifiziert. Außerdem wird in (6.5.1) benutzt, n dass R = u ⊕ us ist.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
121
• Die Abbildung Gr(m, n) → Gr(m, m − n), Pu → 1l − Pu ist ein Diffeomorphismus. • Die Lagrange–Unterr¨aume u des R2n sind unter den n–dimensionalen Unterr¨aumen durch die Bedingung u⊥ = u ausgezeichnet und bilden daher eine abgeschlossene, also kompakte Teilmenge von Gr(2n, n). In Beispiel 6.44.3 haben wir schon festgestellt, dass der Graph {(q, Aq) | q ∈ Rn } ⊂ E = Rn × Rn einer Matrix A ∈ Mat(n, R) genau dann Lagrange–Unterraum ist, wenn A symmetrisch ist. Analog ist f¨ ur A ∈ Lin(u, us ) genau dann Graph(A) Lagrange–Unterraum, wenn gilt ω x + A(x), y + A(y) = 0 (x, y ∈ u). (6.5.2) Da u und us (= Ju) Lagrange–Unterr¨aume sind, ist ω(x, y) = 0 und ω A(x), A(y) = 0. Also ist unter der Voraussetzung (6.5.2) ω A(x), y = ω A(y), x , das heißt die Bilinearform u × u → R , (x, y) → ω A(x), y symmetrisch. Wegen dim(u) = n erhalten wir damit einen n(n + 1)/2– dimensionalen Raum solcher A ∈ Lin(u, u⊥ ), und die behauptete Dimensionsformel. 2 6.53 Aufgabe (SO(3) ∼ = RP(3)) Finden Sie einen Diffeomorphismus (das heißt eine invertierbar glatte Abbildung) zwischen der Drehgruppe SO(3) (siehe Beispiel E.28) und dem projektiven Raum RP(3). 3 In Anschluss an Arbeiten von V.P. Maslov hat V.I. Arnol’d in [Ar4] glatte Abbildungen (m ∈ N) (6.5.3) MAm : Λ(m) → S 1 definiert. Diese ist im einfachsten Fall Λ(1) ∼ = S 1 die identische Abbildung.13 Die Definition f¨ ur allgemeine m folgt in Lemma 6.57. Diese Abbildungen spielen eine wichtige Rolle in der Untersuchung integrabler quantenmechanischer Systeme, etwa der n¨aherungsweisen Berechnung von Eigenwerten, bei der (als Korrekturterm zur Bohr–Sommerfeld–Quantisierung) der sogenannte Maslov–Index 14 auftritt. Stetige Abbildungen c : S 1 → Λ(m) lassen sich n¨amlich mit MAm zu einer stetigen Abbildung (6.5.4) MAm ◦ c : S 1 → S 1 verketten. 13 Wenn sowohl die Punkte auf S 1 als auch die Unterr¨ aume R ⊂ R2 wie in Beispiel 6.52 durch einen Winkel ϕ parametrisiert werden, nimmt diese identische Abbildung die Form MA1 : Λ(1) → S 1 , ϕ → 2ϕ an! 14 Siehe auch Bott [Bo1].
122
6.5. * Der Maslov–Index
6.54 Definition • Der Abbildungsgrad einer Abbildung f ∈ C 1 (S 1 , S 1 ) ist 15 dz d log f (z) . deg(f ) := 2πi S 1 dz • Der Maslov–Index einer stetig differenzierbaren Abbildung c : S 1 → Λ(m) ist definiert als deg(MAm ◦ c). Der Abbildungsgrad von f : S 1 → S 1 misst also die Zahl der Uml¨aufe von f (z) bei einem Umlauf von z. Er ver¨andert sich bei orientierungserhaltenden Umparametrisierungen nicht; bei orientierungsumkehrenden ¨andert er das Vorzeichen. 6.55 Beispiele (Abbildungsgrad und Maslov–Index) 1. F¨ ur m ∈ Z ist der 1 1 m : S → S , f (z) = z gleich deg(fm ) = Abbildungsgrad der Abbildung f m m dz = m. S 1 z 2πi Ist f : S 1 → S 1 von der Form f (z) = eiϕ(z) fm (z) mit ϕ ∈ C 1 (S 1 , R), dann ist nach dem Hauptsatz der Differential- und Integralrechnung ebenfalls deg(f ) = m. 2. Parametrisieren wir eine Niveaulinie H −1 (E) des harmonischen Oszillators H : Rp × Rq → R
H(p, q) = 12 (p2 + q2 ) √ f¨ ur E > 0 mit dem Weg c˜ : S 1 → H −1 (E), c˜(z) := 2Ez (wobei wir ,
Rp × Rq mit C identifiziert haben), dann ist der Tangentialraum von H −1 (E) an c˜(z) durch den Vektor i˜ c(z) aufgespannt. Es ergibt sich eine Abbildung c(z) c : S 1 → Λ(1) , c(z) = span i˜ mit Maslov–Index deg(MA1 ◦ c) = 2. Denn die unorientierten Tangentialr¨aume sind bei (−p, −q) die gleichen wie bei (p, q) ∈ H −1 (E), Zum Maslov-Index des 1D siehe auch nebenstehende Abbildung. 3 harmonischen Oszillators uhrt uns zur Wie ist nun die Abbildung MAm in (6.5.3) definiert? Diese Frage f¨ folgenden Darstellung der Lagrange–Grassmann–Mannigfaltigkeiten. 6.56 Satz (Λ(m) als homogener Raum) F¨ ur alle m ∈ N ist die Abbildung
Re(U O) x m U(m)/O(m) → Λ(m) , U O(m) → O ∈ O(m), x ∈ R Im(U O) x (6.5.5) 15 Hier fassen wir die Kreislinie auf als S 1 = {z ∈ C | |z| = 1} und setzen den nat¨ urlichen d log f (z) stetig ist. Logarithmus so fort, dass die Abbildung S 1 → iR , z → dz
6. Hamiltonsche Gleichungen und Symplektische Gruppe
123
ein Hom¨oomorphismus zwischen dem homogenen Raum 16 U(m)/O(m)und der Lagrange–Grassmann–Mannigfaltigkeit Λ(m). Re(V ) x x ∈ Rm ein Lagrange– Beweis: • F¨ ur V ∈ U(m) ist die Menge Im(V ) x Unterraum. Denn jeder m–dimensionale Unterraum L ⊂ Rm × Rm l¨aßt sich als Bild einer injektiven linearen Abbildung Rm → Rm × Rm
,
Ax ) x → ( Bx
A ) = m. L ist genau dann Lagrange– darstellen, mit A, B ∈ Mat(m, R) und rang ( B Unterraum, wenn . - Ay Ax (x, y ∈ Rm ) , By , J ( Bx ) = 0
also A B = B A gilt. Die Normalisierungs–Forderung, dass die Bilder der Basisvektoren e1 , . . . , em ∈ A) = Rm eine Orthonormalbasis von L ergeben, ist gleichbedeutend zu (A B ) ( B A A + B B = 1l. Beides zusammen ist genau dann der Fall, wenn V := A + iB unit¨ar ist, denn V ∗ V = (A − iB )(A + iB) = (A A + B B) + i(A B − B A) = 1l. • Immer noch entspricht ein Lagrange–Unterraum vielen unit¨aren Matrizen V , denn wir h¨atten ja statt der Basisvektoren e1 , . . . , em ∈ Rm irgendeine Orthonormalbasis des Rm verwenden k¨ onnen. Die Wahl einer solchen entspricht aber dem Basiswechsel mit einer orthogonalen Matrix aus O(m). • Die entsprechende Bijektion U(m)/O(m) → Λ(m) ist stetig, also wegen Kompaktheit von U(m)/O(m) ein Hom¨ oomorphismus. 2 Diese Darstellung von Λ(m) erm¨ oglicht die Definition des Maslov–Index: 2 6.57 Lemma Die Abbildung MAm : Λ(m) → S 1 , U O(m) → det U O(m) ist wohldefiniert. Beweis: Unabh¨angig von O ∈ O(m) ist
2 2 2 2 det(U O) = det(U ) det(O) = det(U ) .
2
Wir k¨onnen den Maslov–Index einer Schleife in der Lagrange–Grassmann–Mannigfaltigkeit Λ(m) auch ausrechnen, indem wir ihren Schnittpunkten mit einer gewissen Teilmenge Λ1 (m) ⊂ Λ(m) ganze Zahlen zuordnen und diese addieren. 16 Definition: Eine Menge M heißt homogener Raum, wenn eine Gruppe G transitiv auf M wirkt. ¨ Hier wirkt die Lie–Gruppe U(m) stetig auf der Menge U(m)/O(m) von Aquivalenzklassen unit¨ arer Matrizen, mit der von U(m) stammenden Quotiententopologie (siehe Seite 450).
124
6.5. * Der Maslov–Index
6.58 Beispiel (Maslov–Index f¨ ur den 1D harmonischen Oszillator) In Beispiel 6.55.2 wurde der Maslov–Index der Parametrisierung c˜ : S 1 → H −1 (E) der Energiekurve des harmonischen Oszillators berechnet, das heißt eigentlich, der Index der c˜ zugeordneten Kurve c : S 1 → Λ(1). Jeder Punkt v ∈ Λ(1) wird von c genau zweimal ¨berstrichen, und zwar im mathematisch positiven Sinn. Also
u 3 ist deg(c) = z∈c−1 (v) sign c (z) = 2 der Maslov–Index. In der Verallgemeinerung des Beispiels auf m Freiheitsgrade ist es oft praktisch, als Referenzpunkt v ∈ Λ(m) den ,vertikalen’ Lagrange–Unterraum v := m m ahlen.17 Zwar werden typische glatte Kurven Rm p × {0} ⊂ Rp × Rq zu w¨ 1 ur m ≥ 2 den Referenzpunkt selbst nicht treffen, denn dann c : S → Λ(m) f¨ m(m+1) ist dim Λ(m) = > 1. Betrachten wir aber die disjunkte Zerlegung der 2 Lagrange–Grassmann-Mannigfaltigkeit in Λ(m) =
m 3
Λk (m)
, mit
Λk (m) := u ∈ Λ(m) | dim(u ∩ v) = k ,
k=0
dann lassen sich, wie wir sehen werden, Schnitte von c mit Λ1 (m) := Λ(m)\Λ0 (m) im Allgemeinen nicht vermeiden. 6.59 Aufgaben (Maslov–Index) 1. Zeigen Sie, dass f¨ ur alle k, m ∈ N0 , k ≤ uglich der Abbildung m die Teilmenge Λk (m) bez¨ πk : Λk (m) → Gr(v, k)
, u → u ∩ v
ein B¨ undel (siehe Definition F.1) u ¨ber der Grassmann-Mannigfaltigkeit Gr(v, k) mit Faserdimension (m − k + 1)(m − k) dim πk−1 (w) = 2
w ∈ Gr(v, k)
ist. Folgern Sie mit Hilfe von Satz 6.51 f¨ ur die Dimension der Mannigfaltigkeit Λk (m): (k = 0, . . . , m). dim Λk (m) = 12 (m + 1)m − (k + 1)k ur k ≥ 2 die Untermannigfaltig2. Zeigen Sie, dass Λ1 (m) = Λ1 (m) gilt, also f¨ keiten Λk (m) im Abschluss von Λ1 (m) liegen, w¨ahrend Λ0 (m) offen ist. Tipp: Zeigen Sie zun¨achst, dass πk−1 (w) = ∅ gilt. Betrachten Sie dann unter Verwendung von Beispiel 6.44.3 eine Umgebung von u ∈ πk−1 (w). 3 6.60 Beispiel (m = 1) Λ1 (1) = {v} und Λ0 (1) = Λ(1)\{v} ist diffeomorph zu R. 3 17 Man
k¨ onnte aber jeden anderen Punkt von Λ(m) w¨ ahlen.
6. Hamiltonsche Gleichungen und Symplektische Gruppe
125
Wir wissen schon, dass in Verallgemeinerung dieses Beispiels Λ0 (m) diffeomorph zum Vektorraum Sym(m, R) ist, denn gerade die zum vertikalen Unterraum aume lassen sich als Graphen V = Rm p × {0} transversalen Lagrange–Unterr¨ m {(Aq, q) ∈ Rm p × Rq } einer symmetrischen m × m–Matrix A darstellen. Also l¨asst sich jede Schleife c : S 1 → Λ0 (m), c(z) = Graph A(z) mittels der stetigen Homotopie H : S 1 × [0, 1] → Λ0 (m) , H(z, t) = Graph tA(z) zur konstanten Schleife (mit Wert {0} × Rm q ∈ Λ0 (m)) kontrahieren. Da sich unter der stetigen Kontraktion der ganzzahlige Maslov–Index nicht ¨andert, ist er f¨ ur Schleifen c : S 1 → Λ0 (m) gleich Null. 6.61 Aufgabe (Wertebereich des Maslov-Index) F¨ ur vorgegebene m ∈ N0 und I ∈ Z gibt es eine Kurve c : S 1 → Λ(m) mit deg MAm ◦ c = I. Tipp: Finden Sie unter Verwendung von Λ(1) ∼ = S 1 zun¨achst eine solche Kurve f¨ ur m = 1, und betten Sie diese dann in Λ(m) ein, indem Sie Rp × Rq als m symplektischen Unterraum von (Rm 3 p × Rq , ω0 ) auffassen. Die Aufgabe zeigt, dass sich Schnittpunkte von c mit Λ1 (m) im Allgemeinen nicht umgehen lassen. Wohl aber ist es m¨ oglich, unter eventueller Anwendung einer Homotopie zu erreichen, dass Λ2 (m) := Λ1 (m)\Λ1 (m) vermieden wird und f¨ ur c(z) ∈ Λ1 (m) der Richtungsvektor c (z) ∈ Tc(z) Λ(m) transversal zum Tangentialraum Tc(z) Λ1 (m) liegt 18 , siehe die (schematische) Abbildung 6.5.1. Dies folgt aus der Formel (k + 1)k codim Λk (m) := dim Λ(m) − dim Λk (m) = 2 f¨ ur die Kodimension der Untermannigfaltigkeiten (siehe Aufgabe 6.59 und Abbildung 6.5.1). Denn diese ist f¨ ur k ≥ 2 mindestens 3, also gr¨oßer als dim(S 1 ) = 1 und auch gr¨oßer als die Dimension 2 einer mit einer Homotopie H : S 1 ×[0, 1] → Λ(m) bewegten Schleife (damit h¨angt die folgende zweite Definition des Maslov– Index nicht von der Wahl einer Homotopie ab). Ist c(z) ∈ Λ1 (m) und c (z) transversal zu Λ1 (m), dann ist genau ein Eigenwert λ(z) einer unit¨aren Darstellung U (z) von c(z) imagin¨ ar, und dessen (z) Ableitung λ (z) besitzt einen wohldefinierten Umlaufsinn sign λiλ(z) . Die Summe dieser Vorzeichen ergibt den Maslov–Index von c. 6.62 Aufgabe (Harmonischer Oszillator) Berechnen Sie den Maslov–Index f¨ ur die Lissajous–Figur aus Abbildung 6.3.1, rechts, also f¨ ur eine geschlossene L¨osungskurve c˜ : S 1 → F −1 (f ) ⊂ R4 mit F1 ωi ω2 5 F = = . , Fi (p, q) = (p2i + qi2 ) und F2 2 ω1 3 18 In
Hirsch [Hirs] findet man eine ausf¨ uhrliche Darstellung des Themas ,Transversalit¨ at’.
126
6.5. * Der Maslov–Index
Abbildung 6.5.1: Schematische Darstellung einer Kurve c : S 1 → Λ(m) in der Lagrange–Grassmann–Mannigfaltigkeit mit Maslov–Index MAm ◦ c = 2, mit Untermannigfaltigkeiten Λk (m) Dieser Kurve ist die Abbildung c : S 1 → Λ(2)
,
c(z) := Tc(z) F −1 (f )
zugeordnet. Wie kann man der abgebildeten Projektion von c˜ auf den Konfigu3 rationsraum ansehen, dass gilt: deg(MA2 ◦ c) = 16 ? Nicht nur Schleifen von Lagrange–Unterr¨aumen, sondern auch von symplektischen Abbildungen kann man einen Maslov–Index zuordnen. Dies folgt unmittelbar aus Satz 6.49 in Kapitel 6.4, denn einer Schleife c : S 1 → Sp(2m, R) entspricht eine Schleife c˜ : S 1 → Λ(2m) , c˜(z) = Graph c(z) . Tats¨achlich ist der Maslov–Index von c als 12 deg(MAm ◦ c˜) definiert. Dies bewirkt, dass jede ganze Zahl (und nicht nur die geraden Zahlen) als Maslov–Index vorkommt. Der Maslov–Index von c : S 1 → Sp(2, R) kann auch mithilfe der Hyperfl¨ache der Matrizen mit degenerierten Eigenwerten +1 definiert werden (siehe Aufgabe 6.26). 6.63 Weiterf¨ uhrende Literatur Weiterf¨ uhrende Aspekte werden zum Beispiel im Buch [LiMa] von Libermann und Marle sowie dem Online-Skript (mit Aufgaben) ,Symplectic Geometry’ von Duistermaat [Du] behandelt. Die Monographie [Lon] von Long hat die symplektische Index-Theorie zum Thema. [SB] von Schulz-Baldes beschreibt einen alternativen Weg zur Berechnung des Maslov–Index. 3
Kapitel 7
Stabilit¨ atstheorie
¨ linearer Differentialgleichungen . . . . . . . . . . 128 7.1 Stabilitat 7.2 Liapunov-Funktionen . . . . . . . . . . . . . . . . . . . . . 131 7.3 Verzweigungen . . . . . . . . . . . . . . . . . . . . . . . . 134
Die in Definition 2.21 eingef¨ uhrten Stabilit¨atsbegriffe wurden bisher haupts¨achlich auf lineare Systeme angewandt. Bei der in diesem Kapitel erfolgenden Analyse nichtlinearer differenzierbarer dynamischer Systeme erweist sich die asymptotische Stabilit¨at aber als robust. So ist eine Ruhelage asymptotisch stabil wenn die Linearisierung des Vektorfelds an dieser Stelle asymptotisch stabil ist (Satz 7.6). A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 7,
127
128
7.1. Stabilit¨at linearer Differentialgleichungen
Leider spielt asymptotische Stabilit¨at bei hamiltonschen Systemen keine Rolle, jedoch zeigt sich hier – zumindest im linearen Fall – Liapunov–Stabilit¨at typischerweise als robust unter kleinen hamiltonschen St¨orungen. Der Nachweis der Liapunov–Stabilit¨at bei nichtlinearen hamiltonschen Systemen ist dagegen oft schwierig (er wird im Kapitel 15.4 u ¨ber KAM-Theorie wieder aufgegriffen). ¨ Verzweigungen sind topologische Anderungen des Phasenraumportraits parameterabh¨angiger dynamischer Systeme. Im einfachsten (lokalen) Fall sind sie Folge einer Ver¨anderung der Stabilit¨atseigenschaften einer Ruhelage oder eines periodischen Orbits.
7.1
Stabilit¨ at linearer Differentialgleichungen
Bevor wir die linearen Differentialgleichungen verlassen, wollen wir uns noch die Frage ihrer Stabilit¨at anschauen. Neu gegen¨ uber den Ergebnissen des Kapitels 5.2 ist dabei nur die Einbeziehung nicht hyperbolischer Matrizen. Wir benutzen dabei wieder den Index einer quadratischen Matrix, also die Summe der algebraischen Vielfachheiten der Eigenwerte λ ∈ C mit Re(λ) < 0. 7.1 Satz Die Ruhelage 0 der DGL x˙ = Ax mit A ∈ Mat(n, R) ist 1. instabil, wenn Ind(−A) > 0 oder Ind(−A) = 0, es aber einen Eigenwert λ ∈ iR gibt, dessen algebraische Multiplizit¨at gr¨oßer als die geometrische ist, 2. liapunov-stabil , wenn keine der in 1. genannten Bedingungen erf¨ ullt ist, 3. asymptotisch stabil genau dann, wenn Ind(A) = n gilt. Beweis: Da Instabilit¨at, Liapunov–Stabilit¨at und asymptotische Stabilit¨at linea¨ rer Differentialgleichungen unter Ahnlichkeitstransformationen erhalten bleiben, nehmen wir ohne Beschr¨ankung der Allgemeinheit an, dass sich A schon in der reellen Jordan–Normalform befindet, also aus reellen Jordan–Bl¨ocken der Form r (μ) −ϕ1lr ur λ ∈ R und JrR (λ) := Jϕ1 f¨ ur λ ∈ C\R JrR (λ) := Jr (λ) f¨ lr Jr (μ) besteht, mit μ := Re(λ), ϕ := Im(λ) und den Jordan–Bl¨ocken Jr (μ) aus Definition 4.6. 1. Nach Voraussetzung gibt es einen Jordan–Block zu einem Eigenwert λ, f¨ ur den Re(λ) > 0 oder Re(λ) = 0, aber r ≥ 2 gilt. Wir benutzen den r–ten kanonischen Basisvektor er im fluss–invarianten Unterraum dieses reellen Jordan– Blocks als Anfangswert. Inspektion von (4.1.6) beziehungsweise (4.1.7) zeigt, dass lim exp JrR (λ) er = ∞. t→∞
2. Andernfalls gibt es keine Eigenwerte λ mit Realteil μ > 0, und diejenigen mit Realteil μ = 0 geh¨ oren zu Jordan–Bl¨ ocken Jr (λ) der Gr¨oße r = 1.
7. Stabilit¨atstheorie
129
Im Fall μ < 0 zeigt f¨ ur reelle λ (4.1.6) und f¨ ur nicht reelle λ (4.1.7), dass R lim exp Jr (λ)t = lim eμt exp JrR (iϕ)t = 0. t→∞
t→∞
F¨ ur Re(λ) = 0 und r = 1 tritt neben dem Fall exp(Jr (0)t) = 1 nur der Fall des reellen Jordan–Blocks cos(ϕt) − sin(ϕt) exp JrR (λ)t = sin(ϕt) cos(ϕt) = 1 aus (4.1.8) auf, und beide f¨ uhren zu Liapunov–Stabilit¨at. 3. Ist Ind(A) = n, also Re(λ) < 0, dann ist limt→∞ exp(JrR (λ)t) = 0. Sonst gibt es ein λ mit Re(λ) ≥ 0, also limt→∞ exp(JrR (λ)t) ≥ 1. 2 Hamiltonsche Fl¨ usse besitzen keine asymptotisch stabilen Fixpunkte, denn sie lassen das Phasenraumvolumen invariant (das gilt auch im nichtlinearen Fall, siehe Bemerkung 10.14.2). Der Nullpunkt kann nach Bemerkung 6.25 nur dann liapunov–stabiler Fixpunkt eines linearen hamiltonschen Systems sein, wenn alle Eigenwerte des den Fluss erzeugenden infinitesimal symplektischen Endomorphismus auf der imagin¨aren Achse liegen. Bei Multiplizit¨at = 1 ist die Liapunov–Stabilit¨at von der Struktur der Jordan–Bl¨ ocke abh¨angig. In einem gewissen Sinn neigen hamiltonsche Systeme also weniger zur Stabilit¨at als allgemeine dynamische Systeme. Es gibt aber auch andere Aspekte. 7.2 Definition Ein infinitesimal symplektischer Endomorphismus A ∈ sp(E, ω) heißt stark stabil, wenn eine Umgebung U ⊂ sp(E, ω) von A existiert, sodass f¨ ur alle B ∈ U der Nullpunkt bez¨ uglich des Flusses exp(Bt) liapunov-stabil ist. Zun¨achst f¨allt bei der Definition auf, dass nicht von der Stabilit¨at eines Fixpunktes, sondern von der eines flusserzeugenden Endomorphismus gesprochen wird. Nat¨ urlich h¨angt das mit der Tatsache zusammen, dass der Nullpunkt immer Fixpunkt eines linearen Flusses ist. Die Idee, die der Definition starker Stabilit¨at zugrunde liegt, ist, dass wir die Bewegungsgleichung eines konkreten mechanischen Systems nicht mit unendlicher Pr¨azision kennen, da wir zum Beispiel die Massen der wechselwirkenden K¨orper nur mit endlicher Genauigkeit messen k¨ onnen. Wir sind daher an der Frage interessiert, ob wir trotzdem entscheiden k¨ onnen, ob das mechanische System liapunov-stabil ist. at) Wenn alle Eigenwerte λ ∈ C eines infinitesimal 7.3 Satz (Starke Stabilit¨ symplektischen Endomorphismus voneinander verschieden sind und auf der imagin¨aren Achse liegen, ist A stark stabil. Beweis: Der Minimalabstand zweier Nullstellen des charakteristischen Polynoms
130
7.1. Stabilit¨at linearer Differentialgleichungen
sei 4ε, ε > 0. Wir betrachten f¨ ur jede Nullstelle eine ε– Umgebung. Diese Umgebungen u ¨berlappen nicht, siehe nebenstehende Abbildung. Die Wurzeln des charakteristischen Polynoms einer Matrix h¨angen stetig von den Matrixelementen ab. Also muss ein gen¨ ugend nahe bei A liegender Endomorphismus B Eigenwerte haben, von denen je einer in einer der ε–Umgebungen liegt. W¨ urden diese Eigenwerte λ nicht gleichzeitig auf der imagin¨aren Achse liegen, so w¨are −λ = λ in der gleichen ε–Umgebung. Widerspruch! 2
Eigenwerte einer Matrix A ∈ sp(R4 )
7.4 Aufgabe (Starke Stabilit¨ at) Wir betrachten die lineare, zeitabh¨angige Differentialgleichung x ¨(t) = −f (t) x(t) (t ∈ R) mit stetigem, T –periodischem f : R → [0, ∞), T > 0, also f (t + T ) = f (t). Die Differentialgleichung ist ¨aquivalent zu einem hamiltonschen System mit zeitabh¨angiger Hamilton–Funktion H : Rt × R2x → R
, H(t, x1 , x2 ) := 12 x21 + 12 f (t) x22 .
(a) Zeigen Sie, dass die durch den hamiltonschen Fluss definierten linearen Abbildungen Φt : R2 → R2 , Φt (x(0)) := x(t), t ∈ R, aufgrund der Zeitabh¨angigkeit von f im Allgemeinen keine Gruppe bilden. ur alle s ∈ R. Daraus folgt dann, dass die (b) Zeigen Sie ΦT +s = Φs ◦ ΦT f¨ Abbildungen ΦnT = (ΦT )n , n ∈ Z, eine Gruppe bilden. (c) Man nennt A := ΦT : R2 → R2 die Periodenabbildung des Systems. Begr¨ unden Sie, warum diese linear ist und Determinante 1 hat. (d) Zeigen Sie, dass die Nulll¨ osung Φt (0) = 0 genau dann liapunov–stabil ist, wenn 0 liapunov–stabiler Fixpunkt von A (das heißt des dynamischen Systems Ψ : Z × R2 → R2 , Ψ(n, x) := An (x)) ist. (e) In Verallgemeinerung von Definition 7.2 bezeichnen wir die Nulll¨osung als stark stabil, wenn sie f¨ ur alle Hamilton–Funktionen in einer Umgebung von H liapunov–stabil ist. Hier schr¨anken wir uns auf Hamilton–Funktionen der ˜ : Rt × R2 → R, (t, x) → x, B(t)x ˜ ˜ : R → Mat(2, R), Form H mit B ˜ + T ) ein und verwenden die Norm ˜ = B(t) ˜ = B(t B(t) ˜ := sup B(t)v R2 | t ∈ [0, T ], v ∈ R2 , v ≤ 1
H
zur Definition einer Umgebung. Zeigen Sie, dass die Nulll¨osung stark stabil ist, wenn A (aus (c)) die Bedingung |tr A| < 2 erf¨ ullt. (f) Betrachte nun die konkrete Funktion f (t)2 := ω 2 (1 + ε cos(t)) mit ω, ε ∈ R. Zeigen Sie mit Hilfe von (e), dass die Nulll¨osung f¨ ur die Parameterwerte 3 ε = 0 und ω ∈ R \ 12 Z stark stabil ist.
7. Stabilit¨atstheorie
7.2
131
Liapunov-Funktionen
Wir verlassen jetzt den Fall linearer Differentialgleichungssysteme und wenden uns dem nicht linearen Fall zu. Eine nat¨ urliche Fragestellung ist die, ob ein Fixpunkt dann asymptotisch stabil ist, wenn die Linearisierung der DGL um diesen Punkt zu einem asymptotisch stabilen linearen Fluss f¨ uhrt. F¨ ur die Beantwortung dieser und vergleichbarer Fragen (wie der in Bemerkung 7.9 angesprochenen) sind Liapunov–Funktionen n¨ utzlich: 7.5 Definition Sei Φ : G × M → M ein stetiges dynamisches System 1 . L ∈ C 0 (M, R) heißt Liapunov–Funktion von Φ, wenn L (oder –L) entlang der Bahnkurven monoton f¨allt. Eine Bahnkurve, die zu einem gegebenen Zeitpunkt die Menge M := {m ∈ M | L(m) ≤ } trifft, kann diese in Zukunft nicht mehr verlassen. Andererseits h¨atte man gerne, dass die Funktion (außer an Fixpunkten etc.) streng monoton in der Zeit f¨allt, und die Trajektorien in immer kleineren Mengen M ⊂ M mit < gefangen werden. Nat¨ urlich l¨asst sich ein entsprechendes Argument f¨ ur eine entlang Bahnkurven monoton wachsende Funktion anwenden. Wir wollen nun zeigen, dass die L¨ osungen der Differentialgleichung in f¨ uhrender Ordnung durch die Linearisierung von f kontrolliert werden, soweit wir uns in der N¨ahe der Gleichgewichtslage befinden. Wir k¨ onnen die Gronwall–Ungleichung (Satz 3.42) benutzen. 7.6 Satz (Liapunov) Eine Gleichgewichtslage xs ∈ U ⊆ Rn der Differentialgleichung x˙ = f (x) , f ∈ C 1 (U, Rn ) ist asymptotisch stabil, wenn Ind Df (xs ) = n ist. Beweis: • Wieder k¨ onnen wir durch eine Verschiebung xs = 0 erreichen. Da ort eine Kugelumgebung vom positiven Radius r˜ zu U . U ⊆ Rn offen ist, geh¨ ur alle Eigenwerte λi ∈ C • F¨ ur A := Df (xs ) gibt es ein Λ < 0 mit Re(λi ) < Λ f¨ von A. Außerdem gibt es (wie man aus der Jordan–Normalform von exp(At) abliest) ein C ≥ 1 mit
exp(At) ≤ C exp(Λt)
(t ≥ 0).
(7.2.1)
Die Duhamel–Gleichung (4.2.10) erlaubt uns, die maximale L¨osung des Anfangswertproblems in der Form t x(t) = exp(At)x(0) + exp A(t − s) R x(s) ds (t ∈ I) 0 1 Oft gen¨ ugt es bei Benutzung von Liapunov–Funktionen, zu zeigen, dass die Dynamik ur alle t ≥ 0 existiert, so etwa im Beweis des nachfolgenden Satzes 7.6. Φt : M → M f¨
132
7.2. Liapunov-Funktionen
mit I ⊆ R zu schreiben, f¨ ur den St¨ orterm R(x) := f (x) − Ax. • Nun existiert ein Radius r ∈ (0, r˜) mit
R(x) ≤ denn nach Taylor ist limx→0
|Λ|
x , 2C
R(x) x
falls x ≤ r,
(7.2.2)
= limx→0 f (x)−Df (0)x−f (0) / x = 0.
• Mit (7.2.1) und (7.2.2) folgt f¨ ur die Funktion F : I → [0, ∞)
,
F (t) := x(t) exp(|Λ|t),
ur das maximale Zeitf¨ ur alle L¨osungen mit Anfangswerten x(0) ∈ Ur (0) und f¨ intervall [0, T ) ⊂ I mit x [0, T ) ⊂ Ur (0) F (t) ≤ CF (0) +
t
C 0
|Λ|
x(s) ds ≤ CF (0) + 2C
t 0
|Λ| F (s) ds 2
t ∈ [0, T ) .
Nach dem Gronwall–Lemma 3.42 ist also F (t) ≤ CF (0) exp( 12 |Λ|t) oder
x(t) ≤ C x(0) exp 12 Λt . ur alle Die L¨osungskurven mit Anfangsbedingung x(0) ∈ Ur/C (0) bleiben also f¨ positiven Zeiten in der Vollkugel Ur (0) und konvergieren gegen die Ruhelage bei 2 Null. Mit anderen Worten ist xs asymptotisch stabil. 7.7 Bemerkungen 1. Der Beweis lieferte zus¨atzlich die Aussage, dass alle x ∈ Ur/C (0) zu gegen die Gleichgewichtslage konvergierenden Orbits geh¨oren, also in deren Einzugsbereich, dem Bassin, liegen (siehe Definition 2.23). 2. Als Korollar erhalten wir, dass eine Gleichgewichtslage xs instabil ist, falls ¨ Ind −Df (xs ) = n gilt. Das folgt aus Satz 7.6 mittels Zeitumkehr, also Uber gang zu −f . F¨ ur die Instabilit¨at von xs reicht aber sogar Ind − Df (xs ) ≥ 1 aus (siehe etwa Walter [Wa1], §29. 3 7.8 Aufgabe (Liapunov–Funktion) Die Vektorfelder in der folgenden Aufgabe sind nicht vollst¨andig. Daher erweitern wir Definition 7.5 auf diese Situation: F¨ ur die Differentialgleichung x˙ = g(x) auf M ⊆ Rn mit lokal lipschitz–stetigem Vektorfeld g : M → Rn existiere eine stetig differenzierbare Funktion V : M → R, so dass f¨ ur alle L¨ osungen I t → x(t) der Differentialgleichung d V x(t) ≤ 0 (t ∈ I) dt erf¨ ullt ist. Bekannterweise ist der Ursprung ein liapunov–stabiler, aber nicht asympto tisch stabiler Fixpunkt des linearen Systems x˙ = Ax mit x ∈ R2 , A = 01 −1 0 . Verwenden Sie die Liapunov–Funktion V (x) := 12 x 2 , um die Stabilit¨at der gest¨orten Systeme x˙ = Ax + fj (x) mit fj : R2 → R2 (j ∈ {1, 2, 3})
7. Stabilit¨atstheorie
133
(a) f1 (x1 , x2 ) := (−x31 − x1 x22 , −x32 − x21 x2 ) (b) f2 (x1 , x2 ) := (x31 + x1 x22 , x32 + x21 x2 ) (c) f3 (x1 , x2 ) := (−x1 x2 , x21 ) zu untersuchen. Welche Form haben die Orbits im Fall (c)? 2 2 3 Es sei nun x˙ = f4 (x) :=
−x2 −x1 x2 +x3 −x1 x1 +x33 −x32 −x1 x3 −x21 x3 −x2 x23 −x53
. Zeigen Sie:
(d) 0 ∈ R3 ist asymptotisch stabil. (e) Die Trajektorien des linearisierten Systems x˙ = Df4 (0)x liegen in Kreisen parallel zur x1 , x2 –Ebene, der Ursprung ist f¨ ur das linearisierte System also liapunov–stabil, aber nicht asymptotisch stabil. 3 7.9 Bemerkung (Liapunov–Funktion und hamiltonsche Dynamik) Es mag so aussehen, als ob das Konzept der Liapunov–Funktion im hamiltonschen Fall keine Anwendung findet. In der Tat ist ja dort das Phasenraumvolumen erhalten, sodass wir sowieso keine asymptotische Stabilit¨at erwarten k¨onnen. Es gibt aber andere Anwendungen: 1. Nichtdegenerierte Extremalstellen x einer Hamilton–Funktion H sind liapunov– stabile Fixpunkte. Denn einerseits ist XH (x) = 0, andererseits ist H selbst Liapunov–Funktion, da der Wert von H sich entlang der Orbits nicht ¨andert. Zum dritten gibt es f¨ ur eine Minimalstelle x zu jeder Umgebung U von x eine Umgebung V ⊂ U von x der Form V = H −1 [h, h + ε) . 2. Betrachten wir zum Beispiel die durch die Hamilton–Funktion H : M := R3p × R3q → R
,
H(p, q) = 12 p 2
gegebene freie Bewegung q˙ = p, p˙ = 0 oder Φ t, (p0 , q0 ) = (p0 , q0 + p0 t). L : M → R, (p, q) → p, q ist dann eine Liapunov–Funktion, denn d L Φt (p, q) = p, ˙ q + p, q ˙ = p, q ˙ = p 2 ≥ 0. dt d
q 2 , ist t → q 2 (t) konvex. Das k¨onnen wir zwar in Da L(p, q) = 12 dt diesem Fall auch direkt ausrechnen, denn q 2 (t) = q0 + p0 t 2 .
Wir k¨onnen aber ¨ahnlich argumentieren, wenn die Bewegung des Teilchens von einem Kraftfeld (schwach) abgelenkt wird. Unter geeigneten Voraussetzungen k¨onnen wir dann schließen, dass die Bahn trotzdem nach r¨aumlich unendlich geht. Daher ist dieses Argument in der Streutheorie beliebt (siehe etwa den Beweis von Satz 12.5). L heißt dort escape-Funktion. 3
134
7.3. Verzweigungen
7.3
Verzweigungen
Oft h¨angt ein dynamisches System von Parametern ab, wie zum Beispiel die in Kapitel 5.4 diskutierte Feder mit Reibung. Unter Ver¨anderung des Parameters wird sich im Allgemeinen das Phasenportrait (das heißt die Zerlegung des Phasenraums in orientierte Orbits) ¨andern. Es kann sein, dass wir einen Hom¨ oomorphismus des Phasenraums finden, der die Phasenportraits ineinander u uhrt, das heißt, orientierte Orbits auf ¨berf¨ orientierte Orbits abbildet. Solche Hom¨ oomorphismen wurden f¨ ur die linearen hyperbolischen Fl¨ usse in Satz 5.9 konstruiert. Es kann aber auch sein, dass sich das Phasenportrait an einem bestimmten Parameterwert qualitativ ¨andert, dass es also nicht nur eine Deformation des Phasenportraits f¨ ur andere Parameterwerte ist und kein derartiger Hom¨oomorphismus existiert. Ein solches Ph¨anomen wird Verzweigung oder auch Bifurkation genannt. Wie so vieles in der Theorie dynamischer Systeme geht der Begriff auf Poincar´e zur¨ uck. Qualitative Ver¨anderungen des Phasenportraits durch Verzweigung eines Fixpunktes heißen lokale, alle anderen globale Bifurkationen. Eine besondere Situation liegt vor, wenn sich der Phasenraum selbst parameterabh¨angig ¨andert. Beispielsweise ist ja bei hamiltonschen Systemen die Gesamtenergie Konstante der Bewegung, man kann also deren Niveaufl¨achen als reduzierte Phasenr¨aume benutzen. Bei Energie¨anderung k¨onnen diese Phasenr¨aume zueinander hom¨ oomorph bleiben oder ihre Gestalt ¨andern.
7.3.1
Verzweigungen von Ruhelagen
Am einfachsten ist die Theorie der lokalen Verzweigungen eines parameterabh¨angigen differenzierbaren dynamischen Systems. Dessen Phasenraum M und Parameterraum P sind differenzierbare Mannigfaltigkeiten. Wir betrachten also f¨ ur die Differenzierbarkeitsstufe n ∈ N (oder n = ∞): • im zeitdiskreten Fall einen parameterabh¨angigen Diffeomorphismus Fp : M → M (p ∈ P ), gegeben durch ein F ∈ C n M × P, M , und einen Fixpunkt x0 ∈ M von Fp0 ; • im zeitkontinuierlichen Fall die parameterabh¨angige Differentialgleichung (7.3.1) x˙ = f (x, p) mit f ∈ C n M × P, Rd . Es sei f¨ ur Parameterwert p0 ∈ P der Phasenraumpunkt x0 ∈ M eine Ruhelage. Bei lokalen Betrachtungen in einer Umgebung von (x0 , p0 ) ∈ M × P gehen wir ohne Beschr¨ankung der Allgemeinheit davon aus, dass der Phasenraum M statt eine beliebige Mannigfaltigkeit eine offene Teilmenge des Rd ist, und der Parameterraum P offen in Rk .
7. Stabilit¨atstheorie
135
ur die Ruhelage x0 , wenn 7.10 Definition p0 ∈ P heißt Verzweigungspunkt f¨ • die Matrix D1 F (x0 , p0 ) ∈ Mat(d, R) einen komplexen Eigenwert mit Betrag 1 besitzt; • die Matrix D1 f (x0 , p0 ) ∈ Mat(d, R) einen imagin¨aren Eigenwert besitzt. 7.11 Bemerkung Der Vorteil dieser Definition ist einerseits, dass sich die Bedingung leicht u ufen l¨asst. Andererseits wissen wir als Folgerung von Satz ¨berpr¨ 5.9, dass bei linearen Differentialgleichungen x˙ = Ax genau f¨ ur diese nichthyperbolischen Systemmatrizen A ∈ Mat(d, R) Verzweigungen auftreten. Genau f¨ ur diesen Fall besitzen aber die L¨ osungsoperatoren exp(At) f¨ ur Zeiten t = 0 einen komplexen Eigenwert vom Betrag Eins, was auch den ersten Teil der Definition motiviert. 3 Bei diesen Punkten (x0 , p0 ) im erweiterten Phasenraum kann sich das parameterabh¨angige Phasenraumportrait qualitativ ¨andern, dies muss aber nicht der Fall sein. Umgekehrt gilt allerdings: ur den Pa7.12 Satz (Parametrisierte Fixpunkte) Es sei x0 ∈ M Fixpunkt f¨ rameterwert p0 . Unter den folgenden Bedingungen gibt es offene Umgebungen ˜ ⊆ M von x0 sowie eine Abbildung X ∈ C n (P˜ , M ˜ ) mit P˜ ⊆ P von p0 und M X(p0 ) = x0 , die die Ruhelagen lokal parametrisiert: • Wenn 1 kein Eigenwert der Matrix D1 F (x0 , p0 ) ist. Dann ist f¨ ur p ∈ P˜ ˜ × P˜ . F X(p), p = X(p) , und graph(X) = {(x, p) | F (x, p) = x} ∩ M • Wenn 0 kein Eigenwert der Matrix D1 f (x0 , p0 ) ist. Dann ist ˜ × P˜ . f X(p), p = 0 (p ∈ P˜ ) und graph(X) = f −1 (0) ∩ M Beweis: Dies ist einfach der Satz u ¨ber implizite Funktionen, angewandt auf F − IdM beziehungsweise f . 2 Die Voraussetzung ist jeweils erf¨ ullt, wenn x0 kein Verzweigungspunkt ist. 7.13 Bemerkung (Asymptotische Stabilit¨ at) Der Satz besagt, dass bei kleinen Ver¨anderungen der Parameter der Fixpunkt nicht verschwinden kann oder ein zweiter Fixpunkt in seiner N¨ahe auftauchen kann. Stattdessen ver¨andert sich seine Lage gem¨aß X, also mit der gleichen Differenzierbarkeitsstufe wie das parameterabh¨angige Vektorfeld selbst. ist, dann ist im zeitkontiFordert man sogar, dass p0 kein Verzweigungspunkt nuierlichen Fall der Index p → Ind D1 f (X(p), p) der Systemmatrix (Definition 5.2) auf P˜ konstant. Eine analoge Aussage gilt im zeitdiskreten Fall f¨ ur die Anzahl der komplexen Eigenwerte, deren Betrag echt kleiner als Eins ist. Also bleibt insbesondere nach dem Satz von Liapunov (Satz 7.6) asymptotische Stabilit¨at unter kleinen St¨ orungen des Parameters erhalten. 3
136
7.3. Verzweigungen
Anders ist die Situation in den folgenden Beispielen. Dass diese keine dynamischen Systeme im engeren Sinn erzeugen, weil die L¨osungen nicht f¨ ur alle Zeiten existieren, tut nichts zur Sache.
7.14 Beispiel (Die Sattel-Knoten-Verzweigung) Wir betrachten die durch p ∈ R parametrisierte Familie von Differentialgleichungen x˙ = Fp (x) := p + 12 x2 auf dem Phasenraum M := R. • F¨ ur p > 0 ist Fp (x) ≥ p > 0, es existiert also kein Fixpunkt.
• F¨ ur p = 0 existiert genau der Fixpunkt x0 = 0. Dieser ist instabil, denn die ur die Anfangswerte x0 > 0 allgemeine L¨osung x(t) = 1−txx00 /2 divergiert f¨ sogar bei t = 2/x0 . √ • F¨ ur p < 0 existieren die beiden Fixpunkte x±,p := ± −2p. Dabei ist x−,p eine asymptotisch stabile, x+,p eine instabile Ruhelage, denn Fp (x±,p ) = x±,p .
Die Linearisierung der Differentialgleichung an den Fixpunkten hat die Form y˙ = x± (p) · y
x
f¨ ur p < 0
und y˙ = 0 f¨ ur p = 0. Genau f¨ ur p = 0 hat die Linearisierung also nicht mehr den maximalen Rang 1. Man sieht an diesem Beispiel, dass sich ein Paar, bestehend aus einem stabilen und einem instabilen Fixpunkt, durch Kollision ausl¨ oschen kann. 3
p
Sattel-Knoten-Verzweigung x˙ = p + 12 x2 . Instabiler Fixpunkt: Hell
7.15 Beispiel (Die Hopf-Verzweigung) Auf dem Phasenraum M := R2
7. Stabilit¨atstheorie
137
ist die Normalform der Hopf-DGL x − x 2 x, (7.3.2) x˙ = p1 −1 p mit Parameter p ∈ R, siehe nebenstehende Abbildung. Offensichtlich ist 0 ∈ M f¨ ur alle Parameterwerte eine Ruhelage. Er ist auch der einzige Fixpunkt, denn das Betragsquadrat des Vektorfeldes auf der rechten Seite von (7.3.2) ist f¨ ur x = 0
x
˙ 2 = x 2 1 + (p − x 2 )2 > 0.
x1
x2
Am einzigen Verzweigungspunkt p diese Ruhelage ist p0 = 0 f¨ u0r −1 Df0 (0) = 1 0 , die Eigenwerte Die Hopf-Verzweigung (7.3.2) sind also nicht reell. Daher bleibt zwar die Ruhelage erhalten, aber ihr Stabilit¨ats-Status ¨andert sich: Auf R2 \ {0} besitzt die DGL in Polarkoordinaten x1 = r cos ϕ , x2 = r sin ϕ, (r, ϕ) ∈ (0, ∞) × R die Form , ϕ˙ = 1, r˙ = r p − r2 denn r˙ =
d 2 dt r
2r
=
x1 x˙ 1 +x2 x˙ 2 r
und ϕ˙ = 2
x˙ 2 x1 −x˙ 1 x2 x21 +x22
= 1.
Damit wird f¨ ur Radien mit r > max(0, p) die Zeitableitung r˙ < 0, f¨ ur ur r2 = p > 0 ist r˙ = 0 und wir haben einen 0 < r 2 < p aber r˙ > 0. F¨ periodischen Orbit gefunden (siehe auch Beispiel 3.35.2). 3 Diese beiden Beispiele sind in gewisser Weise typisch f¨ ur einparametrige Verzweigungen von Fixpunkten. Betrachten wir dazu eine stetige Familie A : I → Mat(d, R)
, t → At
von durch ein Intervall I parametrisierten Matrizen. Wir nehmen an, dass f¨ ur Parameterwert t = 0 ∈ I die Matrix A0 mindestens einen Eigenwert λ0 mit Realteil 0 besitzt. Dann k¨ onnen zwei F¨alle auftreten: λ0 = 0 oder λ0 = 0. Im zweiten Fall sind λ0 , λ0 ∈ iR \ {0} zwei voneinander verschiedene imagin¨are Eigenwerte. Besitzt A0 unter dieser Maßgabe maximalen Rang, dann ist die reelle Jordan–Normalform von A0 - f¨ ur λ0 = 0 gleich 0 ⊕ J ∈ R ⊕ Mat(d − 1, R) 0 −Im(λ0 ) ⊕ J ∈ Mat(2, R) ⊕ Mat(d − 2, R), - f¨ ur λ0 , λ0 ∈ iR \ {0} gleich Im(λ0 ) 0 wobei in beiden F¨allen die Matrix J regul¨ar ist. Der erste Fall tritt bei der Sattel– Knoten–Verzweigung auf, der zweite bei der Hopf–Verzweigung.
138
7.3.2
7.3. Verzweigungen
Verzweigungen periodischer Orbits
Bei einem parameterabh¨angigen dynamischen System l¨asst sich die Verzweigung eines t–periodischen Orbits O(m) • im zeitdiskreten Fall Fp : M → M auf die Verzweigung des Fixpunkts m der Iterierten Fpt : M → M zur¨ uckf¨ uhren. • Auch im zeitkontinuierlichen Fall ist die Reduktion auf die Verzweigung des Fixpunkts m einer Abbildung m¨ oglich. Diese wird Poincar´e–Abbildung genannt.
7.16 Definition • F¨ ur ein Vektorfeld X : M → T M auf der Mannigfaltigkeit M wird eine Untermannigfaltigkeit S mit dim(S) = dim(M ) − 1 ( lokaler) zu X transversaler Schnitt genannt, wenn f¨ ur alle m ∈ S gilt: Tm M = Tm S ⊕ span(X(m)). • F¨ ur ein differenzierbares dynamisches System Φ : R × M → M und einen Punkt m ∈ M auf einem periodischen Orbit sei S ⊂ M ein zum Vektorfeld d ur offene Umgebungen U, V ⊆ S dt Φt |t=0 transversaler Schnitt mit m ∈ S. F¨ von m heißt ein Diffeomorphismus F : U → V Poincar´ e–Abbildung des Orbits O(m), wenn diese von der Form F (x) = Φ T (x), x ist, mit der Poincar´ e–Zeit T : U → (0, ∞)
, T (x) := inf{t > 0 | Φt (x) ∈ V }.
7.17 Satz F¨ ur jeden periodischen Orbit O(m) mit Minimalperiode t0 > 0 gibt es eine Poincar´e–Abbildung F : U → V mit m ∈ U ∩ V , f¨ ur deren Poincar´e–Zeit T ∈ C 1 (U, R+ ) gilt: T (m) = t0 . d Beweis: • Da m keine Ruhelage ist, also das Vektorfeld X := dt Φt |t=0 bei m ungleich Null ist, gibt es einen transversalen Schnitt bei m. Nach dem Satz u ¨ber die Begradigung (Satz 3.46) existiert n¨amlich eine C r –Karte (W, ϕ) von M mit ˜ := m ∈ W , die XW auf das konstante Vektorfeld e1 = (1, 0, . . . , 0) auf W n ϕ(W ) ⊆ R abbildet. Dabei ist d := dim(M ). Wir setzen ohne Einschr¨ankung der Allgemeinheit ϕ(m) := 0 ∈ Rd und rechnen einfachheitshalber in den lokalen Koordinaten der Karte. Mit den Projektionen
Π : Rd → Rd , Π(x) := x, e1 e1 = ϕ1 (x)e1
und Π⊥ := 1l − Π
ist f¨ ur kleine ε > 0 die Menge Wε := {x ∈ W | Π(x) < ε, Π⊥ (x) < ε}
(7.3.3)
7. Stabilit¨atstheorie
139
ur ein Zylinder, mit Wε = (−ε, ε) × Sε f¨ Sε := {x ∈ Wε | Π(x) = 0}. Der Fluss nimmt auf Wε die Form Φt (x) = x + t e1
(x ∈ Sε , |t| < ε)
(7.3.4)
an, denn auf W ist x = e1 . • Wir setzen U := {x ∈ Sε | Φt0 (x) ∈ Wε }. Dann ist mit T : U → (0, ∞) , T (x) := t0 − ϕ1 Φt0 (x) und F : U → N := F (U ), F (x) := Φ T (x), x F (x) = Φ − ϕ1 (Φt0 (x)), Φt0 (x) ∈ Sε , denn aus (7.3.4) folgt Φ − ϕ1 (y), y ∈ Sε f¨ ur alle y ∈ Wε . Wegen der stetigen Differenzierbarkeit des Flusses Φ und der Koordinate ϕ1 : W → R sind T und F ebenfalls stetig differenzierbar. • F¨ ur hinreichend kleine ε > 0 ist T eine Poincar´e–Zeit, das heißt T = T˜ mit T˜ : U → R+
, T˜(x) := inf{t > 0 | Φt (x) ∈ Sε }.
Denn f¨ ur t ∈ (ε, t0 − ε) ist dann Φt (m) ∈ Wε , da sonst t0 nicht die Minimalur alle x ∈ U gilt, steht dies periode w¨are. Da andererseits |T (x) − t0 | < ε f¨ im Widerspruch zur Existenz einer Folge von xn ∈ U mit limn→∞ xn = m und 2 t1 := limn→∞ T (xn ) ∈ (0, t0 ). 7.18 Bemerkung (Nutzen der Poincar´ e–Abbildung) Zwar definiert die Poincar´e–Abbildung F : U → V im Allgemeinen kein diskretes dynamisches System, da Definitions– und Wertebereich nicht u ¨bereinstimmen. Dennoch reicht die in F steckende Information aus, um Verzweigungen des periodischen Orbits zu analysieren. Sie ist daf¨ ur sogar besser geeignet als die Abbildung Φt0 : M → M , die m als Fixpunkt besitzt. Denn die lineare Abbildung Tm Φt0 auf dem Tangentialraum Tm M besitzt den Eigenvektor X(m) zum Eigenwert 1: d d d Φt (m)|t−0 = Φt0 +t (m)|t=0 = Φt (m)|t=0 , Tm Φt0 X(m) = Tm Φt0 dt dt dt also X(m). Anders gesagt besitzt die lineare Abbildung Tm Φt0 − IdTm M auf Tm M einen nichttrivialen Kern. Falls Φp0 einen periodischen Orbit der Periode t0 hat, kann man also nicht mit dem Satz u ¨ber implizite Funktionen folgern, dass der parameterabh¨angige Fluss Φp : R × M → M f¨ ur p nahe bei p0 einen periodischen Orbit der gleichen Periode t0 besitzt. Dies ist auch meistens nicht der Fall, wohl aber existiert typischerweise ein periodischer Orbit von Φp mit Periode t(p) und t(p0 ) = t0 . 3
140
7.3. Verzweigungen
m
Fx
x
m
Abbildung 7.3.1: Links: Poincar´e–Schnitt; Rechts: Verzweigung eines Orbits 7.19 Lemma (Eigenwerte der linearisierten Poincar´ e–Abbildung) Ist O(m) ⊆ M ein t0 –periodischer Orbit des Flusses Φ : R × M → M , und ist F : U → V Poincar´e–Abbildung dieses Orbits mit F (m) = m, dann gilt f¨ ur die komplexen Eigenwerte: spek DΦt0 (m) = spek DF (m) ∪ {1}. Beweis: Da der U und V enthaltende transversale Schnitt Sε ⊂ M nach Definition 7.16 die Eigenschaft Tm M = Tm S ⊕ span X(m) hat, k¨onnen wir wie im Beweis des Satzes 7.17 angepasste Koordinaten verwenden. In diesen ist x ∈ Wε = (−ε, ε) × Sε von der Form x = y + s e1 mit (s e1 , y) := Π(x), Π⊥ (x) , also s ∈ (−ε, ε), y ∈ Sε und der Projektion Π aus (7.3.3). Mit der Kartendarstellung (7.3.4) des Flusses ist Φt0 (y + s e1 ) = Φt0 +s (y) gleich Φs+t0 −T (y) ◦ ΦT (y) (y) = Φs+t0 −T (y) ◦ F (y) = F (y) + s + t0 − T (y) e1 , also DΦt0 (m)
δs δy
=
1 −DT (m) 0 DF (m)
δs δy
.
Aus dieser Blockstruktur ergibt sich die Behauptung u ¨ber die Eigenwerte.
2
Wir haben sogar bewiesen, dass die algebraische Vielfachheit der Eigenwertes 1 oßer als die von DF (m) ist. Daraus ergibt sich von DΦt0 (m) um Eins gr¨ 7.20 Korollar (Parametrisierte periodische Orbits) F¨ ur den parameterabh¨angigen Fluss Φp : R × M → M (p ∈ P ) von (7.3.1) sei O(m) ⊆ M ein periodischer Orbit mit Minimalperiode t0 > 0 zum Parameter p0 . Falls der Eigenwert 1 von Tm Φt0 algebraische Multiplizit¨at Eins hat, dann l¨aßt sich dieser periodische Orbit fortsetzen: Es existieren f¨ ur eine Umgebung P˜ ⊆ P von p Abbildungen 0 im Parameterraum n ˜ X ∈ C (P , Sε ) mit X(p0 ) = m und t ∈ C n P˜ , (0, ∞) mit t(p0 ) = t0 , sodass der Φp –Orbit durch X(p) periodisch mit Minimalperiode t(p) ist.
7. Stabilit¨atstheorie
141
7.21 Aufgabe (Parametrisierte periodische Orbits) Beweisen Sie Kor. 7.20. Pr¨azisieren Sie, in welchem Sinn diese Orbits im wesentlichen eindeutig sind. 3 7.22 Bemerkung (Verzweigungen periodischer Orbits) Falls der Eigenwert 1 eine h¨ohere Multiplizit¨at hat, k¨ onnen vom periodischen Orbit weitere periodische Orbits mit ¨ahnlicher Periode abzweigen. Zwar ist letzteres ausgeschlossen, wenn die Voraussetzungen des Korollars 7.20 erf¨ ullt sind. Aber es k¨ onnen andere Verzweigungsph¨anomene vorkommen. Wie im rechten Bild von Abbildung 7.3.1 angedeutet, kann beispielsweise bei Auftreten eines Eigenwertes −1 ein Orbit der doppelten Periode entstehen. In Kapitel 7 und 8 von Abraham und Marsden [AM] finden sich Illustrationen f¨ ur generische beziehungsweise hamiltonsche Bifurkationen. 3
7.3.3
Verzweigungen des Phasenraums
Wie eingangs erw¨ahnt, tritt in hamiltonschen Systemen mit Hamilton–Funktion H : M → R der Fall auf, dass sich der (reduzierte) Phasenraum H −1 (E) selbst parameterabh¨angig ¨andert, denn die Energie kann wegen ihrer zeitlichen Konstanz als Parameter aufgefasst werden. Abh¨angig von der Struktur der Dynamik k¨ onnen noch weitere Konstanten der Bewegung Fk : M → R existieren, und wir fassen diese mit H zu einer Abbildung F ∈ C ∞ (M, N ) zusammen. Wann immer solch eine Abbildung F von differenzierbaren Mannigfaltigkeiten gegeben ist, stellt sich die Frage nach der Ver¨anderung der Niveaumengen F −1 (f ) mit f ∈ N . Im einfachsten, aber untypischen Fall ist F : M → N ein C ∞ –Faserb¨ undel im Sinn von Definition F.1 des Anhangs. Dann wird N als Basis des B¨ undels aufgefasst, und die Fasern F −1 (f ) sind alle diffeomorph zu einer Standardfaser. H¨aufiger treffen wir diese Situation lokal an (siehe auch [AM], Section 4.5 ): 7.23 Definition F¨ ur Mannigfaltigkeiten M und N sei F ∈ C ∞ (M, N ). • F heißt lokal trivial bei f0 ∈ N , wenn es eine Umgebung V ⊆ N von f0 gibt, sodass: - F¨ ur alle f ∈ V ist F −1 (f ) ⊂ M eine differenzierbare Untermannigfaltigkeit; - Auf U := F −1 (V ) gibt es eine Abbildung G ∈ C ∞ U, F −1 (f0 ) , f¨ ur die F × G : U → V × F −1 (f0 ) ein Diffeomorphismus ist. • Die Verzweigungsmenge von F ist V(F ) := {f ∈ N | F ist bei f nicht lokal trivial}. Zun¨achst einmal ist bei einem lokal trivialen Wert die restringierte Abbildung F U : U → V ein C ∞ –Faserb¨ undel, sogar ein Produktb¨ undel. Andererseits gilt f¨ ur singul¨are Werte f ∈ N von F (f¨ ur die es ein Urbild m ∈ M gibt, bei dem die lineare Abbildung Tm F : Tm M → Tn N nicht regul¨ar ist, siehe Definition A.45):
142
7.3. Verzweigungen
7.24 Lemma Die singul¨aren Werte von F geh¨oren zur Verzweigungsmenge V(F ). Beweis: Es sei m0 ∈ M und f0 := F (m0 ). Wir nehmen an, dass F lokal trivial bei f0 ∈ N ist. Daher ist Rang Tm0 (F, G) = dim(M ). Wegen Rang Tm0 (G) ≤ dim F −1 (f0 ) = dim(M ) − dim(N ) 2 ist Rang Tm0 (F ) = dim(N ), m0 also regul¨arer Punkt. Man k¨onnte vermuten, dass V(F ) sogar nur aus den singul¨aren Werten besteht. Wie das folgende Beispiel zeigt, ist das aber nicht immer so: 7.25 Beispiel (Verzweigungsmenge) F¨ ur W : R → R, q → − exp(−q 2 ) (siehe obere Abbildung auf der n¨achsten Seite) ist nur der Minimalwert −1 sinur q = 0. gul¨ar, denn W (q) = −2q W (q) verschwindet nur f¨ Die Verzweigungsmenge von W ist aber V(W ) = {−1, 0}, denn W −1 (E) = ur E ∈ (−1, 0). Um zu sehen, dass die Werte ∅ f¨ ur E ≥ 0 und |W −1 (E)| = 2 f¨ E ∈ (−1, 0) lokal trivial sind, benutzen wir f¨ ur G in Definition 7.23 die Abbildung G : R∗
→
q
→
W −1 (E), sign(q) ln(1/|E|).
Fassen wir W als Potential der Hamilton– Funktion
W q =
H : Rp × Rq → R, H(p, q) = 12 p2 + W (q)
p
auf, dann ist auch V(H) = {−1, 0}. Niveaukurven von H sind in der unteren q Abbildung dargestellt. Deren topologischer Typ ¨andert sich an der Verzweigungsmenge: W¨ahrend die Niveaukurven f¨ ur E > 0 diffeomorph zu zwei Kopien von R sind, ist H −1 (E) f¨ ur E ∈ (−1, 0) diffeomorph ur E < −1 ist H −1 (E) = ∅. 3 zu einer Kreislinie S 1 . F¨ =
Im Abschnitt 11.3.2 werden die Verzweigungen f¨ ur das (integrable) 2–ZentrenModell der Himmelsmechanik untersucht. 7.26 Weiterf¨ uhrende Literatur Einen weitergehenden Einblick in die Verzweigungstheorie bieten Guckenheimer und Holmes [GuHo]. Die Monographie [MMC] von Marsden und McCracken u ¨ber die Hopf–Verzweigung ist auch online erh¨altlich. Marx und Vogt verbinden in [MV] Theorie und Numerik von Bifurkationen. 3
Kapitel 8
Variationsprinzipien
Parabelrutschen, Fakult¨at f¨ ur Mathematik und Informatik der TU M¨ unchen 8.1 8.2 8.3 8.4 8.5 8.6 8.7
Lagrange- und Hamilton–Gleichungen Holonome Zwangsbedingungen . . . . Das hamiltonsche Variationsprinzip . . ¨ Die Geodatische Bewegung . . . . . . Die Jacobi–Metrik . . . . . . . . . . . . Das fermatsche Prinzip . . . . . . . . . Die geometrische Optik . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. 144 . 149 . 152 . 159 . 164 . 169 . 171
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 8,
143
144
8.1. Lagrange- und Hamilton–Gleichungen
Die Lagrange–Gleichungen einer Lagrange–Funktion sind Differentialgleichungen zweiter Ordnung. Mit ihnen lassen sich Zwangsbedingungen (die in Anwendungen etwa durch Befestigung an Achsen oder Verbindungsstangen entstehen) durch Restriktion der Lagrange–Funktion realisieren. Variationsprinzipien fassen die L¨ osungen der Differentialgleichungen als Extrema von Funktionen auf R¨aumen von Kurven auf. Dies erleichtert das Auffinden dieser L¨osungen, bereitet aber auch konzeptionell die Quantenmechanik vor.
8.1
Lagrange- und Hamilton–Gleichungen
Bisher haben wir uns auf den Standpunkt gestellt, die Zielsetzung der analytischen Mechanik bestehe darin, f¨ ur eine gegebene Hamilton–Funktion die L¨osungen der hamiltonschen Differentialgleichung zu finden, oder, falls dies nicht m¨oglich sein sollte, zumindest qualitative Eigenschaften wie Fixpunkte, Stabilit¨at etc. zu untersuchen. Wie man die Hamilton–Funktion findet, die ein vorgegebenes mechanisches System beschreibt, wurde noch nicht analysiert. Nun ist diese Fragestellung sicher zu einem Teil außermathematisch und f¨allt in den Bereich der Modellbildung in der Physik. Andererseits l¨asst sich doch unter Annahme einer bestimmten Form elementarer Wechselwirkungen (wie Elektromagnetismus oder Gravitation) die Hamilton–Funktion eines physikalischen Systems berechnen. Es taucht dabei allerdings eine Problematik auf, die mit dem Begriff des Impulses zusammenh¨angt. W¨ahrend der Ort und auch die Geschwindigkeit eines Teilchens wohldefinierte messbare Gr¨ oßen sind 1 , ist der Impuls eine abgeleitete Gr¨oße, f¨ ur die erst nach Kenntnis der Hamilton–Funktion H eine Messvorschrift gefunden werden kann. Die Geschwindigkeit ist ja gleich q˙ = D1 H(p, q). Daher ist der Impuls nur f¨ ur eine Hamilton–Funktion der Form H(p, q) = c p 2 + V (q) der Geschwindigkeit proportional. Dies ist einer der Gr¨ unde, weshalb neben der Hamilton–Funktion auch die sogenannte Lagrange–Funktion in der Mechanik wichtig ist. Denn diese ist eine Funktion der Orte und Geschwindigkeiten (statt der Orte und Impulse). Im betrachteten Beispiel ist die zugeh¨ orige Lagrange–Funktion L(q, ˙ q) =
1 ˙ 2 4c q
− V (q).
(8.1.1)
Der erste Summand wird auch kinetische Energie, der zweite potentielle Energie des Teilchens genannt. Da die beiden Terme voneinander subtrahiert statt addiert werden, ist die Lagrange–Funktion im Allgemeinen keine Konstante der Bewegung. Diesem Nachteil steht aber (wie im folgenden Abschnitt 8.2 dargestellt) gegen¨ uber, dass Zwangsbedingungen einfach in den Lagrange–Formalismus eingebaut werden k¨onnen. 1 auch im Rahmen der speziellen Relativit¨ atstheorie ist das in jedem Inertialsystem so, und man kann zwischen den Inertialsystemen umrechnen.
8. Variationsprinzipien
145
Jedenfalls kann man typischerweise zwischen diesen beiden Formulierungen der Mechanik wechseln (siehe Satz 8.6). Die direkteste und historisch erste Formulierung der Mechanik ist die newtonsche, also das Gesetz Kraft =
Masse × Beschleunigung
oder
F (q, q, ˙ t) = m q¨.
Diese Formulierung f¨ uhrt also unmittelbar auf die Bewegungsgleichungen. Wie schon in der Einleitung gesehen, ist es aber n¨ utzlich festzustellen, dass oft die Kraft nicht nur allein eine Funktion des Ortes q ist, sondern sie sich auch als (negativer) Gradient einer reellwertigen Funktion V von q darstellen l¨asst: F (q) = −∇V (q).
(8.1.2)
Damit schließen wir mit Impuls p = mv, dass die newtonschen Gleichungen von 2 uhren. Aus Satz 6.3 folgt: der Hamilton–Funktion H(p, q) = p 2m + V (q) herr¨ 8.1 Korollar Das Kraftfeld F ∈ C 1 (U, Rn ) auf einem offenen und einfach zusammenh¨angenden (zum Beispiel konvexen) Konfigurationsraum U ⊆ Rnq ist genau dann ein Gradienten–Vektorfeld, wenn f¨ ur seine Komponenten gilt: ∂Fi ∂Fk = ∂qk ∂qi
(i, k ∈ {1, . . . , n}).
Beispielsweise muss f¨ ur n = 3 die Rotation von F verschwinden. Es ist also eine spezifische Form der Kr¨afte, die eine Formulierung der mechanischen Bewegungsgleichungen mithilfe einer einzigen Funktion erlaubt. 8.2 Definition • F¨ ur eine Funktion L ∈ C 2 (U × Rnv , R), genannt Lagrange– Funktion, mit einem offenen Konfigurationsraum U ⊆ Rnq heißt das Differentialgleichungssystem d ∂L (q, q) ˙ dt ∂vi
=
∂L (q, q) ˙ ∂qi
(i = 1, . . . , n)
(8.1.3)
Lagrange–Gleichung von L. • p := D2 L(q, v) heißt (verallgemeinerter) Impuls. 2 8.3 Beispiel Die Wahl c := 1/(2m) in (8.1.1) ergibt L(q, v) = m 2 v − V (q). Die Lagrange–Gleichung m¨ q = −∇V (q) entspricht damit der newtonschen Bewegungsgleichung eines Teilchens der Masse m im Potential V . 3
In diesem Beispiel k¨ onnen wir die Gleichung p = D2 L(q, v) des Impulses nach v aufl¨osen: v ≡ v(p, q) = p/m. Betrachten wir nun die Hamilton–Funktion p 2 + V (q), H(p, q) := p, v(p, q) − L q, v(p, q) = 2m
(8.1.4)
146
8.1. Lagrange- und Hamilton–Gleichungen
und schreiben mithilfe des Impulses die Lagrange–Gleichungen in ein System von 2n Differentialgleichungen erster Ordnung um, so ergibt sich, dass diese Gleichungen 4 mv˙ = −∇V (q) p˙ = −∇V (q) ⇐⇒ q˙ = v q˙ = p/m die hamiltonschen Gleichungen von H sind. Wir wollen diesen Zusammenhang auch f¨ ur andere Lagrange–Funktionen herstellen. Es stellt sich dabei die Frage, unter welchen Bedingungen an die Lagrange–Funktion L wir die Gleichung p = p(q, v) = D2 L(q, v) so umstellen k¨onnen, dass v = v(p, q) die abh¨angige Variable wird. Dieses geometrische Problem einer ableitungsdefinierten Variablentransformation wird durch die Legendre–Transformation gel¨ost (siehe Anhang C). F¨ ur die Lagrange–Funktionen, die die entsprechende Bedingung erf¨ ullen, wird (8.1.4) eine Hamilton–Funktion liefern, deren hamiltonsche Differentialgleichung ¨aquivalent zu der Lagrange–Gleichung von L ist. 8.4 Beispiel (Legendre–Transformation quadratischer Formen) F¨ ur eine symmetrische Matrix A ∈ Mat(d, R), A > 0 besitzt die quadratische Form f : Rd → R, f (x) := 12 x, Ax die zweite Ableitung D2 f (x) ≡ A und Legendre– Transformierte f ∗ (p) = sup p, x − f (x) = p, x(p) − 12 x(p), Ax(p) mit x(p) = A−1 p, x∈Rd
) * also f ∗ : Rd → R, f ∗ (p) = 12 p, A−1 p . Diese Beziehung wird z.B. in der Umrechnung der kinetischen Energie von Geschwindigkeits- auf Impulskoordinaten verwendet. 3 8.5 Aufgabe (Legendre–Transformation) Es sei H : Rd → R konvex und H ∗ : Rd → R , H ∗ (q) := sup p, q − H(p) p∈Rd
die Legendre-Transformierte von H. (a) Zeigen Sie f¨ ur H(p) = 1r p r mit r ∈ (1, ∞), dass gilt: H ∗ (q) = 1s q s , mit 1 1 r + s = 1. (b) Diesmal sei H(p) = 12 p, Ap + b, p + c mit einer symmetrischen, positiv definiten Matrix A, b ∈ Rd und c ∈ R. Bestimmen Sie H ∗ . Bemerkung: Diese Formel wird bei der Legendre–Transformation der die Bewegung im elektromagnetischen Feld beschreibenden Lagrange–Funktion verwendet, siehe Aufgabe 8.8 (b). 3 Allgemeiner wenden wir nun die Legendre–Transformation an, um die Lagrange– Funktion in die Hamilton–Funktion umzuwandeln und umgekehrt. Das ist bei quadratischem Wachstum in der Geschwindigkeit m¨oglich:
8. Variationsprinzipien
147
8.6 Satz F¨ ur L ∈ C 2 (U × Rnv , R) mit offenem U ⊆ Rnq gebe es ein a > 0 mit (q, v) ∈ U × Rnv , w ∈ Rn .
* ) w, D2v L(q, v), w ≥ a w, w
• Dann ist mit Impuls p ≡ p(q, v) = Dv L(q, v) H(p, q) = p, v − L(q, v) die Legendre–Transformierte von L bez¨ uglich v, und H ∈ C 2 (Rnp × U, R). • Die Lagrange–Gleichungen (8.1.3) sind ¨aquivalent zu den Hamilton-Gleichungen ∂H ∂H , q˙i = (i = 1, . . . , n). p˙ i = − ∂qi ∂pi Beweis: • q ∈ U ist in der Beziehung zwischen H und L nur ein Parameter. Setzt man Lq (v) := L(q, v), dann ist v → p(q, v) = DLq (v) nach Satz C.7 ein Diffeomorphismus auf das Bild. Dieses Bild B := p(q, Rn ) ⊆ Rn ist aber wegen der Voraussetzung D2v L(q, v) ≥ a1l wieder der Rn . • Betrachten wir die Abbildung Φ : U × Rnv → Rnp × U
,
( vq ) → ( pq ) =
D
v L(q,v)
q
.
Nach den gerade bewiesenen Eigenschaften von v → p(q, v) ist diese einmal stetig differenzierbar und bijektiv. Am Punkt (q, v) mit Bild (p, q) ist ihre totale Ableitung durch Dq Dv L(q, v) D2v L(q, v) DΦ(q, v) = 1l 0 gegeben. Die Jacobi–Matrix hat Determinante (−1)n det D2v L = 0 und ist damit invertierbar. Daher ist aber mit Satz 2.38 auch Φ lokal invertierbar, Φ also ein bijektiver lokaler Diffeomorphismus und damit ein Diffeomorphismus. • Dass H die gleiche Differenzierbarkeitsstufe wie L hat, folgt aus Satz C.9. ¨ • Die Aquivalenz der Bewegungsgleichungen ergibt sich aus der Bildung der totalen ¨außeren Ableitungen von H und L: Einerseits ist dH = Dp H dp + Dq H dq, andererseits wegen Dv L = p die ¨außere Ableitung dH = d v, p − L(q, v) gleich v dp + p dv − Dq L dq − Dv L dv = v(q, p) dp − Dq L dq. d Koeffizientenvergleich ergibt q˙ = v = Dp H, Dq H = −Dq L = − dt Dv L = −p, ˙ dq wenn wir (neben der Definition v = dt der Geschwindigkeit) die Lagrange– d Dv L(q, v) voraussetzen. 2 Gleichungen Dq L(q, v) = dt
Wir k¨onnen auch umgekehrt aus einer im Impuls p konvexen Hamilton–Funktion H durch Legendre–Transformation bez¨ uglich p die Lagrange–Funktion gewinnen.
148
8.1. Lagrange- und Hamilton–Gleichungen
8.7 Beispiel (Relativistische Hamilton–Funktion) Bezeichnet c > 0 die Lichtgeschwindigkeit, dann ist die Hamilton–Funktion eines freien relativistischen Teilchens mit Masse m > 0 gleich H : R3p × R3q → R , H(p, q) = c p 2 + m2 c2 . In der Interpretation von H als Gesamtenergie ergibt eine Taylor-Entwicklung H(p, q) = mc2 +
p 2 + O( p 4 ), 2m
wobei der erste Term als Ruheenergie bezeichnet wird und der zweite Term die nichtrelativistische kinetische Energie ist. Hier nimmt die Geschwindigkeit q˙ = Dp H(p, q) = c
p
p 2
+ m2 c2
nur Werte an, die betragsm¨aßig kleiner als die Lichtgeschwindigkeit c sind. Die Lagrange–Funktion L : Rnq × Uc (0) → R ist gleich
m2 c3 = −mc2 L(q, v) = v, p(v) − H p(v), q = −
p(v) 2 + m2 c2
+ 1−
v 2 . c2
In diesem Beispiel ist der Definitionsbereich von L nicht ganz Rnq × Rnv , denn D2p H erf¨ ullt nicht die Voraussetzung von Satz 8.6. 3 8.8 Aufgabe (Legendre-Transformation) (a) Ein Teilchen bewegt sich im Konfigurationsraum R2 in einem Zentralpotential V : R2 → R
, V (q) = U ( q ) mit
U : R → R.
˜ v) = 1 v 2 − V (q) in ebene PoRechnen Sie die Lagrange–Funktion L(q, 2 larkoordinaten um. Das Ergebnis sei die Funktion L. Berechnen Sie die Legendre–Transformierte von L. (b) Die Bewegung eines geladenen Teilchens im elektromagnetischen Feld wird durch die Lagrange–Funktion L ∈ C ∞ (Rnq × Rnv , R)
,
L(q, v) = 12 m v 2 − eφ(q) +
e c
v, A(q)
beschrieben, wobei φ ∈ C ∞ (Rn , R) und A ∈ C ∞ (Rn , Rn ). Dabei ist e ∈ R die Ladung des Teilchens und c die Lichtgeschwindigkeit. Berechnen Sie durch Legendre–Transformation die Hamilton–Funktion. 3
8. Variationsprinzipien
8.2
149
Holonome Zwangsbedingungen
In vielen F¨allen ist die Bewegung der zu beschreibenden Teilchen in der einen oder anderen Weise eingeschr¨ankt. So werden wir das Beispiel der Perle diskutieren, die auf einen Draht aufgef¨adelt wurde. Betrachten wir die Bewegung des Teilchens in einer m–dimensionalen Untermannigfaltigkeit S ⊆ Rnq . In Rnq × Rnv habe das Teilchen die Lagrange–Funktion ˜ In der N¨ahe eines Punktes q0 ∈ S k¨ L. onnen wir eine lokale Parametrisierung q = q(x), x = (x1 , . . . , xm ) von S vornehmen. ˜ q(x), Dq(x) w 8.9 Definition Das DGL-System mit L(x, w) := L ∂L d ∂L (x, x) ˙ = (x, x) ˙ dt ∂wi ∂xi
(i = 1, . . . , m)
heißt System mit Konfigurationsraum S und holonomer Zwangsbedingung. 8.10 Bemerkung (Nicht holonome Zwangsbedingungen) Mit der Restriktion des Teilchenortes q auf die Untermannigfaltigkeit S ⊆ Rnq wird die Teilchengeschwindigkeit auf den Unterraum Tq S des Tangentialraumes Tq Rnq eingeschr¨ankt. S kann in einer Umgebung U ⊆ Rnq von q als Niveaufl¨ache S = F −1 (0) der regul¨aren Wertes 0 einer Funktion F ∈ C ∞ (U, Rn−m ) dargestellt werden. Diese definiert eine geometrische Distribution DF auf U (siehe Definition F.23): DF := (u, v) | u ∈ U, v ∈ Tu U, (DF )u (v) = 0 ⊆ T U. Die Geschwindigkeit des Teilchens ist immer tangential zu diesen Unterr¨aumen. Betrachten wir f¨ ur eine beliebige, nicht notwendig auf S liegende Anfangskonfigu ration q0 ∈ U nur solche Bahnen c : I → U mit c(0) = q0 und c(t), c (t) ∈ DF , dann bleiben diese entsprechend auf den Niveaufl¨achen F −1 (f ) von f := F (q0 ). Eine solche durch die Distribution DF definierte Zwangsbedingung nennt man ebenfalls holonom. Wann die freie Wahl von f physikalisch realisiert werden kann (ein Beispiel ist etwa F : R2 → R, F (q) = q 2 , also ein planares Pendel mit einstellbarer Pendell¨ange f ), soll hier nicht weiter interessieren. Interessant ist aber die folgende Verallgemeinerung. Eine Zwangsbedingung ist definiert als eine Distribution D ⊆ T U im Konfigurationsraum. Ist diese integrabel, nennt man sie holonom, sonst nicht holonom. Nicht holonome Zwangsbedingungen treten z.B. bei einer rollenden Kugel auf (siehe Kapitel 14.4). 3 Wenn wir die Bewegung eines Teilchens einer Untermannigfaltigkeit S des Konfigurationsraumes beschreiben wollen, geben wir zun¨achst die Lagrange–Funktion ˜ des sich in Rnq frei bewegenden Teilchens an, berechnen dann L und darL aus gegebenenfalls u ¨ber die Legendre–Transformation die Hamilton–Funktion H : T ∗ S → R. Dabei ist T ∗ S das sogenannte Kotangentialb¨ undel von S, eine 2m–dimensionale Mannigfaltigkeit, deren Punkte aus Paaren (p, x) mit x ∈ S, p kanonischer Impuls, gebildet werden.
150
8.2. Holonome Zwangsbedingungen
Zwar ist die obige Konstruktion zun¨achst nur in einer Umgebung von q0 ∈ S g¨ ultig, aber wir werden im Anhang A.2 den Begriff der Mannigfaltigkeit diskutieren, der es uns erlaubt, die globale Bewegung auf S zu diskutieren. 8.11 Beispiel (Perle am Draht) Eine Perle gleitet ohne Reibung auf einem kreisf¨ormigen Draht. Der Kreis vom Radius R hat den Mittelpunkt 0 ∈ R3 . q1 Er rotiert mit Winkelgeschwindigkeit ω um die (vertikale) q1 –Achse, und die Kreisebene enth¨alt diese Achse (siehe Abbildung). Bezeichnet man mit ψ den Winkel q2 zwischen der unteren Ruhelage und dem Ort q der Perle, dann gilt also q3 − cos(ψ) q1 q = qq2 = R sin(ψ) sin(ωt) . 3
sin(ψ) cos(ωt)
ψ Die Lagrange–Funktion der Perle hat m 2 ˜ die Form L(q, v) := 2 v − V (q), und ist damit die Differenz von kinetischer und potentieller Energie. Letztere ist gleich V (q) = mgq1 , wobei g > 0 wieder die Erdbeschleunigung bezeichnet. Die Perle besitzt statt drei nur einen Freiheitsgrad. Entsprechend stellen wir die Lagrange–Funktion als Funktion von ψ, der Winkelgeschwindigkeit vψ = ψ˙ und eventuell der Zeit t dar (siehe auch Percival und Richards [PR2]). Es gilt ⎛
⎞ ⎛ ⎞ sin(ψ)ψ˙ q˙1 q˙ = ⎝ q˙2 ⎠ = R ⎝ cos(ψ) sin(ωt)ψ˙ + ω sin(ψ) cos(ωt) ⎠ , q˙3 cos(ψ) cos(ωt)ψ˙ − ω sin(ψ) sin(ωt) also
q
˙ 2 = R2 ψ˙ 2 + ω 2 sin2 (ψ) .
Außerdem ist V (q) = −mgR cos ψ, sodass in den neuen Koordinaten die Lagrange-Funktion die zeitunabh¨angige Gestalt mR2 2 ω2R L(ψ, vψ ) = vψ + mR g cos ψ + sin2 ψ 2 2 besitzt. Damit ist der zum Winkel ψ konjugierte Impuls pψ gleich pψ :=
∂L = mR2 vψ . ∂vψ
8. Variationsprinzipien
151
Die Hamilton–Funktion besitzt also die Form H(pψ , ψ) = vψ pψ − L(ψ, vψ ) =
p2ψ − mR g cos(ψ) + 12 ω 2 R sin2 (ψ) . 2 2mR
Durch Ver¨anderung von L¨angen-, Energie- und Zeitmaßstab k¨onnen wir uns auf die Diskussion des Falls m =R = g = 1 beschr¨anken und mit der neuen Winkelgeschwindigkeit Ω := ω R/g ergibt sich HΩ (pψ , ψ) = 12 p2ψ + WΩ (ψ) (pψ , ψ) ∈ M 2
mit dem Potential WΩ (ψ) := − cos ψ − Ω2 sin2 ψ. Der Phasenraum von HΩ ist dabei der Zylinder M := R × S 1 . F¨ ur Ω = 0 ist W0 (ψ) = − cos ψ, das Potential besitzt also in der unteren Ruhelage ψ = 0 ein nicht degeneriertes Minimum. Andererseits dominiert f¨ ur große |Ω| die Zentrifugalkraft und WΩ (ψ) besitzt f¨ ur ψ–Werte nahe bei ±π/2 Minimalstellen (siehe Abbildung 8.2.1).
W 1
Π
Π2
Π 2
Π
Ψ
1
Abbildung 8.2.1: Potential WΩ f¨ ur Ω = 0, Ω = 1 und Ω =
√ 2
Dies u ¨bersetzt sich im Phasenraumportrait von HΩ in eine Verzweigung (siehe Abbildung 8.2.2). F¨ ur alle Ω–Werte ist die untere Gleichgewichtslage in M , das heißt der Punkt mit den Koordinaten (pψ , ψ) = (0, 0), Nullstelle des Vektorfeldes − sin ψ + 12 Ω2 sin(2ψ) −WΩ (ψ) = (pψ , ψ) ∈ M XHΩ (pψ , ψ) = pψ pψ dessen Linearisierung von HΩ . Wir berechnen Stabilit¨at durch Untersuchung der DXHΩ (pψ , ψ) = 01 −WΩ0 (ψ) . DXHΩ besitzt die Eigenwerte ± − det(DXHΩ ). Wegen det DXHΩ (ψ) = WΩ (ψ) = cos ψ − Ω2 cos(2ψ) √ sind diese gleich ± −1 + Ω2 , also imagin¨ar f¨ ur |Ω| ≤ 1 und reell f¨ ur |Ω| ≥ 1. F¨ ur Winkelgeschwindigkeiten, die betragsm¨aßig kleiner als der Bifurkationswert 1 sind, wird damit die untere Gleichgewichtslage nach Bemerkung 7.9 liapunov– stabil, f¨ ur gr¨oßere Werte instabil. 3
152
8.3. Das hamiltonsche Variationsprinzip Π2
Π
0 0
Π 2
Π
2
Π
Π2
1 0
Π 2
1
pΨ
0
Π
2
Π2
2 0
Π 2
1
pΨ
0
1 2
Ψ
Π
2 1
pΨ
0
1
1
2
Ψ
Π
Ψ
2
Abbildung 8.2.2: Phasenraumportraits f¨ ur HΩ 8.12 Aufgabe (Perle am Draht) Eine Perle der Masse m gleitet ohne Reibung unter dem Einfluss der Schwerebeschleunigung g auf einem parabolischen Draht der Form z = 12 α2 x2 , wobei die z-Achse vertikal nach oben weist. Der Draht rotiert mit der konstanten Winkelgeschwindigkeit ω um die z-Achse. (a) Berechnen Sie die Hamilton–Funktion H. (b) Untersuchen Sie den Punkt (0, 0) mit Hilfe der Linearisierung des hamiltonschen Vektorfeldes XH auf Stabilit¨at. (c) Zeigen Sie, dass f¨ ur gα2 > ω 2 (also langsame Rotation) und Energie E die Perle eine periodische Bewegung mit der Periode √ 1/2 π 8m 2 α4 E dθ 1 + 2 sin2 θ T = β β 0 mit β 2 =
8.3
m 2 2 (gα
− ω 2 ) durchf¨ uhrt.
3
Das hamiltonsche Variationsprinzip
Die k¨ urzeste Verbindung zweier Punkte x0 , x1 ∈ Rn ist die diese Punkte verbindende Strecke. Das l¨asst sich beweisen, indem man alle m¨oglichen Wege zwischen diesen Punkten betrachtet. Sind diese Wege γ nach dem Parameter stetig differenzierbar, so kommt ihnen eine L¨ange zu: γ : [0, 1] → Rn
, γ(0) = x0 , γ(1) = x1
1
, I(γ) := 0
mit Lagrange–Funktion L(v) := v =
v12 + . . . + vn2 .
L γ(t) ˙ dt
8. Variationsprinzipien
153
Das L¨angenfunktional I ist also eine Abbildung von den in Betracht kommenden Wegen in die reellen Zahlen. Wie eine Funktion auf einem endlich-dimensionalen Raum kann ein solches Funktional Minima - oder allgemeiner - Extrema besitzen. Wie im endlich-dimensionalen Fall ist dann die Linearisierung am Extremum die Null-Abbildung. Die Variation von I verschwindet dort. Wir wollen diesen Ansatz verallgemeinern. Wir setzen dabei voraus, dass die im Folgenden betrachteten Funktionen glatt sind. L wird eine allgemeine Lagrange–Funktion sein, die von der Zeit abh¨angen kann: U ⊆ Rnq offen. Lagrange–Funktion L ∈ C 2 U × Rnv × [t0 , t1 ], R 2 Wege γ ∈ C ([t0 , t1 ], U ) γ(t0 ) = x0 , γ(t1 ) = x1 t Wirkung I(γ) := t01 L γ(t), γ(t), ˙ t dt. Die Differenz h := γ1 − γ2 zweix1 er Wege mit Anfangspunkt x0 und Endpunkt x1 ist eine Abbildung h : [t0 , t1 ] → Rn mit h(t0 ) = h(t1 ) = 0. γ(t) Das Funktional I ist (zum Beispiel) auf dem Raum x0 X := γ ∈ C 2 [t0 , t1 ], U | γ(t0 ) = x0 , γ(t1 ) = x1 erkl¨art: I : X → R. X ist weder endlich-dimensional (wie man etwa u ¨ber die Fourier–Darstellung eines Weges leicht sieht), noch ist X ein linearer Raum. Trotzdem steht X mit einem linearen Raum, und zwar X0 := h ∈ C 2 [t0 , t1 ], Rn | h(t0 ) = h(t1 ) = 0 in Zusammenhang, denn die Differenz zweier Wege γ1 und γ2 ∈ X ist ein Element dieses linearen Raumes. onnen wir zum Beispiel die Norm Auf dem Vektorraum X0 k¨
h 0 := sup ( h(t) + Dh(t) ) t∈[t0 ,t1 ]
einf¨ uhren. Diese f¨ uhrt auf X zu der Metrik d(γ1 , γ2 ) := γ1 − γ2 0 . 8.13 Definition Ein Funktional I : X → R heißt • (Fr´ echet-)differenzierbar bei γ ∈ X, wenn eine beschr¨ankte lineare Abbildung Lγ : X0 → R existiert mit I(γ + h) − I(γ) = Lγ (h) + o( h 0 )
(h ∈ X0 mit γ + h ∈ X). (8.3.1)
• I heißt (Fr´ echet-)differenzierbar, wenn Lγ f¨ ur alle γ ∈ X existiert. • γ heißt station¨ arer Punkt (oder kritischer Punkt) von I, wenn Lγ = 0. • I heißt stetig differenzierbar, wenn sogar γ → Lγ stetig ist.
154
8.3. Das hamiltonsche Variationsprinzip
8.14 Notation Wenn die lineare Abbildung Lγ existiert, dann ist sie durch ¨ (8.3.1) eindeutig definiert. Ublicher als Lγ sind die Schreibweisen δI(γ) und 2 DI(γ). Damit ist dann DI(γ) = 0 f¨ ur station¨are Punkte γ. ˙ t ist 8.15 Satz F¨ ur L ∈ C 2 (U × Rnv × Rt , R) und γ˜ (t) := γ(t), γ(t), I:X→R
, I(γ) :=
t1 L γ˜ (t) dt t0
ein differenzierbares Funktional mit Ableitung t d (DI)γ (h) = t01 D1 L − dt D2 L ◦ γ˜ (t) h(t) dt
(h ∈ X0 ).
(8.3.2)
(8.3.3)
Beweis: • Die linke Seite der Lγ definierenden Gleichung (8.3.1) ist t t ˙ I(γ + h) − I(γ) = t01 L γ(t) + h(t), γ(t) ˙ + h(t), t dt − t01 L γ˜ (t) dt t1 % & ˙ D1 L(˜ γ (t)) · h(t) + D2 L(˜ γ (t)) · h(t) dt + O h 20 . = t0
Durch partielle Integration verschwindet die Zeitableitung der Variation h: t1 ˙ dt = D2 L · h|t1 − t1 d D2 L(˜ D2 L γ˜ (t) h(t) γ (t) · h(t) dt, t0 t0 t0 dt Da h ∈ X0 , ist h(t0 ) = h(t1 ) = 0, also (DI)γ (h) durch (8.3.3) gegeben. • DI(γ) ist beschr¨ankt, mit Operatornorm d |(DI)γ (h)| ≤ (t1 − t0 ) sup D1 L − dt D2 L ◦ γ˜ (t),
DI(γ) = sup h∈X0 , h0 =1
t∈[t0 ,t1 ]
denn die vektorwertige Funktion ist stetig auf dem Kompaktum [t0 , t1 ].
2
8.16 Satz (Hamiltonsches Variationsprinzip) γ ∈ X ist genau dann station¨arer Punkt des Funktionals (8.3.2), wenn γ die Euler–Lagrange–Gleichung erf¨ ullt: d t ∈ [t0 , t1 ] . (8.3.4) D1 L − D2 L ◦ γ˜ (t) = 0 dt Zum Beweis dieses Satzes benutzen wir ein einfaches Lemma. 8.17 Lemma (Fundamental-Lemma der Variationsrechnung) Wenn f¨ ur t ur alle h ∈ C [t0 , t1 ], R mit f ∈ C [t0 , t1 ], R gilt, dass t01 f (t)h(t) dt = 0 f¨ h(t0 ) = h(t1 ) = 0, so ist f = 0. Beweis: Sei stattdessen f (t∗ ) > 0 (oder < 0 entsprechend), dann existieren ε > 0 und c > 0 mit [t∗ − ε, t∗ + ε] ⊂ (t0 , t1 ) und f (t) ≥ c t ∈ [t∗ − ε, t∗ + ε] . 2 Bei
Anwendung des Operators DI(γ) auf einen Vektor h schreiben wir γ als Index.
8. Variationsprinzipien
155
W¨ahle eine sogenannte Abschneidefunktion h ∈ C [t0 , t1 ], R mit h ≥ 0, ⎧ ⎨ 0 , t ≤ t∗ − ε 1 , t∗ − 2ε < t < t∗ + h(t) = ⎩ 0 , t ≥ t∗ + ε, (siehe Abbildung). Dann ist
t1 t0
ε 2
t0
t∗ − ε
t∗
t∗ + ε t1
f (t)h(t) dt ≥ c ε > 0.
2
Beweis des Satzes 8.16: • Ist γ ∈ X station¨arer Punkt, also DI(γ) = 0, dann folgt mit (8.3.3)
0 d γ (t) h(t) dt D1 L − D2 L ◦˜ dt
t1 /
0 = (DI)γ (h) = t0
(h ∈ X0 mit γ+h ∈ X).
Anwenden von Lemma 8.17 auf die n (unabh¨angig variierbaren) Komponenten von h ∈ X0 ergibt die Euler-Lagrange–Gleichung (8.3.4). • Nach (8.3.1) folgt umgekehrt das Verschwinden von DI(γ) aus (8.3.4). 2 Die L¨osungen der Euler-Lagrange–Gleichung sind also gleich den Extremalen des Wirkungsfunktionals I. Dieses ist wiederum Wegintegral der Lagrange–Funktion von U . Denn L auf dem Phasenraum 3 U × Rn ∼ = T U , also des Tangentialraums das Argument von L ist die Kurve t → γ˜ (t) = γ(t), γ(t) ˙ . Unter einer Koordinatentransformation des Konfigurationsraums mit einem glatten Diffeomorphismus ψ : U → V wird γ : [t0 , t1 ] → U zu ψ ◦ γ : [t0 , t1 ] → V , und γ˜ zu ψ ◦ γ : [t0 , t1 ] → V × Rn
, ψ ◦ γ(t) = ψ ◦ γ(t), Dψγ(t) γ(t) ˙ .
Sie weist also das Transformationsverhalten einer Kurve im Tangentialraum auf (siehe Satz A.42), und wir haben bewiesen: 8.18 Lemma Erf¨ ullt γ die Euler-Lagrange–Gleichung von L ∈ C 2 U × Rnv , R), dann gilt das auch f¨ ur γ˜ und L ◦ Ψ−1 , mit Ψ : U × Rn → V × Rn
,
Ψ(q, v) := ψ(q), Dψq v .
Dieses Transformationsverhalten gestattet uns, auch f¨ ur γ : [t0 , t1 ] → M das Wirkungsfunktional
t1
L(γ(t), γ(t)) ˙ dt
I(γ) :=
von Lagrange–Funktionen
L : TM → R
t0
zu betrachten, die Funktionen auf dem sogenannten Tangentialb¨ undel T M einer Konfigurationsmannigfaltigkeit M sind. 3 wir
nehmen zur Vereinfachung der Diskussion an, dass L nicht explizit von der Zeit abh¨ angt.
156
8.3. Das hamiltonsche Variationsprinzip
8.19 Bemerkungen (Funktionale) 1. Nicht jedes Funktional besitzt einen station¨aren Punkt (auch nicht jede Funktion besitzt ja ein solches!). Als Beispiel dient das L¨angenfunktional L(x, v, Ebene t):= v der gelochten und x1 := 10 enth¨alt den U := R2 \ {0}. Die Strecke zwischen x0 := −1 0 urzeste Kurve zwischen x0 und x1 . Punkt 0 ∈ R2 . Es gibt in U also keine k¨ 2. Extremale brauchen nicht eindeutig zu sein. Als Beispiel betrachten wir den Raum 0 0 X := γ ∈ C 2 [0, 1], S 2 γ(0) = 0 , γ(1) = 0 −1 1 0 0 N udpol 0 der der den Nordpol 0 mit dem S¨ −1
1
Sph¨are S 2 = {x ∈ R3 | x = 1} verbindenden Kurven, und das Funktional 1 dγ 2 1 I(γ) := 2 dt (t) dt. 0 Die Segmente von Großkreisen, die am Nordpol beginnen und am S¨ udpol enden, sind Extremale von I (nebenstehende Abbildung; siehe auch Beispiel G.14.2).
S2
S Nord- und S¨ udpol verbindende Geod¨aten
3. Auch wenn das Bild der Kurve eindeutig ist, braucht die Parametrisierung noch nicht eindeutig zu sein. 1 ˙ dt, denn f¨ ur einen Ein Beispiel ist das L¨angenfunktional I(γ) = 0 γ(t)
Diffeomorphismus c : [0, 1] → [0, 1] mit c(0) = 0, c(1) = 1 ist 1 1 d d γ c(t) dt = γ(s) ds (8.3.5) dt ds 0 0 mit Parameter s = c(t). ¨ Diese Uneindeutigkeit der Parametrisierung bereitet manchmal Arger. Deshalb ist das schon in Bemerkung 2. vorkommende Energiefunktional 1 2
γ(t)
˙ dt γ → 12 0
beliebter. Es besitzt bis auf Parametrisierung die gleichen Extremale wie das L¨angenfunktional, die Parametrisierung ist aber eindeutig (siehe Bemerkung G.3.2). 3 8.20 Aufgabe (Beispiel zur Nichtminimalit¨ at des Wirkungsfunktionals) Gegeben sei die Lagrange–Funktion L ∈ C ∞ R2 × R2 , R , L(q, v) := 12 v 2 − q22 , wobei q = (q1 , q2 ) (physikalisch interpretiert beschreibt das ein Teilchen in einer Rinne).
8. Variationsprinzipien
157
y x
A B
=
Abbildung 8.3.1: Links: Ank¨ undigung Bernoullis zum Brachistochronen-Problem. Rechts: Familie von Zykloiden (zum Kasten auf Seite 157) (a) Berechnen Sie die Extremalen q mit q(0) = (0, 0) und q(T ) = (c, 0) des T Wirkungsfunktionals I(q) = 0 L dt. (Beachten Sie dabei den Unterschied zwischen Zeiten T = nπ und T = nπ.) (b) Zeigen Sie, dass f¨ ur die L¨ osung q(t) = ( Tc t, 0) und jede Variation δq von ∞ 2 q, also δq ∈ C ([0, T ], R ) mit δq(0) = (0, 0) und δq(T ) = (0, 0) gilt X(δq) := I(q + δq) − I(q) =
1 T 2 0
2 − δq22 (t) dt .
δ q(t)
˙
(c) Werten Sie nun X(δq) aus f¨ ur eine Variation δq = (δq1 , δq2 ) mit δq2 (t) =
∞
cn sin
πnt T
,
n=1
δq1 (t) = 0 , wobei
∞
(n cn )2 < ∞ .
n=1
(d) Begr¨ unden Sie mit dem Ergebnis aus (c), dass I(q) minimal ist f¨ ur Zeiten 0 < T < π, und dass X f¨ ur lπ < T < (l + 1)π auf einem l-dimensionalen Unterraum negativ definit ist. 3 Die Aufgabe Johann Bernoullis In den Acta Eruditorum, der ersten Wissenschaftszeitschrift Deutschlands, ver¨offentlichte im Jahr 1696 Johann Bernoulli aus Basel (damals in Groningen) die folgende Fragestellung: Wenn in einer verticalen Ebene zwei Punkte A und B gege” ben sind, soll man dem beweglichen Punkte M eine Bahn AM B anweisen, auf welcher er von A ausgehend verm¨oge seiner eigenen Schwere in k¨ urzester Zeit nach B gelangt.” Diese Aufgabe l¨ osten, neben Johann Bernoulli selbst, viele der bedeutendsten zeitgen¨ossischen Mathematiker: sein ¨alterer (und verhasster) Bruder Jakob, Leibniz, de l’Hospital, Tschirnhaus und Newton.
158
8.3. Das hamiltonsche Variationsprinzip
Das Problem selbst war schon von Galilei in [Gal2] erw¨ahnt worden, der Kreissegmente als L¨osungen angab. Mit den neu entwickelten Methoden der Differentialrechnung konnten nun Zykloiden–Segmente als die wahren Bahnen identifiziert werden. Obwohl Variationsprobleme wie das der Dido schon in der Antike bekannt waren, ist dieses sogenannte Brachistochronen-Problem daher der Anfang der modernen Variationsrechnung. Gesucht ist eine Funktion Y : [0, xB ] → R, deren Graph die Bahn minimaler Zeit T (Y ) ist. Die Bahn beginnt am Nullpunkt A = 0 ∈ R2 der Ebene, und ihr Endpunkt hat die Koordinaten B = (xB , yB ) mit xB > 0 > yB . Es ist also Y (0) = 0 und Y (xB ) = yB . Da M bei A mit Geschwindigkeit Null startet, besitzt M√bei der H¨ohe y ≤ 0 unter dem Einfluß der Schwerkraft die Geschwindigkeit −2gy, mit der Erdbeschleunigung g. Damit ist xB 1+Y (x)2 T (Y ) = (8.3.6) −2gY (x) dx. 0
1+v 2 Statt die Euler–Lagrange–Gleichung f¨ ur L(y, v) := −2gy zu bestimmen, schreiben wir mit Satz 8.6 die Hamilton–Funktion H zur Lagrange–Funktion L in Abh¨angigkeit von y und v: v2 1+v 2 −1 √ − . H(y, v) = D2 L(y, v) v − L(y, v) = √ −2gy = 2 2 (1+v )(−2gy)
(1+v )(−2gy)
√ Bezeichnen wir den konstanten Wert von H < 0 mit −1/ 4gr, dann ist also 1 + Y (x)2 = −Y2r(x) oder Y (x) = −1 − Y2r (8.3.7) (x) . Dies ist die Differentialgleichung der Zykloiden, also der Kurven, die die Parameterform x(t) = r t − sin(t) , y(t) = −r 1 − cos(t) (t ∈ R)
− sin(t) ullen (siehe Abb., Seite 157). haben und damit Y (x) = xy (t) (t) = 1−cos(t) erf¨ Die angegebenen L¨ osungen Y besitzen eine bei x = 0 divergierende Ableitung, geh¨oren also eigentlich nicht zur Klasse zul¨assiger Funktionen. Andererseits w¨aren auch noch weniger glatte L¨ osungen denkbar. Mit dem Maximumsprinzip (einer Technik aus der Theorie optimaler Steuerung) weist man Minimalit¨at und Eindeutigkeit der L¨ osungen nach, siehe Sussmann und Willems [SW]. Johann Bernoulli behauptete, dass seine L¨ osung auch f¨ ur andere Wissenszwei” ge als die Mechanik sehr n¨ utzlich” sei. Nun: Die Halfpipes der Skater besitzen oft Zykloidenform. Die am Kapitelanfang abgebildeten Rutschen sind zwar als Parabeln nicht zeitoptimal, aber bequemer als die Brachistochrone, da bei ihnen die Reise nicht mit dem freien Fall beginnt.
8. Variationsprinzipien
159
8.21 Aufgabe (Tautochronen-Problem) Zeigen Sie, dass die Zykloide auch das Tautochronen-Problem l¨ ost, also alle an einem beliebigen Punkt der Kurve mit Geschwindigkeit Null startenden Massenpunkte zum gleichen Zeitpunkt an ihrem tiefsten Punkt ankommen. 3
8.4
Die Geod¨ atische Bewegung
Wir untersuchen die geod¨atische Bewegung auf Untermannigfaltigkeiten M ⊆ Rn . Diese sind oft als Urbilder definiert, und werden nach ihrer Definition 2.34 lokal immer so beschrieben. Es sei also W ⊆ Rn offen, F ∈ C ∞ (W, Rm ), 0 ∈ F (W ) ⊂ Rm regul¨arer Wert von F und M := F −1 (0) die Untermannigfaltigkeit. Wir interessieren uns f¨ ur die durch die Lagrange–Funktion ˜ : W × Rnv → R L
,
˜ v) := 1 v 2 L(q, 2
gegebene freie Bewegung auf W und ihre Einschr¨ankung durch die holonome Zwangsbedingung q ∈ M . Wie auf Seite 27 restringieren wir den Koordinaten-Diffeomorphismus ϕ : U → Rn auf die Umgebung V := U ∩ M von q in M , und schreiben diesen mit d := n − m in der Form ϕV (z) = ψ(z), 0 ∈ Rd × Rm . Die Abbildung ψ : V → Rd l¨asst sich auf ihrem Bild V := ψ(V ) ⊂ Rd × {0} ∼ = Rd glatt invertieren, und wir erhalten damit lokale Koordinaten q := ψ −1 : V → V in V ⊂ M , siehe Abbildung 8.4.1. Die durch
M
Rm
U ϕ
ϕ(U ) Rn−m
Rn V ϕ(V )
Abbildung 8.4.1: Konstruktion lokaler Koordinaten in V ⊂ M
160
8.4. Die Geod¨atische Bewegung L : V × Rd → R
,
˜ q(x), Dq(x) w L(x, w) := L
definierte Lagrange–Funktion L, also L(x, w) = L(x, w) =
d
1 2
gi,j (x) wi wj
mit
1 2
2
Dq(x) w , besitzt die Form
gi,j (x) :=
i,j=1
n ∂qk ∂qk (x) (x). (8.4.1) ∂xi ∂xj
k=1
8.22 Lemma Die matrixwertige Funktion g : V → Mat(d, R) (die erste Fundamentalform) ist eine riemannsche Metrik auf V , das heißt es gilt gi,j = gj,i
(i, j = 1, . . . , d)
und g(x) > 0
(x ∈ V ).
Beweis: • Die Symmetrie von g folgt unmittelbar aus der Definition. • F¨ ur alle x ∈ V ist d
w ∈ Rd \ {0} ,
gi,j (x) wi wj = Dq(x) w 2 > 0
i,j=1
g also positivdefinit, denn mit ψ ist auch q : V → V ein Diffeomorphismus, es gilt also rang Dq(x) = d. 2 Da wir M durch offene Mengen der Form V u ¨berdecken k¨onnen, erhalten wir eine Metrik auf ganz M . Die riemannsche Metrik erm¨ oglicht es, koordinateninvariant L¨angen von Kurven zu messen. Die L¨ange einer Kurve c : [0, 1] → V ist dabei durch 1 1+ d˜c
d˜ cj d˜ cj i c ˜ (t) L(c) := g (t) (t) dt = 2L c ˜ (t), (t) dt i,j i,j dt dt dt 0
0
mit c˜ := ψ ◦ c definiert.4 Die Extremale dieses gem¨aß (8.3.5) parametrisierungsinvarianten Funktionals stimmen bis auf Parametrisierung mit den Extremalen des Funktionals mit Lagrange–Funktion L u ¨berein. Wegen ⎛ ⎞ d d ∂g (x) ∂g (x) i,j i,j D1 L(x, w) = ⎝ 12 wi wj , . . . , 12 wi wj ⎠ ∂x1 ∂xd i,j=1
und
⎛ D2 L(x, w) = ⎝
i,j=1
d j=1
4 Das
g1,j (x)wj , . . . ,
d
⎞ gd,j (x)wj ⎠
j=1
L¨ angenfunktional L sollte nicht mit der Lagrange–Funktion L verwechselt werden!
8. Variationsprinzipien
161
lautet die Lagrange–Gleichung d d d ∂g (x) ∂g i,j k,j 1 x˙ i x˙ j = xj + x˙ j x˙ i gk,j (x)¨ 2 ∂xk ∂xi i,j=1 j=1 i=1 Wir definieren die Christoffel–Symbole durch ∂gi,k ∂gi,j ∂gk,j (x) + (x) − (x) Γhi,j (x) := 12 g h,k (x) ∂xi ∂xj ∂xk
(k = 1, . . . , d).
(i, j, h = 1, . . . , d),
(8.4.2) wobei (g h,k )dh,k=1 die zu (gk,i )dk,i=1 inverse Matrix ist, und die Einsteinsche Summenkonvention verwendet wurde, das heißt u ¨ber doppelt vorkommende Indices summiert wurde. Damit ergeben sich die Gleichungen x ¨h + Γhi,j (x)x˙ i x˙ j = 0
(h = 1, . . . , d).
(8.4.3)
Diese heißen die geod¨atischen Gleichungen, ihre L¨osungen t → x(t) Geod¨aten. Zun¨achst f¨allt auf, dass der metrische Tensor g, und damit auch die geod¨atische Gleichung, nur Informationen u ¨ber die intrinsische Geometrie der d–dimensionalen Fl¨ache M unabh¨angig von ihrer (isometrischen) Einbettung enth¨alt. Wir k¨onnen also auch geod¨atische Bewegungen auf riemannschen Mannigfaltigkeiten (das heißt Mannigfaltigkeiten mit metrischem Tensor) unabh¨angig von jeder Einbettung studieren. 8.23 Aufgabe (Euler-Lagrange-Gleichung in Polarkoordinaten) Betrachten Sie die Ebene R2 in Polarkoordinaten. (a) Berechnen Sie die Christoffel–Symbole, welche durch die Lagrange–Funktion der freien Bewegung bestimmt sind. (b) Schreiben Sie das L¨angenfunktional f¨ ur Kurven im R2 und die Euler-LagrangeGleichungen f¨ ur Geraden in der Ebene in Polarkoordinaten. 3 Die Form der Matrixelemente gi,h ist zwar von der Wahl des Koordinatensystems abh¨angig. Koordinatenfrei definieren lassen sich aber die folgenden Gr¨oßen. • In der riemannschen Geometrie existieren Invarianten, welche die (innere) Kr¨ ummung des Raumes M charakterisieren. • Daneben gibt es auch Kr¨ ummungsinvarianten, die die Form der Einbettung einer Untermannigfaltigkeit M ⊂ Rn charakterisieren. Es ist wichtig, diese beiden Aspekte zu unterscheiden. 8.24 Beispiel (Gauss–Kr¨ ummung) Eine zweidimensionale Fl¨ache M ⊂ R3 besitzt an jedem Punkt q ∈ M die innere Kr¨ ummung K(q) := k1 (q) k2 (q), die
162
8.4. Die Geod¨atische Bewegung
das Produkt der inversen Kr¨ ummungsradien ki zweier Kurven ist. Diese Kurven entstehen durch Schnitt von M mit je einem zweidimensionalen affinen Raum durch q, der die Fl¨achennormale an diesem Punkt enth¨alt. Die Wahl der beiden affinen R¨aume erfolgt dabei so, dass die Kr¨ ummungsradien extremal werden. Das Vorzeichen der Hauptkr¨ ummung ki ist positiv, wenn sich die Kurve in Richtung der Fl¨achennormale kr¨ ummt, sonst negativ. W¨ahrend dadurch k1 und k2 von der Wahl der Normale abh¨angen, ist ihr Produkt K, die gausssche Kr¨ ummung, unabh¨angig davon (also auch f¨ ur eine nicht orientierbare Fl¨ache definiert). ummung K = 0, obwohl wir es biegen • Ein Blatt Papier im R3 besitzt innere Kr¨ k¨onnen. Denn auch beim gebogenen Blatt verschwindet u ¨berall eine der beiden Hauptkr¨ ummungen ki (siehe Abbildung 8.4.2). • Sph¨are {x ∈ R3 | x = R} vom Radius R: Kr¨ ummung K = k1 k2 = R−2 > 0. Auch die gausssche Kr¨ ummung etwa einer weichen Kontaktlinse ver¨andert sich nicht, wenn man sie in einer Richtung zusammendr¨ uckt. • Sattel: Hier sind die Vorzeichen von k1 und k2 verschieden, also K < 0.
3
R
K=0
K=0
K=
1 R2
>0
K<0
Abbildung 8.4.2: Gausssche Kr¨ ummung K von Fl¨achen Aus der Herleitung der Lagrange–Funktion L ergibt sich, dass wir
d 2L(x, x) ˙ = ˙ i x˙ j i,j=1 gi,j (x) x als Betrag der Geschwindigkeit des Teilchens interpretieren k¨onnen. Wie sich durch Einsetzen der geod¨atischen Gleichungen in die zeitliche Ableid L = ∂L x˙ + ∂L x ¨ der Lagrange–Funktion ergibt, ist diese Null, L also eine tung dt ∂x ∂ x˙ Konstante der Bewegung. Daraus folgt, dass der Betrag der Geschwindigkeit des Teilchens auf M ebenfalls konstant ist. Eine besonders einfache Klasse eingebetteter riemannscher Mannigfaltigkeiten bilden die Rotationsfl¨achen. 8.25 Definition Sei I ein Intervall und R ∈ C ∞ (I, R+ ). Dann heißt M := x ∈ R3 | x3 ∈ I, x21 + x22 = (R(x3 ))2 Rotationsfl¨ ache mit Profil R.
8. Variationsprinzipien
163
Die einfachste Rotations߬ache ist der Zylinder (mit konstantem R), siehe Abbildung 8.4.3.
x3
x3
z1
x2 x1
x1
α
z0
Abbildung 8.4.3: Links: Geod¨ate auf einem Zylinder. Mitte: Definition des Winkels α. Rechts: Geod¨ate auf einer Rotationsfl¨ache. Wir parametrisieren eine Rotationsfl¨ache durch z ∈ I und ϕ mit x1 = R(z) cos(ϕ)
,
x2 = R(z) sin(ϕ)
, x3 = z. 1+(R (z))2 0 Damit ergibt sich aus (8.4.1) der metrische Tensor g(z, ϕ) = 2 0 R (z) und, mit den Geschwindigkeitskomponenten wz und wϕ in z– bzw. in ϕ–Richtung, die Lagrange–Funktion L(z, ϕ, wz , wϕ ) = 12 1 + (R (z))2 wz2 + R2 (z)wϕ2 .
8.26 Aufgabe (Rotationsfl¨ achen-Geod¨ aten) (a) Zeigen Sie durch Berechnung der Christoffel–Symbole, dass die geod¨atischen Gleichungen auf M ϕ¨ +
2R (z) ϕ˙ z˙ R(z)
=0 ,
z¨ −
R(z)R (z) 2 ϕ˙ R (z)2 +1
+
R (z)R (z) 2 z˙ R (z)2 +1
=0
lauten. (b) Zeigen Sie, dass die nach Bogenl¨ange parametrisierten Meridiane, das sind Kurven im M mit konstantem Winkel ϕ ≡ c ∈ R, Geod¨atische in M sind. (c) Welche Breitenkreise, also Kurven mit z ≡ c ∈ R, sind Geod¨atische?
3
∂L = R2 (z) wϕ gegeben, Der zu ϕ konjugierte Impuls pϕ ist durch pϕ = ∂w ϕ ∂L 2 pz = ∂wz = 1 + (R (z)) wz . Damit ist die u ¨ber die Legendre–Transformation mit L verkn¨ upfte Hamilton–Funktion
H(pz , pϕ , z, ϕ) = pz wz + pϕ wϕ − L(z, ϕ, wz , wϕ ) = L z, ϕ, wz (pz , z), wϕ (pϕ , z) =
p2ϕ p2z . + 2 1 + (R (z))2 R (z)
1 2
164
8.5. Die Jacobi–Metrik
Die Bewegungsgleichungen lauten p˙z = − z˙ =
R (z)R (z)p2z ∂H = ∂z (1 + (R (z))2 )2
pz ∂H = ∂pz 1 + (R (z))2
und
,
p˙ϕ = − ϕ˙ =
∂H =0 ∂ϕ
,
∂H pϕ = 2 . ∂pϕ R (z)
Es ergibt sich unmittelbar, dass pϕ eine Konstante der Bewegung ist.5 Bezeichnen wir mit α den Winkel der Geod¨aten-Richtung mit dem lokalen Meridian (siehe Abbildung 8.4.3), so ergibt sich der 8.27 Satz (Clairaut) R(z) sin α ist f¨ ur eine Geod¨ate auf einer Rotationsfl¨ache zeitlich konstant. √ Beweis: Es gilt R(z) ϕ˙ = v sin α mit Geschwindigkeitsbetrag v = 2L. Also ist pϕ = R2 ϕ˙ = R v sin α, und wegen der Konstanz von v und pϕ ist R sin α = const. 2 Da | sin α| ≤ 1, kann f¨ ur einen vorgegebenen Wert der Clairaut–Konstante der Radius R nicht zu klein werden. Das kann bedeuten, dass die Bewegung nur in einem Ring z0 ≤ z ≤ z1 mit R(z0 ) = R(z1 ) = |const| verl¨auft, siehe die rechte Abbildung in 8.4.3 . 8.28 Weiterf¨ uhrende Literatur Eine Einf¨ uhrung in die Differentialgeometrie findet man in Klingenberg [Kli1]. Einen tieferen Einstieg in die riemannsche Geometrie bieten das Buch [GHL] von Gallot, Hulin und Lafontaine, [Kli2] von Klingenberg und [Pat] von G. Paternain, die letzteren mit Schwerpunkt auf dem geod¨atischen Fluss. [Berg] von Berger gibt einen Gesamt¨ uberblick ohne Beweise. [JLJ] von Jost und Li-Jost ist eine Monographie zur Variationsrechnung. 3
8.5
Die Jacobi–Metrik
Eine direkte mechanische Anwendung erf¨ahrt die riemannsche Geometrie in der geod¨atischen Bewegung in Metriken der Allgemeinen Relativit¨atstheorie, etwa der eines Schwarzen Loches. Ihre Bedeutung in der Mechanik beschr¨ankt sich aber nicht darauf. Viele mechanische Probleme werden durch die Bewegung in einem Potential beschrieben. Es w¨are daher von Vorteil, wenn wir die reichhaltige und vergleichsweise gut ausgearbeitete Theorie geod¨atischer Bewegung auf solche Potential2 Probleme mit Hamilton–Funktion H(p, q) = p ¨bertragen k¨onnten. 2m + V (q) u 5 Das System ist also integrabel im Sinn der Definition auf Seite 309. Wir k¨ onnen die Konstanz von pϕ auch verstehen, indem wir feststellen, dass pϕ die 3– Komponente des Drehimpulses ist. Diese ist wegen der Drehinvarianz der Rotationsfl¨ ache um die 3–Richtung erhalten, siehe den Satz von Noether auf Seite 330.
8. Variationsprinzipien
165
Das ist, wie von Jacobi und anderen im letzten Jahrhundert erkannt wurde, bis zu einem gewissen Grad m¨ oglich. Der Grund f¨ ur diese Beziehung liegt im folgenden Satz. 8.29 Satz Seien H1 , H2 ∈ C ∞ (M, R) auf dem Phasenraum M := Rnp × U (U ⊆ Rnq offen), und es gelte f¨ ur die regul¨aren Werte hi ∈ Hi (M ), i = 1, 2 Σ := H1−1 (h1 ) = H2−1 (h2 ). Dann besitzen die von H1 und H2 erzeugten maximalen hamiltonschen Fl¨usse auf der Hyperfl¨ache Σ die gleiche Familie von Orbits. Beweis: Σ ⊂ M ist eine (2n − 1)–dimensionale Untermannigfaltigkeit, da die hi ∈ Hi (M ) regul¨ar sind. Die von Hi erzeugten hamiltonschen Vektorfelder haben in (p, q)–Koordinaten die Form l XHi = J ∇Hi , wobei J = 10l −1 . 0 Sowohl ∇H1 als auch ∇H2 stehen an jedem Punkt der Energieschale Σ senkrecht ¨ auf der (2n − 1)–dimensionalen Tangentialebene, denn diese ist Aquipotentialfl¨ache beider Funktionen. Damit sind ∇H1 und ∇H2 parallel. Da h1 und h2 regul¨are Werte von H1 beziehungsweise H2 sind, gilt f¨ ur alle x ∈ Σ : ∇Hi (x) = 0. Also ist ∇H1 (x) = f (x) ∇H2 (x) (x ∈ Σ), und f : Σ → R ist glatt und ungleich Null. Damit wird auf der Niveaufl¨ache (x ∈ Σ),
XH1 (x) = f (x) XH2 (x)
das heißt die hamiltonschen Vektorfelder sind (anti-) parallel und nicht verschwindend. Daraus ergibt sich die Aussage. 2 Schon die Form der Energieschale bestimmt also die Orbits des hamiltonschen
J∇H(x)
∇H(x) x
Σ
Abbildung 8.5.1: Gradient und hamiltonsches Vektorfeld Flusses. Andererseits ist die Zeitparametrisierung dadurch noch nicht festgelegt; im Fall des Satzes ergibt sich die Umparametrisierung durch Integration von f entlang der Orbits. Wir wenden Satz 8.29 nun auf Bewegungen im Potential an.
166
8.5. Die Jacobi–Metrik
8.30 Definition Es sei V ∈ C ∞ (Rnq , R), h ∈ R und U ⊆ Rnq offen. Gilt V U < h, so heißt die Metrik gh auf U mit Komponenten gh (q) i,j := h − V (q) · δi,j (i, j = 1, . . . , n) Jacobi–Metrik auf U f¨ ur Energie h. Die Lagrange–Funktion f¨ ur die geod¨atische Bewegung in dieser Metrik ist
L(q, v) = 12 ni,j=1 gh (q) i,j vi vj . , also p(q, v) = gh (q) v. Damit ist Der kanonisch konjugierte Impuls ist p = ∂L ∂v die Hamilton–Funktion der geod¨atischen Bewegung gleich H2 : Rnp × U → R
, H2 (p, q) :=
1
p 2 . 2(h − V (q))
Wir vergleichen mit der Hamilton–Funktion H : Rnp × Rnq → R
, H(p, q) := 12 p 2 + V (q).
(8.5.1)
8.31 Satz F¨ ur eine L¨osung (p, q) : I → Rnp × U der hamiltonschen Gleichungen von (8.5.1) mit Energie h := H(p, q) gibt es einen Diffeomorphismus ϕ : J → I, sodass q ◦ ϕ : J → U die geod¨atische Gleichung (8.4.3) f¨ ur die Jacobi–Metrik auf U l¨ost. Beweis: • Es gilt, restringiert auf dem Phasenraum u ¨ber U , H −1 (h) = H2−1 (h2 ). ¨ • Durch Uberf¨ uhrung der hamiltonschen Gleichungen von H2 in ein Differentialgleichungssystem zweiter Ordnung in den Koordinaten (q1 , . . . , qn ) ergeben sich die geod¨atischen Gleichungen f¨ ur die Jacobi–Metrik. 2 • Der obige Satz 8.29 (mit H1 := H) ergibt dann die Aussage. 8.32 Beispiel (Doppelpendel) Eine typische Anwendung der Jacobi–Metrik bildet das Doppelpendel. Wir untersuchen den Fall, bei dem der am Nullpunkt befestigte Stab der L¨ange R1 in der q1 − q3 -Ebene schwingt, und der an seinem Ende befestigte Stab der L¨ange R2 in der durch den ersten Stab und die q2 -Achse gegebenen Ebene schwingt. Die Schwingungsebenen stehen also senkrecht aufeinander.6 Unter der Annahme R1 > R2 > 0 ist die Menge der Orte q : S 1 × S 1 → R3 , 0 cos ϕ1 0 − sin ϕ1 0 0 1 0 R1 0 + R2 sin ϕ2 q(ϕ1 , ϕ2 ) = cos ϕ2 −1 sin ϕ1 0 cos ϕ1 sin ϕ1 sin ϕ1 cos ϕ2 sin ϕ2 0 + R2 = R1 − cos ϕ1
− cos ϕ1 cos ϕ2
6 Die Diskussion in [Ar2], §45 des planaren Doppelpendels ist problematisch, da hier die Metrik auf dem Konfigurationsraum degeneriert.
8. Variationsprinzipien
167
des Massenpunktes eine zweidimensionale Untermannigfaltigkeit des R3 . Genauer ist sie diffeomorph zum 2–Torus T2 , wobei f¨ ur n ∈ N der n–Torus durch T := n
×nk=1 S 1
mit
R1
S = {x ∈ C | |x| = 1}
ϕ1
1
R2
definiert ist (siehe nebenstehende Abbildung). Die Lagrange–Funktion
ϕ2
Doppelpendel ˜ v) := 1 v 2 − V˜ (q) mit V˜ (q) := −gq3 L(q, 2 (g > 0 Erdbeschleunigung) nimmt nach Einsetzen der holonomen Zwangsbedingungen die Form L(ϕ, w) = 12 (R1 + R2 cos ϕ2 )2 w12 + R22 w22 − V (ϕ) mit Potential V (ϕ) = −g cos(ϕ1 )(R1 + R2 cos ϕ2 )
(8.5.2)
an. F¨ ur beliebige glatte Potentiale V erhalten wir damit H : R2p × T2 → R von der Form H(p, q) = 12 (R1 + R2 cos ϕ2 )−2 p21 + R2−2 p22 + V (q). Wie man an der numerischen L¨ osung der hamiltonschen Differentialgleichung f¨ ur
1, 2 6Π 4Π 2Π
25
50
75
t
Abbildung 8.5.2: Numerische L¨ osung der Differentialgleichung des Doppelpendels (fett gezeichnet ist der Winkel ϕ1 ) das Potential (8.5.2) in Abbildung 8.5.2 sieht, ist die Dynamik des Doppelpendels kompliziert. Trotzdem kann man mithilfe der Jacobi–Metrik die Existenz gewisser periodischer L¨osungen nachweisen.
168
8.5. Die Jacobi–Metrik
F¨ ur Gesamtenergie h > maxT2 V (was im Fall des Gravitationspotentials (8.5.2) bedeutet: h > g · (R1 + R2 )) besitzt die Jacobi–Metrik die Darstellung durch die folgende auf ganz T2 definierte positiv definite symmetrische Matrix (R1 + R2 cos ϕ2 )2 0 gh (ϕ) = (h − V (ϕ)) (ϕ ∈ T2 ). 0 R22 Wir k¨onnen ¨ahnlich wie oben die geod¨atische Bewegung auf T2 in der Jacobi– Metrik untersuchen. 3 8.33 Satz F¨ ur Energie h > maxq∈T2 V (q) und (m, n) ∈ Z2 \ {(0, 0)} existiert eine periodische Bewegung mit dieser Gesamtenergie, bei der das erste Segment des Doppelpendels m–mal, das zweite n–mal rotiert. Beweis: Wir suchen auf T2 eine geschlossene Geod¨ate der Jacobi–Metrik gh etwa von der in nebenstehender Abbildung skizzierten Form. Eine solche Geod¨ate existiert nach allgemeinen Prinzipien des Variationskalk¨ uls (beziehungsweise Morse-Theorie) f¨ ur jede nichttriviale Wegeklasse der Homotopiegruppe π1 (T2 ) ∼ = Z2 (siehe Satz G.24). Geschlossene Geod¨ate auf einem Torus Die Idee dabei ist, eine geschlossene Kurve mit den gegebenen Umlaufzahlen soweit m¨oglich zu verk¨ urzen. Resultat ist eine geschlossene Geod¨ate mit gleichen Umlaufzahlen, denn diese ¨andern sich bei der Verk¨ urzung nicht. Zur geschlossenen Geod¨ate gibt es analog zu Satz 8.31 eine periodische L¨osung des Doppelpendels, das sich von dieser nur durch die Zeitparametrisierung unterscheidet. 2 Eng verwandt mit der Jacobi–Metrik ist das sogenannte Maupertuis–Prinzip. Es besagt, dass das Wirkungsintegral p · dq auf der Energiefl¨ache f¨ ur die Trajektorien extremal ist (siehe zum Beispiel §45D in [Ar2]). Maupertuis sah sein Prinzip als Gottesbeweis an, seine Nachfolger als mathematischen Satz.
8. Variationsprinzipien
8.6
169
Das fermatsche Prinzip
Der Brechungsindex n eines transparenten Mediums ist das Verh¨altnis zwischen der Phasengeschwindigkeit des Lichtes im Vakuum (das heißt der Lichtgeschwindigkeit) und der Phasengeschwindigkeit im Medium. Beispielsweise findet man f¨ ur Luft die Angabe 1.000 292 und f¨ ur Wasser n = 1.33. Tats¨achlich variiert aber n im Allgemeinen mit der Dichte (zum Beispiel f¨allt der Brechungsindex der Atmosph¨are f¨ ur große H¨ohen gegen 1) und mit der Frequenz des Lichtes (Letzteres macht man sich im Prisma zunutze). Wir schauen uns zun¨achst monochromatisches (einfarbiges) Licht an. Dann ist n eine reelle Funktion des Ortes. Wir nehmen n ∈ C 2 (U, R) an, f¨ ur eine offene Teilmenge U ⊆ Rd . Nach dem fermatschen Prinzip wird die Bewegung eines durch ein Zeitintervall I parametrisierten Lichtstrahls c : I → U im Medium durch die Lagrange–Funktion des optischen Wegs ˜ : U × Rd → R L v
, (q, v) → n(q) v
beschrieben, also durch das L¨angenelement einer Metrik, die sich durch einen ortsabh¨angigen Faktor von der euklidischen Metrik unterscheidet. Wie schon im Kapitel 8.4 gehen wir zur Formulierung mittels der Lagrange– Funktion 2 L : U × Rdv → R , (q, v) → 12 n(q) v
der geod¨atischen Bewegung u ¨ber. Die Lagrange–Gleichungen lauten dann ˙ q, ˙ n(q)¨ q = q
˙ 2 ∇n(q) − 2∇n(q), q
(8.6.1)
und man kann durch direkte Rechnung feststellen, dass L entlang der L¨osungskurven konstant ist. 8.34 Beispiel (Fata Morgana) Wir nehmen an, dass die Dichte der Luft eine Funktion der H¨ohe u ¨ber dem Erdboden ist. Dann ist die Horizontalrichtung des Strahls zeitlich konstant, und wir rechnen in der durch (x, y) parametrisierten Ebene U := R2 ⊂ R3 , die von dieser Horizontalrichtung und der Vertikale aufgespannt ist. Dabei misst y die H¨ ohe und wir schreiben den Brechungsindex als Funktion y → n(y) dieser H¨ ohe. Es ist g¨ unstig, soweit m¨ oglich, den Strahl statt durch die Zeit durch die Horizontalkomponente x ∈ R des Ortes zu parametrisieren. Die Vertikalkomponente x → y(x) erf¨ ullt dann die aus (8.6.1) folgende Differentialgleichung n(y)y = n (y) 1 + (y )2 . (8.6.2) Nehmen wir nun an, dass n affin, also von der Form n(y) = n0 + ky
(8.6.3)
ist, dann ergeben sich f¨ ur k = 0 die von den Parametern c und x0 abh¨angenden L¨osungen cosh c(x − x0 ) n0 − . (8.6.4) y(x) = c k
170
8.6. Das fermatsche Prinzip
W¨ahlen wir nun x0 := arcosh(cn0 /k)/c, dann erhalten wir eine einparametrige Schar von L¨osungen yc , mit yc (0) = 0. Die Strahlen gehen also alle vom Nullpunkt aus, kreuzen sich aber ein zweites Mal (siehe Abbildung 8.6.1).
y x Abbildung 8.6.1: Fata Morgana: von einem Punkt ausgehende Strahlen Das bedeutet, dass f¨ ur große Abst¨ande x der Gegenstand gespiegelt wird, also scheinbar auf dem Kopf steht. Ist die Luft am Boden heißer, also k > 0, dann sieht man entfernte bodennahe Objekte nicht mehr. Der Ansatz (8.6.3) ist in Wirklichkeit nicht realistisch. Tats¨achlich wird f¨ ur gr¨oßere y der Brechungsindex wieder n¨aherungsweise konstant, und wir sehen Objekte doppelt (einmal direkt, einmal gespiegelt), siehe Abbildung 8.6.2. 3
Abbildung 8.6.2: Fata Morgana u uste ¨ber der Mojavew¨
8.35 Aufgaben (Lichtbrechung) 1. Leiten Sie die Lagrange–Gleichungen (8.6.1) und aus diesen die Differentialgleichung (8.6.2) ab. 2. Wie findet man die L¨ osung (8.6.4) unter Benutzung der Konstanz der Lagrange–Funktion? 3. Die x–Achse stelle die Grenze zwischen zwei Medien mit unterschiedlicher Lichtgeschwindigkeit dar. Oberhalb der x–Achse habe diese den Wert c1 > 0, und unterhalb den Wert c2 > 0. Es wird nun der Weg eines Lichtstrahls betrachtet, der vom Punkt a1 = (0, y1 ) mit y1 > 0 ausgeht und nach Brechung an der x-Achse auf den Punkt a2 = (x2 , y2 ) mit y2 < 0 trifft. Nach dem fermatschen Prinzip liegt der Brechungspunkt a0 = (x0 , 0) so, dass die
8. Variationsprinzipien
171
Laufzeit T (a0 ) :=
a1 − a0 a2 − a0
+ c1 c2
des Lichtstrahls minimal ist. Zeigen Sie, dass f¨ ur diesen Punkt a0 das snelliussche Brechungsgesetz 7 c2 sin α1 = c1 sin α2 (mit den Winkeln α1 , α2 der Teilstrecken gegen die Normale) erf¨ ullt ist. Tipp: Es ist nicht notwendig, x0 explizit zu berechnen.
8.7
3
Die geometrische Optik
Linsen besitzen zwei lichtbrechende Fl¨achen. Besitzt die Linse den Radius r > und bezeichnet Dr := {(y, z) ∈ R2 | y 2 + z 2 ≤ r2 } die Kreisscheibe von Radius r, dann beschreiben wir die lichtbrechenden Fl¨achen als Graphen von glatten Funktionen O : Dr → Rx . Wir setzen voraus, dass O(−y, −z) = O(y, z) gilt, das heißt die Fl¨ache symmetrisch um die optische Achse {(x, y, z) ∈ R3 | y = z = 0} ist. 8.36 Beispiele (Lichtbrechende Fl¨ achen) 1. Ist die Fl¨ache planar, dann ist O eine konstante Funktion, deren Wert die Lage auf der optischen Achse beschreibt. 2. Ist sie sph¨arisch, dann ist bei Kr¨ ummungsradius R ∈ R, |R| > r 2 2 1 − y R+z −1 . O(y, z) = O(0, 0) + R 2
3
Indiziert man die beiden Grenzfl¨achen der Linse so, dass O + > O− ist, dann heißt die entsprechende Oberfl¨ache genau dann konvex beziehungsweise konkav, wenn O− respektive −O+ konvex bzw. konkav ist. Linsen mit konvexen Oberfl¨achen sammeln also das Licht. Ein die Linseneigenschaft bestimmender Parameter ist ihre Brennweite. Um diese zu definieren, stellen wir zun¨achst fest, dass wegen der Symmetrieannahme ein auf der optischen Achse verlaufender Strahl von der Linse nicht abgelenkt wird. Die Brennweite wird u ¨blicherweise als Abstand auf der optischen Achse zwischen Linse und Brennpunkt beschrieben. Das ist aber nicht nur deswegen unexakt, weil Linsen endliche Dicke besitzen, sondern auch, weil sph¨arische Sammellinsen achsenparallele Strahlen nicht in einem Brennpunkt zusammenf¨ uhren: 7 Benannt nach dem niederl¨ andischen Mathematiker Willebrord van Roijen Snell (1580– 1626). Das Gesetz wurde zuerst vom arabischen Mathematiker Abu Sa‘d Ibn Sahl (ca. 940– 1000) gefunden (in der Form n1 sin α1 = n2 sin α2 , mit den Brechungsindices n1 , n2 in den beiden Medien).
172
8.7. Die geometrische Optik
8.37 Beispiel (Plankonvexe Linse) Wir betrachten eine plankonvexe sph¨a ri y 2 +z 2 − + 1 − R2 − 1 , sche Linse, d.h. wir setzen O := 0 und O (y, z) := d + R mit d > 0 und R > 0. Von links kommende achsenparallele Strahlen werden von der planen Grenzfl¨ache nicht abgelenkt. Bezeichnen wir mit := y 2 + z 2 den Abstand des achsenparallelen Strahls von der optischen Achse, dann trifft er auf die rechte Grenzfl¨ache unter dem Winkel θ1 := arcsin(/R) gegen die Fl¨achennormale. Nach dem snelliusschen Brechungsgesetz gilt (bei Brechungsindex n > 1 der Linse und Brechungsindex 1 außerhalb der Linse) sin θ2 = n sin θ1 =
n . R
Damit trifft der Strahl die optische Achse am Punkt ˜ + y cot(θ2 − θ1 ) X() = O()
˜ mit O() := d + R( 1 − 2 /R2 − 1). Taylor-Entwicklung nach ergibt 2 1 n R 4 1− + O( ) . X() = d + n−1 2 R Der Brennpunkt wird als der –unabh¨angige Term X(0) = d +
R n−1
definiert. 3
Dass sph¨arische Linsen und Spiegel achsenparallele Strahlen also nur n¨aherungsweise in einem Punkt vereinigen, wird als sph¨arische Aberration bezeichnet. Statt einem Brennpunkt sieht man helle Kurven an der Einh¨ ullenden des Strahlenb¨ undels, sogenannte Kaustiken (siehe die linke der Abbildungen 8.7.1 auf Seite 173). In der technischen Praxis wird versucht, diese durch Verwendung von kombinierten oder asph¨arischen Linsen soweit m¨ oglich zu vermeiden. Andererseits sind Kaustiken ein in der Natur h¨aufig auftauchendes und interessantes Ph¨anomen siehe etwa Abbildung 8.7.1, rechts. 8.38 Definition (Kaustik) Es sei ı : L → P die Einbettung einer n-dimensionalen Untermannigfaltigkeit in den Phasenraum P := Rnp ×Rnq , und π : P → Rnq , (p, q) → q die Projektion auf den Konfigurationsraum Rnq . Dann heißt die Menge der singul¨aren Werte von π ◦ ı : L → Rnq Kaustik. 8.39 Beispiel (Faltungssingularit¨ at) F¨ ur n = 1 und die Einbettung ı : R → P , 3 ı(x) = x, (x − a)2 + b besteht die Kaustik nur aus dem Punkt b ∈ Rq . 8.40 Weiterf¨ uhrende Literatur An dem Beispiel kann man ablesen, dass kleine ¨ Anderungen der Einbettung ı von L nur die Lage der Kaustik ver¨andern, sie aber nicht zum Verschwinden bringen k¨ onnen. Dies ist ein allgemeines Ph¨anomen, und es ist m¨oglich, typische lokale Formen von Kaustiken zu klassifizieren. Die entsprechende Theorie wird im Buch [AGV] von Arnol’d, Gusein-Zade und
8. Variationsprinzipien
173
Varchenko entwickelt. In den Les-Houches-Lectures [Berr] von M. Berry findet man viele physikalische Anwendungen. In mechanischen oder optischen Anwendungen treten als Untermannigfaltigkeiten L oft Lagrange–Mannigfaltigkeiten auf (siehe Kapitel 10.4). 3 8.41 Aufgabe (Reflektion von Licht an einer Tasse) Wir betrachten die ein B¨ u schel von zur 1-Achse parallelen Strahlen, die Kreislinie S 1 ⊂ R2 und sin ϕ an der Stelle A(ϕ) := cos mit ϕ ∈ [0, π] den Kreis zum ersten Mal treffen. ϕ Dort werden sie nach dem Gesetz ,Ausfallwinkel = – Einfallwinkel’ reflektiert. (a) Zeigen Sie, dass die n¨achste Reflektion am Punkt A(3ϕ) ∈ S 1 stattfindet. (b) Es sei Bt (ϕ) := tA(ϕ) + (1 − t)A(3ϕ) (t ∈ [0, 1]) ein Punkt des Strahls zwischen erster und zweiter Reflektion. F¨ ur welchen Wert t0 von t gilt (mit J = 10 −1 ) 0 5 6 d =0? Bt (ϕ), J A(3ϕ) − A(ϕ) dϕ (c) Berechnen Sie die Kaustik Bt0 : [0, π] → R2 , also die blaue Kurve in der Abbildung 8.7.1, links. Welches ist der hellste Punkt der Kaustik? 3
Abbildung 8.7.1: Kaustik in einer von links beleuchteten Tasse (links), Kaustiken auf dem Meeresboden (rechts)
Im Folgenden betreiben wir aber lineare Optik, bei der die Strahlausbreitung in der N¨ahe der optischen Achse durch Multiplikation von Matrizen beschrieben wird. Wir beschreiben dabei die Strahlen als Graphen von Kurven q : R → R2 . Solange diese in einem Medium mit konstantem Brechungsindex n bleiben, gilt f¨ ur einen geeigneten Vektor p ∈ R2 q(x) = q(x0 ) +
x − x0 p. n
174
8.7. Die geometrische Optik
p parametrisiert dabei die Strahlrichtung und bleibt hier z-unabh¨angig, also 1l 0 p(x) p(x0 ) x−x01l = M mit M := (8.7.1) 1l ∈ Sp(4, R). q(x) q(x0 ) n
An einer Grenzfl¨ache spielt in der linearen Approximation nur deren TaylorPolynom zweiten Grades eine Rolle. Wegen der Symmetrieannahme O(−q) = O(q) ist der Graph der Grenzfl¨ache O(q) = O(0) +
1 2
q, Aq + O( q 4 )
(8.7.2)
mit einer Matrix A ∈ Mat(2, R), die wir symmetrisch w¨ahlen k¨onnen. 8.42 Aufgabe (Lineare Optik) Zeigen Sie, dass in linearer Approximation die Brechung an einer durch (8.7.2) beschriebenen Grenzfl¨ache durch die lineare Abbildung A ∈ Sp(4, R) ( pq ) → N ( pq ) mit N := 10l Δn (8.7.3) 1l gegeben ist, wobei Δn die Differenz der beiden Brechungsindices bezeichnet. 3 Die Berechnung des linearisierten Strahlengangs wird also durch Multiplikation von Matrizen aus Sp(4, R) bewerkstelligt. 8.43 Beispiel (Sph¨ arische Linse) Der Brechungsindex des Glases sei n > 1, und wir n¨ahern den Brechungsindex von Luft mit 1. Die beiden Kr¨ ummungsradien seien R− und R+ , die Dicke der Linse d > 0. Damit wird sie durch die Matrix (1−n) n−1 d(1−n) (1−n)(d(n−1)+n(R− −R+ )) 1+ + )1l 1l ( 1 l 0 1 l 1 l − + 1l 1 l R n nR R − R R+ d L := = d n 1l 1l 0 1l 0 1l (1+ d(n−1) )1l n 1l nR− beschrieben. Setzen wir
1 1 , − − R+ R + d n−1 n 1l 0 dann besitzt die 4 × 4-Matrix M L f¨ ur M := Δx1 ∈ Sp(4, R) die Form l 1l c11 1l c12 1l M L = c21 1l c22 1l mit c22 = 0 und c21 = 1/c12 . Δx ist also der Abstand des Brennpunktes von der rechten Linsenfl¨ache, und f¨ ur eine d¨ unne Linse gilt f¨ ur die Brennweite f damit n¨aherungsweise 1 1 1 ≈ (n − 1) − . (8.7.4) f R+ R− Δn Definitionsgem¨aß wird eine D¨ unne Linse durch die Matrix N := 10l R1l 1l mit 1 := (n − 1) Δx
1 effektivem Kr¨ ummungsradius R und R = R1+ − R1− beschrieben. Wir verifizieren ebenfalls durch Matrixmultiplikation die bekannte Linsengleichung oder Abbildungsgleichung 1 f
=
1 b
+
1 g
,
wobei b die Bild- und g die Gegenstandsweite bezeichnet, siehe Abb. 8.7.2. 3
8. Variationsprinzipien
175
b g
f
Abbildung 8.7.2: Abbildungsgleichung f¨ ur eine D¨ unne Linse Es ist nun leicht, im Rahmen dieser linearen Approximation optische Instrumente zu entwickeln. 8.44 Beispiel (Kepler–Teleskop) Wir stellen zwei D¨ unne Linsen mit Brennweiten f1 , f2 > 0 so hintereinander, dass ihr Abstand gleich d ist. Das Gesamtsystem wird damit durch die Matrix f +f −d 1l −1l/f (1− fd )1l 1 f f2 1l 1l 0 2 1 2 1 2 Ld := 10l −1l/f (8.7.5) = d d1l 1l 1l 0 1l )1l d1l
(1− f
1
beschrieben. Zum entspannten Sehen sollen die parallelen Strahlen eines Sterns aus dem Okular wieder parallel austreten. F¨ ur d = f1 + f2 ist ullt, weil dies erf¨ f
dann der rechte obere Eintrag von Ld verschwindet: Ld =
− f1 1l 2
0
f
(f1 +f2 )1l − f2 1l
.
1
Winkel werden dann um den Faktor − ff12 vergr¨oßert. Wie man am negativen Vorzeichen abliest, steht das Bild auf dem Kopf. Typische Zahlenwerte f¨ ur ein Amateurfernrohr sind etwa f1 = 1 m f¨ ur das ur das Okular, also f¨ unfzigfache Vergr¨oßerung. 3 Objektiv und f2 = 20 mm f¨ 8.45 Aufgaben (Optische Ger¨ ate) 1. Entwerfen Sie ein aus zwei D¨ unnen Linsen bestehendes Mikroskop. 2. Berechnen Sie die Matrix N eines Brillenglases, das in linearer N¨aherung die Fehlsichtigkeit eines kurzsichtigen Auges mit Astigmatismus korrigiert. 3 Als letzte praktische Anwendung soll die sogenannte chromatische Aberration von Linsen korrigiert werden. Diese beruht auf der Frequenzabh¨angigkeit des Brechungsindex von Glas. n(ω) w¨achst mit der Frequenz ω, was dazu f¨ uhrt, dass die Brennweite einer Sammellinse f¨ ur blaues Licht kleiner ist als f¨ ur rotes. Zur Korrektur benutzt man aus verschiedenen Glassorten bestehende Linsensysteme. 8.46 Beispiel (Achromat) Ein Achromat ist ein System zweier Linsen, oft bestehend aus einer Sammellinse aus Kronglas und einer Zerstreuungslinse
176
8.7. Die geometrische Optik
aus Flintglas, die miteinander verkittet sind. Soll der aus zwei solchen D¨ unnen Linsen bestehende Achromat bei der Frequenz ω0 eine Brennweite f (ω0 ) besitzen, dann muss 1 1 1 = + f (ω0 ) fF (ω0 ) fK (ω0 ) (8.7.6) gelten. Soll außerdem f (ω0 ) = 0 sein, dann muss wegen (8.7.4) gelten:
Achromat
nF (ω0 ) nK (ω0 ) + = 0. fF (ω0 ) (nF (ω0 ) − 1) fK (ω0 ) (nK (ω0 ) − 1)
(8.7.7)
Die Gleichungen (8.7.6) und (8.7.7) sind linear in den Kehrwerten der gesuchten Brennweiten fF (ω0 ) und fK (ω0 ). Sie besitzen eine L¨osung, denn die Koeffizien0 )−1 ten n(ω ur Flint- und Kronglas voneinander verschieden.8 3 n (ω0 ) sind f¨ 8.47 Bemerkung (Lineare Optik und symplektische Gruppe) Wir haben in diesem Kapitel festgestellt, dass die geometrische Optik in ihrer linearen Approximation auf Rechnungen in der Gruppe Sp(4, R) f¨ uhrt. Tats¨achlich kann man zeigen (siehe Guillemin und Sternberg [GS1], Kapitel 4), dass die lineare Optik in dem Sinn ¨aquivalent zur Theorie dieser symplektischen Gruppe ist, dass jedes Gruppenelement als endliches Produkt von Matrizen der Form (8.7.1) beziehungsweise (8.7.3) dargestellt werden kann. 3
8 In der Praxis korrigiert man oft auf die Farben Blau und Rot (siehe Abbildung) und verwendet daher statt dieser Koeffizienten die sogenannte Abbe-Zahlen der Glassorten.
Kapitel 9
Ergodentheorie
9.1 Maßerhaltende dynamische Systeme . . . . . . . . . . . . 178 9.2 Ergodische dynamische Systeme . . . . . . . . . . . . . . 181 9.3 Mischende dynamische Systeme . . . . . . . . . . . . . . 184 9.4 Der birkhoffsche Ergodensatz . . . . . . . . . . . . . . . . 191 ´ 9.5 Der poincaresche Wiederkehrsatz . . . . . . . . . . . . . . 197
In der Ergodentheorie werden statistische Eigenschaften dynamischer Systeme untersucht. Das ist oft auch und gerade dann m¨oglich und sinnvoll, wenn die Dynamik sehr schlecht berechenbar ist, also bei chaotischer Bewegung. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 9,
177
178
9.1
9.1. Maßerhaltende dynamische Systeme
Maßerhaltende dynamische Systeme
Durch die Untersuchungen u ¨ber die Grundlagen der Geometrie wird uns die ” Aufgabe nahegelegt, nach diesem Vorbilde diejenigen physikalischen Disciplinen axiomatisch zu behandeln, in denen schon heute die Mathematik eine hervorragende Rolle spielt; dies sind in erster Linie die Wahrscheinlichkeitsrechnung und die Mechanik.” David Hilbert, 6. Problem Nach den topologischen und geometrischen Eigenschaften dynamischer Systeme werden wir uns jetzt mit den maß– und wahrscheinlichkeitstheoretischen Aspekten befassen. Dieser Gesichtspunkt ist besonders wichtig, wenn wir das Langzeitverhalten instabiler (,chaotischer’) Systeme beschreiben wollen. Im einfachsten Fall wird das betrachtete Maß das Lebesgue–Maß λd auf dem Phasenraum Rd sein. Da wir aber auch andere Maße betrachten wollen, beginnen wir mit einigen maß- und wahrscheinlichkeitstheoretischen Grundbegriffen. Das oben zitierte sechste der 23 hilbertschen Probleme, die dieser in seiner Rede dem internationalen Mathematiker-Kongreß zu Paris im Jahr 1900 vorstellte, zeigt, dass zu dieser Zeit die Mathematisierung der Wahrscheinlichkeitstheorie noch nicht abgeschlossen war (und wegen der u.A. durch Boltzmann vorangetriebenen statistischen Mechanik teils der Physik als Anwendungsfach zugerechnet wurde). Diese Axiomatisierung geschah im wesentlichen durch Andrei Kolmogorovs 1933 erschienenes Lehrbuch Grundbegriffe der Wahrscheinlichkeitsrechnung. 9.1 Definition Ein messbarer Raum (kurz Messraum) (M, M) ist eine nichtleere Menge M mit einer Familie M von Teilmengen von M (den messbaren Mengen), f¨ ur die gilt: • M ∈ M. • Falls An ∈ M (n ∈ N), dann ist auch
7 n∈N
An ∈ M.
• Falls A ∈ M, dann ist auch Ac := M \ A ∈ M. M heißt dann σ–Algebra auf M . Man vergleiche mit der Definition A.1 der topologischen R¨aume. 9.2 Beispiele (Messr¨ aume) 1. {∅, M } ist die kleinste σ–Algebra auf M . 2. Die Potenzmenge 2M = P(M ) von M ist die gr¨oßte σ–Algebra auf M . 3. Ist M = ∅ und N eine Teilmenge der Potenzmenge 2M , dann ist das Mengensystem 8 σ(N ) := A (9.1.1) σ−Algebra A⊆2M : N ⊆A
eine σ–Algebra auf M mit N ⊆ σ(N ). Sie ist die kleinste solche σ–Algebra und heißt die von N erzeugte σ–Algebra.
9. Ergodentheorie
179
4. Ist (M, O) ein topologischer Raum, dann heißt σ(O) die σ–Algebra der Borel– Mengen. Sie enth¨alt insbesondere alle offenen und alle abgeschlossenen Teilmengen von M . Dies ist die in der Klassischen Mechanik haupts¨achlich benutzte σ–Algebra auf dem Phasenraum M (der als Mannigfaltigkeit insbesondere ein topologischer Raum ist). 3 9.3 Definition • Ein Maß auf einem messbaren Raum (M, M) ist eine Abbildung 1 μ : M → [0, ∞] (die nicht nur den Wert ∞ annimmt), welche σ–additiv (auch abz¨ ahlbar additiv genannt) ist, das heißt 3 An = μ(An ), (9.1.2) μ n∈N
n∈N
f¨ ur disjunkte (Am ∩ An = ∅ f¨ ur m = n ∈ N) An ∈ M. • μ heißt Wahrscheinlichkeitsmaß, wenn zus¨atzlich μ(M ) = 1 gilt. • Ein Maßraum (M, M, μ) ist ein messbarer Raum (M, M) mit einem Maß μ : M → [0, ∞]. • Ist μ ein Wahrscheinlichkeitsmaß, dann heißt (M, M, μ) Wahrscheinlichkeitsraum (kurz W-Raum). 9.4 Beispiele (Maße) 1. Rd , + und Zd , + sind Beispiele (lokalkompakter) abelscher topologischer Gruppen (M, +). F¨ ur diese existiert ein translationsinvariantes 2 (regul¨ares) Maß μ auf einer die Borel–Mengen von M umfassenden σ–Algebra M, das auf nichtleeren offenen Teilmengen positiv ist. Dieses Maß ist bis auf Multiplikation mit einer positiven Konstante eindeutig und wird Haar-Maß genannt. Seine Konstruktion findet man in Elstrodt [El], Kapitel VIII, §3. Etwa im Fall der Gruppe Rd , + erhaltenwir μ = cλd f¨ ur das Lebesgue–Maß d d λ und die Normierungskonstante c := μ [0, 1] > 0. 2. Ist h ein regul¨arer Wert einer glatten Funktion H : Rd → R, und ist die Niveaumenge M := {x ∈ Rd | H(x) = h} kompakt (und M = ∅), dann wird durch ˆ ∩ H −1 (h − ε, h + ε) λd B λh (B) := lim ε0 2ε ein Maß auf M definiert. Dabei werden den Borel–Mengen B ∈ M die Menˆ ⊆ Rd zugeordnet, die entstehen, wenn man alle um b ∈ B zentrierten gen B Mit [0, ∞] ist die Menge [0, +∞) ∪ {+∞} gemeint. Translationsinvarianz von μ bedeutet μ(A + m) = μ(A) f¨ ur alle A ∈ M und m ∈ M. 1
2 Definition:
180
9.1. Maßerhaltende dynamische Systeme
auf M senkrecht stehenden Strecken der (kleinen) L¨ange 2δ > 0 vereinigt, also anschaulich B ,verdickt’. Das Maß λh auf M heißt Liouville–Maß. Beispielsweise erhalten wir so f¨ ur H : Rd+1 → R, H(x) := x 2 ein rotationssymmetrisches Maß auf der Kugeloberfl¨ache S d = H −1 (1). 3 9.5 Definition • Eine Abbildung T : M1 → M2 zwischen Maßr¨aumen (Mi , Mi , μi ) heißt messbar, wenn T −1 (A2 ) ∈ M1
(A2 ∈ M2 ).
• Eine messbare Abbildung T : M1 → M2 heißt maßerhaltend, wenn μ1 T −1 (A2 ) = μ2 (A2 )
(A2 ∈ M2 ).
• Ist Φ : G×M → M ein dynamisches System (mit Gruppe G = R oder Z), und ist μ ein Maß auf der Borel–σ–Algebra M von M , dann heißt (M, M, μ, Φ) ein maßerhaltendes dynamisches System, wenn Φ messbar und die Abbildungen Φt : M → M (t ∈ G) maßerhaltend sind. 9.6 Aufgabe (Invariantes Maß) Zeigen Sie, dass die st¨ uckweise stetige Gauss– Abbildung 3 h : [0, 1) → [0, 1) das durch μ(A) := erh¨alt.
1 log 2
, h(0) := 0 , h(x) := 1/x − 1/x f¨ ur x > 0
1 A 1+x
dx definierte Wahrscheinlichkeitsmaß μ auf [0, 1] 3
9.7 Bemerkung (Existenz invarianter Maße) Meistens weiß man, dass es f¨ ur ein dynamisches System ein invariantes Maß gibt. Beispielsweise garantiert der Satz von Bogoliubov und Krylov f¨ ur stetige Abbildungen T : M → M eines kompakten metrischen Raumes M sogar die Existenz eines T –invarianten Wahr3 scheinlichkeitsmaßes 4 . In der Klassischen Mechanik existiert immer ein ausgezeichnetes invariantes Maß:
9.8 Satz Es sei H ∈ C 2 (M, R) auf dem Phasenraum M := Rnp × Rnq eine Funktion, die (im Sinn von Definition 6.6) einen hamiltonschen Fluss Φ auf M erzeugt. Dann erhalten die Φt : M → M (t ∈ R) das Lebesgue–Maß λ2d . 3 Siehe
auch Seite 406. konstruiert es als H¨ aufungspunkt einer Folge immer invarianterer Maße, siehe Walters [Wa2], Corollary 6.9.1. 4 Man
9. Ergodentheorie
181
Beweis: F¨ ur den Fall eines linearen Flusses wurde die Aussage schon im Korollar zu Satz 6.11 bewiesen. Analog folgt die Behauptung mit Satz 4.18 (Wronski– Determinante) aus der Form XH = J DH des hamiltonschen Vektorfeldes von H. Denn die Spur des linearisierten Vektorfeldes ist Null: tr(DXH ) = tr J D2 H = tr (J D2 H) = tr − J D2 H = −tr(DXH ). 2
9.9 Bemerkung Analog erh¨alt auch f¨ ur regul¨are Werte E von H der auf die 3 Energiefl¨ache H −1 (E) eingeschr¨ankte Fluss das Liouville–Maß λE . 9.10 Aufgabe (Phasenraumvolumen) Gegeben sei die Hamilton–Funktion H : M → R , H(p, q) := 12 p 2 + W ( q )
mit dem Potential W (r) := −r −α
auf dem Phasenraum M := Rn × (Rn \ {0}). F¨ ur welche Parameterwerte α∈R ist f¨ ur alle E < 0 das Volumen V (E) := λ2n (p, q) ∈ M H(p, q) ≤ E des Phasenraumbereichs mit Energie kleiner als E endlich, f¨ ur welche unendlich? 3
9.2
Ergodische dynamische Systeme
Viele dynamische Systeme besitzen die Eigenschaft, dass anf¨anglich benachbarte Trajektorien schnell auseinanderstreben, sodass eine langfristige Voraussage bei endlich genauer Kenntnis der Anfangsbedingungen unm¨oglich ist. Trotzdem sind auch in diesen F¨allen Aussagen u ¨ber das Langzeitverhalten m¨ oglich, die dann allerdings statistischer Natur sind. Diese Anwendung wahrscheinlichkeitstheoretischer Begriffe auf dynamische Systeme wird Ergodentheorie genannt. Wir untersuchen also die Eigenschaften eines maßerhaltenden dynamischen Systems (M, M, μ, Φ), wobei wir annehmen, dass μ ein Wahrscheinlichkeitsmaß ist 5 . Eine wichtige Frage ist dabei, wie viele Φ–invariante messbare Mengen es gibt, also wie groß I := {A ∈ M | ∀t ∈ G : Φt (A) = A}
(9.2.1)
ist. Offensichtlich gilt immer {∅, M } ⊂ I, und I ⊂ M ist eine σ–Algebra von M . Grob gesagt, ist I umso kleiner, je mehr Φ den Phasenraum M durcheinander mischt. 9.11 Definition Das maßerhaltende dynamische System heißt ergodisch 6 , wenn μ(A) ∈ {0, 1} 5 Es
(A ∈ I).
gibt aber auch eine Ergodentheorie f¨ ur nicht endliche Maße, siehe Aaronson [Aa]. Vermeidung von Mißverst¨ andnissen: Die Ergodentheorie betrachtet auch nicht ergodische Systeme. 6 Zur
182
9.2. Ergodische dynamische Systeme
9.12 Beispiel (Kreisrotationen) Es sei M die Kreislinie S 1 ⊂ C. Da dieser Phasenraum gleichzeitig eine kompakte abelsche Gruppe ist, ist das geeignet normierte haarsche Maß 7 μ auf M ein Wahrscheinlichkeitsmaß. 1. Die R–Gruppenwirkung Φ : R × M → M , Φ(t, m) := exp(2πiαt) m ist maßerhaltend und f¨ ur α ∈ R \ {0} ergodisch, denn falls m ∈ S 1 zu einer Φ–invarianten Menge A ⊆ S 1 geh¨ ort, dann ist A = S 1 . 2. F¨ ur α ∈ Q ist die Z–Gruppenwirkung Φ : Z × M → M , Φ(t, m) := exp(2πiαt) m
S1 A
A
nicht ergodisch, denn wenn α = p/q mit q ∈ N und p ∈ Z ist, ist die Menge 3
q−1
A :=
& % k+ 1 ⊂M exp 2πi kq , q 2
A
k=0
Φ–invariant, aber μ(A) = hende Abbildung.
1 , 2
siehe nebenste3
Φ–invariante Menge A f¨ ur α = p/q mit q = 3
Im letzten Beispiel sind f¨ ur α ∈ Q alle Orbits periodisch, w¨ahrend f¨ ur α ∈ R \ Q kein Orbit periodisch ist. Ist dann dieses diskrete dynamische System auch ergodisch? Dies ist nicht so einfach zu beantworten, denn jedenfalls gibt es mehr invariante Mengen als M und ∅ (zum Beispiel der Orbit {exp(2πiαt)x | t ∈ Z} eines Punktes x ∈ M ; dieser ist abz¨ahlbar, kann also nicht mit M u ¨bereinstimmen). Hier ist es n¨ utzlich zu betrachten, wie das dynamische System auf Phasenraumfunktionen, genauer den quadratintegrablen Funktionen auf M , wirkt. 9.13 Lemma Ist (M, M, μ, Φ) ein maßerhaltendes dynamisches System, dann sind die linearen Endomorphismen ˆ t f := f ◦ Φt ˆ t : L2 (M, μ) → L2 (M, μ) , Φ (t ∈ G) Φ . ˆ t g = f, g f, g ∈ L2 (M, μ) . ˆ t f, Φ ˆ t ist surjektiv und Φ unit¨ar, das heißt Φ ur y = Φt (x) Beweis: • Wegen der Φt –Invarianz des Maßes μ ist f¨ . ˆ tg ˆ t f, Φ = f ◦ Φt (x) g ◦ Φt (x) dμ(x) = f (y) g(y) dμ Φ−t (y) Φ M M = f (y) g(y) dμ(y) = f, g . M
ˆ t )−1 = Φ ˆ −t . ˆ t ist surjektiv, da die Umkehrabbildung existiert: (Φ •Φ 7 siehe
Beispiel 9.4 auf Seite 179.
2
9. Ergodentheorie
183
9.14 Satz (Koopman) Die Gruppenwirkung Φ ist genau dann ergodisch, wenn ˆ alle Φ–invarianten Funktionen f ∈ L2 (M, μ)
ˆ tf = f , Φ
(t ∈ G)
μ–fast u ¨berall konstant sind. Beweis: Wir identifizieren die quadratintegrablen Funktionen f : M → C mit ¨ ihren Aquivalenzklassen [f ] ∈ L2 (M, μ). ˆ • F¨ ur eine Φ–invariante Funktion f ∈ L2 (M, μ) sind auch Re(f ) und Im(f ) ˆ Φ–invariant, und umgekehrt. Wir k¨ onnen also annehmen, dass f reell ist. F¨ ur alle n ∈ N und k ∈ Z sind die messbaren Teilmengen des Phasenraums An,k := f −1 k2−n , (k + 1)2−n ur alle n ∈ N bilden sie außerdem eine Partition von Φ–invariant (An,k ∈ I). F¨ M , das heißt 3 An,k1 ∩ An,k2 = ∅ f¨ ur k1 = k2 , und An,k = M. (9.2.2) k∈Z
Ist Φ ergodisch, dann ist μ(An,k ) ∈ {0, 1}, sodass wegen (9.2.2) ein eindeutiger Index kn mit μ(An,kn ) = 1 existiert. Nun gilt An,k = An+1,2k ∪˙ An+1,2k+1 , weshalb die Folge (kn 2−n )n∈N gegen eine reelle Zahl z konvergiert, die von f μ–fast u ¨berall angenommen wird (das heißt μ({x ∈ M | f (x) = z}) = 0). ˆ • Sind umgekehrt alle Φ–invarianten Funktionen f ∈ L2 (M, μ) μ–fast u ¨berall konstant, dann gilt dies insbesondere f¨ ur die charakteristischen Funktionen 1lA der invarianten Mengen A ∈ I. Da diese nur die Werte 0 und 1 annehmen k¨onnen, folgt 1lA dμ ∈ {0, 1} (A ∈ I), μ(A) = M
2
also die Ergodizit¨at.
9.15 Beispiel (Diskrete Kreisrotation) Wir kehren zu Beispiel 9.12.2 zur¨ uck und nehmen an, dass der Kreis S 1 um die ganzzahligen Vielfachen des Winkels ˆ und ist 2πα, α ∈ R \ Q gedreht wird. Ist nun f ∈ L2 (M, μ) invariant unter Φ f= ck ek mit ck := f, ek k∈Z
die Fourier–Entwicklung von f mit der Orthonormalbasis der Charaktere ek : S 1 → S 1
,
ek (m) := mk
(k ∈ Z),
184
9.3. Mischende dynamische Systeme
dann ist ˆ t (f ) = Φ
k∈Z
ˆ t (ek ) = ck Φ
ck exp(2πitkα) ek ,
k∈Z
ˆ 1 (f ) = 0. sodass f¨ ur Zeit t = 1 folgt: k∈Z ck 1 − exp(2πikα) ek = f − Φ Wegen der Irrationalit¨at von α verschwindet die Klammer aber nur f¨ ur k = 0, sodass aus der Basiseigenschaft der Funktionen ek folgt: ck = 0 (k ∈ Z \ {0}). f ist also μ–fast u 3 ¨berall konstant. Damit ist Φ ergodisch.
9.3
Mischende dynamische Systeme Ich bin eigentlich nur Physiker aus Ordnungsliebe geworden ” (er stellt die Stehlampe auf). Um die scheinbare Unordnung in der Natur auf eine h¨ohere Ordnung zur¨ uckzuf¨ uhren.” Newton, in Die Physiker von Friedrich D¨ urrenmatt
Wie das letzte Beispiel zeigte, k¨ onnen sehr regul¨are und gut voraussagbare dynamische Systeme ergodisch sein. Dagegen ist die Dynamik mischender Systeme komplizierter. Wir gehen wieder von einem messbaren dynamischen System (M, M, μ, Φ) mit Wahrscheinlichkeitsmaß μ aus. 9.16 Definition Das dynamische System heißt mischend, wenn gilt (A, B ∈ M). lim μ Φt (A) ∩ B = μ(A) μ(B) |t|→∞
(9.3.1)
In einem maßtheoretischen Sinn wird also f¨ ur große Zeiten t die Menge Φt (A) in M gleichverteilt, etwa so wie sich durch R¨ uhren die Milch im Kaffee verteilt. 9.17 Lemma Mischende dynamische Systeme sind ergodisch. Beweis: Ist A ∈ I (siehe (9.2.1)), dann ist Φt (A) = A f¨ ur alle Zeiten t, also wegen der Mischungseigenschaft μ(A∩B) = lim|t|→∞ μ(Φt (A)∩B) = μ(A) μ(B). 2 F¨ ur B := A ergibt das die Gleichung μ(A) = μ(A)2 , also μ(A) ∈ {0, 1}. 9.18 Beispiel Der Fall der Kreisrotationen (Beispiel 9.12.1 und 9.15) zeigt, dass umgekehrt nicht alle ergodischen dynamischen Systeme mischend sind, denn der Limes aus (9.3.1) existiert hier nicht, siehe Abbildung 9.3.1. 3 Allerdings gilt f¨ ur ergodische Systeme, dass das Ces`aro-Mittel 8 der auf der linken Seite von (9.3.1) auftretenden Funktion gegen die rechte Seite konvergiert. 8 Definition: Das Ces` aro-Mittel einer Zahlenfolge (ak )k∈N ist die Folge (ck )k∈N , ck :=
k aro-Mittel einer integrablen Funktion a : R+ → C ist die Funktion c : =1 a . Das Ces` R+ → C mit c(x) := x1 0x a(y) dy. 1 k
9. Ergodentheorie
185
Μ t A A
13
1 3
2 3
1
4 3
5 3
2
t
Abbildung 9.3.1: Die Funktion t → μ Φt (A) ∩ A , ihr Mittelwert und Ces`aro– Mittel, f¨ ur die Kreisrotation Φt (x) = exp(2πit) x und das Kreissegment A := {exp(2πiz) | 0 ≤ z ≤ 1/3}. 9.19 Definition • F¨ ur ein maßerhaltendes dynamisches System (M, M, μ, Φ) mit W -Maß μ, der Gruppe von Zeiten G = R oder G = Z und f, g ∈ L2 (M, μ) heißt die Funktion . ˆ t f, g − f, 1lM 1lM , g Cf,g : G → C , Cf,g (t) := Φ die Korrelationsfunktion von f und g. • Cf := Cf,f heißt die Autokorrelationsfunktion von f . Insbesondere hat die Korrelationsfunktion von charakteristischen Funktionen die Gestalt C1lA ,1lB (t) = μ Φt (A) ∩ B − μ(A) μ(B) (A, B ∈ M). (9.3.2) In der Funktion f ist Cf,g linear, in g konjugiert linear. Außerdem gilt Cf˜,˜g = Cf,g , falls f˜ − f und g˜ − g konstante Funktionen sind. In Analogie zu Satz 9.14 gilt: 9.20 Satz F¨ ur ein maßerhaltendes dynamisches System (M, M, μ, Φ) mit W Maß μ sind die folgenden Aussagen ¨aquivalent. 1. Das System ist mischend. 2. F¨ ur die Korrelationsfunktion von f, g ∈ L2 (M, μ) gilt lim|t|→∞ Cf,g (t) = 0. 3. F¨ ur die Autokorrelationsfunktion von f ∈ L2 (M, μ) gilt lim|t|→∞ Cf (t) = 0. Beweis: • F¨ ur f := 1lA und g := 1lB folgt aus (9.3.2) die Implikation 2. ⇒ 1. • 1. ⇒ 3. folgt durch Approximation
von f ∈ L2 (M, μ) durch einfache Funktionen, das heißt solche der Form fn := nk=1 cn,k 1lAn,k , mit Koeffizienten cn,k ∈ C ur ε > 0 sei N (ε) so gew¨ahlt, dass gilt: und messbaren An,k ⊆ M . F¨
f − fn 2 < ε n ≥ N (ε) .
186
9.3. Mischende dynamische Systeme
Es gen¨ ugt, Aussage 3. f¨ ur Funktionen f mit Mittelwert f, 1lM = 0 zu zeigen, und wir k¨onnen diese durch einfache Funktionen fn mit Mittelwert fn , 1lM = 0 ˆt approximieren. Aus der Cauchy-Schwarz–Ungleichung und der Unitarit¨at von Φ (Lemma 9.13) folgt . . ˆ ˆ (9.3.3) |Cf (t) − Cfn (t)| = Φ t (f − fn ), f + Φt fn , f − fn ˆ t (f − fn ) 2 f 2 + Φ ˆ t fn 2 f − fn 2 ≤ Φ = f − fn 2 ( f 2 + fn 2 ) ≤ ε( f 2 + f 2 + ε), also uniform in der Zeit limn→∞ Cfn = Cf . Andererseits konvergiert n
Cfn (t) =
cn,k cn, μ Φt (An,k ) ∩ An, − μ(An,k ) μ(An, )
k,=1
nach der Voraussetzung 1. f¨ ur alle n ∈ N im Limes |t| → ∞ gegen Null. Insgesamt folgt daraus lim|t|→∞ Cf (t) = 0. • 3. ⇒ 2. folgt aus einer Polarisationsidentit¨at. Setzen wir n¨amlich wieder ohne Beschr¨ankung der Allgemeinheit voraus, dass f, g ∈ L2 (M, μ) Mittelwert Null haben, gilt gleiches f¨ ur hk := 12 (f + ik g), und 4
ik Chk (t) = 14
k=1
4 %. . . .& ˆ t f, g + (−1)k Φ ˆ t g, f + ik Φ ˆ t f, f + ik Φ ˆ t g, g Φ k=1
=
. ˆ t f, g = Cf,g (t). Φ
(9.3.4)
Da nach Voraussetzung die linke Seite von (9.3.4) im Limes |t| → ∞ gegen Null geht, ist auch lim|t|→∞ Cf,g (t) = 0. 2 9.21 Beispiel (Torusautomorphismen) Die Menge der invertierbaren 2 × 2– Matrizen mit ganzzahligen Eintr¨agen bildet eine multiplikative Gruppe GL(2, Z) := {T ∈ Mat(2, Z) | | det(T )| = 1}, die Allgemeine Lineare Gruppe vom Grad 2 u ¨ber Z. F¨ ur jedes T ∈ GL(2, Z) erhalten wir damit ein dynamisches System ˜ : Z × R2 → R2 Φ
˜ , Φ(n, x) := T n x,
welches das Gitter Z2 ⊂ R2 auf sich abbildet. Nun ist Z eine Untergruppe der abelschen Gruppe R, die Menge R/Z der Nebenklassen also (nach Satz E.7) ebenfalls eine abelsche Gruppe, und wir k¨onnen die Zahlen aus [0, 1) als die Repr¨asentanten dieser Gruppe w¨ahlen. Dabei geht die Addition reeller Zahlen in die Addition modulo 1 u ¨ber. Die Abbildung x → exp(2πix) bildet R/Z isomorph auf die multiplikative Gruppe S 1 = {c ∈ C | |c| = 1}, die Kreislinie, ab. Komponentenweise Addition
9. Ergodentheorie
187
modulo 1 ergibt die Isomorphie des in Beispiel 8.32 (Doppelpendel) eingef¨ uhrten 2–Torus T2 = S 1 × S 1 mit der Faktorgruppe ˆ 2 := R2 /Z2 ∼ ˆ 2 , ( xx1 ) → x1 ( mod 1) . T = (R/Z)2 mit Projektion π : R2 → T 2 x2 ( mod 1) ˜ t linear sind und Φ ˜ t (Z2 ) = Z2 gilt, ergibt sich f¨ Da die Abbildungen Φ ur alle Zeiten t ∈ Z ˜ t (x + ) ≡ Φ ˜ t (x) ( mod 1) Φ x ∈ R2 , ∈ Z2 . Damit erhalten wir durch Projektion auf die Faktorgruppe das dynamisches System ˆ2 → T ˆ 2 , Φt π(x) = π Φ ˜ t (x) Φt : T x ∈ R2 . ˆ 2 und heißt daher TorusautomorphisΦ1 ist ein Automorphismus der Gruppe T 9 mus . Ist sogar det(T ) = 1, dann nennt man T und den Torusautomorphismus • hyperbolisch, wenn |tr(T )| > 2 gilt, also wenn T reelle Eigenwerte λi mit |λ1 | > 1 > |λ2 | besitzt. Die Abbildung T streckt dann in Richtung des ersten Eigenraums um den Faktor λ1 und kontrahiert um λ2 = 1/λ1 in Richtung des zweiten Eigenraums. • parabolisch, wenn |tr(T )| = 2 gilt, also der Eigenwert gleich 1 oder −1 ist • elliptisch, wenn |tr(T )| < 2 gilt, die durch T gegebene lineare Abbildung also konjugiert zu einer Drehung der Ebene um den Winkel ±π/3, ±π/2 oder ±2π/3 ist. Wir sehen in den Abbildungen 9.3.2 und 9.3.3 f¨ ur eine hyperbolische bzw. paraˆ 2. 3 bolische Matrix T die Wirkung von Φt auf eine Teilmenge des 2-Torus T
Abbildung9.3.2: ur die Ma Wirkung des hyperbolischen Torusautomorphismus f¨ trix T := 21 11 . Links: Teilmenge A ⊂ T2 . Mitte: Φ1 (A), Rechts: Φ3 (A). 9 Tats¨ achlich
ˆ 2 von dieser Form ([Wa2], §0.8). ist jeder stetige Automorphismus der Gruppe T
188
9.3. Mischende dynamische Systeme
Abbildung ur die Matrix 9.3.3: Wirkung des parabolischen Torusautomorphismus f¨ T := 10 11 . Links: Teilmenge A ⊂ T2 . Mitte: Φ2 (A), Rechts: Φ5 (A). 9.22 Satz Hyperbolische Torusautomorphismen sind mischend. ˆ 2 ) der (Aquivalenzklassen ¨ Beweis: Der Hilbert–Raum L2 (T von) quadratinteg 2 ˆ rablen Funktionen f, g : T → C mit Skalarprodukt f, g := Tˆ 2 f (x)g(x) dx besitzt die Orthonormalbasis der Charaktere (ek )k∈Z2 mit ˆ2 . ek (x) := exp(2πi k, x) x∈T (9.3.5) Es ist . ˜ (k), x = e ˜ (x), ek Φn (x) = exp 2πi k, Φn (x) = exp 2πi Φ n Φ (k) n
denn mit T ist auch die transponierte Matrix T in GL(2, Z). Wegen der Hyperbolizit¨at von T existiert kein Gittervektor k ∈ Z2 \ {0}, der ˜ f¨ ur irgendeine Zeit t ∈ Z \ {0} auf sich abgebildet w¨ urde, das heißt Φ t (k) = k. Betrachten wir daher f¨ ur ein noch so großes r > 0 die endliche Menge Z2r := {k ∈ Z2 | |k| ≤ r}, dann existiert eine Zeit t0 (r), nach der alle k ∈ Z2r \ {0} diese Menge verlassen haben, das heißt 2 ˜ Φ |t| > t0 (r) . t (k) ∈ Zr Die linearen Abbildungen ˆ 2 ) → L2 (T ˆ 2) , ˆ t : L2 ( T Φ
ˆ t f = f ◦ Φt Φ
sind nach Lemma 9.13 unit¨ar. Gem¨aß Satz 9.20 zeigen wir, dass gilt: ˆ 2) . lim Cf (t) = 0 f ∈ L2 (T |t|→∞
(9.3.6)
Ohne Beschr¨ankung der Allgemeinheit k¨ onnen wir wieder annehmen, dass f Mittelwert Null hat, also in der Fourier–Reihe f= ck ek mit ck := f, ek ∈ C k∈Z2
9. Ergodentheorie
189
(und k∈Z2 |ck |2 < ∞) der Koeffizient c0 = 0 ist. Wir schneiden wir diese Reihe ab, indem wir cn en fr := n∈Z2r
setzen. Nun folgt f¨ ur Zeiten t ∈ Z mit |t| > t0 (r) . . ˆ t ek , e = |c0 |2 = 0, ˆ t fr , fr = ck c · Φ Φ k,∈Z2r
ˆ t ek = e ˜ ist dann f¨ ur Gitterpunkte k ∈ Z2r \ {0} orthonormal auf den denn Φ Φt (k) ˆ t unit¨ar, sodass unter Verwendung e , ∈ Z2r . Andererseits sind die Abbildungen Φ der Dreiecksungleichung und der schwarzschen Ungleichung analog zu (9.3.3) folgt: . . ˆ ˆ t fr , fr ≤ ε(2 f 2 + ε), Φt f, f − Φ falls r ≡ r(ε) so groß gew¨ahlt wird, dass f − fr 2 < ε gilt. Das impliziert f¨ ur |t| > t0 (r(ε)) die Ungleichung |Cf (t)| ≤ ε(2 f 2 + ε), also (9.3.6). 2 9.23 Aufgabe (Korrelationsabfall) Ein hyperbolischer Torusautomorphismus T : T2 → T2 , T x = Tˆx (mod 1) mit Tˆ ∈ GL(2, Z) und tr(Tˆ) > 2 ist nach Satz 9.22 mischend, das heißt, mit U : L2 (T2 ) → L2 (T2 ), U g := g ◦ T ist lim f, U n g = f, 1l 1l, g
n→∞
f, g ∈ L2 (T2 ) .
In dieser Aufgabe soll f¨ ur f, g ∈ C 1 (T2 ) die Konvergenzgeschwindigkeit abgesch¨atzt werden. Dazu wird verwendet, dass die Fourier–Koeffizienten fk = f, ek ∈ C, ek : T2 → S 1 , k ∈ Z2 nicht nur die aus der Orthonormalit¨at der Charaktere
2 ek (x) = exp(2πi k, x) folgende Parseval–Gleichung k∈Z2 |fk | = f, f erf¨ ullen, wenn f ∈ C 1 (T2 ) ist. Dann gilt sogar k∈Z2
k 2 |fk |2 =
∇f 22 < ∞. 4π 2
(9.3.7)
Die Fourier–Koeffizienten fallen also wegen der stetigen Differenzierbarkeit von f relativ schnell ab (siehe auch Lemma 15.14 auf Seite 381). (a) Zeigen Sie f¨ ur zwei Funktionen f, g ∈ C 1 (T2 ) und mit T˜ := (Tˆ )−1 f, U n g = f, 1l 1l, g +
k∈Z2 \{(0,0)}
fk gT˜n k .
190
9.3. Mischende dynamische Systeme
(b) Leiten Sie die Existenz einer ((f, g)–abh¨angigen) Konstanten L ∈ (0, ∞) her, mit −4 14 f, U n g − f, 1l 1l, g ≤ L .
k 2 + T˜n k 2 k∈Z2 \{0}
Tipp: Verwenden Sie (9.3.7), die H¨ older–Ungleichung und xy ≥ x ≥ y ≥ 1.
x+y 2
f¨ ur
(c) Die Matrix T˜ ist hyperbolisch und zerlegt den Raum R2 in zwei Eigenr¨aume: uhren auf R2 die Norm k E := ks 2 + ku 2 ein. R2 = E s ⊕ E u . Wir f¨ Nat¨ urlich ist · E ¨aquivalent zu · 2 , das heißt, ∃C ≥ 1 : C −1 k E ≤
k 2 ≤ C k E . Mit ihr kann man aber einfacher rechnen, denn T˜k E = ur k = ks +ku ∈ E s ⊕E u , mit dem gr¨oßten Betrag λ > λ−1 ks 2 +λ ku 2 f¨ 1 eines Eigenwertes von T˜. Zeigen Sie exponentiellen Korrelationsabfall 10 : 1 n 4 f, U n g − f, 1l 1l, g ≤ C 2 L h−4 λ− 2 (n ∈ N). 3 2 h∈Z2 \{0}
9.24 Weiterf¨ uhrende Literatur Im Beispiel der hyperbolischen Torusautomorphismen haben wir uns zunutze gemacht, dass der Torus R2 /Z2 eine abelsche Gruppe ist, und die untersuchten Abbildungen Gruppenautomorphismen sind. In physikalischen Anwendungen kann man dies nat¨ urlich nicht erwarten, und andere Techniken m¨ ussen benutzt werden. Eine wichtige Beispielklasse mischender hamiltonscher Systeme ist die der geod¨atischen Fl¨ usse auf kompakten Mannigfaltigkeiten negativer Schnittkr¨ ummung. Den Beweis der Ergodizit¨at dieser Fl¨ usse findet man im von M. Brin geschriebenen Anhang des Buches [Ball] von Ballmann. Eine weitere Beispielklasse bilden sogenannte Billards (englisch: billiard). Unter diesen ist der bekannteste der sogenannte Sinai–Billard. Bei diesem bewegt sich die Billardkugel auf einem zweidimensionalen Torus (oder ¨aquivalent in einem Quadrat, siehe Abbildung) und wird an einem kreisf¨ormigen Hindernis reflektiert. Er wurde zuerst von Yakow Sinai in [Sin] untersucht. Siehe Cornfeld, Fomin und Sinai [CFS], Kozlov und Treshchev [KT], Liverani und Wojtkowski [LW] und Tabachnikov [Ta]. 3 9.25 Aufgabe (Produktmaß auf dem Shiftraum) Wir definieren Teilmengen des Shiftraums M := AZ u ¨ber dem Alphabet A (siehe Beispiel 2.18), sogenannte Zylindermengen, f¨ ur k ∈ Z, j ∈ N0 und τ = (τ1 , . . . , τj ) ∈ Aj durch
:= a : Z → A ∀ ∈ {1, . . . , j} : ak+−1 = τ . [τ1 , . . . , τj ]k+j−1 k 10 Der
exponentielle Korrelationsabfall ist Thema des Buches [Bala] von Viviane Baladi.
9. Ergodentheorie
191
Der untere Index gibt also die Position des ersten, der obere die des letzten festgelegten Symbols an. Die Zylindermengen erzeugen die σ–Algebra (siehe Definition 9.1.1)
M := σ [τ1 , . . . , τj ]k+j−1 k ∈ Z, j ∈ N0 , τ1 , . . . , τj ∈ A . k
F¨ ur eine Wahrscheinlichkeitsfunktion p : A → [0, 1], a∈A p(a) = 1 auf dem Alphabet A wird (nach dem Erweiterungssatz von Kolmogorov, siehe z. B. Klenke [Kle]) auf M durch μp
[τ1 , . . . , τj ]k+j−1 k
:=
j 9
p(τ )
=1
ein Wahrscheinlichkeitsmaß μp festgelegt, das sogenannte Produktmaß.11 Dieses ist invariant unter dem Shift Φ : Z × M → M . Zeigen Sie, dass f¨ ur alle Wahrscheinlichkeitsfunktionen p das maßerhaltende dynamische System (M, M, μp , Φ) mischend ist. 3
9.4
Der birkhoffsche Ergodensatz
Dieser Satz von George David Birkhoff untersucht die Existenz des Zeitmittels n−1 1 f ◦ Φt (m) n→∞ n t=0
f (m) := lim
(m ∈ M )
(9.4.1)
von Funktionen f : M → C auf einem Phasenraum M eines maßerhaltenden dynamischen Systems (M, M, μ, Φ). Wir nehmen hier vereinfachend an, dass μ ein Wahrscheinlichkeitsmaß ist und Φ ein diskretes dynamisches System ist. urzend setzen wir ft := f ◦ Φt . Die Dieses wird von Φ1 : M → M erzeugt. Abk¨ Ces`aro-Mittel der Funktionenfolge (ft )t∈N0 bezeichnen wir mit 12 An = An f : M → C
, A0 := 0
und An :=
n−1 1 ft n t=0
(n ∈ N). (9.4.2)
Wir fragen also in (9.4.1) nach der Existenz des punktweisen Limes der Funktionenfolge (An )n∈N . Der Satz von Birkhoff (Satz 9.32) gibt hierauf eine Antwort und wird daher auch als punktweiser Ergodensatz bezeichnet. + (9.4.1) definiert das Zeitmittel f (m) := f (m) der Zukunft. Analog ist −
n−1 1 f−t (m) n→∞ n t=0
f (m) := lim
(m ∈ M )
11 F¨ ur A = {−1, 1} und p(1) = t ∈ [0, 1], also p(−1) = 1 − t heißt dies auch Bernoulli–Maß zum Parameter t.
n−1 12 Das in der Ergodentheorie ubliche Symbol A steht f¨ ur average, Sn f := ur ¨ n t=0 ft f¨ sum.
192
9.4. Der birkhoffsche Ergodensatz
das Zeitmittel der Vergangenheit. Auch wenn f stetig ist, existiert f (m) im Allgemeinen nicht, und wenn die ± Mittel f (m) existieren brauchen sie nicht gleich zu sein: 9.26 Beispiel (Shiftraum) Der Folgenraum M := AZ des Alphabets A := {−1, 1} bildet mit dem Shift Φt : M → M , Φt (a) k := ak+t (t ∈ Z) ein bez¨ uglich der Produkttopologie auf M stetiges dynamisches System (siehe Beispiel 2.18.3). Die Funktion f :M →R
, f (a) := a0
ist ebenfalls stetig bez¨ uglich der Produkttopologie auf M . Etwa an der Stelle 1 , k=0 m ∈ M , mk := (−1)log2 |k| , k ∈ Z \ {0} mit der floor –Funktion ·, also k=0
m = (. . . , −1, 1, 1 , 1, −1, −1, 1, 1, 1, 1, −1, −1, −1, −1, −1, −1, −1, −1, . . .), existiert der Limes 9.4.1 aber nicht. Denn f¨ ur n := 2l besitzt die durch l indizierte Teilfolge l−1 −l k An (m) = 2 (l ∈ N) (−2) 1+ = 13 22−l − (−1)l k=0
von Ces`aro-Mitteln An = An f die zwei H¨aufungspunkte ± 13 . Man kann sich u ¨berlegen, dass das Zeitmittel f sogar auf einer in M dichten Teilmenge nicht existiert. Sei n¨amlich m ˜ ∈ M . Dann konvergiert die Folge von Punkten x(s) ∈ M mit m ˜ k , |k| ≤ s (s) xk := (s ∈ N, k ∈ Z) (9.4.3) mk , |k| > s gegen m. ˜ Aber f¨ ur keinen dieser Punkte existiert f (x(s) ). Etwa f¨ ur den Punkt 1 , k=0 m ∈ M , mk := sign(k) , k ∈ Z \ {0} +
−
ist f (m) = 1, aber f (m) = −1. Auch hier kann man mit einer zu (9.4.3) analogen Konstruktion eine dichte Teilmenge des Phasenraums M finden, auf ± der die Zeitmittel f (x) zwar existieren, aber voneinander verschieden sind. 3
9. Ergodentheorie
193
9.27 Aufgabe (Shiftraum) Finden Sie f¨ ur die Funktion f : M → R, m → m0 aus Beispiel 9.26 eine dichte Teilmenge U ⊂ M = {−1,1}Z , sodass ur alle f¨ m ∈ U die Menge der H¨aufungspunkte der Zahlenfolge An f (m) n∈N gleich dem Intervall [−1, 1] ist. 3 Aus den vorangegangenen Beispielen k¨ onnte man den falschen Schluss ziehen, dass Zeitmittel typischerweise nicht existieren. Immerhin ist f , soweit existent, Φ-invariant: 9.28 Lemma (Zeitmittel) Falls f¨ ur den Phasenraumpunkt m ∈ M das Zeitur alle Punkte des Orbits mittel f (m) von f : M → C existiert, gilt das auch f¨ durch m, und f Φt (m) = f (m) (t ∈ Z). Beweis: Aus dem Fall t = 1 folgt durch Induktion die Aussage f¨ ur beliebige t ∈ Z. Nun ist f¨ ur t = 1 die Differenz der Ces`aro-Mittel der beiden Anfangspunkte gleich 1 f (Φn (m)) − f (m) An Φ1 (m) − An (m) = n
(n ∈ N).
(9.4.4)
Im Limes n → ∞ konvergiert der zweite Term f (m)/n der rechten Seite gegen Null. Zwar ist der Z¨ahler fn (m) des ersten Terms f Φn (m) /n im Allgemeinen ankt, aber wegen der vorausgesetzten Konvergenz der Zahlenfolge in n unbeschr¨ An (m) n∈N und fn (m) 1 An+1 (m) − An (m) = 1+ n n konvergiert auch der erste Term der rechten Seite von (9.4.4) gegen Null.
2
9.29 Bemerkungen (Zeitmittel) 1. Die Existenz des Zeitmittels f (m) ist unabh¨angig von der Wahl des Φ–invarianten Wahrscheinlichkeitsmaßes μ auf M . Man kann aber mithilfe von μ definieren, was es bedeutet, dass f (m) typischerweise existiert, n¨amlich μ-fast u ¨berall. 2. Ist dabei das dynamische System ergodisch, dann gilt als Folgerung des birkhoffschen Ergodensatzes f¨ ur integrable Funktionen f : M → C mit dem Erwartungswert E(f ) = M f dμ von f f (m) = E(f )
f¨ ur μ-fast alle m ∈ M,
(9.4.5)
also Gleichheit von Zeitmittel und Raummittel. Glaubt man schon einmal, dass der Limes f (m) μ-fast u ¨berall existiert, ist die Formel (9.4.5) leicht zu verstehen. Ist n¨amlich etwa f reellwertig und w¨are f nicht μ-fast u ¨berall konstant, dann −1 [a, ∞) in M geben w¨ urde es eine Φ–invariante Menge der Form U := f mit mit μ(U ) ∈ (0, 1), im Widerspruch zur Ergodizit¨at. Der konstante Wert 3 muss aber gleich E(f ) sein, denn E(f ) = E(An f ) = E(f ).
194
9.4. Der birkhoffsche Ergodensatz
Da der birkhoffscher Ergodensatz nicht voraussetzt, dass das maßerhaltende dynamische System ergodisch ist, muss in ihm die rechte Seite von (9.4.5) wie folgt verallgemeinert werden. M bezeichnet die σ–Algebra der messbaren Mengen im Phasenraum M , und in (9.2.1) haben wir die Unter–σ–Algebra I ⊂ M der Φ–invarianten messbaren Mengen eingef¨ uhrt. 9.30 Definition F¨ ur die Zufallsvariable f ∈ L1 (M, μ) auf dem Wahrscheinlichkeitsraum (M, M, μ) und die Unter–σ–Algebra N ⊂ M heißt g ∈ L1 (M, μ) eine bedingte Erwartung von f gegeben N , wenn gilt: ur alle Borel-Mengen B ⊆ C) 1. g ist N -messbar (also g −1 (B) ∈ N f¨ 2. f¨ ur alle A ∈ N ist E(g1lA ) = E(f 1lA ). Tats¨achlich existiert immer eine bedingte Erwartung von f gegeben N , und zwei solche bedingten Erwartungen unterscheiden sich nur auf einer μ–Nullmenge, siehe zum Beispiel Klenke [Kle], §8.2. Diese werden auch Versionen der bedingten Erwartung genannt, und man schreibt E(f | I). 9.31 Beispiel (Bedingte Erwartung) F¨ ur den durch die Matrix T := 10 11 gegebenen parabolischen Torusautomorphismus (siehe Beispiel 9.21 und Abb. 9.3.3) sind die ,horizontalen Kreise’ (siehe Abbildung 9.4.1) ˆ 2 x ∈ [0, 1) (r ∈ [0, 1)) Kr := ( xr ) ∈ T Φ–invariant, und zwar wirkt Φ auf Kr durch Rotation mit dem Parameter r. Ist r eine Irrationalzahl, dann ist jeder Orbit auf Kr dicht, ist r ∈ Q, dann ist jeder Orbit auf Kr periodisch (vergleiche mit Beispiel 9.15). ˆ2 Sei
f : T → C eine (zum Beispiel stetige) Funktion mit Fourier–Darstellung f = k∈Z2 ck ek bez¨ uglich der in (9.3.5) definierten Orthonormalbasis (ek )k∈Z2 , mit Koeffizienten ck ∈ C. F¨ ur die Unter–σ–Algebra I ⊂ M der Φ–invarianten messbaren Mengen ist die u ber die Kreise Kr gemittelte Funktion ¨
ˆ (9.4.6) k=(k0 )∈Z2 ck ek : T → C 2 eine Version der bedingten Erwartung von f gegeben I (siehe Abbildung 9.4.1). Eine andere Version von E(f | I) (die an allen Punkten gleich dem Zeitmittel f von f ist) wird durch Mittelung von f u ¨ber die Kreise Kr mit irrationalem r, aber Mittelung nur bez¨ uglich der endlichen Periode q f¨ ur Kreise mit rationalem r = p/q gegeben. Im Gegensatz zur Version (9.4.6) ist diese Version im Allgemeinen unstetig. 3
9. Ergodentheorie
195
Abbildung 9.4.1: Invarianter Kreis K1/3 (links); Graustufenbilder der charakteriˆ 2 → R einer Kreisscheibe D (Mitte) und ihrer bedingten stischen Funktion 1lD : T Erwartung E(1lD | I), gegeben die Invarianz-Algebra I des Torusautomorphismus f¨ ur 10 11 (rechts). 9.32 Satz (Birkhoffscher Ergodensatz, [Bi1]) Ist f ∈ L1 (M, μ), dann existiert f¨ ur μ–fast alle Anfangswerte m ∈ M das Zeitmittel f (m), es ist f ∈ L1 (M, μ) und f = E(f | I) (μ–fast ¨uberall). (9.4.7) 9.33 Bemerkungen 1. Aus Lemma 9.28 und E(An ) = E(f ) folgt f dμ = f dμ und f ◦ T = f (μ–fast u ¨berall). M
M −
Weiter gilt eine zu (9.4.7) analoge Aussage auch f¨ ur f , sodass Zukunft und Vergangenheit sich gleichen: f
+
=f
−
(μ–fast ¨uberall).
2. Durch getrennte Betrachtung von Real-und Imagin¨arteil k¨onnen wir ohne Einschr¨ankung voraussetzen, dass f ∈ L1R (M, μ), also reell ist. Dann ist (mit den Ces`aro-Mitteln An f aus (9.4.2)) die Konvergenzaussage des Ergodensatzes: lim sup An f = lim inf An f n→∞
n→∞
(μ–fast u ¨berall).
Der Vorteil dieser Formulierung besteht darin, dass lim sup und lim inf im Gegensatz zum Limes immer existieren. Den lim sup kontrolliert man mit dem Maximum, unter Verwendung des folgenden Lemmas (siehe zum Beispiel [Kle], Kapitel 20.2, und Krengel [Kre], Kapitel 1.2 f¨ ur eine Verallgemeinerung auf positive Kontraktionen). 3 9.34 Lemma (Maximal-Ergodenlemma) F¨ ur die Funktion g ∈ L1R (M, μ) auf dem Phasenraum M des maßerhaltenden dynamischen Systems (M, M, μ, Φ)
n−1 und Sn := t=0 gt , S0 := 0 sei Fn := m ∈ M | max S1 (m), . . . , Sn (m) > 0 .
196
9.4. Der birkhoffsche Ergodensatz
Dann ist E(g 1lFn ) ≥ 0
(n ∈ N).
Beweis: F¨ ur alle k ∈ N0 ist g = Sk+1 − Sk ◦ T . Mit Mn := max(S0 , . . . , Sn ) folgt (k = 0, . . . , n), g ≥ Sk+1 − Mn ◦ T also
E max(S1 , . . . , Sn ) − Mn ◦ T 1lFn = E (Mn − Mn ◦ T ) 1lFn ≥ E Mn − Mn ◦ T = E Mn − E Mn = 0.
E(g 1lFn ) ≥
Die erste Gleichung folgt dabei aus Fn = {m ∈ M | Mn (m) > 0}, die vorletzte aus der T -Invarianz des Maßes μ. Die zweite Ungleichung folgt aus Mn ◦ T ≥ 0 ur m ∈ M \ Fn (denn S0 = 0). 2 und Mn (m) = 0 f¨ Beweis von Satz 9.32: (Zur Beweisstrategie siehe Bemerkung 9.33.2) • Es gen¨ ugt, f¨ ur alle ε > 0 und 4 Fε+ := Fε+ (f ) := m ∈ M lim sup An f (m) > E(f | I)(m) + ε , n→∞
Fε− := Fε− (f ) := m ∈ M lim inf An f (m) < E(f | I)(m) − ε n→∞
zu zeigen, dass μ(Fε± ) = 0 gilt. Dies folgt schon aus μ(Fε+ ) = 0, denn Fε− (f ) = Fε+ (−f ). ˜ • F¨ ur f˜ := f − E(f | I) − ε ist E(f | I) = −ε, denn die bedingte Erwartung ist idempotent: E E(f | I) I = E(f | I). Also ist 4 + + ˜ ˜ Fε (f ) = Fε (f ) = m ∈ M lim sup An f (m) > 0 . (9.4.8) n→∞
• Wir setzen nun g := f˜ 1lFε+ Wegen der Φ-Invarianz von lim supn→∞ An g ist Fε+ ∈ I, also die Iterierten gk = g ◦ Φk von der Form gk = f˜k 1lFε+ . Wie im Beweis von Lemma 9.34 benutzen wir Mn g := max(S0 g, . . . , Sn g)
und Fn := {m ∈ M | Mn g(m) > 0}.
Da n → Mn monoton w¨achst, ist Fn ⊆ Fn+1 , und mit (9.4.8) 3 Fn = {m ∈ M | lim Mn g(m) > 0} n∈N
= m∈M = m∈M
n→∞
4 4 sup Sn g(m) > 0 = m ∈ M sup An g(m) > 0 n∈N n∈N 4 sup An f˜(m) > 0 und lim sup An f˜(m) > 0 = Fε+ (f˜). n→∞
n→∞
9. Ergodentheorie
197
• Die punktweise Konvergenz der Funktionen g 1lFn gegen g 1lFε+ = g und ihre Dominierung durch |g| ergibt nach dem Satz u ¨ber die dominierte Konvergenz lim E(g 1lFn ) = E(g).
n→∞
Nach dem Maximal–Ergodenlemma 9.34 ist E(g 1lFn ) ≥ 0, also auch E(g) ≥ 0. • Andererseits ist (mit Fε+ ∈ I und E(f˜| I) = −ε) E(g) = E(f˜ 1lFε+ ) = E E(f˜| I) 1lFε+ = −ε E(1lFε+ ) = −ε μ(Fε+ ), was nur f¨ ur μ(Fε+ ) = 0 mit E(g) ≥ 0 vereinbar ist.
2
9.35 Aufgabe (Birkhoffscher Ergodensatz f¨ ur Fl¨ usse) Sei (M, M, μ, Φ) ein maßerhaltendes dynamisches System mit kompaktem metrischen Raum M , Borel– σ–Algebra M, Wahrscheinlichkeitsmaß μ und stetigem Fluss Φ : R × M → M . Weiter sei f ∈ L1 (M, μ). Zeigen Sie, dass das Zeitmittel 1 t f (m) := lim f ◦ Φ(s, m) ds t→∞ t 0 f¨ ur μ–fast alle m ∈ M existiert, und außerdem f ∈ L1 (M, μ), M f dμ = f dμ und f (m) = f ◦ Φ(t, m) f¨ ur μ–fast alle m ∈ M und alle t ∈ R. M n
n−1 ur n ∈ N, Tipp: Zeigen Sie zun¨achst 0 f ◦ Φ(s, m) ds = k=0 F ◦ T k (m) f¨ 1 T := Φ(1, ·) und F (m) := 0 f ◦ Φ(s, m) ds. 3 9.36 Aufgabe (Normale reelle Zahlen) Beweisen Sie: F¨ ur Lebesgue–fast alle x ∈ [0, 1) ist die Frequenz, mit der in der Bin¨ardarstellung von x die 1 auftritt, gleich 12 . Tipp: Verwenden Sie die Abbildung T (x) := 2x (mod 1) auf [0, 1) und den birkhoffschen Ergodensatz 9.32 mit einer geeigneten Observablen. 3 9.37 Bemerkung (maßtheoretisch typische Dynamik) F¨ ur ein vorgegebenes dynamisches System Φ : Z × M → M gibt es auf dem Phasenraum M im Allgemeinen viele Φ–invariante Wahrscheinlichkeitsmaße. Zum Beispiel ist f¨ ur einen periodischen Punkt m ∈ M der Periode T das
T −1 Wahrscheinlichkeitsmaß T1 t=0 δΦt (m) invariant und ergodisch, und ebenso die Produktmaße aus Aufgabe 9.25. Entsprechend wird das vom Ergodensatz vorausgesagte typische Verhalten stark von der Wahl des Maßes abh¨angen. 3
9.5
Der poincar´ esche Wiederkehrsatz
Stellen wir uns einen Container C = CL ∪˙ CR ⊂ R3 mit einer Trennwand vor, die diesen in zwei Kammern teilt. Die linke Seite CL sei evakuiert, w¨ahrend die rechte ullt ist. Wir entfernen die Trennwand. Ohne die genauen Seite CR mit Luft gef¨
198
9.5. Der poincar´esche Wiederkehrsatz
Orte und Geschwindigkeiten der Gasmolek¨ ule zum Zeitpunkt der Trennung zu kennen, erwarten wir, dass sie nicht auf der rechten Seite bleiben, sondern sich auf beiden Seiten etwa gleich verteilen.
CL
CR
Niemand w¨urde intuitiv erwarten, dass sich die Luft zu einem sp¨ateren Zeitpunkt wieder in der rechten Containerh¨alfte versammelt. Genau das ist aber Konsequenz des folgenden Satzes: 9.38 Satz (Poincar´ escher Wiederkehrsatz, [Poi2]) Es sei Φ : Z × M → M ein das Maß μ auf M erhaltendes dynamisches System (siehe Definition 9.5). ˜ ⊆ M messbar, und M ˜ sei Φ–invariant mit μ(M ˜ ) < ∞. Weiter seien B ⊆ M Dann kehren μ–fast alle Punkte aus B unendlich oft nach B zur¨uck. 9.39 Bemerkungen (Poincar´ escher Wiederkehrsatz) ˜ := M . Ohne die Einschr¨ankung 1. Ist μ(M ) < ∞, dann setzt man einfach M ˜ μ(M ) < ∞ ist der Satz aber falsch, wie man schon am Beispiel der Translation Φt (x) := x + t auf M := R mit Lebesgue–Maß μ sieht. 2. Wenn wir einen Fluss Φ : R × M → M zu diskreten Zeiten t ∈ Z betrachten, k¨onnen wir den Satz auf das restringierte System anwenden. Im zeitdiskreten Fall ist es auch nat¨ urlicher, die umgangssprachliche Aussage x kehrt unendlich oft nach B zur¨ uck” im Sinn von ” {n ∈ N | Φn (x) ∈ B} = ∞ zu formalisieren.
3
Beweis: • Ist μ(B) = 0, so ist die Aussage offensichtlich, wenn man bedenkt, dass in der Maßtheorie ,fast alle’ alle 7 bis auf eine Menge vom Maß Null bedeutet. ∞ • Es sei also μ(B) > 0 und Kn := j=n Φ−j (B) (n ∈ N0 ). ˜ ⊇ Kn Kn ist als abz¨ahlbare Vereinigung messbarer Mengen messbar, und aus M ˜ folgt μ(Kn ) ≤ μ(M ) < ∞. Es gilt ˜ ⊃ K0 ⊇ K1 ⊇ . . . ⊇ Kn ⊇ Kn+1 ⊇ . . . . Kn+1 = Φ−1 (Kn ) und M B ∩ Kn ist die Menge der Punkte aus B die nach der Zeit n noch einmal nach B zur¨ uckkommen.
9. Ergodentheorie
199
• B ∩ (∩n∈N0 Kn ) ist die Menge der Punkte aus B, die nach beliebig langer Zeit noch einmal nach B wiederkehren, das heißt unendlich oft wiederkommen. Diese Menge ist als abz¨ahlbarer Schnitt messbarer Mengen messbar. Wir wollen nun zeigen, dass (9.5.1) μ B ∩ (∩n∈N0 Kn ) = μ(B) gilt. Wegen der Schachtelung der Kn ist : 3 8 ˙ K n = K0 n∈N0
n∈N0
Kn \ Kn+1 ,
also wegen der σ–Additivit¨at (9.1.2) von μ ∞ 8 Kn μ B ∩ (Kn \ Kn+1 ) . = μ(B ∩ K0 ) − μ B∩
(9.5.2)
n=0
n∈N0
Nun ist B ∩ K0 = B, und aus Kn ⊇ Kn+1 und μ(Kn+1 ) = μ Φ−1 (Kn ) = μ(Kn ) folgt μ(Kn \ Kn+1 ) = 0. Also impliziert (9.5.2) die Formel (9.5.1). 2 9.40 Beispiel (Statistische Mechanik und Reversibilit¨ at) Im Fall des Containers ist (R3 × C)n der Phasenraum der n Gasatome. Wir modellieren mit einer glatten Funktion V ∈ C ∞ (R3 , R) die Wechselwirkung zwischen den Atomen. Dann ist die Hamilton–Funktion von der Form H : (R3 ×C)n → R
,
H(p1 , q1 , . . . , pn , qn ) =
n
2 1 V 2 pk + k=1 1≤k
(ql −qk ).
Bei St¨oßen mit den Containerw¨anden setzen wir fest, dass die Teilchen reflektiert werden (Ausfallwinkel = – Einfallswinkel). Damit erhalten wir ein das Lebesgue– Maß erhaltendes dynamisches System 13 . ˜ := M := H −1 (E) mit dem (endWir betrachten nun eine Energiefl¨ache M lichen) Liouville–Maß μ und setzen in Satz 9.38: B := M ∩ (R3 × CR )n . Dies ist der Teil von M , in dem sich alle n Teilchen auf der rechten Seite befinden. Nat¨ urlich ist ein wichtiger Punkt beim Poincar´eschen Wiederkehrsatz, dass er keine Aussage u ¨ber die Wiederkehrzeiten macht. Im Fall des Containers ist die Wiederkehrzeit nach B (f¨ ur realistische Container C, Teilchenzahlen n und Energien E) gr¨oßer als das bisherige Alter des Universums. Dies ist f¨ ur die praktische G¨ ultigkeit der Statistischen Mechanik mit ihren Irreversibilit¨atsaussagen entscheidend. 3 9.41 Weiterf¨ uhrende Literatur Der eben bewiesene Satz geh¨ort wie auch der Satz 12.16 zur Ergodentheorie (also der Verkn¨ upfung der Theorie dynamischer Systeme mit der Maß– und Wahrscheinlichkeitstheorie). Ein gutes Buch u ¨ber Ergodentheorie ist Walters [Wa2]; Anwendungen auf Probleme der Klassischen Mechanik findet man in Arnol’d und Avez [AA] und in Bunimovich [Bu]. 3 13 Dieses
ist nicht stetig, es ist aber ein dynamisches System im maßtheoretischen Sinn.
Kapitel 10
Symplektische Geometrie q
t
p Kontaktstruktur der Kontaktform dt − p dq auf dem Erweiterten Phasenraum R3 10.1 10.2 10.3 10.4 10.5
Symplektische Mannigfaltigkeiten . . . . . Lie–Ableitung und Poisson–Klammer . . . Kanonische Transformationen . . . . . . . Lagrange–Mannigfaltigkeiten . . . . . . . . Erzeugende kanonischer Transformationen
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. 202 . 208 . 213 . 219 . 221
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 10,
201
202
10.1. Symplektische Mannigfaltigkeiten
Wenn man den Spezialfall linearer hamiltonscher Differentialgleichungen verl¨asst, wird die im Kapitel 6 untersuchte symplektische Bilinearform zur symplektischen Form, und Lagrange-Unterr¨aume werden zu Lagrange-Untermannigfaltigkeiten. Symplektische Mannigfaltigkeiten, also Mannigfaltigkeiten mit einer solchen Differentialform, besitzen eine besondere Geometrie. Ihre strukturerhaltenden Abbildungen heißen kanonisch.
10.1
Symplektische Mannigfaltigkeiten
Die bisher untersuchten dynamischen Systeme besaßen oft offene Teilmengen des Rn als Phasenr¨aume. Beginnend mit diesem Kapitel werden jetzt systematisch Phasenr¨aume untersucht, die allgemeiner differenzierbare Mannigfaltigkeiten (siehe Anh¨ange A.2 und A.3) sind. Dies geschieht aus drei Gr¨ unden: • Zum Ersten werden wir in der Mechanik wegen der Existenz von Konstanten der Bewegung in nat¨ urlicher Weise auf (Unter-)Mannigfaltigkeiten gef¨ uhrt. • Zum Zweiten tritt der geometrische Gehalt von Aussagen klarer hervor, wenn man sie (soweit m¨ oglich) f¨ ur Mannigfaltigkeiten formuliert und nicht im Rn . Denn in letzterem Fall rechnet man meistens doch in arithmetischen Koordinaten, und außerdem besitzt der Rn Zusatzstrukturen (er ist ein Vektorraum, besitzt eine kanonische Metrik etc.), von denen wir besser abstrahieren sollten. • Außerdem ist der Aufwand bei dieser Verallgemeinerung gering, und er wurde teils schon geleistet (etwa in Lemma 8.18 f¨ ur die Euler-Lagrange–Gleichung auf Tangentialb¨ undeln von Mannigfaltigkeiten). Der hamiltonsche Formalismus verwendet als Phasenraum statt dem Tangentialb¨ undel T M einer Mannigfaltigkeit M ihr Kotangentialb¨ undel T ∗ M . Diese stehen in einem Verh¨altnis wie ein Vektorraum und sein Dualraum: 10.1 Definition Sei M eine differenzierbare Mannigfaltigkeit. • Eine Eins–Form auf dem Tangentialraum Tx M von M bei x (also eine lineare Abbildung Tx M → R) heißt auch Kotangentialvektor von M bei x. • Der Dualraum von Tx M , also der lineare Raum Tx∗ M dieser Eins–Formen heißt auch Kotangentialraum von M bei x. 7 undel von M . • Die Vereinigung T ∗ M := x∈M Tx∗ M heißt Kotangentialb¨ Koordinaten. Wenn mit n := dim(M ) auf einer Umgebung U ⊆ M von x lokale Koordinaten q = (q1 , . . . , qn ) : U → Rn gegeben sind, wird eine Eins–Form p ∂ auf Tx M durch die n Zahlen p := p ∂q (x) festgelegt. Wir identifizieren dann in diesen Koordinaten p mit dem Vektor (p1 , . . . , pn ) und verwenden die B¨ undelkoordinaten (p, q) auf T ∗ U . Offensichtlich gilt auch dim(T ∗ M ) = 2 dim(M ). T ∗ M ist sogar diffeomorph zu T M (allerdings nicht kanonisch diffeomorph, siehe Seite 470).
10. Symplektische Geometrie
203
10.2 Bemerkung (Kotangentialb¨ undel als Phasenr¨ aume) Wir haben schon einige Beispiele von Kotangentialb¨ undeln T ∗ M kennengelernt, etwa 1. T ∗ Rn ∼ = Rn × Rn
(freie Bewegung)
2. T ∗ S 1 ∼ = R × S1
(planares Pendel)
3. T ∗ T2 ∼ = R × T2
(Doppelpendel).
Die Hamilton–Funktionen waren dabei glatte Abbildungen H : T ∗ M → R. Die rechte Seite der hamiltonschen Differentialgleichung war durch das von H induzierte hamiltonsche Vektorfeld XH gegeben. Bezeichnet man mit P := T ∗ M den Phasenraum, so ist XH insbesondere eine glatte Abbildung XH : P → T P in das Tangentialb¨ undel von P mit der Eigenschaft, dass πP ◦ XH : P → P die identische Abbildung ist, also ein Tangentialvektorfeld. Bez¨ uglich der lokalen (p, q)–B¨ undelkoordinaten besitzt XH die Komponenten XH =
∂H ∂H ∂H ∂H − ,··· ,− ; ,··· , ∂q1 ∂qn ∂p1 ∂pn
.
3
Die folgende koordinatenfreie Definition des hamiltonschen Vektorfelds erm¨oglicht ein besseres geometrisches Verst¨andnis. 10.3 Definition • Eine symplektische Form auf einer Mannigfaltigkeit P ist eine geschlossene (dω = 0) Zwei–Form ω auf P , die nicht degeneriert ist, das heißt f¨ ur alle x ∈ P und ξ ∈ Tx P \ {0} ∃η ∈ Tx P :
ω(ξ, η) = 0.
• (P, ω) heißt symplektische Mannigfaltigkeit. 10.4 Bemerkungen 1. Aus der Linearen Algebra ergibt sich, dass f¨ ur x ∈ P dim(Tx P ) gerade sein muss, damit die Zwei–Form nicht degeneriert ist. Das ist nat¨ urlich f¨ ur Phasenr¨aume P der Form P = T ∗ M der Fall. 2. Nicht jede geschlossene k–Form α (das heißt dα = 0) ist exakt (d.h. α = dβ f¨ ur eine (k − 1)–Form β). Falls ω exakt ist, heißt (P, ω) exakt symplektisch.
n 3. Im Fall P = T ∗ Rn haben wir die Zwei–Form ω0 := i=1 dqi ∧ dpi zur
n Verf¨ ugung. Es gilt ω0 = −dθ0 mit θ0 := i=1 pi dqi . 3 Wir wissen, dass eine beliebige (nicht notwendig antisymmetrische) nicht de¨ generierte Bilinearform einen Ubergang von Vektorfeldern zu Eins–Formen und umgekehrt erm¨oglicht. Angewandt auf die symplektische Zwei–Form ist der Zusammenhang durch die Gleichung ω(X, ·) = α
X Vektorfeld
,
α Eins–Form auf P,
gegeben. Wahlweise kann X aus α oder umgekehrt α aus X bestimmt werden.
204
10.1. Symplektische Mannigfaltigkeiten
10.5 Definition Ein Vektorfeld X : P → T P auf der symplektischen Mannigfaltigkeit (P, ω) heißt • hamiltonsch, wenn ω(X, ·) eine exakte Eins–Form ist, • lokal hamiltonsch, wenn die Eins–Form ω(X, ·) geschlossen ist. • F¨ ur eine stetig differenzierbare Funktion H : P → R heißt das Vektorfeld XH mit ω(XH , ·) = dH das von H erzeugte hamiltonsche Vektorfeld, und (M, ω, H) hamiltonsches System. 10.6 Beispiel Betrachten wir den Fall (P, ω) = (T ∗ Rn , ω0 ), so ergibt sich in (p, q)–Koordinaten mit XH =
n i=1
n
∂ ∂ (XH )i + (XH )n+i ∂pi ∂qi
dqi ∧ dpi (XH , ·) =
i=1
n
(XH )i+n dpi − (XH )i dqi
i=1
und dH =
n ∂H i=1
∂qi
dqi +
∂H dpi , ∂pi
durch Koeffizientenvergleich also (XH )i = −
∂H ∂qi
,
(XH )i+n =
∂H ∂pi
(i = 1, . . . , n),
das heißt die rechte Seite der hamiltonschen Gleichungen.
(10.1.1) 3
Warum, so kann man fragen, haben wir gerade ω0 benutzt? Tats¨achlich werden wir in Aufgabe 10.8 eine Formulierung der Bewegung eines Teilchens in einem Magnetfeld B kennenlernen, in der eine abge¨anderte symplektische Form ωB = ω0 verwendet wird. Trotzdem besitzt ω0 eine besondere Bedeutung, es l¨asst sich n¨amlich koordinatenfrei geometrisch definieren. Diese Definition l¨asst sich auf alle Phasenr¨aume P , die Kotangentialb¨ undel sind (P = T ∗ M ), u ¨bertragen. Wir bezeichnen mit ∗ πM :P →M
∗ , πM (Tq∗ M ) = {q}
(10.1.2)
die Fußpunktprojektion des Kotangentialb¨ undels P := T ∗ M von M . Wir wollen eine Eins–Form auf dem Phasenraum P definieren, deren ¨außere Ableitung uns dann die kanonische symplektische Form liefert. Eine solche Eins–Form θ0 ist durch ihre Anwendung auf ein beliebiges Tangentialvektorfeld Y : P → T P definiert. θ0 (Y ) : P → R ist dann eine Funktion auf dem Phasenraum. Betrachten wir einen Punkt x ∈ P des Phasenraums, so l¨asst sich dieser als ein Kotangentialvektor der Konfigurationsmannigfaltigkeit M am Fußpunkt
10. Symplektische Geometrie
205
∗ (x) auffassen. Ein solcher Kotangentialvektor wiederum l¨asst sich auf q := πM einen Tangentialvektor an M am gleichen Punkt anwenden. Verkn¨ upfen wir diese Beobachtungen, so l¨asst sich eine Eins–Form θ0 auf P durch * ) ∗ Y (x) (x ∈ P ) (10.1.3) θ0 (x), Y (x) := x, T πM ∗ definieren (Abbildung 10.1.1), denn die Tangentialabbildung T πM bildet Tan-
x
T ∗M q M
Tx M ∗ (Y (x)) T πM
Abbildung 10.1.1: Zur Definition der kanonischen symplektischen Form θ0 gentialvektoren des Phasenraums P in solche des Konfigurationsraumes M ab, die wiederum durch Paarung mit der Eins–Form x auf M in eine Zahl umgewandelt werden. Das folgende Diagramm von Mannigfaltigkeiten und Abbildungen kommutiert, T P −−−− → TM ∗ T πM ⏐ ⏐ ⏐ ⏐ πP πM π∗
P −−−M−→ M . d.h. die beiden verketteten Abbildungen von T P nach M sind einander gleich. 10.7 Definition • Die durch (10.1.3) definierte Differentialform θ0 auf dem Phasenraum P = T ∗ M heißt die kanonische Eins–Form, Liouville–Form oder tautologische Form. • ω0 := −dθ0 heißt die kanonische symplektische Form. In einer kanonischen B¨ undelkarte (p, q) : T ∗ U → Rnp × U von T ∗ M ist Y =
n i=1
∂ ∂ + Yi+n Yi ∂pi ∂qi
∗ )Y = und (T πM
n i=1
n
Yi+n
∂ . ∂qi
Der Vektor p l¨asst sich in der Form p = i=1 pi dqi schreiben, sodass wir θ0 =
n i=1 pi dqi erhalten. p ist aber eine Eins–Form auf M , θ0 hingegen eine Eins– Form auf P = T ∗ M !
206
10.1. Symplektische Mannigfaltigkeiten
Es gen¨ ugt also die Angabe einer (Hamilton–) Funktion H : T ∗ M → R auf dem Kotangentialb¨ undel einer Konfigurationsmannigfaltigkeit M , um auf diesem Phasenraum durch die Relation ω0 (XH , ·) = dH ein hamiltonsches Vektorfeld XH , und damit eine Differentialgleichung, zu definieren. 10.8 Aufgabe (Teilchen im Magnetfeld) Es sei B = (B1 , B2 , B3 ) ∈ C ∞ R3q , R3 ein ortsabh¨angiges Magnetfeld, das heisst ein divergenzfreies Vektorfeld, div(B) = 0. Die Zwei–Form ωB ∈ Ω2 (P ) auf dem Phasenraum P := R3q × R3v sei gegeben durch ωB := ω0 + B1 dq2 ∧ dq3 + B2 dq3 ∧ dq1 + B3 dq1 ∧ dq2 mit ω0 =
3
dqi ∧ dvi .
i=1
(a) Zeigen Sie, dass ωB eine symplektische Form auf P ist. (b) Berechnen Sie f¨ ur Vektorfelder X, Y : P → R6 die Funktion ωB (X, Y ) : P → R. (c) Berechnen Sie f¨ ur H : P → R, H(q, v) := 12 v 2 die Eins–Form dH und dH(Y ). Finden Sie die eindeutige L¨ osung XH der Gleichung ωB (XH , Y ) = dH(Y ), wobei Y : P → R6 beliebige Vektorfelder sind. (d) Schreiben Sie die hamiltonsche Differentialgleichung x˙ = XH (x) in Ortsund Geschwindigkeitskoordinaten x = (q, v) ∈ P . 3 Auf Kotangentialb¨ undeln kann man also auch von der kanonischen symplektiuber hinschen Zwei–Form ω0 verschiedene symplektische Formen benutzen Dar¨ aus ist nicht jede symplektische Mannigfaltigkeit (P, ω) ein Kotangentialb¨ undel, und es ist noch nicht einmal jede symplektische Mannigfaltigkeit exakt symplektisch: 10.9 Beispiel (Zwei–Torus) In lokalen (!) Winkelkoordinaten ϕ1 , ϕ2 ist die Fl¨achenform ω := dϕ1 ∧ dϕ2 eine symplektische Form auf dem zwei–Torus P := T2 . Es gilt P ω = 4π 2 = 0. Daher ist die symplektische Mannigfaltigkeit (P, ω) nicht exakt symplektisch, denn f¨ ur ω = −dΘ w¨are nach der Formel von Stokes (siehe Satz B.39) ω=− dΘ = − Θ = 0, P
P
∂P
da die kompakte Mannigfaltigkeit P = T2 ja keinen Rand besitzt (∂P = ∅). Allgemeiner besitzen alle orientierbaren und geschlossenen (das heißt kompakten und randlosen) Fl¨achen eine Fl¨achenform, also eine symplektische Form, aber diese ist aus dem gleichen Grund nicht exakt symplektisch. 3
10. Symplektische Geometrie
207
Es ist auch nicht jedes lokal hamiltonsche Vektorfeld hamiltonsch. 10.10 Beispiel (Bedingt-periodische Bewegung auf T2 ) Auf dem Phasenraum P = T2 sei f¨ ur a = (a1 , a2 ) ∈ R2 das Vektorfeld X : P → T P in lokalen Winkelkoordinaten gegeben durch ϕ = (ϕ1 , ϕ2 ) → (ϕ; a).
0
=
Π
2Π 2Π
2
Π
0
1
Abbildung 10.1.2: Lokal aber nicht global hamiltonsches Vektorfeld auf dem Torus T2 . Linke Darstellung: T2 ⊂ R3 , rechte Darstellung: T2 = R2 /2πZ2 X ist lokal hamiltonsch, denn die Eins–Form β := ω(X, ·) ist geschlossen: ∂ ∂ = a1 dϕ2 − a2 dϕ1 + a2 β = dϕ1 ∧ dϕ2 a1 ∂ϕ1 ∂ϕ2
, sodass
dβ = 0.
Aber es existiert f¨ ur a = 0 keine Funktion H : T2 → R mit β = dH, denn die Eins–Form β verschwindet nirgends, w¨ahrend eine Funktion H ∈ C 1 (T2 ) auf dem (kompakten!) Torus eine Maximalstelle x ∈ T2 hat und dort dH(x) = 0 gilt. Der Zeit-Eins-Fluss von X, die Translation ϕ → ϕ + a, wird auch nicht durch zeitabh¨angige hamiltonsche Vektorfelder erzeugt, siehe Beispiel 10.29.3. 3 10.11 Bemerkung (Kontaktmannigfaltigkeiten) Symplektische Mannigfaltigkeiten haben eine gerade Dimension. Es gibt aber eine ¨ahnlich wichtige geometrische Struktur auf gewissen ungerad–dimensionalen Mannigfaltigkeiten. Nach Definition ist eine Kontaktform auf einer Mannigfaltigkeit M der Diur die die (2n + 1)–Form θ ∧(dθ)∧n mension 2n + 1 eine Eins–Form θ ∈ Ω1 (M ), f¨ nirgends verschwindet. (M, θ) heißt dann Kontaktmannigfaltigkeit. 1. Ein Beispiel bietet der erweiterte Phasenraum M := T ∗ N × Rt eines Kotangentenb¨ undels (T ∗ N, θ0 ), mit der Liouville–Form θ0 aus (10.1.3). Bezeichnen wir die Projektionen mit π1 : M → T ∗ N und π2 : M → Rt , dann ist θ :=
π2∗ dt − π1∗ θ0 eine Kontaktform. Im Fall von N = Rnq ist also n θ = dt − k=1 pk dqk .
208
10.2. Lie–Ableitung und Poisson–Klammer
2. Ist g eine riemannsche Metrik auf N und H : T ∗ N → R von der Form ur h > H(p, q) = 12 gq (p, p) + V (q) mit einer Niveaufl¨ache M := H −1 (h) f¨ supq∈N V (q), dann ist die Restriktion von θ0 auf M eine Kontaktform. Denn f¨ ur n := dim(N ) ist dH ∧ θ0 ∧ (dθ0 )∧n−1 proportional zu (H − V ) (dθ0 )∧n , und damit bei M ⊂ T ∗ N nicht degeneriert. 3. Gleiches gilt nicht f¨ ur Energien h, die kleiner als das Supremum des Potentials
n V sind. Beispielsweise ist die Restriktion von θ0 = k=1 pk dqk keine Kontaktform f¨ ur die Energiefl¨achen M = H −1 (h) des harmonischen Oszillators H : R2n → R
, H(p, q) = 12 ( p 2 + q 2 ).
n Allerdings kann man hier θ := 12 k=1 (pk dqk − qk dpk ) benutzen, eine Eins– Form, deren Differenz zur Liouville–Form θ0 exakt ist. Dass θ auf M eine Kontaktform ist, wird analog zum obigen Fall 2 bewiesen. Durch den Kern von θ werden Hyperebenen in den Tangentialr¨aumen Tx M fixiert, die zusammengenommen eine geometrische Distribution auf M bilden (die sogenannten Kontaktdistribution). Das Besondere an θ ist, dass es maximal nichtintegrabel im Sinn von Frobenius (siehe Anhang F.3) ist. Das bedeutet insbesondere, dass die Kontaktdistribution nicht tangential an eine (2n)– dimensionale Untermannigfaltigkeit von M sein kann. Dies sieht man anschaulich am Beispiel der auf Seite 201 abgebildeten Kontaktdistribution des R3 . 3 10.12 Weiterf¨ uhrende Literatur Eine Einf¨ uhrung in die Kontaktgeometrie geben H. Geiges in [Ge] sowie V.I. Arnol’d und A. Givental in [AG]. 3
10.2
Lie–Ableitung und Poisson–Klammer La vie n’est bonne qu’`a deux choses: `a faire des math´ematiques ” ´on Poisson, nach Fran¸cois Arago 1 et `a les professer.” Sime
Im letzten Kapitel war der Begriff der symplektischen Mannigfaltigkeit (P, ω) eingef¨ uhrt worden. Dabei war P eine Mannigfaltigkeit und ω eine symplektische Zwei–Form, das heißt eine nicht degenerierte geschlossene Differentialform zweiter Stufe. Standardbeispiel ist
n (P, ω) = T ∗ Rnq , i=1 dqi ∧ dpi . Eine Hamilton–Funktion H : P → R induziert dann das hamiltonsche Vektorfeld XH , das durch die Relation ω(XH , ·) = dH definiert ist. Im Standardbeispiel gilt in (p, q)–Koordinaten ∂H ∂H , · · · , − ∂q ; XH = − ∂q 1 n 1 Fran¸ cois
∂H ∂p1 , · · ·
∂H , ∂p n
Arago: Notices biographiques, Band 2, Seite 662 (1854)
.
10. Symplektische Geometrie
209
ur Ein Vektorfeld, also insbesondere XH , erzeugt einen Fluss Φt , der zumindest f¨ kleine Zeiten lokal existiert. d (Φ∗t ω) = In der Mechanik hat der in Satz B.34 bewiesene Zusammenhang dt ∗ Φt LX ω zwischen Fluss und Lie–Ableitung nun folgende Konsequenz: 10.13 Satz Sei (M, ω, H) ein hamiltonsches System, und das hamiltonsche Vekur alle Zeiten t ∈ R torfeld XH erzeuge einen Fluss Φ : R × M → M . Dann gilt f¨ k ∈ {1, . . . , 12 dim M } . Φ∗t ω ∧k = ω ∧k Beweis: • Φ0 = IdM , also (mit Satz B.15.3) Φ∗0 ω∧k = ω∧k . d ∗ • dt Φt ω = Φ∗t LXH ω = Φ∗t (iXH d + diXH )ω = Φ∗t iXH ;<=> dω + ddH ;<=> = 0, also nach der Leibniz–Regel auch
d ∗ Φ dt t
ω ∧k =
d (Φ∗ ω dt ; t
0
0
∧ . . . ∧ Φ∗t ω ) = 0. <= >
2
k-mal
10.14 Bemerkungen 1. Hamiltonsche Fl¨ usse lassen also die symplektische Zwei–Form ω invariant. Da das den Fluss erzeugende Vektorfeld XH selbst mithilfe von ω definiert wurde, ist dies eine wichtige Konsistenz-Eigenschaft. Wie wir gesehen haben, folgt sie aus der zun¨achst unmotiviert erscheinenden Forderung der Geschlossenheit einer symplektischen Form. Dagegen wird f¨ ur exakte symplektische Zwei–Formen, also solche der Gestalt ω = −dΘ, die Eins–Form Θ im Allgemeinen nicht invariant gelassen. 2. Insbesondere ist die Volumenform ω ∧n mit n = Hamiltonsche Fl¨ usse sind also volumenerhaltend.
1 2
dim M Fluss-invariant.
ur Umgekehrt ist jeder volumenerhaltende Fluss auf R2 hamiltonsch. Denn f¨ das erzeugende Vektorfeld X ist dann ω(X, ·) geschlossen, also nach dem Poincar´e–Lemma (siehe Anhang B.7) exakt. Andererseits ist f¨ ur n > 1 nicht jeder volumenerhaltende Fluss auf R2n hamiltonsch. 3 Die Poisson–Klammer spielt eine wichtige Rolle in der Mechanik. 10.15 Definition Sei (M, ω) eine symplektische Mannigfaltigkeit und f, g ∈ C ∞ (M, R). Die Poisson–Klammer von f und g ist die Funktion {f, g} := ω(Xf , Xg ) ∈ C ∞ (M, R). 10.16 Satz Es gilt
(10.2.1)
{f, g} = −LXf g = +LXg f .
Beweis: −LXf g = −iXf dg = −iXf iXg ω = −ω(Xg , Xf ) = ω(Xf , Xg ).
2
Diese Beziehung zur Lie–Ableitung bedeutet, dass die Poisson–Klammer g →
210
10.2. Lie–Ableitung und Poisson–Klammer
{f, g} mit einer vorgegebenen Funktion f eine Ableitung (auch Derivation genannt) ist, das heißt die Leibniz–Regel und damit auch {f, G ◦ h} = G {f, h}
{f, gh} = {f, g}h + g{f, h}
f¨ ur stetig differenzierbare G : R → R gilt. 10.17 Satz f ∈ C ∞ (M, R) erzeuge einen hamiltonschen Fluss Φ auf M . Dann sind f¨ ur g ∈ C ∞ (M, R) ¨aquivalent: 1. {f, g} = 0 2. g ist konstant auf den Orbits von Φ. Beweis: Nach den S¨atzen B.34 und 10.16 gilt d dt g
◦ Φt =
d ∗ dt Φt g
= Φ∗t LXf g = −Φ∗t {f, g} .
2
10.18 Bemerkung In kanonischen Koordinaten (p1 , . . . , p
n , q1 , . . . , qn ), das n heißt Koordinaten, in denen die symplektische Form ω gleich i=1 dqi ∧ dpi ist, hat wegen (10.1.1) die Poisson–Klammer die Gestalt {f, g} =
n i=1
∂f ∂g ∂qi ∂pi
−
∂f ∂g ∂pi ∂qi
,
insbesondere {pi , pk } = {qi , qk } = 0 und {qi , pk } = δi,k , f¨ ur i, k = 1, . . . , n. 3 Da die Poisson–Klammer {f, g} selbst ein hamiltonsches Vektorfeld X{f,g} definiert, liegt da Frage nach dessen Verh¨altnis zu Xf und Xg nahe. Dazu ben¨otigen wir den Begriff der Lie–Klammer. Wenn wir mit (A.3.3) ein Vektorfeld X in lokalen Koordinaten (z1 , . . . , zn ) in der Form n ∂ X(z) = Xi (z) ∂z i i=1 geschrieben haben, machten wir Gebrauch von der durch die Lie–Ableitung von Funktionen gegebenen Isomorphie zwischen Vektorfeldern und Differentialoperatoren erster Ordnung. Nat¨ urlich ist dann ein Produkt von Lie–Ableitungen LX LY ein Differentialoperator zweiter Ordnung. Interessanterweise gilt aber: 10.19 Lemma Der Operator LX LY − LY LX ist ein Differentialoperator erster Ordnung.
10. Symplektische Geometrie
211
Beweis: In lokalen Koordinaten (z1 , . . . , zn ) ist ⎛ ⎞ n n n ∂ ⎝ ∂ϕ ⎠ ∂Yj ∂ϕ ∂2ϕ LX LY ϕ = Xi Yj = Xi + Xi Yj , ∂zi j=1 ∂zj ∂zi ∂zj ∂zi ∂zj i=1 i=1 j=1 n
also (LX LY − LY LX )ϕ =
n n ∂Yj ∂Xj ∂ϕ Xi − Yi . ∂zi ∂zi ∂zj i=1 j=1
2
Wir k¨onnen somit wegen der obigen Isomorphie definieren: 10.20 Definition Die Lie–Klammer oder der Kommutator zweier Vektorfelder X, Y : M → T M ist das mit [X, Y ] bezeichnete Vektorfeld auf M , f¨ ur das gilt: L[X,Y ] = LX LY − LY LX . In lokalen Koordinaten (z1 , . . . , zn ) gilt nach unserem Lemma: [X, Y ] =
n n j=1 i=1
∂Yj ∂Xj Xi − Yi ∂zi ∂zi
∂ . ∂zj
10.21 Satz Die von vollst¨andigen Vektorfeldern X und Y erzeugten Fl¨usse Φt und Ψs vertauschen genau dann, wenn [X, Y ] = 0, siehe Abbildung. Beweis: • Wenn f¨ ur alle s, t ∈ R
Ψs (z)
Φt ◦ Ψs (z) = Ψs ◦ Φt (z)
Φt ◦ Ψs (z) Ψs ◦ Φt (z)
ist, so gilt f¨ur alle Funktionen f ∈ C ∞ (M, R) L[X,Y ] f = LX LY f − LY LX f = d ∗ d ∗ d d Φt Ψs f − Ψ∗s Φ∗t f = 0. dt ds ds dt t=s=0 • Die R¨ uckrichtung ist zum Beispiel in Giaquinta und Hildebrandt [GiHi], §9.1.4 nachzulesen. 2
z
Φt (z)
Nicht kommutierende Fl¨ usse Φ und Ψ
10.22 Satz F¨ur Funktionen f, g ∈ C ∞ (M, R) auf einer symplektischen Mannigfaltigkeit (M, ω) gilt d{f, g} = −i[Xf ,Xg ] ω.
212
10.2. Lie–Ableitung und Poisson–Klammer
10.23 Bemerkung Der Kommutator der hamiltonschen Vektorfelder von f und g ist also selbst ein hamiltonsches Vektorfeld mit Hamilton–Funktion −{f, g}: X{f,g} = −[Xf , Xg ].
3
10.24 Lemma F¨ ur Vektorfelder X, Y : M → T M und k–Formen α auf M gilt i[X,Y ] α = LX iY α − iY LX α. Beweis: • F¨ ur Null–Formen ist die Relation trivial, denn das innere Produkt zwischen einer Funktion und einem Vektorfeld verschwindet. uglich der Eins– • F¨ ur ein lokales Koordinatensystem (z1 , . . . , zn ) auf M gilt bez¨ Formen α := dzk LX iY dzk − iY LX dzk = (LX LY zk − LX d iY zk ) − iY dLX zk ;<=> 0
=
LX LY zk − LY LX zk + d iY LX zk = L[X,Y ] zk = di[X,Y ] zk +i[X,Y ] dzk . ; <= > ; <= > 0
0
• Allgemeine Formen setzt man durch ¨außere Produkte aus Funktionen und Eins– 2 Formen dzk zusammen und benutzt (B.5.2). Beweis von Satz 10.22: Wegen dω = 0 ist d{f, g} = diXg iXf ω = LXg iXf ω − iXg diXf ω = LXg iXf ω − iXg LXf ω + iXg iXf dω = LXg iXf ω − iXf LXg ω = −i[Xf ,Xg ] ω, 2
denn LXf ω = LXg ω = 0.
Es ist also wesentlich die Geschlossenheit von ω in den Beweis des Satzes eingegangen. 10.25 Satz (Poisson–Klammer als Lie–Algebra) F¨ ur f, g, h ∈ C ∞ (M, R) gilt {f, g} = −{g, f } (Antisymmetrie) und {{f, g}, h} + {{g, h}, f } + {{h, f }, g} = 0
(Jacobi–Identit¨at)
.
(10.2.2)
Beweis: • Die Antisymmetrie der Poisson–Klammer folgt aus der Antisymmetrie von ω. • Es gilt {{f, g}, h} = −LX{f,g} h, {{g, h}, f } = −LXf LXg h
und {{h, f }, g} = +LXg LXf h,
also ist die linke Seite der Jacobi–Identit¨at gleich (LXg LXf − LXf LXg )h − LX{f,g} h = (L[Xg ,Xf ] + LX{g,f } )h = 0.
2
10.26 Bemerkung Damit ist f¨ ur eine symplektische Mannigfaltigkeit (M, ω) der R–Vektorraum C ∞ (M, R) mit der Poisson–Klammer eine Lie–Algebra (siehe Seite 514). 3
10. Symplektische Geometrie
10.3
213
Kanonische Transformationen
10.27 Definition • Es seien (P, ω) und (Q, ρ) symplektische Mannigfaltigkeiten mit dim(P ) = dim(Q). Eine Abbildung F ∈ C 1 (P, Q)
F ∗ρ = ω
mit
heißt symplektisch oder kanonische Transformation. • Ein symplektischer Diffeomorphismus F ∈ C 1 (P, Q) heißt Symplektomorphismus. • L¨aßt sich ein Symplektomorphismus F als L¨osung F = F1 der explizit zeitabd Ft = XHt ◦ Ft , F0 = IdP mit dem hamiltonh¨angigen Differentialgleichung dt schen Vektorfeld XHt einer zeitabh¨angigen Hamilton–Funktion Ht darstellen, heißt er hamiltonsch. 10.28 Bemerkungen 1. Die kanonischen Transformationen sind die strukturerhaltenden Abbildungen symplektischer Mannigfaltigkeiten, ¨ahnlich wie etwa die linearen Abbildungen die Struktur der Vektorr¨aume erhalten. 2. Die Symplektomorphismen von (P, ω) bilden eine Untergruppe der Diffeomorphismengruppe von P , die hamiltonschen wiederum eine Untergruppe der Symplektomorphismengruppe. 3. Die B¨ ucher [LiMa] von Libermann und Marle, McDuff und Salamon [MS], und von Hofer und Zehnder [HZ, Zeh] behandeln weitergehende geometrische und topologische Aspekte. 3 10.29 Beispiele 1. F¨ ur die symplektischen Mannigfaltigkeiten (P, ω) := (0, ∞) × R, r dr ∧ dϕ und (Q, ρ) := R2 , dx1 ∧ dx2 ist die Transformation auf Polarkoordinaten F (r, ϕ) := (r cos ϕ, r sin ϕ) eine kanonische Transformation (aber weder injektiv noch surjektiv). 2. Ist Φ : R × P → P ein hamiltonscher Fluss auf der symplektischen Mannigfaltigkeit (P, ω), dann sind nach Satz 10.13 die Φt Symplektomorphismen. 3. Die Translationen Φa : T2 → T2 , x → x + a (a ∈ T2 ) des Zwei-Torus T2 mit Fl¨achenform ω sind symplektisch, aber nur f¨ ur Φ0 = IdT2 hamiltonsch: d Ft = XHt ◦ Ft mit einem zeitabh¨angigen hamilF¨ ur F1 = Φa , F0 = IdT2 , dt tonschen Vektorfeld t → XHt (und der Identifikation T T2 ∼ = R2 × T2 ) ist 1 d aω = a = Ft (x) dt ω(x) F1 (x) − x ω(x) = dt 2 2 2 0 T T T 1 1 = XHt ◦ Ft (x) dt ω(x) = XHt ◦ Ft (x) ω(x) dt
T2 1
0
= 0
T2
XHt (x) ω(x) dt = J 0
0
1
T2
T2
∇Ht (x) ω(x) dt = 0.
214
10.3. Kanonische Transformationen
Denn nach dem Satz von Stokes (Satz B.39) ist das innere Integral Null. 3 10.30 Aufgabe (Kugel und Zylinder) Z := {x ∈ R | 3
x21
+
x22
2
Zeigen Sie, dass f¨ ur den Zylinder
= 1, |x3 | < 1}
die radiale Projektion auf die Sph¨are, also die Abbildung F : Z → S 2 , x → x1 1 − x23 , x2 1 − x23 , x3 ein Symplektomorphismus auf ihr Bild (also die Sph¨are außer den Polen) ist. Dabei werden die jeweiligen Fl¨achenformen der in den R3 eingebetteten Fl¨achen als symplektische Formen zugrunde gelegt. Zum Beispiel ist dies f¨ ur die Sph¨are ωx (Y, Z) := det(x, Y, Z) Y, Z ∈ Tx S 2 . 3 Lokal kann man in symplektischen Mannigfaltigkeiten immer die kanonischen Koordinaten aus Bemerkung 10.18 verwenden. Mit anderen Worten: lokal sehen alle symplektischen Mannigfaltigkeiten gegebener Dimension gleich aus: 10.31 Satz (Darboux) F¨ ur jeden Punkt x ∈ P einer 2n–dimensionalen symplektischen Mannigfaltigkeit (P, ω) gibt es eine Karte
n (U, ϕ) bei x mit Koordinaten ϕ = (p1 , . . . , pn , q1 , . . . , qn ), sodass ωU = i=1 dqi ∧ dpi . Beweis: • Wir arbeiten in den Bildern lokalen Karten bei x. Wir zeigen also, dass zu zwei offenen Umgebungen U0 , U1 von 0 ∈ R2n und symplektischen Formen ωk auf Uk Umgebungen Vk ⊆ Uk der Null und einen Diffeomorphismus F : V0 → V1 gibt mit ω0 V0 = F ∗ ω1 V1 . In den Beweisschritten verkleinern wir bei Bedarf die Umgebungen Uk , ohne die Umgebungen jeweils zu benennen. • Wir setzen voraus, dass durch eine lineare Abbildung schon bewirkt wurde, dass ω0 (0) = ω1 (0) ist. Der Lineare Satz von Darboux (Satz 6.13) sagt uns, dass das m¨ oglich ist. • Der Diffeomorphismus wird angesetzt als L¨ osung F = F1 einer zeitabh¨angigen d Ft = Xt ◦ Ft mit Anfangswert F0 = Id. Dieser wird sogar Differentialgleichung dt die Eigenschaft Ft (0) = 0 und DFt (0) = 1l haben. Das Vektorfeld Xt wird die Bedingung LXt ωt = ω0 − ω1 2 So
mit
ωt := (1 − t)ω0 + tω1
(10.3.1)
hieß ein 225 v. Chr. ver¨ offentlichtes Werk von Archimedes, in dem er unter anderem zeigte, dass Kugel und umschreibender Zylinder fl¨ achengleich sind. Cicero suchte als Qu¨ astor auf Sizilien das Grab des ermordeten Archimedes und glaubte es ge¨ funden zu haben. Uber dem Gestr¨ upp aber, bemerkte ich, erhob sich eine kleine S¨ aule, auf der ” sich die Figur einer Kugel und eines Zylinders befand.” (45 v. Chr., Tusculanae disputationes)
10. Symplektische Geometrie
215
besitzen. Dies bedeutet Ft∗ ωt = ω0 , denn F0∗ ω0 = ω0 und ∗ ∗ ∗ d d dt Ft ωt = Ft LXt ωt + dt ωt = Ft (0) = 0. Ft deformiert also die symplektische Form. • Auf einer kleinen Umgebung der Null ist ωt f¨ ur alle t ∈ [0, 1] eine symplektische Form. Denn ωt (0) ist konstant und nichtdegeneriert, und Nichtdegeneriertheit ist eine offene Bedingung. • Nach dem Poincar´e–Lemma (siehe Anhang B.7) ist in einer Kugel um die Null ur eine geeignete Eins–Form die geschlossene Form ω1 −ω0 exakt, also gleich dθ f¨ θ. Da ωt in (10.3.1) geschlossen ist, ist die Lie–Ableitung LXt ωt = diXt ωt , die Forderung ist also iXt ωt = θ (eventuell plus ein df ). Wegen der Nichtdegeneriert von ωt l¨asst sich diese erf¨ ullen. Durch Addition eines geeigneten df zu θ normie2 ren wir auf θ(0) = 0, also Xt (0) = 0, das heißt Ft (0) = 0. Im Rest dieses Kapitels beschr¨anken wir uns der Einfachheit halber auf symplektische Mannigfaltigkeiten, die Kotangentialb¨ undel (P, ω) = (T ∗ M, ω0 ) einer Mannigfaltigkeit M sind (mit der kanonischen symplektischen Form ω0 = −dθ0 aus Definition 10.7). Diese besitzen eine besondere Klasse kanonischer Transformationen: 10.32 Definition F¨ ur einen Diffeomorphismus f ∈ C 1 (M, N ) heißt die Abbildung T ∗ f : T ∗ N → T ∗ M , T ∗ f (βn ), v := βn , T f (v) βn ∈ Tn∗ N , v ∈ Tm M , mit n := f (m), die Kotangentialabbildung oder der Kotangentiallift von f . 10.33 Bemerkungen 1. Da die Ableitungen von f bei m ∈ M , also die linearen Abbildungen Tm f : Tm M → Tn N surjektiv sind, sind die Abbildungen ∗ Tn∗ f := T ∗ f Tn∗ N : Tn∗ N → Tm M
(n ∈ f (M ) ⊆ N )
Isomorphismen der Kotangentialr¨aume. Da f selbst surjektiv ist, ist Tn∗ f f¨ ur alle n ∈ N definiert. 2. Das ist also der duale Begriff zur in Definition A.41 eingef¨ uhrten Tangentialabbildung T f : T M → T N . Das nebenstehende Diagramm (mit der in ∗ (10.1.2) definierten Fußpunktprojektion πM ) T ∗f kommutiert. T ∗ N −−−−→ T ∗ M ⏐ ⏐ Man beachte aber, dass die Tangentialabbil⏐π∗ ∗ ⏐ πM M dung (anders als die Kotangentialabbildung) 1 auch f¨ ur Abbildungen f ∈ C (M, N ) defif −1 N −−−−→ M niert ist, die keine Diffeomorphismen sind. Außerdem gilt f¨ ur Diffeomorphismen g : L → M und f : M → N T (f ◦ g) = T f ◦ T g
, aber T ∗ (f ◦ g) = T ∗ g ◦ T ∗ f.
(10.3.2)
216
10.3. Kanonische Transformationen
3. In der Klassischen Mechanik heißen diese Abbildungen auch Punkttransformationen. 3 10.34 Beispiel eines Gradientenflusses) Auf der Kreislinie (Kotangentiallift sin ϕ S 1 = cos | ϕ ∈ [−π, π] erzeugt die H¨ ohenfunktion ϕ sin ϕ h : S 1 → R, cos → cos ϕ ϕ das an S 1 tangentiale Gradientenvektorfeld (siehe Seite 90) sin ϕ cos ϕ ∇h cos = sin ϕ −sin . ϕ ϕ Π
Der (anschaulich der Schwerkraft entΠ 2 gegengerichtete!) Gradientenfluss x˙ = ∇h(x) entspricht damit der Differential1 2 gleichung ϕ˙ = − sin ϕ. Diese besitzt die Π2 L¨osung (siehe Abbildung) Π ft (ϕ) = 2 arccot et cot(ϕ/2) (t ∈ R). Der Kotangentiallift T ∗ ft (p, ϕ) = (cosh(t) + sinh(t) cos(ϕ)) p , f−t (ϕ) des Diffeomorphismus ft ist eine
t
fl¨achenerhaltende Abbildung des Zylinders R × S 1 ∼ = T ∗S 1. In der nebenstehenden Abbildung sieht man den (durchsichtigen) Zylinder [−1, 1] × S 1 und sein Bild unter dem Kotangentiallift T ∗ f1 . 3 10.35 Satz (Kotangentiallift) Der Kotangentiallift T ∗ f eines Diffeomorphismus f ∈ C 1 (M, M ) l¨asst die tautologische Eins–Form θ0 auf T ∗ M invariant, das heißt (T ∗ f )∗ θ0 = θ0 . Beweis: In lokalen Vektorb¨ undelkoordinaten (p, q) und (P, Q) mit Q := f (q) ist −1 p = Df (q) P , also P = Df (q) p und - . −1 θ0 = P, dQ = Df (q) p, Df (q) dq = p, dq = (T ∗ f )∗ θ0 . Dabei wurde die Kurzschreibweise P, dQ :=
dim M i=1
Pi dQi benutzt.
2
Damit sind Kotangentiallifte insbesondere symplektisch. Eine weitere Klasse symplektischer Abbildungen bilden gewisse Fasertranslationen: 10.36 Definition Eine Fasertranslation eines Kotangentialb¨undels T ∗ M ist eine Abbildung transA : T ∗ M → T ∗ M , transA (p) = p + A(q) q ∈ M, p ∈ Tq∗ M , mit einer Eins–Form A ∈ Ω1 (M ).
10. Symplektische Geometrie
217
10.37 Satz Eine Fasertranslation transA ist genau dann symplektisch, wenn A geschlossen ist (dA = 0) und hamiltonsch, wenn A exakt ist (A = dh). Beweis: • In lokalen kanonischen Koordinaten (p, q) wird die symplektische Form
dq ∧dp durch pull-back mit der Fasertranslation von A(q) = A (q)dq k k k k k k
in k dqk ∧ d pk − Ak (q) transformiert. Sie ¨andert sich also um dA. ∗ • Ist A = dh, dann erzeugt der Lift H = h ◦ πM : T ∗ M → R von h : M → ∗ R einen hamiltonschen Fluss Φ : R × T M → T ∗ M mit Φ−1 = transA . Koordinaten gleich Denn hamiltonsche XH ist in den lokalen
das
Vektorfeld ∂h ∂ ∂ − k ∂q (q) = − A (q) , also Φ (p, q) = p − tA(q), q . 2 k t k ∂pk ∂pk k Wie bei allen Transformationen k¨ onnen wir auch bei den kanonischen den aktiven oder den passiven Standpunkt einnehmen. Im ersten Fall interessieren wir uns daf¨ ur, wie Phasenraumpunkte durch F aufeinander abgebildet werden, im zweiten, wie ein Koordinatensystem (etwa die Koordinaten (p1 , . . . , pn , q1 , . . . , qn ) auf dem Vektorraum Rnp × Rnq ) durch F ∗ zu einem neuen Koordinatensystem wird. Eine wichtige Motivation f¨ ur die Anwendung kanonischer Transformationen besteht in der L¨osung der hamiltonschen Differentialgleichung p˙i = −
∂H ∂qi
, q˙i =
∂H ∂pi
(i = 1, . . . , n).
Es kann n¨amlich sein, dass in einem neuen Koordinatensystem (P, Q) die Differentialgleichungen eine einfachere Form besitzen, sodass wir sie l¨osen k¨onnen. Dabei stellt sich heraus, dass es sich lohnt, nicht irgendwelche neue Koordinaten X1 , . . . , X2n zu benutzen, sondern solche, in denen die Form der hamiltonschen Gleichung erhalten bleibt. Daher empfehlen sich zum Koordinatenwechsel kanonische Transformationen. F¨ ur eine gegebene Hamilton–Funktion H : P := T ∗ M → R betrachten wir unter Verwendung der in Definition 10.7 eingef¨ uhrten kanonischen Eins–Form θ0 auf P die Eins–Form ΘH := π1∗ θ0 − H dt auf dem erweiterten Phasenraum P × Rt . Rt repr¨asentiert dabei die Zeitachse, und π1 : P × Rt → P die Projektion auf den ersten Faktor P . Es gilt wegen dθ0 = −ω0 dΘH = −π1∗ ω0 − dH ∧ dt Diese Zwei–Form muss degeneriert sein, denn sie ist ja eine antisymmetrische ur Bilinearform auf dem ungerad-dimensionalen Raum P × Rt . Insbesondere ist f¨ ˜ H auf P × Rt das Vektorfeld X ˜ H (x, t) := XH (x) + ∂ X ∂t iX˜ H dΘH = −dH + dH = 0. Andererseits gilt:
(10.3.3)
218
10.3. Kanonische Transformationen
10.38 Lemma Gilt f¨ ur ein Vektorfeld W auf P × Rt dΘH (W, ·) ≡ 0, ˜ H aus so ist f¨ ur eine geeignete Funktion f auf P × Rt und das Vektorfeld X (10.3.3) ˜H . W =f X Beweis: Die lokale Form eines Vektorfeldes auf P × Rt ist W =
n i=1
ai
∂ ∂ + bi ∂qi ∂pi
+c
∂ . ∂t
Damit ist die Eins–Form dΘH (W, ·) gleich
n % ∂H ∂H ∂H i=1 −ai dpi + bi dqi − ∂pi bi + ∂qi ai dt + c ∂qi dqi +
∂H ∂pi dpi
& .
∂H Ist diese Null, so ergibt sich durch Koeffizientenvergleich ai = +c ∂p und bi = i ∂H ˜ 2 −c ∂qi (i = 1, . . . , n), also W = f XH mit f = c.
An jedem Punkt x von P × Rt existiert im lokalen Tangentialraum Tx (P × Rt ) also ein genau eindimensionaler Unterraum von Vektoren, die, in dΘH eingesetzt, eine verschwindende Eins–Form ergeben. Folgen wir diesen Richtungen, so erhalten wir Kurven c : I → P × Rt , die wir sogar so w¨ahlen k¨ onnen, dass sie durch t parametrisiert sind; diese Linien heißen charakteristische oder Vortexlinien c(t) = p1 (t), . . . , pn (t), q1 (t), . . . , qn (t), t (t ∈ I). Es gilt dann nach Lemma 10.38: p˙i = − ∂H ∂qi und q˙i = Differentialgleichungen.
∂H ∂pi ,
also die hamiltonschen
10.39 Satz Wenn der Koordinatenwechsel (p, q) → P (p, q), Q(p, q) auf dem Phasenraum M ⊆ Rnp × Rnq eine kanonische Transformation g : M → RnP × RnQ vermittelt, so transformieren sich die hamiltonschen Differentialgleichungen ∂H p˙i = − ∂H ∂qi , q˙i = ∂pi von H : M → R in ∂K P˙ i = − ∂Qi
,
∂K Q˙ i = ∂Pi
, mit
K P (p, q), Q(p, q) = H(p, q).
n Beweis: Betrachten wir die Eins–Form α := i=1 (pi dqi − Pi dQi ) auf dem Kartengebiet in M . Es ist dα = 0, da g kanonisch ist. Damit gilt auf dem erweiterten Phasenraum π1∗
n i=1
pi dqi − Hdt = π1∗
n i=1
Pi dQi − Hdt + π1∗ α.
10. Symplektische Geometrie
219
Wenn man von der rechten Seite π1∗ α abzieht, so bleiben die Vortexlinien die gleichen, denn diese h¨angen ja nur von der ¨außeren Ableitung ab, und dπ1∗ α = π1∗ dα = 0. Da die Vortexlinien sich gleichen, ist auch die Gestalt der hamiltonschen Gleichung dieselbe. 2 Nicht nur die Hamilton–Funktion, die die Bewegungsgleichungen erzeugt, transformiert sich unter einer kanonischen Transformation in einfacher Weise, sondern auch die Poisson–Klammern: 10.40 Satz Der Diffeomorphismus F : P → Q sei eine kanonische Transformation der symplektischen Mannigfaltigkeiten (P, ω) und (Q, ρ). Dann gilt (unter Benutzung des pull-back 3 F ∗ ) f¨ ur f, g ∈ C ∞ (Q, R) F ∗ Xf = XF ∗ f und F ∗ {f, g}Q = {F ∗ f, F ∗ g}P . Beweis: • Die erste Identit¨at folgt wegen der Nichtdegeneriertheit von ω aus iF ∗ Xf ω = iF ∗ Xf F ∗ ρ = F ∗ (iXf ρ) = F ∗ (df ) = d(F ∗ f ) = iXF ∗ f ω. • Die zweite Identit¨at folgt aus der ersten: F ∗ {f, g}Q = F ∗ iXg iXf ρ = = iF ∗ Xg iF ∗ Xf F ∗ ρ = iXF ∗ g iXF ∗ f ω = {F ∗ f, F ∗ g}P .
10.4
2
Lagrange–Mannigfaltigkeiten Symplectic Creed: Everything is a Lagrange manifold.” ” Alan Weinstein, in [Wein]
Die hamiltonschen Bewegungsgleichungen unterscheiden sich von anderen Systemen gew¨ohnlicher Differentialgleichungen durch die Tatsache, dass die in ihnen steckende Information in einer einzigen Funktion, der Hamilton–Funktion, codiert ¨ ist. Ahnlich (wenn auch mit gewissen Einschr¨ankungen) lassen sich kanonische Transformationen mithilfe einer einzigen, der sogenannten erzeugenden, Funktion darstellen. Um diese Darstellungsweise zu verstehen, f¨ uhren wir den Begriff der Lagrange–Mannigfaltigkeit ein. Erinnern wir uns zun¨achst an die Definition der Lagrange–Unterr¨aume L ⊂ E eines symplektischen Vektorraums (E, ω) in Kapitel 6.4: Diese sind isotrop (d.h. ω verschwindet auf L) und von maximaler Dimension (dim(L) = 12 dim(E)). Dieser Begriff l¨aßt sich ohne Schwierigkeiten von symplektischen Vektorr¨aumen auf symplektische Mannigfaltigkeiten u ¨bertragen: 10.41 Definition Sei (P, ω) eine symplektische Mannigfaltigkeit und I : L → P die Einbettung einer Untermannigfaltigkeit L.4 3 Definition: Der pull-back F ∗ X eines Vektorfeldes X : Q → T Q auf einer Mannigfaltigkeit Q bez¨ uglich eines Diffeomorphismus F : P → Q ist das durch F ∗ X := T (F −1 ) ◦ X ◦ F definierte Vektorfeld auf P . 4 Untermannigfaltigkeiten von Mannigfaltigkeiten P definiert man analog zum Fall P = Rn (Definition 2.34).
220
1 2
10.4. Lagrange–Mannigfaltigkeiten
L heißt isotrop, wenn I ∗ ω = 0 und lagrangesch, wenn außerdem dim L = dim P .
10.42 Beispiele 1. F¨ ur dim P = 2 ist jede eindimensionale Untermannigfaltigkeit L lagrangesch, da I ∗ ω eine Zwei–Form auf L und damit I ∗ ω = 0. 2. Es sei dim P = 2n und F1 , . . . , Fn ∈ C ∞ (P, R). f ∈ F (P ) sei ein regul¨arer Wert von F 1 .. F := : P → Rn . . Fn
Dann ist L := F
−1
(f ) eine n–dimensionale Untermannigfaltigkeit von P .
ur i, k ∈ {1, . . . , n}, so ist L lagrangesch. Gilt {Fi , Fk } = 0 f¨ Denn wegen der Regularit¨at ist f¨ ur x ∈ L die n-Form dF1 ∧ . . . ∧ dFn (x) = 0, ur x ∈ L die hamiltonschen und wegen der Relation iXFi ω = dFi sind f¨ Vektorfelder XF1 , . . . , XFn bei x ∈ L linear unabh¨angig. Außerdem sind sie tangential an L, denn dFi (XFk ) = iXFk dFi = iXFk iXFi ω = {Fi , Fk } = 0. Da dim(Tx L) = n ist, spannen die Vektoren XF1 (x), . . . , XFn (x) den Tangentialraum Tx L von L bei x auf.
Tangentialvektorfelder Y, Z an L k¨onnen n also als Linearkombinationen Y = i=1 Yi · XFi mit Funktionen Yi : L → R und entsprechend f¨ ur Z geschrieben werden. Daher gilt ω(Y, Z) = 0, also I ∗ ω = 0, das heißt L ist isotrop und wegen dim(L) = n lagrangesch. 3. Sei M eine n–dimensionale Mannigfaltigkeit und P := T ∗ M ihr Kotangentialb¨ undel. Dann existieren auf P die in Definition 10.7 eingef¨ uhrte kanonische Form ω = Eins–Form θ0 und die kanonische symplektische 0 −dθ0 .
F¨ ur das Beispiel M = Rnq ist θ0 = ni=1 pi dqi und ω0 = ni=1 dqi ∧ dpi . Wir betrachten eine Eins–Form α auf M . Der Graph L von α ist eine n–dimensionale Untermannigfaltigkeit L ⊂ P .
Abbildung 10.4.1: Lagrange-Untermannigfaltigkeit als Graph einer geschlossenen Eins–Form
10. Symplektische Geometrie
221
Wir k¨onnen also mittels der als Abbildung α ˆ : M → L ⊂ P aufgefassten uckholen, und es ist Eins–Form α die kanonische Eins–Form θ0 zur¨ α ˆ ∗ θ0 = α.
(10.4.1)
Denn wegen der Definition (10.1.3) von θ0 gilt (unter Verwendung der Fuß∗ : T ∗M → M ) punktprojektion πM ) * ) * ∗ θ0 (ˆ α(q)) , ζ = α(q) , T πM (ζ) ζ ∈ Tα(q) P , ˆ ∗ ◦α ˆ = IdM f¨ ur vq ∈ Tq M folgt: woraus mit πM * ) * ) ∗ * ) ∗ α(q)) , T (ˆ α)(vq ) = α(q) , T (πM ) ◦ T (ˆ α)(vq ) α ˆ θ0 (q) , vq = θ0 (ˆ ∗ = α(q), T (πM ◦α ˆ )(vq ) = α(q), T IdM (vq ) = α(q), vq .
Die ¨außere Ableitung von (10.4.1) ist ˆ ∗ dθ0 = −ˆ α ∗ ω0 , dα = dˆ α ∗ θ0 = α L = graph(α) ist also genau dann lagrangesch, wenn α geschlossen ist.5 3 Ganz analog zum linearen Fall (Satz 6.49) ergibt sich folgende Aussage: 10.43 Satz Sei F : M1 → M2 ein Diffeomorphismus der symplektischen Mannigfaltigkeiten (Mi , ωi ). Dann ist F genau dann symplektisch, wenn der Graph ΓF := x, F (x) | x ∈ M1 ⊂ M1 × M2 von F lagrangesch ist bez¨ uglich der symplektischen Form ω1 & ω2 auf M1 × M2 . Beweis: Der Tangentialraum T(x,F (x)) ΓF von ΓF am Punkt x, F (x) ist von der Form T(x,F (x)) ΓF = v, T F (v) | v ∈ Tx M1 . Daher gilt f¨ ur die Einbettung I : ΓF → M1 × M2 und ω := ω1 & ω2 (siehe (6.48)) (I ∗ ω) (v1 , T F (v1 )) , (v2 , T F (v2 )) 2 = ω1 (v1 , v2 ) − ω2 T F (v1 ), T F (v2 ) = ω1 − F ∗ ω2 (v1 , v2 ).
10.5
Erzeugende kanonischer Transformationen
Wir werden nun zeigen, dass sich kanonische Transformationen zumindest lokal mithilfe einer einzigen Funktion, der sogenannten Erzeugenden der kanonischen Transformation darstellen lassen. 5 Vergleiche
mit dem Satz 10.37 u ¨ber Fasertranslationen.
222
10.5. Erzeugende kanonischer Transformationen
Wir wissen aus Satz 10.43, dass die Graphen kanonischer Transformationen Lagrange–Untermannigfaltigkeiten sind. Sei daher (M, ω) eine symplektische Mannigfaltigkeit und I : L → M eine Lagrange–Untermannigfaltigkeit. Nach dem Poincar´e-Lemma (siehe Anhang B.7) gibt es f¨ ur alle x ∈ P eine Umgebung U ⊂ P von x und eine Eins–Form θ auf U mit ωU = −dθ. Ist nun x ∈ L, dann ist wegen 0 = I ∗ ωU = −I ∗ dθ = −dI ∗ θ I ∗ θ geschlossen. Damit existiert auf einer geeigneten Umgebung V ⊂ L von x eine Funktion S : V → R mit −I ∗ θV = dS. Eine solche Funktion wird eine erzeugende Funktion f¨ ur L genannt. Betrachten wir nun speziell den Fall einer kanonischen Transformation F von (M1 , ω1 ) nach (M2 , ω2 ), wobei diese symplektischen Mannigfaltigkeiten exakt symplektisch seien, das heißt ωi = −dθi . Dann ist die symplektische Mannigfaltigkeit (M, ω), M := M1 × M2 und ω := ω1 & ω2 ebenfalls exakt symplektisch: ω = −dθ
mit
θ := θ1 & θ2 = π1∗ θ1 − π2∗ θ2
auf M.
Nach Satz 10.43 ist der Graph ΓF ⊂ M eine Lagrange–Untermannigfaltigkeit. Zumindest lokal (also durch Restriktion von F auf eine geeignete Umgebung onnen wir also eine erzeugende Funktion S finden mit U1 ⊂ M1 von m1 ∈ M1 ) k¨ I ∗ θ = −dS. Wir benutzen lokale kanonische Koordinaten (P, Q) = (P1 , . . . , Pn , Q1 , . . . , Qn ) auf U1 und (p, q) = (p1 , . . . , pn , q1 , . . . , qn ) auf U2 := F (U1 ) ⊆ M2 , wobei F (P, Q) = (p, q) gelte. Nach dem Satz von Darboux 6.13) k¨onnen wir
(Satz
nannehmen, dass auf n U1 beziehungsweise U2 gilt: θ2 = i=1 pi dqi und θ1 = i=1 Pi dQi , sodass Pi dQi − pi dqi . θ= i
F¨ ur n = 1 l¨aßt sich die kanonische Transformation in mindestens zwei der folgenden vier angegebenen Formen schreiben, denn mindestens zwei Eintr¨age in DF (P, Q) ∈ Mat(2, R) verschwinden nicht: 1. Wir schreiben S als Funktion S1 (q, Q) von (q1 , . . . , qn , Q1 , . . . , Qn ).
∂S1 1 Aus dS1 = −I ∗ θ1 folgt dS1 = i ( ∂S i (pi dqi − Pi dQi ), ∂qi dqi + ∂Qi dQi ) = also ∂S1 ∂S1 , Pi = − (i = 1, . . . , n). pi = ∂qi ∂Qi
10. Symplektische Geometrie
223
2. Wenn S als Funktion S2 (q, P ) angesetzt wird, empfiehlt es sich, zu θ1 eine exakte Form zu addieren:
dS2 = −I ∗ θ2 mit θ2 := θ1 −d ( i Qi Pi ) = i (−Qi dPi −pi dqi ) , also Qi =
∂S2 ∂Pi
,
pi =
∂S2 ∂qi
(i = 1, . . . , n).
3.
Setzen wir S als S3 (p, Q) an, so ergibt sich mit θ3 := θ1 + i Pi dQi + qi dpi Pi = −
∂S3 ∂Qi
, qi = −
∂S3 ∂pi
i
d(pi qi ) =
(i = 1, . . . , n).
4. F¨ ur θ4 := θ1 + d ( −Qi Pi + qi pi ) = i −Qi dPi + qi dpi erf¨ ullt S, ausgedr¨ uckt durch S4 (p, P ), −dS4 = I ∗ θ4 , also qi = −
∂S4 ∂pi
, Qi =
∂S4 ∂Pi
(i = 1, . . . , n)
(k = 1, 2, 3, 4). F¨ ur alle vier F¨alle gilt gleichermaßen ω = −dθk Allgemein ist dim(M1 × M2 ) = 4n. Mindestens eines der Koordinaten–2n– Tupel l¨aßt sich in diesem Fall zur lokalen Darstellung der kanonischen Transformation verwenden. Das Argument findet sich in Lemma 1 auf Seite 276 von Hofer und Zehnder, [HZ]. 10.44 Beispiel (Polarkoordinaten und harmonischer Oszillator) F¨ ur ω > 0 pω p cos(2πq), sin(2πq) ist und F : R+ × R → R2 , (p, q) → (P, Q) = π πω + + 1 πp 1 sin(2πq)dp + 2 cos(2πq)dq ∧ dQ ∧ dP = 2 πωp ω + √ ω 1 cos(2πq)dp − 2 pωπ sin(2πq)dq 2 pπ = dq ∧ dp, also der (lokale) Diffeomorphismus fl¨achenerhaltend. F¨ ur S1 (q, Q) := − ω2 Q2 cot(2πq) ist ∂S1 ∂q
=
πωQ2 sin2 (2πq)
und
∂S1 = −Qω cot(2πq). ∂Q
Damit erzeugt S1 die kanonische Transformation F : P ∂S1 = ω cot(2πq) , also P = − , Q ∂Q ∂S1 Q2 p , also p = . = 2 πω ∂q sin (2πq)
224
10.5. Erzeugende kanonischer Transformationen
Betrachten wir H(P, Q) := 12 (P 2 +ω 2 Q2 ), so transformiert sich diese Hamilton– Funktion in ω p. K(p, q) := 2π Die Bewegungsgleichungen sind dann linearisiert: q˙ =
ω 2π
3
, p˙ = 0.
10.45 Aufgabe (Darstellung des Flusses mit erzeugenden Funktionen) (a) Zeigen Sie, dass f¨ ur die Hamilton–Funktion des harmonischen Oszillators H0 : R 2 → R
, H0 (p, q) = 12 (p2 + q2 )
und Zeiten t ∈ (−π/2, π/2) die L¨ osung (pt , qt ) in der Form pt = p0 − t D2 Ht (p0 , qt )
, qt = q0 + t D1 Ht (p0 , qt )
(10.5.1)
dargestellt werden kann, mit der H0 erg¨anzenden erzeugenden Funktion / 0? cos(t) − 1 sin(t) 2 Ht (p, q) := cos(t) 0 < |t| < π/2 . p + q2 + pq 2t t (b) Verallgemeinern Sie dieses Ergebnis in dem Sinn, dass f¨ ur jede quadratische Hamilton–Funktion H0 : R2n → R eine Zeit T > 0 und erzeugende Funktionen Ht , |t| < T existieren, so dass die zu (10.5.1) analoge Beziehung gilt. Berechnen Sie Ht aus der L¨ osung (mit Ht (0) := 0). Schließen Sie, dass (t, p, q) → Ht (p, q) auch bei t = 0 glatt ist. (c) Zeigen Sie, dass der anharmonische Oszillator mit Hamilton–Funktion H0 : R2 → R , H0 (p, q) = 12 p2 + q2 + q 4 zwar ein dynamisches System definiert, eine zu (10.5.1) analoge Beziehung aber f¨ ur kein t = 0 auf dem ganzen Phasenraum gilt. 3
Kapitel 11
Bewegung im Potential
11.1 Allgemein gultige ¨ Eigenschaften . . . . . . . . . . . . . . . 226 11.2 Bewegung im periodischen Potential . . . . . . . . . . . . 228 11.3 Himmelsmechanik . . . . . . . . . . . . . . . . . . . . . . 238
Diese Klasse hamiltonscher Bewegungen ist die wichtigste. Sie umfasst sowohl elektrostatische wie gravitative Kraftfelder. Mit dem Spezialfall der geod¨atischen Bewegung teilt sie die Eigenschaft der Reversibilit¨at, und sie l¨asst sich oft gut mit dieser vergleichen. Entsprechend wurden viele geometrische Techniken zur Analyse der Potential-Dynamik entwickelt. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 11,
225
226
11.1
11.1. Allgemein g¨ ultige Eigenschaften
Allgemein g¨ ultige Eigenschaften
In diesem Kapitel betrachten wir hamiltonsche Systeme auf dem Phasenraum 1 P := Rdp ×Rdq , deren Hamilton–Funktion von der physikalisch h¨aufig auftretenden Form (11.1.1) H : P → R , H(p, q) = 12 p, Ap + V (q) ist, mit A = A ∈ Mat(d, R) positiv definit und einem Potential V ∈ C 2 (Rd , R). Die hamiltonsche Differentialgleichung ist damit p˙ = −∇V (q)
, q˙ = Ap .
(11.1.2)
Die kinetische Energie, das heißt die quadratische Form K(p) := p, Ap wird durch eine lineare symplektische Transformation P → P , (p, q) → (Op, Oq), mit einer Drehung O ∈ SO(d), diagonalisiert. Bezeichnet man die Kehrwerte der
d p2 Eigenwerte von A mit m1 , . . . , md > 0, dann ergibt sich K(p) = k=1 2mkk . Physikalisch werden die mk als Massen interpretiert. 1 2
11.1.1
Existenz des Flusses
Nur dann kann f¨ ur Anfangsbedingungen x0 ∈ P die Norm Φt (x) der L¨osung groß werden, wenn mit p(t), q(t) := Φt (x) der Ort q(t) nach Unendlich geht. Dies f¨ uhrt zu der folgenden hinreichenden Bedingung f¨ ur die Existenz des Flusses. 11.1 Satz Falls f¨ ur eine Konstante c > 0 gilt V (q) ≥ −c 1 + q 2
q ∈ Rd ,
(11.1.3)
dann erzeugt die Differentialgleichung (11.1.2) einen Fluss Φ ∈ C (R × P, P ). 1
˙ ≤ p /mmin . Beweis: • F¨ ur mmin := min(m1 , . . . , md ) ist q
• Wir setzen E := H(x0 ). Dann ist f¨ ur alle Zeiten t ∈ (tmin , tmax ) aus dem maximalen L¨osungsintervall
p(t)
d 1 2 ≤ c1 E − V (q(t)) (11.1.4)
q(t)
˙ ≤ k=1 2 pk (t)/mk = c1 mmin √ max mit c1 := m2m . Aus (11.1.3) ergibt sich mit c := c 2 max(E, c) 2 1 min
q(t)
˙ ≤ c1 E + c(1 + q(t) 2 ) ≤ c2 1 + q(t) 2 . ur alle t ∈ [0, tmax ) • Mit f (t) := 1 + q(t) 2 und A := f (0) ist daher f¨ t t q(s), q(s) ˙ ds ≤ A + 2
q(s) q(s)
˙ ds f (t) = A + 2 0 0 t t ≤ A + 2c2 (1 + q(s) 2 ) ds = A + 2c2 f (s) ds . 0
0
ist der Konfigurationsraum eine offene Teilmenge M ⊆ Rd und der Phasenraum P das Kotangentialb¨ undel T ∗ M ∼ = Rdp × M , siehe Kapitel 10.1. 1 Allgemeiner
11. Bewegung im Potential
227
Eine analoge Aussage gilt f¨ ur t ∈ (tmin , 0]. Damit ist nach dem GronwallLemma 3.42 f (t) ≤ A exp(2c2 |t|), also insbesondere beschr¨ankt. F¨ ur die L¨ osung Φt (x0 ) = p(t), q(t) gilt also wegen (11.1.4) und (11.1.3) f¨ ur eine geeignete Konstante c3
Φt (x0 ) 2 = p(t) 2 + q(t) 2 ≤ c3 1 + q(t) 2 ≤ c3 A exp(2c2 |t|). Wegen dieser Absch¨atzung und der lokalen Lipschitz–Stetigkeit der rechten Seite von (11.1.2) l¨asst sich die L¨ osung f¨ ur alle Zeiten fortsetzen. • Die stetige Differenzierbarkeit des Flusses ergibt sich aus der stetigen Differenzierbarkeit der rechten Seite von (11.1.2) und Satz 3.45. 2 11.2 Aufgabe (in endlicher Zeit nach Unendlich) Zeigen Sie, dass f¨ ur ε > 0 und Potential V (q) := c (1 + q 2 )1+ε die Differentialgleichung (11.1.2) genau dann einen vollst¨andigen Fluss erzeugt, wenn c ≥ 0 ist. 3 Da die kinetische Energie K nichtnegativ ist, verbleibt f¨ ur Gesamtenergie E := H(p0 , q0 ) die Trajektorie mit Anfangsbedingung (p0 , q0 ) in der Zusammenhangskomponente von q0 des Hillschen Gebietes {q ∈ Rd | V (q) ≤ E}.
11.1.2
Reversibilit¨ at des Flusses
Wir betrachten jetzt Potentiale V : M → R auf dem (offenen) Konfigurationsraum M ⊆ Rd . Die Bewegung im Potential V ist reversibel: 11.3 Definition • Die Abbildung T : P → P , (p, q) → (−p, q) auf dem Phasenraum P := Rd × M wird Zeitumkehr genannt. • Eine Hamilton–Funktion H : P → R (und der von ihr erzeugte Fluss) heißt reversibel, wenn sie zeitumkehrinvariant ist, das heißt H ◦ T = H. T ist ein Diffeomorphismus und eine Involution, das heißt T ◦ T = IdP . 11.4 Beispiele (Reversibilit¨ at) 1. Die Hamilton–Funktion (11.1.1) der Bewegung im Potential ist reversibel. ist die Hamilton–Funktion (siehe Abschnitt 2. F¨ ur B ∈ R \ {0} und J = 01 −1 0 6.3.3) H : R2 × R2 → R , H(p, q) := 12 p − BJq 2 nicht reversibel. Sie beschreibt die Bewegung eines geladenen Teilchens in der Ebene unter dem Einfluss eines konstanten Magnetfelds der St¨arke B. 3 11.5 Satz Der von einer reversiblen Hamilton–Funktion H : P → R erzeugte Fluss Φ : R × P → P besitzt die Eigenschaft Φ−t = T ◦ Φt ◦ T
(t ∈ R).
(11.1.5)
228
11.2. Bewegung im periodischen Potential
Beweis: • Wir die Zeitumkehr in der Form T (x) = T x mit der Matrix schreiben l 0 T = T −1 := −1 ∈ Mat(2d, R). Damit ist DT = T und T JT −1 = −J. 0 1l d • Unter Benutzung des Zusammenhangs dt Φt = XH ◦ Φt zwischen dem hamiltonschen Vektorfeld und dem von ihm erzeugten Fluss ist f¨ ur t = 0 die Zeitableitung der rechten Seite der behaupteten Identit¨at (11.1.5) gleich D1 (T ◦ Φ) 0, T (x) = T D1 Φ 0, T (x) = T XH 0, T (x) = T J∇H T (x)
=
T JT −1 ∇(H ◦ T )(x) = −J∇H(x) = −XH (x).
Auch die Zeitableitung der linken Seite ergibt D1 Φ(−t, x)|t=0 = −XH (x). • Wegen der Gruppeneigenschaft (2.1.1) des Flusses beweist dies (11.1.5).
11.1.3
2
Erreichbarkeit
Durch die richtige Wahl der Anfangsrichtung kann man im Raum von einem Ort zu jedem anderen kommen.2 11.6 Satz (Erreichbarkeit) F¨ ur die von (11.1.1) erzeugte hamiltonsche Dynamik gilt: f¨ ur alle Energien E > supq V (q) und Orte q0 , q1 ∈ Rdq gibt es einen Anfangswert x0 = (p0 , q0 ) ∈ ΣE und eine Zeit t ≥ 0 mit q(t, x0 ) = q1 . Beweis: Die L¨osungskurven der hamiltonschen Gleichungen stimmen nach Satz 8.31 bis auf die zeitliche Parametrisierung mit den Geod¨aten der Jacobi–Metrik gE (q) = E − V (q) g q ∈ Rdq mit der Massen-Matrix g = A−1 ∈ Mat(d, R) u ¨berein, analog zu Definition 8.30. uck bez¨ uglich dieser Man zeigt also, dass ein q0 und q1 verbindendes Geod¨atenst¨ Metrik existiert. Dies wird aber durch den Satz von Hopf und Rinow (Satz G.15 auf Seite 546) garantiert, denn die riemannsche Mannigfaltigkeit Rdq , gE ist 2 wegen der Schranke gE ≥ E − supq V (q) g geod¨atisch vollst¨andig. Auch diese Eigenschaft unterscheidet die Bewegung im Potential von der im Magnetfeld. Denn die ebene Bewegung in einem konstanten Magnetfeld ist kreisf¨ormig (siehe Abschnitt 6.3.3), verbindet also keine Punkte mit großem Abstand.
11.2
Bewegung im periodischen Potential
Wir betrachten im Weiteren die Bewegung eines Teilchens. In der kinetischen Energie kommt also nur eine Masse m vor. Durch Multiplikation der Hamilton– Funktion mit m wird nur die Zeitskala ge¨andert. Wir k¨onnen also die von H:P →R
, H(p, q) = 12 p 2 + V (q)
(11.2.1)
2 Dabei ist sogar unwesentlich, ob der Fluss vollst¨ andig ist, also etwa, ob das Potential V die Bedingung (11.1.3) erf¨ ullt. Wesentlich ist aber, dass die Energie E gen¨ ugend groß ist, vergleiche mit Aufgabe 6.34.2.
11. Bewegung im Potential
229
auf dem Phasenraum P := Rdp × Rdq erzeugte hamiltonsche Differentialgleichung p˙ = −∇V (q)
, q˙ = p. (11.2.2) uglich eines von Basisuntersuchen. Dabei soll das Potential V ∈ C 2 Rdq , R bez¨ vektoren 1 , . . . , d des Rd aufgespannten Gitters
d n n ∈ Z L := spanZ (1 , . . . , d ) = i i i i=1 L–periodisch sein, das heißt es soll gelten V (q + ) = V (q)
q ∈ Rd , ∈ L .
Die Differentialgleichung modelliert zum Beispiel die Bewegung eines klassischen Elektrons in einem d–dimensionalen Kristall.
11.2.1
Existenz der asymptotischen Geschwindigkeiten
Als eine Anwendung des birkhoffschen Ergodensatzes 9.32 vergleichen wir die Asymptotiken der Bewegung in Zukunft und Vergangenheit. λ2d bezeichnet dabei das Lebesgue–Maß auf dem 2d–dimensionalen Phasenraum P = Rdp × Rdq . 11.7 Satz • Die DGL (11.2.2) erzeugt einen Fluss Φ = (p, q) ∈ C 1 (R × P, P ). • F¨ ur λ2d –fast alle Anfangsbedingungen x ∈ P existieren die asymptotischen T Geschwindigkeiten v ± (x) := limT →∞ T1 0 p(±t, x) dt. Setzt man andernfalls v ± (x) := 0, erh¨alt man messbare Abbildungen v ± : P → Rd . F¨ ur λ2d –fast alle x ist v + (x) = v − (x). • Es gilt v ± (x) ≤ 2(H(x) − Vmin ), mit Vmin := inf q∈Rd V (q) > −∞. 11.8 Bemerkung Die Aussage, dass sich die asymptotischen Geschwindigkeiten von Vergangenheit und Zukunft fast immer gleichen, ist eigentlich verbl¨ uffend, denn zumindest f¨ ur chaotische Dynamiken kann man die ferne Zukunft nicht voraussagen, wenn man die Vergangenheit mit endlicher Genauigkeit kennt. 3 Der im Existenzbeweis von v ± benutzte birkhoffsche Ergodensatz erfordert aber ullt diese Bedingung nicht. Daher konstruieren wir ein endliches Maß, und λ2d erf¨ vorbereitend eine Vergleichsdynamik auf einem kompakten Raum. Wegen der L–Periodizit¨at k¨ onnen wir V auch als Funktion auf dem d–dimensionalen Torus T := Rd /L = q + L | q ∈ Rd auffassen. Diese Mannigfaltigkeit l¨asst sich mit dem kompakten Parallelotop
d x x ∈ [0, 1] ⊂ Rd , D := i i=1 i i
230
11.2. Bewegung im periodischen Potential
¨ dem sogenannten Elementargebiet, identifizieren, wenn man mittels der Aquivalenzrelation q ∼ r, falls q − r ∈ L deren gegen¨ uberliegende R¨ander identifiziert. Insbesondere ist T kompakt. Die glatte Abbildung π : Rdq → T
,
q → q + L
wickelt sozusagen den Konfigurationsraum auf dem Torus auf, und gestattet uns die Definition des Potentials V@ : T → R
, V@ = V ◦ π −1
auf T. Der Phasenraum des Torus ist die 2d–dimensionale Mannigfaltigkeit P@ := Rdp × T. Die Abbildung π @ : P → P@ , (p, q) → p, π(q) der Phasenr¨aume ist ein lokaler Diffeomorphismus. Die auf P@ projizierte Funktion (11.2.1), das heißt @ : P@ → R H
@ q) = 1 p 2 + V@ (q) , H(p, 2
(11.2.3)
besitzt die hamiltonsche Differentialgleichung p˙ = −∇V (q), q˙ = p; diese wird @ = (@ durch einen hamiltonschen Fluss Φ p, q@ ) : R × P@ → P@ gel¨ost. Beweis von Satz 11.7 • Zun¨achst ist Vmin > −∞ und analog Vmax := sup V (q) q∈Rd
< +∞, denn inf q∈Rd V (q) = inf q∈D V (q), D ist kompakt und V stetig. Damit ist die Voraussetzung des Satzes 11.1 erf¨ ullt, und die Differentialgleichung (11.2.2) erzeugt einen vollst¨andigen Fluss Φ ∈ C 1 (R × P, P ). @t ◦ π ˆ , also (mit v ± (ˆ x) := 0 bei nichtexistentem Limes) • Es gilt π ˆ ◦ Φt = Φ 1 T →∞ T
v ± (x) = v ± (ˆ x) := lim
T
p@ (±t, x ˆ) dt
f¨ ur x ˆ := π ˆ (x).
(11.2.4)
0
ˆ := λd × μ auf P@ = Rd × T und dem durch μ(T) = λd (D) • Mit dem Maß λ p ˆ invariant bez¨ @ und f¨ normierten haarschen Maß μ auf dem Torus ist λ uglich Φ, ur alle messbaren Teilmengen A ⊆ P ist (da die verschobenen Elementargebiete D + ( ∈ L) zusammen den Rd ergeben und ihr Schnitt Maß Null besitzt) ˆ π λ ˆ A ∩ Rdp×(D + ) λ2d A) = (11.2.5) λ2d A ∩ Rdp×(D + ) = ∈L
∈L
ˆ x) Es gen¨ ugt also zu zeigen, dass f¨ ur λ–fast alle x ˆ ∈ P@ gilt: der Limes v ± (ˆ + − existiert und v (ˆ x) = v (ˆ x). ˆ kein endliches Maß, aber f¨ • Nun ist auch λ ur alle E ∈ R ist die Restriktion von ˆ auf die Φ–invariante @ λ Teilmenge @ x) ≤ E ˆ ∈ P@ | H(ˆ P@E := x
11. Bewegung im Potential
231
ˆ P@E ) ≤ λd (B d ) μ(T) < ∞ f¨ ur die des Phasenraums ein endliches Maß, mit λ( r d d–dimensionale Kugel Br vom Radius r := 2(E − Vmin ). ˆ P@E ) > 0 f¨ Andererseits ist λ( ur E > Vmax , mit Vmax = supq V (q) < ∞. Wir ˆ @ zu einem Wahrscheinlichkeitsmaß normieren und darauf den k¨onnen damit λ PE birkhoffschen Ergodensatz 9.32 anwenden. Da aber Nullmengen Nullmengen bleiben, wenn wir das Maß mit einer positiven Konstante multiplizieren, schließen wir ˆ − fast alle x v + (ˆ x) = v − (ˆ x) f¨ ur λ ˆ ∈ P@E . 7 ˆ Mit P@ = E∈N P@E folgt dies sogar f¨ ur λ–fast alle x ˆ ∈ P@. Die Menge der Urbilder @ @ von x ˆ ∈ P unter π ˆ : P → P ist wie das Gitter L abz¨ahlbar. Wegen (11.2.4) und ur λ2d –fast alle x ∈ P , und die Messbarkeit (11.2.5) folgt auch v + (x) = v − (x) f¨ ± der Abbildungen v . • Da f¨ ur alle (p, q) ∈ ΣE = H −1 (E) gilt: p ≤ 2(E − Vmin ), besitzen die Ces`aro-Mittel (11.2.3) die gleiche Majorante. 2 11.9 Bemerkung (Zuf¨ allige Potentiale) In der Theorie metallischer Legierungen wird vorausgesetzt, dass an den Punkten eines Gitters L ⊂ Rd zuf¨allig Atome von zwei oder mehr chemischen Elementen anzutreffen sind. Man spricht dann von einem Substitutionsmischkristall. Ordnet man der Atomsorte i ∈ I etwa ein kompakt getragenes Einzelplatzpotential Wi ∈ Cc2 (Rd , R) zu, dann ergibt sich ur jeden Gitterplatz das Gesamtpotential bei Wahl ω ∈ Ω := I L der Atomsorten f¨
d V : Ω × R → R , V (ω, q) := ∈L Wω() (q − ). Zur Beschreibung der konkreten Legierung wird dann ein unter Verschiebungen mit L invariantes Wahrscheinlichkeitsmaß β auf Ω gew¨ahlt. Im einfachsten Fall ist dies das Produktmaß desjenigen Wahrscheinlichkeitsmaßes auf I, welches das Mischungsverh¨altnis der Legierung quantifiziert. Die Hamilton–Funktion H : Ω × T ∗ Rd → R, H(ω; p, q) = 12 p 2 + V (ω, q) auf dem erweiterten Phasenraum definiert dann eine durch Ω parametrisierte ur β × Zeitentwicklung auf T ∗ Rd . Die asymptotische Geschwindigkeit existiert f¨ ur λ2d –fast alle Anfangsbedingungen auf Ω × T ∗ Rd , und deren Verteilung ist f¨ β–fast alle Hamilton–Funktionen H(ω; ·) (ω ∈ Ω) einander gleich.3 Die Bewegung in einem solchen zuf¨alligen Potential ist auf der Seite 29 dargestellt, unterlegt mit einem Graustufenbild der Realisation V (ω, ·). 3
11.2.2
Verteilung der asymptotischen Geschwindigkeiten
Welche asymptotischen Geschwindigkeiten kommen nun typischerweise vor? Da ohnehin fast u ¨bereinstimmen, betrachten wir ¨berall die Grenzwerte v + und v − u dazu gleich die messbare Abbildung + v (ˆ x) , falls v + (ˆ x) = v − (ˆ x) d @ v : P → R , v(ˆ x) := 0 , sonst. 3 falls
β wie zum Beispiel das Produktmaß ergodisch unter Verschiebungen mit L ist.
232
11.2. Bewegung im periodischen Potential
@ aus (11.2.3) erhalten wir die Energie-ImpulsMit der Hamilton–Funktion H Abbildung @ v : P@ −→ R × Rd . I := H, ˆ auf R × Rd beschreibt die gemeinsame Verteilung Das Bildmaß ν := I(λ) von Energie und asymptotischer Geschwindigkeit. 11.10 Beispiele (Energie-Impuls-Abbildung) 1. F¨ ur das Potential V = 0 und 2 @ x) = 1 ˆ x ˆ = (ˆ p, qˆ) ist v(ˆ x) = pˆ und H(ˆ p
. 2 Daher ist der Tr¨ager von ν das Paraboloid H supp(ν) = (E, v) ∈ R × Rd | E = 12 v 2 . F¨ ur fixierte Energie E > 0 ist die asymptotische Geschwindigkeit damit auf der Sph¨are vom Ra√ dius 2E in Rd gleichverteilt.
Vmax
2. F¨ ur d = 1 verzweigt bei der Energie Vmax der Tr¨ager von ν, siehe Satz 11.11. In nebenstehender Abbildung ist der Tr¨ager von ν f¨ ur das Potential V = cos dargestellt. 3
Vmin
v
In einer Raumdimension existiert die asymptotische Geschwindigkeit immer und l¨aßt sich auch berechnen: 11.11 Satz Ist d = 1 und eine Periode des Gitters, so gilt: 1. F¨ ur E ≤ Vmax und Anfangsbedingung x0 = (p0 , q0 ) ∈ H −1 (E) ist q(t; x0 ) − q0 ≤ (t ∈ R). 2. F¨ ur E > Vmax und Anfangsbedingung x0 = (p0 , q0 ) ∈ H −1 (E) ist q(t; x0 ) − (q0 + v(x0 )t) ≤ (t ∈ R), mit asymptotischer Geschwindigkeit 1 T →∞ T
T
v(x0 ) := lim
p(t; x0 ) dt = 0
−1
0
sign(p0 )
− 1 2(E − V (q) 2 dq
Beweis: • Zun¨achst einmal ist es n¨ utzlich, das Phasenportrait das heißt die Zerlegung des Phasenraums in Orbits, zu finden. Da der Orbit durch x0 ∈ ΣE := H −1 (E) in ΣE enthalten ist, ist f¨ ur regul¨are Werte E von H jede Zusammenhangskomponente dieser Niveaulinie von H ein Orbit. Da der Summand 12 p2 von H(p, q) als einzigen nicht regul¨aren Wert die Null besitzt stimmen die regul¨aren Werte von H und von V u ¨berein. Insbesondere sind alle Werte E > Vmax regul¨ar.
11. Bewegung im Potential
233
q
V
1
1 2 1 4
Π
p Π
2Π
0
q
1
14 Π
0
Π
2Π
Abbildung 11.2.1: Potential V (q) = 12 cos(q) + 14 cos(2q) (links) und Phasenportrait von H(p, q) = 12 p2 + V (q) (rechts) • F¨ ur E < Vmax kann sich das Teilchen an den Orten q mit V (q) > E nicht aufhalten. Diese verbotenen Zonen sind gitterperiodisch angeordnete, nicht leere Intervalle. Ihr Komplement, also {q ∈ R | V (q) ≤ E} ist disjunkte Vereinigung abgeschlossener Intervalle von der L¨ange < . Damit ergibt sich der erste Teil des Satzes f¨ ur E < Vmax . Ist E = Vmax , dann finden wir in beiden Richtungen im Abstand ≤ von q0 Punkte q1 , q2 mit V (q1 ) = V (q2 ) = Vmax . Die Punkte (0, q1 ), (0, q2 ) ∈ ΣE sind Ruhelagen, zwischen denen der Orbit durch x0 liegt. Das bedeutet, dass auch f¨ ur E = Vmax die Bewegung gebunden ist. • Im zweiten Fall E > Vmax besteht ΣE aus nur zwei regul¨aren Zusammenhangskomponenten, also Orbits, die wir als Graphen von ± p± E : R → R , pE (q) := ± 2(E − V (q)) − darstellen. Dabei entspricht p+ E > 0 einer Bewegung nach rechts und pE < 0 einer Bewegung nach links. Es ist dt 1 1 dq = dq T := dq = + 2(E − V (q)) 0 dq 0 pE (q) 0
die Zeit, die das Teilchen der Energie E ben¨ otigt, um die Gitterperiode zu durchlaufen. Daraus ergab sich der Ansatz f¨ ur die mittlere Geschwindigkeit v = auft in der Zeit t > 0 mindestens n := t/T ∈ N0 , T . Das Teilchen durchl¨ h¨ochstens n + 1 Gitterperioden. Das beweist die Behauptung. 2 Nun ist die eindimensionale Bewegung physikalisch nicht besonders interessant. Wir k¨onnen zwar die Bewegung in einem periodischen Potential im Rd dann auf die Bewegung in eindimensionalen Potentialen zur¨ uckf¨ uhren, wenn V sich (nach Wahl einer geeigneten orthogonalen Basis) in der Form V : Rd → R
,
V (q) =
d i=1
Vi (qi )
(11.2.6)
234
11.2. Bewegung im periodischen Potential
schreiben l¨asst, siehe Abbildung 11.2.2, links. Solche Potentiale heißen separabel. Im Allgemeinen ist dies aber nicht der Fall, zum Beispiel nicht f¨ ur das Potential V (q1 , q2 ) = cos(q1 ) + cos(q1 + q2 ). Dessen Verteilung der asymptotischen Geschwindigkeit ist in Abbildung 11.2.2, rechts zu sehen.
Abbildung 11.2.2: Verteilung der asymptotischen Geschwindigkeiten f¨ ur Energie E = 3 und Potential V (q1 , q2 ) = cos(q1 ) + cos(q2 ) (links) beziehungsweise V (q1 , q2 ) = cos(q1 ) + cos(q1 + q2 ) (rechts). In diesen Bildern f¨allt auf, dass die vorkommenden asymptotischen Geschwindigkeiten, also der Tr¨ager des Maßes ν, symmetrisch bez¨ uglich der Spiegelung S : R × R d → R × Rd
, (E, v) → (E, −v)
sind. Das gilt f¨ ur beliebige Potentiale, sogar: 11.12 Lemma Die Verteilung ν von Energie und asymptotischer Geschwindigkeit ist S–invariant. Beweis: • Bei Existenz des Limes v + (x) der asymptotischen Geschwindigkeit von x ∈ P gilt wegen der Reversibilit¨at des Flusses Φ nach Satz 11.5 f¨ ur die zeitumgekehrte Anfangsbedingung T (x): 1 T −1 T − T (x) = lim v p −t, T (x) dt = lim p(+t, x) dt = −v + (x). T →+∞ T 0 T →+∞ T 0 Sonst sind beide Seiten nach Definition von v ± gleich Null. ˆt ◦π Wegen der Semikonjugations-Eigenschaft π ˆ ◦ Φt= Φ ˆ der Fl¨ usse gilt diese − @ Beziehung auch auf dem Phasenraum P , denn v π(T (x)) = −v + π(x) . ˆ ur die u • Nach Satz 11.7 stimmen v + undv − λ–fast ¨berein. F¨ ¨berall mit v u @ Energie-Impuls-Abbildung I = H, v und Zeitspiegelung T@ auf P@ ist daher S ◦ I(ˆ x) = I ◦ T@ (ˆ x)
ˆ − fast u (λ ¨berall).
(11.2.7)
11. Bewegung im Potential
235
ˆ ist T@ –invariant. Wegen der Definition von ν als Bildmaß von λ ˆ • Das Maß λ bez¨ uglich der Energie-Impuls-Abbildung beweist das zusammen mit (11.2.7) die Behauptung. 2
11.2.3
Ballistische und diffusive Bewegung
11.13 Definition Der Phasenraumpunkt 4 x0 ∈ P heißt ballistisch, wenn seine asymptotische Geschwindigkeit v(x0 ) ungleich Null ist. Ist v(x0 ) dagegen gleich Null, dann heißt das noch nicht automatisch, dass die Bewegung gebunden ist, also q(t, x0 ) f¨ ur alle Zeiten t in einem beschr¨ankten Gebiet des Konfigurationsraumes Rd bleibt. Wie wir sehen werden, gibt es beispielsweise auch F¨alle, in denen q(t, x0 ) − q0 typischerweise wie |t| statt mit |t| divergiert. Solche Bewegungen nennt man diffusiv. Wir benutzen als einfache Referenzdynamik die von der rein kinetischen Hamilton–Funktion H(p, q) = 12 p 2 erzeugte freie Bewegung x0 = (p0 , q0 ) ∈ P, t ∈ R . p(t, x0 ), q(t, x0 ) = (p0 , q0 + p0 t) F¨ ur diese k¨onnen wir ein beliebiges Gitter L ⊂ Rdq w¨ahlen. Es gilt dann Folgendes: 1. Die Bewegung ist f¨ ur positive Energien ballistisch. F¨ ur alle x0 ≡ (p0 , q0 ) ∈ P ur p0 = 0 ist v(x0 ) = p0 , also f¨ lim
|t|→∞
q(t, x0 ) − q0
= p0 > 0. |t|
2. Integrabilit¨at: F¨ ur E > 0 wird die @ −1 (E) ⊂ P@ von flussEnergiefl¨ache H invarianten d–dimensionalen Tori gefasert. Diese Phasenraum-Tori sind in diesem Fall von√ der Form Tp := {p} × T mit p = 2E und dem Konfigurationsraumtorus T = Rd /L. Das System ist also total integrabel. Wir untersuchen nun, welche dieser Eigenschaften bei Bewegung im periodischen Potential bewahrt bleiben. 11.14 Beispiel (d = 1) Im Fall eines periodischen Potentials V ∈ C 2 (R, R) (Satz 11.11) bleiben beide Charakteristika der freien Bewegung f¨ ur alle Energien E > Vmax erhalten: Der Limes v(x0 ) existiert und ist ungleich Null, und die @ −1 (E) ist die disjunkte Vereinigung zweier invarianter Tori. 3 Energieschale H Der ballistische Charakter der Bewegung ist in h¨oheren Dimensionen subtil: 4 Auch der Orbit O(x ) wird dann ballistisch genannt, denn die asymptotische Geschwin0 digkeit ist ja f¨ ur alle Punkte von O(x0 ) gleich.
236
11.2. Bewegung im periodischen Potential
11.15 Aufgabe (Ballistische und gebundene Bewegung) Zeigen Sie: ur jeden Git(a) Sei die Dimension d ∈ N und E > Vmax . Dann existieren f¨ tervektor ∈ L \ {0} Anfangsbedingungen x0 ∈ ΣE mit asymptotischer Geschwindigkeit v(x0 ) = 0
und Richtung
v(x0 ) = .
v(x0 )
Es gibt also Anfangsbedingungen, deren L¨ osungskurven ballistisch sind. (b) In d > 1 Raumdimensionen existieren periodische Potentiale, f¨ ur die auch geeignete Anfangsbedingungen x0 ∈ ΣE mit Energien E > Vmax zu gebundenen Bahnen f¨ uhren: sup q(t, x0 ) < ∞. t∈R
Der Abstand vom Ausgangspunkt skaliert in diesem Fall also nicht wie t1 , 3 sondern wie t0 . Physikalisch realistischere periodische Potentiale enthalten Coulomb-artige Singularit¨aten an den Kernorten s. Dort ist das Potential V (q) asymptotisch zu −z q−s , wobei z > 0 die Kernladungszahl ist. Als Beispiel betrachten wir das periodische Potential V (q) :=
−e−q−s
q − s
2
q ∈ R2 \ Z 2
s∈Z
in der Ebene, das sich additiv aus an den Kernorten s ∈ Z2 der Ebene lokalisierten Yukawa–Potentialen zusammensetzt. F¨ ur die Hamilton–Funktion H zu diesem Potential gilt dann folgender Satz: 11.16 Satz (Deterministische Diffusion [Kn1]) Es gibt eine Schwellenenergie E0 > 0, sodass f¨ ur alle E > E0 und alle Wahrscheinlichkeitsmaße μE mit Tr¨ager in der Energieschale ΣE , die absolut)stetig *zum Liouville–Maß (siehe Seite 180) sind (und r¨aumlich so abfallen, dass q0 2 μE < ∞), der folgende Limes existiert: * 1) D(E) := lim
q(t) − q0 2 μ > 0 E t→∞ t Dabei bedeutet die Klammer μE Bildung des Erwartungswertes bez¨ uglich μE . Tats¨achlich h¨angt die Konstante D nur von E, nicht aber von der Wahl von μE ab. D kann als Diffusionskonstante interpretiert werden. Der Erwartungswert wird gebildet, um Ausnahmebahnen wie ballistische oder gebundene Bahnen nicht explizit ber¨ ucksichtigen zu m¨ ussen. (Beide Typen von Ausnahmebahnen existieren, haben aber Maß Null.) Typische Bahnen verhalten sich im Limes großer Zeiten wie Pfade der Brownschen Bewegung, siehe Abbildung 11.2.3.
11. Bewegung im Potential
237
Abbildung 11.2.3: Bahn im periodischen Coulomb–Potential f¨ur Gesamtzeit √ T = 1 (links), T = 4 (Mitte) und T = 16 (rechts). Der Maßstab skaliert wie 1/ T .
11.17 Bemerkung (Anomale Diffusion) Man spricht von anomaler Diffusion, wenn f¨ ur ein α ∈ (0, 2) der Limes lim
1
t→∞ tα
q(t, x0 ) − q0 2
existiert und positiv ist, und zwar von Subdiffusion f¨ ur α ∈ (0, 1) und von Superdiffusion f¨ur α ∈ (1, 2). F¨ ur die gew¨ ohnliche Diffusion ist α = 1. In Geisel, Zacherl und Radons [GZR] wird f¨ ur periodische glatte Potentiale numerisch das Auftreten anomaler Diffusion gezeigt und mit der Koexistenz von KAM-Tori und ergodischen Phasenraumgebieten erkl¨art. 3 Abschließend soll bemerkt werden, dass f¨ ur glatte periodische Potentiale die klassische Bewegung f¨ ur hohe Energien typischerweise ballistisch ist. @ −1 (E) (mit der Genauer gesagt, existiert eine Teilmenge der Energieschale H @ aus 11.2.3), deren (Liouville-) Maß f¨ Hamilton–Funktion H ur hohe Energien E gegen das Maß der Energieschale strebt, f¨ ur die die Bewegung mit den entsprechenden Anfangsbedingungen ballistisch ist. Das liegt nun daran, dass f¨ ur hohe Energien das glatte periodische Potential als kleine St¨orung des Falls V = 0, also der freien Bewegung, aufgefasst werden kann. Der Satz von KAM (Kolmogorov, Arnol’d und Moser), siehe Satz 15.32 garantiert dann, dass viele invariante Phasenraumtori der freien Bewegung nur deformiert, aber nicht zerst¨ort werden (hier wird die Bewe@ −1 (E) ⊂ P@ gung in der Energieschale H betrachtet). Dies wird in Beispiel 15.34 gezeigt. Haben wir aber u ¨ber dem Konfigurationstorus T = Rd /L eine Bewegung auf solchen Tori (siehe Abbildung), so ist die Bewegung im Raum Rd ballistisch.
238
11.3. Himmelsmechanik
@ −1 (E) f¨ ur Energien E > Vmax Dies f¨ uhrt uns zur Frage, ob die Energieschale H aus lauter invarianten Tori besteht, die Bewegung also total integrabel ist. F¨ ur einen Freiheitsgrad ist dies ja der Fall (Beispiel 11.14). Im Gegensatz dazu steht folgende Aussage [Kn2]: 11.18 Satz (Totale Integrabilit¨ at) Das Potential V ∈ C 2 (Rd , R) sei L–perio@ −1 (E) mit E > Vmax existiert, f¨ ur disch, und d ≥ 2. Wenn eine Energiefl¨ache H die die Bewegung total integrabel ist, dann ist das Potential konstant. 11.19 Aufgabe (Totale Integrabilit¨ at) Zeigen Sie Satz 11.18 f¨ ur separable Potentiale, also solche der Form (11.2.6). 3 11.20 Bemerkung (Quantenmechanik) Im Fall des Schr¨odinger-Operators − 2 Δ + V 2
auf dem Hilbert-Raum L2 (Rd )
ist die Bewegung im periodischen Potential V immer ballistisch, auch f¨ ur kleine Energien. In diesem Zusammenhang stellt sich die mathematische Frage, warum und in welcher Weise das sogenannte Korrespondenzprinzip verletzt ist. Dieses heuristische Gesetz besagt, dass die quantenmechanische Bewegung f¨ ur kleine Werte des Planckschen Wirkungsquantums der klassischen ,¨ahnlich’ werden sollte. Hier werden aber zwei Limiten, n¨amlich der semiklassische Limes ! 0 und der Zeitlimes t → ∞, vertauscht, was im Allgemeinen nicht statthaft ist. Physikalisch ist die Frage nach dem Typ der Bewegung im Zusammenhang mit Transportph¨anomenen im Festk¨ orper interessant. 3
11.3
Himmelsmechanik Mathematical physics, as we are well aware, is an offspring ” ´, in [Poi3] of celestial mechanics.” Henri Poincare
Das himmelsmechanische n-K¨ orper-Problem besitzt unter den hamiltonschen Potentialdynamiken eine Sonderstellung. Es ist die am l¨angsten und intensivsten Untersuchte dieser Differentialgleichungen. Die Bewegungsgleichungen (1.8) des n–K¨ orper-Problems in d Raumdimensionen sind (in zweiter Ordnungs-Schreibweise) die hamiltonschen Differentialgleichungen zur Hamilton–Funktion H : P@ → R , H(p, q) =
n
pk 2 k=1
2mk
+V (q)
mit
V (q) := −
1≤k<≤n
mk m
qk − q
(11.3.1) ∼ Rdn × M 2u 2= auf dem Phasenraum P@ := T ∗ M ¨ber dem Konfigurationsraum 2 := q = (q1 , . . . , qn ) ∈ Rdn | qk = q f¨ M ur k = . (11.3.2) Die
n Massen mk > 0 sind die Parameter der Differentialgleichung. mN := k=1 mk ist die Gesamtmasse.
11. Bewegung im Potential
239
11.21 Aufgabe (Konstanten der Bewegung) Zeigen Sie, dass in d Raumdimensionen zusammen mit H die folgenden Phasenraumfunktionen Konstanten der von (11.3.1) erzeugten Bewegung im (bedarfsweise um die Zeitachse Rt erweiterten) Phasenraum P@ sind:
n • der Gesamtimpuls pN : P@ → Rd , (p, q) → k=1 pk , • der Schwerpunkt zur Zeit Null (siehe auch Satz 12.38):
n qN : P@ × Rt → Rd , (p, q; t) → m1N k=1 (mk qk − pk t) , • Der Gesamtdrehimpuls mit den ( d2 ) Komponenten
Li,j : P@ → R , (p, q) → nk=1 (qk,i pk,j − qk,j pk,i ) (1 ≤ i < j ≤ d). d+2 Wie viele von diesen 2 Konstanten der Bewegung sind in d = 2 beziehungsweise d = 3 Dimensionen algebraisch unabh¨angig? 3
11.3.1
Geometrie des Kepler–Problems
In der Einleitung wurde bewiesen, dass die Bahnen des Kepler–Problems Kegelschnitte sind. Bei negativer Gesamtenergie E bewegt sich also der Massenk¨orper auf Ellipsenbahnen um den Nullpunkt, w¨ahrend er bei positivem E von diesem Gravitationszentrum auf einer Hyperbel gef¨ uhrt wird. Der Fall E = 0 entspricht Parabeln. Es scheint zun¨achst, dass damit das Kepler–Problem (also auch die Dynamik zweier K¨orper) bis auf die Zeitparametrisierung vollst¨andig verstanden wurde. Und: bei Kenntnis der Bahnform l¨asst sich letztere auf eine Integration zur¨ uckf¨ uhren. ¨ Bei genauerem Hinsehen bietet die Kepler–Dynamik aber doch einige Uberraschungen und Besonderheiten. Will man das n–K¨orper-Problem oder die St¨orungstheorie des Kepler–Problems besser verstehen, muss man diese kennen. Beginnen wir mit der hamiltonschen Formulierung: Auf dem Konfigurati2 → 2 := Rd \{0} ist das Kepler– oder Coulomb–Potential V : M onsraum 5 M −Z R, V (q) = q definiert. Im Fall der Gravitationsanziehung ist Z > 0 die (reduzierte) Masse der Zentralkraft. Im elektrostatischen Fall ist −Z Produkt der beiden Ladungen. Also tritt bei gleichnamigen Ladungen Abstoßung auf. Jedenfalls ist der Phasenraum von der Form 2, 2 ∼ P@ := T ∗ M = Rd × M ˆ := ω0 P@ der kanoniund da P@ ⊂ T ∗ Rd offen ist, ist auch die Restriktion ω
d schen symplektischen Form ω0 := i=1 dqi ∧ dpi auf T ∗ Rd symplektisch (siehe Definition 10.3 auf Seite 203). Die von der Hamilton–Funktion ˆ : P@ → R H
ˆ (p, q) = 1 p 2 + V (q) , H 2
(11.3.3)
5 Zwar ist der physikalische Konfigurationsraum dreidimensional, aber wegen der Planarit¨ at der Zentralkraftbewegung auch d = 2 relevant.
240
11.3. Himmelsmechanik
erzeugte Bewegung ist f¨ ur Z < 0 vollst¨andig, denn es kommen nur Energien E > 0 vor, und f¨ ur diese ist der Minimalabstand gleich −Z/E > 0. F¨ ur den jetzt weiter untersuchten Fall Z > 0 ist der maximale Fluss ˆ : D → P@ Φ
mit Definitionsbereich
D ⊂ Rt × P@
(11.3.4)
(siehe Satz 3.39) genau f¨ ur diejenigen Anfangswerte x0 = (p0 , q0 ) ∈ P@ unvollst¨andig, bei denen der Anfangsimpuls p0 in span(q0 ) liegt. Die entsprechenden Kollisionsbahnen werden wir gleich regularisieren. 2 im von q0 und p0 aufgespannten UnterDa die Trajektorie t → q(t, x0 ) ∈ M raum verbleibt, k¨ onnen wir ohne Einschr¨ankung annehmen, dass die Dimension 2 gleich Zwei ist, und wir setzen := L ˆ (x0 ) mit d des Konfigurationsraumes M Drehimpuls ˆ : P@ → R , L ˆ (p, q) = q1 p2 − q2 p1 . (11.3.5) L Dieser ist (wie schon in (1.4) gezeigt) konstant in der Zeit. Die einfachste Bahnform ist der Kreis, der als degenerierte Ellipse nur f¨ ur −Z ur E = 2q . Dies sieht man ein, Energien E := H(x0 ) < 0 auftritt, und zwar f¨ 0 2
Z ur r := q0
wenn man beachtet, dass das effektive Potential V (r) = 2r 2 − r f¨ 2 seine Minimalstelle haben muss, also = rZ gilt, und der Minimalwert gleich E ist. F¨ ur alle anderen Anfangsbedingungen (p0 , q0 ) und zugeh¨orige Konstanten der Bewegung (E, ) ist der Abstand des Perizentrums, also des zentrumsn¨achsten Punktes der Bahn rmin : P@ → [0, ∞), √ −Z+ Z 2 +2E2 , E = 0 2E rmin (p0 , q0 ) = inf r > 0 | V (r) ≤ E = 2 ,E = 0 2Z
keine Minimalstelle von V . Er ist Null genau dann, wenn der Drehimpuls ebenfalls verschwindet. Jede Bahn nimmt mindestens zu einem Zeitpunkt ihren Perizentrumsabstand an (wobei f¨ ur = 0 dieser einer Kollision entspricht). Ist die Bahn keine Kreisbahn, dann kann man sie lokal durch die Zeit Tˆ : P@ → R, die bis zum n¨achsten Perizentrumspunkt vergeht, parametrisieren. Da die RadialgeschwindigZ keit betragsm¨aßig gleich 2E + 2 R − R 2 ist (siehe (1.6)), folgt r r 1 R ˆ √ dR . (11.3.6) T (p, q) = dR = sign(p, q) 2 2 rmin dR/dt rmin 2R E + 2ZR − 2
F¨ ur positive E wird dieses Integral in Aufgabe 12.10 ausgewertet. In den bis jetzt angesprochenen Eigenschaften unterscheidet sich das KeplerPotential wenig von homogenen singul¨aren Potentialen q → −Z/ q a mit a > 0. Die Besonderheit des Exponenten a = 1 liegt in der Existenz einer zus¨atzlichen Erhaltungsgr¨oße: 11.22 Aufgabe (Laplace–Runge–Lenz–Vektor) (a) Zeigen Sie, dass der (f¨ ur d = 2 notierte) Laplace–Runge–Lenz–Vektor p2 q ˆ q) := L(p, ˆ q) −p . (11.3.7) − Z q Aˆ : P@ → R2 , A(p, 1 zeitlich konstant ist und in Richtung des Perizentrums zeigt.
11. Bewegung im Potential
241
ˆ (b) Zeigen sie, dass A /Z = e mit der Exzentrizit¨at e aus (1.7) gilt. Beweisen ˆ Sie die Kegelschnittgleichung (1.7) unter Verwendung von A. 3 Diese 1710 von Jakob Hermann entdeckte Erhaltungsgr¨oße erlaubt die Regularisierung der Kollisionsbahnen. Letztere werden durch die Energie E ∈ R und die Perizentrumsrichtung θ ∈ S d−1 des kollidierenden Massenpunktes parametrisiert. Dass diese Richtung als Limes von Fastkollisionsbahnen u ¨berhaupt existiert, folgt aus der Existenz von A. Die Regularisierung der Kollisionsbahnen bedeutet geometrisch ihre Spiegelung am Ursprung des Konfigurationsraums. Sie kann mathematisch als Erweiterung des hamiltonschen Systems (Definition 10.5) beschrieben werden. 11.23 Satz (Regularisierung des Kepler-Problems) ˆ ) l¨aßt sich im folgenden Sinn zu einem haDas hamiltonsche System (P@, ω ˆ, H miltonschen System (P, ω, H) erweitern: • Die 2d–dimensionale differenzierbare Mannigfaltigkeit P ist als Menge von der Form (11.3.8) P = P@ ∪˙ R × S d−1 . • Die Restriktion der glatten symplektischen Form ω ∈ Ω2 (P ) auf P@ ist gleich ω ˆ. ˆ. • Die Restriktion der glatten Funktion H : P → R auf P@ ist gleich H • Der hamiltonsche Fluss Φ von (P, H, ω) ist glatt und vollst¨andig, das heißt Φ ∈ C ∞ (R × P, P ). Beweis: • Wir schauen die Kepler-Dynamik in der Phasenraumumgebung 4 cZ 2 ˆ @ U := (p, q) ∈ P p >
q
(11.3.9) der Singularit¨at an, mit c := 32 . ˆ ist f¨ Innerhalb U ur einen Orbit (p, q) : I → P@ die Ableitung Z d c−1 Z q , p = p 2 − > dt
q
2 q
(11.3.10) ˆ positiv, so dass dort der Fluss Φ transversal zur perizentrischen Hyperfl¨ache Sˆ0 := (p, q) ∈ P@ | q , p = 0 (11.3.11) d2 d 2 ist. Wegen dt 2 q = 2 dt q , p
p
U
2
1 e1 E1
e0 E12
1
q
ˆ der Singularit¨ Phasenraumumgebung U at. Kreisbahnen (Exzentrizit¨ at e = 0) sind ˆ . (Fast-)Kollisionsorbits disjunkt zu U ˆ. (e 1) schneiden U
242
11.3. Himmelsmechanik
zeigt diese Ungleichung auch, dass der Schnittpunkt des Orbits mit Sˆ0 tats¨achlich perizentrisch ist, das heißt minimalen Abstand zum Ursprung hat. ˆ, Jeder Kollisionsorbit befindet sich unmittelbar vor und nach der Kollision in U ˆ denn f¨ ur einen Orbit der Energie H (p, q) = E ist
p 2 −
cZ (2 − c)Z q→0 = + 2E −→ +∞.
q
q
• Nach Satz 3.39 ist der Definitionsbereich D ⊂ Rt × P@ von P@ aus (11.3.4) mit den ober– beziehungsweise unterhalbstetigen Fluchtzeiten T + : P@ → (0, ∞] bzw. T − : P@ → [−∞, 0) := {−∞} ∪ (−∞, 0) von der Form D = (t, x) ∈ R × P@ | t ∈ T − (x), T + (x) . F¨ ur Anfangswerte x mit T + (x) < ∞ findet zum Zeitpunkt T + (x) eine Kollision statt, das heißt lim q(t, x) = 0. tT + (x)
• Wie schon angemerkt, verbleiben die L¨ osungskurven t → q(t, x0 ) in M mit @ Anfangswerten x0 = (p0 , q0 ) ∈ P in der von p0 und q0 aufgespannten Ebene (oder Geraden) durch den Ursprung. Nehmen wir also zun¨achst d = 2 an. ˆ : D → P@ invariant. Der Drehimpuls (11.3.5) ist unter dem Fluss Φ • Die in komplexen Koordinaten geschriebene Richtung des Laplace-Runge-LenzVektors ˆ → S 1 , ϕ(p, ˆ q) = arg −ipL(p, ˆ q) − Z q ϕˆ : U ˆ q) := arg A(p, (11.3.12) |q| ist definiert und damit glatt, denn das Argument von arg in (11.3.12) ist nicht Null: 2 q ˆ 2H ˆ . (11.3.13) ˆ (x) + Z 2 > 0 ˆ iL(x)p x = (p, q) ∈ U + Z = 2L(x) |q| ˆ (x) < 0 ist n¨amlich wegen |L(x)| ˆ H ≤ |p| |q| und der Definition (11.3.9) ˆ U ˆ 2H ˆ . ˆ (x) ≥ |p|2 |q| |p|2 |q|−2Z = |p|2 |q|−Z 2 −Z 2 > −Z 2 2L(x) x∈U
F¨ ur von
Einfachheitshalber bezeichnen wir die Restriktionen fˆUˆ von Funktionen fˆ : P@ → R ebenfalls mit fˆ. Wir haben damit die lokalen Koordinaten 6 ˆ , Tˆ, L, ˆ ϕˆ : U ˆ → R3 × S 1 . H (11.3.14) 6 Diese Sprechweise ist nicht exakt, da ϕ ˆ nicht reell- sondern S 1 –wertig ist. Genauer versehen wir die Kreislinie S 1 selbst mit Karten, auf denen der Winkel als reellwertige Koordinate definiert ist.
11. Bewegung im Potential
243
• Diese Koordinaten sind kanonisch im Sinn von Definition 10.18, das heißt, die Poisson–Klammern haben folgende Form: ˆ } = {ϕ, ˆ =1 {Tˆ, H ˆ L}
ˆ H ˆ } = {ϕ, ˆ } = {L, ˆ Tˆ} = {ϕ, und {L, ˆ H ˆ Tˆ} = 0. (11.3.15) ˆ t |t=0 . ˆ sind die Ableitungen {fˆ, H ˆ } = d fˆ◦ Φ Denn die Poisson–Klammern mit H dt ˆ wegen der Zentralsymmetrie des Potentials V eine Erhaltungsgr¨oße W¨ahrend L ist und f¨ ur ϕˆ nach Aufgabe 11.22 das Gleiche gilt, ist Tˆ als Zeitparameter definiert, hat also Zeitableitung Eins. Der Definition von Tˆ in (11.3.6) sieht man an, dass diese Gr¨ oße invariant unter Drehung von Orts- und Impulsraum um ˆ Hamilton–Funktion dieser Drehung ist (siehe auch den gleichen Winkel ist. Da L ˆ Tˆ} = 0. Mutatis mutandis ver¨andert sich der Winkel Beispiel 13.15), folgt {L, ˆ erzeugten Fluss mit Geschwindigkeit {ϕ, ˆ = 1. unter dem von L ˆ L} • Eine verh¨altnism¨aßig einfache M¨ oglichkeit, die verbleibende Relation {ϕ, ˆ Tˆ} = 0 nachzuweisen, besteht in der Beobachtung, dass das hamiltonsche Vektorfeld Xϕˆ von ϕˆ tangential zur Hyperfl¨ache Tˆ ≡ 0 ist. Dazu zeigen wir, dass auf der Fl¨ache Tˆ ≡ 0 gilt: {ϕ, ˆ q, p} = 0. (11.3.16) ˆ mit Sˆ0 aus (11.3.11). Auf dieser Diese Fl¨ache im Phasenraum ist gleich Sˆ0 ∩ U Fl¨ache haben beide komplexen Zahlen, die in der Definition (11.3.12) von ϕˆ auftauchen, modulo π das gleiche Argument, und dieses ist invariant unter der von q, p erzeugten Dilatation (p, q) → (e−t p, et q), was ˆ t von H ˆ: (11.3.16) zeigt. Andererseits ist {ϕ, ˆ Tˆ} invariant unter dem Fluss Φ d ˆ ∗ ˆ } + Tˆ, {H ˆ , ϕ} ˆ ∗ {H ˆ , {ϕ, ˆ ∗ ϕ, = 0, ˆ {Tˆ, H ˆ Φt {ϕ, ˆ Tˆ} = −Φ ˆ Tˆ}} = Φ t t dt wobei die Jacobi–Identit¨at (E.21) benutzt wurde. Bis auf die Kollisionsorbits ˆ die Hyperfl¨ache Sˆ0 . Da die durch verschwindenden schneiden alle Orbits in U ˆ nirgends dichte TeilmenDrehimpuls gekennzeichneten Kollisionsorbits eine in U ge bilden, gilt u ˆ Tˆ} = 0. ¨berall {ϕ, ˆ erzeugte unvollst¨andige Fluss Φ ˆ auf • In der Karte (11.3.14) ist also der von H ˆ linearisiert. U ˆ auf Kollisionsbahnen besitzen den Wert = 0 des Die Punkte (p, q) ∈ U Drehimpulses, aber Tˆ(p, q) = 0. Der Zylinder R × S d−1 in der Menge P = P@ ∪˙ (R × S d−1 ) aus (11.3.8) wird dann mit der Menge der fehlenden, durch (, t) = 0 charakterisierten Phasenraumpunkte identifiziert. Die Struktur einer differenzierbaren Mannigfaltigkeit erh¨alt P durch Einf¨ uhrung einer Karte auf d−1 ˆ ∪˙ R × S ⊂ P, U := U zun¨achst f¨ ur den Fall d = 2. Wir erweitern n¨amlich (11.3.14) zu einer Abbildung H, T, L, ϕ : U → R3 × S 1 , (11.3.17) indem wir f¨ ur (E, θ) ∈ R × S 1 setzen: H, T, L, ϕ (E, θ) := (E, 0, 0, θ).
244
11.3. Himmelsmechanik
• Aus (11.3.15) folgt die Identit¨at ˆ + dϕˆ ∧ dL ˆ ω ˆ Uˆ = dTˆ ∧ dH f¨ ur die Restriktion ω ˆ ∈ Ω2 (P@) der kanonischen symplektischen Form ω0 . Wir definieren daher umgekehrt die Erweiterung ω ∈ Ω2 (P ) von ω ˆ durch ωU := dT ∧ dH + dϕ ∧ dL. • Da ω symplektisch ist, und H, aufgefasst als mithilfe von (11.3.17) auf ganz P ˆ : P@ → R, glatt ist, dient H als Hamilton–Funktion. definierte Erweiterung von H Deren Fluss Φ ist vollst¨andig, und in den lokalen Koordinaten (11.3.17) linear. • W¨ahrend in d = 2 Freiheitsgraden die Werte (, θ) von Drehimpuls und Perizentrumswinkel Punkte auf dem Zylinder T ∗ S 1 sind, sind analog f¨ ur beliebige d und (p, q) ∈ Sˆ0 die Werte des ’Drehimpulsvektors’ q p und der Perizentrumsrichtung q/ q Elemente von T ∗ S d−1 . Damit l¨aßt sich die obige Konstruktion auf d Freiheitsgrade verallgemeinern. 2 11.24 Bemerkungen (Kepler–Problem) 1. Die Bewegung zweier sich gravitativ anziehender Massenpunkte ist also zwar in (p, q)–Koordinaten singul¨ar, in angepassten Koordinaten aber glatt. 2. Das Kepler–Problem ist wie jedes Zentralkraftproblem integrabel, siehe Ab¨ schnitt 13.1. Ahnlich wie der in Satz 6.35 analysierte harmonische Oszillator mit d Freiheitsgraden und gleichen Frequenzen besitzt es aber mehr als d (n¨amlich 2d − 1) unabh¨angige Konstanten der Bewegung. Solche hamiltonschen Systeme werden superintegrabel genannt. Sie besitzen besondere Eigenschaften. In den genannten F¨allen folgt etwa die Periodizit¨at aller Orbits auf kompakten Energiefl¨achen.
q2
Q2
Q1
q1
Abbildung 11.3.1: Die Wirkung der Levi-Civita–Transformation C → C, Q → Q2 , also (q1 , q2 ) = (Q21 − Q22 , 2Q1 Q2 ) auf Geraden in der Q–Ebene
11. Bewegung im Potential
245
3. Die vorgestellte Regularisierungsmethode hat gegen¨ uber anderen Varianten den Vorteil, dass der Phasenraum nur erg¨anzt statt gewechselt wird, die Zeitparametrisierung ebenfalls gleich bleibt und sie gleichzeitig den Fluss auf allen Energiefl¨achen vervollst¨andigt. Allerdings ist ihr geometrischer Gehalt weniger u ¨bersichtlich als etwa bei der Levi-Civita–Transformation genannten Regularisierungsmethode. Diese basiert auf der Feststellung, dass die holomorphe Abbildung C −→ C ,
Q −→ q := Q2
Geraden auf Parabeln abbildet (siehe Abbildung 11.3.1), und allgemeiner die Kegelschnitte der Kepler–Bahnen Bilder im Ursprung regul¨arer Kegelschnitte sind. Die entsprechende lokale Punkttransformation (siehe (10.32)) der PhaP ¨ und f¨ uhrt nach Anderung senr¨aume transformiert die Impulse gem¨aß p = 2Q der Zeitparametrisierung zu einer Bewegung im Potential eines harmonischen Oszillators. Das Analog der Levi-Civita–Transformation f¨ ur drei Freiheitsgrade heißt Kustaanheimo-Stiefel–Transformation oder Cayley-Klein-Parametrisierung (und basiert auf der Hopf–Abbildung (6.36)), siehe Stiefel und Scheifele [StSc]. 4. Eine andere Regularisierungsmethode wird im Artikel [Mos3] von Moser beschrieben. Diese zeigt f¨ ur Energien E < 0, dass der auf die Energiefl¨ache ΣE := H −1 (E) ⊂ P restringierte Fluss Φt (t ∈ R) im Sinn von Definition 2.28 konjugiert zum geod¨atischen Fluss Ψt : T1 S d → T1 S d , Ψt (x, y) = cos(t)x + sin(t)y, − sin(t)x + cos(t)y (t ∈ R) auf dem Einheitstangentenb¨ undel T1 S d = (x, y) ∈ Rd+1 × Rd+1 | x = y = 1 , x, y = 0
(11.3.18)
der d-dimensionalen Sph¨are ist. Insbesondere ist ΣE diffeomorph zu T1 S d . Konkret wird die Sph¨are außer ihrem Nordpol n stereographisch auf die 2 des unregularisierten Kepler– Impuls-Ebene Rdp des Phasenraums P@ ∼ = Rdp ×M Problems projiziert, und das Einheitstangentenb¨ undel unter der linearisierten −1 ˆ @ Abbildung auf H (E) ⊂ P . Die Kollisionssph¨are S d−1 des Kepler–Problems entspricht damit {(x, y) ∈ T1 S d | x = n}. Diese Transformation zeigt auch, dass das Kepler-Problem spezielle Symmetrien besitzt. Denn w¨ahrend allgemein Zentralpotentiale (wie in Beispiel 13.15 ausf¨ uhrlicher untersucht) invariant unter der Wirkung der Rotationsgruppe SO(d) sind, wirkt auf dem Einheitstangentenb¨ undel (11.3.18) die Gruppe SO(d + 1). 3 11.25 Aufgaben (Regularisierbare singul¨ are Potentiale) 1. F¨ ur welche homogene singul¨are Potentiale der Form q → −Z/ q a mit a ∈ (0, 2) kann die
246
11.3. Himmelsmechanik
hamiltonsche Dynamik analog zum Kepler-Fall a = 1 regularisiert werden? Tipp: Betrachten Sie den totalen Ablenkwinkel Δϕ f¨ ur Energie E > 0 ∞ ϕ˙ dr Δϕ(E, ) = 2 rmin r˙ ∞ /r2 = 2 dr 2(E − V (r)) rmin
q2
=
q1
2
mit effektivem Potential V (r) := 2r 2 − Z im Limes verschwindenden Drehima r pulses . Zeigen Sie, dass dieser Limes lim±0 Δϕ(E, ) Energie-unabh¨angig ist und zwar gleich Fastkollisionsbahn negativer Energie ∞ in einem nicht regularisierbaren 2π du √ =± = ±2 . Potential (V (q) = −1/ q 1.3 ) 2−a u u2−a − 1 1
2. Folgern Sie aus Bemerkung 11.24.4, dass f¨ ur negative Energien E, d Freiheitsgrade und die Energieschale ΣE des Kepler–Problems der Raum ΣE /S 1 der Orbits (a) f¨ ur d = 2 diffeomorph zu S 2 , (b) f¨ ur d = 3 diffeomorph zu S 2 × S 2 ist. (c) Zeigen Sie f¨ ur das Kepler–Problem mit d = 2 Freiheitsgraden direkt, dass ΣE /S 1 ∼ = S 2 gilt, falls E < 0. Was ist die Form dieses Orbitraumes f¨ ur E > 0? Tipps: • Betrachten Sie f¨ ur d = 2 und (x, y) ∈ T1 S 2 den Vektor x × y ∈ R3 . • Identifizieren Sie f¨ ur d = 3 den Vektorraum R4 × R4 aus der Definition 3 (11.3.18) von T1 S mit dem kartesischen Produkt H×H der QuaternionenSchiefk¨orper H aus E.27, und zeigen Sie, dass die Abbildung T1 S 3 /S 1 → S 2 × S 2 ⊂ ImH × ImH , [(x, y)] → xy∗ , y ∗ x (mit dem Orbit [(x, y)] durch (x, y)) wohldefiniert und ein Diffeomorphismus ist. • Verwenden Sie den Laplace-Runge-Lenz–Vektor A : P → R2 , der aus Aˆ in (11.3.7) durch Regularisierung gewonnen wird. Zeigen Sie, dass
A 2 = 2 L 2 H + Z 2 gilt, A also f¨ ur Energie E < 0 und x ∈ ΣE die Werte in der Kreisscheibe A(x) ≤ Z annimmt. Wie viele Orbits in ΣE entsprechen einem Wert a von A, f¨ ur a = Z bzw. a < Z? 3
11. Bewegung im Potential
247
Die in Aufgabe 11.25.2 abgeleitete Form des Orbitraumes ist wesentlich f¨ ur die St¨orungstheorie. Sie wird in [Mos3] von Moser benutzt, um zu zeigen, dass bei ˆ f¨ kleinen Potentialst¨ orungen von H ur d = 2 mindestens 3, f¨ ur d = 3 mindestens 6 periodische Orbits gegebener Energie E < 0 u ¨brigbleiben.
11.3.2
Zwei Gravitationszentren
Das sogenannte n–Zentren-Problem l¨asst sich nur im eben behandelten Fall n = 1 als Spezialfall eines n–K¨ orper-Problems auffassen. Wie wir aber sehen werden, hat zumindest das Zweizentren-Problem dennoch Anwendungen in der Himmelsmechanik. Im n–Zentren-Problem wird die Bewegung eines Massenpunktes im Gravitationsfeld von n an voneinander verschiedenen Stellen s1 , . . . , sn ∈ Rd fixierten Gravitationszentren untersucht. Damit ist es einfacher als das (n + 1)–K¨orperProblem. F¨ ur den jetzt behandelten Fall d = 3 und n = 2 ist der Konfigurationsraum 2 := R3 \ {s1 , s2 }, und f¨ ur Massen bzw. Ladungen Z1 , Z2 ∈ R \ {0} ist also M 2→R V :M
,
V (q ) =
−Z1 −Z2 +
q − s1 q − s2
ˆ : P@ → R, H ˆ (p, q) = 1 p 2 + ein glattes Potential. Die Hamilton–Funktion H 2 2 erzeugt zwar f¨ 2 ∼ V (q) auf dem Phasenraum P@ := T ∗ M ur positive = Rd × M Zk eine unvollst¨andige Dynamik, aber die Regularisierung bei sk geht genauso vonstatten wie im Ein-Zentren-Problem des Abschnitts 11.3.1. Erstaunlicherweise ist das System integrabel. Dies wurde von Jacobi gezeigt, siehe [Jac]. Die Dynamik wurde in der Folge vielfach genauer untersucht. [WDR] enth¨alt eine umfangreiche Literaturliste zum Zwei-Zentrenproblem. Durch eine euklidische Bewegung und Maßstabsskalieq2 rung k¨onnen wir uns auf 1 1 den Spezialfall s1 := 0 −1 0 beund s2 := 0 0 schr¨anken. Konkret wird die Integration durch Benutzung q1 1 1 spheroid-prolater Koordinaten (ξ, η, ϕ) ∈ (0, ∞) × 2 gezeigt (0, π) × S 1 f¨ ur M (siehe auch Kapitel 4.3 von 1 Thirring [Th1]), mit cosh(ξ) cos(η) q1 q 2 q ≡ q = F (ξ, η, ϕ) := sinh(ξ) sin(η) cos(ϕ) . 3
sinh(ξ) sin(η) sin(ϕ)
248
11.3. Himmelsmechanik
Niveaulinien von ξ und η sind nebenstehend dargestellt. Die Funktionaldeterminante ist auf dem genannten Definitionsbereich positiv: (11.3.19) det DF (ξ, η, ϕ) = cosh2 (ξ) − cos2 (η) sinh(ξ) sin(η), verschwindet aber auf der Achse durch s1 und s2 (denn diese q1 –Achse ist punktweise invariant unter der Rotation mit Winkel ϕ ∈ S 1 ). Die spheroid-prolaten Koordinaten sind dem Zwei-Zentrenproblem angepasst, denn die Abst¨ande zu den Zentren haben die einfache Form 7
q − s1 = cosh(ξ) − cos(η) ,
q − s2 = cosh(ξ) + cos(η).
Also ist mit Z± := Z2 ± Z1 und f (ξ, η) := cosh2 (ξ) − cos2 (η) das Potential V ◦ F (ξ, η, ϕ) =
−Z+ cosh(ξ) + Z− cos(η) . f (ξ, η)
F¨ ur die hamiltonschen Gleichungen ben¨ otigen wir noch dem Koordinatensystem (ξ, η, ϕ) angepasste Impulse (pξ , pη , pϕ ). Da sich die Geschwindigkeiten mit der Jacobi–Matrix DF transformieren, sind die zu diesen dualen Impulse durch die Beziehung p1 pξ pη p = pp2 = DF (ξ, η, ϕ)−1 p 3
ϕ
festgelegt. Damit ist pϕ =
∂F1 ∂F2 ∂F3 p1 + p2 + p3 = q2 p3 − q3 p2 ∂ϕ ∂ϕ ∂ϕ
eine Konstante der Bewegung: Mit W (q1 , r) := √ −Z12 2 + √ −Z22 2 und (q1 −1) +r (q1 +1) +r r := q22 + q32 ist V (q) = W (q1 , r) und daher q q2 dpϕ ∂W 3 = 0. = q˙2 p3 −q˙3 p2 +q2 p˙ 3 −q3 p˙2 = p2 p3 −p3 p2 + (q1 , r) q2 − q3 dt ∂r r r pϕ ist gleich der ersten Komponente des Drehimpulsvektors. Mit dem Satz von Noether (Satz 13.22) folgt die Konstanz von pϕ geometrisch aus der Invarianz von V unter Rotationen um die q1 –Achse. Die kinetische Energie ist von der Form pξ 2 −1 −1 pη 1 1 . DF (ξ, η, ϕ)
p
= (p , p , p ) DF (ξ, η, ϕ) ξ η ϕ 2 2 p ϕ
ˆ (x0 ). Damit ist F¨ ur die Anfangswerte x0 ∈ P@ sei := pϕ (x0 ) und E := H ˆ − E in den neuen Koordinaten wegen DF −1 DF −1 = die Form von H −1 DF DF und DF DF (ξ, η, ϕ) =
diag(1, 1, sinh(ξ)−2 + sin(η)−2 ) f (ξ, η)
aus diesen Beziehungen cosh(ξ) = 12 (q −s1 +q +s1 ) folgt, sind die Niveaufl¨ achen von ξ tats¨ achlich die Rotationsellipsoide mit den Brennpunkten si . 7 Da
11. Bewegung im Potential
249
f (ξ, η)−1 Hξ (pξ , ξ) + Hη (pη , η) , f¨ ur Hξ (pξ , ξ) := 12 p2ξ + Vξ (ξ) mit Vξ (ξ) :=
2 − Z+ cosh(ξ) − E cosh2 (ξ) 2 sinh2 (ξ)
und Hη (pη , η) := Vη (η) :=
1 2 2 pη
VΞ 0.8
1.2 ZE
+ Vη (η) mit
2 + Z− cos(η) + E cos2 (η). 2 sin2 (η)
¨ Durch Ubergang zum erweiterten Phasenraum ∗ @ P ×T R ∼ = P@ × RE × Rs und Benutzung des neuen Zeitparameters s mit dt = f (ξ, η) ds separiert die neue Hamilton–Funktion 8 H : P@ × T ∗ R → R:
1 4
Z2 4E 1 2
3 4
Ξ
1
VΗ Π
Π2
Π 2
Π
Η
14 12 34
E
Die Potentiale Vξ und Vη f¨ ur = 0, Z1 = Z2 = 1 und E = −3/4
ˆ − E) = Hξ (pξ , ξ) + Hη (pη , η). H(pξ , ξ, pη , η; E, s) = f (ξ, η)(H Die Bewegung auf H−1 (0) stimmt – bis auf Zeitparametrisierung – mit der auf ˆ −1 (E) u H ur ¨berein. F¨ K := Hξ (x0 ) = −Hη (x0 ) haben wir drei im allgemeinen unabh¨angige Konstanten der Bewegung, n¨amlich ˆ , Hξ und pφ , mit Werten E, K und . H In Abbildung 11.3.2 sehen wir drei in der q1 − q2 –Ebene liegende Trajektorien (f¨ ur die also der Drehimpulswert = 0 ist). Sie liegen ganz im durch V (q) ≤ E definierten Hillschen Gebiet. Letzteres ist symmetrisch unter der Spiegelung an der q1 –Achse (und hier auch an der q2 –Achse, denn es wurde Z1 = Z2 = 1 gew¨ahlt). Außerdem ist es zusammenh¨angend, denn der Wert E = −3/4 der Gesamtenergie ist gr¨ oßer als der Wert V (0) = −Z+ = −Z1 − Z2 des Sattelpunktes. Wir bemerken folgendes: • Im linken Bild enth¨alt der projizierte 2–Torus keine der Singularit¨aten s1 , s2 , sondern die Trajektorien bewegen sich im Gegenuhrzeigersinn um diese herum. Wegen der Zeitumkehr-Symmetrie (p1 , p2 , q1 , q2 ) → (−p1 , −p2 , q1 , q2 ) gibt es noch einen zweiten invarianten Torus mit den gleichen Konstanten K und E, entsprechend einer Bewegung im Uhrzeigersinn. • Im mittleren Bild enth¨alt die Projektion des invarianten 2–Torus auf den Konfigurationsraum beide Singularit¨aten s1 , s2 . 8 Diese Definition von H ist schlampig geschrieben, denn H ˆ ist Funktion der kartesischen Koordinaten.
250
11.3. Himmelsmechanik 2
0
2
2
0
s2
s1
0
2
2
2
q2
2
2
q2
0
0
2
s2
q2
2
2
2
q1
q1
0
q1
Abbildung 11.3.2: Drei Trajektorien im Zweizentren-Potential f¨ ur Energie E = −3/4, Drehimpuls = 0 und unterschiedliche Werte Ki der Konstanten der Bewegung Hξ • Im rechten Bild verbleibt die Trajektorie in der N¨ahe von s2 . Zu dem Wert K der Konstanten der Bewegung existiert (wegen der Symmetrie (p1 , p2 , q1 , q2 ) → (−p1 , p2 , −q1 , q2 )) neben dem invarianten 2–Torus dieser Trajektorie noch ein zweiter, dessen Projektion auf das Hillsche Gebiet nur s1 enth¨alt. Die Verzweigungsmenge ist durch die Menge der Werte gegeben, f¨ ur die die Abbildung vom Phasenraum in den Raum der Konstanten der Bewegung nicht lokal trivial ist (siehe Definition 7.23). F¨ ur den Fall = 0 erhalten wir eine Bewegung in einer Ebene. Durch Untersuchung der Extrema von Vξ und Vη stellen wir fest, dass f¨ ur den ˆ einfachsten (zweidimensionalen) Fall = 0 das Bild von (H , Hξ ) der Abschluss eines Gebietes im R2 ist, welches durch die Graphen folgender Kurven begrenzt wird: Aus K = Hξ ≥ Vξ ergibt sich K ≥ K+ (E) mit K+ (E) :=
E
2 Z+ 4E
−(Z+ +E)
, 0 > E > −Z+ /2 , E ≤ −Z+ /2
2
,
aus −K = Hη ≥ Vη ergibt sich K ≤ K− (E) mit 2 Z− , E > |Z− |/2 . 4E K− (E) := |Z− | − E , E ≤ |Z− |/2 F¨ ur die symmetrische Situation Z1 = Z2 ist das Verzweigungsdiagramm (siehe Abbildung) die Vereinigung der beiden Randkurven K± und der drei Geraden im Bild ˆ , Hξ ) von (H
1
2
1
1
K
1
Verzweigungsdiagramm f¨ ur das Zweizentren-Problem mit = 0 und Z1 = Z2 = 1
¨ • E = 0, entsprechend dem Ubergang von kompakten zu nicht kompakten Energiefl¨achen, • K = 0, entsprechend dem kritischen Wert von Vη bei η = ±π/2
11. Bewegung im Potential
251
ˆ , Hξ )– • und K0 (E) := −2(Z+ + E). Diese Gerade K0 entspricht den (H Werten des periodischen Orbits, der zwischen s1 und s2 oszilliert, der also den konstanten Koordinatenwert ξ = 0 hat. Im Verzweigungsdiagramm entsprechen die drei Punkte bei Energie E = −3/4 in ihrer Position (links, Mitte, rechts) den drei Trajektorien aus Abbildung 11.3.2. In Waalkens, Dullin und Richter [WDR] wird die Verzweigung auch f¨ ur ungleiche Massen/Ladungen und f¨ ur d = 3 Freiheitsgrade analysiert. Nicht alle Trajektorien positiver Energie E sind Streubahnen. Der gebundene Orbit, der zwischen den beiden Zentren hin und her l¨auft, ist hyperbolisch und besitzt damit instabile und stabile Mannigfaltigkeiten. Diese sind d–dimensional und besitzen den Parameterwert K(E). In der nebenstehenden Abbildung sieht man f¨ ur d = 2 die KonfigurationsraumProjektion einer Familie von Trajektorien, die eine solche Mannigfaltigkeit bilden. Wegen der Reversibilit¨at der Bewegung sehen diese Bahnen f¨ ur die in der Vergangenheit gebundenen Entweichorbits und in der Zukunft gebundenen Einfangorbits gleich aus, nur die Durchlaufrichtung unterscheidet sich.
2
0
2 2
q2
0 2
q1
11.26 Bemerkung (Das Gravitationsfeld der Erde) Newton bemerkte 1687, dass die rotierende Erde an ihren Polen abgeplattet sein m¨ usse. In Proposition XIX, Problem III des Band III seiner Principia [Ne] folgerte er aus einer Berechnung, die die Erde wie einen Fl¨ ussigkeitstropfen behandelte: . . . and therefore the diameter of the earth at the equator is to its diameter from pole to pole as 230 to 229.’ Dies wurde durch Messungen im Wesentlichen best¨atigt.9 Obwohl die Erdoberfl¨ache mit den Bergen H¨ ohenunterschiede im Kilometerbereich aufweist, un¨ terscheidet sich das Geoid, also die idealisierte Aquipotentialfl¨ ache des Gravitationsfeldes auf Meeresh¨ ohe, von einem Rotationsellipsoid um kaum 100 Meter. Dieses Rotationsellipsoid ist fast raumfest. Satellitenbahnen sind damit in guter N¨aherung integrabel. Zwar modelliert das Zweizentren-Modell ein prolates (zigarrenf¨ormiges) Rotationsellipsoid. Es kann aber durch analytische Fortsetzung auf die oblate (abgeplattete) Form der Erde angewandt werden. Heute sind durch GPS- und andere Techniken die Satellitenbahnen bis Zentimetergenauigkeit messbar. Dadurch wird es m¨ oglich, Abweichungen des (harmonischen) Gravitationsfeldes von dem des Zweizentren-Modells sehr genau zu 9 Die tats¨ achliche Abplattung betr¨ agt nur etwa 1/298. Da die Dichte der Erde gegen den Mittelpunkt zunimmt, ist Newtons Berechnung eine obere Schranke f¨ ur die Abplattung. Umgekehrt ging Huygens in [Huy] bei seiner Berechnung der Abplattung von einer im Erdmittelpunkt konzentrierten Masse aus. Aus der Forderung, dass die Summe aus Schwerkraft und Fliehkraft senkrecht auf der Erdoberfl¨ ache wirke, berechnete er eine Abplattung von 1/578 — und damit eine untere Schranke.
252
11.3. Himmelsmechanik
bestimmen. Daraus ergibt sich zwar noch nicht direkt die Dichteverteilung der Erde (siehe dazu Aufgabe 12.37). Trotzdem sind auf diese wichtige R¨ uckschl¨ usse m¨ oglich. 3
11.3.3
Das n–K¨ orper-Problem
D’ailleurs, ce qui nous rend ces solutions p´eriodiques si pr´ecieuses, c’est ” qu’elles sont, pour ainsi dire, la seule br´eche par o` u nous puissions essayer ´, de p´en´etrer dans une place jusqu’ici r´eput´ee inabordable.” Henri Poincare in: Les M´ethodes nouvelles de la m´ecanique c´eleste, Band 1, §36.10 Im Gegensatz zum Zwei-K¨ orper-Problem ist die Bewegung von drei oder mehr Massenpunkten nicht integrabel. Zwar versuchten sich die besten Mathematiker seit Newtons Zeiten an der expliziten L¨ osung der Bewegungsgleichungen. Dass aber Eigenschaften des Systems selbst und nicht mangelnde menschliche F¨ahigkeiten am Scheitern dieser Anstrengungen schuld sein k¨onnten, drang erst allm¨ahlich ins Bewußtsein. 1887 zeigte Heinrich Bruns in [Br], dass neben den bekannten 10 Integralen der Bewegung (Aufgabe 11.21) das n–K¨ orper-Problem keine von diesen unabh¨angige Integrale aufweist, die algebraische Phasenraumfunktionen sind. Dies bedeutet f¨ ur sich genommen noch nicht, dass das System nicht integrabel ist, zeigte aber, dass gewisse L¨ osungsans¨atze erfolglos bleiben mussten (siehe auch [Whi] von Whittaker, §164). Schon im 18ten Jahrhundert wurden jedoch spezielle, besonders symmetrische L¨osungen des n–K¨ orper-Problems gefunden. Daf¨ ur gen¨ ugt eine Betrachtung im Schwerpunktsystem, das heißt auf der Mannigfaltigkeit 2 n mk qk = 0 . 20 := q ∈ M M k=1 1n Die Diagonalmatrix M := k=1 mk 1ld ∈ Mat(nd, R) wird als Massenmatrix bezeichnet 11 . Mit ihr besitzen die hamiltonschen Gleichungen von (11.3.1) die Form Mq˙ = p
, p˙ = −∇V (q)
, oder
M¨ q = −∇V (q).
11.27 Beispiel (Zentralkollisionen) Beginnen wir mit der Ableitung spezieller 20 und r(t) > 0, r(0) = 1. Da ∇V L¨osungen der Form q(t) = r(t)q0 mit q0 ∈ M homogen vom Grad -2 ist, folgt r¨ Mq0 = −r−2 ∇V (q0 )
, also
c Mq0 = ∇V (q0 )
und r¨ = −cr−2 ,
10 Ubersetzung: ¨ Was die periodischen L¨ osungen f¨ ur uns so wertvoll macht, ist, dass sie sozusagen die einzige Bresche bilden, durch die wir versuchen k¨ onnen, an einen f¨ ur uns bisher unzug¨ anglichen Ort zu gelangen. Tats¨ achlich baut die semiklassische Theorie chaotischer Systeme erfolgreich auf der Basis periodischer Orbits auf. Stichworte sind hier die Spurformeln von Selberg und von Gutzwiller. Dies ´ und anderen ausf¨ wird im netzbasierten Chaos Book [Cv] von Cvitanovic uhrlich dargestellt. 11 In (12.6.2) wird das M entsprechende Skalarprodukt definiert.
11. Bewegung im Potential
253
mit c > 0. Von der hamiltonschen Differentialgleichung r¨ = −cr −2 ist schon aus Aufgabe 3.41 bekannt, dass sie nur L¨ osungen besitzt, die in mindestens einer Zeitrichtung Kollisionen aufweisen. Da alle Teilchen gleichzeitig am Nullpunkt kollidieren, spricht man von einer Zentralkollision. F¨ ur jede L¨osung von c Mq0 = ∇V (q0 ) ist die Proportionalit¨atskonstante (q0 ) c = q−V . Dies ergibt sich durch Skalarmultiplikation beider Seiten mit q0 , 0 ,Mq0 denn q0 , ∇V (q0 ) = −V (q0 ). Die Gleichung c Mq0 = ∇V (q0 ) ist 20 erf¨ ullbar, weil im Schwerpunktsystem • f¨ ur n = 2 Teilchen f¨ ur jedes q0 ∈ M die beiden mit den Massen multiplizierten Orte einander negativ gleich sind. • Auch f¨ ur n ≥ 3 Teilchen kann man aus einer L¨osung q0 durch Drehung oder Spiegelung mit O ∈ O(d) und Streckung um λ > 0 eine neue L¨osung λ(O ⊕ . . . ⊕ O)q0 konstruieren. 3 Der obige Ansatz liefert nach Verallgemeinerung auch L¨osungen des n–K¨orperProblems, die kollisionsfrei sind. Die folgenden Begriffe haben sich eingeb¨ urgert: 20 heißt zentral, wenn die Vekto11.28 Definition • Eine Konfiguration q ∈ M ren ∇V (q) und Mq linear abh¨angig sind. 20 heißen ¨ • Zwei zentrale Konfigurationen q, q ∈ M aquivalent, wenn sie auseinander durch orthogonale Transformation aus O(d) und Streckung hervorgehen. 20 des n–K¨orper-Problems heißt homogra• Eine L¨osung I t → q(t) ∈ M phisch, wenn f¨ ur alle Zeiten s, t ∈ I die Konfigurationen q(s) und q(t) zueinander ¨aquivalent sind. 20 heißt kollinear (bzw. planar), wenn • Eine Konfiguration q = (q1 , . . . , qn ) ∈ M span(q1 , . . . , qn ) ⊂ Rd eindimensional (bzw. h¨ochstens zweidimensional) ist. 20 eine planare Zentralkonfiguration, also 11.29 Satz Es sei qˆ = (q1 , . . . , qn ) ∈ M ohne Beschr¨ankung d = 2. t → r(t), ϕ(t) sei eine L¨osung des Kepler–Problems (ˆ q) , in Polarkoordinaten mit r(0) = 1. Dann ist (11.3.3) mit Parameter Z := ˆqV,Mˆ q − sin(ϕ(t)) f¨ ur die Matrixfunktion t → A(t) := r(t)R(t) mit R(t) := cos(ϕ(t)) sin(ϕ(t)) cos(ϕ(t)) 20 t → q(t) := A(t)q1 , . . . , A(t)qn ∈ M eine homographische L¨osung des n–K¨orper-Problems. Beweis: Es ist mit J = 10 −1 0 q¨(t) = r¨(t) − r(t)ϕ˙ 2 (t) R(t)q1 , . . . , R(t)qn + r(t)ϕ(t) ¨ + 2r(t) ˙ ϕ(t) ˙ R(t)Jq1 , . . . , R(t)Jqn .
254
11.3. Himmelsmechanik
Wegen der Form (1.5) der Kepler-DGL in Polarkoordinaten f¨allt der zweite Summand weg. Nach der Newton–Gleichung und da qˆ Zentralkonfiguration ist, gilt V (q) (ˆ q) q q = ˆqV,Mˆ . Mit der obigen Konstante Z ist dies q¨ = −M−1 ∇V (q) = q,Mq q r3 auch mit der Radialkomponente der Kepler–Gleichung (1.5) vereinbar. 2 Wir suchen also nach nicht zueinander ¨aquivalenten zentralen Konfigurationen des n–K¨orperproblems, n ≥ 2. ¨ 11.30 Satz (Moulton [Mou]) Es gibt genau n!/2 Aquivalenzklassen kollinearer Zentralkonfigurationen. Beweis: [Teilweise nach 12 ] • Ohne Beschr¨ankung der Allgemeinheit nehmen wir 20 der Aquivalenzklassen ¨ f¨ ur die Repr¨asentanten q ∈ M an, dass span(q1 , . . . , qn ) = span(e1 ) mit e1 = (1, 0, . . . , 0) ∈ Rd . Wir schreiben entsprechend qk = rk e1 . Damit gibt es genau eine Permutation π ∈ Sn mit rπ(1) < rπ(2) < . . . < rπ(n) . Wir zeigen umgekehrt, dass es f¨ ur jedes π ∈ S genau eine Folge r = (r , . . . , r ) mit r < r < . . . < r , n 1 n π(1) π(2) π(n)
n
n 2 k=1 mk rk = 0 und der Normierung k=1 mk rk = 1 gibt, die das skalare ˜ := diag(m1 , . . . , mn )) Analogon (mit M mk m ˜ −1 ∇U (r) + U (r)r = 0 mit U (r) := − (11.3.20) F (r) := M |rk − r | 1≤k<≤n
der Bedingungsgleichung c Mq = ∇V (q) erf¨ ullt (in der Normierung nk=1 mk rk2 = 1 ist ja c = −U (r)). • Diesem r = (r1 , . . . , rn ) entspricht dann ein Repr¨asentant (q1 , . . . , qn ) einer ¨ Aquivalenzklasse kollinearer Zentralkonfigurationen. ¨ L¨osungen zu π = σ ∈ Sn entsprechen genau dann der gleichen Aquivalenzklasse, wenn π(k) = σ(n − k) (k = 1, . . . , n) gilt, also die Reihenfolge auf der Achse durch Spiegelung umgekehrt wird. Daraus ergibt sich dann die behauptete Anzahl n!/2. • Die Kraft F aus (11.3.20) ist tangential zur Sph¨are n n ˜ SM ˜ := r ∈ R | k=1 mk rk = 0, r, Mr = 1 , ˜ besitzt das Skalarprodukt denn der auf dieser bei r senkrechte Vektor Mr ˜ F (r) = r, ∇U (r) + r, MrU ˜ Mr, (r) = r, ∇U (r) + U (r) = 0. • Wir betrachten ohne Beschr¨ankung der Allgemeinheit das der identischen Perare. mutation entsprechende Gebiet G := {r ∈ SM ˜ | r1 < . . . < rn } der Sph¨ Dieses ist als Schnitt von SM aumen rk < rk+1 f¨ ur n > 2 ˜ mit den n − 1 Halbr¨ diffeomorph zu einem offenen (n − 2)–Simplex. Die Restriktion UG : G → R des 12 R. Moeckel, Celestial Mechanics (Especially Central Configurations), Course at CIME, Trieste (1994)
11. Bewegung im Potential
255
Potentials U auf G ist glatt. Da die Tangentialvektoren v ∈ Tr G nach Definition . ˜ bez¨ uglich des Skalarproduktes ·, ·M := ·, M· auf dem Vektor r senkrecht ˜ stehen, gilt . ˜ −1 ∇U (r) + U (r)r, v = ∇U (r), v = DU (r) v. M F (r), vM ˜ = ˜ M
F ist damit das Gradientenvektorfeld von UG bez¨ uglich des Skalarproduktes ·, ·M osung der Bedin˜ . Insbesondere ist eine Maximalstelle r ∈ G von UG L¨ gungsgleichung F (r) = 0. • Eine solche Maximalstelle existiert, denn limr→∂G UG (r) = −∞. • Sie ist in G eindeutig, denn UG ist eine strikt konkave Funktion (Aufgabe!). 2 F¨ ur das drei-K¨orper-Problem ergeben sich drei Familien kollinearer Zentralkonfigurationen. Diese wurden von Euler 1767 in [Eu] gefunden. Lagrange fand 1772 in [Lag] eine weitere Familie planarer Zentralkonfigurationen des drei-K¨ orper-Problems. In der astronomischen Literatur wird diese in zwei Familien aufgeteilt. Gegeben die Positionen der ersten beiden Massenpunkte in der Ebene bilden die als Lagrange–Punkte L4 und L5 bezeichneten Orte des dritten Massenpunktes mit diesen ein gleichseitiges Dreieck. Die entsprechenden Orte des dritten Massenpunktes in den kollinearen Euler-L¨osungen werden mit L1 , L2 und L3 bezeichnet. 11.31 Satz (Lagrange) Die nicht kollinearen Zentralkonfigurationen des drei-K¨orper-Problems haben die Form eines gleichseitigen Dreiecks. 20 erf¨ Beweis: Die Zentralkonfiguration q = (q1 , q2 , q3 ) ∈ M ullt die Gleichungen c qk =
=k
m
qk − q
qk − q 3
(k = 1, 2, 3).
Durch Summation unter Benutzung der Schwerpunktbedingung − =k m q = mk qk ergibt sich c 1 m − (k = 1, 2, 3). (qk − q ) = 0
qk − q 3 m1 + m2 + m3 =k
Nach Voraussetzung sind die beiden Vektoren qk − q dieser Summe linear unabh¨angig, also ihre Faktoren qk − q −3 − c/(m1 + m2 + m3 ) gleich Null. Damit 2 sind alle Seitenl¨angen qk − q einander gleich.
11.32 Bemerkungen (Zentralkonfigurationen) 1. Erstaunlich ist, dass sich auch f¨ ur ungleiche Massen ein gleichseitiges Dreieck ergibt. ¨ 2. Uber die von ihm gefundenen periodischen L¨ osungen des drei-K¨orper-Problems schrieb Lagrange in [Lag], Seite 230: Cette recherche n’est `a la v´erit´e que de ”
256
11.3. Himmelsmechanik
pure curiosit´e” 13 . Tats¨achlich wurden erst 1906 Himmelsk¨orper bekannt, die sich in der N¨ahe eines Lagrange–Punktes aufhalten. Diese sogenannten Trojaner bev¨olkern die Nachbarschaft von L4 und L5 des durch die Sonne und ihren schwersten Planeten Jupiter gebildeten Paars. Heute geht man von der Existenz von einer Million Trojanern mit Durchmessern u ¨ber einem Kilometer aus. F¨ ur das Paar Erde-Sonne werden die (instabilen) Lagrange–Punkte L1 und L2 als Satellitenstandorte genutzt. 3. F¨ ur n > 3 Teilchen wird die Struktur der Zentralkonfigurationen schnell kompliziert. Immerhin ist f¨ ur n = 4 Massenpunkte seit dem Artikel [HaMo] von ¨ Hampton und Moeckel bekannt, dass es nur endlich viele Aquivalenzklassen planarer Zentralkonfigurationen gibt (vermutlich masseabh¨angig zwischen 32 und 50). 4. Die f¨ unf Lagrange–Punkte f¨ uhren zu Verzweigungen f¨ ur die durch die Konstanten der Bewegung gegebene Abbildung und zu Ver¨anderungen der Topologie der Urbilder. Steven Smale hat in [Sm2] das n–K¨ orper-Problem auf solche Verzweigungen hin untersucht. 3 Die Lagrange–Punkte dienen als Ausgangsbasis f¨ ur ein besseres Verst¨andnis des drei-K¨orper-Problems. Vielleicht am einfachsten sieht man dies im Zusammenhang des restringierten drei-K¨orper-Problems. Bei diesem bewegt sich eine Masse im Feld zweier um ihren Schwerpunkt kreisender Sterne. Es unterscheidet sich vom integrablen Zwei-Zentren-Problem also durch die Rotation mit konstanter Winkelgeschwindigkeit.
L5 L2
V
L4
L1
L3
q2 q1 Abbildung 11.3.3: Potential des restringierten drei-K¨orper-Problems, mit den f¨ unf Lagrange–Punkten 13 Ubersetzung: ¨
Diese Untersuchung geschieht in Wirklichkeit aus reiner Neugier.
11. Bewegung im Potential
257
Das nicht restringierte planare drei-K¨ orper-Problem l¨aßt sich durch Betrachtung des Raums seiner ¨aquivalenten Konfigurationen besser verstehen. Es werden 20 in Aquivalenzklassen ¨ durch Dredabei die Konfigurationen q = (q1 , q2 , q3 ) ∈ M hung und Streckung auseinander hervorgehender Dreiecke eingeteilt. Die entstehende Mannigfaltigkeit besitzt die Topologie einer punktierten Sph¨are S 2 \ {p1 , p2 , p3 }, siehe Abbildung 11.3.4.
Abbildung 11.3.4: Die Formsph¨are, mit den f¨ unf Lagrange–Punkten L1 , . . . , L5 ¨ und den drei Kollisionspunkten Ckl . Der Aquator parametrisiert die kollinearen Konfigurationen, die anderen drei Großkreise die gleichschenkligen. Dies sieht man, indem man die Differenzvektoren q2 − q1 und q3 − q1 als von 1 Null verschiedene komplexe Zahlen interpretiert. Der Quotient qq32 −q −q1 charakte¨ risiert die Aquivalenzklasse. Alle Punkte in C \ {0, 1} kommen als Quotienten vor. Via stereographischer Projektion entspricht C \ {0, 1} der dreifach gelochten Zwei–Sph¨are. Die drei Punkte auf der sogenannten Formsph¨are entsprechen den drei zwei-K¨orper-Kollisionen. 11.33 Definition Eine planare T –periodische L¨osung 20 t → q(t) = q1 (t), . . . , qn (t) ∈ M des n–K¨orper-Problems heißt Choreographie, wenn f¨ ur die Bahnen der n Massenpunkte gilt: qk+1 (t) = q1 (t − T k/n)
(t ∈ R, k = 1, . . . , n − 1),
sie also in gleichem zeitlichen Abstand die gleiche Bahn in der Ebene durchlaufen. In den letzten Jahren wurden zahlreiche Choreographien gefunden, insbesondere eine, bei der drei gleiche Massen eine ,Acht’ durchlaufen (siehe Abbildung 11.3.5). Diese ist stabil, sodass die M¨ oglichkeit besteht, dass irgendwo im Weltraum drei Sterne diesen merkw¨ urdigen Tanz auff¨ uhren.
258
11.3. Himmelsmechanik
Abbildung 11.3.5: Eine stabile L¨ osung des drei-K¨orper-Problem, nach Chenciner und Montgomery [CM, Mon2]
Wichtiger ist, dass diese und andere Choreographien eventuell einen geometrischeren Zugang zum drei-K¨ orper-Problem er¨ offnen: Aufgefasst als Kurve auf der ¨ Formsph¨are, wickelt sich die ,Acht’ entlang des Aquators um die drei Kollisionssingularit¨aten. Die allgemeine Frage ist, welche Homotopieklassen kollisionsfreier geschlossenen Kurven auf der Formsph¨are L¨ osungen als Repr¨asentanten besitzen.
11.34 Weiterf¨ uhrende Literatur Die Literatur zum himmelsmechanischen n– K¨orper-Problem ist kaum u ucher [AM, DH, HaMe, Mos4, ¨berschaubar. Die Lehrb¨ SM] bieten Einstiege in seine verschiedenen Facetten, [Sa] hat eine ungew¨ohnliche Themenauswahl. 3
Kapitel 12
Streutheorie
12.1 Potentialstreuung . . . . . . . . . . . . . . . . . . . . . . . 260 12.2 Die Møller-Transformationen . . . . . . . . . . . . . . . . . 268 12.3 Der differentielle Wirkungsquerschnitt . . . . . . . . . . . . 275 ¨ 12.4 Zeitverzogerung, Radon–Transform., Inverse Streutheorie 279 12.5 Kinematik der Streuung von n Teilchen . . . . . . . . . . . 286 ¨ 12.6 * Asymptotische Vollstandigkeit . . . . . . . . . . . . . . . 291
Ein Großteil unseres Wissens u ule, Atome und Elementarteilchen stammt ¨ber Molek¨ aus Streuexperimenten, in denen Teilchen definierter Anfangsgeschwindigkeit miteinander oder mit einem feststehenden Target kollidieren. Nach dem Streuprozess wird registriert, welche Teilchen mit welcher Geschwindigkeit auftreten. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 12,
259
260
12.1. Potentialstreuung
Auch wenn die richtige Sprache zur Beschreibung dieser Prozesse die Quantenmechanik ist, stimmen deren Voraussagen in manchen Situationen in guter N¨aherung mit denen der Klassischen Mechanik u ¨berein. Beispiele von klassischen Streuprozessen ist der von Billardkugeln oder von einem Kometen im Schwerefeld unseres Sonnensystems.
12.1
Potentialstreuung
Die geradlinige Bewegung tritt also nur ein, wenn die Dinge sich nicht richtig ” verhalten und nicht vollkommen ihrer Natur gem¨aß sind, indem sie sich vom Ganzen trennen und seine Einheit verlassen.” Nikolaus Kopernikus, in De Revolutionibus Orbium Coelestium (1543) [Kop] Wir untersuchen zun¨achst den Fall der Streuung eines (klassischen) Teilchens in einem langreichweitigen Potential. Dieses wird durch die Hamilton–Funktion H(p, q) := 12 p 2 + V (q)
auf dem Phasenraum P := Rdp × Rdq
(12.1.1)
beschrieben, wobei das Potential V ∈ C 2 (Rdq , R) bei Unendlich gegen Null geht. In der Streutheorie unterscheidet man kurz- und langreichweitige Potentiale, die mit der gegl¨atteten Betragsfunktion · : Rd → [1, ∞) , q := q 2 + 1 und Multiindices α = (α1 , . . . , αd ) ∈ Nd0 , |α| := α1 + . . . + αd und die durch sie α1 αd indizierten partiellen Ableitungen ∂ α := ∂∂ α1 . . . ∂∂ αd wie folgt definiert werden: q1
qd
12.1 Definition (Klassen von Potentialen) V ∈ C 2 (Rd , R) heißt • langreichweitig, wenn f¨ ur geeignete ε > 0, c > 0 gilt −|α|−ε
|∂ α V (q)| ≤ c q
(q ∈ Rd , |α| ≤ 2),
• kurzreichweitig, wenn f¨ ur geeignete ε > 0, c > 0 gilt −|α|−1−ε
|∂ α V (q)| ≤ c q
(q ∈ Rd , |α| ≤ 2).
12.2 Bemerkungen (Reichweite und Asymptotik) 1. Ist V kurzreichweitig, dann ist V auch langreichweitig, mit denselben Konstanten ε und c. 2. Wie in Satz 12.11 gezeigt wird, besitzen kurzreichweitige Potentiale die Eigenschaft, dass in ihnen die Streutrajektorien asymptotisch zu Bahnkurven (0) (0) (t ∈ R) (12.1.2) Φ(0) t (x0 ) = (p (t, x0 ), q (t, x0 )) = p0 , q0 + p0 t der durch H (0) : P → R
, H (0) (p, q) := 12 p 2
12. Streutheorie
261
definierten freien Bewegung mit Anfangswert x0 = (p0 , q0 ) ∈ P sind. Gewisse langreichweitige Potentiale besitzen diese Eigenschaft nicht, etwa das physikalisch wichtige Coulomb-Potential q → −Z/ q (f¨ ur Z > 0 auch Kepler -Potential genannt). Die Kepler-Hyperbel ist zwar asymptotisch zu einer unparametrisierten Geraden, wird aber mit der von der freien Geschwindigkeit √ 2E zu stark abweichenden Geschwindigkeit 2(E + Z/ q ) durchlaufen. 3. Langreichweitige Potentiale eine Kraft F (q) := −∇V (q), die von erzeugen −1−ε , also radial integrierbar ist. Das sichert, der Ordnung F (q) = O q wie wir sehen werden, immerhin eine Asymptotik der Geschwindigkeit. 3 Es sei nun V langreichweitig. Da aus der Stetigkeit und limq→∞ V (q) = 0 folgt, dass das Infimum Vmin := inf q∈Rdq V (q) > −∞ ist, erhalten wir mit dem Satz 11.1 einen vollst¨andigen Fluss (12.1.3) Φ ∈ C 1 (R × P, P ) , p(t, x), q(t, x) := Φt (x) := Φ(t, x) von (12.1.1). Wir wollen nun genauere Informationen u ¨ber diese Dynamik erhalten und unterscheiden zun¨achst zwischen gestreuten und gebundenen Orbits.
12.3 Definition Wir unterscheiden die folgenden Teilmengen des Phasenraums:
Bindungszust¨ ande b := b+ ∩ b− mit b± := x ∈ P lim sup q(t, x) < ∞ , t→±∞
+ − ± Streuzust¨ ande s := s ∩ s mit s := x ∈ P limt→±∞ q(t, x) = ∞ und Einfangzust¨ ande 1 t := t+ ∪ t− mit t± := b± ∩ s∓ . ± F¨ ur Energie E ∈ R setzen wir b± E := b ∩ ΣE etc.
12.4 Bemerkungen 1. Die so definierten Mengen sind Φ–invariant. 2. Da f¨ ur E < 0 wegen limq→∞ V (q) = 0 und H(p, q) ≥ V (q) die Energiefl¨ache ΣE kompakt ist, gilt f¨ ur diese Energien ΣE = bE . Die Energie E = 0 wollen wir aus unserer weiteren Analyse aussparen und uns Energien E > 0 zuwenden. 3 12.5 Satz (Streuasymptotik) Es sei V ein langreichweitiges Potential. • Dann besitzt f¨ ur ein geeignetes c1 > 0 der Virialradius Rvir (E) := c1 E −1/ε (E > 0) die Eigenschaft, dass aus x0 = (p0 , q0 ) ∈ ΣE mit q0 ≥ Rvir (E) und q0 , p0 ≥ 0 folgt: x0 ∈ s+ . • F¨ ur alle Anfangsbedingungen x0 ∈ s± E existieren die asymptotischen Impulse √ p± (x0 ) := lim p(t, x0 ) ∈ Rd , und p± (x0 ) = 2E. t→±∞
1 Englisch:
bounded, scattering, trapped
262
12.1. Potentialstreuung ±
0) d−1 bezeichnen wir die asymptotische Richtung. Mit pˆ± (x0 ) := pp± (x (x0 ) ∈ S • Ist V kurzreichweitig, dann existieren die asymptotischen Impaktparameter ) * ± ± d : s± , q⊥ (x0 ) = lim q(t, x0 ) − q(t, x0 ), pˆ± (x0 ) pˆ± (x0 ) . q⊥ E →R
t→±∞
Beweis: • Wir betrachten ohne Einschr¨ankung der Allgemeinheit nur den Limes t → +∞ und schreiben die L¨ osung mit Anfangswert x0 in der Form t → p(t), q(t) . F¨ ur gilt dann F (t) = q(t), p(t) und, mit Konstanz der Energie E = H(x0 ) = H p(t), q(t) , ) * F (t) = p(t) 2 − q(t), ∇V (q(t)) = 2E − 2V q(t) − q(t), ∇V q(t) . (12.1.4) Damit ist wegen der Langreichweitigkeit von V −ε F (t) ≥ 2E − 2 V q(t) − q(t) ∇V q(t) ≥ 2E − c(2 + d) q(t) , (12.1.5) mit den Konstanten ε und c aus Definition 12.1. Falls nun gilt: q(s) ≥ Rvir (E) mit 1/ε , (12.1.6) Rvir (E) = c1 E −1/ε und c1 := c (2 + d) F (t) := 12 q(t) 2
dann ist die ,Radialbeschleunigung’ F (s) ≥ E > 0. Dies impliziert F (t) ≥ F (0) + Et, solange f¨ ur alle s ∈ [0, t] die Bedingung q(s) ≥ Rvir (E) erf¨ ullt ist. Da F (0) = q0 , p0 ≥ 0 und q(0) ≥ Rvir (E) gilt, ist unter dieser Voraussetzung s ∈ [0, t] , F (s) ≥ Es also
t
F (t) ≥ F (0) +
F (s) ds ≥
0
1 2
%
& 2 Rvir (E) + Et2 .
(12.1.7)
Sei nun T := inf{s > 0 | F (s) = 0}. Aus der Taylor-Entwicklung F (s) = urde F (0) + F (0)s + o(s) ≥ Es + o(s) folgt T > 0. W¨are T ∈ (0, ∞), dann w¨ T F (s) T q(T ) = q(0) + 0 q(s) ds ≥ Rvir (E) und F (T ) = F (0) + 0 F (s) ds ≥ E T > 0 gelten, im Widerspruch zur Definition von T . Es folgt limt→∞ q(t) = ∞, das heißt x0 ∈ s+ . • F¨ ur jedes x0 = (p0 , q0 ) ∈ s+ E existiert eine Zeit t0 mit q(t0 ), p(t0 ) ≥ 0 und Wir nehmen ohne Einschr¨ankung t0 = 0 an. Nach (12.1.7) q(t0 ) ≥ Rvir (E). gilt dann q(t) ≥ (Rvir (E))2 + Et2 f¨ ur alle t ≥ 0, also f¨ ur alle t2 ≥ t1 > 0 t2 t2 −1−ε
p(t2 ) − p(t1 ) = ∇V q(s) ds q(s) ds (12.1.8) ≤ dc t1 t1 ∞ 2 − 1+ε 2 ds ≤ dc Rvir (E) + Es2 t1
≤
d c E−
1+ε 2
∞ t1
s−(1+ε) ds = c2 t−ε 1 mit c2 :=
d c E− ε
1+ε 2
.
12. Streutheorie
263
Damit ist das Cauchy–Kriterium f¨ ur die Existenz von p+ (x0 ) = limt→+∞ p(t) erf¨ ullt. • Gleichzeitig folgt wegen p(t), q(t) ∈ ΣE , also p(t) = 2 E − V (q(t)) und √ lim V q(t) = 0 auch p+ (x0 ) = lim p(t) = 2E > 0. t→∞
t→∞
• F¨ ur q⊥ (t) := q(t) − q(t), pˆ+ pˆ+ (mit pˆ+ := pˆ+ (x0 )) gilt q⊥ (t2 ) − q⊥ (t1 )
t2
t1 t2
= =
) * p(s) − p(s), pˆ+ pˆ+ ds * ) (p(s) − p+ ) − p(s) − p+ , pˆ+ pˆ+ ds,
t1
also f¨ ur t2 ≥ t1 > 0 im kurzreichweitigen Fall analog zu (12.1.8)
q⊥ (t2 ) − q⊥ (t1 ) ≤
∞
p(s) − p+ ds ≤ c3
t1
mit c3 :=
dcE ( 1+ε
− 1+ ε 2
)
p(t) − p ≤ d c
s−1−ε ds =
t1
c3 −ε t ε 1
, denn ∞
+
∞
q(s)
−2−ε
t
∞
ds ≤ d c
(Es2 )−(1+ 2 ) ds = c3 t−(1+ε) . ε
t
+ Also ist auch f¨ ur den asymptotischen Impaktparameter q⊥ (x0 ) = limt→+∞ q⊥ (t) das Cauchy–Kriterium erf¨ ullt. 2
¨ 12.6 Bemerkungen 1. Ahnlich wie die asymptotischen Geschwindigkeiten im periodischen Potential (siehe Satz 11.7) k¨ onnen die asymptotischen Impulse als Ces`aro–Limes geschrieben werden. F¨ ur p± (x0 ) = limt→±∞ p(t, x0 ) gilt 1 p (x0 ) = lim T →∞ T ±
T
p(±t, x0 ) dt = lim 0
t→±∞
q(t, x0 ) . t
(12.1.9)
Anders als in Satz 11.7 ist aber (f¨ ur d ≥ 2) typischerweise p+ (x0 ) = p− (x0 ). 2. Aus Satz 12.5 folgt f¨ ur kurzreichweitige Potentiale die Existenz von (12.1.10) L± (x0 ) := lim q(t, x0 ) ∧ p(t, x0 ) x0 ∈ s± E , t→±∞
also der asymptotischen Drehimpulse (die Zwei–Form q ∧ p kann dabei f¨ ur d = 2 Dimensionen mit der Zahl q1 p2 − q2 p1 , f¨ ur d = 3 mit dem Vektor q × p identifiziert werden). 3
264
12.1. Potentialstreuung
12.7 Aufgaben (Asymptotik der Potentialstreuung) 1. Zeigen Sie, dass die Ces`aro-Limiten in (12.1.9) f¨ ur alle Anfangswerte x0 ∈ P existieren (w¨ahrend es f¨ ur x0 ∈ b± im Allgemeinen keine Limiten limt→±∞ p(t, x0 ) gibt, und bei der Bewegung in periodischen Potentialen noch nicht einmal immer die Ces`aro-Limiten existieren). Diese Eigenschaft nennt man Asymptotische Vollst¨andigkeit, siehe Satz 12.53. 2. Zeigen Sie, dass die asymptotischen Drehimpulse (12.1.10) und damit auch die asymptotischen Impaktparameter auch dann existieren, wenn die Differenz zwischen dem Potential V und einem langreichweitigen aber zentralsymmetrischen Potential W kurzreichweitig ist. Eine analoge Aussage gilt f¨ ur die singul¨aren n-atomigen Molek¨ ulpotentiale V (q) := −
n k=1
Zk
q − sk
und W (q) := −
Z
q
mit den Atompositionen sk ∈ R3 und der Gesamtladung Z :=
(12.1.11)
n k=1
Zk . 3
12.8 Korollar Es sei V ein langreichweitiges Potential. • F¨ ur alle E > 0 ist dann die Energieschale die disjunkte Vereinigung ΣE = bE ∪˙ sE ∪˙ tE
(12.1.12)
von Bindungs- Streu- und Einfangzust¨anden. Dabei ist bE kompakt und sE offen. • Es gibt eine Energieschranke E0 > 0, so dass es f¨ ur alle E ≥ E0 nur Streuzust¨ande gibt, das heißt ΣE = sE . (12.1.13) + ˙ + Beweis: • Wir zeigen zun¨achst ΣE = s+ E ∪ bE . Dass die beiden Mengen sE und + bE disjunkt sind, folgt direkt aus ihrer Definition. • Falls x0 ∈ ΣE nicht in b+ liegt, gibt es eine aufsteigende Folge von Zeiten (tn )n∈N mit q(tn+1 ) ≥ q(tn ) und limn→∞ q(tn ) = ∞. Es gibt also ein n ur F (t) := 12 q(t) 2 , eine mit q(tn ) ≥ Rvir (E) und, wegen F (tn+1 ) > F (tn ) f¨ Zeit t ∈ [tn , tn+1 ] mit F (t) = q(t), p(t) ≥ 0 und q(t) ≥ Rvir (E). F¨ ur den Phasenraumpunkt x(t) = (p(t), q(t)) ∈ ΣE besagt Satz 12.5, dass x(t) ∈ s+ ist. Da die Menge s+ unter Φ invariant ist, ist auch der Anfangspunkt x0 ∈ s+ . • Die durch die Dynamik in der Vergangenheit bestimmte analoge Zerlegung ˙ − ache folgt aus dem Satz 11.5 u usse. ΣE = s− ¨ber reversible Fl¨ E ∪ bE der Energiefl¨ • Zusammen ergeben die beiden Zerlegungen − ˙ + − ˙ + − ˙ + − ˙ − ˙ + ˙ ΣE = (s+ E ∩ sE ) ∪ (sE ∩ bE ) ∪ (bE ∩ sE ) ∪ (bE ∩ bE ) = sE ∪ tE ∪ tE ∪ bE ,
˙ + also wegen tE = t− E ∪ tE die Aussage (12.1.12). • Wir setzen E0 := cε1 mit der Konstanten c1 aus (12.1.6), sodass Rvir (E0 ) = 1 gilt, und betrachten f¨ ur E ≥ E0 und Anfangswert x0 = (p0 , q0 ) ∈ ΣE die Zeitabh¨angigkeit von F (t) = 12 q(t) 2 .
12. Streutheorie
265
Wegen der nun f¨ ur alle x0 ∈ ΣE geltenden Ungleichung F (t) ≥ 2E − −ε E0 q(t) ≥ E > 0 (siehe (12.1.5)) folgt F (t) ≥ F (0) + F (0)t +
E 2 t , 2
also limt→∞ q(t) = ∞, das heißt x0 ∈ sE und damit (12.1.13). • bE ist in der beschr¨ankten Teilmenge {(p, q) ∈ ΣE | q ≤ Rvir (E)} enthalten. Ist x∞ Limes einer Cauchy–Folge (xn )n∈N in bE , dann folgt aus der Stetigkeit des Flusses Φt (x∞ ) = lim Φt (xn ) (t ∈ R). (12.1.14) n→∞
W¨are x∞ ∈ s+ urde f¨ ur ein geeignetes t gelten: E , dann w¨ q(t, x∞ ) > Rvir (E)
,
q(t, x∞ ), p(t, x∞ ) > 0.
Dies w¨ urde wegen (12.1.14) auch f¨ ur Φt (xn ) mit n groß gelten. Dann w¨are aber + auch xn ∈ s+ . Also ist x ∈ b und auch x∞ ∈ b− ∞ E E E , bE also abgeschlossen, und damit kompakt. + − • Daraus folgt im Umkehrschluss, dass s± E offen ist, also auch sE = sE ∩ sE . 2 Wir haben mit dem Korollar die Existenz von Bahnen ausgeschlossen, f¨ ur die lim sup q(t) = ∞
, aber
t→∞
lim inf q(t) < ∞
(12.1.15)
t→∞
oder das Analogon f¨ ur t → −∞ gilt. Wir fassen die in Satz 12.5 gewonnenen Informationen u ¨ber die Asymptotik von Streubahnen folgendermaßen zusammen. Bezeichnen wir mit T S d−1 := {(u, v) ∈ Rd × Rd | u = 1, u, v = 0}
(12.1.16)
das Tangentialb¨ undel der (d − 1)–Sph¨are S d−1 (siehe Seite 466), dann haben wir Abbildungen d−1 s± E → TS
,
± x → pˆ± (x), q⊥ (x)
gefunden. Die Mannigfaltigkeit T S d−1 parametrisiert die orientierten Geraden im Rd , denn diese k¨onnen wir eindeutig in der Form t → v + ut mit
(u, v) ∈ T S d−1
darstellen. Die Ortsraumtrajektorie t → ± + q(t) ist nun gegen die Geraden s → q⊥ ± s p in dem Sinn asymptotisch, dass im Limes t → ±∞ die Minimalabst¨ande
q2
S1
v
u
q1
266
12.1. Potentialstreuung
Painlev´ es Stockholmer Vorlesungen Auf Einladung K¨ onig Oskars II. von Schweden hielt im Jahr 1895 der 31-j¨ahrige Mathematiker (und sp¨atere franz¨ osische Premierminister) Paul Painlev´ e in Stockholm eine Vorlesungsreihe u ¨ber Differentialgleichungen. Als H¨ohepunkt und Ende des zwei Jahre sp¨ater ver¨offentlichten, fast 600 Seiten umfassenden Manuskripts [Pai] stellte er fest, dass in der Himmelsmechanik neben Kollisionen auch andere Formen von Singularit¨aten denkbar seien (siehe die Handschrift 2 , und [DH]).
Diese Vermutung wurde fast hundert Jahre sp¨ater durch Jeff Xia in [Xi] bewiesen. Wie dieser 1992 zeigte, k¨ onnen im himmelsmechanischen n–K¨orperProblem (1.8) Massenpunkte in endlicher Zeit nach Unendlich entweichen. In der von ihm gefundez P nen Konfiguration saust ein Botenstern wie ein Weberschiffchen immer schneller zwischen zwei Doppelsternsystemen hin und her P und treibt sie in endlicher Zeit in S die Unendlichkeit. S Das hat offensichtlich nichts mehr Q Q mit astronomischer Realit¨at zu tun, zeigt aber, auf was man bei der mathematischen Behandlung des n–K¨orperproblems gefaßt sein muss. Analoge L¨osungen, bei denen aber Xias L¨ osung des 5–K¨orper-Problems der die Divergenz erst im Limes unHimmelsmechanik, aus Moser [Mos6] endlicher Zeiten auftritt, existieren ebenfalls. F¨ ur den Ort des Botensterns gilt dann (12.1.15), und die Geschwindigkeiten besitzen keinen Limes (die Bewegung ist also nicht asymptotisch vollst¨andig im Sinn von Definition 12.40). Manchmal l¨asst in der Mathematik ein Beweis auf sich warten. 1
2
1
2
2 ’. . . points du syst´ eme tendent vers des positions limites ` a distance finie, ou bien il existe au moins quatre points du syst´ eme, soit M1 , . . . , Mμ (μ ≥ 4) qui ne tendent vers aucune position limite ` a distance finie, et qui de plus sont tels que le minimum ρ(t) de leurs distances mutuelles tende vers z´ero avec t − t1 , sans qu’aucune de ces distances tende constamment vers
12. Streutheorie
267 ± + s p± ) d± q(t) := min q(t) − (q⊥ s∈R
gegen Null gehen. Denn ± ± d± q(t) = q⊥ (t) − q⊥
± (t) := q(t) − q(t), pˆ± pˆ± . mit der im Satz 12.5 untersuchten Gr¨ oße q⊥
12.9 Bemerkung (Langreichweitige Potentiale) Eine solche Asymptotik der Streutrajektorie gegen Geraden kann auch bei langreichweitigen Potentialen vorkommen, siehe Aufgabe 12.7.2. Man denke nur an die Kepler–Hyperbeln. Allerdings werden gem¨ 12.2 diese Kepler–Hyperbeln mit der + aß Bemerkung Z durchlaufen. Das weicht von der GeGeschwindigkeit t → 2 E + q(t) √ schwindigkeit 2E der von H (0) (p, q) = 12 p 2 erzeugten freien Bewegung so weit ab, dass eine asymptotische Synchronisierung im Sinne der Existenz eines + + (t − t0 )p+ ) = 0 nicht erreicht werden kann: 3 t0 mit limt→∞ q(t) − (q⊥ 12.10 Aufgaben (Streuorbits) 1. Zeigen Sie, dass f¨ ur die Kepler–Hyperbeln der Energie E > 0 und mit Drehimpuls ∈ R im Potential q → −Z/ q die zwischen zwei Radien verstrichene Zeit durch das entsprechende bestimmte Integral zu
+ 2 r r Z √ − 2 (12.1.17) dr = √ 1+ 2 2 rE 2r E 2r E + 2Zr − 2E Z 1 2 E + Zr − 1 2 ) − ln Er + Z + E(r + c 2 2 (2E)3/2
gegeben ist. Der logarithmische Term in (12.1.17) verunm¨oglicht eine asymptotische Synchronisierung (siehe auch Thirring [Th1], Kapitel 4.2). 2. Wir betrachten f¨ ur E > 0 die Energiefl¨ache ΣE ⊆ P := R2p × R2q der Hamilton–Funktion 3 H : P → R, H(p, q) = 12 p 2 + V (q) z´ ero.’ ¨ Ubersetzung: ’. . . Massenpunkte streben zu Positionen mit endlichem Abstand, oder es gibt mindestens vier Massenpunkte M1 , . . . , Mμ , (μ ≥ 4), die nicht gegen eine Limesposition endlichen Abstandes konvergieren, und f¨ ur die das Minimum ρ(t) ihres Abstandes mit t − t1 gegen Null strebt, ohne dass einer der Abst¨ ande gegen Null konvergiert’. [In Xias Beispiel konvergieren manche, aber nicht alle Abst¨ ande.] 3 Diese Hamilton–Funktion tritt im Beweis der Nichtintegrabilit¨ at der klassischen Yang-MillsGleichung mit Eichgruppe SU(2) auf.
268
12.2. Die Møller-Transformationen
mit Potential V (q) := 12 q12 q22 . Zeigen Sie: Außer den vier Orbits in der abgeschlossenen Menge sE := (p, q) ∈ ΣE | q1 q2 = p1 p2 = 0, q p gibt es keine Anfangsbedingungen x0 ∈ ΣE mit limt→∞ q(t, x0 ) = ∞. Insbesondere ist also die Menge sE der Streuorbits nicht offen. Tipp: Betrachten Sie unter der Annahme x0 ) = +∞ die Gr¨ oße J(p, q) := lim t→∞ q1 (t, 1 2
q1 q22 +
p22 q1
q2
=
q1
und beweisen Sie, dass diese
n¨aherungsweise konstant ist (siehe Abschnitt 15.2). Folgern Sie durch Vergleich mit H, dass sie gleich Null ist. 3
12.2
Die Møller-Transformationen
Wit vergleichen nun den von H aus (12.1.1) erzeugten Fluss (12.1.3) mit der von H (0) erzeugten freien Dynamik (12.1.2). 12.11 Satz • F¨ ur kurzreichweitige Potentiale V ∈ C 2 Rd , R sind die MøllerTransformationen 4 (vergleiche mit Bemerkung 12.2.2 und Abbildung 12.2.1) Ω± : P+(0) → s±
, Ω± := lim Φ−t ◦ Φ(0) t t→±∞
(12.2.1)
auf dem Phasenraumbereich P+(0) := Rdp \ {0} × Rdq Hom¨oomorphismen, die energieerhaltend sind: H ◦ Ω± (x) = H (0) (x) (12.2.2) x ∈ P+(0) . • Bez¨ uglich der Zeitumkehr T (Definition 11.3) gilt Ω− = T ◦ Ω+ ◦ T . • Die Møller-Transformationen konjugieren die beiden Fl¨ usse: ± Ω± ◦ Φ(0) (t ∈ R). (12.2.3) t = Φt ◦ Ω • Ist sogar das Potential V ∈ C ∞ Rd , R und besitzt kompakten Tr¨ager, dann sind Ω± glatte symplektische, also volumenerhaltende Abbildungen.
12.12 Bemerkungen (Varianten) 1. Mit mehr Arbeit als im nachfolgenden Beweis kann man unter den Voraussetzungen von Satz 12.11 die Differenzierbarkeit der Møller-Transformationen f¨ ur kurzreichweitige Potentiale ableiten. 4 Christian Møller, d¨ anischer Physiker (1904–1980). Artikel: General properties of the characteristic matrix in the theory of elementary particles. Danske Vid. Selsk. Mat.-Fys. Medd. 23, (1945) 1–48
12. Streutheorie
269
2. Falls die Definition 12.1 kurzreichweitiger Potentiale V in dem Sinn versch¨arft w¨ urde, dass f¨ ur V ∈ C ∞ (Rd , R) mit geeigneten cα > 0 gilt: |∂ α V (q)| ≤ cα q−|α|−1−ε
q ∈ Rd , α ∈ Nd0 ,
dann w¨aren die Møller-Transformationen ebenfalls C ∞ –Diffeomorphismen. 3. Falls man Definition 12.1 aber abschw¨acht, indem man keine Abfallbedingung f¨ ur die zweite Ableitung stellt, kann man Potentiale finden, bei denen verschiedene Orbits die gleichen asymptotischen Daten besitzen (siehe Simon [Sim]). Das Ph¨anomen ist vergleichbar mit der Existenz mehrerer L¨osungen des Anfangswertproblems nicht lipschitz–stetiger Differentialgleichungen, siehe Beispiel 3.11.2. 3
p0
supp(V )
q0 q0 + p0 t +
Ω ((p0 , q0 ))
Abbildung 12.2.1: Definition der Møller-Transformation Ω+ f¨ ur ein Potential V mit kompaktem Tr¨ager Beweis: • Wir beginnen mit der einfacher zu beweisenden letzten Aussage. Außerhalb des Phasenraumbereichs u ¨ber dem kompakten Tr¨agers supp(V ) = {q ∈ Rd | V (q) = 0} von V stimmen Fl¨ usse u ur ¨berein. Daher wird f¨ die beiden alle x0 = (p0 , q0 ) ∈ P + := H −1 (0, ∞) der Limes in (12.2.1) schon nach endlicher Zeit erreicht. Denn wegen p0 = 0 liegt auch die offene PhasenraumUmgebung U (x0 ) := x ∈ P | x − x0 < 12 p0
von x0 ganz in P + . F¨ ur alle x = (p, q) ∈ U (x0 ) ist die Geschwindigkeit p > 12 p0 > 0. d = {q ∈ Rd | q ≤ R} Andererseits liegt supp(V ) im Inneren einer Kugel BR von großem Radius R > 0, w¨ahrend der Abstand des Anfangspunktes q zu deren Mittelpunkt 0 kleiner als q0 + 12 p0 ist. Daher hat der freie Fluss die Menge U (x0 ) nach einer Minimalzeit
R+q0 + 12 p0 x ∈ U (x ) < T ≡ T (x0 ) := sup R+q 1 0 p p 2
0
270
12.2. Die Møller-Transformationen
endg¨ ultig aus dem u uhrt. ¨ber supp(V ) liegenden Phasenraumbereich herausgef¨ Damit gilt f¨ ur alle x ∈ U (x0 ): Ω+ (x) = (0) (0) lim Φ−T −t ◦ Φ(0) ◦ Φ(0) t+T (x) = lim Φ−T ◦ Φ−t ◦ Φt T (x) = Φ−T ◦ ΦT (x), t→+∞
t→+∞
was mit Satz 3.45 Existenz und Glattheit der Møller-Transformation impliziert. Dass die Abbildung Ω+ symplektisch, also volumenerhaltend ist, folgt aus der entsprechenden Eigenschaft von Φt und Φ(0) t , also aus Satz 10.13. (0) ur • Wegen der Energieerhaltung (H ◦ Φ−t = H und H (0) ◦ Φ(0) t = H ) gilt f¨ (0) ± x = (p, q) ∈ P+ : H ◦ Ω (x) = lim H ◦ Φ(0) t (x) =
t→±∞
(0) lim H (0) ◦ Φ(0) t (x) + lim V (q + tp) = H (x).
t→±∞
t→±∞
• Mit Satz 11.5 ist unter Verwendung von T ◦ T = IdP Ω−
= =
(0) lim Φt ◦ Φ(0) −t = lim (T ◦ Φ−t ◦ T ) ◦ (T ◦ Φt ◦ T ) t→+∞ (0) T ◦ lim Φ−t ◦ Φt ◦ T = T ◦ Ω+ ◦ T .
t→+∞
t→+∞
ur alle Diese Beziehung gilt immer dann, wenn der Limes Ω+ existiert, also auch f¨ (0) (0) kurzreichweitigen Potentiale. Es ist Ω± ◦ Φ(0) t = (lims→±∞ Φ−s ◦ Φs ) ◦ Φt = (0) (0) (0) lims→±∞ Φ−s ◦ Φs+t = limt→±∞ Φt−u ◦ Φu = Φt ◦ (limu→±∞ Φ−u ◦ Φu ) = Φt ◦ Ω± . ¨ • Ahnlich wie im Fall der zeitlokalen L¨ osung des Anfangswertproblems (Satz 3.17 von Picard-Lindel¨ of) werden wir jetzt die Møller-Transformationen als Fixpunkte kontrahierender Abbildungen darstellen. Die Bedingung der Kurzreichweitigkeit aus Definition 12.1 entspricht dann einer Lipschitz–Bedingung bei Unendlich. Wir nehmen an, dass f¨ ur x0 = (p0 , q0 ) ∈ P+(0) eine Anfangsbedingung x0 ∈ P existiert mit limt→∞ [q(t, x0 ) − q (0) (t, x0 )] = 0 (wobei (p(0) , q (0) ) = Φ(0) die freie Bewegung bezeichnet, also q (0) (t) ≡ q (0) (t, x0 ) = q0 + p0 t). Dann w¨ urde auch gelten limt→∞ p(t, x0 ) = p0 . Der Differenzvektor Q(t) ≡ urde die Differentialgleichung Qx0 (t) := q(t, x0 ) − q (0) (t, x0 ) w¨ Q (t) = −∇V q(t, x0 ) erf¨ ullen, die wir auch in der Form
Q (t) = −∇V q (0) (t) + Q(t)
(12.2.4)
schreiben k¨onnen. Wir suchen wegen der Randbedingung limt→∞ Q(t) = 0 also nach L¨osungen der Integralgleichung ∞ ∞ Q(t) = − ∇V q (0) (τ ) + Q(τ ) dτ ds. (12.2.5) t
s
) F¨ ur alle Zeiten T ∈ R ist Q[T,∞) damit Fixpunkt der Abbildung Ax0 ≡ A(T x0 ∞ ∞ (Ax0 w)(t) := − ∇V (q (0) (τ ) + w(τ )) dτ ds t ∈ [T, ∞)
t
s
(12.2.6)
12. Streutheorie
271
auf dem normierten Raum C ≡ C (T ) := w ∈ C [T, ∞), Rd w (T ) :=
sup w(t) < ∞ . t∈[T,∞)
Nach Satz D.1 aus Anhang D ist (C (T ) , · (T ) ) ein vollst¨andiger metrischer Raum. • Tats¨achlich bildet Ax0 den Raum C in sich ab, denn mit c1 := q0 + w (T ) ist ∞ ∞ ) (T ) ∇V q (0) (τ ) + w(τ ) dτ ds
A(T (w)
≤ x0 T s ∞ ∞ −2−ε q (0) (τ ) + w(τ ) dτ ds ≤ dc T s ∞ ∞ −2−ε ≤ dc p0 τ − c1 dτ ds < ∞. T
s
Die Konstante c > 0 stammt dabei aus der Definition 12.1 kurzreichweitiger Potentiale. In der letzten Ungleichung wurde benutzt, dass f¨ ur x0 = (p0 , q0 ) ∈ P+(0) der Anfangsimpuls p0 = 0 ist. ) (T ) • F¨ ur große Anfangszeiten T ist außerdem die Abbildung A(T → C (T ) x0 : C (T ) eine Kontraktion. Denn f¨ ur w0 , w1 ∈ C gilt (T ) A (w1 ) − A(T ) (w0 )(T ) x0 x ∞ ∞0 ∇V q (0) (τ ) + w1 (τ ) − ∇V q (0) (τ ) + w0 (τ ) dτ ds ≤ T s ∞ ∞ 1 (0) D∇V q (τ ) + wr (τ ) · w1 (τ ) − w0 (τ ) dr = dτ ds T s 0 ∞ ∞ −3−ε ≤ c3 p0 τ − c2 dτ ds w1 − w0 (T ) . (12.2.7)
T
s
Hierbei wurde der Hauptsatz der Differential– und Integralrechnung benutzt, aus dem die Lemma von Hadamard genannte Identit¨at folgt: F¨ ur F (x) := ∇V (q (0) (τ ) + x) , xi := wi (τ ) (i = 0, 1) und xr := (1 − r)x0 + rx1 gilt:
1
F (x1 )−F (x0 ) = 0
dF (xr ) dr = dr
0
1
dxr dr = DF (xr ) dr
1
DF (xr )·(x1 −x0 ) dr. 0
In (12.2.7) kann c2 := q0 + w0 (T) + w1 (T ) gew¨ahlt werden. F¨ ur T → +∞ ∞ ∞ −3ε ) geht die Lipschitz–Konstante c3 T s p0 τ − c2 dτ ds von A(T x0 gegen Null, die Abbildung ist also f¨ ur große T eine Kontraktion. Damit sind alle Voraussetzungen des banachschen Fixpunktsatzes (Satz D.3) erf¨ ullt, und wir erhalten einen eindeutigen Fixpunkt Q, zun¨achst als Kurve auf dem Intervall [T, ∞), dann durch L¨ osung der Differentialgleichung (12.2.4) als Kurve Q : R → Rd .
272
12.2. Die Møller-Transformationen
ur gege• Qx0 h¨angt stetig von den Anfangsbedingungen x0 ∈ P+(0) ab. Denn f¨ ur alle benes w ∈ C ist die in (12.2.6) definierte Abbildung x0 → (Ax0 w)(t) f¨ ∂ t ∈ [T, ∞) stetig differenzierbar. F¨ u r die Richtungsableitung in die Phasen∂v v raumrichtung v = vpq ∈ Rdp × Rdq ist n¨amlich mit v˜(t) := vq + tvp ∞ ∞ ∂v (Ax0 w)(t) = − D∇V q (0) (τ ) + w(τ ) · v˜(τ ) dτ ds, t
s
wobei die Vertauschbarkeit von Differentiation und Integration durch die (in x0 lokal gleichm¨aßigen) Absch¨atzungen , v˜(τ ) = O τ D∇V q (0) (τ ) + w(τ ) = O τ −3−ε und den Satz von Lebesgue gerechtfertigt ist. −ε Damit ist ∂v (Ax0 w)(t) = O(t ), also ∂v Ax0 w (T ) < ∞. Anwendung des parametrisierten Fixpunktsatzes (Satz D.4) ergibt die Stetigkeit von x0 → Qx0 . • Die Møller-Transformation ist also durch Ω+ (x0 ) = p0 + Qx0 (0) , q0 + Qx0 (0)
x0 = (p0 , q0 ) ∈ P+(0)
gegeben und stetig. Die Existenz und Stetigkeit der Umkehrabbildung (Ω± )−1 : s± → P+(0)
,
x → lim Φ(0) −t ◦ Φt (x) t→±∞
folgt analog, durch Vertauschung der Rollen der beiden Dynamiken.
2
12.13 Aufgabe (Møller-Transformationen in 1D) Zeigen Sie, dass in d = 1 Dimension f¨ ur ein kurzreichweitiges Potential V die Streutransformation S := ur Energien gr¨ oßer als Vmax := supq∈R V (q) ≥ 0 (Ω+ )−1 ◦ Ω− (siehe (12.2.8)) f¨ durch S(p, q) = p, q − p τ (p) (p, q) ∈ R2 , E := 12 p2 > Vmax gegeben ist, mit der Zeitverz¨ogerung (siehe auch Thirring [Th1], Kapitel 3.4, und Abschnitt 12.4) % & −1/2 − (2E)−1/2 dq. 3 2(E − V (q)) τ (p) := R
12.14 Beispiel (Zerlegung des Phasenraums) Phasenraum P = Rp × Potential V wie in Abbildung 12.2.2 (oben). Die Phasenraumpunkte x1 , x3 sind Streuzust¨ande, w¨ahrend x2 ∈ t+ und x4 ∈ t− Einfangzust¨ande sind. Bindungszust¨ande sind in schwarzer Farbe markiert.
Rq , ∈s Die 3
Anschaulich besteht das Bild s± von P+(0) unter Ω± aus den Phasenraumpunkten, die in der Zukunft beziehungsweise der Vergangenheit nach Unendlich entweichen, und im Allgemeinen ist s+ = s− . Ein in der Vergangenheit gebundenes
12. Streutheorie
273
V 1 1 2
4
2
x1 x2 x3
2
2 0
p
2
q
4 2
0
x4
q
2
Abbildung 12.2.2: Bindungs-, Streu- und Einfangzust¨ande (erstere schwarz) Teilchen kann also durchaus in Zukunft frei werden und umgekehrt. Zum Beispiel kann ein Meteorit vom System Erde-Mond eingefangen werden. Ist ein solcher Vorgang zu erwarten? Um eine Antwort auf die Frage zu geben, wollen wir das Maß 5 λ2d (s+ Δs− ) der Menge von Zust¨anden, die nur in einer Zeitrichtung streuen, betrachten. Dabei ist λ2d das Lebesgue–Maß auf P = Rdp × Rdq . 12.15 Satz (Maß der Einfangzust¨ ande) F¨ ur die Streuung an Potentialen V ∈ Cc2 (Rdq , R) ist das Lebesgue–Maß der Einfangzust¨ande t = s+ Δs− gleich Null: λ2d (t) = 0. Der anschauliche Grund f¨ ur die Richtigkeit des Satzes ist, dass sich das aus dem Unendlichen kommende Phasenraumvolumen wegen der maßerhaltenden Eigenschaft des Flusses Φt nicht im Endlichen stauen kann. Dies formuliert der schwarzschildsche Einfangsatz: 5 Die
symmetrische Differenz zweier Teilmengen A, B ⊂ M ist AΔB := (A \ B) ∪ (B \ A).
274
12.2. Die Møller-Transformationen
12.16 Satz (Schwarzschildscher Einfangsatz) Es sei Φ : Z × P → P ein das Maß μ auf P erhaltendes dynamisches System und A ⊆ P messbar mit μ(A) < ∞. Dann gilt f¨ ur die Teilmengen A± := ∩t∈N0 Φ±t (A) von A: μ(A+ ) = μ(A+ ∩ A− ) = μ(A− )
, also μ(A+ ΔA− ) = 0.
Beweis: F¨ ur alle T ∈ Z folgt aus der Φ-Invarianz von μ μ(A± ) = μ ∩t∈N0 Φ±t (A) = μ ΦT (∩t∈N0 Φ±t (A)) = μ ∩t∈N0 ΦT ±t (A) , also (wegender Stetigkeit des Maßes μ von oben, siehe Bauer [Bau], Satz 3.2) 2 μ(A± ) = μ ∩t∈Z Φt (A) = μ(A+ ∩ A− ). Beweis des Satzes 12.15. Die Menge t = s+ Δs− der Einfangzust¨ande ist messbar, denn s+ und s− sind offen. t ist im Phasenraumgebiet H −1 ([0, E0 ]) enthalten, mit der Energieschranke E0 aus Korollar 12.8. F¨ ur k ∈ N definieren wir die Mengen Ak := {(p, q) ∈ H −1 ([0, E0 ]) | q ≤ k}. Als kompakte Teilmengen des Phasenraums besitzen diese endliches Lebesgue– Maß. Wir k¨onnen auf sie daher den schwarzschildschen Einfangsatz anwenden − − 2d ∪k∈N A+ und erhalten λ2d A+ k ΔAk = 0, also auch λ k ΔAk = 0. − Andererseits ist die Menge t der Einfangzust¨ande in ∪k∈N A+ k ΔAk enthalten, woraus die Behauptung folgt. 2 Unter der Voraussetzung der Existenz der Møller-Transformationen und der asymptotischen Vollst¨andigkeit k¨ onnen wir die von Narnhofer und Thirring in [NT] eingef¨ uhrte Streutransformation S:D→D
x → (Ω+ )−1 ◦ Ω− (x)
mit
D := (Ω− )−1 (s)
(12.2.8)
definieren, siehe nebenstehende Abbildung. Damit wird f¨ ur x ∈ D (0) S(x) = lim Φ(0) −t ◦ Φ2t ◦ Φ−t (x).
t→∞
x
Aus (12.2.3) folgt, dass die Streutransformation mit der freien Bewegung vertauscht, also gilt: (0) S ◦ Φ(0) t = Φt ◦ S
(t ∈ R). (12.2.9) In der Streutransformation sind alle relevanten Informationen u ¨ber das Resultat des Streuprozesses codiert.
S(x) Definition der Streutransformation S
Im Gegensatz zu den Møller-Transformationen ist sie im Prinzip durch Streuexperimente messbar, also in der mathematischen Modellierung durch Zeitlimiten von Observablen.
12. Streutheorie
275
12.17 Bemerkung (Quantenmechanische Streuung) Um Kontakt mit (mikroskopischen) Streuexperimenten herzustellen, muss typischerweise aus S der Wirkungsquerschnitt berechnet werden (siehe Abschnitt 12.3). Denn bei diesen ist im Allgemeinen der Impaktparameter nicht messbar. Ironischerweise besitzt die Nullmenge t der klassischen Einfangzust¨ande eine zentrale Bedeutung besonders f¨ ur den quantenmechanischen Streuprozess. Dessen sogenannten Resonanzen lassen sich in vielen F¨allen auf diese Nullmenge beziehen. Der Grund ist folgender: Streubahnen in s mit kleinem Abstand zu t verweilen lange in der N¨ahe gebundener Bahnen und besitzen damit eine große Zeitverz¨ogerung. Da in der Quantenmechanik wegen des Interferenzeffektes solche Laufzeitunterschiede zu Phasenverschiebungen und Amplitudenverst¨arkung beziehungsweise -verminderung der auslaufenden Welle f¨ uhren, k¨onnen Resonanzen auftreten. Die Struktur von t kann sehr verwickelt sein. Beispielsweise besitzt im f¨ ur die Molek¨ ulstreuung relevanten n–Zentren-Problem diese Menge f¨ ur n ≥ 3 Zen¨ tren lokal die Struktur einer Cantor–Menge [Kn3]. Ahnliches geschieht bei der Streuung an Kreisscheiben, siehe Uzy Smilansky [Smi], und [KS]. 3
12.3
Der differentielle Wirkungsquerschnitt
In Streuexperimenten mit Elektronen, Atomen oder anderen Teilchen wird oft ein Target mit einem Teilchenstrahl beschossen und danach die richtungsabh¨angige Intensit¨at der gestreuten Teilchen gemessen. Dabei sind die Abmessungen des Strahls groß gegen¨ uber dem Abstand benachbarter Teilchen im Target, sodass der Impaktparameter nicht direkt gemessen werden kann. 12.18 Beispiel (Rutherford–Experiment) Thomson, der 1897 in Kathodenstrahlexperimenten das Elektron entdeckt hatte, entwarf das sogenannte Plumpuddingmodell der Atome, bei dem die negativ geladenen Elektronen (wie Rosinen im Pudding) in einem homogenen positiven Ladungshintergrund steckten. 1909 u uften Geiger und Marsden unter Anleitung von Rutherford dieses ¨berpr¨ Modell, indem sie Alphateilchen auf eine sehr d¨ unne Goldfolie lenkten. Aus der Winkelabh¨angigkeit der gestreuten Alphateilchen (die dem Wirkungsquerschnitt des Coulomb–Potentials entspricht, siehe Satz 12.21) leitete Rutherford 1911 sein Atommodell ab, das die Existenz eines Atomkerns postuliert. 3 Der differentielle Wirkungsquerschnitt ist nun eine experimentell messbare Gr¨oße, die besagt, wie in Abh¨angigkeit von Teilchenenergie und Einfallswinkel die Winkelverteilung der Intensit¨at der gestreuten Teilchen aussieht. Dabei wird Gleichverteilung der Impaktparameter der einfallenden Teilchen vorausgesetzt. Wie l¨asst sich diese sprachliche Definition formalisieren? Es sei zun¨achst f¨ ur Energie E > 0 A± E :=
± pˆ± (x), q⊥ (x) ∈ T S d−1 | x ∈ sE
(12.3.1)
276
12.3. Der differentielle Wirkungsquerschnitt
die Menge der Streudaten f¨ ur diese Energie.6 Da zu jedem Punkt von A± E genau ein Streuorbit geh¨ ort, k¨ onnen wir eine stetige Abbildung durch − − d−1 , pˆ (x), q⊥ (x) → pˆ+ (x) ϕE : A− E →S definieren. Hierbei ist x ein beliebiger Punkt auf dem Streuorbit. Nach Korollar d−1 . 12.8 sind f¨ ur langreichweitige Potentiale und Energien E > E0 die A± E = TS 12.19 Definition • F¨ ur θ − ∈ S d−1 bezeichne λθ− das (d − 1)–dimensionale Lebesgue–Maß auf dem Vektorraum Tθ − S d−1 := {q ∈ Rd | q, θ − = 0}. Das Bildmaß von λθ− unter der Abbildung ϕE,θ − := ϕE Tθ− S d−1 : Tθ− S d−1 → S d−1 bezeichnen wir mit σ(E, θ− ). • Der Differentielle Wirkungsquerschnitt Bildmaßes am Punkt θ + ∈ S d−1 .
dσ − + dθ (E, θ , θ )
ist die Dichte dieses
12.20 Bemerkung Genau gesagt, ist der differentielle Wirkungsquerschnitt die uglich des roRadon–Nikodym–Ableitung des Maßes σ(E, θ− ) auf der Sph¨are, bez¨ tationsinvarianten Wahrscheinlichkeitsmaßes μ auf S d−1 . Als Bildmaß des Lebesgue–Maßes ist σ(e, θ − ) kein endliches Maß. Ob es absolut stetig zu μ ist, wie im Satz von Radon–Nikodym gefordert, ist jeweils im konkreten Streuproblem zu u ufen. 3 ¨berpr¨ 12.21 Satz (Rutherford–Streuquerschnitt) Wir betrachten die Streuung durch das Coulomb–Potential 2, R V ∈ C∞ M
, V (q) = −
Z
q
2 := Rd \{0} f¨ auf dem Konfigurationsraum M ur d ≥ 2 und eine Ladung Z ∈ R \ {0}. Dann ist f¨ ur E > 0 der differentielle Wirkungsquerschnitt gleich dσ (E, θ− , θ + ) = dθ+
d−1 |Z| , 4E sin2 12 Δθ
wobei Δθ ∈ (0, π] den Winkel zwischen θ− und θ+ bezeichnet.
dΣ dΘ 20 10
0
Π 2
Π
3Π 2
Θ
2Π
6 Ist E regul¨ arer Wert von H, so l¨ asst sich (analog zu Satz 12.15) zeigen, dass (bez¨ uglich des nat¨ urlichen Maßes auf T S d−1 ) die Komplementmengen T S d−1 − A± E Maß Null besitzen. Diese geh¨ oren zu den Einfangorbits.
12. Streutheorie
277
Beweis: • Wir betrachten zun¨achst den Fall der Dimension d = 2. F¨ ur den Wert des Drehimpulses L ist der Impaktparameter bei Energie E − = p− = √2E . Wir berechnen zun¨achst in Polarkoordinaten (r, ϕ) gleich q⊥ die Drehimpulsabh¨angigkeit des Streuwinkels ∞ dϕ Δθ(E, ) = 2 dr + π, (12.3.2) rmin dr mit dem Perizentrumsradius rmin , also dem Radius des Punktes der Hyperbel, der dem Ursprung am n¨achsten kommt. Dort ist die Radialgeschwindigkeit Null, also 2 Z E − W (r) = E + − 2 = 0, r 2r was rmin ≥ 0 bestimmt. Unter Benutzung von dϕ dr = 2 und = 2(E − W (r)), dt r dt siehe die Formel (1.6) in der Einleitung, ergibt sich modulo 2π ∞ 2 Z −1 √ dr = 2 tan , Δθ(E, ) = 2 2E rmin r 2 2 E + Z − 2 r 2r 2 Z Δθ = . cot 2E 2 2E Der Betrag der Ableitung nach Δθ ist damit − dq⊥ |Z| 1 dΔθ = 4E sin2 1 Δθ , 2
oder
− =√ q⊥
(12.3.3)
also die Behauptung f¨ ur d = 2. • F¨ ur d ≥ 3 bemerkt man, dass im Vektorraum Tθ− S d−1 ∼ = Rd−1 der Impaktparameter r (siehe Definition 12.19) die Vollkugel vom Radius r das Volur besitzt, w¨ahrend dem durch die Bedingung Δθ˜ ∈ [0, Δθ] men vd−1 0 r˜d−2 d˜ Δθ ˜ d−2 dΔθ˜ zudefinierten Kugelsegment in S d−1 das Volumen vd−1 0 (sin(Δθ)) kommt (dabei bezeichnet vd das Volumen der d–dimensionalen Einheitskugel). Die Quotient beider Integranden ist der differentielle Wirkungsquerschnitt. ˜ stehen die beiden Integrationsvariablen nach (12.3.3) ˜ := q − (Δθ)
F¨ ur r˜(Δθ) ⊥ ˜ = |Z| cot Δθ˜ . Es gilt also unter Verwendung des in der Beziehung r˜(Δθ) 2E 2 ˜ = 2 sin Δθ˜ cos Δθ˜ trigonometrischen Additionstheorems sin(Δθ) 2 2 vd−1 r˜d−2 dd˜θr˜ ˜ d−2 vd−1 sin(Δθ)
⎞d−2 ⎛ ⎛ ⎞d−1 ˜ |Z| cot Δ2θ |Z| |Z| ⎠ =⎝ ⎠ , =⎝ ˜ ˜ 2E sin Δθ˜ 4E sin2 Δθ 4E sin2 Δθ
was die Formel auch f¨ ur Dimension d ≥ 3 beweist.
2
2
2
278
12.3. Der differentielle Wirkungsquerschnitt
12.22 Bemerkungen (Rutherford–Streuung) 1. W¨ahrend also der differentielle Wirkungsquerschnitt in Vorw¨artsrichtung divergiert (denn weit entfernte Teilchen werden nur wenig abgelenkt), ist er auch f¨ ur die R¨ uckw¨artsrichtung (entsprechend einer Kollisionsbahn7 ) von Null verschieden. Dies schloss das Plumpudding–Modell aus. 2. Man beachte, dass der Rutherford–Streuquerschnitt unabh¨angig von dem Vorzeichen der Ladung Z ist. 3. Der analoge Wirkungsquerschnitt in der Quantenmechanik hat die gleiche Form. Dies war hilfreich, denn 1911, als Rutherford seinen Streuquerschnitt aus der Klassischen Mechanik ableitete, stand die Schr¨odinger–Gleichung der Quantenmechanik noch nicht zur Verf¨ ugung. 3 12.23 Beispiel (Regenbogensingularit¨ at) V ∈ C 2 (R2 , R) sei ein zentralsymmetrisches Potential mit kompaktem Tr¨ager, also V (q) = W ( q ) f¨ ur eine Funktion W mit W (r) = 0 f¨ ur alle gen¨ ugend großen r, etwa r ≥ R > 0. Da V beschr¨ankt ist, gibt es Energien E > supq V (q), und f¨ ur diese wollen wir den Wirkungsquerschnitt analysieren. F¨ ur Impaktparameter, die betragsm¨aßig gr¨oßer als R sind, trifft die Bahn nicht den Tr¨ager von V , wird also auch nicht abgelenkt. Ebenso ist aus Symmetriegr¨ unden jede Bahn mit Impaktparameter Null geradlinig. Andererseits gibt es f¨ ur V = 0 Bahnen, die abgelenkt werden (warum?). Wegen der stetig differenzierbaren Abh¨angigkeit der Richtungs¨anderung Δθ vom Impaktparameter und der Symmetrie Δθ(−q⊥ ) = −Δθ(q⊥ ) muss es also ein von Null verschiedenes Maximum von Δθ geben. Dort ist dΔθ ur diesen dq⊥ = 0, und f¨ Winkel divergiert der differentielle Streuquerschnitt (im Gegensatz zum Streuquerschnitt des singul¨aren Coulomb-Potentials!). Dieses Ph¨anomen tritt beispielsweise bei der Streuung von Licht an Wassertropfen auf und heißt daher Regenbogensingularit¨at. Diese ist eine Faltungssingularit¨at im Sinn von Beispiel 8.39. 3 12.24 Aufgabe (Streuung bei hohen Energien) Der Tr¨ager des Potentials V ∈ C 2 (Rd , R), V = 0 sei in einer Kugel vom Radius R enthalten, und
V ∞ := sup |V (q)| q∈Rd
, ∇V ∞ := sup ∇V (q) . q∈Rd
(a) Zeigen Sie, dass mit der Maximal– beziehungsweise Minimalgeschwindigkeit vmax := 2(E + V ∞ ) , vmin := 2(E − V ∞ ) 7 Genau genommen m¨ usste die Kepler–Bewegung f¨ ur diese Kollisionsbahn regularisiert werden. Das f¨ uhrt dann auch f¨ ur Δθ = π zu dem Ausdruck f¨ ur den Rutherford-Streuquerschnitt.
12. Streutheorie
279
f¨ ur alle E > V ∞ die Geschwindigkeit der Richtungs¨anderung des Teilchens der Energie E im Potential durch dθ ∇V ∞ ≤ dt vmin absch¨atzen l¨asst.
& % 2vmin uckge(b) Zeigen Sie, dass sich f¨ ur Zeiten t ∈ 0, ∇V ∞ der vom Teilchen zur¨ legte Abstand durch 0 ≤ t vmin − 12 ∇V ∞ t ≤ q(t) − q(0) ≤ vmax t beidseitig absch¨atzen l¨asst. (c) Zeigen Sie, dass f¨ ur Teilchenenergien E ≥ V ∞ + 2R ∇V ∞ das Teilchen gestreut wird und dabei h¨ ochstens eine Winkel¨anderung
Δθ ≤
2R ∇V ∞ ≤1 E − V ∞
erf¨ahrt (allgemein f¨ uhren glatte langreichweitige Potentiale f¨ ur hohe Energien E zu einer Streuung mit kleinen Richtungs¨anderungen O(1/E)). 3
12.4
Zeitverz¨ ogerung, Radon–Transformation, Inverse Streutheorie
Woher wissen wir eigentlich, wie die Wechselwirkungen zwischen mikroskopischen Teilchen aussehen? Das Beispiel des rutherfordschen Atommodells aus dem Abschnitt 12.3 deutet darauf hin, dass diese Kenntnis mit Streuexperimenten erlangt werden kann. Allerdings stellen sich die folgenden Fragen: 1. K¨onnte auch ein anderes Potential als das Coulomb–Potential zum rutherfordschen Streuquerschnitt (Satz 12.21) f¨ uhren? 2. H¨atte Rutherford, wenn er nicht den richtigen Ansatz f¨ ur das Potential gehabt h¨atte, dieses im Prinzip aus seinen Streudaten berechnen k¨onnen? 3. Welche experimentell messbaren Gr¨ oßen erlauben gegebenenfalls die Rekonstruktion des Potentials? Eine negative Antwort auf die erste Frage w¨ urde nat¨ urlich die Existenz der in den folgenden Fragen angesprochenen Inversen Streumethode unm¨oglich machen. 12.25 Beispiele 1. Nichtexistenz einer 1D inversen Streutheorie Dies ist in der Tat die Situation f¨ ur d = 1 Dimensionen: Es sei V : R → R ein kurzreichweitiges Potential und Φ der zugeh¨orige Fluss. Dann gilt f¨ ur das
280
12.4. Zeitverz¨ ogerung, Radon–Transform., Inverse Streutheorie
um ∈ R verschobene Potential V () (das heißt V () (q) := V (q − )) mit der Transformation des Phasenraums W () : P → P
, (p, q) → (p, q + ),
dass der zu V () geh¨ orende Fluss Ψ() die Form ()
Ψt = W () ◦ Φt ◦ W (−)
(t ∈ R)
besitzt. Wir betrachten nun den Phasenraumbereich P + := H −1 (Vmax , ∞) mit Vmax := supq∈R V (q). Dort kehren die L¨osungen p(t, x0 ), q(t, x0 ) := Φt (x0 ) ihre Richtung nicht um, das heißt sign(p(t, x0 )) ist t–unabh¨angig. Sei S () die Streutransformation zu Ψ() und S die zu Φ. Dann gilt S () (x) = S(x)
(x ∈ P + ),
(12.4.1)
man kann also den Streudaten nicht ansehen, dass das Potential verschoben wurde. Gleichung (12.4.1) folgt f¨ ur x = (p, q) mit T := /p aus der Relation W (−) (x) = (p, q − ) = Φ(0) /p (x): S () (x)
=
()
(0) lim Φ(0) −t ◦ Ψ2t ◦ Φ−t (x)
t→∞
=
() lim Φ(0) ◦ Φ2t ◦ W (−) ◦ Φ(0) −t ◦ W −t (x) (0) (−) (x) W () ◦ lim Φ(0) −t ◦ Φ2t ◦ Φ−t ◦ W
=
W () ◦ S ◦ W (−) (x) = Φ/p ◦ S ◦ Φ−/p (x) = S(x).
=
t→∞
t→∞
Im letzten Schritt wurde die Vertauschbarkeit von S mit Φ(0) , also (12.2.9) benutzt. (12.4.1) folgt auch durch explizite Berechnung (Aufgabe 12.13). 2. Differentieller Wirkungsquerschnitt In keiner Raumdimension d kann man aus dem differentiellen Wirkungsquerschnitt (Definition 12.19) das Potential V rekonstruieren, denn dieser ist invariant unter Translation von V . 3 Erfreulicherweise ist die Situation in d ≥ 2 Dimensionen und f¨ ur andere Streudaten g¨ unstiger. Verschiedene Potentiale f¨ uhren zu verschiedenen Streutransformationen, und es gibt auch Verfahren, erstere aus Streudaten wie etwa der Zeitverz¨ogerung zur¨ uckzugewinnen. Diese Methoden sind verwandt mit denen der Radon– beziehungsweise R¨ontgen–Transformation, die in der Computertomographie Anwendung findet. 12.26 Definition In Dimension d ≥ 2 ist die R¨ ontgen–Transformierte einer Funktion f ∈ C 2 (Rd , R) mit kompaktem Tr¨ager die Funktion (siehe Definition 12.1.16) Rf : T S d−1 → R
(u, v) →
f (v + tu) dt. R
12. Streutheorie
281
12.27 Bemerkungen (R¨ ontgen– und Radon–Transformation) 1. f wird also u ¨ber diejenige Gerade mit der Richtung u ∈ S d−1 integriert, die dem Ursprung 0 ∈ Rd am Punkt v ∈ Tu S d−1 = {q ∈ Rd | q, u = 0} am n¨achsten kommt. 2. Bei der Radon–Transformation 8 wird statt u ¨ber Geraden u ¨ber Hyperfl¨achen integriert. F¨ ur d = 2 stimmt diese daher im Wesentlichen mit der R¨ontgen– Transformation u ¨berein. 3. Die Computertomographie wurde vom Physiker Allan Cormack (1924–1998) und dem Ingenieur Godfrey Hounsfield (1919–2004) theoretisch und praktisch entwickelt. In den 1970er Jahren, also zu einem Zeitpunkt, als die effektive Berechnung der inversen Radon–Transformation mit Computern m¨ oglich wurde, entstanden die ersten Prototypen (siehe nebenstehende Skizze von Hounsfield). 4. Ein Standard-Lehrbuch zur Computertomographie ist [Nat] von Natterer. Das Buch [Hel] von Helgason u ¨ber die (gruppentheoretisch definierten, auch die R¨ontgen–Transformation beinhaltenden) Radon–Transformationen ist auch auf seiner Homepage erh¨altlich. 5. Die genaue Bestimmung der Klassen von Funktionen f , auf die man die R¨ontgen– bzw. Radon–Transformation anwenden kann, ist eine subtile, aber praktisch wichtige Frage. Man denke etwa bei f : R3 → R+ an die optische Dichte des durchleuchteten Gewebes im R¨ontgenbereich (sog. R¨ontgenAbschw¨achungsfaktor ). Dann wird an Grenzfl¨achen zwischen Knochen und Muskelgewebe der Wert von f springen (siehe Kapitel IV.2 in [Nat]). 3 In der Computertomographie misst man nun die Intensit¨aten der das Objekt durchleuchtenden R¨ ontgenstrahlen und damit Rf . Die mathematische Aufgabe besteht darin, aus Rf auf f zur¨ uckzuschließen. Dazu ist zun¨achst wichtig: • R ist eine lineare Abbildung. Die Frage ist also, ob deren Kern nur aus der Nullfunktion besteht. • F¨ ur die Definitionsbereiche von Rf und von f gilt: dim(T S d−1 ) = 2d − 2, was f¨ ur d ≥ 2 gr¨ oßer oder gleich dim(Rd ) ist. Wir haben also – im Gegensatz zu einer Dimension – in h¨ oheren Dimensionen eine Chance, das Problem zu l¨osen. 8 Der osterreichische Mathematiker Johann Radon (1887–1956) untersuchte in einer Arbeit ¨ von 1917 diese nach ihm benannte Integral–Transformation.
282
12.4. Zeitverz¨ ogerung, Radon–Transform., Inverse Streutheorie
Der Schl¨ ussel zur Invertierung des Operators R ist die folgende im Englischen Fourier–slice–theorem genannte Aussage. • Darin bezeichnet Fd : S Rd → S Rd
−d/2
, (Fd f )(k) = (2π)
f (x)e−ik·x dx
Rd
die Fourier–Transformation auf dem Raum der Schwartz–Funktionen9 des Rd . • Weiter sei f¨ ur die Richtung u ∈ S d−1 , (Ru f )(v) = (Rf )(u, v) Ru : S Rd → S Tu S d−1 die Restriktion der R¨ ontgen–Transformation (also das, was der Computer– Tomograph sieht, wenn die R¨ ontgen–Strahlung in Richtung u weist). • Die Fourier–Transformation einer Funktion auf dem (d − 1)–dimensionalen u bezeichnet. Unterraum Tu S d−1 = {v ∈ Rd | u, v = 0} wird mit Fd−1 12.28 Satz (Fourier–slice–Theorem) Es gilt f¨ ur d ≥ 2 √ u Fd−1 Ru f (k) = 2π (Fd f )(k) u ∈ S d−1 , k ∈ Tu S d−1 . Beweis: Wir k¨onnen f¨ ur u ∈ S d−1 alle x ∈ Rd eindeutig in der Form x = tu + v mit v ∈ Tu S d−1 und t ∈ R schreiben. Damit erhalten wir d−1 u (2π) 2 Fd−1 Ru f (k) = (Ru f )(u, v)e−iv·k dv d−1 Tu S f (v + tu) dt e−iv·k dv = f (v + tu)e−i(v+tu)·k dt dv = Tu S d−1
= Rd
R
Tu S d−1 R
f (x)e−ix·k dx = (2π)d/2 (Fd f )(k),
denn u · k = 0.
2
Es folgt, dass der Operator R der R¨ ontgen–Transformation invertiert werden kann, denn die Fourier–Transformation Fd : S Rd → S Rd ist invertierbar. 12.29 Bemerkung (Schlecht gestellte Probleme) Die Integration mittelt hochfrequente Oszillationen, w¨ahrend ihre Umkehroperation, die Differentiation, diese verst¨arkt. Dies f¨ uhrt dazu, dass die R¨ ontgen–Transformation, auf geeigneten Funktionenr¨aumen definiert, ein kompakter Operator, ihre Umkehrabbildung aber unbeschr¨ankt ist. Praktisch f¨ uhrt dies zu einer starken Verst¨arkung des Rauschens der Bilddaten. Hier werden zur Regularisierung Methoden aus der Theorie schlecht gestellter Probleme benutzt, siehe etwa das Buch [Lou] von Louis. 3 9 Der
Schwartz–Raum S Rd ist der Funktionenraum S Rd := f ∈ C ∞ (Rd , C) | ∀ α, β ∈ Nd0 : t → tα ∂ β f (t) ist beschr¨ ankt .
12. Streutheorie
283
Wir kommen zur Streutheorie zur¨ uck. Aus der in (12.2.8) definierten Streutransformation S : D → D f¨ ur kurzreichweitige Potentiale kann man die Transformation der in Satz 12.5 eingef¨ uhrten asymptotischen Impulse und Impaktparameter berechnen, denn mit − − (p , q ) ∈ s (p+ , q + ) := S (p− , q − ) sind die p± schon die asymptotischen Impulse, und die asymptotischen Impaktparameter ergeben sich mit ± q⊥ = q± −
q ± , p± 2
p±
p± .
In S steckt neben diesen 2d − 1 Koordinaten noch eine weitere Information, n¨amlich die von H. Narnhofer in [Nar] eingef¨ uhrte 10 Zeitverz¨ogerung τ :D→R
p− , q − − p+ , q + , τ (p− , q − ) = .
p± 2
(12.4.2)
12.30 Bemerkung (Zeitverz¨ ogerung) Diese beschreibt, um wieviel l¨anger sich (im Limes R → ∞) die Bahnkurve mit Anfangswert x = (p, q) = Ω+ (p+ , q + ) = Ω− (p− , q − ) d mit großem Radius R aufh¨alt, als das die Bahnkurven der in einer Kugel BR freien Bewegung tun. Dies liest man von der folgenden Zeichnung ab.
q2 q q1
q q
Br
• Da die beiden Bahnkurven der freien Bewegung Geraden sind, sind deren Schnitte mit der Kugel Strecken der L¨angen ± 2 ± 2
= 2R 1 − q⊥
/R = 2R+O(1/R). (12.4.3) L± (R) = 2 R2 − q⊥ Im Limes R → ∞ geht deren L¨angendifferenz also gegen Null. 10 Siehe auch den Uberblicksartikel ¨ [CN] u ¨ber klassische und quantenmechanische Zeitverz¨ ogerung.
284
12.4. Zeitverz¨ ogerung, Radon–Transform., Inverse Streutheorie
* ) ± ± = 0) (mit p± , q⊥ • F¨ ur den Weg von q ± zum zentrumsn¨achsten Punkt q⊥ braucht die freie Bewegung die Zeit t± := −
p± , q ± ,
p± 2
(12.4.4)
denn p± , q ± + t± p± = 0. Von diesem Punkt aus wird betragsm¨aßig noch ± otigt, um BR zu verlassen. die Zeit L2p(R) ± ben¨ • Stimmen die wirklichen Orbits und ihre freien Asymptoten außerhalb BR schon u ¨berein, h¨alt sich der Orbit in BR exakt die Zeit TR mit + L (R) L− (R) + − TR = +t +t − − (12.4.5) 2 p+
2 p−
auf, sonst geht die Differenz beider Seiten im Limes R → ∞ gegen Null. • Setzt man (12.4.3) und (12.4.4) in (12.4.5) ein, dann ergibt sich mit τ aus Formel (12.4.2): 3 lim TR − L± (R)/ p± = τ (p− , q − ) . R→∞
12.31 Satz (Zeitverz¨ F¨ ur die Bahnkurve t → q(t) ≡ q(t, x) mit An ogerung) fangswert x = Ω± (p± , q ± ) ∈ s und Energie E := H(x) ist % − − ) * & −1 τ (p , q ) = (2E) dt. (12.4.6) 2V q(t) + q(t), ∇V q(t) R
p− ,q− −p+ ,q+ Beweis: • Nach Definition (12.4.2) ist τ (p− , q − ) = , denn 2E
p± 2 = 2E. • Andererseits ist nach Definition (12.2.1) der Møller-Transformationen Ω± ) * lim p(t), q(t) − p± , q ± + tp± = 0 t→±∞
, also nach dem Hauptsatz der Differential- und Integralrechnung (wie f¨ ur p = dq dt in (12.1.4)) ) − −* ) + +* d p(t), q(t) dt = p ,q − p ,q 2E − dt R % ) * & = dt. 2E − 2 E − V (q(t)) + q(t), ∇V q(t) R
Damit ergibt sich die Formel.
2
Statt auf dem Definitionsbereich D ⊂ P (0) wie in (12.4.2) k¨onnen wir durch Fixierung der Energie E die Zeitverz¨ ogerung auch als Funktion auf T S d−1 auffassen.
12. Streutheorie
285
Mit der zu Streudaten der Energie E > 0 geh¨orenden Teilmenge A− E ⊆ aus (12.3.1) bekommen wir eine wohldefinierte Abbildung TS d−1
τ˜E : A− E →R
,
− := τ (p− , q − ) . τ˜ pˆ− , q⊥
F¨ ur alle Energien E > E0 besteht nach Korollar 12.8 die Energieschale nur aus Streuzust¨anden, sodass dann τ˜E auf ganz T S d−1 definiert ist. Wir betrachten nun ein Potential V ∈ C ∞ (Rd , R) mit kompaktem Tr¨ager und die Funktion fE : Rd → R
,
fE (q) :=
2V (q) + q, ∇V (q) . 2E 2(E − V (q))
Aus einer Taylor–Absch¨atzung von fE (q) folgt, gleichm¨aßig in q ∈ Rd fE (q) =
2V (q) + q, ∇V (q) + O E −5/2 . 3/2 (2E)
(12.4.7)
F¨ ur große Energien wird fE in (12.4.6) n¨aherungsweise entlang der freien Bahnkurve integriert, um die Zeitverz¨ ogerung zu erhalten: 12.32 Satz (Inverse Streutheorie) Bei Energie E > E0 ist die Differenz zwischen der Zeitverz¨ogerung τ˜E und der R¨ontgen–Transformierten von fE ΔE := τ˜E − RfE : T S d−1 → R von der Ordnung supx |ΔE (x)| = O E −5/2 . 12.33 Bemerkung (Inverse Streutheorie) Wir k¨onnen also durch Messung ur große Energie E kleinen von τ˜E die R¨ontgen–Transformierte von fE mit einem f¨ Fehler der relativen Ordnung O(1/E) rekonstruieren. Nach dem Fourier–slice– Theorem (Satz 12.28) ist damit fE selbst experimentell messbar 11 . Das gleiche gilt aber auch f¨ ur das kurzreichweitige Potential V : Wie man n¨amlich durch Einsetzen u uft, l¨aßt sich V f¨ ur beliebige Dimension d aus ¨berpr¨ dem Z¨ahler F (q) := 2V (q) + q, ∇V (q) in (12.4.7) mit der Formel V (0) =
1 2 F (0)
, V (q) = −
∞
F (tq) t dt
q ∈ Rd \ {0}
1
zur¨ uckgewinnen. Man findet diese L¨ osung der quasilinearen partiellen Differentialgleichung 2V (q) + q, ∇V (q) = F (q) durch Integration entlang des charakteristischen Vektorfeldes. Siehe Arnol’d [Ar3], Kap. 2.7 und Schmitz [Schm]. 3 11 mit
einem E–abh¨ angigen Fehler, der sich aus den S¨ atzen in [Nat], Kapitel IV.2 ergibt.
286
12.5. Kinematik der Streuung von n Teilchen
Beweis: • Statt durch die Zeit t parametrisieren wir die Bahnkurve t → q(t, x) durch ihre Projektion * ) (t ∈ R), s(t) := p˜− (x), q(t, x) siehe nebenstehende Zeichnung. Dies ist m¨ oglich, falls E groß genug ist, denn dann ist nachAufgabe 12.24.c) die Winkel¨anded rung pˆ− (x), dt q(t, x) kleiner als π/2, also s (t) > 0.
q2
qt,x q
q1
st BR
• Unter Verwendung von
. ) * p(t,x) s (t) = pˆ− (x), p(t, x) = pˆ− (x), p(t,x) 2 E − V (q(t, x))
und Δθ(t) := pˆ− (x), p(t, x) = O(1/E) (Aufgabe 12.24), also . p(t,x) − pˆ (x), p(t,x) = cos Δθ(t) = 1 − sin2 (Δθ(t)) = 1 + O E −2 (12.4.8) erhalten wir mit q˜(s) := q t(s) fE q˜(s) ds + O E −5/2 . τ (x) = R
d d , also auch supp(fE ) ⊆ BR , W¨ahlen wir R > 0 so groß, dass supp(V ) ⊆ BR dann ist R R − fE q˜(s) ds = fE q˜(s) ds = fE q ⊥ + s pˆ− ds + O E −5/2 . R
−R
−R
− Die letzte Absch¨atzung folgt aus q˜(s) − q⊥ + sˆ p− = O(1/E) und der Taylor–Formel f¨ ur die Differenz der Integranden. Also ist − − − τ˜E pˆ , q⊥ = τ p− , q − = RfE pˆ− , q⊥ + O E −5/2 ,
(|s| ≤ R) (12.4.9)
wie behauptet.
12.5
2
Kinematik der Streuung von n Teilchen
Wir betrachten die Bewegung von endlich vielen Teilchen, die aufeinander Kr¨afte aus¨ uben k¨onnen, aber die keinen ¨außeren, also auch von der Position ihres Schwerpunktes abh¨angigen, Kr¨aften unterworfen sind. Eine Frage ist die nach ihrer Dynamik f¨ ur große Zeiten: Formen die Teilchen letztendlich feste Gruppen, Cluster, die untereinander stark wechselwirken k¨onnen, bei denen aber die Wechselwirkung zwischen Teilchen unterschiedlicher Gruppen mit der Zeit abklingt?
12. Streutheorie
287 1 4
3
5 2
Abbildung 12.5.1: Konfiguration von Billardkugeln (links) mit zugeh¨origem Graphen (rechts) und Clusterzerlegung {{1, 3, 4, 5}, {2}} 12.34 Beispiel (Billardkugeln im Raum) Wenn wir n Kugeln im Rd vom Radius R > 0 und mit Massen m1 , . . . , mn > 0 betrachten, dann ist ihr gemeinsamer Konfigurationsraum von der Form 3 M := Rnd \Δ mit Δ := Δi,j 1≤i<j≤n
und Δi,j := {q = (q1 , . . . , qn ) ∈ (Rd )n | qi −qj < 2R}, denn die Mittelpunkte der i–ten und der j–ten Kugel haben einen Mindestabstand 2R. Gem¨aß der Hamilton–Funktion 12 H:P →R
,
H(p, q) :=
n
pi 2 i=1
2mi
auf dem Phasenraum P := Rnd × M der n Teilchen bewegen sich die Teilchen mit konstanter Geschwindigkeit q˙i (t) = pi (0)/mi , bis sie auf den Rand ∂M ihres Konfigurationsraumes stoßen. Hier begegnen uns zum ersten Mal Cluster, denn f¨ ur q ∈ ∂M k¨onnen wir auf der Menge N := {1, . . . , n} diejenigen Elemente i < j durch eine Kante {i, j} verbinden, f¨ ur die qi − qj = 2R gilt, bei denen sich die Kugeln mit den Nummern i und j also ber¨ uhren. Wir erhalten so einen Graphen auf der Menge N von Knoten, und N wird in Cluster untereinander durch Kanten verbundener Knoten zerlegt, siehe Abbildung 12.5.1. • Wir sprechen von einer Konfiguration q ∈ ∂M von Zweierst¨oßen, wenn die Cluster h¨ochstens die Gr¨ oße zwei besitzen. F¨ ur das Cluster {i, j} wird dann die Bewegung nach der Kollision gem¨aß den folgenden Regeln des elastischen Stoßes fortgesetzt. 12 Eine realistischere Betrachtung der Mechanik des Billardspiels findet man in §27 von Sommerfeld [Som]. Dort werden auch hohe und tiefe St¨ oße, Nachl¨ aufer etc. untersucht.
288
12.5. Kinematik der Streuung von n Teilchen
− Die Impulse der Kugeln unmittelbar vor dem Stoß seien p− i , pj , die nach dem + + Stoß pi , pj . Dann gilt: + − − (a) Der Gesamtimpuls bleibt erhalten, das heißt p+ i + pj = pi + pj .
(b) Die Gesamtenergie bleibt erhalten, d.h.
2 p+ i 2mi
+
2 p+ j 2mj
=
2 p− i 2mi
+
p− j . 2mj
(c) Zerlegen wir die Impulse in Komponenten parallel beziehungsweise senkrecht zur Verbindungslinie durch die Mittelpunkte der Kugeln, dann bleiben die senkrechten Komponenten erhalten, das heißt f¨ ur ,±
p± k = pk
+ p⊥,±
gilt
p⊥,+ = p⊥,− k k
(k = i, j).
Aus diesen Regeln ergibt sich eine quadratische Gleichung f¨ ur die zu qi − qj parallele Komponente der Impulse. Diese besitzt (neben der unphysikalischen ,+ ,− L¨osung pk = pk ) die L¨ osung ,+
pi
=
mi −mj mi +mj
,−
pi
+
2mi mi +mj
,−
pj
,+
, pj
=
mj −mi mi +mj
,−
pj
+
2mj mi +mj
,−
pi . (12.5.1)
Mit diesen Daten l¨asst sich die L¨ osung fortsetzen. • Falls dagegen wie in Abbildung 12.5.1 drei oder mehr Kugeln gleichzeitig in einem Cluster zusammenkommen, gibt es im Allgemeinen keine in den Anfangsbedingungen stetige Regel, die Bewegung fortzusetzen, und man nimmt an, dass die gew¨ahlten Anfangsbedingungen nicht zu solchen St¨oßen f¨ uhren (das ist bis auf eine Ausnahmemenge vom Maß Null der Fall). Im Jahr 1998 bewiesen Burago, Ferleger und Kononenko in [BFK], dass es unter diesen Bedingungen nur zu endlich vielen St¨oßen kommt und gaben auch eine obere Schranke f¨ ur die Zahl der Kollisionen an. Da sich die Impulse nach dem letzten Stoß nicht mehr ¨andern, erhalten wir eine Zerlegung in Gruppen von sich mit der gleichen Geschwindigkeit bewegenden Kugeln (wobei typischerweise verschiedene Kugeln auch verschiedene Endgeschwindigkeiten besitzen). 3 12.35 Aufgabe (Billardkugeln) (a) Geben Sie f¨ ur n Kugeln gleicher Masse in einer Dimension (d = 1) eine obere Schranke f¨ ur die Zahl der St¨ oße an. Vergleichen Sie mit der Dynamik des Kugelstoßpendels, siehe nebenstehende Abbildung. (b) Dasselbe f¨ ur drei Kugeln verschiedener Massen. 3 Im Weiteren untersuchen wir die nichtrelativistische Bewegung von n Teilchen im Rd , die sich gegenseitig mit Potentialkr¨aften anziehen oder abstoßen k¨onnen.
12. Streutheorie
289
Bezeichnen wir die Massen dieser Teilchen wieder mit m1 , . . . , mn > 0, dann f¨ uhrt die Hamilton–Funktion H(p, q) :=
n
pk 2 k=1
2mk
+ V (q)
(12.5.2)
zu den Bewegungsgleichungen p˙ k = −∇qk V (q)
, q˙k =
pk mk
(k = 1, . . . , n).
(12.5.3)
Das Potential V soll sich dabei aus Zwei–K¨ orperpotentialen zusammensetzen, das heißt Vi,j (qi − qj ). V (q) = 1≤i<j≤n
12.36 Beispiel Ein prominentes Beispiel ist das n–K¨orper-Problem der Himmi mj melsmechanik aus Kapitel 11.3.3. Bei diesem ist Vi,j (Q) := − Q , und die newtonschen Differentialgleichungen sind (1.8). In der Elektrostatik dagegen beZi Zj sitzen die Teilchen Ladungen Zi ∈ R und Vi,j (Q) := Q . W¨ahrend also die Gravitation anziehend wirkt, stoßen sich gleichnamige Ladungen ab. 3 Die folgende Aufgabe kl¨art, warum das von einer zentralsymmetrischen Massenverteilung, zum Beispiel (n¨aherungsweise) einem Stern, im Außenraum erzeugte Gravitationspotential von der angegebenen Form ist. 12.37 Aufgabe (Potential einer zentralsymmetrischen Massenverteilung) Wir studieren das von einer Massen- oder Ladungsverteilung erzeugte (gravitative oder elektrostatische) Potential. Die stetige Dichte ρ : R3 → [0, ∞) habe 3 = {x ∈ R3 | x ≤ R}. Wir nehmen an, dass ihren Tr¨ager in der Kugel BR sie zentralsymmetrisch ist, das heißt ρ(x) = ρ˜( x ). Das Potential ist gegeben durch: ρ(x) V : R3 → R , V (q) := dx , 3
q − x
BR ρ(x) dx die Masse oder Ladung. und wir nennen M := 3 BR
(a) Erkl¨aren Sie, warum das Potential V zentralsymmetrisch ist, dass also gilt: V (q) = V 0, 0, q . (b) Wir nehmen q = (0, 0, a) an, wobei a > 0. Geben Sie q − x in Kugelkoordinaten an. (c) Zeigen Sie mithilfe von Kugelkoordinaten, dass gilt: 2π R V (q) = rρ˜(r) r + a − |a − r| dr. a 0
290
12.5. Kinematik der Streuung von n Teilchen
(d) Zeigen Sie, dass f¨ ur a > R gilt: V (q) =
M . a
(e) Zeigen Sie, dass f¨ ur 0 < a ≤ R gilt: V (q) = V˜ (a) mit R a 2 r ˜ rρ˜(r) dr . V (a) := 4π ρ˜(r) dr + 0 a a Leiten Sie her, dass ∂a2 V˜ (a)+ a2 ∂a V˜ (a) = −4π ρ˜(a) (d.h. in Euklidischen Koordinaten: −ΔV = 4πρ). Das ist die Formel von Poisson. (f) Erdnahe Satelliten haben Umlaufzeiten von etwa anderthalb Stunden. Wie lange ben¨otigt ein sonnennaher Satellit ungef¨ahr f¨ ur einen Umlauf? 3 Die in Beispiel 12.36 auftretenden Singularit¨aten erschweren die Behandlung der Dynamik sehr. Wir betrachten daher nur Zwei–K¨orperpotentiale Vi,j ∈ C 2 (Rd , R) und nehmen an, dass diese im Sinn der Definition 12.1 langreichweitig sind. Wir fordern also, dass f¨ ur geeignete Konstanten C, ε > 0 gilt: −|α|−ε
|∂ α Vi,j (Q)| ≤ C Q
1 ≤ i < j ≤ n, Q ∈ Rd , α ∈ Nd0 , |α| ≤ 2 .
Bequem ist es, Vj,i (q) := Vi,j (−q) zu setzen, falls 1 ≤ i < j ≤ n. Dann ist nd die Hamilton–Funktion (12.5.2) auf dem Phasenraum P := Rnd p × Rq zweimal 1 stetig differenzierbar, und nach Satz 11.1 ist der Fluss Φ ∈ C (R × P, P ). Wir schreiben die L¨ o sungen in der Form p(t, x0 ), q(t, x0 ) = Φ(t, x0 ) oder kurz p(t), q(t) . 12.38 Satz (Schwerpunktbewegung) Es bezeichne
n • mN := k=1 mk die Gesamtmasse,
• pN : P → Rd , (p, q) → nk=1 pk den Gesamtimpuls und
n • qN : P → Rd , (p, q) → m1N k=1 mk qk den Schwerpunkt. Dann gilt f¨ ur pN (t), qN (t) := (pN , qN ) ◦ Φt (p, q): pN (t) = pN (0) ,
qN (t) = qN (0) +
pN (0) t mN
(t ∈ R).
Beweis: Aus den Bewegungsgleichungen (12.5.3) folgt d pN (t) dt
= =
n n n d ∇qk V (q) = − ∇qk Vi,j (qi − qj ) pk (t) = − dt k=1 k=1 k=1 1≤i<j≤n ∇qi Vi,j (qi − qj ) + ∇qj Vi,j (qi − qj ) = 0. 1≤i<j≤n
12. Streutheorie Andererseits ist
291 d dt qN (t)
=
1 mN
n k=1
d mk dt qk (t) =
1 mN
n k=1
pk (t) =
pN (0) mN .
2
Der Gesamtimpuls ist damit eine Erhaltungsgr¨oße, und wir kennen auch die Zeitentwicklung des Schwerpunktes. Da V nicht von qN , sondern nur von den onnen wir die Phasenraumdimensionen um 2d erAbst¨anden qi − qj abh¨angt, k¨ niedrigen und die Bewegung im Schwerpunktsystem untersuchen. 12.39 Beispiel (Reduktion des Zweik¨ orperproblems) Am leichtesten gelingt dies f¨ ur die Bewegung zweier K¨ orper. Mit der Gesamtmasse mN = m1 + m2 und m2 der reduzierten Masse mr := mm11+m f¨ uhrt die lineare Transformation Ψ : P → P 2 mit Phasenraum P = T ∗ R2d , 1 p2 m1 q1 +m2 q2 (p1 , p2 , q1 , q2 ) → (pN , pr , qN , qr ) := p1 + p2 , m2 p1m−m , , q − p 1 2 mN N zur Hamilton–Funktion H ◦ Ψ = HN + Hr mit 13 HN (pN , qN ) :=
pN 2 2mN
und Hr (pr , qr ) :=
pr 2 + V1,2 (qr ). 2mr
Die lineare Abbildung ist symplektisch auf dem Phasenraum P : Ψ ∈ Sp(P, ω0 ), ˜ ( pq ) mit der Matrix denn Ψ(p, q) = Ψ m m ˜ := ( A 0 ) ∈ Mat(4d, R) , A := m12l 1l − m1l1 1l und D := mN1 1l mN2 1l , Ψ 0 D m m N
N
1l
−1l
˜ JΨ ˜ = J, siehe Bemerkung 6.15.2 und Aufgaalso A D = 1l und damit Ψ be 6.26.b). Die Bewegungsgleichung bleibt also unter Ψ hamiltonsch, und die 3 Untersuchung von H l¨auft auf die von Hr : R2d → R hinaus.
12.6
* Asymptotische Vollst¨ andigkeit
K¨onnte man nicht fragen, ob die einzelnen K¨orper immer in bestimmten ” Himmelsrichtungen verbleiben oder, wenn nicht, ebenso gut immer weiter fort fliegen mochten: ob sich die Distanz zwischen den K¨orpern in der unendlichen Zukunft vergr¨oßern oder verkleinern oder ob sie sich immer in bestimmten Grenzen halten wird? K¨onnte man nicht Tausende von Fragen dieser Art stellen, die alle l¨osbar w¨aren, sobald wir w¨ ußten, wie man die Bahnen der drei ´, in [Poi1] 14 K¨orper qualitativ konstruieren muß?” Henri Poincare 12.40 Definition Das n–K¨orperproblem (12.5.2) heißt asymptotisch vollst¨ andig, wenn die asymptotischen Geschwindigkeiten v ± (x0 ) := lim
t→±∞
q(t, x0 ) t
(12.6.1)
f¨ ur alle Anfangsbedingungen x0 ∈ P existieren. 13 Genauer:
H ◦ Ψ = HN ◦ π1 + Hr ◦ π2 mit (π1 , π2 ) : T ∗ R2d → T ∗ RdqN × T ∗ Rdqr . nach Galison [Gali], Seite 62.
14 Ubersetzung ¨
292
12.6. * Asymptotische Vollst¨andigkeit
12.41 Bemerkungen 1. F¨ ur den Fall n = 2 wurde die asymptotische Vollst¨andigkeit schon gezeigt. Denn sie folgt mit Beispiel 12.39 aus Aufgabe 12.7.1. 2. Die Definition asymptotischer Vollst¨andigkeit ist in der Literatur nicht einheitlich. Wir haben einen eher schwachen Begriff gew¨ahlt. 3. In der quantenmechanischen Streutheorie ist der Nachweis einer analogen Eigenschaft asymptotischer Vollst¨andigkeit zuerst gelungen, unter Mitwirkung von V. Enss, Ch. G´erard, G.–M. Graf, I.M. Sigal, A. Soffer, D. Yafaev und anderen. Im klassischen Fall haben unter anderem J. Derezi´ nski und W. Hunziker [Hun] entscheidende Beitr¨age zum Beweis geliefert. 4. Der folgende Beweis ist eine Version der Darstellung in der Standardreferenz ´ski und Ge ´rard. Er ist kompliziert und man kann ihn [DG] von Derezin problemlos u ¨bergehen, da er in sp¨ateren Kapiteln nicht mehr aufgegriffen wird. Andererseits beruht auf der Annahme der asymptotischen Vollst¨andigkeit die gesamte praktische Streutheorie. Der Beweis geh¨ ort er zu den Highlights der Mathematischen Physik, und man kann seine analytischen F¨ahigkeiten bei dem Versuch erproben, ihn zu vereinfachen. 3 In Beispiel 12.39 wurden f¨ ur zwei K¨ orper die interne und die externe Dynamik (mit den Hamilton–Funktionen Hr bzw. HN ) getrennt untersucht. Dieser Ansatz soll jetzt auf die Dynamik innerhalb bzw. zwischen Clustern von Teilchen ¨ verallgemeinert werden. Wir stellen also kinematische Uberlegungen an. 12.42 Definition • Eine Mengenpartition oder Clusterzerlegung der Indexmenge N := {1, . . . , n} ist eine Menge C := {C1 , . . . , Ck } von Atomen ( Clustern) ∅ = C ⊆ N mit k 3
C = N
und C ∩ Cm = ∅
f¨ ur = m.
=1
• Der Partitionsverband P(N ) ist die Menge der Clusterzerlegungen C von N , teilweise geordnet durch Verfeinerung, das heißt C = {C1 , . . . , Ck } {D1 , . . . , D } = D, falls Cm ⊆ Dπ(m) f¨ ur eine geeignete Abbildung π : {1, . . . , k} → {1, . . . , }. C heißt dann feiner als D und D gr¨ ober als C. • Der Rang von C ∈ P(N ) ist die Zahl |C| seiner Atome. • Die Vereinigung (englisch: join) von C und D ∈ P(N ) ist die mit C ∨ D bezeichnete feinste Clusterzerlegung, die gr¨ober als C und gr¨ober als D ist.
12. Streutheorie
293
Die eindeutigen feinsten beziehungsweise gr¨ obsten Elemente von P(N ) sind und Cmax := {1, . . . , n} . Cmin := {1}, . . . , {n}
123 12.43 Beispiel (Partitionsverband) F¨ ur n = 3 besteht P(N ) aus f¨ unf Elementen, die wie in nebenstehender Graphik geordnet sind (bei vertikaler Ordnung nach 12 3 13 2 23 1 dem Rang). Dabei bezeichnet z.B. 12|3 die Mengenpartition {{1, 2}, {3}}, mit Rang {{1, 2}, {3}} = 2. 123 Die Vereinigung von 12|3 und 1|23 = 23|1 ist 123. 3 1n nd Auf dem Konfigurationsraum M := aller Teilchen, mit dem k=1 Mk = R Konfigurationsraum Mk := Rd des k–ten Teilchens, soll jetzt eine der Clusterzerlegung C ∈ P(N ) angepasste Wahl von Koordinaten getroffen werden, analog zu Beispiel 12.39. Wir schreiben Konfigurationen q ∈ M in der Form q = (q1 , . . . , qn ) mit qk ∈ Mk . Die Verwendung des Skalarproduktes
q, q M :=
n
mk qk , qk
(q, q ∈ M )
(12.6.2)
k=1
und der Norm q M :=
q, qM erleichtern die Notation.
12.44 Definition In der Clusterzerlegung C = {C1 , . . . , Ck } ∈ P(N ) sind
• die Masse des i–ten Clusters Ci gleich mCi := j∈Ci mj .
E := m1C • der Schwerpunkt von Ci gleich qC j∈Ci mj qj , i i
• und die Schwerpunktprojektion ist die lineare Abbildung ΠE C :M →M
E , ΠE C (q) := qCi
, mit
∈ Ci .
uglich des Skalarproduktes orthogonale Projektion, ebenso Damit ist ΠE C eine bez¨ E . F¨ ur letztere ist ΠIC (q) = q −qC (mit ∈ Ci ) der Abstand wie ΠIC := 1lM −ΠE C i des –ten Teilchens vom Schwerpunkt seines Clusters. Die Symbole I und E stehen f¨ ur die clusterinterne bzw. -externe Dynamik. 12.45 Aufgabe (Clusterprojektionen) Beweisen Sie, dass f¨ ur alle C ∈ P(N ) die linearen Abbildungen ΠIC und ΠE orthogonale Projektionen sind. 3 C (0)
Wir bezeichnen die Bilder dieser Projektionen mit ΔC := ΠE C (M ) und nennen diese Kollisionsunterr¨aume. Da diese durch Angabe der Schwerpunkte der |C| (0) Cluster parametrisiert werden, ist dim ΔC = d|C|, und (0)
(0)
(0)
ΔC ∩ ΔD = ΔC∨D
C, D ∈ P(N ) .
(12.6.3)
294
12.6. * Asymptotische Vollst¨andigkeit
q2 q3
q3 q4
q1 q2 q1 q4
q1 q3
q2 q4
Abbildung 12.6.1: Kollisionsunterr¨aume f¨ ur n = 4 Teilchen in d = 1 Dimension, mit Schwerpunkt bei Null Letztere Identit¨at ist die Ursache f¨ ur die Bedeutung der ∨–Operation, siehe Abbildung 12.6.1. (0)
12.46 Bemerkungen 1. Die Unterr¨aume ΔC von M erzeugen wegen (12.6.3) eine Mengenpartition von M mit den Atomen : 7 (0) (0) (0) ΞC := ΔC ΔD C ∈ P(N ) . (12.6.4) DC
Falls die asymptotischen Geschwindigkeiten in (12.6.1) existieren, k¨onnen wir also durch (0) C ± : P → P(N ) , v ± (x0 ) ∈ ΞC ± (x0 ) die Teilchen in der fernen Zukunft beziehungsweise Vergangenheit eindeutig in Cluster einteilen. In dieser Asymptotik gibt es zwischen Teilchen verschiedener Cluster keine Wechselwirkungen mehr. 2. F¨ ur endliche Zeiten ist die Partition (12.6.4) beweistechnisch nicht sehr n¨ utzlich. Entsprechend betrachten wir zun¨ achst f¨ ur ein vorgegebenes ε > 0 die ε–Umgebungen (ε) ΔC := q ∈ M | ΠIC (q) M ≤ ε C ∈ P(N ) (12.6.5) (ε)
F¨ ur q ∈ ΔC ist also der Ort qi des i–ten Teilchens nicht zu weit von dem Schwerpunkt seines C–Clusters entfernt; siehe Abbildung 12.6.2 (links). Bei der Suche nach einer Clusterpartition von M k¨onnten wir versucht sein, analog zu (12.6.4) die Teilmengen : 7 (ε) ? (ε) (ε) ΞC := ΔC ΔD C ∈ P(N ) (12.6.6) DC
12. Streutheorie
295
Ε 132
Ε 132
Ε 231 q
Ε 231 Ε
123 0 Ε 123 123
Ε 123 0 Ε 123 123
Abbildung 12.6.2: Ung¨ unstige Clustereinteilungen des Konfigurationsraums (mit Schwerpunkt bei Null) f¨ ur n = 3 Teilchen in d = 1 Dimension. zu verwenden. Diese sind aber nicht disjunkt, denn das Analogon von (12.6.3) (ε) gilt f¨ ur die ΔC nicht. So sieht man in Abbildung 12.6.2 (links), dass es Punkte (ε) q ∈ M gibt, f¨ ur die keine eindeutige Zuordnung zu einem ΞC m¨oglich ist, und dass die Menge dieser Punkte sogar positives Volumen besitzt. Aus dem gleichen Grund ist es auch nicht hilfreich, zun¨achst ausgehend von (ε) der Familie der ε–Umgebungen ΔD der Zwei–Teilchen–Kollisionsunterr¨aume (0) ΔD , |D| = n − 1 die Definition (12.6.5) zu modifizieren, indem man 8 ? (ε) (ε) ? (ε) C ∈ P(N ), |C| < n − 1 ΔD ΔCmin := M und ΔC := DC, |D|=n−1
setzt, siehe Abbildung 12.6.2 (rechts). Auch auf diese Familie angewandt ergibt n¨amlich (12.6.6) keine Mengenpartition von M . 3 Wir gehen daher anders vor und benutzen die sogenannte Graf–Partition von M . Diese basiert auf dem (mittleren) Tr¨agheitsmoment J :M →R
2 , J(q) = q M =
n
mk qk 2 .
k=1
In der Clusterzerlegung C erh¨alt dieses wegen der Orthogonalit¨at der Projektion ΠE C die Form und JCI := J ◦ ΠIC , (12.6.7) J = JCE + JCI mit JCE := J ◦ ΠE C ) E * I denn J(q) = (ΠC + ΠIC )q , (ΠE C + ΠC )q M , und * ) * ) * ) E E E E ΠC q , ΠIC q M = ΠE C q , (1lM − ΠC )q M = q , ΠC (1lM − ΠC )q M = 0. Dabei sind anschaulich
296
12.6. * Asymptotische Vollst¨andigkeit • JCE (q) das Tr¨agheitsmoment der Konfiguration, bei der alle Massen jedes Clusters in dessen Schwerpunkt vereinigt sind. • JCI (q) die Summe der Cluster-Tr¨agheitsmomente, bezogen auf deren jeweiligen Schwerpunkt statt auf den Nullpunkt.
12.47 Aufgabe (Tr¨ agheitsmomente) Zeigen Sie, dass f¨ ur Mengenpartitionen E I C, D ∈ P(N ) mit D C gilt: JD ≤ JCE (und wegen (12.6.7) JD ≥ JCI ). 3 12.48 Lemma Es gibt ein δ ∈ (0, 12 ] mit JI + JI I I ≤ JC∨D C, D ∈ P(N ) . δ JCI + JD ≤ C D δ Beweis: • F¨ ur die linke Ungleichung k¨ onnen wir nach Aufgabe 12.47 jede Konstante δ ∈ (0, 12 ] verwenden. I = J ◦ ΠIC∨D • F¨ ur die rechte Ungleichung benutzen wir die Identit¨aten JC∨D I I I I I I I I und (JC + JD ) ◦ ΠC∨D = JC + JD . Sowohl JC∨D als auch JC + JD sind auf dem Raum Im(ΠIC∨D ) = ker(ΠE C∨D ) positiv definit. Solche quadratische Formen auf endlich–dimensionalen Vektorr¨aumen sind immer vergleichbar. Es gibt also f¨ ur alle Paare (C, D) eine die rechte Ungleichung realisierende Konstante δ (C, D) ∈ (0, 12 ]. Es gibt aber nur endlich viele Paare, 2 also ein kleinstes von Null verschiedenes δ .
12.49 Definition F¨ ur δ ∈ (0, 1) sei J (δ) : M → R
,
J (δ) (q) := max JCE (q) + δ |C| C ∈ P(N ) .
Die Graf–Partition des Konfigurationsraums M ist die Familie von Teilmengen
(δ) C ∈ P(N ) . (12.6.8) ΞC := q ∈ M JCE (q) + δ |C| = J (δ) (q) Dies ist zwar keine Partition im mengentheoretischen, 7 aber im(δ)maßtheoretischen ur Sinn, denn C∈P(N ) ΞC = M , und f¨ (δ)
C = D ist das Lebesgue–Maß von ΞC ∩ (δ) ΞD gleich Null, weil die Funktionen JCE + E δ |C| und JD +δ |D| nur auf Quadriken in M die gleichen Werte annehmen. Von einer Clusterzerlegung von M erwarten wir, dass die Teilchen eines Clusters auch nahe beieinander liegen, w¨ahrend Teilchen verschiedener Cluster zueinander einen Mindestabstand halten. Beides ist hier der Fall, siehe nebenstehende Abbildung und das folgende Lemma.
Graf–Partition des Konfigurationsraums (Schwerpunkt bei Null) f¨ ur n = 3 Teilchen in d = 1 Dimen(δ) (δ) sion. Weiß: ΞCmin , Schwarz: ΞCmax
12. Streutheorie
297
12.50 Lemma F¨ ur jedes δ ∈
0, δ4 gibt es 0 < ρ1 < ρ2 mit (f¨ur die in (ε)
(0)
(12.6.5) definierten ε–Umgebungen ΔC der Kollisionsunterr¨aume ΔC ) 3 (δ) (ρ ) (ρ ) ΔC 1 ⊆ Ξ D ⊆ ΔC 2 C ∈ P(N ) . DC
Abbildung 12.6.3: Die Inklusionen des Lemma 12.50 f¨ur n = 3, d = 1 und C = {{1, 2}, {3}} ¨ 12.51 Bemerkung Uberlegen Sie sich, dass das Lemma zeigt, dass die Graf– Partition die obigen Anforderungen an eine Clusterzerlegung erf¨ ullt. 3 √ Beweis: • Wir beginnen mit der rechten Inklusion und setzen ρ2 := δ. Dann (ρ ) ist ΔC 2 = {q ∈ M | JCI (q) ≤ δ}. Ist D C, dann ist nach Aufgabe 12.47 (δ) I JD (q) ≥ JCI (q). F¨ ur q ∈ ΞD ist aber (nach Definition der Graf–Partition und im I Vergleich von D und Cmin ) JD (q) ≤ δ |D| − δ n ≤ δ. Zusammengefasst erhalten (ρ2 ) I wir JC (q) ≤ δ, also q ∈ ΔC . • Statt der linken Inklusion zeigen wir die (wegen mangelnder Disjunktheit der Partition ein wenig st¨ arkere) Aussage: F¨ ur ein geeignetes ρ1 ∈ (0, ρ2 ) ist (ρ )
(δ)
ΔC 1 ∩ ΞE = ∅ ,
falls E C
(E nicht gr¨ober als C).
(12.6.9)
Unter dieser Bedingung ist immer |E ∨C| < |E| und |E ∨C| ≤ |C|, wobei Gleichheit genau dann gilt, wenn E C (E echt feiner als C).
298
12.6. * Asymptotische Vollst¨andigkeit (ρ )
(δ)
(δ)
F¨ ur q ∈ ΔC 1 ∩ ΞE ist JCI (q) ≤ ρ21 und nach Definition von ΞE I JEI (q) ≤ JE∨C (q) − δ |E∨C| 1 − δ |E|−|E∨C| .
(12.6.10)
• Ist nun E C, dann gilt die Bedingung in (12.6.9), E ∨ C = C und die Ungleichung impliziert JEI (q) ≤ JCI (q) − δ |C| (1 − δ) ≤ ρ21 − δ |C| (1 − δ) ≤ ρ21 − δ n−1 (1 − δ) < 0 f¨ ur kleine Werte von ρ1 . Das kann nicht sein, denn JEI ≥ 0. • Auch der andere mit der Bedingung in (12.6.9) kompatible Fall, dass C und E nicht vergleichbar sind, also zus¨atzlich zu E C noch E C gilt, f¨ uhrt f¨ ur kleine ur Werte von ρ1 zum Widerspruch, denn mit Lemma 12.48 folgt aus (12.6.10) f¨ δ < 14 δ ≤ 18 JE (q)
≤ ≤ ≤
1 I JE (q) + JCI (q) − δ |E∨C| (1 − δ) δ 2 δ |E| 1 I 2JC (q) + δ |E| − δ |C| − δ |E∨C| (1 − δ) ≤ ρ21 + − 12 δ |E∨C| δ δ δ 2 2 1 |E∨C| 2 2 1 n−1 ρ − δ ≤ ρ1 − 4 δ . δ 1 4 δ
In der vorletzten Ungleichung haben wir |E|√≥ |E ∨ C| verwendet. Auch dieser Ausdruck wird kleiner Null, wenn wir ρ1 < δ n δ w¨ahlen. Wir haben damit die (ρ ) (δ) Annahme q ∈ ΔC 1 ∩ ΞE zum Widerspruch gef¨ uhrt. 2 Eine weitere im Bild auf Seite 296 illustrierte Eigenschaft gilt allgemein f¨ ur Graf– Partitionen: 12.52 Lemma F¨ ur kleine Werte von δ ∈ (0, 1) besitzt die Graf–Partition (12.6.8) (δ) (δ) die Eigenschaft, dass f¨ ur ΞC ∩ ΞD = ∅ die Clusterzerlegungen C und D vergleichbar sind, das heißt C D oder C D gilt. (δ)
(δ)
Beweis: Nach Lemma 12.48 ist f¨ ur q ∈ ΞC ∩ ΞD I JC∨D (q) ≤
I JCI (q) + JD (q) δ
I und JD (q) − δ |D| = JCI (q) − δ |C| .
W¨are nun C und D nicht vergleichbar, also |C ∨ D| < min(|C|, |D|) und ohne Einschr¨ankung |C| ≤ |D|, dann w¨ urde folgen: I JC∨D (q) − δ |C∨D| − JCI (q) − δ |C| 1 I I |C| |D| I |C| J − J − δ |C∨D| ≤ (q) + J (q) − δ + δ (q) − δ C C C δ 2 2 I |C| |C∨D| ≤ − 1 JC (q) + δ − δ ≤ − 1 δ |C| + δ |C| − δ |C∨D| δ δ 2δ ≤ − 1 δ |C∨D| < 0, δ
12. Streutheorie
299
falls δ ∈ (0, δ /2). Das bedeutet aber, dass q doch nicht in ΞC liegen kann, denn in Def. 12.49 ist JCE (q) + δ |C| = J(q) − JCI (q) − δ |C| nicht maximal. 2 (δ)
Wegen dieses Lemmas steht die Graf–Partition des Konfigurationsraums M in enger Beziehung zum Partitionsverband P(N ). Wir setzen sie beim Beweis der folgenden Hauptaussage ein: 12.53 Satz (Asymptotische Vollst¨ andigkeit) F¨ ur alle Hamilton–Funktionen (12.5.2) mit langreichweitigen Potentialen Vi,j ∈ C 2 (Rd , R) (1 ≤ i < j ≤ n) und f¨ ur alle Anfangsbedingungen x0 ∈ P existieren die asymptotischen Geschwin0) digkeiten v ± (x0 ) = limt→±∞ q(t,x . t Beweis: • Wegen der Reversibilit¨at des hamiltonschen Flusses Φ ∈ C 2 (R×P, P ) gen¨ ugt es, die Existenz von v + (x0 ) zu zeigen. • In einem ersten Schritt wird gezeigt, dass die Norm von t → besitzt. Mit p(t), q(t) := Φ(t, x0 ) sei q(t) j(t) := J t ∈ [1, ∞) . t
q(t,x0 ) t
einen Limes
Es soll also die Existenz von j + := limt→∞ j(t) gezeigt werden. • Der entscheidende Schritt dabei ist eine zeitabh¨angige, der Bewegung angepasste Clusterzerlegung. Wir finden messbare Abbildungen A : [1, ∞) → P(N )
mit
q(t) (δ) ∈ ΞA(t) . t1−ε/2
(12.6.11) (δ)
A ist durch diese Bedingung genau auf den Grenzfl¨achen zwischen den ΞC nicht eindeutig festgelegt. Da die Ortsraumtrajektorie q aber zweifach stetig (δ) (δ) differenzierbar ist (und als Folge von Lemma 12.52 f¨ ur C = D und ΞC ∩ΞD = ∅ onnen wir aus dem Satz von Sard 15 schließen, in (12.6.8) gilt: δ |C| = δ |D| ), k¨ dass f¨ ur fast alle δ ∈ (0, 1) in der Definition 12.49 der Graf–Zerlegung A sogar st¨ uckweise konstant gew¨ahlt werden kann. • Die Skalierung mit t1−ε/2 in (12.6.11) hat nun zur Folge, dass in der Zerlegung des Tr¨agheitsmoments q(t) q(t) E I I (t) := J und j j(t) = j E (t) + j I (t) mit j E (t) := JA(t) A(t) t t (12.6.12) der zweite Term asymptotisch nichts beitr¨agt: q(t) I ≤ t−ε , j I (t) = t−ε JA(t) t1−ε/2
(12.6.13)
15 Satz (Sard), siehe Hirsch [Hirs]. F¨ ur f ∈ C k (U, Rm ) mit k ≥ max(n − m + 1, 1) und U ⊆ Rn offen bezeichne Crit(f ) := {x ∈ U | rang(Df (x)) < m} die kritische Menge von f . Dann hat die Menge f Crit(f ) ⊆ Rm der kritischen Werte das Lebesgue–Maß 0.
300
12.6. * Asymptotische Vollst¨andigkeit (δ)
denn f¨ ur alle C ∈ P(N ) und q˜ ∈ ΞC Graf–Partition
ist nach (12.6.7) und Definition der
JCI (˜ q ) = J(˜ q ) − JCE (˜ q ) = JCEmin (˜ q ) − JCE (˜ q ) ≤ δ |C| − δ n ≤ 1.
(12.6.14)
Um die Existenz des Limes j + = limt→∞ j(t) zu zeigen, reicht es also nach (12.6.12) aus zu zeigen, dass j E (t) einen Limes besitzt. Eine Schwierigkeit dabei besteht darin, dass j E dort unstetig ist, wo t → A(t) nicht konstant ist. Daher zerlegen wir j I in j I = ˜j I + h (12.6.15) uckweise konstant. Die Zerlegung ist eindeutig bis auf eine mit ˜j I stetig und h st¨ noch zu w¨ahlende additive Konstante. Entsprechend ist wegen j E = j − j I auch die Funktion ˜j E := j E − h stetig. d I Es gilt mit q I (t) := ΠIA(t) q(t) und v I (t) := dt q (t) st¨ uckweise d ˜I 2 j (t) = dt t
5
q I (t) I q I (t) , v (t) − t t
6
= O t−1−ε/2
(12.6.16)
M
wegen q I (t) = O(t1−ε/2 ) und
v I (t) M ≤ v(t) M =
2 E − V (q(t)) ≤ 2(E − Vmin ).
Damit existiert auch limt→∞ ˜j I (t), und wir w¨ahlen die additive Konstante in (12.6.15) so, dass dieser Limes Null ist. Gleichzeitig ist dann auch h(t) = j I (t) − ˜j I (t) = O(t−ε ) + O(t−ε/2 ) = O(t−ε/2 ).
(12.6.17)
• Um die Existenz des Limes von j E nachzuweisen, ugt es daher zu zeigen, t gen¨ dass die stetige Funktion t → ˜j E (t) = ˜j E (1) + 1 f (s) ds mit 5 6 2 q E (s) E q E (s) f (s) := , v (s) − = O(1/s) (12.6.18) s s s M d E q ) konvergiert. Den Integranden zerlegen wir (und q E := q − q I , v E := dt ˜ ˜ wieder in f = f + g mit f stetig und g st¨ uckweise konstant. Damit ist t I(s) ds (12.6.19) f (t) = f (1) + g(t) − g(1) + 1
mit dem Integranden I(s) := I1 (s)+I2 (s)+I3 (s) = O(1/s2 ), I1 (s) := − 2s f (s), I2 (s) :=
2 E 2 v E (s) − q (s) 2 s s M
und mit dem Inter–Cluster–Potential V E q(s) :=
,
I3 (s) := −
1≤i<j≤n
2 s
5
6 q E (s) , ∇V E (q(s)) , s
Vi,j qi (s) − qj (s) .
12. Streutheorie
301
soll bedeuten, dass nur u Das Zeichen ¨ber solche Paare (i, j) von Indices summiert wird, die in der Clusterzerlegung A(s) zu verschiedenen Atomen geh¨oren. Damit ist f¨ ur diese Paare nach (12.6.11) und Lemma 12.50 s ∈ [1, ∞) ,
qi (s) − qj (s) ≥ c s1−ε/2 also wegen der Langreichweitigkeit (Definition 12.1) der Paarpotentiale ε ∇V E q(s) = O (s1−ε/2 )−1−ε = O s−1− 4 , (12.6.20) falls wir ε ∈ (0, 12 ) w¨ahlen. • Der Integrand I in (12.6.19) ist st¨ uckweise gleich der Zeitableitung von f . Wie man durch Einsetzen u uft, besitzt die Integralgleichung (12.6.19) die ¨berpr¨ L¨osung t 2 −2 f (1) − g(1) + f (t) = g(t) + t s (I2 (s) + I3 (s)) − 2s g(s) ds . 1
(12.6.21) Von dieser w¨ urden wir gerne zeigen, dass f ∈ L1 [1, ∞) , denn dann konvergiert t → ˜j E (t). F¨ ur g ≡ 0 argumentieren wir wie folgt: uhrt wegen seiner Integrabilit¨at, siehe (12.6.20), zu einem - Der Beitrag von I3 f¨ ε integrablen Beitrag der Ordnung O(t−1− 4 ) in (12.6.21). - I2 ist nichtnegativ. W¨ urde der Beitrag von I2 dazu f¨ uhren, dass f nicht integrabel ist, w¨ urde daher ˜j E gegen +∞ divergieren. Wir wissen aber, dass ˜j E beschr¨ankt ist. Also konvergiert ˜j E . • W¨are der die Langreichweitigkeit quantifizierende Parameter ε gleich Null, dann ur die Sprungh¨ohe von g gelten: w¨ urde an einer Unstetigkeitsstelle t0 f¨ − + − g(t+ 0 ) − g(t0 ) = gA (t0 ) − gA (t0 ) −ε d E und gA (t± 0 ) := t0 dt JA(t± ) 0
q(t) t
mit g(t± 0 ) := lim g(t0 ± γ) etc. γ0
.
t=t0
Tats¨achlich ist aber ε > 0 und damit wegen (12.6.18) − + − + − g(t+ 0 ) − g(t0 ) = gA (t0 ) − gA (t0 ) + gB (t0 ) − gB (t0 )
(12.6.22)
f¨ ur die st¨ uckweise konstante Funktion gB mit den Sprungh¨ohen 6 5 E − 6 0 /5 E + ε q (t0 ) E − q (t0 ) E + − ) − g (t ) = − , v (t ) − , v (t ) gB (t+ . B 0 0 0 0 t0 t0 t0 M M - Mit h aus (12.6.15) ist / gB (t2 ) − gB (t1 ) = −2ε
h(t2 ) h(t1 ) − + t2 t1
t2
t1
0 h(s) ds s2
(1 ≤ t1 < t2 ),
302
12.6. * Asymptotische Vollst¨andigkeit
also nach (12.6.17) −1−ε/2 gB (t2 ) − gB (t1 ) = O t1
(1 ≤ t1 < t2 ).
Wir nehmen ohne Einschr¨ ankung der Allgemeinheit an: limt→∞ gB (t) = 0, uhrt damit zu einem integrablen Beitrag der also gB (t) = O t−1−ε/2 . gB f¨ ε Ordnung O(t−1− 2 ) in (12.6.21). - Die st¨ uckweise konstante Funktion gA in (12.6.22) ist monoton steigend, denn nach Definition (12.6.8) der Graf–Partition und (12.6.11) gilt f¨ ur q(t0 ) 1−ε/2
t0
(δ)
(δ)
∈ ΞA− ∩ ΞA+
mit A± := lim A(t0 ± γ) und A+ = A− γ0
die Ungleichung / 0 d q(t) q(t) E E JA+ 1−ε/2 − JA− 1−ε/2 ≥ 0. dt t t t=t0 Insgesamt k¨onnen wir also den Fall g = 0 ganz analog zum Fall g = 0 behandeln. Wir schließen, dass ˜j E (und damit auch j E = ˜j E + h und j = j I + j E ) konvergiert. • Ist nun der Limes j + = 0, dann existiert die asymptotische Geschwindigkeit: v + (x0 ) = 0. Wir nehmen also j + > 0 an. F¨ ur Q(t) := q(t)/t ist Q ∈ C 2 ([1, ∞), M ). Wir betrachten nun die Menge Ω := v ∈ M ∃(tn )n∈N mit lim tn = +∞ und lim Q(tn ) = v n→∞
n→∞
von H¨aufungspunkten dieser Kurve. Diese liegt in der Sph¨are 2 SM := {v ∈ M | v M = j + }.
Wegen der Kompaktheit von SM ist Ω nicht leer. Wir wollen zeigen, dass Ω aus nur einem Punkt besteht (n¨amlich der asymptotischen Geschwindigkeit v + (x0 )). Wir erinnern uns an die Mengenpartition (12.6.4) von M und betrachten (0) zun¨achst einen H¨aufungspunkt v ∈ Ω ∩ ΞC , f¨ ur den die Anzahl |C| der Cluster (0) maximal ist. Da das Atom ΞC der Mengenpartition relativ offen im Kollisionsun(0) ur kleine γ > 0 und Uγ (v) := {v ∈ M | v − v M < γ} terraum ΔC ist, liegt f¨ (0) die 2γ–Umgebung U2γ (v) ∩ Ω von v in ΞC . F¨ ur alle n ≥ N (γ) ist Q(tn ) ∈ Uγ/2 (v), da v H¨aufungspunkt von Q(tn ) n ist. Wir wollen zeigen, dass f¨ ur alle t ≥ T (γ) gilt: Q(t) ∈ Uγ (v). Da γ beliebig klein gew¨ahlt werden kann, folgt dann Ω = {v}. • Es sei χ ∈ Cc∞ (M, [0, 1]) eine Funktion mit Tr¨ager in der Umgebung U2γ (v), deren Restriktion auf Uγ (v) gleich 1 ist. E qCE (t) v Ψ : [1, ∞) → [0, ∞) , Ψ(t) = χ Q(t) (t) − C t M
12. Streutheorie
303
ist beschr¨ankt und besitzt die Ableitung ? E . - qCE (t) qC (t) E E E Ψ (t) = χ Q(t) − v (t) − v (t) , ∇V (q(t)) C C t t M . qCE (t) q(t) 1 + t v(t) − t , ∇χ Q(t) t − vCE (t) − 1t Ψ(t). (12.6.23) M
1
- Wegen (12.6.20) ist der erste Summand in L [1, ∞) . - Es gibt eine solche Abschneidefunktion χ der Produktform (v ∈ M ). χ(v) = χI ΠIC (v) χE ΠE C (v) (γ/2)
(weil sonst v nicht F¨ ur große Zeiten t und Q(t) ∈ U2γ (v) ist Q(t) ∈ ΔC H¨aufungspunkt mit maximaler Clusterzahl |C| w¨are). Daher ist χI ΠIC (Q(t)) = 1, also im zweiten Term von (12.6.23) (0) ∇χ Q(t) = ∇χE ΠE C (Q(t)) ∈ ΔC . Also ist der Betrag des zweiten Terms kleiner als 2 E C qC (t) − vCE (t) t t M
, mit
Aus der Integrabilit¨at des Terms t → t−2
C := sup ∇χ(x) M . x
t
s2 I2 (s) ds in (12.6.21) folgert E 2 q (t) man mittels partieller Integration, dass t → Ct C t − vCE (t) ebenfalls in M L1 [1, ∞) liegt, also auch der zweite Term von (12.6.23). 1
- Den dritten Term von (12.6.23) k¨ onnen wir in der Form d qCE (t) 1 Ψ(t) = χ Q(t) dt t t M schreiben. Da er nichtnegativ ist, die beiden anderen Terme auf der rechten Seite von (12.6.23) integrabel sind, und die linke Seite von (12.6.23) beschr¨ankt ist, gilt t → 1t Ψ(t) ∈ L1 [1, ∞) . ∞ d qCE (t) ur alle gen¨ ugend große n gilt: • Da also 1 χ Q(t) dt t dt < ∞, und f¨ M
ur große t in Uγ (v). Q(tn ) ∈ Uγ/2 (v), bleibt Q(t) f¨
2
Wie auf Seite 266 erw¨ahnt, gilt die f¨ ur beschr¨ankte Potentiale gerade bewiesene asymptotische Vollst¨andigkeit im Fall der Kepler–Potentiale der Himmelsmechanik nicht mehr f¨ ur alle Anfangsbedingungen.
Kapitel 13
Integrable Systeme und Symmetrien
¨ Ein Beispiel . . . . . . . . . . 306 13.1 Was bedeutet Integrabilitat? 13.2 Der Satz von Liouville-Arnol’d . . . . . . . . . . . . . . . . 309 13.3 Winkel-Wirkungskoordinaten . . . . . . . . . . . . . . . . . 315 13.4 Die Impulsabbildung . . . . . . . . . . . . . . . . . . . . . 322 13.5 * Reduktion des Phasenraums . . . . . . . . . . . . . . . . 330
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 13,
305
306
13.1
13.1. Was bedeutet Integrabilit¨at? Ein Beispiel
Was bedeutet Integrabilit¨ at? Ein Beispiel
When, however, one attempts to formulate a precise definition of integrability, ” many possibilities appear, each with a certain intrinsic theoretic interest.” D. Birkhoff, in: Dynamical Systems [Bi3] In einem heuristischen Sinn ist eine Differentialgleichung integrabel, wenn wir in der Lage sind, ihre L¨ osungen ,hinzuschreiben’. Aus zwei Gr¨ unden l¨asst uns diese Definition” nat¨ urlich unbefriedigt. Zum ” einen h¨atten wir gerne einen Integrabilit¨atsbegriff, der etwas u ¨ber die Differentialgleichung statt u ¨ber unsere mathematischen F¨ahigkeiten aussagt. Zum anderen ist nicht ganz klar, was ,hinschreiben’ bedeutet. Soll die L¨osung durch ,bekannte Funktionen’, durch konvergente Reihen oder etwa durch einen Limesprozess angegeben werden? Wir wollen so vorgehen, dass wir zun¨achst ein Beispiel eines hamiltonschen Systems diskutieren, das wir als integrabel ansehen und danach einen Integrabilit¨atsbegriff abstrahieren. 13.1 Beispiel (Planare Bewegung im zentralsymmetrischen Potential) Wir betrachten die Bewegung in der Konfigurations-Ebene, also auf dem Phasenraum P := T ∗ R2q ∼ = R4 mit symplektischer Form ω0 = dq1 ∧ dp1 + dq2 ∧ dp2 und der Hamilton–Funktion H(p, q) := 12 p 2 + V (q) mit zentralsymmetrischem Potential V ∈ C ∞ (R2q , R) , V (q) = W ( q ). Der Drehimpuls L : P → R, L(p, q) := −q1 p2 + q2 p1 Poisson–kommutiert mit H, das heißt {H, L} = 0, und wir benutzen abk¨ urzend die Energie-DrehimpulsAbbildung F := (H, L) ∈ C ∞ (P, R2 ). Wir wissen also, dass die Bahn durch x0 ∈ P in der Menge F −1 (f ) ⊂ P mit ur regul¨are Werte f in der Bildmenge F (P ) ⊂ R2 des f := F (x0 ) bleibt. F¨ Phasenraums ist dies eine zweidimensionale Mannigfaltigkeit. Ein Wert f = (h, ) ist genau dann regul¨ar, wenn f¨ ur alle x = (p, q) ∈ F −1 (f ) die Kovektoren dH(x) und dL(x) linear unabh¨angig sind. • Ist dagegen dH(x) = 0, dann folgt mit dH(x) = p1 dp1 + p2 dp2 + ∂q1 V (q) dq1 + ∂q2 V (q) dq2
(13.1.1)
W ( q ) = 0 und p = 0, also auch L(x) = 0 und H(x) = W ( q ). Die entsprechenden singul¨aren Werte sind daher von der Form (h, ) = W ( q ), 0 , liegen also auf der Ordinate der (h, )–Ebene. • Ist stattdessen dH(x) = 0, aber f¨ ur ein c ∈ R dL(x) = c dH(x),
(13.1.2)
13. Integrable Systeme und Symmetrien
307
dann folgt mit dL(x) = q2 dp1 − q1 dp2 − p2 dq1 + p1 dp2 durch Koeffizientenvergleich von (13.1.1) und (13.1.2) mit J = q = c Jp
0 −1 1 0
und p = −c J∇V (q).
Die Menge solcher singul¨aren Punkte ist eine Nullmenge im Phasenraum P , und sie entspricht wegen L(x) = q, Jp = c p 2 den Kreisbahnen. In Abbildung 13.1.1 sind die entsprechenden singul¨aren Werte als die Grenzkurven von F (P ) ⊂ R2 erkennbar. H
H
L
L
Abbildung 13.1.1: Energie-Drehimpuls-Abbildung f¨ ur zentralsymmetrische Potentiale. Links: Harmonischer Oszillator, Rechts: Kepler–Potential Wegen der Drehinvarianz der Hamilton–Funktion empfehlen sich Polarkoordinaten (r, ϕ) mit (13.1.3) q1 = r sin ϕ , q2 = r cos ϕ, die wir zu kanonischen Koordinaten ausbauen k¨ onnen. Dazu setzen wir die erzeugende Funktion wie in Fall 2. des Kapitels 10.5 an: ∂S ∂S ∂S ∂S . , , (pr , pϕ , q1 , q2 ) = , ∂r ∂ϕ ∂p1 ∂p2 F¨ ur S(r, ϕ, p1 , p2 ) := p1 r sin ϕ + p2 r cos ϕ ist (13.1.3) erf¨ ullt. Weiter gilt dann pr = p1 sin ϕ + p2 cos ϕ =
p, q
q
,
pϕ = p1 r cos ϕ − p2 r sin ϕ = L.
Physikalisch kann pr also einfach als Radialkomponente des Impulses p = (p1 , p2 ) angesehen werden, w¨ahrend pϕ gleich dem Drehimpuls ist. Insgesamt erhalten wir eine kanonische Transformation , (pr , pϕ , r, ϕ) → (p1 , p2 , q1 , q2 ). Ψ : T ∗ R+ × S 1 → T ∗ R2 \ {0} Wegen der aus den trigonometrischen Additionstheoremen folgenden Identit¨at p21 + p22 = p2r +
L2 r2
ist
H ◦ Ψ (pr , pϕ , r, ϕ) =
p2ϕ p2r + 2 + W (r). 2 2r
308
13.1. Was bedeutet Integrabilit¨at? Ein Beispiel
Da H ◦ Ψ nicht von der Koordinate ϕ abh¨angt, wird p˙ ϕ = L˙ = 0, also := pϕ (0) = pϕ (t) eine Konstante der Bewegung von H ◦ Ψ. 2 2r2 ist eine Hamilton–Funktion mit einem Freiheitsgrad. W ist das sogenannte effektive Potential. Da die Energie h := K pr (0), r(0) zeitlich konstant ist, kennen wir schon die Orbits des von K erzeugten Flusses. Die Zeitparametrisierung ergibt sich mit r˙ = pr = 2(h − W (r)) durch Invertierung des Integrals r(t) dr = t − t0 . ± 2(h − W (r)) r0
K : T ∗ (R+ ) → R
,
K (pr , r) = 12 p2r + W (r)
mit
W (r) := W (r) +
F¨ ur = 0 ist wegen unserer Annahme der Stetigkeit von V der Grenzwert limr0 W (r) = +∞, sodass f¨ ur diese Energie h das Masseteilchen vom 2 Zentrifugalpotential 2mr2 am Besuch des Ursprungs gehindert ist. Nehmen wir c c stattdessen zum Beispiel V (q) = − q α mit α ∈ (0, 2) an, also W (r) = − r α , dann gilt immer noch das Gleiche. Unter der Voraussetzung V (q) ≥ −c(1+ q 2 ), siehe Satz 11.1 ist die Existenz der L¨osung der hamiltonschen Differentialgleichung f¨ ur alle Zeiten gesichert, und der Radialanteil der Bahnform l¨asst sich durch Kurvendiskussion beschreiben. Es kommen n¨amlich nur r–Werte mit W (r) ≤ h in Frage, eine Bedingung, die in Wl W45
h r rmin
rmax
W
Intervallen in R+ erf¨ ullt ist. Wir betrachten nur das zu dem Anfangswert geh¨orende Intervall. Dies ist entweder von der Form [rmin , rmax ] oder [rmin , ∞), entsprechend der gebundenen beziehungsweise ungebundenen Bewegung. Die Energieschale im Phasenraum sieht f¨ ur das Beispiel des Yukawa–Potentials W (r) := − exp(−r)/r entsprechend folgendermaßen aus:
13. Integrable Systeme und Symmetrien
309
p
r
Der Radius des Teilchenortes ver¨andert sich also im gebundenen Fall zeitperiodisch zwischen rmin und rmax , w¨ahrend er im ungebundenen Fall f¨ ur t → ±∞ gegen unendlich geht. Setzt man die L¨osung t → r(t) in die Differentialgleichung ϕ˙ =
q2
˜ pϕ ∂H = 2 = 2 ∂pϕ r r (t)
q1
ein, so ergibt sich t ϕ(t) = ϕ(t0 ) + t0 r−2 (s) ds. Insbesondere ist die Winkelgeschwindigkeit in der N¨ahe von rmax am kleinsten. In der Konfigurationsebene ergibt sich (f¨ ur das Yukawa–Potential) die abgebildete Bewegungsform. Im Phasenraum entsprechen die Zusammenhangskomponenten Mh, ⊆ F −1 (f ) = (p, q) ∈ R4 | H(p, q) = h , L(p, q) = im Fall der gebundenen Bewegung einem durch ϕ und den zeitlichen Abstand vom letzten Perizentrum parametrisierten Torus T2 := S 1 × S 1 , im Fall der ungebundenen Bewegung einem Zylinder S 1 × R. Wir werden in Satz 13.3 sehen, dass diese Formen der Untermannigfaltigkeiten f¨ ur integrable hamiltonsche Systeme typisch ist. 3
13.2
Der Satz von Liouville-Arnol’d
Wir abstrahieren die wesentlichen Bestandteile des vorausgegangenen Beispiels in einer Definition: 13.2 Definition Es sei H ∈ C ∞ (P, R) eine (Hamilton-)Funktion auf der symplektischen Mannigfaltigkeit (P, ω) der Dimension 2n. • Dann heißt F ∈ C ∞ (P, R) Konstante der Bewegung, wenn {F, H} = 0.
310
13.2. Der Satz von Liouville-Arnol’d
• Eine Menge {F1 , . . . , Fk } von Funktionen Fi ∈ C ∞ (P, R) ist in Involution, wenn die Poisson–Klammern verschwinden: i, j ∈ {1, . . . , k} . {Fi , Fj } = 0 • Sie heißt unabh¨ angig, wenn die Menge {x ∈ P | dF1 (x) ∧ . . . ∧ dFk (x) = 0} das Liouville–Maß 1 Null besitzt. • {F1 , . . . , Fk } heißt (Liouville-) integrabel, wenn die Fi in Involution und unabh¨angig sind und k = n ist. • Die Funktion H heißt dann integrabel, wenn zus¨atzlich zu F1 := H weitere n − 1 Konstanten der Bewegung F2 , . . . , Fn existieren, sodass {F1 , . . . , Fn } integrabel ist. Die obige Definition von Integrabilit¨at wirkt zun¨achst etwas abstrakt, erm¨oglicht es aber, durch Einf¨ uhrung geeigneter (halblokaler) kanonischer Koordinaten (I1 , . . . , In , ϕ1 , . . . , ϕn ) die Bewegung zu linearisieren. Die hamiltonschen Gleichungen werden in diesen Koordinaten die Form I˙k = 0 , ϕ˙ k = ωk (I) k ∈ {1, . . . , n} annehmen, womit sie durch Ik (t) = Ik (0) ,
ϕk (t) = ϕk (0) + ωk (I) t
gel¨ost werden. Wir beginnen mit einer Aussage, die sich im Lauf von u ¨ber hundert Jahren zur nachfolgenden Form entwickelt hat. 13.3 Satz (Liouville und Arnol’d) Es sei (P, ω) eine 2n–dimensionale symplektische Mannigfaltigkeit und {F1 , . . . , Fn } integrabel. f ∈ F (P ) ⊂ Rn sei regul¨arer Wert 2 der Abbildung F 1 .. F := : P → Rn , . Fn
Dann ist jede kompakte Zusammenhangskomponente Mf von F −1 (f ) diffeomorph zu einem n–dimensionalen Torus Tn = (S 1 )n . 1 Definition:
Ist (P, ω) eine symplektische Mannigfaltigkeit, dann heißt f¨ ur n := (−1)n/2 n ω n!
1 2
dim P
induzierte Maß auf P Liouville–Maß . das von der Volumenform F¨ ur (P, ω) = (T ∗ Rn , ω0 ) stimmt es mit dem Lebesgue–Maß u ¨berein. 2 Gleichbedeutend sind die Funktionen F , . . . , F −1 (f ) unn auf der Niveaumenge F 1 abh¨ angig, das heißt dF1 ∧ . . . ∧ dFn (x) = 0 falls F (x) = f .
13. Integrable Systeme und Symmetrien
311
Genauer gesagt existieren Winkelkoordinaten ϕ1 , . . . , ϕn auf Mf und Frequenzen ω1 , . . . , ωn ∈ R, in denen der von H erzeugte Fluss auf Mf die Form ϕk (t) = ϕk (0) + ωk t (mod 2π) , t ∈ R, k ∈ {1, . . . , n} (13.2.1) besitzt. Beweis: • Wir wissen schon (Beispiel 10.42.2), dass Mf eine n–dimensionale Lagrange–Mannigfaltigkeit ist. • Wegen der vorausgesetzten Kompaktheit von Mf und Regularit¨at von f ist f¨ ur kleine Radien ε > 0 der Kugel Bε (f ) := {f ∈ Rn | f − f ≤ ε} auch die Zusammenhangskomponente K von Mf in F −1 Bε (f ) ⊂ P kompakt. • Außerdem sind wegen dFk (XFl ) = {Fk , Fl } = 0 (Satz 10.16) die Vektorfelder XFl tangential zu den Niveaumengen von F . Auf K existiert nach Satz 3.27 der von dem hamiltonschen Vektorfeld XFk der k–ten Konstanten der Bewegung Fk erzeugte Fluss Φkt : K → K f¨ ur alle Zeiten t ∈ R. • Wir wissen, dass f¨ ur alle Zeiten ti ∈ R gilt Φktk ◦ Φltl = Φltl ◦ Φktk k, l ∈ {1, . . . , n} , denn nach Satz 10.21 kommutieren die von Vektorfeldern X, Y erzeugten Fl¨ usse genau dann, wenn [X, Y ] = 0, und nach Bemerkung 10.23 ist der Kommutator [XFk , XFl ] = −X{Fk ,Fl } = 0, denn {Fk , Fl } = 0. Nun wollen wir die Abbildung Ψ : Rn × Mf → Mf , (t1 , . . . , tn ), x → Φ1t1 ◦ . . . ◦ Φntn (x) (13.2.2) zur Parametrisierung von Mf verwenden. Tats¨achlich ist dies eine Abbildung in Mf , denn die Fl¨ usse Φkt lassen Mf invariant (die Vektorfelder XFk sind ja tangential an Mf ). Außerdem gilt f¨ ur Ψt : Mf → Mf , Ψt (x) := Ψ(t, x) Ψ0 = IdMf , Ψs ◦ Ψt = Ψs+t s, t ∈ Rn . Damit ist Ψ eine Gruppenwirkung der Lie–Gruppe Rn auf Mf (siehe Bemerkung 2.17.7 und Definition E.4). • Wegen der Unabh¨angigkeit der dFk sind auch die n Vektorfelder XFk auf Mf unabh¨angig. Damit (und wegen Kompaktheit von Mf ) existiert eine Umgebung U ⊂ Rn der Null, sodass f¨ ur alle x ∈ Mf die Abbildung U → Mf , t → Ψ(t, x) ein Diffeomorphismus aufs Bild Ψ U, {x} ist (siehe Abbildung 13.2.1). Die Gruppenwirkung ist also lokal frei. Das Bild Ψ Rn , {x} der Abbildung Rn → Mf , t → Ψ(t,x) ist damit offen in Mf (und nicht leer!). Aber auch sein wenn Komplement Mf \Ψ Rn , {x} ist offen. Denn y im Komplement des Bildes liegt, dann muss auch die Umgebung Ψ U, {y} von y im Komplement liegen, n da sonst ein z ∈ Ψ R , {x} ∩ Ψ U, {y} existierte, also z = Ψt (x) = Ψs (y) mit s, t ∈ Rn geeignet, woraus y = Ψt−s (x) folgte. Weil also Ψ Rn , {x} offen und abgeschlossen und außerdem nicht leer ist, muss es eine Zusammenhangskomponente von Mf sein. Da aber nach Voraussetzung Mf zusammenh¨angend ist, ist Ψ Rn , {x} = Mf , die Gruppenwirkung
312
13.2. Der Satz von Liouville-Arnol’d
Rn
Ψ(t, x)
Mf
U t x Ψ(U, x)
Abbildung 13.2.1: Gruppenwirkung Ψ also, wie man sagt, transitiv . • Die Isotropiegruppe Γ eines Punktes x ∈ Mf (siehe untenstehende Abbildung) ist durch (13.2.3) Γ ≡ Γx := {t ∈ Rn | Ψt (x) = x} definiert. Γ ist von der Wahl von x unabh¨angig, denn wegen der Transitivit¨at von Ψ existiert f¨ ur y ∈ Mf ein s ∈ Rn mit y = Ψs (x). Da Ψ eine Gruppenwirkung der abelschen Gruppe Rn ist, gilt Γy = {t ∈ Rn | Ψt+s (x) = Ψs (x)} = Γx . Da die Gruppenwirkung lokal frei ist, existiert eine Umgebung U ⊂ Rn von 0 ∈ Γ mit U ∩ Γ = {0}. F¨ ur t ∈ Γ ist daher t der einzige Punkt in der Umgebung U + t, der zur Isotropiegruppe geh¨ ort. Damit ist Γ eine (als Teilmenge des topologischen Raumes Rn , siehe Def. A.20) diskrete Untergruppe des Rn . Wir unterbrechen den Beweis von Satz 13.3, um diese Untergruppen zu untersuchen. 13.4 Lemma Sei Γ ⊂ Rn eine diskrete Untergruppe und k := dim spanR (Γ) . Dann existieren linear unabh¨angige Vektoren 1 , . . . , k ∈ Γ mit
k Γ = spanZ (1 , . . . , k ) := z ∈ Z . z i i i i=1 Beweis: Wir bezeichnen einen Unterraum U ⊂ Rn als Γ–Teilraum, wenn spanR (U ∩ Γ) = U, und wir konstruieren induktiv Basen ur geeignete Γ–Teilr¨aume 1 , . . . , m ∈ Γ f¨ Um ⊂ Rn der Dimensionen m ≤ k, die gleichzeitig Z–Basen von Um ∩ Γ sind, das heißt
2 1
2 1 1
2
3
Um ∩ Γ = spanZ (1 , . . . , m ). • {0} ⊂ Γ ist ein 0-dimensionaler Γ–Teilraum. • Haben wir f¨ ur m < k einen Γ–Teilraum Um mit Basis 1 , . . . , m konstruiert,
13. Integrable Systeme und Symmetrien
313
dann existiert ein von diesen linear unabh¨angiger Vektor m+1 ∈ Γ, der minimalen Abstand a > 0 zum Unterraum spanR (1 , . . . , m ) besitzt.3 Denn Γ \ spanZ (1 , . . . , m ) = ∅, und wir k¨ onnen aus m+1 durch Translation mit
einem Vektor ∈ spanZ (1 , . . . , m ) einen Vektor der L¨ange m+1 − ≤ m a + i=t i gewinnen. W¨are das Infimum der Abst¨ande zum Unterraum gleich Null, dann w¨ urde dies der Diskretheit von Γ widersprechen. • Um+1 = spanR (1 , . . . , m+1 ) ist nach Konstruktion ein Γ–Teilraum. • 1 , . . . , m+1 ist eine Z–Basis von Um+1 , denn jedes ∈ Um+1 ∩ Γ l¨aßt sich eindeutig in der Form = zm+1 + u
mit
u ∈ Um
und z ∈ R
zerlegen. Der Vektor − zm+1 ∈ Um+1 ∩ Γ hat den Abstand (z − z) · a vom Unterraum Um . Da dieser nicht echt zwischen 0 und a liegen kann, ist z ∈ Z. Damit ist u ∈ spanZ (1 , . . . , m ), und letztlich ∈ spanZ (1 , . . . , m+1 ). 2 Ende des Beweises von Satz 13.3: • Erg¨anzen wir die Z–Basis 1 , . . . , k aus Lemma 13.4 zu einer R–Basis 1 , . . . , n von Rn , so ergibt sich durch Basiswechsel der Gruppenisomorphismus und Diffeomorphismus Rn /Γ ∼ = Rn−k × (R/Z)k ∼ = Rn−k × Tk . = Rn /Zk ∼ Da nach Voraussetzung Mf kompakt ist, und Mf ∼ = Rn /Γ, gilt k = n und n Mf ∼ =T . • Da Mf also diffeomorph zum n–Torus ist, folgt, dass man die Punkte auf Mf durch n Winkel ϕ1 , . . . , ϕn parametrisieren kann. Dies ist sogar in einer Weise m¨oglich, in der der von H = F1 erzeugte Fluss eine besonders einfache Form besitzt: Es sei 1 , . . . , n wieder eine Basis der Isotropiegruppe Γ ⊂ Rn aus (13.2.3). Dann ist f¨ ur jeden Punkt x ∈ Mf die durch Restriktion der Rn -Wirkung (13.2.2) definierte Abbildung n ϕi i n ,x [0, 2π[ −→ Mf , (ϕ1 , . . . , ϕn ) −→ Ψ 2π i=1 1
.. ∈ Rn habe die Darstellung e1 = ni=1 . 0 von H erzeugte Fluss besitzt dann die Form n ωi i 1 ,y . Φt1 (y) = Ψ (t1 , 0, . . . , 0), y = Ψ t1 2π i=1
bijektiv. Der Vektor e1 =
0
ωi 2π i .
Der
Also gilt f¨ ur die Koordinaten ϕ1 (t), . . . , ϕn (t) von Φ1t (y) Gleichung (13.2.1). 2 3 Statt dessen einen von , . . . , angigen k¨ urzesten Vektor m+1 ∈ Γ zu m linear unabh¨ 1 w¨ ahlen, f¨ uhrt in hohen Dimensionen im Allgemeinen nicht zum Ziel, siehe zum Beispiel Quaisser [Qu], §5.1.
314
13.2. Der Satz von Liouville-Arnol’d
13.5 Bemerkung Eine Bewegung von dem im zweiten Teil des Satzes gegebenen Typ auf einem n–Torus heißt bedingt-periodische Bewegung, siehe auch Seite 371. 3 Π
0
2Π 2Π
2
Π
0
1 Abbildung 13.2.2: Bedingt-periodische Bewegung mit Frequenzverh¨altnis dem Torus T2
√
2 auf
13.6 Bemerkung (Symplektische Integratoren) Die meisten hamiltonschen Systeme sind nicht integrabel. F¨ ur die Berechnung ihrer Dynamik ist man also auf Numerik angewiesen. Ironischerweise sind bei der Entwicklung einer dem Problem angepassten Numerik die integrablen Systeme hilfreich. Bei der numerischen Approximation hamiltonscher Dynamik ist es n¨amlich vorteilhaft, wenn diese selbst eine symplektische Zeitevolution liefert. Beispielsweise besagt Satz 7.3 u ¨ber starke Stabilit¨at, dass im linearen Fall kleine symplektische St¨orungen eines nicht resonanten hamiltonschen Systems dessen LiapunovStabilit¨at nicht verletzen, w¨ahrend dies f¨ ur allgemeine St¨orungen der Fall ist. Entsprechende numerische Verfahren heißen symplektische Integratoren. Die Grundidee kann am Beispiel der Bewegung im Potential, mit Hamilton– Funktion H(p, q) = T (p) + V (q) auf dem Phasenraum P := Rdp × Rdq erl¨autert werden. Als Hamilton-Funktionen sind die Summanden T und V integrabel, mit den vollst¨andigen Fl¨ ussen Φt (p, q) = p, q+t∇T (p) und Ψt (p, q) = p−t∇V (p), q t ∈ R, (p, q) ∈ P . Wir nehmen an, dass auch der von H selbst erzeugte Fluss vollst¨andig ist, wir ihn also in der Form Ξt : P → P mit t ∈ R notieren k¨onnen. Eine beliebige Verkettung Φc1 t ◦ Ψd1 t ◦ . . . ◦ Φc1 t ◦ Ψd1 t der Fl¨ usse ist symplektisch. Wir nennen sie symplektischen Integrator n–ter Ordnung, wenn gilt: Φc1 t ◦ Ψd1 t ◦ . . . ◦ Φc1 t ◦ Ψd1 t = Ξt + o(tn+1 ), eventuell in einer Problem-angepassten Metrik auf dem Phasenraum. Beispielsweise ergibt die Kombination c1 = d1 = 1 einen symplektischen Integrator 1–ter
13. Integrable Systeme und Symmetrien
315
Ordnung, Φt/2 ◦ Ψt ◦ Φt/2 = Ξt + o(t3 ), etc. siehe Yoshida [Yo]. Man iteriert dann die verketteten Abbildungen numerisch O(T /t) mal, um nach der Gesamtzeit T zu einem Fehler der Ordnung o(tn ) zu kommen. 3 13.7 Weiterf¨ uhrende Literatur Wie mit dem Zitat von Birkhoff auf Seite 306 angedeutet, gibt viele Integrabilit¨atsbegriffe, die zwar aufeinander bezogen werden k¨onnen, sich aber auf unterschiedliche Anwendungsbereiche beziehen. Insbesondere k¨ onnen auch nichtlineare partielle Differentialgleichungen integrabel sein. Ein in [AM] behandeltes Beispiel ist die Korteweg-de Vries–Gleichung orungstheorie wird unter anderem im ut = 6uux − uxxx . Ihre hamiltonsche St¨ Buch [KP] von Kappeler und P¨ oschel behandelt. Algebraische Aspekte von Integrabilit¨at findet man etwa in Arnol’d und Novikov [AN], und Moser [Mos2]. Differentialgeometrie erm¨ oglicht ein tieferes Verst¨andnis von Integrabilit¨at. Aber auch differentialgeometrische Objekte wie Fl¨achen k¨onnen L¨osungen integrabler partieller Differentialgleichungen sein. Eine diskretisierte solche Fl¨ache ist auf Seite 305 abgebildet, und die diskrete Differentialgeometrie integrabler Strukturen wird in [BoSu] von Bobenko und Suris untersucht. 3
13.3
Winkel-Wirkungskoordinaten
Als n¨achsten Schritt werden wir nicht nur auf einem einzelnen Torus Mf Winkelkoordinaten einf¨ uhren, sondern diese auf eine offene Phasenraumumgebung von Mf ausdehnen und durch n sogenannte Wirkungskoordinaten zu kanonischen Koordinaten im Sinn von Bemerkung 10.18 erg¨anzen. 13.8 Satz (Winkel-Wirkungskoordinaten) Unter den Voraussetzungen des Satzes von Liouville und Arnol’d (Satz 13.3) existieren auf einer Umgebung U ⊂ P jeder kompakten Zusammenhangskomponente Mf von F −1 (f ) Wirkungskoorϕn : U → R/(2πZ), dinaten I1 , . . . , In : U → R und Winkelkoordinaten ϕ1 , . . . ,
sodass die symplektische Form die kanonische Gestalt ω = nk=1 dϕk ∧ dIk besitzt und die hamiltonschen Differentialgleichungen die folgende Form annehmen: I˙k = 0 , ϕ˙ k = ωk (I)
(k = 1, . . . , n).
Beweis: • Dass f regul¨arer Wert von F ist, bedeutet zwar noch nicht, dass eine offene ˜ ⊆ Rn von f existiert, die ebenfalls aus regul¨aren Werten von Umgebung U 4 F besteht. W¨ahlt man aber U als diejenige Zusammenhangskomponente von ˜ ) ⊆ P , in der Mf liegt, dann kann man wegen der Kompaktheit von F −1 (U 4 Beispiel: Der Wert f = 0 von F : (0, ∞) → R, x → x sin(1/x) ist regul¨ ar, aber in jeder Umgebung von f liegen Extremalwerte von F .
316
13.3. Winkel-Wirkungskoordinaten
˜ sicherstellen, dass alle x ∈ U regul¨are Punkte Mf durch Verkleinerung von U von F sind. • Die gemeinsamen Nullstellen der n Winkelkoordinaten sollen auf einer noch genauer zu bestimmenden n-dimensionalen und zu Mf transversalen Fl¨ache ˜ →U N :U
mit
F ◦ N = IdU˜
liegen. Wegen der Regularit¨at von F auf U ist die (zu (13.2.2) analoge) Abbildung Ψ : Rn × U → U , (t1 , . . . , tn ), x → Φ1t1 ◦ . . . ◦ Φntn (x) (13.3.1) eine lokal freie Gruppenwirkung von Rn . Analog zu (13.2.3) h¨angt die Isotropiegruppe Γx := {t ∈ Rn | Ψt (x) = x} (13.3.2) eines Punktes x ∈ U nur von F (x) ab. Da nach dem Satz u ¨ber die implizite Funktion die Punkte des Gitters Γx glatt von x abh¨angen, und da angenom˜ einfach zusammenh¨angend ist, kann eine Z–Basis men werden kann, dass U n 1 (x), . . . , n (x) ∈ R von Γx gew¨ahlt werden, deren Vektoren glatt von x ∈ U abh¨angen. Nach (13.2.1) kann jeder Punkt y ∈ U eindeutig in der Form n ϕi i (x) , x mit ϕi ∈ [0, 2π), x := N ◦ F (y) und i (x) = i (y) y=Ψ 2π i=1 (13.3.3) dargestellt werden. Damit haben wir Winkelkoordinaten ϕ1 , . . . , ϕn auf U definiert.
n • Wenn die symplektische Form auf U die kanonische Gestalt ω = k=1 dIk ∧ dϕk besitzen soll, m¨ ussen (nach Bemerkung 10.18) die Poisson–Klammern {ϕi , ϕk } gleich Null sein. Wegen der Beziehung {ϕi , ϕk } = LXϕk ϕi ist das genau dann der Fall, wenn die hamiltonschen Vektorfelder Xϕk tangential zur Mannigfaltigkeit N sind, diese also wegen {ϕi , ϕk } = ω(Xϕi , Xϕk ) eine Lagrange–Mannigfaltigkeit ist. Wegen des Satzes von Darboux (Satz 10.31) k¨onnen wir die n-dimensionale Fl¨ache N entsprechend w¨ahlen. • Um den Winkeln ϕk zugeordnete Wirkungskoordinaten Ik : U → R zu finden, suchen wir nach einer diese bestimmenden Eigenschaft der Abbildung I = (I1 , . . . , In ) : U → Rn . ˜ → Rn . Da I h¨angt nur von den Werten von F ab: I = I˜ ◦ F , mit I˜ : U {Fi , Fk } = 0 ist, Poisson–kommutieren also auch die Ik miteinander.
13. Integrable Systeme und Symmetrien
317
Die Ableitung DI˜ wird durch die angestrebte Form {ϕi , Ik } = δi,k der Poisson– Klammern festgelegt. In (13.3.3) ist das erste Argument von Ψ gleich t(ϕ) :=
n ϕi i ∗ n ∗ i=1 2π . Mit den dualen Basisvektoren i : U → R , i , j := 2πδi,j ist ∗ also i , t(ϕ) = ϕi . Aus . {ϕi , Fj } = LXFj ϕi = LXFj ∗i , t(ϕ) = ∗i , LXFj t(ϕ) = ∗i , ej = ∗i,j (13.3.4) folgt schließlich δi,k = {ϕi , Ik } = {ϕi , I˜k ◦ F } =
n
. {ϕi , Fj } Dj I˜k ◦ F = ∗i , DI˜k ◦ F
j=1 k oder DI˜k ◦ F = 2π . Da die Basisvektoren k auf den Tori konstant sind, also ˜ onnen, ist die Bestimmungsgleichung in der Form k ◦ F geschrieben werden k¨ ˜ := (˜1 , . . . , ˜n ) einfach mit L
DI˜ =
˜ L . 2π
(13.3.5)
˜:U ˜ → Rn eine Integrabilit¨ats• F¨ ur n > 1 Dimensionen muß die Abbildung L bedingung erf¨ ullen, damit (13.3.5) eine L¨ osung besitzt. Denn da die partiellen Ableitungen von I˜ vertauschen, gilt dann Di ˜j,k = Dk ˜j,i
(i, j, k = 1, . . . , n).
(13.3.6)
Andererseits ist wegen des Poincar´e-Lemmas (Satz B.48) Gleichung (13.3.5) ˜ ⊆ Rn (zum Beispiel einer Vollauf einfach zusammenh¨angenden Gebieten U kugel) l¨osbar, wenn (13.3.6) gilt. Aus der Poisson-Identit¨at (13.3.7) ϕi , {ϕj , Fk } + Fk , {ϕi , ϕj } + ϕj , {Fk , ϕi } = 0 folgern wir wegen {ϕi , ϕj } = 0 mit (13.3.4): {ϕi , ∗j,k } = {ϕj , ∗i,k }. Nennen ˜ inverse Matrix M ˜ : U ˜ → Rn , dann erf¨ ullen deren Eintr¨age wir die zu L m ˜ j,k in Einsteinscher Summenkonvention die Relation ˜li,j m ˜ j,k = δi,k , und ˜ k,j ◦ F } = {ϕj , m ˜ k,i ◦ F }. {ϕi , m Es ergibt sich daher bei nochmaliger Verwendung von (13.3.4) aus (13.3.7) die Beziehung m ˜ r,i Dr m ˜ k,j = m ˜ r,j Dr m ˜ k,i oder Di m ˜ a,b = ˜s,i m ˜ r,b Dr m ˜ a,s . ˜L ˜ = 0 ist Di ˜lj,k = − ˜lj,a ˜lb,k Di m ˜ a,b . Wegen Di M
(13.3.8)
Einsetzen von (13.3.8) auf der rechten Seite best¨atigt, dass die Integrabilit¨atsbedingung (13.3.6) erf¨ ullt ist. 2 Nebenbei: Der Vektor I : U → Rn der Wirkungsvariablen ist durch die Ableitung nur bis auf Addition eines Vektors v ∈ Rn festgelegt.
318
13.3. Winkel-Wirkungskoordinaten
13.9 Bemerkung (Bedeutung der Winkel-Wirkungskoordinaten) Warum interessiert man sich u ur die Wirkungsvariablen Ik und gibt sich nicht ¨berhaupt f¨ mit den Konstanten der Bewegung Fk zufrieden? Weil sie so einfach sind, dass die zugrundeliegende Phasenraumgeometrie klar hervortritt: 1. Zum einen ver¨andert der von Ik erzeugte hamiltonsche Fluss auf Mf ja nur den k–ten Winkel ϕk . Dagegen variiert der von Fk erzeugte Fluss im Allgemeinen alle Winkel gleichzeitig. ur n = 1 2. Selbst wenn f¨ ur alle i = k gilt: {ϕi , Fk } = 0 (insbesondere also f¨ Freiheitsgrad), bilden die Fk , zusammen mit ,geeigneten’ Winkelvariablen ϕk im Allgemeinen keine kanonischen Koordinaten, das heißt die Poisson– Klammern {ϕk , Fi } sind, im Gegensatz zu {ϕk , Ii }, ungleich δi,k . Wegen ihrer Einfachheit sind die Winkel-Wirkungskoordinaten ein idealer Ausgangspunkt f¨ ur die Untersuchung (meist nicht integrabler) hamiltonscher St¨orungen, siehe Kapitel 15. 3 Im folgenden Abschnitt wird eine Methode vorgestellt, mit der sich die Wirkungskoordinaten durch Integration 5 finden lassen. In diesem Sinn erm¨oglicht uns die Integrabilit¨at eines hamiltonschen System auch, seine L¨osungen zu berechnen. Wie konstruieren wir nun die Wirkungsvariablen aus den Konstanten der Bewegung Fk ? Wir benutzen eine Eins–Form θ mit symplektischer Zwei–Form ω = −dθ. Auf Kotangentialr¨aumen (P, ω) = (T ∗ N, ω0 ) bietet sich die tautologische Eins–Form θ0 an. Aber auch auf der Phasenraumumgebung U ⊂ P von Satz 13.8 gibt es nach Konstruktion der Winkel-Wirkungskoordinaten immer ein
n I ∧ dϕ solches θ, zum Beispiel k. k=1 k Versuchen wir f¨ ur einen fest gew¨ahlten Punkt x0 ∈ Mf zun¨achst eine Funktion auf Mf durch x θMf S(x) := x0
zu definieren. Unter diesem Ausdruck soll das Wegintegral der symplektischen Eins–Form θ entlang eines x mit x0 verbindenden Weges γ : [0, 1] → Mf , γ(0) = x0 , γ(1) = x verstanden werden. H¨angt nun S, wie die Schreibweise suggeriert, nur von x, nicht aber von der Wahl von γ ab? Betrachten wir dazu zwei Wege γ0 und γ1 : [0, 1] → Mf mit den gegebenen Endpunkten. Wir setzen zun¨achst einmal voraus, dass γ0 unter Beibehaltung der Endpunkte in γ1 deformiert werden kann, das heißt wir setzen die Existenz einer stetigen Homotopie H : I × I → Mf , I := [0, 1] mit H(t, 0) = γ0 (t)
, H(t, 1) = γ1 (t)
, H(0, y) ≡ x0
, H(1, y) ≡ x
5 manchmal auch Quadratur genannt, da der Fl¨ acheninhalt eines von einer Kurve begrenzten Gebietes gesucht wird.
13. Integrable Systeme und Symmetrien
319
voraus, siehe Anhang A.22. Dann ist aber γ0 θMf = γ1 θMf , denn ∗ ∗ θMf − θMf = H (θ) = dH (θ) = H ∗ (dθ) = 0 γ0
γ1
∂(I×I)
I×I
I×I
nach dem Satz von Stokes (Satz B.39), und weil die symplektische Zwei–Form ω = −dθ auf der Lagrange-Untermannigfaltigkeit Mf identisch verschwindet. Es sieht so aus, als ob wir bewiesen h¨atten, dass S(x) nicht von der Wahl des Weges abh¨angt. Aber Vorsicht! Wir haben vorausgesetzt, dass die Wege zueinander homotop sind. Nun sind aber nicht alle Wege auf dem Torus zueinander homotop. Insbesondere finden wir ja n nur bei x0 kreuzende Wege γ1 , . . . , γn mit γi (0) = γi (1) = x0 , wobei γi gerade die i–te Winkelrichtung einmal im positiven Sinn durchl¨auft. Wir k¨ onnen also das Integral ,S(x0 )’ auf viele verschiedene Wei-
p Mf
γ q x0
Abbildung 13.3.1: Links: Basis γ1 , . . . , γn der Fundamentalgruppe des n–Torus Mf . Rechts: Invarianter Eins-Torus Mf = γ([0, 1]) sen berechnen beziehungsweise interpretieren, indem wir es z.B. als Schreibweise f¨ ur γk θ auffassen. Bezeichnen wir versuchsweise diese Integrale mit 1 Ik := θ (k = 1, . . . , n). (13.3.9) 2π γk Sind die Ik Null? Sie denken gar nicht daran. 13.10 Beispiel Im besonders einfachen Fall des symplektischen Phasenraums P := Rp × Rq mit ω0 = dq ∧ dp ist Mf das Bild einer geschlossene Kurve γ : [0, 1] → P (siehe Abbildung 13.3.1, rechts). Das Integral aus (13.3.9) ist 1 −1 I= p dq = ω0 , 2π γ 2π F wobei F ⊂ R2 nach dem Satz von Stokes (Satz B.39) das von der orientierten Kreislinie Mf = ∂F eingeschlossene kompakte Fl¨achenst¨uck ist. I ist also proportional zum eingeschlossenen Fl¨acheninhalt. 3
320
13.3. Winkel-Wirkungskoordinaten
Wir k¨onnen nicht nur auf Mf , sondern auch auf benachbarten Tori Mf˜ mit uhren und die Ausdr¨ ucke Ik werden nach
f˜ − f klein, Wege γ1 , . . . , γn einf¨ dem, was wir gerade bewiesen haben, nur Funktionen Ik = I˜k (F1 , . . . , Fn ) der Konstanten der Bewegung sein. ur die Wirkungsvariablen. Die Ik sind unsere Kandidaten f¨ Um die Winkelvariablen einzuf¨ uhren, betrachten wir in der N¨ahe eines typischen Punktes x0 = (p0 , q0 ) ∈ Mf die Darstellung von Mf als Graph der ˜ ), siehe Abbildung 13.3.2. Diese wird nat¨ Funktion p = p(I, q) mit I = I(f urlich nicht f¨ ur alle x0 ∈ Mf m¨ oglich sein.
x0 p(I, q)
q
q0
Abbildung 13.3.2: Lokale Darstellung von Mf als Graph einer Funktion Wir setzen ϕk (q) :=
n l=1
q q0
∂ S˜ ∂pl (I, q) dql = ∂Ik ∂Ik
(13.3.10)
mit der (f¨ ur ein einfach zusammenh¨angendes Gebiet des Torus definierten) Funktion q ˜ q) := p(I, q) · dq. S(I, q0 ˜ ∂S ∂q
˜ ∂S ∂I ,
Es ist also p = und ϕ = sodass die Transformation (p, q) → (I, ϕ) lokal kanonisch ist. Die lokalen Koordinaten ϕk lassen sich nun tats¨achlich als Winkel interpretieren, das heißt wir k¨ onnen exp(iϕk ) als Funktion Mf → S 1 ⊂ C auffassen. Denn in einer Umgebung von x0 ∈ Mf stimmt x ∂ θ (13.3.11) exp iϕk (x) = exp i (x ∈ Mf ) ∂Ik x0 Mf mit der Definition (13.3.10) u ¨berein, und wegen (13.3.9) ist modulo 2πi das Argument der Exponentialfunktion in (13.3.11) unabh¨angig von der Wahl des Weges γ : I → Mf zwischen γ(0) = x0 und γ(1) = x.
13. Integrable Systeme und Symmetrien
321
13.11 Beispiel (Planares Pendel) Die Hamilton–Funktion des ebenen Pendels ist (wie im Beispiel 8.11 der Perle am sich nicht drehenden Draht) nach Normalisierung von Pendell¨ange und Erdbeschleunigung gleich H(pψ , ψ) = 12 p2ψ − cos(ψ). Dabei ist ψ der Winkel gegen die untere Ruhelage. Wie man aus der Taylor– Entwicklung − cos(ψ) = −1 + 12 ψ 2 + O(ψ 4 ) abliest, ist die an der unteren Ruhelage linearisierte Entwicklung die des harmonischen Oszillators mit Frequenz Eins. Wie sich die Frequenz bei Vergr¨ oßerung der Gesamtenergie h ≥ −1 ver¨andert, = p = 2(h + cos(ψ)). ergibt die Formel f¨ ur die Zeitableitung des Winkel: dψ ψ dt Also braucht das Pendel die Zeit ψ −1/2 1 h + cos(x) dx, (13.3.12) th (ψ) = √ 2 0 um den Winkel ψ zu erreichen. Entsprechend dem Wert h = 1 der potentiellen Energie an der oberen Ruhelage (pψ , ψ) = (0, π) sind drei F¨alle zu unterscheiden: • h = 1: Die Energiefl¨ache H −1 (h) besteht aus der instabilen oberen Ruhelage und zwei weiteren Orbits, die homoklin genannt werden, da sie diesen Sattelpunkt mit sich selbst verbinden. Man nennt H −1 (h) manchmal auch Separatrix, da sie Phasenraumgebiete mit qualitativ unterschiedlichem Verhalten berandet. Auf den homoklinen Orbits ist der Zeitparameter ±1 mal ψ z −1 1 cos(x/2) dx = (1 − y 2 )−1 dy, t1 (ψ) = 2 0
0
1+z mit Substitution z = sin(ψ/2). Damit ist t1 (ψ) = 12 log( 1−z ), das heißt die Ann¨aherung an die instabile obere Ruhelage ψ = ±π geschieht in mit der Winkeldifferenz logarithmisch divergierender Zeit.
• h ∈ (−1, 1): Hier besteht die Energiefl¨ache aus einem Orbit. Die Gesamtenergie reicht nicht aus, um die obere Ruhelage zu erreichen, und der Maximalwinkel ist betragsm¨aßig gleich ψh := arccos(−h). Eingesetzt in (13.3.12) ist th (ψ) gleich ψ ψ −1/2 −1/2 2 1 √ dx = 12 dx. cos(x)−cos(ψh ) sin (ψh /2)−sin2 (x/2) 2 0 0 Nachschauen in der Integraltabelle oder Eingeben in ein Computeralgebrasystem ergibt, nach dem Winkel aufgel¨ ost, sin(ψ/2) = sin(ψh /2) sn t ; sin(ψh /2) , wobei sn eine jacobische elliptische Funktion (den sinus amplitudinis) bezeichnet. Die Periode des Pendels ist damit T (h) := 4K(sin(ψh /2)), wobei das
322
13.4. Die Impulsabbildung
vollst¨andige elliptische Integral erster Art K(k) :=
π/2
1 − k2 sin(ϕ)2
−1/2
T dϕ
0
6Π
ist. Man sieht diesem an, dass bei 4Π Vergr¨oßerung der Energie die Periode monoton von 2π nach Unendlich 2Π anw¨achst. Der Winkel ϕ (im Sinn von WinkelWirkungsvariablen auf dem invarianten 1 0 1 2 Torus) ist proportional zur Zeit t, mit Periode des planaren Pendels Proportionalit¨atskonstante 2π/T (h).
h
• h ∈ (1, ∞): Hier reicht die Energie aus, um in konstanter Richtung zu rotieren, und entsprechend besitzt die Energiefl¨ache zwei Zusammenhangskomponenten. Es ergibt sich analog √ √ sin(ψ/2) = sn (1+h)/2 t ; 2/(1+h) , √ √ und die Periode T (h) = 2 2/(1+h) K 2/(1+h) f¨allt wieder monoton in h. Die Winkelvariable ϕ wird wie eben definiert. 3 13.12 Aufgabe (Wirkung des planaren Pendels) Bestimmen Sie die Wirkung I als Funktion der Energie h durch Fl¨achenberechnung des Gebiets {(pψ , ψ) ∈ R × S 1 | H(pψ , ψ) ≤ h}, in Termen vollst¨andiger elliptischer Integrale. 3
13.4
Die Impulsabbildung
Unter g¨ unstigen Umst¨anden kann man bei Vorhandensein von Symmetrien der Hamilton–Funktion aus diesen Konstanten der Bewegung berechnen, im Idealfall sogar die Bewegungsgleichungen l¨ osen. Klassisch wird ein solcher Zusammenhang zwischen Symmetrien und Erhaltungsgr¨oßen durch das Noether-Theorem hergestellt. Heute bedient man sich oft der ebenfalls in diesem Kapitel vorgestellten Impulsabbildung. Am Beispiel der Bewegung im zentralsymmetrischen Potential Der in Definition 13.2 dargestellte Integrabilit¨atsbegriff ist aber daf¨ ur oft noch zu eng. Dies sehen wir am Beispiel 13.1 der planaren Bewegung im zentralsymmetrischen Potential. • Zum Einen wurde dort die mit der Hamilton–Funktion H Poisson-kommutierende Drehimpulsfunktion L aus dem Hut gezaubert. Wichtig ist hier zu erfahren, wie man dergleichen Phasenraumfunktionen bei Kenntnis der Symmetrie von H berechnen kann.
13. Integrable Systeme und Symmetrien
323
• Zum Anderen wurde schon vorausgesetzt, dass sich das Teilchen in einer Ebene des Konfigurationsraumes R3q bewegt, obwohl man dies beweisen kann. Dazu muss man aber auch untereinander nicht kommutierende Konstanten der Bewegung zulassen. Wir setzen an der letzten Feststellung an, betrachten also die Bewegung eines Massenpunktes mit Masse m im R3q unter dem Einfluss einer Zentralkraft mit Potential V : R3q → R, (das heißt V (O q) = V (q) f¨ ur O ∈ O(3)) und Hamilton– Funktion auf dem Phasenraum P := R3p × R3q , H:P →R
, H(p, q) :=
p 2 + V (q). 2m
Die Komponenten des sogenannten Drehimpulsvektors sind Phasenraumfunktionen: q1 p1 q2 p3 −q3 p2 L1 3 L = L2 : P → R , L(p, q) = q × p = qq2 × pp2 = q3 p1 −q1 p3 . L3
3
3
q1 p2 −q2 p1
(13.4.1) Es ist 3 ∂L2 ∂L1 ∂L1 ∂L2 + − = −q2 p1 + (−p2 )(−q1 ) = L3 , {L1 , L2 } = ∂pi ∂qi ∂pi ∂qi i=1
{L2 , L3 } = L1
und {L3 , L1 } = L2 .
Andererseits gibt es wegen der Radialsymmetrie von V : R3 → R ein W : [0, ∞) → R mit V (q) ≡ W ( q ). Daraus folgt 1 {L1 , p21 + p22 + p23 } + {L1 , W ( q )} {L1 , H} = 2m 3 1 ∂(q2 p3 − q3 p2 ) ∂(p21 + p22 + p23 ) ∂(q2 p3 − q3 p2 ) ∂ q
= − DW ( q ) 2m i=1 ∂qi ∂pi ∂pi ∂qi = 0. Analog ist auch {L2 , H} = {L3 , H} = 0. Wir k¨onnen durch eine Drehung (p, q) → (Op, Oq) mit Matrix O ∈ SO(3) immer erreichen, dass L1 (p, q) = L2 (p, q) = 0 ist. p und q m¨ ussen dann in der 1 − 2–Ebene liegen, und wir k¨ onnen zum neuen Phasenraum R2p × R2q ⊂ R3p × R3q und der darauf restringierten Hamilton–Funktion p21 + p22 2 2 2 2 q1 + q2 +W HR2p ×R2q : Rp × Rq → R , (p, q) → 2m u ¨bergehen. Die umbenannte dritte Drehimpulskomponente L : R2p × R2q → R
,
L(p, q) = q1 p2 − q2 p1
324
13.4. Die Impulsabbildung
bleibt dabei Konstante der Bewegung. In diesem Beispiel haben wir mit den Drehimpulskomponenten sogar drei Konstanten der durch H definierten Bewegung und sie bilden zusammen mit H ein System von vier unabh¨angigen Funktionen. Aber die Drehimpulskomponenten sind untereinander nicht in Involution, die Integrationsmethode des letzten Kapitels ist also nicht anwendbar. Welcher Systematik folgt also die eben benutzte Reduktion auf die 1 − 2–Ebene? Symplektische Gruppenwirkungen Beginnen wir damit, den Begriff der Symmetrie genauer zu fassen. Zun¨achst nehmen wir an, dass eine Symmetriegruppe G auf dem Phasenraum (P, ω) wirkt, die die Hamilton–Funktion H : P → R invariant l¨asst. Es soll also f¨ ur die glatte Gruppenwirkung einer Lie–Gruppe G mit Lie–Algebra g (siehe Anhang E) (13.4.2) Φ : G × P → P und Φg (p) := Φ(g, p) gelten: H ◦ Φg = H
(g ∈ G).
(13.4.3)
Nur solche Gruppenwirkungen sind n¨ utzlich, die mit der symplektischen Struktur des Phasenraums vertr¨aglich sind. Was Vertr¨aglichkeit aber genau heißt, ist noch nicht klar. Es bieten sich drei Alternativen an: 13.13 Definition • Die Gruppenwirkung (13.4.2) heißt symplektisch, wenn die Diffeomorphismen Φg : P → P Symplektomorphismen sind, d.h. gilt: Φ∗g ω = ω
(g ∈ G) .
• Eine symplektische Gruppenwirkung heißt schwach hamiltonsch, wenn die Vektorfelder Xξ : P → T P (ξ ∈ g) hamiltonsch sind (d.h die Eins– Form iXξ ω ist exakt). • Sie heißt hamiltonsch, wenn eine lineare Abbildung F : g → C ∞ (P )
(13.4.4)
existiert, die ein Homomorphismus der Lie–Algebren g und (C ∞ , {·, ·}) (also des Phasenraums mit Poisson–Klammer (10.2.1)) ist, und f¨ ur die gilt:6 Xξ = XF (ξ) (ξ ∈ g). (13.4.5) Unsere Ziele sind, soweit m¨ oglich 1. ein einfaches Kriterium zu finden, wann eine symplektische Gruppenwirkung hamiltonsch ist, und dann eine (13.4.4) erf¨ ullende Funktion F zu berechnen, 6 Dabei ist das Vektorfeld X der in Definition E.32 eingef¨ uhrte infinitesimale Erzeuger von ξ ξ, w¨ ahrend XF (ξ) das hamiltonsche Vektorfeld der Funktion F (ξ) : P → R ist.
13. Integrable Systeme und Symmetrien
325
2. zu zeigen, dass diese f¨ ur eine Symmetrie (13.4.3) von H Konstante der Bewegung der Hamilton–Funktion H ist (d.h. dF (ξ)(XH ) = 0 (ξ ∈ g)), 3. und mit ihrer Hilfe die Dimension des Phasenraums P zu reduzieren. F¨ ur eine Gruppenwirkung Φ gelten die Implikationen Φ hamiltonsch
=⇒
Φ schwach hamiltonsch
=⇒
Φ symplektisch.
Umkehren k¨onnen wir die Pfeile aber nicht: 7 13.14 Beispiele 1. (symplektisch, aber nicht schwach hamiltonsch) Wir wissen schon aus Beispiel 10.10, dass auf dem Zwei-Torus P := T2 mit der Volumenform ω als symplektischer Form die konstanten Vektorfelder lokal hamiltonsch sind. Hier ist die R–Gruppenwirkung die bedingt-periodische Bewegung in Richtung des Vektorfeldes, und diese ist symplektisch. Unter ihnen ist aber nur das Null-Vektorfeld hamiltonsch, denn nur dann ist die Kohomologieklasse [iv ω] ∈ H 1 (T2 ) ∼ = R2 gleich Null, siehe Beispiel B.54. 2. (schwach hamiltonsch, aber nicht hamiltonsch) Auf dem Phasenraum P := R2x mit kanonischer symplektischer Form ω0 = dx1 ∧ dx2 ist die Gruppenwirkung der Gruppe G := R2 , gegeben durch die Translationen Φg (x) := x + g (x ∈ P, g ∈ G), schwach hamiltonsch, mit Hamilton– Funktion F : g → C ∞ (P )
, F (ξ)(x) := x, Jξ = x2 ξ1 −x1 ξ2 (ξ ∈ g = R2 , x ∈ P ) f¨ ur die Matrix J = 10 −1 0 . Aber die Poisson–Klammer {F (ξ), F (η)} =
∂F (ξ) ∂F (η) ∂F (ξ) ∂F (η) − = η, Jξ ∂x1 ∂x2 ∂x2 ∂x1
ist f¨ ur linear unabh¨angige ξ, η ungleich Null. Die lineare Abbildung F : g → C ∞ (P ) ist wegen der Kommutativit¨at der Lie–Algebra g (also [ξ, η] = 0) kein Homomorphismus von Lie–Algebren. Zwar k¨onnen wir zu den Hamilton–Funktionen F (ξ) noch Konstanten hinzuaddieren ohne die Vektorfelder XF (ξ) zu ¨andern, aber das ¨andert auch nichts an den Poisson–Klammern. 3. (hamiltonsch) Die Rk –Gruppenwirkung, die von k Poisson-kommutierenden Funktionen F1 , . . . , Fk ∈ C ∞ (P, R) auf einer symplektischen Mannigfaltigkeit (P, ω) erzeugt wird, ist hamiltonsch (Voraussetzung ist nat¨ urlich die Existenz
k usse). Man setzt F : Rk → R, F (ξ) := i=1 ξi Fi . der von den Fi erzeugten Fl¨ Insbesondere erzeugt ein integrables System (Definition 13.2) eine hamiltonsche Gruppenwirkung. 3 7 Es gibt daf¨ ur Obstruktionen, die in der Kohomologiegruppe H 1 (P, R) beziehungsweise der sogenannten Lie–Algebren-Kohomologie H 2 (g, R) liegen, siehe McDuff und Salamon [MS].
326
13.4. Die Impulsabbildung
Wir werden im Folgenden nur hamiltonsche Gruppenwirkungen betrachten. Wenn wir annehmen, dass der Phasenraum P zusammenh¨angend ist, dann unterscheiden sich zwei Abbildungen F1 , F2 : g → C ∞ (P ) in (13.4.4), die die gleichen Vektorfelder erzeugen, nur durch eine lineare Abbildung F1 −F2 : g → R, also ein Element der dualen Lie–Algebra g∗ . Impulsabbildungen f¨ ur geliftete Konfigurationsraum–Symmetrien 13.15 Beispiel (Drehgruppe) G := SO(3) wirkt auf dem Phasenraum P := T ∗ R3 ∼ = R3p × R3q durch Φg (p, q) := g(p), g(q)
g ∈ SO(3), (p, q) ∈ P ,
(13.4.6)
und wir werden gleich sehen, dass das eine hamiltonsche Wirkung ist. Zun¨achst berechnen wir eine durch die Lie–Algebra g = so(3) von G parametrisierte Hamilton–Funktion F : g → C ∞ (P ). so(3) ist der dreidimensionale reelle Vektorraum der antisymmetrischen 3 × 3-Matrizen ξ ∈ so(3) und wirkt durch die Vektorfelder Xξ : P → T P
,
Xξ (p, q) = (ξ p, ξ q)
ξ ∈ so(3) .
Diese sind hamiltonsche Vektorfelder f¨ ur die Hamilton–Funktionen F (ξ) : P → R
,
F (ξ)(p, q) = p, ξ q
ξ ∈ so(3) .
(13.4.7)
Der schon im Zusammenhang (6.3.14) der Magnetfelder n¨ utzliche Isomorphismus i : R3 → so(3) , mit der Eigenschaft i(a)b = a × b
a1 a2 a3
→
(13.4.8)
(a, b ∈ R3 ) f¨ uhrt zu
F ◦ i(a) = a, L mit dem Drehimpulsvektor L =
0 −a3 a2 a3 0 −a1 −a2 a1 0
L1 L2 L3
(13.4.9)
: P → R3 aus dem Beispiel auf Seite 322.
Insbesondere ist also f¨ ur a ∈ S 2 die Funktion F ◦ i(a) der Drehimpuls in Richtung a, und diese Hamilton–Funktion erzeugt eine Rechtsdrehung mit der Periode 2π um die in Richtung von a orientierte Achse span(a). 3 Im Beispiel kam die Gruppenwirkung Φ auf dem Phasenraum T ∗ M von einer Gruppenwirkung auf dem Konfigurationsraum M . Φg war dabei der Kotangentiallift Tg∗ : T ∗ M → T ∗ M eines Diffeomorphismus g −1 : M → M (siehe Definition 10.32). Solche F¨alle kommen ¨ ofter vor, f¨ uhren zu hamiltonschen Φ und erlauben eine einfache Berechnung von F (und damit eine Teilantwort auf die erste Frage auf Seite 324):
13. Integrable Systeme und Symmetrien
327
13.16 Satz 1. F¨ ur eine Gruppenwirkung Ψ : G × M → M ist der sogenannte Linkslift ∗ ΨL : G × P → P , ΨL g = T Ψg −1 auf P := T ∗ M auch eine Gruppenwirkung.8 2. Diese ist eine symplektische Gruppenwirkung und l¨asst sogar die tautologische Form θ0 auf P (siehe Definition 10.7) invariant. 3. L¨asst eine symplektische Gruppenwirkung Φ : G × P → P auf P die tautologische Form θ0 auf P = T ∗ M invariant, dann ist sie hamiltonsch, und (13.4.4) besitzt die Form F : g → C ∞ (P )
, F (ξ) := iXξ θ0 .
Beweis: Wir benutzen die Beziehung ω0 = −dθ0 . ∗ ∗ • ΨL g bildet den Kotangentialraum Tq M auf TΨg (q) M ab, und Aussage 1. folgt ∗ aus (10.3.2): ΨL g◦h = T Ψ(g◦h)−1 ist gleich L T ∗ Ψh−1 ◦g−1 = T ∗ (Ψh−1 ◦ Ψg−1 ) = T ∗ (Ψg−1 ) ◦ T ∗ (Ψh−1 ) = ΨL g ◦ Ψh .
• Nach Satz 10.35 ist der Kotangentiallift exakt symplektisch. Also gilt Aussage 2. • F¨ ur alle ξ ∈ g ist F (ξ) Hamilton–Funktion von Xξ , denn die Invarianz impliziert LXξ θ0 = 0, also dF (ξ) = diXξ θ0 = LXξ θ0 − iXξ dθ0 = 0 + iXξ ω. • Um die Poisson–Klammer von F (ξ) und F (η) f¨ ur ξ, η ∈ g zu berechnen, schreiben wir F (ξ), F (η) = LXξ F (η) = LXξ iXη θ0 = (LXξ iXη − iXη LXξ )θ0 = i[Xξ ,Xη ] θ0 = iX[ξ,η] θ0 = F [ξ, η] . Dabei wurde in der vierten Identit¨at Lemma 10.24 benutzt. Also ist ξ → F (ξ) ein Homomorphismus der Lie–Algebren. 2 13.17 Beispiel (Drehgruppe) Die Gruppenwirkungen Φg aus Beispiel 13.15 sind Kotangentiallifte der R¨ uckdrehungen g −1 : R3 → R3 , mit g ∈ SO(3). −1 Denn es gilt g = g. Ebenso ist die durch (13.4.7) definierte Abbildung F : so(3) → C ∞ (P ) so definiert, wie in Satz 13.16 gefordert. 3 8 Genauer gesagt, eine Linkswirkung. Bei Benutzung von Ψ statt Ψ alt man eine g g−1 erh¨ Rechtswirkung.
328
13.4. Die Impulsabbildung
Immer, wenn eine Lie–Gruppe G durch Diffeomorphismen auf einer Mannigfaltigkeit M wirkt, erhalten wir also eine hamiltonsche Gruppenwirkung Φ auf dem Kotangentialb¨ undel T ∗ M . Die u ¨blichere Formulierung der hamiltonschen Symmetrien ist zu der angegebenen dual und benutzt entsprechend das Dual g∗ der Lie–Algebra g: 13.18 Definition • Eine Abbildung J : P → g∗ heißt Impulsabbildung f¨ ur die symplektische Gruppenwirkung Φ, wenn die durch sie induzierte lineare Abbildung ˆ (x) := J(x)(ξ) (ξ ∈ g, x ∈ P ) Jˆ : g → C ∞ (P ) , J(ξ) das Analog von (13.4.5) erf¨ ullt, das heißt Xξ = XJ(ξ) ˆ . • Es seien G eine Gruppe und M , N Mengen mit den Gruppenwirkungen Φ : G × M → M und Ψ : G × N → N . Eine Abbildung f : M → N heißt G–¨ aquivariant, wenn gilt: Ψg ◦ f = f ◦ Φg (g ∈ G), das nebenstehende Diagramm also kommutiert. ¨ Aquivariant bedeutet: in gleicher Weise variierend. Angewandt auf die Impulsabbildung wirkt auf dem Phasenraum P die Gruppenwirkung Φ der Lie–Gruppe G, w¨ahrend G auf der dualen Lie–Algebra g∗ durch die in (E.4.2) definierte koadjungierte Darstellung wirkt. Im Fall einer dann Ad∗ –¨aquivariant genannten Impulsabbildung kommutiert also das rechtsstehende Diagramm.
Φg
M −−−−→ ⏐ ⏐ f
M ⏐ ⏐f
Ψg
N −−−−→ N Φg
P −−−−→ ⏐ ⏐ J
P ⏐ ⏐ J.
Ad∗ g −1
g∗ −−−−→ g∗
13.19 Beispiel (Drehgruppe) Der Drehimpuls L : P → R3 in (13.4.1) ist eine Impulsabbildung und damit eigentlich eine Abbildung mit Werten in so(3)∗ . Entsprechend ist das R3 –Skalarprodukt in (13.4.9) eigentlich die Paarung von so(3) und so(3)∗ . Da f¨ ur alle Drehmatrizen 9 O ∈ SO(3) und a, b ∈ R3 gilt: (O a) × (O b) = ¨ 3 O (a × b), folgt die Ad∗ –Aquivarianz. Von den zwei ¨aquivalenten Bedingungen im folgenden Lemma ist die erste lokaler Natur (denn sie betrifft nur die Lie–Algebra g), die zweite global (denn sie betrifft die Lie–Gruppe G). Um von der lokalen zur globalen Eigenschaft zu kommen, muss die Lie–Gruppe zusammenh¨angend sein. 13.20 Lemma Eine symplektische Gruppenwirkung Φ : G × P → P einer zusammenh¨angenden Lie–Gruppe G ist genau dann hamiltonsch, wenn es eine Ad∗ – ur Φ gibt. ¨aquivariante Impulsabbildung J : P → g∗ f¨ Beweis: • Es sei J : P → g∗ f¨ ur Φ eine Ad∗ –¨aquivariante Impulsabbildung. Zu zeigen ist, dass Jˆ aus Definition 13.18 hamiltonsch ist. 9 Aber
nicht f¨ ur die orthogonalen Matrizen O ∈ O(3) von Spiegelungen!
13. Integrable Systeme und Symmetrien
329
wird nach Definition erf¨ ullt. Zu zeigen ist Die erste Bedingung Xξ = XJ(ξ) ˆ also noch, dass die Poisson–Klammer die Gleichung ˆ ˆ J(ξ), J(η) = Jˆ [ξ, η] (ξ, η ∈ g) erf¨ ullt. Daf¨ ur benutzen wir die Beziehung ˆ ˆ ˆ = −LX J(η) ˆ J(ξ), J(η) = −LXJ(ξ) J(η) ˆ ξ zwischen Poisson–Klammer und Lie–Ableitung (Satz 10.16). Nach Satz B.34 ist f¨ ur alle x ∈ P 5 6 d d ˆ ˆ Φ(exp(tξ), x) J Φ(exp(tξ), x) , η = (x) = J(η) LXξ J(η) dt dt t=0 t=0 6 5 6 5 d d Ad∗ η = J(x), η = J(x), Adexp(−tξ) dt exp(−tξ) t=0 dt t=0 ) * = J(x), [−ξ, η] = −Jˆ [ξ, η] (x), ¨ wobei wir die Ad∗ –Aquivarianz von J und (E.4.3) benutzt haben. • Sei umgekehrt Φ hamiltonsch f¨ ur Φ : g → C ∞ (P ). Wir behaupten, dass ∗ J : P → g , J(x)(ξ) := F (ξ)(x) eine Ad∗ –¨aquivariante Impulsabbildung ist. ¨ Daf¨ ur ist nur noch die Ad∗ –Aquivarianz zu zeigen, das heißt (g ∈ G). (13.4.10) J Φg (x) = Ad∗g−1 J(x) Da dies f¨ ur die Identit¨at g = e erf¨ ullt ist, und G zusammenh¨angend ist, gen¨ ugt es zu zeigen, dass die Ableitungen beider Seiten von (13.4.10) nach g einander gleich sind. Wegen der definierenden Eigenschaft Φg ◦ Φh = Φgh von Gruppenwirkungen gen¨ ugt es, dies bei g = e zu zeigen. Da das Bild exp(g) ⊆ G der Exponentialabbildung (E.2.1) eine Umgebung von e ∈ G ist, ist dies ¨aquivalent damit, f¨ ur alle ξ ∈ g zu zeigen, dass & d % J Φexp(tξ) (x) − Ad∗exp(−tξ) J(x) =0 dt t=0 ist. Das wiederum ist ¨aquivalent zur Behauptung LXξ F (η) = −F [ξ, η] (η ∈ g), die aus LXξ F (η) = −{F (ξ), F (η)} und der Homomorphismus–Eigenschaft von F folgt. 2 Das zweite unserer auf Seite 324 formulierten Ziele ist nun einfach zu erreichen: 13.21 Lemma F¨ ur eine hamiltonsche Gruppenwirkung Φ und F aus (13.4.4) folgt aus der Φ–Invarianz (13.4.3) einer Hamilton–Funktion H : P → R, dass F Konstante der Bewegung von H ist.
330
13.5. * Reduktion des Phasenraums
Beweis: Zu zeigen ist f¨ ur alle ξ ∈ g, dass {H, F (ξ)} = 0 ist. Dies folgt aber, d H ◦ Φexp(tξ) |t=0 = 0. 2 mit (13.4.3), aus {H, F (ξ)} = LXF (ξ) H = dt Damit haben wir den Satz von Emmy Noether [No] bewiesen, dem zufolge kontinuierliche Symmetrien Konstanten der Bewegung erzeugen: 13.22 Satz (Noether) Falls die Hamilton–Funktion H : P → R auf dem symplektischen Phasenraum (P, ω) den Fluss Ψ erzeugt und invariant unter einer hamiltonschen Gruppenwirkung Φ : G × P → P ist, dann existiert eine Impulsabbildung J : P → g∗ von Φ mit J ◦ Ψt = J
13.5
(t ∈ R).
* Reduktion des Phasenraums
The more I have learned about physics, the more convinced I am that ” physics provides, in a sense, the deepest applications of mathematics. The mathematical problems that have been solved, or techniques that have arisen out of physics in the past, have been the lifeblood of mathematics... The really deep questions are still in the physical sciences. For the health of mathematics at its research level, I think it is very important to maintain that link as much as possible.” (Michael Atiyah, in: Mathematical Intelligencer, 6, 9–19 (1984)
Symplektische Reduktion Zwar besagt der Satz von Noether, dass bei Vorhandensein kontinuierlicher Symmetrien Konstanten der Bewegung existieren, die (f¨ ur einen regul¨aren Wert j ∈ g∗ der Impulsabbildung) erlauben, die Bewegung auf der Untermannigfaltigkeit Mj := J −1 (j) von P zu betrachten. Aber diese wird im Allgemeinen keine symplektische Mannigfaltigkeit mehr sein (etwa in Beispiel 13.15 ist der Drehimpuls die Impulsabbildung, und Mj ist dreidimensional, kann also gar keine symplektische Form besitzen). Tats¨achlich kann man aber oft durch eine weitere Reduktion der Phasenraumdimension, die sogenannte symplektische oder Marsden–Weinstein–Reduktion [MW], wieder zu einem hamiltonschen System kommen. Auch dies haben wir f¨ ur den Fall des zentralsymmetrischen Potentials schon gesehen (Beispiel 13.1). Zwar geht dieser neue Phasenraum Pj aus Mj durch Quotientenbildung hervor, statt wieder eine Untermannigfaltigkeit zu sein; die Punkte in Pj sind die Orbits der Wirkung einer Untergruppe Gj von G. Trotzdem besitzt Pj die Struktur einer Mannigfaltigkeit, und die Quotientenabbildung Mj → Pj ist ein Hauptfaserb¨ undel (siehe Definition F.4). Wir untersuchen jetzt diese Reduktionstechnik. Alle in diesem Kapitel vorkommenden Abbildungen sind glatt.
13. Integrable Systeme und Symmetrien
331
13.23 Satz (Marsden und Weinstein) Es sei f¨ ur die Ad∗ –¨aquivariante Im∗ pulsabbildung J : P → g der symplektischen Gruppenwirkung Φ : G × P → P der Bildpunkt j regul¨arer Wert von J (also Mj := J −1 (j) eine Untermannigfaltigkeit, mit Inklusion ij : Mj → P ). Die Isotropiegruppe Gj := {g ∈ G | Ad∗g (j) = j} wirke frei und eigentlich auf Mj . Dann ist (13.5.1) πj : Mj → Pj := Mj /Gj eine Submersion auf eine Mannigfaltigkeit Pj , und Pj besitzt eine eindeutige symplektische Struktur ωj mit der Eigenschaft i∗j ω = πj∗ ωj .
(13.5.2)
13.24 Bemerkungen 1. Dass die Isotropiegruppe Gj frei und eigentlich auf Mj wirkt, wird nur benutzt, um die Regularit¨at von (13.5.1) sicherzustellen. 2. Interessant kann auch der Fall sein, dass Gj lokal frei wirkt 10 . Dann ist Pj zwar eventuell keine Mannigfaltigkeit, aber ein sogenanntes Orbifold (siehe Audin, Cannas da Silva und Lerman [ACL]). Gj wirkt aber immer dann lokal frei, wenn j regul¨arer Wert von J ist. 3 Beweis: Mj ist nach dem Satz vom regul¨aren Wert (Satz A.46) eine Untermannigfaltigkeit von P . ¨ von J die Isotropiegruppe Gj . • Auf dieser wirkt wegen der Ad∗ –Aquivarianz • Nach Satz E.36 ist Pj eine Mannigfaltigkeit, und πj : Mj → Pj ist eine surjektive Submersion. • Daher unterscheiden sich die pull-backs voneinander verschiedener Differentialformen mittels πj∗ ebenfalls voneinander. Es kann also h¨ochstens eine symplektische Form ωj auf Pj geben, die (13.5.1) erf¨ ullt. • Da πj eine surjektive Submersion ist, k¨ onnen wir die Zwei–Form ωj auf Pj repr¨asentantenunabh¨angig durch (v, w ∈ Tm Mj ) ωj Tm πj (v) , Tm πj (w) := ω(v, w) definieren, wenn f¨ ur alle Punkte m := Φg (m) ∈ Mj des Gj –Orbits und alle Tangentialvektoren v , w ∈ Tm Mj gilt: ω(v , w ) = ω(v, w), falls Tm πj (v ) = Tm πj (v) und Tm πj (w ) = Tm πj (w). • Ist m = Φg (m), dann ist Φ∗g ω = ω, wir k¨ onnen also ohne Beschr¨ankung der Allgemeinheit m = m annehmen. 10 Definition: Eine topologische Gruppenwirkung Φ : G × M → M ist lokal frei, wenn es eine Umgebung U ⊆ G von e gibt, f¨ ur die aus Φg (x) = x f¨ ur ein x ∈ M und ein g ∈ U schon folgt: g = e.
332
13.5. * Reduktion des Phasenraums
• Daf¨ ur gen¨ ugt es zu zeigen, dass f¨ ur alle Tangentialvektoren h ∈ ker(Tm πj ) gilt: ω(h, k) = 0 (k ∈ Tm Mj ). (13.5.3) Es gibt aber einen Vektor ξ ∈ g, f¨ ur den der infinitesimale Erzeuger Xξ = d Φ | an der Stelle m gleich h ist (Xξ (m) = h). t=0 exp(tξ) dt Nun ist iXξ ω = dJ(ξ) eine auf Mj verschwindende Eins–Form, denn J(ξ) : P → R ist auf Mj = J −1 (j) konstant. Gleichung (13.5.3) ist damit bewiesen. • Die eben definierte Zwei–Form ωj auf Pj ist geschlossen. Denn einerseits ist wegen (B.25) und (13.5.2) πj∗ dωj = dπj∗ ωj = di∗j ω = i∗j dω = 0. Andererseits folgt f¨ ur jede Differentialform ϕ auf Pj aus πj∗ ϕ = 0 schon ϕ = 0, denn πj ist eine surjektive Submersion. • ωj ist auch nicht degeneriert, und damit eine symplektische Form auf Pj . Denn f¨ ur m ∈ Mj , v ∈ Tm P und ξ ∈ g ist ˆ ω Xξ (m), v = dJ(ξ)(v) = Tm J(v), ξ . Dieser Ausdruck verschwindet genau dann f¨ ur alle ξ ∈ g, wenn Tm J(v) = 0 ist, also v im Unterraum Tm Mj von Tm P liegt. Anders gesagt ist das ω–orthogonale Komplement von Tm Mj gleich dem Unterraum U := {Xξ (m) | ξ ∈ g} von Tm P . • Es gen¨ ugt zu zeigen, dass f¨ ur die Lie–Algebra Lie(Gj ) der Isotropiegruppe Gj U ∩ Tm Mj = {Xξ (m) | ξ ∈ Lie(Gj )} ist. Denn dies ist der Kern von Tm πj : Tm Mj → Tπj (m) Pj . Xξ (m) liegt aber genau dann in Tm Mj , wenn dJ(Xξ )(m) = 0 ist, also wegen der Ad∗ – ¨ Aquivarianz von J, wenn j ∈ g∗ Fixpunkt des ad–Operators ad∗ξ (siehe (E.4.4)) ist. Dies ist genau dann der Fall, wenn ξ ∈ Lie(Gj ). 2 Wie sich bald in Beispielen zeigen wird, besitzt diese symplektische oder Marsden– Weinstein–Reduktion Anwendungen außerhalb des Gebietes der dynamischen Systeme. Insbesondere ist sie eine Methode, neue symplektische Mannigfaltigkeiten zu finden. Wir schauen uns dennoch vorher den Fall an, bei dem die Wirkung Φ benutzt wird, um hamiltonsche Differentialgleichungen zu vereinfachen. 13.25 Satz Unter den Voraussetzungen des Satzes 13.23 sei die Hamilton– Funktion H : P → R invariant unter der Gruppenwirkung Φ und erzeuge einen Fluss Ψ : R × P → P .
13. Integrable Systeme und Symmetrien
333
1. Die durch die Relation i∗j H = πj∗ Hj
(13.5.4)
definierte Funktion Hj : Pj → R erzeugt einen hamiltonschen Fluss Ψj auf der symplektischen Mannigfaltigkeit (Pj , ωj ), der ein Faktor des auf Mj restringierten Flusses Ψ ist. 2. Ist f¨ ur den Anfangswert x ∈ Mj und xj := πj (x) ∈ Pj die Kurve t → ρ(t) ∈ Mj ein Lift der L¨osung t → Ψj,t (xj ) ∈ Pj mit ρ(0) = x, dann kann die L¨osung t → Ψt (x) ∈ Mj in der Form Ψt (x) = Φg(t) ρ(t) dargestellt werden (siehe Abbildung).
F(G j,x) Yt (x)
x
Mj
r(t)
pj xj
Y j,t (x)
Pj
Dabei erf¨ ullt die Kurve t → g(t) ∈ Gj in der Isotropiegruppe (unter Verwendung der Linkswirkung Lg aus (E.1.3)) das Anfangswertproblem g(0) = e , g (t) = Te Lg(t) ξ(t) mit Xξ(t) ρ(t) := XH ρ(t) − ρ (t). (13.5.5) Beweis: 1. • Zun¨achst ist die Hamilton–Funktion H invariant unter der Symmetrie Φ, die Gleichung (13.5.4) besitzt also u ¨berhaupt eine L¨osung Hj : Pj → R. Diese ist auch eindeutig, da πj eine surjektive Submersion ist. • Der Fluss Ψ l¨asst wegen des Satzes von Noether (Satz 13.22) auf die Untermannigfaltigkeit Mj = J −1 (j) restringieren. Aus (13.5.2) und (13.5.4) folgt, undeldass das hamiltonsche Vektorfeld XH auf Mj unter der linearisierten B¨ projektion T πj auf das hamiltonsche Vektorfeld XHj auf Pj projiziert. Also gilt f¨ ur die Fl¨ usse die Faktoreigenschaft πj ◦ Ψt (x) = Ψj,t ◦ πj (x)
(x ∈ Mj , t ∈ R).
2. • Zun¨achst einmal ist wieder die L¨ osbarkeit einer Gleichung zu u ufen, ¨berpr¨ diesmal ξ(t) ∈ Lie(Gj ) mit Xξ(t) ρ(t) = XH ρ(t) − ρ (t) ∈ Tρ(t) Mj . Dass so ein ξ(t) ∈ Lie(Gj ) existiert, daran, dass (wegen der Lift– liegt Eigenschaft von ρ) der Vektor XH ρ(t) − ρ (t) ∈ Tρ(t) Mj im Kern der linearisierten Projektion Tρ(t) πj : Tρ(t) Mj → Tψj,t (x) Pj liegt. Damit ist ξ(t) ∈ Lie(Gj ) auch eindeutig bestimmt, denn die Isotropiegruppe Gj wirkt nach Annahme frei auf Mj .
334
13.5. * Reduktion des Phasenraums
• Um (13.5.5) zu verifizieren, leiten wir als N¨achstes ddie Gleichung Ψt (x) = Ψt (x) = XH Ψt (x) , Φ g(t), ρ(t) nach der Zeit ab. Ihre linke Seite ergibt dt also −1 Tρ(t) Φg(t) (13.5.6) XH Ψt (x) = XH ρ(t) . • Die Zeitableitung ihrer rechte Seite ist d ˜ ρ(t) g (t), Φ g(t), ρ(t) = Tρ(t) Φg(t) ρ (t) + Tg(t) Φ (13.5.7) dt ˜ x (g) := Φ(g, x). Wir formen den zweiten Term in (13.5.7) ˜ x : G → P, Φ mit Φ wie folgt um. Aus der Definition von Gruppenwirkungen schließen wir die Beziehung ˜ x = Φg ◦ Φ ˜ x ◦ Lg −1 Φ (g ∈ G, x ∈ P ). Also ist
˜ ρ(t) = Tρ(t) Φg(t) ◦ Te Φ ˜ ρ(t) ◦ Tg(t) Lg−1 (t) . Tg(t) Φ
(13.5.8)
˜ Eingesetzt in (13.5.8) erh¨alt (13.5.7) mit g (t) = Te Lg(t) ξ(t) und Te Φρ(t) ξ = Xξ ρ(t) (ξ ∈ g) die Form −1 d Tρ(t) Φg(t) Φ g(t), ρ(t) = ρ (t) + Xξ(t) ρ(t) . (13.5.9) dt
(13.5.6) und (13.5.9) zeigen die ξ(t) definierende Relation in (13.5.5).
2
Anwendungen der symplektischen Reduktion manche meinen lechts und rinks kann man nicht velwechsern ” werch ein illtum!” lichtung, von Ernst Jandl Die Integration der Differentialgleichung auf P ist mit Satz 13.25 zur¨ uckgef¨ uhrt auf die Integration einer Differentialgleichung auf dem reduzierten Phasenraum Pj und – nachfolgend – einer Differentialgleichung auf der Isotropiegruppe Gj . 13.26 Beispiele (Reduktion) 1. Als kompakte Lie–Gruppe wirkt der k–dimensionale Torus G = Tk immer eigentlich, und die Isotropiegruppe Gj stimmt mit G u ur regul¨are Werte j ∈ g ∼ ¨berein. Daher ist f¨ = Rk der Impulsabbildung dim(Pj ) = dim(P ) − 2k. Im Extremfall eines integrablen Systems mit k = n := 12 dim(P ) ist die Dimension des reduzierten Phasenraums Pj gleich Null. Dabei sind die kompak˜ j von Mj selbst diffeomorph zum Torus ten Zusammenhangskomponenten M n ˜ j des T . Die Aufgabe, das Φ–invariante Vektorfeld XH M˜ j auf den Fasern M B¨ undels Mj → Pj zu integrieren, wurde in Kapitel 13.2 gel¨ost. Allerdings muß festgestellt werden, dass zun¨achst einmal die Gruppe Rn auf P wirkt. Die Identifizierung von deren Perioden (und damit der Toruswirkung) ist hier ein der Marsden-Weinstein-Reduktion vorgeschalteter Schritt.
13. Integrable Systeme und Symmetrien
335
2. Wir schauen uns zum letzten Mal das schon etwas strapazierte Beispiel der Wirkung (13.4.6) der Drehgruppe SO(3) auf dem Phasenraum P := T ∗ R3 an. Die Impulsabbildung (13.4.1) des Drehimpulses L : P → so(3) hat den einzigen singul¨aren Wert 0 ∈ so(3). F¨ ur Werte = 0 des Drehimpulses sind die Urbildmengen M := L−1 () also Mannigfaltigkeiten. Diese sind dann mit dem zweidimensionalen Unterraum ⊥ := {q ∈ R3 | q, = 0} von der Form M =
×q q2
+ cq , q c ∈ R, q ∈ ⊥ \{0} ⊂ P
(13.5.10)
Dies u uft man durch Einsetzen in die Definition L(p, q) = q × p des ¨berpr¨ Drehimpulses. Durch die Parametrisierung mit (c, q) ergibt sich der Diffeomorphismus M ∼ = R × R2 \{0} .
(13.5.11)
Die Isotropiegruppe SO(3) besteht aus den gelifteten Drehungen (13.4.6) um die Achse span(). Da diese zu SO(2) isomorphe Drehgruppe kompakt ist, wirkt sie immer eigentlich. Sie wirkt auch frei, und zwar nur auf den zweiten Faktor in (13.5.11), in der Form (R2 \{0})/SO(2) ∼ = R+ . Letzteres sieht man bei Verwendung von Polarkoordinaten in R2 \{0}. Die Voraussetzungen von Satz 13.23 sind also erf¨ ullt. Es ergibt sich der reduzierte Phasenraum P = M /SO(3) ∼ = R × R+ , der schon in Beispiel 13.1 zur Analyse der radialen Bewegung benutzt wurde. 3. Die Hamilton–Funktion H : P → R, H(p, q) = 12 p 2 erzeugt die freie Bewegung Φt (p, q) = (p, q + tp) auf P := T ∗ Rd . Diese hamiltonsche Gruppenwirkung von R ist bei Restriktion auf eine Energiefl¨ache ΣE = H −1 (E) f¨ ur Energie E > 0 frei und eigentlich. Etwa f¨ ur E := diffeomorph zu
1 2
ist ΣE ∼ = Spd−1 × Rdq , und der reduzierte Phasenraum ist PE := ΣE /R ∼ = T ∗ S d−1 ,
(13.5.12)
denn f¨ ur jeden Punkt (p, q) ∈ ΣE gibt es genau eine Zeit t ∈ R mit p, q + tp = 0. Dieses Kotangentialb¨ undel PE (beziehungsweise das Tangentialb¨ undel T S d−1) haben wir schon im Kontext der Potentialstreuung benutzt, siehe (12.1.16). Nach Korollar 12.8 ist f¨ ur hohe Energien E die Wirkung des hamiltonschen Flusses mit Potential ebenfalls eigentlich und frei. Wir k¨onnen zwar den reduzierten Phasenraum (13.5.12) nicht unbedingt wie im potentialfreien Fall parametrisieren, wohl aber durch die asymptotischen Streudaten. 3 Eine mathematisch wichtige Beispielklasse wird durch die koadjungierte Wirkung einer Lie–Gruppe G auf ihrer dualen Lie–Algebra g∗ gebildet, siehe (E.4.2).
336
13.5. * Reduktion des Phasenraums
13.27 Beispiel (koadjungierte Wirkung) F¨ ur die Lie–Gruppe SO(3) ist g = Alt(3, R). Wir identifizieren g∗ ebenfalls mit Alt(3, R), indem wir die Paarung von Lie–Algebra und dualer Lie–Algebra in der Form einer Spur schreiben: ∗ ξ ∗ , η = tr(ξ ∗ η) ξ , η ∈ Alt(3, R) . Damit folgt aus Adg (η) = gηg−1 die Form Ad∗g−1 (ξ ∗ ) = gξ ∗ g −1 der koadjungierten Darstellung. Nach Aufgabe E.31 besitzt bei der Identifikation i : R3 → so(3) aus (13.4.8) die adjungierte Darstellung die Form Adg (η) = g η, also dual Ad∗g −1 (ξ ∗ ) = g ξ ∗ g ∈ SO(3), ξ ∗ ∈ R3 . In diesem Sinn ist der SO(3)–Orbit von ξ ∗ ∈ R3 \ {0} gleich der Zwei-Sph¨are {g ξ ∗ | g ∈ SO(3)} = {x ∈ R3 | x = ξ ∗ } vom Radius ξ ∗ , und der Nullpunkt ist ebenfalls ein Orbit.
3
In diesem Beispiel besitzen damit die Orbits mit den Fl¨achenformen unter der koadjungierten Wirkung invariante symplektische Formen. Es ist aber noch nicht sichtbar, wie diese durch symplektische Reduktion zustandegekommen sein k¨onnte. Es ist das Verdienst von Kirillov, Kostant und Souriau, diesen Zusammenhang ganz allgemein hergestellt zu haben. 13.28 Satz Die Orbits der koadjungierten Wirkung einer Lie–Gruppe besitzen eine nat¨ urliche, unter dieser Wirkung invariante symplektische Form. Beweis: Die Beweisidee besteht darin, diese Orbits durch Marsden–WeinsteinReduktion zu gewinnen. • Wir beginnen mit der Feststellung, dass das Kotangentialb¨ undel P := T ∗ G der Lie–Gruppe G wie jedes Kotangentialb¨ undel eine symplektische Mannigfaltigkeit (P, ω0 ) mit ω0 = −dθ0 und der tautologischen Form θ0 aus Definition 10.7 ist. • Nach Satz 10.35 l¨asst sich also die Linkswirkung Lg : G → G
,
h → g ◦ h
(g ∈ G)
von G liften zu einer symplektischen Wirkung Φg := T ∗ Lg : P → P
(g ∈ G).
Nach Satz 13.16 besitzt diese die Impulsabbildung ξ ∈ g, g ∈ G , J : P → g∗ , J(αg )(ξ) = αg Xξ (g)
(13.5.13)
wobei Xξ : G → T G der infinitesimale Erzeuger zu ξ, also das rechtsinvariante Vektorfeld mit Xξ (e) = ξ ist. Wir k¨ onnen damit Xξ (g) ∈ Tg G in der Form Xξ (g) = Te Rg (ξ) schreiben, oder dual J(αg )(ξ) = (Te Rg )∗ αg (ξ). • Daher ist f¨ ur j ∈ g∗ die Niveaumenge der (Ad∗ –¨aquivarianten) Impulsabbildung Mj = J −1 (j) = graph(αj ) ⊂ T ∗ G
13. Integrable Systeme und Symmetrien
337
mit der rechtsinvarianten Eins–Form αj ∈ Ω1 (G), die an der Identit¨at e ∈ G den Wert αj (e) = j besitzt. Damit ist Mj zu G diffeomorph. Da die Gruppenwirkung Φ : G × P → P eine Linkswirkung ist, ist die Isotropiegruppe Gj = {g ∈ G | Ad∗g (j) = j} der Ad∗ –Wirkung von G gleich der Untergruppe {g ∈ G | L∗g (αj ) = αj } der die rechtsinvariante Eins–Form nicht ver¨andernden Linkstranslationen. Der Orbit {Ad∗g (j) | g ∈ G} ⊆ g∗ von j besitzt damit die Form G/Gj ∼ = Pj mit dem reduzierten symplektischen Phasenraum (Pj , ωj ) aus Satz 13.23. 2 Im Allgemeinen sind die koadjungierten Orbits nur immersierte, nicht eingebettete Untermannigfaltigkeiten von g∗ , siehe Beispiel 14.1.6 von Marsden und Ratiu [MR]. Jedenfalls sind sie als symplektische Mannigfaltigkeiten von gerader Dimension.
13.29 Aufgabe (koadjungierte Orbits) Zeigen Sie f¨ ur den Fall einer Untergruppe G ≤ GL(n, R), dass f¨ ur den Orbit O(ξ) ⊂ g∗ der koadjungierten Wirkung einer Lie–Gruppe G auf ihrer dualen Lie–Algebra g∗ (a) der Tangentialraum Tξ O(ξ) aus den Vektoren der Form ad∗u ξ (u ∈ g) besteht (mit dem zu adu in (E.4.4) adjungierten Operator ad∗u auf g∗ ), (b) die symplektische Struktur auf O(ξ) die folgende Form besitzt: ωξ ad∗u ξ, ad∗u ξ = − ξ, [u, v]
(u, v ∈ g),
(13.5.14)
(c) die Impulsabbildung J : O(ξ) → g∗ die Inklusion des Orbits ist.
3
13.30 Beispiel (spezielle lineare Gruppe) Die f¨ ur die Klassische Mechanik besonders wichtige Lie–Gruppe Sp(2n, R) stimmt f¨ ur n = 1 mit der speziell–linearen Gruppe SL(2, R) = {M ∈ Mat(2, R) | det(M ) = 1} u ¨berein (Aufgabe 13.30). Als Matrixgruppe ist ihre Lie–Algebra gleich sl(2, R) = {ξ ∈ Mat(2, R) | tr(ξ) = 0}. Wir identifizieren wieder u ¨ber die Spur die duale Lie–Algebra sl(2, R)∗ mit sl(2, R), und parametrisieren durch i : R3 → sl(2, R)∗
,
x →
x1 x2 +x3 x2 −x3 −x1
.
338 Damit ist det i(x) = x23 − x21 − x22 ,
13.5. * Reduktion des Phasenraums ]
und diese Gr¨oße bleibt unter der koadjungierten Wirkung invariant. Die Niveaufl¨achen sind daher Quadriken im R3 , und zwar je nach Vorzeichen der Determinante einschalige oder zweischalige Rotationshyperboloide beziehungsweise f¨ ur verschwindende Determinante ein Doppelkegel (siehe Abbildung). Jede Zusammenhangskomponente einer Quadrik bildet einen Orbit, bis auf den DopOrbits in sl(2, R)∗ pelkegel. Dieser setzt sich aus dem Nullpunkt und den beiden einfachen Kegeln ohne Spitzen (entsprechend den Orbits der infinitesimal symplektischen Matrizen ( 00 10 ) und 00 −1 0 ) als Orbits zusammen. Die Exponentialabbildung ordnet diesen Orbits Bahnen symplektischer Matrizen mit gleichen Eigenwerten zu. Man vergleiche also die Familie von Quadriken mit einer Umgebung der Identit¨at in der Darstellung der symplektischen Gruppe Sp(2, R) auf Seite 89. 3 13.31 Bemerkungen 1. Der Satz 13.28 ist kein isoliertes Resultat, sondern Ausgangspunkt der sogenannten Orbit–Methode von Kirillov (die dieser ¨ im Uberblicksartikel [Ki] darstellt). Dabei wird die symplektische Geometrie als Zugang zur Darstellungstheorie von Lie–Gruppen gew¨ahlt. Die entsprechende physikalische Theorie ist die sogenannte geometrische Quantisierung. 2. Zwar kann man die in Satz 13.28 untersuchten dualen Lie–Algebren nicht in nat¨ urlicher Weise als symplektische Vektorr¨aume auffassen (oft sind sie, wie zum Beispiel so(3), sogar von ungerader Dimension). Aber sie besitzen eine Poisson–Struktur. Eine Poisson–Struktur auf einer Mannigfaltigkeit P ist dabei eine bilineare Abbildung {·, ·} : C ∞ (P ) × C ∞ (P ) → C ∞ (P ), die C ∞ (P ) zu einer Lie– Algebra macht und f¨ ur die die Derivationseigenschaft gilt: {f g, h} = f {g, h} + {f, g}h f, g, h ∈ C ∞ (P ) . Das verallgemeinert den Begriff der Poisson–Klammer einer symplektischen Mannigfaltigkeit aus Definition 10.15. Im Fall der dualen Lie–Algebren treten die Orbits als sogenannte symplektische Bl¨atter einer Poisson–Struktur auf (siehe Marsden und Ratiu [MR]). 3
13. Integrable Systeme und Symmetrien
339
Reduktion symplektischer Toruswirkungen Wir betrachten jetzt speziell Toruswirkungen.
x2
13.32 Aufgabe (Hamiltonsche S 1 -Wirkung) Zeigen Sie, dass die H¨ ohenfunktion H : S2 → R
,
H(x) = x3
x3
auf der Zwei-Sph¨are S = {x ∈ R | x = 1} (mit der Fl¨achenform als symplektischer Form) eine S 1 –Wirkung erzeugt, n¨amlich die Drehung um die 3–Achse, siehe Abbildung. x1 Vergleichen Sie auch mit Aufgabe 10.30. 3 In diesem Fall ist das Bild der symplektischen Mannigfaltigkeit unter der Impulsabbildung gleich H(S 2 ), also ein Intervall. Wir verallgemeinern dieses Beispiel einer Toruswirkung, indem wir S 2 als CP(1) auffassen und analoge Wirkungen auf dem projektiven Raum CP(d) suchen. 2
3
13.33 Beispiel (hamiltonsche Td -Wirkung auf CP(d)) In Dimension n ∈ N wirkt die abelsche Gruppe Tn := {t = (t1 , . . . , tn ) ∈ Cn | |tk | = 1} durch punktweise Multiplikation ˜ : Tn × Cn → C , Φ(t, x) = t1 x1 , . . . , tn xn Φ auf dem symplektischen Vektorraum (Cn , ω) mit ω(u, v) = Im(u, v) (siehe Bemerkung 6.15.1). Diese Wirkung ist hamiltonsch, mit Ad∗ –¨aquivarianter (also invarianter) Impulsabbildung J˜ : Cn → Rn ∼ = Lie(Tn )∗ , x → − 12 |x1 |2 , . . . , |xn |2 . Andererseits wirkt auch S 1 ⊂ C in der Form Ψ : S 1 × Cn → Cn
, Ψ(s, x) = sx
hamiltonsch auf Cn , mit Hamilton–Funktion H(x) = − 12 x 2 . Diese ist von der Form der im Satz 6.35 behandelten harmonischen Oszillatoren mit gleichen Frequenzen. Also ist der reduzierte Phasenraum Mh /S 1 (f¨ ur h = − 12 , mithin Mh = H −1 (h) ∼ = S 2n−1 ) der komplexe projektive Raum CP(n − 1). Die Gruppenwirkungen Ψ und Φ vertauschen miteinander, sodass f¨ ur alle t ∈ ˜ t (x) . ˜ t OΨ (x) = OΨ Φ Tn und x ∈ Cn Orbits auf Orbits abgebildet werden: Φ Wir erhalten damit eine Wirkung von Tn auf dem symplektischen Phasenraum (P, ω), mit dem projektiven Raum P := CP(d) der reellen Dimension 2d (f¨ ur d := n − 1). Allerdings ist diese Wirkung nicht mehr frei, denn f¨ ur s ∈ S 1 und s˜ := n ˜ s˜ = Ψs . Betrachten wir aber die Untergruppe (s, . . . , s) ∈ T ist Φ G := (t1 , . . . , tn ) ∈ Tn | tn = 1 ∼ = Td
340
13.5. * Reduktion des Phasenraums
von Tn , dann ist Tn ∼ = G ⊕ S 1 , und wir erhalten eine freie hamiltonsche Wirkung Φ : G × P → P . Ihre Impulsabbildung ist von der Form J : P → Rd ∼ = Lie(G)
,
J([x]) = − 12
Die Notation ist hier so zu verstehen, dass wir die Punkte [x] ∈ CP (d) durch ihre Repr¨asentanten, also x ∈ Cd+1 \{0} darstellen, mit [x] = [y], falls ein λ ∈ C\{0} existiert mit x = λy. Damit ist das Bild der Impulsabbildung der Simplex Δd := J(P ) ⊂ Rd mit den Ecken 0 und − 21 ek , k = 1, . . . , d. 3 Wie auch in Beispiel 13.1 (siehe Abbildung 13.1.1 links) erhalten wir als Bild einer Impulsabbildung einer Toruswirkung ein Polyeder (also die Schnittmenge endlich vieler Halbr¨aume).
|x1 |2 |xd |2 ,..., 2
x
x 2
.
0
0
12
12
0
12
Simplex Δ3
Dies ist kein Zufall. Unabh¨angig voneinander haben M. Atiyah in [At] und V. Guillemin und S. Sternberg in [GS2] folgenden Satz bewiesen: 13.34 Satz Ist Φ : Tm × P → P eine hamiltonsche Toruswirkung auf der kompakten zusammenh¨angenden symplektischen Mannigfaltigkeit (P, ω) mit Impulsabbildung J : P → Rm , dann gilt: 1. Die Niveaumengen Mj = J −1 (j) ⊂ P sind zusammenh¨angend. 2. Das Bild J(P ) ⊂ Rm ist ein Polytop, und zwar die konvexe H¨ ulle der Bilder J(p) ∈ Rm der Fixpunkte p ∈ P der Φ–Wirkung. 13.35 Weiterf¨ uhrende Literatur Einen Beweis dieses Satzes findet man auch in Kapitel 5.4 von McDuff und Salamon [MS]. Es ist genau bekannt, welche Polytope als Bilder der Impulsabbildung auftreten k¨onnen. Diese sogenannten Delzant–Polytope werden zum Beispiel im Artikel von Ana Cannas da Silva in [ACL] beschrieben, und sie sind wichtig in der algebraischen Topologie und der String–Theorie. 3 Der Satz von Schur und Horn Kennen wir die Eigenwerte λk einer hermiteschen Matrix A = A∗ ∈ Herm(d, C), dann wissen wir, dass die Spur der Matrix A gleich der Summe dieser Eigenwerte ist. Um einer solchen Matrix A einen eindeutigen Vektor λ = (λ1 , . . . , λd ) ∈ Rd zuzuordnen, nehmen wir λ1 ≥ λ2 ≥ . . . ≥ λd an, erhalten damit also eine
13. Integrable Systeme und Symmetrien
341
Abbildung Λ : Herm(d, C) → Rd .
(13.5.15)
Wir interessieren uns nun f¨ ur die Diagonalen der isospektralen Matrizen aus Λ−1 (λ), betrachten also die Projektion
3
1 2
2 1
3
Π : Herm(d, C) → Rd , (ai,k )di,k=1 → (ak,k )dk=1 . Da Diagonalmatrizen die Diagonalelemente als Eigenwerte besitzen, ist klar, dass f¨ ur jede Per1 mutation σ ∈ Sd die Menge 2 Das Polytop Π Λ−1 (λ) f¨ ur −1 d (13.5.16) Π Λ (λ) ⊂ R die Eigenwerte 3, −1, −2 den Punkt λσ := (λσ(1) , . . . , λσ(d) ) enth¨alt. Der Satz von Schur und Horn besagt, dass diese Menge durch Konvexkombination aus diesen Diagonalmatrizen entsteht: 13.36 Satz (Schur und Horn) F¨ ur die hermiteschen Matrizen mit Eigenwerten λ gilt Π Λ−1 (λ) = conv {λσ | σ ∈ Sd } (13.5.17) uhrt Beweis: Der Beweis kann heute 11 durch Anwendung von Satz 13.34 gef¨ werden (siehe Atiyah [At]). Man kann ihn selbst finden, wenn man sich fragt, welche Toruswirkung benutzt werden kann: • Zun¨achst ist Herm(d, C) eine Lie–Algebra, mit Lie–Klammer [A, B] := i(AB− BA). Da wir aber zu der Lie–Algebra eine kompakte Lie–Gruppe suchen, ist es besser, zu den antisymmetrischen Matrizen u ¨berzugehen. Diese bilden die zu Herm(d, C) (unter Multiplikation mit i) isomorphe Lie–Algebra u(d) der unit¨aren Gruppe U(d). • Identifizieren wir wieder die Lie–Algebra mit ihrem Dual (durch A → tr(A ·)), dann wirkt U(d) mit der koadjungierten Abbildung auf u(d)∗ , und damit auch auf Herm(d, C). • Da die Multiplikation mit unit¨aren Matrizen gerade den das Skalarprodukt erhaltenden Basiswechseln entspricht, besteht der U(d)–Orbit A ∈ Herm(d, C) OU(d) (A) = U AU −1 | U ∈ U(d) gerade aus allen hermiteschen Matrizen, die die gleichen Eigenwerte λ ∈ Rd wie A besitzen. Es ist also OU(d) (A) = Λ−1 (λ), und diese Mannigfaltigkeit besitzt nach Satz 13.28 eine unter der U(d)–Wirkung invariante symplektische Struktur. 11 Die Inklusion ,⊆’ der Identit¨ at (13.5.17) wurde 1924 von I. Schur bewiesen, die umgekehrte Inklusion 1954 von A. Horn, also lange bevor die symplektische Reduktion in Form von Satz 13.23 bekannt war.
342
13.5. * Reduktion des Phasenraums
• Wir betrachten zun¨achst den generischen (das heißt typischen) Fall, dass die Eigenwerte voneinander verschieden sind (λk+1 < λk , k = 1, . . . , d − 1). Dann ist die Isotropie–Untergruppe der Diagonalmatrizen A aus Λ−1 (λ) von der Form Td ⊂ U(d), besteht also aus allen Diagonalmatrizen, auf deren Diagonale komplexe Zahlen vom Betrag 1 stehen. Einerseits gilt damit 12 Λ−1 (λ) ∼ = U(d)/Td Andererseits wirkt die Untergruppe Td auf Λ−1 (λ) (f¨ ur d ≥ 2 nicht trivial) durch Φ : Td × Λ−1 (λ) → Λ−1 (λ) , ΦU (A) = U AU −1 , und die einzigen Fixpunkte dieser Wirkung sind die den Permutationen λσ entsprechenden Diagonalmatrizen diag(λσ ) ∈ Λ−1 (λ). • Nach Aufgabe 13.29.c) ist die Impulsabbildung von Φ von der Form J : Λ−1 (λ) → t∗ , A → tr(A ·) = tr Π(A) · , mit der Projektion (13.5.16) und der abelschen Lie–Algebra t = Lie(Td ) der reellen Diagonalmatrizen. Diese ist isomorph zu Rd . • Damit folgt die Behauptung im generischen Fall aus Satz 13.34. Der Fall degenerierter Eigenwerte folgt daraus durch Grenzwertbildung. 2 13.37 Aufgabe (Ky-Fan-Maximumsprinzip f¨ ur hermitesche Matrizen) Folgern Sie aus dem Satz von Schur und Horn, dass f¨ ur die Eigenwerte (λ1 , . . . , λd ) = Λ(A) von A ∈ Herm(d, C) die linearen Relationen k i=1
λi =
max
(x1 ,...,xk )∈Vk (Cd )
k
xi , Axi
(k = 1, . . . , d)
i=1
gelten. Hier bezeichnet Vk (Cd ) die kompakte, reell (2dk − k 2 )–dimensionale Stiefel–Mannigfaltigkeit der orthonormalen k–Tupel (x1 , . . . , xk ) von Vektoren x i ∈ Cd . 3 13.38 Weiterf¨ uhrende Literatur Eine Modifikation des Satzes von Schur und Horn beschreibt die Eigenwertstruktur der Matrix A+B unter der Voraussetzung, dass nur die Eigenwerte von A und B ∈ Herm(d, C) bekannt sind. Dieser Satz l¨asst sich durch eine auf Frances Kirwan zur¨ uckgehende Verallgemeinerung von Satz 13.34 beweisen, siehe z.B. den Artikel [Li] von P. Littelmann. 3
12 also zum Beispiel Λ−1 (λ) ∼ S 2 f¨ ur d = 2, denn U(2)/S 1 ∼ = SU(2) ∼ = S 3 und SU(2)/S 1 ∼ = = S 2 , siehe die Hopf-Abbildung auf Seite 108.
Kapitel 14
Starre und bewegliche Ko ¨rper
Der Asteroid Ida 1 rotiert alle 4.6 Stunden um die Achse maximalen Tr¨agheitsmoments. Die Sonne l¨asst diese Achse mit einer Periode von 77 000 Jahren pr¨azedieren.
14.1 14.2 14.3 14.4
Bewegungen des Raumes . . . . . . . . . ¨ Kinematik starrer Korper . . . . . . . . . . ¨ Losung der Bewegungsgleichungen . . . . ¨ Bewegliche Korper, anholonome Systeme
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. 344 . 345 . 351 . 361
1 Ida besitzt einen mittleren Durchmesser von ca. 30 km und einen Mond, der Ida im Schritttempo umrundet. Aufnahme 1993 durch den Satellit Galileo.
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 14,
343
344
14.1. Bewegungen des Raumes
Bisher haben wir meistens die Bewegung von Punktmassen betrachtet. Diese stellen zwar, wie etwa in der Himmelsmechanik, eine gute Idealisierung mancher Naturvorg¨ange dar. H¨aufig haben wir es aber mit ausgedehnten K¨orpern zu tun. Manchmal, wie etwa bei Fl¨ ussigkeiten, sind diese nur mit den Mitteln der Kontinuumsmechanik, also mit partiellen statt gew¨ ohnlichen Differentialgleichungen zu beschreiben. Bei starren K¨orpern allerdings bleiben die Abst¨ande zwischen den punktf¨ormig gedachten Atomen zeitlich konstant, was uns eine Beschreibung durch gew¨ohnliche Differentialgleichungen erm¨oglicht.
14.1
Bewegungen des Raumes
Wir beginnen mit dem euklidischen Raum(Rd , ·, ·) mit kanonischem Skalarpro d dukt a, b = k=1 ak bk , Norm a = a, a und Metrik d(a, b) = a − b , sowie seinen Isometrien oder Bewegungen, das heißt den abstandserhaltenden Abbildungen I : Rd → Rd . Wir erinnern an eine aus der Linearen Algebra bekannte Tatsache. Offensichtlich ist jede Abbildung I : Rd → Rd , I(q) = Oq + v mit O ∈ O(d) (orthogonale Gruppe der Drehspiegelungen des Rd , siehe Anhang E) und v ∈ Rd eine Isometrie, denn I(a) − I(b) = O(a − b) = a − b . Umgekehrt gilt: 14.1 Satz (Euklidische Bewegungen) Jede Isometrie I : Rd → Rd kann eindeutig in der Form I(q) = Oq + v (q ∈ Rd ) mit O ∈ O(d) und v ∈ Rd dargestellt werden. Beweis: Es sei I : Rd → Rd eine Isometrie. ˜ := I(q) − v den Ursprung invariant. • Setzen wir v := I(0), dann l¨asst I(q) • Aus der Polarisationsidentit¨at f¨ ur das Skalarprodukt a, b = 14 a + b 2 − a − b 2 a, b ∈ Rd und
˜ ˜ ˜
I(c)
= d I(0), I(c) = d(0, c) = c
c ∈ Rd . ˜ ˜ folgt, dass I(a), I(b) = a, b gilt. Falls I˜ linear ist, ist I˜ orthogonal.
• Die Linearit¨at von I˜ folgt aus der Beziehung ˜ ˜ − β I(b) ˜ 2 = 0 I(αa + βb) − αI(a)
α, β ∈ R, a, b ∈ Rd .
Die linke Seite ist aber eine Summe von Skalarprodukten und daher wegen der Invarianz des Skalarproduktes unter I˜ gleich (αa + βb) − αa − βb 2 = 0. Also ist I˜ linear. 2 Isometrien metrischer R¨aume sind immer injektiv, aber nicht notwendig surjektiv (finden Sie ein Gegenbeispiel!). Im Fall des Rd ist dies aber so, und wir erhalten also die Gruppe der Isometrien des Rd , die sogenannte Euklidische Gruppe E(d).
14. Starre und bewegliche K¨ orper
345
• Dies ist eine Lie–Gruppe (siehe Anhang E) und als Mannigfaltigkeit nach Satz 14.1 gleich E(d) = Rd × O(d). (14.1.1) • Die Gruppenstruktur von E(d) entspricht aber nicht dem direkten Produkt dieser beiden Gruppen, sondern ihrem sogenannten semidirekten Produkt, siehe Anhang E.1. Bei Komposition zweier Isometrien erhalten wir also (v2 , O2 ) ◦ (v1 , O1 ) = O2 v1 + v2 , O2 O1
vi ∈ Rd , Oi ∈ O(d) .
14.2 Aufgabe Welche Form hat das zu (v, O) ∈ E(d) inverse Element?
3
Die Untergruppe der orientierungserhaltenden Isometrien des Rd bezeichnen wir mit SE(d) := {(v, O) ∈ E(d) | O ∈ SO(d)}. (14.1.2)
14.2
Kinematik starrer K¨ orper
Bei einem aus n Massenpunkten zusammengesetzten starren K¨orper bleiben die Abst¨ande dk, zwischen dem k–ten und –ten Massenpunkt zeitlich konstant. Andererseits k¨ onnen wir nicht so einfach durch Vorgabe von n2 positiven Zahlen dk, = d,k , 1 ≤ k < ≤ n einen starren K¨orper im Rd definieren. Denn ussen Relationen wie zum Beispiel 2 die Dreiecksun• zwischen den dk, m¨ gleichung erf¨ ullt sein, damit u ¨berhaupt Punkte q1 , . . . , qn ∈ Rd mit diesen Abst¨anden existieren. • Wenn auch die Abst¨ande dk, bei beliebigen Isometrien gleich bleiben, sind physikalische Bewegungen orientierungserhaltend. Wir gehen anders vor und definieren 14.3 Definition • F¨ ur d, n ∈ N sei die Diagonalwirkung von E(d) auf dem Rnd gegeben durch Φn,d : E(d) × Rnd → Rnd
, Φn,d I, (q1 , . . . , qn ) = I(q1 ), . . . , I(qn ) .
• Die Φn,d –Orbits O ⊆ Rnd der Gruppe SE(d) heißen starre K¨ orper aus n Punkten im Rd . 2 Eine
weitere Bedingung ist, dass die sogenannten Cayley-Menger–Determinanten von je⎛ ⎞
weils d + 1 Punkten nicht negativ sind. Beispiel f¨ ur d = 2: −16 det
⎜ ⎜ ⎜ ⎜ ⎜ ⎝
0 1
1 0
1 d2 2,1 1
d2 3,1
1 1 2 ⎟ d2 1,2 d1,3 ⎟ 0 d2 3,2
⎟
⎟. d2 2,3 ⎟ ⎠
0
346
14.2. Kinematik starrer K¨orper
Das sieht zun¨achst abstrakt aus, beschreibt aber, was wir haben wollen, denn genau dann geh¨oren q, q ∈ Rnd zum gleichen Orbit, wenn gilt
qk − q = qk − q
(1 ≤ k < ≤ n)
und zus¨atzlich die Orientierung erhalten bleibt. Der Orbit Oq der Diagonalwirkung von SE(d) durch q ∈ Rnd besitzt die Form des Quotientenraums Oq ∼ = SE(d)/SE(d)q , wobei SE(d)q = {I ∈ SE(d) | Φn,d (I, q) = q} die Stabilisatorgruppe von q bezeichnet, siehe Anhang E.1. 14.4 Beispiele 1. n = 1 Teilchen. Hier ist die Isotropiegruppe SE(d)q = (v, O) ∈ SE(d) | v = (1l − O)q ∼ = SO(d) ⊂ SE(d), und es gibt nur einen Orbit: O ∼ = Rd = SE(d)/SO(d). 2. n = 2 Teilchen. Falls der Abstand d1,2 = 0 ist, ist der Orbit Oq durch q ∈ R2d wieder von der Form Oq = Rd . Sonst ist die Isotropiegruppe SE(d)q ∼ = SO(d − 1) (mit SO(0) := {e}), denn wir k¨ onnen im (d − 1)–dimensionalen Unterraum des Rd , der senkrecht zur Verbindungslinie span(q1 − q2 ) ⊆ Rd liegt, beliebige Drehungen vornehmen. Damit ist der Orbit durch q gleich Oq ∼ = SE(d)/SE(d)q = Rd × SO(d)/SO(d − 1) = Rd × S d−1 , falls d ≥ 2 (und Oq ∼ ur d = 1). = R f¨ Das kann man direkt verstehen, denn f¨ ur das erste Teilchen kann der Ort q1 frei gew¨ahlt werden, w¨ahrend bei vorgegebenem Abstand d1,2 > 0 das zweite Teilchen auf der Sph¨are {q2 ∈ Rd | q2 − q1 = d1,2 } liegen muss. 3. n ≥ d Teilchen. Wir k¨ onnen in einem Orbit O ⊂ Rnd zum Beispiel den Ort d q1 ∈ R des ersten Teilchens frei w¨ahlen. Falls die Vektoren q2 − q1 , q3 − q1 , . . . , qn − q1 ∈ Rd den Rd aufspannen, ist die Isotropiegruppe SE(d)q einelementig, also Oq ∼ = SE(d). Dies ist aber schon der Fall, wenn ein (d−1)–dimensionaler Unterraum des Rd aufgespannt wird, denn keine echte Drehung des Rd l¨asst die Punkte dieses Unterraums invariant. F¨ ur n ≥ d Teilchen 3 ist daher Oq ∼ = SE(d) typisch. 3 Wir werden nur diesen letzten Fall weiter betrachten, erhalten also als starre K¨orper im Rd zu SE(d) isomorphe Mannigfaltigkeiten. 3 Sind die q etwa Atomorte, dann ist d = 3 und f¨ ur einen makroskopischen starren K¨ orper k zum Beispiel n = 1023 .
14. Starre und bewegliche K¨ orper
347
Die Bewegung auf diesem Konfigurationsraum wird mit dem Formalismus der holonomen Zwangsbedingungen aus Kapitel 8.2 beschrieben. Ist etwa die Hamilton–Funktion von der Form ˜ q) = , H(p,
nd ˜ : Rnd H p × Rq → R
n
pk 2 k=1
2mk
+ V˜ (q),
also die Lagrange–Funktion gleich nd L˜ : Rnd q × Rv → R
˜ v) = , L(q,
n mk k=1
2
vk 2 − V˜ (q),
dann parametrisieren wir den die Referenzkonfiguration q ∈ Rnd enthaltenden Orbit Oq mit der Euklidischen Gruppe, benutzen also den Diffeomorphismus Q : SE(d) → Oq ⊂ Rnd
, Q(a, O)k := Oqk + a (k = 1, . . . , n).
Wie bei jeder Lie–Gruppe ist das Tangentialb¨ undel von SE(d) parallelisierbar (siehe Definition A.43), und mit dem Vektorraum Alt(d, R) = {A ∈ Mat(d, R) | A = −A} der antisymmetrischen Matrizen ist es nach (E.3.2) von der Form T SE(d) ∼ = SE(d) × Rd × Alt(d, R) . Damit l¨asst sich die Ableitung von Q an der Stelle (a, O) schreiben als DQ(a, O)(v, A) = (AOq1 + v, . . . , AOqn + v) v ∈ Rd , A ∈ Alt(d, R) . Nach Definition ergibt sich f¨ ur die Lagrange–Funktion auf dem Tangentialb¨ undel des Orbits L : T Oq → R , L(x, w) = L˜ Q(x), DQ(x) w mit x = (a, O), w = (v, A) und V (x) := V˜ Q(x) L(x, w) =
n mk k=1
2
AOqk + v, AOqk + v − V (a, O).
Wir k¨onnen jetzt annehmen, dass (mit der Gesamtmasse mN := Schwerpunkt qN : Rnd → Rd
, qN (q) =
n mk qk ∈ Rd mN
(14.2.1)
n k=1
mk ) der
(14.2.2)
k=1
der Referenzkonfiguration q bei der Null liegt, denn durch Translation von q mittels Φn,d findet man in Oq einen Punkt mit dieser Eigenschaft.
348
14.2. Kinematik starrer K¨orper
2
2
1
2
2
1
2
0
=
1 0
=
1
0
2
1
2
2 0
1 2
Zeit t
0 1
4 6
1 2
0 2 0
1
1
2
Zeit t
2
0 4
1
1
2
Zeit t
1 4
0 6
1
1
Abbildung 14.2.1: Bewegtes Viereck im erweiterten Konfigurationsraum R2 × I. Links: Raumfeste Basis (e1 , e2 ), mit Graph der Kurve c aus Lemma 14.6, Mitte: K¨orpereigene Basis (E1 , E2 ) in raumfesten Koordinaten, Rechts: Graph der Kurve C in k¨ orpereigener Basis (E1 , E2 ). Wir multiplizieren das Skalarprodukt in (14.2.1) aus. Mit den Orthogonalpro jektionen Pk : Rd → Rd auf span qk − Q und dem Tr¨agheitstensor 4 I˜ = I˜qN (q) (q)
f¨ ur I˜Q (q) :=
n
mk qk − Q 2 Pk ∈ Sym(d, R)
(14.2.3)
k=1
bez¨ uglich Q ∈ Rd ist dann L(x, w) =
−1 mN ˜
v 2 + 12 tr IO A AO − V (a, O). 2
(14.2.4)
Wir werden im n¨achsten Abschnitt die Lagrange–Gleichungen von (14.2.4) in einfachen F¨allen l¨osen. Dabei werden verschiedene Koordinatensysteme benutzt. 14.5 Definition • Die kanonische Basis (e1 , . . . , ed ) des Rd heißt auch raumfeste Basis. • F¨ ur ein Intervall I ⊆ R und eine glatte Kurve O : I → SO(d) heißt die durch die Zeit t ∈ I parametrisierte Orthonormalbasis E1 (t), . . . , Ed (t) mit Ek (t) := O(t) ek k¨ orpereigene Basis des Rd . Bei diesen Namen haben wir eine Bewegung des starren K¨orpers im Blick, bei der sich die Punkte des K¨ orpers zum Zeitpunkt t an den Orten q (t) := O(t) q (t0 ) + a(t)
( = 1, . . . , n)
14.5 dieselbe Kurve befinden, mit O(t0 ) = 1l und a(t0 ) = 0. Wird in Definition ) * O : I → SO(d) benutzt, dann ist Ek (t), q (t) = ek , q (t0 ) + O(t)−1 a(t) . 4 Die Tilde symbolisiert, dass diese Definition in drei Dimensionen nicht mit der ublichen ¨ (siehe (14.3.4)) u ¨bereinstimmt.
14. Starre und bewegliche K¨ orper
349
Falls also die Bewegung keinen Translationsanteil hat (a(t) = 0 (t ∈ I)), ¨andern sich die Orte in der k¨ orpereigenen Basis nicht: mit Q (t) :=
d
Ek (t), q (t) Ek (t)
k=1
ist
Q (t) =
d
ek , q (t0 ) Ek (t).
k=1
Eine sinnvolle Darstellung dieser Basen ist im erweiterten Konfigurationsraum undelprojektion π : E → I , (q, t) → t E := Rd × I , mit B¨ m¨oglich. Die raumfeste Basis in der Faser π −1 (t) des Vektorb¨ undels E u ¨ber dem Punkt t der Basismannigfaltigkeit I (also dem Zeitintervall) wird jetzt mit e1 (t), . . . , ed(t) bezeichnet. Dagegen verdreht liegt die k¨orpereigene Basis E1 (t), . . . , Ed (t) in der gleichen Faser (siehe Abbildung 14.2.1). 14.6 Lemma (Kinematik in k¨ orpereigenen Koordinaten) F¨ ur eine glatte Kurve c : I → Rd in raumfesten Koordinaten und die zeitabh¨angige Drehung O : I → SO(d) aus Definition 14.5 bezeichne C := O−1 c : I → Rd ihre Darstellung in k¨orpereigenen Koordinaten. Dann gilt • f¨ ur die Geschwindigkeit: C = O−1 c − BC
mit
B(t) := O−1 (t) O (t) ∈ Alt(d, R)
(t ∈ I)
• und f¨ ur die Beschleunigung: C = O−1 c − 2BC − B 2 C − B C.
(14.2.5)
Beweis: • Aus der Produktregel O(O−1 ) + O O−1 = (OO−1 ) = 1l = 0 f¨ ur die Ableitung von O : I → SO(d) folgt (O−1 ) = −O −1 O O−1 . Die Formel f¨ ur die Geschwindigkeit C ergibt sich mit der Produktregel aus C = O−1 c. • B(t) ist in Alt(d, R), denn wegen (O −1 ) = (O ) = (O ) ist B = (O ) (O −1 ) = (O −1 ) O = −(O−1 O O−1 )O = −O−1 O = −B. • Einsetzen der gerade abgeleiteten Relation O−1 c = C + BC in C
= (O−1 c − BC) = O−1 c + (O−1 ) c − BC − B C = O−1 c − O−1 O O−1 c − BC − B C
ergibt die Beziehung C = O−1 c − O−1 O C − O−1 O BC − BC − B C zwischen den Beschleunigungen in den beiden Koordinatensystemen. 2 14.7 Bemerkung (Retrograde Planetenbewegung) Allgemeiner k¨onnen wir zeitabh¨angige Koordinatentransformationen (a, O) : I → SE(d) betrachten, die zur Zeit t ∈ I von der Form q → O(t)q + a(t) ist, also außer der Rotation O(t) ∈ SO(3) noch eine Translation um a(t) ∈ R3 beinhaltet.
350
14.2. Kinematik starrer K¨orper
Marsbahn Mars Erdbahn Erde Sonne
Abbildung 14.2.2: Links und Mitte: Form der von der Erde aus beobachteten Marsbahn. Rechts: Erkl¨arung der retrograden Bewegung. Sei etwa a(t) die Position der Erde (beziehungsweise eines Beobachters auf ihr) zur Zeit t in einem Koordinatensystem, dessen Mittelpunkt die Sonne einnimmt. Wir nehmen vereinfachend an, dass der Beobachter im Lauf des Jahrs immer auf den gleichen Punkt des Fixsternhimmels schaut, setzen also O(t) = 1l. Wegen der geringen Exzentrizit¨at sind die Ellipse a und die entsprechende Ellipse der Marsbahn in guter N¨aherung mit konstanter Geschwindigkeit durchlaufene Kreise. Die Transformation der Kreislinie in das Koordinatensystem des Mars–Beobachters f¨ uhrt aber zu einer komplizierten Bewegung von Mars am Firmament, siehe Abbildung 14.2.2 (links und Mitte). Insbesondere scheint er entgegen seiner u ¨blichen Bewegung am Firmament von West nach Ost zur¨ uckzulaufen, wenn die Erde ihn u ¨berholt. Diese Scheinbewegung wird retrograd genannt, siehe Abbildung 14.2.2 (rechts). In der griechischen Antike wurde sie durch die Epizykeltheorie erkl¨art, bei der die Planeten sich auf einem kleiMars nen Kreis (dem Epizykel) bewegen, Marsbahn dessen Mittelpunkt wiederum auf eiEpizykel nem um die ruhende Erde zentrierten Deferent Kreis, dem Deferenten, abl¨auft. Erde Obwohl diese geozentrische Theorie wegen der Kommutativit¨at der VekEpizykelmodell des Apollonius toraddition zu einer heliozentrischen (ca. 200 vor Chr.) Kreisbewegung kinematisch ¨aquivalent ist, ist sie nicht dynamisch ¨aquivalent. Insbesondere wird im geozentrischen Modell die Erde nicht beschleunigt. 3 14.8 Aufgaben (Scheinkr¨ afte) 1. Zeigen Sie, dass in ur d = 2 Dimensionen f¨ 0 −1 cos(ϕ(t)) − sin(ϕ(t)) J = 1 0 und zeitabh¨angiger Drehmatrix O(t) = sin(ϕ(t)) cos(ϕ(t)) gilt: C (t) =
cos(ϕ(t)) sin(ϕ(t)) − sin(ϕ(t)) cos(ϕ(t))
c (t)−2ϕ (t)JC (t)+ϕ (t)2 C(t)−ϕ (t)JC(t).
2. Zeigen Sie, dass in d = 3 Dimensionen mit ω(t) := i−1 (B(t)) ∈ R3 (siehe
14. Starre und bewegliche K¨ orper
351
(13.4.8)) gilt: C (t) = O−1 (t) c (t) − 2ω(t) × C (t) − ω(t) × (ω(t) × C(t)) − ω (t) × C(t). 3. Berechnen Sie die Coriolis–Kraft (siehe unten), die auf einen Radfahrer der Masse m = 100kg (einschließlich Fahrrad!) wirkt, der in Berlin mit 20 km/h Geschwindigkeit nach Westen f¨ahrt. Was ist der Betrag der Horizontalkomponente, und in welcher Himmelsrichtung wirkt sie? 3 Ist c(t) ∈ Rd der Ort eines Teilchens der Masse m > 0 im Rd , dann sind nach der Newton–Gleichung die mit m multiplizierten Terme von (14.2.5) als Kr¨afte anzusehen, die — von dem k¨orpereigenen Koordinatensystem aus gesehen — auf das Masseteilchen wirken:
E2
1. −2mBC (in 3D: −2m ω × C ) heißt Coriolis–Kraft, 2. −mB 2 C (in 3D: −m ω × (ω × C)) heißt Fliehkraft, und
E1
Coriolis–Kraft (senkrecht auf C) und Fliehkraft (radial) f¨ ur die 3. −mB C (in 3D: −m ω × C) heißt Kurve C aus Abbildung 14.2.1 Euler–Kraft. Substitution von B in die Lagrange–Funktion L ergibt ur verschwindendes Po f¨ ˜ . tential mit A = O (t) = O(t)B(t)O(t)−1 : L = 12 tr B IB
14.3
L¨ osung der Bewegungsgleichungen
Falls das Potential V translationsinvariant, d.h. unabh¨angig von seinem ersten Argument a ∈ Rd ist, kommt a in der Lagrange–Funktion (14.2.4) nicht vor. Der Schwerpunkt des starren K¨ orpers bewegt sich folglich geradlinig und gleichf¨ormig: v(t) = v(0) , a(t) = a(0) + v(0)t
(t ∈ R),
und die Bewegung im Schwerpunktsystem wird von der Lagrange–Funktion −1 ˜ A AO − V (0, O) (14.3.1) L : T SO(d) → R , L(O, A) = 12 tr IO bestimmt.5 Diese Situation wird jetzt genauer untersucht. 5 Hier und in den weiteren dynamischen Betrachtungen nehmen wir an, dass die Massenverteilung nicht degeneriert ist.
352
14.3. L¨ osung der Bewegungsgleichungen
14.9 Beispiel (Schwerer Kreisel in zwei Dimensionen) F¨ ur d = 2 Dimensionen ist
ϕ − sin ϕ SO(2) = O = cos = S 1 × R, ϕ ∈ [0, 2π) ∼ = S 1 und T SO(2) ∼ sin ϕ cos ϕ denn Alt(2, R) = A = v0 −v |v∈R ∼ = R, siehe auch Beispiel A.44. 0 In dieser Parametrisierung des Tangentialraums von SO(2) ist A A = v 2 ( 10 01 ), also n ˜ −1 A AO = 1 tr I˜ v 2 = 1 J v 2 mit J := mk qk 2 > 0. L(O, A) = 12 tr IO 2 2 k=1
(14.3.2) Damit ist die Bewegungsgleichung ¨aquivalent zu der der Hamilton–Funktion H : T ∗ S 1 → R , H(p, ϕ) =
p2 − W (ϕ) 2J
ϕ − sin ϕ mit W (ϕ) := V 0, cos . sin ϕ cos ϕ
Deren hamiltonsche Gleichung l¨asst sich explizit l¨osen (siehe Satz 11.11). Auch der Fall eines um eine ortsfeste Achse rotierenden starren K¨orper im R3 kann auf dieses zweidimensionale Problem zur¨ uckgef¨ uhrt werden. Falls sogar W = 0 ist, dreht sich der starre K¨ orper mit der durch die Energie √ E = H(p0 , ϕ0 ) bestimmten Winkelgeschwindigkeit: ϕ(t) = ϕ0 + pJ0 t = ϕ0 ± JE t um seinen Schwerpunkt. 3 Der physikalisch wichtige Fall des frei rotierenden starren K¨orpers in d = 3 Dimensionen scheint schon deshalb schwieriger zu sein, weil sein Konfigurationsraum SO(3) sich nicht mehr so einfach wie SO(2) koordinatisieren l¨asst. Daf¨ ur gibt es zwar die sogenannten Euler–Winkel. Allerdings k¨onnen wir nicht darauf hoffen, dass sich der Ausdruck der kinetischen Energie in gleicher Weise vereinfachen l¨asst wie in (14.3.1). Denn die Matrix A A ∈ Sym(3, R) kommutiert nun nicht mehr immer mit der Drehmatrix O ∈ SO(3). Stattdessen betrachten wir zwei Spezialf¨alle: • Den kr¨aftefreien Kreisel, bei dem das Potential V = 0 ist. • Den schweren symmetrischen Kreisel. Der Tr¨agheitstensor 14.2.3) eines symmetrischen Kreisels besitzt zwei gleiche Eigenwerte. Man spricht von einem schweren Kreisel, wenn V ein konstantes Gravitationsfeld beschreibt.
14.3.1
Kr¨ aftefreie Kreisel
Im Fall des kr¨aftefreien Kreisels nehmen wir eine Koordinatentransformation auf k¨ orpereigene Koordinaten vor. In d = 3 Dimensionen verwenden wir statt der antisymmetrischen Matrizen B ∈ Alt(3, R) aus Lemma 14.6 die vertrauteren Vektoren 0 −ω3 ω2 ω1 3 ω3 0 −ω1 2 ∈ R = B, mit i(ω) = ω= ω ω 3
ω1 −ω2
0
14. Starre und bewegliche K¨ orper
353
siehe (13.4.8) zur Parametrisierung des Tangentialraums an SO(3). Mit der Eigenschaft i(a)c = a × c (a, c ∈ R3 ) aus (13.4.8) und der Identit¨at des Kreuzproduktes a × c, b × c = a, b c 2 − a, c b, c a, b, c ∈ R3 ergibt sich (f¨ ur a = b = ω und c = qk ) die Form der Lagrange–Funktion ˜ (14.3.3) L(ω) = 12 tr i(ω)Ii(ω) = 12 ω, Iω . Dabei ist die symmetrische Matrix I ∈ Sym(3, R) gleich I = J1l − I˜ mit I˜ aus (14.2.3) und 2 2 n n qk,2 +qk,3 −qk,1 qk,2 −qk,1 qk,3 2 2 2 J := mk qk , also I = mk −qk,1 qk,2 qk,1 +qk,3 −qk,2 qk,3 . (14.3.4) k=1
k=1
−qk,1 qk,3
−qk,2 qk,3
2 2 qk,1 +qk,2
I wird Tr¨agheitstensor genannt. Da die Summanden von I in (14.3.4) positiv semidefinit mit Kern span(qk ) (und einem Eigenwert qk 2 der Multiplizit¨at 2) sind, ist I selbst positiv semidefinit und sogar positiv definit, außer, wenn alle Massenpunkte qk auf einer Linie liegen. 14.10 Aufgabe (Satz von Steiner) Zeigen Sie, dass der Tr¨agheitstensor aus (14.3.4), aufgefasst als Funktion I : R3d → Sym(3, R) der n Massenpunkte q = (q1 , . . . , qn ), bez¨ uglich der Translationen Ta (q) := (q1 − a, . . . , qn − a)
(a ∈ R3 )
ur die minimal 6 wird, wenn a der Schwerpunkt qN aus (14.2.2) ist, und dass f¨ Gesamtmasse mN , qN ∈ R3 \ {0} und die Projektion PN auf span(qN ) gilt: I(q) = I TqN (q) + mN qN 2 (1l3 − PN ). Das Tr¨agheitsmoment bei Drehung um die Achse span(qN ) ist also die Summe der Tr¨agheitsmomente eines um seinen Schwerpunkt verschobenen und eines in seinem Schwerpunkt konzentrierten K¨ orpers gleicher Masse. 3 Man gibt also u uglich seines ¨blicherweise den Tr¨agheitstensor I eines K¨orpers bez¨ an. Die Eigenwerte 0 ≤ I1 ≤ I2 ≤ I3 von I heißen auch Haupttr¨agheitsmomente, die eindimensionalen Eigenr¨aume Haupttr¨agheitsachsen. Letztere sind also paarweise orthogonal, beziehungsweise k¨ onnen bei Gleichheit von Haupttr¨agheitsmomenten orthogonal gew¨ahlt werden.
6 F¨ ur
symmetrische Matrizen gilt A ≤ B, wenn B − A positiv semidefinit ist.
354
14.3. L¨ osung der Bewegungsgleichungen
14.11 Aufgabe (Haupttr¨ agheitsmomente) Zeigen Sie, dass f¨ ur n ≥ 3 1 1 Massenpunkte qk ∈ R3 der Kegel 4 0 3 Stab (I1 , I2 , I3 ) ∈ R3 | I1 ≤ I2 ≤ I3 ≤ I1 + I2 Mensch
1 2
I I
2 3 der Wertebereich der Haupttr¨agheitsmomente ist. I Welcher Wertebereich wird f¨ ur n = 3 abgedeckt, 2 Kugel I1I2I3 1 falls sich der Schwerpunkt qN am Nullpunkt befin 3 det? I1I2 ¨ Best¨atigen Sie (durch Ubergang von der Summe Scheibe 1 4 zum Integral in (14.3.4)) die Beispielangaben der I1 Eckpunkte f¨ ur das nebenstehende Bild der Haupttr¨agheitsmomente. Dabei wurde I1 + I2 + I3 = 1 angenommen. Daten bezogen auf den Schwerpunkt eines aufrecht stehenden Durchschnittserwachsenen (große Variation!). 3
Interessant an (14.3.3) ist, dass nur noch drei der sechs Phasenraumkoordinaten, n¨amlich die Eintr¨age der Winkelgeschwindigkeit ω, vorkommen.
L2
L2
L3
L3
L1
L1
Abbildung 14.3.1: Links: Schnitt der Ellipsoide M −1 (m) und L−1 (e). Rechts: ¨ Aquipotentialkurven auf M −1 (m). Die Achsen sind die Drehimpulskomponenten.
14.12 Satz • L : T SO(3) → R aus (14.3.3) ist eine Konstante der Bewegung. • Der Gesamtdrehimpuls des kr¨aftefreien starren K¨orpers in raumfesten Koordinaten, also die Restriktion L : T SO(3) → R3 der Abbildung ˜ : R3n × R3n → R3 L q v
,
˜ v) = L(q,
n
mk qk × vk ,
k=1
ist zeitlich konstant. Er besitzt in k¨orpereigenen Koordinaten die Form L = I ω, und L ist eine Konstante der Bewegung des kr¨aftefreien Kreisels.
14. Starre und bewegliche K¨ orper
355
Beweis: • Die Lagrange–Funktion L ist Konstante der Bewegung, da sie nach der Beziehung H(p, q) = p, v − L(q, v) aus Satz 8.6 hier gleich dem pull-back der Hamilton–Funktion H : T ∗ SO(d) → R auf T SO(d) ist.7 • Mit (14.3.4) ist ˜ v) = L(q,
n
mk qk × (ω × qk ) =
k=1
n
mk qk 2 ω − ω, qk qk = Iω.
k=1
• Die Konstanz des Drehimpulses folgt aus dem Satz von Noether (Satz 13.22): Die diagonale Wirkung der Drehgruppe im Konfigurationsraum, also ˜ : SO(3) × R3n → R3n , Φ ˜ O (q1 , . . . , qn ) = Oq1 , . . . , Oqn Φ q q wird durch Restriktion auf den zu SO(3) isomorphen Orbit zur Linkswirkung auf SO(3). Die Lagrange–Funktion ist invariant unter dem Lift dieser Linkswirkung auf T SO(3), denn * ) O ∈ SO(3) . Oω, OIO −1 Oω = ω, Iω Analog ist die Hamilton–Funktion H : T ∗ SO(d) → R invariant unter dem Kotangentiallift Φ der Linkswirkung. Der auf T ∗ SO(3) zur¨ uckgezogene Drehimpuls L : T SO(3) → R3 ist (analog zu Beispiel 13.19) eine Impulsabbildung von Φ, und die Hamilton–Funktion H ist Φ-invariant. 2 • Wegen L(t) = O−1 (t)L ist L zeitlich konstant. Neben L ist das Quadrat M := L, L des Drehimpulsvektors eine positiv definite quadratische Form auf dem R3ω . Sind die Eigenwerte von I voneinander verschieden, dann definieren typische Werte von L und M beschr¨ankte Kurven im Raum. Bis auf Zeitparametrisierung haben wir damit die Differentialgleichung f¨ ur die Winkelgeschwindigkeit ω gel¨ ost, siehe Abbildung 14.3.1. Wir bestimmen die Evolution des Drehimpulses L(t) = O(t)−1 L(t) ∈ R3 in der k¨orpereigenen Basis. Nach Lemma 14.6 und Satz 14.12 ergibt sich f¨ ur den kr¨aftefreien Kreisel die Euler–Gleichung ˙ L(t) = L(t) × Ω(t). Wegen L(t) = I Ω(t) ist das eine Differentialgleichung f¨ ur den Vektor Ω ˙ IΩ(t) = I Ω(t) × Ω(t). Ist die symmetrische Matrix I diagonal, I= diag(I 1 , I2 , I3 ), dann ist die KoordiΩ1 natenform der Euler–Gleichung f¨ ur Ω = Ω 2 Ω3
˙1 I1 Ω ˙2 I2 Ω ˙3 I3 Ω
= =
(I2 − I3 ) Ω2 Ω3 (I3 − I1 ) Ω3 Ω1
=
(I1 − I2 ) Ω1 Ω2 .
7 Zwar ist Satz 8.6 nicht f¨ ur Konfigurationsmannigfaltigkeiten M , sondern f¨ ur offene Teilmengen U des Rn formuliert, kann aber als Aussage u ¨ber Kartenbilder von M gelesen werden.
356
14.3. L¨ osung der Bewegungsgleichungen
¨ Aquivalent dazu ergeben sich f¨ ur die Koordinaten in der k¨orpereigenen Basis Lk = Ik Ωk , 1 L˙ 1 = I3 1 L˙ 2 = I1 1 L˙ 3 = I2 mit den Erhaltungsgr¨ oßen E :=
3
also −
1 I2
−
1 I3
−
1 I1
L2k k=1 Ik
L1 L2 L3
:= L des Drehimpulses
L2 L3 L3 L1 L1 L2 ,
und L 2 = L21 + L22 + L23 .
Abbildung 14.3.2: Links: Modell der MIR-Station. Mitte: besch¨adigte Station. Rechts: der Astronaut Michael Foale. The Right Spin So lautet der Titel einer vom Mathematiker Robert Osserman herausgegebenen DVD u ¨ber einen folgenreichen Unfall der Raumstation Mir (Abbildung 14.3.2, links und Mitte). Am 25. Mai 1997 kollidierte diese mit dem unbemannten Versorgungsmodul Progress, als die Astronauten versuchten, das Andockman¨over ohne Benutzung des automatischen Leitsystems von Hand zu steuern (nach dem Zerfall der Sowjetunion verlangte die Ukraine Geld f¨ ur die Benutzung dieses Systems, w¨ahrend das russische Raumprogramm auf Sparkurs gesetzt worden war). Um dem der Kollision folgenden Druckabfall zu entgehen, musste sich die Crew in ein Modul der Station retten. Das n¨achste Problem war ein Stromausfall, denn die Kosmonauten waren gezwungen, Stromkabel zu zerschneiden, um die Luke ihres Moduls zu schließen. Die noch verf¨ ugbaren Solarzellen lieferten keinen Strom mehr, denn die Kollision hatte die Station zum Rotieren gebracht. Im Film berichtet der US–Astronaut Michael Foale (Abbildung 14.3.2 rechts), wie er und seine russischen Kollegen versuchten, die Mir zu stabilisieren. Dazu musste (anhand eines zerbrochenen Modells der Mir ) gesch¨atzt werden, welche der Hauptachsen stabil waren. Die Vermutung stellte sich als falsch heraus, und Foale versuchte auf einem Laptop mit sich leerenden Batterien die Euler–Gleichungen der Station zu l¨osen. Die Stabilisierungsversuche waren so erfolgreich, dass die Mannschaft u ¨berlebte und nach dreieinhalb Monaten von einem Space Shuttle zur Erde zur¨ uckgebracht werden konnte.
14. Starre und bewegliche K¨ orper
357
14.13 Definition Das k¨ orpereigene Tr¨ agheitsellipsoid eines starren K¨orpers mit kinetischer Energie h > 0 ist Eh := {ω ∈ R3 |
1 2
ω, I ω = h}.
Auf diesem Ellipsoid muss sich also der k¨ orpereigene Vektor t → Ω(t) bewegen, wenn die Energie gleich h ist. Analog gilt f¨ ur die Winkelgeschwindigkeit Ω im raumfesten System: Ω(t) ∈ Eh (t) := O(t) Eh
(t ∈ R).
14.14 Satz (Poinsot) Das zeitabh¨angige Tr¨agheitsellipsoid t → Eh (t) des raumfesten Koordinatensystems rollt ohne Schlupf auf den zum Drehimpulsvektor ∈ R3 senkrechten Ebenen U± := {ω ∈ R3 | ω, = ±2h}. Beweis: • Eh (t) schneidet die Ebenen bei ±Ω(t). Denn wegen = I(t)Ω(t) ist: Ω(t), = 2h. • Eh (t) ber¨ uhrt diese Ebenen. Denn der Gradient der kinetischen Energie ist bei Ω(t) ∈ Eh (t) gleich . • Das Tr¨agheitsellipsoid besitzt in seiner Bewegung auf U± keinen Schlupf. Denn die Geschwindigkeit eines mit dem Tr¨agheitsellipsoid mitbewegten Punktes ω(t) = O(t)ω(0) ∈ Eh (t) ist dO (t) ω(0) = i Ω(t) ω(t) dt (mit i aus (13.4.8)). F¨ ur ω(t) = Ω(t) ist dieser Ausdruck Null. 2
Das Tr¨agheitsellipsoid rollt ohne Schlupf auf der Ebene U−
Wie wir aus dieser Beschreibung, aber auch schon aus dem in Abbildung 14.3.1 gezeigten Schnitt der Ellipsoide ersehen k¨ onnen, ist die Bewegung um die mittlere Achse instabil. 14.15 Bemerkung (Tennisschl¨ agersatz) Dies f¨ uhrt unter anderem zu folgendem Befund (Siehe Cushman und Bates [CB], Kapitel III.8): H¨alt man einen Tennisschl¨ager horizontal und versucht, ihn um seine vertikale Achse zu drehen, dann bewegt sich der Griff n¨aherungsweise in der Horizontalen. F¨angt man den Schl¨ager nach einer Rotation des Griffes wieder auf, haben sich aber Ober- und Unterseite vertauscht, siehe Abbildung 14.3.3.b) auf Seite 359. 3
358
14.3. L¨ osung der Bewegungsgleichungen
14.3.2
Schwere (symmetrische) Kreisel
Wie schon bei dem kr¨aftefreien Kreisel wird beim schweren Kreisel nicht vorausgesetzt, dass dieser um seinen Schwerpunkt rotiert. Im Gegenteil wird sich ein homogenes Schwerefeld nur dann bemerkbar machen, wenn Aufh¨angepunkt und Schwerpunkt nicht u ¨bereinstimmen. Die Euler–Winkel sind eine Parametrisierung der Drehgruppe SO(3). Eine Drehmatrix R ∈ SO(3) wird als Produkt D3 (γ)D1 (β)D3 (α) geschrieben, mit den Drehungen 1 0 0 0 cos(δ) sin(δ) D1 (δ) := 0 − sin(δ) cos(δ) cos(δ) sin(δ) 0 D3 (δ) := − sin(δ) cos(δ) 0 0
0
1
um die x– beziehungsweise z–Achse. Bezeichnet man die Schnittgerade der xy– Ebene und ihres Bildes unter R als Knotenlinie N , dann ist α ∈ [0, 2π) (beziehungsweise γ ∈ [0, 2π)) der Winkel zwischen der x–Achse (bzw. deren Bild, der X–Achse) und N . β ∈ [0, π) parametrisiert den Winkel zwischen den beiden Ebenen. α und β sind also die geographische L¨ange und Breite der Z-Achse. Offensichtlich degeneriert die Darstellung insbesondere f¨ ur β = 0. In der Anwendung auf den schweren Kreisel wirkt die Schwerkraft in negativer z–Richtung, die xy–Ebene ist also waagerecht. Die im Kreisel ortsfesten XY Z– Achsen sollen die Haupttr¨agheitsachsen mit den Tr¨agheitsmomenten I1 , I2 und I3 bez¨ uglich des als Nullpunkt benutzten Aufh¨angepunkts sein. Die Lagrange–Funktion L : T SO(3) → R besitzt L(ω) = 12 ω, Iω aus (14.3.3) als kinetischen Term. Die potentielle Energie im homogenen Schwerefeld ist die des Schwerpunktes. Wir setzen voraus, dass der Aufh¨angepunkt des Kreisels 8 sich auf der in Z–Richtung zeigenden Achse durch den Schwerpunkt befindet, im Abstand a. Dann besitzt dieser die z–Komponente a cos(β), und mit der Schwerebeschleunigung g > 0 ist die potentielle Energie V ≡ V (β) = ag cos(β). Wir verwenden Maßeinheiten, in denen ag = 1 ist. In Euler–Winkeln (α, β, γ) besitzt die Lagrange–Funktion L die Gestalt ˙ γ˙ = T α, β, γ, α, ˙ γ˙ − cos(β) L α, β, γ, α, ˙ β, ˙ β, mit kinetischer Energie ˙ γ˙ T α, β, γ, α, ˙ β, = + 8 also
(14.3.5)
2 I1 α˙ sin(β) sin(γ) + β˙ cos(γ) 2 2 I2 α˙ sin(β) cos(γ) − β˙ sin(γ) + I3 γ˙ + α˙ cos(β) . 1 2
der Nullpunkt des bewegten wie des ortsfesten kartesischen Koordinatensystems.
14. Starre und bewegliche K¨ orper
359
Abbildung 14.3.3: Bewegung des Locus der I3 -Achse auf der Einheitskugel. Von links nach rechts: a) keine Symmetrie, keine Schwerkraft, b) Tennisschl¨agersatz, c) keine Symmetrie, Schwerkraft, d) Symmetrie, Schwerkraft.
Wie man der numerischen L¨ osung anzusehen glaubt, ist die Bewegung f¨ ur den Fall generischer Haupttr¨agheitsmomente nicht integrabel (siehe Abb. 14.3.3 c)). Im achsensymmetrischen Fall I1 = I2 vereinfacht sich die Gestalt der Lagrange– Funktion (14.3.5) aber auf9 % & ˙ γ˙ = 1 I1 (α˙ sin(β))2 + β˙ 2 + I3 γ˙ + α˙ cos(β) 2 − cos(β). L α, β, γ, α, ˙ β, 2 (14.3.6) In dieser tauchen die Koordinaten α und γ nicht mehr auf. Damit sind deren konjugierte Impulse ∂L ∂L = α˙ I1 sin2 (β)+I3 cos2 (β) + γI = γ˙ + α˙ cos(β) I3 ˙ 3 cos(β) , pγ = ∂ α˙ ∂ γ˙ (14.3.7) Erhaltungsgr¨oßen. Deren Werte z und Z entsprechen den Drehimpulsen um die Vertikale und die k¨ orperfeste Symmetrieachse. Zusammen mit dem Wert E der Gesamtenergie T + V erhalten wir drei unabh¨angige Konstanten der Bewegung, und die Bewegung wird integrabel im Sinn von Definition 13.2. Wegen der ˙ 1 sin2 (β) schließen wir auf die implizite DifferentiRelation z − Z cos(β) = αI algleichung erster Ordnung E = 12 I1 β˙ 2 + Veff (β) mit effektivem Potential pα =
Veff (β) :=
2 z − Z cos(β) 2 + Z + cos(β). 2 2I3 2I1 sin (β)
Diese wird bei Transformation auf die Variable u := cos(β) mit β˙ = −u/ ˙ sin(β) noch u ¨bersichtlicher. Denn dann ist u˙ 2 = Ueff (u)
mit
Ueff (u) :=
2EI3 − 2Z (z − Z u)2 2u(1 − u2 ) (1−u2 )− − , I1 I3 I12 I1
das effektive Potential also ein Polynom dritten Grades. 9 Diese
Form setzt nicht voraus, dass I3 das gr¨ oßte Haupttr¨ agheitsmoment ist.
360
14.3. L¨ osung der Bewegungsgleichungen
Aus limu→±∞ Ueff (u) = ±∞ und Ueff (±1) = −(z ∓ Z )2 /I12 ≤ 0 folgern wir, dass f¨ ur z = ±Z und physikalisch realisierbare Energiewerte E das Polynom zwei Nullstellen in (−1, 1) besitzt. Diese dem Winkel β zugeordnete sogenannte Nutationsbewegung des Kreisels findet dann also zwischen zwei Grenzwinkeln 0 < β1 ≤ β2 < π statt, siehe Abbildung 14.3.3 d). Sie u ¨berlagert die Pr¨azession von α und die Rotation von γ. Deren Differentialgleichungen erh¨alt man durch Einsetzen der Nutationsbewegung t → β(t) in (14.3.7). 14.16 Weiterf¨ uhrende Literatur In [Whi], Kapitel 6 von Whittaker (zu Anfang des 20. Jahrhunderts die Monographie zur analytischen Mechanik) findet man die expliziten L¨ osungen (elliptische Funktionen). Globale Aspekte werden in [CB] von Cushman und Bates angesprochen. 3 14.17 Aufgabe (Schneller Kreisel) Analysieren Sie, ab welcher Rotationsfrequenz die obere Ruhelage β = 0 des schweren symmetrischen Kreisels liapunov– stabil wird. 3 14.18 Bemerkung (Hyperion) Hyperion ist ein Mond des Saturn. Die Sonde Voyager 2 fotografierte ihn (siehe Abbildung), und die Haupttr¨agheitsmomente I1 < I2 < I3 konnten bestimmt werden. Sie weichen mit dem Wert des Tr¨agheitsparameters (I2 − I1 )/I3 ≈ 0.24 stark von einer axialsymmetrischen Gestalt ab. Kombiniert mit einer recht exzentrischen Bahn um Saturn f¨ uhrt dies zu einer chaotischen Rotation von Hyperion, siehe [WPM] von Wisdom, Peale und Mignard. Er ist der einzige bekannte Mond im Sonnensystem mit dieser Eigenschaft. In [ZP] haben Zurek und Paz abgesch¨atzt, dass nach ca. 20 Jahren eine quantenmechanische Berechnung der Rotation merklich von den klassischen Daten abweichen w¨ urde. Hyperion sollte sich in einem makroskopischen Quantenzustand befinden. Wie die Tatsache zu erkl¨aren ist, dass wir dies nicht beobachten k¨onnen, war Inhalt des sogenannten Hyperion-Disputs. 3
14. Starre und bewegliche K¨ orper
14.4
Bewegliche K¨ orper, anholonome Systeme
Die starren K¨orper aus Definition 14.3 bestehen aus n Teilchen im Rd mit festen Abst¨anden. Ihr Konfigurationsraum ist also eine Untermannigfaltigkeit des Rnd , deren Dimension die der Gruppe SE(d) nicht u ¨bersteigt. Wir werden nun dieses Schema holonomer Zwangsbedingungen in zwei Richtungen verallgemeinern: 1. Wie in Bem. 8.10 angesprochen, k¨ onnen holonome Zwangsbedingungen als integrable Distributionen aufgefasst werden. Verallgemeinernd spricht man von (anholonomen) Zwangsbedingungen, wenn eine nicht notwendig integrable Distribution vorliegt. Besonders wichtig sind dabei die in den Geschwindigkeiten linearen Zwangsbedingungen. Ein erstes Beispiel ist die ohne Schlupf rollende Kugel. 2. Wir werden auch statt starren in sich bewegliche K¨ orper untersuchen. Selbst wenn keinerlei Teilchenabst¨ande fixiert werden, erhalten wir eine in einem reinen n–K¨orperproblem noch nicht vorhandene geometrische Struktur. Wir setzen n¨amlich voraus, dass gewisse Abst¨ande gesteuert werden k¨ onnen, wie z.B. die Stellung eines Gelenks in Biologie und Technik. Dann wird der Konfigurationsraum zum Totalraum eines B¨ undels u ¨ber dieser gesteuerten Basismannigfaltigkeit.
14.4.1
Geometrie K¨ orper
beweglicher
Beginnen wir mit Punkt 2. Diese Geometrie wurde seit den 1980er Jahren ausgearbeitet und ist z.B. in [MMR] von Marsden, Montgomery und Ratiu sowie in [Mon1] von Montgomery beschrieben. Das Paradigma ist der nebenstehend abgebildete freie Fall einer Katze.
361
362
14.4. Bewegliche K¨orper, anholonome Systeme
Diese kann zwar nicht ihren Drehimpuls ¨andern, schafft es aber trotzdem, mit den F¨ ußen aufzukommen, wenn sie Zeit hat, wie abgebildet zu man¨ovrieren. Die von ihr benutzte Technik ist die Benutzung einer geometrisch definierten Holonomie. Katzen k¨onnen damit auch den Sturz aus den oberen Stockwerken eines Hochhauses u onnen uns mit einer vergleichbaren Tech¨berleben. Wir Menschen k¨ nik immerhin auf einem B¨ urostuhl ohne Bodenkontakt drehen. Wir diskutieren allgemein den Fall einer freien eigentlichen Wirkung einer Lie– Gruppe G auf einer (Konfigurations–) Mannigfaltigkeit Q. Der Quotient B := Q/G ist damit nach Satz E.36 eine Mannigfaltigkeit 10 der Dimension dim(Q) − dim(G) und kann als Basis des Prinzipalb¨ undels π : Q → B, π(q) = [q] mit typischer Faser G angesehen werden (siehe Bemerkung F.5). 14.19 Beispiel Bei der Herleitung der Kinematik starrer K¨orper in Abschnitt 14.2 gingen wir von der Diagonalwirkung der Lie–Gruppe G = SE(d) auf Rnd aus. Diese wirkt auf dem Rnd zwar nicht frei. Aber wie aus Beispiel 14.4.3 folgt, ist f¨ ur n ≥ d Teilchen die Einschr¨ankung der Diagonalwirkung auf die dichte, G–invariante Teilmenge Q := q = (q1 , . . . , qn ) ∈ Rnd | span {qi − qk } = Rd frei. Da die Q definierende Bedingung offen ist, ist Q ⊂ Rnd eine nd–dimensionale Untermannigfaltigkeit. 3 14.20 Aufgaben (Euklidische Symmetrien) 1. Zeigen Sie, dass die Wirkungen von SE(d) auf Rnd und Q eigentlich sind. 2. Zeigen Sie, dass die auf Seite 257 definierte Formsph¨are des Dreik¨orperproblems als Quotient des Konfigurationsraums dreier Teilchen nach einer Gruppenwirkung verstanden Tipp: Kombinieren Sie die Dilatationen werden kann. R2 → R2 , x → λx λ ∈ (0, ∞) mit SE(2), und lassen Sie die entstehende Gruppe auf dem Konfigurationsraum (11.3.2) wirken. 3 Im Beispielfall parametrisiert B die Formen des beweglichen ,K¨orpers’. In vielen Anwendungen werden die m¨ oglichen Formen durch Wahl einer geeigneten G– invarianten Untermannigfaltigkeit von Q eingeschr¨ankt. Jedenfalls stellen wir uns vor, dass die K¨orperform als Funktion der Zeit gesteuert werden kann, durch Vorgabe einer Kurve c : [0, 1] → B. Geben wir einen Zusammenhang auf dem Hauptfaserb¨ undel π : Q → B vor, dann entspricht einer geschlossenen Kurve c eine Holonomie, das heißt eine durch ein Element der Gruppe G beschriebene K¨ orperbewegung. Ist der Totalraum eine riemannsche Mannigfaltigkeit (Q, g) (im Beispielfall ist g die euklidische Metrik), dann l¨asst sich ein solcher Zusammenhang wie folgt 10 Falls schon {q −q , . . . , q −q } linear unabh¨ angig ist, gibt es einen eindeutigen Repr¨ asen2 1 1 d ur den bez¨ uglich der Einbettungen R ⊂ Rn = R × Rn− gilt: tanten r = (r1 , . . . , rn ) ∈ [q], f¨ r ∈ R−1 ( = 1, . . . , d). In diesem Fall definieren diese Repr¨ asentanten r eine lokale Karte von Q. Sonst werden die Indices der qi entsprechend permutiert.
14. Starre und bewegliche K¨ orper
363
definieren. Als bei q ∈ Q zur (vertikalen) Faserrichtung Vq := ker(Dπq ) ⊂ Tq Q komplement¨arer horizontaler Unterraum wird ur alle v ∈ Vq } Hq := {h ∈ Tq Q | gq (h, v) = 0 f¨ gew¨ahlt. Wirkt G wie im Beispiel durch Isometrien, dann ist das ein G–invarianter Zusammenhang (im Sinn von Definition F.17). Diese geometrischen Strukturen korrespondieren mit der hamiltonschen Mechanik eines nat¨ urlichen mechanischen Systems, das heißt einer Funktion auf dem Phasenraum P := T Q, die von der Form H(q, v) = 12 gq (v, v) + V (q) ist. Dieses definiert u ¨ber die mit dem musikalischer Isomorphismus : T Q → uckgeholte kanonische symplektische Form ω0 ein haT ∗ Q (siehe Seite 470) zur¨ miltonsches Vektorfeld auf P . Mit Satz 13.16 erhalten wir eine faserweise lineare symplektische Gruppenwirkung von G auf P . Diese ist eine Symmetrie der Dynamik, wenn G nicht nur isometrisch auf Q wirkt, sondern auch das Potential V invariant l¨asst. Die Konstanten dieser Bewegung sind durch die Impulsabbildung J : P → g∗ gegeben (Definition 13.18). Mithilfe des Vektorfeldes Xξ : Q → T Q von ξ ∈ g kann man diese als (q, v) ∈ T Q J(q, v) = Xq (v) schreiben (mit der Transponierten Xq : Tq Q → g∗ von ξ → Xξ mittels g, siehe Montgomery [Mon1], Kapitel 14.1). Sie ist also faserweise linear. Nun k¨onnen wir J : T Q → g∗ damit beinahe als eine Zusammenhangsform A : T Q → g auf dem B¨ undel π : Q → B deuten. Nur beinahe, denn J besitzt Werte in der dualen Lie–Algebra g∗ statt in g. Diesen Fehler kann man aber beheben, wenn man das Tr¨agheitsmoment bei q ∈ Q als die symmetrische Bilinearform g × g → R, (ξ, η) → gq Xξ (q), Xη (q) definiert, oder ¨aquivalent als lineare Abbildung I(q) : g → g∗ , ξ → gq Xξ (q), · .
14.21 Satz Die Lie–Algebra–wertige Eins–Form A : TQ → g
, A(q) := I(q)−1 J q, ·
ist die Zusammenhangsform des Ehresmann–Zusammenhangs H auf dem Haupt faserb¨ undel π : Q → B, das heißt ker A(q) = Hq . Insbesondere verschwindet J(q, v) f¨ ur horizontale Richtungen v. Beweis: Siehe Montgomery [Mon1], Proposition 14.1.
2
Mechanische Systeme mit verschwindendem J bewegen sich also unter einer gesteuerten Dynamik so, wie das durch den Ehresmann–Zusammenhang H definiert ist.
364
14.4. Bewegliche K¨orper, anholonome Systeme
In der physikalischen Literatur wird die zugeh¨ orige Holonomie oft mit den Namen Berry–Phase (in quantenmechanischen Ph¨anomenen) oder Hannay–Winkel bezeichnet. Es l¨asst sich zeigen, dass diese Gr¨oßen in vielen gesteuerten Systemen im Limes langsamer Parameter¨anderung aus der Bewegung abgelesen werden k¨onnen. Die Anwendungen sind vielf¨altig: Die in Beispiel F.29 vorgestellte Dreiachsenstabilisierung l¨asst sich damit ebenso erkl¨aren wie das Foucault–Pendel und die zyklische Fortbewegung von Mikroorganismen, ja, es wurde sogar eine Schwimmtechnik im gekr¨ ummten Weltraum gefunden (die aber zu ineffektiv ist um einem schwarzen Loch zu entkommen, siehe [AK]).
14.4.2
Anholonome Zwangsbedingungen
Reifen, Kugeln etc. rollen auf einer Oberfl¨ache ohne Schlupf, wenn sich deren Oberfl¨ache am Ber¨ uhrpunkt mit der Unterlage nicht bewegt. Dies f¨ uhrt zu in den Geschwindigkeiten linearen anholonomen Zwangsbedingungen. Beispielsweise k¨onnen wir mit einem Auto oder einem Fahrrad nicht seitw¨arts fahren, aber dennoch einparken. 14.22 Beispiel (Rollendes Rad) Wir betrachten ein senkrecht rollendes Rad (siehe den Artikel [BKMM] von Bloch, Krishnaprasad, Marsden und Murray). Besitzt dies den Radius r > 0, dann befindet sich die Radnabe am Punkt 2 x1 (x1 , x2 , r) u dem Ber¨ uhrpunkt ¨ber 0 3 (x1 , x2 , 0) ∈ R . Seine aktuelle Ori2 entierung im Raum wird durch einen Winkel θ beschrieben. Ein zweiter Winkel ϕ misst die Lage eines markierten Punktes, x3 etwa des Ventils, relativ zum Ber¨ uhrpunkt Θ mit dem Boden. Damit bewegt sich die 2 Radnabe 0 mit dem Geschwindigkeitsvektor x˙ = r cos(θ) ϕ˙ , r sin(θ) ϕ˙ parallel zur 2 x2 Unterlage 11 . Die durch das Abrollen definierte Distribution D ⊂ T Q im Ortsraum Q := R2x × Sθ1 × Sϕ1 ist also durch ˙ ϕ) ˙ r sin(θ)ϕ˙ (14.4.1) D(x, θ, ϕ) = (x, ˙ θ, ˙ ∈ R4 | x˙ = r cos(θ)ϕ, gegeben und offensichtlich in den Geschwindigkeiten linear. Sie ist zweidimensional und glatt. Sie wird (mit der Abk¨ urzung q := (x1 , x2 , θ, ϕ)) durch die Vektorfelder Xi : Q → T Q , X1 (q) := r cos(θ), r sin(θ), 0, 1 und X2 (q) := (0, 0, 1, 0) aufgespannt: Deren Kommutator ist [X1 , X2 ](q) = r sin(θ), −r cos(θ), 0, 0 , liegt also nicht in D(q). Nach dem Satz F.25 von Frobenius ist sie damit nicht integrabel. 11 Wir
unterschlagen ab jetzt die vertikale x3 –Komponente.
14. Starre und bewegliche K¨ orper
365
Wegen [X2 , [X1 , X2 ]](q) = r cos(θ), r sin(θ), 0, 0 = X1 (q) − (0, 0, 0, 1) spannen die Xi und diese beiden Kommutatoren sogar ganz T Q auf. Nach dem Satz von Chow 12 kann man also je zwei Punkte des Konfigurationsraumes Q durch einen glatten Weg c : [0, 1]→ Q verbinden, der horizontal ist, dessen Geschwindigkeitsvektor c(t) ˙ also in D c(t) liegt. Beispielsweise kann das Rad so vom Punkt A zum Punkt B der Ebene man¨ovriert werden, dass sein Ventil bei A und B in die gleiche Richtung zeigt. 3 Solche kinematischen Betrachtungen werden durch die der nichtholonomen Dynamik erg¨anzt. Dabei wird eine Lagrange–Funktion L : T Q → R auf die Distribution D ⊂ T Q restringiert, also LD := LD gesetzt. Ist n := dim(Q) und die Distribution vom Rang n − p, dann kann sie lokal als Nullstellenmenge von p unabh¨angigen Eins–Formen ω1 , . . . , ωp geschrieben werden. In lokalen Koordinaten q = (r, s) von Q mit s = (s1 , . . . , sp ), r = (r1 , . . . , rn−p ) ist ωa (r, s) = dsa +
n−p
Aa,α (r, s) drα
(a = 1, . . . , p).
(14.4.2)
α=1
Einsetzen ergibt (mit Summierung u ¨ber α) die Koordinatengestalt der restringierten Lagrange–Funktion: LD (r, s, r) ˙ = L r, s, r, ˙ −A ·,α (r, s) r˙α . Die Lagrange-d’Alembert–Bewegungsgleichungen entstehen durch Variation von zur Distribution tangentialen Kurven t → q(t), wobei auch die Variation δq(t) in D q(t) liegt. In lokalen Koordinaten besitzen diese Gleichungen die Gestalt ∂LD ∂L ∂LD d ∂LD − + Aa,α =− Ba,α,β r˙β dt ∂ r˙α ∂rα ∂sa ∂ s˙ a
(α = 1, . . . , n − p),
wobei B die Kr¨ ummung des durch A definierten Zusammenhangs ist, und daher oft magnetischer Term genannt wird. In Koordinaten ist B ·,α,β =
∂A ·,β ∂A ·,α ∂A ·,α ∂A ·,β − + Aa,α − Aa,β . ∂rβ ∂rα ∂sa ∂sa
14.23 Beispiel (Rollendes Rad) Das Rad aus Beispiel 14.22 besitze eine achsensymmetrische Massenverteilung mit Gesamtmasse m > 0. Eine Hauptachse seines Tr¨agheitstensors (14.2.3) stimmt dann mit der Radachse u ¨berein, und I˜ ist senkrecht dazu rotationssymmetrisch. Bezeichnen wir das zugeh¨orige Haupttr¨agheitsmoment mit I, und die beiden anderen mit J, dann hat die Lagrange– Funktion die Gestalt ˙ ϕ˙ = 1 m x
˙ 2 + I ϕ˙ 2 + J θ˙2 . L : T Q → R , L x, θ, ϕ, x, ˙ θ, 2 12 Satz (Chow): Wenn auf der zusammenh¨ angenden Mannigfaltigkeit Q eine Distribution durch Vektorfelder X1 , . . . , Xn aufgespannt wird, deren iterierte Kommutatoren ihrerseits ganz T Q aufspannen, dann gibt es f¨ ur alle q0 , q1 ∈ Q einen horizontalen Weg c ∈ C 1 [0, 1], Q mit c(i) = qi . Siehe Montgomery, [Mon1], Kapitel 2.
366
14.4. Bewegliche K¨orper, anholonome Systeme
Die Form der Distribution (14.4.1) legt es nahe, als die r–Koordinaten in (14.4.2) die Winkel zu benutzen. Die restringierte Lagrange–Funktion ist dann ˙ ϕ˙ = 1 (mr2 + I)ϕ˙ 2 + J θ˙2 . ˙ θ, LD x, θ, ϕ, x, 2 Werden als Indices von A die Variablennamen verwendet, dann ist Ax1 ,θ = Ax2 ,θ = 0 und Ax1 ,ϕ (x, θ, ϕ) = −r cos(θ), Ax2 ,ϕ (x, θ, ϕ) = −r sin(θ). Es folgt Bx1 ,θ,ϕ (x, θ, ϕ) = r sin(θ)
,
Bx2 ,θ,ϕ (x, θ, ϕ) = −r cos(θ).
Die Bewegungsgleichungen sind damit ˙ osung ϕ(t) = ϕ(0)+ϕ(0)t ˙ , θ(t) = θ(0)+θ(0)t. (mr 2 +I)ϕ¨ = 0 , J θ¨ = 0 , mit L¨ ˙ Das Rad durchl¨auft also gleichf¨ ormig je nach Anfangsbedingung θ(0) einen Kreis oder eine Gerade in der Ebene. 3 W¨ahrend die Bewegungsform des Rades auch erraten werden k¨onnte und nicht aus dem Rahmen der hamiltonschen Mechanik herausf¨allt, zeigen sich schon bei wenig komplizierteren anholonomen Systemen ungewohnte Ph¨anomene: • Das Phasenraumvolumen muss nicht mehr erhalten sein, obwohl keine Reibung vorliegt. Dieses Ph¨anomen kann zu asymptotischer Stabilit¨at f¨ uhren. Sie ist etwa von Einkaufswagen bekannt, die sich in freier Fahrt so orientieren, dass die Griffe nach vorn zeigen. • Eine Poisson–Klammer erf¨ ullt im Gegensatz zum symplektischen Fall nicht immer die Jacobi–Identit¨at. • Kontinuierliche Symmetrien m¨ ussen im Gegensatz zum Satz von Noether nicht zu Erhaltungsgr¨ oßen f¨ uhren. 14.24 Weiterf¨ uhrende Literatur Bloch, Marsden und Zenkov stellen in [BMZ] solche F¨alle vor und geben einen Literatur¨ uberblick. 3
Kapitel 15
St¨ orungstheorie
Die Saturn-Ringe, 2005 von der Raumsonde Cassini aufgenommen
15.1 15.2 15.3 15.4 15.5 15.6
Bedingt-periodische Bewegung des Torus . . ¨ Storungstheorie fur ¨ eine Winkelvariable . . . . ¨ Hamiltonsche Storungstheorie erster Ordnung KAM-Theorie . . . . . . . . . . . . . . . . . . Diophantische Bedingung und Kettenbruche ¨ . Cantori: Am Beispiel der Standardabbildung .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. 368 . 376 . 379 . 387 . 403 . 408
In der St¨orungstheorie betrachtet man dynamische Systeme, deren L¨osung zwar nicht explizit bekannt ist, die aber durch Vergleich mit der bekannten L¨osung eines anderen dynamischen Systems auf dem gleichen Phasenraums kontrolliert werden kann. Im hamiltonschen Fall ist diese N¨aherung besonders pr¨azis. Im Extremfall sehr irrationaler Frequenzverh¨altnisse ist sie f¨ur alle Zeiten g¨ ultig. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 15,
367
368
15.1
15.1. Bedingt-periodische Bewegung des Torus
Bedingt-periodische Bewegung des Torus
Je n’avais pas besoin de cette hypoth`ese-l`a.” (Pierre-Simon Laplace) 1 ” Nicht alle hamiltonschen Systeme sind integrabel. F¨ ur n ≥ 2 Freiheitsgrade ist Nichtintegrabilit¨at sogar in einem pr¨azisen Sinn typisch (generisch im Sinn von Bemerkung 2.44.2), siehe Markus und Meyer [MaMe]. In nicht integrablen Systemen findet die Bewegung in der (2n−1)–dimensionalen Energieschale f¨ ur ein positives Liouville–Maß von Anfangsbedingungen nicht auf n–dimensionalen Lagrange–Tori statt und kann sehr verwickelt (,chaotisch’) aussehen. Um das Langzeitverhalten der Orbits zu beschreiben, mussten ganz neue Begriffe entwickelt werden, wie zum Beispiel die der in Kapitel 9 besprochenen Ergodentheorie. Wir wenden wir jetzt stattdessen Systemen zu, die beinahe integrabel sind, in denen die Hamilton–Funktion also die Form Hε (I, ϕ) = H0 (I) + εH1 (I, ϕ), |ε| klein, besitzt. Ziel ist zun¨achst die Beschreibung der Orbits f¨ ur nicht allzu lange Zeiten. Wir schauen uns also Differentialgleichungssysteme der Form 0 + εfk (I, ϕ) I˙k = k ∈ {1, . . . , m} (15.1.1) l ∈ {1, . . . , n} ϕ˙ l = ωl (I) + εgl (I, ϕ) auf einem Phasenraum der Form G×Tn an, mit G ⊆ Rm offen. Verallgemeinernd setzen wir also nicht voraus, dass das System hamiltonsch ist. Es braucht auch nicht gleich viele Winkel- wie Wirkungsvariablen zu geben. Es ist in diesem Zusammenhang besser, von langsamen (I)–Variablen und schnellen (ϕ)–Variablen zu sprechen, denn offensichtlich gilt allgemein f¨ ur jedes ε–unabh¨angige T > 0 :
I(t) − I(0) = O(ε) und ϕ(t) − ϕ(0) = O(1) |t| ≤ T . Es ist sinnvoll, sich den Phasenraum als B¨ undel G × Tn u ¨ber der Basis G mit dem Torus Tn als Faser vorzustellen. In G findet dann nur die langsame Drift der I–Variablen statt, siehe nebenstehende Zeichnung. In vielen F¨allen interessiert uns haupts¨achlich die zeitliche Entwicklung der langsamen Variablen I. Um diese zu untersuchen, wenden wir aus der Ergodentheorie (Kapitel 9.4) bekannte Begriffe auf (15.1.1) an:
I(0), ϕ(0)
I(t), ϕ(t)
G × Tn
G I(0)
I(t)
Schnelle und langsame Variablen
1 (Diese Hypothese ben¨ otigte ich nicht). Als Antwort auf die Frage Napoleons, warum in seinem (u.A. die St¨ orungstheorie mitbegr¨ undenden) Buch M´ ecanique C´ eleste Gott nicht vorkam. Nach W. Rouse Ball: A short account of the history of mathematics, 4. Auflage (1908), S. 418
15. St¨orungstheorie
369
15.1 Definition • Das Raummittel einer integrablen Funktion h : G×Tn → R ist die Funktion dϕ h(I, ϕ) . h : G → R , h(I) = n (2π) n T • Das Zeitmittel von h bez¨ uglich ω : G → Rn ist die Funktion h∗ : G × Tn → R
1 T →∞ T
, h∗ (I, ϕ) = lim
T
h I, ϕ + ω(I)t dt.
0
Wir bezeichnen die L¨ osung von (15.1.1) zu vorgegebenen Anfangsbedingungen x0 = (I0 , ϕ0 ) mit t → Iε (t, x0 ). Das Mittelungsprinzip besteht nun darin, diese mit der L¨osung t → Jε (t, x0 ) einer einfacheren Differentialgleichung, des sogenannten gemittelten Systems J˙k = ε fk (J)
(k = 1, . . . , m)
mit Anfangswert Jε (0, x0 ) := I0 zu vergleichen. Die ε–Abh¨angigkeit des gemittelten Systems ist simpel: Jε (t, x0 ) = J1 (ε t, x0 ). Unter bestimmten Umst¨anden ist die Differenz Iε (t, x0 )−Jε (t, x0 ) f¨ ur eine lange Zeitspanne klein. 15.2 Beispiel (Mittelungsprinzip) F¨ ur f : R × S 1 → R, f (I, ϕ) := 1 + cos ϕ und ω ∈ R \ {0} sei I˙ = εf (I, ϕ)
,
I,J
ϕ˙ = ω
It
(also g ≡ 0 in (15.1.1)). Die L¨ osung des Anfangswertproblems ist ε Iε (t, x0 ) = I0 + εt + sin(ωt + ϕ0 ) ω ϕε (t, x0 ) = ϕ0 + ωt.
Jt I0
Das gemittelte ,System’ (in Wahrheit haben wir nur noch eine Variable) ist J˙ = εf (J) = ε
t
, also Jε (t, x0 ) = I0 + εt.
In diesem Fall gilt also gleichm¨aßig in den Zeiten t ∈ R und den Anfangswerten x0 ε |Iε (t, x0 ) − Jε (t, x0 )| ≤ = O(ε), ω siehe Abbildung 15.2. Allerdings, und das ist typisch, divergiert der Abstand f¨ ur ω → 0. 3
370
15.1. Bedingt-periodische Bewegung des Torus
Nat¨ urlich k¨onnen wir in diesem einfachen Beispiel das Differentialgleichungssystem durch Quadraturen l¨ osen, sodass wir auf eine N¨aherungsl¨osung nicht angewiesen sind. Trotzdem zeigt uns das Beispiel, worauf es ankommt. Zwar oszilliert die langsame Variable I wegen der ϕ–Abh¨angigkeit von f ,schnell’, mit der Schwankungsbreite O(ε). Zur einer langfristigen Ver¨anderung von f tr¨agt aber nur das Raummittel f = 1 von f bei. Dieses entspricht hier exakt dem Zeitmittel 1 T 1 T 1 + cos(ϕ0 + ωt) dt f Iε (t, x0 ), ϕε (t, x0 ) dt = lim lim T →∞ T 0 T →∞ T 0 sin(ϕ0 + ωT ) − sin(ϕ0 ) 1 T+ = 1. = lim T →∞ T ω Wenn im allgemeinen Fall Raummittel und Zeitmittel von f u ¨bereinstimmen w¨ urden, w¨aren wir sicher, dass das Mittelungsprinzip uns eine gute N¨aherung f¨ ur die Evolution der langsamen Variablen liefern w¨ urde (vorausgesetzt gen¨ ugend schnelle Konvergenz des Zeitmittels). Dies ist aber leider nicht immer der Fall: 15.3 Beispiel (Scheitern des Mittelungsprinzips) Auf dem Phasenraum R2 × T2 betrachten wir die Differentialgleichung I˙1 = −ε sin(ϕ1 − 2ϕ2 ), I˙2 = ε cos(ϕ1 − 2ϕ2 ) + sin ϕ2 , ϕ˙ 1 = 2, ϕ˙ 2 = 1 + I1 . Das gemittelte System ist also J˙1 = J˙2 = 0.
I,J
I2t
F¨ ur die Anfangswerte mit ϕ1 (0) = ϕ2 (0) = 0 und I1 (0) = 0 bezeichnen wir die L¨ osung einfach mit (I, ϕ):
I20
J2t t
ϕ1 (t) = 2t , ϕ2 (t) = t I1 (t) = 0 , I2 (t) = I2 (0) + ε t − cos(t) + 1 . Im Gegensatz zu den langsamen Variablen bleiben die gemittelten Variablen konstant: J1 (t) = I1 (0) = 0 und J2 (t) = I2 (0). Im Limes großer Zeiten |t| ist damit I(t) − J(t) = ε|t − cos(t) + 1| ∼ ε|t|, siehe Abbildung. Hier f¨ uhrt also die Anwendung des Mittelungsprinzips nicht zu einer guten Ann¨aherung der Wirkungen Ik durch die gemittelten Wirkungen Jk , zumindest nicht f¨ ur die angegebenen Anfangsbedingungen. 3 Wenn wir nach Kriterien suchen, unter denen wir das Mittelungsprinzip erfolgreich anwenden k¨ onnen, m¨ ussen wir analysieren, warum im zweiten Beispiel die
15. St¨orungstheorie
371
ur t = O(1/ε) nur von der Ordnung 1, also Differenz zwischen I2 und J2 schon f¨ groß ist. Wir betrachten dazu die in Beispiel 15.3 auftretende Bewegung ϕ1 (t) = 2t
,
ϕ2 (t) = t
auf dem Torus T2 . Diese Bewegung ist 2π–periodisch, siehe Abbildung 15.1.1.
0
=
Π
2Π 2Π
2
Π
1
0
Abbildung 15.1.1: 2π–periodische Bewegung auf T2 Wir k¨onnen also nicht erwarten, dass Raummittel und Zeitmittel einer Funktion f auf T2 gleich sind. Insbesondere ist f¨ ur den Koeffizienten f := f2 des Differentialgleichungssystems (mit f2 (I, ϕ) = cos(ϕ1 − 2ϕ2 ) + sin ϕ2 ) f2 (I) ≡ 0, aber 1 t→∞ T
lim
T
f2 I, ϕ(t) dt = 1.
0
Wir m¨ ussen also zun¨achst nach Kriterien suchen, die Gleichheit von Raum- und Zeitmittel einer Bewegung auf dem Torus erzwingen. 15.4 Definition • Es seien ϕ = (ϕ1 , . . . , ϕn ) Winkelkoordinaten auf dem Torus Tn . Dann heißt f¨ ur ω = (ω1 , . . . , ωn ) ∈ Rn der vom verschiebungsinvarianten Vektorfeld ϕ → ω erzeugte Fluss Φ : R × Tn → Tn bedingt-periodische Bewegung. • Die ωl ∈ R heißen die Frequenzen der bedingt-periodischen Bewegung. • Sie heißen (rational) unabh¨ angig, falls f¨ ur k ∈ Zn nur dann k, ω = 0 gilt, wenn k = 0. 15.5 Aufgabe (Bedingt-periodische Bewegung) Wie oft treffen sich Stunden- und Minutenzeiger innerhalb eines Tages?
3
372
15.1. Bedingt-periodische Bewegung des Torus
Der Begriff der rationalen Unabh¨angigkeit spielte schon beim harmonischen Oszillator eine Rolle, siehe Definition 6.31. Offensichtlich ist der Fluss auf Tn (mod 2π) gleich Φt ϕ(0) ≡ ϕ(t) = ϕ1 (t), . . . , ϕn (t) = ϕ1 (0) + ω1 t, . . . , ϕn (0) + ωn t . (15.1.2) In Satz 5 von [Wey] stellte Hermann Weyl 1916 sinngem¨aß folgendes fest: 15.6 Satz (Weyl) • F¨ ur stetige Funktionen f : Tn → C existieren Raum- und Zeitmittel des bedingt-periodischen Flusses. • Falls die Frequenzen ωl rational unabh¨angig sind, sind sogar Raum- und Zeitmittel beschr¨ankter Riemann-integrabler 2 Funktionen gleich, es gilt also f ∗ (ϕ) = f
(ϕ ∈ Tn ).
Der Beweis dieses Satzes wird am Ende dieses Kapitels nachgeliefert. 15.7 Bemerkung (Unabh¨ angigkeit) Ist n = 1 wie in unserem ersten Beispiel 15.2, so ist die Unabh¨angigkeit von ω gleichbedeutend mit ω = 0. Diese Bedingung ist in Beispiel 15.2 erf¨ ullt. Ist dagegen n = 2 wie in Beispiel (15.3), dann ist die Unabh¨angigkeit von ω1 und ω2 gleichbedeutend damit, dass ω2 = 0 und ω1 /ω2 ∈ Q. Diese Bedingung 3 ist in Beispiel 15.3 f¨ ur I1 (0) = 0 verletzt, denn dann ist ω1 /ω2 = 2. 15.8 Korollar (Unabh¨ angigkeit) Falls die Frequenzen unabh¨angig sind, • ist jede L¨osung t → ϕ(t, ϕ0 ) auf Tn gleichverteilt. Das heißt: F¨ ur jede jordan–messbare 3 Menge U ⊆ Tn ist deren mittlere Aufenthaltszeit in T U , also limT →∞ T −1 0 1lU ϕ(t, ϕ0 ) dt gleich dem Haar–Maß von U . • Insbesondere ist jeder Orbit auf Tn dicht. Beweis: • F¨ ur die Riemann-integrable charakteristische Funktion 1lU gilt nach Satz 15.6 T λn (U ) λn (U ) −1 1lU ϕ(t, ϕ0 ) dt = 1l∗U (ϕ0 ) = 1lU = n n = . lim T T →∞ λ (T ) (2π)n 0 n • Sonst existierte eine ε–Umgebung U ⊂ T eines Punktes mit ϕ(R) ∩ U = ∅, 2 also 1lU > 1l∗U ϕ(0) = 0.
15.9 Bemerkung (Eindeutige Ergodizit¨ at) Aus dem Satz 9.14 von Koopman folgt (mit einem Approximationsargument) f¨ ur unabh¨angige Frequenzen, dass die 2 Eine entsprechende Aussage gilt nicht f¨ ur jede Lebesgue-integrable Funktion. Insbesondere ist f¨ ur n ≥ 2 jeder Orbit O := Φ(R, ϕ) ⊂ Tn eine Lebesgue-messbare Teilmenge mit Maß 0, aber 1l∗O (ϕ) = 1. 3 Das heißt, es wird angenommen, dass die Lebesgue–Maße des Inneren und des Abschlusses von U gleich sind.
15. St¨orungstheorie
373
bedingt-periodische Bewegung f¨ ur das Haar–Maß ergodisch ist. Aus der Ergodizit¨at allein k¨onnte man mit dem birkhoffschen Ergodensatz 9.32 folgern, dass f¨ ur λn –fast alle Anfangswerte ϕ0 ∈ Tn das Zeitmittel gleich dem Raummittel ist. Der Satz von Weyl ist aber st¨arker, denn er gilt f¨ ur alle Anfangsbedingungen. Der Unterschied ist wichtig, denn Ausnahmemengen von Anfangsbedingungen w¨ urden eine in ϕ0 gleichm¨aßige Konvergenz des Ces`aro–Mittels in der Zeit, also T von T → T −1 0 1lU ϕ(t, ϕ0 ) dt, gegen das Raummittel verhindern. Die zugrundeliegende starke Eigenschaft der Dynamik, nur ein invariantes Borel–Wahrscheinlichkeitsmaß zu besitzen, nennt man eindeutige Ergodizit¨at. Solche Maße sind dann insbesondere ergodisch (warum?). 3 In Umkehrung des Satzes 15.6 ist rationale Unabh¨angigkeit eine notwendige Voraussetzung f¨ ur die Ergodizit¨at des bedingt-periodischen Flusses: 15.10 Lemma Wenn es einen Gittervektor k ∈ Zn \ {0} mit k, ω = 0 gibt, dann existiert ein stetiges f : Tn → C mit nicht konstantem Zeitmittel f ∗ . Beweis: Setze f (ϕ) := exp(i k, ϕ). Dann existiert das Zeitmittel f ∗ (ϕ), denn 1 T →∞ T
lim
T 0
f (ϕ + ωt) dt
= =
T lim T1 0 exp(i k, ϕ + ωt) dt T →∞ 1 T exp(i k, ϕ) dt = f (ϕ). T 0
Die nicht konstante Funktion f ist also gleich ihrem Zeitmittel f ∗ .
2
Beweis des Satzes 15.6 (Satz von Weyl): • Das Raummittel existiert wegen der Integrabilit¨at von f . • Um die Existenz des Zeitmittels nachzuweisen und im Fall rationaler Unabh¨angigkeit zu zeigen, dass es gleich dem Raummittel ist, beginnen wir mit einfachen Funktionen f : 1. Ist f konstant, dann sind Raum- und Zeitmittel gleich der Konstante. Ist f (ϕ) := exp(i k, ϕ) f¨ ur ein k ∈ Zn \ {0}, und k, ω = 0, dann existiert nach dem Beweis von Lemma 15.10 das Zeitmittel. Auch f¨ ur k, ω = 0 existiert das Zeitmittel von f und ist dann gleich dem Raummittel: 1 T exp(i k, ϕ + ωt) dt f ∗ (ϕ) = lim T →∞ T 0 =
1 eik,ϕT − 1 = 0. T →∞ T i k, ϕ
exp(i k, ϕ) lim
Wegen der Linearit¨at des Integrals folgt damit die Aussage des Satzes f¨ ur die endlichen Linearkombinationen, also die trigonometrischen Polynome. 2. Wir betrachten nun stetige Funktionen f : Tn → C. Wegen der Linearit¨at des Integrals ist ohne Einschr¨ankung f reellwertig. Nach dem Weierstraßschen Approximationssatz gibt es f¨ ur alle ε > 0 ein trigonometrisches Polynom
374
15.1. Bedingt-periodische Bewegung des Torus
¨ von p zu 12 (p + p¯) erreichen p : Tn → C mit |f − p| < 12 ε. Durch Ubergang wir, dass auch p reellwertig ist. Damit ist 1 lim sup T →∞ T = ≤
T
f (t) dt − lim inf 0
1 lim sup T →∞ T ε ε + = ε. 2 2
T →∞
T
1 T
0
T
f (t) dt
∗
f (t) dt − p (ϕ)
−
0
1 lim inf T →∞ T
T
∗
f (t) dt − p (ϕ) 0
Der Zeitlimes existiert also. Auch die Gleichheit der beiden Mittel f¨ ur unabh¨angige ω ∈ Rn u ¨bertr¨agt sich von den trigonometrischen Polynomen auf die stetigen Funktionen. 3. Endlich sind wir bei den beschr¨ankten Riemann-integrablen Funktionen f : Tn → R angelangt. Diese k¨ onnen wir zwar nicht punktweise, aber in der Integralnorm durch stetige Funktionen approximieren. Nach Definition des Riemann–Integrals von f gibt es f¨ ur jedes ε > 0 Trep−n (g2 − g1 ) dϕ < 14 ε. penfunktionen g1 ≤ f ≤ g2 mit (2π) −n Weiter gibt es stetige Funktionen f1 ≤ g1 und f2 ≥ g2 mit (2π) |fk − gk | dϕ < 14 ε. Dies folgt aus der entsprechenden Aussage f¨ ur die charakteristiur ϕ ∈ Tn sche Funktion g = 1lQ eines Quaders Q: Man setze f¨ f1 (ϕ) := min c dist(ϕ, Tn − Q), 1
,
f2 (ϕ) := max 1 − c dist(ϕ, Q), 0
mit c > 0. Dann ist f1 ≤ g ≤ f2 . W¨ahle nun c gen¨ ugend groß. F¨ ur stetige fk haben wir die Existenz der Zeitmittel fk∗ gezeigt. Wir nehmen an, dass der Frequenzvektor ω ∈ Rn rational unabh¨angig ist. Also gilt fk∗ = fk . Wegen f1 < f < f2 ist | f − fk | < ε. Also existiert auch das Zeitmittel von f und ist gleich f . 2
Exkurs: Der Virialsatz Raummittel und Zeitmittel spezieller Phasenraumfunktionen kann man in viel allgemeineren Situationen berechnen. Wir betrachten dazu zun¨achst ganz allgemein ur die die Energieschale eine glatte Hamilton–Funktion H : R2n → R, f¨ ΣE := {x ∈ R2n | H(x) = E} f¨ ur den Wert E der Energie kompakt ist. F¨ ur eine beliebige Funktion f ∈ C ∞ (R2n , R) ist dann das Zeitmittel von {f, H} ∈ C ∞ R2n , R
15. St¨orungstheorie
375
auf ΣE Null. Denn wenn Φ den von H erzeugten Fluss bezeichnet, dann ist d f ◦ Φt |t=0 , und damit das Zeitmittel f¨ ur x ∈ ΣE wegen der Be{f, H} = dt schr¨anktheit von f |ΣE gleich 1 T f ◦ ΦT (x) − f (x) ∗ = 0. {f, H} (x) = lim {f, H} ◦ Φt (x) dt = lim T →∞ T 0 T →∞ T
15.11 Beispiele (Virialsatz) Wir schauen uns den Fall der Hamilton–Funktion H(p, q) := T (p) + V (q) mit kinetischer Energie T (p) := 12 p 2 an (und setzen immer voraus, dass die Energieschale ΣE kompakt ist). 1. F¨ ur die Impulskomponenten f (p, q) := pi , i = 1, . . . , n ergibt sich: Das Zeitmittel der auf den Massenpunkt wirkenden Kraft −∇V (q) verschwindet. 2. Die analoge Aussage f¨ ur die Ortskomponenten qi , i = 1, . . . , n ist: Das Zeitmittel des Impulses (der hier gleich der Geschwindigkeit ist) ist Null. F¨ ur die relativistische Bewegung mit kinetischer Energie T (p) := 1 + p 2 verschwindet dagegen nur das Zeitmittel der Geschwindigkeit, nicht des Impulses. 3. Wieder im nichtrelativistischen Fall (T (p) = Funktion der Dilatation f (p, q) := p, q
1 2 2 p )
ist f¨ ur die Hamilton–
{f, H}(p, q) = 2 T (p) − q, ∇V (q) . Der zweite Term hat nun zun¨achst keine anschauliche Interpretation. Setzen wir aber das Potential als homogenes Polynom k–ten Grades in den qi (mit geradem k) an, so erhalten wir in Multiindex-Notation V (q) =
cα q α
, ql
α∈Nn 0 ,|α|=k
∂ V (q) = ∂ql
αl cα q α
α∈Nn 0 ,|α|=k
also q, ∇V (q) = k V (q). Damit ergibt sich also f¨ ur die Zeitmittel von potentieller und kinetischer Energie (die nach dem birkhoffschen Ergodensatz Satz 9.32 fast u ¨berall auf ΣE existieren): k V ∗ (x) = 2 T ∗ (x), oder auch T ∗ (x) =
k H(x) k+2
, V ∗ (x) =
2 H(x). k+2
Ganz analog argumentiert man auch f¨ ur den Fall eines homogenen Zentralpotentials V (q) = q C , insbesondere f¨ ur C = −1, das heißt die Kepler– Bewegung. Dort ist also T ∗ (x) = −H(x) und V ∗ (x) = 2H(x) < 0. (Man 3 beachte, dass T ∗ und V ∗ von allen Phasenraumvariablen abh¨angen!)
376
15.2. St¨ orungstheorie f¨ ur eine Winkelvariable
Der Virialsatz hat in der statistischen Mechanik Bedeutung. Dort stellt sich n¨amlich die Frage, wie sich die Gesamtenergie auf die verschiedenen Freiheitsgrade verteilt. 15.12 Aufgabe (Virialsatz f¨ ur Raummittel) Es sei E regul¨arer Wert der Hamilton–Funktion H ∈ C 2 (Rnp × Rnq , R). λE bezeichne das Liouville-Maß auf der als kompakt angenommenen Energieschale ΣE , mit Normierung λE (ΣE ) = 1 eines Wahrscheinlichkeitsmaßes. Wir setzen gE := ΣE g dλE . (a) Beweisen Sie den ur Raummittel: F¨ ur beliebige Phasenraumfunk Virialsatzf¨ tionen f ∈ C 2 Rnp × Rnq , R gilt {f, H} E = 0. ¨ (b) Ubertragen Sie die Beispiele 15.11 in ihre Varianten f¨ ur Raummittel. (c) Im Zusammenhang mit der Zustandsgleichung des realen Gases bezeichnen wir f¨ ur N ∈ N Teilchen mit Konfigurationsraum Rnq = R3N deren Orte mit q = (q1 , . . . , qN ). Die Hamilton–Funktion sei H(p, q) :=
N
2 1 2 pj
j=1
+ Uj (qj ) +
N
Wj,k (qj − qk )
k=j+1
(p, q) ∈ Rnp × Rnq , mit Potentialen Uj , Wj,k : Rn → R.
Was besagt der Virialsatz f¨ ur f (p, q) := p, q? (d) Der Container, in dem sich die Teilchen aufhalten, sei nun ein glatt berandeter kompakter Abschluss G ⊂ R3 eines Gebiets. Die Hamilton–Funktion sei jetzt vereinfacht:
N Hλ (p, q) := j=1 12 pj 2 + λU (qj ) (p, q) ∈ Rnp × Rnq , λ > 0 , mit Container-Potential U (q) := dist(q, G)2
, f¨ ur dist(q, G) = min{ q − Q | Q ∈ G}.
Wie erhalten wir im Limes λ → ∞ die Zustandsgleichung des idealen Gases P V = 23 T E mit Druck P , Volumen V von G und kinetischer Energie T ? Tipps: Untersuchen Sie zun¨achst die Differenzierbarkeitseigenschaften von U , insbesondere in der N¨ahe von ∂G. Erinnern Sie sich an die physikalische Definition des Drucks, und benutzen Sie den Satz B.39 von Stokes. 3
15.2
St¨ orungstheorie f¨ ur eine Winkelvariable
Bevor wir hamiltonsche Systeme betrachten, untersuchen wir die St¨orungstheorie in einem Fall, in dem das Mittelungsprinzip besonders gut anwendbar ist. Die gest¨orte Differentialgleichung auf dem Phasenraum G × S 1 , G ⊆ Rm offen, sei I˙ = εg(I, ϕ)
, ϕ˙ = ω(I) + εf (I, ϕ),
(15.2.1)
15. St¨orungstheorie
377
mit ω, f ∈ C 1 (G × S 1 , R) und g ∈ C 1 (G × S 1 , Rm ). Das gemittelte System ist also J˙ = εg(J). (15.2.2) Wir bezeichnen mit t → Iε (t), ϕε (t) die eindeutige L¨osung des gest¨orten und mit t → Jε (t) die des gemittelten Systems mit Anfangsbedingung I(0) = J(0) = I0 , ϕ(0) = ϕ0 . Da die Variation g˜(I, ϕ) := g(I, ϕ) − g (I)
(15.2.3)
von g im Allgemeinen nicht verschwindet, w¨ urde man vielleicht erwarten, dass sich nur f¨ ur Zeiten t der Ordnung O(ε0 ) = O(1) gemitteltes und ungemitteltes System nur um O(ε) unterscheiden. Dies ist aber nicht der Fall. 15.13 Satz (St¨ orungstheorie f¨ ur eine Winkelvariable, erste Ordnung) 1. Die Frequenzfunktion ω in (15.2.1) nehme den Wert Null nicht an. 2. F¨ ur den Anfangswert (I0 , ϕ0 ) ∈ G×S 1 und eine kompakte Teilmenge Gk ⊂ G habe das Anfangswertproblem des gemittelten Systems (15.2.2) L¨osungen Jε : [0, 1/ε] → Gk 0 < ε ≤ ε0 . Dann liegen f¨ ur kleine ε die wahre und die gemittelte L¨osung lange nahe beieinander: sup Iε (t) − Jε (t) = O(ε) 0 < ε ≤ ε0 . 0≤t≤1/ε
Beweis: Wir lassen im Beweis die Indices ε wieder weg. • Der Ansatz des Beweises besteht darin, neue langsam ver¨anderliche Koordinaten ˜ ϕ) := I + εK(I, ϕ) I(I, (15.2.4) einzuf¨ uhren, in denen die winkelabh¨angige St¨ orung nur noch von der Ordnung ε2 ist. Eine St¨orung dieser Gr¨ oße k¨ onnen wir dann u ¨ber die Zeitspanne 1/ε integrieren und erhalten eine Maximalabweichung vom ungest¨orten System von der Ordnung ε. Zur Bestimmung des Koordinatenwechsels setzen wir den Ansatz (15.2.4) in die Differentialgleichung (15.2.1) ein und erhalten & % ˜˙ I˙ + ε D1 K(I, ϕ)I˙ + D2 K(I, ϕ)ϕ˙ =ε [g(I, ϕ) + D2 K(I, ϕ)ω(I)] + ε2 R(I, ϕ) I= (15.2.5) mit dem Restterm R(I, ϕ) := D1 K(I, ϕ)g(I, ϕ) + D2 K(I, ϕ)f (I, ϕ). • Wir w¨ahlen nun, um die Klammer in (15.2.5) ϕ–unabh¨angig zu machen, ϕ 1 K(I, ϕ) := − (15.2.6) g˜(I, ψ) dψ (I, ϕ) ∈ Gk × S 1 , ω(I) 0
378
15.2. St¨ orungstheorie f¨ ur eine Winkelvariable
mit g˜ aus (15.2.3). Dies ist wegen der Voraussetzung ω(I) = 0 m¨oglich. Wegen ˜ g (I) = 0 ist K tats¨achlich 2π–periodisch in ϕ. • Da Gk positiven Abstand zu Rm \ G besitzt, liegt sogar eine abgeschlossene δ–Umgebung von Gk in G. Diese ebenfalls kompakte Umgebung benennen wir wieder mit Gk . Wegen der Kompaktheit von Gk ist K ∈ C 1 (Gk × S 1 , Rm ) zusammen mit seiner Ableitung beschr¨ankt. Entsprechend ist R ∈ C 0 (Gk ×S 1 , Rm ) beschr¨ankt. Die Klammer in (15.2.5) ist mit (15.2.6) gleich g (I). • Weiter folgern wir, dass wir f¨ ur kleine ε (15.2.4) nach I aufl¨osen k¨onnen, und ˜ ϕ) ebenfalls zusammen mit ihrer Ableitung dass die urspr¨ ungliche Wirkung I(I, ˜ ϕ), ϕ | (I, ϕ) ∈ Gk × S 1 ist f¨ ur beschr¨ankt ist. Ihr Definitionsbereich I(I, kleine ε > 0 in G × S 1 enthalten. Die Differentialgleichung ˜ + ε2 R(I, ϕ) + ε g (I) − g (I) ˜ I˜˙ = ε g (I) + ε2 R(I, ϕ) = ε g (I) von I˜ vergleichen wir mit der f¨ ur die gemittelte Variable. F¨ ur ΔI := I˜ − J ist ˜ mit (15.2.4) der Anfangswert ΔI(0) = I(0) − I(0) = O(ε) und d ˜ ˜ − g (J) + ε2 R(I, ϕ) + ε g (I) − g (I) ΔI = ε g (I) dt ˜ + = ε D g (J) · ΔI + ε2 R(I, ϕ) + ε g (I) − g (I) ˜ − g (J) − D g (J) · ΔI . ε g (I) Da g ∈ C 1 (G × S 1 , Rm ), ist nach der Taylor–Formel der letzte Term von der Ordnung o(ε2 ), falls ΔI = O(ε). Dies setzen wir nun f¨ ur das Zeitintervall [0, 1/ε] voraus und u ufen die Konsistenz dieser Annahme. ¨berpr¨ • ΔI erf¨ ullt die Integralgleichung t% & ˜ ε) ds, εD ˜ g J(s) · ΔI(s) + R(s, (15.2.7) ΔI(t) = ΔI(0) + 0
wobei nach Voraussetzung ˜ ˜ ˜ ˜ ε) := ε2 R I I(s), ϕ(s) , ϕ(s) + ε g I I(s), ϕ(s) , ϕ(s) − g I(s) R(s, ˜ +ε g I(s) − g J(s) − D g J(s) · ΔI(s) von der Ordnung O(ε2 ) ist. Wir sch¨atzen ΔI mithilfe von (15.2.7) ab und setzen dazu in der Voraussetzung (3.6.2) des Gronwall–Lemmas (Satz 3.42) F := ΔI , a := ΔI(0) +
˜ R(s, ε) ds und G := ε D g .
1/ε
0
Falls die L¨osung t → I(t) in Gk bleibt (was f¨ ur F (t) ≤ δ sichergestellt ist), nimmt die Gronwall–Ungleichung (3.6.3) die Form F (t) ≤ c1 ε exp(c2 ε t)
(0 ≤ t ≤ 1/ε)
15. St¨orungstheorie
379
an. Das w¨are konsistent mit unserer Annahme ΔI = O(ε). Wir k¨onnen die Maximalgr¨ oße ε0 der St¨ orung so klein w¨ahlen, dass c1 ε0 exp(c2 ) < 12 δ
und ε0
sup (I,ϕ)∈Gk
×S 1
K(I, ϕ) < 12 δ,
also I(t) − J(t) < δ ist und somit f¨ ur 0 ≤ t ≤ 1/ε wirklich I(t) ∈ Gk gilt. 2 Das Verfahren l¨aßt sich bei h¨ oherer Differenzierbarkeit von ω, f und g iterieren, und liefert unter g¨ unstigen Umst¨anden in n-ter Ordnung eine Kontrolle der L¨osung im Zeitintervall [0, 1/εn ].
15.3 Hamiltonsche St¨ orungstheorie erster Ordnung Ob ich die Mathematik auf ein Paar Dreckklumpen anwende, die wir Planeten ” nennen, oder auf rein arithmetische Probleme, es bleibt sich gleich, die letztern haben nur noch einen h¨ohern Reiz f¨ ur mich.” (Carl Friedrich Gauss) 4 Wir betrachten ein hamiltonsches System mit Hamilton–Funktion Hε (I, ϕ) := H0 (I) + εH1 (I, ϕ)
(15.3.1)
auf dem Phasenraum G × Tn , G ⊂ Rn offen und beschr¨ankt, und mit St¨orparameter |ε| < ε0 . Die Differentialgleichungen sind also I˙ = −ε D2 H1 (I, ϕ)
, ϕ˙ = ω(I) + ε D1 H1 (I, ϕ)
mit Frequenzvektor ω := DH0 : G → Rn . Das gemittelte System ist trivial: J˙ = 0. F¨ ur n = 1 Freiheitsgrad k¨onnen wir daher Satz 15.13 des letzten Abschnitts anwenden, falls die Rotationsfrequenz nicht verschwindet. Wir erhalten dann die Aussage I(t) = I(0) + O(ε)
(0 ≤ t ≤ 1/ε).
F¨ ur n > 1 Freiheitsgrade suchen wir eine kanonische Transformation ˜ ϕ), ˜ Tε : (I, ϕ) −→ (I, die die Winkelabh¨angigkeit der Differentialgleichung bis auf einen Term der Ordnung ε2 eliminiert. Dazu benutzen wir die Methode der erzeugenden Funktion, setzen also an ˜ ϕ) I = I˜ + ε D2 S(I,
,
˜ ϕ). ϕ˜ = ϕ + ε D1 S(I,
(15.3.2)
4 nach W. Sartorius v. Waltershausen: Gauss zum Ged¨ achtniss. 1856, Neudruck 1965, S. 101/102.
380
15.3. Hamiltonsche St¨orungstheorie erster Ordnung
Einsetzen in die Hamilton–Funktion ergibt mit Kε ◦ Tε = Hε formal ˜ ϕ) ˜ ϕ(I, ˜ ϕ) ˜ ϕ(I, ˜ ϕ) (15.3.3) ˜ = Hε I˜ + ε D2 S I, ˜ , ϕ˜ − ε D1 S I, ˜ Kε (I, %) & * ˜ + ε DH0 (I), ˜ D2 S(I, ˜ ϕ) ˜ ϕ) = H0 (I) ˜ + H1 (I, ˜ + O(ε2 ). Es m¨ usste also S so gew¨ahlt werden, dass * ) ˜ ϕ) ˜ ϕ) ˜ D2 S(I, ˜ + H1 (I, ˜ ω(I), ˜ nicht den Winkeln wird. Dazu benutzt man die Fourier– nur eine Funktion von I, Transformation, schreibt also (zun¨achst nur im Sinn formaler Reihen) ˜ ˜ ˜ ϕ) ˜ i,ϕ ˜ ϕ) ˜ i,ϕ H1 (I, ˜ = h (I)e , S(I, ˜ = S (I)e . (15.3.4) ∈Zn
∈Zn
) * ˜ ϕ), ˜ = i n S (I) ˜ , ω(I) ˜ exp(i , ϕ) Wegen D2 S(I, ˜ ω(I) ˜ ergeben sich ∈Z die Bedingungsgleichungen ˜ , ω(I) ˜ + h (I) ˜ = 0. ∈ Zn \ {0} . (15.3.5) iS (I) Diese sind im Allgemeinen nicht l¨ osbar, denn • wir k¨onnen f¨ ur n > 1 Freiheitsgrade durch eine beliebig kleine Ver¨andeur ein geeignetes rung eines Frequenzvektors ω ∈ Rn immer erreichen, dass f¨ ∈ Zn \ {0} das Skalarprodukt , ω = 0 wird, und • falls die Abbildung D ω : G → Mat(n, R) den maximalen Rang n besitzt, k¨onnen wir eine solche Ver¨anderung von ω durch Variation von I˜ bewirken. Setzen wir aber voraus, dass f¨ ur ein festes Iˆ ∈ G die Komponenten des Fren ˆ quenzvektors ω(I) ∈ R rational unabh¨angig sind, das heißt ˆ = 0 , ω(I) ∈ Zn \ {0} , ˜ dann k¨onnen wir durch die (I–unabh¨ angigen!) Fourier–Koeffizienten ˆ ˜ := −i h (I) S (I) ˆ , ω(I)
∈ Zn \ {0}
˜ := 0 und S0 (I)
(15.3.6)
der erzeugenden Funktion S die Gleichungen (15.3.5) immerhin an der Stelle I˜ = Iˆ l¨osen. Es taucht aber das Problem der kleinen Nenner in (15.3.6) auf. Zwar sind die Fourier–Koeffizienten S definiert, aber es ist nicht klar, ob die Fourier–Reihe (15.3.4) konvergiert. Dazu versch¨arfen wir die Unabh¨angigkeitsbedingung zur Forderung dass ˆ ∈ Rn diophantisch ist, d.h. f¨ ur geeignete γ > 0 und τ > 0 in der Menge ω(I) Ωγ,τ := ω ˆ ∈ Rn | ∀ ∈ Zn \ {0} : |, ω ˆ | ≥ γ||−τ
(15.3.7)
15. St¨orungstheorie
381
liegt. Ob eine solche Bedingung u ur einen Frequenzvektor ω ˆ ∈ Rn ¨berhaupt f¨ erf¨ ullt ist, soll uns erst sp¨ater interessieren (Lemma 15.17). Außerdem fordern wir, um die Konvergenzchancen in (15.3.4) zu vergr¨oßern, dass die Fourier–Koeffizienten h schnell abfallen. Dies ist bei gen¨ ugender Differenzierbarkeit von H1 der Fall: 15.14 Lemma (Differenzierbarkeit und Fourier–Koeffizienten) F¨ ur eine Funktion g ∈ C k (Tn , R) auf dem Torus Tn mit Fourier–Darstellung g(ϕ) =
∈Zn
g exp(i , ϕ)
sind die Fourier–Koeffizienten g ∈ C von der Ordnung |g | = O ||−k . Beweis: Es ist f¨ ur Multiindex α ∈ Nn0 mit Eins-Norm |α| = Dα g(ϕ) = i|α|
∈Zn
(15.3.8)
n
g α exp(i , ϕ)
j=1
αj ≤ k (15.3.9)
(Beweis durch partielle Integration). Es sei ∈ Zn \{0} und j eine betragsm¨aßig gr¨oßte Komponente von , das heißt insbesondere |j | ≥ ||/n. Durch inverse Fourier–Transformation der k-ten Ableitung nach ϕj , also 1 dϕ g = exp(−i , ϕ) ∂ϕk j g(ϕ) , (ij )k Tn (2π)n zeigen wir (15.3.8), denn maxj supϕ |∂ϕk j g(ϕ)| < ∞.
2
Solche Aussagen heißen Paley-Wiener–Absch¨atzungen. Wie h¨angt umgekehrt die Differenzierbarkeitsstufe einer Funktion von den Abfallseigenschaften ihrer Fourier–Koeffizienten ab? 15.15 Lemma (Differenzierbarkeit von Fourier-Reihen) Falls c : Zn → C f¨ ur eine reelle Zahl k > n + r, r ∈ N0 von der Ordnung c() = O(||−k ) ist, dann ist die durch c() exp(i , ϕ) (ϕ ∈ Tn ) (15.3.10) f (ϕ) := ∈Zn
definierte Funktion f in C r (Tn , C). Beweis: Es gen¨ ugt wegen (15.3.9), die Behauptung f¨ ur r = 0 zu zeigen, also die Stetigkeit von f . Es existiert also ein C > 0 mit |c()| ≤ C||−k . Die Reihe (15.3.10) konvergiert gleichm¨aßig, denn ∈Zn
|c()| ≤ |c(0)| + C
∈Zn \{0}
||−k < ∞.
(15.3.11)
382
15.3. Hamiltonsche St¨orungstheorie erster Ordnung
∞ Das sieht man durch Vergleich mit dem Integral R x −k dx = cn 1 r n−1−k dr ur ε > 0 sei N so gew¨ahlt, f¨ ur das Integrationsgebiet R := {x ∈ Rn | x ≥ 1}. F¨ dass |c()| ≤ ε/3, (15.3.12) ∈Zn , ||>N
und fN die Partialsumme
fN (ϕ) :=
c() exp i , ϕ .
∈Zn , ||≤N
Dann u ur alle ¨bertr¨agt sich deren Stetigkeit mit einem ε/3–Argument auf f : F¨ ϕ, ψ ∈ Tn ist |f (ϕ) − f (ψ)|
≤
|f (ϕ) − fN (ϕ)| + |fN (ϕ)| − fN (ψ)| + |fN (ψ) − f (ψ)| ε ε + |fN (ϕ)| − fN (ψ)| + . ≤ 3 3
ε Andererseits ist f¨ ur |ϕ − ψ| < δ := 3CM mit M := ∈Zn \{0}, ||≤N ||1−k |fN (ϕ) − fN (ψ)| = c() exp(i , ϕ) − exp(i , ψ) ∈Zn , ||≤N ≤ C ||−k 1 − exp(i , ψ − ϕ) ∈Zn \{0}, ||≤N
≤
C
||−k |, ψ − ϕ| < C
∈Zn \{0}, ||≤N
||−k ||δ ≤
∈Zn \{0}, ||≤N
sodass 5 dann |f (ϕ) − f (ψ)| < ε.
ε , 3 2
15.16 Korollar F¨ ur 6 H1 ∈ Cbk (G × Tn , R) mit k > n + τ , τ ∈ N und eine Wirkung Iˆ ∈ G, die die diophantische Bedingung (15.3.7) erf¨ ullt, ist die erzeugende Funktion mit Fourier–Koeffizienten (15.3.6) 7 k−τ −n
S ∈ Cb
Weiter gibt es ein C > 0 mit ˆ ∈ Ωγ,τ ≤ sup |∂ α S| | Iˆ ∈ G, ω(I)
G × Tn , R .
C γ
|α| ≤ k − n − τ .
(15.3.13)
5 Man stellt aber auch fest, dass sich Differenzierbarkeit f¨ ur k ≤ n + 1 nicht von fN auf f u agt, denn dann divergiert M f¨ ur N → ∞. ¨bertr¨ 6 C k (U, R) bezeichnet den Vektorraum der k–fach stetig differenzierbaren Funktionen auf b ankt sind. Wir verwenden hier die WinkelkoordiU ⊆ Rm , deren partielle Ableitungen beschr¨ naten auf dem Torus Tn . 7 mit der ceil-Funktion · : R → Z , x → min{z ∈ Z | z ≥ x}.
15. St¨orungstheorie
383
ur die Fourier–Koeffizienten Beweis: Anwendung von Lemma 15.14 auf H1 ergibt f¨ (15.3.6) ˆ h (I) C||τ −k ∈ Zn \ {0} . (15.3.14) |S | = ,ω( ˆ ≤ γ I)
k−τ −n G × Tn , C . S ist reellwertig, denn Nach Lemma 15.15 ist daher S ∈ Cb die Fourier–Koeffizienten in (15.3.6) besitzen die Symmetrie S = S− . Die Konstanten in (15.3.14) u ¨bertragen sich wegen der Linearit¨at von Fourier– Transformation und Ableitung auf (15.3.13). 2 Die diophantische Bedingung (15.3.7) ist, falls τ > n − 1, f¨ ur Lebesgue-fast-alle ullt (allerdings mit einer ω-abh¨angigen Konstante γ): ω ∈ Rn erf¨
=
Abbildung 15.3.1: Die in (15.3.15) definierte diophantische Menge Bγ,τ (Weiß). 15.17 Lemma F¨ ur τ > n − 1 ist das Lebesgue–Maß der diophantischen Menge Bγ,τ := Ωγ,τ ∩ B
(15.3.15)
in der Vollkugel B := {ω ∈ Rn | ω ≤ 1} f¨ ur kleine Werte von γ groß: Es gibt ein α(τ ) < ∞ mit λn (Bγ,τ ) ≥ 1 − γ α(τ ) λn (B). ˜ < γ||−τ } rationaler Beweis: F¨ ur die Umgebungen G := {ω ∈ B | |, ω(I)| Hyperfl¨achen ist λn (G ). λn (Bγ,τ ) ≥ λn (B) − ∈Zn \{0}
Es ist λn (G ) ≤ 2vn−1 γ||−τ −1 , wobei vk das Volumen der k–dimensionalen Vollkugel vom Radius 1 bezeichnet (siehe Abbildung). Damit folgt (mit einer Summenabsch¨atzung wie im Beweis von (15.3.11))
384
15.3. Hamiltonsche St¨orungstheorie erster Ordnung
λn (G ) ≤ vn γ α(τ )
f¨ ur α(τ ) := 2
∈Zn \{0}
vn−1 vn
||−τ −1 < ∞. 2
∈Zn \{0}
15.18 Bemerkung (Diophantische Menge als Cantor–Menge) Ωγ,τ ist die Vereinigung von abgeschlossenen Strahlen {s ω | ω ∈ Ωγ,τ , s ≥ 1}. Daher liegt es nahe (und ist f¨ ur die St¨ orungstheorie bei konstanter Energie n¨ utzlich, siehe n−1 mit Sph¨aren vom Radius R > 0 Beispiel 15.34), Schnitte der Form Ωγ,τ ∩ SR zu betrachten. Diese sind kompakt und total unzusammenh¨angend. Sie sind die Vereinigung einer topologischen Cantor–Menge (siehe Seite 455) und einer abz¨ahlbaren Menge (wobei diese Bestandteile auch wegfallen k¨ onnen). Dies folgt aus dem Satz von Cantor–Bendixson, nach dem eine abgeschlossene u ¨berabz¨ahlbare Menge in eine abz¨ahlbare und eine perfekte Menge 8 aufgeteilt werden kann. Siehe Broer und Sevryuk [BrSe], Kapitel 4.1.2. Wie wir sehen, ist das Lebesgue–Maß einer topologischen Cantor–Menge im ur die Cantorsche 1/3–Menge aus Beispiel Rd nicht immer gleich Null (wie das f¨ 2.5 der Fall ist). 3 Wir sammeln jetzt unsere Teilergebnisse: 15.19 Satz (Hamiltonsche St¨ orungstheorie erster Ordnung) Falls in (15.3.1) H0 , H1 ∈ Cb2n+3 (G×Tn , R) ist, und die Frequenzen ω = DH0 : G → Rn unabh¨angig variieren, das heißt inf |det(Dω)(I)| = 0,
I∈G
(15.3.16)
gibt es Teilmengen Gγ ⊂ G mit asymptotisch vollem Maß (limγ0 λn (Gγ ) = λn (G)), f¨ ur die das Mittelungsprinzip im folgenden Sinn anwendbar ist: sup Iε (t, x0 ) − Iε (0, x0 ) = Oγ (ε) 0 < ε ≤ ε0 . sup x0 ∈Gγ ×Tn 0≤t≤1/ε
Beweis: • F¨ ur τ := n − 1/2 ist die Menge Gγ := {I ∈ G | dist(I, Rn \ G) > γ , ω(I) ∈ Ωγ,τ } der randfernen nichtresonanten Wirkungen im Limes γ ! 0 von vollem Maß. Dies folgt mit (15.3.16) aus Lemma 15.17. osungen zu den Anfangsbedingungen • Es sei jetzt Iˆ ∈ Gγ . Wir betrachten die L¨ n ˆ x0 ∈ {I} × T . Unter den genannten Voraussetzungen ist nach Korollar 15.16 die erzeugende Funktion S ∈ C 3 (G × Tn , R), sodass die Absch¨atzung (15.3.3) ˆ in einer ε-Umgebung von mit dem konstanten zu ε proportionalen Term εh1 (I) 8 Also
eine Menge, die gleich der Menge ihrer H¨ aufungspunkte ist.
15. St¨orungstheorie
385
˜ ϕ) Iˆ gilt, das heißt durch Einf¨ uhrung der neuen Koordinaten (I, ˜ (siehe (15.3.2)) die Hamilton–Funktion bis auf Fehlerterme Ri der Ordnung ε2 integrabel ist: ˜ ϕ) ˜ + εh1 (I) ˆ + R1 (I, ˜ ϕ) ˜ ϕ) Kε (I, ˜ = H0 (I) ˜ + R2 (I, ˜ mit ˜ ϕ) R1 (I, ˜ :=
˜ ϕ) ˜ − εDH0 (I) ˜ · D2 S I, ˜ ϕ˜ H0 I˜ + εD2 S(I, ˜ − H0 (I) ˜ ϕ), ˜ ϕ˜ = Oγ ε2 , ˜ ϕ˜ − H1 I, +ε H1 I˜ + εD2 S(I,
ur und die gleiche Absch¨atzung gilt f¨ ur das Vektorfeld XR1 . Analoges gilt f¨ ˜ ϕ˜ := ε ω(I) ˜ · D2 S(I, ˜ ϕ˜ − H1 I, ˆ ϕ˜ . ˜ ϕ) ˆ 2 S(I, ˆ ϕ) R2 I, ˜ − ω(I)D ˜ +ε H1 I, • Integration der hamiltonschen Differentialgleichungen von Kε mithilfe des Gronwall–Lemmas (Satz 3.42) analog zum Beweis von Satz 15.13 liefert das Resultat, sofern die Trajektorien t → Iε (t, x0 ) mit Anfangswerten x0 ∈ Gγ × Tn im Zeitraum t ∈ [0, 1/ε] in G verbleiben. Das k¨onnen wir durch Verkleinerung von ε erreichen. 2 15.20 Bemerkung (Anwendung auf die Erdbahn) Die Massen der Großplaneten Jupiter und Saturn betragen in der Gr¨ oßenordnung ε := 1/1000 der Sonnenmasse. Durch deren St¨ orungen k¨ onnten sich also nach etwa 1/ε = 1000 Jahren die L¨angen der Ellipsen-Halbachsen der Erdbahn bedeutend ver¨andern. W¨aren die Voraussetzungen von Satz 15.19 gegeben, dann w¨ urde er immerhin voraussagen, dass solche Ver¨anderungen nach 1000 Jahren noch O(ε) sind, und sich — u ¨berschl¨agig — erst nach einer Million Jahren deutlich bemerkbar machen. Der Satz ist zwar nicht direkt anwendbar, denn det(Dω) = 0 (im Kepler– Problem sind die Bahnen negativer Energie immer periodisch). Es gibt aber Va´joz rianten des Satzes, die f¨ ur das himmelsmechanische Problem greifen (in Fe [Fej1] wird die weitergehende Frage nach Anwendbarkeit der KAM–Theorie, also dauerhafte Stabilit¨at gel¨ ost). Tats¨achlich ¨andert sich aufgrund der Einfl¨ usse von Jupiter und Saturn die Exzentrizit¨at der Erdbahn in sich u ¨berlagernden sogenannten Milankovi´c-Zyklen von ca. 413 000 beziehungsweise 100 000 Jahren. Diese beeinflussen in einer noch nicht gut verstandenen Weise die Abfolge der Eiszeiten. Eine fr¨ uhe Diskussion der Stabilit¨at des Sonnensystems findet man in [Mos1] von Moser. Numerisch hat Laskar mit h¨ ochster Pr¨azision diese Frage untersucht, unter Einbeziehung der Relativit¨atstheorie, des Quadrupolmoments der Sonne etc. (siehe [Las1]). Auf einer Zeitskala von Milliarden Jahren wurde die M¨oglichkeit von Kollisionen zwischen den Planeten Merkur, Venus, Erde und Mars gezeigt (siehe [Las2]). 3
386
15.3. Hamiltonsche St¨orungstheorie erster Ordnung
15.21 Aufgabe (Relativistische Periheldrehung) Zeigen Sie f¨ ur das gest¨orte Kepler–Problem mit Hamilton–Funktion Hε : P@ → R
Hε (p, q) = 12 p 2 −
,
ε Z −
q q 3
(15.3.17)
auf dem Phasenraum P@ := T ∗ R2 \ {0} , dass sich das Argument des LaplaceRunge-Lenz–Vektors Aˆ : P@ → R2 , q2 ˆ q) = L(p, ˆ q) A(p,
p2 −p1
−Z
q
q
aus Aufgabe 11.22 f¨ ur Energie H0 = E < 0 innerhalb einer Periode der Kepler–Ellipse um ε
6πZ + O(ε2 ) 4
(15.3.18)
q1
ˆ (und damit die ¨andert, w¨ahrend A
Exzentrizit¨at e) bis auf O(ε2 ) konstant bleibt. Dabei bezeichnet = 0 den Wert des Drehimpulses. 3 15.22 Bemerkung (Periheldrehung des Merkur) Da allgemein-relativistische 2 St¨orungen sich in der Form des Potentials c2Z außern, ist in (15.3.17) der q3 ¨ St¨orparameter ε = um den Winkel
Z2 c2 .
Daraus folgt nach (15.3.18) eine Periheldrehung etwa
rs 6πZ 6πZ 2 = 3π , = 2 c 2 2 c a (1 − e2 ) a (1 − e2 )
wobei rs = 2Z/c2 den sog. Schwarzschild-Radius der Zentralmasse bezeichnet. F¨ ur die Sonne ist rs ≈ 2.95 km. Die Große Halbachse a von Merkur mißt etwa 57 900 000 km, und seine Exzentrizit¨at ist e ≈ 0.206. Also bewirkt der Effekt eine Periheldrehung um 2π nach etwa 12 500 000 Uml¨aufen. Dies ist weniger als ein Prozent der durch die anderen Planeten verursachten Periheldrehung. Trotzdem bemerkte Le Verrier 1859 diesen nicht durch bekannte Ursachen erkl¨arbaren Effekt. Le Verrier war 1845 durch Beobachtungen von St¨orungen der Uranusbahn die Bahnberechnung des Planeten Neptun gelungen, der daraufhin auch entdeckt wurde. Die Erkl¨arung der Merkur-Periheldrehung durch einen hypothetischen, von Le Verrier Vulkan genannten Planeten erwies sich als nicht erfolgreich. Dagegen wurde der Effekt zu einer wichtigen Best¨atigung der Allgemeinen Relativit¨atstheorie Einsteins. 3 15.23 Weiterf¨ uhrende Literatur Eine Referenz zur Mittelungstheorie ist [SV] von Sanders und Verhulst.
15. St¨orungstheorie
387
Eine sch¨one Textsammlung zu verschiedensten Aspekten der hamiltonschen Dynamik bietet [MM] von MacKay und Meiss. 3
15.4
KAM-Theorie
On sera frapp´e de la complexit´e de cette figure, que je ne cherche mˆeme pas `a ” tracer. Rien n’est plus propre `a nous donner une id´ee de la complication du probl`eme des trois corps et en g´en´eral de tous les probl`emes de Dynamique o` u il n’y a pas d’int´egrale uniforme et o` u les s´eries de Bohlin sont divergentes.” ´ in einem Brief an G¨osta Mittag-Leffler) 9 (Henri Poincare Im Beweis des Satzes 15.19 u orungstheorie erster Ordnung konnten ¨ber die St¨ wir f¨ ur diophantische Frequenzvektoren ω = ω(I) neue Koordinaten einf¨ uhren, in denen die St¨orterme von der Ordnung ε2 statt ε sind. Es stellt sich die Frage, ob man diese Transformation iterieren kann, um die St¨orung in geeigneten Koordinaten vollst¨andig zu eliminieren. Damit w¨are dann die Existenz eines flussinvarianten Torus gezeigt, auf dem die Bewegung bedingt-periodisch mit Frequenz ω ist. Dieses Ziel verfolgt die Theorie, die um 1960 von Kolmogorov, Arnol’d und Moser aufgestellt wurde und die daher kurz KAM-Theorie genannt wird. Sie ist dem klassischen Newton–Verfahren zum Auffinden von Nullstellen reeller Funktionen verwandt, siehe Anhang D. 15.24 Bemerkung (Banachscher Fixpunktsatz und Newton–Verfahren) Das banachsche Fixpunktverfahren besitzt eine in der Zahl m der Iterationen exponentielle Konvergenzgeschwindigkeit, das heißt eine Fehlerschranke O(θ m ) (siehe Satz D.3). Das Newton–Verfahren konvergiert noch wesentlich schneller, m mit einem Fehler der Ordnung θ (2 ) (quadratische Konvergenz). Allerdings wird auch mehr von f verlangt, n¨amlich insbesondere zweifache Differenzierbarkeit. Der jetzt folgende Beweis des KAM-Satzes (Satz 15.25 auf Seite 390) stammt ´joz [Fej3] und benutzt die Fixpunktiteration. Allerdings ist die Konvon J. Fe vergenz formal quadratisch, ¨ahnlich wie bei der Newton-Methode. Wie F´ejoz in [Fej2] zeigt, kann alternativ eine variierte Newton–Methode f¨ ur den Beweis des KAM-Theorems benutzt werden. 3 Jeder Beweis dieses fundamentalen Satzes ist kompliziert, so auch dieser. Immerhin z¨ahlt die KAM-Theorie zu den großen mathematischen Leistungen” ” des 20. Jahrhunderts, wie Winfried Scharlau 1992 bei der Vergabe der CantorMedaille an J¨ urgen Moser anmerkte. Allerdings ist die Beweismethode von F´ejoz vergleichsweise u ¨bersichtlich. 9 Ubersetzung: ¨ Man wird verbl¨ ufft von der Komplexit¨ at dieses Bildes sein, das ich nicht einmal zu zeichnen versuche. Nichts ist geeigneter, uns eine Idee von der Komplexit¨ at des Dreik¨ orperproblems und im Allgemeinen von all den Problemen der Dynamik zu geben, bei denen es keine Integrale der Bewegung gibt und wo die [St¨ orungs-] Reihen von Bohlin divergieren. Nach: Gesammelte Werke, Kapitel XXXIII, Paragraph 397, Band II. Poincar´ e hatte vermutlich etwas wie Abbildung 15.4.3 auf Seite 402 im Sinn.
388
15.4. KAM-Theorie
Danach wird in Satz 15.32 auf Seite 400 ein weiteres Resultat dargestellt. Dieses zeigt, dass eine gleichzeitige Transformation auf alle diophantischen Tori m¨ oglich ist. Den Beweis findet man im Artikel [Poe] von J. P¨ oschel.
15.4.1
* Ein Beweis des KAM–Satzes
´joz in [Fej3]. Der folgende Beweis basiert auf dem von J. Fe 1. Die Phasenr¨ aume: • Der reelle Phasenraum P ist von der Form P := Rn × Tn , mit dem Torus Tn = (R/2πZ)n . Dieser ist mit Winkel-Wirkungs-Koordinaten (I, ϕ) versehen. Das Iterationsschema ist so angelegt, dass am Ende der invariante Torus Wirkungskoordinaten I = 0 besitzt, also der Nullschnitt P0 := {0} × Tn ⊂ P ist (statt I = 0 kann auch jeder andere Wert der Wirkungen gew¨ahlt werden). • Der komplexifizierte Phasenraum PC ⊃ P besitzt die Gestalt PC := Cn × TnC , mit dem komplexifizierten Torus TnC := (C/2πZ)n . • W¨ahrend der Iteration werden schrumpfende Umgebungen des Nullschnittes ur P0 ⊂ PC benutzt. F¨ Tns := {ϕ ∈ TnC | max1≤k≤n |Im(ϕk )| ≤ s}
(s > 0)
sind diese von der Form Ps := {(I, ϕ) ∈ PC | (I, ϕ) ≤ s} mit
(I, ϕ) := max1≤k≤n max (|Ik |, |Im(ϕk )|) . 2. Die Hamilton–Funktionen: F¨ ur geeignete Teilmengen U, V von Vektorr¨aumen Ck ist ˚ , A(U, V ) := g ∈ C(U, V ) | g ist reell-analytisch in U
(15.4.1)
A(U ) := A(U, C).
Reell-analytisch bedeutet: g ist analytisch, und ihre Restriktion auf U ∩ Rk ist reellwertig. • Die w¨ahrend der Iteration vorkommenden Hamilton–Funktionen sind Elemente der R–Vektorr¨aume 10 Hs := A(Ps )
(s > 0).
Da Ps kompakt ist, wird A(Ps ) mit Norm |H|s := sup(I,ϕ)∈Ps |H(I, ϕ)| zum Banach–Raum. • Der induktive Limes dieser Banach–R¨aume ist H := lim Hs = (∪s>0 Hs ) /∼ , −→ 10 Da der komplexifizierte Phasenraum P aus Aquivalenzklassen ¨ nach dem Gitter (2πZ)n C besteht, k¨ onnen wir H als (2πZ)n –periodische Funktion auf C2n auffassen.
15. St¨orungstheorie
389
ur s := min{s1 , s2} mit Identifikation ∼ von H1 ∈ Hs1 und H2 ∈ Hs2 , falls f¨ gilt: H1 Ps = H2 Ps . Die Restriktion induziert hier eine injektive lineare Abbildung, da die betrachteten Funktionen analytisch sind. In diesem Sinn ist Ht ⊂ Hs und |H|t ≥ |H|s f¨ ur s ≤ t und H ∈ Ht . • Das hamiltonsche Vektorfeld dieser Funktionen ist im Allgemeinen nicht tanur die durch die Frequenzvektoren ω ∈ Rn indizierten gential an den Torus P0 . F¨ affinen Unterr¨aume Ks,ω := {H ∈ Hs | DH|P0 = (ω, 0)}
(15.4.2)
erzeugt H aber auf P0 den bedingt-periodischen Fluss (15.1.2). Da in (15.4.2) nur verlangt wird, dass H in f¨ uhrender I–Ordnung ϕ–unabh¨angig ist, haben wir uns nicht die Chance vergeben, die im Allgemeinen nicht integrable Hamilton–Funktion H ∈ Hs kanonisch in eine Funktion aus Ks,ω zu transformieren. 3. Die kanonischen Transformationen: In der hamiltonschen St¨ orungstheorie erster Ordnung (Satz 15.19) waren kleine St¨orungen einer integrablen (das heißt nur von den Wirkungen I abh¨angigen) Hamilton–Funktion H0 betrachtet worden. Voraussetzung war schon dort die Nichtdegeneriertheit seines Frequenzvektors ω = DH0 gewesen, das heißt die Regularit¨at der Matrix Dω = D2 H0 . KAM–Theorie besteht in der kontrollierten unendlichen Iteration dieses Satzes. Um dabei in jedem Schritt die diophantische Bedingung zu bewahren, ist diese Nichtdegeneriertheit von zentraler Bedeutung, erlaubt sie doch, durch eine (symplektische) Verschiebung der Wirkung den Frequenzvektor anzupassen. Grob gesprochen besteht die Beweisstrategie darin, f¨ ur nichtdegenerierte, auf dem Nullschnitt integrable K ∈ Ks,ω und benachbarte H ∈ H die Abbildung (K , H − K) −→ K + δK , H ◦ exp(−Z) − (K + δK) (15.4.3) zu iterieren, um ihren Fixpunkt (K∞ , 0) zu finden. Dabei sind δK und Z L¨osung der Kohomologie-Gleichung LZ K + δK = H − K.
(15.4.4)
Dadurch wird nicht nur gezeigt, dass H einen invarianten Torus mit Frequenz ω besitzt, sondern dieser (durch Anwendung der Symplektomorphismen auf P0 ) auch konstruiert. exp(−Z) ist die Komposition Φ1 ◦Φ2 ◦Φ3 dreier symplektischen Abbildungen: • Der Kotangentiallift Φ1 := T ∗ g eines Diffeomorphismus g : Tn → Tn (siehe Seite 216) ver¨andert die Winkelkoordinaten auf dem Torus P0 . Um die Eindeutigkeit von Z in der L¨ osung von (15.4.4) zu erreichen, wird dabei gefordert, dass g von einem Vektorfeld mit verschwindendem Torus-Mittel kommt. • Die hamiltonsche Fasertranslation (siehe Definition 10.36) Φ2 := transdH
390
15.4. KAM-Theorie
• Die symplektische Fasertranslation Φ3 := transv um den konstanten Translationsvektor v ∈ t∗ (mit der dualen Lie–Algebra t∗ ∼ = Rn von Tn , siehe Seite 519). Diese ist f¨ ur v = 0 nicht hamiltonsch. 0
Π
I
2Π 1 1 2 0 12 1
0
Π
I
2Π 1 1 2 0 12 1
Π
0
I
2Π 1 1 2 0 12 1
0
Π
2Π 1 1 2 0 12 1
I
Abbildung 15.4.1: 1) Phasenportrait f¨ u √r eine Hamilton–Funktion mit einem Freiheitsgrad. Der 1-Torus mit Frequenz 2 ist hervorgehoben. 2) Nach konstanter Verschiebung der Wirkungen. 3) Nach Fasertranslation.4) Nach Kotangentiallift. In Bild 3) und 4) wurden auf dem Torus zeitlich ¨aquidistante Punkte markiert. Diese haben in 4) auch exakt gleichen Winkelabstand. In den Illustrationen sind die Wirkungen dieser Abbildungen f¨ ur den Fall von n = 1 Freiheitsgrad dargestellt. Ziel ist der Beweis des folgenden Satzes u ¨ber die einzelnen diophantischen Tori. 15.25 Satz (KAM) Es sei ω ∈ Ωγ,τ (also diophantisch, siehe (15.3.7)). • Die Hamilton–Funktion H0 sei f¨ ur den Frequenzvektor ω integrabel (das heißt, H0 ∈ Kt,ω , siehe (15.4.2)) • und besitze eine nicht degenerierte gemittelte Variation der Frequenz (das heißt, die Matrix Tn D21 H0 (0, ϕ) dϕ ∈ Mat(n, R) ist regul¨ar). Dann besitzen alle Hamilton–Funktionen H ∈ Ht in einer kleinen Umgebung von H0 ebenfalls einen invarianten Torus zur Frequenz ω. 4. Die Konvergenzbedingungen Wir bezeichnen f¨ ur t > 0 den R–Vektorraum der reell-analytischen Funktionen F : Tnt → C mit A(Tnt ). Mit der Supremumsnorm |·|t wird A(Tnt ) zum Banach– Raum. F¨ ur H ∈ A(Tnt ) mit Mittelwert H = 0 suchen wir eine L¨osung S der sogenannten kohomologischen Gleichung Lω S = H
,
S = 0,
(15.4.5)
∼ Rn . Der mit der Lie–Ableitung nach dem konstanten Vektorfeld 11 ω ∈ t = Mittelwert von S wird durch die Gleichung Lω S = H nicht festgelegt. In Korollar 15.16 wurde die kohomologische Gleichung f¨ ur endlich oft differenzierbare Funktionen statt f¨ ur analytische Funktionen gel¨ ost. 11 t
bezeichnet die Lie–Algebra der Lie–Gruppe Tn .
15. St¨orungstheorie
391
A (w) dw f¨ ur den Wert einer anaAus der Cauchy–Formel f (z) = (2πi)−1 C fw−z lytischen Funktion im Inneren einer geschlossenen Kurve C in C folgt die Formel B f (w) 1 f (z) = dw 2πi C (w − z)2 f¨ ur deren Ableitung. Diese wiederum erm¨ oglicht die Absch¨atzung f ∈ A(Tns+σ ) . |f |s ≤ σ −1 |f |s+σ
(15.4.6)
15.26 Lemma (skalare kohomologische Gleichung) Ist der Frequenzvektor diophantisch mit ω ∈ Ωγ,τ und hat H ∈ A(Tns+σ0 ) Mittelwert H = 0, dann besitzt (15.4.5) in A(Tns ) eine eindeutige L¨osung S, und diese erf¨ ullt f¨ ur eine Konstante C = C(n, τ ) > 1 die Normungleichungen σ ∈ (0, σ0 ] . |S|s ≤ Cγ σ −τ −n |H|s+σ Beweis: • Wie im Beweis von Korollar 15.16 benutzen wir die Darstellungen H= H e , S = S e , (15.4.7) ∈Zn
∈Zn
mit den Charakteren e (ϕ) := ei,ϕ und den Fourier–Koeffizienten
H , S ∈ C. Diese gilt f¨ ur H auf dem Definitionsbereich Tns+σ . Aus Lω S = i ∈Zn S , ω e und S = S0 ergibt sich die L¨ osung S := −i
H , ω
∈ Zn \ {0}
und S0 := 0.
(15.4.8)
• Da H und e analytisch ist, h¨angen die Mittelwerte H e θ mit −n F (ψ) dψ θ ∈ Rn , maxk |θk | ≤ s + σ F θ := (2π) Tn +iθ
nicht von der Wahl des Vektors iθ ab, um den der reelle Torus Tn ⊂ Tns+σ verschoben wird. Mit der optimalen Wahl θk := −sign(k ) (s + σ) (k = 1, . . . , n) ergibt sich (analog zu Lemma 15.14) eine Paley-Wiener–Absch¨atzung mit dem Abfall der Fourier–Koeffizienten ( ∈ Zn ). |H | = | H e− θ | ≤ exp − (s + σ)|| |H|s+σ • Mit ω ∈ Ωγ,τ , also |, ω| ≥ γ||−τ , folgt daher aus (15.4.8) |S | ≤
||τ exp − (s + σ)|| |H|s+σ γ
∈ Zn \ {0} .
n Wir sch¨atzen damit (analog zu Lemma 15.15) die Supremumsnorm |S| s in Ts ⊂ n n n n n k+n−1 ≤ Ts+σ ab. Wegen |{ ∈ Z | || = k}| ≤ 2 |{ ∈ N0 | || = k}| = 2 n−1
392 2n (n−1)! (k
15.4. KAM-Theorie + n − 1)n−1 ist
≤
|H|s+σ |S | exp s || ≤ ||τ exp − σ|| γ ∈Zn ∈Zn \{0} n
2 |H|s+σ n−1 τ −σ k k e k∈N (k + n − 1) γ (n−1)! n
2 |H|s+σ n+τ −1 −σ k e k∈N (k + n − 1) γ (n−1)!
≤
|H|s+σ
|S|s ≤
≤
≤
|H|s+σ
2n eσ0 n γ (n − 1)! n σ0 n
2 e γ (n − 1)!
∞
(m − 1)n+τ −1 e−σ m
m=n+1 ∞ n+τ −1 −σ x
x
e
dx.
0
Das Integral hat den Wert σ −n−τ Γ(n + τ ). Wir setzen C :=
2n eσ0 n (n−1)! Γ(n + τ ).
2
5. Die symplektischen Vektorfelder: Die oben angesprochenen Symplektomorphismen werden als L¨osungen von (lokal) hamiltonschen Differentialgleichungen dargestellt. Daher werden jetzt durch s > 0 parametrisierte R–Vektorr¨aume angegeben, deren Elemente ihrerseits die symplektischen Vektorfelder festlegen. • Der Raum der im Torusmittel verschwindenden reell-analytischen Vektorfelder: Xs := X ∈ A(Tns , Cn ) | Tn X dϕ = 0 . Xs wirkt auf dem Phasenraum Cn × Tns durch die hamiltonschen Vektorfelder (I, ϕ) −→ − DXϕ I, X(ϕ) . • Der Raum der geschlossenen reell-analytischen Eins–Formen auf dem Torus: Ys := Y ∈ A(Tns , Cn ) | dY = 0 . Ys wirkt auf Cn ×Tns durch die symplektischen Vektorfelder (I, ϕ) → Y (ϕ), 0 . • Die direkte Summe Zs := Xs ⊕ Ys dieser R¨aume, mit ihrer infinitesimal symplektischen Wirkung auf Cn × Tns : Die gesuchte Abbildung Z = (X, Y ) ∈ Zs ⊂ A(Tns , C2n ) wirkt als Vektorfeld auf dem Phasenraum Cn × Tns in der Form Z : Cn × Tns → C2n , (I, ϕ) → Y (ϕ) − DXϕ I, X(ϕ) . (15.4.9) Xs , Ys und Zs sind als abgeschlossene Unterr¨aume von A(Tns , Cm ) mit Norm
V s := max{|Vk |s | k = 1, . . . , m} Banach–R¨aume.
15. St¨orungstheorie
393
15.27 Lemma (Exponentialabbildung) F¨ ur alle Z = (X, Y ) ∈ Zs+σ mit Norm Z s+σ ≤ 13 ( 4σn )2 ist die symplektische Transformation exp(Z) reell– analytisch auf Ps und verschiebt diesen Phasenraumbereich h¨ochstens um 12
exp(Z) − 1lPs s ≤
6n σ Z s+σ .
(15.4.10)
Beweis: • Der Picard–Operator des Anfangswertproblems x˙ = Z(x), x(0) = x0 mit x = (I, ϕ) ∈ Ps , dem komplexen kompakten Phasenraum, ist f¨ ur 0 < δ < σ
A : F (δ) → A Is × Ps , C
2n
,
t
Aψ (t, x) = x +
Z ψ(t˜, x) dt˜. (15.4.11)
0
2n
Dabei ist F (δ) := ψ ∈ A Is ×Ps , C | f¨ ur alle t ∈ Is ist ψ(t, ·)−IdPC s ≤ δ , mit dem komplexifizierten Zeitintervall Is := {t ∈ C | |Re(t)| ≤ 1, |Im(t)| ≤ s}. • Mit diesen Definitions– und Wertebereichen lassen sich Z und ψ(t˜, ·) verkn¨ upfen. Wegen der Analytizit¨at des Integranden ist das Wegintegral wohldefiniert. • Das faserweise affine Vektorfeld Z ist auf Ps+δ beschr¨ankt durch
Z s+δ = sup Y (ϕ) − DXϕ I, X(ϕ) (I, ϕ) ∈ Ps+δ ≤
2n
Z s+σ , σ−δ
denn σ − δ < 1. Setzt man nun δ := 13 σ, dann ist
Z s+2δ ≤
6n σ
Z s+σ ≤ . σ 8n
(15.4.12)
Damit gilt f¨ ur (t, x) ∈ Is × Ps : Aψ (t, x) − x ≤ Z s+2δ < δ, also Aψ ∈ F (δ). A l¨aßt sich daher iterieren. • Die Lipschitz–Konstante DZ s+δ des Picard–Operators ergibt sich aus t
Aψ1 − Aψ0 s ≤ sup 0 Z ψ1 (t˜, x) − Z ψ0 (t˜, x) dt˜ s t∈Is t 1 = sup 0 0 DZ ψu (t˜, x) · ψ1 (t˜, x) − ψ0 (t˜, x) du dt˜ s
t∈Is
≤
DZ s+δ ψ1 − ψ0 s ,
mit ψu := uψ1 + (1 − u)ψ0 (wie im Beweis von Lemma 3.14). • Die Lipschitz–Konstante wird f¨ ur dieses δ durch eine Cauchy–Absch¨atzung der Zeilensummennorm mit (15.4.6) dominiert:
DZ s+δ ≤
2n
Z s+2δ δ
≤
3 4
< 1.
• Als Kontraktion auf dem vollst¨andigen metrischen Raum F (δ) hat A nach dem Satz von Banach einen Fixpunkt Ψ, mit Ψ(t, ·) = exp(tZ) (t ∈ [0, 1]). • Ungleichung (15.4.12) zeigt dann auch (15.4.10). 2 12 Mit
der Schreibweise t → exp(tZ) f¨ ur den Fluss des Vektorfelds Z
394
15.4. KAM-Theorie
Notation: Zur Vermeidung von Verwechslungen mit dem Skalarprodukt bezeichnen wir hier das Mittel f von f u ¨ber Tn mit f und schreiben f = f + f˜. 3 Wir greifen jetzt die Bedingung der regul¨aren Variation der Frequenzen, also 2 D1 H 0 P0 = D21 H0 (0, ϕ) dϕ ∈ GL(n, R) Tn
des KAM–Satzes 15.25 auf. Auf einer kleinen Kugel Bt,ω = Bt,ω (H0 , ε0 ) := {K ∈ Kt,ω | |K − H0 |t ≤ ε0 }
(15.4.13)
um H0 ist die Variation der Frequenzen von K ebenfalls nicht degeneriert. Wir setzen (mit der Zeilensummennorm · s ) Kmax CK
:= 1 + max{|K|smax | K ∈ Bt,ω (H0 )}, −1 := Kmax 1 + max D21 K s | K ∈ Bt,ω (H0 ) . (15.4.14) max
Wie CK findet man auch im folgenden Lemma eine Konstante C˜K , die nur von der Wahl der Kugel Bt,ω abh¨angt. Die Wirkung des lokal hamiltonsche Vektorfelder parametrisierenden Raums Zt auf Ht ist bei H0 transversal zum integrablem Unterraum Kt,ω : 15.28 Lemma (L¨ osung der Kohomologiegleichung) ur (K, δH) ∈ Bs+σ,ω × Hs+σ Die Kohomologiegleichung LZ K + δK = δH f¨ besitzt eine eindeutige L¨osung (δK, Z) ∈ Ks,0 × Zs , mit der Norm (15.4.15) max δK s , Z s ≤ C˜K σ −2(τ +n+1) |δH|s+σ . Beweis: • Die Taylor–Entwicklungen von K ∈ Ks+σ,ω und der Variation δK ∈ Ks+σ,0 von K in den Wirkungen I sind . K(I, ϕ) = K (0) + ω, I + I, K (2) (ϕ) I + K (3) (I, ϕ), + δK (2) (I, ϕ), δK(I, ϕ) = δK (0)
n mit a, b = ur a, b ∈ Cn , K (2) (ϕ) ∈ Sym(n, C), K (3) (I, ϕ) = k=1 ak bk f¨ 3 (2) O( I ) und δK (I, ϕ) = O( I 2 ). Also ist (15.4.16) DK(I, ϕ) = ω + 2K (2) (ϕ) I, 0 + O( I 2 ). • Der erste Term LZ K = DK(Z) der Kohomologiegleichung hat mit (15.4.9) und (15.4.16) die Taylor–Entwicklung . LZ K(I, ϕ) = ω + 2K (2) (ϕ) I, Y (ϕ) − DXϕ I + O( I 2 ). • Dagegen kann auch der f¨ uhrende Term der δH–Entwicklung von ϕ abh¨angen: . δH(I, ϕ) = δH (0) (ϕ) + δH (1) (ϕ), I + δH (2) (I, ϕ)
15. St¨orungstheorie
395
mit δH (2) (I, ϕ) = O( I 2 ). • Koeffizientenvergleich der nach I entwickelten Kohomologiegleichung: ω, Y (ϕ) + δK (0) = δH (0) (ϕ)
,
2K (2) (ϕ)Y (ϕ) − DXϕ ω = δH (1) (ϕ)
) * und δK (2) (I, ϕ) = δH (2) (I, ϕ) + 2K (2) (ϕ) I, DXϕ I − DK (3) (Z)(I, ϕ). • Dieses lineare Gleichungssystem besitzt die eindeutige L¨osung (0) ˜ Y˜ := D L−1 ω δH
,
Y :=
(2) X := L−1 Y − δH (1) ω 2K
1 2
(2) −1 (1) δH − 2K (2) Y˜ , K , δK (0) := δH
(0)
) * − ω, Y
(15.4.17) (15.4.18)
und (mit diesen Gr¨ oßen) das schon angegebene δK (2) . • Um die Normen dieser Gr¨ oßen zu kontrollieren, werden sie auf in der Reihenfolge ihres Auftretens schrumpfenden Gebieten abgesch¨atzt. Mit ω ∈ Ωγ,τ und der Konstante C > 1 aus Lemma 15.26 ist also ˜ s+σ σ ∈ (0, σ0 ] .
Y˜ s+ 23 σ ≤ Cγ (σ/3)−τ −n−1 |δ H| Eingesetzt in die Formel (15.4.17) f¨ ur Y ist (mit CK ≥ 1 aus (15.4.14))
Y s+ 23 σ ≤ CK 1 + Cγ (σ/3)−τ −n−1 |δH|s+σ σ ∈ (0, σ0 ] . Also ist
Y s+ 23 σ ≤ Y s+ 23 σ + Y˜ s+ 23 σ ≤ 2CK 1 +
−τ −n−1 C γ (σ/3)
|δH|s+σ . (15.4.19) Als n¨achstes sch¨atzen wir mit Lemma 15.26 komponentenweise das Vektorfeld X aus (15.4.18) ab, und erhalten mit Kmax aus (15.4.14), (15.4.19) und σ ≤ 1
X s+ 13 σ ≤ 2 Cγ (σ/3)−τ −n Kmax Y s+ 23 σ + δH s+σ ≤ 2 Cγ (σ/3)−τ −n 2CK Kmax 1 + Cγ (σ/3)−τ −n−1 + 1 δH s+σ % &2 ≤ 8 CK 1 + Cγ (σ/3)−τ −n−1/2 |δH|s+σ . (15.4.20) Zusammengenommen beweisen (15.4.19) und (15.4.20) den Z s ≤ Z s+σ/3 betreffenden Teil der Ungleichung (15.4.15).Es folgt der Teil f¨ ur δK s : • Die konstante Funktion δK (0) aus (15.4.18) wird durch % & |δK (0) |s ≤ |δH|s + ω
Y s ≤ 1 + 2 ω CK 1 + Cγ (σ/3)−τ −n−1 |δH|s+σ beschr¨ankt. Schließlich ist auf dem kompakten Phasenraumgebiet Ps |δK (2) |s
≤ ≤
|δH (2) |s + |K|s DX s + DK s Z s n 1 |δH|s + 3n σ |K|s X s+ 3 σ + σ K s+σ Z s . (15.4.21)
396
15.4. KAM-Theorie
Neben der Absch¨atzung (15.4.20) f¨ ur X setzen wir die zu (15.4.12) analoge
Z
in (15.4.21) ein. 2 Ungleichung Z s ≤ 6n s+σ/3 σ Als n¨achstes wird abgesch¨atzt, wie sehr die Hamilton–Funktion K + δH nach Transformation mit dem Symplektomorphismus exp(−Z) von der Integrabilit¨at abweicht. 15.29 Lemma (quadratische Konvergenz) Die L¨osungen (δK, Z) ∈ Ks,0 ×Zs der Kohomologiegleichung LZ K +δK = δH ullen f¨ ur (K, δH) ∈ Bs+σ,ω × Hs+σ mit |δH|s+σ ≤ gσ 2˜τ , τ˜ := 2(τ + n + 2) erf¨ f¨ ur ein geeignetes g: exp(Z) ist reell-analytisch auf Ps
,
exp(Z) − IdPC s ≤ σ.
(15.4.22)
Dann ist der Iterationsfehler |(K + δH) ◦ exp(−Z) − (K + δK)|s ≤ c (σ −˜τ )2 |δH|2s+σ .
(15.4.23)
Beweis: • Die Lemmas 15.27 und 15.28 zeigen die Richtigkeit von (15.4.22). Mit der angegebenen Schranke an |δH|s+σ besagt n¨amlich Lemma 15.28, dass 2 max δK s+σ/2 , Z s+σ/2 ≤ C˜K (σ/2)−2(τ +n+1) |δH|s+σ ≤ 13 ( σ/2 4n ) , f¨ ur g :=
2−2(τ +n+2) ˜K (4n)2 . 3C
Mit (15.4.10) folgert man
exp(Z) − 1lPs s ≤
6n
Z s+σ/2 σ/2
≤
σ . 16n
• F¨ ur H := K + δH ergibt der Hauptsatz der Differential- und Integralrechnung 1 d H ◦ exp(−tZ) dt H ◦ exp(−Z) = H + 0 dt 1 = H − 0 DHexp(−tZ) (Z) dt = H − DH(Z) + R , mit dem Restterm R = 1t 0
0
1t 0
d DH 0 ds
D2 Hexp(−sZ) (Z, Z) ds dt =
◦ exp(−sZ)(Z) ds dt =
1 0
(1 − t)D2 Hexp(−tZ) (Z, Z) dt. (15.4.24)
Die linke Seite |H ◦ exp(−Z) − (K + δK)|s von (15.4.23) ist also gleich |δH − DH(Z) + R − δK|s = |R − LZ δH|s ;
(15.4.25)
letztere Identit¨at folgt aus der Kohomologiegleichung LZ K + δK = δH. • Zum Beweis von (15.4.23) sch¨atzen wir die rechte Seite von (15.4.25) ab. Mit (15.4.12) und (15.4.15) ist
Z s ≤
2n σ/2 Z s+σ/2
≤ 2nC˜K (σ/2)−2(τ +n)−3 |δH|s+σ .
(15.4.26)
ur H ∈ Bt,ω (die in (15.4.13) definierte Kugel Der Term D2 H in (15.4.24) wird f¨ um H0 ) durch 2nσ −2 Kmax mit der Konstanten Kmax aus (15.4.14) abgesch¨atzt. Der Beitrag von R zu (15.4.25) ist also von der in (15.4.23) angegebenen Form.
15. St¨orungstheorie
397
Abbildung 15.4.2: Iteration der quadratischen Abbildung Fc f¨ ur c = 2/3 (links) und c = 0 (rechts). Darstellung der Iteration als Cobweb–Diagramm, das heißt als Streckenzug mit Eckpunkten auf dem Graph und der Diagonale. Der Term |LZ δH|s in (15.4.25) wird mit (15.4.26) durch eine Konstante 2 mal σ −˜τ |δH|2s+σ dominiert, also durch eine kleinere Potenz von 1/σ. F´ejoz findet die integrable Hamilton–Funktion des KAM-Torus als Fixpunkt (K∞ , 0) der Abbildung (15.4.3). Daher liegt es nahe zu glauben, dass der Satz von Banach (siehe D.3) die Existenz des Fixpunkts sicherstellt. Dies ist aber nicht m¨ oglich, denn Lemma 15.28 kann
∞nicht sicherstellen, dass die Abbildung eine Kontraktion ist. Denn die Summe j=1 σj der Analytizit¨atsverluste σj im j–ten Iterationsschritt muss endlich sein, die σj konvergieren −2(τ +n+1) der oberen also gegen Null. Andererseits divergiert dann der Faktor σj Schranke in (15.4.15). Eine besondere Eigenschaft der iterierten Abbildung rettet die Situation. Sie kontrahiert n¨amlich um so mehr, je mehr man sich ihrem Fixpunkt n¨ahert. Das sieht man an der in δH quadratischen oberen Schranke in (15.4.23). 15.30 Bemerkung (quadratische Konvergenz zum Fixpunkt) Ein stark vereinfachtes Modell bietet die Iteration der quadratischen Abbildungen Fc : R → R , x → (x − c)2 c ∈ [−1/4, ∞) . ur Werte des ParaHier ist der Fixpunkt xc := c + 1/2 − c + 1/4 ≥ 0 von Fc f¨ meters c ∈ (−1/4, 3/4) stabil, Fc also in einer Umgebung von xc kontrahierend. F¨ ur c = xc = 0 aber ist die Ableitung Fc (xc ) = 0, und die Konvergenz gegen xc ist wie beim Newton–Verfahren quadratisch (Abbildung 15.4.2, rechts). 3 • Allerdings ist (im Gegensatz zu F0 aus der Bemerkung) die Ableitung der Abbildung (15.4.3) an den Fixpunkten nicht Null, denn alle integrablen Hamilton– Funktionen K liefern Fixpunkte (K, 0). • Ebenso verkleinert sich mit jeder Iteration der Definitionsbereich der verwendeten Abbildung.
398
15.4. KAM-Theorie
Im folgenden Fixpunktsatz wird die auftretende Situation formalisiert. Die beiden der Abbildung (15.4.3) zugrundeliegenden Funktionenr¨aume werden hier allgemein mit H und K bezeichnet. Genauer wird die sich bei der Iteration verringernde G¨ utestufe at abstrakt durch eine Familie (Hs )s∈(0,1] der Analytizit¨ codiert, mit Ht ⊆ Hs und |H|(H) von Banach–R¨aumen Hs , | · |(H) ≤ |H|(H) s s t (H) f¨ ur s < t und H ∈ Ht . Analog f¨ ur Ks , | · |s s∈(0,1] und die kartesischen (H) Produkte Ms := Ks × Hs , mit den Normen |(K, H)|s := max(|K|(K) s , |H|s ) (wir schreiben hier also abk¨ urzend H statt δH). 0 < s < s + σ ≤ 1 und h, k, τ > 0 seien die Parameter der Kugeln (H) τ Bs,σ (h, k, τ ) := {(K, H) ∈ Ms+σ | |K|(K) s+σ ≤ k, |H|s+σ ≤ hσ }. (15.4.27)
Gegeben sei eine Familie von Abbildungen Fs,σ : Bs,σ (h, k, τ ) −→ Ms , die mit Restriktion auf Unterr¨aume vertr¨aglich sind, das heißt Fs1 ,σ1 Ms
2 +σ2
= Fs2 ,σ2
f¨ ur 0 < s1 < s2
und 0 < σ1 < σ2 .
Der G¨ uteverlust (in der Anwendung die Verkleinerung des Analytizit¨atsgebietes) unter Fs,σ werde durch σ ∈ (0, 1 − s] gemessen. 15.31 Satz (F´ ejoz [Fej3]; Existenz eines Fixpunkts) ˆ H) ˆ := ur die Bilder (K, F¨ ur geeignete c, h0 , k0 , τˆ > 0 und ein τ ≥ τˆ gelte f¨ ur alle 0 < s < s + σ ≤ 1 Fs,σ (K, H) von (K, H) ∈ Bs,σ (h0 , k0 , τ ) f¨ 2 ˆ − K|(K) ≤ c σ −ˆτ /2 |H|(H) und |H| ˆ (H) |K ≤ c σ−ˆτ |H|(H) (15.4.28) s s+σ s s+σ . Dann gibt es f¨ ur σj := 2−j σ, s0 := s + σ, die gegen s fallende Folge (sj )j∈N0 mit sj := sj−1 − σj und f¨ ur k := k0 /2 ein h ∈ (0, h0 ), sodass gilt: • Die Abbildungen F˜ (j) : Bs1 ,σ1 (h, k, τ ) → Bsj+1 ,σj+1 (h, k0 , τ ) mit F˜ (1) := Fs1 ,σ1
und F˜ (j) = Fsj ,σj ◦ F˜ (j−1)
haben die angegebenen Wertebereiche (sind also f¨ ur alle j ∈ N definiert). • F¨ ur alle (K, H) ∈ Bs,σ (h, k, τ ) existiert der Grenzwert (K∞ , 0) := lim F˜ (j) (K, H) ∈ Bs,0 (h, k0 , τ ). j→∞
Beweis: • Es ist sj = s + σ −
j l=1
σl = s + 2−j σ. Sei
h := min 2τˆ−2τ /c, k (1 − 2−τ /2 ) .
Soweit die Abbildungen F˜ (j) mit den angegebenen Wertebereichen definiert sind, schreiben wir (Kj , Hj ) f¨ ur F˜ (j−1) (K, H). τ F¨ ur (K, H) ∈ Bsj ,σj (h, k, τ ), also |Hj |(H) sj−1 ≤ hσj ist nach (15.4.28) 2τ −ˆ τ τ |Hj+1 |(H) ≤ cσj−ˆτ h2 σj2τ = c 22τ −ˆτ h2 σj+1 ≤ hσj+1 . sj
(15.4.29)
15. St¨orungstheorie
399
F¨ ur diese Wahl von h besitzen also alle F˜ (j) , was die Normen der Hj angeht, die angegebenen Wertebereiche. Falls dies auch die Kj gilt, ist außerdem limj→∞ |Hj |(H) = 0. s • Tats¨achlich ist (Kj )j∈N eine Cauchy–Folge in Ks mit |Kj |(K) ≤ k0 , denn s ur alle j ≥ i ∈ N ist wegen (15.4.29) |Kj − Ki |(K) ≤ Ksj ⊂ Ks und f¨ s
∞
∞ (K) (K) τ 2−iτ /2 ≤ 2 =i |K+1 − K |s =i |K+1 − K |s+1 ≤ hσ 1−2−τ /2 ≤ k. Beweis des Satzes 15.25 (KAM) auf Seite 390: Wegen Lemma 15.28 und (15.4.22) besitzt die Familie von Abbildungen Fs,σ : Bs+σ,ω × Hs+σ (K , H − K)
−→ Ks,ω × Hs (0 < s < s + σ ≤ 1) −→ K + δK , H ◦ exp(−Z) − (K + δK)
aus (15.4.3) den angegebenen Wertebereich. Es ist zu zeigen, dass sie (nach Verschiebung um H0 ) die Bedingung des Fixpunktsatzes 15.31 erf¨ ullt. Wenn man sie dann mit Startpunkt (H0 , H − H0 ) und f¨ ur s := σ := 12 min(t, 1) iteriert, findet man einen Fixpunkt (K∞ , 0) ∈ Bs,ω × Hs . Bedingung (15.4.28) ist wegen Lemma 15.28 und (15.4.23) in Lemma 15.29 ullt. 2 f¨ ur τˆ := 2˜ τ und kleine Radien ε0 der Kugel Bs+σ,ω in (15.4.13) erf¨ ´joz in [Fej3] gezeigt, die verketteten SymplektoAnalog ergeben, wie von J. Fe morphismen der KAM-Iteration einen Limes-Symplektomorphismus.
15.4.2
Maß der KAM–Tori
Eben wurde die KAM–Theorie f¨ ur die einzelnen Tori mit diophantischem Frequenzvektor entwickelt. Dagegen hat P¨ oschel in [Poe] eine globale kanonische Transformation konstruiert, die gleichzeitig f¨ ur viele KAM–Tori Winkel– Koordinaten liefert. Außerdem erlaubt sie eine gewisse Kontrolle der eventuell chaotischen Dynamik außerhalb der KAM–Tori. Es sei wieder Hε (I, ϕ) := H0 (I) + εH1 (I, ϕ)
(15.4.30)
auf dem Phasenraum G × Tn , mit einem Gebiet G ⊂ Rn und mit St¨orparameter |ε| < ε0 . Wir setzen voraus, dass die integrable Hamilton–Funktion H0 reell-analytisch ist. Weiter fordern wir wieder die unabh¨angige Variation der Frequenzen ω := DH0 : G → Rn : det(Dω)(I) = 0
(I ∈ G),
und ω sei ein Diffeomorphismus auf das Bild Ω := ω(G). Wegen dieser Eigenschaft k¨ onnen wir mittels der Abbildung Ψ : Ω × Tn → G × Tn , (ˆ ω , ϕ) → ω −1 (ˆ ω ), ϕ
(15.4.31)
400
15.4. KAM-Theorie
die Hamilton–Funktion Hε als Funktion Hε := Hε ◦ Ψ : Ω × Tn −→ R auffassen, und die symplektische Zwei–Form mit dem pull-back Ψ∗ auf diesen neuen Phasenraum zur¨ uckziehen. Der Vorteil dieses Koordinatenwechsels ist, dass bei der Iteration der kanonischen Transformationen direkt an den neuen Wirkungen ω ˆ abgelesen werden kann, ob sie zur diophantischen Menge Ωγ,τ (siehe (15.3.7)) geh¨oren. Wir setzen τ := n und nennen die diophantische Teilmenge der Menge Ω unserer Frequenzen einfachheitshalber Ωγ := Ωγ,τ ∩ Ω. Der St¨orterm H1 sei glatt 13 auf G × Tn , also H1 = H1 ◦ Ψ ∈ C ∞ (Ω × Tn ). 15.32 Satz (Kolmogorov, Arnol’d und Moser; KAM) Unter den obigen Bedingungen existiert ein ε0 > 0, sodass f¨ ur |ε| < ε0 ein Diffeomorphismus Tε auf dem Phasenraum Ω × Tn existiert, der auf der Teilmenge Ω√ε × Tn ⊂ Ω × Tn die hamiltonschen Differentialgleichungen in die Form d ω ˆ (t) = 0 , dt
d ϕ(t) = ω ˆ (t) dt
(15.4.32)
transformiert. Das Lebesgue–Maß dieser Teilmenge ist f¨ ur kleine St¨orungen groß: √ λn Ω√ε = λn (Ω) · 1 − O( ε) (falls Ω eine berandete Mannigfaltigkeit ist). 15.33 Bemerkungen 1. Die Gleichungen (15.4.32) sind integrabel und haben die L¨osungen ω ˆ (t) = ω ˆ (0) ,
ϕ(t) = ϕ(0) + ω ˆ (0)t (mod 2π)
(t ∈ R).
¨ 2. Uber die ,resonanten Tori’, das heißt das Komplement von Ω√ε × Tn , wird in dieser Formulierung des Satzes nichts ausgesagt. Dort k¨onnen die Tori u ¨berleben (wenn Hε integrabel ist) oder sich durch die St¨orung aufl¨osen, siehe Abbildung 15.4.3 und das Titelbild des Buches. 3 15.34 Beispiel (Bewegung im periodischen Potential) Als Anwendungsbeispiel greifen wir die in Kapitel 11.2 behandelte Bewegung eines Teilchens im L– periodischen Potential V auf, wobei das regul¨are Gitter L = spanZ (1 , . . . , d ) 13 P¨ oschel
ben¨ otigt sogar nur 3n–fache stetige Differenzierbarkeit.
15. St¨orungstheorie
401
von einer Basis 1 , . . . , d des Rd aufgespannt wird. Wir nehmen zus¨atzlich Glattheit des Potentials an, das heißt V ∈ C ∞ (Rd , R). Die Hamilton–Funktion H : P → R, H(p, q) = 12 p 2 + V (q) auf dem Phasenraum P = Rdp × Rdq erzeugt die hamiltonsche Differentialgleichung p˙ = −∇V (q)
, q˙ = p.
Um die obige Formulierung des KAM-Satzes zu treffen, benutzen wir anders als in Kapitel 11.2 nicht den Periodentorus Rd /L, sondern den Standardtorus T = Rd /(2πZ)d , mit Kotangentialraum Pˆ := T ∗ Td ∼ = Rd × Td als Phasenraum. Mit der Matrix L := (1 , . . . , d )/(2π) ∈ Mat(d, R) der Basisvektoren wird V durch Koordinatenwechsel 2π–periodisch, l¨aßt sich also als Funktion Vˆ ∈ C ∞ (Td , R)
,
Vˆ (ϕ) := V (Lϕ)
auffassen. Um die KAM-Theorie auf H mit den Energien im Intervall [(1 − δ)E, (1 + δ)E] um E > 0 anzuwenden, betrachten wir die Hamilton–Funktion ˆ ε : Pˆ → R H
,
ˆ ε (I, ϕ) := H
1 2
I, M I + εVˆ (ϕ),
mit M := (L L)−1 . Diese ist von der Form (15.4.30). F¨ ur den Diffeomorphismus √ ME : P → Pˆ , (p, q) → (I, ϕ) := L p/ E , L−1 q folgt ˆ 1/E ◦ ME = H, E·H ˆ ε erzeugte hamiltonsche Fluss Φ ˆ ε (bez¨ und der von H uglich der kanonischen ˆ ist konjugiert zum urspr¨ unglichen Fluss, bis symplektischen Struktur ω0 auf P) auf einen Wechsel der Zeitskala: √
ˆ Et ◦ ME = ME ◦ Φt Φ 1/E
(t ∈ R).
ˆ tε integrabel. Es gilt dann F¨ ur den St¨orparameter ε = 0 wird Φ ˆ t0 (I0 , ϕ0 ) = I0 , ϕ0 + ω0 (I0 )t t ∈ R, (I0 , ϕ0 ) ∈ Pˆ Φ ˆ 0 (I) = M I. Der Frequenzvektor ω erf¨ ullt mit dem Frequenzvektor ω(I) := DH die Bedingung (15.4.31) unabh¨angiger Variation, denn die Matrix Dω(I) = M besitzt Rang d. 3 15.35 Bemerkung (Resonanzen) Wie im Kapitel 17.2 u ¨ber den Satz von Poincar´e-Birkhoff ausgef¨ uhrt, zeigen sich zwischen den KAM-Tori oft neue stabile und instabile periodische Orbits (siehe Abbildung 15.4.3). Diese entsprechen Resonanzen zwischen Frequenzen des gest¨ orten integrablen Systems. So findet man die Rotationsperioden mancher Planeten und Monde in Resonanz mit ihren Umlaufsdauern. W¨ahrend etwa der Erdmond eine gebundene Rotation besitzt, uns also immer in etwa die gleiche Seite zeigt, rotiert Merkur bei zwei Uml¨aufen um die Sonne exakt dreimal um seine Achse. 3
402
15.4. KAM-Theorie
Abbildung 15.4.3: Phasenraumportrait eines hamiltonschen Systems mit zwei Freiheitsgraden, mit ineinander geschachtelten KAM-Tori (aus [AM])
Ist man an dem Anteil der KAM–Tori in einer Energiefl¨ache interessiert, dann m¨ ussen die Bedingungen des Satzes angepasst werden. Scheinbar ist das nicht m¨ oglich, dann nun k¨ onnen auf der (n − 1)–dimensionalen Energiefl¨ache nicht alle n Frequenzen unabh¨angig variiert werden. Wie man aus der diophantischen Bedingung (15.3.7) abliest, kommt es aber haupts¨achlich darauf an, dass deren Verh¨altnisse unabh¨angig variiert werden k¨ onnen. Man geht also vom Raum Rn der Frequenzen zum projektiven Raum RP(n − 1) u ¨ber. 15.36 Satz (Isoenergetische Nichtdegeneriertheit) F¨ ur die integrable Hamilton–Funktion H0 sei E := H0 (I0 ) ein regul¨arer Wert von H0 . Genau dann, wenn f¨ ur ω := ∇H0 : G → Rn gilt: Dω(I ) ω(I ) (15.4.33) det ω(I )0 0 0 = 0, 0
ist f¨ ur eine geeignete Umgebung U ⊆ H0−1 (E) von I0 die Abbildung U → RP(n − 1) , I → span ω(I) (15.4.34) ein Diffeomorphismus aufs Bild. Beweis: • Da E nach Voraussetzung ein regul¨arer Wert von H0 ist, nimmt der Frequenzvektor ω : G → Rn auf der (n − 1)–dimensionalen Mannigfaltigkeit
15. St¨orungstheorie
403
ur alle ME := H0−1 (E) ⊂ G nicht den Wert 0 an. Damit ist span ω(I) ⊆ Rn f¨ I ∈ ME ein eindimensionaler Unterraum, und Φ : ME → RP(n − 1) , I → span ω(I) bildet tats¨achlich in den projektiven Raum RP(n − 1) ab. • Die zu ω(I0 ) senkrechten Vektoren v ∈ Rn bilden den Tangentialraum TI0 ME von ME . Genau dann, wenn es einen solchen Vektor v0 = 0 gibt, dessen Bild unter Dω(I0 ) in span ω(I0 ) liegt, ist die lineare Abbildung TI0 ME → TΦ(I0 ) RP(n − 1)
, v → DΦ(I0 ) v
nicht surjektiv. • Dann aber ist die Bedingung (15.4.33) verletzt. Denn ur Dω(I 0 ) v0 = λ ω(I0 ) f¨ v0 Dω(I0 ) ω(I0 ) liegt der Vektor −λ dann im Kern der Matrix ω(I ) 0 . Andererseits 0
kann ein Vektor ( μv ) nur dann im Kern dieser Matrix liegen, wenn v, ω(I0 ) = 0 und Dω(I0 ) v = −μ ω(I0 ) gilt. • Die Existenzaussage u ¨ber (15.4.34) folgt dann aus dem Umkehrsatz der mehrdimensionalen Differentialrechnung (siehe etwa Hildebrandt [Hil], Analysis 2, Kapitel I.9). 2 In Broer und Huitema [BH] wird gezeigt, dass unter Voraussetzung der Bedingung (15.4.33) eine zu Satz 15.32 analoge Aussage f¨ ur die invarianten Tori in orten Systems folgt. den Energiefl¨achen Hε−1 (E) des gest¨ 15.37 Aufgabe (Nichtdegeneriertheitsbedingungen) Zeigen Sie, dass f¨ ur die Hamilton–Funktionen Hi : R2 × T2 → R, H1 (I, ϕ) = I1 + I2 + I12
und H2 (I, ϕ) = I1 + I2 + I12 − I22
gilt: Der invariante Torus {0} × T2 ist f¨ ur H1 (15.4.31)–degeneriert aber nichtdegeneriert im Sinn von Bedingung (15.4.33). F¨ ur H2 gilt das Gegenteil.14 3
15.5
Diophantische Bedingung und Kettenbr¨ uche
Wir stellen uns nun die Frage nach der diophantischen Bedingung (15.3.7) f¨ ur den einfachsten Fall der Dimension n = 2. In diesem Fall ist die Menge der unabh¨angigen Frequenzvektoren
Ωγ,τ = (ω1 , ω2 ) ∈ R2 ∀(1 , 2 ) ∈ Z2 \ {0} : |1 ω1 + 2 ω2 | ≥ γ (21 + 22 )−τ /2 . (15.5.1) Die definierende Bedingung ist sicher nicht erf¨ ullt, falls ω1 = 0 gilt oder ω2 = 0. ur (ω1 , ω2 ) ∈ Wir dividieren also in (15.5.1) durch ω2 und setzen ω := ω1 /ω2 . F¨ 14 Die
Beispiele entstammen dem Artikel [Do] von R. Douady.
404
15.5. Diophantische Bedingung und Kettenbr¨ uche
ullt (nach Umbenennung (q, p) := (1 , −2 ) und Ωγ,τ ist ω irrational, und erf¨ Redefinition der Konstante γ) die Ungleichungen γ p γ bzw. ω − ≥ . (15.5.2) |qω − p| ≥ 2 q (p + q 2 )τ /2 |q|(p2 + q2 )τ /2 Diese sind am schwersten zu erf¨ ullen, wenn wir p und q durch ihren gr¨oßten gemeinsamen Teiler k¨ urzen. Wir nehmen auch ohne Beschr¨ankung der Allgemeinheit an, dass q ∈ N. Die diophantische Bedingung an ω bedeutet also schlechte rationale Approximierbarkeit von ω durch rationale Zahlen p/q. Die beiden Ungleichungen in (15.5.2) f¨ uhren auf unterschiedliche Approximationsmaße: 15.38 Definition F¨ ur ω ∈ R heißt die (gek¨ urzt dargestellte) rationale Zahl p/q 1. Bestapproximierende 1. Art an ω, falls f¨ ur alle p /q ∈ Q \ {p/q} mit Nenner 1 ≤ q ≤ q gilt: ω − p < ω − p . q q 2. Bestapproximierende 2. Art an ω, falls f¨ ur alle p /q ∈ Q \ {p/q} mit Nenner 1 ≤ q ≤ q gilt: |qω − p| < |q ω − p | . Die zweite Eigenschaft impliziert die erste, aber nicht umgekehrt: 15.39 Beispiel (Bestapproximierende) F¨ ur ω := 1/5 ist p/q := 1/3 Bestapproximierende 1. aber nicht 2. Art, denn in beiden F¨allen kommt nur der Bruch ur diesen gilt ω − pq = 2/15 < 1/5 = ω − pq , p /q := 0/1 in Frage, und f¨ 3 aber |qω − p| = |3/5 − 1| = 2/5 > 1/5 = |q ω − p |. Es stellt sich nun heraus, dass die Bestapproximierenden 2. Art durch die Kettenbruchentwicklung von ω gefunden werden k¨ onnen. Dazu setzen wir ω > 0 voraus und betrachten wir im Quadranten [0, ∞)2 ⊂ R2 den Strahl durch den Nullpunkt mit Steigung ω. Dieser teilt den Quadranten, und auch die Gitterpunkt-Menge N20 ⊂ [0, ∞)2 in M± := (k1 , k2 ) ∈ N20 | ±(k2 − k1 ω) ≥ 0 \ {(0, 0)}. Nur im Fall einer rationalen Steigung ω ∈ Q sind diese beiden Mengen nicht disjunkt. Die konvexen H¨ ullen von M± haben Gitterpunkte (qn , pn ) als Extreur M− und (q−1 , p−1 ) := (0, 1) malpunkte, beginnend mit (q0 , p0 ) := (1, ω) f¨ f¨ ur M+ . Diese sind Bestapproximierende 2. Art, denn ihr vertikale Abstand von der Geraden unterbietet die Abst¨ande aller Gitterpunkte (q , p ) mit kleinerer 1. Koordinate q .
15. St¨orungstheorie
405
15.40 Beispiel (Goldener Schnitt g) Seit der Antike ist die folgende Konstruktion bekannt: L2 L1 Teile eine Strecke der L¨ange L in zwei Teile der L¨angen L1 = g · L, L2 = L − L1 , mit 2 gleichen Verh¨altnissen LL1 = L L L1 . √
Es ergibt sich g = (1 − g)/g oder g 2 + g − 1 = 0, also 15 g = 5−1 ≈ 0.618. 2 Die Extremalpunkte sind hier (qn , pn ) = (Fn , Fn−1 ), siehe Abbildung 15.5.1, mit der durch F−1 := 1 , F0 := 0 und Fn := Fn−2 + Fn−1
(n ∈ N)
definierten Folge der Fibonacci–Zahlen (also F1 = F2 = 1, F3 = 2, F4 = 3, F5 = 5, F6 = 8, F7 = 13, F8 = 21 . . .; normalerweise beginnt man mit F1 ).
pk 5
M
4 3 2
M
1 1
2
3
4
5
6
qk
Abbildung 15.5.1: Gerade mit Steigung g und Extremalpunkte (qn , pn ) In diesem Fall konvergieren die Steigungen gn := pn /qn der durch die Extremalpunkte gehenden Ursprungsgeraden gegen den Goldenen Schnitt g, weil die Iteration Fn Fn 1 gn+1 = = = Fn+1 Fn + Fn−1 1 + gn den stabilen Fixpunkt g = g1 = 0 , g2 = 1 , g3 = 15 Oft
1 2
1 1+g
=
, g4 =
2 3
1 1+
1+
1 1 1+...
besitzt:
≈ 0.667 , g5 =
3 5
= 0.6 , g6 =
wird stattdessen 1/g = g + 1 als Goldener Schnitt bezeichnet.
5 8
= 0.625 , .. .
406
15.5. Diophantische Bedingung und Kettenbr¨ uche
Man berechnet die Gitterpunkte (qn , pn ) allgemein durch Kettenbruchentwick3 lung von ω ∈ R+ . 15.41 Weiterf¨ uhrende Literatur Eine gute Referenz ist Khinchin [Kh]. 15.42 Definition • Die Funktion (siehe Bild)
Gauss–Abbildung 16
h : [0, ∞) → [0, 1)
3
ist die st¨ uckweise stetige
, h(0) := 0, h(x) := 1/x − 1/x f¨ ur x > 0.
• Es sei (der Einfachheit halber) ω irrational. hx F¨ ur die Menge 1
F := {a : N0 → Z | ∀n ∈ N : an ∈ N} ganzzahliger Folgen und Φ : [0, ∞) → F,
1 2
:= ω := 1/h(n−1) ({ω})
0
Φ(ω)0 Φ(ω)n
(n ∈ N)
11 32
1
2
3
4
x
heißt dann a := Φ(ω) die Folge der Teilnenner von ω. • F¨ ur die Startwerte mit (also
( pq00
)=
1 ω
q−2 p−2
:= ( 10 ),
q−1 p−1
( pqnn ) := an ) heißt ωn :=
:= ( 01 ) und die Folgen p, q : N0 → N0
qn−1
pn qn
pn−1
+
qn−2
(15.5.3)
pn−2
die n–te Kettenbruchn¨ aherung an ω.
√ √ ur ω := 5 ≈ 2.23607 ist 15.43 Beispiel (Kettenbruchn¨ aherung von 5) F¨ √ √ {ω} = 5 − 2 = 1/( 5 + 2) ≈ 0.23607, also h(k) ({ω}) = {ω} (k ≥ 1). Damit ist a0 = 2 und a = 4 ( ≥ 1), also ω0 = 2, ω1 = 2 + 14 = 94 = 2.25, ω2 = 2 +
1 4+
1 4
=
38 ≈ 2.2353 17
und ω3 +
1 4+
1 1 4+ 4
=
161 ≈ 2.23611. 3 72
15.44 Satz (Kettenbr¨ uche) F¨ ur die Kettenbr¨ uche ωn der Irrationalzahl ω gilt: qn−2 qn−1 n . 1. det pn−2 pn−1 = (−1)n (n ∈ N0 ), also ωn−1 − ωn = q(−1) n−1 qn 2. Z¨ahler und Nenner in der Darstellung
pn qn
von ωn sind teilerfremd.
3. Die Folge (ω2m )m∈N0 ist monoton steigend, die Folge (ω2m+1 )m∈N0 ist monoton fallend. 16 In Aufgabe 9.6 wurde der Definitionsbereich [0, 1) benutzt. Die gleichnamige Abbildung in der Differentialgeometrie wurde auf Seite 109 definiert.
15. St¨orungstheorie 4. F¨ ur die Nenner der Kettenbruchn¨aherungen gilt qn ≥ 2(n−1)/2
407 (n ≥ 2).
Beweis: q q−1 = det ( 10 01 ) = (−1)0 und (15.5.3) 1. Mit dem Induktionsanfang det p−2 −2 p−1 folgt die Behauptung, denn der Induktionsschritt ist q q qn q an qn−1 +qn−2 qn−2 = det pn−1 det pn−1 = det pn−1 = (−1)n+1 . n−1 pn n−1 pn−2 n−1 an pn−1 +pn−2 2. folgt aus Teil 1) des Satzes, denn ein gemeinsamer Teiler von pn und qn muss wegen pn−1 qn − qn−1 pn = (−1)n auch (−1)n teilen. 3. Dies folgt aus (15.5.3) und Teil 1) des Satzes, denn q q qn qn−1 det pn−2 det pn−2 pn−2 an pn n−2 pn n−2 pn−1 − = = an = (−1)n . qn qn−2 qn−2 qn qn−2 qn qn−2 qn 4. Dies folgt aus dem Induktionsanfang q3 ≥ q2 = a2 + 1 ≥ 2 und Induktionsschritt qn = an qn−1 + qn−2 ≥ qn−1 + qn−2 ≥ 12 2n/2 + 2(n−1)/2 . 2 15.45 Aufgabe (Kettenbruchentwicklung) Zeigen Sie, dass f¨ ur Irrationalzah3 len ω die Kettenbruchentwicklung konvergiert, d.h. gilt: limn→∞ ωn = ω. Daraus folgt mit Satz 15.44 die Absch¨atzung der Konvergenzgeschwindigkeit: 15.46 Korollar Alle irrationalen Zahlen ω lassen sich im folgenden Sinn durch rationale Zahlen approximieren: 1 pn ω − pn−1 < 1 < 2 oder ω − (n ∈ N). 2 qn−1 2qn−1 qn 2qn Beweis: Nach Teil 3 und 1 von Satz 15.44 und wegen qn−1 < qn ist pn−1 1 1 pn pn−1 pn 1 1 = = ω − + − <2 + 2 . 2 2 qn−1 − ω qn qn−1 qn qn−1 qn qn−1 qn
15.47 Bemerkung (Parameter der diophantischen Bedingung) Wir ersehen hieraus, dass in der diophantischen Bedingung (15.5.1) der Exponent τ tats¨achlich gr¨oßer oder gleich 1 sein muß, weil sie sonst f¨ ur kein ω erf¨ ullt w¨are. F¨ ur τ = 1 muß nach Korollar 15.46 die Konstante γ ≤ 12 sein, damit die Menge Ωγ,τ nicht leer ist. Das Beispiel des goldenen Schnittes ω = g zeigt, dass diese Absch¨atzung realistisch ist (siehe Khinchin [Kh], Kapitel 7). g ist die im diophantischen Sinn am schlechtesten approximierbare Zahl, weil die Teilnenner seiner Kettenbruchentwicklung gleich 1, also minimal sind. 3
408
15.6. Cantori: Am Beispiel der Standardabbildung
Der Antikythera–Mechanismus Dieses astronomische Berechnungsger¨at wurde im Jahr 1900 in einem vor der K¨ uste der griechischen Insel Antikythera untergegangenen Schiff gefunden. Es stammt etwa aus dem 2. Jahrhundert vor Christus und besteht aus u ¨ber 30 Zahnr¨adern. Es ist das einzige bekannte Instrument seiner Art aus dieser Zeit. Tony Phillips spekuliert auf der Feature Column-Seite der American Mathematical Society dar¨ uber, wie etwa die exzellente mechanische N¨aherung 254/19 = 13.368 421.. (der Meton–Zyklus) an das astronomische Verh¨altnis 13. 368 267.. von Jahr und (tropischem) Monat gefunden wurde. Aus der Kettenbruchentwicklung 13. 368 267.. = [13, 2, 1, 2, 1, 1, 17, ...] ergibt sich in der Tat [13, 2, 1, 2, 1, 1] = 254/19, w¨ahrend die n¨achstbessere Approximation [13, 2, 1, 2, 1, 1, 17] = 4465/334 = 13. 368 263.. sich wohl mechanisch nicht h¨atte realisieren lassen.
15.6
Cantori: Am Beispiel der Standardabbildung
Die Standardabbildung oder Chirikov–Taylor–Abbildung ist eine Familie von Abbildungen Fε = (Fε,1 , Fε,2 ) ∈ C ∞ (R2 , R2 ) der Ebene auf sich, gegeben durch Fε (x, y) = x + y + ε sin(2πx) , y + ε sin(2πx) . Diese besitzen folgende elementare aber wichtige Eigenschaften: cos(2πx) 1 1. Fε ist fl¨achenerhaltend, denn DFε (x, y) = 1+2πε . 2πε cos(2πx) 1 2. Fε ist doppeltperiodisch, d.h. es gilt Fε (x + x , y + y ) = Fε (x, y) + (x , y ) f¨ ur alle (x, y) ∈ R2 und (x , y ) ∈ Z2 . Damit definiert sie eine Familie fl¨achenerhaltender Abbildungen fε : T2 → T2 des Zwei-Torus T2 = R2 /Z2 . Als Koordinaten verwenden wir x, y ∈ [0, 1).
15. St¨orungstheorie
409
3. Die Abbildungen fε = (fε,1 , fε,2 ) besitzen die Twisteigenschaft ∂fε,1 (x, y) > 0 ∂y
(x, y) ∈ T2 .
Die Abbildung f0 ist sehr einfach, n¨amlich im folgenden Sinn integrabel: • der Torus T2 wird in die f0 –invarianten, durch die Rotationszahl r ∈ [0, 1) parametrisierten Kreislinien Sr := {(x, y) ∈ T2 | y = r} gefasert. • Auf diesen eindimensionalen Tori Sr wirkt f0 durch Translation um r. ur f0 die TwistF¨ ur ε > 0 sind die Sr nicht mehr fε –invariant. Andererseits ist f¨ eigenschaft analog zur Bedingung (15.4.31) der unabh¨angigen Variation der Frequenzen. Tats¨achlich gilt eine dem KAM-Theorem (Satz 15.32) analoge Aussage, nach der f¨ ur kleine ε eine große 17 Teilmenge Mε des Phasenraums T2 immer noch durch fε –invariante Kreislinien gefasert wird.
ε = 0.05
ε = 0.155
ε = 0.19
Abbildung 15.6.1: Numerische Iterationen der Standardabbildung
Bei Vergr¨oßerung von ε werden mehr und mehr dieser durch ihre Rotationszahl definierten fε –invarianten Tori nicht nur deformiert, sondern zerst¨ort, siehe Abbildung 15.6.1. F¨ ur große Werte von ε gibt es keine solchen Tori mehr, wie in [Mac] von MacKay und Percival bewiesen. Die Abbildungen fε besitzen die Spiegelsymmetrie fε ◦ I = I ◦ fε mit I : T2 → T 2
, (x, y) → (1 − x, 1 − y) (mod 1).
I bildet damit Orbits auf Orbits ab, ist also eine Symmetrie der Phasenraumportraits (siehe Abb. 15.6.1). Je zwei fε –invariante Tori S, S ⊂ T2 teilen den Phasenraum in die beiden ihrerseits fε –invarianten Zusammenhangskomponenten von T2 \ (S ∪ S ) auf. Diese sind Kreisringe. Die beiden letzten etwa bis ε = 0.155 u invarianten Tori besitzen ¨berlebenden √ die Rotationszahl des Goldenen Schnitts g = 12 ( 5 − 1) beziehungsweise 1 − g. 17 Das
√ Haar–Maß von T2 \ Mε ist von der Ordnung O( ε).
410
15.6. Cantori: Am Beispiel der Standardabbildung
In Abbildung 15.6.2 sieht man anschaulich den Grund f¨ ur die Robustheit dieser beiden invarianten Tori. F¨ ur die Rotationszahl g verteilen sich die Iterierten n¨amlich besonders gleichm¨aßig, und der Orbit wird daher durch die sinusf¨ormige St¨orung weniger stark beeinflußt. Ε0.01
y 1
R
1
0.8 2 7 0 5 10 0.6 0 2 4 6 8 10
4
91
6
3
0
8
Golden
13579
0 0.527
1 2
0
0.4
0.1
0.2 0
0 0
12
1
1 2 3 4 5 6 7 8 9 10
y 0.2
0.4
0.6
0.8
1
x
Abbildung 15.6.2: Links: Rotationszahl Rε f¨ ur ε = 0.155 und Anfangspunkte (x, y) mit x = .3. Rechts: Je 10 Iterationen der Standardabbildung f−0.01 , f¨ ur drei Rotationszahlen. In den in Abbildung 15.6.1 gezeigten Orbits zeigt die Farbwahl die Anzahl der mit dem Goldenen Schnitt g oder 1 − g u ¨bereinstimmenden Folgenglieder in der Kettenbruchentwicklung der (numerisch bestimmten) Rotationszahlen. Rot eingef¨arbt sind die Orbits, deren Rotationszahlen mit dem Goldenen Schnitt am besten u ¨bereinstimmen. Dies visualisiert die obige Aussage u ¨ber die beiden letzten u ¨berlebenden invarianten Tori. Auch f¨ ur ε = 0 k¨ onnen wir Phasenraumpunkten (x, y) ∈ T2 analog zu (2.2.4) eine Rotationszahl 1 (n) Rε (x, y) := lim Fε,1 (x, y) n→∞ n (n)
zuordnen, mit der n–ten Iterierten Fε von Fε . Nach dem Ergodensatz von Birkhoff (Satz 9.32) existiert dieser Limes f¨ ur fast alle Phasenraumpunkte. Wie man in Abbildung 15.6.2 (links) sehen kann, sind die Rotationszahlen in der N¨ahe eines elliptischen periodischen Punktes lokal konstant 18 . Es ist aber keineswegs selbstverst¨andlich, dass es f¨ ur eine vorgegebene Zahl r einen fε –Orbit mit dieser Rotationszahl r gibt. Dies wurde von Mather in [Mat] gezeigt, unter Benutzung der Twisteigenschaft. Ist r rational, dann existiert ein periodischer Orbit mit dieser Rotationszahl. F¨ ur irrationale r und große ε bilden Orbits mit dieser Rotationszahl einen sog. Cantorus statt einem KAM-Torus, eine fε –invariante Cantor–Menge. ¨ 15.48 Weiterf¨ uhrende Literatur Uberblicke uber diese sogenannte Aubry-Ma¨ ther-Theorie findet man in Moser, [Mos5] und Siburg, [Sib]. 3 18 im Bild f¨ ur y–Werte nahe 0 (mod 1) gleich 0 (mod 1), f¨ ur y–Werte nahe 1/2 (mod 1) gleich 1/2 (mod 1).
Kapitel 16
Relativistische Mechanik
T¨ ubingen zu Fuß (links) und bei vier F¨ unftel der Lichtgeschwindigkeit (rechts); aus [KB]
16.1 16.2 16.3 16.4 16.5 16.6
Die Lichtgeschwindigkeit . . . . . . . . ´ Die Lorentz– und die Poincare–Gruppe Geometrie des Minkowski–Raumes . . Die Welt in relativistischer Sichtweise . Von Einstein zu Galilei — und zuruck ¨ . Relativistische Dynamik . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. 412 . 414 . 419 . 425 . 430 . 435
Das Relativit¨atsprinzip besagt, dass in den Gesetzen der Physik nur Relativ geschwindigkeiten vorkommen, es also insbesondere sinnlos ist, einen Zustand absoluter Ruhe zu postulieren. Die erste Relativit¨atstheorie (also eine auf dem Relativit¨atsprinzip aufbauen¨ de kinematische Theorie) stammt von Galileo Galilei. Ahnlich wie die Spezielle Relativit¨atstheorie Albert Einsteins setzt sie Isotropie des Raumes R3 und Homogenit¨at der Raumzeit R3 × R voraus und besagt, dass die physikalischen Gesetze in allen Inertialsystemen (nicht beschleunigten Koordinatensystemen) die gleiche Form besitzen. Galilei begr¨ undet seine Relativit¨atstheorie im 1632 erschienenen Dialog u ¨ber die beiden haupts¨achlichen Weltsysteme 1 [Gal1] mit der Unm¨oglich1 in
dem er das ,kopernikanische Weltsystem’ vorstellte und dessentwegen er von der Kirche
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 16,
411
412
16.1. Die Lichtgeschwindigkeit
keit, in einem abgeschlossenen Raum eines Schiffes dessen Geschwindigkeit experimentell festzustellen. Wird die Relativgeschwindigkeit eines Bezugssystems a zum Bezugssystem b mit va,b ∈ R3 bezeichnet, dann folgt nach Galilei die vektorielle Additionsregel v1,3 = v1,2 + v2,3 .
(16.0.1)
Der Unterschied zur Speziellen Relativit¨atstheorie Einsteins besteht in Galileis Annahme, dass die Lichtgeschwindigkeit unendlich sei. Es hat sich aber eingeb¨ urgert, dynamische Systeme, bei denen die auftretenden Geschwindigkeiten klein gegen die Lichtgeschwindigkeit sind, nichtrelativistisch zu nennen, w¨ahrend relativistisch f¨ ur die einsteinsche Relativit¨atstheorie steht.
16.1
Die Lichtgeschwindigkeit
Die spezielle Relativit¨atstheorie weicht also von der klassischen Mechanik nicht ” durch das Relativit¨atspostulat ab, sondern allein durch das Postulat von der Konstanz der Vakuum-Lichtgeschwindigkeit.” Albert Einstein, in [Ei2] Die Frage, ob das Licht sich mit endlicher Geschwindigkeit oder instantan (das heißt: augenblicklich) ausbreitet, war seit der Zeit der antiken griechischen Naturforscher umstritten. Eine Messung der Lichtgeschwindigkeit Salviati: Und der Versuch, den ich ersann, war folgender: Von zwei Personen ” h¨alt eine jede ein Licht in einer Laterne oder etwas dem ¨ahnlichen, und zwar so, daß ein jeder mit der Hand das Licht zu- und aufdecken k¨onne; dann stellen sie sich einander gegen¨ uber auf in einer kurzen Entfernung und u ¨ben sich, ein jeder dem anderen sein Licht zu verdecken und aufzudecken: in der Weise, dass, wenn der eine das andere Licht erblickt, er sofort das seine aufdeckt... Einge¨ ubt in kleiner Distanz, entfernen sich die beiden Personen mit ihren Laternen bis auf 2 oder 3 Meilen; und indem sie nachts ihre Versuche anstellen, beachten sie aufmerksam, ob die Beantwortung ihrer Zeichen in demselben Tempo wie zuvor erfolge, woraus man wird schließen k¨onnen, ob das Licht sich instantan fortpflanzt;...” Sagredo: Ein sch¨ oner und sinnreicher Versuch, aber, sagt uns, was hat sich ” bei der Ausf¨ uhrung desselben ergeben?” Salviati: Ich habe den Versuch nur in geringer Entfernung angestellt, in weniger ” als einer Meile, woraus noch kein Schluß u ¨ber die Instantaneit¨at des Lichts zu ziehen war; aber wenn es nicht momentan ist, so ist es doch sehr schnell, fast ¨ momentan...” Galileo Galilei: Uber zwei neue Wissenszweige (1638), zitiert nach [Gal2], Seite 363–364. verfolgt wurde.
16. Relativistische Mechanik
413
Wie im Kasten dargestellt, schlug Galileo eine Kl¨arung der Frage durch Messung vor. Galileos Methode lieferte nur eine untere Schranke an die Lichtgeschwindigkeit, aber ein anderer Vorschlag f¨ uhrte wenig sp¨ater zum Erfolg. Ein entscheidendes Problem der Schifffahrt dieser Zeit war die Bestimmung des L¨angengrades. Der Breitengrad ist einfach zu bestimmen, etwa durch Messung der H¨ohe des Polarsternes u ¨ber dem Horizont. Dagegen erfordert die Bestimmung des L¨angengrades durch Messung der H¨ohe eines Sternes bzw. der Sonne u ostlichen Horizont die Kenntnis der Uhrzeit. ¨ber dem westlichen oder ¨ Die damaligen Schiffsuhren waren daf¨ ur aber nicht genau genug, besonders bei langen Reisen. Galileo schlug nun vor, die vorausberechneten Verfinsterungen der Jupitermonde als universale Uhr zu benutzen. Tats¨achlich war die Methode auf See nicht praktikabel (siehe das spannende Buch L¨angengrad von Dava Sobel [Sob1]), wurde aber an Land benutzt. Im Jahr 1671 besuchte der d¨anische Astronom Ole Rømer die Insel Hven, um den Breitengrad des alten Observatoriums von Tycho Brahe festzustellen und damit dessen Daten an die der Pariser Sternwarte anzuschließen. In einer Beobachtungsreihe von etwa acht Monaten und 140 Verfinsterungen des Jupitermondes Io stellte Rømers Skizze mit Erde, er eine mit dem Abstand von Jupiter und Erde variieSonne, Jupiter und Io rende Abweichung von den Berechnungen fest. 1676 ver¨offentlichte er seine Theorie, nach der diese auf die Endlichkeit der Lichtgeschwindigkeit zur¨ uckzuf¨ uhren sei (siehe die Skizze von Ole Rømer) und sch¨atzte die Zeit, die das Sonnenlicht ben¨ otigt, um die Erde zu erreichen, auf etwa 11 Minuten ab [MKO]. Damit war Galileis Relativit¨atstheorie widerlegt, nicht aber sein Relativit¨atsprinzip. Huygens und andere argumentierten nun, dass keine materiellen Teilchen derart schnell sein k¨ onnten. Statt dessen solle man sich die Lichtausbreitung als eine Dichteschwankung in einer den Raum f¨ ullenden Substanz vorstellen, ¨ahnlich der Ausbreitung von Schall in Luft. ¨ Diese Athertheorie stand nun auch in Widerspruch zum Invarianzprinzip von Galilei und sp¨ater Newton, nach dem nur Relativgeschwindigkeiten, keine Absolutgeschwindigkeiten definierbar seien. Tats¨achlich stellte sich aber 1887 bei einer verfeinerten Messung der Lichtgeschwindigkeit durch Michelson und Morley heraus, dass diese nicht durch die Bewegung der Erde um die Sonne beeinflußt wurde. Da also sowohl Galileis ¨ Relativit¨atstheorie als auch die Athertheorie widerlegt waren, mußte eine neue Relativit¨atstheorie formuliert werden. Dies gelang Einstein 1905 in seinem Artikel Zur Elektrodynamik bewegter K¨orper [Ei1]. Seit 1983 ist ein Meter als diejenige Strecke definiert, die Licht im Vakuum binnen des 299 792 458sten Teils einer Sekunde zur¨ ucklegt. Die Lichtgeschwin-
414
16.2. Die Lorentz– und die Poincar´e–Gruppe
digkeit in m/s kann also nicht mehr gemessen werden (statt dessen aber etwa die L¨ange des in Paris befindlichen Urmeters in Einheiten des so definierten Meters). Wir benutzen im Weiteren Einheiten, in denen die Lichtgeschwindigkeit gleich Eins ist. Will man die Formeln in einem anderen Einheitensystem interpretieren, muß man alle vorkommenden Geschwindigkeiten durch die Lichtgeschwindigkeit c in diesem System dividieren.
16.2
Die Lorentz– und die Poincar´ e–Gruppe
Es ist eine Mannigfaltigkeit und in derselben eine Transformationsgruppe ” gegeben; man soll die der Mannigfaltigkeit angeh¨origen Gebilde hinsichtlich solcher Eigenschaften untersuchen, die durch die Transformationen der Gruppe nicht ge¨andert werden.” Felix Klein (1872), in [Kl] Mathematisch gesehen besteht die einsteinsche Spezielle Relativit¨atstheorie im Kern aus der Theorie der Poincar´e–Gruppe und einer Untergruppe, der Lorentz–Gruppe. Wir untersuchen zun¨achst die Lorentz–Gruppe (als Spezialfall der sogenannten indefinit orthogonalen Gruppen), bevor wir ihre physikalische Bedeutung erkunden. Dies entspricht dem Ansatz des Erlanger Programms von Felix Klein, nach dem eine Geometrie durch Untersuchung ihrer Transformationsgruppe analysiert wird. Die Geometrie selbst ist durch eine Bilinearform auf der Raumzeit definiert: 16.1 Definition • F¨ ur m, n ∈ N0 und k := m + n sei eine symmetrische Bilinearform mit Signatur (m, n) definiert durch ·, ·m,n : Rk × Rk → R,
,
v, wm,n =
m =1
v w −
k
v w . (16.2.1)
=m+1
• Die indefinite orthogonale Gruppe ist deren Transformationsgruppe: O(m, n) := A ∈ GL(k, R) | ∀v, w ∈ Rk : Av, Awm,n = v, wm,n . • R4 , ·, ·3,1 heißt Minkowski–Raum. L := O(3, 1) heißt auch Lorentz– Gruppe, ihre Elemente Lorentz–Transformationen. • Die Poincar´ e–Gruppe ist das semidirekte Produkt P := R4 L mit Verkn¨ upfung (a, A) ◦ (b, B) := (a + Ab, AB). 16.2 Bemerkungen 1. Nach dem Tr¨agheitssatz von Sylvester (Satz 6.13.1) ist jede nicht degenerierte symmetrische Bilinearform auf einem k–dimensionalen reellen Vektorraum in einer geeigneten Basis von der Gestalt (16.2.1) (und die Zahlen m und n h¨angen nicht von der Wahl der Basis ab).
16. Relativistische Mechanik
415
2. Wegen der Beziehung ·, ·n,m = − M ·, M ·m,n mit der Permutationsma trix M := 1l0n 1l0m ∈ Mat(k, R) ist O(n, m) isomorph zu O(m, n). 3. ·, · := ·, ·k,0 ist das euklidische Skalarprodukt, und O(k, 0) = O(k) ist die orthogonale Gruppe. 4. Mit der Diagonalmatrix I := 1l0m −10ln = 1lm ⊕ (−1ln ) ∈ Mat(k, R) ist ·, ·m,n = ·, I ·. Also ist eine Matrix A ∈ Mat(k, R) genau dann in O(m, n) wenn A IA = I. ¨ 5. Ublich ist die Nummerierung der Komponenten eines Vektors im Minkowski– v1 Raum in der Form vv23 ∈ R4 . Man nennt dann v4 seine Zeitkomponente und v4 v1 3 v2 seine Raumkomponente. Ebenso kommt aber auch die Schreib∈ R v3 v0 weise vv12 ∈ R4 mit Bilinearform v, w1,3 = v0 w0 − v1 w1 − v2 w2 − v3 w3 v3
vor, wobei die nullte Komponente als Zeit interpretiert wird. In der physikalischen Literatur wird statt v, w3,1 kurz vα wα geschrieben, mit einsteinscher Summenkonvention. Lateinische statt griechische Summationsindices stehen dann f¨ ur die r¨aumlichen Komponenten, also etwa va wa = v1 w1 + v2 w2 + v3 w3 .
3
16.3 Satz (Lorentz–Gruppe) • Die indefiniten orthogonalen Gruppen O(m, n) sind Lie–Gruppen der Dimension 12 k(k − 1), mit k = m + n. Insbesondere ist dim(L) = 6. • Die Polarzerlegung einer Matrix A ∈ O(m, n) ist von der Form A = OP mit O = O0m O0n ∈ O(m) × O(n) ⊂ O(m, n), und P = exp θ0 0θ f¨ ur θ ∈ Mat(n × m, R). • F¨ ur 0 < m < k ist O(m, n) nicht kompakt und besteht aus vier Zusammenhangskomponenten. Die Zusammenhangskomponente der Eins besitzt dabei eine Polarzerlegung mit Om ∈ SO(m) und On ∈ SO(n). Die Determinanten der Matrizen zweier dieser Komponenten sind gleich 1, f¨ ur die anderen beiden Komponenten gleich −1. Beweis: • O(m, n) ist eine Gruppe und Urbild des regul¨aren Wertes I = 1l0m −10ln der Abbildung GL(k, R) −→ Sym(k, R)
,
A −→ A IA
(vergleiche mit dem Spezialfall der orthogonalen Gruppe O(k) in Beispiel E.19.2). Damit ist O(m, n) eine Lie–Gruppe, und dim O(m, n) = dim GL(k, R) − dim Sym(k, R) = ( k2 ) .
416
16.2. Die Lorentz– und die Poincar´e–Gruppe
• Zun¨achst ist mit A auch A = IA−1 I in O(m, n), denn A−1 ∈ O(m, n), und die Involution B → IBI bildet O(m, n) auf sich ab. Damit ist mit A auch die ur die Wurzel positive Matrix A A ∈ O(m, n), und gleiches gilt f¨ 1/2 ˜ = exp(θ) P = A A
mit
θ˜ :=
1 2
log A A ∈ Sym(k, R) ∩ o(m, n)
in der Polarzerlegung A = OP . Da die Elemente a der Lie–Algebra o(m, n) ⊂ Mat(k, R) von O(m, n) durch die Relation a I + Ia = 0 charakterisiert sind, ist 0 θ ˜ θ von der angegebenen Form θ 0 . • Zahl und Form der Zusammenhangskomponenten ergibt sich aus der Gestalt der Polarzerlegung und der (in Beispiel E.19.2 bewiesenen) Tatsache, dass die orthogonale Gruppe O() die Drehgruppe SO() und die Spiegelungen des R an Hyperebenen als ihre beiden Zusammenhangskomponenten haben. Die Werte von det(A) ergeben sich mit Satz 4.12 aus der Polarzerlegung A = ˜ = det(O) = det(Om ) det(On ). O exp θ˜ : det(A) = det(O) exp tr(θ) 2 16.4 Bemerkungen (Untergruppen der Lorentz–Gruppe) 1. Die indefinite spezielle orthogonale Gruppe SO(m, n) besteht aus den Elementen von O(m, n) mit Determinante +1, und besitzt damit f¨ ur m, n > 0 genau zwei Zusammenhangskomponenten. 2. Im Fall der Lorentz–Gruppe L = O(3, 1) wird die durch I = diag(1, 1, 1, −1) beziehungsweise −I = diag(−1, −1, −1, 1) definierten linearen Abbildungen auch Zeitspiegelung bzw. Raumspiegelung genannt, und die Zusammenhangskomponente der Eins auch als echt orthochrone oder restringierte Lorentz– Gruppe L↑+ = SO+ (3, 1) bezeichnet. Zusammen mit der Komponente L↑− := IL↑+ bildet sie die orthochrone Lorentz– Gruppe L↑ := L↑+ ∪˙ L↑− . Die anderen Zusammenhangskomponenten sind L↓+ := −L↑+ und L↓− := −IL↑+ . Der Subindex bezeichnet also das Vorzeichen der Determinante. 3. F¨ ur alle 0 ≤ m ≤ m und 0 ≤ n ≤ n gibt es in O(m, n) zu O(m , n ) isomorphe Untergruppen, denn mit A ∈ O(m , n ) ist zum Beispiel A := 1lm−m ⊕ A ⊕ 1ln−n ∈ O(m, n). Damit ist auch die Gruppe O(m) × O(n) eine Untergruppe von O(m, n). Im Fall der restringierten Lorentz–Gruppe besteht SO+ (3, 1) ∩ O(3) × O(1) aus den Raumdrehungen, ist also eine zu SO(3) isomorphe Gruppe. Diese Symmetrie entspricht der sogenannten Isotropie der Raumzeit. 4. Dagegen bilden die positiven Matrizen in der Polarzerlegung (die sogenannten speziellen Lorentz–Transformationen oder Lorentz–boosts) keine Untergruppe der Lorentz–Gruppe, denn diese Teilmenge ist unter Produktbildung nicht abgeschlossen (siehe (16.2.6)). 3
16. Relativistische Mechanik
417
16.5 Beispiel (Zweidimensionale Raumzeit) In Sinn der vorletzten Bemerkung k¨onnen wir O(1, 1) als Untergruppe der Lorentz–Gruppe O(3, 1) auffassen. Deren Zusammenhangskomponente der Eins ist 2
cosh(θ) sinh(θ) (16.2.2) SO+ (1, 1) := exp θ0 θ0 = sinh(θ) cosh(θ) θ ∈ R , entspricht also einer Untergruppe der restringierten Lorentz–Gruppe SO+ (3, 1). Der Parameter θ wird Rapidit¨at genannt. Er hat gegen¨ uber der Parametrisierung √1 √v cosh(θ) sinh(θ) 2 1−v 2 (16.2.3) = √1−v v √ 1 sinh(θ) cosh(θ) 2 1−v 1−v 2 mit der Geschwindigkeit v = tanh(θ) ∈ (−1, 1) den Vorteil der Additivit¨at, denn cosh(θ1 ) sinh(θ1 ) cosh(θ2 ) sinh(θ2 ) cosh(θ1 +θ2 ) sinh(θ1 +θ2 ) sinh(θ1 ) cosh(θ1 ) sinh(θ2 ) cosh(θ2 ) = sinh(θ1 +θ2 ) cosh(θ1 +θ2 ) . Dagegen ist die relativistische Summe der (parallelen) Geschwindigkeiten vi := tanh(θi ) gleich v1 + v2 v := tanh artanh(v1 ) + artanh(v2 ) = ∈ (−1, 1). 1 + v1 v2
(16.2.4)
Durch relativistische Addition dieser Geschwindigkeiten wird also die Lichtgeschwindigkeit nicht u ¨berschritten. Diese Komposition von parallelen Geschwindigkeiten ist kommutativ und assoziativ (mit der relativistischen Summe v1 + v2 + v3 + v1 v2 v3 Zeit 1 + v1 v2 + v1 v3 + v2 v3 dreier Geschwindigkeiten). F¨ ur nichtrelativistischen Geschwindigkeiten |vi | " 1 gilt wie bei Galilei (siehe (16.0.1)) in guter N¨aherung =
v ≈ v 1 + v2 .
Raum
Die Orbits von SO+ (1, 1) in R2 sind (abgesehen vom Nullpunkt) Hyperbeln und die Halb-Diagonalen, siehe die nebenstehende Abbildung. 3 Wir u ¨bertragen jetzt die Parametrisierung (16.2.3) der zu (R, +) isomorphen Gruppe SO+ (1, 1) auf die sechsdimensionale Lie–Gruppe SO+ (3, 1). 16.6 Aufgaben (Lorentz–boosts) 1. Zeigen Sie, dass die von der Identit¨at L(0) := 1l4 verschiedenen Lorentz–boosts in der restringierten Lorentz–Gruppe 2 mit
dem Matrixexponential aus (4.1.5).
418
16.2. Die Lorentz– und die Poincar´e–Gruppe
SO+ (3, 1) die folgenden symmetrischen Matrizen sind: (1l3 − Pv )/γ(v) + Pv v v ∈ R3 , 0 < v < 1 , L(v) := γ(v) v 1 (16.2.5) v⊗v 2 −1/2 und der Orthogonalprojektion Pv = v2 auf mit γ(v) := (1 − v ) span(v) ⊂ R3 . (16.2.5) ist das Analog zu (16.2.3). ˜ einer Matrix A = a b ∈ 2. Folgern Sie, dass in der Polarzerlegung A = OP c d SO+ (3, 1) (mit a ∈ Mat(3, R), b, c ∈ R3 und d ∈ R) die positive Matrix ˜ von der Form P = L(c/d) ist, also die orthogonale Matrix die Gestalt O = O ⊕ 1 = AL(−c/d) besitzt. Folgern Sie weiter, dass d = 1 + b 2 und b = Oc gilt. Man kann also die Polarzerlegung von A relativ leicht aus den Komponenten von A ablesen. 3. Zeigen Sie unter Verwendung von (16.2.5) und 2., dass f¨ ur die ,relativistische Summe’ der Geschwindigkeiten v1 , v2 ∈ R3 , vi < 1 die Formel ˜ L(u) L(v1 )L(v2 ) = D
v1 + v2 + mit
u=
v1 ×(v1 ×v2 ) 1+
√
1−v1 2
1 + v1 , v2
(16.2.6)
˜ := D ⊕ 1, D ∈ SO(3) gilt. Diese Komposition von Geschwindigkeiten und D ist weder kommutativ noch assoziativ, wenn v1 , v2 linear unabh¨angig sind. ¨ Uberpr¨ ufen Sie, dass immerhin die Norm von u ein in den Geschwindigkeiten v1 und v2 symmetrischer Term ist: 1 − v1 2 1 − v2 2
v1 + v2 2 − v1 × v2 2 2
u = =1− < 1. (1 + v1 , v2 )2 (1 + v1 , v2 )2 4. Wir schreiben die Komposition (16.2.6) von Lorentz–boosts in der Form ˜ 12 L(u12 ) L(v1 )L(v2 ) = D
˜ 21 L(u21 ). , und analog L(v2 )L(v1 ) = D (16.2.7)
Schließen Sie aus • dem Transformationsgesetz der Geschwindigkeiten v ∈ R3 , v < 1 ˜ ˜ = L(Dv) DL(v) D
˜ := D ⊕ 1 mit D
(16.2.8)
von Lorentz–boosts (16.2.5) unter Raumdrehungen D ∈ SO(3), • der Invarianz des Vektors (v1 × v2 ) ⊕ 0 ∈ R4 unter L(v1 ) und L(v2 ), ˜ (also der Transposition von • und der Relation L(v2 )L(v1 ) = L(u12 ) D 12 (16.2.7)),
16. Relativistische Mechanik
419
∈ SO(3) die Drehmatrix ist, die eine Drehung um die von dass D12 = D21 uhrt. v1 × v2 aufgespannte Achse bewirkt und dabei u12 in u21 u ¨berf¨
Diese Drehmatrix heißt auch Thomas–Matrix 3 . In Ungar [Un] findet man eine Diskussion der Thomas–Rotation. 3
16.3
Geometrie des Minkowski–Raumes
Time flies like an arrow; fruit flies like a banana.” Groucho Marx zugeschrieben ” Wir wissen jetzt genug u ¨ber die Transformationsgruppe des Minkowski–Raums, um dessen Geometrie genauer zu untersuchen. 16.7 Definition 1. Ein Vektor u im Minkowski–Raum R4 , ·, ·3,1 heißt zeitartig, lichtartig 4 bzw. raumartig, falls u, u3,1 < 0, = 0 bzw. > 0 gilt. 2. Die Menge C ⊂ R4 der lichtartigen Vektoren heißt Lichtkegel, mit dem Vorw¨ arts- beziehungsweise R¨ uckw¨ artslichtkegel C ± := {u ∈ C | ±u4 > 0}. 16.8 Aufgabe (Minkowski–Produkt) Zeigen Sie, dass ein Paar v, w zeitartiger ur Paare Vektoren immer ein Minkowski–Produkt v, w3,1 = 0 besitzt, dies aber f¨ raumartiger Vektoren nicht gilt. 3 16.9 Bemerkungen (Lichtgeschwindigkeit) 1. Einem Vektor u = (u1 , u2 , u3 , u4 ) ∈ R4 mit nichtverschwindender Zeitkomponente u4 = 0 weisen wir wie in der nichtrelativistischen Theorie den Geschwindigkeitsvektor u1 ? G(u) := uu2 u4 ∈ R 3 3
zu. Die lichtartigen u besitzen die Geschwindigkeit G(u) = 1, die Lichtgeschwindigkeit. F¨ ur zeitartige u ist G(u) < 1. 2. Lorentz–Transformationen ¨andern den Charakter eines Vektors im Sinn von Definition 16.7.1 nicht und bilden den Lichtkegel C auf sich ab. Die (in Bemerkung 16.4.2 definierten) orthochronen Lorentz–Transformationen bilden dabei C + und C − jeweils auf sich ab. 3 Jede Basis des Minkowski–Raums R4 definiert ein Koordinatensystem in der Raumzeit. Aber nicht jede Basis ist physikalisch angemessen. Jedenfalls ist die unftig, denn es gilt ei , ek 3,1 = δi,k sk mit kanonische Basis e1 , e2 , e3 , e4 vern¨ s 1 = s 2 = s3 = 1
und s4 = −1.
3 nach dem britischen Mathematiker und Physiker Llewellyn Hilleth Thomas (1903–1992), der 1926 die nach ihm benannte relativistische Pr¨ azession der Elektronen im Atom voraussagte. 4 Die Zuordnung der Nullpunktes ist in der Literatur nicht einheitlich.
420
16.3. Geometrie des Minkowski–Raumes
Die Maßst¨abe in den Raum- und der Zeitrichtung sind also normiert. Gleiches gilt f¨ ur eine Basis f1 , f2 , f3 , f4 genau dann, wenn es eine Lorentz– Transformation M gibt mit fk = M ek . Nach Bemerkung 16.9.2 sind dann f1 , f2 , f3 raumartig und f4 zeitartig, siehe nebenstehende Abbildung. Dort sind die Hyperboloide der Punkte u mit u, u3,1 = ±1 eingezeichnet, sowie auch ein von der f -Basis erzeugtes Koordinatennetz.
t f4 e4
f1 e1
x1
Zwar erhalten wir umgekehrt allein durch Angabe eines Geschwindigkeitsvektors v ∈ R3 , v < 1 noch kein Koordinatensystem, aber immerhin zwei ¨ Aquivalenzrelationen auf der Raumzeit. F¨ ur alle Inertialsysteme, die sich mit dieser Geschwindigkeit gegen das durch die kanonische Basis e1 , e2 , e3 , e4 gegebene Inertialsystem bewegen, beschreiben diese die gleichzeitigen beziehungsweise am gleichen Ort stattfindenden Ereignisse. Bezeichnen wir n¨amlich f¨ ur einen beliebigen zeitartigen Vektor f ∈ G−1 (v) den Lorentz–orthogonalen Unterraum f ⊥ := {e ∈ R4 | e, f 3,1 = 0}, dann h¨angen dieser und span(f ) nur von v ab. In jedem um a ∈ R4 verschobenen affinen Unterraum span(f ) + a sind die Ereignisse zueinander gleichortig. f ⊥ ist dreidimensional, und eine kleine Erweiterung der ersten Aussage aus ur einen Aufgabe 16.8 zeigt, dass alle Vektoren aus f ⊥ \ {0} raumartig sind. F¨ Beobachter mit dieser Geschwindigkeit v sind in jedem um a ∈ R4 verschobenen affinen Unterraum f ⊥ + a die Ereignisse zueinander gleichzeitig. 16.10 Bemerkung (konstante Lichtgeschwindigkeit und Lorentz–Gruppe) Bemerkung 16.9.2 rechtfertigt teilweise die Lorentz–Transformationen als Transformationen der Raumzeit, denn unter ihnen bleibt die Lichtgeschwindigkeit konstant. Zwar bilden auch die Dilatationen λ ∈ (0, ∞) (16.3.1) R4 −→ R4 , x −→ λx den Lichtkegel auf sich ab, ver¨andern aber die Minkowski–Bilinearform ·, ·3,1 durch Multiplikation mit λ2 . F¨ ur drei Raumdimensionen (nicht aber f¨ ur eine Raumdimension!) ist die um die Dilatationen (16.3.1) erweiterte Lorentz–Gruppe die gr¨oßte die Kausalit¨at erhaltende Symmetriegruppe, siehe Zeeman [Zee]. In diesem Sinn ist das Zitat von Einstein auf Seite 412 zu verstehen. 3 Die Bedeutung der Minkowski–Bilinearform geht also dar¨ uber hinaus, dass man mit ihr den Lichtkegel (sowie Zukunft und Vergangenheit) definieren kann. Wir
16. Relativistische Mechanik
421
definieren die sogenannte Minkowski–Norm 5 D(u) := | u, u3,1 |
u ∈ R4 .
(16.3.2)
F¨ ur einen Vektor u ∈ R3 ⊂ R4 (also mit u4 = 0) stimmt damit D(u) mit der euklidischen L¨ange u ur u ∈ R1 ⊂ R4 (also u = (0, 0, 0, u4 ) ∈ ¨berein. Ebenso mißt f¨ 4 R ) D(u) den zeitlichen Abstand. Mit der Minkowski–Norm k¨onnen wir also Strecken und Zeitspannen messen. Wie gewohnt ¨andert sich die L¨ange von u ∈ R3 ⊂ R4 unter Drehungen nicht (D(Ou) = D(u) f¨ ur O ∈ SO(3)). Das Besondere ist aber, dass sich diese Gr¨oßen auch unter Lorentz–boosts nicht ¨andern, das heißt D L(v)u = D(u). Dagegen ver¨andert sich die Norm u21 + u22 + u23 der Raumkomponente von u unter Lorentz–boosts: 16.11 Beispiel (Lorentz–Kontraktion) Wie man der Form (16.2.5) des Lorentz-boosts mit Geschwindigkeit v ∈ R3 , 0 < v < 1 ersehen kann, findet in Bewegungsrichtung eine (Lorentz–Kontraktion genannte) L¨angenverk¨ urzung um den Faktor (1l3 − Pv ) + γ(v)Pv Pv = γ(v) = (1 − v 2 )−1/2 < 1 statt (mit der Projektion Pv in Geschwindigkeitsrichtung). Senkrecht dazu Bezugssystemen die gleichen L¨angen werden dagegen in beiden gemessen, denn (1l3 − Pv ) + γ(v)Pv (1l3 − Pv ) = 1l3 − Pv . Der Grund f¨ ur die Lorentz–Kontraktion ist die Abh¨angigkeit der Definition gleichzeitiger Ereignisse vom Bezugssystem. Um etwa die L¨ange eines von links nach rechts am r¨aumlichen Nullpunkt unseres Bezugssystems vorbeifliegenden Stabes festzustellen, messen wir in unserem Bezugssystem die Orte der Stabenden gleichzeitig und bilden die Differenz. Im Bezugssystem des Stabes findet aber die Messung des linken Stabendes sp¨ater als die des (in beiden Bezugssystemen) zuerst vorbeikommenden rechten Stabendes statt, was eine entsprechende scheinbare Verk¨ urzung mit sich bringt (siehe Abbildung 16.3.1). 3 ¨ Ahnlich f¨ uhrt ein Lorentz–boost auch zu einer Zeitkontraktion. Wir nennen eine Kurve c : I → R4 im Minkowski–Raum Weltlinie, und zeitartig 6 , wenn sie regul¨ar ist mit zeitartigen Tangentialvektoren c (t) (t ∈ I). Unter der Eigenzeit einer Weltlinie c verstehen wir die Zeit, die in dem System gemessen wird, das durch c parametrisiert ist. 16.12 Satz Die entlang der zeitartigen Weltlinie c ∈ C 1 [t0 , t1 ], R4 vergangene Eigenzeit ist t1 τ (c) := D c (s) ds, t0
ist keine Norm auf dem R4 ! wird schon in der Definition von Weltlinien ihre Zeitartigkeit vorausgesetzt.
5 Dies 6 Oft
422
16.3. Geometrie des Minkowski–Raumes
t
t
2
2
2
2
x
2
2
x
2
2
Abbildung 16.3.1: Lorentz–Kontraktion eines Stabes der L¨ange 2. Links: Geschwindigkeit 0, rechts: Geschwindigkeit 0.75 c (mit D aus (16.3.2)) Diese Eigenzeit ist unabh¨angig von der Parametrisierung der Weltlinie. t Beweis: Die Funktion ϕ : [t0 , t1 ] → R, ϕ(t) := t0 D c (s) ds ist stetig diffe renzierbar mit ϕ (t) = D c (t) > 0. Damit ist ϕ auf dem Intervall Ableitung [0, τ ] := ϕ [t0 , t1 ] invertierbar. Die reparametrisierte Weltlinie c˜ := c ◦ ϕ−1 ∈ C 1 [0, τ ], R4 ist nicht nur zeitartig, sondern erf¨ ullt D c˜ = 1. Damit ist die Eigenzeit τ = τ (˜ c) = τ (c). 2 Ist die Weltlinie c durch den Zeitparameter t eines Inertialsystems parametrisiert, das heißt t cˆ(t) v(s) ds mit cˆ(t) = cˆ(t0 ) + c(t) = t t0
und der Geschwindigkeit v(s) zum Zeitpunkt s des Inertialsystems, entspricht ihr also die Eigenzeit t τ (c) = t01 1 − v(s) 2 ds. (16.3.3)
16.13 Beispiel (Hafele–Keating–Experiment) Im Experiment von Hafele und Keating [HK] wurden 1971 vier C¨asium-Atomuhren auf Fl¨ ugen um die Erde mitgenommen, in westlicher und in ¨ ostlicher Richtung. Beim Flug nach Westen gingen die Uhren im Vergleich zu Atomuhren in Washington um durchschnittlich 273 ± 7 Nanosekunden vor, beim Flug nach Osten um 59 ± 10 Nanosekunden nach. Die aus den Flugdaten abgeleitete Voraussage der Relativit¨atstheorie war ein Gangunterschied von +275 ± 21 beziehungsweise −40 ± 23 Nanosekunden. Diese setzte sich additiv aus einem Anteil der Speziellen und der Allgemeinen Relativit¨atstheorie zusammen.
16. Relativistische Mechanik
423
2005 wurde das Experiment modifiziert wiederholt, wobei Voraussage und Messung mit einer relativen Genauigkeit von ca. 2 % u ¨bereinstimmten. Der allgemein-relativistische Effekt wurde inzwischen sogar mit einer relativen Genauigkeit von 10−8 best¨atigt (siehe M¨ uller, Peters und Chu [MPC]), allerdings mit Atomen und einer Flugh¨ ohe von 0.1 mm. Wir berechnen den speziell-relativistischen Effekt in einer idealisierten Version ¨ des Experiments, bei der das Flugzeug entlang des Aquators mit einer konstanten Relativgeschwindigkeit vF ∈ (0, c) bodennah fliegt. Die Flugzeit ist damit T := ¨ uE /vF , mit dem Aquatorumfang uE . ¨ Am Aquator bewegt sich die Erdoberfl¨ache mit der Geschwindigkeit vE ∈ (0, c) gegen¨ uber einem im Erdmittelpunkt ruhenden Inertialsystem nach Osten. Damit sind nach (16.2.4) die Geschwindigkeiten des west- beziehungsweise ostw¨arts fliegenden Jets im Inertialsystem gleich (mit vmax := max(vE , vF )) vW =
vF − vE 1 − vF vE /c2
also vW = vF − vE + O
3 vmax c2
vF + vE , 1 + vF vE /c2
,
vO =
,
vO = vF + vE + O
3 vmax c2
.
Die Zeitdilatationen gegen¨ uber dem Inertialsystem sind durch (16.3.3) gegeben. Die Differenz zwischen der Zeitdilatation von Flugzeug und Erde ist also beim Ostflug tO := T
3 2 /c2 − 2 /c2 = −u vE + vF /2 + O vmax . 1 − vO 1 − vE E c4 c2
und beim Westflug tW := T
2 /c2 − 1 − vW
3 2 /c2 = u vE − vF /2 + O vmax . 1 − vE E c4 c2
Numerisch ist vE = uE /tE ≈ 465.1 m/s wobei uE ≈ 40 075 017 m der ¨ Aquatorumfang ist und tE ≈ 86 164 s die mittlere siderische Tagesl¨ange. Setzt man f¨ ur die Relativgeschwindigkeit des Flugzeugs vF := 900 km/h = 250 m/s an, ergeben sich im Inertialsystem die Geschwindigkeiten von vW ≈ 215.1 m/s und vO ≈ 715.1 m/s. Die Differenzen der Zeitdilatationen betragen dann tW ≈ 152 × 10−9 s und tO ≈ −263 × 10−9 s. 3 16.14 Aufgabe (Modifiziertes Zwillingsparadox) Zwei (z¨ahe) Schnecken be¨ geben sich entlang des Aquators auf Wanderschaft, eine nach Osten und eine nach Westen. Um wieviel weniger ist die nach Osten kriechende Schnecke gealtert, wenn sie sich beim Ausgangsort wieder treffen? Man betrachte also in Beispiel 16.13 die Zeitdifferenz tO − tW im Limes tS → 0 verschwindender
424
16.3. Geometrie des Minkowski–Raumes
Kriechgeschwindigkeit tS ! 3 Es sind solche nicht intuitive Ph¨anomene, die bis heute Widerspruch gegen die einsteinsche Relativit¨atstheorie hervorrufen, und auch immer neue Widerlegungsversuche provozieren (siehe das nebenstehende Facsimile eines entsprechenden Briefes). 16.15 Bemerkung Der Minkowski–Raum R4 , ·, ·3,1 wird in zwei Bedeutungen verwendet: • Als Raumzeit. Die Punkte x ∈ R4 heißen dann Ereignisse (denn Ereignisse finden an einem Ort und zu einem Zeitpunkt statt). Die (chronologische) Zukunft beziehungsweise Vergangenheit eines Ereignisses x sind dann definitionsgem¨aß die offenen Kegel I ± (x) := y ∈ R4 | y − x, y − x3,1 < 0, ±(y4 − x4 ) > 0 . Wir haben schon gesehen, dass Zukunft und Vergangenheit von 0 ∈ R4 invariant unter orthochronen Lorentz–Transformationen aus L↑ ist. Allgemeiner gilt f¨ ur Poincar´e–Transformationen Φ(a,A) : Φ(a,A) I ± (x) = I ± Φ(a,A) (x) x ∈ R4 , (a, A) ∈ R4 × L↑ . • Als Tangentialraum Tx R4 ∼ = R4 der Raumzeit an einem Punkt x ∈ R4 . Eine stetig differenzierbare Kurve c : I → R4 heißt zeitartig, wenn ihre Tangentialvektoren c (s) ∈ Tc(s) R4 f¨ ur alle Parameter s ∈ I zeitartig sind, und zwar zukunftsorientiert, wenn c4 (s) > 0 gilt. Offensichtlich besteht die Zukunft I + (x) von x aus den von x aus mit zukunftsorientierten Kurven erreichbaren Kurven. Einer mit ,der Zeit’ t parametrisierten Kurve C : I → R3 im Raum wird durch 4 C(t) c : I → R , t → eine zukunftsorientierte Kurve zugeordnet, falls f¨ ur t ihre Geschwindigkeit C (t) < 1 (t ∈ I) gilt. In der Allgemeinen Relativit¨atstheorie wird dann der Minkowski–Raum in seiner ersten Bedeutung als Raumzeit zu einer vierdimensionalen Mannigfaltigkeit mit einer Lorentz–Metrik verallgemeinert. Die als Untergruppe in der Poincar´e–Gruppe enthaltenen Translationen Ta : R4 → R4 , Ta (x) = x + a a ∈ R4 der Raumzeit R4 lassen die Lorentz–Metrik unver¨andert. Man spricht in diesem Zusammenhang von der Homogenit¨at der Raumzeit. 3
16. Relativistische Mechanik
16.4
425
Die Welt in relativistischer Sichtweise Or high Mathesis, with her charm severe, ” Of line and number, was our theme; and we Sought to behold her unborn progeny, And thrones reserved in Truth’s celestial sphere: While views, before attained, became more clear; And how the One of Time, of Space the Three, Might, in the Chain of Symbols, girdled be” Aus dem Gedicht The Tetractys W.R. Hamiltons u ¨ber die von ihm gefundenen Quaternionen, 1846
Hamilton hat in diesem Gedicht eine fruchtbare Anwendung seiner Theorie vorweggenommen. Ausgangspunkt ist die folgende Feststellung. Betten wir wie in E.27 den R4 als Vektorraum der Quaternionen ein: x1 x4 +ix3 x2 +ix1 x2 4 → −x I : R → Mat(2, C) , , x3 2 +ix1 x4 −ix3 x4
dann ist die Lorentz–Metrik des Minkowski–Raums von der Form x, y3,1 = − 12 tr I(x)I(y) . Auch die Lorentz–Transformationen der Himmelssph¨are k¨onnen so beschrieben werden. Damit wird z.B. die relativistische Verzerrung des Bildes am Kapitelanfang erkl¨art. Man k¨onnte aus der Diskussion der Lorentz–Kontraktion (in Bsp. 16.11) schließen, dass diese einfach zu einer optischen Stauchung der Objekte in ihrer Bewegungsrichtung f¨ uhrt. Entsprechende Abbildungen findet man in ¨alteren Popularisierungen der Relativit¨atstheorie. Wie wir sehen werden, ist dies nicht der Fall. Insbesondere sehen Kugeln auch f¨ ur bewegte Beobachter kugelf¨ormig aus. Ein Beobachter im Nullpunkt des Minkowski–Raumes sieht das Licht 7 x2 seines R¨ uckw¨artslichtkegels C − , und zwar unabh¨angig davon, ob seine Geschwindigkeit Null ist oder nicht. Dieser C+ ist die disjunkte Vereinigung der durch 0 die Raumrichtung x definierten Strahlen t x )|λ>0 (x ∈ S 2 ). R(x) := λ ( −1 R(x) CS1 Die Sph¨are S 2 nennen wir Himmelskugel. x In nebenstehender Abbildung ist die Geometrie f¨ ur zwei Raumdimensionen (das heißt in (R3 , ·, ·2,1 )) dargestellt, x1 mit der Himmelskugel S 1 . 7 und allgemeiner die elektromagnetische Strahlung, soweit sie sich nicht in einem Medium mit geringerer Geschwindigkeit als Lichtgeschwindigkeit 1 ausbreitet.
426
16.4. Die Welt in relativistischer Sichtweise
Wir untersuchen nun, wie sich die Richtungen und deren Winkelabst¨ande bei Lorentz–Transformationen ver¨andern. Dazu sind die Projektivit¨aten genannten Abbildungen die geeignete Sprache. 16.16 Definition Die projektive lineare Gruppe PGL(V ) eines K–Vektorraums V ist die Faktorgruppe PGL(V ) := GL(V ) / Z(V ) der allgemeinen linearen Gruppe GL(V ), mit der normalen Untergruppe 8 der Streckungen Z(V ) := {λ IdV | λ ∈ K∗ } GL(V ). Diese Gruppe wirkt auf dem projektiven Raum P(V ), denn GL(V ) wirkt auf diesem (siehe Beispiel E.18), und Z(V ) l¨asst die eindimensionalen Unterr¨aume von V invariant. 16.17 Beispiel (projektiver Raum KP(1) und M¨ obius–Transformationen) Wie in Beispiel 6.52 gezeigt, ist der reell-projektive Raum RP(1) ≡ P(R2 ) diffeomorph zur Kreislinie S 1 . Analog ist der komplex-projektive Raum CP(1) ≡ P(C2 ) diffeomorph zur Sph¨are S 2 (Bemerkung 6.36). Eine andere M¨ oglichkeit, dies zu sehen, besteht in der Identifikation von Sph¨are und projektivem Raum mit K ∪ {∞}, f¨ ur K = R beziehungsweise C. • Im Fall von S 1 beziehungsweise S 2 geschieht dies u ¨ber die stereographische Projektion (Beispiel A.29.3). • Im Fall von KP(1) identifiziert man die ¨ Aquivalenzklasse [v] = span(u) \ {0} ∈ KP(1) von u ∈ K2 \ {0} mit ∞, falls u2 = 0 und sonst mit u1 /u2 ∈ K, f¨ ur K = R bzw. K = C. Geometrisch entspricht letzteres {(u1 /u2 , 1)} = dem Schnittpunkt [u] ∩ K × {1} , siehe Abbildung.
1 u1u2
Die Projektivit¨aten oder M¨obius–Transformationen zu dieser Notation von der Form z →
u1 az + b f¨ ur z = cz + d u2
beziehungsweise
u
u2
a b c d
z →
u1
∈ GL(2, K) sind in
a f¨ ur z = ∞, c
siehe auch Aufgabe 6.42. Sie h¨angen nur von drei Parametern aus K ab, da Z¨ahler und Nenner mit der gleichen Zahl aus K∗ multipliziert werden kann, ohne das Ergebnis zu ¨andern. PGL(R2 ) ist damit eine dreidimensionale, PGL(C2 ) eine sechsdimensionale Lie–Gruppe. 8 Z(V ) wird auch das Zentrum von GL(V ) genannt, weil es aus den mit allen Gruppenelementen kommutierenden Abbildungen besteht.
16. Relativistische Mechanik
427
Im Artikel [AR] von Arnold und Rogness wird bewiesen und visualisiert, upfung von (inverdass die M¨obius–Transformationen aus PGL(R2 ) durch Verkn¨ ser) stereographischer Abbildung und starrer Bewegung der Sph¨are S 2 im R3 entstehen. 3 Der folgende Satz wurde 1959 unabh¨angig voneinander von Penrose in [Pen] und Terrell in [Te] bewiesen. 16.18 Satz Die restringierte Lorentz–Gruppe SO+ (3, 1) wirkt auf der Himmelskugel S 2 als die Gruppe PSL(2, C) := SL(2, C)/{±1l} orientierungserhaltender M¨obius–Transformationen. Beweis: • Betrachten wir zun¨achst f¨ ur den linearen Isomorphismus +v3 v1 +iv2 mit det A(v) = − v, v3,1 A : R4 → Sym(2, C) , A(v) := vv14−iv 2 v4 −v3 die Gruppenwirkung Φ : SL(2, C) × R4 → R4
,
Φg (v) := A−1 gA(v)g ∗ .
(16.4.1)
F¨ ur die Lorentz–Metrik und w := Φg (v) gilt w, w3,1 = − det gA(v)g ∗ = −| det(g)|2 det A(v) = − det A(v) = v, v3,1 . Die Gruppe SL(2, C) wirkt also durch Lorentz–Transformationen, und wir erhalten einen Gruppenhomomorphismus ˜ : SL(2, C) → O(3, 1). Π • Dieser erweitert den Gruppenhomomorphismus Π : SU(2) → SO(3) aus Satz E.29. Denn SU(2) ≤ SL(2, C) und SO(3) ≤ O(3, 1) sind Untergruppen, und f¨ ur −ix3 −ix 1 +x2 g ∈ SU(2) ist g ∗ = g −1 . Weiter ist mit σ : R3 → su(2), x → 12 −ix ix3 1 −x2 A ( x0 ) = 2i σ(x)
, also ΦU ( x0 ) = ΠU0(x)
x ∈ R3 , U ∈ SU(2) .
˜ SL(2, C) ist in der restringierten Lorentz–Gruppe SO+ (3, 1) ent• Das Bild Π halten: - nach Bemerkung 16.4.2 ist die Untergruppe SO+ (3, 1) ≤ O(3, 1) die Zusammenhangskomponente der Eins; - die Matrizen g ∈ SL(2, C) besitzen die Polarzerlegung g = u exp(w) mit u ∈ SU(2) und w ∈ Mat(2, C) hermitesch und spurlos. Umgekehrt ist jedes solche Produkt u exp(w) in SL(2, C). Da SU(2) ∼ = S 3 × R3 = S 3 , ist SL(2, C) ∼ zusammenh¨angend. ˜ SU(2) • Andererseits ist das Bild von SL(2, C) gleich SO+ (3, 1), wie man aus Π = SO(3) und der Transformation des positiven Faktors in der Polarzerlegung von
428
16.4. Die Welt in relativistischer Sichtweise
g ∈ SL(2, C) sieht. • Wir bemerken nun, dass wir die Abbildung C2 → Sym(2, C)
z = ( zz12 ) → z ⊗ z =
,
|z1 |2 z1 z2 z2 z1 |z2 |2
mit A−1 : Sym(2, C) → R4 zur sogenannten Hopf–Abbildung ⎛ Hopf : C2 → R4
, z=
( zz12
) →
2Re(z1 z2 ) 1 z2 ) ⎝ 2Im(z |z1 |2 −|z2 |2 |z1 |2 +|z2 |2
⎞ ⎠
verkn¨ upfen k¨onnen. Die ersten drei (also die ,r¨aumlichen’) Komponenten wurden schon im Zusammenhang des zweidimensionalen harmonischen Oszillators zur Parametrisierung von S 2 genutzt, siehe Bemerkung 6.36. 2dessenOrbitraum Das Bild Hopf C \ {0} ⊂ R4 ist der Vorw¨artslichtkegel C + aus Definition 16.7, und f¨ ur v := Hopf(z) ∈ C + ist die Faser die Kreislinie Hopf −1 (v) = {λz | λ ∈ S 1 ⊂ C}. Die lineare Wirkung ( zz12 ) →
g1,1 z1 +g1,2 z2 g2,1 z1 +g2,2 z2
der Matrix g =
g1,1
g1,2 g2,1 g2,2
∈
SL(2, C) auf C f¨ uhrt also bei Komposition mit der Hopf–Abbildung zu einer Lorentz–Transformation des Vorw¨artslichtkegels, die die Himmelskugel konform transformiert. 2 2
Einige M¨obius–Transformationen der Himmelskugel sind in den Abbildungen 16.4.1 und 16.4.2 dargestellt, genauer gesagt, ihre erzeugenden Vektorfelder: • Die t¨agliche scheinbare Drehung der Sterne um die Polachse der Erde ist uns vertraut. • Der boost konzentriert die Sterne in Geschwindigkeitsrichtung, w¨ahrend entgegen der Flugrichtung ihre Dichte abnimmt. • Kombinationen von Drehung und boost sind der typischere Fall. Nur bei Drehung um die Geschwindigkeitsrichtung sind dabei die beiden Nullstellen des M¨obius–Vektorfelds Antipoden. • Die beiden Nullstellen k¨ onnen sich auch zu einer degenerierten Nullstelle vereinigen. Da von den winkeltreuen M¨ obius–Transformationen Kreise auf Kreise abgebildet werden, ist keine relativistische L¨angenkontraktion sichtbar. Das steht nicht im Widerspruch zu den vorigen Bemerkungen. Denn in der in Beispiel 16.11 behandelten Lorentz–Kontraktion wurden die beiden Enden des vorbeifliegenden Stabes an verschiedenen Orten des Bezugssystems gemessen. In Penrose und Rindler [PR1] findet sich eine weiterf¨ uhrende Diskussion.
16. Relativistische Mechanik
429
Abbildung 16.4.1: Oben Links: Rotation, Oben Rechts: boost, Unten: Kombination von Rotation und boost
Abbildung 16.4.2: Links: Kombination von Rotation und boost, mit verschiedenen Achsen, Rechts: Orbits eines degenerierten M¨ obius–Vektorfelds
430
16.5
16.5. Von Einstein zu Galilei — und zur¨ uck
Von Einstein zu Galilei — und zur¨ uck
Die Relativit¨atstheorie Galileis entsteht durch Limesbildung aus der Speziellen Relativit¨atstheorie Einsteins, wenn die Lichtgeschwindigkeit c gegen Unendlich geht. Um dies zu sehen, setzen wir c > 0 in das Minkowski–Produkt ein 9 : ·, ·c : R4 × R4 → R,
,
v, wc = v1 w1 + v2 w2 + v3 w3 − c2 v4 w4 , (16.5.1)
und definieren die Lorentz–Gruppen als deren Invarianz–Gruppen, das heißt Lc := A ∈ GL(4, R) | ∀v, w ∈ R4 : Av, Awc = v, wc . ˜ c (v) einer Matrix A ∈ Lc mit einer orthogonalen In der Polarzerlegung A = OL ˜ Matrix O besitzt der Lorentz–boost durch Modifikation von (16.2.5) die explizite Form (1l3 − Pv )/γc (v) + Pv v v ∈ R3 , 0 < v < c , Lc (v) = γc (v) 1 v /c2 (16.5.2) mit γc (v) := (1− v 2 /c2 )−1/2 = 1+O(c−2 ). Damit ist f¨ ur jede Geschwindigkeit v ∈ R3 1l3 v L∞ (v) := lim Lc (v) = . 0 1 c→∞ Geh¨ort A zur restringierten Lorentz–Gruppe, dann ist die orthogonale Matrix in ˜ = ( O 0 ) mit Drehmatrix O ∈ SO(3). Noch der Polarzerlegung von der Form O 0 1 ˜ ∞ (v) = ( O Ov ) wird die Gestalt der Matrix bei Vertauschen der einfacher als OL 0 1 ˜ = ( O v ). Faktoren in der Polarzerlegung, denn L∞ (v)O 0 1 Die Poincar´e–Gruppe in ihrer explizit von der Lichtgeschwindigkeit abh¨angigen Form ist das semidirekte Produkt Pc := R4 Lc . Sie l¨aßt sich als Matrixa gruppe schreiben, indem man a ∈ R4 und A ∈ Lc in die 5 × 5-Matrix ( A 0 1) zusammenf¨ ugt. Nach Bildung des Limes c → ∞ erhalten O vwir mit dem Translaq tionsvektor a := ( qt ) ∈ R4 = R3 × R die Elemente 0 1 t der (eigentlichen 0 0 1
orthochronen) Galilei–Gruppe, mit Multiplikation O1 v1 q1 O2 v2 q2 O1 O2 v1 +O1 v2 q1 +v1 t2 +O1 q2 = . 0 1 t1 0 1 t2 0 1 t1 +t2 0
0 1
0
0 1
0
0
(16.5.3)
1
Wie die Poincar´e–Gruppe ist diese also eine zehndimensionale Lie–Gruppe. 16.19 Bemerkungen (Galilei–Gruppe) 1. Damit ist diese Gruppe isomorph zum semidirekten Produkt R4 E(3) der euklidischen Gruppe E(3) mit dem R4 : Auf den Raumzeitpunkt (q, t) ∈ R4 wirkt g := (Δq, Δt ; v, O) ∈ R4 E(3) durch (16.5.4) Φg (q, t) := Oq + vt + Δq, t + Δt . 9 Wo die Faktoren c als Umrechnungsfaktor zwischen Ort und Zeit eingef¨ ugt werden m¨ ussen, kann man leicht durch eine Dimensionsbetrachtung feststellen.
16. Relativistische Mechanik
431
2. Die Minkowski–Bilinearform (16.5.1) selbst besitzt keinen Limes unendlicher Lichtgeschwindigkeit. Statt dessen existiert in Galileis Relativit¨atstheorie eine absolute, vom Bezugssystem unabh¨angige Zeit. Zwei Raumzeitpunkte (q, t) = (q , t ) werden dabei gleichzeitig genannt, wenn man nicht physikalisch von (q, t) aus (q , t ) erreichen kann, es also kein (v, s) ∈ R4 mit (q , t ) = (q + vs, t + s) gibt. Das ist offensichtlich genau dann der Fall, wenn t = t ist. Galilei–Gleichzeitigkeit ¨ auf der Raumzeit. definiert damit 10 eine Aquivalenzrelation Die Raumzeit kann so als B¨ undel u ¨ber der Zeitachse R aufgefasst werden, deren Fasern isomorph, aber nicht kanonisch isomorph zum dreidimensionalen affinen Raum ist. Dieser Aspekt wird zum Beispiel im Kapitel II.2 des Buches [Scho] von Schottenloher diskutiert. Nur durch explizite Zeittranslation kann diese globale Uhrzeit ge¨andert wer¨ den, nicht durch Anderung der Geschwindigkeit. Dies kann man dem Eintrag t1 + t2 des Multiplikationsgesetzes (16.5.3) entnehmen. Der Raumpunkt dagegen h¨angt auch in Galileis Theorie von der Geschwindigkeit ab, entsprechend dem Eintrag q1 + v1 t2 + O1 q2 in (16.5.3). Es gibt in ihr keine absolute ,Gleichortigkeit’. Auch das Konzept der absoluten Gleichzeitigkeit aufzugeben, stellte den entscheidenden Schritt auf dem Weg zur Speziellen Relativit¨atstheorie dar. 3. Erstaunlicher als die Tatsache, dass die Galilei–Gruppe so durch Limesbildung aus der Poincar´e–Gruppe gewonnen werden kann, ist, dass auch der umgekehrte Weg m¨ oglich ist. Durch eine Deformation genannte Technik l¨aßt sich die einsteinsche Spezielle Relativit¨atstheorie gruppentheoretisch und fast ohne physikalische Zus¨atze aus der Theorie Galileis ableiten. Die Lie–Algebra g einer Lie–Gruppe bestimmt deren lokale Struktur (siehe Bemerkung E.23.2). In einer Basis b1 , . . . , bn des R–Vektorraums g ist die Lie–Algebra–Struktur durch die Koeffizienten cki,j ∈ R in deren Lie–
n k Klammer [bi , bj ] = k=1 ci,j bk festgelegt. Aus deren Antisymmetrie folgt k k cj,i = −ci,j , w¨ahrend die Jacobi–Identit¨at die quadratischen Beziehungen
n m m m =1 ci,j c,k + cj,k c,i + ck,i c,j = 0 der Koeffizienten ergibt. Die Menge der Struktur–Tensoren (cki,j ) von Lie-Algebren bildet damit eine Teilmenge L(n) eines n3 –dimensionalen R–Vektorraums. Auf diesem operiert die Gruppe GL(n, R), und deren Orbits in L(n) bestehen aus zueinander isomorphen Lie–Algebren. Die Kontraktionen einer Lie–Algebra entsprechen den Randpunkten von deren Orbits. Wie wir gesehen haben, entsteht die Lie–Algebra der Galilei–Gruppe durch eine solche Kontraktion aus der Lie–Algebra der Poincar´e–Gruppe. Die Grundidee der Deformation von g besteht umgekehrt darin, die Koeffizienten von g in L(n) zu st¨ oren, und zu schauen, ob die so entstehende 10 im
Gegensatz zum Fall der Speziellen Relativit¨ atstheorie!
432
16.5. Von Einstein zu Galilei — und zur¨ uck
Lie–Algebra g zu g isomorph ist (siehe Kapitel 7.2 des Buches [OV] von Onishchik und Vinberg). F¨ ur die Lie–Algebra der euklidischen Gruppe E(3) wird man so einerseits auf die Lie–Algebra so(4) der Drehgruppe, andererseits auf die der Lorentz– Gruppe gef¨ uhrt. Die Drehgruppe scheidet als Kandidatin einer relativistischen Symmetrie der Raumzeit aus. Details kann man in [FOF] und den darin zitierten Arbeiten finden. 3 Die grundlegenden Wechselwirkungen einer physikalischen Theorie sollten unter den relativistischen Symmetrietransformationen invariant sein. Dies schr¨ankt die Form der physikalisch fundamentalen Hamilton–Funktion ein. Um diese Invarianz u ussen wir statt Pha¨berhaupt formal zu definieren, m¨ senr¨aumen, die Kotangentialb¨ undel u ¨ber dem Ortsraum sind, solche u ¨ber der Raumzeit betrachten. Sehr allgemein gehen wir aus von einer eventuell zeitabh¨angigen Hamilton– Funktion H : T ∗ M × Rt → R auf dem um die Zeitachse Rt erweiterten Phasenraum T ∗ M mit Konfigurationsmannigfaltigkeit M . Das Produkt T ∗ M × T ∗ Rt von Kotangentialr¨aumen (T ∗ M, ω1 ) und (T ∗ Rt , ω2 ) mit ihren kanonischen symplektischen Formen besitzt mit den Projektionen πi auf die Faktoren die nach Satz 6.48 symplektische Struktur ω := ω1 & ω2 = π1∗ (ω1 ) − π2∗ (ω2 ).
(16.5.5)
Dabei ist das Vorzeichen so gew¨ahlt, dass ω an den Minkowski–Raum ·, ·3,1 angepasst ist. Die von H erzeugte Dynamik vergleichen wir mit der von ˜ : T ∗ (M × Rt ) → R H
˜ E; q, t) := H(p, q, t) − E. , H(p,
(16.5.6)
Die hamiltonschen Bewegungsgleichungen sind (in lokalen kanonischen Koordinaten p = (p1 , . . . , pd ), q = (q1 , . . . , qd ) von T ∗ M ) p˙j = −
∂H ∂qj
,
q˙j =
∂H ∂pj
∂H , E˙ = ∂t
und t˙ = 1,
wobei der Punkt die Ableitung nach dem Zeitparameter s bezeichnet. Also ˜ korrespondieren mit denen k¨onnen wir t = s setzen, und die L¨ osungen f¨ ur H f¨ ur H. ˜ −1 (0) gilt außerdem E = H(p, q, t), die PhasenraumAuf der Niveaumenge H variable E ist also dort als Gesamtenergie interpretierbar. Wir spezialisieren nun auf den Fall M := R3q , und untersuchen unter der auf T ∗ R4 gelifteten Wirkung der Poincar´e–Gruppe P = R4 L die Form der invarianten Hamilton–Funktionen. (a, A) ∈ P wirkt durch die affine Abbildung Φ(a,A) : R4 → R4 , x → Ax + a auf der Raumzeit R4 , also durch deren ω–symplektischen Kotangentiallift (siehe Definition 10.32) ∗ ΦT(a,A) : T ∗ R4 → T ∗ R4 , (p, x) → I A−1 I p, Ax + a (16.5.7)
16. Relativistische Mechanik
433
auf deren Kotangentialraum. Wegen der (nach Bemerkung 16.2.4 aus der Definition der Lorentz-Gruppe folgenden) Relation A IA = I, mit der Diagonalma trix I = diag(1, 1, 1, −1), kann man statt der Matrix I A−1 I auch einfach A schreiben. 16.20 Lemma (Kotangentiallift der Galilei-Transformation) Der nichtrelativistische Limes von (16.5.7) f¨ ur die Poincar´e–Transformation mit Polarzerlegung ˜ orthogonaler Matrix O ˜ = ( O 0 ) und a = Δq ist Ac := Lc (v)O, 0 1 Δt (p, E ; q, t) −→ Op , E + v, Op ; Oq + vt + Δq , t + Δt . (16.5.8) Dies ist der Kotangentiallift der Galilei-Transformation (16.5.4) auf T ∗ R4 ∼ = T ∗ R3 × T ∗ R. I = Dc Ac Dc−1 , mit Dc := Beweis: Analog zur obigen Bemerkung ist I A−1 c 2 diag(1, 1, 1, c ). Weiter ist ˜ c−1 = Dc Lc (v)Dc−1 O. ˜ Dc Ac Dc−1 = Dc Lc (v)Dc−1 Dc OD Der Limes c → ∞ ergibt sich nach Konjugation der Formel (16.5.2) f¨ ur den 2 Lorentz–boost Lc (v). Bemerkenswert an (16.5.8) ist, dass in diesem Limes der Impuls p ∈ R3 durch den ¨ Ubergang zum Bezugssystem mit Relativgeschwindigkeit v nicht ver¨andert wird. Wir erinnern uns aber daran, dass der Impuls erst durch Angabe der Hamilton– Funktion eines Teilchens eine Beziehung zu dessen Geschwindigkeit bekommt. Da a ∈ R4 frei w¨ahlbar ist, kann eine Lorentz–invariante Hamilton–Funktion nur vom Vierer-Impuls p abh¨angen. F¨ ur beliebige f ∈ C 1 (R, R) ist eine Hamilton– Funktion der Form ˜ c (p, q) := f p, p ˜ c : T ∗ R4 → R , H H 1/c invariant. Im einfachsten Fall ist f : R → R linear, und zum Vergleich mit der nichtrelativistischen Theorie bezeichnen wir die Steigung von f mit 1/(2m). Schreiben wir den Viererimpuls in der Form (p, E) ∈ R3 × R, dann ergibt sich 2 f¨ ur den Wert − mc 2 der Hamilton–Funktion ˜ c (p, E; q, t) := p − E 2 2 H 2m 2mc 4 2 2 also die Formel E = mc2 1 + p = mc2 + p +O p f¨ ur die Energie mc 2m mc des relativistischen freien Teilchens. Die Bewegungsgleichungen 2
dp =0 ds
,
dE =0 , ds
˜ f¨ von H uhren auf der Niveaumenge von dq = dt
dq p = ds m mc2 2
,
dt E = ds mc2
zur relativistischen Beziehung
p 2 m 1 + p mc
434
16.5. Von Einstein zu Galilei — und zur¨ uck
zwischen Geschwindigkeit und Impuls. 2 ˜ c (p, E; q, t) = p ist, wird f¨ ur W¨ahrend der punktweise Limes limc→∞ H 2m vorgegebene Werte von p (sowie q und t) auf der c–abh¨angigen Niveaufl¨ache 2 p2 2 ˜ ˜ ˜ von mc 2 der nichtrelativistische Limes von Hc (p, E + mc ; q, t) gleich 2m − E. ¨ Die auf diese Weise oder durch den Ubergang (16.5.6) auf den erweiterten Phasenraum gewonnene nichtrelativistische Hamilton–Funktion ˜ : T ∗ (R3q × Rt ) → R H
,
2 ˜ E; q, t) := p − E H(p, 2m
(16.5.9)
ist allerdings unter der gelifteten Wirkung (16.5.8) der Galilei–Gruppe nicht invariant. Daher benutzt man nichtrelativistisch statt (16.5.8) die folgenden Transformationen: 16.21 Lemma (Phasenraumwirkung der Galilei–Gruppe) Die Abbildungen (p, E ; q, t) → Op + mv , E + v, Op + 12 m v 2 ; Oq + vt + Δq , t + Δt (16.5.10) definieren eine (bez¨ uglich ω aus 16.5.5) ω–symplektische Gruppenwirkung der Galilei–Gruppe auf dem Phasenraum T ∗ R4 der Raumzeit, die die Wirkung Φ aus Bemerkung 16.19.1 u ¨berlagert. Beweis: • Abbildung (16.5.10) ist die Komposition des (ω–symplektischen) Kotangentiallifts (16.5.8) mit der Translation der Fasern von T ∗ R4 um die Kon 1 stante mv, 2 m v 2 ; 0, 0 . Damit ist sie ω–symplektisch. • Außerdem gilt f¨ ur die Komposition der Wirkungen der Bewegungen (v1 , O1 ), (v2 , O2 ) ∈ E(3): O1 (O2 p + mv2 ) + mv1 = O1 O2 p + m(O1 v2 + v1 ) und
E + v2 , O2 p + 12 m v2 2 + v1 , O1 (O2 p + mv2 ) + 12 m v1 2 = E + O1 v2 + v1 , O1 O2 p + 12 m O1 v2 + v1 2 .
Es liegt also wirklich eine Gruppenwirkung der Galilei–Gruppe vor. • Die letzten beiden Eintr¨age in (16.5.10) stimmen mit (16.5.4) u ¨berein. Die Wirkung Φ wird also u 2 ¨berlagert. Diese Abbildungen unterscheiden sich zwar von (16.5.8) nur durch eine konstante Fasertranslation von T ∗ R4 , lassen aber die Hamilton–Funktion (16.5.9) invariant. Nichtrelativistische Teilchen k¨ onnen auf vielerlei Weise Galilei–invariant miteinander interagieren. Der erweiterte Phasenraum von n Teilchen ist Pn := T ∗ R3n q × Rt .
16. Relativistische Mechanik
435
Die Wirkung der Galilei–Gruppe ist diagonal bez¨ uglich der Koordinaten der > 0 und die Gesamtmasse m := Teilchen, das heißt f¨ u r die Teilchenmassen m k
n ¨ber in k=1 mk geht der Phasenraumpunkt (p1 , . . . , pn , E; q1 , . . . , qn , t) ∈ Pn u O(p1 + m1 v), . . . , O(pn + mn v) , E + v, p1 + . . . + pn + 12 m v 2 ; O(q1 + vt) + Δq, . . . , O(qn + vt) + Δq , t + Δt .
16.22 Aufgabe (Galilei–Gruppe) (a) Zeigen Sie analog zu Lemma 16.21, dass diese Abbildungen eine symplektische Gruppenwirkung der Galilei–Gruppe auf dem erweiterten Phasenraum Pn von n Teilchen definieren. (b) Wir betrachten die Hamilton–Funktion H : Pn → R, H(p1 , . . . , pn , E; q1 , . . . , qn , t) =
n
pk 2 k=1
2mk
+
Vk, (qk − q ) − E.
1≤k<≤n
Dabei sind die Vk, ∈ C ∞ (R3 , R). Zeigen Sie, dass H Galilei–invariant ist, falls die Wechselwirkungspotentiale Vk, rotationsinvariant sind. 3 16.23 Bemerkung (Struktur relativistischer Theorien) Dagegen kann eine endliche Anzahl relativistischer Teilchen nicht Poincar´e–invariant miteinander wechselwirken. Dies wurde zun¨achst f¨ ur zwei Teilchen gezeigt (siehe Currie, Jordan und Sudarshan in [CJS]) und darauf von Leutwyler in [Leu] verallgemeinert. Arens und Babbitt behandeln in [AB] nicht notwendigerweise hamiltonsche Wechselwirkungen. Diese Ergebnisse deuten darauf hin, dass eine relativistische Theorie mit Wechselwirkungen unendlich viele Teilchen zulassen muss. 3
16.6
Relativistische Dynamik
Zwei nicht zueinander parallele affine Hyperebenen des R4 besitzen einen Schnittpunkt. Bei beschleunigten Bezugssystemen existieren also Raumzeitpunkte, die gleichzeitig zu verschiedenen Punkten der Weltlinie sind, siehe Abbildung 16.6.1, links. 16.24 Beispiel (konstante Kraft) Bei konstanter Kraft (also bei im mitbewegten Bezugssystem konstanter Beschleunigung g > 0) wird die Bahn durch die Hamilton–Funktion H : R2 → R , H(p, q) = 1 + p2 − g q beschrieben, vergleiche mit Beispiel 8.7. Damit ist p˙ = g und q˙ = p/ 1 + p2 .
436
16.6. Relativistische Dynamik
t
t
2
2
]=
2
2
2
x
2
2
x
2
Abbildung 16.6.1: Weltlinien, das heißt Flugbahnen in Raumzeit-Darstellung. Die Geraden sind im beschleunigten Bezugssystem simultan. Links: R¨ uckkehr zum Ausgangspunkt. Rechts: Konstante Beschleunigung. Alle L¨osungskurven ergeben sich durch Raumzeittranslation aus der mit Energie H = 0 und p(0) = 0, also q(0) = 1/g. Wir erhalten q˙ = 1 − g/q 2 , also q(t) =
g −2 + t2
t und q(t) ˙ = ∈ (−1, 1). g −2 + t2
t → q(t), t ∈ R2 ist die parametrische Gleichung einer Hyperbel (siehe Abbildung 16.6.1, rechts). Die Raumzeitgeraden der im mitbewegten Bezugssystem zum Punkt q(s), s simultanen Ereignisse sind daher von der Form
q(s), s + c 1, q(s) ˙ | c ∈ R = span g −2 + s2 , s (s ∈ R), schneiden sich also alle im Nullpunkt der Raumzeit. uglich des NullDamit ist der Doppelkegel {(x, t) ∈ R2 | t2 > x2 } der bez¨ punktes des Minkowski–Raumes R2 zeitartigen Ereignisse zu keinem Punkt der Weltlinie simultan. 3 Das beschriebene Ph¨anomen deckt sich nicht mit der Alltagserfahrung, tritt aber auch im Alltag kaum auf (denn Beschleunigungen, die viel gr¨oßer als die Erdbeschleunigung sind und Entfernungen, die gr¨ oßer als ein Lichtjahr sind, geh¨oren nicht zu unserem Erfahrungsschatz): 16.25 Aufgabe (konstante Beschleunigung) Berechnen Sie die Entfernung des Kreuzungspunktes aus Beispiel 16.24 vom beschleunigten Beobachter, falls 3 dieser eine konstante Beschleunigung von 10 m/s2 erf¨ahrt.
Kapitel 17
Symplektische Topologie
Volumenerhaltendes, nicht symplektisches Kamel
¨ 17.1 Das symplektische Kamel und das Nadelohr . . . . . . . . 438 ´ 17.2 Der Satz von Poincare–Birkhoff . . . . . . . . . . . . . . . 442 17.3 Die Arnol’d–Vermutung . . . . . . . . . . . . . . . . . . . . 446
In der Theorie dynamischer Systeme werden topologische Methoden oft dann eingesetzt, wenn die Dynamik zu kompliziert ist, um direkt Fragen wie die nach der Existenz periodischer Orbits zu beantworten. Da hamiltonsche Differentialgleichungen (wie auch Gradienten–Differentialgleichungen) durch die Ableitung einer Funktion H : M → R definiert werden, A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 17,
437
438
17.1. Das symplektische Kamel und das Nadel¨ohr
werden topologische Aussagen u ¨ber Werte einer reellen Funktion auf einer Mannigfaltigkeit zu dynamischen Aussagen. Beispielsweise besitzt eine solche Funktion auf einer kompakten Mannigfaltigkeit Minimum und Maximum. Die Morse–Theorie sagt (abh¨angig von der Topologie der Mannigfaltigkeit) die Existenz weiterer kritischer Punkte der Hamilton–Funktion voraus. All diese sind Ruhelagen des dynamischen Systems. Die meisten Phasenr¨aume der Klassischen Mechanik sind nicht kompakt, weswegen die obigen Argumente verfeinert werden m¨ ussen. Die symplektische Topologie, ein in den letzten Jahrzehnten sehr aktives Forschungsgebiet, versucht, solche dynamische Eigenschaften hamiltonscher Systeme zu ergr¨ unden. Darin ersch¨opft sie sich aber nicht. Beispielsweise sind (nach dem Satz von Darboux, siehe Seite 214) symplektische Mannigfaltigkeiten gleicher Dimension lokal nicht von einander zu unterscheiden, ganz im Gegensatz etwa zu riemannschen Mannigfaltigkeiten. Was sind aber die globalen Invarianten? Einige Antworten kommen direkt in den Sinn: • Auf einer Mannigfaltigkeit kann es nicht isomorphe symplektische Strukturen geben, denn etwa das Volumen einer kompakten symplektischen Mannigfaltigkeit ist eine Invariante. • Ebenso tr¨agt nicht jede Mannigfaltigkeit eine symplektische Struktur. Abgesehen von der Bedingung gerader Dimension muss sie orientierbar sein. In diesem Kapitel werden einige weiter gehende Antworten angesprochen.
17.1
Das symplektische Kamel und das Nadel¨ ohr
Eher geht ein Kamel durch ein Nadel¨ohr, als dass ein Reicher in das Reich ” Gottes gelangt.” Evangelium nach Markus, 10,25 Unter diesem merkw¨ urdigen Titel firmiert eine von M. Gromov in den 1980er Jahren begonnene Analyse der Invarianten symplektischer Abbildungen. K¨onnte sich das symplektische Kamel mit beliebigen volumenerhaltenden statt nur mit ¨ symplektischen Diffeomorphismen verformen, so die Idee, w¨are die Uberwindung des Nadel¨ohrs keine Schwierigkeit. So aber verwehren ihm seine symplektischen Rippen den Zutritt. Das Kamel wird dabei durch eine Vollkugel Br vom Radius r im symplektischen Vektorraum (R2n , ω0 ) modelliert und das Nadel¨ohr durch ein Loch vom ur n = 1 Freiheitsgrad kann sich das Radius R in einer Hyperfl¨ache H ⊂ R2n . F¨ Kamel immer fl¨achenerhaltend d¨ unn machen und durch das Loch schl¨ upfen. F¨ ur n ≥ 2 geht das symplektisch aber nur 1 , falls r < R. 1 technisch: Es existiert eine symplektische Isotopie Φ : R2n → R2n , t ∈ [0, 1] mit Φ = Id, t 0 die die gelochte Hyperfl¨ ache invariant l¨ aßt und f¨ ur die Φ1 (Br ) in der anderen Komponente von R2n \ H liegt als Br .
17. Symplektische Topologie
439
Im von Gromov 1985 bewiesenen nonsqueezing -Satz wird gefragt, wann die Vollkugel Br symplektisch in einen speziellen Zylinder ZR vom Radius R abgebildet werden kann. Dies ist in beliebiger Dimension genau dann m¨oglich, wenn r ≤ R. Aus dem nonsqueezing-Satz folgt die obige Aussage u ¨ber das symplektische Kamel, aber, wie wir sehen werden, noch viel mehr (siehe aber [AbMa]). Wir schauen uns das Problem zun¨achst in einer stark vereinfachten Situation an, bei der nur affin symplektische Abbildungen des 2n–dimensionalen Vektorraums E f :E→E
,
x → g(x) + a mit
g ∈ Sp(E, ω) und a ∈ E
(17.1.1)
betrachtet werden. Diese bilden als semidirektes Produkt E Sp(E, ω) eine Lie– Gruppe, genannt ASp(E).2 Um Objekte wie Kugeln und Zylinder zu definieren, ben¨otigt man eigentlich eine euklidische Norm, also eine Zusatzstruktur. Außerdem werden Kugeln unter affinen symplektischen Abbildungen nicht auf Kugeln abgebildet (die Eigenschaft, eine Kugel zu sein, ist also keine affin symplektische Invariante). Dagegen ist in einem endlich-dimensionalen reellen Vektorraum E auch ohne Norm definierbar, wann eine Teilmenge E ⊆ E ein Ellipsoid ist, n¨amlich, wenn f¨ ur eine geeignete positiv definite quadratische Form Q:E→R
gilt:
E = {x ∈ E | Q(x) ≤ 1}.
Da sich die quadratische Form aus dem Ellipsoid durch Q(0) := 0 und Q(x) := inf{q > 0 | x/q ∈ E} f¨ ur x ∈ E \ {0} rekonstruieren l¨aßt, sind Ellipsoide und positiv definite quadratische Formen zwei Seiten einer Medaille. Unsere erste Frage ist die nach den symplektischen Normalformen von Ellipsoiden (beziehungsweise positiv definiten quadratischen Formen). Wir vergleichen zun¨achst mit Normalformen f¨ ur andere Gruppen: • Auf dem Raum P = P(E) dieser Formen wirkt die allgemeine lineare Gruppe GL(E) transitiv durch GL(E) × P → P
, (f, Q) → Q ◦ f.
Dies kann man f¨ ur den Fall E = Rd und die Darstellung Q(x) = x Q x mit −1/2 1/2 Q ∈ Sym(d, R) sehen, indem man Q1 mit der Kongruenzmatrix Q1 Q2 ∈ GL(d, R) in Q2 transformiert. Jedes Ellipsoid l¨asst sich also linear in die Einheitskugel u uhren. ¨berf¨ • F¨ ur die spezielle lineare Gruppe SL(d, R) ⊂ GL(d, R) ist das Volumen des Ellipsoids die einzige Invariante, und dieses ist proportional zu det(Q)−1/2 . • F¨ ur die orthogonale Gruppe O(d) ⊂ GL(d, R) sind dagegen die d L¨angen der Hauptachsen des Ellipsoids die Invarianten. 2 Ihre
Dimension ist n(2n + 3), denn nach Aufgabe 6.26 ist dim Sp(E, ω) = n(2n + 1).
440
17.1. Das symplektische Kamel und das Nadel¨ohr
Im Vergleich zum letzten Fall gibt es f¨ ur d = 2n und die symplektische Gruppe nur halb so viele Invarianten: 17.1 Lemma (Symplektische Normalform von Ellipsoiden) F¨ ur jedes Ellipsoid E ⊂ R2n im kanonischen symplektischen Vektorraum (R2n , ω0 ) gibt es eindeutige reelle Zahlen 0 < r1 ≤ . . . ≤ rn und eine symplektische Abbildung f ∈ Sp(2n, R) mit E = f (Er1 ,...,rn ) f¨ ur das Ellipsoid
n p2 +q2 Er1 ,...,rn := (p, q) ∈ R2n k=1 kr2 k ≤ 1 . k
Beweis: Dies folgt aus Lemma 6.29 und der Normalform-Darstellung (6.3.2). 2 Damit sind die linear symplektischen Bilder von Br2n = Er,...,r die bestm¨oglichen Analoga der euklidischen Kugel Br2n vom Radius r > 0, und f¨ ur n ≥ 2 ist nicht jedes Ellipsoid f¨ ur einen geeigneten Radius r so darstellbar. Wir betrachten symplektische Zylinder der Form ZR := (p, q) ∈ Rnp × Rnq = R2n | p21 + q12 ≤ R2 . Die Frage ist nun, wann es ein f ∈ ASp(R2n , ω0 ) gibt mit f (Br ) ⊂ ZR . 17.2 Satz (Gromovs nonsqueezing-Resultat, linearer Fall) Genau dann kann man eine Kugel vom Radius r affin symplektisch in den Zylinder ZR abbilden, wenn r ≤ R ist. Beweis: • F¨ ur r ≤ R bildet f = Id die Kugel in den Zylinder ab. • Die Nichtexistenz-Aussage folgt durch Skalierung aus dem Spezialfall r = 1. Es sei f (x) = g(x) + a mit g ∈ Sp(R2n , ω0 ) und a = (a1 , . . . , a2n ) ∈ R2n . Die linke Seite der Bedingung maxx∈S 2n−1 f1 (x)2 + fn+1 (x)2 ≤ R2 ist minimal f¨ ur a1 = an+1 = 0. Auch die Transponierte H = (h1 , . . . , h2n ) der darstellenden Matrix von g ist symplektisch, und daher gilt hk hn+k ≥ ω0 (hk , hn+k ) = 1. Wir folgern = maxx∈S 2n−1 h1 , x2 + hn+1 , x2 maxx∈S 2n−1 f1 (x)2 + fn+1 (x)2 ≥
max{ h1 2 , hn+1 2 } ≥ 1,
durch Anwendung der Ungleichung ab ≤ max{a2 , b2 } auf a := h1 und b := 2
hn+1 . 17.3 Bemerkung (Squeezing f¨ ur volumenerhaltende Abbildungen) Stellt man die analoge Frage f¨ ur affine volumenerhaltende Abbildungen (bei denen in (17.1.1) gefordert wird, dass g ∈ SL(2n, R) ist), dann ist f¨ ur n ≥ 2 Freiheitsgrade eine entsprechende Einbettung immer m¨oglich. Denn dann besitzt der Zylinder ZR (der selbst als degenerierte Ellipse aufgefasst werden kann) unendliches Volumen. Die Aussage betrifft also eine spezifische, u ¨ber die Volumenerhaltung hinausgehende, Eigenschaft symplektischer Abbildungen. 3
17. Symplektische Topologie
441
17.4 Korollar Genau dann kann man das Ellipsoid Er1 ,...,rn affin symplektisch in den Zylinder ZR abbilden, wenn r1 ≤ R ist. Wesentlich ist also, dass die symplektische Fl¨ache πr12 des Ellipsoids kleiner als die symplektische Fl¨ache πR2 des Zylinders ist. Im nonsqueezing-Satz wird damit eine zweidimensionale Eigenschaft von Teilmengen des symplektischen Phasenraums gemessen. Grundlegende Invarianten der symplektischen Theorie sind zweidimensional, w¨ahrend etwa Kurvenl¨angen eindimensionale Invarianten der riemannschen Theorie sind. Wir sehen dies auch am Beispiel der von Helmut Hofer eingef¨ uhrten displacement-Energie 1 sup(Ht ) − inf(Ht ) dt e(K) := inf {Ht }
0
einer (kompakten) Teilmenge K ⊂ M einer symplektischen Mannigfaltigkeit (M, ω). Diese misst die Energie, die ben¨ otigt wird, um durch einen von {Ht }t∈[0,1] erzeugten hamiltonschen Fluss {φt }t∈[0,1] die Menge K von sich selbst zu trennen, das heißt φ1 (K) ∩ K = ∅. 17.5 Beispiel (Displacement-Energie) Wir schauen uns den einfachsten Fall eines Flusses an, der von einer linearen zeitunabh¨angigen Hamilton–Funktion erzeugt wird K wirkt. Das
und auf ein Ellipsoid
Ellipsoid sei achsenparallel, das 2 p2k n qk 2n heißt K = (p, q) ∈ R k=1 r2 + s2 ≤ 1 . Der von der Hamilton–Funktion k
Hξ,η : R
2n
→R
k
, Hξ,η (p, q) = ξ, p − η, q
(ξ, η ∈ Rn )
erzeugte Fluss ist die Verschiebung φt (p, q) = (p + tη, q + tξ).
2 −1/2 2 n ηk ξk die Tren• Damit ist f¨ ur alle Zeiten |t| > T (ξ, η) := 2 2 + s2 k=1 rk k nung erfolgt (φt (K) ∩ K = ∅). Genau dann, wenn (η, ξ)/2 ein Punkt der Oberfl¨ache von K ist, gilt damit T (ξ, η) = 1. • Andererseits ist die eingesetzte Energie gleich
Hξ,η
:= max{Hξ,η (x) | x ∈ K} − min{Hξ,η (x) | x ∈ K} = 2 max{Hξ,η (x) | x ∈ K},
wegen der Punktsymmetrie von K. Durch Maximierung mit der Nebenbedingung x ∈ K ergibt sich 2 2 1/2 .
Hξ,η = 2 ξ, r + η, s Schreiben wir die Komponenten des Verschiebungsvektors in der Polarform + η2 ξ2 ξk = k sk cos ϕk , , ηk = k rk sin ϕk mit k := r2k + sk2 , (17.1.2) k
k
n 2 1/2 dann ist Hξ,η = 2 . k=1 (k rk sk ) • Wir nehmen jetzt T (ξ, η) = 1 an, also 2 = 2. Falls fj = min{f1 , . . . , fn }
442
17.2. Der Satz von Poincar´e–Birkhoff
f¨ ur fk := rk sk , nimmt Hξ,η das Minimum 4fj an, wann immer in (17.1.2) ur alle anderen k gilt. Damit ist die Verschiebungsenergie j = 2 und k = 0 f¨ proportional zur oben definierten symplektischen Fl¨ache des Ellipsoids. 3 Die Displacement-Energie ordnet zwar Mengen wie den Ellipsoiden eine nichtnegative Zahl zu, aber diese h¨angt von der Einbettung der Menge in die symplektische Mannigfaltigkeit (im Fall der Ellipsoide der (R2n , ω0 )) ab, ist also keine intrinsische Gr¨oße. Als Konsequenz haben Ekeland und Hofer in [EH] axiomatisch definiert, was unter einer (intrinsischen) symplektischen Kapazit¨at zu verstehen sei. 17.6 Definition Eine Abbildung c : (P, ω) → [0, ∞], die den symplektischen Mannigfaltigkeiten nichtnegative Zahlen zuordnet, heißt eine symplektische Kapazit¨ at, wenn sie die folgenden Eigenschaften besitzt: Monotonie: Falls es eine kanonische Transformation gibt, die (P1 , ω1 ) in (P2 , ω2 ) einbettet, ist c(P1 , ω1 ) ≤ c(P2 , ω2 ). Skalierung: F¨ ur k > 0 gilt c(P, k ω) = k c(P, ω). Nichttrivialit¨ at: F¨ ur die Einheitskugeln B12n in (R2n , ω0 ) gilt c(B12n , ω0 ) > 0; f¨ ur die symplektischen Zylinder Z1 in (R2n , ω0 ) gilt c(Z1 , ω0 ) < ∞. 17.7 Satz (Gromovs nonsqueezing-Resultat) Wenn es eine symplektische Kapazit¨at mit c(B12n , ω0 ) = c(Z1 , ω0 ) gibt, dann gilt: Genau dann kann man eine Kugel vom Radius r symplektisch in den Zylinder ZR abbilden, wenn r ≤ R ist. Beweis: • Ist r ≤ R, dann ist Br2n schon eine Teilmenge von ZR . • Bei Existenz einer symplektischen Einbettung I : Br2n → ZR gilt: c(Br2n , ω0 ) ≤ c(ZR , ω0 ) = c(Z1 , R−2 ω0 ) = R−2 c(Z1 , ω0 ) = R−2 c(B12n , ω0 ), ur r > R einen Widerspruch zur Posiwas wegen c(Br2n , ω0 ) = r−2 c(B12n , ω0 ) f¨ 2 tivit¨at von c(B12n , ω0 ) darstellt. Tats¨achlich haben Gromov und Hofer–Zehnder solche Kapazit¨aten definiert.
17.2
Der Satz von Poincar´ e–Birkhoff
Poincar´e, der ja als Erster systematisch qualitative Methoden in die Mechanik einf¨ uhrte, formulierte in seinem ,letzten geometrischen Theorem’ eine Aussage u ¨ber fl¨achenerhaltende Abbildungen. Diese wurde 1925 von George David Birkhoff bewiesen. Wir betrachten f¨ ur die Radien 0 < r− < r+ < ∞ und die Kreislinie S 1 = R/2πZ einen Hom¨ oomorphismus H = (R, Φ) : A −→ A
des Kreisrings
A := [r− , r+ ] × S 1 ,
(17.2.1)
17. Symplektische Topologie
443
der die beiden Randkomponenten {r± }×S 1 orientierungserhaltend auf sich abbil¨ det. Die bez¨ uglich der Uberlagerung A˜ := [r− , r+ ]×R → A zu H semikonjugierte Abbildung ˜ = (R, ˜ Φ) ˜ : A˜ → A˜ H ˜ ϕ + 2π) = R(r, ˜ ϕ) und besitzt die Periodizit¨aten R(r, ˜ ϕ + 2π) = Φ(r, ˜ ϕ) + 2π. Φ(r,
(17.2.2)
Die Randkomponenten sollen gegenl¨aufig verdreht werden, das heißt es gebe ϕ− < 0 < ϕ+ mit ˜ ± , ϕ) = ϕ + ϕ± Φ(r (ϕ ∈ R). (17.2.3) ˜ Letzteres ist haupts¨achlich eine Forderung an H, aber auch an die Wahl von H.
17.8 Satz (Poincar´ e–Birkhoff) Ist der Hom¨oomorphismus H fl¨achenerhaltend 3, dann besitzt er mindestens zwei Fixpunkte im Inneren des Kreisrings A. 17.9 Bemerkung Die Voraussetzung, dass H fl¨achenerhaltend ist, kann nicht weggelassen werden. Gegenbeispiele sind die Diffeomorphismen des Kreisrings 1 ˜ ε (r, ϕ) := r − ε(r − r+ )(r − r− ) , ϕ + r − 1 (r+ + r− ) H . |ε| < r+ −r 2 − Diese sind f¨ ur ε = 0 fixpunktfrei und nur f¨ ur ε = 0 fl¨achenerhaltend.
3
Beweis: Wir nehmen vereinfachend an, dass H zweimal stetig differenzierbar ist. In der Arbeit [Bi2] von George David Birkhoff findet man einen Beweis, der ohne diese Annahme auskommt. Die Abbildung Ψ:A→R
˜ ϕ) − ϕ , Ψ(r, [ϕ]) := Φ(r,
ist wegen (17.2.2) wohldefiniert und misst die Winkeldifferenz zwischen Bild und Urbild von H. Insbesondere ist wegen (17.2.3) Ψ(r± , [ϕ]) = ϕ± , also 0 ∈ Ψ(A). • Ist 0 regul¨arer Wert von Ψ, dann ist die Urbildmenge M := Ψ−1 (0) ⊂ A eine eindimensionale kompakte Untermannigfaltigkeit. Damit besteht sie aus endlich vielen Zusammenhangskomponenten Mi , die ihrerseits diffeomorph zur Kreislinie sind. Die Restriktionen Πi : Mi → S 1 der Projektion Π : A → S 1 , (r, ϕ) → ϕ besitzen also Abbildungsgrade deg(Πi ) (siehe Seite 122), von denen wir durch onnen, dass sie nichtnegativ sind. Wahl der Orientierung von Mi annehmen k¨ Ein Abbildungsgrad gr¨ oßer als Eins kann nicht vorkommen, weil sonst Mi Selbst¨ uberschneidungen aufweisen m¨ usste. Die Mi sind Jordan–Kurven. A\Mi 3 Wir nehmen das Lebesgue-Maß auf A beziehungsweise die Fl¨ achenform dr ∧ dϕ, aber etwa uhrende Maß r dr ∧ dϕ kann verwendet werden. auch das vom Polarkoordinaten auf R2 herr¨
444
17.2. Der Satz von Poincar´e–Birkhoff
besteht also nach dem jordanschen Kurvensatz 4 aus genau zwei Zusammenhangskomponenten. Es muß aber einen Index j mit deg(Πj ) = 1 geben, weil sonst {r− } × S 1 und {r+ } × S 1 jeweils in der gleichen Komponente liegen w¨ urden. Schnittpunkte von Mj mit H(Mj ) sind Fixpunkte von A, denn nur die erste Komponente eines Punktes (r, ϕ) ∈ M kann sich bei Anwendung von A ¨andern. Solche Schnittpunkte existieren, denn sonst w¨ urde eine Zusammenhangskomponente U M2 M1 von A − Mj durch H in eine echte Teilmenge H(U ) von sich abgebildet. Dies w¨ urde der Fl¨achenerhaltung widersprechen, denn auch die Fl¨ache dieser Teilmenge w¨are echt kleiner. Wenn es aber einen Schnittpunkt von Mj mit H(Mj ) gibt, existiert noch ein zweiter solcher Schnittpunkt. • Ist aber 0 kein regul¨arer Wert von Ψ, dann betrachten wir die St¨orungen Hε : A → A
,
Hε := Rε ◦ H
mit
Rε (r, ϕ) := (r, ϕ − ε)
ullt Hε die Voraussetzungen des Satzes. Wevon H. F¨ ur alle ε ∈ (ϕ− , ϕ+ ) erf¨ gen des Satzes von Sard (siehe Seite 299) gibt es eine gegen Null konvergente ur die Hεn auch die Regularit¨atsvoraussetzung des ersten Teils Folge (εn )n∈N , f¨ des Beweises erf¨ ullt. Also existiert eine Folge von Fixpunkten xn von Hεn . Wegen der Kompaktheit des Kreisringes besitzt diese eine konvergente Teilfolge. Deren Limespunkt x ∈ A ist Fixpunkt von H. Eine Verfeinerung des Argumentes zeigt, dass es sogar zwei Fixpunkte gibt. 2 Eine besonders einfache Klasse von Abbildungen (17.2.1) sind monotone Twistabbildungen. Diese sind stetig differenzierbar, mit partieller Ableitung D1 Φ > 0. Daher ist nach dem Satz u ¨ber implizite Funktionen die Nullstellenmenge M = Ψ−1 (0) ⊂ A Graph einer Funktion des Winkels. 17.10 Beispiele (Monotone Twistabbildungen) 1. (Standardabbildung) Die in Abschnitt 15.6 behandelten fl¨achenerhaltenden Standardabbildungen Fε (x, y) = x + y + ε sin(2πx), y + ε sin(2πx) haben die monotone Twist-Eigenschaft D1 Φ > 0. Dabei wird x als die Winkelvariable ϕ und y ∈ R als Radius r aufgefasst, so dass Φ(r, ϕ) = ϕ + r + ε sin(2πϕ) ist. 4 Jordanscher Kurvensatz: Das Komplement des Bildes c(S 1 ) ⊂ R2 einer einfachen geschlossenen Kurve c : S 1 → R2 in der Ebene besteht aus genau zwei Zusammenhangskomponenten, von denen die eine beschr¨ ankt, die andere unbeschr¨ ankt ist. c(S 1 ) ist der Rand beider Zusammenhangskomponenten.
17. Symplektische Topologie
445
Zwar ist die Bedingung der Invarianz und gegenl¨aufigen Verdrehung (17.2.3) der Randkreise f¨ ur ε = 0 in diesen Koordinaten nicht erf¨ ullt. Man kann aber — und in dieser Idee liegt das eigentliche Anwendungspotential des Satzes von Poincar´e–Birkhoff — das von zwei invarianten KAM-Tori eingeschlossene Gebiet betrachten, und auf die Existenz zweier Fixpunkte in diesem Gebiet schließen. Dass die Punkte (x, y) = (0, 0) und (x, y) = (1/2, 0) Fixpunkte der Standardabbildungen Fε sind, sieht man allerdings auch direkt. Ebenso rechnet man von Fε an diesen Fixpunk nach, 1dass die Linearisierung 1−2πε 1 ten von der Form 1+2πε beziehungsweise ist, f¨ ur ε = 0 der −2πε 1 2πε 1 eine also im Sinn der Klassifikation von SL(2, R)–Matrizen (Aufgabe 6.26) hyperbolisch, der andere elliptisch ist. Die Abbildungen 15.6.1 lassen vermuten und man kann beweisen, dass sich um den hyperbolischen Fixpunkt eine chaotische Zone bildet, w¨ahrend der elliptische Fixpunkt von invarianten Tori umschlossen wird. All dies sind typische Eigenschaften von Twistabbildungen. 2. (Konvexer Billard) Eine einfache geschlossene Kurve c : S 1 → R2 definiert nach dem gerade benutzten jordanschen Kurvensatz ein beschr¨anktes Gebiet im R2 . Dieses kann man als Billardtisch auffassen. Am einfachsten liegen die Verh¨altnisse, wenn die Kurve glatt, regul¨ar und positiv gekr¨ ummt ist 5 . Wir normieren die L¨ange der Kurve zu 2π. Die Billardtrajektorie besteht dann aus einem Streckenzug, dessen Ecken auf dem Rand C := c(S 1 ) des liegen, und bei denen die Richtun Billardtischs gen zur Kurvennormale 10 −1 c (t) sich nach der Regel ,Ausfallwinkel = − 0 Einfallwinkel’ ver¨andern. Neben der Bogenl¨ange t des Kollisionspunktes parametrisiert der Ausfallwinkel, oder praktischerweise dessen Sinus u, die Strecke. Der Phasenraum der diskretisierten Dynamik ist damit ein Kreisring der Form A := [−1, 1] × S 1 . Wegen der positiven Kr¨ ummung des Randes sind die jeweils folgenden Kollisionen mit dem Rand transversal, die Abbildung Φ : A → A also nach dem Satz u ¨ber die implizite Funktion glatt. Die Transversalit¨at wird nur verletzt f¨ ur den Fall einer zu C tangentialen Richtung, also u = ±1. In diesem Fall ist (u, t) Fixpunkt von Φ, weshalb eine der Bedingungen des Satzes 17.8 erf¨ ullt ist. Aus dem gleichen Grund ist aber die Bedingung (17.2.3) an die Verdrehung der Randkomponenten verletzt. Auch die Aussage des Satzes ist falsch, denn f¨ ur einen von ±π verschiedenen Winkel ist der n¨achste Kollisionspunkt vom ˚ = (−1, 1) × S 1 vor. gegebenen verschieden, es liegt also kein Fixpunkt in A Dennoch ist der Satz von Poincar´e–Birkhoff auf das Billardproblem anwendbar. Da n¨amlich die Winkeldifferenz ϕ+ − ϕ− (siehe (17.2.3)) gleich 2π ist, 5 Ist c nach der Bogenl¨ ange parametrisiert (was f¨ ur regul¨ oglich * ist und wir im m¨ ) are Kurven c (t) > 0. weiteren annehmen), dann bedeutet positive Kr¨ ummung c (t), 10 −1 0
446
17.3. Die Arnol’d–Vermutung
entspricht der n–ten Iterierten Φn eine Winkeldifferenz von 2πn. Damit be˚ Diese geh¨oren zu sitzt f¨ ur alle n ≥ 2 die Abbildung Φn Fixpunkte in A. n–periodischen Orbits von Φ. Da Φm und Φn f¨ ur teilerfremde Potenzen m, n keinen gemeinsamen Fixpunkt ˚ haben k¨onnen, besitzt Φ unendlich viele periodische Orbits. in A 3
17.3
Die Arnol’d–Vermutung
Schon George David Birkhoff suchte nach einer Verallgemeinerung seines Satzes auf h¨ohere Phasenraumdimensionen. Eine solche Verallgemeinerung ist in den letzten Jahren mit dem Beweis der Arnol’d–Vermutung gelungen. 17.11 Bemerkung (Arnol’d-Diffusion) Zun¨achst ist nicht einmal klar, wie eine solche Aussage u onnte. Betrachten wir als Anwendungs¨berhaupt aussehen k¨ bereich des Satzes von Poincar´e–Birkhoff das Phasenraumportrait eines hamiltonschen Systems mit zwei Freiheitsgraden, wie in Abbildung 15.4.3. Da die Energiefl¨ache dreidimensional ist, besitzen die zweidimensionalen KAM-Tori Kodimension Eins. Zwei solche KAM-Tori k¨ onnen also ein dreidimensionales Gebiet einschließen. Nach Diskretisierung der Dynamik durch eine Poincar´e–Fl¨ache gelangen wir zu einem Kreisring zwischen zwei invarianten Kreislinien. Da nun f¨ ur n Freiheitsgrade die n–dimensionalen KAM–Tori in der Energieschale die Kodimension n − 1 besitzen, begrenzen endlich viele von ihnen f¨ ur n > 2 kein Gebiet. Statt dessen k¨onnen in diesem Fall nicht auf einem invarianten Torus befindliche Anfangswerte zu Trajektorien geh¨oren, deren Wirkungsvariablen sich zeitlich ¨ahnlich wie eine Irrfahrt verhalten. Dem entspricht ein auch auf den Sph¨aren ω = const. zusammenh¨angendes Komplement der diophantischen Menge, das f¨ ur n = 3 und ω3 = 1 nebenstehend (in Schwarz) abgebildet ist. Dies ist zu vergleichen mit der Abbildung f¨ ur n = 2 auf Seite 383. Dieses Arnol’d-Diffusion genannte Ph¨anomen konnte f¨ ur einige hamiltonsche Systeme nachgewiesen werden, so im von Kaloshin und Levi [KL] ausgearbeiteten Fall der Bewegung in einem periodischen Potential. Siehe auch Kapitel 6 von Lichtenberg und Lieberman [LL]. 3 In dieser Richtung ist also keine Verallgemeinerung zu erwarten. Der folgende alternative Beweis des Satzes von Poincar´e–Birkhoff f¨ ur das Billard-Problem ergibt aber eine erfolgversprechendere Perspektive.
17. Symplektische Topologie
447
17.12 Beispiel (Periodische Orbits konvexer Billardtische) In Beispiel 17.10.2 wurden die Kollisionsdaten mit den Phasenraumkoordinaten (u, t) ∈ A = [−1, 1] × S 1 parametrisiert; die diskrete Dynamik H = (R, Φ) : A → A f¨ uhrte entsprechend einen Punkt (u0 , t0 ) in (u1 , t1 ) u ¨ber. Die monotone Twistbedingung D1 Φ > 0 erm¨oglicht es, die Startrichtung u0 aus dem Paar (t0 , t1 ) von Randpunkten zu berechnen. Setzen wir n¨amlich als erzeugende Funktion der kanonischen Transformation S : S1 × S1 → R
, S(t0 , t1 ) = − c(t1 ) − c(t0 ) ,
dann ist, abgesehen von der Diagonale Δ ⊂ S 1 × S 1 des Torus, S eine glatte Funktion (und die Diagonalpunkte (t, t) ∈ Δ entsprechen uneigentlichen, zum Rand tangentialen Billard-Trajektorien). Die partiellen Ableitungen sind D1 S(t0 , t1 ) = c (t0 ), c(t1 ) − c(t0 ) / c(t1 ) − c(t0 ) = sin ϕ0 = u0 und analog D2 S(t0 , t1 ) = u1 . Die kritischen Punkte (t0 , t1 ) von S entsprechen daher u0 = u1 = 0, also einem beidseitig senkrecht auf dem Rand C auftretenden Segment der Billardtrajektorie. Iteration f¨ uhrt hier zu einem zwei-periodischen Orbit. Wir schließen auf die Existenz eines solchen Orbits, weil S einen negativen Minimalwert besitzt, w¨ahrend S auf Δ verschwindet. Wegen der Symmetrie S(t1 , t0 ) = S(t0 , t1 ) wird dieser Minimalwert zweimal angenommen. Ein weiterer periodischer Orbit entspricht einem (eventuell degenerierten) Sattelpunkt von S. Auf dessen Existenz kann man daraus schließen, dass S auf der Diagonale gleich Null ist. Damit entspricht S (durch Aufschneiden des Torus an der Diagonalen) einer Funktion auf einem Kreisring A, die auf dessen beiden Randkreisen ∂± A den Wert Null annimmt und in dessen Inneren negativ ist. Den Sattelpunkt findet man zum Beispiel durch Betrachtung des Minimaxproblems maxd∈D min S d(x) < 0, x∈[0,1]
mit
D := d : [0, 1] → A | d stetig, d(0) ∈ ∂− A, d(1) ∈ ∂+ A .
3
17.13 Aufgabe (elliptischer Billard) Zeigen Sie f¨ ur einen elliptischen Billardtisch mit Rand C := {x ∈ R2 | (x1 /a1 )2 + (x2 /a2 )2 = 1} und Halbachsen 0 < a1 < a2 , dass die diskrete Dynamik genau zwei geometrisch verschiedene periodische Trajektorien der Minimalperiode Zwei besitzt. 3 Die Minimalzahl kritischer Punkte betr¨agt hier also Zwei. Im Zusammenhang solcher Beispiele stellte Arnol’d in den 1960er Jahren die folgende Vermutung auf, siehe Anhang 9 in [Ar2]. Arnol’d–Vermutung: Ein hamiltonscher Symplektomorphismus Φ : P → P (siehe Definition 10.27) einer kompakten symplektischen Mannigfaltigkeit P • besitzt mindestens so viele Fixpunkte, wie eine glatte Funktion S : P → R
448
17.3. Die Arnol’d–Vermutung
kritische Punkte. • Falls seine Fixpunkte nicht degeneriert sind, ist deren Anzahl mindestens so groß wie die der kritischen Punkte einer Morse–Funktion S : P → R. Hier wurden die folgenden Begriffe benutzt (siehe auch Anhang G): 17.14 Definition F¨ ur eine differenzierbare Mannigfaltigkeit P heißt • ein Fixpunkt x ∈ P einer Abbildung Φ ∈ C 1 (P, P ) nicht degeneriert, wenn die lineare Abbildung DΦ(x) − IdTx P : Tx P → Tx P bijektiv ist; • eine Funktion f ∈ C 2 (P, R) Morse–Funktion, wenn alle kritischen Punkte x von f nicht degeneriert sind, das heißt die Hessesche D2 f (x) als Bilinearform nicht degeneriert im Sinn von Definition 6.12 ist. 17.15 Bemerkungen (Arnol’d–Vermutung) 1. Da die Minimalzahlen der in der Vermutung angesprochenen kritischen Punkte berechenbar sind (siehe Anhang G), ergeben die behaupteten Ungleichungen einen Zugang zu den periodischen Orbits von Φ. 2. Falls der hamiltonsche Symplektomorphismus Φ : P → P Zeit-Eins-Fluss der hamiltonschen Differentialgleichung einer Hamilton–Funktion H : P → R ist, ist die Arnol’d–Vermutung f¨ ur Φ offensichtlich richtig, denn die Ruhelagen des Flusses entsprechen den kritischen Punkten von H. Dies zeigt auch, dass die behaupteten Ungleichungen schon optimal sind, wenn es auf P eine perfekte Morse–Funktion gibt (siehe Seite 538). 3. Dass der Symplektomorphismus Φ hamiltonsch ist, ist eine im Allgemeinen notwendige Voraussetzung f¨ ur die Existenz von Fixpunkten. Denn der Zwei-Torus P := T2 mit Fl¨achenform ω ist eine kompakte symplektische Mannigfaltigkeit, und jede Verschiebung Φa : P → P, x → x + a ist symplektisch. Aber diese ist fixpunktfrei außer f¨ ur den hamiltonschen Fall Φ0 = IdP (siehe Beispiel 10.29.3). 4. Eine Morse–Funktion f ∈ C 2 (P, R) heisst Morse-Smale, wenn sich (anders als in der Abbildung auf Seite 540) die stabilen Mannigfaltigkeiten der kritischen Punkte p mit den instabilen Mannigfaltigkeiten der q transversal schneiden. In diesem Fall kann die Morse-Theorie auf mittels der transversalen Schnitte definierten relativen Indices von (p, q) aufgebaut werden, siehe M. Schwarz [Schw]. Dies erm¨ oglicht f¨ ur unendlich-dimensionale P die nach Andreas Floer benannte Floer–Theorie, siehe [Bo2] von R. Bott, [McD] von D. McDuff und Kapitel 6 in [Jo] von J. Jost. 3 17.16 Weiterf¨ uhrende Literatur F¨ ur ein gr¨ undliches Studium eignen sich der das Gebiet definierende Artikel [Ar5] von Arnol’d, die Lehrb¨ ucher von McDuff und Salamon [MS], von Hofer und Zehnder [HZ, Zeh] und die darin zitierte Literatur. 3
Anhang A
Topologische R¨ aume und Mannigfaltigkeiten A.1 Topologie und Metrik . . . . . . . . . . . . . . . . . . . . . 449 A.2 Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . 457 A.3 Das Tangentialbundel ¨ . . . . . . . . . . . . . . . . . . . . . 463
A.1
Topologie und Metrik
Eine Teilmenge von R nennen wir offen, wenn sie Vereinigung offener Intervalle (a, b) ⊆ R ist. Damit wird R zu einem topologischen Raum: A.1 Definition 1. Ein topologischer Raum ist ein Paar (M, O), bestehend aus einer Menge M und einer Menge O von Teilmengen (genannt offene Mengen) von M derart, dass gilt 1. ∅ und M sind offen, 2. beliebige Vereinigungen offener Mengen sind offen, 3. der Durchschnitt von je zwei offenen Mengen ist offen. 2. O heißt Topologie von M . 3. Sind O1 und O2 Topologien auf M und O1 ⊆ O2 , dann heißt O1 gr¨ ober als O2 und O2 feiner als O1 . A.2 Beispiele 1. Die diskrete Topologie 2M (Potenzmenge) beziehungsweise die triviale Topologie {M, ∅} sind die feinste bzw. gr¨obste Topologie einer Menge M . Die topologischen R¨aume (M, 2M ) heißen diskret. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 18,
449
450
A.1. Topologie und Metrik
2. Ist N ⊆ M Teilmenge eines topologischen Raumes (M, O), dann ist {U ∩ N | U ∈ O} ⊆ 2N
(A.1.1)
eine Topologie auf N , die sogenannte Teilraumtopologie, Spurtopologie oder induzierte Topologie. Etwa f¨ ur die Teilmenge N := [0, ∞) von R sind alle Teilintervalle der Form [0, b) ⊂ N mit b ∈ N in N (nicht aber in R) offen. 3. Sind (M, OM ) und (N, ON ) disjunkte (d.h. M ∩N = ∅) topologische R¨aume, dann ist die Vereinigung M ∪ N mit {U ∪ V | U ∈ OM , V ∈ ON } ⊆ 2M ∪N ein topologischer Raum, genannt Summenraum. 4. Es sei (M, OM ) ein topologischer Raum und f : M → N surjektiv. Die durch f auf N induzierte Quotiententopologie ist die Topologie V ⊆ N | f −1 (V ) ∈ OM ⊆ 2N . 3 A.3 Satz Es sei F eine beliebige Familie von Teilmengen einer Menge M . • Dann existiert eine eindeutige gr¨obste Topologie O(F) von M mit F ⊆ O(F). • O(F) heißt die von F erzeugte Topologie. In vielen F¨allen wird die Topologie von einer Metrik erzeugt. A.4 Definition • Ein metrischer Raum ist ein Paar (M, d), bestehend aus einer Menge M und einer Funktion d : M × M → [0, ∞), derart, dass f¨ ur alle x, y, z ∈ M gilt (a) d(x, y) = 0 ⇐⇒ x = y (b) d(x, y) = d(y, x)
(Positivit¨at)
(Symmetrie)
(c) d(x, z) ≤ d(x, y) + d(y, z)
(Dreiecksungleichung).
• d heißt Metrik, d(x, y) Abstand von x und y. • F¨ ur x ∈ M und ε > 0 heißt Uε (x) := {y ∈ M | d(y, x) < ε} (offene) ε–Umgebung von x in M . A.5 Beispiele 1. Die Menge B := {0, 1} bezeichnet ein Bit. Wir betrachten Folgen von n ∈ N Bits, das heißt Elemente von B n . Ihr sogenannter Hamming–Abstand ist durch die Metrik d : B n × B n → {0, 1, . . . , n}, d (b1 , . . . , bn ), (c1 , . . . , cn ) := i ∈ {1, . . . n} | bi = ci gegeben 1 , also durch die Zahl der Stellen, an denen sich die beiden Bitfolgen unterscheiden. Diese Metrik wird in der Informationstheorie benutzt. 1 mit
Schreibweise als Zeilenvektoren.
A. Topologische R¨aume und Mannigfaltigkeiten
451
2. Ist (M, d) ein metrischer Raum und N eine Teilmenge von M , dann ist (N, dN ) mit der ,auf N restringierten’ Metrik 2 dN : N × N → R
, dN (x, y) := d(x, y)
ebenfalls ein metrischer Raum. Etwa f¨ ur M := C mit der Metrik d(x, y) := |x−y| ist S 1 ⊂ C geometrisch die Kreislinie vom Radius 1 um den Nullpunkt. Der Abstand dS 1 (x, y) zwischen zwei Kreispunkten ist dann gleich der L¨ange der Sekante mit den Endpunkten x und y. Eine andere sinnvolle Metrik auf S 1 ist durch die (minimale) Winkeldifferenz von x und y gegeben. 3. Auf dem Vektorraum Rn wird die L¨ange eines Vektors durch die euklidische Norm n 2 v = (v1 , . . . , vn ) ∈ Rn
v := i=1 vi von v definiert. Mit d(x, y) := y − x ergibt sich daraus eine Metrik auf dem Rn , genannt die euklidische Metrik. 4. Auf dem Vektorraum Rn wird auch durch die Maximumsnorm
v ∞ := max(|v1 |, . . . , |vn |)
v = (v1 , . . . , vn ) ∈ Rn
eine Metrik definiert: d∞ (x, y) := x − y ∞ , und es gilt d∞ (x, y) ≤ d(x, y) ≤
√ nd∞ (x, y)
(x, y ∈ Rn ),
siehe nebenstehende Abbildung f¨ ur n = 2 und x = 0. Die ,Einheitskugel’ {v ∈ Rn | v ∞ ≤ 1} bez¨ uglich der Maximumsnorm ist ein achsenparalleler um den Nullpunkt zentrierter n-dimensionaler W¨ urfel der Kantenl¨ange 2. 3 A.6 Definition F¨ ur einen metrischen Raum (M, d) heißt O(d) := V ⊆ M | ∀x ∈ V ∃ε > 0 : Uε (x) ⊆ V .
(A.1.2)
die (metrische) Topologie von (M, d). A.7 Satz M, O(d) ist ein topologischer Raum, und die ε–Umgebungen Uε (x) sind offen. 2 Genau
gesagt wird die Abbildung d : M × M → R auf N × N restringiert.
452
A.1. Topologie und Metrik
A.8 Bemerkung (Topologische Vektorr¨ aume) Oft erzeugen verschiedene Metriken die gleiche Topologie. Insbesondere gilt dies f¨ ur Metriken auf Vektorr¨aumen, die (wie in Beispiel A.5.3 und A.5.4) von ¨aquivalenten Normen 3 abstammen. Denn in diesem Fall findet man zu jeder ε–Kugel um x bez¨ uglich der einen Norm eine in dieser enthaltene ε/c–Kugel um x bez¨ uglich der anderen Norm. Da alle Normen auf einem endlich-dimensionalen Vektorraum ¨aquivalent sind, sprechen wir von der Topologie des Rn oder Cn (es gibt aber auch Topologien auf diesen R¨aumen, die nicht von Normen herkommen, siehe Beispiel A.2.1). Auf einem unendlich-dimensionalen K–Vektorraum V gibt es dagegen viele von Normen erzeugte Topologien O. In jedem Fall sind Addition und Skalarmultiplikation stetig, weswegen (V, O) ein sogenannter topologischer Vektorraum ist. 3 Wir erweitern unseren topologischen Sprachschatz, indem wir die uns vom Raum R bekannten Begriffsbildungen verallgemeinern: A.9 Definition Es sei (M, O) ein topologischer Raum. • A ⊆ M heißt abgeschlossen, wenn A Komplement einer offenen Menge ist: M \ A ∈ O. • U ⊆ M heißt Umgebung von x ∈ M , wenn es eine offene Menge V mit x ∈ V ⊆ U gibt. • F¨ ur A ⊆ M und x ∈ M heißt x innerer beziehungsweise ¨ außerer bzw. Randpunkt von A, je nachdem, ob A oder M \ A oder keine von beiden Mengen Umgebung von x ist. ˚ := {x ∈ M | x ist innerer Punkt von A} heißt das Innere von A. - A - A := {x ∈ M | x nicht ¨außerer Punkt von A} heißt der Abschluss oder die abgeschlossene H¨ ulle von A. - ∂A := {x ∈ M | x Randpunkt von A} heißt Rand von A. • x ∈ M heißt H¨ aufungspunkt der Teilmenge A ⊆ M , wenn f¨ ur keine Umgebung U von x die Menge U ∩ (A \ {x}) leer ist. • N ⊆ M heißt dicht, wenn N = M ist. • N ⊆ M heißt nirgends dicht, wenn das Innere von N leer ist. ˚ = (0, 1), A = [0, 1] und ∂A = A.10 Beispiele 1. F¨ ur A := (0, 1] ⊆ R ist A {0, 1}. 3 Definition: Zwei Normen · , · aquivalent, wenn eine Zahl c ≥ 1 I II : V → R heißen ¨ existiert mit (v ∈ V ). c−1 vI ≤ vII ≤ cvI
A. Topologische R¨aume und Mannigfaltigkeiten 2. In R ist Q eine dichte, Z eine nirgends dichte Teilmenge.
453 3
A.11 Definition Es sei (M, O) ein topologischer Raum. ¨ von M , wenn • Eine Familie (Ui )i∈I von Ui ∈ O heißt offene Uberdeckung gilt: ∪i∈I Ui = M. ¨ • (M, O) heißt kompakt, wenn jede offene Uberdeckung (Ui )i∈I eine endliche ¨ Teil¨ uberdeckung, das heißt eine offene Uberdeckung (Uj )j∈J mit endlicher Indexmenge J ⊆ I, besitzt. • (M, O) heißt lokalkompakt, wenn alle m ∈ M eine kompakte Umgebung besitzen. • (M, O) heißt Hausdorff–Raum, wenn f¨ ur alle x = y ∈ M disjunkte Umgebungen Ux von x und Uy von y existieren. ¨ • Ein Hausdorff–Raum (M, O) heißt parakompakt, wenn f¨ ur jede offene Uber¨ deckung {Ui }i∈I eine offene Uberdeckung {Vj }j∈J existiert, die (a) eine Verfeinerung von {Ui }i∈I ist, d.h. ∀j ∈ J ∃i ∈ I : Vj ⊆ Ui , (b) und die lokal endlich ist, das heißt f¨ ur alle x ∈ M existiert eine Umgebung U von x mit endlicher Indexmenge {j ∈ J | Vj ∩ U = ∅}. A.12 Beispiele (topologische Begriffe) 1. Endlich-dimensionale reelle und komplexe Vektorr¨aume V sind lokalkompakt und parakompakt. Teilmengen von V sind genau dann kompakt, wenn sie beschr¨ankt und abge¨ schlossen sind (Uberdeckungssatz, auch Satz von Heine-Borel genannt). Q mit der Spurtopologie von R ist aber nicht lokalkompakt. 2. Da in einem metrischen Raum (M, d) alle Punkte x = y ∈ M positiven Abstand besitzen, ist der topologische Raum M, O(d) hausdorffsch. Ein topologischer Raum (M, O) heißt metrisierbar wenn es eine Metrik d auf M gibt mit O = O(d). Wie man am Beispiel von nicht-Hausdorff–R¨aumen sieht, ist das nicht immer der Fall. 3. Unendlich-dimensionale Banach–R¨aume sind zwar nicht lokalkompakt, wohl aber (wie jeder metrische Raum) parakompakt. 4. Ein Beispiel eines nicht parakompakten Hausdorff–Raumes ist die sogenannte ,Lange Gerade’, siehe Hirsch [Hirs], Kap. 1.1, Aufgabe 9. Nicht parakompakte R¨aume treten normalerweise in mechanischen Problemen nicht auf. 3 A.13 Definition • Eine Zerlegung der Eins (englisch: partition of unity) auf einem topologischen Hausdorff–Raum (M, O) ist eine Familie (fi )i∈I stetiger ur jedes x ∈ M gilt: (siehe Def. A.17) Funktionen fi : M → [0, 1], so dass f¨ x hat eine Umgebung U , sodass die Indexmenge {j ∈ I | fj U = 0} endlich
ist, und i∈I fi (x) = 1.
454
A.1. Topologie und Metrik
¨ • Eine Zerlegung der Eins (fi )i∈I heißt angepasst an eine offene Uberdeckung ur alle i ∈ I gilt: supp(fi ) ⊆ Ui . (Ui )i∈I von M , wenn f¨ Zerlegungen der Eins sind n¨ utzlich, weil man mit ihnen lokal, das heißt auf geeigneten Umgebungen Ui definierte Objekte zu einem global, d.h. auf ganz M definierten Objekt konvex-kombinieren kann. Daher kl¨art der folgende Satz die Bedeutung des Begriffes ,parakompakt’: A.14 Satz Ein topologischer Hausdorff–Raum ist genau dann parakompakt, wenn ¨ er f¨ ur jede offene Uberdeckung eine angepasste Zerlegung der Eins besitzt. A.15 Definition • Eine Folge (xn )n∈N in einem metrischen Raum (M, d) heißt Cauchy–Folge, wenn f¨ ur alle ε > 0 eine Schranke N0 ≡ N0 (ε) ∈ N existiert mit m, n ≥ N0 (ε) . d(xm , xn ) < ε • (M, d) heißt vollst¨ andig, wenn jede Cauchy–Folge gegen ein x ∈ M konvergiert, das heißt f¨ ur alle ε > 0 eine Schranke N (ε) ∈ N existiert mit xn ∈ Uε (x) n ≥ N (ε) . A.16 Satz Jeder kompakte metrische Raum ist vollst¨andig. A.17 Definition Eine Abbildung f : M → N der topologischen R¨aume (M, OM ) und (N, ON ) • heißt stetig, wenn die Urbilder offener Mengen offen sind (f −1 (V ) ∈ OM falls V ∈ ON ); • heißt Hom¨ oomorphismus, wenn f bijektiv, stetig und f −1 : N → M stetig ist. oomorph, wenn • Die topologischen R¨aume (M, OM ) und (N, ON ) heißen hom¨ es einen Hom¨oomorphismus f : M → N gibt. Hom¨oomorphe topologische R¨aume sind vom Standpunkt der Topologie nicht zu unterscheiden, so zum Beispiel R und das Intervall (−1, 1) mit dem Hom¨oomorphismus tanh : R → (−1, 1). ! F¨ ur das kartesische Produkt M := i∈I Mi von Mengen Mi wird, ausgehend von Topologien Oi der Faktoren Mi mithilfe der kanonischen Projektionen pj : M → Mj
, (mi )i∈I → mj
(j ∈ I)
eine Topologie definiert: A.18 Definition • Die Produkttopologie O auf M ist die gr¨obste Topologie, bez¨ uglich der noch alle kanonischen Projektionen pi (i ∈ I) stetig sind.
A. Topologische R¨aume und Mannigfaltigkeiten
455
• Der topologische Raum (M, O) heißt der Produktraum der (Mi , Oi ). A.19 Satz (Tychonoff) Beliebige Produkte kompakter topologischer R¨aume sind in der Produkttopologie kompakt. Beweis: Siehe zum Beispiel J¨ anich [Jae], Kapitel X.
2
U ⊆ M ist offen genau dann, wenn U die Vereinigung von (m¨oglicherweise unendlich vielen) Durchschnitten je endlich vieler Mengen der Form p−1 i (Oi ) mit Oi ∈ Oi ist. Im Allgemeinen sind nicht alle kartesischen Produkte offener Teilmengen offen. Das aber der Fall, wenn die Indexmenge I endlich ist. A.20 Definition Es sei (M, O) ein topologischer Raum. • (M, O) heißt zusammenh¨ angend, wenn die einzigen gleichzeitig offenen und abgeschlossenen Teilmengen von M die leere Menge und M selbst sind. Sonst heißt (M, O) unzusammenh¨ angend. • N ⊆ M heißt zusammenh¨ angend, wenn N in der Spurtopologie (A.1.1) von O zusammenh¨angend ist. • Die maximalen zusammenh¨angenden Teilmengen N ⊆ M heißen die Zusammenhangskomponenten von M • (M, O) heißt total unzusammenh¨ angend, falls alle Zusammenhangskomponenten einpunktig sind. • N ⊆ M heißt diskret, wenn die Spurtopologie diskret (siehe Beispiel A.2.1) ist. A.21 Bemerkungen 1. Zusammenhangskomponenten N ⊆ M sind in (M, O) abgeschlossen, m¨ ussen aber nicht offen sein. Beispielsweise sind die rationalen Zahlen (als einelementige Mengen) die Zusammenhangskomponenten von Q. 2. Die Zusammenhangskomponenten Ni (i ∈ I) von (M, O) bilden eine Partition von M , das heißt ∪i∈I Ni = M und Ni ∩ Nj = ∅ f¨ ur i = j ∈ I. 3. Ein metrisierbarer (siehe Beispiel A.12.2) Raum (M, O) heißt (topologische) Cantor–Menge, wenn der Raum nicht leer, kompakt und total unzusammenh¨angend ist und jeder Punkt von M H¨aufungspunkt von M ist. Alle Cantor–Mengen sind zueinander und auch zur Cantorschen 1/3–Menge (siehe Aufgabe 2.5) hom¨oomorph. Das gilt zum Beispiel auch f¨ ur das nebenstehend abgebildete kartesische Produkt der Cantorschen 1/3–Menge mit sich. 3
456
A.1. Topologie und Metrik
A.22 Definition • Zwei stetige Abbildungen f0 , f1 : M → N heißen homotop, wenn es eine stetige Abbildung h : M × [0, 1] → Y
mit
h(m, i) = fi (m) (m ∈ M, i ∈ {0, 1})
gibt. h heißt dann eine Homotopie von f0 nach f1 . • Zwei topologische R¨aume M, N heißen homotopie¨ aquivalent, wenn es stetige Abbildungen f : M → N und g : N → M gibt, f¨ ur die g ◦ f homotop zu IdM und f ◦ g homotop zu IdN ist. • Ein topologischer Raum M heißt kontrahierbar, wenn M homotopie¨aquivalent zu einer einpunktigen Menge ist. • Eine stetige Abbildung c : I → M eines Intervalls in einen topologischen Raum heißt Kurve oder Weg. t ∈ I heißt der Parameter von c, ihr Bild c(I) ⊆ M auch die Spur von c. • Zwei Kurven c0 , c1 : I → M im topologischen Raum (M, O) mit I := [a, b] und gleichen Anfangs– und Endpunkten (c0 (a) = c1 (a) und c0 (b) = c1 (b)) heißen homotop relativ zu diesen Punkten, wenn es eine Homotopie h : I × [0, 1] → M von c0 nach c1 gibt mit h{a}×[0,1] = c0 (a)
und h{b}×[0,1] = c0 (b).
• M heißt einfach zusammenh¨ angend, wenn je zwei Kurven in M mit gleichen Anfangs- und Endpunkten relativ zu diesen Punkten homotop sind. • F¨ ur ein m ∈ M ist die Fundamentalgruppe π1 (M, m) von M (bei m) die Menge der Homotopieklassen der bei m beginnenden und endenden Kurven. A.23 Bemerkungen 1. Anschaulich wird durch h die Kurve c0 stetig in c1 deformiert, wobei Anfangs- und Endpunkte festgehalten werden. Setzt man n¨amlich f¨ ur s ∈ [0, 1] cs : I → M
, cs (t) := h(t, s),
dann stimmen die Kurven cs f¨ ur s = 0 oder s = 1 mit den vorher definierten Kurven u ¨berein, und cs (a) = c0 (a), cs (b) = c0 (b). 2. Wie schon bei der Definition der Fundamentalgruppe benutzt, ist Homoto¨ pie¨aquivalenz eine Aquivalenzrelation. 3. Die Fundamentalgruppe besitzt bez¨ uglich der Zusammensetzung von Kurven die Struktur einer Gruppe. Falls die Fußpunkte m1 und m2 in der gleichen Zusammenhangskomponente von M liegen, sind die Gruppen π1 (M, mi ) isomorph. Ein solcher Isomorphismus wird durch eine Kurve mit m1 als Anfangs- und und m2 als Endpunkt induziert. Ist M zusammenh¨angend, spricht man daher kurz von der Funda3 mentalgruppe π1 (M ) von M .
A. Topologische R¨aume und Mannigfaltigkeiten
457
A.24 Beispiele (Zusammenhang) 1. Der gelochte Raum M := Rn+1 \ {0} ist homotopie¨aquivalent zur Sph¨are N := S n . Dies sieht man, wenn man f¨ ur f : M → N die radiale Projektion x → x/ x , f¨ ur g : N → M die Einbettung nimmt. Es ist damit π1 (M ) = π1 (S n ). Alle Sph¨aren S n außer S 0 = {−1, 1} sind zusammenh¨angend. S n ist genau dann einfach zusammenh¨angend, wenn n ≥ 2. Dann ist die Fundamentalgruppe von S n trivial. Weiter ist π1 (S 1 ) ∼ = Z. 2. Konvexe Teilmengen U ⊆ Rn sind einfach zusammenh¨angend, denn f¨ ur zwei Kurven c0 , c1 : [a, b] → U mit gleichen Anfangs- und Endpunkten ist h : [a, b] × [0, 1] → U
, h(t, s) := (1 − s) c0 (t) + s c1 (t) 3
eine Homotopie.
A.2
Mannigfaltigkeiten
In Definition 2.34 wurden Untermannigfaltigkeiten des Rn eingef¨ uhrt. Hier werden Mannigfaltigkeiten ohne Bezugnahme auf eine solche Einbettung definiert. Grob gesagt ist eine n–dimensionale Mannigfaltigkeit ein topologischer Raum, der lokal wie der Rn aussieht. Genauer ist die folgende Definition. A.25 Definition Es sei (M, O) ein topologischer Raum. • M heißt lokal euklidisch, wenn es ein n ∈ N0 gibt, sodass jedes m ∈ M eine Umgebung U ∈ O besitzt, die hom¨oomorph zu Rn ist. Die (eindeutige) Zahl n heißt dann die Dimension von M . • Ist (M, O) außerdem parakompakt, dann heißt M topologische Mannigfaltigkeit. • Eine Karte (U, ϕ) von (M, O) (auch lokales Koordinatensystem genannt) besteht aus einer offenen Teilmenge U ⊆ M und einem Hom¨oomorphismus ϕ : U → V auf das offene Bild V := ϕ(U ) ⊆ Rn . • F¨ ur r ∈ N bzw. r = ∞ haben zwei Kar¨ ten (Ui , ϕi ), (Uj , ϕj ) C r –Uberlapp (oder r aglich), wenn f¨ ur Vi,j := heißen C –vertr¨ ϕi (Ui ∩ Uj ) ⊆ Rn die Kartenwechsel
M Uj Ui ϕj
ϕi Vi,j
Vj,i
ϕi,j := ϕj ◦ ϕ−1 i Vi,j : Vi,j → Vj,i r–fach stetig differenzierbare Diffeomor phismen sind (d.h. ϕi,j ∈ C r Vi,j , Vj,i und ϕj,i ∈ C r Vj,i , Vi,j ), siehe Abb.
Kartenwechsel zwischen (Ui , ϕi ) und (Uj , ϕj )
458
A.2. Mannigfaltigkeiten
• Ein C r –Atlas von M ist eine Menge {(Ui , ϕi ) | i ∈ I} C r –vertr¨aglicher Karten, die M u ¨berdecken, das heißt M = ∪i∈I Ui . • Zwei C r –Atlanten heißen ¨ aquivalent, wenn je zwei ihrer Karten C r –vertr¨aglich sind. A.26 Bemerkungen 1. Topologische Mannigfaltigkeiten M (oder allgemeiner lokal euklidische R¨aume) besitzen eine eindeutige Dimension (Schreibweise: dim(M )). Dies ist aber nicht ganz einfach zu beweisen (man denke an die raumf¨ ullenden Peano–Kurven). ¨ ¨ F¨ ur 2. Aquivalenz von C r –Atlanten ist offensichtlich eine Aquivalenzrelation. r einen C –Atlas Φ existiert ein eindeutiger maximaler C r –Atlas Ψ von M , der Φ enth¨alt. Ein solcher maximaler Atlas von M heißt C r –differenzierbare Struktur. 3 A.27 Definition Eine topologische Mannigfaltigkeit (M, O) zusammen mit einer C r –differenzierbaren Struktur heißt C r –Mannigfaltigkeit. A.28 Bemerkungen 1. Man denke bei einem Atlas durchaus an einen Weltatlas. Er muss die ganze Erdoberfl¨ache zeigen. Dazu reicht eine Karte bekanntlich nicht aus. Die Karten des Atlas k¨ onnen durch verschiedene Projektionsarten entstehen. Ein Objekt, das in der einen Karte rechteckig aussieht, kann in der anderen durch Kurven begrenzt sein. Knicke sind aber nicht erlaubt (siehe Abbildung). Von einer metrischen Struktur wird also abgesehen, nicht aber von der differenzierbaren Struktur.
M
ϕ1
kompatibel
ϕ2
ϕ3
inkompatibel
Vertr¨agliche und nichtvertr¨agliche Karten
A. Topologische R¨aume und Mannigfaltigkeiten
459
2. Die Forderung der Parakompaktheit (siehe Definition A.11) bedeutet praktisch keine Einschr¨ankung. Sie ist erf¨ ullt, wenn die Topologie des lokal euklidischen Raumes von einer Metrik erzeugt wird, also etwa wenn M als Teilmenge eines Rm definiert wird. Die sogenannte Gerade mit zwei Urspr¨ ungen ist ein Beispiel eines eindimensionalen lokal euklidischen topologischen Raums, der nicht hausdorffsch (und ˜ / ∼ mit M ˜ := damit nicht parakompakt) ist. Man setzt dabei M := M R × {0} ∪ R × {1} und durch (x, 0) ∼ (x, 1) f¨ ur x ∈ R \ {0} erzeug¨ ter Aquivalenzrelation, und versieht M mit der Quotiententopologie. 3. Wir werden normalerweise glatte (C ∞ –) Mannigfaltigkeiten M untersuchen. ¨ Auf M gibt es dann zu jeder offenen Uberdeckung (Ui )i∈I eine angepasste Zerlegung der Eins durch glatte Funktionen (fi )i∈I . 4. Oft wird die Schreibweise M n f¨ ur eine n–dimensionale Mannigfaltigkeit M benutzt. 3 A.29 Beispiele (Mannigfaltigkeiten) 1. Jede offene Teilmenge M ⊂ Rn wird mit der Karte (M, IdM ) zu einer Mannigfaltigkeit. 2. Als Teilmenge des Rn+1 ist die n–Sph¨are M = S n = {x ∈ Rn+1 | x = 1} ein topologischer Raum. Die 2n + 2 Kartengebiete U±j := {x ∈ S n | ±xj > 0}
(j = 1, . . . , n + 1)
und die Abbildungen ϕ±j : U±j −→ Rn
, x=
x1
.. .
xn+1
⎛
⎞ .. ⎜ . ⎟ ⎜ ⎟ → ϕ±j (x) = ⎜ x2j ⎟ − ⎝ . ⎠ .. x1
xn+1
bilden einen Atlas von M . Dabei zeigt der Hut u ¨ber xj an, dass diese Koordinate weggelassen wird. 3. Ein damit vertr¨aglicher Atlas auf S n wird durch die beiden Karten ϕk : Uk → Rn der stereographischen Projektion gegeben (siehe Abbildung), mit
S2 U1/2 := S n \{(0, . . . , 0, ±1) }, x1 2 .. . ϕ1/2 (x) := 1 ∓ xn+1 x.n
n n+1 2 2 Da 1−x k=1 xk = 1+xn+1 = (1 − xn+1 ) / 2
4/ ϕ1 (x) , ist der Kartenwechsel auf U1 ∩ U2 geometrisch die Spiegelung an
x ϕ1 (x) Stereographische Projektion
460
A.2. Mannigfaltigkeiten
der Sph¨are mit Radius 2: ϕ2 ◦ ϕ−1 1 (y)
1 − xn+1 = 1 + xn+1
y1 4y .. = 2 .
y
yn
y ∈ ϕ1 (U1 ∩ U2 ) = Rn \ {0} .
In der Mathematischen Physik taucht S 2 etwa als Konfigurationsraum des sph¨arischen Pendels auf, und S 2n−1 als Energieschale H −1 ( 12 ) des harmonischen Oszillators H : Rnp × Rnq → R , H(p, q) := 12 p 2 + q 2 . 4. In Definition A.27 haben wir von einer Einbettung der Mannigfaltigkeit v¨ollig abgesehen. Wir k¨onnen Mannigfaltigkeiten M sogar allein dadurch definieren, indem wir ¨ Kartenbilder und vertr¨agliche Ubergangsfunktionen angeben. Die Menge M ¨ wird dabei als Menge von Aquivalenzklassen unter Kartenwechsel ¨aquivalenter Punkte aufgefasst, die Topologie ist die Quotiententopologie. Ein Beispiel: W¨ahrend das M¨obius–Band in Beispiel 2.35 als Untermanniguhrt wurde, k¨ onnen wir es statt dessen als abstrakte faltigkeit des R3 eingef¨ C ∞ –Mannigfaltigkeit M wie folgt definieren. Die Kartenbilder der drei Karten ϕi : M → R2 , i = 1, 2, 3 seien die offenen Rechtecke Vi := (0, 3) × (−1, 1), die Definitions- und Wertebereiche der Kartenwechsel die Teilmengen Vi,i+1 := {(x, y) ∈ Vi | x > 2} , Vi,i−1 := {(x, y) ∈ Vi | x < 1}
(i = 1, 2, 3)
(mit Index–Addition modulo 3). Die Kartenwechsel selbst seien von der Form ϕi,i+1 : Vi,i+1 → Vi+1,i
, (x, y) → (x − 2, −y)
(also ϕi+1,i = ϕ−1 i,i+1 : Vi+1,i → Vi,i+1 , (x, y) → (x + 2, −y)). 5. Der Konfigurationsraum zweier ebener Pendel ist der Torus T2 := S 1 ×S 1 . 3 A.30 Bemerkungen (Konstruktion von Mannigfaltigkeiten) 1. Eine offene Teilmenge N ⊂ M einer C r –Mannigfaltigkeit (M, OM ) mit Atlas {(Ui , ϕi ) | i ∈ I} bildet in kanonischer Weise wieder eine C r –Mannigfaltigkeit. Als Topologie nimmt man f¨ ur (N, ON ) die Teilraumtopologie ON := {U ∩ N | U ∈ OM }, als Atlas die Menge
Ui ∩ N, ϕi N | i ∈ I
der auf N eingeschr¨ankten Karten (Ui , ϕi ) von M . In Beispiel A.29.1 wurde schon der Fall M = Rn besprochen.
A. Topologische R¨aume und Mannigfaltigkeiten
461
2. Mit den differenzierbaren Mannigfaltigkeiten M und N und ihren Atlanten {(Ui , ϕi ) | i ∈ I} beziehungsweise {(Vj , ψj ) | j ∈ J} ist auch der topologische Produktraum M × N eine differenzierbare Mannigfaltigkeit, mit Atlas { (Ui × Vj , ϕi × ψj ) | (i, j) ∈ I × J} .
3
ur eine Die abgeschlossene Vollkugel B n = {x ∈ Rn | x ≤ 1} ist ein Beispiel f¨ sogenannte berandete Mannigfaltigkeit. B n ist keine Mannigfaltigkeit, denn es gibt f¨ ur die Randpunkte x ∈ ∂B n = S n−1 keine zu Rn hom¨oomorphe Umgebung. Wohl aber gibt es eine Umgebung, die zu einem durch eine lineare Abbildung : Rn → R definierten Halbraum hom¨ oomorph ist, mit Hn := {y ∈ Rn | (y) ≥ 0}
(also mit H0n = Rn ).
A.31 Definition • Ein parakompakter topologischer Raum (M, O), f¨ ur den es ein n ∈ N0 gibt, sodass jedes m ∈ M eine zu einem Halbraum Hn hom¨oomorphe Umgebung U ∈ O besitzt, heißt topologische berandete Mannigfaltigkeit. n heißt dann Dimension von M . • Eine Karte (U, ϕ) von (M, O) besitzt als Definitionsbereich eine offene Teilmenge U ⊆ M , und ϕ : U → ϕ(U ) ist ein Hom¨oomorphismus auf das relativ offene Bild ϕ(U ) ⊆ Hn . C r –Vertr¨ aglichkeit von Karten, C r –Atlanten {(Ui , ϕi ) | i ∈ I} von M und berandete C r –Mannigfaltigkeiten werden analog zu den Definitionen A.25 und A.27 eingef¨ uhrt. A.32 Definition • Der Rand der berandeten Mannigfaltigkeit M ist die Menge ∂M := m ∈ M | ∃ i ∈ I : m ∈ Ui , ϕi (m) ∈ ∂ ϕi (Ui ) ⊆ Rn . Der Witz bei dieser Definition ist, dass der Rand der Teilmenge ϕi (Ui ) des Rn im topologischen Sinn (Definition A.9) definiert ist. Er besteht genau aus den Punkten von ϕi (Ui ), die auch in der Hyperebene ∂Hni des Rn liegen. A.33 Satz F¨ ur die Indexmenge J := {j ∈ I | Uj ∩ ∂M = ∅} und Abbildungen ˜j → ∂H n mit Definitionsbereich U ˜j := Uj ∩ ∂M ϕ˜j := ϕU˜j : U j ˜j , ϕ˜j )j∈J ein C r –Atlas des Randes der berandeten C r –Mannigfaltigkeit M . ist (U Insbesondere ist der Rand ∂M selbst eine unberandete Mannigfaltigkeit: ∂∂M=∅. Dies ist in der Integrationstheorie dual zu der Eigenschaft dd = 0 der ¨außeren Ableitung aus Satz B.20.
462
A.2. Mannigfaltigkeiten
A.34 Beispiel (berandete Mannigfaltigkeit) Halb-unendlicher Zylinder M := {x ∈ R3 | x21 + x22 = R2 , x3 ≥ 0}
1
x2
mit Radius R > 0. Wir k¨ onnen z.B. die folgenden vier Karten (Ui± , ϕ± i ), i = 1, 2 benutzen (siehe Abbildung):
M
0
1 2
± 2 Ui± := {x ∈ M | ±xi > 0}, ϕ± i : Ui → R+ =
ϕ± 1 (x1 , x2 , x3 )
:= (±x2 , x3 ),
ϕ± 2 (x1 , x2 , x3 ) := (±x1 , x3 ).
x3 1 0
Der Rand des Zylinders ist ∂M = {x ∈ M | x3 = 0},
x1
0 1
also ein Kreis mit Radius R in der (x1 , x2 )– 3 Ebene des R3 . A.35 Bemerkung Das kartesische Produkt M × N zweier berandeter Mannigfaltigkeiten ist im Allgemeinen keine berandete Mannigfaltigkeit. 3 Wie k¨onnen wir eine stetige Abbildung f : M → N zwischen differenzierbaren Mannigfaltigkeiten angeben und beschreiben? Offenbar wieder unter Verwendung von Karten (U, ϕ) von M bei x ∈ M und (V, ψ) von N bei f (x) ∈ N , die der Abbildung angepasst sind: Es muss f (U ) ⊆ V gelten. Dann ist die Abbildung ψ ◦ f ◦ ϕ−1 : ϕ(U ) → ψ(V )
(A.2.1)
definiert. Sie heißt lokale Darstellung von f bei x. Wegen der Stetigkeit von f k¨onnen wir eine solche immer finden, indem wir notfalls zu einer kleineren offenen Umgebung U ⊆ U von x u ¨bergehen (die Karte (U , ϕU ) ist mit den anderen Karten vertr¨aglich). A.36 Definition • f : M → N heißt r–mal stetig differenzierbar (Schreibur alle x ∈ M die lokalen Darstellungen von f bei weise: f ∈ C r (M, N )), wenn f¨ x r–mal stetig differenzierbar sind (siehe Abbildung A.2.1). • Die Abbildungen f ∈ C ∞ (M, N ) heißen auch glatt. • Ein Hom¨oomorphismus f ∈ C r (M, N ) heißt C r –Diffeomorphismus, wenn f −1 ∈ C r (M, N ).
A.37 Weiterf¨ uhrende Literatur Eine empfehlenswerte Referenz zum Thema ,Mannigfaltigkeiten’ ist Kapitel 1 von Abraham und Marsden [AM]; Globale topologische Fragen werden in Hirsch [Hirs] behandelt. 3
A. Topologische R¨aume und Mannigfaltigkeiten
M
463
N f (x) f (U )
f U x
ψ
ϕ ψ ◦ f ◦ ϕ−1
Abbildung A.2.1: Differenzierbarkeit von f : M → N
A.3
Das Tangentialb¨ undel
Welche geometrische Struktur bilden die Zust¨ande, also Orte und Geschwindigkeiten, eines mechanischen Systems, wenn sein Konfigurationsraum eine Mannigfaltigkeit M ist? Sie bilden das sogenannte Tangentialb¨undel T M von M . Ist M eine in den Rn eingebettete UntermannigR3 faltigkeit, so ist klar, was wir unter dem Tangentialraum von M an einem Punkt x ∈ M verste- S 2 Tx S 2 hen. Das ist dann der Unterraum Tx M der Vektoren des Tangentialraums Tx Rn ∼ = Rn des Rn x bei x, die an M tangential sind. Ist insbesondere M ⊂ Rn offen, dann ist TM ∼ = M × Rn .
(A.3.1)
A.38 Beispiel Der Tangentialraum der Sph¨are S d ⊂ Rd+1 bei x ∈ S d ist Tx S d = {y ∈ Rd+1 | y, x = 0}, siehe nebenstehende Abbildung 4 . 3
Tangentialraum Tx S 2
Da nicht alle Mannigfaltigkeiten als Teilmengen eines Rn definiert sind, m¨ ussen wir bei der allgemeinen Definition des Tangentialb¨ undels anders vorgehen: A.39 Definition • Ein Tangentialvektor einer Mannigfaltigkeit M am Punkt ¨ x ∈ M ist eine Aquivalenzklasse von Kurven c ∈ C 1 ]−ε, ε[, M mit c(0) = x, wobei zwei solche Kurven c1 , c2 ¨ aquivalent heißen, wenn in einer Karte (U, ϕ), 4 Beispiel A.38 zeigt, dass schon aus Dimensionsgr¨ unden das Tangentialb¨ undel T M einer Untermannigfaltigkeit M ⊂ Rd im Allgemeinen nicht in den Rd eingebettet werden kann, wohl aber die Tangentialr¨ aume Tx M .
464
A.3. Das Tangentialb¨ undel
x ∈ U , gilt
d d ϕ ◦ c1 (t) = ϕ ◦ c2 (t) . dt dt t=0 t=0
• Die Menge Tx M von Tangentialvektoren von M an x heißt Tangentialraum von M an x. 7 • Das Tangentialb¨ undel T M von M ist die Vereinigung x∈M Tx M . • Wir bezeichnen die Projektion der Tangentialvektoren in Tx M auf ihren Fuß−1 punkt x mit πM : T M → M ; πM (x) = Tx M heißt Faser u ¨ber x ∈ M . • Eine stetige Abbildung v : M → T M mit πM ◦ v = IdM heißt Vektorfeld auf M , siehe Abbildung A.3.2.
M
−1 −ε
0
1
x U
ε ϕ c˙1 (0) = c˙2 (0) ϕ(x) ϕ(U )
¨ Abbildung A.3.1: Tangentialvektor als Aquivalenzklasse von Kurven Der Tangentialvektor wird also durch die Menge aller Kurven definiert, die aneinander tangential im Sinn von (A.3.2) ϕ c1 (t) − ϕ c2 (t) = o(t) sind, siehe Abbildung A.3.1. Die Tangentialit¨atseigenschaft (A.3.2) zweier Kurven ist zwar in einer Karte definiert, bleibt aber bei Kartenwechsel erhalten. A.40 Bemerkung (Definitionen des Tangentialb¨ undels) Sei M ⊆ Rn offen, und als Karte werde (U, ϕ) := (M, Id) benutzt. Dann ergibt Definition A.39 in ¨ undel von Ubereinstimmung mit (A.3.1) T M ∼ = M × Rn , sodass das Tangentialb¨ M eine differenzierbare Mannigfaltigkeit der doppelten Dimension ist. Allgemein wird die am Anfang des Abschnitts ausgesprochene Definition des Tangentialb¨ undels T M einer Untermannigfaltigkeit M ⊆ Rn in Definition A.39 von T M u uhrt, wenn man einem Tangentialvektor v ∈ Tm Rn an m ∈ M ¨bergef¨ ¨ die Aquivalenzklasse der auf M projizierten Kurve t → m + t v zugeordnet. 3
A. Topologische R¨aume und Mannigfaltigkeiten
465
v(x) TM v x M Tx M Abbildung A.3.2: Ein Tangentialvektorfeld v : M → T M ; der Nullschnitt von T M wird mit M identifiziert Allgemein sind f¨ ur einen Punkt x einer Mannigfaltigkeit M , eine Karte (U, ϕ) bei x und eine C 1 –Kurve c : (−ε, ε) → U mit c(0) = x die Zeitableitungen d ϕ ◦ c(t) dt t=0 Vektoren in Tϕ(x) Rn ∼ = Rn , und im Kartenbild k¨onnen wir diese Tangentialvektoren mit einer reellen Zahl multiplizieren und miteinander addieren. Diese Vektorraumstruktur u ¨bertr¨agt sich kartenunabh¨angig auf die Menge Tx M der Tangentialvektoren von M an x. A.41 Definition F¨ ur f ∈ C 1 (M, N ) heißt T f : T M → T N mit T f [c]x := [f ◦ c]f (x) x ∈ M, c Kurve bei x ¨ die Tangentialabbildung von f (dabei bezeichnet [·] die Aquivalenzklasse). A.42 Satz • F¨ ur eine C r+1 –Mannigfaltigkeit M gilt: Der Tangentialraum Tx M von M an x ist ein reeller Vektorraum der Dimension dim(Tx M ) = dim(M ). • Das Tangentialb¨ undel T M ist eine C r –Mannigfaltigkeit, und dim(T M ) = 2 dim(M ). Beweis: Sei A := {(Ui , ϕi ) | i ∈ I} ein Atlas von M . Dann ist T A := {(T Ui , T ϕi ) | i ∈ I} ein Atlas von T M , genannt der nat¨ urliche Atlas. Seine Karten heißen nat¨ urliche Karten. 2 Zwar k¨onnen wir im Prinzip in der Mannigfaltigkeit T M beliebige Koordinaten benutzen. Es ist aber sinnvoll, in den Tangentialvektoren lineare Koordinaten zu
466
A.3. Das Tangentialb¨ undel
verwenden, um in den Karten Tangentialvektoren an einem Punkt wie u ¨blich zu addieren. Eine Karte (U, ϕ) von M induziert auf U die n = dim(M ) Vektorfelder ∂ ∂ ,..., : U → T U, ∂ϕ1 ∂ϕn die unter der Tangentialabbildung die Bilder ∂ (u) = ϕ(u), el (u ∈ U, l = 1, . . . , n) Tϕ ∂ϕl
(A.3.3)
haben (el bezeichnet den l-ten kanonischen Basisvektor des Rn ). F¨ ur x ∈ U ∂ ∂ (x), . . . , (x) eine Basis von T M . bilden die Tangentialvektoren ∂ϕ x ∂ϕ 1 n Die Menge X (M ) der Vektorfelder einer Mannigfaltigkeit M bildet einen R– Vektorraum. U besitzt X ∈ X (M ) die eindeutige Darstellung
n Im Kartengebiet ∂ X(x) = k=1 Xk (x) ∂ϕ (x) mit stetigen Funktionen Xk : U → R. k A.43 Definition • Das Tangentialb¨ undel T M einer n–dimensionalen Mannigfaltigkeit M heißt parallelisierbar, wenn es einen Diffeomorphismus I : T M → M × Rn gibt, der faserweise (das heißt restringiert auf die Fasern Tm M , f¨ ur alle m ∈ M ) −1 (m) = {m} × Rn ). linear und bez¨ uglich M die Identit¨at ist (I ◦ πM • Dann heißt I eine Parallelisierung von T M . Alle parallelisierbaren Mannigfaltigkeiten sind insbesondere orientierbar, siehe Definition F.12. A.44 Beispiele (Parallelisierbarkeit) 1. Lie–Gruppen G sind parallelisierbar, denn mit der Linkswirkung Lg aus (E.1.3) und der Lie–Algebra g ∼ = Te G ∼ = dim(G) von G ist R G × g → TG
,
(g, ξ) → (Te Lg )(ξ)
ein faserweise linearer Diffeomorphismus mit (Te Lg )(ξ) ∈ Tg G. 2. Das Tangentialb¨ undel der Sph¨are S n = {x ∈ Rn+1 | x = 1} ist T S n = (x, y) ∈ Rn+1 × Rn+1 | x = 1 , x, y = 0 . • T S 1 : Wegen S 1 = {x ∈ C | |x| = 1} k¨onnen wir das Tangentialb¨ undel mit
y ∈iR T S 1 = (x, y) ∈ C × C | |x| = 1 , x identifizieren. Wir finden eine Parallelisierung I : T S 1 → S 1 × R , (x, y) → x, y/(ix)
T S1 y x Tangentialraum der Kreislinie S 1
A. Topologische R¨aume und Mannigfaltigkeiten
467
von T S 1 , mit Inverser I −1 (x, z) = (x, ixz), siehe nebenstehende Abbildung. Wir machen von dieser Tatsache bei der Betrachtung des ebenen Pendels Gebrauch. • T S 2. Behauptung: T S 2 ist nicht parallelisierbar.5 Beweis: Durch Widerspruch. Betrachte dazu I −1 x × 10 . Das ist ein Tangentialvektor an x ∈ S 2 . Dieser Tangentialvektor verschwindet nach Voraussetzung nicht (Linearit¨at). Betrachten wir f¨ ur alle x ∈ S 2 diese Tangentialvektoren, so erhalten wir ein nicht verschwindendes Vektorfeld auf S 2 . Ein solches Vektorfeld Y : S 2 → T S 2 existiert aber nicht (siehe Abbildung). Denn sei Y (x) (notfalls durch Normierung) f¨ ur alle x ∈ S 2 von der L¨ange 1, also Yε := ε Y von der L¨ange |ε|. Dann bildet
S2
Tangentialvektorfeld auf S 2
fε : S 2 → R3
, x → x + Yε (x) √ ur betragsm¨aßig auf die Sph¨are S 2 (r) vom Radius r := 1 + ε2 ab, und fε ist f¨ kleine ε ein Diffeomorphismus der Sph¨aren. Wir betrachten auf R3 die Zwei–Form (siehe Anhang B.2) ω := x1 dx2 ∧ dx3 + x2 dx3 ∧ dx1 + x3 dx1 ∧ dx2 = r3 cos(θ) dϕ ∧ dθ in Kugelkoordinaten x1 = r cos(θ) cos(ϕ)
, x2 = r cos(θ) sin(ϕ) ,
x3 = r sin(θ).
Nun k¨onnen wir die Fl¨ache F (r) der Sph¨are S 2 (r) einerseits durch 1 F (r) = ω = 4πr2 = 4π (1 + ε2 ) r S 2 (r) berechnen, andererseits aber nach unserer Widerspruchsannahme durch 1 1 ω= f ∗ (ω). F (r) = r fε (S2 (1)) r S 2 (1) ε √ Letzterer Ausdruck ist aber ein Polynom in ε, dividiert durch r = 1 + ε2 , 2 wie man durch explizite Betrachtung von fε∗ (ω) sieht. Widerspruch! 5 Satz vom Igel: Jeder stetig gek¨ ammte Igel hat mindestens eine kahle Stelle, englisch: hairy ball theorem.
Der folgende Beweis von Milnor l¨ asst sich auf alle Sph¨ aren S 2n verallgemeinern, siehe Gallot, Hulin und Lafontaine [GHL], Kapitel I.C. Von den ungerad-dimensionalen Sph¨ aren ist außer S 1 nur noch S 3 und S 7 parallelisierbar, siehe Hirzebruch [Hirz]. Dass S 3 parallelisierbar ist, sieht man daran, dass S 3 diffeomorph zur Lie–Gruppe SU(2) ist (siehe (E.2.1)).
468
A.3. Das Tangentialb¨ undel
Das Tangentialb¨ undel T M einer Konfigurationsmannigfaltigkeit M ist der Raum der Orte und Geschwindigkeiten. Die Lagrange–Funktion eines mechanischen Systems mit Konfigurationsraum M ist eine Funktion L : T M → R. A.45 Definition F¨ ur die C 1 –Mannigfaltigkeiten M und N sei f ∈ C 1 (M, N ). • f heißt immersiv bei m ∈ M , wenn Tm f : Tm M → Tf (m) N injektiv, submersiv bei m ∈ M und m regul¨ arer Punkt von f , wenn Tm f surjektiv ist. Sonst heißt m singul¨ arer Punkt von f . • f heißt Immersion, wenn f¨ ur alle m ∈ M f immersiv bei m ist. f heißt Submersion, wenn f¨ ur alle m ∈ M f submersiv bei m ist. • f heißt Einbettung, wenn f eine Immersion ist, die M hom¨oomorph auf f (M ) abbildet. (In Zeichen: f : M !→ N ) • n ∈ N heißt regul¨ arer Wert von f , wenn alle m ∈ f −1 (n) regul¨are Punkte sind, sonst singul¨ arer Wert. Immersionen m¨ ussen nicht injektiv sein, regul¨are Werte n ∈ N nicht im Bild f (M ) liegen. Aus dem Satz u ¨ber die inverse Abbildung folgt: A.46 Satz (Satz vom regul¨ aren Wert) F¨ ur r ≥ 1 und die C r –Mannigfaltigkeiten M und N sei n ∈ N regul¨arer Wert von f ∈ C r (M, N ). Dann ist U := f −1 (n) ⊆ M eine C r –Untermannigfaltigkeit, und dim U = dim M − dim N . Viele Ph¨anomene kann man schon bei Kurven c : I → N in einer Mannigfaltigkeit N sehen. Eine solche C 1 –Kurve heißt regul¨ar, wenn sie eine Immersion ist, also der Geschwindigkeitsvektor c (t) ∈ Tc(t) M nie verschwindet. A.47 Aufgaben (Differentialtopologie) Man zeige: 1. f : R → R , t → t3 ist injektiv, aber bei t = 0 nicht immersiv. Das Bild ist f (R) = R, also eine Mannigfaltigkeit. 3 (siehe Abbildung A.3.3, links) ist zwar eine glatte 2. f : R → R2 , t → tt2 Abbildung, aber bei t = 0 nicht immersiv, und das Bild ist keine Untermannigfaltigkeit (vergleiche mit dem implizit definierten Fall aus Beispiel 2.42). sin t ) heißen Rosenkurven (siehe 3. Die Kurven fk : R → R2 , t → cos(kt) ( cos t ur alle k ∈ R Immersionen, aber im Abbildung A.3.3, Mitte). Die fk sind f¨ Allgemeinen sind die Bilder fk (R) ⊂ R2 keine Untermannigfaltigkeiten. sin t 4. f : R → R2 , t → cos t ist eine nicht injektive Immersion, also keine Einbettung. Dennoch ist das Bild S 1 ⊂ R2 eine Untermannigfaltigkeit. sin t Dagegen ist f˜ : R/(2πZ) → R2 , t + 2πZ → cos t wohldefiniert und bettet die eindimensionale Mannigfaltigkeit R/(2πZ) ein. 5. f : R → R2 , t → exp(−t2 ) tt3 (siehe Abbildung A.3.3, rechts) ist eine injektive Immersion, aber keine Einbettung.
A. Topologische R¨aume und Mannigfaltigkeiten
469
x2
x2
x1
x2
x1
x1
Abbildung A.3.3: Links: Bild einer glatten, nicht immersiven Abbildung. Mitte: Rosenkurve mit k = 2/3, Bild einer nicht injektiven Immersion. Rechts: Bild einer injektiven Immersion, die keine Einbettung ist. ur dim(M ) > dim(N ) keine Immersion, f¨ ur dim(M ) < 6. f ∈ C 1 (M, N ) kann f¨ dim(N ) keine Submersion sein. 7. Die in Anhang F.1 besprochenen Projektionen π : E → B differenzierbarer Faserb¨ undel sind Submersionen. 3 In der Differentialtopologie gibt es eine untrennbare Verbindung zwischen Aussagen u ¨ber Mannigfaltigkeiten und Aussagen u ¨ber Abbildungen. Ein Beispiel daf¨ ur ist der folgende Satz: A.48 Satz Sei N eine C r –Mannigfaltigkeit, r ≥ 1. Eine Teilmenge A ⊂ N ist genau dann eine C r –Untermannigfaltigkeit, wenn A das Bild einer C r –Einbettung einer Mannigfaltigkeit ist. Andererseits lassen sich nach dem folgenden Satz alle abstrakt definierten Mannigfaltigkeiten als Untermannigfaltigkeit eines Rd auffassen: A.49 Satz (Einbettungssatz von Whitney) Jede kompakte n-dimensionale differenzierbare Mannigfaltigkeit besitzt eine Einbettung in R2n . A.50 Bemerkung Diese in der Dimension lineare Schranke ist optimal, wie man etwa am Beispiel A.47.4 von S 1 oder dem reell-projektiven Raum RP(2) sieht, der sich als kompakte nicht orientierbare Fl¨ache nicht in den R3 einbetten l¨aßt. Wohl aber existieren Immersionen RP(2) → R3 , z.B. die Boysche Fl¨ache, das Wahrzeichen des Mathematischen Forschungsinstituts Oberwolfach. 3 Riemannsche Mannigfaltigkeiten A.51 Definition Es sei M eine differenzierbare Mannigfaltigkeit.
470
A.3. Das Tangentialb¨ undel
• Eine riemannsche Metrik auf M ist eine differenzierbar von m abh¨angende Familie g = (gm )m∈M positiv definiter symmetrischer Bilinearformen gm : Tm M × Tm M → R
(m ∈ M ).
• F¨ ur eine riemannsche Metrik g auf M heißt (M, g) riemannsche Mannigfaltigkeit. Die Funktion g heißt auch metrischer Tensor 6 . Aus dem Beispiel (Rn , g) mit translationsinvarianter riemannscher Metrik gm (v, w) := v, w ergeben sich durch Restriktion von g auf Untermannigfaltigkeiten M ⊆ Rd wieder riemannsche Mannigfaltigkeiten, siehe Seite 483. Als nicht degenerierte Bilinearform definiert die riemannsche Metrik einen Isomorphismus zwischen Tangential– und Kotangentialr¨aumen, n¨amlich ∗ M Tm M → Tm
,
v → gm (v, ·)
(m ∈ M ).
Das ergibt einen Vektorb¨ undel-Isomorphismus : T M → T ∗ M . Diese Legendre– Transformation heißt musikalischer Isomorphismus, und sein Inverses wird mit " : T ∗ M → T M bezeichnet. Der Gradient ∇f : M → T M einer Funktion f ∈ C 1 (M, R) ist das Vektorfeld, das durch aus der ¨außeren Ableitung df : M → T ∗ M entsteht. Im Gegensatz zu df h¨angt also ∇f vom metrischen Tensor g ab. A.52 Weiterf¨ uhrende Literatur Bekannte B¨ ucher zur Differentialtopologie sind [Hirs] von Hirsch und [BJ] von Br¨ ocker und J¨ anich. Choquet-Bruhat, DeWitt-Morette und Dillard-Bleick geben in ih¨ rem zweib¨andigen Werk [CDD] eine umfassende Ubersicht u ¨ber die Theorie differenzierbarer Mannigfaltigkeiten, einschließlich Differentialformen, B¨ undeltheorie und Differentialgeometrie. 3
6 Sie ist keine Metrik im Sinne metrischer R¨ aume, erlaubt aber die Definition einer solchen, siehe (G.3.3).
Anhang B
Differentialformen B.1 B.2 B.3 B.4 B.5 B.6 B.7 B.8
¨ Außere Formen . . . . . . . . . . . . . . Differentialformen auf dem Rn . . . . . . Integration von Differentialformen . . . . Differentialformen auf Mannigfaltigkeiten Innere Ableitung und Lie–Ableitung . . . Der Satz von Stokes . . . . . . . . . . . ´ Das Poincare–Lemma . . . . . . . . . . de-Rham–Kohomologie . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. 472 . 477 . 482 . 485 . 486 . 489 . 493 . 497
In zahlreichen physikalischen Anwendungen der Analysis wird ¨uber Untermannigfaltigkeiten des Rn integriert, zum Beispiel zur Bestimmung - des durch eine von einer Leiterschleife berandete Fl¨ache dringenden magnetischen Flusses - der entlang eines Weges geleisteten Arbeit, etc. ´ Cartan und anderen der Um solche Integrationen durchzuf¨ uhren, ist von Elie Kalk¨ ul der Differentialformen auf Mannigfaltigkeiten entwickelt worden. Dieser Kalk¨ ul l¨asst aber auch den geometrischen Gehalt physikalischer Theorien wie Klassische Mechanik, Elektrodynamik oder Allgemeine Relativit¨atstheorie klar hervortreten (die Maxwellschen Gleichungen beispielsweise lassen sich mit Differentialformen als dF = 0, δF = j schreiben, siehe Beispiel B.21). B.1 Weiterf¨ uhrende Literatur Eine gute Einf¨ uhrung gibt das Buch [AF] von Agricola und Friedrich. 3 Der erste Schritt ist die algebraische Theorie der ¨außeren Formen, denn diese beschreiben das lokale Verhalten der Differentialformen an einem Punkt der Mannigfaltigkeit. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 19,
471
¨ B.1. Außere Formen
472
B.1
¨ Außere Formen
B.2 Definition Es sei E ein n–dimensionaler reeller Vektorraum. Eine Abbildung ϕ : E × . . . × E → R heißt multilinear, wenn sie in jedem Argument linear ist, d.h. f¨ ur λ ∈ R, j = 1, . . . , k und xj , xIj , xII j ∈E ϕ(x1 , . . . , xj−1 , λxj , xj+1 , . . . , xk ) = λϕ(x1 , . . . , xk ) und ϕ x1 , . . . , xj−1 , xIj + xII j , xj+1 , . . . , xk = ϕ x1 , . . . , xIj , . . . , xk + ϕ x1 , . . . , xII j , . . . , xk . Genauer spricht man von einer k–linearen Abbildung. Auf E := Rn mit Standardbasis e1 , . . . , en ∈ E bezeichne α1 , . . . , αn ∈ E ∗ die Dualbasis (das heißt αi (ej ) = δij ). ¨ B.3 Beispiele (Außere Formen) 1. k = 1. Dann ist ϕ eine Linearform auf E, und f¨ ur ϕ = 0 ist ϕ−1 (0) ⊂ E ein Unterraum der Dimension n − 1. 2. k = 2, E = Rn mit innerem Produkt ·, ·. F¨ ur A ∈ Mat(n, R) ist ϕ : E × E → R, ϕ(x, y) := x, Ay eine Bilinearform. Sie heißt (anti)symmetrisch, wenn ϕ(x, y) = ±ϕ(y, x) (x, y ∈ E). 3. k = n, E = Rn . ϕ(x1 , . . . , xn ) := det(x1 , . . . , xn ) (x1 , . . . , xn ∈ E) definiert die Determinantenform. Diese gibt das orientierte Volumen des von den 3 Vektoren x1 , . . . , xn aufgespannten Parallelotops an. Offensichtlich k¨onnen wir zwei k–lineare Abbildungen ϕ1 , ϕ2 addieren, indem wir (x1 , . . . , xk ∈ E) (B.1.1) setzen und eine k–lineare Abbildung ϕ mit einer reellen Zahl multiplizieren (λ ∈ R, x1 , . . . , xk ∈ E). (B.1.2) (λϕ)(x1 , . . . , xk ) := λ ϕ(x1 , . . . , xk )
(ϕ1 + ϕ2 )(x1 , . . . , xk ) := ϕ1 (x1 , . . . , xk ) + ϕ2 (x1 , . . . , xk )
Damit wird die Menge Lk (E, R) der k–linearen Abbildungen in R zu einem R– Vektorraum. B.4 Definition Es sei E ein n–dimensionaler R–Vektorraum. Dann heißt ϕ ∈ Lk (E, R) ¨ außere k–Form, wenn sie antisymmetrisch ist, d.h. ϕ(x1 , . . . , xi , . . . , xj , . . . , xk ) = −ϕ(x1 , . . . , xj , . . . , xi , . . . , xk )
(x ∈ E).
Der Unterraum der ¨außeren k–Formen wird mit Ωk (E) ⊂ Lk (E, R) bezeichnet. B.5 Beispiele (R¨ aume ¨ außerer Formen) 1. Ω1 (E) = L1 (E) ∼ = E∗.
B. Differentialformen
473
2. Die bilineare Abbildung Rn × Rn → R, (x, y) → x, Ay definiert eine ¨außere Zwei–Form auf Rn genau dann, wenn die Matrix A ∈ Mat(n, R) antisymmetrisch ist, also A = −A gilt. Also ist dim(Ω2 (Rn )) = ( n2 ). 3. Die n–Formen auf dem Rn sind Vielfache der Determinantenform.
3
B.6 Definition Das ¨ außere Produkt von ω1 , . . . , ωk ∈ Ω1 (E) wird durch ⎛ ⎞ ω1 (x1 ) . . . ωk (x1 ) ⎜ ⎟ .. .. ω1 ∧. . .∧ωk (x1 , . . . , xk ) := det ⎝ ⎠ (x1 , . . . , xk ∈ E) . . ω1 (xk )
...
ωk (xk )
definiert. Offensichtlich ist ω1 ∧ . . . ∧ ωk eine k–Form, also in Ωk (E). Insbesondere ist damit αi1 ∧ . . . ∧ αik ∈ Ωk (E). Diese ¨außere Form stimmt bis auf Vorzeichen mit derjenigen u ¨berein, bei der i1 , . . . , ik aufsteigend geordnet sind und ist genau dann = 0, wenn alle Indices voneinander verschieden sind. Wir k¨onnen nun jede k–Form ω ∈ Ωk (Rn ) eindeutig als Linearkombination ωi1 ...ik αi1 ∧ . . . ∧ αik ω= 1≤ii <...
mit den Koeffizienten ωi1 ...ik := ω(ei1 , . . . , eik ) ∈ R darstellen. F¨ ur dim(E) = n ist daher dim Ωk (E) = ( nk ) . Das ¨außere Produkt oder Dachprodukt der k–Form ω mit einer l–Form ψj1 ...jl αj1 ∧ . . . ∧ αjl ∈ Ωl (E) ψ= 1≤j1 <...<jl ≤n
wird nun (kompatibel mit dem Distributivgesetz) als ω ∧ψ := ωi1 ...ik ψj1 ...jl αi1 ∧. . .∧αik ∧αj1 ∧. . .∧αjl 1≤i1 <...
definiert. All diejenigen Summanden, bei denen ein ir = js ist, sind gleich Null, denn αl ∧ αl = −αl ∧ αl = 0. Die anderen Summanden tragen zu der ¨außeren Form ω ∧ ψ ∈ Ωk+l (Rn ) bei. Offensichtlich ist das ¨außere Produkt assoziativ, das heißt (ω ∧ ψ) ∧ ρ = ω ∧ (ψ ∧ ρ). Weiter gilt f¨ ur eine k–Form ω und eine l–Form ψ ω ∧ ψ = (−1)k l ψ ∧ ω, denn wir m¨ ussen (k l)–mal Eins–Formen kommutieren, um von der einen zur anderen Form zu gelangen.
¨ B.1. Außere Formen
474
B.7 Definition • Eine k–Form ω ∈ Ωk (E) heißt zerlegbar, wenn es Eins– Formen ω1 , . . . , ωk ∈ Ω1 (E) gibt mit ω = ω1 ∧ . . . ∧ ωk . • Der einer k–Form ω ∈ Ωk (E) ist die kleinste Zahl n ∈ N mit ω =
n Rang () und ω () ∈ Ωk (E) zerlegbar. =1 ω B.8 Beispiel (Symplektische Form auf dem R2n ) ω :=
n
αi ∧ αi+n ∈ Ω2 (R2n ).
i=1
Die symplektische Form ω besitzt eine Schl¨ usselrolle in der Klassischen Mechanik, siehe Kapitel 6.2. Dort bezeichnen wir die Koordinaten x1 , . . . , xn als Impulskoordinaten, die Koordinaten xn+1 , . . . , x2n als Ortskoordinaten. F¨ ur n = 2 ergibt sich ω = α1 ∧ α3 + α2 ∧ α4 , also ω ∧ ω = (α1 ∧ α3 + α2 ∧ α4 ) ∧ (α1 ∧ α3 + α2 ∧ α4 )
(B.1.3)
= α1 ∧ α3 ∧ α1 ∧ α3 +α2 ∧ α4 ∧ α1 ∧ α3 + α1 ∧ α3 ∧ α2 ∧ α4 + α2 ∧ α4 ∧ α2 ∧ α4 ;
<=
>
;
0
<=
>
0
= (−1)3 α1 ∧ α2 ∧ α3 ∧ α4 + (−1)1 α1 ∧ α2 ∧ α3 ∧ α4 = −2α1 ∧ α2 ∧ α3 ∧ α4 . B.9 Aufgabe (Volumenform) Zeigen Sie in Verallgemeinerung von (B.1.4), dass das n–fache ¨außere Produkt ω ∧n von ω eine Volumenform ergibt, genauer, dass gilt: n 2n C (−1)( 2 ) ∧n ω αk = n! k=1
(Daraus ergibt sich, dass der Rang von ω gleich n ist).
3
B.10 Beispiel (Kreuzprodukt) Wir betrachten einen Vektor v1 v = vv2 = v1 e1 + v2 e2 + v3 e3 ∈ R3 . 3
• Jetzt benutzen wir erstmals das kanonische innere Produkt ·, · des R3 . Durch v ∗ (w) := v, w = v1 w1 + v2 w2 + v3 w3 w ∈ R3 wird dem Vektor v die Eins–Form v ∗ ∈ Ω1 (R3 ) zugeordnet. ¨ • Ahnlich wird v die Zwei–Form ωv ∈ Ω2 (R3 ), ωv (x, y) := det(v, x, y) x, y ∈ R3 zugeordnet. Wir finden v ∗ = v1 α1 + v2 α2 + v3 α3
und ωv = v1 α2 ∧ α3 + v2 α3 ∧ α1 + v3 α1 ∧ α2 .
B. Differentialformen
475
• Das ¨außere Produkt zweier so gewonnener Eins–Formen ergibt v∗ ∧ w∗
= (v1 α1 + v2 α2 + v3 α3 ) ∧ (w1 α1 + w2 α2 + w3 α3 ) = (v1 w2 − v2 w1 )α1 ∧ α2 + (v2 w3 − v3 w2 )α2 ∧ α3 +(v3 w1 − v1 w3 )α3 ∧ α1 = ωv×w .
Wir haben damit das Kreuzprodukt zweier Vektoren im R3 dargestellt.
3
B.11 Satz Die Vektoren ω1 , . . . , ωk ∈ E ∗ sind genau dann linear abh¨angig, wenn gilt: ω1 ∧ . . . ∧ ωk = 0. Beweis: Es seien ω1 , . . . , ωk ∈ E ∗ . • Wenn sie linear abh¨angig sind, k¨ onnen wir einen Index i ∈ {1, . . . , k} und
k cl ∈ R mit ωi = l=1 cl ωl finden. Damit gilt aber (mit ωl an der i-ten Stelle) l=i
ω1 ∧ . . . ∧ ωk =
k
cl ω1 ∧ . . . ∧ ωl ∧ . . . ∧ ωk = 0,
l=1 l=i
denn in jedem Summanden kommt ωl doppelt vor. • Andernfalls k¨onnen wir die Vektoren ω1 , . . . , ωk zu einer Basis ω1 , . . . , ωn
mit
n := dim(E ∗ )
erg¨anzen, sodass ω1 ∧ . . . ∧ ωn = 0 ist, also auch ω1 ∧ . . . ∧ ωk = 0.
2
B.12 Definition Der reelle Vektorraum Ω∗ (E) :=
∞ D k=0
Ωk (E) ∼ =
D
dim(E)
Ωk (E)
k=0
(mit Ω0 (E) := R) mit der durch das Dachprodukt gegebenen Multiplikation heißt die ¨ außere oder Grassmann–Algebra u ¨ber E.
n B.13 Bemerkungen 1. dim Ω∗ (E) = 2dim(E) , denn k=0 nk = 2n . 2. F¨ ur beliebige k, l ∈ N0 und ω ∈ Ωk (E), ϕ ∈ Ωl (E) ist ω ∧ ϕ ∈ Ωk+l (E), 3. aber f¨ ur m > dim(E) ist dim Ωm (E) = 0. 4. In den meisten Anwendungen kommen keine ,gemischten’ ¨außere Formen dim(E) ω = ⊕k ωk ∈ Ω∗ (E) = ⊕k=0 Ωk (E) vor, bei denen mehr als ein Summand ωk ungleich Null ist. Jedenfalls reicht es im Weiteren aus, den Fall von 3 Formen in Ωk zu behandeln, und dann linear auf Ω∗ fortzusetzen.
¨ B.1. Außere Formen
476
B.14 Definition F¨ ur eine lineare Abbildung f : E → F endlichdimensionaler R–Vektorr¨aume, k ∈ N0 und ω ∈ Ωk (F ) heißt die durch f ∗ (ω)(v1 , . . . , vk ) := ω f (v1 ), . . . , f (vk ) (v1 , . . . , vk ∈ E) uckziehung (engl. pull-back) von ω mit f . definierte k–Form f ∗ (ω) die Zur¨ Es gilt f ∗ (ω) ∈ Ωk (E), denn f ∗ (ω) ist k–linear und antisymmetrisch. B.15 Satz (pull-back) Es sei f ∈ Lin(E, F ). 1. Die Abbildungen f ∗ : Ωk (F ) → Ωk (E)
(k ∈ N0 ) sind linear.
2. F¨ ur g ∈ Lin(F, G), also g ◦ f ∈ Lin(E, G), ist (g ◦ f )∗ = f ∗ ◦ g ∗ . 3. F¨ ur f = IdE ist f ∗ = IdΩ∗ (E) . 4. F¨ ur f ∈ GL(E, F ) ist (f ∗ )−1 = (f −1 )∗ . 5. F¨ ur α, β ∈ Ω∗ (F ) ist f ∗ (α ∧ β) = f ∗ (α) ∧ f ∗ (β). Beweis: Im Beweis ist v1 , . . . , vk ∈ E und λ ∈ R. 1. Mit der in (B.1.1) und (B.1.2) erkl¨arten Vektorraumstruktur auf Ωk ist f¨ ur α, β ∈ Ωk (F ) f ∗ (α + λβ)(v1 , . . . , vk ) = (α + λβ) f (v1 ), . . . , f (vk ) = α f (v1 ), . . . , f (vk ) + λβ f (v1 ), . . . , f (vk ) = f ∗ α + λf ∗ β v1 , . . . , vk . 2. F¨ ur α ∈ Ωk (G) ist (g ◦ f )∗ α(v1 , . . . , vk )
= α g ◦ f (v1 ), . . . , g ◦ f (vk ) = g ∗ α f (v1 ), . . . , f (vk ) = f ∗ ◦ g ∗ α(v1 , . . . , vk ).
3. Id∗E (α)(v1 , . . . , vk ) = α IdE (v1 ), . . . , IdE (vk ) = α(v1 , . . . , vk ). 4. folgt aus 2. und 3., denn f ∗ ◦ (f −1 )∗ = (f −1 ◦ f )∗ = Id∗E = IdΩ∗ (E) . 5. Aufgabe
2
B.16 Aufgabe (Invarianz der Volumenform) Zeigen Sie, dass auf dem in Beispiel B.8 untersuchten symplektischen Vektorraum (R2n , ω) lineare Symplektomorphismen (das heißt lineare Abbildungen f : R2n → R2n mit f ∗ ω = ω) die E2n Volumenform k=1 αk invariant lassen. 3
B. Differentialformen
B.2
477
Differentialformen auf dem Rn
Wir f¨ uhren nun Differentialformen auf Mannigfaltigkeiten ein, und zwar zun¨achst auf offenen Teilmengen U ⊆ Rn . Dieser Spezialfall beschreibt das Verhalten einer allgemeinen Differentialform auf einem Kartengebiet. Eine Differentialform ω auf U ist eine von Ort zu Ort variierende ¨außere Form, deren Variation wir hier als glatt voraussetzen. Eine allgemeine k–Form ω besitzt die Gestalt ωi1 ...ik dxi1 ∧ . . . ∧ dxik ∈ Ωk (U ), (B.2.1) ω = 1≤i1 <...
wobei die ωi1 ...ik Funktionen aus C ∞ (U, R) sind, und die dxi den Koordinatenfunktionen xi : Rn → R zugeordnete 1–Differentialformen (dxi ∈ Ω1 (Rn )). Dabei schreiben wir diesen Raum im Gegensatz zum Raum Ωk (Rn ) der ¨außeren k–Formen mit einem nicht fetten Ω. Die dxi sind durch ihre Wirkung auf ein Vektorfeld v : U → Rn definiert mit dxi (v)(y) := vi (y)
(y ∈ U, i = 1, . . . , n).
1–Differentialformen machen also aus Vektorfeldern Funktionen, und f¨ ur k Vektorfelder v(l) : U → R und ω ∈ Ωk (U ) ist ⎛ ⎞ dxi1 (v (1) ) ... dxik (v (1) ) .. .. ⎠ ωi1 ...ik det ⎝ ω v (1) , . . . , v (k) := . . 1≤i1 <...
dxi1 (v(k) ) ... dxik (v (k) )
definiert. Das Ergebnis ist eine reelle Funktion auf U . Die Rechenregeln des Abschnitts B.1 u ¨bertragen 1n sich von den ¨außeren Formen auf die Differentialformen. Auf Ω∗ (U ) := k=0 Ωk (U ) betrachten wir jetzt den Differentialoperator d, der durch
∂f • df := ni=1 ∂x dxi f¨ ur Funktionen f ∈ C ∞ (U, R) = Ω0 (U ) i
• und dω := 1≤i1 <...
B.2. Differentialformen auf dem Rn
478
3. F¨ ur ω = ω12 dx1 ∧ dx2 + ω23 dx2 ∧ dx3 + ω31 dx3 ∧ dx1 ∈ Ω2 (R3 ) ist ∂ω23 ∂ω31 12 + + dω = ∂ω ∂x3 ∂x1 ∂x2 dx1 ∧ dx2 ∧ dx3 . 4. F¨ ur ω ∈ Ω3 (R3 ) ist dω = 0.
3
B.19 Satz d ist eine Antiderivation, d.h. f¨ ur α ∈ Ωk (U ) und β ∈ Ωl (U ) ist d(α ∧ β) = (dα) ∧ β + (−1)k α ∧ dβ. Beweis: Es gen¨ ugt, diese Gleichung f¨ ur Monome α := f α ˜ , β := g β˜ mit f, g ∈ ∞ n ˜ C (R , R), α ˜ := dxi1 ∧ . . . ∧ dxik und β := dxj1 ∧ . . . ∧ dxjl zu beweisen, denn d ist linear. Es gilt d(α ∧ β) = d(f · g)˜ α ∧ β˜ = ((df )g + f (dg))˜ α ∧ β˜ ˜ ∧ (dg)β˜ = dα ∧ β + (−1)k α ∧ dβ. = (df )˜ α ∧ g β˜ + (−1)k f α
2
B.20 Satz dd = 0. Beweis: 1. F¨ ur f ∈ Ω0 (U ) ist ddf = d =
n i,l=1
∂ 2f dxl ∧ dxi = ∂xl ∂xi
n ∂f i=1 ∂xi dxi
1≤r<s≤n
, also gleich
∂2f ∂2f − ∂xr ∂xs ∂xs ∂xr
dxr ∧ dxs = 0,
denn wegen der Glattheit von f vertauschen die partiellen Ableitungen.
2. F¨ ur ω = ωi1 ...ik dxi1 ∧ . . . ∧ dxik ∈ Ωk (U ) ist wegen Teil 1. ddω = (ddωi1 ...ik ) ∧ dxi1 ∧ . . . ∧ dxik = 0.
2
Differentialoperatoren, Koordinatenwechsel Wir erinnern uns an Beispiel B.10, in dem wir Vektoren in 1–Formen beziehungsweise (n − 1)–Formen umgewandelt haben. Gleiches wollen wir jetzt auch f¨ ur Vektorfelder und Differentialformen tun. Wir ordnen also mithilfe des kanonischen Skalarproduktes ·, · auf dem Rn dem Vektorfeld v ∈ C ∞ (U, Rn ) 1. die durch v ∗ ∈ Ω1 (U ), v ∗ (w) := v, w w ∈ C ∞ (U, Rn ) definierte 1–Form n zu. In Koordinaten ist v ∗ = i=1 vi dxi . 2. Die Zuordnung einer (n − 1)–Form ωv ∈ Ωn−1 (U ) zum Vektorfeld v wird durch ωv (w1 , . . . , wn−1 ) := det(v, w1 , . . . , wn−1 ) wi ∈ C ∞ (U, Rn ) (B.2.2)
B. Differentialformen
479
definiert, also durch ihre Anwendung auf n − 1 Vektorfelder. In Koordinaten ergibt sich ωv = dx1 ∧ . . . ∧ dxn (v, ·, . . . , ·), also ωv =
n
2i ∧ dxi+1 ∧ . . . ∧ dxn . (−1)i−1 vi dx1 ∧ . . . ∧ dx
(B.2.3)
i=1
2i Entfernung von dxi . Dabei bedeutet dx Im ersten Fall sieht man die Rechenregel grad(f )∗ = df f¨ ur den Gradienten
⎛
(B.2.4) ∂f ∂x1
⎞
grad(f ) ≡ ∇f = ⎝ .. ⎠ . ∂f ∂xn
einer reellen Funktionen f , im zweiten gilt div(v) dx1 ∧ . . . ∧ dxn = dωv f¨ ur die Divergenz div(v) ≡ ∇ · v :=
(B.2.5)
n ∂vk ∂xk
k=1
eines Vektorfeldes v. Denn nach (B.2.3) ist dωv =
n
(−1)i
i,k=1
∂vi 2i ∧ dxi+1 ∧ . . . ∧ dxn , dxk ∧ dx1 ∧ . . . ∧ dx ∂xk
und die Summanden sind f¨ ur k = i gleich Null. Da dx1 ∧ . . . ∧ dxn die kanonische Volumenform auf dem Rn ist, ergibt dies eine Relation, die praktisch n¨ utzlich ist. Speziell f¨ ur n = 3 Dimensionen ist die Rotation ⎛ ∂v3 ∂v2 ⎞ ∂x2
− ∂x
∂v2 ∂x1
− ∂x1
3
∂v ∂v1 − ∂x3 ⎠ rot v ≡ ∇ × v := ⎝ ∂x 3 1 ∂v
2
des Vektorfeldes v durch die Relation ωrot v = d(v ∗ ) mit der ¨außeren Ableitung verkn¨ upft • Es ergibt sich aus (B.2.5), (B.2.6) und Satz B.20 div(rot v) dx1 ∧ dx2 ∧ dx3 = dωrot v = ddv ∗ = 0, also mit dx1 ∧ dx2 ∧ dx3 = 0
(B.2.6)
B.2. Differentialformen auf dem Rn
480
div rot v = 0. Diese und ¨ahnliche Relationen sind u ¨brigens, da sie aus dd = 0 abgeleitet sind, auch bei einer anderen Wahl der riemannschen Metrik (siehe Seite 160) g¨ ultig. • Auch die Relation rot gradf = 0, die f¨ ur beliebige glatte Funktionen f gilt, entpuppt sich als eine Manifestation des Gesetzes dd = 0: Wegen (B.2.6) und (B.2.4) gilt ωrot (gradf ) = d(gradf )∗ = ddf = 0. • Als letztes Beispiel f¨ ur die N¨ utzlichkeit der Differentialformen in der Vektoranalysis soll die Identit¨at div(v × w) = rot v, w − v, rot w abgeleitet werden: Wir haben schon im Beispiel B.10 gesehen, dass v ∗ ∧ w ∗ = ωv×w
(B.2.7)
gilt, denn die entsprechende Rechenregel f¨ ur ¨außere Formen u ¨bertr¨agt sich direkt auf Differentialformen im R3 . Also gilt unter Benutzung von (B.2.5), (B.2.7) und (B.2.6) div(v × w) dx1 ∧ dx2 ∧ dx3 = dωv×w = d(v∗ ∧ w ∗ ) = (dv ∗ ) ∧ w∗ − v ∗ ∧ dw∗ = ωrot v ∧ w ∗ − v ∗ ∧ ωrot w∗ = rot v, w − v, rot w dx1 ∧ dx2 ∧ dx3 , was zu beweisen war. B.21 Beispiel (Maxwellsche Gleichungen) Die kartesischen Koordinaten x1 , . . . , x4 auf der Raumzeit R4 bezeichnen den Raumpunkt x := (x1 , x2 , x3 ) und den Zeitpunkt t := x4 . Die Feldst¨arke F ∈ Ω2 (R4 ) sei durch F := B1 dx2 ∧ dx3 + B2 dx3 ∧ dx1 + B3 dx1 ∧ dx2 +
3
Ei dxi ∧ dx4
i=1
gegeben, wobei E := (E1 , E2 , E3 ) ∈ C ∞ (R4 , R3 ) das elektrische und B := (B1 , B2 , B3 ) ∈ C ∞ (R4 , R3 ) das magnetische Feld bezeichnet. Die homogene Maxwell–Gleichung dF = 0 ist ¨aquivalent zu divx (B) = 0 ,
∂B = −rotx E. ∂t
Aus dem Poincar´e-Lemma B.45 schließen wir auf die Existenz eines sogenannten 3 Eichfeldes A ∈ Ω1 (R4 ) mit F = dA.
B. Differentialformen
481
Ein weiterer Aspekt von Differentialformen ist ihr Verhalten unter Abbildungen. ϕ1 .. :U →V B.22 Definition Es seien U ⊆ Rm , V ⊆ Rn offen und ϕ = . ϕn
glatt. Die Zur¨ uckziehung (pull-back) ϕ∗ ω einer k-Form ω= ωi1 ...ik dxi1 ∧ . . . ∧ dxik ∈ Ωk (V ) 1≤i1 <...
auf V ist durch ϕ∗ ω =
ωi1 ...ik ◦ ϕ · dϕi1 ∧ . . . ∧ dϕik
1≤i1 <...
definiert. Es gilt also ϕ∗ ω ∈ Ωk (U ), das heißt der pull-back ist eine k–Form auf U ⊆ Rm . ¨ Ahnlich wie die ¨außere Ableitung ist der pull-back ϕ∗ : Ω∗ (V ) → Ω∗ (U ) eine lineare Abbildung. ¨ B.23 Beispiel (Fl¨ achenform in Polarkoordinaten) Ubergang von karte 1 Der + : R × (0, 2π) → R2 , sischen zu Polarkoordinaten erfolgt durch ϕ = ϕ ϕ2 ϕ1 (r, ψ) = r cos ψ
,
ϕ2 (r, ψ) = r sin ψ.
uckgezogen werden. Mit f˜ := f ◦ ϕ, Es soll die Zwei–Form ω = f dx1 ∧ dx2 zur¨ also der in Polarkoordinaten geschriebenen Funktion f , ergibt sich mit ϕ∗ ω = f˜ dϕ1 ∧ dϕ2 wegen dϕ1 (r, ψ) = cos(ψ) dr − r sin(ψ) dψ
, dϕ2 (r, ψ) = sin(ψ) dr + r cos(ψ) dψ
ϕ∗ ω(r, ψ) = f˜(r, ψ) r (cos2 ψ + sin2 ψ) dr ∧ dψ = f˜(r, ψ) r dr ∧ dψ.
3
B.24 Aufgabe (Pull-back von ¨ außeren Formen) Es seien U ⊆ Rm und V ⊆ n ∞ R offen, ϕ ∈ C (U, V ) und ω ∈ Ωk (V ), ψ ∈ Ωl (V ). Zeigen Sie, dass gilt (ϕ∗ ω) ∧ (ϕ∗ ψ) = ϕ∗ (ω ∧ ψ).
3
B.25 Satz ϕ∗ d = dϕ∗ , pull-back mit ϕ ∈ C ∞ (U, V ) und ¨außere Ableitung vertauschen also. ugt es, beide Seiten der behaupBeweis: Wegen der Linearit¨at von d und ϕ∗ gen¨ teten Identit¨at auf f dxi1 ∧ . . . ∧ dxik anzuwenden. Die linke Seite ergibt ϕ∗ d(f dxi1 ∧ . . . ∧ dxik )
n = ϕ∗ l=1 Dl f dxl ∧ dxi1 ∧ . . . ∧ dxik
n = Dl f ◦ ϕ dϕl ∧dϕi1 ∧ . . . ∧ dϕik . ; l=1 <= > d(f ◦ϕ)
482
B.3. Integration von Differentialformen
Bei Anwendung der Kettenregel folgt gleichermaßen f¨ ur die rechte Seite dϕ∗ f dxi1 ∧. . .∧dxik = d f ◦ϕ dϕi1 ∧. . .∧dϕik = d(f ◦ϕ)∧dϕi1 ∧. . .∧dϕik .2 Durch Spezialisierung auf Diffeomorphismen ϕ folgt aus Satz B.25 insbesondere, dass die ¨außere Ableitung unabh¨angig vom verwendeten Koordinatensystem definiert ist.
B.3
Integration von Differentialformen
Wir integrieren zun¨achst n–Formen auf dem Rn , und danach k–Formen auf k– dimensionalen Untermannigfaltigkeiten des Rn . B.26 Definition Es sei U ⊆ Rn offen, und ω ∈ Ωn (U ) habe kompakten Tr¨ager (das heißt f¨ ur ω = f dx1 ∧ . . . ∧ dxn ist f (x) = 0 außerhalb eines Kompaktums K ⊂ U ). Das Integral von ω ist dann ω := f (x) dx1 . . . dxn . U
U
B.27 Satz Es seien U, V ⊆ Rn offen undϕ : V → U ein Diffeomorphismus mit konstantem Vorzeichen ε von det Dϕ(x) . Dann gilt ϕ∗ ω = ε ω. V
U
Beweis: Nach Definition des pull–back ist unter Benutzung der symmetrischen Gruppe Sn ϕ∗ ω = f ◦ ϕ dϕ1 ∧ . . . ∧ dϕn = f ◦ ϕ
n
i1 ,...,in =1
∂ϕn ∂ϕ1 · ... · dxi1 ∧ . . . ∧ dxin ∂xi1 ∂xin
∂ϕ1 ∂ϕn = f ◦ϕ · ... · dxπ(1) ∧ . . . ∧ dxπ(n) ∂xπ(1) ∂xπ(n) π∈Sn ∂ϕ1 ∂ϕn dx1 ∧ . . . ∧ dxn = f ◦ϕ sign(π) · ... · ∂xπ(1) ∂xπ(n) π∈Sn
= f ◦ ϕ det(Dϕ) dx1 ∧ . . . ∧ dxn . Nach dem Transformationssatz der Integrationstheorie ergibt die Integration die ser n–Form auf V f ◦ ϕ det(Dϕ) dx . . . dx = ε f ◦ ϕ | det Dϕ| dx = 1 n V V 2 ε U f dx = ε U ω. Wir sehen insbesondere, dass das Integral u ¨ber die n–Form ω nicht von der Wahl des (orientierten) Koordinatensystems abh¨angt. Betrachten wir dx1 ∧ . . . ∧ dxn als die Standardvolumenform auf dem Rn , dann k¨onnen wir U ω auch als Integral der Funktion f u ¨ber U auffassen.
B. Differentialformen
483
Wenn wir als n¨achstes Funktionen u ¨ber k–dimensionale Mannigfaltigkeiten ussen wir uns zun¨achst u V ⊆ Rn (also k ≤ n) integrieren wollen, m¨ ¨ber die Standardvolumenform von V klar werden. Wir benutzen dabei eine Parametrisierung von V : Es sei U ⊆ Rk offen ϕ : U → Rn eine injektive glatte Abbildung mit Bild ϕ(U ) = V ⊆ Rn . Es gelte rang Dϕ(x) = k (x ∈ U ), der Rang sei also maximal. ϕ parametrisiert damit die k–dimensionale Mannigfaltigkeit V . Gesucht ist nun eine Form ω (ϕ) ∈ Ωk (U ), f¨ ur die f¨ ur jedes in V offene V ⊆ V ω (ϕ) ϕ−1 (V )
das Volumen von V ist. Vern¨ unftige Forderungen an die ϕ–abh¨angige Definition von ω (ϕ) sind, dass • das Quadrat V := (0, 1)k × {0}n−k ⊂ Rn den Fl¨acheninhalt 1 besitzt. • sich unter einer Drehung O ∈ SO(n) der Fl¨acheninhalt von V nicht ¨andert, und ebenso wenig unter Translationen. • der Fl¨acheninhalt von V sich nicht ¨andert, wenn die Parametrisierung (orientierungserhaltend) ge¨andert wird. Diese Forderungen werden von der Volumenform ω (ϕ) := det(g) dx1 ∧ . . . ∧ dxk
(B.3.1)
der parametrisierten Fl¨ache V erf¨ ullt, wobei die symmetrische k × k–Matrix g durch g := (Dϕ) Dϕ definiert ist, und f¨ ur regul¨are Parametrisierung (rang Dϕ(x) = k (x ∈ U )) wegen v ∈ Rk \ {0} v, g(x)v = Dϕ(x) v, Dϕ(x) v = Dϕ(x) v 22 > 0 g(x) > 0 gilt, die Matrix also positiv definit ist. g ist also ein metrischer Tensor im Sinne von Definition A.51. |g| bezeichnet in der Literatur oft det(g). Ist beispielsweise ψ : U → Rn durch ψ = O ◦ ϕ mit O ∈ SO(n) gegeben, dann ist g invariant unter der Drehung: (Dψ) Dψ = (ODϕ) (ODϕ) = (Dϕ) O ODϕ = (Dϕ) Dϕ = g. Wir k¨onnen eine Funktion f : V → R integrieren, indem wir das Integral
484
B.3. Integration von Differentialformen U
f ◦ ϕ · ω (ϕ)
bilden. Dieser Ausdruck ist invariant unter einer Ver¨anderung der Parametrisierung. Der Spezialfall f = 1lV liefert wieder das k–dimensionale Volumen von V . B.28 Beispiel (Volumen) Wir berechnen den Fl¨acheninhalt eines zweidimenur die Radien r1 > r2 > 0 durch T2 := ϕ(U ) sionalen Torus T2 ⊂ R3 . Dieser sei f¨ mit 2 ϕ : U → R3 , U := [0, 2π)×[0, 2π) und
ϕ(ψ1 , ψ2 ) :=
(r1 +r2 cos ψ2 ) cos ψ1 (r1 +r2 cos ψ2 ) sin ψ1 r2 sin ψ2
parametrisiert. Wir scheren uns nicht weiter um die Tatsache, dass U ⊂ R2 nicht offen ist, denn der Rand von U ist eine LebesgueNullmenge.
x3 x2 x1
g12 Die Koeffizienten der riemannschen Metrik g = ( gg11 21 g22 ) mit g21 = g12 sind 2 3 ∂ϕi g11 (ψ1 , ψ2 ) = = (r1 + r2 cos ψ2 )2 (sin2 ψ1 + cos2 ψ1 ) ∂ψ 1 i=1
= g12 (ψ1 , ψ2 ) =
g22 (ψ1 , ψ2 ) = also
|g| =
(r1 + r2 cos ψ2 )2 3 ∂ϕi ∂ϕi = r2 sin ψ2 (r1 + r2 cos ψ2 ) sin ψ1 cos ψ1 ∂ψ 1 ∂ψ2 i=1 3 i=1
√
−r2 sin ψ2 (r1 + r2 cos ψ2 ) cos ψ1 sin ψ1 = 0 2 ∂ϕi = r22 [sin2 ψ2 (cos2 ψ1 + sin2 ψ1 ) + cos2 ψ1 ] = r22 , ∂ψ2
det g = r2 (r1 + r2 cos ψ2 ) > 0 und damit die Torus-Fl¨ache 2π 2π (ϕ) ω = det g dψ1 dψ2 = (2π)2 r1 r2 . U
0
3
0
Betrachten wir den im Beispiel vorliegenden Spezialfall einer Hyperfl¨ache V des Rn genauer. V = ϕ(U ) ⊂ Rn besitzt eine Parametrisierung ϕ : U → Rn
f¨ ur U ⊆ Rn−1 offen.
Auf V existiert ein bis auf Vorzeichen eindeutiges stetiges Normalenvektorfeld N : V → Rn
,
N (y) = 1
(y ∈ V ),
B. Differentialformen
485
das senkrecht auf V steht, also x ∈ U, w ∈ Rn−1 . Es gilt dann f¨ ur die n × n–Matrix M (x) := N ◦ ϕ(x), Dϕ(x) ⎛ 1 0 ... 0 ⎞
N ◦ ϕ(x), Dϕ(x) w = 0
0
M (x) M (x) = ⎝ .. .
g(x)
⎠,
(x ∈ U )
0
2 also det g(x) = det M (x)M (x) = det(M (x)) , oder, bei geeigneter Wahl der Orientierung des Normalenvektorfeldes det g = det M. (B.3.2) Damit ergibt sich f¨ ur die in (B.2.2) definierte, zum Normalenvektorfeld N duale (n − 1)–Form ωN auf V (also ωN (w1 , . . . , wn−1 ) = det(N, w1 , . . . , wn−1 )) die Gleichheit zur Volumenform der Hyperfl¨ache V : B.29 Satz ϕ∗ ωN = ω (ϕ) f¨ ur ω (ϕ) aus (B.3.1). Fk wieder das Entfernen von dϕk , dann ist Beweis: Bezeichnen wir mit dϕ ϕ∗ ωN =
n
2 ∧. . . dϕn = det M dx1 ∧. . . ∧dxn−1 . (−1)k−1 Nk ◦ϕ dϕ1 ∧. . . ∧ dϕ k
k=1
Die Behauptung folgt also aus (B.3.2). Eigentlich m¨ usste nach Definition des pullback die (n − 1)–Form ωN auf einer im Rn offenen Umgebung von V definiert sein. Dies kann aber durch glatte Fortsetzung des Normalenvektorfelds N erreicht werden, und ϕ∗ ωN h¨angt dann nicht von der Wahl der Fortsetzung ab. 2 Eine weitere wichtige Situation ist die, dass im die k–dimensionale Untermannigfaltigkeit V ⊆ Rn umgebenden Raum eine k–Form ω ∈ Ωk (Rn ) existiert. Deren Integral u ¨ber die (mit einer offenen Teilmenge U ⊂ Rk und ϕ : U → Rn parametrisierten) Untermannigfaltigkeit V = ϕ(U ) definieren wir durch ω := ϕ∗ ω. (B.3.3) V
U
Nach Satz B.27 ist dieses Integral bis auf das Vorzeichen unabh¨angig von der Wahl der Parametrisierung.
B.4
Differentialformen auf Mannigfaltigkeiten
Setzen wir in Definition B.12 der Grassmann–Algebra Ω∗ (E) als R–Vektorraum E den Tangentialraum Tm M der Mannigfaltigkeit M bei m ∈ M ein, dann sind die Elemente ω(m) ∈ Ω∗ (Tm M ) ¨außere Formen bei m. Die Glattheit von m → ω(m) kann mittels des Atlas von M definiert werden:
486
B.5. Innere Ableitung und Lie–Ableitung
B.30 Definition Auf der Mannigfaltigkeit M mit Atlas {(Ui , ϕi ) | i ∈ I} ist eine Differentialform ω eine Familie von Differentialformen in den Kartenbildern ωi ∈ Ω∗ (Vi )
,
Vi := ϕi (Ui ) ⊆ Rn
(i ∈ I),
die in folgendem Sinn kompatibel sind: F¨ ur i, j ∈ I und den Definitionsbereich Vi,j := ϕi (Ui ∩ Uj ) ⊂ Vi des Kartenwechsels ψi,j := ϕj ◦ ϕ−1 i Vi,j : Vi,j → Vj,i gilt ∗ ωj Vj,i = ωi Vi,j (i, j ∈ I). ψi,j Kartenweise Addition ergibt den R-Vektorraum Ω∗ (M ) =
n D
Ωk (M )
(B.4.1)
k=0
der Differentialformen auf der Mannigfaltigkeit M , mit ebenfalls kartenweise definiertem ∧–Produkt. Auch die in Definition B.22 eingef¨ uhrte Zur¨ uckziehung von Differentialformen u ¨bertr¨agt sich von offenen Teilmengen des Rn auf Mannigfaltigkeiten: Sei also f : M → N eine glatte Abbildung der Mannigfaltigkeiten M, N , und ur m ∈ M , Tangentialvektoren u1 , . . . , uk ∈ Tm M ω ∈ Ωk (N ) eine k–Form. F¨ und deren Bilder vi := Tm f (ui ) ∈ Tf (m) N ist der pull–back f ∗ ω ∈ Ωk (M ) durch f ∗ ω(m)(u1 , . . . , uk ) := ω f (m) (v1 , . . . , vk ) definiert. Wir k¨onnen damit Definition B.22 in den lokalen Darstellungen (A.2.1) von f benutzen. Wenden wir die Vertauschbarkeit von ¨außerer Ableitung und Diffeomorphismus (Satz B.25) auf Kartenwechsel an, so sehen wir, dass die ¨außere Ableitung d : Ωk (M ) → Ωk+1 (M ) (k ∈ N0 ) von Differentialformen auf Mannigfaltigkeiten M kartenunabh¨angig definiert ist.
B.5
Innere Ableitung und Lie–Ableitung
Die Lie–Ableitung einer differenzierbaren Funktion f : M → R auf einer Mannigfaltigkeit M in Richtung eines Vektorfeldes X : M → T M ist die durch LX f := df (X)
(B.5.1)
definierte reelle Funktion auf M . Wir werden verallgemeinert auch die Lie– Ableitung einer k–Form nach X definieren. Dazu bietet sich eine Notation an, bei der die Paarung von Differentialformen und Vektorfeldern, anders als bei der rechten Seite von (B.5.1) geschrieben wird, ohne deren Reihenfolge umzukehren.
B. Differentialformen
487
B.31 Definition Es sei X ein Vektorfeld auf einer Mannigfaltigkeit M und ω eine (k + 1)–Form auf M . Dann heißt die durch iX ω(X1 , . . . , Xk ) := ω(X, X1 , . . . , Xk ) definierte k–Form iX ω ∈ Ωk (M ) inneres Produkt von X und ω. Man kann statt iX ω nat¨ urlich auch ω(X, ·, . . . , ·) schreiben. B.32 Aufgabe (∧–Antiderivation) Zeigen Sie, dass f¨ ur die Vektorfelder X auf M die Abbildung iX eine ∧–Antiderivation ist, d.h. sie ist linear und es gilt iX (ϕ∧ω) = (iX ϕ)∧ω +(−1)k ϕ∧iX (ω) ϕ ∈ Ωk (M ), ω ∈ Ωl (M ) . (B.5.2) B.33 Definition Es sei X ein Vektorfeld auf einer Mannigfaltigkeit M . Dann ist f¨ ur ein ω ∈ Ωk (M ) die Lie–Ableitung von ω nach X die k–Form LX ω := (iX d + d iX ) ω. Tats¨achlich ist LX ω ∈ Ωk (M ), denn die ¨außere Ableitung erh¨oht den Formengrad um eins, w¨ahrend die innere Produktbildung den Formengrad um eins erniedrigt. Definition B.33 verallgemeinert die Definition (B.5.1) der Lie–Ableitung einer Funktion f : M → R in Richtung von X, denn LX f = iX df + d iX f = iX df = df (X), da das innere Produkt eines Vektorfeldes mit einer Funktion definitionsgem¨aß Null ergibt (es gibt ja keine Differentialformen vom Grad −1). Die Lie–Ableitung LX ω besitzt eine geometrische Interpretation. Sie be¨ schreibt n¨amlich die Anderung der Differentialform ω in Richtung des vom Vektorfeld X erzeugten Flusses. B.34 Satz Das Vektorfeld X auf einer Mannigfaltigkeit M erzeuge einen Fluss ur alle ω ∈ Ω∗ (M ) Φt : M → M (t ∈ R). Dann gilt f¨ d dt
(Φ∗t ω) = Φ∗t LX ω
(t ∈ R).
Beweis: • Allgemein m¨ ussen wir die Relation nur f¨ ur t = 0 nachweisen, denn d ∗ d ∗ ∗ d ∗ d ∗ = = Φ∗t (Φt ω) = Φt+s ω Φt Φ s ω Φs ω . dt ds ds ds s=0 s=0 s=0 • Wir beginnen mit der Lie–Ableitung von Funktionen f : M → R. In lokalen d ∗ Koordinaten y = (y1 , . . . , yn ) ist dt Φt f (y) t=0 gleich n f Φt (y) − f (y) ∂f = (y) · Xi (y) = df (X)(y) = LX f (y) . lim t→0 t ∂y i i=1
488
B.5. Innere Ableitung und Lie–Ableitung
• W¨ahlen wir f¨ ur ω die (speziellen) Eins–Formen dyi , so ergibt sich d ∗ d d (Φt dyi ) t=0 = d(Φ∗t yi ) t=0 = d (Φ∗t yi ) t=0 = dXi , dt dt dt andererseits wegen LX d = iX dd + d iX d = d iX d = dLX LX dyi = dLX yi = d iX dyi = dXi . • Mit Φ∗t (ϕ ∧ ω) = (Φ∗t ϕ) ∧ (Φ∗t ω) und dem folgenden Lemma ergibt sich der Satz, denn in lokalen Koordinaten y = (y1 , . . . , yn ) k¨onnen wir jede k–Form ω in der Gestalt ω= fl1 ...lk dyl1 ∧ . . . ∧ dylk 1≤l1 <...
2
schreiben. ∗
Die Lie–Ableitung ist eine Derivation auf der Algebra Ω (M ) der Differentialformen: B.35 Lemma F¨ ur ϕ, ω ∈ Ω∗ (M ) gilt LX (ϕ ∧ ω) = (LX ϕ) ∧ ω + ϕ ∧ LX ω. Beweis: F¨ ur k–Formen ϕ gilt nach Satz B.19 und (B.5.2) d(ϕ∧ω) = (dϕ)∧ω+(−1)k ϕ∧dω
und iX (ϕ∧ω) = (iX ϕ)∧ω+(−1)k ϕ∧iX ω.
Kombination dieser beiden Antiderivationen ergibt die Leibniz–Regel LX (ϕ ∧ ω) = iX d(ϕ ∧ ω) + diX (ϕ ∧ ω) = iX (dϕ) ∧ ω + (−1)k ϕ ∧ dω + d (iX ϕ) ∧ ω + (−1)k ϕ ∧ iX ω 2 = (LX ϕ) ∧ ω + ϕ ∧ LX ω.
B.36 Bemerkung (Koordinatenvektorfelder) Bez¨ uglich eines Koordinatensystems ϕ1 , . . . , ϕn : U → R haben wir die Koordinatenvektorfelder ∂ ≡ ∂ϕi : U → Rn ∂ϕi
(i = 1, . . . , n),
die durch L∂ϕi ϕk := δik
(i, k = 1, . . . , n)
(B.5.3)
fixiert sind, in deren Richtung also nur die i–te Koordinate variiert wird. Es gilt L∂ϕi g(ϕ1 , . . . , ϕn ) =
∂ g(ϕ1 , . . . , ϕn ), ∂ϕi
die Lie-Ableitung der Funktion g ∈ C 1 (U, R) in Richtung des i–ten Vektorfeldes ∂ . ist also gleich der i–ten partiellen Ableitung; daher die Notation ∂ϕ i Man beachte, dass wegen (B.5.3) f¨ ur n > 1 die Kenntnis der i–ten Koordinate ∂ zu berechnen. 3 ϕi allein nicht ausreicht, um ∂ϕ i
B. Differentialformen
489
B.37 Beispiel (Koordinatenvektorfelder ur Polarkoordinaten) Auf der of f¨ fenen Teilmenge U := R2 \ (−∞, 0] × {0} des R2 (geschlitzte Ebene) x2 werden Polarkoordinaten x2 ϕ(x) := arctan , r(x) := x21 + x22 x1 definiert (wobei der Winkel ϕ(x) f¨ ur x 2 ≤ 0 stetig fortgesetzt wird, also ϕ(x) ∈ (−π, π) gilt). In kartesischen Koordinaten besitzt das ∂ ∂ 2 (siehe Vektorfeld ∂ϕ die Form ∂ϕ (x) = −x x1 Abbildung rechts), denn
0=L 1=L
x2
−x
und r = (x1 /r, x2 /r) x12 −x /x2 1/x1 −x2 ϕ = 1+(x22 /x11 )2 , 1+(x 2 x1 . 2 /x1 )
∂ ∂ϕ
∂ ∂ϕ
x1
Analog ist das radiale Vektorfeld gleich
x1
∂ (x) = xx12 /r(x) /r(x) ∂r 3
(siehe die nebenstehende Abbildung).
B.6
Der Satz von Stokes
Nehmen wir an, dass im die k–dimensionale Untermannigfaltigkeit V ⊆ Rn umgebenden Raum eine k–Form ω ∈ Ωk (Rn ) existiert. Deren Integral u ¨ber die (mit einer offenen Teilmenge U ⊆ Rk und ϕ : U → Rn parametrisierten) Untermannigfaltigkeit V = ϕ(U ) haben wir in (B.3.3) durch ω := ϕ∗ ω V
U
definiert. Nach Satz B.27 ist dieses Integral bis auf das Vorzeichen unabh¨angig von der Wahl der Parametrisierung. B.38 Beispiel (Wegintegral) Wir integrieren die Eins–Form ω ∈ Ω1 (R2 ), Weges ω(x) := x1 dx2 entlang des auf U := [0, 2π) definierten r cos ψ 2 x2 ϕ : U → R , ϕ(ψ) := r sin ψ .
V
Dessen Bild V := ϕ(U ) ist die Kreislinie vom Radius r > 0 um den Ursprung. ∗ 2 ω = ϕ ω = r cos ψ d(r sin ψ) = r cos2 ψ dψ = πr2 . V
U
U
U
(B.6.1)
x1 r
490
B.6. Der Satz von Stokes
In diesem Beispiel f¨allt auf, dass das Integral von dω = dx1 ∧ dx2 , also dem kanonischen orientierten Fl¨achenelement des R2 , u ¨ber die von V eingeschlossene Kreisscheibe vom Radius r gleich dem Integral (B.6.1) von ω u ¨ber die Kreislinie ist. Dies ist kein Zufall, sondern die Manifestation eines allgemeinen Satzes, des sogenannten Satzes von Stokes. Dieser stellt eine Beziehung zwischen Integralen u ¨ber Mannigfaltigkeiten und Integralen u ¨ber ihren Rand her.
x3
x U1
x2 y2
M U2 x1
ϕ1
V1
ϕ2 V2
y1
Der Hauptsatz der Differential- und Integralrechnung besitzt die folgende Verallgemeinerung: B.39 Satz (Stokes) Es sei M eine (orientierte) k–dimensionale berandete Mannigfaltigkeit und ω eine (k − 1)–Form mit kompaktem Tr¨ager 1 auf M . Dann gilt M
dω =
∂M
ω.
Beweis: • Wir beweisen den Satz hier nur f¨ ur den Fall einer berandeten Untermannigfaltigkeit M ⊂ Rn der vollen Dimension k = n. Den Beweis f¨ ur beliebige, nicht notwendig eingebettete berandete Mannigfaltigkeiten findet man etwa in Agricola und Friedrich [AF], Kapitel 3.6. • Nach dem Satz u ur jeden Punkt x ∈ ∂M ¨ber implizite Funktionen finden wir f¨ eine Umgebung Ui ⊆ M von x und eine Kartenabbildung ϕi : Ui → Vi ⊆ Rn+ n−1 mit ∂M ∩ Ui = ϕ−1 × {0}). Da ω nur auf einem Kompaktum von Null i (R verschieden ist, gen¨ ugen endlich viele Karten. 1 Alternativ kann man Abfallbedingungen f¨ ur ω und dω fordern, die die Endlichkeit beider Seiten garantieren.
B. Differentialformen
491
• Wir k¨onnen nun mit einem Trick die scheinbar Χ einschr¨ankende Voraussetzung supp(ω) ⊆ Ui be1 nutzen. Es gibt n¨amlich eine glatte Zerlegung der Eins (siehe Def. A.13), eine Familie von Funktio1 ∞ n nen χ 2
i ∈ C (R , R) mit χi ≥ 0, supp(χi ) ⊂ Ui und i∈I χi = 1, siehe Abbildung.
Setzen wir ωi := χi ω, dann ist i∈I ωi = ω und supp(ωi ) ⊂ Ui . 1 2 3 4 • Nach oben stehender Definition reicht es aus, die Integration einer (n − 1)– Form ω mit im Halbraum Rn+ gelegenem Tr¨ager zu betrachten. Dann l¨asst sich (wenn wir wie in Kapitel 13 die Entfernung einer Eins–Form durch einen Hut indizieren) ω in der Form ω=
n
Fk ∧ dxk+1 ∧ . . . ∧ dxn (−1)k−1 fk dx1 ∧ . . . ∧ dxk−1 ∧ dx
k=1
schreiben, wobei die fk Funktionen mit kompaktem Tr¨ager in Rn+ sind.
n ∂fk • Nun ist dω = k=1 ∂xk dx1 ∧ . . . ∧ dxn , also
n
∂fk dx1 ∧ . . . ∧ dxn n ∂xk Rn + k=1 R+ n−1 ∂fk k−1 Fk ∧ dxk+1 ∧ . . . ∧ dxn = (−1) dxk dx1 ∧ . . . ∧ dxk−1 ∧ dx n−1 ∂x k R R + k=1 ∞ ∂fn n−1 + (−1) dxn dx1 ∧ . . . ∧ dxn−1 . ∂xn Rn−1 0 dω =
Das innere Integral verschwindet nach dem Hauptsatz der Differential- und Integralrechnung f¨ ur k = 1, . . . , n − 1. F¨ ur den letzten Summanden ergibt partielle Integration aber ∞ ∂fn (x1 , . . . , xn ) dxn = −fn (x1 , . . . , xn−1 , 0), ∂x n 0 also insgesamt dω = (−1)n Rn +
Rn−1
fn (x1 , . . . , xn−1 , 0) dx1 ∧ . . . ∧ dxn−1 .
• Andererseits ist ωRn−1 ×{0} = (−1)n−1 fn dx1 ∧ . . . ∧ dxn−1 , denn xn ist auf diesem Unterraum gleich Null, also auch dxn Rn−1 ×{0} = 0. Mit der richtigen Wahl der Orientierungen ergibt sich also Rn dω = Rn−1 ×{0} ω, und damit der + Satz von Stokes. 2 B.40 Beispiele (Satz von Stokes) 1. Es sei M ⊂ Rn das Bild einer (regul¨aren, injektiven) Kurve c : [0, 1] → Rn
492
B.6. Der Satz von Stokes
und F : M → R eine glatte Funktion. Dann besteht ∂M aus den Punkten c(0) und c(1). Diese bekommen als Anfangs– und Endpunkte aber unterschiedliche Orientierung, sodass die Formel 1 d F ◦ c(t) dt = F ◦ c(1) − F ◦ c(0) (B.6.2) dt 0 ; <= > dF ◦c
entsteht. Ist F = F˜ M mit einer glatten Funktion F˜ : Rn → R, dann ist das Integral in (B.6.2) gleich F˜ (c(1)) − F˜ (c(0)), unabh¨angig von der Wahl des Weges c mit vorgegebenem Anfangs– und Endpunkt. 2. In Verallgemeinerung von
nBeispiel B.38 betrachten wir die symplektische Zwei–Form ω = −dθ
= i=1 dqi ∧ dpi auf dem Phasenraum P := Rnp × Rnq n mit Eins–Form θ := i=1 pi dqi . Es sei c : S 1 → P eine Schleife, deren Bild das Bild M einer Kreisscheibe berandet, das heißt c(S 1 ) = ∂M. Dann ist das Integral ∂M θ = − M ω, unabh¨angig von der Wahl von M . Diese Gr¨oße spielt bei der Berechnung von Wirkungsvariablen integrabler hamiltonscher Systeme eine wichtige Rolle. ˜ ⊂ R2 . Diese soll aber 3. Wir bleiben bei dem Bild M einer Kreisscheibe M 3 3 ˜ diesmal im R liegen, also durch ı : M → M ⊂ R eingebettet sein. Weiter sei v : R3 → R3 ein Vektorfeld. Dann ist v ∗ eine Eins–Form, dv ∗ eine (auf M integrierbare) Zwei–Form, und nach der Formel aus (B.2.6) gilt ωrot v = dv ∗ . Also ist das Integral von dv∗ u ¨ber M gleich dem Integral des Skalarproduktes von rot v mit der Fl¨ a chennormale N (bez¨ uglich des Fl¨achenelementes |g|dx1 ∧ dx2 ). Es folgt nach Satz B.29 der Satz von Kelvin-Stokes rot v , N ◦ ı(x) |g(x)| dx1 ∧ dx2 = rot v, N ωN ˜ M M 6 t1 5 dc v c(t) , (t) dt = ωrot v = dv∗ = v∗ = dt M M ∂M t0 f¨ ur eine Parametrisierung c : [t0 , t1 ] → ∂M des (orientierten) Randes der Kreisscheibe. Das Linienintegral nennt man auch Zirkulation.
rot v
N (x) x M ∂M
B. Differentialformen
493
Beispielsweise k¨ onnte v das Geschwindigkeitsfeld einer Fl¨ ussigkeit sein. Dann sieht man aus der obigen Formel, dass bei Rotationsfreiheit der Str¨omung die Tangentialkomponente der Geschwindigkeit bez¨ uglich der Schleife ∂M im Mittel verschwindet. 4. Die Divergenz div(v) eines Vektorfeldes v auf dem Rn ist nach (B.2.5) mittels
n 2i ∧ dxi+1 ∧ . . . ∧ dxn und ωv = i=1 (−1)i−1 vi dx1 ∧ . . . ∧ dx dωv = div(v ) dx1 ∧ . . . ∧ dxn mit der ¨außeren Ableitung verbunden. Ist M ⊂ Rn eine n–dimensionale berandete Untermannigfaltigkeit (etwa eine Vollkugel), dann gilt nach dem Satz von Stokes dωv = ωv . M
∂M
F¨ ur die Randpunkte x ∈ ∂M bezeichne N (x) den Normalenvektor. v(x) l¨asst sich eindeutig in der Form
v
v(x) = v(x), N (x) N (x) + w(x) (B.6.3)
∂M
schreiben, wobei dann w(x) tangential an ∂M bei x ist, also ∂M ωw = 0 und mit (B.6.3) ω = ∂M v, N ωN . Es ergibt sich also der Satz von Gauss ∂M v div(v ) dx1 . . . dxn = dωv = ωv = v , N ωN . M
M
∂M
∂M
Ist das Vektorfeld divergenzfrei (wie beispielsweise das Geschwindigkeitsfeld einer inkompressiblen Fl¨ ussigkeit), dann fließt also durch die Randfl¨ache ∂M genauso viel aus M heraus wie herein. 3
B.7
Das Poincar´ e–Lemma
B.41 Definition Eine k–Form α ∈ Ωk (M ) heißt geschlossen, wenn dα = 0. Sie heißt exakt, wenn eine Differentialform β ∈ Ωk−1 (M ) existiert mit α = dβ. Wegen der Eigenschaft dd = 0 (Satz B.20) ist jede exakte Differentialform geschlossen. Aber nicht jede geschlossene Differentialform ist exakt: B.42 Beispiel (Aharonov-Bohm Effekt) Auf U := R2 \{0} ist die Eins–Form 2 dx1 glatt, wobei x1 , x2 die kartesischen Koordinaten des R2 sind. ω := x1 dxx22 −x 2 1 +x2 • Die Eins–Form ω ist geschlossen, denn x1 x2 dω = D1 + D dx1 ∧ dx2 = 0. 2 x21 + x22 x21 + x22
494
B.7. Das Poincar´e–Lemma
• Aber ω ist nicht exakt. Denn g¨abe es eine 0-Form ϕ : U → R mit dϕ = ω, dann m¨ usste nach dem Satz von Stokes bei Integration u ¨ber die Kreislinie S 1 ⊂ U gelten: dϕ = S1
ϕ = 0, ∂S 1
denn als Rand der Kreisscheibe ist die Kreislinie S 1 selbst randlos. Andererseits w¨ urde gelten: dϕ = ω= (x1 dx2 − x2 dx1 ) S1
S1
S1
2π
2π
(cos ϕ d(sin ϕ) − sin ϕ d(cos ϕ)) =
= 0
(cos2 ϕ + sin2 ϕ) dϕ = 2π. 0
• Die Eins–Form ω kann man als das Eichpotential einer abgeschirmten (unendlich d¨ unnen) Spule entlang der x3 -Achse ansehen. Die ¨außere Ableitung B := dω des Eichfeldes ist das Magnetfeld, und dieses verschwindet im Außengebiet. • Obwohl also keine magnetischen Kr¨afte auf Teilchen im Außengebiet wirken, kann man wegen der quantenmechanischen Natur von Elektronen experimentell nachweisen, dass das Eichfeld ω selbst ungleich Null ist. In einer geeigneten Versuchsanordnung entstehen Interferenzmuster (Aharonov-Bohm Effekt). 3 Ist aber der Definitionsbereich U ein sogenanntes Sterngebiet (oder allgemeiner: kontrahierbar), dann ist jede geschlossene k–Form auf U exakt (k ≥ 1). B.43 Definition Eine offene Teilmenge U ⊆ Rn heißt Sterngebiet, wenn es ein x ∈ U gibt, sodass f¨ ur alle y ∈ U die Strecke zwischen x und y in U liegt. B.44 Beispiel Offene konvexe Teilmengen ∅ = U ⊆ Rn sind Sterngebiete.
3
B.45 Satz (Poincar´ e-Lemma) Ist U ⊆ Rn ein Sterngebiet und ω ∈ Ωk (U ), k ≥ 1 geschlossen (dω = 0), dann ist ω exakt (ω = dϕ). Beweis: Zwar ist ϕ nicht eindeutig bestimmt. Der Beweis (nach Abraham und Marsden [AM], Theorem 2.4.17 ) beinhaltet aber eine Formel f¨ ur eine solche (k − 1)–Form ϕ. • Wir nehmen ohne Beschr¨ankung der Allgemeinheit an, dass U ein Sterngebiet bez¨ uglich des Nullpunkts ist. • Die Skalierungs-Abbildungen Ft : U → U
,
y → ty
(t ∈ [0, 1])
sind f¨ ur t ∈ (0, 1] Diffeomorphismen auf das Bild Ft (U ). Die Abbildungen t → ur u ∈ U k¨ onnen als L¨ osungen des Anfangswertproblems Ft (u) f¨ dy = Xt (y) dt
,
y(1) = u
B. Differentialformen
495
mit dem zeitabh¨angigen Vektorfeld X : (0, 1] × Rn → Rn , Xt (y) := y/t aufgefasst werden. F¨ ur die Lie–Ableitung LXt gilt daher analog zu Satz B.34 d ∗ F = Ft∗ LXt . dt t • Wegen der Geschlossenheit von ω ist LXt ω = (d iXt + iXt d)ω = d iXt ω, also insgesamt d ∗ F ω = Ft∗ d iXt ω = dFt∗ iXt ω. dt t F¨ ur t0 ∈ (0, 1] folgt durch Integration 1 1 d ∗ Ft∗ iXt ω dt. Ft ω = d ω − Ft∗0 ω = F1∗ ω − Ft∗0 ω = t0 dt t0 Im Limes t0 ! 0 verschwindet Ft∗0 ω wegen k ≥ 1. Es ergibt sich ω = dϕ mit 1 2 ϕ := 0 Ft∗ iXt ω dt. Wir wollen nun Eins–Formen ω ∈ Ω1 (U ) entlang Kurven integrieren, und sehen, ob das Ergebnis nur von Anfangs-und Endpunkt abh¨angt. Ohne Beschr¨ankung der Allgemeinheit nehmen wir an, dass die offene nichtleere Teilmenge U ⊆ Rn zusammenh¨angend ist, also nicht als disjunkte Vereinigung U = U1 ∪˙ U2 solcher Teilmengen dargestellt werden kann. B.46 Satz Es sei U ⊆ Rn offen. Falls ω ∈ Ω1 (U ) geschlossen ist, gilt f¨ ur homotope (Definition A.22) C 1 –Kurven c0 , c1 : [a, b] → U mit gleichen Anfangsund Endpunkten ω= ω. c0
c1
Beweis: • Nach Definition existiert eine stetige Homotopie h : [a, b]×[0, 1] → U von c0 nach c1 . Wegen der Offenheit von U kann man diese gl¨atten, zum Beispiel durch Faltung. Wir nehmen also an, dass h schon glatt ist. Wir ziehen mit h die ˜ ) mit 2 Eins–Form ω zur¨ uck und erhalten eine Eins–Form ω ˜ := h∗ ω ∈ Ω1 (U ˜ U := [a, b] × [0, 1]. • ω ist geschlossen (dω = 0). Nach Satz B.25 ist damit auch ω ˜ geschlossen. ˜ als Vereinigung der Bilder der vier • Wir stellen nun den Rand des Rechtecks U Kurven ˜ c˜k : [a, b] → U ˜ ˜ a ˜, b : [0, 1] → U dar. Es gilt
, c˜k (t) := (t, k) , a ˜(s) := (a, s)
(k = 1, 2) , ˜ , b(s) := (b, s)
ω ˜= c˜k
ω ck
,
ω ˜= a ˜
ω ˜ = 0, ˜ b
2 Dass U ˜ selbst nicht offen ist, spielt keine Rolle, da wir h glatt auf eine offene Obermenge ˜ fortsetzen k¨ von U onnen.
496
B.7. Das Poincar´e–Lemma
˜ ≡ a, h ◦ ˜b ≡ b. denn h ◦ c˜k = ck , h ◦ a ˜ ist konvex, also gilt f¨ •U ur die geschlossene Eins–Form ω ˜ das Poincar´e-Lemma. Wir w¨ahlen die zusammengesetzten Kurven c˜0 (τ ) , τ ∈ [a, b] ˜ , d0 (τ ) := d0 : [a, b + 1] → U ˜b(˜ a u − b) , a ˜u ∈ (b, b + 1] a ˜ (˜ a u) , a ˜u ∈ [0, 1] ˜ , d1 (˜ au) := d1 : [a, b + 1] → U c˜1 (˜ au − 1) , a ˜u ∈ (1, b + 1] Diese sind st¨ uckweise glatt, mit Anfangspunkt (a, 0) und Endpunkt (b, 1), und ω ˜= ω ˜+ ω ˜= ω ˜ , ω ˜= ω ˜+ ω ˜= ω ˜. d0
˜ b
c˜0
c˜0
d1
a ˜
Nach dem Poincar´e-Lemma ist aber ω ˜ = dϕ, ˜ also ω ˜= dϕ = ϕ(b, 1) − ϕ(a, 0) dk
c˜1
c˜1
(k = 0, 1),
dk
wobei im letzten Schritt der Satz von Stokes verwendet wurde. Es folgt ω= ω ˜= ω ˜= ω ˜= ω ˜= ω. c0
c˜0
d0
d1
c˜1
2
c1
B.47 Beispiel (rotationsfreie Vektorfelder) Ist v : U → Rn ein glattes Vektorfeld mit der Eigenschaft ∂vk ∂vi = ∂xk ∂xi
(i, k = 1, . . . , n),
dann ist die in Kapitel B.2 eingef¨ uhrte Eins–Form v ∗ ∈ Ω1 (U ) (v ∗ (w) := v, w f¨ ur Vektorfelder w) geschlossen, denn ∗
v =
n
vk dxk
k=1
n ∂vk , also dv = dxi ∧ dxk = 0. ∂xi ∗
i,k=1
Integrieren wir solche Vektorfelder entlang Kurven c : [t0 , t1 ] → U , indem wir c
v∗ =
t1
5 v(c(t)),
t0
6 dc (t) dt dt
berechnen, dann ist dieses Integral f¨ ur homotope Kurven wegunabh¨angig.
3
F¨ ur den Fall von Eins–Formen im Rn gilt das Poincar´e-Lemma B.45 nicht nur auf Sterngebieten:
B. Differentialformen
497
B.48 Satz (Poincar´ e-Lemma) Ist die offene Menge U ⊆ Rn einfach zusammenh¨angend, dann sind geschlossene Eins–Formen ω ∈ Ω1 (U ) exakt. Beweis: • Da die offene Menge U ⊆ Rn zusammenh¨angend ist, ist U auch wegweise zusammenh¨angend, das heißt von einem willk¨ urlich gew¨ahlten Ausonnen wir jedes x ∈ U durch einen Weg cx : [0, 1] → U gangspunkt x0 ∈ U k¨ mit cx (0) = x0 , cx (1) = x erreichen. Wir k¨ onnen sogar annehmen, dass cx glatt ist. • Wir definieren eine Funktion ϕ : U → R durch ϕ(x) := cx ω. Nach Satz B.46 h¨angt ϕ(x) nicht von der Wahl von c ab. • ϕ ist stetig differenzierbar, mit dϕ = ω. 2 B.49 Bemerkung (Aharonov-Bohm) Beispiel B.42 zeigt zusammen mit Satz B.48, dass die gelochte Ebene R2 \{0} nicht einfach zusammenh¨angend ist. 3
B.8
de-Rham–Kohomologie
Kohomologietheorien ordnen einem topologischen Raum Gruppen zu, die diesen teilweise charakterisieren. Darin sind sie den (in Anhang G.2 thematisierten) Homologietheorien ¨ahnlich. Die de-Rham–Kohomologie verwendet Differentialformen und ist damit auf differenzierbare Mannigfaltigkeiten zugeschnitten. B.50 Definition Es sei M eine differenzierbare Mannigfaltigkeit. • F¨ ur k ∈ N0 und den R–Vektorraum der geschlossenen k–Formen Z k (M ) := ker dΩk (M ) heißen zwei geschlossene Formen ¨ aquivalent oder kohomolog (ω1 ∼ ω2 ), wenn ω1 − ω2 ∈ B k (M ), mit dem Unterraum der exakten Formen B k (M ) := im dΩk−1 (M ) ⊆ Z k (M ). • Die k–te de-Rham–Kohomologiegruppe ist der Faktorraum H k (M ) := Z k (M )/B k (M )
, und H ∗ (M ) :=
∞ D
H k (M ).
(B.8.1)
k=0
F¨ ur k > dim(M ) sind diese R¨aume Null-dimensional. F¨ ur k ≤ dim(M ) sind im Gegensatz zu Z k (M ) und B k (M ) die R–Vektorr¨aume H k (M ) f¨ ur kompakte Mannigfaltigkeiten M (und f¨ ur nicht zu komplizierte, nicht kompakte Mannigfaltigkeiten) endlich-dimensional. In diesem Fall sind also die Betti–Zahlen (k ∈ N0 ) (B.8.2) bettik (M ) := dim H k (M ) definiert. Diese Zahlen haben eine topologische Bedeutung. Beispielsweise gilt:
498
B.8. de-Rham–Kohomologie
B.51 Satz Ist die Mannigfaltigkeit M kompakt, dann ist die Betti–Zahl betti0 (M ) die Anzahl der Zusammenhangskomponenten von M . Beweis: Eine Null–Form ω auf M ist eine reelle Funktion. • Diese ist geschlossen, wenn ihre Ableitung dω = 0 ist, sie also (analog zu (B.6.2)) auf den Zusammenhangskomponenten von M konstant ist. • Ihre Werte auf den Zusammenhangskomponenten lassen sich frei w¨ahlen. 2 B.52 Beispiele (de-Rham–Kohomologie) 1. M = Rn : ω ∈ Ω0 (Rn ) ist genau dann geschlossen, wenn ω konstant ist. ω ist genau dann exakt, wenn diese Konstante die Null ist (vergleiche mit Satz B.51). Nach dem Poincar´e–Lemma (Satz B.45) ist dagegen ω ∈ Ωk (Rn ) f¨ ur k ≥ 1 geschlossen genau dann, wenn ω exakt ist. Daher ist H 1 (Rn ) = . . . = H n (Rn ) = {0} und H 0 (Rn ) = R. 2. Kreislinie M = S 1 = R/Z: Auf R ist f¨ ur λ ∈ R die Eins–Form ω ˜ λ := λ dx invariant unter den Decktransformationen x → x + , ∈ Z, und definiert damit eine Eins–Form ωλ auf S 1 mit π ∗ ωλ = ω ˜ λ f¨ ur die Projektion π : R → S 1 , x → x + Z. Diese ist geschlossen, denn es gibt keine nichttrivialen Formen h¨oheren Graur λ = 0 nicht exakt. des als die Dimension der Mannigfaltigkeit, aber ωλ ist f¨ Dies erkennt man daran, dass S 1 ωλ = λ = 0, sodass eine Funktion ρλ mit x usste ja ρλ (x) = ρλ (0) + 0 ωλ dρλ = ωλ = nicht existieren kann (es m¨ gelten). Auf R hingegen ist ω ˜ λ = d˜ ρλ mit ρ˜λ (x) := λx + c, c ∈ R beliebig. Dagegen ist jede Eins–Form ω ∈ H 1 (S 1 ) zu einer Eins–Form ωλ kohomolog, und zwar mit λ := S 1 ω: x (ω − ωλ ) (x ∈ S 1 ). ω = ωλ + dρ mit ρ(x) := 0
Also ist H (S ) = R (wieder nach Satz B.51) und H 1 (S 1 ) = R. 0
1
3
In vielen F¨allen ist bei Berechnungen von de-Rham–Kohomologien hilfreich auszunutzen, dass die ¨außere Ableitung sich nat¨ urlich unter glatten Abbildungen f : M → N verh¨alt, dass also df = f d gilt. B.53 Beispiel (Kohomologie der Sph¨ aren) Die Berechnung der de-Rham-Kohomologie H ∗ (S n ) der n–Sph¨are erfolgt durch Mittelung von Differentialformen. • S n ⊂ Rn+1 ist invariant unter der Wirkung der Drehgruppe SO(n + 1), und wir bezeichnen die Restriktion gS n einer Drehung g : Rn+1 → Rn+1 wieder mit g. • Wir k¨onnen nun Formen ω ∈ Ω∗ (S n ) mitteln. Mit μ bezeichnen wir das haarsche Maß auf der Gruppe SO(n + 1). Dies ist das (eindeutige) Wahrscheinlichkeitsmaß mit der Eigenschaft μ Lg (A) = μ(A) = μ Rg (A)
B. Differentialformen
499
f¨ ur alle Borel–Mengen A ⊆ SO(n + 1), wobei Links– und Rechtswirkung von g ∈ SO(n + 1) durch Lg (h) := g ◦ h , Rg (h) := h ◦ g h ∈ SO(n + 1) definiert sind (siehe auch E.1.3). Wir mitteln die Form ω, setzen also ω := g ∗ ω dμ(g). SO(n+1)
ur alle h ∈ SO(n + 1), die Form ist also invariant. Es gilt h∗ ω = ω f¨ • Offensichtlich ist wegen dg ∗ = g ∗ d die gemittelte Form ω geschlossen beziehungsweise exakt, wenn ω geschlossen bzw. exakt ist. Aber auch die Umkehrung gilt. Wir k¨ onnen also zu invarianten Repr¨asentanten ω von Kohomologieklassen u ¨bergehen, die durch ihren Wert an einem Punkt der Sph¨are, z.B. dem Nordpol fixiert sind, und unter der Stabilisatorgruppe SO(n) ⊂ SO(n + 1) invariant sein m¨ ussen. Dies gilt f¨ ur die konstanten 0– und n–Formen, aber f¨ ur keine weiteren. 3 Damit ist H 0 (S n ) = H n (S n ) = R und H i (S n ) = 0 (0 < i < n). Es ist manchmal auch hilfreich, dass die ¨außere Ableitung f¨ ur ω ∈ Ωk die Leibniz– k ullt. Daher ist mit ω und ρ auch Regel d(ω ∧ ρ) = (dω) ∧ ρ + (−1) ω ∧ dρ erf¨ ω ∧ ρ geschlossen und f¨ ur eine beliebige (k − 1)–Form σ zur geschlossenen Form (ω + dσ) ∧ ρ kohomolog. H ∗ (M ) wird damit zu einem Ring, dem Kohomologiering, und es gilt die K¨ unneth–Formel D H k (M1 × M2 ) = H 1 (M1 ) ⊗ H 2 (M2 ) (k ≥ 0) 1 +2 =k
oder kurz
H ∗ (M1 × M2 ) = H ∗ (M1 ) ⊗ H ∗ (M2 ).
B.54 Beispiel (Kohomologie der Tori) Damit folgt f¨ ur den n–Torus Tn = S11 × . . . × Sn1 H k (Tn ) =
D
n G
1 +...+n =k i=1
H i (Si1 ) ∼ =
D
n R = R(k )
(k = 0, . . . , n).
1 +...+n =k
Entsprechend ist die k-te Betti–Zahl bettik (Tn ) = nk , und H ∗ (Tn ) ist die von den ωi von H ∗ (Si1 ) (i = 1, . . . , n) erzeugte ¨außere Algebra ∧(ω1 , . . . , ωn ). 3
Anhang C
Konvexit¨ at und Legendre–Transformation C.1
Konvexe Mengen und Funktionen
C.1 Definition • Eine Teilmenge K ⊆ V eines K-Vektorraums V heißt konvex, falls f¨ur alle x, y ∈ K die Strecke zwischen x und y [x, y] := (1 − λ)x + λy | λ ∈ [0, 1] ⊂ V in K liegt. • Die auf einer konvexen Menge K ⊆ V definierte Funktion f : K → R∪{+∞} heißt konvex, wenn f (1 − λ)x + λy ≤ (1 − λ)f (x) + λf (y) (λ ∈ [0, 1]), f : K → R ∪ {−∞} heißt konkav, wenn −f konvex ist. C.2 Bemerkung Wir haben hier den Funktionswert ∞ zugelassen (mit den Rechenregeln ∞ + ∞ := ∞, a < ∞ und a + ∞ := ∞ + a := ∞ f¨ ur a ∈ R). Dies ist manchmal praktisch, denn f¨ ur eine konvexe Funktion f : K → R ∪ {+∞} ist auch ihre Fortsetzung f (x) , x ∈ K f˜ : V → R ∪ {+∞} , f˜(x) := +∞ , x ∈ V \ K konvex. Umgekehrt k¨ onnen f : K → R ∪ {+∞} auf ihren effektiven Definitionsbereich dom(f ) := {x ∈ V | f (x) ∈ R} restringieren, der dann f¨ ur konvexe f wieder konvex ist. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 20,
3 500
C. Konvexit¨at und Legendre–Transformation
501
C.3 Beispiele (Konvexit¨ at) 1. Alle affinen Unterr¨aume von V sind konvex. 2. Jede Norm auf V ist eine konvexe Funktion. 3. F¨ ur eine Funktion f : Rd → R ∪ {+∞} ist der Epigraph von f epi(f ) := (x, t) ∈ Rd × R | t ≥ f (x) genau dann eine konvexe Teilmenge von Rd+1 , wenn f konvex ist. 4. F¨ ur eine konvexe Funktion f : V → R ∪ {+∞} und c ∈ R ∪ {+∞} ist die Menge {x ∈ V | f (x) ≤ c} konvex. 3 Drei Fakten u ¨ber konvexe Funktionen f : K → R auf offenen konvexen Teilmengen K ⊆ Rd sollte man kennen: • Sie sind stetig. • F¨ ur alle x ∈ K ⊆ Rd existiert (mindestens) eine affine Hyperebene in Rd+1 , die Graph einer affinen Funktion y → f (x) + D, y − x
(y ∈ Rd )
ist, mit f (y) ≥ f (x) + D, y − x
(y ∈ K).
Solche Ebenen heißen St¨ utzebenen, und Tangentialebenen, falls sie eindeutig sind. • Ist f ∈ C 2 (K, R), dann ist f genau dann konvex, wenn die Hesse–Matrix 1 D2 f (x) an jedem Punkt x ∈ K positiv semidefinit ist. Dann ist die St¨ utzebene eindeutig, und D = Df (x).
C.2
Die Legendre-Fenchel–Transformation
C.4 Definition Die Legendre-Fenchel-Transformierte einer Funktion f : Rn → R ∪ {+∞} (mit f (Rn ) = {+∞}) ist f ∗ : Rn → R ∪ {+∞}
,
f ∗ (p) := sup x∈Rn
p, x − f (x) . ⎛
⎜ 1 Zur Erinnerung: 1) Die Hesse-Matrix besitzt die Form D2 f = ⎜ ⎜ ⎝
∂2 f ∂x2 1
. . .
∂2 f ∂xn ∂x1
2
⎞
. . .
⎟ ⎟ ⎟ ⎠
f ··· ∂x∂ ∂x n 1
···
∂2 f 2 ∂xn
2) Eine symmetrische Matrix A ∈ Mat(n, R) heißt positiv definit (A > 0) (beziehungsweise positiv semidefinit), wenn v, Av > 0 (bzw. v, Av ≥ 0) f¨ ur v ∈ Rn \ {0}.
502
C.2. Die Legendre-Fenchel–Transformation
Insbesondere ist also f ∗ (0) = − inf x∈Rn f (x), und f ∗ (p) ist der Vertikalabstand zwischen der durch den Graphen von x → p, x gegebenen Ebene und dem Graphen von f . Offensichtlich gilt auch die Young-Ungleichung x, p ≤ f (x) + f ∗ (p)
(x, p ∈ Rn ).
Durch Hinzunahme der Wertes +∞ existiert f ∗ immer. C.5 Beispiel Die Exponentialfunktion f (x) := ex ist auf R definiert. Das Bild f (R) ist das Intervall I := (0, ∞). F¨ ur p ∈ I wird das Maximum von f ∗ (p) = x Die Legendre–Transformierte von f maxx (px − e ) bei x = ln(p) angenommen. ist also gleich f ∗ : I → R, f ∗ (p) = p ln(p) − 1 , siehe Abbildung. F¨ ur den von I auf R erweiterten Definitionsbereich von f ∗ wird das Supremum ∗ f (0) = 0 nicht mehr angenommen, und f ∗ (p) = +∞ f¨ ur p < 0. 3
g
f
p lnp1
1
ex 2
1
px 1
e 1
x
1
x
p
1
1
Abbildung C.2.1: Definition der Legendre–Transformation (links) und Legendre– Transformierte f ∗ (p) = p(ln p − 1) der Exponentialfunktion (rechts) C.6 Satz Die Legendre-Fenchel-Transformierte f ∗ ist eine konvexe Funktion. Beweis: F¨ ur p0 , p1 ∈ Rn und pt := (1 − t)p0 + tp1 (t ∈ [0, 1]) gilt f ∗ (pt ) =
sup (pt , x − f (x)) = sup (1 − t) p0 , x − f (x) + t p1 , x − f (x) x∈Rn ≤ (1 − t) sup p0 , x − f (x) + t sup p1 , x − f (x) =
x∈Rn
(1 −
x∈Rn t)f ∗ (p0 )
x∈Rn
∗
2
+ tf (p1 ). ∗
Wir setzen jetzt voraus, dass f nicht nur den Wert +∞ annimmt. Damit ist ur alle y ∈ Rn auch f ∗∗ := (f ∗ )∗ konvex und f¨ f ∗∗ (y) = sup y, p − f ∗ (p) = sup infn y − x, p + f (x) p∈Rn
≤
sup p∈Rn
p∈Rn x∈R
y − y, p + f (y) = f (y).
C. Konvexit¨at und Legendre–Transformation
503
f ∗∗ ist also eine konvexe Funktion, die kleiner als f ist. Wir betrachten ab jetzt Funktionen f ∈ C 2 (K, R) mit offenem konvexen Definitionsbereich K ⊆ Rn (mit +∞ auf Rn fortgesetzt) und Hesse-Matrix D2 f (x) > 0 (x ∈ K). ur Φ := Df , dann gilt Setzen wir K ∗ := Φ(K) ⊆ Rn f¨ C.7 Satz Φ ist ein C 1 –Diffeomorphismus von K auf K ∗ . Beweis: • Nach Definition ist Φ : K → Φ(K) einmal stetig differenzierbar und surjektiv. • Φ ist aber auch injektiv, denn f¨ ur x0 , x1 ∈ K gilt, mit xt := (1 − t)x0 + tx1 , Φ(x1 ) − Φ(x0 ), x1 − x0
1
=
0
d Φ(xt ) − Φ(x0 ), x1 − x0 dt dt
1
DΦ(xt )(x1 − x0 ), x1 − x0 dt > 0
= 0
f¨ ur x1 = x0 , denn DΦ(xt ) = D2 f (xt ) > 0. • Da DΦ(x) > 0, ist nach Satz 2.39 auch Φ(K) offen, und die Inverse von Φ ist ebenfalls stetig differenzierbar. 2 Φ(K) muss nicht konvex sein. Jedenfalls gilt ) * C.8 Satz f ∗ (p) = p, Φ−1 (p) − f ◦ Φ−1 (p)
p ∈ Φ(K) .
Beweis: F¨ ur p ∈ Φ(K) betrachten wir die Funktion g ∈ C 2 (K, R)
,
g(x) := p, x − f (x).
ur x∗ := Φ−1 (p) ist Es gilt D2 g(x) = −D2 f (x) < 0 und f¨ Dg(x∗ ) = p − Df (x∗ ) = p − Φ ◦ Φ−1 (p) = 0. Nach der Taylor-Formel ist f¨ ur x ∈ K und ein y auf der Strecke [x∗ , x] ) * g(x) − g(x∗ ) = 12 x − x∗ , D2 g(y)(x − x∗ ) < 0 falls x = x∗ . Also ist tats¨achlich x∗ die eindeutige Maximalstelle von g.
2
C.9 Satz 1. Mit f ist auch f ∗ : K ∗ → R zweimal stetig differenzierbar. 2. Ist K ∗ konvex, dann ist die Legendre–Transformation involutiv, d.h. f ∗∗ = f .
504
C.2. Die Legendre-Fenchel–Transformation
) * Beweis: 1. Aus f ∗ (p) = p, Φ−1 (p) − f ◦ Φ−1 (p) folgt mit Φ(x) = Df (x) Df ∗ (p) = Φ−1 (p) + p DΦ−1 (p) − Df (Φ−1 (p))DΦ−1 (p) = Φ−1 (p). Nun ist Φ−1 ∈ C 1 (K ∗ , K), also auch Df ∗ ∈ C 1 (K ∗ , K) und f ∗ ∈ C 2 (K ∗ , R). ur f . Es ist damit 2. F¨ ur f ∗ gelten jetzt die gleichen Voraussetzungen wie f¨ Df ∗ : K ∗ → K die inverse Abbildung zu Df : K → K ∗ , und mit Satz C.8 gilt 2 f ∗∗ = f .
y
Die Legendre–Transformation ist sogar f¨ ur beliebige konvexe f involutiv.
2
C.10 Korollar F¨ ur konvexe f : R → R ist die Einh¨ ullende der Familie y = px − g(p)
(p ∈ f (R))
von Geraden ist die Legendre–Transformierte von g, siehe nebenstehende Abbildung.
f 1 2
1
p x gp
1
x
1
Die Legendre–Transformierte f von g
Anhang D
Fixpunkt- und Urbilds¨ atze Im Zusammenhang des Satzes von Picard–Lindel¨of (Satz 3.17) und auch der Møller–Transformationen (Satz 12.11) tauchen R¨aume von Kurven auf. Der folgende Satz stellt die Konvergenz der Cauchy–Folgen in diesen R¨aumen sicher. D.1 Satz Sei V ⊆ Rn abgeschlossen, I ⊆ R ein Intervall, und X der Raum der Kurven
X := c ∈ C(I, V ) sup c(t) < ∞ , t∈I
mit d(f, g) := supt∈I f (t) − g(t) (f, g ∈ X). Dann ist (X, d) ein vollst¨andiger metrischer Raum. Beweis: • (X, d) ist ein metrischer Raum. Denn f¨ur f, g, h ∈ X ist - d(g, f ) = d(f, g), - d(f, g) ≤ supt∈I f (t) + supt∈I g(t) < ∞, und d(f, g) ≥ 0 mit Gleichheit genau, wenn f = g, und - d(f, h) = supt∈I (f (t) − g(t)) + (g(t) − h(t))
≤ supt∈I f (t) − g(t) + supt∈I g(t) − h(t) = d(f, g) + d(g, h). • Cauchy–Folgen (fm )m∈N in X konvergieren punktweise gegen eine Abbildung f : I → V , denn f¨ ur alle t ∈ I ist fm (t) − fn (t) ≤ d(fm , fn ), und V ist als abgeschlossene Teilmenge des Rn vollst¨andig. • Nach dem folgenden ε/3–Argument ist f stetig und sogar f ∈ X. F¨ ur ε > 0 sei N ∈ N so gew¨ahlt, dass d(fm , fN ) < ε/3 (m ≥ N ), also auch f¨ ur alle t ∈ I : f (t) − fN (t) ≤ ε/3. Aus der Stetigkeit von fN folgt f¨ ur alle s ∈ I die Existenz eines δ > 0 mit
fN (t) − fN (s) < 3ε t ∈ I : |t − s| < ε/3 . Also ist
f (t) − f (s) ≤ f (t) − fN (t) + fN (t) − fN (s) + fN (s) − f (s) < ε. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 21,
505
506
D. Fixpunkt- und Urbilds¨atze
• In (X, d) gilt auch f = limN →∞ fN , denn der Abstand d(f, fN ) = sup lim fm (t) − fN (t) ≤ sup sup fm (t) − fN (t)
t∈I m→∞
t∈I m≥N
= supm≥N d(fm , fN ) geht f¨ ur N → ∞ gegen Null.
2
D.2 Definition • x ∈ X heißt Fixpunkt von f : X → X, falls f (x) = x. • Falls (X, d) ein vollst¨andiger metrischer Raum ist, dann heißt f : X → X kontrahierend, wenn eine Kontraktionskonstante θ ∈ (0, 1) existiert mit d f (x), f (y) ≤ θ d(x, y) (x, y ∈ X). D.3 Satz (Banachscher Fixpunktsatz) Eine kontrahierende Abbildung f : X → X auf einem vollst¨andigen metrischen Raum (X, d) mit Lipschitz– ur die m-te Iterierte Konstante θ < 1 besitzt genau einen Fixpunkt x∗ , und f¨ xm := f (xm−1 ) von x0 ∈ X gilt m
θ d(xm , x∗ ) ≤ d(x1 , x0 ) 1−θ
(m ∈ N).
(D.1)
Beweis: • F¨ ur n ∈ N0 gilt d(xn+1 , xn ) ≤ θ d(xn , xn−1 ) ≤ . . . ≤ θn d(x1 , x0 ), also f¨ ur n > m ⎛ ⎞ n−1 n−1 θm d(x1 , x0 ). d(xn , xm ) ≤ d(xj+1 , xj ) ≤ ⎝ θj ⎠ d(x1 , x0 ) ≤ 1−θ j=m j=m Also ist (xn )n∈N eine Cauchy–Folge, und wegen Vollst¨andigkeit von (X, d) existiert x∗ := lim xn . n→∞ ∗ θm ∗ • Damit ist d(x , xm ) = limn→∞ d(x , xn ) + d(xn , xm ) ≤ 1−θ d(x1 , x0 ). ∗ • Wegen der Stetigkeit von f gilt f (x∗ ) = limn→∞ f (xn ) = limn→∞ xn+1 = ∗x . ∗ • Gilt f¨ ur x ∈ X ebenfalls f (x) = x, dann ist d(x, x ) = d f (x), f (x ) 2 ≤ θ d(x, x∗ ), also x = x∗ . Damit ist x∗ der einzige Fixpunkt. In vielen F¨allen ist die kontrahierende Abbildung parameterabh¨angig und man interessiert sich f¨ ur die Abh¨angigkeit des Fixpunktes vom Parameter. Eine entsprechende Aussage ist: D.4 Satz (Parametrisierter Fixpunktsatz) Es sei (X, d) ein vollst¨andiger metrischer Raum, P ein topologischer Raum (der Parameterraum) und es gelte f¨ ur f : X × P → X, fp (x) := f (x, p): 1. Es gibt eine gemeinsame Kontraktionskonstante θ ∈ (0, 1) f¨ ur die Abbildungen fp (p ∈ P ). 2. F¨ ur alle x ∈ X sind die Abbildungen P → X, p → fp (x) stetig.
D. Fixpunkt- und Urbilds¨atze
507
Dann sind die Fixpunkte xp von fp stetig in p ∈ P . Beweis: Wegen 1. besitzt fp nach Satz D.3 einen eindeutigen Fixpunkt xp . • F¨ ur alle p, q ∈ P ist, ebenfalls wegen der ersten Bedingung d(xp , xq ) = d fp (xp ), fq (xq ) ≤ d fp (xp ), fp (xq ) + d fp (xq ), fq (xq ) ≤ θ d xp , xq + d fp (xq ), fq (xq ) , also d(xp , xq ) ≤ d fp (xq ), fq (xq ) /(1 − θ). • Wegen der zweiten Bedingung ur alle ε > 0 eine Umgebung U ⊆ P gibt es f¨ von q mit d fp (xq ), fq (xq ) < ε(1 − θ), falls p ∈ U . F¨ ur diese p ist also 2 d(xp , xq ) < ε. D.5 Bemerkung (Newton–Verfahren) Es sei f ∈ C 2 (I, R), also eine zweimal stetig differenzierbare Funktion auf dem Intervall I := [a, b], mit f (x) = 0 f¨ ur alle x ∈ I. f Gesucht ist das (wegen dieser Annah1 me eindeutige) Urbild X eines Punktes Y ∈ f (I). X ist der einzige Fixpunkt von x0 , f x0 g ≡ gY : I → R
,
g(x) = x −
f (x)−Y f (x)
.
Geometrisch ist g(x) der Schnittpunkt der Tangente an den Graphen von f bei (x, f (x)) mit der Geraden y = Y . Im Newton–Verfahren w¨ahlt man einen Anfangswert x0 ∈ I und iteriert g, mit xn+1 := g(xn ). 3
Y
X,Y
x1 ,Y
X,X
f
I
gY x
D.6 Satz (Newton-Verfahren) F¨ ur alle x ∈ I ist |g(x) − X| ≤ M |x − X|2 , maxx∈I |f (x)| mit M := minx∈I |f (x)| . Also konvergiert das Verfahren f¨ ur Anfangswerte x0 ∈ I mit M |x0 − X| < 1, das heißt: limn→∞ xn = X. Beweis: Falls x = X ist, sind wir fertig. Sonst gibt es nach dem Mittelwertsatz der Differentialrechnung ein ξ im offenen Intervall zwischen x und X mit f (x)−f (X) = f (ξ), also x−X f (ξ) |g(x) − X| = x − f (x)−Y − X) 1 − = − X (x f (x) f (x) (ξ) 2 f (x)−f (ξ) 1 ≤ |x − X| = |x − X| · f (x)−f · f (x) x−ξ f (x) =
|x − X|2 ·
|f (η)| . |f (x)|
Wieder wird nach dem Mittelwertsatz η geeignet zwischen x und ξ gew¨ahlt. 2 1 Oft
wird in Darstellungen des Newton–Verfahrens Y = 0 angenommen.
Anhang E
Gruppentheorie E.1 E.2 E.3 E.4
E.1
Gruppen . . . . . . . . Lie–Gruppen . . . . . Lie–Algebren . . . . . Lie–Gruppenwirkungen
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. 508 . 511 . 514 . 519
Gruppen
E.1 Definition • Eine Gruppe ist eine Menge G mit einer Abbildung (,Verkn¨ upfung’ genannt) ◦ : G × G → G, die assoziativ ist (g ◦ (h ◦ k) = (g ◦ h) ◦ k), und einem ausgezeichneten Element e ∈ G (Identit¨ at) mit g ◦ e = e ◦ g = g, (g ∈ G), f¨ur die zu jedem Element g ∈ G ein inverses Element h ∈ G mit g ◦ h = e existiert. • G heißt kommutativ oder abelsch, wenn g ◦ k = k ◦ g
(g, k ∈ G) gilt.
• Die Ordnung |G| einer Gruppe ist die Kardinalit¨at der Menge. • Eine nicht leere Teilmenge H ⊆ G heißt Untergruppe, wenn sie unter Multiplikation und Inversenbildung abgeschlossen ist. Schreibweise: H ≤ G. • F¨ ur eine Untergruppe H ≤ G und g ∈ G heißt g ◦ H := {g ◦ h | h ∈ H} ⊆ G eine Linksnebenklasse, H ◦ g eine Rechtsnebenklasse von H. E.2 Bemerkung Sowohl die Identit¨at e als auch das zu g inverse Element g −1 ist eindeutig, und es gilt auch g −1 ◦ g = e. 3 E.3 Satz (Lagrange) Die Ordnung |H| einer Untergruppe H ≤ G einer endlichen Gruppe G teilt die Ordnung |G| von G. A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 22,
508
E. Gruppentheorie
509
E.4 Definition g1 ∈ G heißt konjugiert zu g2 ∈ G, wenn ein h ∈ G existiert mit g2 = h ◦ g1 ◦ h−1 . Eine Untergruppe H1 ≤ G heißt konjugiert zu H2 ≤ G, wenn ein h ∈ G existiert mit H2 = h ◦ H1 ◦ h−1 . ¨ E.5 Satz Konjugation ist eine Aquivalenzrelation. Eine Gruppe G zerf¨allt also in Konjugationsklassen, wobei die Identit¨at e ∈ G eine eigene Klasse bildet. E.6 Definition Eine Untergruppe H ≤ G heißt normal, wenn gilt: kHk −1 = H
(k ∈ G),
also Links- und Rechtsnebenklassen u ¨bereinstimmen. Schreibweise: H G. E.7 Satz Ist die Untergruppe H ≤ G normal, dann induziert die Verkn¨ upfung auf G eine Verkn¨ upfung auf der Menge G/H der Nebenklassen von H. Diese Gruppe heißt Faktorgruppe G/H. E.8 Beispiel (Restklassengruppe) F¨ ur n ∈ N ist die Teilmenge nZ ⊆ Z der ganzzahligen Vielfachen von n eine Untergruppe von (Z, +). Da (Z, +) abelsch ist, ist nZ normal, mit der Restklassengruppe Zn := Z/nZ ∼ = {0, 1, . . . , n − 1} als Faktorgruppe (Addition mod n). 3 E.9 Definition Eine Abbildung φ : G1 → G2 von der Gruppe G1 in die Gruppe G2 heißt Homomorphismus, wenn φ(g1 ◦ g2 ) = φ(g1 ) ◦ φ(g2 )
(g1 , g2 ∈ G1 )
(E.1.1)
gilt. Ein bijektiver Homomorphismus heißt Isomorphismus. E.10 Bemerkung Aus (E.1.1) folgt f¨ ur die Bilder des neutralen und der inversen Elemente φ(e) = e und φ(g −1 ) = φ(g)−1 (g ∈ G1 ). 3 E.11 Satz Der Kern ker(φ) := {g ∈ G1 | φ(g) = e} eines Gruppenhomomorphismus φ : G1 → G2 ist eine normale Untergruppe. E.12 Definition • Eine (Links–)Wirkung oder Aktion einer Gruppe G auf einer Menge M ist eine Abbildung Φ : G×M → M , f¨ ur die in der Schreibweise Φg : M → M
, Φg (m) := Φ(g, m)
(g ∈ G)
gilt Φe = IdM
und Φg ◦ Φh = Φg◦h
(g, h ∈ G).
(E.1.2)
• Der Orbit eines Punktes m ∈ M ist die Menge O(m) := Φ(G, m) ⊆ M . • Die Isotropiegruppe (auch Stabilisator, Fixgruppe oder Standgruppe genannt) von m ∈ M ist die Untergruppe Gm := {g ∈ G | Φ(g, m) = m}.
510
E.1. Gruppen
• Die Wirkung heißt frei, wenn f¨ ur alle m ∈ M die Abbildung G → M, g → Φ(g, m) injektiv ist, transitiv, wenn sie f¨ ur ein (und damit f¨ ur alle) m ∈ M surjektiv ist. • Eine Gruppenwirkung Φ : G × V → V auf einem Vektorraum V heißt Darstellung von G, wenn die Abbildungen Φg : V → V linear sind. Φ : G × C → C, (g, c) → ϕ(g)c (und auch ϕ : G → C) heißt Charakter. Wie im Spezialfall dynamischer Systeme (Satz 2.13) definiert die Zugeh¨origkeit ¨ zu einem Orbit eine Aquivalenzrelation auf M . F¨ ur h ∈ G und den Punkt m := h m ∈ O(m) des Orbits von m ist in der Kurzschreibweise g m := Φg (m) Gm = {g ∈ G | g ◦ h m = h m} = {g ∈ G | h−1 ◦ g ◦ h m = m} = h Gm h−1 . Die Isotropiegruppen der Punkte eines Orbits sind also zueinander konjugiert. Gruppen G wirken in verschiedener Weise auf sich selbst, zum Beispiel durch Links– beziehungsweise Rechtswirkung 1 L:G×G→G
, Lg (h) := g ◦ h
, R:G×G→G
, Rg (h) := h ◦ g. (E.1.3) Die Abbildungen Lg und Rg vertauschen miteinander, und sowohl die Links– als ur auch die Rechtswirkung sind transitiv, denn f¨ ur h1 , h2 ∈ G ist Lg (h1 ) = h2 f¨ −1 g := h2 ◦ h−1 und R (h ) = h f¨ u r g := h ◦ h . Auch die Abbildung g 1 2 2 1 1 I :G×G→G
, Ig (h) := g ◦ h ◦ g −1
(E.1.4)
ist eine Gruppenwirkung von G auf sich, aber im Gegensatz zu Lg und Rg ist Ig : G → G ein Gruppen–Automorphismus, denn es gilt Ig (h1 ) ◦ Ig (h2 ) = g ◦ h1 ◦ g −1 ◦ g ◦ h2 ◦ g −1 = Ig (h1 ◦ h2 ), ur alle g ∈ G. Diese Gruppenwirkung heißt (entalso insbesondere Ig (e) = e f¨ sprechend Definition E.4) auch Konjugation. E.13 Satz Ist |G| < ∞ und Φ : G × M → M eine Gruppenwirkung, so gilt |O(m)| · |Gm | = |G|
(m ∈ M ).
E.14 Definition • Sind G1 , G2 Gruppen, so heißt G1 × G2 mit Gruppenmultiplikation g1 , g2 ◦ g1 , g2 := g1 ◦ g1 , g2 ◦ g2 direktes Produkt von G1 und G2 . • Die Automorphismengruppe einer Gruppe G ist die Gruppe Aut(G) := {φ : G → G | φ ist Isomorphismus } mit der Komposition als Gruppenverkn¨ upfung. 1 F¨ ur
die Rechtswirkung gilt allerdings Rg1 ◦ Rg2 = Rg2 ◦g1 , im Gegensatz zu (E.1.2).
E. Gruppentheorie
511
• Ist φ : G2 → Aut(G1 ) ein Homomorphismus von G2 in die Automorphismengruppe von G1 , so heißt G1 × G2 (als Menge) mit Gruppenmultiplikation (g1 , g2 ) ◦ (g1 , g2 ) = g1 ◦ φ(g2 )(g1 ) , g2 ◦ g2 gi , gi ∈ Gi semidirektes Produkt von G1 und G2 , und wird mit G1 φ G2 (oder G1 G2 ) bezeichnet. E.15 Beispiel (Euklidische Gruppe) Wie in Satz 14.1 gezeigt wird, ist die Euklidische Gruppe E(d) des Rd semidirektes Produkt von G1 := (Rd , +) und der orthogonalen Gruppe G2 := O(d). Der Homomorphismus φ : O(d) → Aut(Rd ) ist dabei einfach durch φ(O)(v) := Ov f¨ ur v ∈ Rd gegeben, sodass (v, O) ◦ (v , O ) = v + Ov , O O gilt. Insbesondere ergibt sich f¨ ur d = 1 Dimensionen E(1) ∼ = R φ {±1}, wobei dieses semidirekte Produkt abelscher Gruppen nicht abelsch ist, denn z.B. (v, −1) ◦ (v , 1) = (v − v , −1)
, aber (v , 1) ◦ (v, −1) = (v + v , −1).
3
Zwar sind die beiden Faktoren eines semidirekten Produktes Untergruppen von G1 G2 , aber im Allgemeinen ist nur G1 normal. Etwa im Beispiel der Euklidischen Gruppe ist die Untergruppe {0} × O(d) der Drehspiegelungen um den Ursprung konjugiert zu den Untergruppen der Drehspiegelungen um einen anderen Punkt des Rd .
E.2
Lie–Gruppen
Viele Gruppen sind in nat¨ urlicher Weise topologische R¨aume oder sogar Mannigfaltigkeiten. E.16 Definition • Eine Gruppe (G, ◦) heißt topologische Gruppe, wenn G mit einer Topologie versehen ist, sodass gilt: Die Gruppenverkn¨ upfung ◦ : G × G → G und die Inversenbildung G → G sind stetig (dabei wird G × G mit der Produkttopologie versehen, siehe Seite 454). • Eine Gruppe (G, ◦) heißt Lie–Gruppe, wenn G mit einer differenzierbaren Struktur (siehe Seite 458) versehen ist, sodass die Gruppenverkn¨ upfung G × G → G und die Inversenbildung G → G glatte Abbildungen sind. Ein einfaches Beispiel einer Lie–Gruppe ist die abelsche Gruppe (Rd , +), ebenso deren Untergruppe Zd mit der durch die Inklusion Zd ⊂ Rd entstehenden (diskreten) Teilraumtopologie. E.17 Bemerkungen 1. Schon in Definition 2.16 eines stetigen dynamischen Systems und Definition 2.43 eines differenzierbaren dynamischen Systems haben wir von Definition E.16 Gebrauch gemacht.
512
E.2. Lie–Gruppen
2. Da Mannigfaltigkeiten topologische R¨aume und glatte Abbildungen stetig sind, ist jede Lie–Gruppe eine topologische Gruppe. Umgekehrt gilt das nicht. Beispielsweise kann man die Gruppe Diff(M ) aller Diffeomorphismen einer Mannigfaltigkeit M als topologische Gruppe auffassen. F¨ ur dim(M ) ≥ 1 m¨ usste sie als ,Mannigfaltigkeit’ unendliche Dimension besitzen, was mit unserem Mannigfaltigkeitsbegriff nicht kompatibel ist. 3. Um zu zeigen, dass G eine Lie–Gruppe ist, reicht es aus zu zeigen, dass die Multiplikation glatt ist. Bezeichnen wir diese n¨amlich mit M : G × G → G, −1 dann ist die Inversenbildung I : G → G, I(g) = g L¨osung der Gleichung M g, I(g) = e, und die partielle Ableitung D2 M (g, h) nach dem zweiten Argument ist ein Isomorphismus. Die Glattheit von I folgt damit aus dem Satz u 3 ¨ber die implizite Funktion. E.18 Beispiel (Allgemeine lineare Gruppe) Die allgemeine lineare Gruppe GL(V ) eines Vektorraums V ist die Gruppe der Automorphismen von V (also der invertierbaren linearen Abbildungen aus Lin(V )). Damit wirkt sie auf V und auch auf dem projektiven Raum P(V ) von V , also ¨ der Menge der Aquivalenzklassen P(V ) := [v] | v ∈ V \ {0}
mit
[v] = [w] falls span(v) = span(w).
Im Fall eines K–Vektorraums V endlicher Dimension n ist die Gruppe isomorph zu der Gruppe der invertierbaren Matrizen aus Mat(n, K). F¨ ur K = R und alle n ∈ N ist diese reelle allgemeine lineare Gruppe GL(n, R) := {M ∈ Mat(n, R) | det(M ) = 0} eine offene Teilmenge des n2 –dimensionalen Vektorraums Mat(n, R), und die Gruppenmultiplikation ist als Einschr¨ankung der bilinearen Matrixmultiplikation glatt (siehe auch Beispiel 4.13). Es gilt also dim GL(n, R) = n2 , und die Lie– Gruppe GL(n, R) besitzt neben der Untergruppe GL+ (n, R) := {M ∈ GL(n, R) | det(M ) > 0} noch eine zweite Zusammenhangskomponente. Dabei ist die letztere von der Form GL+ (n, R)N mit einer beliebigen Matrix N ∈ GL(n, R) negativer Determinante. Sie sieht also als Mannigfaltigkeit genauso aus wie GL+ (n, R), ist aber keine Gruppe. Eine Untergruppe von GL(n, R) ist die orthogonale Gruppe O(n) := M ∈ GL(n, R) | M = M −1 der Drehspiegelungen des Rn . Die Topologie der Mannigfaltigkeit GL(n, R) kann man verstehen, indem man die Matrizen M ∈ GL(n, R) mittels Polarzerlegung eindeutig in der Form M = OP schreibt mit O ∈ O(n) und P positiv. Dass dabei P = (M M )1/2 sein muss, ergibt sich aus dem Ansatz M = OP : M M =
E. Gruppentheorie
513
P O OP = P P = P 2 . Da die positiven Matrizen von der Form P = exp(S) mit S ∈ Sym(n, R) sind,2 ist GL(n, R) −→ O(n) , OP −→ O ein B¨ undel mit typischer Faser Sym(n, R). Als R–Vektorraum ist diese zusammenh¨angend. Also besitzt der Totalraum GL(n, R) des B¨ undels genauso viele Zusammenhangskomponenten wie die Basis O(n). GL+ (n, R) projiziert auf die Drehgruppe SO(n) := M ∈ GL+ (n, R) | M = M −1 . Letztere ist zusammenh¨angend, wie in Beispiel E.19 gezeigt wird. Die Gruppe GL(n, R) ist andererseits nicht kompakt, denn sie enth¨alt ja die Untergruppe {λ1l | λ > 0}. Analog ist f¨ ur alle n ∈ N die komplexe allgemeine lineare Gruppe GL(n, C) := {M ∈ Mat(n, C) | det M = 0} als offene dichte Teilmenge von Mat(n, C) eine 2n2 –dimensionale (reelle) Mannigfaltigkeit. Diese Lie–Gruppe ist aber zusammenh¨angend. 3 Oft werden Lie–Gruppen als Untergruppen von GL(n, R) oder GL(n, C) definiert. E.19 Beispiele (Lie–Gruppen) 1. Die spezielle lineare Gruppe SL(n, R) := {M ∈ GL(n, R) | det(M ) = 1} ist eine (n2 − 1)–dimensionale Untermannigfaltigkeit von GL+ (n, R), da 1 regul¨arer Wert von det : Mat(n, R) → R ist. SL(n, R) ist zusammenh¨angend und f¨ ur n > 1 nicht kompakt. 2. Die Drehgruppe SO(n) = M ∈ SL(n, R) | M = M −1 ist diejenige Zusammenhangskomponente der orthogonalen Gruppe O(n) die die Identit¨at enth¨alt. Denn als normale reelle Matrix ist O ∈ SO(n) in einer geeigneten Orthonormalbasis von Rn eine direkte Summe von Matrizen der Form ( sc −s c )∈ Mat(2, R) und Zahlen u ∈ Mat(1, R) = R. Da O orthogonal ist, sind die ( sc −s c ) ∈ SO(2), und |u| = 1. Da sogar O ∈ SO(n), gibt es eine gerade Zahl von Summanden c = −1. Diese kann man wieder zu Paaren von Drehmatri cos ϕ − sin ϕ zen aus SO(2) zusammenfassen. Da SO(2) = | ϕ ∈ [0, 2π) sin ϕ cos ϕ zusammenh¨angend ist, ist damit auch SO(n) zusammenh¨angend. Da die Matrixnorm der Elemente von O(n) gleich Eins ist, ist O(n) und damit auch SO(n) kompakt. 1l ∈ Sym(n, R) ⊂ Mat(n, R) ist regul¨arer Wert der Abbildung P : GL(n, R) −→ Sym(n, R) 2 Mit
, M −→ M M,
Sym(n, K) := {P ∈ GL(n, K) | P ∗ = P } f¨ ur K = R oder K = C.
514
E.3. Lie–Algebren
denn ihre Linearisierung ist durch DP (M )N = M N + N M gegeben, und f¨ ur M ∈ P −1 (1l) = O(n) und L ∈ Sym(n, R) ist L Bild von N := 12 M L unter der Abbildung N → M N + N M , diese also surjektiv. Damit ist O(n) eine Lie–Gruppe, und dim O(n) = dim GL(n, R) − dim Sym(n, R) = n2 − n+1 = ( n2 ) . 2 3. Die unit¨are Gruppe U(n) := M ∈ GL(n, C) | M ∗ = M −1 ist als Lie–Gruppe ebenfalls kompakt, besitzt die (reelle) Dimension n2 , und U (1) ∼ = S 1 . Die Untergruppe SU(n) := {M ∈ U(n) | det(M ) = 1} der speziell unit¨aren Matrizen ist eine (n2 − 1)–dimensionale Lie–Gruppe. Die Darstellung v w 2 2 SU(2) = ( −w (E.2.1) v ) | v, w ∈ C, |v| + |w| = 1 zeigt, dass SU(2) diffeomorph zur Sph¨are S 3 ⊂ R4 ∼ = C2 ist. 4. Kartesische Produkte von Lie–Gruppen sind, als Produktmannigfaltigkeiten aufgefasst, wieder Lie–Gruppen. Ein Beispiel ist die abelsche Gruppe Tn := S 1 × . . . × S 1 , der n–dimensionale Torus. 3
E.3
Lie–Algebren
In der Mathematik ist das Konzept der Linearisierung oft erfolgreich, denn lineare Strukturen sind meist einfacher zu verstehen als nicht lineare. Da eine Lie–Gruppe auch eine Mannigfaltigkeit ist, kann man sie lokal (in der N¨ahe des neutralen Elements) betrachten, und kommt so zum Begriff ihrer Lie–Algebra. Die in (E.1.3) definierten Links- und Rechtswirkungen Lg , Rg : G → G sind im Fall einer Lie–Gruppe G Diffeomorphismen. E.20 Definition Ein Vektorfeld X : G → T G auf einer Lie–Gruppe G heißt • links–invariant, wenn gilt (Lg )∗ X = X • rechts–invariant, wenn gilt (Rg )∗ X = X
(g ∈ G), (g ∈ G).
Wir werden weiter meistens die links–invarianten Vektorfelder X betrachten; f¨ ur die rechts–invarianten gelten dann analoge Aussagen. Da die Linkswirkung transitiv ist, brauchen wir nur X(e) zu kennen, um ur alle g ∈ G zu kennen. Die links–invarianten Vektorfelder X(g) = T Lg X(e) f¨ urlich isomorphen Unterraum XL (G) im R– auf G bilden also einen zu Te G nat¨ Vektorraum X (G) aller Vektorfelder.
E. Gruppentheorie
515
E.21 Definition Eine Lie–Algebra E, [·, ·] ist ein K–Vektorraum E mit einer Abbildung [·, ·] : E × E → E, genannt Lie–Klammer, die (mit a, b ∈ K und X, Y, Z ∈ E) • bilinear ist, das heißt [a X + b Y, Z] = a [X, Z] + b [Y, Z]
und [Z, a X + b Y ] = a [Z, X] + b [Z, Y ]
• alternierend ist: [X, X] = 0, und damit antisymmetrisch: [X, Y ] = −[Y, X], ullt. • und die die Jacobi–Identit¨ at [X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y ]] = 0 erf¨ E.22 Lemma Die Lie–Klammer [X, Y ] : G → T G (siehe Definition 10.20) zweier links–invarianter Vektorfelder X, Y : G → T G ist selbst links–invariant. Beweis: F¨ ur g ∈ G gilt (Lg )∗ [X, Y ] = [(Lg )∗ X, (Lg )∗ Y ] = [X, Y ], also auch [X, Y ] ∈ XL (G). 2 Damit bildet XL (G), [·, ·] eine Lie–Algebra, die sogenannte Lie–Algebra Lie(G) von G. E.23 Bemerkungen 1. Oft wird statt Lie(G) das Frakturzeichen g benutzt, zum Beispiel Lie SO(n) = so(n). 2. Wie bemerkt, l¨aßt sich die Lie–Algebra g einer Lie–Gruppe G als Tangentialraum von G des neutralen Elements e ∈ G auffassen 3 . Da sie damit deren lokale Struktur in der N¨ahe der Identit¨at wiedergibt, kann es wie in Aufgabe E.27.2.b) oder im Beispiel so(n) = o(n) vorkommen, dass nicht isomorphe Lie–Gruppen isomorphe Lie–Algebren besitzen. 3 Nicht alle Lie–Gruppen sind Matrixgruppen: E.24 Beispiele (Lie–Gruppen vs Matrixgruppen) 1. So besteht zwar (R, +) aus reellen Zahlen, also eindimensionalen Matrizen, aber die Gruppenverkn¨ upfung entspricht nicht der Matrixmultiplikation. In diesem Fall ist die Lie–Gruppe aber isomorph zu einer Matrixgruppe, n¨amlich der multiplikativen Gruppe (R+ , ·), mit dem Isomorphismus exp : R → R+ . Solche Lie–Gruppen heißen auch linear. Beispielsweise sind alle endlichen Gruppen linear. 2. Manche Gruppen sind ,zu groß’ um linear zu sein, zum Beispiel die Permutationsgruppe von N. sogenannte Baker–Campbell–Hausdorff–Formel stellt log exp(X) exp(Y ) durch Kommutatoren von X und Y dar, mit exp aus (E.3.1), stellt also eine Beziehung zwischen Lie–Klammer und Gruppenverkn¨ upfung her. 3 Die
516
E.3. Lie–Algebren
3. Auch manche zusammenh¨angenden Lie–Gruppen wie die sogenannten metaplektischen Gruppen, die die symplektischen Gruppen zweifach u ¨berlagern und in der Quantenmechanik wichtig sind, sind nicht linear (siehe etwa Carter, Segal und Macdonald [CSM], Seite 130). 3 Im allgemeinen Fall der Lie–Algebra g einer Lie–Gruppe G wird die Exponentialabbildung wie folgt definiert. Die Elemente ξ ∈ g werden als linksinvariante Vektorfelder auf G aufgefasst. Diese erzeugen Fl¨ usse Φ(ξ) : R × G → G
(ξ ∈ g),
(denn wegen der Gruppenstruktur gibt es ein von der Anfangsbedingung g ∈ G unabh¨angiges Zeitintervall, auf dem die Picard–Iteration konvergiert), und die Exponentialabbildung ist exp : g → G
, ξ → Φ(ξ) (1, e).
(E.3.1)
Die Exponentialabbildung bildet kleine Umgebungen von 0 ∈ g diffeomorph auf Umgebungen von e ∈ G ab (etwa f¨ ur lineare Gruppen ist ja D exp(0) = 1l). Sie bildet aber nicht immer g auf die Zusammenhangskomponente von e ∈ G ab. Dies sieht man etwa f¨ ur die in Aufgabe 6.26.d) diskutierte und auf Seite 89 illustrierte Gruppe SL(2, R) = Sp(2, R). Unter den hyperbolischen Matrizen ist die Zusammenhangskomponente der Matrizen mit negativen Eigenwerten nicht im Bild exp sl(2, R) der Exponentialabbildung. Siehe auch Abraham und Marsden [AM], Example 4.1.9 f¨ ur die Gruppe GL(2, R). E.25 Aufgabe (Exponentialabbildung f¨ ur GL(n, R)) Zeigen Sie, dass die links– beziehungsweise rechts–invarianten Vektorfelder auf der Matrixgruppe GL(n, R) von der Form g ∈ GL(n, R), ξ ∈ Mat(n, R) g → X (ξ) (g) = g ξ bzw. g → ξ g sind, dass der Kommutator von zwei links-invarianten Vektorfeldern durch % & X (ξ) , X (η) = X ([ξ,η]) mit [ξ, η] = ξη − ηξ ξ, η ∈ Mat(n, R) gegeben ist, und dass Definition (E.3.1) von exp(ξ) mit dem Matrixexponential (4.1) u 3 ¨bereinstimmt.
E.26 Beispiele 1. Die links– und die rechts–invarianten Vektorfelder einer abelschen Lie–Gruppe sind einander gleich, und ihre Lie–Klammer verschwindet. Auf Rn etwa geh¨oren genau die konstanten Vektorfelder zur Lie–Algebra XL (Rn ) = XR (Rn ). F¨ ur die Lie–Gruppe U (1) = {c ∈ C | |c| = 1} mit Lie–Algebra iR ergibt sich das nebenstehende Bild.
U1
i
E. Gruppentheorie
517
2. Die Matrixgruppe GL(n, K) ist offen in Mat(n, K), ihre Lie–Algebra ist also der Tangentialraum gl(n) = Mat(n, K). Der oben beschriebene Zusammenhang zwischen Lie–Algebra und Tangentialraum der Identit¨at erlaubt damit eine einfache Berechnung der Matrix– Lie–Algebra einer Matrix–Lie–Gruppe, wie man am Beispiel der SO(n, R) ⊂ GL(n, R) sieht: F¨ ur eine C 1 –Kurve A : (−, ) → SO(n, R) mit A(0) = 1l gilt A(s)A(s) = 1l und det A(s) = 1 f¨ ur alle s ∈ (−, ), also ˙ ˙ = A(0) ˙ ˙ . A(s)A(s) = A(0)A(0) + A(0)A(0) + A(0) 0= d ds
s=0
Folglich ist mit dem Vektorraum Alt(n, R) := {X ∈ Mat(n, R) | X = −X} der antisymmetrischen Matrizen so(n) = Alt(n, R),
(E.3.2)
denn aus X + X = 0 folgt bereits exp(X) exp(X ) = 1l und tr (X) = 0, so dass det(exp X) = 1. 3 E.27 Aufgaben (Lie–Gruppen und Lie–Algebren) 1. Berechnen Sie analog zu den obigen Beispielen die Lie–Algebren u(n), su(n) und sp(R2n ) von U(n), SU(n) beziehungsweise Sp(R2n ) (siehe Beispiel E.19.3 und (6.2.5)), und bestimmen Sie deren Dimensionen. 2. (Isomorphien von Lie–Algebren) (a) Zeigen Sie, dass die Lie–Algebra so(3) mit (13.4.8) isomorph ist zur Lie– Algebra des R3 , versehen mit dem Vektorprodukt als Klammeroperation. (b) Zeigen Sie die Isomorphie so(3) ∼ = su(2) mit su(n) := {X ∈ Mat(n, C) | X + X ∗ = 0, tr(X) = 0} . (c) Es bezeichne H den Schiefk¨ orper der Quaternionen q = a + bi + cj + dk mit a, b, c, d ∈ R, wobei i, j, k folgenden Relationen gen¨ ugen: ij = k = −ji , jk = i = −kj , ki = j = −ik und i2 = j 2 = k2 = −1, und die Konjugation durch q ∗ := a − bi − cj − dk erkl¨art ist (siehe auch Koecher und Remmert [KR]). Zeigen Sie, dass su(2) als Lie–Algebra isomorph ist zur Menge ImH := {q ∈ H | a = 0} der imagin¨aren Quaternionen mit dem Kommutator als Klammeroperation. Verwenden Sie dazu die Einbettung a+bi c+di H → Mat(2, C) , q → −c+di 3 a−bi . E.28 Beispiel (Parametrisierung von SO(3)) Eine Parametrisierung von SO(3) ist die folgende glatte Abbildung (mit der Vollkugel Brd = {x ∈ Rd | x ≤ r}): a1 0 −a3 a2 A : Bπ3 → SO(3), x → exp i(x) , mit i : R3 → so(3), aa2 → a3 0 −a1 3
−a2 a1
0
518
E.3. Lie–Algebren
(siehe auch (13.4.8)). Da x im Kern der Matrix i(x) liegt, ist A(x) eine Drehung um die Achse span(x). Wegen der Eigenwerte spek(x) = 0, i x , −i x ist der Drehwinkel gleich x . Da jede Drehung im R3 als Rechtsdrehung um einen Winkel im Intervall [0, π] dargestellt werden kann, ist A surjektiv. Abgesehen von der Identifikation der Antipoden auf der Kugeloberfl¨ache, das heißt i(x) = i(−x) f¨ ur x = π, ist die Abbildung injektiv. Diese Eigenschaften von A folgen auch mit der Formel von Rodrigues exp i(x) = 1l3 +
sin(x) x
i(x) +
1 2
sin(x/2) x/2
2 i(x)
x ∈ R3 \ {0} .
(E.3.3) Letztere beweist man durch Einsetzen der Formel i(x)2 = xx − x 2 1l3 , also i(x)3 = − x 2 i(x) in die Potenzreihe von exp und Sortieren in gerade und ungerade Potenzen. 3 Aus dieser Parametrisierung folgt (siehe Aufgabe 6.53), dass SO(3) diffeomorph zum reell-projektiven Raum RP(3) ∼ = S 3 /{±1l} ist. Andererseits ist nach Beispiel E.19.3 die Lie–Gruppe SU(2) diffeomorph zur Sph¨are S 3 . Wir erhalten damit eine ¨ zweifache Uberlagerung von SO(3) durch die Gruppe SU(2). E.29 Satz (SU(2) und SO(3)) Mit dem linearen Isomorphismus −ix3 −ix1 −x2 σ : R3 → su(2) , σ(x) := 12 −ix ix3 1 +x2 ist die adjungierte Darstellung Π : SU(2) → SO(3) ,
ΠU (x) = σ −1 U σ(x)U −1
U ∈ SU(2), x ∈ R3
ein surjektiver Gruppenhomomorphismus mit Kern {±1l}. Beweis: • Mit tr σ(x)σ(y) = − 12 x, y folgt f¨ ur ΠU ∈ GL(3, R) schon ΠU ∈ SO(3), denn f¨ ur x, y ∈ R3 ist ΠU (x), ΠU (y) = −2tr U σ(x)U −1 U σ(y)U −1 = −2tr σ(x)σ(y) = x, y . • Π ist ein Gruppenhomomorphismus mit {±1l} ⊆ ker(Π), denn Π−1l (x) = Π1l (x) = x und f¨ ur U, V ∈ SU(2) ist ΠU ◦ ΠV (x) = ΠU σ −1 V σ(x)V −1 = σ −1 U V σ(x)V −1 U −1 = ΠU V (x). Andererseits ist U ∈ ker(Π) genau dann, wenn U v U −1 = v f¨ ur alle v ∈ su(2). Das ist gleichbedeutend mit U v = vU f¨ ur alle v ∈ su(2), also damit, dass U Vielfaches der Eins ist. 0 −a3 a2 a1 • i : R3 → so(3) , aa2 → a3 0 −a1 ist nach (13.4.8) ein Isomorphismus 3
−a2 a1
0
der Lie–Algebren, ebenso wie σ : R3 → su(2), und daher (Aufgabe E.27.2) auch ψ := i ◦ σ −1 : su(2) → so(3).
E. Gruppentheorie
519
Damit ist die Linearisierung Te Π : su(2) → so(3) des Gruppenhomomorphismus Π bei der Identit¨at von der Form Te Π = ψ, denn unter Verwendung von v × x = i(v)x folgt Te Π(u)(x) = σ −1 uσ(x)−σ(x)u = σ −1 (u)×x = ψ(u)x u ∈ su(2), x ∈ R3 . • Π ist damit ein lokaler Diffeomorphismus 4 . Das Bild Π SU(2) ⊆ SO(3) ist damit offen und abgeschlossen zugleich. Da nach Beispiel E.19.2 die Gruppen SO(n) zusammenh¨angend sind, ist Π SU(2) = SO(3). 2
E.4
Lie–Gruppenwirkungen
Wie jede Gruppe auf einer Menge wirken kann (siehe Definition E.12), so kann auch eine topologische Gruppe auf einem topologischen Raum beziehungsweise eine Lie–Gruppe auf einer Mannigfaltigkeit wirken. Man wird aber dann Vertr¨aglichkeit der Strukturen erwarten. Im ersten Fall wird man also Stetigkeit der Gruppenwirkung, im zweiten Fall stetige Differenzierbarkeit voraussetzen. E.30 Beispiele (Lie–Gruppenwirkungen) 1. Jede Lie–Gruppe G wirkt auf sich selbst von links und von rechts (E.1.3), sowie durch die Konjugation I : G × G → G (E.1.4), das heißt durch Gruppenautomorphismen. 2. Damit wirkt sie auch auf ihrer Lie–Algebra g. Identifizieren wir diese n¨amlich mit dem Tangentialraum Te G an der Identit¨at e ∈ G, dann ist wegen Ig (e) = e (g ∈ G) die adjungierte Darstellung Adg : g → g
(g ∈ G, ξ ∈ Te G ∼ = g)
, Adg (ξ) = DIg (e) ξ
(E.4.1)
eine lineare Gruppenwirkung von G auf g. Ist die Lie–Gruppe G eine Matrixgruppe, dann ist Adg (ξ) = g ξ g −1
(g ∈ G, ξ ∈ Te G).
3. Damit wird auch auf der dualen Lie–Algebra g∗ eine Darstellung von G definiert. Die zur linearen Abbildung Adg duale Abbildung Ad∗g ist ja durch die Eigenschaft ) ∗ ∗ * Adg (ξ ), η = ξ ∗ , Adg (η) (η ∈ g, ξ ∗ ∈ g∗ ) festgelegt. Die Abbildung g → Ad∗g ist aber eine Rechtswirkung, w¨ahrend wir Linkswirkungen benutzen. Entsprechend ist die koadjungierte Darstellung von G auf g∗ , definiert durch Ad∗ : G → Lin(g∗ )
,
g → Ad∗g −1 ,
(E.4.2)
eine Linkswirkung. 4 Also analog zu Definition 2.36 jeder Punkt x ∈ SU(2) eine Umgebung U besitzt, so dass x ΠUx ein Diffeomorphismus auf Π(Ux ) ist.
520
E.4. Lie–Gruppenwirkungen
Abbildung E.4.1: Links und Mitte: Orbits der Linkswirkung einer einparametrigen Untergruppe in SO(3), Rechts: Rechtswirkung der gleichen Untergruppe (beachte die umgekehrte Torsion der Orbits). Darstellung in der Kugel-Parametrisierung von SO(3) aus Beispiel E.28, Seite 517. 4. Auch die in diesem Buch behandelten differenzierbaren dynamischen Systeme sind Lie–Gruppenwirkungen (n¨amlich der Lie–Gruppen Z oder R, siehe Definition 2.43). 3 E.31 Aufgabe (adjungierte Darstellung) Zeigen Sie, dass f¨ ur G = SO(3) und mit der Identifikation (13.4.8) von so(3) mit R3 die adjungierte Darstellung der 3 Drehmatrix O ∈ SO(3) die Form AdO (ξ) = O ξ besitzt. Das Besondere, mit der Differenzierbarkeit der Wirkung einhergehende Element der Lie–Gruppenwirkungen Φ : G × M → M im Vergleich zu anderen Gruppenwirkungen ist die folgende Beziehung zwischen der Lie–Algebra g und Vektorfeldern auf der Mannigfaltigkeit M . E.32 Definition F¨ ur eine Lie–Gruppenwirkung Φ : G × M → M und ξ ∈ g heißt das Vektorfeld auf M d Xξ : M → T M , Xξ (m) := Φ exp(tξ), m dt t=0 der infinitesimale Erzeuger der von ξ erzeugten Gruppenwirkung. F¨ ur die Linkswirkung Φ : G × G → G, Φg (h) = g ◦ h erhalten wir damit die rechts–invarianten Vektorfelder 0 0 0 auf G. In Abbildung E.4.1 sieht man als Beispiel Orbits der von ξ = 0 0 −1 ∈ so(3) erzeugten Linkswirkung; das Vektorfeld 01 0
Xξ : SO(3) → T SO(3) ist zu diesen Orbits tangential. Es ist nicht erstaunlich, dass die adjungierte Darstellung sich mit Lie–Klammer und Exponentialabbildung vertr¨agt: E.33 Satz F¨ ur jede Lie–Gruppe G mit Lie–Algebra g und alle ξ, η ∈ g gilt (g ∈ G) Adg [ξ, η] = Adg ξ , Adg ξ , exp Adg (ξ) = g ◦ exp(ξ) ◦ g −1
E. Gruppentheorie
521 d Adexp(tξ) (η) t=0 = [ξ, η] . dt
und
(E.4.3)
¨ E.34 Aufgabe (adjungierte Wirkung) Uberpr¨ ufen Sie diese Formeln f¨ ur die Lie–Gruppe GL(n, R) und deren Lie–Algebra Mat(n, R) (und damit f¨ ur alle Matrix–Lie–Gruppen G ≤ GL(n, R)). 3 Die Identit¨at (E.4.3) f¨ uhrt zur Definition der linearen ad–Operatoren d Adexp(tξ) t=0 : g → g , η → [ξ, η]. (E.4.4) dt Diese sind also die infinitesimalen Erzeugenden der adjungierten Darstellung. adξ :=
E.35 Definition • Eine stetige Abbildung f : M → N zwischen topologischen R¨aumen heißt eigentlich (englisch: proper), wenn die Urbilder kompakter Mengen kompakt sind. • Eine stetige Gruppenwirkung Φ : G × M → M einer topologischen Gruppe G heißt eigentlich, wenn die Abbildung G×M → M ×M, (g, m) → m, Φ(g, m) eigentlich ist. Oft betrachtet man den Raum der Orbits einer Lie–Gruppenwirkung, und manchmal kann man diesen als Mannigfaltigkeit auffassen. E.36 Satz (Mannigfaltigkeit von Orbits) Ist ψ : G × M → M eine freie eigentliche Gruppenwirkung der Lie–Gruppe G auf einer Mannigfaltigkeit M , dann besitzt der Quotientenraum B := M/G = {O(m) | m ∈ M } die differenzierbare Struktur einer Mannigfaltigkeit, und die Abbildung π:M →B
,
x → O(x),
die den Punkten von M die sie enthaltenden Orbits zuordnet, ist eine surjektive Submersion (siehe Seite 468). Beweis: Dies ist Proposition 4.1.23 in Abraham und Marsden [AM].
2
Zun¨achst kann B immer mit der Quotiententopologie aus Beispiel A.2.4 versehen werden. Man kann, wie die folgenden Beispiele zeigen, aber die Forderungen nach Freiheit und Eigentlichkeit der Gruppenwirkung nicht einfach weglassen: E.37 Aufgaben (Lie–Gruppenwirkungen) 1. Zeigen Sie, dass f¨ ur n ∈ N \ {1} die Abbildung Φ : SO(n) × Rn → Rn , (O, m) → Om eine eigentliche, aber nicht freie Lie–Gruppenwirkung der Drehgruppe SO(n) ist, und dass B = Rn /SO(n) keine (unberandete) Mannigfaltigkeit ist. t 0 x 2. Zeigen Sie, dass die Abbildung Φ : R × M → M, (t, m) → e0 e−t auf M := R2 \{0} eine freie, aber nicht eigentliche Lie–Gruppenwirkung von (R, +) ist, und dass B kein Hausdorff–Raum ist. 3
Anhang F
Bu ¨ndel, Zusammenhang, Kru ¨mmung F.1 F.2 F.3 F.4
F.1
Faserbundel ¨ . . . . . . . . . . . . . . . . . ¨ Zusammenhange auf Faserbundeln ¨ . . . . Distributionen und der Satz von Frobenius Holonomie und Krummung ¨ . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. 522 . 526 . 532 . 534
Faserb¨ undel
Das kartesische Produkt E := B × F zweier Mannigfaltigkeiten ist selbst eine Mannigfaltigkeit. Bezeichnen wir mit π : E → B (b, f ) → b die Projektion auf den ersten Faktor, dann ist (E, B, F, π) ein Beispiel f¨ ur ein sogenanntes Faserb¨ undel. F.1 Definition • Es seien E, B und F topologische Hausdorff–R¨aume und π : E → B eine stetige surjektive Abbildung. Dann heißt (E, B, F, π) (topologisches) Faserb¨ undel mit Totalraum E, Basis B und ( Standard-) Faser F (siehe nebenstehende Abbildung), wenn die Projektion π lokal trivial ist, d.h. f¨ ur alle b ∈ B eine offene Umgebung U ⊆ B und ein Hom¨oomorphismus Φ : π −1 (U ) → U × F existiert mit Φ π −1 (b ) = {b } × F (b ∈ U ).
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 23,
522
F. B¨ undel, Zusammenhang, Kr¨ ummung
523
• F¨ ur ein Faserb¨ undel (E, B, F, π) heißt eine Familie (Ui , Φ7 i )i∈I von solchen offenen Mengen Ui ⊆ B und Hom¨oomorphismen Φi mit i∈I Ui = B eine lokale Trivialisierung des Faserb¨ undels. • Analog spricht man (f¨ ur r ∈ N oder r = ∞) von einem C r –Faserb¨ undel, wenn Totalraum E, Basis B und Faser F jeweils C r –Mannigfaltigkeiten und C r –Abbildungen sind. π sowie die Φ±1 i • Eine stetige (bzw. C r –) Abbildung S : B → E heißt Schnitt, wenn gilt: π ◦ S = IdB . F.2 Bemerkungen 1. Statt der etwas umst¨andlichen Benennung (E, B, F, π) findet man oft die Schreibweise π : E → B oder – pars pro toto – E. Die Fasern π−1 (b) ∼ = F schreibt man auch Eb . 2. Im einleitenden Beispiel eines Produktb¨ undels ist (U, Φ) := (B, IdE ) eine lokale Trivialisierung. Solche B¨ undel nennt man trivial. Beispielsweise sind die parallelisierbaren Tangentialb¨ undel (siehe Definition A.43) trivial. 3 F.3 Beispiele (Eindimensionale B¨ undel) 1. Ein einfaches Beispiel f¨ ur ein undel ist E := S 1 ⊂ R2 , B := RP(1) (der einnicht triviales C ∞ –Faserb¨ dimensionale reell–projektive Raum aller Ursprungsgeraden im R2 , siehe Definition 6.50) und die Abbildung π : E → B, die jedem Punkt x ∈ S 1 der Kreislinie die durch ihn gehende Ursprungsgerade zuordnet. Hier ist die Standardfaser F := {−1, +1} zweielementig, aber der Totalraum E ist zusammenh¨angend, also nicht hom¨ oomorph zu B × F . Eine lokale Trivialisierung ist z.B. (Ui , Φi )i∈I mit Indexmenge I := {1, 2} und Ui := span(x) | x ∈ S 1 ⊂ R2 , xi > 0 , Φi : π−1 (Ui ) → B × F
,
x → span(x), sign(xi ) .
Verallgemeinert erhalten wir f¨ ur n ∈ N ein nicht triviales Faserb¨ undel mit Faser F = {−1, +1} π : S n → RP(n). 2. Ein weiteres Beispiel f¨ ur ein C ∞ –Faserb¨ undel ist die Abwicklung der Gerade auf der Kreislinie, mit Totalraum E := R, Basis B := S 1 ⊂ C, Projektion π : E → B, x → exp(2πix) und Standardfaser F := Z. 3 Ist, wie in den vorigen Beispielen, die Standardfaser F ein diskreter topologischer ¨ Raum, dann nennt man das Faserb¨ undel eine Uberlagerung.
524
F.1. Faserb¨ undel
Hauptfaserb¨ undel und Vektorb¨ undel Oft besitzen die Faserb¨ undel Fasern mit Zusatzstrukturen. F.4 Definition Ist die Standardfaser F des Faserb¨ undels (E, B, F, π) eine topologische Gruppe und gibt es eine stetige (Rechts–) Wirkung Ψ:E×F →E
, Ψf (e) := Ψ(e, f ),
die die Fasern invariant l¨asst (das heißt f¨ ur alle f ∈ F : π ◦ Ψf = π) und auf ihnen frei und transitiv wirkt, heißt (E, B, F, π) Hauptfaserb¨ undel oder Prinzipalb¨ undel mit Strukturgruppe F . F.5 Bemerkung Da nach Annahme f¨ ur je zwei Punkte e1 , e2 ∈ E, die in einer Faser liegen (π(e1 ) = π(e2 )) genau ein Gruppenelement f ∈ F existiert mit Ψ(e1 , f ) = e2 , ist der Raum E/F der Orbits der Gruppenwirkung tats¨achlich hom¨oomorph zur Basis B. Sind die topologischen R¨aume differenzierbare Mannigfaltigkeiten, nimmt man an, dass F eine Lie–Gruppe ist. Oft entstehen Hauptfaserb¨ undel umgekehrt durch eine freie eigentliche Gruppenwirkung Ψ einer Gruppe G auf einem Raum E. Spezialisiert auf Mannigfaltigkeiten kann dann der Satz E.36 benutzt werden, um die Basismannigfaltigkeit B := E/G zu definieren. 3 Ein Beispiel f¨ ur eine solche Gruppenwirkung ist die von G = S 1 auf die Energiefl¨ache E := S 2d−1 ⊂ R2d des harmonischen Oszillators mit d Freiheitsgraden, siehe Satz 6.35. undels f¨ ur alle Punkte b ∈ B der Obwohl die Fasern Eb eines Hauptfaserb¨ Basis hom¨oomorph zur topologischen Gruppe F sind, gibt es im Allgemeinen keine stetige Vorschrift, je zwei Punkte einer Faser miteinander zu verkn¨ upfen. F.6 Beispiel (Einheitstangentialb¨ undel) F¨ ur die n–Sph¨are B := S n bezeichnet E := {(x, y) ∈ S n × Rn+1 | x, y = 0, y = 1} das Einheitstangentialb¨ undel, mit Projektion π : E → B, (x, y) → x und Faser ur n = 2 ist F eine (Lie–) Gruppe, und diese wirkt durch F = S n−1 . Etwa f¨ Drehung des Einheitstangentialvektors y um die x–Achse. Die Existenz einer stetig definierten Gruppenmultiplikation in den Fasern w¨ urde in jeder Faser ein Element auszeichnen (das neutrale Element), sodass wir einen Schnitt B → E erhalten w¨ urden. Dieser existiert aber nicht (siehe Beispiel A.44.2). 3 F.7 Aufgabe (Trivialit¨ at von Hauptfaserb¨ undeln) Beweisen Sie, dass ein Hauptfaserb¨ undel (E, B, F, π) genau dann trivial ist, wenn es einen Schnitt B → E besitzt. 3 Die Vektorb¨ undel sind ein anderer Typ von B¨ undeln. Bei ihnen ist die typische Faser F ein Vektorraum. Zum Beispiel sind f¨ ur das in Anhang A.3 behandelte Tangentialb¨ undel E := T B einer Mannigfaltigkeit B die Fasern Eb = Tb B reelle Vektorr¨aume der Dimension dim(B).
F. B¨ undel, Zusammenhang, Kr¨ ummung
525
F.8 Bemerkung (Nullschnitt) Zwar sind bei einem Vektorb¨ undel die Fasern als Vektorr¨aume insbesondere (additive) Gruppen, aber es gibt im Allgemeinen keine Gruppenwirkung von F auf E. Denn dann w¨aren nach Aufgabe F.7 Vektorb¨ undel immer trivial, wegen der Existenz des Nullschnittes B → E, b → 0 ∈ Eb . undel im Wie im Beispiel A.44.2 des Tangentialb¨ undels T S 2 sind aber Vektorb¨ Allgemeinen nicht trivial. 3 Daher ist die Definition von Vektorb¨ undeln auch kein Spezialfall der Definition von Prinzipalb¨ undeln. F.9 Definition Ein Faserb¨ undel (E, B, F, π), bei dem die Standardfaser F ein topologischer Vektorraum ist, wird Vektorb¨ undel (oder Vektorraumb¨ undel) genannt, wenn die lokale Trivialisierung (Ui , Φi )i∈I f¨ ur je zwei u ¨berlappende ¨ Gebiete Ui , Uj ⊆ B mit Ui,j := Ui ∩ Uj = ∅ sich mittels stetiger Ubergangsfunktionen ti,j : Ui,j → GL(F ) in der Form Φi ◦ Φ−1 , (b, f ) −→ b, ti,j (b)f j : Ui,j × F −→ Ui,j × F schreiben l¨asst. Der Rang des Vektorb¨ undels ist die Dimension der Standardfaser F . Wir betrachten in diesem Buch nur Vektorb¨ undel, deren Standardfaser ein K– Vektorraum mit K = R oder C ist. ¨ Dass der Ubergang zwischen B¨ undelkarten durch invertierbare lineare Abbildungen erfolgt, stellt sicher, dass die Vektorraumstruktur der Fasern Eb kartenunabh¨angig definiert ist. Faserweise k¨onnen mit Vektorb¨ undeln die u ¨blichen Operationen der linearen Algebra durchgef¨ uhrt werden, etwa die Bildung des Faktorraums nach einem Unterraum. F.10 Beispiel (Normalenb¨ undel) Eine andere Klasse von Vektorraumb¨ undeln wird durch die Normalenb¨ undel TM N/T M 7 von Untermannigfaltigkeiten M ⊆ N gebildet (mit TM N := m∈M Tm N ). Besitzt N eine riemannsche Metrik, ist dieses (algebraische) Normalenb¨ undel kanonisch isomorph zum geometrischen Normalenb¨ undel T M ⊥ , das aus allen lokal auf M senkrecht stehenden Tangentialvektoren von N besteht. Etwa f¨ ur M := S n ⊆ Rn+1 ist T M = (x, y) ∈ Rn+1 × Rn+1 | x = 1, y, x = 0 , also T M ⊥ = (x, y) ∈ Rn+1 × Rn+1 | x = 1, y = kx f¨ ur ein k ∈ R .
3
526
F.2. Zusammenh¨ange auf Faserb¨ undeln
F.11 Bemerkung (Whitney–Summe) Wendet man auf zwei Vektorb¨ undel π (i) : E (i) → B u ¨ber der gleichen Basis B faserweise die direkte Summe (1) (2) (E (1) ⊕ E (2) )b := Eb ⊕ Eb an, erh¨alt man die direkte Summe π : E (1) ⊕ E (2) → B der Vektorb¨ undel. Dieses Vektorb¨ undel wird auch Whitney–Summe genannt. undel T M ⊥ einer UnterSo ist etwa T M ⊕ T M ⊥ ∼ = TM N , mit dem Normalenb¨ mannigfaltigkeit M ⊆ N aus Beispiel F.10. 3
Orientierung von Vektorb¨ undeln Auch der Begriff der Orientierung eines n ∈ N–dimensionalen R–Vektorraums V u undel: ¨bertr¨agt sich auf Vektorb¨ Die Menge der Basen (e1 , . . . , en ) von V wird durch die allgemeine lineare Gruppe GL(V ) (siehe Beispiel E.18) parametrisiert, denn f¨ ur eine zweite Basis (f1 , . . . , fn ) gibt es genau ein A ∈ GL(V ) mit fk = A(ek ) (k = 1, . . . , n), und umgekehrt ist das Bild einer Basis unter A ∈ GL(V ) wieder eine Basis. ¨ Sie zerf¨allt damit in genau zwei Aquivalenzklassen durch die Untergruppe GL+ (V ) ineinander transformierter Basen. Diese heißen die Orientierungen von V . Etwa f¨ ur R2 sind die Basen (e1 , e2 ) beziehungsweise (e2 , e1 ) Repr¨asentanten, n ¨ von (e1 , . . . , en ) die Standardorientierung. und f¨ ur R heißt die Aquivalenzklasse Um auch den Vektorraum R0 = {0} mit ins Boot zu nehmen, f¨ ugt man ihm die Zahl 1 (Standardorientierung ) oder -1 als Orientierungen zu. F.12 Definition Ein Vektorb¨ undel (E, B, F, π) mit endlich-dimensionalem R– Vektorraum F als Standardfaser heißt • orientiert, wenn den Fasern Fb (b ∈ B) Orientierungen zugeordnet werden, die in den lokalen Trivialisierungen (siehe Definition F.1) konstant sind. • Es heißt orientierbar, wenn es in diesem Sinn orientiert werden kann. Eine Mannigfaltigkeit M heißt orientierbar beziehungsweise orientiert, wenn ihr Tangentialb¨ undel T M orientierbar bzw. orientiert ist. In diesem Sinn sind das M¨ obius–Band oder die reell-projektiven R¨aume RP(2k) gerader Dimension nicht orientierbar, die RP(2k + 1) aber schon.
F.2
Zusammenh¨ ange auf Faserb¨ undeln
Wir betrachten in diesem Abschnitt C r –Faserb¨ undel π : E → B.
F. B¨ undel, Zusammenhang, Kr¨ ummung
527
Die Linearisierung der Projektion π ist die Abbildung Tπ : TE → TB vom Tangentialb¨ undel des Totalraums E auf das Tangentialb¨ undel der Basis B. F¨ ur einen beliebigen Punkt e ∈ E in der Faser Eb u ¨ber b := π(e) ist die induzierte Abbildung Te E → Tb B der Tangentialr¨aume linear und surjektiv. Ihr Kern Ve ⊂ Te E besitzt die Dimension dim(Ve ) = dim(F ) der Standardfaser. In der Tat ist Ve = Te Eb . ur den vertikaDie Bezeichnung Ve steht f¨ len Unterraum Te Eb ⊂ Te E, und V → E heißt vertikales B¨ undel, siehe nebenstehende Abbildung. F.13 Definition • Ein (Ehresmann)–Zusammenhang auf dem Faserb¨ undel (E, B, F, π) ist ein glattes Unterb¨ undel H des Tangentialb¨ undels T E → E mit Whitney–Summe H ⊕ V = T E. • H wird horizontales B¨ undel genannt. F¨ ur jeden Punkt e ∈ E erg¨anzt also der horizontale Unterraum He ⊂ Te E den vertikalen Unterraum Ve ⊂ Te E so, dass He ⊕ Ve = Te E gilt, und die Restriktion der linearen Abbildung Te π : Te E → Tb B auf He ein Isomorphismus ist. F.14 Bemerkung Unterr¨aume eines Vektorraums k¨onnen wir als Kerne (oder als Bilder) linearer Abbildungen erhalten. Angewandt auf ein Faserb¨ undel (E, B, F, π) wurden schon die vertikalen Unterr¨aume so dargestellt. F¨ ur einen Ehresmann–Zusammenhang H auf dem Faserb¨ undel wird jeder Tangentialvektor Xe ∈ Te E am Punkt e ∈ E des Totalraums eindeutig in seine vertikale beziehungsweise horizontale Komponente vere (X) ∈ Ve , hore (Xe ) ∈ He zerlegt: Xe = vere (Xe ) + hore (Xe ).
(F.2.1)
Entsprechend besitzt ein Vektorfeld X : E → T E die Komponenten ver(X) : E → V
und hor(X) : E → H.
Umgekehrt definiert eine faserweise lineare Abbildung ω : TE → V
, Te E → Ve
genau dann einen Ehresmann–Zusammenhang, wenn die linearen Abbildungen ωe : Te E → Ve Projektionen auf den Vertikalraum Ve sind, das heißt ωe ◦ωe = ωe und ωe (Te E) = Ve gilt. 3
528
F.2. Zusammenh¨ange auf Faserb¨ undeln
Abbildung F.2.1: Zwei verschiedene Zusammenh¨ange auf dem gleichen B¨ undel
F.15 Beispiel (Produkt–Zusammenhang) F¨ ur ein triviales B¨ undel π : E → B mit E = B × F ist der Produkt–Zusammenhang durch den Kern von T π2 gegeben, mit der Projektion π2 : E → F
, (b, f ) → f
auf die Standardfaser, siehe nebenstehende Abbildung. 3 Im Gegensatz zu V ist aber H nicht durch das B¨ undel selbst definiert, und es gibt dementsprechend viele Zusammenh¨ange auf einem Faserb¨ undel π : E → B (siehe Abbildung F.2.1).
F.16 Definition Es sei I ⊆ R ein Intervall und c ∈ C 1 (I, B) eine Kurve in der undels π : E → B. Basis B eines C 1 –Faserb¨ • Eine Kurve c˜ ∈ C 1 (I, E) wird Lift von c genannt, wenn gilt: c = c˜ ◦ π. • F¨ ur einen Zusammenhang H auf dem Faserb¨ undel wird ein Lift c˜ von c horizontal genannt, wenn die Geschwindigkeit c˜ horizontal ist, das heißt c˜ (t) ∈ Hc˜(t) ⊂ Tc˜(t) E
(t ∈ I).
F¨ ur jeden Zeitpunkt t ∈ I und jeden Punkt e ∈ Ec(t) gibt es einen eindeutigen Vektor ft (e) ∈ He , der unter der linearisierten Projektion T π auf c (t) projiziert.
F. B¨ undel, Zusammenhang, Kr¨ ummung
529
Der Satz von Picard–Lindel¨ of (Satz 3.17) garantiert nun, dass das Anfangswertproblem (F.2.2) c˜ (t) = ft c˜(t) , c˜(t0 ) = e0 f¨ ur alle t0 ∈ I und e0 ∈ Eb(t0 ) in einer in I offenen Umgebung von t0 eindeutig l¨osbar ist. Oft (zum Beispiel wenn die Standardfaser kompakt ist), gibt es sogar eine eindeutige L¨ osung von (F.2.2) auf I. Zusammenh¨ ange auf Hauptfaserb¨ undeln und Vektorb¨ undeln F¨ ur Prinzipal– beziehungsweise Vektorb¨ undel gibt es besondere – der Gruppen– bzw. Vektorraumstruktur angepasste – Typen von Zusammenh¨angen. Wir schauen uns zun¨achst den Fall der Hauptfaserb¨ undel (E, B, F, π) an, bei der die Lie–Gruppe F auf dem Totalraum E als Gruppe von fasererhaltenden Diffeomorphismen Ψf wirkt. F.17 Definition Ein Ehresmann–Zusammenhang H auf dem Hauptfaserb¨ undel heißt F –Zusammenhang, wenn f¨ ur die linearisierte Gruppenwirkung T Ψf : T E → T E
(f ∈ F )
gilt: Te Ψf (He ) = HΨf (e)
(e ∈ E, f ∈ F ),
die Gruppenwirkung also den Zusammenhang H invariant l¨asst. Beispielsweise l¨asst sich das Faserb¨ undel π : E → B in Abbildung F.2.1 als Hauptfaserb¨ undel mit Gruppe F = S 1 interpretieren. Dann ist nur der links dargestellte Zusammenhang ein F -Zusammenhang. Da auf Hauptfaserb¨ undeln fast nur solche F –Zusammenh¨ange benutzt werden, l¨asst man oft das ,F ’ weg. Bezeichnen wir die Lie–Algebra der Lie–Gruppe F mit f, dann ist f¨ ur alle Vektoren f ∈ f d Xf : E → T E , Xf (e) = Ψ e, exp(tf ) dt t=0 ein vertikales Vektorfeld, das heißt Xf (e) ∈ Ve . Da bei einem Hauptfaserb¨ undel die Lie–Gruppe F frei und transitiv wirkt, sind die linearen Abbildungen f → Ve
,
f → Xf (e)
(e ∈ E)
sogar bijektiv. Die in Bemerkung F.14 eingef¨ uhrte, den Ehresmann–Zusammenhang H darstellende Abbildung ω : T E → V k¨onnen wir also als f–wertige ur die gilt: Eins–Form ω ∈ Ω1 (E, f) auffassen, f¨ ω(Xf ) = f
(f ∈ f).
(F.2.3)
530
F.2. Zusammenh¨ange auf Faserb¨ undeln
F.18 Satz Der durch ein ω ∈ Ω1 (E, f) mit (F.2.3) definierte Ehresmann–Zusammenhang ist genau dann ein F –Zusammenhang, wenn mit der adjungierten Darstellung ad von F in f gilt: adf Ψ∗f ω = ω
(f ∈ F )
(F.2.4)
Beweis: Siehe Kobayashi und Nomizu [KN], Kapitel II, Proposition 1.1. 2 F.19 Bemerkung Im f¨ ur unsere Anwendungen wichtigen Fall einer abelschen Lie–Gruppe F (zum Beispiel eines Torus) ist adf = Idf , also ω nach (F.2.4) einfach invariant unter der Gruppenwirkung. 3 Um lineare Zusammenh¨ange auf Vektorb¨ undeln (E, B, F, π) einzuf¨ uhren, benutzen wir die beiden folgenden glatten Abbildungen. - Die faserweise Skalarmultiplikation mit k ∈ K Mk : E → E
e → k e
,
(k ∈ K),
- die faserweise Vektoraddition auf der Whitney–Summe E ⊕ E: A:E⊕E →E
,
(e1 , e2 ) → e1 + e2 .
F.20 Definition Ein (Ehresmann–) Zusammenhang H auf einem differenzierbaren Vektorb¨ undel (E, B, F, π) heißt linear, wenn sich die horizontalen Unterr¨aume wie folgt transformieren: (e ∈ E, k ∈ K) 2. T(e1 ,e2 ) A (He1 , He2 ) = He1 +e2 (e1 , e2 ) ∈ E ⊕ E .
1. Te Mk (He ) = Hke
Ein linearer Zusammenhang ist in Abbildung F.2.2 (links) dargestellt, ein (translationsinvarianter) F –Zusammenhang rechts. Die meisten in Anwendungen vorkommenden Zusammenh¨ange auf Vektorb¨ undeln sind linear. F.21 Bemerkung (Existenz von Zusammenh¨ angen) F¨ ur ein differenzierbares Faserb¨ undel (E, B, F, π) existieren Zusammenh¨ange (und auch F –Zusammenh¨ange beziehungsweise lineare Zusammenh¨ange). Denn f¨ ur den Fall eines trivialen B¨ undels mit E = B × F und Projektion π2 : E → F
,
(b, f ) → f
auf die Standardfaser erf¨ ullt der triviale Zusammenhang H alle geforderten Eigenschaften. ¨ Sonst besitzt B eine der Uberdeckung (Ui )i∈I angepasste Zerlegung
der Eins (siehe Def. A.13), d.h. χi ∈ C(B, [0, 1]) mit supp(χi ) ⊂ Ui und i∈I χi = 1. F¨ ur einen beliebigen Punkt e ∈ E des Totalraums mit Projektion b := π(e) benutzen wir die linearisierte Projektion Te π : Te E → Tb B.
F. B¨ undel, Zusammenhang, Kr¨ ummung
531
E
E e
B
e
B
Abbildung F.2.2: Linearer (links) und nicht linearer (rechts) Zusammenhang auf einem Vektorb¨ undel π : E → B
ur alle Indices i ∈ I mit b ∈ Ui der triviale Zusammenhang Ist y ∈ Tb B, dann hat f¨ Hi die Eigenschaft, dass der Horizontalraum Hi,e ⊂ Te E genau einen bez¨ uglich ber y liegenden Punkt x ∈ H besitzt. Te π u ¨ i i,e Ebenso gilt f¨ ur die (endliche!)
Konvexkombination E x := i∈I χi (b)xi , dass Te π(x) = y. Eb Damit k¨onnen wir die gesamten Horizontalr¨aume Hi,e konvex kombinieren und erB halten den horizontalen Unx1,e terraum He ⊂ Te E, siehe xe e x nebenstehende Abbildung. 3 2,e Te E V e Im Abschnitt 8.4 wurden die (mit i, j, h = 1, . . . , d indizierten) Christoffel–Symbole Konvexkombination von Zusammenh¨angen Γhi,j (x) = 12 g h,k (x)
∂gi,k ∂gi,j ∂gk,j (x) + (x) − (x) ∂xi ∂xj ∂xk
x∈U
eingef¨ uhrt. In einer Karte mit Definitionsbereich U ⊆ M sind sie Koeffizienten der geod¨atischen Gleichung (8.4.3) auf der riemannschen Mannigfaltigkeit (M, g). Dies bedeutet, dass sie einen Zusammenhang auf dem Tangentialb¨ undel π : T M → M definieren, den Levi-Civita–Zusammenhang. Die geod¨atische Bewegung ergibt sich dann durch Parallelverschiebung des Geschwindigkeitsvektors. uhrten) KoordinaBezeichnet man mit ∂ϕ1 , . . . , ∂ϕd die (auf Seite 488 eingef¨ tenvektorfelder in einer Karte (U, ϕ) von M , dann haben Vektorfelder X ∈ X (M )
d die lokale Gestalt X = k=1 Xk ∂ϕk mit Koeffizientenfunktionen Xk : U → R. ¨ Die kovariante Ableitung, das heißt die Anderung des Vektorfelds Y in Richtung von X, nimmt dann (mit einsteinscher Summenkonvention) die folgende
532
F.3. Distributionen und der Satz von Frobenius
Form an:
∇X Y = Xi ∂ϕi Yk + Γki,j Xi Yj ∂ϕk .
F.22 Satz (Hauptsatz der riemannschen Geometrie) Der lokal so definierte Levi-Civita–Zusammenhang zeichnet sich durch die folgenden Eigenschaften aus: • Er ist vertr¨aglich mit der Metrik g, d.h. LX g(Y, Z) = g(∇X Y, Z) + g(Y, ∇X Z)
X, Y, Z ∈ X (M ) ; • Er ist torsionsfrei, das heißt ∇X Y − ∇Y X = [X, Y ] X, Y ∈ X (M ) .
F.3
Distributionen und der Satz von Frobenius
Um die Kr¨ ummung eines Zusammenhangs einzuf¨ uhren, schauen wir uns zun¨achst Eigenschaften von Unterb¨ undeln des Tangentialb¨ undels an. F.23 Definition • Eine (geometrische) Distribution in einer Mannigfaltigkeit M ist ein glattes Unterb¨ undel D ⊆ T M des Tangentialb¨ undels. rang(D) ist der Rang von D als Vektorb¨ undel, also die (konstante) Dimension der Fasern Dx ⊆ Tx M (x ∈ M ). • Eine rang(D)–dimensionale Untermannigfaltigkeit N ⊆ M heißt Integralmannigfaltigkeit von D, wenn gilt: Tx N = Dx (x ∈ N ). • Eine Distribution D ⊆ T M vom Rang k heißt integrabel, wenn jeder Punkt x ∈ M in einer Integralmannigfaltigkeit von D liegt. • Sie heißt involutiv, wenn der Kommutator [X, Y ] zweier zu D tangentialer Vektorfelder X, Y ∈ X (M ) ebenfalls zu D tangential ist. Einen k–dimensionalen Unterraum eines m–dimensionalen Vektorraums kann man als gemeinsame Nullstellenmenge von m − k linear unabh¨angigen Line¨ arformen beschreiben. Ahnlich kann jede Distribution vom Rang k lokal (also in geeigneten Umgebungen U ⊂ M der x ∈ M ) durch den Schnitt der Kerne unabh¨angiger Eins–Formen ω1 , . . . , ωm−k ∈ Ω1 (U ) beschrieben werden. F.24 Bemerkung (Existenz von Distributionen) • Auf einer Mannigfaltigkeit M braucht es gar keine Distribution vom Rang k zu geben. Ein Beispiel ist die Sph¨are M = S 2 und k = 1. Dies beweist man ¨ahnlich wie den Satz vom Igel (Beispiel A.44.2). • Auch wenn es auf M eine Distribution vom Rang k gibt, braucht sie nicht global als Schnitt der Kerne unabh¨angiger Eins–Formen darstellbar sein. Ein Beispiel ist M = S 2 und k = 0, also eine ziemlich triviale Distribution. Wie gerade bemerkt, gibt es keine Eins–Form auf S 2 , die nirgendwo verschwindet. 3
F. B¨ undel, Zusammenhang, Kr¨ ummung
533
f
f
b2
b1 b2
b1
Abbildung F.3.1: Integrable (links) und nicht integrable (rechts) Distribution auf dem B¨ undel π : R3 → R2
F.25 Satz (Frobenius) Es sei E ⊆ T M eine geometrische Distribution vom Rang k auf der m–dimensionalen Mannigfaltigkeit M . Dann sind die folgenden Bedingungen ¨aquivalent: 1. E ist integrabel; 2. E ist involutiv; ¨ 3. Es gibt eine Uberdeckung von M mit Umgebungen U ⊆ M , so dass f¨ ur eine lokale Darstellung E ∩ T U = {v ∈ T U | ω1 (v) = . . . = ωm−k (v) = 0} der Distribution durch ω1 , . . . , ωm−k ∈ Ω1 (U ) weitere Eins–Formen θi,j ∈ Ω1 (U ) existieren mit
m−k dωi = j=1 θi,j ∧ ωj (i = 1, . . . , m − k). 4. Mit den Bezeichnungen von 3. ist dωi ∧ω1 ∧. . .∧ωm−k = 0 (i = 1, . . . , m−k). Den Beweis findet man in Kapitel 4.1 des Buches [AF] von Agricola und Friedrich. 2 F.26 Beispiele (Integrabilit¨ at geometrischer Distributionen) 1. Distributionen D ⊆ T M vom Rang Eins sind integrabel. Dies folgt aus dem Hauptsatz der Differentialgleichungstheorie (Satz 3.45), denn wir k¨onnen in einer geeigneten Umgebung U ⊆ M jedes Punktes ein nicht verschwindendes glattes Tangentialvektorfeld X ∈ X (U ) finden, das tangential zur Distribution ist. Dessen Orbits sind Integralmannigfaltigkeiten von D. 2. Die Kontaktdistributionen aus Bemerkung 10.11 sind dagegen nicht integrabel. Denn eine Kontaktform ω ∈ Ω1 (M ) auf einer (2n + 1)–dimensionalen Mannigfaltigkeit M erzeugt nach Definition eine Volumenform ω ∧ (dω)∧n .
534
F.4. Holonomie und Kr¨ ummung
Dies widerspricht aber der Bedingung 3 im Satz von Frobenius (dω = θ ∧ ω), aus der wegen Antisymmetrie ω ∧ dω = 0 folgt. 3. Ein (Ehresmann–) Zusammenhang auf einem Faserb¨ undel (Definition F.13) ist eine spezielle Distribution. Deren Mangel an Integrabilit¨at f¨ uhrt zum Begriff der Kr¨ ummung, und damit zum Zentrum der Differentialgeometrie. 3
F.4
Holonomie und Kr¨ ummung
Wir nehmen einfachheitshalber an, dass im betrachteten B¨ undel (E, B, F, π) mit Zusammenhang H Kurven c ∈ C 1 (I, B) in der Basis B beliebig horizontal geliftet ur st¨ uckweise stetig differenzierbare werden k¨onnen1 (das Gleiche gilt dann auch f¨ Kurven). Es sei I das Intervall [0, 1] und c geschlossen (c(1) = c(0) = b). Bezeichnet die Kurve c˜e : I → E den horizontalen Lift von c mit Anfangspunkt c˜e (0) = e ∈ Eb , dann braucht c˜e (1) ∈ Eb nicht gleich e zu sein (siehe nebenstehende Abbildung). Immerhin wird die Faser Eb u ¨ber dem Anfangspunkt b von c durch die Abbildung
E
B
e
cˆ : Eb → Eb
, e → c˜e (1)
hom¨oomorph auf sich abgebildet.
b Holonomie eines Zusammenhangs
F.27 Definition F¨ ur b ∈ B heißt Hol(b) := cˆ : Eb → Eb | c ∈ C 1 (I, B), c(0) = c(1) = b die Holonomiegruppe von b. F.28 Bemerkungen 1. Tats¨achlich ist Hol(b) eine Gruppe, denn f¨ ur zwei solche Wege c1 , c2 : I → B k¨ onnen wir den zusammengesetzten Weg c1 ∗c2 : I → B mit , t ∈ 0, 12 c2 (2t) c1 ∗ c2 (t) := (F.4.1) c1 (2t − 1) , t ∈ 12 , 1 horizontal liften, was der Komposition von cˆ1 und cˆ2 entspricht.2 Ebenso ist die Existenz der Inversen von cˆ durch (ˆ c)−1 = (c−1 )∧ mit c−1 (t) := c(1 − t) sichergestellt. 1 Manchmal wird diese – f¨ ur kompakte F immer erf¨ ullte – Eigenschaft gleich zur Definition ´r ˘, Michor, und des Zusammenhangs hinzugef¨ ugt. Siehe zum Beispiel Kapitel 9.9 von Kola ´k [KMS]. Slova 2 c ∗ c ist zwar im Allgemeinen nur st¨ uckweise stetig differenzierbar. Wir k¨ onnen aber 1 2 durch Umparametrisierung erreichen, dass c2 (1) = c1 (0) = 0 ist. Diese Umparametrisierung andert weder cˆ1 noch cˆ2 . ¨
F. B¨ undel, Zusammenhang, Kr¨ ummung
535
2. Ist die Basismannigfaltigkeit B zusammenh¨angend, dann sind alle Gruppen Hol(b) (b ∈ B) zueinander isomorph, denn f¨ ur b0 , b1 ∈ B gibt es eine Kurve d ∈ C 1 (I, B) mit d(0) = b0 , d(1) = b1 . Besitzt c1 ∈ C 1 (I, B) Anfangs– und Endpunkt b1 , dann ist die (analog zu (F.4.1) definierte) Kurve c0 := d−1 ∗c1 ∗d eine bei b0 basierte Schleife. Die Abbildung Hol(b1 ) → Hol(b0 ), cˆ1 → cˆ0 ist dann ein Gruppenisomorphismus. 3 F.29 Beispiel (Dreiachsenstabilisierung) Ohne Verwendung von Steuerd¨ usen k¨onnen Raumflugk¨ orper ihren Drehimpuls nicht ver¨andern. Dieser ist im Normalfall sehr klein, so dass die Lage im Raum n¨aherungsweise konstant bleibt. Um diese Lage zu ver¨andern, werden Reaktionsr¨ader eingesetzt, bei der sogenannten Dreiachsenstabilisation mit drei aufeinander orthogonalen Achsen (siehe auch den Kasten auf Seite 356). Beschreibt der Winkel θ ∈ B := S 1 die aktuelle Lage eines solchen Rades relativ zum Satelliten, dann bilden die Lagen von Satellit und Rad im Raum einen undels Punkt (ϕS , ϕR ) ∈ E := T2 des Torus. Wir fassen E als Totalraum des B¨ π : E → B auf, mit Projektion θ = π(ϕS , ϕR ) := ϕR − ϕS . Sind die Tr¨agheitsmomente von Satellit beziehungsweise Rad um die Radachse IS , IR > 0 (siehe Seite 295), dann ist der Gesamtdrehimpuls um diese Achse gleich IS ϕ˙ S + IR ϕ˙ R . Drehimpulserhaltung bedeutet also geometrisch den durch die Eins–Form IS dϕS + IR dϕR = (IS + IR ) dϕS + IR dθ definierten, auf Seite 534 abgebildeten Zusammenhang auf E. Die Holonomie f¨ ur die Drehung des Rades um Δθ = 2π betr¨agt also, gemes3 sen in der Lage¨anderung des Satelliten, ΔϕS = −2πIR /(IS + IR ). Wie dieses Beispiel zeigt, kann ein integrabler Zusammenhang eine nichttriviale Holonomiegruppe besitzen, wenn die Basis-Mannigfaltigkeit nicht einfach zusammenh¨angend ist. Es gibt aber auch die M¨ oglichkeit, dass die Holonomiegruppe nichttrivib2 al ist, weil der Zusammenhang nicht integrabel ist (siehe Abbildung). Die Kr¨ ummung des Zusammenhangs ist dann ein quantitatives Maß f¨ ur dessen Mangel an Integrabilit¨at. f Das Bild suggeriert, dass die Holonomie im Limes kleiner Kurvenl¨ange proportional zu der Fl¨ache ist, die von der auf die Basis projizierten Kurve eingeschlossen wird. Die folgende Definition pr¨azisiert diese Beobachtung und beb1 zeichnet den Proportionalit¨atsfaktor als Kr¨ ummung. =
F.30 Definition (Kr¨ ummung eines Zusammenhangs) Die Kr¨ ummung des Ehresmann–Zusammenhangs H ist (bez¨ uglich der Zerlegung (F.2.1) eines Vek-
536
F.4. Holonomie und Kr¨ ummung
torfeldes) die Zwei–Form K ∈ Ω2 (E, T E)
, K(X, Y ) = ver hor(X), hor(Y )
X, Y ∈ X (E) .
F.31 Bemerkungen (Kr¨ ummung als vektorwertige Zwei–Form) 1. Der so definierte Tangentialvektor K(X, Y )(e) ∈ Te E h¨angt f¨ ur einen Punkt e ∈ E nur von X(e) und Y (e) ab, K ist also tats¨achlich eine vektorwertige Zwei–Form. Das liegt daran, dass ganz allgemein auf einer Mannigfaltigkeit E Lie–Klammern von Vektorfeldern U, V ∈ X (E) bei Multiplikation mit einer Funktion f ∈ C ∞ (E, R) die Relation [U, f V ] = f [U, V ] + df (U ) V
(F.4.2)
erf¨ ullen. Das ergibt sich direkt aus Definition 10.20. Der erste Summand in (F.4.2) enth¨alt gar keine Ableitung von f . Der zweite h¨angt zwar von df ab. Ist aber V horizontal, dann auch sein Produkt mit der Funktion df (U ). Der zweite Term verschwindet also in der Projektion auf den vertikalen Teilraum. Analoges gilt f¨ ur die Multiplikation von U mit einer Funktion. 2. Die Kr¨ ummung eines F –Zusammenhangs auf einem Prinzipalb¨ undel mit abelscher Lie–Gruppe ist invariant unter Fasertranslationen (siehe Bemerkung F.19). Sie kann damit auch als eine vektorwertige Zwei–Form auf der Basismannigfaltigkeit aufgefasst werden. Das ist beispielsweise in der Elektrodynamik der Fall. Bei dieser bildet die Raumzeit R4 die Basis, und die Faser ist die abelsche Gruppe U(1). Die Kr¨ ummung setzt sich aus elektrischer und magnetischer Feldst¨arke zusammen (siehe Beispiel B.21 und Thirring [Th2]). 3
Anhang G
Morse–Theorie Morse–Theorie stellt eine Beziehung her zwischen der Topologie einer n–dimensionalen Mannigfaltigkeit M und den kritischen Punkten einer Funktion f ∈ C 2 (M, R). G.1 Definition • Ein kritischer Punkt x ∈ M von f ∈ C 2 (M, R) heißt nicht degeneriert, wenn in einer beliebigen Karte bei x die Hesse–Matrix D2 f (x) ∈ Mat(n, R) regul¨ar ist. • Der Index Ind(x) des kritischen Punktes x ∈ M von f ist als der Index 1 von D2 f (x) definiert. • f ∈ C 2 (M, R) heißt Morse–Funktion, wenn alle kritischen Punkte von f nicht degeneriert sind. Die Menge Crit(f ) ⊆ M der kritischen Punkte von f ist abgeschlossen. Ist f eine Morse–Funktion, dann ist diese kritische Menge diskret. Wir betrachten zun¨achst nur kompakte Mannigfaltigkeiten M . Auf diesen hat dann eine Morse– Funktion nur endlich viele kritische Punkte. Da die Teilmenge der nicht degenerierten symmetrischen Matrizen offen und dicht im Vektorraum Sym(n, R) ist, ist die Eigenschaft, Morse–Funktion zu sein, generisch (siehe Bemerkung 2.44.2, und Satz 1.2 in Kapitel 6 von [Hirs]). Ist beispielsweise M ⊂ Rn eine Untermannigfaltigkeit, dann ist f¨ ur Lebesgue– fast alle a ∈ Rn die Restriktion der Linearform fa : Rn → R, x → x, a auf M eine Morse–Funktion (siehe Proposition 17.18 in Bott und Tu [BT]).
G.1
Morse–Ungleichungen
Die Morse–Ungleichungen f¨ ur eine Morse–Funktion f : M → R stellen eine Beziehung her zwischen der in den Betti–Zahlen betti (M ) (siehe Definition 1 Der Index einer n × n–Matrix wurde in Definition 5.2 als Summe der algebraischen Vielfachheiten der Eigenwerte λ mit Re(λ) < 0 eingef¨ uhrt.
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 24,
537
538
G.1. Morse–Ungleichungen
B.8.2) codierten Topologie von M und den Kardinalit¨aten crit (f ) := |Crit (f )| der Mengen Crit (f ) kritischer Punkte mit Index . In ihrer einfachsten Form besagen sie f¨ ur eine kompakte Mannigfaltigkeit M n crit (f ) ≥ betti (M )
( = 0, . . . , n).
(G.1.1)
Eine Morse–Funktion f : M → R, f¨ ur die Gleichheit gilt, heißt perfekt.2 Es ist allerdings wichtig, dass wir zwar (f¨ ur Dimensionen n ≥ 1) die linke Seite der Ungleichungen durch Ver¨anderung von f beliebig groß machen k¨onnen, aber trotzdem nicht in beliebiger Weise. Insbesondere gilt immer die Gleichung
n =0
(−1) crit (f ) =
n =0
(−1) betti (M ) =: χ(M ),
(G.1.2)
wobei wir die alternierende Summe der Betti–Zahlen als Definition der Euler– Charakteristik χ(M ) der Mannigfaltigkeit gew¨ahlt haben. G.2 Beispiel (Sph¨ aren) M = S n . Die H¨ ohenfunktion f (x) := xn+1 von S n bez¨ uglich der u ¨blichen Einbettung in den Rn+1 hat ein Minimum und ein Maximum und keine weiteren kritischen Punkte. Es ist also crit0 (f ) = critn (f ) = 1, crit1 (f ) = . . . = critn−1 (f ) = 0 und damit χ(S n ) = 1 + (−1)n
(n ∈ N0 ).
Wenn wir die runde Sph¨are eindellen, erscheint f¨ ur die H¨ohenfunktion eine weitere Maximalstelle, aber eben unweigerlich noch mindestens ein weiterer kritischer Punkt.
Die rechte Abbildung zeigt f¨ ur n = 2 den Fall crit0 (f ) = critn−1 (f ) = 1, critn (f ) = 2 (und crit1 (f ) = . . . = critn−2 (f ) = 0). Die alternierende Summe 3 ¨andert sich dann nicht. 2 Eine solche Funktion braucht f¨ ur M nicht zu existieren. Ein Beispiel ist die (im Zusammenhang der Poincar´ e–Vermutung wichtige) sogenannte Poincar´e–Sph¨ are, siehe Remark 5.15 im Buch [Ni] von Nicolaescu.
G. Morse–Theorie
539
G.3 Bemerkungen 1. Die Morse–Ungleichungen werden verwendet, um von kritischen Punkten geeigneter Morse–Funktionen auf die Topologie der Mannigfaltigkeit zu schließen. Beispielsweise kann man durch die Euler–Charakteristik sowohl die orientierbaren als auch die nicht orientierbaren kompakten Fl¨achen topologisch klassifizieren. Mindestens ebenso wichtig ist es, umgekehrt zu zeigen, dass Morse–Funktionen viele kritische Punkte besitzen m¨ ussen. Ein Beispiel ist die Frage nach der Minimalzahl periodischer Orbits f¨ ur hamiltonsche Systeme, siehe die Arnol’d– Vermutung (Seite 448). 2. Es ist aber nicht zwingend notwendig, dass die Mannigfaltigkeit M endliche Dimension besitzt. Beispielsweise ist f¨ ur das Intervall I der Raum H 1 (I, N ) 1 3 der H –Kurven c : I → N auf einer riemannschen Mannigfaltigkeit (N, g) nicht kompakt. Sie besitzt aber immerhin die Struktur einer unendlich-dimensionalen Mannigfaltigkeit (siehe [Kli2], Kapitel 2.3), mit riemannscher Metrik. F¨ ur glatte Vektorfelder v, w entlang c (also v(t), w(t) ∈ Tc(t) N ) setzt man % & gc(t) v(t), w(t) + gc(t) ∇v(t), ∇w(t) dt. v, w := (G.1.3) I 1
Damit wird H (I, N ) zu einer sogenannten Hilbert–Mannigfaltigkeit. Das Energiefunktional 1 1 ˙ c(t) ˙ dt (G.1.4) E : H (I, N ) → [0, ∞) , c → 2 gc(t) c(t), I
ist glatt. Seine kritischen Punkte sind die konstanten Kurven, denn die Ableitung DE(c)(v) = gc(t) c(t), ˙ ∇v(t) dt v ∈ Tc H 1 (I, M ) (G.1.5) I
in Richtung v := c˙ ist sonst positiv. Die kritische Menge ist also hom¨oomorph zu N . 3 Es gibt verschiedenartige Beweise der Morse–Ungleichungen (siehe auch Bemerkung 17.15.4). G.4 Bemerkung (Wittens Beweis der Morse–Ungleichungen) Der Physiker Edward Witten ver¨ offentlichte 1982 in [Wit] einen Beweis der Morse–Ungleichungen f¨ ur geschlossene orientierbare Mannigfaltigkeiten, der auf einer Deformation des sogenannten Laplace–Beltrami–Operators auf dem in (B.4.1) eingef¨ uhrten Vektorraum Ω∗ (M ) mithilfe der Morse–Funktion beruht, siehe auch [CFKS], Kapitel 11. Dieser Beweis ist Ausgangspunkt interessanter Entwicklungen in der Mathematik und der Quantenfeldtheorie. 3 3 Also
solche mit quadratintegrabler erster Ableitung.
540
G.1. Morse–Ungleichungen
Wir stellen kurz die Hauptschritte des klassischen Beweises zusammen. Die Mannigfaltigkeit M wird dabei durch Vergr¨ oßerung des Parameters b aus den Subniveaumengen (b ∈ R) Mb := f −1 (−∞, b] der Morse–Funktion aufgebaut.
Subniveaumengen T2b einer perfekten Morse–Funktion f : T2 → R des Torus. Man unterscheidet dabei Parameterintervalle danach, ob sie einen kritischen Wert enthalten oder nicht. ur f ∈ C r+1 (M, R), r ≥ 1 keinen G.5 Lemma Enth¨alt Ma,b := f −1 [a, b] f¨ kritischen Punkt, dann ist die berandete Mannigfaltigkeit Ma,b diffeomorph zu f −1 (a) × [a, b] (mit einem C r –Diffeomorphismus, der die Niveaumengen f −1 (c) auf f −1 (a) × {c} abbildet). Beweis: Man benutzt auf Ma,b den Fluss des normierten Gradientenvektorfeldes ∇f uglich einer beliebigen riemannschen Metrik. Dieser f¨ uhrt wegen X := ∇f 2 bez¨ df (X) = 1 Niveaumengen in Niveaumengen u ¨ber. Die Details findet man in Kapitel 6.1, Satz 2.2. von Hirsch [Hirs]. 2 G.6 Lemma (Morse–Lemma) Es sei m ∈ M n ein nicht degenerierter kritischer Punkt von f ∈ C r+1 (M, R), r ≥ 1 mit Index k. Dann gibt es eine C r –Karte (U, ϕ) bei m mit f ◦ ϕ−1 (x) = f (m) −
k i=1
x2i +
n i=k+1
x2i
x ∈ ϕ(U ) .
Beweis: In Hirsch [Hirs], Satz 1.1 von Kapitel 6.1 (Differenzierbarkeitsstufe in Exercise 1). 2 Enth¨alt Ma,b genau einen kritischen Punkt m, dann entsteht topologisch 4 Mb = Ma ∪ Ma,b aus Ma durch Ankleben der stabilen Mannigfaltigkeit von m (siehe Abbildung G.1.1, und §3 von Milnor [Mi]). Diese ist nach dem Morse–Lemma Ind(m)–dimensional. Mit den im n¨achsten Abschnitt aufbereiteten Techniken der singul¨aren Homologie wird die dabei stattfindende Topologie¨anderung der Subniveaumenge kontrolliert. 4 als sog. Deformationsretrakt von M . F¨ ur einen topologischen Teilraum A ⊆ B heißt eine b Homotopie g : B × [0, 1] → B Deformationsretraktion und A Deformationsretrakt von B, wenn aquivalent. g(B, 1) = A und g(·, 1)A = IdA ist. Damit sind A und B insbesondere homotopie¨
x1
x2
x2
541
x2
G. Morse–Theorie
x1
x1
Abbildung G.1.1: Subniveaumengen Mc−ε (links) und Mc+ε (rechts) einer Morse–Funktion f : M → R in der N¨ahe eines kritischen Punktes m mit c := f (m) und Ind(m) = 1. Die mittlere Abbildung zeigt die Vereinigung von Mc−ε und der stabilen Mannigfaltigkeit von m. Die Karte entspricht der im Morse–Lemma.
G.2
Singul¨ are Homologie
Die Morse–Ungleichungen enthalten die in (B.8.2) mithilfe der de-Rham–Kohomologie definierten Betti–Zahlen. Es erscheint daher nat¨ urlich, diese Ungleichungen auch mit dem Kalk¨ ul der Differentialformen zu beweisen. Statt der de-Rham–Kohomologie wird f¨ ur diesen Beweis aber u ¨blicherweise die sogenannte singul¨are Homologie verwandt. Ein Grund daf¨ ur ist die Tatsache, dass diese f¨ ur beliebige topologische R¨aume, nicht nur f¨ ur endlich-dimensionale Mannigfaltigkeiten definierbar ist. Damit kann die Morse–Theorie auch auf so wichtige Fragen wie die nach geschlossenen Geod¨aten angewandt werden (siehe Bemerkung G.3.2). Singul¨are Homologie ist eine Homologietheorie, die einem topologischen Raum X abelsche Gruppen Hk (X), k ∈ N0 zuordnet, die diesen teilweise charakterisieren. Das Buch [Cr] von Croom ist eine elementare Einf¨ uhrung. Bausteine sind die Simplices: Sind a0 , . . . , ak ∈ Rn geometrisch unabh¨angig in dem Sinn, dass sie in keinem (k − 1)–dimensionalen affinen Unterraum liegen, so heißt die konvexe H¨ ulle
k k n σk := [a0 , . . . , ak ] := i=0 ti ai ti ≥ 0, i=0 ti = 1 ⊂ R dieser Punkte Standard–k–Simplex; die i–te Seite (i)
σk−1 := [a0 , . . . , a ˆi , . . . , ak ]
(i = 0, . . . , k)
von σk ist Konvexkombination der Eckpunkte von σk außer ai . G.7 Definition • Ein singul¨ arer k–Simplex des topologischen Raumes X ist ein Paar (σk , f ) mit einer stetigen Abbildung f : σk → X.
542
G.2. Singul¨are Homologie
• Es sei G eine abelsche Gruppe. Eine singul¨ are k–Kette ist eine endliche
formale Linearkombination i gi (σk,i , fi ) singul¨arer k–Simplices, mit gi ∈ G. Die Menge Ck (X; G) (oder kurz: Ck (X)) dieser singul¨aren Ketten ist damit wieder eine abelsche Gruppe. • Der Rand eines singul¨aren k–Simplex (σk , f ) ist die formale Linearkombination
k (q) q (−1) , f ∂(σk , f ) := σ ∈ Ck−1 (X; G), (q) q=0 k−1 σ
k−1
der Rand einer singul¨aren k–Kette ck := i gi (σk,i , fi ) ist gi ∂(σk,i , fi ). ∂ck := i
G.8 Satz ∂ : Ck (X) → Ck−1 (X) (k ∈ N) ist ein Gruppenhomomorphismus, und ∂∂ = 0. Diese einfach nachzurechnende Formel ist mit der Eigenschaft dd = 0 der ¨außeren Ableitung vergleichbar. Wie diese in (B.8.1) zur Definition der de-Rham– Kohomologie benutzt wurde, f¨ uhrt Satz G.8 zur Definition der singul¨aren Homologie: G.9 Definition (und Satz) • Eine Kette ck ∈ Ck (X; G) heißt Zykel (ck ∈ Zk (X; G)), wenn ∂ck = 0, ur ein ck+1 ∈ Bk+1 (X; G). Rand (ck ∈ Bk (X; G)), wenn ck = ∂ck+1 f¨ Damit ist Zk (X) eine Untergruppe von Ck (X) und Bk (X) eine Untergruppe von Zk (X). • Zwei Zykeln ck , ck ∈ Zk (X) heißen ¨ aquivalent, wenn ck − ck Rand ist. ¨ Das ist eine Aquivalenzrelation. ¨ • Die Menge Hk (X; G) der Aquivalenzklassen heißt k–te singul¨ are Homologiegruppe. Sie ist damit die Faktorgruppe Hk (X) = Zk (X)/Bk (X). F¨ ur die Morse–Theorie wird als additive Gruppe G oft der K¨orper R der reellen Zahlen verwandt. Ck (X) und analog Zk (X), Bk (X) und Hk (X) werden damit zu R–Vektorr¨aumen. W¨ahrend erstere aber typischerweise unendlich-dimensional sind, ist etwa f¨ ur kompakte Mannigfaltigkeiten X die Homologiegruppe Hk (X) endlich–dimensional. Nach dem universellen Koeffiziententheorem (Satz 15.14 in [BT]) und dem Satz von de Rham (etwa: Satz 8.9 in [BT]) gilt dann sogar: dim(Hk (X)) = bettik (X) mit den Betti–Zahlen bettik (X). Eine stetige Abbildung topologischer R¨aume ϕ : X → Y induziert den Homomorphismus
(k ∈ N0 ) ϕ∗ : Ck (X; G) → Ck (Y ; G) , ϕ∗ (ck ) = i gi (σk,i , ϕ ◦ fi )
der Ketten, f¨ ur ck := i gi (σk,i , fi ). ϕ∗ induziert wiederum einen Homomorphismus (k ∈ N0 ). (G.2.1) ϕ∗ : Hk (X; G) → Hk (Y ; G)
G. Morse–Theorie
543
Dieser h¨angt nur von der Homotopieklasse von f ab. Insbesondere besitzen homotopie¨aquivalente R¨aume isomorphe (singul¨are) Homologiegruppen. G.10 Beispiel Die gelochte Ebene und sind die Kreislinie nach Beispiel A.24.1 homotopie¨aquivalent. Daher gilt Hk C\{0}; G = Hk S 1 ; G . 3 F¨ ur den Beweis der Morse–Ungleichungen ben¨ otigen wir auch die relativen Homologien. Ist Y ein Teilraum des topologischen Raumes X, dann ist die Gruppe Ck (Y ; G) Untergruppe von Ck (X; G). Die Faktorgruppe wird mit Ck (X, Y ) := Ck (X)/Ck (Y ) bezeichnet. ∂ bildet Ck (Y ) in Ck−1 (Y ) ab, und definiert damit einen Randoperator ∂ : Ck (X, Y ) → Ck−1 (X, Y ). Es sei die Gruppe der relativen Zykeln Zk (X, Y ) := {ck ∈ Ck (X, Y ) | ∂ck = 0} und die Gruppe der relativen R¨ander Bk (X, Y ) := ck ∈ Ck (X, Y ) | ∃ ck+1 ∈ Ck+1 (X, Y ) : ck = ∂ck+1 . Die k–te relative Homologiegruppe ist die Faktorgruppe Hk (X, Y ) := Zk (X, Y )/Bk (X, Y ). • Da jeder Zykel aus Hk (X) als einer in Hk (X, Y ) betrachtet werden kann, erhalten wir einen Homomorphismus j : Hk (X) → Hk (X, Y )
, [zk ] → [zk + Ck (Y )].
• Andererseits induziert die Inklusion i : Y → X mit (G.2.1) einen Homomorphismus i∗ : Hk (Y ) → Hk (X). • Zu guter Letzt stellen wir fest, dass f¨ ur [zk + Ck (Y )] ∈ Hk (X, Y ), n ≥ 1, zk + Ck (Y ) ein relativer k–Zykel ist, ∂zk also in Ck−1 (Y ) liegt. Da ∂∂zk = 0 (Satz G.8), ist ∂zk ein (k − 1)–Zykel; ∂zk ∈ Zk−1 (Y ) definiert also ein Element [∂zk ] ∈ Hk−1 (Y ). Die entsprechende Abbildung ist ∂∗ : Hk (X, Y ) → Hk−1 (Y )
, [zk + Ck (Y )] → [∂zk ].
G.11 Satz Die Sequenz ∂
i
j
∂
i
∗ ∗ . . . →∗ Hk (Y ) → Hk (X) → Hk (X, Y ) →∗ Hk−1 (Y ) → . . . H0 (X, Y ) → 0
ist exakt, also ker(i∗ ) = Im(∂∗ ) , ker(j) = Im(i∗ ) und ker(∂∗ ) = Im(j).
544
G.2. Singul¨are Homologie
Beweis: Siehe Band 3, §5 von Dubrovin, Fomenko und Novikov [DFN]. 2 Wir kehren zum Beweis der Morse–Ungleichungen zur¨ uck. F¨ ur diesen ist es n¨ utzlich, das Poincar´e–Polynom der Mannigfaltigkeit M n
n PM (t) := =0 betti (M ) t mit dem Poincar´e–Polynom der Morse–Funktion f : M → R
n QM (f, t) := =0 crit (f ) t zu vergleichen. Durch gen¨ ugend kleine Ver¨anderung von f auf disjunkten Umgebungen der kritischen Punkte erreichen wir, dass die Werte ck := f (xk ) der kritischen Punkte x1 , . . . , xN von f voneinander verschieden sind, ohne dabei ihren Index zu ¨andern. Wir nummerieren die ck aufsteigend, und definieren f¨ ur Y ⊆ X die relativen Betti–Zahlen betti (X, Y ) := dim H (X, Y )
( ∈ N0 ).
Wir w¨ahlen regul¨are Werte ai ∈ (ci , ci+1 ), mit a0 < c1 und aN > cN . G.12 Lemma Das Poincar´e–Polynom ist QM (f, t) =
n N
betti Mak , Mak−1 t .
k=1 =0
Beweis: • Aus der sogenannten Exzisionseigenschaft der relativen Homologie folgt H (X, Y ) = H (X/Y, ∗), wobei ∗ eine einpunktige Menge symbolisiert und X/Y der Raum mit Quotiententopologie ist, bei dem Y zu einem Punkt zusammengeschlagen wird. • In unserem Fall ist f¨ ur den kritischen Punkt xk mit Index m die Mannigfaltigkeit Mak /Mak−1 homotopie¨aquivalent zu Dm /∂Dm ∼ = S m , siehe das auf das Morse–Lemma G.6 folgende Argument. Daher sind die Betti–Zahlen betti Mak , Mak−1 = betti (S m , ∗) = δ(, m). 2 fi
fi+1
fi+k−1
fi+k
Aus der Exaktheit einer Sequenz . . . Hi → Hi+1 −→ . . . −→ Hi+k −→ ... endlich-dimensionaler Vektorr¨aume, also dim ker(f+1 ) = dim im(f ) , folgt mit dem Dimensionssatz dim(H ) = dim(ker(f )) + dim(im(f )) der Linearen Algebra f¨ ur die alternierende Summe:
i+k −i dim(H ) = dim ker(fi ) + (−1)k dim im(fi+k ) . =i (−1) Satz G.11 impliziert daher ∞ =0
(−1) betti (Y ) − betti (X) + betti (X, Y ) = 0.
(G.2.2)
G. Morse–Theorie
545
Beweis der Morse–Ungleichungen: • Die Formel (G.1.2) f¨ ur die Euler–Charakteristik folgt wegen M = MaN durch Summation u ¨ber k aus (G.2.2), mit Y := Mak und X := Mak−1 . • In ¨ahnlicher Weise wie (G.1.2) beweist man die starken Morse–Ungleichungen
m
m −m crit (f ) ≥ =0 (−1)−m betti (M ) (m = 1, . . . , n − 1). =0 (−1) (G.2.3) Daraus folgen die schwachen Morse–Ungleichungen (G.1.1) durch Addition von (G.2.3) f¨ ur Paare benachbarter Werte von m. 2
G.3
Geod¨ atische Bewegung und Morse–Theorie
¨ In diesem Abschnitt wird ein Uberblick u ¨ber Anwendungen und Erweiterungen der Morse–Theorie gegeben, insbesondere f¨ ur die Analyse der Geod¨aten einer vollst¨andigen riemannschen Mannigfaltigkeit (M, g). Eine Geod¨ate auf (M, g) ist eine Kurve c ∈ C 2 (I, M ), f¨ ur die der Paralleltransport entlang c den Geschwindigkeitsvektor c invariant l¨asst, die also in lokalen Koordinaten die Geod¨atengleichung (8.4) erf¨ ullt. F¨ ur das Intervall I = [0, 1] ist sie damit Extremal des Energiefunktionals (G.1.4) und des L¨angenfunktionals 1 gc(t) c(t), L : H (I, M ) → [0, ∞) , L(c) := ˙ c(t) ˙ dt, (G.3.1) I
im Vergleich mit Kurven, deren Anfangs- und Endpunkt gleich c(0) bzw. c(1) sind. Eine analoge Aussage gilt f¨ ur beliebige Punktepaare. Ist M eine Untermannigfaltigkeit des Rk und die riemannsche Metrik g auf M die Restriktion der euklidischen Metrik des Rk , dann zeichnen sich die Geod¨aten auf M dadurch aus, dass ihre Beschleunigung c (t) ∈ Tc(t) Rk senkrecht auf dem Tangentialraum Tc(t) M ist. Die geod¨atische Bewegung, aufgefasst als Fluss auf dem Tangentialb¨ undel T M , ist hamiltonsch, mit der Hamilton–Funktion H : TM → R
,
ur v ∈ Tm M. v → 12 gm (v, v) f¨
(G.3.2)
Dabei ist die das hamiltonsche Vektorfeld XH definierende symplektische Form die mittels der B¨ undelabbildung T M → T ∗ M, v → g(v, ·) vom Kotangen∗ tialb¨ undel T M auf T M zur¨ uckgezogene kanonische symplektische Form ω0 (siehe Seite 205). Das L¨angenfunktional L erm¨ oglicht es, eine (zusammenh¨angende) riemannsche Mannigfaltigkeit (M, g) als metrischen Raum mit Metrik d : M × M → [0, ∞), (G.3.3) d(q0 , q1 ) := inf L(c) | c ∈ H 1 (I, M ), c(0) = q0 , c(1) = q1 aufzufassen. Nach der Cauchy-Schwarz–Ungleichung gilt f¨ ur die Zeitintervalle [t0 , t1 ] ⊆ I: d c(t0 ), c(t1 ) ≤ 2 E(c) (t1 − t0 ).
546
G.3. Geod¨atische Bewegung und Morse–Theorie
G.13 Definition • Die riemannsche Mannigfaltigkeit (M, g) heißt geod¨ atisch vollst¨ andig, wenn es f¨ ur jeden Tangentialvektor v ∈ Tm M eine Geod¨ate c : R → M mit c(0) = m und c (0) = v gibt. • Auf einer geod¨atisch vollst¨andigen Mannigfaltigkeit heißt mit diesen Bezeichnungen die Abbildung exp : T M → M
,
v → c(1)
Exponentialabbildung. Ihre Restriktion auf Tm M wird mit expm : Tm M → M bezeichnet. Diese Exponentialabbildung der Differentialgeometrie sollte nicht mit der gleichnamigen Abbildung (E.3.1) aus der Theorie der Lie–Gruppen verwechselt werden 5 . G.14 Beispiele 1. Kompakte Mannigfaltigkeiten sind bez¨ uglich jeder riemannschen Metrik geod¨atisch vollst¨andig. Denn die flussinvarianten Niveaufl¨achen der Hamilton–Funktion (G.3.2) sind dann ebenfalls kompakt. Damit folgt die Behauptung aus Satz 3.27. 2. Ein einfaches Beispiel f¨ ur eine Exponentialabbildung ist die der runden Sph¨are S 2 ⊂ R3 . Vom Tangentialraum Tn S 2 ∼ = R2 des Nordpols n aus gesehen wird durch die Inverse der Tangentialabbildung expn : Tn S 2 → S 2 die (Erd-) Kugel azimutal auf die Ebene abgebildet. Die Geod¨aten sind in diesem Fall Großkreise. Der Nordpol erscheint als Nullpunkt und in Form konzentrischer Kreise der Radien 2πn, n ∈ N. In nebenstehender Abbildung sieht man die Antarktis mit dem S¨ udpol als Kreis mit Radius π. 3
Inverse Exponentialabbildung der Erde am Nordpol, also ¨aquidistante Azimutalprojektion, nach wikipedia.
G.15 Satz (Hopf und Rinow) F¨ ur eine zusammenh¨angende riemannsche Mannigfaltigkeit (M, g) sind die folgenden Aussagen ¨aquivalent: 1. (M, g) ist geod¨atisch vollst¨andig. 5 Bei einer unter der Links- und der Rechtswirkung (E.1.3) invarianten Metrik auf einer Lie– Gruppe G fallen die beiden Begriffe aber zusammen, wenn man die Lie–Algebra g in exp : g → G als Tangentialraum Te G von G beim neutralen Element e ∈ G auffasst. Beispiele sind abelsche Lie–Gruppen wie Rn und der Torus Tn .
G. Morse–Theorie
547
2. (M, d) (mit der Metrik d aus (G.3.3)) ist ein vollst¨andiger metrischer Raum; 3. die abgeschlossenen und bez¨ uglich d beschr¨ankten Teilmengen von M sind kompakt; Unter dieser Voraussetzung existiert f¨ ur je zwei Punkte q0 und q1 von M eine Geod¨ate c : [0, 1] → M mit c(i) = qi und minimaler L¨ange L(c) = d(q0 , q1 ). Um die Geod¨aten mithilfe von Morse–Theorie zu untersuchen, muss man ihren Index bez¨ uglich des Energiefunktionals verstehen. Dieser h¨angt mit ihren konjugierten Punkten zusammen. G.16 Definition • Es sei c : [0, T ] → M ein Geod¨atensegment auf der riemannschen Mannigfaltigkeit (M, g). Dann heißt q := c(t) konjugierter Punkt von p := c(0) (entlang c), wenn die lineare Abbildung Tc (0)t expp : Tc (0)t Tp M −→ Tq M einen nichttrivialen Kern besitzt. • Die Dimension dieses Kerns heißt Multiplizit¨ at Multc (t) des konjugierten Punktes. G.17 Bemerkung (konjugierte Punkte) Man betrachtet also die Linearisierung der Exponentialabbildung und schaut damit, ob eine Variation der Anfangsgeschwindigkeit der bei p startenden Geod¨ate uns trotzdem in der Zeit t zu uhrt. Die zu p konjugierten Punkte c(t) entlang der Geod¨ate q = expp (c (0)t) f¨ c besitzen damit Zeitparameter t, die sich nicht h¨aufen. Ist q konjugierter Punkt von p entlang c, dann ist auch p konjugierter Punkt von q (entlang der umgekehrt durchlaufenen Geod¨ate). In Beispiel G.14.2 sind genau die Antipodenpaare (p, q) = (p, −p) und die Paare (p, p) der Sph¨are zueinander konjugiert, entlang jedes sie treffenden Großkreissegmentes. 3 Die in Bemerkung G.3.2 eingef¨ uhrte Hilbert–Mannigfaltigkeit H 1 (I, M ) besitzt nur die konstanten Kurven als kritische Punkte des Energiefunktionals E. Man kann aber u ¨ber die Endpunktabbildung π : H 1 (I, M ) → M × M , c → c(0), c(1) Untermannigfaltigkeiten von H 1 (I, M ) definieren und E darauf restringieren. Besonders wichtig sind die R¨aume Ωp,q M := π −1 (p, q) (p, q ∈ M ) der bei p beginnenden und bei q endenden Kurven, und ΛM := π −1 Δ , mit der Diagonale Δ := {(q, q) | q ∈ M }.
548
G.3. Geod¨atische Bewegung und Morse–Theorie
G.18 Satz (Index–Satz von Morse) Der Index des Energiefunktionals E : Ωp,q M −→ [0, ∞)
bei einer Geod¨ate c von p nach q ist 6 t∈(0,1) Multc (t). Beweis: In Klingenberg [Kli2], Theorem 2.5.9.
2
Der Raum ΛM kann sinnvollerweise als Raum von H 1 –Schleifen c : S 1 → M aufgefasst werden. Das (wieder mit E bezeichnete) auf ΛM restringierte Energiefunktional ist dann invariant unter den Drehungen t → t + s auf S 1 = R/Z. Es ist also immer degeneriert und damit keine Morse–Funktion 7 . Die kritischen Punkte von E : ΛM → [0, ∞) besitzen aber endlichen Index, und sie sind geschlossene Geod¨aten. Letzteres schließt man durch partielle Integration aus der Formel (G.1.5) f¨ ur ihre Ableitung DE, ¨ahnlich wie beim hamiltonschen Variationsprinzip in Satz 8.16. uglich der G.19 Satz Falls (M, g) vollst¨andig ist, sind auch Ωp,q M und ΛM bez¨ von (G.1.3) abgeleiteten Metrik auf H 1 (I, M ) vollst¨andige metrische R¨aume. Beweis: Siehe Theorem 2.4.7 in Klingenberg [Kli2]. Dort wird angenommen, dass M kompakt ist. Die leichte Verallgemeinerung auf vollst¨andige (M, g) findet 2 man zum Beispiel in Proposition 4.1 von 8 . Um in Ωp,q M beziehungsweise ΛM Geod¨aten als kritische Punkte von E zu finden, u uft man eine sogenannte Palais-Smale–Bedingung. Wir bezeichnen ¨berpr¨ diese R¨aume dabei pauschal mit Ω: G.20 Definition (Palais-Smale–Bedingung) Alle Folgen (ck )k∈N von Kurven in Ω, f¨ ur die die Folge E(ck ) k∈N beschr¨ankt ist und limk→∞ grad E(ck ) = 0 gilt, besitzen eine konvergente Teilfolge. G.21 Beispiel (Gegenbeispiel) Ist (M, g) die (vollst¨andige) riemannsche Mannigfaltigkeit M := R mit euklidischer Metrik g, dann ist die Palais-Smale– Bedingung f¨ ur ΛM nicht erf¨ ullt. ullt die Denn etwa die Folge der konstanten Schleifen ck mit ck (t) := k erf¨ Voraussetzung der Definition, besitzt aber keine konvergente Teilfolge. 3 G.22 Lemma Die Palais-Smale–Bedingung ist f¨ ur Ωp,q M erf¨ ullt, falls (M, g) vollst¨andig ist, und f¨ ur ΛM , falls M kompakt ist. 6 Die
Summe ist endlich! es k¨ onnte eine sogenannte Morse-Bott–Funktion sein. Bei einer Morse-Bott–Funktion ist die kritische Menge eine abgeschlossene Untermannigfaltigkeit und die Hesse–Matrix in Normalenrichtung ist nicht degeneriert. 8 M. Klein, A. Knauf: Classical Planar Scattering by Coulombic Potentials. LNP 13. Berlin: Springer, 1993 7 Aber
G. Morse–Theorie
549
Unter den genannten Voraussetzungen erzeugt das Gradientenvektorfeld grad E einen vollst¨andigen Fluss auf Ω. Man findet also beispielsweise in jeder Zusammenhangskomponente von Ωp,q M ein p mit q verbindendes Geod¨atensegment. Diese Zusammenhangskomponenten werden durch die Fundamentalgruppe π1 (M ) nummeriert. Auch im Fall trivialer Fundamentalgruppe kann man oft die Existenz vieler solcher Geod¨atensegmente nachweisen: G.23 Beispiel • Sei zun¨achst M = S n mit Standardmetrik g und p, q ∈ S n nicht konjugiert, also nicht gleich oder Antipoden. Wir k¨onnen diese beiden Punkte mit unendlich vielen Geod¨aten–Segmenten mit Multiplizit¨aten k(n − 1), k ∈ N0 verbinden. Allerdings sind diese alle Segmente einer (in span(p, q) liegenden) Geod¨ate. • Ist die Metrik nicht die Standardmetrik, so l¨asst sich unter Zuhilfenahme des Satzes von Sard (siehe Seite 299), angewandt auf die Exponentialabbildung, immer noch feststellen, dass fast alle (p, q) ∈ M × M nicht konjugiert sind, und man erh¨alt wieder viele verbindende Geod¨atensegmente. Allerdings werden diese im Allgemeinen geometrisch verschieden sein. 3 Eine andere Fragestellung ist die nach Existenz und Zahl geschlossener Geod¨aten. Man benutzt dabei das in Bemerkung G.3.2 eingef¨ uhrte und auf den Raum der H 1 –Schleifen c : S 1 → M restringierte Energiefunktional E : ΛM → [0, ∞). G.24 Satz (Ljusternik-Fet) Auf einer geschlossenen (das heißt kompakten und randlosen) riemannschen Mannigfaltigkeit existiert eine periodische Geod¨ate. Beweis: Neben dem Originalbeweis in [LF], siehe auch Theorem 3.7.7 von Klingenberg [Kli2], gibt es in [Kli2], Thm. 2.4.20 einen weiteren Beweis. Beweisidee: • Wenn die Fundamentalgruppe π1 (M ) nicht trivial ist, dann gibt es auch nicht triviale Konjugationsklassen (siehe Satz E.5) in π1 (M ), also nicht kontrahierbare Schleifen. Da allgemein die Zusammenhangskomponenten von ΛM den Konjugationsklassen entsprechen, finden wir durch Straffziehen einer solchen Schleife mit dem Gradientenfluß eine geschlossene Geod¨ate. • Ist aber M einfach zusammenh¨angend, dann existiert eine nicht triviale Homotopiegruppe9 π (M ), 2 ≤ ≤ dim(M ). ∑B1 Sei f : S → M nicht homotop zu einer konstanten Abbildung. Wir zerlegen S (auf die in der Abbildung f¨ ur = 2 B1 −1 angedeuteten Weise) in durch B parametrisierte Orbits ur Parameter aus ∂B −1 . von S 1 , mit konstanten Kreisen f¨ Diese ziehen wir gemeinsam straff. Es ergibt sich eine ge- 2 schlossene Geod¨ate. Beispiel: Im Fall von M = S 2 mit Stan- S ¨ dardmetrik und f = IdS 2 ist diese der Aquator. 2 9 eine analog zur Fundamentalgruppe definierte Gruppe von Homotopieklassen von Abbildungen S → M .
550
G.3. Geod¨atische Bewegung und Morse–Theorie
G.25 Bemerkung (Existenz vieler geschlossener Geod¨ aten) Typischerweise besitzt eine geschlossene riemannschen Mannigfaltigkeit (M, g) (mit dim(M ) ≥ 2 mehr als eine geschlossene Geod¨ate. Dabei nennen wir zwei Geod¨aten geometrisch verschieden, wenn ihre Orbits im Einheitstangentenb¨ undel T1 M verschieden sind. Dies kann man zeigen, wenn die Fundamentalgruppe π1 (M ) hinreichend groß ist (etwa f¨ ur Tori, siehe Satz 8.33). Aber auch zum Beispiel f¨ ur die Sph¨are S 2 mit beliebigen Metriken ist das bewiesen worden, siehe Bangert [Ban]. 3 Ein großes Problem bei der Anwendung der Morse–Theorie ist die Voraussetzung der Nichtdegeneriertheit der kritischen Punkte. Zwar ist diese Voraussetzung in einem generischen Sinn erf¨ ullt, doch f¨ ur den konkreten Einzelfall l¨asst sie sich nur schwer nachpr¨ ufen. Hier ist die Ljusternik–Schnirelmann–Kategorie n¨ utzlich: G.26 Definition Die Ljusternik–Schnirelmann–Kategorie cat(X) eines Hausdorff–Raumes X ist die kleinste Kardinalit¨at kontrahierbarer abgeschlossener 10 Mengen 11 Ai ⊆ X (i ∈ I) mit 7 X = i∈I Ai . G.27 Beispiel (Kreislinie) Die Ljusternik–Schnirelmann–Kategorie cat(S 1 ) der Kreislinie S 1 ist gleich 2. Denn zum Beispiel die beiden abgeschlossenen Teilmengen A± := {z ∈ S 1 ⊂ C | ±Re(z) ≤ 1/2} sind kontrahierbar, mit A− ∪ A+ = S 1 . Aber S 1 selbst ist nicht kontrahierbar. 3 Ist X kompakt, dann ist cat(X) < ∞. Es gilt der G.28 Satz Eine Funktion f ∈ C 2 (M, R) auf einer geschlossenen Mannigfaltigkeit M besitzt mindestens cat(M ) kritische Punkte. Beweis: Einen Beweis findet man in Band 3, §19 von Dubrovin, Fomenko und Novikov [DFN]. Die grobe Idee ist folgende: Bez¨ uglich jeder riemannschen Metrik g erzeugt ∇f einen vollst¨ a ndigen Gradientenfluss auf M . Es gilt M = 7 s W (m), wobei die stabilen Mannigfaltigkeiten W s (m) voneinander m∈Crit(M ) s verschiedener kritischer Punkte disjunkt sind. Aus den W (m) l¨asst sich eine ¨ Uberdeckung im Sinn von Definition G.26 basteln. 2 Die Ljusternik–Schnirelmann–Kategorie k¨ onnen wir oft mithilfe der sogenannten cup–L¨ange berechnen. G.29 Definition Die cup–L¨ ange cup(M ) eine Mannigfaltigkeit M ist die Maximalzahl von Elementen α1 , . . . , αp ∈ H ∗ (M, Z) mit Grad ≥ 1 und α1 ∧ . . . ∧ αp = 0. 10 Man kann f¨ ¨ ur unsere Zwecke auch offene Uberdeckungen verwenden, siehe R. Fox: On the Lusternik-Schnirelmann Category. The Annals of Mathematics, Second Series, 42, 333–370 (1941) 11 Es wird nicht gefordert, dass die A zusammenh¨ angend sind. i
G. Morse–Theorie
551
Damit ist die cup–L¨ange einer n–dimensionalen Mannigfaltigkeit h¨ochstens n. G.30 Satz cat(M ) ≥ cup(M ) + 1. Beweis: In Band 3, §19 von Dubrovin, Fomenko und Novikov [DFN]. 2 G.31 Beispiel (Torus) cup(Tn ) = n, wie man durch Benutzung einer Basis α1 , . . . , αn ∈ H 1 (Tn ) von H ∗ (Tn , Z) sieht (vergleiche mit Beispiel B.54). Jede glatte Funktion f : Tn → R besitzt also mindestens n + 1 kritische Punkte. Diese untere Schranke wird auch realisiert. Etwa f¨ ur den 2-Torus T2 := 2 2 R /πZ ist die Funktion f : T2 → R, x → sin(x1 ) sin(x2 ) sin(x1 + x2 ) wohldefiniert und hat genau drei kritische Punkte: (0, 0) (π/3, π/3) (2π/3, 2π/3) siehe Abbildung.
(degeneriert), (Maximalstelle), und (Minimalstelle), 3
Finishing a book is just like you took a child out in the yard and shot it.” ” Truman Capote
Anhang H
L¨ osungen der Aufgaben Kapitel 1, Einleitung Aufgabe 1.1 auf Seite 6 (Drittes Keplersches Gesetz): (a) Mit der Parametergleichung (1.7) sind die Minimal- und Maximalabst¨ande rmin = R(ϕ0 ) =
p 1+e
und rmax = R(ϕ0 + π) =
Praktisch nach Definition ist die große Halbachse a = tisches Mittel.
p 1−e2
p . 1−e deren arithme-
Der Abstand der beiden Brennpunkte ist rmax − rmin . Daher gilt mit der G¨artner-Definition der Ellipse1 : Die kleine Halbachse ˜b erf¨ullt nach Pythagoras die Beziehung ˜b2 + (rmax − rmin )2 /4 = (rmax + rmin )2 /4 oder ˜b = (rmin rmax )1/2 = b. (b) Der Fl¨acheninhalt der Ellipse ist πab, also nach dem zweiten Keplerschen Gesetz gleich T /2, mit der Umlaufzeit T . Damit ist T = 2πab/. √ √ (c) Mit b = p/ 1 − e2 = pa = a/γ folgt aus Teil b) f¨ ur die Umlaufzeit: T =
2πab
3/2
= 2π a√γ .
2
Kapitel 2, Dynamische Systeme Aufgabe 2.5 auf Seite 13 (Cantor–Menge): • Die Cantor–Menge ist definiert als C˜ := ∩n∈N Cn mit C0 := I, wobei Cn+1 ⊂ Cn aus Cn durch Wegnahme des 1 also aufgefaßt als die Menge der Punkte, deren Summe der Abst¨ ande zu den Brennpunkten konstant ist, die also gezeichnet werden kann, indem man einen Faden an zwei N¨ ageln festbindet und ihn mit einem Stift staffzieht. Im Barock und im Rokoko waren ellipsenf¨ ormige Beete beliebt.
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9 25,
552
H. L¨osungen der Aufgaben
553
mittleren Drittels aller Teilintervalle entsteht. • Da f¨ ur x ∈ [0, 1/3] beziehungsweise x ∈ [2/3, 1] gilt: f (x) = 3x bzw. ˜ = C˜ und damit C˜ ⊆ C. f (x) = 3(1 − x), ist f (Cn+1 ) = Cn , also f (C) ˜ • Ist umgekehrt x0 ∈ I \ C, dann existiert genau ein n ∈ N0 mit xn ∈ Cn aber 2 xn+1 ∈ Cn+1 . Dann ist xn+1 ∈ L. Aufgabe 2.12 auf Seite 15 (Periode): 1. • F¨ ur Φt (m) = exp(2πitα)m gilt Φ0 (m) = exp(0)m = m und Φt1 ◦ Φt2 (m) = exp(2πit1 α) exp(2πit2 α)m = exp(2πi(t1 + t2 )α)m = Φt1 +t2 (m). (Φt )t∈Z ist also ein dynamisches System auf S 1 . • F¨ ur α = q/p mit q ∈ Z, p ∈ N ist Φp (m) = exp 2πip pq m = m, p also Periode von m ∈ S 1 . Die Minimalperiode r ∈ N von m teilt p (in Zeichen: r|p), und aus Φr (m) = m folgt exp 2πi rq = 1, also p|rq. Da q und p nach Annahme teilerfremd sind, p folgt p|r. Da auch r|p gilt, ist r = p. • Falls f¨ ur ein t ∈ Z und m ∈ S 1 gilt: Φt (m) = m, dann folgt exp(2πiαt) = 1, und damit αt ∈ Z. Ist α ∈ R\Q, dann ist t = 0. (n)
2. Durch Induktion folgt f¨ ur m, n ∈ N und fm (z) := z m : fm = fmn . F¨ ur ∈ N folgt aus f (z) = z die Gleichung z = z oder z −1 − 1 = 0. F¨ ur > 1 ist das Polynom vom Grad − 1, besitzt also genau − 1 Nullstellen auf dem komplexen Einheitskreis. (n) 2 Damit ist Pn (fm ) = P1 fm = P1 fmn = mn − 1. Aufgabe 2.15 auf Seite 16 (Minimalperiode des dynamischen Systems): F¨ ur dynamische Systeme gilt, dass die Φt : M → M Bijektionen sind. Ist M eine endliche Menge und m ∈ M , dann gibt es Zeiten t1 < t2 mit Φt1 (m) = Φt2 (m). Dann ist t := t2 − t1 eine Periode: Φt (m) = m. Jeder Punkt m ∈ M ist also periodisch, und wegen t ∈ Z gibt es auch eine Minimalperiode T (m) ∈ N. Da das kleinste gemeinsame Vielfache Tˆ ∈ N der T (m) (m ∈ M ) wegen der Endlichkeit von M existiert, gilt f¨ ur alle m ∈ M : ΦTˆ (m) = m. Andererseits ist ˆ T auch Minimalperiode des dynamischen Systems. 2 Aufgabe 2.19 auf Seite 19 (Shift): 1. dA ist eine Metrik A, also auch 2−|j| dA f¨ ur beliebige j ∈ Z.
auf−|j| = 3 < ∞ ist, ist d eine Produktmetrik auf AZ : Da außerdem j∈Z 2 • F¨ ur x = y gibt es ein j ∈ Z mit xj = yj , also d(x, y) ≥ 2−|j| > 0. • d(x, y) = d(y, (b, a).
x), da dA (a, b) = dA
• d(x, z) = j∈Z 2−|j| dA (xj , zj ) ≤ j∈Z 2−|j| dA (xj , yj ) + dA (yj , zj ) = d(x, y) + d(y, z). Φ ist stetig, denn d Φ±1 (x), Φ±1 (y) ≤ 2d(x, y).
554
H. L¨osungen der Aufgaben
ur j = 2. • m = (mj )j∈Z ist genau dann n–periodisch, wenn mj+kn = mj f¨ 0, . . . , n − 1 und k ∈ Z gilt. Es gibt also genau 2n n–periodische Punkte. • Die Minimalperiode T eines n–periodischen Punktes m ∈ M teilt n (siehe Satz 2.13). Daher gibt es f¨ ur n = 2, 3 beziehungsweise 4 genau 2 = 22 − 3 4 2, 6 = 2 − 2 bzw. 12 = 2 − 2 − 2 Punkte mit Minimalperiode n. • Die periodischen Orbits der Minimalperiode k umfassen k Punkte. Es gibt also 2 = 2/1, 1 = 2/2, 2 = 6/3 bzw. 3 = 12/4 Orbiten der Minimalperioden 1, 2, 3 bzw. 4. Damit gibt es genau 2, 3, 4 bzw. 6 Orbiten dieser Perioden. Steht B(n) f¨ ur die Anzahl der periodischen Orbits mit Minimalperiode n ∈ N, so ist d B(d), 2n = d: d|n
und die M¨obius–Inversion dieser Beziehung sagt einem nun B(n) =
1 d n 2 μ( d ). n d: d|n
Dabei ist μ : N → {−1, 0, 1} die M¨obius–Funktion ⎧ ⎪ , n = 1 oder n hat eine gerade Anzahl von Primteilern, ⎨1 μ(n) := −1 , n hat eine ungerade Anzahl von Primteilern ⎪ ⎩ 0 , sonst. Ist n prim, so vereinfacht sich die Formel f¨ ur B zu B(n) =
1 n
2n − 2 .
3. Es sei etwa x = (xj )j∈Z mit xj := 0 f¨ ur j ≤ 0 und (xj )j∈N die Folge 0 1 00 01 10 11 000 001 010 011 . . ., bei der also nacheinander die Bitfolgen der L¨angen 1, 2, . . . lexikalisch geordnet aneinandergeh¨angt werden. 2 Aufgabe 2.22 auf Seite 20 (Stabilit¨ at): ur λ ∈ C\{0} 1. Die Abbildungen Φt : C → C, Φt (m) := λt m (t ∈ Z) bilden f¨ ein stetiges dynamisches System, weil die Φt lineare, also stetige Abbildungen sind, Φ0 (m) = λ0 m = m und Φt1 ◦ Φt2 (m) = λt1 λt2 m = λ(t1 +t2 ) m gilt. Wegen Linearit¨at ist 0 ein Fixpunkt. 2. Die Umgebungsbasis {U ur |λ| ≤ 1 die ε (0) | ε > 0} der Null besitzt genau f¨ Eigenschaft Φt Uε (0) ⊆ Uε (0) f¨ ur alle t ≥ 0. Damit ist f¨ ur diese λ–Werte 0 Liapunov–stabil. Ist dagegen |λ| > 1, dann ist limt→∞ |λ|t ε = ∞, und wegen Φt Uε (0) = U|λ|t ε (0) ist die 0 nicht Liapunov–stabil. 3. Ist |λ| < 1, dann ist 0 nicht nur Liapunov–stabil, sondern der Radius |λ|t ε der ur t → ∞ gegen Null. Also ist die 0 asymptoKreisscheibe Φt Uε (0) geht f¨ tisch stabil. 2
H. L¨osungen der Aufgaben
555
Aufgabe 2.25 auf Seite 21 (Attraktor): 1. Die Vereinigung A zweier Attraktoren A1 , A2 ist wieder ein Attraktor, denn sind Ui ⊆ M vorw¨arts invariante Umgebungen von Ai , dann ist U := U1 ∪ U2 eine solche f¨ ur A, und mit einer offenen Umgebung V ⊆ U von A sind ur Ai . Es existieren dann τi > 0 mit Φt (Ui ) ⊆ Vi Vi := V ∩ Ui ⊆ Ui solche f¨ f¨ ur alle t ≥ τi . F¨ ur τ := max(τ1 , τ2 ) ist dann auch Φt (U ) ⊆ V f¨ ur alle t ≥ τ . 2. A ⊆ t≥0 Φt (U0 ) folgt aus A ⊆ U0 und Φ(t, A) = A f¨ ur alle t ∈ G. Sei x ∈ t≥0 Φt (U0 ) \ A. Dann ist V := U0 \ {x} offen und erf¨ ullt A ⊆ V ⊆ existiert ein τ ≥ 0 mit Φ(t, U ) ⊆ V f¨ u r alle t ≥ τ . Das widerspricht U0 . Also 0 x ∈ t≥0 Φ(t, U0 ). 2 Aufgabe 2.27 auf Seite 22 (Logistische Familie): 1. • F¨ ur f4 (x) = 4x(1 − x) gilt: f4 12 = 1 ist der Maximalwert, und f (0) = (n) f (1) = 0. Da f4 − Id ein Polynom 2n –ten Grades ist (bei der Komposition von Polynomen werden ja die Grade multipliziert), kann es h¨ochstens 2n (n) Nullstellen haben. Damit existieren h¨ ochstens 2n Fixpunkte von fn . (n)
• Andererseits gibt es f¨ ur f 4 (n)
(n)
Punkte xk (n)
(k = 0, . . . , 2n ) mit
(n)
(n)
x0 = 0 , xk < xk+1 und x2n = 1, (n) (n) (n) sodass f4 x2 = 0 und f4n x2+1 = 1 ist.
(1) Das folgt durch Induktion aus x1 := 12 , denn f4 w¨achst auf 0, 12 streng monoton von 0 auf 1 und f¨allt auf 12 , 1 streng monoton auf 0. (n) Daher existieren mindestens 2n Fixpunkte von f4 . 2. Es ist fp (yp ) = yp , und f¨ ur p ≥ 1 ist yp ∈ [0, 1]. Damit ist yp im Parameterur alle x ∈ (0, 1) bereich p ∈ (1, 3) der zweite Fixpunkt von fp neben 0. Dass f¨ (n) gilt: limn→∞ fp (x) = yp , wurde f¨ ur Parameterwerte p ∈ (1, 2] in Beispiel 2.26 gezeigt. F¨ ur p ∈ (2, 3) betrachten wir fp(2) (x) = p2 x(1 − x) 1 − px(1 − x) . Wir beginnen mit einer Kurvendiskussion. • F¨ ur die Parameterwerte ist 12 Minimal(2) stelle von fp , und die Maximalstellen √
p(p−2) . 2p p Der Maximalwert ist 4. (2) • Die beiden Wendepunkte von √ fp liep(p−2)/3 , gen an den Stellen wp± := 12 ± 2p 3/2 d (2) und dx fp (wp± ) = ± p(p−2) . 3 (2)
von fp
liegen bei m± p :=
1 2 ± (2) fp (m± p)=
p2.8 f p f p , Id
1
1 2
0
wp
y p mp 1 2
x
1
556
H. L¨osungen der Aufgaben
√ ur das Da das Intervall (2, 3) innerhalb des Intervalls 2, 1 + 5 liegt, f¨ (2) (2) + + + fp (m+ ) < m gilt, wird das Intervall [m , 1) durch f in (0, m p p p p p ) ab (2) + + gebildet, und auch fp (0, mp ) ⊆ (0, mp ). Wir zeigen, dass sich der Abstand von x zum Fixpunkt yp unter Iteration ultigen Absch¨atzung verkleinert. Das folgt aus der f¨ ur x ∈ (0, m+ p ), x = yp , g¨ |fp(2) (x) − yp | < |x − yp |. (2)
Der Graph von fp ist ja in (0, yp ) oberhalb der Diagonale, aber wegen d (2) d (2) − dx fp (x) ≥ dx fp (wp ) > −1 auch unterhalb der Gerade x → 2yp − x durch den Fixpunkt. F¨ ur das Intervall (yp , m+ p ) argumentiert man analog. Einen f¨ ur alle p ∈ (1, 3] g¨ ultigen L¨ osungsansatz findet man in Denker [De], Kapitel 1.5. 2 (1)
(2)
Aufgabe 2.30 auf Seite 23 (Konjugation): Es gelte h◦Φt = Φt ◦h (t ∈ G), ¨ f¨ ur einen Hom¨oomorphismus h : M (1) → M (2) . Da Konjugation eine Aquiva¨ lenzrelation ist, reicht es aus, eine Implikation der folgenden Aquivalenzen zu zeigen. (i)
(a) x ∈ M (i) ist genau dann eine Ruhelage, wenn Φt (x) = x (t ∈ G). Ist x1 ∈ M (1) eine Ruhelage, dann ist also (2)
(2)
(1)
Φt (x2 ) = Φt ◦ h(x1 ) = h ◦ Φt (x1 ) = h(x1 ) = x2 . Ist U (2) ⊆ M (2) eine Umgebung von x2 , so auch U (1) := h−1 (U (2) ) ⊆ M (1) f¨ ur x1 . Ist x1 Liapunov–stabil, dann existiert eine Umgebung V (1) ⊆ U (1) von (1) x1 mit Φt (V (1) ) ⊆ U (1) (t ≥ 0). Entsprechend ist V (2) := h(V (1) ) ⊆ U (2) eine Umgebung von x2 mit (2) (2) (1) Φt V (2) = Φt ◦ h V (1) = h ◦ Φt V (1) ⊆ h U (1) = U (2) . Die asymptotische Stabilit¨at u ¨bertr¨agt sich analog. Auch die Teile (b) und (c) sind Routineaufgaben.
2
Aufgabe 2.45 auf Seite 28 (Diffeomorphismengruppe): • Es sei (U, ϕ) eine Karte von M mit x ∈ U , und mit V := U (ϕ) ⊆ Rn sei das Kartenbild bezeichnet. F¨ ur gen¨ ugend kleine ε > 0 ist die ε–Kugel x) um x ˜ := ϕ(x) ganz in V enthalten. Es sei χ ˜ ∈ C ∞ Uε (˜ x), [0, 1] eine Uε (˜ Abschneidefunktion, also etwa χ ˜ Uε/4 (˜ x) = 1 und χ(z) ˜ = 0 f¨ ur z ∈ Uε/2 (˜ x). Ist nun y˜ ∈ Uε/4 (˜ x), dann ist v˜ : Uε (˜ x) → Rn , v˜(z) := χ(z) ˜ · (˜ y−x ˜) ein x) verschwindet und innerhalb Uε/4(˜ x) Vektorfeld, das außerhalb von Uε/2 (˜ −1 gleich y˜ − x ˜ ist. Durch Fortsetzung mit Null wird das auf ϕ Uε (x) ⊆ U geliftete Vektorfeld zu einem Vektorfeld v auf M . Sein Zeit–1–Fluss f ∈ Diff(M ) existiert (das folgt aus einem zum Beweis von Satz 3.27 analogen Argument). Zudem gilt mit y := ϕ−1 (˜ y ) : f (x) = y (denn in der Karte gilt x + t˜ y , dass v˜(zt ) = y˜ − x ˜). f¨ ur alle zt := (1 − t)˜
H. L¨osungen der Aufgaben
557
• Damit ist die Menge Mx := {y ∈ M | es gibt ein f ∈ Diff(M ) mit f (x) = y} offen und nicht leer. Aber auch M \Mx ist offen, denn mit z ∈ M \Mx kann auch ganz Mz nicht erreicht werden (hier nutzt man, dass Diff(M ) eine Gruppe ist). Nun ist M 2 nach Annahme zusammenh¨angend, also Mx = M .
Kapitel 3, Gew¨ ohnliche Differentialgleichungen Aufgabe 3.12 auf Seite 35 (Einzeldifferentialgleichungen erster Ordnung): 1. • Es ist genau dann f1 (x) = 0, wenn |x| = 1 ist, sonst ist f1 (x) > 0. Damit sind die minimalen invarianten Mengen (−∞, −1), {1}, (−1, 1), {1} und (1, +∞). Die L¨ osungen sind in den offenen Intervallen streng monoton wachsend. Da f1 (x) ≥ x4 /2 gilt, falls |x| ≥ 2, sind die Existenzintervalle f¨ ur Anfangsur x0 < −1 von werte x0 > 1 von oben, f¨ unten beschr¨ankt. • Es ist f2 (x) ≥ f2 (0) = 1. Damit ist der Phasenraum R die einzige (nicht leere) invariante Menge, und es gibt insbesondere keine Fixpunkte. Die L¨osungen sind streng monoton wach2 send und existieren nur f¨ ur ein endliches Zeitintervall, denn f2 (x) ≥ x4 .
f 25 20 15
=
10 5 1
1
2
x
2. Die Differentialgleichung x˙ = f (x) f¨ ur f : (0, ∞) → R, x → xα besitzt die 1/β mit β := 1 − α L¨osungen x(t) = et x0 , falls α = 1, und x(t) = βt + xβ0 sonst. Letzteres berechnet man durch Trennung der Variablen und Anpassung der Integrationskonstanten an den Anfangswert x0 > 0. W¨ahrend also f¨ ur den linearen Fall α = 1 die L¨ osung f¨ ur alle Zeiten existiert, ist das f¨ ur α > 1 nur f¨ ur das Zeitintervall −∞ , xβ0 /|β| der Fall, f¨ ur α ∈ [0, 1) 2 nur f¨ ur t ∈ −xβ0 /β , +∞ . Aufgabe 3.19 auf Seite 40 (Picard–Lindel¨ of): 1 (a) Die von Satz 3.17 garantierte Maximalzeit ist ε(r) := min{r, N r(r) , 2L(r) } r := max{|f (x)| | x ∈ B (0)} = e und mit r > 0, Br (0) ⊆ Df = R, N (r) r Lipschitz–Konstante L(r) := Lip f Br (0) = er . 1 F¨ ur r = 12 erh¨alt man ε(r) = 2√ , und das ist der Maximalwert. e
(b) Die Picard–Iteration stellt man mit dieser Rekursionsformel auf: t t f xj (τ ) dτ = e−xj (τ ) dτ . x0 (t) := x0 = 0 und xj+1 := x0 + t0
0
558
H. L¨osungen der Aufgaben
(c) Die maximale L¨ osung des AWP ist ϕ : (−1, ∞) → R, ϕ(t) = log(1 + t). 2 Aufgabe 3.25 auf Seite 43: Die Funktion sin ist auf R (nicht aber auf C!) Lipschitz–stetig. Also besitzt das Anfangswertproblem x˙ = sin x, x0 = π/2 eine eindeutige L¨osung. Diese gewinnt man durch Trennung der Variablen: t = y x x 1 tan(x/2) dy = log tan 2 = log tan(π/4) , also x(t) = 2 arctan(et ). Dax0 sin y x0 mit ist lim x(t) = lim 2 arctan(y) = π und lim x(t) = 2 arctan(0) = 0. 2 t→∞
y→∞
t→−∞
Aufgabe 3.28 auf Seite 44 (Existenz des Flusses): 2n (a) F¨ ur eine beliebige Zahl n ∈ N von Freiheitsgraden ist H : R → R, H(x) := 2 −1
x eine Funktion, deren Subniveaumengen H (−∞, E] kompakte Vollkugeln sind. H ist die Hamilton–Funktion eines harmonischen Oszillators.
(b) • H ist Konstante der Bewegung, denn f¨ ur eine L¨osung ϕ : [−ε, ε] → R2n der hamiltonschen Differentialgleichung gilt 2n d ∂H ϕ(t) ϕ˙ j (t) = 0. H ϕ(t) = dt ∂xj j=1
ur E > 0. • Wir betrachten die Subniveaumenge PE := H −1 (−∞, E] f¨ Diese ist invariant unter dem hamiltonschen Fluss, denn H ist ja eine Konstante der Bewegung. Da Annahme kompakt ist, ist das PE nach Vektorfeld J ∇HPE mit J = 1l0n −10ln Lipschitz–stetig. Der hamiltonsche ur alle Zeiten definiert. Da E beliebig war und Fluss auf 7 PE ist damit f¨ R2n = E>0 PE , folgt die Vollst¨andigkeit des Vektorfelds auf R2n . 2 Aufgabe 3.30 auf Seite 45: Die lineare Differentialgleichung x ¨ = x besitzt als Basis des L¨osungsraums x± : R → R, x± (t) = exp(±t), also x± (0) = 1, x˙ ± (0) = ±1. F¨ ur die Anfangsbedingungen (x0 , x˙ 0 ) = (1, −1) ergibt sich also 2 die L¨osung x(t) = x− (t) = exp(−t), mit 0 = limt→∞ x(t). Aufgabe 3.41 auf Seite 50 (Fluchtzeit): Die hamiltonschen Differentialgleichungen lauten wie behauptet p˙ = −
m ∂H =− 2 ∂q q
,
q˙ =
∂H = p. ∂p
Wir haben die Erhaltungsgr¨ oße H(p, q) = 12 p2 − m = E, also q m q= 1 2 bzw. p = ± 2 E + m q . p −E 2 Gemeinsame L¨osung der Teile (a) und (b): • p0 > 0, E := H(p0 , q0 ) ≥ 0: Es ist √ √ m ur t ≥ 0 : q(t) ≥ q0 + t 2E. q(t) ˙ = 2 E + q(t) ≥ 2E , also f¨
H. L¨osungen der Aufgaben
559
Der linke Rand des Definitionsbereichs wird von q ∈ (0, ∞) also f¨ ur positive Zeiten nie erreicht. Weiter gilt f¨ ur t ≥ 0 und wieder p0 > 0, E ≥ 0 m q(t) ˙ = 2 E + q(t) ≤ 2(E + qm0 ) =⇒ q(t) ≤ q0 + t 2(E + qm0 ). Das bedeutet, dass f¨ ur p > 0, E ≥ 0 die Fluchtzeit TF = ∞ ist. − |E| wird mit Tren• p0 ≤ 0, E < 0. Die Differentialgleichung q˙ = − 2 m q nung der Variablen zu q q + d˜ t=− = g(q) − g(q0 ) 2
q0
m q˜ −|E|
3 q − |E|) + m arcsin(1 − 2|E| m ) , was f¨ ur mit g(q) = (2|E|)− 2 q 2|E| 2( m q m q ∈ (0, |E| ] definiert ist. F¨ ur q ! 0 erhalten wir die Fluchtzeit limq0 (g(q) − g(q0 )) = mπ 3 − g(q0 ). 2(2|E|) 2
• p0 > 0, E < 0. Die Differentialgleichung f¨ ur q lautet q˙ = l¨asst sich umschreiben zu q d˜ q t= = g(q0 ) − g(q). m q0 2 q˜ − |E|
2 m q − |E| und
Die Differentialgleichung verliert ihre G¨ ultigkeit bei 0 = q˙ =
2 m q − |E| ,
m m . Bis dahin vergeht die Zeit g(q0 ) − g( |E| ) = g(q0 ) + also wenn q = |E| mπ ¨bernimmt das Regime p0 ≤ 0, E < 0. Wir erhalten 3 , anschließend u 2(2|E|) 2
die Fluchtzeit g(q0 ) +
3mπ 3
2(2|E|) 2
.
• p0 ≤ 0, E = 0. Die Differentialgleichung q˙ = − 2 m q wird mit Trennung der Variablen zu t = −(2m)− 2 1
q
q0
3 3 23 2 3 q 2 − q02 ⇐⇒ q = q02 − 3t m q˜ d˜ q=− √ . 2 3 2m
Wir k¨onnen die Fluchtzeit
√ 3 √2 q 2 3 m 0
direkt ablesen.
+ E , und • p0 < 0, E > 0. Die Differentialgleichung lautet nun q˙ = − 2 m q das f¨ uhrt auf q d˜ q t=− = g(q) − g(q0 ) mit m q0 2 q˜ + E √ √ m g(q) = 4E2 √mE log m + 2Eq + 2q E m (q > 0). q + E − 2q q +E 3
3
Mit limq0 g(q) = m log(m)/(2E) 2 ist die Fluchtzeit g(q0 )+m log(m)/(2E) 2 .
560
H. L¨osungen der Aufgaben
osung des AWP x(0) = x0 ist eindeutig, (c) Ein Beispiel ist x˙ = x2 . Denn die L¨ x(t) = 0 ist eine L¨ osung, und f¨ ur x0 ∈ R \ {0} lautet sie (siehe Aufgabe 3.12) −1 x(t) = x−1 auf x−1 ur x0 < 0, bzw. − ∞, x−1 f¨ ur x0 > 0. 2 0 −t 0 , ∞ f¨ 0
Kapitel 4, Lineare Dynamik Aufgabe 0 0 0 4.11 auf Seite 63 (Matrixexponential): A = 1l + B mit B := 1 0 0 . Also ist der L¨ osungsoperator f¨ ur alle Zeiten t ∈ R 110
t
t
exp(At) = e exp(Bt) = e 1l + Bt +
1 2 2 B t 2
=e
t
1 00 t 10 t+t2 /2 t 1
2
.
Kapitel 5, Klassifikation linearer Fl¨ usse Aufgabe 5.5 auf Seite 77 (Index): Es ist 1 ein doppelter und −1 ein einfacher 1 1 −1 Eigenwert der Matrix A := 0 −1 2 . Die Matrix ist damit hyperbolisch und −2 −1 1
ihr Index ist 1. Es gilt B −1 AB = J mit −1 −1 1 2 1 2 1 1 B = 2 0 −2 , B −1 = 14 −4 −2 0 und Jordan–Matrix J = 0 1 2
1
0
0 0 0 0 −1
2 −1 2
Ein Fundamentalsystem der L¨ osungen ist also −1 −1 R t → et 2 , R t → et t 2 + 2
2
1 0 −1
,
R t → e−t
und die letzte davon bleibt f¨ ur t → +∞ beschr¨ankt.
1 −2 0
.
, 2
Aufgabe 5.12 auf Seite 83: (Hookesches Kraftgesetz) Es ist (At)2 = at2 ( 10 01 ), also exp(At) =
∞ ∞ ∞ (At)n (at2 )k (At2 )k = 1l + At . n! (2k)! (2k + 1)! n=0 k=0
k=0
√ (a) F¨ ur a > 0 und ω = a ist also √ √ sinh( at) cosh(ωt) sinh(ωt)/ω √ exp(At) = 1l cosh( at) + A = , ω sinh(ωt) cosh(ωt) a (b) F¨ ur a = 0 ist A2 = 0, also exp(At) = ( 10 1t ). √ (c) F¨ ur a < 0 ist mit ω = 2 −a sin(ωt) cos(ωt) exp(At) = 1l cos(ωt) + A = ω sin(ωt) ω
sin(ωt)/ω cos(ωt)
.
2
H. L¨osungen der Aufgaben
561
Kapitel 6, Hamiltonsche Gleichungen und Symplektische Gruppe Aufgabe 6.23 auf Seite 102 (Symplektische Algebra): u ist infinitesimal symplektisch. F¨ ur die darstellende Matrix U von uglich einer Basis, in der ul bez¨ dargestellt wird, gilt daher die symplektischen Bilinearform ω durch J = 10l −1 0 JU + U J = 0. Die Eigenwerte sind Nullstellen des charakteristischen Polynoms det(λ1l − U ) = det J(λ1l − U ) = det(λJ − JU ) = det λJ + U J = det (λ1l + U )J = det λ1l + U = det(λ1l + U ) = det(−λ1l − U ). Das charakteristische Polynom ist also gerade, und damit ist mit λ auch −λ Eigenwert. Da U nur reelle Eintr¨age hat, ist mit λ auch λ Eigenwert. Die Multiplizit¨aten der so zueinander geh¨ orenden Eigenwerte stimmen u ¨berein. Die gerade Multiplizit¨at der Null ergibt sich auch daraus, dass das charakteristische Polynom gerade ist. 2 Aufgabe 6.26 auf Seite 102 (Symplektische Matrizen): 0 −1l A B C −C 0 −1l A C + ( ) = (a) u J + Ju = B C D 1l 0 1l 0 D +A D
−A −D −B +B
.
(b) Dies folgt daraus, dass der folgende Ausdruck gleich Null ist: AB 0 −1l l A C ( C D ) − 10l −1 a J a − J = B 1l 0 0 D C A−A C C B−A D+1l C −A A B ) − 0 −1l = ( . = D C D 1l 0 D A−B C−1l D B−B D −B (c) SL(2, R) = {u ∈ Mat(2, R) | det u = 1} und die Bedingung aus (b) zeigen die erste Behauptung. Der dreidimensionale offene Volltorus ist S 1 × B. Wegen
cos(ϕ) − sin(ϕ) 1 | ϕ ∈ S SO(2) = sin(ϕ) cos(ϕ) ist die S 1 –Koordinate bereits identifiziert. Die positiven symmetrischen MaA B ) mit A > 0, B ∈ R trizen mit Determinante 1 lassen sich schreiben als ( B C 2 und C = 1+B A . Die Cayley–Transformation der riemannschen Zahlenkugel C ∪ {∞} → C ∪ {∞}
, z →
z−i z+i
bildet die Obere Halbebene {z = B + iA ∈ C | B ∈ R, A > 0} mit einem 1+w Diffeomorphismus (mit Inverser w → i 1−w ) auf die offene Einheitskreisscheibe B = {w ∈ C | |w| < 1} ab. b 2n = (a2 + b2 )n 1l ist (d) Wegen ab −a exp
a
b b −a
√ sinh a2 + b2 a b 2 2 √ a + b 1l + = cosh b −a . a2 + b 2
562
H. L¨osungen der Aufgaben √ Also ist tr(M ) = 2 cos(ϕ) cosh a2 + b2 . Die Formel 1 tr(M )2 − 4 det(M ) 2 tr(M ) ± f¨ ur die Eigenwerte einer Matrix M ∈ Mat(2, R) zeigt, dass die Eigenwerte der symplektischen Matrix M genau f¨ ur |tr(M )| = 2 einander gleich sind. 2
Aufgabe 6.34 auf Seite 107 (Lissajous–Figuren): 1. Das Frequenzverh¨altnis ist
ω2 ω1
=
Zahl der Maximalstellen von q2 . Zahl der Maximalstellen von q1
2. E := {Q ∈ R2 | H(0, Q) ≤ E} = {Q ∈ R2 | ω1 Q21 + ω2 Q22 ≤ 2E} ist das elliptische Hillsche Gebiet, aus dem wir den Anfangspunkt q w¨ahlen. Dann ist der Abschluss der Lissajous-Figur mit Anfangsbedingung (p, q), H(p, q) = E das Rechteck Rp := {Q ∈ R2 | |Qk | ≤ p2k + qk2 }. Die Vereinigung dieser Rechtecke ergibt die q2 Teilmenge des Ellipsengebiets E ∩ [−R1 , R1 ] × [−R2 , R2 ], q1 mit R1 := (2E − ω2 q22 )/ω1 und R2 := (2E − ω1 q12 )/ω2 . Kein Punkt q ∈ E außerhalb dieses Gebiets ist von q aus erreichbar, und f¨ ur q = 0 gibt es solche Punkte q . Das Analogon des Satzes von Hopf und Rinow gilt also nicht f¨ ur Hillsche Gebiete. 2 Aufgabe 6.38 auf Seite 110 (Verschlingungszahl): • Mit den Frequenzen ωk = nk ω0 ist die Bewegung des harmonischen Oszilla. Die Normalschwingungen auf der tors periodisch mit Minimalperiode T = 2π ω0 −1 onnen daher mit S 1 := R/T Z in der Energieschale ΣE = H (E), E > 0 k¨ Form + + 0 1 t) 2E cos(ω 2E cos(ω 1 2 t) 0 , c˜2 (t) = c˜k : S → ΣE , c˜1 (t) = 0 1 t) ω1 sin(ω ω2 sin(ω 2 t) 0 dargestellt werden. ΣE ⊂ R4 ist unter der linearen Abbildung √ √ √ √ (p1 , p2 , q1 , q2 ) −→ (2E)−1/2 ω1 p1 , ω2 p2 , ω1 q1 , ω2 q2 diffeomorph zu S 3 ⊂ R4 . Die Projektionen der Normalschwingungen seien mit cˆk : S 1 → S 3 bezeichnet. Diese projizieren 2 wir nun mit der stereographischen Abbildung aus Beispiel A.29.3 auf R3 . Es ergeben sich als Bildkurven der cˆk cos(ω1 t) − sin(ω1 t) 0 0 c1 : S 1 → R3 , c1 (t) = 2 , also c1 (t) = 2ω1 sin(ω1 t)
π
cos(ω1 t)
2 Dass c ˆ2 (t) f¨ ur t = 2 + 2πk /ω2 , k ∈ Z gleich dem Nordpol (0, 0, 0, 1) ∈ S 3 ist, st¨ ort bei der Integration nicht.
H. L¨osungen der Aufgaben c2 : S 1 → R3 ∪ {∞}, c2 (t) =
563 2 1−sin(ω2 t)
0 cos(ω2 t) 0
, also c2 (t) =
2 Damit ist Δc(t) = c1 (t1 ) − c2 (t2 ) = 2 1−sin(ω und 2 t2 ) ⎞ ⎛ √ cos(ω1 t1 ) 1−sin(ω2 t2 ) √ 1 ⎝ − cos(ω2 t2 )/ 1−sin(ω2 t2 ) ⎠ . G(t1 , t2 ) = √ √ 2 sin(ω1 t1 ) 1−sin(ω2 t2 )
2ω2 1−sin(ω1 t)
0 1 0
.
F¨ ur die Verschlingungszahl (6.3.8) der beiden Kurven erhalten wir also wegen det DG(t) = −ω1 ω2 1 − sin(ω2 t2 ) ω 1 ω2 T T LK(c1 , c2 ) = − √ 1 − sin(ω2 t2 ) dt1 dt2 4π 8 0 0 n 1 ω2 T = − √ 1 − sin(ω2 t2 ) dt2 = −n1 n2 . 4 2 0 • F¨ ur beliebige Paare voneinander verschiedener periodischer Trajektorien in ΣE existiert eine stetige Homotopie der Anfangsbedingungen, die diese mit c˜1 (0) beziehungsweise c˜2 (0) verbindet und dabei Gleichheit der deformierten Orbits vermeidet. In der Abbildung sind dieWerte der Abbildung F1 (x) mit den Konstanten ΣE → R2 , x → F 2 (x) der Bewegung Fk aus (6.3.4) aufgetragen. Es ergibt sich eine Strecke, denn 3
f2
f1
Fk ≥ 0 und F1 + F2 = H. Die Wirkung der Homotopie auf die Werte von F sind durch Pfeile angedeutet. • In der Abbildung auf Seite 108 entspricht dem horizontalen Kreis die projizierte Normalschwingung c1 , der vertikalen Gerade c2 . Diese Zuordnung ¨andert sich 2 auch f¨ ur voneinander verschiedene Frequenzen (n1 = n2 ) nicht. Aufgabe 6.40 auf Seite 112 (Dispersionsrelation): (a)
(a) Ist f¨ ur den Ansatz q (t) := c(a) exp(2πik/n + iωk t) das Verh¨altnis λ := (2) (1) c /c , dann ergibt sich aus den Gleichungen f¨ ur die Impuls¨anderungen (a) (a) p˙ = −ωk2 m(a) q das gekoppelte System ωk2 m(1) = c[2 − λ(e2πik/n + 1)]
, ωk2 m(2) = c[2 − λ−1 (e−2πik/n + 1)].
Die quadratische Gleichung f¨ ur die quadrierten Frequenzen ωk2 lautet daher 2πk 2c 2c 2 2 2 1 + cos n ωk − (1) = 0. ωk − (2) − 2c m m m(1) m(2) 3 Die
Endpunkte der Strecke sind die F –Werte der Normalschwingungen.
564
H. L¨osungen der Aufgaben Ihre L¨osungen sind die beiden Zweige der Dispersionsrelation.
(b) Aus den Gleichungen (6.3.11) f¨ ur die Frequenzen ωk , also ωk2 =
2 cr 1 − cos(2πk r/n) m
(k ∈ L)
r∈L
ergibt sich durch Fourier–Transformation bez¨ uglich der Gruppe L = Z/nZ die Bestimmungsgleichung f¨ ur die Kopplungskonstanten cr : Nur die Summen ein, und diese sind proportional zu cr + c−r gehen in die Wechselwirkung
den Fourier–Koeffizienten ω ˆ r2 := k∈L ωk2 exp(2πik r/n). 2 Aufgabe 6.42 auf Seite 115 (Obere Halbebene und M¨ obius–Transformationen): 2z > 0 zu u (a) Wir haben Im M ufen. ¨berpr¨ 2z = 1 az+b − az+b = 1 (az+b)(cz+d)−(cz+d)(az+b) Im M 2 2i cz+d cz+d 2i |cz+d| =
ad Imz − bc Imz |cz + d|
Imz
det M =1
=
2
(b) Seien M, M ∈ SL(2, R) und z ∈ H. Es ist M −1 = a d−bc b d−bd . ac −a c ad −b c
2
|cz + d|
>0
d −b −c a
und M −1 M =
z+b d ac z+d d(a z + b ) − b(c z + d ) a z + b − b −1 M −1 2 z = M = M = a z+b c z + d −c(a z + b ) + a(c z + d ) −c c z+d + a
=
(a d − bc )z + b d − bd −1 M z, = M
(ac − a c)z + ad − cb
also handelt es sich um eine Gruppenwirkung. (c) Wir setzen die Fixpunktgleichung an: 2z = az + b ⇐⇒ (cz + d)z = az + b ⇐⇒ cz 2 + (d − a)z − b = 0 z=M cz + d Diese quadratische Gleichung hat die Diskriminante (d − a)2 + 4bc = (tr M )2 − 4. • F¨ ur eine elliptische Matrix ist die Diskriminante negativ, also existiert genau ein Fixpunkt in H. • F¨ ur eine parabolische Matrix verschwindet die Diskriminante, also existiert ein (doppelter) Fixpunkt in R ∪ {∞}, letzteres passiert bei c = 0. • F¨ ur eine hyperbolische Matrix erhalten wir zwei Fixpunkte in R ∪ {∞}, denn die Diskriminante ist positiv. Im Fall c = 0 ist einer von ihnen ∞.
H. L¨osungen der Aufgaben
565
(d) Die M¨obius–Transformationen zu M1 := 21 : z → a2 z + ab M
a
b 0 a−1
und M2 :=
0 c −c−1 0
sind
2 22 : z → c2 z −1 = c z = c2 x − iy . und M 2 x2 + y 2 |z|
Ihre Ableitungen bei z = x + iy ∈ H sind 21 (x, y) = DM
a2 0 0 a2
22 (x, y) = und DM
(x2
2 2 c2 y −x 2 2 2xy +y )
−2xy y 2 −x2
.
2∗ g = (a2 y)−2 (a4 dx ⊗ dx + a4 dy ⊗ dy) = g Wir transportieren die Metrik. M 1 und mit v = (vx , vy ) ∈ Tz H:
2∗ g (z)(v, v) = g M 22 z DM 22 v, DM 22 v M 2 2 2 2 c2 (x2 + y 2 )2 (y −x )vx −2xyvy = 2 2 (c2 y)2 (x2 + y 2 )2 2xyvx +(y −x )vy ((y 2 − x2 )vx − 2xyvy )2 + (2xyvx + (y 2 − x2 )vy )2 = y 2 (x2 + y 2 )2
(y 2 − x2 )2 (vx2 + vy2 ) + 4x2 y 2 (vx2 + vy2 )
v 2 = = g(z)(v, v). y 2 (x2 + y 2 )2 y2 Die u uften Matrizen erzeugen SL(2, R). Denn falls M = ac db ∈ ¨berpr¨ SL(2, R) nicht von der Form M1 ist, dann ist c = 0. Ist dann M nicht von der a = 0 oder d = 0. Durch Konjugation erreicht 0Form M2 ,0 dann ist −d c 1 1 man −1 0 M −1 0 = b −a , Durch nachfolgende Multiplikation mit einer Matrix vom Typ M1 kann manden rechten oberen Eintrag Null setzen. 0 1 Nochmalige Konjugation mit −1 0 erzeugt eine Matrix vom Typ M1 . =
Damit ist g unter allen M¨ obius–Transformationen invariant. (e) folgt aus Aufgabe 6.26 (a). 2 4 · zz33 −z ist genau dann (f) Das Doppelverh¨altnis DV (z1 , z2 , z3 , z4 ) := zz11 −z −z4 −z2 reell, wenn die vier Punkte z1 , z2 , z3 , z4 ∈ C auf einem Kreis liegen. 0 1 0 1 cos t sin t • m = −1 = − sin t cos t ist elliptisch (außer bei t ∈ 0 : exp t −1 0 πZ) mit Fixpunkt i ∈ H. Die Orbits sind Kreise in H, siehe Abbildung H.1, links. • m = ( 01 00 ): exp t ( 01 00 ) = ( 1t 01 ) ist parabolisch (nur bei t = 0 gleich ( 10 01 )) mit Fixpunkt 0 ∈ ∂H. Der Abschluss eines Orbits ist ein Kreis, der am Ursprung tangential an ∂H ist, siehe Abbildung H.1, Mitte. t sinh t • m = ( 01 10 ): exp t ( 01 10 ) = cosh ist hyperbolisch (außer bei sinh t cosh t t = 0) mit Fixpunkten −1, 1 ∈ ∂H. Die Orbits sind durch die Fixpunkte begrenzte Kreissegmente, siehe Abbildung H.1, rechts. 2
566
H. L¨osungen der Aufgaben 3
2
y
1
2
1
0
1 x
2.5
2.5
.0
2.0
1.5
1.5
1.0
1.0
0.5
0.5
2 1.5
1.0
0.5
0
0.5
1.0
1.5
1.5
1.0
0.5
0
0.5
1.0
1.5
Abbildung H.1: Orbits der Gruppen aus 6.42 (f) durch die Punkte 1 + i, 3i und i/2. Links: elliptisch, Mitte: parabolisch, Rechts: hyperbolisch Aufgabe 6.45 auf Seite 117 (Symplektische Abbildungen und Unterr¨ aume): (a) Da die antisymmetrische Bilinearform ω : E × E → R des 2n–dimensionalen Vektorraums E nicht degeneriert ist, gibt es f¨ ur v, w ∈ E\{0} nach dem linearen Satz von Darboux (Satz 6.13.2) sogar zwei Basen d1 , . . . , d2n und e1 , . . . , e2n von E mit d1 = v, e1 = w und ω(dk , d ) = ω(ek , e ) = δk+n,
(1 ≤ k ≤ ≤ 2n).
(H.1)
Die lineare Abbildung f : E → E, die durch den Basiswechsel f (dk ) := ek (k = 1, . . . , 2n) definiert wird, ist in Sp(E, ω). (b) Sei E := R4 mit kanonischer Basis e1 , . . . , e4 und symplektischer Form ω, die durch ω(ek , e ) = δk+2, (1 ≤ k ≤ ≤ 4) festgelegt ist. Dann ist F := span(e1 , e2 ) lagrangesch, F := span(e1 , e3 ) symplektisch. Daher gibt es kein f ∈ Sp(E, ω) mit f (F ) = F . (c) Seien F, F ⊆ E symplektisch und von gleicher Dimension 2m. Der Beweis von Satz 6.13.2 liefert die Existenz von Basen d1 , . . . , d2n und e1 , . . . , e2n von E mit (H.1) und d1 , . . . , d2m ∈ F , e1 , . . . , e2m ∈ F . Die durch f (dk ) := ek definierte Abbildung f ∈ Sp(E, ω) bildet also F auf F ab. 2 Aufgabe 6.47 auf Seite 118 (Dimensionsformel): Ist f1 , . . . , fm eine Basis von F ⊆ E, dann sind wegen der Nichtdegeneriertheit von ω die Linearformen ∗ f1∗ , . . . , fm ∈ E ∗ , fk∗ (e) := ω(fk , e) f¨ ur e ∈ E, linear unabh¨angig. Also ist ∗ F ⊥ = {e ∈ E | f1∗ (e) = . . . = fm (e) = 0}
von Dimension dim(F ⊥ ) = dim(E) − dim(F ).
2
∼ Aufgabe 6.53auf Seite 121 (SO(3) = RP(3)): • Die Rodrigues–Parametrisier∞ 3 ung A ∈ C Bπ , SO(3) aus (E.3.3) ist surjektiv und, eingeschr¨ankt auf die offene Vollkugel vom Radius π, ein Diffeomorphismus auf das Bild. Dies sieht man zum Beispiel, indem man nachpr¨ uft, dass f¨ ur x ∈(0, π) die Invertierung von A(x) durch
r 2 sin(r) (A(x)
− A(x) ) mit r := arccos
tr(A(x))−1 2
erfolgt.
H. L¨osungen der Aufgaben
567
Auch bei x ∈ ∂Bπ3 , also x = π ist A ein lokaler Diffeomorphismus. Bei Identifikation ∼ der Antipoden der Zwei–Sph¨are ∂Bπ3 ist A sogar injektiv. • Andererseits ist Bπ3 / ∼ diffeomorph zu RP (3). Denn unter einer (mit π/2 skalierten) stereographischen Projektion S 3 \{(0, 0, −1) } → R3 ist Bπ3 als berandete Mannigfaltigkeit diffeomorph zur Nordhalbkugel {x ∈ S 3 | x3 ≥ 0}, siehe Beispiel A.29.3. Außerdem hat jede Ursprungsgerade des R3 (also jedes Element von RP (3)) genau einen Schnittpunkt mit der Nordhalbkugel, bis auf ¨ 2 diejenigen, die den Aquator {x ∈ S 3 | x3 = 0} an Antipoden treffen. Aufgabe 6.59 auf Seite 124 (Maslov–Index): 1. F¨ ur u ∈ Λk (m) = {u ∈ Λ(m) | dim(u ∩ v) = k} mit v = Rm p × {0} setzen wir uv := u ∩ v. F¨ ur w ∈ Gr(v, k) besteht die Faser πk−1 (w) also aus den u ∈ Λk (m) mit uv = w. Diese l¨asst sich durch den Unterraum Sym(w ⊥ ) der selbstadjungierten Abbildungen von w⊥ := {x ∈ Rm | ∀ y ∈ w : x, y = 0} in sich parametrisieren, denn deren Graph ist lagrangesch, und der symplektische Vektorraum (Rm × Rm , ω0 ) ist die direkte Summe seiner symplektischen Unterr¨aume w × w und w ⊥ × w ⊥ . , denn dim w⊥ = m − k. Andererseits ist dim Sym w⊥ = m−k+1 2 Trivialisierung des B¨ undels πk : Λk (m) → Gr(v, k) ist u ¨ber einer Umgebung von w ∈ Gr(v, k) durch Orthogonalprojektion m¨oglich. Da die Dimension des Totalraums eines B¨ undels die Summe der Dimensionen von Basis und typischer Faser ist, folgt mit dim Gr(v, k) = k(m − k) (Satz 6.51) k+1 − 2 . dim Λk (m) = k(m − k) + 12 (m − k + 1)(m − k) = m+1 2 2. Die unter 1. gezeigte Parametrisierung von Λ0 (m) durch Sym(Rm ) zeigt, ur k ≥ 2, dann kann man in dass Λ0 (m) ⊂ Λ(m) offen ist. Ist u ∈ Λk (m) f¨ uv ∈ Gr(v, k) eine orthogonale Zerlegung uv = a⊕b in einen eindimensionalen Unterraum a und einen (k − 1)–dimensionalen Unterraum b w¨ahlen. Damit wird uv durch die Folge der Lagrange–Unterr¨aume ({0} × a) ⊕ Graph(n1lb )
(n ∈ N)
approximiert, mit der identischen Abbildung 1lb : b → b.
2
Aufgabe 6.61 auf Seite 125 (Wertebereich des Maslov-Index): • F¨ ur m = 1 und I ∈ Z hat die Abbildung c : S 1 → Λ(1) , z → spanR z I/2 ⊂ C ∼ = R2 den gew¨ unschten Maslov–Index I. Dabei wurde von der Schreibweise S 1 = {z ∈ C | |z| = 1} und Λ(1) = {spanR (z) | z ∈ S 1 } Gebrauch gemacht. Man beachte,
568
H. L¨osungen der Aufgaben
ur ungerade I wohldefiniert ist. dass spanR z I/2 auch f¨ • F¨ ur m > 1 bettet man Λ(1) in Λ(m) ein, etwa mit Λ(1) → Λ(m)
, u → u ⊕ Rm−1 × {0}.
2
Aufgabe 6.62 auf Seite 125 (Harmonischer Oszillator): Eine solche geschlossene L¨osungskurve c˜ : S 1 → F −1 (f ) ⊂ R4 ist f¨ ur f = (f1 , f2 ) mit fi > 0 und ki = 2fi /ωi gegeben durch c˜(t) = k1 sin(ω1 (t−t1 )), k2 sin(ω2 (t−t2 )), k1 cos(ω1 (t−t1 )), k2 cos(ω2 (t−t2 )) . Der invariante Phasenraum-Torus F −1 (f ) projiziert auf ein Rechteck des Konfigurationsraums. Entlang der Kurven {(0, k2 sin ϕ, ±k1 , k2 cos ϕ) | ϕ ∈ [0, 2π]} und {(k1 sin ϕ, 0, k1 cos ϕ, ±k2 ) | ϕ ∈ [0, 2π]} ist diese Projektion vertikal. Diese Kurven werden von c˜ innerhalb einer Periode [0, T ] mit T = ω6π1 = 10π ω2 sechsmal beziehungsweise zehnmal, also insgesamt 16–mal getroffen. Man sieht der Projektion t → k1 cos(ω1 (t−t1 )), k2 cos(ω2 (t−t2 )) von c˜ auf dem Konfigurationsraum an, dass die 1–Komponente sechs, die 2–Komponente zehn Extrema besitzt. 2
Kapitel 7, Stabilit¨ atstheorie Aufgabe 7.4 auf Seite 130 (Starke Stabilit¨ at): Zun¨achst einmal ist XH : Rt × R2x → R2 , XH (t, x) = 10 −f0(t) x das zeitabh¨angige hamiltonsche Vektorfeld zu H. Die Differentialgleichung ist ugt damit nach Satz 4.14 f¨ ur alle Zeiten l¨ osbar, denn XH ist linear in x und gen¨ einer Lipschitz–Bedingung. (a) Gegenbeispiel zur Gruppeneigenschaft: F¨ ur die 2–periodische charakteristische Funktion f := 1l[0,1]+2Z ist die eindeutige Existenz der L¨osung weiterhin gesichert, denn die Lipschitz–Bedingung bezieht sich nur auf x (siehe die Bemerkung 3.24.3). Wir k¨ onnen die Differentialgleichung st¨ uckweise l¨osen: cos(t) − sin(t) x(t) = Mk ({t})x( t) mit M0 (t) := sin(t) cos(t) , M1 (t) := ( 1t 01 ) und k := 0 f¨ ur gerade t, k := 1 f¨ ur ungerade t. Es ist M02 (1) = M0 (1)M1 (1). (b) F¨ ur s = 0 gilt ΦT +s = Φ0 ◦ ΦT , denn Φ0 = Id. Weiter gilt d ΦT +s (x) = XH T + s, ΦT +s (x) = 01 −f0(s) ΦT +s (x), ds denn f (T + s) = f (s), sowie d Φs ◦ ΦT (x) = XH s, Φs ◦ ΦT (x) = 01 −f0(s) Φs ◦ ΦT (x). ds ullen also dasselbe Die Funktionen s → Φs ◦ ΦT (x) und s → ΦT +s (x) erf¨ eindeutig l¨osbare Anfangswertproblem, und daher stimmen sie u ¨berein.
H. L¨osungen der Aufgaben
569
ur alle t ∈ R linear, denn f¨ ur t = 0 ist (c) Die Abbildung Φt : R2 → R2 ist f¨ Φ0 = Id, was sicher linear ist, weiter gilt d Φt (λx + y) = XH t, Φt (λx + y) = 01 −f0(t) Φt (λx + y) dt d und dt λΦt (x) + Φt (y) = λXH t, Φt (x) + XH t, Φt (y) = 10 −f0(t) λΦt (x) + Φt (y) . Die Funktionen erf¨ ullen dasselbe Anfangswertproblem, stimmen also u ¨berein. d Die Wronski–Determinante t → det Φt besitzt die Ableitung dt det Φt = −1 ˙ tr det(Φt )Φ−1 t Φt = det(Φt )tr Φt XH (t)Φt = det(Φt )tr XH (t) = 0. Wegen det Φ0 = 1 folgt insbesondere det A = 1. Mit J = 10 −1 ist 0 tr XH (t) = tr JB(t) = tr B (t)J = −tr B(t)J = −tr JB(t) = 0.
(d) Wenn die Nulll¨ osung des hamiltonschen Flusses Liapunov–stabil ist, dann ist 0 auch Liapunov–stabiler Fixpunkt der Abbildung A, denn es ist ja Ψ = ΦZ×R2 . Zur Umkehrung sei κ := (sup{ Φs | s ∈ [0, T ]})−1 und eine Umgebung U von 0 ∈ R2 gegeben. Wir w¨ahlen ε > 0, so dass Bε (0) ⊆ U und mit Hilfe der Liapunov–Stabilit¨at von Ψ ein δ > 0, so dass Ψ(n, x0 ) ∈ Bεκ (0) f¨ ur alle n ∈ N0 und f¨ ur alle Anfangsbedingungen x0 ∈ Bδ (0). F¨ ur t = nT + s mit n ∈ N0 und s ∈ [0, T [ erhalten wir
Φt (x) = Φs (Ψ(n, x)) ≤ Φs
Ψ(n, x) ≤ κ−1 εκ = ε. Damit ist Φ Liapunov–stabil. (e) Zun¨achst einmal ist Ψ Liapunov–stabil, wenn |tr(A)| < 2 erf¨ ullt ist, denn das charakteristische Polynom von A lautet χA (λ) = λ2 − λ trA + det A det A=1 1 1 1 1 2 2 = λ − 2 trA + i 1 − ( 2 trA) λ − 2 trA − i 1 − ( 2 trA) . Die Eigenwerte von A haben Betrag 1, wie man leicht nachrechnet. Damit ist A eine Drehung und Liapunov–stabil. 0 ˜ | H ˜ − H < δ} (t ∈ R) und U := {H Wir setzen B(t) := 10 f (t) ˜ mit noch zu bestimmendem δ > 0. Sei nun K := sup{ Φ−1 s , Φs | s ∈ ˜ von H ˜ ∈ U generiert.}. Es ist K < ∞, denn [0, T ], Φ t t ˜0 + ˜ 0 + ˜ Φ(s) ˜ ˜ ˜ ≤ Φ ˜ t = Φ J B(s) ds
B(s)
Φ(s)
ds
Φ 0
t
˜ ( B(s) + δ) Φ(s)
ds,
≤1+ 0
0
570
H. L¨osungen der Aufgaben und das Lemma von Gronwall verr¨at uns nun t ˜ t ≤ exp
Φ ( B(s) + δ) ds ≤ exp 0
T
( B(s) + δ) ds. 0
Wir vergleichen die beiden Zeitentwicklungen: d −1 ˜ ˙ = Φ−1 J B(t) − B(t) −1 ˜ −1 ˜ ˜ ˜t ˙ (Φt Φt ) = Φ−1 Φ Φ + Φ Φ Φ Φ t t t t t t t dt und erhalten t d −1 ˜ ˜ ˜
Φt − Φt ≤ Φt
Φt Φt − 1l = Φt (Φ−1 s Φs ) ds ds 0 t 3 ˜ ˜
Φ−1 ≤ Φt
t B(t) − B(t) Φt ds ≤ K T δ. 0
˜ Liapunov–stabil, und der FixWegen der Stetigkeit der Spur sind alle Φ punkt 0 ist stark stabil. Matrizen mit absoluter Spur kleiner 2 heißen auch elliptisch. (f) F¨ ur ε = 0 reduziert sich die Differentialgleichung zu x ¨(t) = −ω 2 x(t), und der Fluss hat die Form cos(ωt) −ω sin(ωt) . Φt = ω −1 sin(ωt) cos(ωt) Es ist T = 2π, und entsprechend ist cos(2πω) −ω sin(2πω) A = Φ2π = ω−1 sin(2πω) cos(2πω) mit |tr(A)| = 2|cos(2πω)| < 2, weil 2ω ∈ Z.
2
Aufgabe 7.8 auf Seite 132 (Liapunov–Funktion): d V (x(t)) = − x(t) 4 < 0 (a) Es ist ∇V (x) = x und f1 (x) = − x 2 x, also dt 2 f¨ ur x ∈ R \ {0}. Der Ursprung ist damit asymptotisch stabil.
(b) Wegen f2 = −f1 ist der Ursprung instabil. 2 d (c) Die Form f3 (x) = (1+x1 ) −x V (x(t)) = x1 des Vektorfeldes impliziert, dass dt 0 ist, die Orbits also in Kreisen um den Ursprung enthalten sind. Jeder Punkt auf der Gerade x1 = −1 entspricht einem Orbit, ebenso die Kreissegmente, die durch Schnitt dieser Kreise mit den Halbebenen (−1, ∞) × R und (−∞, −1) × R entstehen. (d) V : R3 → R, x → 12 x 2 ist eine Liapunov–Funktion, mit f4 (x), ∇V (x) = −x21 x 2 − x42 − x63 < 0 Also ist 0 ∈ R3 asymptotisch stabil.
f¨ ur x ∈ R3 \ {0}.
H. L¨osungen der Aufgaben
571
cos t − sin t 0 0 −1 0 (e) Es ist A := Df (0) = 1 0 0 , also exp(At) = sin t cos t 0 . Der Ur0 0 0 0 0 1 sprung dieses linearisierten Systems ist damit liapunov–stabil, aber nicht asymptotisch stabil. Insbesondere besteht die x3 –Achse aus Fixpunkten. 2 Aufgabe 7.21 auf Seite 141 (Parametrisierte periodische Orbits): Nach Annahme ist die Abbildung (t, m, p) → Φpt (m) n-mal stetig differenzierbar, und f¨ ur Parameterwert p0 ∈ P gibt es nach Satz 7.17 eine Poincar´e–Abbildung von Φp0 beim Punkt m ∈ M des Φp0 –periodischen Orbits. Es folgt aus einem Transversalit¨atsargument die Existenz einer Umgebung P˜ ⊆ P von p0 und einer zu allen Fl¨ ussen Φp , p ∈ P˜ transversalen Hyperfl¨ache S ⊂ M durch m. Damit existieren auch eine in S offene Umgebung U ⊂ S von m, und Poincar´e–Zeiten T˜ : U × P˜ → R+ mit F p (u) := Φp T˜(u, p), u ∈ S. Nach Voraussetzung ist F p0 (m) = t0 , und T˜, also auch (u, p) → F p (u) sind in C n . Ebenfalls ist nach Voraussetzung 1 kein Eigenwert von DF p0 (m). Damit n ˜ ur erhalten 0 ) = m, f¨ wir mit Satz 7.12 eine Abbildung X ∈ C (P , S), mit X(p p 4 die F X(p) = X(p) ist, die also den Fixpunkt parametrisiert. Ebenso k¨onnen wir annehmen, dass DF p X(p) keinen Eigenwert 1 besitzt. Die Minimalperiode t : p˜ → (0, ∞) ist die durch t(p) = T˜ X(p), p definierte Abbildung. Es kann zwar in beliebigen kleinen Umgebungen vom X(p) weitere periodische Orbits geben, aber nicht mit einer nahe bei t(p) liegenden Minimalperiode. 2
Kapitel 8, Variationsprinzipien Aufgabe 8.5 auf Seite 146 (Legendre–Transformation): ur q ∈ R d (a) Wegen r > 1 ist H ∈ C 1 (Rd , R) und strikt konvex. Wir suchen f¨ d den Vektor pˆ = pˆ(q) ∈ R mit = 0. ∇p p, q − H(p) p=pˆ
r−2
p
Wegen ∇H(0) = 0 ist pˆ(0) = 0. Sonst gilt q = ˆ p pˆ, also q = ˆ s−1 oder mit (r − 1)(s − 1) = 1: ˆ p = q . Daher ist pˆ =
q
ˆ p
r−2
=
q
rs=r+s
(r−2)(s−1)
q
=
q
s−2
r−1
q.
Damit k¨onnen wir H ∗ ausrechnen: s−2 s−2 s (s−1)r s = 1s q . H ∗ (q) = q, q q − H q q = q − 1r q
(b) Wir gehen wie in (a) vor. 0 = ∇p p, q − H(p) 4 Hier
p=pˆ
= q − Aˆ p − b,
und im Weiteren m¨ ussen gegebenenfalls Definitionsbereiche wie P˜ verkleinert werden.
572
H. L¨osungen der Aufgaben also q = Aˆ p + b oder pˆ = A−1 (q − b). Und wieder berechnen wir H ∗ : H ∗ (q) = q, A−1 (q − b) − H A−1 (q − b) = q, A−1 (q − b) − 12 A−1 (q − b), AA−1 (q − b) − b, A−1 (q − b) − c = q − b, A−1 (q − b) − 12 q − b, A−1 (q − b) − c = 12 q − b, A−1 (q − b) − c.
2
Aufgabe 8.8 auf Seite 148 (Legendre-Transformation): v cos ϕ−v r sin ϕ (a) Polarkoordinaten: x = r cos ϕ, y = r sin ϕ, v = vrr sin ϕ+vϕϕr cos ϕ . v ˜ x(r,ϕ) , vr cos ϕ−vϕ r sin ϕ L(( ϕr ) , ( vϕr )) = L = 12 (vr2 + r2 vϕ2 ) − U (r). vr sin ϕ+vϕ r cos ϕ y(r,ϕ) Die Legendre–Transformierte davon lautet H(( ϕr ) , ( ppϕr )) = 12 p2r + r−2 p2ϕ + U (r). (b) Es ist ∇v L(q, v) = mv + ec A(q), also folgt sup p, v − L(q, v) | v ∈ R2 1 = p, m (p − ec A(q)) −
=
1 2m p
1 2m p
2
− ec A(q) + eφ(q) −
e cm p
− ec A(q), A(q)
2
− ec A(q) + eφ(q).
2
Aufgabe 8.12 auf Seite 152 (Perle am Draht): (a) Zum Zeitpunkt t ∈ R wird der parabolische Draht parametrisiert durch w −→ q˜(t, w) =
w cos(ωt) w sin(ωt) α2 2
.
w2
Ist der Parameterwert gleich w(t), dann ist f¨ ur q(t) := q˜ t, w(t) ⎞ ⎛ w(t) ˙ cos(ωt) − ωw(t) sin(ωt) ˙ sin(ωt) + ωw(t) cos(ωt) ⎠ , q(t) ˙ = ⎝ w(t) ˙ α2 w(t)w(t) also q
˙ 2 = w˙ 2 +w 2 ω 2 +α4 w2 w˙ 2 . Die nicht explizit zeitabh¨angige Lagrange– Funktion besitzt damit die Gestalt 2 4 2 w w˙ 2 + m − gα2 w2 . L(w, w) ˙ = m 2 1+α 2 ω Der zu w konjugierte Impuls ist pw = D2 L(w, w) ˙ = m(1 + α4 w2 )w. ˙ Damit 2 2 ist die Hamilton–Funktion f¨ ur c := gα − ω gleich H(pw , w) =
p2w + V (w) 2m(1 + α4 w2 )
mit
V (w) =
2 m 2 cw .
H. L¨osungen der Aufgaben
573
(b) Die Linearisierung A := DXH (0) des hamiltonschen Vektorfelds XH = −D2 H 0 −mc 1 . Damit ist det(A) = am Ursprung ist von der Form A = 0 D1 H m c. F¨ ur c > 0 (d.h. langsame Rotation) ist daher die Ruhelage (pw , w) = (0, 0) ein elliptischer Fixpunkt und die Bewegung Liapunov–stabil. (c) F¨ ur langsame Rotation (c > 0) wird die Periode der Librationsbewegung in Abh¨angigkeit von der Energie E durch wmax + √ dw 2(E−β 2 w2 ) E mit w(E, ˙ w) = m(1+α T (E) = 4 4 w 2 ) und wmax = β w(E, ˙ w) 0 bestimmt. Es ergibt sich √ √ H 4 2 y 8m 1 1+ Eα 8m π/2 β2 T (E) = dy = 1+ 1−y 2 β β 0 0
Eα4 β2
sin2 θ dθ.
2
Aufgabe 8.20 auf Seite 156 (Beispiel zur Nichtminimalit¨ at des Wirkungsfunktionals): (a) Die Extremalen erf¨ ullen die Euler–Lagrange–Gleichung (8.3.4), also q¨ = −(0, q2 ) . Die L¨ osungsschar mit Anfangsbedingung q(0) = 0 hat die Form (t ∈ R). q(t) = c2v1sint t F¨ ur T ∈ R\πZ kann nur dann q(T ) = 0c sein, wenn v1 = Tc und c2 = 0 gilt. Ist dagegen T ∈ πZ\{0}, dann erhalten wir die einparametrige L¨osungsschar q(t) = Tc t, c2 sin t . (b) Die Variation des Wirkungsfunktionals in Richtung δq ist X(δq)
=
1 2
=
1 2
T 0
% c & 2 c 2 T + δ q(t) − T − δq 2 (t) dt ˙ 2 0 0
T 2 [ δ q(t)
˙ − δq22 (t)] dt + 0
0
T
)
c T
0
* , δ q(t) ˙ dt.
- c
. Das zweite Integral ist gleich T0 , δq(T ) − δq(0) = 0. F¨ ur die angegebene πnt
∞ π Variation ist δ q˙2 (t) = T n=1 ncn cos T , also ist X(δq) gleich ∞ n=1
T
c2n 0
/
π2 2 n cos2 T2
πnt T
− sin
2
πnt T
0
∞ c2n 2 2 dt = (π n − T 2 ). 2T n=1
F¨ ur T ∈ lπ, (l + 1)π und l ∈ N0 ist π 2 n2 < T 2 genau dann, wenn n ≤ l gilt. Auf dem durch ck = 0 (k > l) bestimmten Unterraum ist also X negativ definiert, aber es gibt keinen h¨ oherdimensionalen solchen Unterraum von Variationen. 2
574
H. L¨osungen der Aufgaben
Aufgabe 8.21 auf Seite 159 (Tautochronen-Problem): Die Zeit, die zwischen dem Start am Punkt (x0 , y0 ) und der Ankunft am tiefsten Punkt (r, −2r) vergeht, ist analog zu (8.3.6) H r+ r 1 + Y (x)2 r T˜(y0 ) := dx = dx, 2g(y0 − Y (x)) gY (x)(Y (x) − y0 ) x0 (y0 ) x0 denn die Startgeschwindigkeit ist 0. Bei der Umformung wurde die Differentialgleichung (8.3.7) der Brachistochrone verwandt. Substitution der y–Variable ergibt T˜(y0 ) =
−2r
+
y0
dy r gy(y − y0 ) −1 −
2r y
−2r
+
= y0
r dy. g(−y − 2r)(y − y0 )
y0 −y Substitution von z := 2r+y , also y = y0 − z(2r + y0 ), ergibt 0 1 r T˜(y0 ) = dz = π r , unabh¨angig von y0 . 0
gz(1−z)
g
2
Aufgabe 8.23 auf Seite 161 (L¨ angenfunktional und Euler–Lagrange-Gleichung in Polarkoordinaten): (a) Die Polarkoordinaten (r, ϕ) ∈ (0, ∞) × (−π, π) der geschlitzten Ebene stehen zu den kartesischen Koordinaten in der Beziehung x1 = r cos ϕ, x2 = r sin ϕ. Es ist also ˙ sin ϕ , x˙ 2 = r˙ sin ϕ + ϕr ˙ cos ϕ x˙ 1 = r˙ cos ϕ − ϕr
und x
˙ 2 = r˙ 2 + r2 ϕ˙ 2 .
˙ 2 besitzt damit die Gestalt Die Lagrange–Funktion L(x, x) ˙ = 12 x
1 2
gr,r (r, ϕ)r˙ 2 + 2gr,ϕ (r, ϕ)r˙ ϕ˙ + gϕ,ϕ (r, ϕ)ϕ˙ 2 ,
ur die mit gr,r = 1, gr,ϕ = 0 und gϕ,ϕ (r, ϕ) = r2 . Die Formel (8.4.2) f¨ Christoffel–Symbole ergibt mit g r,r = 1, g r,ϕ = 0 und g ϕ,ϕ (r, ϕ) = r−2 : Γrϕ,ϕ (r, ϕ) = −r
,
Γϕ r,ϕ (r, ϕ) =
1 = Γϕ ϕ,r (r, ϕ), r
ϕ w¨ahrend Γrr,ϕ = Γrϕ,r = Γrr,r = Γϕ ϕ,ϕ = Γr,r = 0 ist.
(b) Mit der obigen Form des metrischen Tensors in Polarkoordinaten ist das t1 t1 2 2 2 L¨angenfunktional von der Form t0 x(t)
˙ dt = t0 r˙ + r ϕ˙ dt. Nach (8.4.3) sind die Euler–Lagrange–Gleichungen des Energiefunktionals in Po˙ = 0, also larkoordinaten r¨ + Γrϕ,ϕ (r, ϕ)ϕ˙ 2 = 0, ϕ¨ + 2Γϕ r,ϕ (r, ϕ)r˙ ϕ r¨ = rϕ˙ 2
2 ˙ und ϕ¨ = − r˙ ϕ. r
2
H. L¨osungen der Aufgaben
575
Aufgabe 8.26 auf Seite 163 (Rotationsfl¨ achen-Geod¨ aten): Die Bedingung positiven Profils R(x3 ) > 0 ist wichtig, ansonsten ist M keine Mannigfaltigkeit. (a) In der Formel f¨ ur die Christoffel–Symbole: ∂g ∂gi,l ∂gi,j l,j 1 k,l Γki,j (x) = g (x) (x) + (x) − (x) 2 ∂xi ∂xj ∂xl
(i, j, k ∈ {r, ϕ})
l
ist der metrische Tensor g(x) = R (z) cos ϕ −R(z) sin ϕ R (z) cos ϕ R (z) sin ϕ 1 −R(z) sin ϕ R(z) cos ϕ 0
denn
x1 x2 x3
=
R(z) cos ϕ R(z) sin ϕ z
R (z) sin ϕ R(z) cos ϕ 1 0
Γϕ z,ϕ
(R (z))2 +1 0 0 (R(z))2
,
. Die Christoffel–Symbole lauten also
∂gz,z R (z)R (z) = ∂z (R (z))2 + 1 ∂gϕ,ϕ R(z)R (z) =− = − 12 g z,z ∂z (R (z))2 + 1 R (z) 1 ϕ,ϕ ∂gϕ,ϕ = Γϕ = ϕ,z = 2 g ∂z R(z)
Γzz,ϕ = Γzϕ,z = − 12 g z,z
Γzz,z = 12 g z,z Γzϕ,ϕ
=
∂gz,z =0 ∂ϕ
∂gz,z =0 ∂ϕ ∂gϕ,ϕ = 12 g ϕ,ϕ = 0. ∂ϕ
1 ϕ,ϕ Γϕ z,z = − 2 g
Γϕ ϕ,ϕ
Die allgemeine Geod¨atengleichung ist x ¨k + setzt sich das zur Behauptung.
i,j
Γkij x˙ i x˙ j = 0, und hier u ¨ber-
(b) Ein Meridian γ : I → M hat die Form R(z(t)) cos ϕ R (z(t))z(t) ˙ cos ϕ R(z(t)) sin ϕ (z(t)) z(t) ˙ sin ϕ R γ(t) = , also γ(t) ˙ = . z(t)
z(t) ˙
Nach Bogenl¨ange zu parametrisieren heißt γ(t)
˙ = 1 f¨ ur alle t zu fordern. Das bedeutet 2 2 −1 2 (R (z(t)))2 +1 , also z(t) 1 = γ(t)
˙ = z(t) ˙ ˙ = (R (z(t)))2 +1 . (H.2) Wir notieren z(t) ˙ = 0. Ableiten dieser Gleichung liefert uns −2 ˙ R z(t) R z(t) z(t) z(t)¨ ˙ z (t) = − (R (z(t)))2 + 1 Zusammen mit (H.2) und ϕ˙ = 0 ergibt das die Geod¨atengleichung f¨ ur z. Die Geod¨atengleichung f¨ ur ϕ ist trivialerweise erf¨ ullt. (c) Breitenkreise γ : R → M haben die Form −R(z)ϕ(t) ˙ sin ϕ(t) R(z) cos ϕ(t) γ(t) = R(z) sin ϕ(t) , also γ(t) ˙ = . R(z)ϕ(t) ˙ cos ϕ z
0
Nach der Geod¨atengleichung f¨ ur z und z˙ = z¨ = 0 ist R (z) = 0 und nach der Geod¨atengleichung f¨ ur ϕ die Parametrisierung von γ mit konstanter Geschwindigkeit. 2
576
H. L¨osungen der Aufgaben
Aufgabe 8.35 auf Seite 170 (Lichtbrechung): 1. Es ist ∇v L(q, v) = n(q)2 v und ∇q L(q, v) = n(q) v 2 ∇n(q), also d ˙ = 2n(q) ∇n(q), q ˙ q˙ + n(q)2 q¨, ∇v L(q, q) dt woraus sich (8.6.1) nach Division durch n > 0 ergibt. (8.35) folgt durch Substitution y˜(x(t)) = y(t) der unabh¨angigen Variablen x aus der in der Form y = n (x˙ 2 − y˙ 2 ) n¨ x = −2n x˙ y˙ , n¨ ¨(t) + x(t) ˙ 2 y˜ x(t) . geschriebenen Gleichung (8.6.1), denn y¨(t) = y˜ x(t) x 2. Auswertung von (8.6.1) f¨ ur einen nur von der y–Koordinate abh¨angigen Brechungsindex n ergibt also die Differentialgleichung 2n (y)y˙ x˙ + n(y)¨ x=0
, oder
d 2 n (y)x˙ = 0. dt
(H.3)
Also ist x˙ = c/n2 (y), mit einer Konstante c. Wenn man dies in die konstante Lagrange–Funktion L eintr¨agt, ergibt sich aus = 12 n2 (y)x˙ 2 1 + (y (x))2 die Beziehung 1 + (y (x))2 = c22 n2 (y) oder + 2 2 n (y) − 1. y (x) = ± c2 Diese Differentialgleichung ist durch Separation der Variablen l¨osbar. F¨ ur n von der Form (8.6.3) ergibt sich (8.6.4). Die Integration von (H.3) ist wegen der Translationsinvarianz der Lagrange– Funktion in x–Richtung m¨ oglich. 3. Mit den angegebenen Koordinaten der Punkte ai ist die Laufzeit x20 + y12 (x2 − x0 )2 + y22
a1 − a0 a2 − a0
T (a0 ) = + + + . c1 c2 c1 c2 Bezeichnen wir diese nur noch von x0 abh¨angige Funktion mit t(x0 ), dann ist t (x0 ) = sinc1α1 − sinc2α2 , denn sin α1 = √ x20 2 und sin α2 = √ x2 −x02 2 . x0 +y1
(x2 −x0 ) +y2
Bei minimalem t gilt t (x0 ) = 0, also das Brechungsgesetz von Snellius.
2
Aufgabe 8.41 auf Seite 173 (Reflektion von Licht an einer Tasse): sin ϕ (a) Die zur 1-Achse parallelen Strahlen, die an der Stelle A(ϕ) := cos ϕ mit ϕ ∈ [0, π] die Kreislinie treffen, werden an deren Normale A(ϕ) gespiegelt. π Die gespiegelten Strahlen haben also die Richtung A + 2ϕ = C(2ϕ) 2 cos ϕ mit C(ϕ) := − sin ϕ . Andererseits folgt bei Benutzung trigonometrischer Additionstheoreme, dass der zweite Schnittpunkt des gespiegelten Strahls mit S 1 der Punkt A(3ϕ) = A(ϕ) + 2 sin(ϕ) C(2ϕ) ist.
H. L¨osungen der Aufgaben
577
d A(ϕ) = C(ϕ) folgt (b) Aus JA(ϕ) = −C(ϕ) und dϕ 6 5 d Bt (ϕ), J A(3ϕ) − A(ϕ) = tC(ϕ) + 3(1 − t)C(3ϕ), C(ϕ) − C(3ϕ). dϕ
F¨ ur t =
3 4
ist dies gleich
3 4
C(ϕ) + C(3ϕ), C(ϕ) − C(3ϕ) = 0.
ur ϕ = (c) Daher ist die Kaustik die Kurve ϕ → B3/4 (ϕ). Genau f¨ d 3 dϕ B3/4 (ϕ) = 4 C(ϕ) + C(3ϕ) = 0. Dies entspricht dem Punkt 3π 1/2 π 1 . 3A +A = 0 4 2 2
π 2
ist
2
In diesem Brennpunkt sammeln sich die parallelen Lichtstrahlen.
Aufgabe 8.42 auf Seite 174 (Lineare Optik): A ∈ Sp(4, R), denn A ist symmetrisch, • Zun¨achst ist tats¨achlich N := 10l Δn 1l und daher ist das Kriterium aus Aufgabe 6.26 (b) erf¨ ullt. • An der Stelle O(q), q ∈ R3 der Grenzfl¨ache zeigt die Fl¨achennormale in 1 die Richtung −Aq + O( q 3 ). Der Strahl in dem ersten Medium besitze die 1 1 Richtung v1 := p1 /n1 / p1 /n1 , nach Brechung an der Grenzfl¨ache v2 := 1 1 Gesetz gilt mit dem Einheitsvektor p2 /n2 / p2 /n2 . Nach dem snellschen e(q) der Fl¨achennormale an der Stelle O(q), q , dass die durch wi := vi − in der n1 w1 = vi , e(q) e(q) gegebenen Tangentialkomponenten 1 1 Beziehung n2 w2 stehen. Hier ist e(q) = −Aq + O( q 2 ), denn −Aq
= 1 + O( q 2 ). 1 + O( x 2 ) = pi /n0i +Aq + O( x 2 ), mit Damit ergibt sich wi = vi − −Aq dem Phasenraumpunkt x = (p, q) ∈ R2 × R2 . Nach dem snellschen Gesetz ist damit 2 p2 = p1 + Δn Aq + O( x 2 ) , mit Δn := n1 − n2 . Aufgabe 8.45 auf Seite 175 (Optische Ger¨ ate): 1. Das dem Auge zugewandte Okular des Mikroskops ist eine D¨ unne Linse mit ur das dem Objekt zugewandte Objektiv nennen wir Brennweite fok , und f¨ die entsprechende Gr¨ oße fob . Um das Objekt entspannt zu betrachten, sollen die das Okular verlassenden, von einem Objektpunkt stammenden Strahlen ein paralleles B¨ undel bilden. Das erreichen wir z.B. durch Einstellen des Abstandes d zwischen den Linsen. F¨ ur den Abstand dob zwischen Objekt und Objektiv ergibt sich die Matrix Md des Mikroskops als 1+d(dob −fob )−dob (fok +fob ) d−fok −fob 1 −1/f 1 0 1 −1/f 1 0 fok fob fok fob ok ob . ( = ) ddob dob 1 d0 d 0 1 0 1 d+dob −
fob
1− f
ob
Nach unseren Anforderungen muss das von einem ausgehende Licht Punkt durch Md parallelisiert werden, das heißt Md 0c = c0 . Der linke obere Matrixeintrag muss also verschwinden, was f¨ ur Abstand d = fok + bob mit Bildweite
578
H. L¨osungen der Aufgaben
bob des Objektivs geschieht. W¨ahlt man diesen Parameter d = fok + von Md , dann ist fob 0 (dob −fob )fok Md = . dob fok fok dob fok −
fob
1− f + f ob
dob fob dob −fob
ob −fok
0 mit Md , dann Multipliziert man eine Ver¨anderung des Objektivpunktes Δq ergibt sich die Ver¨anderung des Winkels der ausgehenden Strahlen m22 Δq gegen die optische Achse. Bei Beobachtung des Objekts mit bloßem Auge mit Abstand D (z.B. D = 25 cm), ist dagegen diese Winkelver¨anderung von der Form Δq oßerung des Mikroskops um den D . Der Vergleich liefert die Vergr¨ Faktor d − fok − fob · D. fok · fob Zum Beispiel ergibt sich f¨ ur die Brennweiten fob = fok = 25 mm und den Linsenabstand d = 30 cm der Objektabstand dob = 27, 5 mm und eine Vergr¨oßerung um den Faktor 100. 2. Optiker rechnen gern in Dioptrien, also Kehrwerten von Brennweiten (Einheit 1 dpt = 1/m). Wie man an (8.7.5) abliest, addieren sich diese Kombina bei 1
1
tion von Linsen, wenn deren Abstand d = 0 ist, denn L0 = 1l f1 + f2 1l . 0 1l ur die GeF¨ ur positive Abst¨ande d liest man aus Ld die Gullstrand–Formel f¨ samtbrechkraft Dges ab: Dges = D1 + D2 − dD1 D2
, f¨ ur Di := 1/fi .
Ist D1 der Brechwert des Auges (also der Kombination von Hornhaut und Linse), Dges der Kehrwert des Abstandes zum Gelben Fleck, dann muss die Dges −D1 Brille D2 = 1−dD Dioptrien haben, um auf die Ferne zu korrigieren. 1 F¨ ur die beiden Brechzahlen des astigmatischen Auges gilt diese Formel auch, denn die Hauptkr¨ ummungsachsen stehen ja senkrecht aufeinander (siehe auch Beispiel 8.24). Typische Werte sind Dges = 60 dpt, und der Hornscheitelabstand (Abstand zwischen Glas und Hornhaut) d = 14 mm. F¨ ur Kontaktlinsen ist d = 0, und entsprechend ¨andert sich der notwendige Brechwert. 2
Kapitel 9, Ergodentheorie Aufgabe 9.6 auf Seite 180 (Invariantes Maß): Die Gauss–Abbildung h gleicht & 1 1 auf ihren Stetigkeitsintervallen den Abbildungen hn : n+1 , n → [0, 1), x → & 1 1 1 1 x − n (n ∈ N). Diese besitzen die Inversen fn : [0, 1) → n+1 , n , y → y+n . Das Bildmaß des Maßes mit Dichte x →
1 1+x
hat damit an der Stelle y ∈ [0, 1)
H. L¨osungen der Aufgaben
579
die Dichte ∞ ∞ ∞ |fn (y)|−1 1 1 = = (y+n)(y+n+1) y+n − 1 + f (y) n n=1 n=1 n=1
1 y+n+1
Das Maß ist also invariant unter der Gauss–Abbildung. Wegen ist μ ein Wahrscheinlichkeitsmaß.
1 . y+1
=
1
1 0 1+x
dx = log 2 2
Aufgabe 9.10 auf Seite 181 (Phasenraumvolumen): F¨ ur E < 0 ist das Volumen des Phasenraumbereichs mit dieser H¨ ochstenergie gleich dp dq V (E) = λ2n H −1 (−∞, E] = Bn
|E|−1/a
=
n B√
2(E+q−a )
−1/q
|E|
v (n) s(n−1)
n/2 r n−1 2(E + r−a ) dr,
0 (n)
n
(B1n )
das Lebesgue–Maß der n–dimensionalen Einheitskugel und wobei v = λ s(n−1) das Maß von S n−1 bezeichnen. Bei Radius r = 0 ist der Integrand zu a 2n/2 rn(1− 2 )−1 asymptotisch, ist also genau f¨ ur a ∈ (0, 2) integrabel. 2 Aufgabe 9.23 auf Seite 189 (Korrelationsabfall): Diese Aufgabe basiert auf [BrSi]. Wir benutzen die Orthonormalbasis ek der Charaktere aus (9.3.5). (a) Wir m¨ ussen den Ausdruck f, U n g − f, 1l1l, g -
. -
.-
.
= fk ek (x), g e (T n x) − fk ek (x), 1l 1l, g e (x) k∈Z2
=
∈Z2
k∈Z2
. fk g ek (x), e(Tˆ )n (x) − f0 g0 =
∈Z2
fk gT˜ −n k
k∈Z2 \{0}
k,∈Z2
kontrollieren. (b) Die Summe fassen wir als Skalarprodukt auf und wenden die H¨older–Ungleichung und die letzte Ungleichung aus dem Tipp darauf an (diese sieht man durch Einschieben von x: F¨ ur x ≥ y ≥ 1 ist xy ≥ x ≥ x+y 2 .) n n −1 ˜ ˜ fk gT˜ n k = ( k 2 fk )( T k 2 gT˜n k )( k 2 T k 2 ) k∈Z2 \{0} k∈Z2 \{0} 1 4 ≤ 12 L ( k 2 T˜n k 2 )−4 ≤L
k∈Z2 \{0}
( k 2 + T˜n k 2 )−4
k∈Z2 \{0}
14
(H.4)
580
H. L¨osungen der Aufgaben 1 1
2 2 2
4 4 4 . Es ist L < ∞, mit L := 2 k∈Z2 \{0} k 2 |fk | h∈Z2 \{0} h 2 |gh | p 2 2 da die –R¨aume monoton in p sind, also speziell (Z ) ⊂ 4 (Z2 ) ist. Damit ergibt sich die Behauptung.
(c) • Sei n = 2m zun¨achst gerade. Wir m¨ ussen die Terme k 2 + T˜n k 2 in (H.4) nach unten absch¨atzen, und benutzen daf¨ ur h := T˜ m k:
T˜m h 2 + T˜ −m h 2 ≥ C −1 ( T˜m h E + T˜−m h E ) = C −1 (λ−m hs 2 + λm hu 2 + λm hs 2 + λ−m hu 2 ) C −1 λm h E ≥ C −2 λm h 2 .
≥
Da die Abbildung k → h = T˜ m k eine Permutation von Z2 \ {0} ist, erhalten wir 1 −4 4 |f, U n g − f, 11, g| ≤ C 2 Lλ−m
h 2 . h∈Z2 \{0}
• F¨ ur ungerade n = 2m + 1 ist analog
T˜m +1 h 2 + T˜−m h 2 ≥ C −1 ( T˜ m +1 h E + T˜−m h E )
= C −1 (λ−m −1 hs 2 + λm +1 hu 2 + λm hs 2 + λ−m hu 2 )
≥ C −1 λm h E ≥ C −2 λm h 2 ,
also |f, U n g − f, 11, g| ≤ C 2 Lλ−m • Aus m =
n 2
=
n2
und m =
n−1 2
=
n2
h∈Z2 \{0}
−4
h 2
14
.
folgt die Behauptung.
2
Aufgabe 9.25 auf Seite 190 (Produktmaß auf dem Shiftraum): • Die Zylindermengen bilden ein Mengensystem S, das die σ–Algebra M erzeugt. Sind zun¨achst A, B ∈ S, dann gibt es ein T ∈ N mit μp (Φt (A) ∩ B) = μp (A) μp (B)
(|t| ≥ T )
f¨ ur die Produktmaße μp . Dies ist bei Zylindermengen A = [τ1 , . . . , τj ]k+j−1 k und B = [κ1 , . . . , κi ]+i−1 f¨ ur T := max( + i − k, k + j − ) der Fall. ˜ B ˜ der von • Sind nun A, B ∈ M, dann gibt es f¨ ur alle ε > 0 Elemente A, den Zylindermengen erzeugten Algebra A(S) mit symmetrischen Differenzen ˜ ˜ μp (AΔA) < ε und μp (BΔB) < ε (siehe zum Beispiel Elstrodt [El]). F¨ ur dieses Paar gibt es ebenfalls eine Minimalzeit T˜ mit ˜ ∩B ˜ = μp (A) ˜ μp (B) ˜ |t| ≥ T˜ . μp Φt (A) Andererseits ist wegen ˜ ∩B ˜ ⊆ Φt (A) Δ Φt (A) ˜ ∪ BΔB ˜ Φt (A) ∩ B Δ Φt (A)
H. L¨osungen der Aufgaben
581
f¨ ur alle Zeiten t das Maß der linken Seite kleiner als 2ε. Ist nun |t| ≥ T˜, dann folgt μp Φt (A) ∩ B − μp (A) μp (B) ≤ ˜ ∩B ˜ + μp Φt (A) ˜ ∩B ˜ − μp (A) ˜ μp (B) ˜ μp Φt (A) ∩ B − μp Φt (A) ˜ − μp (A)| μp (B) ˜ + μp (A) |μp (B) ˜ − μp (B)| + |μp (A) < 2ε + 0 + ε + ε = 4ε. Da ε > 0 beliebig war, folgt lim|t|→∞ μp Φt (A) ∩ B = μp (A) μp (B).
2
Aufgabe 9.27 auf Seite 193 (Shiftraum): • Wir finden zun¨achst einen Punkt ur m = {mk }k∈Z ∈ M mit H¨aufungsmenge [−1, 1] der Mittelwerte. Sei daf¨ 1 , k ∈ {−1, 0, 1} mk := log2 (log2 |k|) (−1) , k ∈ Z \ {−1, 0, 1}. Nun w¨ahlen wir die Teilfolge na := 2(2 k ∈ {n2a , . . . , n2a+1 − 1} k ∈ {n2a+1 , . . . , n2a+2 − 1}
a
)
und bemerken f¨ u r a ∈ N0 =⇒ =⇒
mk = 1 mk = −1.
Damit k¨onnen wir die Mittelwerte f¨ ur die Teilfolge absch¨atzen:
2a −1 |An2a f (m) + 1| = n12a nt=0 f ◦ Φt (m) + 1 n2a−1 −1
≤
1 n2a
≤
n2a−1 n2a
t=0
1 1+ n2a
n 2a −1
f ◦ Φt (m) + 1
t=n2a−1
a−1 a a−1 a→∞ n 2a−1 + n2a −n − 1 = 21+2 −2 = 21−2 −−−→ 0, ≤ 2 n2a−1 n2a 2a
das heißt lima→∞ An2a f (m) = −1. Ebenso erhalten wirlima→∞ An2a+1 f (m) = 1. Damit sind ±1 H¨aufungspunkte der Folge An f (m) n∈N . Wegen n 1 n−1 1 f ◦ T t (m) − f ◦ T t (m) |An f (m) − An+1 f (m)| = n t=0 n + 1 t=0
≤
1 n
−
n−1 n−1 n 1 2 1 |f ◦ T t (m)|+ f ◦T t (m)− f ◦T t (m) ≤ n + 1 t=0 n + 1 t=0 n + 1 t=0
m¨ ussen dann alle Punkte zwischen −1 und 1 H¨aufungspunkte sein. • Nun m¨ ussen wir {m} ⊆ M zu einer dichten Teilmenge U von M ausbauen. Wir setzen f¨ ur alle m ∈ M mk , |k| ≤ s (s ∈ N, k ∈ Z). xm ,s ∈ M mit xkm ,s := mk , |k| > s
582
H. L¨osungen der Aufgaben
Es ist also lims→∞ xm ,s = m . Die Menge U := xm ,s ∈ M | m ∈ M, s ∈ N ist damit dicht in M und hat die gew¨ unschte H¨aufungspunkteigenschaft. 2 Aufgabe 9.35 auf Seite 197 (Birkhoffscher Ergodensatz f¨ ur Fl¨ usse): • Der Fluss Φ : R × M → M ist stetig, also messbar. Die Zeit t–Abbildungen Φt : M → M (t ∈ R) erhalten das Maß μ. Also l¨asst sich f¨ ur alle T > 0 und das auf [0, T ] restringierte Lebesgue–Maß λT der Satz von Fubini anwenden; f ◦ Φ dλ dμ = T f dμ = f ◦ Φ(t, m) dλ(t) dμ. T [0,T ]×M M M [0,T ] Insbesondere existiert das innere Integral f¨ ur μ–fast alle m ∈ M . • Wir k¨onnen f¨ ur μ–fast alle Anfangsbedingungen m ∈ M das Zeitintegral T f ◦ Φ(t, m) dt durch das mit ganzzahliger oberer Grenze absch¨atzen, denn 0 1 mit G := 0 |f ◦ Φt | dt ∈ L1 (M, μ) ist T T (H.5) f ◦ Φ(t, m) dt − f ◦ Φ(t, m) dt ≤ G ◦ Φ T , m . 0 0 ur μ–fast alle Da nach dem birkhoffschen Ergodensatz (Satz 9.32) G(m) f¨ m ∈ M existiert, folgt mit dem Beweis von Lemma 9.28 auch lim 1 G n→∞ n
◦ Φn (m) = 0
(μ–fast u ¨berall).
Damit folgt aus (H.5) und dem Ergodensatz μ–fast u ¨berall T 1 T 1 lim f ◦ Φ(t, m) dt = lim f ◦ Φ(t, m) dt = F (m) T →∞ T 0 T →∞ T 0 1 mit F := 0 f ◦ Φt dt ∈ L1 (M, μ). Damit ist μ–fast u ¨berall f = F . Die weiteren Aussagen u ¨ber f folgen mit dem Ergodensatz und Bemerkung 9.33.1 aus analogen Aussagen f¨ ur F . 2 Aufgabe 9.36 auf Seite 197 (Normale reelle Zahlen): • Die Abbildung T : M → M, x → 2x (mod 1)
auf M := [0, 1)
ist ergodisch und sogar mischend bez¨ uglich des auf M ⊆ R eingeschr¨ankten ek : T –invarianten Lebesgue–Maßes λ. Denn L2 (M, λ) wird von den Funktionen M → S 1 , ek (x) = exp(2πikx) (k ∈ Z) aufgespannt, und ek T (x) = e2k (x). • Die Menge N ⊆ M der Zahlen mit nicht eindeutiger dyadischer Entwicklung (also die mit der Periode 0 oder 1) ist abz¨ahlbar, hat also das Lebesgue–Maß λ(N ) = 0. Außerdem gilt T (N ) = N . • Da T in der dyadischen Darstellung als Verschiebung (shift) um eine Ziffer wirkt, betrachten wir die Funktion f := 1l[0, 12 ) ∈ L1 (M, λ). Nach dem birkhoffschen Ergodensatz (Satz 9.32) existiert f¨ ur λ–fast alle ur x ∈ M das Zeitmittel f (x) von f . Nach der obigen Bemerkung l¨asst es sich f¨ λ–fast alle x ∈ M als Frequenz deuten. Wegen der Ergodizit¨ a t von T ist es f¨ ur 2 λ–fast alle x ∈ M gleich M f dλ = 12 .
H. L¨osungen der Aufgaben
583
Kapitel 10, Symplektische Geometrie Aufgabe 10.8 auf Seite 206 (Teilchen im Magnetfeld): (a) • ωB = ω0 + B1 dq2 ∧ dq3 + B2 dq3 ∧ dq1 + B3 dq1 ∧ dq2 ∈ Ω2 (P ) auf dem
3 Phasenraum P = R3q ×R3v mit der symplektischen Form ω0 = i=1 dqi ∧ dvi ist geschlossen, denn nach Voraussetzung ist div B = 0, und dωB
=
dB1 ∧ dq2 ∧ dq3 + dB2 ∧ dq3 ∧ dq1 + dB3 ∧ dq1 ∧ dq2
=
div(B) dq1 ∧ dq2 ∧ dq3 .
• ωB ist nicht degeneriert, denn f¨ ur einen Tangentialvektor X = 0 bei (q, v) ∈ P gibt es ein i ∈ {1, 2, 3} mit nicht verschwindender ∂q∂ i –Komponen∂ te, oder sonst mit nicht verschwindender ∂v –Komponente von X. i ∂ Im ersten Fall setzen wir Y := ∂vi , im zweiten Fall Y := ∂q∂ i . Immer gilt ωB (X, Y ) = ω0 (X, Y ) = 0.
3 (v) ∂ (v) ∂ (q) ∂ (q) ∂ (b) Mit X = 3i=1 Xi ∂v und Y = Y + X + Y i i i i=1 ∂q ∂v ∂q i i i * ) i * ) ist ωB (X, Y ) = X (q) , Y (v) − X (v) , Y (q) + det(B, X (q) , Y (q) ). ) *
3 (c) dH(q, v) = i=1 vi dvi , also dH(Y )(q, v) = v, Y (v) (q, v) . Koeffizienten* ) vergleich in ωB (XH , ·) = dH ergibt wegen ωB (X, Y ) = X (q) , Y (v) + ) * B × X (q) − X (v) , Y (q) : X (q) (q, v) = v, X (v) (q, v) = B(q) × v. (d) Aus (c) folgen die Bewegungsgleichungen der Lorentz–Kraft (siehe (6.3.13)): q˙ = v
, v˙ = B(q) × v
2
Aufgabe 10.30 auf Seite 214 (Kugel und Zylinder): Die der totalex1Ableitung x w 0 − w3 Abbildung F : Z → S 2 an der Stelle x ∈ Z ist DFx = 0 w − x2wx3 , mit der 0 0 1 ur die Wurzel. Abk¨ urzung w := 1 − x23 > 0 f¨ Das Fl¨achenelement ϕ auf dem Zylinder ist bei x ∈ Z durch ϕx (Y, Z) = det(˜ x, Y, Z) (Y, Z ∈ Tx Z) x1 gegeben, mit der Radialkomponente x ˜ := x2 von x. Damit ist 0
ωF (x)
DFx (Y ) , DFx (Z) = det
x
x x
Y1 w−Y3 1w 3 x x x2 w Y2 w−Y3 2w 3 x3 Y3 1w
x x
Z1 w−Z3 1w 3 x x Z2 w−Z3 2w 3 Z3
= x1 (Y2 Z3 − Y3 Z2 ) + x2 (Y3 Z1 − Y1 Z3 ) = ϕx (Y, Z). Bei der Berechnung der Determinante wurde benutzt, dass f¨ ur Tangentialvektoren Y, Z des Zylinders die 3–Komponente Y1 Z2 − Y2 Z1 ihres Kreuzproduktes Null ist. 2
584
H. L¨osungen der Aufgaben
Aufgabe 10.45 auf Seite 224 (Darstellung des Flusses mit erzeugenden Funktionen): (a) Die erzeugende Funktion H : (−π/2, π/2) × R2 → R ist auch in ihrer Zeitabh¨angigkeit stetig, denn limt→0 Ht (p, q) = H0 (p, q). Nach (10.5.1) gilt 1 p0 + p0 tan(t), − qt tan(t) , qt = q0 + qt 1 − pt = cos(t) cos(t) also qt = q0 cos(t)+p0 sin(t), pt = p0 cos(t)−q0 sin t. Dies ist die L¨osung der Differentialgleichung des harmonischen Oszillators mit Hamilton-Funktion H0 . (b) Die L¨osung der hamiltonschen Gleichungen f¨ ur die quadratische Hamilton– Funktion H0 (x) = 12 x, Ax und Anfangswert x0 = (p0 , q0 ) ist von der Form xt = (pt , qt ) = exp(JAt)x0 , also linear. Damit gibt es eine Zeit T > 0, sodass f¨ ur alle |t| < T der Ort zur Zeit t als Funktion der Anfangswerte die Eigenschaft hat, dass D2 qt (p0 , q0 ) maximalen Rang (also Rang n) besitzt. Nach dem Satz u ¨ber die implizite Funktion k¨onnen wir daher die Beziehung invertieren und eine glatte Abbildung Qt : R2n → Rn , q0 = Qt (p0 , qt ) finden. ullt die integrable Relation DHt (p0 , qt ) = Die Funktion Ht erf¨ erzeugende t J x0 −x , deren rechte Seite bekannt ist. Die Konvention Ht (0) = 0 legt Ht t 0 fest. Da xt = exp(JAt)x0 gilt, folgt limt→0 xt −x = JAx0 , also t 1 limt→0 DHt (x) = Ax0 , was sich zu H0 (x) = 2 x, Ax aufintegrieren l¨asst. (c) Der anharmonische Oszillator besitzt eine Hamilton–Funktion H0 : R2 → R
V (q) := 12 (q 2 + q4 ) ≥ 0. Nach Satz 11.1 erzeugt H0 damit einen Fluss Φ ∈ C 1 R × R2 , R2 . Da ur V (q) = q + 2q 3 eine ungerade Funktion des Ortes q ist, mit V (q) > 0 f¨ q > 0, ist (p0 , q0 ) = (0, 0) die einzige Ruhelage. ur alle h > 0 die EnergieDa außerdem lim|q|→∞ V (q) = +∞ ist, sind f¨ −1 2 kurven H0 (h) ⊂ R diffeomorph zu einer Kreislinie S 1 . Alle Orbits sind also periodisch. Die Periode ist eine Funktion T : (0, ∞) → (0, ∞) der Energie h. Es gilt limh→∞ T (h) = 0. Denn mit der Maximalauslenkung √
c(h) :=
c(h)
−c(h)
, H0 (p, q) = 12 p2 + V (q)
1+8h−1 2
dq =2 dq/dt
mit
und Q := q/c(h) ist T (h) gleich 0
c(h)
dq 2h − q 2 − q 4
Das Integral hat f¨ ur h → ∞ den Limes
1 0
=
2 c(h)
√ dQ
1−Q4
1 dQ
+ 0
2h c(h)4
2
Q −( c(h) ) −Q4
.
> 0, was die Behauptung
limh→∞ T (h) = 0 zeigt. Dies beweist aber, dass (im Gegensatz zu (b)) f¨ ur ur den anharmonischen Oszillator die implizite Beziehung q0 = Qt (p0 , qt ) f¨ kein Zeitintervall t ∈ (−T, T ) auf dem gesamten Phasenraum l¨osbar ist. 2
H. L¨osungen der Aufgaben
585
Kapitel 11, Bewegung im Potential Aufgabe 11.2 auf Seite 227 (In endlicher Zeit nach Unendlich): • F¨ ur c ≥ 0 ist V ∈ C ∞ (Rd , R) nicht negativ. Also erzeugt nach Satz 11.1 die hamiltonsche Differentialgleichung (11.1.2) einen Fluss. • F¨ ur c < 0 und eine L¨ osung x = (p, q) : I → P betrachten wir die Funktion f : I → [0, ∞), f (t) = 1 + q(t) 2 . Die Energie ist zeitlich konstant, und f¨ ur Anfangsbedingungen (p0 , q0 ) mit p0 = 2(E − V (q0 )) qq00 = 0 ist H(x(t)) = E. Außerdem gilt p˙ = −2c(1 + ε)(1 + q 2 )ε q, weswegen auch p(t) und q(t) in span(q0 ) liegen und ihre Betr¨age in der Zeit monoton wachsen. f erf¨ ullt f¨ ur E ≥ 0 die Differentialungleichung f (t) = 2 q(t), p(t) = 2 2(E + |c|(1 + q(t) 2 )1+ε ) q(t) ≥ kf (t)1+ε/2 mit k := |c| min(1, q0 ), denn q(t) 2 ≥ 12 (1 + q(t) 2 ) min(1, q0 2 ). Die entsprechende Differentialgleichung g (t) = kg(t)1+ε/2 besitzt die L¨osung − 2 . Setzt man g(0) := g(t) = g(0) − k 2ε t ε , divergiert also zum Zeitpunkt 2g(0) εk f (0), dann muss f¨ ur t ∈ I, t ≥ 0 auch f (t) ≥ g(t) gelten. Das impliziert die Divergenz von f in endlicher Zeit. Eine Modifikation des Arguments zeigt, dass auch L¨osungen f¨ ur Energie E < 0 divergieren. 2 Aufgabe 11.15 auf Seite 236 (Ballistische und gebundene Bewegung): (a) Wir verk¨ urzen die geschlossene Kurve c : S 1 → T, c (t) = t in der Jacobi– Metrik und erhalten wie in Satz 8.33 eine geschlossene Geod¨ate @ c : S 1 → T. Diese entspricht nach Satz 8.31 einer zeitperiodischen L¨osungskurve t → @ −1 (E) und einer Periode T > 0. q@(t, x ˆ0 ) mit Anfangswert x ˆ0 ∈ H ˆ0 gilt die F¨ ur jede Anfangsbedingung x0 ∈ ΣE mit Projektion π(x0 ) = x Aussage des Satzes. (b) Sei V˜ ∈ C 2 [0, ∞), (−∞, 0] eine reelle Funktion mit V˜ (0) = 0 und V˜ (r) = 0 f¨ ur alle r ≥ R > 0. Dann ist f¨ ur Dimension d ∈ N und das Gitter L := 2RZd das L–periodische Potential V˜ ( q − ) V : Rd → R , V (q) = ∈L
ebenfalls zweimal stetig differenzierbar. Außerdem ist V (q) = V˜ ( q ), falls
q ≤ R. Wie man aus der Betrachtung des effektiven Potentials (siehe Seite 308) ersieht, gibt es f¨ ur d ≥ 2 und geeignete Wahl von V˜ und E > 0 Anfangsbedingungen x0 = (p0 , q0 ) ∈ ΣE mit q(t, x0 ) ≤ R f¨ ur alle t ∈ R. Diese besitzen sogar positives Liouville-Maß. 2
586
H. L¨osungen der Aufgaben
Aufgabe 11.19 auf Seite 238 (Totale Integrabilit¨ at): Es sei das separable
d Potential V (q) = i=1 Vi (qi ) mit Ti –periodischen Funktionen Vi . Damit ist das regul¨are Gitter L := {(k1 T1 , . . . , kd Td ) | ki ∈ Z} ⊂ Rd Periodengitter von V . Dann ist f¨ ur Anfangswert x0 = (p0 , q0 ) = (p1,0 , . . . , pd,0 , q1,0 , . . . , qd,0 ) die L¨osung von der Form (p(t), q(t)), wobei (pi (t), qi (t)) die hamiltonschen Gleichunur d ≥ 2, Gesamtenergie gen f¨ ur Hi : R2 → R, Hi (pi , qi ) = 12 p2i + Vi (qi ) l¨ost. F¨
d E > Vmax = i=1 Vi, max und j ∈ {1, . . . , d} k¨onnen wir Anfangsbedingungen mit Hj (p1,j , q1,j ) = Vj, max und Hi (p1,i , q1,i ) > Vi, max f¨ ur alle i ∈ {1, . . . , d}\{j} w¨ahlen. Ist der Summand Vj nicht konstant, dann k¨onnen wir dabei p1,j > 0 annehmen. Dann ist zwar t → q1,j (t) streng monoton wachsend, aber beschr¨ankt. Das ist unvereinbar mit einer bedingt-periodischen, also nicht wandernden 5 Bewegung auf einem Torus. Die Bewegung in einem solchen separablen Potential ist zwar nicht total integrabel, aber die nicht auf einem invarianten Torus liegenden Phasenraumpunkte bilden eine Nullmenge. Nur gibt es invariante Phasenraumtori, die nicht diffeomorph auf den Konfigurationstorus projizieren. 2 Aufgabe 11.21 auf Seite 239 (Konstanten der Bewegung): • F¨ ur den Gesamtimpuls pN gilt p˙N =
n
p˙k = −
k=1
n k=1
∇qk V (q) =
n k=1 =k
mk m (q − qk ) = 0.
qk − q 3
• Der Schwerpunkt zur Zeit Null ist explizit zeitabh¨angig, und N N pk 1 1 q˙N = mk (mk q˙k − p˙ k t − pk ) = + ∇qk V (q) − pk mN mN mk k=1
p˙ N −m N
= denn L˙ i,j
= = =
k=1
= 0. Auch die Komponenten des Gesamtdrehimpulses sind konstant, n
q˙k,i pk,j + qk,i p˙ k,j − q˙k,j pk,i − qk,j p˙ k,i
k=1 n
1 1 pk,i pk,j − qk,i ∂qk,j V (q) − pk,j pk,i + qk,j ∂qk,i V (q) mk mk
k=1 n k=1 =k
mk m qk,i (q,j − qk,j ) − qk,j (q,i − qk,i ) = 0.
qk − q 3
n • Die Wahl der Konstanten pN = 0, qN = 0 impliziert k=1 mk qk = 0. Wegen der linearen Unabh¨angigkeit dieser Einzelgleichungen haben wir eine 2(n − 1)d–dimensionale Untermannigfaltigkeit des Phasenraums P@ definiert. 5 Definition: Ein Punkt eines topologischen dynamischen Systems Φ : G × M → M heißt ur alle t ≥ T . wandernd, wenn er eine Umgebung U ⊂ M besitzt mit U ∩ Φt (U ) = ∅ f¨
H. L¨osungen der Aufgaben
587
• F¨ ur n = 1 Teilchen ist das ein Punkt, und genau 2d Konstanten sind algebraisch unabh¨angig. • Im Fall von n = 2 Teilchen k¨ onnen wir zu Relativkoordinaten (pr , qr ) ∈ T ∗ Rd \{0} u ¨bergehen, in denen die Teilchenbewegung der eines Teilchens im Feld einer Zentralkraft gleicht. Deren Hamilton–Funktion ist Hr (pr , qr ) = pr 2 m1 m2 m1 m2 2mr − qr mit reduzierter Masse mr = m1 +m2 (siehe Beispiel 12.39). In d = 2 Freiheitsgraden ist (bei Weglassen des Index r) m1 m2 p1 dp1 + p2 dp2 + (q dq + q dq ) (dH ∧ dL)(p, q) = 1 1 2 2 m
q 3 ∧(q1 dp2 + p2 dq1 − q2 dp1 − p1 dq2 ) 2 m1 m2 = q, p dp1 ∧ dp2 − + dq ∧ dq fi,j (p, q)dqi ∧ dpj . 1 2
q 3 i,j=1 Die beiden Konstanten der Bewegung sind also algebraisch unabh¨angig. Eine analoge Betrachtung zeigt auch f¨ ur d = 3, dass H und die Drehimpulskomponenten Li,k algebraisch unabh¨angig sind. = 6, f¨ ur Gleiches gilt erst recht f¨ ur n > 2. F¨ ur d = 2 haben wir also d+2 2 d+2 d = 3 insgesamt 2 = 10 unabh¨angige Konstanten der Bewegung. 2 Aufgabe 11.22 auf Seite 240 (Laplace–Runge–Lenz–Vektor): (a) Der Laplace–Runge–Lenz–Vektor hat die Zeitableitung ˆ
q 2 p − p, q q −q2 L(x) d ˆ = 0, − A(x) = Z dt
q 3 q1
q 3 mit x(t) = p(t), q(t) . Das Perizentrum q der Bahn zeichnet sich dadurch aus, dass dort p, q = 0 gilt und gleichzeitig die Radialbeschleunigung positiv ist: Z 1 d2
q(t) 2 = p(t) 2 − ≥ 0. 2 dt2
q(t)
. ˆ Dann ist A(x), q ≥ 0 und Aˆ parallel zu q. (b) Am Perizentrum (und damit wegen (a) entlang der gesamten Bahn) ist ˆ 2 ˆ A,q A = Zq = /Z−q = e, denn die Exzentrizit¨at besitzt nach (1.7) Z q die Gestalt e =
2 ZR
− 1.
Aufgabe 11.25 auf Seite 245 (Regularisierbare singul¨ are Potentiale):
2
588
H. L¨osungen der Aufgaben 2
ur Drehimpuls > 0 der vom Ur1. Mit der Substitution r = 2−a R besitzt f¨ sprung aus gesehene Ablenkwinkel f¨ ur das a–homogene Potential die Form ∞ dR Δϕ(E, ) = 2 . 2a Rmin R 2E 2−a + 2ZR2−a − 1 ∞ 1 dR , mit Rmin = (2Z)− 2−a . Also ist Δϕ(E, 0+ ) = 2 Rmin R√2ZR 2−a −1 Die Substitution R = (2Z)− 2−a u zeigt, dass der Ablenkwinkel ∞weder von E noch von der Ladung Z > 0 abh¨angt, denn Δϕ(E, 0+ ) = 2 umin u√udu 2−a −1 2π mit umin = 1. Es folgt Δϕ(E, 0+ ) = 2−a . 1
2π Δϕ(E, ) ist ungerade in , also ist lim0 Δϕ(E, ) = − 2−a . Die beiden Winkel sind genau dann gleich mod 2π, wenn a = 2(1 − 1/n) mit n ∈ N.
2. Wir m¨ ussen entsprechend Bemerkung 11.24.4 die Orbits des geod¨atischen Flusses Ψ auf dem Einheitstangentenb¨ undel T1 S d parametrisieren. (a) F¨ ur d = 2 kann dies durch die Abbildung T1 S 2 → S 2
, (x, y) → x × y geschehen. Diese ist Ψ–invariant, denn mit x(t), y(t) = Ψt (x0 , y0 ) gilt x(t) × y(t) = cos2 (t)x0 × y0 − sin2 (t)y0 × x0 = x0 × y0 . Verschiedene Orbits liegen in verschiedenen orientierten Ebenen. Damit ist der Orbitraum die Sph¨are S 2 . (b) F¨ ur d = 3 ist der Orbitraum (analog zu d = 2) die Grassmann–Mannigfaltigkeit der orientierten zweidimensionalen Ebenen im R4 . Diese werden durch die Orthonormalbasen (x, y) ∈ T1 S 3 aufgespannt. Die Abbildung , (x, y) → (xy ∗ , y∗ x), a+bi c+di (bei der Punkte (a, b, c, d) ∈ R4 mit x = −c+di a−bi ∈ H identifiziert wurden), bildet wegen
mn = m
n f¨ ur m, n ∈ H in S 2 × S 2 ab. Außerdem gilt f¨ ur x(t), y(t) = Ψt (x0 , y0 ) ∗ x(t)y(t)∗ = cos(t)x0 + sin(t)y0 − sin(t)x0 + cos(t)y0 Φ : T1 S 3 → S 2 × S 2
=
sin(t) cos(t)(y0 y0∗ − x0 x∗0 ) + cos2 (t)x0 y0∗ − sin2 (t)y0 x∗0 = x0 y0∗ .
Denn x0 = y0 = 1, also x0 x∗0 = y0 y0∗ = 1l, und x0 y0∗ = −y0 x∗0 ∈ ImH, denn die Vektoren stehen aufeinander senkrecht, also tr(x0 y0∗ ) = 0. onnen also durch die Drehung Ψ Analog ist y ∗ (t)x(t) = y0∗ x0 . Wir k¨ faktorisieren. F¨ ur ein Quaternion z ∈ H der Norm z = 1 und das Bild (u, v) := (xy ∗ , y ∗ x) der Abbildung Φ ist z − uzv = 2(z, x x + z, y y).
(H.6)
H. L¨osungen der Aufgaben
589
Man kann daher aus dem Bild die von x und y aufgespannte Ebene rekonstruieren. Wegen Φ(y, x) = (yx∗ , x∗ y) = −(xy ∗ , y ∗ x) = −Φ(x, y) erhalten wir auch ihre Orientierung. Damit ist Φ/S 1 injektiv. Die Surjektivit¨at folgt ebenfalls mit (H.6), wenn wir (u, v) ∈ S 2 × S 2 beliebig w¨ahlen. Damit ist Φ/S 1 auch schon ein Diffeomorphismus. (c) Wegen der Regularisierung (11.3.12) der Richtung des Laplace–Runge– Lenz–Vektors ist auch dieser selbst regularisierbar. Die im Tipp angegebene Formel f¨ ur A folgt daher aus der in (11.3.13) bewiesenen Formel ˆ 2 H ˆ ˆ 2 = 2 L ˆ + Z 2 f¨ ur A.
A
Damit folgt f¨ ur E < 0, dass A ≤ Z ist. F¨ ur A < Z ist die Ellipse nicht degeneriert, und es gibt genau zwei periodische Orbits mit diesem Wert von A in ΣE . Dagegen entsprechen die Vektoren mit A = Z den Kollisionsbahnen, also denjenigen periodischen Orbits in ΣE , die mit ihrem Bild unter Zeitumkehr (Definition 11.3) u ¨bereinstimmen. Damit erhalten wir topologisch zwei entlang ihres Randes verklebte Kreisscheiben, also S 2 , als Orbitraum. Umgekehrt ist A ≥ Z, falls E > 0, und der Orbitraum ist dann ein Zylinder S 1 × R. 2
Kapitel 12, Streutheorie Aufgabe 12.7 auf Seite 264 (Asymptotik der Potentialstreuung): 1. Wegen der Reversibilit¨at des Flusses, gen¨ ugt es, f¨ ur alle Anfangswerte x0 ∈ P T die Existenz des Ces`aro-Limes p+ (x0 ) = limT →∞ T1 0 p(t, x0 ) dt zu zeigen. • F¨ ur E > 0 und x0 ∈ s+ E existiert dieser nach Satz 12.5. 0) = 0, denn • Ist x0 ∈ b+ , dann ist p+ (x0 ) = limT →∞ q(T,x T lim supT q(T, x0 ) < ∞. ∪ b+ ur E < 0 gilt ΣE = b+ • F¨ ur E > 0 ist ΣE = s+ E E , f¨ E . Es bleibt der Fall −ε 0 ) E = 0. Dann ist p = 2V (q) ≤ c q . W¨are lim supT →∞ q(T,x > T 0, g¨abe es also ein k > 0 und eine wachsende Folge von Zeiten tn → ∞ mit q(tn ,x0 ) ≥ k, dann w¨ urde f¨ ur alle n ≥ n0 insbesondere die Ungleichung tn 2c 1/ε gelten. Da dann aber q(tn+1 , x0 ) − q(tn , x0 )
q(tn , x0 ) > k kleiner als tn+1 tn+1 k −ε
p(t, x0 ) dt < c q(t, x0 ) dt < (tn+1 − tn ), 2 tn tn
also lim supm→∞
q(tm ,x0 ) tm
≤ k/2 w¨are, kann dies nicht sein.
590
H. L¨osungen der Aufgaben
2. Wir schreiben kurz p(t), q(t) := p(t, x0 ), q(t, x0 ) und setzen L(t) := q(t) ∧ p(t). ˜ ( q ) existiert, f¨ Da nach Voraussetzung ein Potential W mit W (q) = W ur das V − W kurzreichweitig ist, ist W automatisch langreichweitig. ¨ Bei der Uberpr¨ ufung des Cauchy–Kriteriums f¨ ur den Limes von L gilt: t
L(t2 ) − L(t1 ) = t12 q(t) ∧ ∇V q(t) dt t2 t2 −1−ε = ≤ q(t) ∧ ∇ V q(t) − W q(t) dt q(t) dt, t1
t1
analog zu (12.1.6). Die Anwendbarkeit auf die singul¨aren Molek¨ ulpotentiale (12.7) folgt aus der Zk Zk −2 − ). 2 Kurzreichweitigkeit der Differenzen q−s q = O( q
k Aufgabe 12.10 auf Seite 267 (Streuorbits): 1. F¨ ur vorgegebene Werte E > 0 und ∈ R gibt es einen Minimalradius rmin = Z Z2 2 − 2E + 4E 2 + 2E ≥ 0. F¨ ur r2 > r1 ≥ rmin existieren Zeiten t2 > t1 ≥ tmin , sodass die Bahn t → q(t) ∈ R2 diese Abst¨ande realisiert, das heißt
q(tmin ) = rmin , q(ti ) = ri . r r dr, da f¨ ur Zeiten t > tmin gilt: Es folgt t2 − t1 = r12 √2r2 E+2Zr− 2 d q(t), ˙ q(t)
q(t) = = dt
q(t)
H 2 E+
2 Z −
q(t) 2 q(t) 2
> 0.
2. Es sei t → p(t), q(t) eine L¨ osung der hamiltonschen Gleichungen mit limt→+∞ q1 (t) = +∞. Wir betrachten die Dynamik der zweiten Koordinate auf dem erweiterten Phasenraum R := Rp × Rq × Rt (lassen also den Index 2 weg). Diese wird durch die zeitabh¨angige Hamilton-Funktion h : R → R , h(p, q, t) := 12 p2 + q12 (t)q 2 ¨ beschrieben. Ahnlich wie in Beispiel 10.44 gehen wir zu Polarkoordinaten f¨ ur diesen explizit zeitabh¨angigen harmonischen Oszillator u ¨ber. Dazu setzen wir als erzeugende Funktion s(q, ϕ, t) := 12 q1 (t)q 2 cot(ϕ). Die zeitabh¨angige kanonische Transformation ist damit ∂s q p= , also ϕ = arctan q1 (t) ∂q p p2 ∂s , also J = 12 q1 (t)q 2 + J =− ∂ϕ q1 (t)
H. L¨osungen der Aufgaben
591
Damit ist h(p, q, t) = q1 (t)J(p, q, t). Die Hamilton–Funktion k mit k(J, ϕ, t) = q1 (t)J +
∂s q(J, ϕ, t), ϕ, t ∂t
erzeugt in den neuen Koordinaten die Dynamik. Explizit ist k(J, ϕ, t) = q1 (t)J +
1 q1 (t) 2 q (t) J 1
q (t) Damit ist J˙ = − q11 (t) J cos(2ϕ) und ϕ˙ = q1 (t) +
sin(2ϕ). 1 q1 (t) 2 q2 (t)
sin(2ϕ).
Unter unserer Annahme limt→+∞ q1 (t) = +∞ ist auf dieses Differentialgleichungssystem die St¨ orungstheorie des Kapitels 15.2 anwendbar. Nach Satz 15.13 gibt es also ein c > 0, sodass c 1 |J(t) − J(t0 )| < . t − t0 ∈ 0, q1 (t ) 0 q1 (t0 ) J ist also eine sogenannte adiabatische Invariante. Im Limes großer t0 folgt wegen der Energieschranke E ≥ h p(t), q(t), t = q (t)J p(t), q(t), t und 1 q1 (t) → +∞, dass J p(t0 ), q(t0 ), t0 = 0 gelten muss. Dann ist aber p(t0 ) = q(t0 ) = 0, und damit in den urspr¨ unglichen Koordinaten ur alle Zeiten t ∈ R. 2 p2 (t) = q2 (t) = 0 f¨ Aufgabe 12.13 auf Seite 272 (Møller-Transformationen in 1D): Da die Møller-Transformationen Ω± nach (12.2.2) die Energien erhalten, gilt H (0) ◦ S(x) = H (0) ◦ (Ω+ )−1 ◦ Ω− (x) = H ◦ Ω− (x) = H (0) (x). Damit muss f¨ ur x = (p, q) ∈ P+ und x = (p , q ) := S(x) gelten: |p | = |p|. Nun besteht f¨ ur E > Vmax die Energieschale ΣE = H −1 (E) aus genau zwei Zusammenhangskomponenten, f¨ ur die sign(p) gleich +1 beziehungsweise = −1 ist. Da diese invariant unter dem Fluss Φt sind, gilt p = p. Da Vmax ≥ 0 ist und E > Vmax angenommen wurde, existiert das τ (p) definierende Lebesgue-Integral f¨ ur kurzreichweitige V . Da f¨ ur beliebige Intervalle 2 −q1 , die I := [q1 , q2 ] ⊂ R die Aufenthaltsdauer des freien Teilchens in I gleich q√ 2E −1/2 q2 dq ist, folgt die Formel des Teilchens im Potential gleich q1 2(E − V (q)) −1/2 −1/2 τ (p) = R (2 E − V (q) dq. 2 − (2E) (0)
Aufgabe 12.24 auf Seite 278 (Streuung bei hohen Energien): p(t) ur alle Zeiten t die Richtung θ(t) := p(t) wohlde(a) Wegen E > V ∞ ist f¨ finiert. Die Richtungs¨anderung p(t) . −∇V q(t)
p(t)
+ ∇V q(t) , p(t) p(t) dθ = dt
p(t) 2
592
H. L¨osungen der Aufgaben ≤ besitzt eine durch dθ dt
p(t) ∈ [vmin , vmax ].
∇V ∞ p(t)
≤
∇V ∞ vmin
beschr¨ankte Norm, denn
(b) F¨ ur alle Zeiten t > 0 gilt
t ≤ vmax t.
q(t) − q(0) = p(s) ds 0
Eine untere Schranke erh¨alt man durch Projektion der Bahn auf ihre Anfangsrichtung. F¨ ur Zeiten t > 0 ist . t. p(0) p(0)
q(t) − q(0) ≥ q(t) − q(0) , p(0) = p(s) , p(0) ds 0 6 s t5 p(0) p(0) − ds ∇V (q(τ )) dτ , p(0) ≥ 0
0
≥ p(0) t − 12 ∇V ∞ t2 ≥ t (vmin − 12 ∇V ∞ t). Diese Schranke ist f¨ ur t < vmin . ∇V ∞
2vmin ∇V ∞
positiv, und sie ist maximal f¨ ur t =
(c) Es sei t0 ∈ R ein Zeitpunkt, an dem p(t0 ), q(t0 ) = 0 ist (falls es ein solches t0 nicht gibt, betrachtet man statt dessen eine Folge (tn )n∈N mit limn→∞ p(tn ), q(tn ) = 0). 2 Die untere Schranke an E impliziert vmin ≥ 4R ∇V ∞ .
-
.
p0 nach (b) gilt: q(t± ) − q0 , p(0)
asst die Da f¨ ur t± := t0 ± v2R ≥ R, verl¨ min Bahn nach t+ und vor t− die Kugel vom Radius R und bewegt sich außerhalb der Kugel geradlinig weiter.
Die Winkel¨anderung im Intervall [t− , t+ ] ist nach (a) h¨ochstens t+ dθ dt ≤ 4R ∇V ∞ = 2R ∇V ∞ ≤ 1. 2 dt vmin E − V ∞ t−
2
Aufgabe 12.35 auf Seite 288 (Billardkugeln): (a) Bezeichnet man in einer Dimension die Orte der Kugelmittelpunkte mit onnen wir annehmen, dass diese f¨ ur alle Zeiten qi ∈ R (i = 1, . . . , n), dann k¨ t aufsteigend geordnet sind. Sind die Radien der Kugeln gleich R und bezeichnet qN := Schwerpunkt, dann wird durch die Abbildung qk → qk − 2kR + Δ
mit
Δ := 2R
n m
=1 n =1 m
n mk qk
k=1 n k=1 mk
ihren
(k = 1, . . . , n)
der Schwerpunkt nicht ver¨andert, aber der Abstand qk+1 − qk um 2R vermindert. Die Dynamik wird damit auf die von n Punktteilchen mit Radius 0 zur¨ uckgef¨ uhrt (siehe Abbildung).
H. L¨osungen der Aufgaben
593
qk
qk
t
t
Besitzen nun diese Teilchen gleiche Massen m := m1 = . . . = mn , dann gilt f¨ ur die Geschwindigkeiten vi = pi /mi nach einem Zweierstoß zwischen dem i–ten und (i + 1)–ten Teilchen gem¨aß (12.5.1): − vi+ = vi+1
+ und vi+1 = vi−
Die Teilchen tauschen also paarweise ihre Geschwindigkeit aus. Tr¨agt man nun die Orte q1 , . . . , qn als Funktion der Zeit auf, dann ergeben sich n Geraden, mit Achsenabschnitten qi und Steigungen vi, siehe Abbildung. Da sich n Geraden h¨ ochstens n2 mal schneiden, ist n2 die Maximalzahl der Kollisionen. Diese wird genau dann realisiert, wenn alle Anfangsgeschwindigkeiten voneinander verschieden sind. ¨ Auch beim Kugelstoßpendel sind die Massen gleich. Ublicherweise ber¨ uhren die Kugeln einander in der Ruhelage fast. Zieht man die ersten k Kugeln nach links und l¨asst sie gemeinsam los, dann werden sich nach den (als eine Kollision wahrgenommenen) St¨ oßen die letzten k Kugeln nach rechts weiterbewegen. Da ihre Aufh¨angung eine r¨ ucktreibende Kraft erzeugt, wiederholt sich der Vorgang in gespiegelter Reihenfolge. (b) Wie aus der Aufgabe (a) hervorgeht, ur einen Zeitpunkt t, bei dem keine ist f¨ Kollision stattfindet, die L¨ osung p(t, x0 ), q(t, x0 ) stetig in den Anfangsbedingungen x0 . Auch Mehrfachkollisionen k¨ onnen stetig fortgesetzt werden. Dies ist bei voneinander verschiedenen Massen nicht mehr der Fall. Aber auch wenn wir nur Anfangsbedingungen betrachten, die nicht zu Mehrfachkollisionen f¨ uhren, wirkt sich die Verschiedenheit der Massen aus. Beispielsweise wird eine Kugel zwischen zwei Kugeln mit viel gr¨oßeren Massen oft kollidieren k¨onnen. Galperin hat in [Galp] gezeigt, dass f¨ ur drei Kugeln mit Massen m1 , m2 und m3 und voneinander verschiedene Anfangsgeschwindigkeiten die Zahl ihrer Kollisionen gleich I J π arccos
m1 m3 (m1 +m2 )(m2 +m3 )
(mit der ceil-Funktion ·) ist. Sie ist also mindestens gleich 2, gleich 3 f¨ ur gleiche Massen, und divergiert f¨ ur m2 ! 0.
594
H. L¨osungen der Aufgaben Dieses Ergebnis gewinnt man folgendermaßen: Im Konfigurationsraum R3q der drei Teilchen geht man zum Schwerpunktsystem, also zur Ebene ˜ := q ∈ R3 E
3 i=1 mi qi = 0
u Q := M q ¨ber. Die lineare Abbildung √ √ √ mit M := diag m1 , m2 , m3 ˜ = bildet diese ME 3auf√ E := 3 Q∈R mi Qi = 0 ab. Die i=1 Kollisionen entsprechen den Geraden √ √ Q ∈ E | Qi / mi = Qi+1 / mi+1 (i = 1, 2). Vorteil des Koordinatenwechsels ist, dass der Vektor der transformierten Geschwindigkeiten V := M v bei einer Kollision des i–ten und (i + 1)–ten Teilchens an der Gerade √ √ span ei / mi −ei+1 / mi+1 ⊂ E gespiegelt wird. Da der Winkel ϕ zwischen diesen beiden Geraden von der Form m1 m3 ϕ = arccos (m1 +m2 )(m2 +m3 ) ist, ergibt sich die Formel durch Entfaltung des Konfigurationsraumes in der Ebene E (siehe Abbildung). 2 Aufgabe 12.37 auf Seite 289 (Potential einer zentralsymmetrischen Massenverteilung): 3 (a) Sowohl das Lebesgue–Maß auf dem R3 als auch die Kugel BR sind invariant −1 unter der Wirkung von O ∈ SO(3). Es gilt also mit y := O x: V (Oq) =
3 BR
ρ(x) ρ(O−1 x) ρ(y) dx = dx = dy = V (q). −1 x)
3 3
Oq − x
O(q − O
O(q − y)
BR BR
(b) q − x =
x21 + x22 + (x3 − a)2 . Unter Benutzung der Kugelkoordinaten
x1 = r cos(θ) cos(ϕ) , x2 = r cos(θ) sin(ϕ) ist dies gleich r2 + a2 − 2ra sin(θ).
, x3 = r sin(θ)
¨ (c) Beim Ubergang zu den Kugelkoordinaten wird der Integrand mit der Funk-
H. L¨osungen der Aufgaben
595
ur a = q > 0 tionaldeterminante r2 cos(θ) multipliziert. Damit ist f¨
R
V (q) = 2π =
2π a
0
R
ar
−ar
0
π/2
ρ˜(r)r2 cos θ dθ dr r2 + a2 − 2ra sin θ −π/2 2π R ρ˜(r)r du √ dr = r |a + r| − |a − r| ρ˜(r) dr. 2 2 a r + a − 2u 0 √
2π a
(d) F¨ ur a > R ist also V (q) =
R 0
2r2 ρ˜(r) dr.
In Kugelkoordinaten ist das Integral f¨ ur die gesamte Masse beziehungsweise R π/2 R Ladung gleich M = 2π 0 −π/2 ρ˜(r)r2 cos θ dθ dr = 2π 0 2r2 ρ˜(r) dr. (e) F¨ ur a ∈ (0, R] ist V (q) =
2π a
a 0
2π R ρ(r) dr. a a 2ra˜ 4π a 2 − a3 0 2r ρ˜(r) dr und
2r 2 ρ˜(r) dr +
Damit gilt f¨ ur V˜ ( q ) = V (q): a2 ∂a V˜ (a) = a 2 ˜(r) dr − 4π ρ˜(a), also insgesamt −ΔV = 4πρ. ∂a2 V˜ (a) = + 4π a3 0 2r ρ 3
(f) Da mit der Gravitationskonstante G ≈ 6.67 · 10−11 kgm s2 wegen des newton 3π ist, h¨angt sie nur von der schen Kraftgesetzes die Umlaufzeit T = ρG mittleren Dichte ρ des Himmelsk¨ orpers, nicht von seinem Radius ab. Diese kg kg Dichte variiert verh¨altnism¨aßig wenig (ρErde ≈ 5 500 m 3 , ρSonne ≈ 1 400 m3 ), denn auch sie l¨asst sich n¨aherungsweise durch die Kombination von Naturkonstanten wie dem Bohr-Radius berechnen. 2 Aufgabe 12.45 auf Seite 293 (Clusterprojektionen): Die linearen Abbildun
1 E gen ΠE : M → M, Π (q) = m q (mit Teilchenindex ∈ Ci ) auf j j C C j∈Ci mCi dem euklidischen Vektorraum (M, ·, ·M ) sind orthogonale Projektionen:
E ΠE C ◦ ΠC (q) =
1 mj 1 mr qr = mr qr = ΠE C (q) mCi mCi mCi j∈Ci
r∈Ci
r∈Ci
und )
ΠE C (q ), q
* M
=
n
k . ) *
= m ΠE (q ) , q m m1C C r∈Ci mr qr , q i=1 ∈Ci
=1
=
k i=1 r∈Ci
=
)
i
k . ) *
1 m r qr , m C mr qr , ΠE C (q)r ∈Ci m q =
* q , ΠE C (q) M .
i
i=1 r∈Ci
Also ist auch ΠIC = 1lM − ΠE C eine orthogonale Projektion: E E E E I ΠIC ◦ ΠIC = 1lM − 1lm ◦ ΠE C − ΠC ◦ 1lM + ΠC ◦ ΠC = 1lm − ΠC = ΠC ∗ ∗ E I und ΠIC = 1lM − (ΠE C ) = 1lM − ΠC = ΠC .
2
596
H. L¨osungen der Aufgaben
Aufgabe 12.47 auf Seite 296 (Tr¨ agheitsmomente): Die Mengenpartition D ∈ P(N ) ist nach Annahme feiner als C ∈ P(N ). F¨ ur die SchwerpunktproE E E E jektionen gilt damit ΠE onnen also die externen C ΠD = ΠD ΠC = ΠD , wir k¨ E E E E E Tr¨agheitsmomente JCE = J ◦ ΠE C und JD = J ◦ ΠD durch JD = JC ◦ ΠD E E E vergleichen. Wegen Konvexit¨at von J, also auch von JC folgt JD ≤ JC . 2
Kapitel 13, Integrable Systeme und Symmetrien Aufgabe 13.12 auf Seite 322 (Wirkung des planaren Pendels): Wir benutzen die vollst¨andigen elliptischen Integrale erster Art, das heißt 6 K(k) =
π/2
−1/2 1 1 − k2 sin2 (ϕ) dϕ = 0 √
0
dx , (1−x2 )(1−k 2 x2 )
und zweiter Art: E(k) =
1/2 1 1−k2 x2 1 − k2 sin2 (ϕ) dϕ = 0 1−x2 dx.
π/2 0
Die Wirkung I(h) =
H −1 ([−1,h])
dpψ dψ ist
• f¨ ur h > 1 mit ϕ := ψ/2 gleich
π
=
2(h + cos(ψ)) dψ = 8 0 2 8 2(h + 1)E h+1 .
I(h) = 4
π/2
2(h + 1 − 2 sin2 ϕ) dϕ
0
• F¨ ur h ∈ (−1, 1) benutzen wir die Substitution x :=
1−cos(ψ) 1+h .
F¨ ur ψ ∈
[0, arccos(−h)] ist also x ∈ [0, 1]. Mit der Abk¨ urzung k := 1+h 2 ist der Inte arccos(−h) 2(h + cos(ψ)) dψ gleich 2(h + cos(ψ)) = grand von I(h) = 4 0 √ 2k 2 √ 2k 1 − x und dψ = 1−k2 x2 dx. Also ist I(h) = 16k
2 0
1
+
1 − x2 dx = 16 E(k) − (1 − k2 )K(k) . 2 2 1−k x
Die Ableitung der stetigen, monoton wachsenden Funktion I : [−1, ∞) → [0, ∞) existiert damit u ¨berall bis auf die Stelle h = 1. und ist gleich der Periode des Orbits. Bei h = 1 divergiert sie √ wegen der oberen Ruhelage. Im 2 Limes h , ∞ ist I(h) asymptotisch zu 4π 2h.
6 Bei
deren Benutzung ist darauf zu achten, dass diese oft anders definiert werden!
H. L¨osungen der Aufgaben
597
Aufgabe 13.29 auf Seite 337 (koadjungierte Orbits): (a) Mit O(ξ) = {gξg −1 | g ∈ G} und der Parametrisierung einer Umgebung von e ∈ G durch g = exp(u) mit g −1 = exp(−u) folgt die Behauptung Tξ O(ξ) = {[u, ξ] | u ∈ g ⊂ Mat(n, R)} aus der Produktregel der Ableitung. (b) Die durch Reduktion definierte symplektische Form auf der linken Seite von (13.5.14) ist Ad∗g –invariant. Wegen Adg [u, v] = [Adg u, Adg v] ist auch die Zwei–Form auf der rechten Seite von (13.5.14) Ad∗g –invariant. Ihre Identit¨at wird z.B. in Kapitel 14 von Marsden und Ratiu [MR] bewiesen. (c) Wegen der Formel (13.5.13) f¨ ur die Impulsabbildung J : T ∗ G → g∗ und der Definitionsgleichung Xξ (e) = ξ des infinitesimalen Erzeugers Xξ : G → T G ist die Restriktion von J auf Te∗ G = g∗ die Identit¨at. 2
Aufgabe 13.32 auf Seite 339 (Hamiltonsche S 1 -Wirkung auf S 2 ): Auf dem Zylinder Z := {x ∈ R3 | x21 + x22 = 1, |x3 | < 1} mit der Fl¨achenform cos t − sin t 0 erzeugt HZ : Z → R, x → x3 die S 1 –Wirkung Φt (x) = sin t cos t 0 x. Nach 0
0
1
Aufgabe 10.30 ist die radiale Projektion F : Z→ S2 ein Symplektomorphismus 0 auf das Bild, und H ◦ F = HZ . Nur die Pole 0 , auf denen H extremal ist, ±1
werden von F nicht getroffen. Damit erzeugt auch H eine S 1 –Wirkung.
2
Aufgabe 13.37 auf Seite 342 (Ky-Fan-Maximumsprinzip f¨ ur hermitesche Matrizen): Da A ∈ Herm(d, C) Eigenr¨aume zu den Eigenwerten λi besitzt, die f¨ ur Indices i > j orthogonal sind, sehen wir durch Wahl orthonormaler Eigenvektoren x1 , . . . , xk ∈ Cd zu den Eigenwerten λ1 , . . . , λk , dass jedenfalls k
λi ≤
i=1
max
k
(x1 ,...,xk )∈Vk (Cd )
xi , Axi
i=1
gilt. Umgekehrt sei (x1 , . . . , xk ) ∈ Vk (Cd ), und wir erg¨anzen zu einer Orthonormalbasis (x1 , . . . , xd ) ∈ Vd (Cd ). Dann besitzt die Darstellung von A in dieser Basis nach dem Satz von Schur und Horn Diagonalwerte bi,i , die sich als Konvexkombination der λσ (σ ∈ Sd ) darstellen lassen: bi,i =
σ∈Sd
cσ λσ(i)
mit
cσ ≥ 0 ,
cσ = 1.
σ∈Sd
k Das Maximum von i=1 bi,i wird aber an einer Ecke des Polytops Π Λ−1 (λ) angenommen. Eine solche Ecke ist wegen der schwachen Ordnung λ1 ≥ λ2 ≥ . . . der Eigenwerte die f¨ ur σ = Id. 2
598
H. L¨osungen der Aufgaben
Kapitel 14, Starre und bewegliche K¨ orper Aufgabe 14.2 auf Seite 345: Es ist (v, O)−1 = (−O−1 v, O−1 ).
2
Aufgabe 14.8 auf Seite 350 (Scheinkr¨ afte): 1. In der dimensionsunabh¨ angigen Formel (14.2.5) ist f¨ ur d = 2 die Matrix cos(ϕ) sin(ϕ) − sin(ϕ) − cos(ϕ) −1 B = O O = − sin(ϕ) cos(ϕ) ϕ = ϕ 10 −1 = ϕ J. 0 cos(ϕ) − sin(ϕ) Daraus folgt B 2 = −(ϕ )2 1l, B = ϕ J und die Behauptung.
2. Die Formel folgt sofort aus (14.2.5) und Bv = i(ω)v = ω ×v (siehe (13.4.8)). 3. Der Betrag 2m C
ω der Coriolis–Kraft h¨angt nicht von der geographischen Lage ab, da die Fahrtrichtung senkrecht auf der Drehachse der Erde ist. Mit ω = 2π/T , T = 86 400 s und C = 20 000/3 600 m/s betr¨agt sie etwa 0.08 Newton. Zum Vergleich: eine Schokoladentafel wiegt etwa 1N. Die Kraft wirkt vertikal gesehen nach unten und in ihrer Horizontalkomponente nach Norden, macht den den Radfahrer also schwerer und lenkt ihn nach rechts ab. Das sieht man mit der Rechte-Hand-Regel f¨ ur das Vektorprodukt in der Formel −2mω × C der Coriolis–Kraft. Die Aufteilung auf diese Komponenten entspricht bei der geographischen Breite Berlins von 53.5◦ etwa 0.048 N beziehungsweise 0.064 N. Der Betrag der nach rechts ablenkenden Kraftkomponente h¨angt nicht von der Fahrtrichtung ab. 2 Aufgabe 14.10 auf Seite 353 (Satz von Steiner): • Aus der Formel f¨ ur I(q) folgt schon die Minimalit¨at von I TqN (q) , denn der Summand mN qN 2 (1l3 − PN ) ist positiv semidefinit und genau dann gleich Null, wenn der Schwerpunkt qN = 0 ist. ˜ ˜ • Die Formel selbst denn ergibt
n sich aus I = J1l3 − I2 mit I aus (14.2.3), 2 J(q) − J TqN (q) = 2m (q , q −
q
) = m
q
. Analog ist k N k N N N k=1 2 I˜0 (q) − I˜qN (q) (q) = mN qN 2 PN . Aufgabe 14.11 auf Seite 354 (Haupttr¨ agheitsmomente): • Es gen¨ ugt, den Fall n = 3 zu betrachten, da f¨ ur q4 := . . . qn := 0 die Haupttr¨agheitsmomente von den ersten drei Massenpunkten bestimmt werden. Sei ur Masnun qk = ek . Dann ist I = diag(m2 + m3 , m1 + m3 , m1 + m2 ). F¨ sen 0 ≤ m3 ≤ m2 ≤ m1 ist damit (I1 , I2 , I3 ) = (m2 + m3 , m1 + m3 , m1 + m2 ). Die Ungleichungen der Massen u ¨bertragen sich in I1 ≤ I2 ≤ I3 ≤ I1 + I2 . • Analog zeigt man auch (in einer Orthonormalbasis, in dem I diagonal ist) die ur beliebige n ∈ N. allgemeine G¨ ultigkeit der Ungleichung I3 ≤ I1 + I2 f¨ • Wenn der Schwerpunkt der drei Massenpunkte der Ursprung des R3 ist, ist span(q1 , q2 , q3 ) h¨ochstens zweidimensional. Damit ist I1 + I2 = I3 , die Haupttr¨agheitsmomente sind also Konvexkombinationen von denen einer Scheibe und
H. L¨osungen der Aufgaben
599
eines Stabes. • Dass eine homogene Kugel mit Mittelpunkt 0 drei gleiche Haupttr¨agheitsmomente besitzt, folgt aus ihrer Symmetrie unter beliebigen Drehungen. • F¨ ur einen in 1–Richtung orientierten Stab ist I = diag(0, I2 , I2 ). • Den Tr¨agheitstensor I einer kreisf¨ ormigen Massenverteilung erh¨alt man durch π/2 Integration I = 0 I(ϕ) dϕ u ¨ber die Tr¨agheitstensoren I(ϕ) der Konfiguration gleicher Massen an den vier Punkten ±e1 (ϕ) und ±e2 (ϕ) mit e1 (ϕ) := cos(ϕ)e1 + sin(ϕ)e2
und e2 (ϕ) := cos(ϕ)e2 − sin(ϕ)e1 .
Da dabei I(ϕ) = I(0) gilt, folgt die Aussage I = diag(I1 , I1 , 2I1 ) daraus, dass die Projektion auf die 1–2–Ebene alle vier Punkte ±e1 , ±e2 invariant l¨asst, die Projektionen auf die 1–3–Ebene bzw. die 2–3–Ebene dagegen nur jeweils zwei von ihnen, w¨ahrend die beiden anderen auf die Null abgebildet werden. 2 Aufgabe 14.17 auf Seite 360 (Schneller Kreisel): Die Anfangsbedingung ˙ β(0) = 0 (also u(0) = 1) erfordert z = Z . Die Anfangsbedingung β(0) =0 2Z bedeutet E = Veff (0) = 2I3 + 1. Zusammen ergibt das 2 Ueff (u) = I1−1 (1 − u)2 2(1 + u) − IZ1 . Die Drehung ist also stabil f¨ ur
2Z I1
√ > 4, d.h. Frequenz |ω| > 2/ I1 .
2
Aufgabe 14.20 auf Seite 362 (Euklidische Symmetrien): 1. Die Wirkung von (v, O) ∈ SE(d) auf Rd ist gegeben durch x → Ox + v, siehe (14.1.2). Dabei ist v ∈ Rd und O ∈ SO(d). Ist nun K ⊂ Rd ×Rd kompakt, also beschr¨ankt mit Schranke b > 0, dann kann der Punkt (x, Ox + v) nur dann in K liegen, wenn v ≤ 2b gilt. Denn Ox + v ≥ v − Ox = v − x . Da die Drehgruppe SO(d)kompakt ist, ist damit auch das Urbild von K unter der Abbildung (O, v), x) → (x, Ox + v) kompakt. Die Diagonalwirkung von SE(d) auf Rnd kann als Wirkung einer abgeschlossenen Untergruppe von SE(nd) aufgefasst werden. Sie ist daher mit dem gleichen Argument eigentlich. Da die offene, dichte Teilmenge Q invariant unter dieser Wirkung ist, folgt die Aussage auch auf die auf Q restringierte Wirkung. 2. Die Wirkung von G := R+ × SE(2) auf R2 , gegeben durch x → λO(x + v), ist eine Wirkung der Lie–Gruppe G. In komplexer Schreibweise wirkt G auf R2 ∼ = C durch Multiplikation mit einer komplexen Zahl z = λO ∈ C∗ und Translation um v ∈ C. ∼ C3 dreier TeilG wirkt auch diagonal auf dem Konfigurationsraum (R2 )3 = chen in der Ebene. Setzen wir z := 1/(q2 − q1 ) und v := −q1 , dann wird q1 auf 0 ∈ C und q2 auf 1 ∈ C abgebildet. Das Bild w ∈ C \ {0, 1} von q3 parametrisiert dann die Gruppenorbits, und C \ {0, 1} ist das Bild der Formsph¨are unter stereographischer Projektion. 2
600
H. L¨osungen der Aufgaben
Kapitel 15, St¨ orungstheorie Aufgabe 15.5 auf Seite 371 (Bedingt-periodische Bewegung): Der bedingtperiodische Fluss auf T2 mit Frequenzvektor (1, 1/12) besitzt die Periode 12. Seine geschlossenen Orbits treffen die Diagonale {(x, x) ∈ T2 | x ∈ S 1 } elf Mal. Stunden- und Minutenzeiger treffen sich also innerhalb eines Tages 22 Mal. 2 Aufgabe 15.12 auf Seite 376 (Virialsatz f¨ ur Raummittel): d (a) {f, H}E = ΣE {f, H} dλE = ΣE dt f ◦ Φt |t=0 dλE = 0, denn das Maß λE ist Φ–invariant. (b) Klar. (c) F¨ ur f (p, q) := p, q hat die Poisson–Klammer {f, H}(p, q) =
N
1
pj 2 − qj , ∇Uj (qj ) − 2
j=1
N
qj , ∇Wj,k (qj − qk )
k=j+1
Mittelwert Null. Der erste Summand ist die mittlere kinetische Energie. (d) Wegen der Kompaktheit der berandeten Mannigfaltigkeit G gibt es ein ε > 0, f¨ ur das auf Gε := {q ∈ R3 | dist(q, G) ≤ ε} die Funktion q → U (q) = ur Parameterwerte dist(q, G)2 glatt ist. Auf ∂Gε ist U gleich ε2 . Also ist f¨ λ > E/ε2 auch die Energieschale ΣE,λ glatt, denn sie projiziert bez¨ uglich aller Teilchenindices j auf deren Ortsraumgebiet G√E/λ . Das Volumen VE/λ von G√E/λ f¨allt f¨ ur λ , ∞ auf das Volumen V von G. Da der Nachweis der idealen Gasgleichung l¨anglich ist, folgt hier nur eine Skizze. 1. Wenn das als Wahrscheinlichkeitsmaß μE,λ auf ΣE,λ normierte Liouville– Maß u ¨ber die Geschwindigkeiten integriert wird, bleibt die Dichte d/2−1 ˜ (˜ q )/E)+ d˜ q , mit v(E, λ) ∈ (V, VE/λ ), v(E, λ)−1 2(1 − λU
N ˜ (˜ q ) = k=1 U (qk ). q˜ = (q1 , . . . , qN ) und U Daher w¨achst im Limes λ , ∞ das Integral dieser Dichte u ¨ber GN gegen Eins. 2. Wegen U ≥ 0 ist die kinetische Energie T auf ΣE,λ kleiner als E. Aber da U G = 0 ist, folgt limλ∞ T E,λ = E. Also gilt nach dem Virialsatz
N ur Mλ (˜ q ) := k=1 qk , ∇λU (qk ). auch limλ∞ M E,λ = E, f¨ 3. Wenn G der W¨ urfel [−, ]3 ist, dann gilt mit den orthonormalen Basisvektoren e1 , e2 , e3 des R3 , dass die Summe der Projektionen auf diese Vektoren Eins ist. Der Gesamtdruck etwa auf die Seitenfl¨achen {±} × [−, ]2 l¨asst sich als limλ∞ R1 E,λ definieren, mit Ri (˜ q ) :=
N k=1
sign(qk ) ei , λ∇U (qk ) .
H. L¨osungen der Aufgaben
601
Nach dem Hauptsatz ist dieses Integral im Limes λ , ∞ gleich 2P V . Summiert man u ¨ber die drei Basisvektoren, ergibt sich P V = 23 T E . 4. F¨ ur beliebige glatt berandete G ⊂ R3 folgt bei Benutzung des Satzes von Stokes eine analoge Aussage. 2 Aufgabe 15.21 auf Seite 385 (Relativistische Periheldrehung): Die Hamilton-Funktion 7 (15.3.17) hat die Form Hε = H0 + εK, mit der Hamilton– Z Funktion H0 (p, q) = 12 p 2 − q der Kepler-Bewegung und K(p, q) = −1/ q 3 . Den maximalen von Hε erzeugten Fluss bezeichnen wir mit Φε . Der RungeLenz-Vektor A ist unter dem Kepler-Fluss Φ0 invariant. Daher ver¨andert sich A nach der hamiltonschen St¨ orungstheorie erster Ordnung innerhalb einer Periode T des Φε –Orbits t → x(t) um
T 0
T dA dt = ε −Dp A x(t) ∇q K x(t) +Dq A x(t) ∇p K x(t) dt+O(ε2 ). dt 0
Der zweite Integrand verschwindet, der erste liefert wegen q1 2q1 p2 −q2 p1 3 2 p2 und ∇q K(x) = − q Dp A(x) = 2q2−q 5 ( q2 ) p1 −q1 p2 −q1 p1 T q T dt = 3ε 0 −q21 / q 5 dt + O(ε2 ). den zu ε proportionalen Beitrag in 0 dA dt Wir parametrisieren mit dem Winkel ϕ statt mit der Zeit t. Unter Verwendung der Kegelschnittgleichung (1.7) der Kepler–Ellipse mit ϕ0 := 0 und mit ϕ˙ = /r2 ist T q2 2 sin ϕ 3εZ 2 2π −q1 1 + e cos(ϕ) 3ε dt = cos ϕ dϕ 5 4
q
0 0 0 6πεZ 2 0 6πεZ e −1 =
A −1 = 4 4 In der letzten Umformung wurde A = Ze aus Aufgabe 11.22 (b) verwandt. Diese St¨orung ist senkrecht auf dem A–Vektor (Aufgabe 11.22 (a)). Also bleibt dessen Norm bis auf Fehler der Ordnung ε2 konstant. Teilung durch A liefert die Ver¨anderung des Argumentes von A. 2 Aufgabe 15.37 auf Seite 403 (Nichtdegeneriertheitsbedingungen): 2 0 1 ω = 001 . 1. ω1 (I) = 1 + 2I1 , ω2 (I) = 1. Daher ist Dω = ( 20 00 ) und Dω ω 0 2. ω1 (I) = 1 + 2I1 , ω2 (I) = 1 − 2I2 . Dω =
2
0 0 −2
und
Dω
ω
ω 0
=
2
110
0 1 0 −2 1 1 1 0
.2
Aufgabe 15.45 auf Seite 407 (Kettenbruchentwicklung): • Dass limn→∞ ωn existiert, folgt aus den Teilen 1) und 3) von Satz 15.44. Denn diese sagen, dass die Teilfolgen mit (un-)geradem Index monoton steigend 7 Wir
lassen die H¨ ute aus (15.3.17) zur Vereinfachung weg.
602
H. L¨osungen der Aufgaben
(beziehungsweise fallend) sind, und die Differenz ihrer Glieder gegen Null geht. • Dass die Folge gegen ω konvergiert, ist eine Konsequenz der Beziehung ω= (H.7) folgt induktiv: pn+1 + h(ρ) pn qn+1 + h(ρ) qn
= =
pn + h(n) ({ω}) pn−1 qn + h(n) ({ω}) qn−1
p0 + h(0) ({ω}) p−1 q0 + h(0) ({ω}) q−1
=
ω + {ω} 1+0
(n ∈ N0 ).
(H.7)
= ω und, mit ρ := h(n) ({ω}),
an+1 pn + pn−1 + h(ρ) pn ( 1/ρ + h(ρ))pn + pn−1 = an+1 qn + qn−1 + h(ρ) qn
1/ρ + h(ρ))qn + qn−1 −1 ρ pn + pn−1 pn + ρpn−1 = = ω. ρ−1 qn + qn−1 qn + ρqn−1
• Denn (H.7) besagt wegen der Positivit¨at von h(n) ({ω}), dass ω zwischen n−1 ωn = pqnn und ωn−1 = pqn−1 liegt. Siehe auch Theorem 14 in Khinchin [Kh]. 2
Kapitel 16, Relativistische Mechanik Aufgabe 16.6 auf Seite 417 (Lorentz–boosts): 1. Die Lorentz–boosts sind nach Definition die positiven Matrizen in der restringierten Lorentz–Gruppe SO+ (3, 1). Zun¨achst sind die angegebenen L(v) von diesem Typ. Das ist f¨ ur L(0) klar. F¨ ur v ∈ R3 , 0 < v < 1 rechnet man L(v) IL(v) = I nach. Die Positivit¨at von L(v) erh¨alt man f¨ ur einen Vektor w = ww˜4 ∈ R4 aus der Identit¨at ˜ 2 ≥ 0. w, L(v)w = γ(v)(w, ˜ v + v4 )2 + w
Umgekehrt sei A = ca db ∈ SO+ (3, 1) (mit a ∈ Mat(3, R), b, c ∈ R3 und d ∈ R) positiv und A = 1l4 . Aus der Symmetrie von A folgt b = c und a = a, aus der Positivit¨at d > 0. Die Bedingung A IA = I beinhaltet die Relationen d2 − b 2 = 1, die Eigenwertgleichung ab = cb und a2 = 1l3 + b ⊗ b . Also ist d ≥ 1. Der Fall d = 1 kann nicht vorkommen, denn sonst w¨are b = 0 und a = 1l3 , was der Annahme A = 1l4 widerspr¨ache. Also ist d = γ mit γ := 1 + b 2 > 1, und f¨ ur v := b/γ gilt v ∈ (0, 1). Ebenso gilt die Relation γ = (1 − v 2 )−1/2 . ˜2 = 1l3 − Pv + a ˜ := 1l3 − Pv + γ(v)Pv ist positiv und besitzt das Quadrat a 2 γ(v) Pv = 1l3 + b ⊗ b . Wir haben damit bewiesen, dass A = L(v) gilt. 2. Die behauptete Relation d2 = 1 + b 2 wird so wie im ersten Aufgabenteil gezeigt.
H. L¨osungen der Aufgaben
603
˜ orthoWir wissen schon, dass P positiv ist. Es ist zun¨achst zu zeigen, dass O gonal ist. Dazu wertet man die Relation AIA = I aus (diese gilt, da mit A auch A ∈ O(3, 1) ist): aa − b ⊗ b = 1l3
, ac = bd
, c c = d2 − 1.
˜ = O ⊕ 1 mit O = a[1l3 − Pv + γPv ] − bc . Berechnung Wir erhalten O von OO ergibt 1l3 . Wegen [1l3 − Pv + γPv ]c = γc = dc und ac = bd ist Oc = (d2 − c c)b = b. 3. In der Gleichung P = L(c/d) k¨ onnen c und d aus dem Produkt A = ca db := L(v1 )L(v2 ) abgelesen werden. Es ist d = γ(v1 )γ(v2 )(1 + v1 , v2 ) und c = [(1l3 − Pv1 ) + γ(v1 )Pv1 ]γ(v2 )v2 + γ(v1 )γ(v2 )v1 . Also ist u = c/d gleich [(1l3 −Pv1 )/γ(v1 ) + Pv1 ]v2 +v1 1+v1 ,v2
=
v1 +v2 + 1−
√
1−v1 2 v1 v1 ,v2 /v1 2 −v2 1+v1 ,v2
.
Aus der Identit¨at v1 × (v1 × v2 ) = v1 v1 , v2 − v2 v1 2 ergibt sich (16.2.6). ×(v1 ×v2 ) K Das Quadrat von u = v1 + v2 + v1√ (1 + v1 , v2 ) hat den Z¨ahler 2 1+
1−v1
v × (v × v ) 2 , v × (v × v ) v 2 1 1 2 1 1 2
v1 + v2 2 + 2 + 2 2 1 + 1 − v1
1 + 1 − v1 1 − v1 2 ) − v1 2 2 2 2(1 + = v1 + v2 − v1 × v2
. (1 + 1 − v1 2 )2 2
Der letzte Faktor ist Eins. Wegen v1 × v2 2 + v1 , v2 = v1 2 v2 2 ergibt sich weiter 1 − v1 2 1 − v2 2
v1 + v2 2 − v1 × v2 2 2 = 1− < 1.
u = (1 + v1 , v2 )2 (1 + v1 , v2 )2 4. Aus der Relation D12 = D21 und (16.2.7) schließen wir, dass L(u21 ) = ˜ ist, also wegen (16.2.8) gilt: u21 = D12 u12 . Da u21 und u12 ˜ 12 L(u12 ) D D 12 sich im von v1 und v2 aufgespannten Unterraum befinden, liegt die Drehachse 2 von D12 senkrecht dazu.
Aufgabe 16.8 auf Seite 419 (Minkowski–Produkt): Durch Lorentz–Transformation erreichen wir, dass v = (0, 0, 0, v4 ) ist, also v, w3,1 = −v4 w4 . Andererseits ist nach Lorentz–Transformation ein raumartiger Vektor von der Form v = (v1 , 0, 0, 0) = 0, besitzt also etwa den ·, ·3,1 –orthogonalen raumar2 tigen Unterraum span(e2 , e3 ).
604
H. L¨osungen der Aufgaben
Aufgabe 16.14 auf Seite 423 (Modifiziertes Zwillingsparadox): In den Forv3 meln von Beispiel 16.13 ist die Zeitdifferenz tw − t0 = 2 uEc2vE + O cmax . 2 Dieser Altersunterschied der beiden Schnecken nach ihrer Erdumrundung ist also im Limes verschwindender Kriechgeschwindigkeit gleich 2 uEc2vE ≈ 0.41μs (Mikrosekunden). 2 Aufgabe 16.22 auf Seite 435 (Galilei–Gruppe): (a) Die Galilei–Transformation setzt sich aus einer Translation (p1 , . . . , pn , E; q1 , . . . , qn t) → (p1 , . . . , pn , E; q1 +Δq, . . . , qn +Δq, t+Δt), (H.8) einer Drehung (p1 , . . . , pn , E; q1 , . . . , qn , t) → (Op1 , . . . , Opn , E; Oq1 , . . . , Oqn , t) (H.9) und einem boost (H.10) (p1 , . . . , pn , E; q1 , . . . , qn , t) → 2 1 p1 + m1 v, . . . , pn + mn v, E + v, pN + 2 m v ; q1 + vt, . . . , qn + vt, t des erweiterten Phasenraums Pn zusammen. Die Translation besitzt Ableitung 1l, ist also symplektisch. Dass die Phasenraumdrehung symplektisch ist, folgt wie in Beispiel 13.17. A B ) mit Untermatrizen A, B, Die Ableitung des boosts besitzt die Form ( C D 1l 0 nd C, D ∈ Mat(nd + 1, R), B = C = 0 und A = D = v...v 1 .
Da wir die symplektische Form (16.5.5) mit Konfigurationsraum M = Rnd q benutzen, ergibt das mit der Zeitspiegelung I modifizierte Kriterium aus Aufgabe 6.26 (b), dass auch der boost symplektisch ist. (b) Da das Potential nur von den Abst¨anden qk − q abh¨angt, ist H unter den Translationen (H.8) invariant. Die Forderung Vk, (Oq) = Vk, (q) der Rotationsinvarianz impliziert Invarianz bez¨ uglich (H.9). Der boost (H.10) ver¨andert H nicht, denn m = m1 + . . . + mn und pN = p1 + . . . + pn . 2 Aufgabe 16.25 auf Seite 436 (konstante Beschleunigung): Die Beschleunigung g > 0 bewirkt eine raumartige Entfernung 1/g des Beobachters vom Kreuzungspunkt der Geraden. F¨ ur g = 10 m/s2 ist die Entfernung damit c2 /g ≈ 12 2 9 · 10 km, also ungef¨ahr ein Lichtjahr.
Kapitel 17, Symplektische Topologie Aufgabe 17.13 auf Seite 447 (elliptischer Billard): • Die Orbits {(±a1 , 0; ∓1, 0)} und {(0, ±a2 ; 0, ∓1)} auf den Achsen haben die Periode 2.
H. L¨osungen der Aufgaben
605
• Ein Orbit der Periode 2 muss zu einer Billardtrajektorie geh¨oren, die eine an ihren Endpunkten p1 , p2 ∈ C auf Tpi C senkrechte Strecke ist. Damit ist Tp1 C parallel zu Tp2 C und p1 = −p2 , die Strecke geht also durch den Mittelpunkt der Ellipse. Da a1 < a2 ist, ist die Strecke eine Halbachse. 2
Anh¨ ange Aufgabe A.47 auf Seite 468 (Differentialtopologie): 1. f : R → R, t → t3 besitzt die nur bei t = 0 verschwindende Ableitung f (t) = 3t2 , ist also injektiv und nur bei 0 nicht immersiv. Da limt→±∞ f (t) = ±∞ gilt, ist f (R) = R. 3 2 0 f (t) 2. F¨ ur f : R → R2 , t → tt2 ist f (t) = 3t 2t . Damit ist lim±t0 f (t) = ±1 und f (R) ist keine Untermannigfaltigkeit. sin t 3. Die Ableitungen der Rosenkurven fk : R → R2 , t → cos(kt) cos ur t sind f¨ sin t cos t k ∈ R gleich fk (t) = −k sin(kt) cos t + cos(kt) − sin t . Sie besitzen also die ur k = 0 ist Norm 1 + k2 sin2 (kt) > 0, weshalb die fk Immersionen sind. F¨ ur die 0 ∈ fk (R), aber es gibt im Allgemeinen verschiedene Richtungen fk (t) f¨ t–Werte mit fk (t) = 0. Dann ist fk (R) keine Untermannigfaltigkeit. 4. f ist 2π-periodisch, also nicht injektiv. Dass S 1 ⊂ R2 eine Untermannigfaltigkeit ist, folgt mit S 1 = g −1 (1) f¨ ur g(x) := x 2 . 2 −t2 = 0 als Ableitung. 5. f : R → R2 , t → exp(−t2 ) tt3 hat f (t) = t21−2t (3−2t2 ) e 2 f ist ungerade und f¨ ur t > 0 w¨achst t → ff21 (t) (t) = t streng monoton. Also ist f injektiv. Andererseits ist limt→±∞ f (t) = 0 = f (0), also ist f nur eine injektive Immersion und keine Einbettung. 6. F¨ ur f ∈ C 1 (M, N ) und m ∈ M ist rang(Tm f ) ≤ min dim(M ), dim(N ) .
7. Ist π : E → B ein C 1 –Faserb¨ undel, dann ist nach Definition F.1 die Abbildung π eine C 1 –Abbildung von Mannigfaltigkeiten. Ist b ∈ B, dann existiert eine Umgebung U ⊂ B von b und ein Diffeomorphismus Φ : π −1 (U) → U × F mit Φ π −1 (b ) = {b } × F . Also ist f¨ ur alle f ∈ F : π ◦ Φ−1 (b , f ) = 2 b . Daraus folgt die Submersionseigenschaft von π. Aufgabe B.9 auf Seite 474 (Volumenform): Im ¨außeren Produkt ω ∧n ∈ Ω2n (R2n ) gibt es bei Ausmultiplikation genau n! nicht verschwindende En Summanden. Um diese bez¨ uglich der Dualbasis α1 , . . . , α2n in der Form i=1 (αi ∧ αi+n ) zu ordnen, muss jeweils eine gerade Anzahl von Transpositionen vorgenommen werden. Dabei ¨andert sich das Vorzeichen nicht. Andererseits ist En (n2 ) E2n α , denn bei der sukzessiven Vertauschung i=1 (αi ∧ αi+n ) = (−1) j=1 j von α2n−1 , α2n−2 , . . . , αn+1 an die (2n − 1)–te, (2n − 2)-te, . . . , (n + 1)–te
606
H. L¨osungen der Aufgaben
Stelle m¨ ussen 1, 2, . . . , n − 1 Transpositionen vorgenommen werden.
2
Aufgabe B.16 auf Seite 476 (Invarianz der Volumenform): Wegen Satz B.15.5 ist f ∗ (ω ∧n ) = (f ∗ ω)∧n = ω ∧n . Wegen Aufgabe B.9 wird also die Volumenform invariant gelassen. 2 Aufgabe B.24 auf Seite 481 (Pull-back von ¨ außeren Formen): Die zu beweisende Formel f¨ ur den pull–back von Differentialformen folgt aus der entsprechenden Aussage f¨ ur ¨außere Formen, also Satz B.15.5. 2 Aufgabe B.32 auf Seite 487 (∧-Antiderivation): Die Behauptung, dass das innere Produkt eine ∧–Antiderivation ist, folgt durch Restriktion auf die Tangentialr¨aume Tm M , also aus einer analogen Formel f¨ ur ¨außere Formen. F¨ ur ¨außere Formen kann sie auf einer Basis der Grassmann–Algebra Ω∗ (E) u ¨ber dem Vektorraum E u uft werden. Hier folgt sie aus der Antisymmetrie des ¨berpr¨ 2 ¨außeren Produktes von Eins–Formen. Aufgabe E.25 auf Seite 516 (Exponentialabbildung f¨ ur GL(n, R)): (ξ) (ξ) Linksinvarianz des Vektorfelds X = XL : G → T G mit X (ξ) (e) = ξ ∈ g bedeutet mit der Linkswirkung Lh : G → G, g → h ◦ g (h ∈ G), dass gilt: (f ∈ G). (Lh )∗ X ξ (f ) = X ξ (f ) Nun ist f¨ ur ein Vektorfeld Y : G → T G dieser push–forward von der Form ((Lh )∗ Y ) (f ) = DLh (h−1 ◦ f ) Y (h−1 ◦ f ) . Im Fall Y = X (ξ) ist Y h−1 ◦ f = h−1 ◦ f ξ. Da f¨ ur G = GL(n, R) die Wirkung Lh von links mit der Matrix h (ξ) multipliziert, folgt die Behauptung XL (g) = g ξ. Der Beweis der Formel f¨ ur die rechtsinvarianten Vektorfelder ist analog. (ξ) d (ξ) Φt (g)|t=0 = Der von XL erzeugte Fluss Φ(ξ) : R × G → G ist wegen dt (ξ) (ξ) XL (g) = g ξ von der Form Φt (g) = g exp(ξt). Damit ist der Kommutator der linksinvarianten Vektorfelder, angewandt auf f ∈ C ∞ (G, R), von der Form & % (η) (η) (ξ) [X (ξ) , X (η) ] f (g) = lim ε−2 f Φ(ξ) ◦ Φ (g) − f Φ ◦ Φ (g) ε ε ε ε ε→0 −2 = lim ε f exp(εξ) exp(εη)g − f exp(εη) exp(εξ)g ε→0
= df (g)[ξ, η] = X ([ξ,η]) f (g).
2
Aufgabe E.27 auf Seite 517 (Lie–Gruppen und Lie–Algebren): 1. Unit¨ are Gruppe: Eine Kurve c ∈ C 1 I, U(n) hat einen Tangentialvektor ˙ Ist umgec(0) ˙ ∈ Alt(n, C), denn wegen c(s)∗ = c(s)−1 ist c˙∗ (0) = −c(0). kehrt X ∈ Alt(n, C), dann kommutieren X und X ∗ = −X, woraus sich exp(X) exp(X)∗ = exp(X) exp(X ∗ ) = exp(X + X ∗ ) = 1l,
H. L¨osungen der Aufgaben
607
also exp(X) ∈ U(n) ergibt. Damit ist die Lie–Algebra u(n) = Alt(n, C) und dim U(n) = dimR Alt(n, C) = n2 . Speziell unit¨ are Gruppe: F¨ ur einen Weg c ∈ C 1 I, SU(n) in der Unterd gruppe SU(n) von U(n) gilt zus¨atzlich wegen 0 = dt det(c(t))|t=0 = tr(c(0)), ˙ dass der Tangentialvektor c(0) ˙ ∈ Alt(n, C) verschwindende Spur besitzt. Daher ist die Lie–Algebra su(n) = {X ∈ Alt(n, C) | tr(X) = 0}, und dim SU(n) = dimR su(n) = n2 − 1. Symplektische Gruppe: Die Lie–Algebra sp(R2n ) von Sp(R2n ) wurde schon in Aufgabe 6.26 bestimmt, ebenso ihre Dimension n(2n + 1). 2. (Isomorphien von Lie–Algebren) (a) Mit i : R3 → so(3) aus (13.4.8) und i(a)b = a × b folgt mit der Jacobi– Identit¨at: i(a1 )i(a2 ) − i(a2 )i(a1 ) b = a1 × (a2 × b) − a2 × (a1 × b) = a1 × (a2 × b) + a2 × (b × a1 ) = (a1 × a2 ) × b. √ (b) Verwenden wir die Basis von su(2) der mit −1 multiplizierten Pauli– 0 Matrizen (τ1 , τ2 , τ3 ) := ( 0i 0i ) , 01 −1 , 0i −i , dann ist die Abbildung 0 so(3) −→ su(2) ,
0 −a3 a2 a3 0 −a1 −a2 a1 0
−→
1 2
3
i=1 ai τi
3 ein solcher Isomorphismus, denn [τi , τj ] = 2 k=1 εijk τk . (c) Mit der auf die imagin¨aren Quaternionen Im H restringierten Einbettung bi c+di = bτ3 − cτ2 + dτ1 bi + cj + dk → −c+di −bi wird ij auf −τ3 τ2 = τ1 , jk auf −τ2 τ1 = τ3 und ki auf τ1 τ3 = −τ2 abgebildet (sowie ii, jj und kk auf τ12 = τ22 = τ32 = −1l). 2 Aufgabe E.31 auf Seite 520 (adjungierte Mit Darstellung): dem Lie-AlgebrenIsomorphismus i : R3 → so(3) , a =
Formel
a1 a2 a3
→
0 a3 a2 a3 0 −a1 −a2 a1 0
aus (13.4.8) ist die
O ∈ SO(3), a ∈ R3 c −s 0 zu u ufen. F¨ ur die Elemente der Form O = s c 0 mit c2 + s2 = 1 sind ¨berpr¨ 0 0 1 0 −a3 ca2 +sa1 a3 0 −ca1 +sa2 . Jede Drehung aus SO(3) ist beide Seiten gleich O i(a) O −1 = i(Oa)
−ca2 −sa1 ca1 −sa2
0
aber zu einer solchen Drehung um die 3–Achse (und mit dem gleichen Winkel) konjugiert. 2
608
H. L¨osungen der Aufgaben
Aufgabe E.34 auf Seite 521 (adjungierte Wirkung): • F¨ ur die Lie–Gruppe G := GL(n, R) mit Lie–Algebra g := Mat(n, R) ist wegen Adg (η) = gηg −1
(η ∈ g, g ∈ G)
−1 gηg −1 − gηg −1 gξg −1 = [Adg (ξ), Adg (η)]. Adg ([ξ, η]) = Adg (ξη −ηξ) = gξg • Entsprechend ist exp Adg (ξ) = exp(gξg −1 ) = g exp(ξ)g −1 . • Die adjungierte Darstellung von ξ ∈ g ist, angewandt auf η ∈ g, gleich d d Adexp(tξ) η exp(tξ) η exp(−tξ) = dt dt t=0 t=0 d d exp(tξ) exp(−tξ) = η + η = [ξ, η]. 2 dt dt t−0 t=0
Aufgabe E.37 auf Seite 521 (Lie–Gruppenwirkungen): 1. Dass Φ : SO(n) × Rn → Rn , (O, m) → Om eine Wirkung der Lie–Gruppe SO(n) ist, ist klar. Da SO(n) kompakt ist (siehe Beispiel E.37.2), ist die Wirkung eigentlich. Sie ist f¨ ur n > 1 nicht frei, denn Φ(SO(n), {0}) = {0}. B = Rn /SO(n) = [0, ∞), denn die anderen Orbits sind Sph¨aren mit dem Nullpunkt als Mittelpunkt, parametrisiert durch den Radius. Also ist ∂B = {0}. t 0 x auf M = R2 \{0} ist 2. Die Abbildung Φ : R × M → M, (t, m) → e0 e−t eine Lie–Gruppenwirkung von (R, +), denn sie ist die Restriktion eines linearen dynamischen Systems auf eine offene flussinvariante Teilmenge des R2 . Sie ist frei, denn durch Entfernung des Ursprungs gibt es keine periodischen Orbits. Sie ist aber nicht eigentlich, denn das Urbild der kompakten Menge (x, y) ∈ M × M | x −e1 ≤ 12 ≥ y − e2 unter der Abbildung R × M → M × M, (t, m) → m, Φ(t, m) ist nicht kompakt. Der topologische Raum B = M/R ist nicht hausdorffsch, denn die Bilder der Punkte e1 und e2 sind voneinander verschieden, befinden sich aber nicht in disjunkten Umgebungen. 2 Aufgabe F.7 auf Seite 524 (Trivialit¨ at von Hauptfaserb¨ undeln): • Besitzt das Hauptfaserb¨ undel π : E → B mit der Lie–Gruppe G als typischer Faser einen Schnitt s : B → E (also π ◦ s = IdB ), dann ist, mit der Wirkung Ψ : E × G → E der Gruppe, die Abbildung ρ:B×G→E
, ρ(b, g) := Ψg ◦ s(b)
ein Hom¨oomorphismus. Denn ρ ist nach Definition stetig und bijektiv, mit stetiger Umkehrabbildung ρ−1 (e) = π(e)), g(s ◦ π(e), e) (e ∈ E). • Umgekehrt ist f¨ ur das neutrale Element e ∈ G der Gruppe bei Existenz einer Trivialisierung Φ : E → B × G die Abbildung s : B → E, s(b) = Φ−1 (b, e) ein Schnitt. 2
Literaturverzeichnis [AA] V.I. Arnol’d, A. Avez: Ergodic Problems of Classical Mechanics. Reading: Benjamin, 1968 [Aa] J. Aaronson: An Introduction to Infinite Ergodic Theory (Mathematical Surveys and Monographs). American Mathematical Society, 1997 [AB] R. Arens, D. Babbitt: The Geometry of Relativistic n Particle Interactions. Pacific Journal of Mathematics 28, 243–274 (1969) [AbMa] A. Abbondandolo, S. Matveyev: Middle-dimensional squeezing and non-squeezing behavior of symplectomorphisms. arXiv:1105.2931 (2011) [ACL] M. Audin, A. Cannas da Silva, E. Lerman: Symplectic Geometry of Integrable Hamiltonian Systems (Advanced Courses in Mathematics, CRM Barcelona). Basel: Birkh¨ auser, 2003 [AF] I. Agricola, T. Friedrich: Globale Analysis. Differentialformen in Analysis, Geometrie unf Physik. Braunschweig: Vieweg, 2001 [AG] V.I. Arnol’d, A. Givental: Symplectic geometry. Dynamical Systems IV, Symplectic Geometry and its Applications (Arnold, V., Novikov, S., eds.), Encyclopaedia of Mathematical Sciences 4, Berlin: Springer 1990 [AGV] V.I. Arnol’d, S.M. Gusein-Zade, A.N. Varchenko: Singularities of Differentiable Maps, Vol 1 (Monographs in Mathematics). Basel: Birkh¨ auser, 1985 [AK] J. Avron, O. Kenneth: Swimming in curved space or the Baron and the cat. New Journal of Physics 8, 68–82 (2006) link [AM] R. Abraham, J.E. Marsden: Foundations of Mechanics, second edition. Reading: Benjamin/Cummings, 1982. link [Am] H. Amann: Gew¨ ohnliche Differentialgleichungen. Berlin: de Gruyter [AN] V. Arnol’d, S. Novikov, eds.: Dynamical Systems VII: Integrable Systems. Nonholonomic Dynamical Systems. (Encyclopaedia of Mathematical Sciences 16) Berlin: Springer 1993 [AR] D. Arnold, J. Rogness: M¨ obius Transformations Revealed. Notices of the AMS 55, 1226– 1231 (2008). link [Ar1] V.I. Arnol’d: Gew¨ ohnliche Differentialgleichungen. Berlin: Springer, 1980 [Ar2] V.I. Arnol’d: Mathematical Methods of Classical Mechanics. Graduate Texts in Mathematics 60. Berlin: Springer 1989 [Ar3] V.I. Arnol’d: Geometrical Methods in the Theory of Ordinary Differential Equations. Grundlehren der mathematischen Wissenschaften 250. Berlin: Springer, 1997
A. Knauf, Mathematische Physik: Klassische Mechanik, Springer-Lehrbuch Masterclass, c Springer-Verlag Berlin Heidelberg 2012 DOI 10.1007/978-3-642-20978-9,
609
610
Literaturverzeichnis
[Ar4] V.I. Arnol’d: Characteristic class entering in quantization conditions. Functional Analysis and Its Applications 1, 1–13 (1967) [Ar5] V.I. Arnol’d: First Steps in Symplectic Topology. Russian Mathematical Surveys 41, 1–21 (1986) [Ar6] V.I. Arnol’d: Huygens and Barrow, Newton and Hooke: Pioneers in Mathematical Analysis and Catastrophe Theory from Evolvents to Quasicrystals. Basel: Birkh¨ auser, 1990 [Art] E. Artin: Geometric Algebra. New York: Interscience Publishers, 1957 [At] M. Atiyah: Convexity and commuting Hamiltonians. Bull. Lond. Math. Soc. 14, 1-15 (1982) [Bala] V. Baladi: Positive Transfer Operators and Decay of Correlation. (Advanced Series in Nonlinear Dynamics). Singapore: World Scientific, 2000 [Ball] W. Ballmann: Lectures on Spaces of Nonpositive Curvature. Basel: Birkh¨ auser, 1995 [Ban] V. Bangert: On the existence of closed geodesics on two-spheres. International Journal of Mathematics 4, 1–10 (1993) [Bau] H. Bauer: Maß- und Integrationstheorie. Berlin: de Gruyter, 1992 [Berg] M. Berger: A Panoramic View of Riemannian Geometry. Berlin: Springer 2003 [Berr] M. Berry: Singularities in Waves and Rays, in Les Houches Lecture Series Session XXXV, eds. R. Balian, M. Kl´ eman and J-P. Poirier, North-Holland: Amsterdam, 453-543, 1981 [BFK] D. Burago, S. Ferleger, A. Kononenko: Uniform estimates on the number of collisions in semidisperging billiards. Annals of Mathematics 147, 695–708 (1998) [BH] H. Broer, G. Huitema: A proof of the isoenergetic KAM-theorem from the ’ordinary’ one. J. Differential Equations 90, 52–60 (1991) [Bi1] G.D. Birkhoff: Proof of the ergodic theorem. Proceedings National Acad. Sci. 17, 656– 660 (1931) link [Bi2] G.D. Birkhoff: An extension of Poincar´e s last geometric theorem. Acta Mathematica 47, 297–311 (1925) [Bi3] G.D. Birkhoff: Dynamical Systems. American Mathematical Society, 1927 [BJ] Th. Br¨ ocker, K. J¨ anich: Einf¨ uhrung in die Differentialtopologie. Berlin: Springer, 1990 [BKMM] A. Bloch, P. Krishnaprasad, J. Marsden, R. Murray: Nonholonomic mechanical systems with symmetry. Archive for Rational Mechanics and Analysis 136 21–99 (1996) [BMZ] A. Bloch, J. Marsden, D. Zenkov: Nonholonomic Dynamics. Notices of the AMS 52, 324–333 (2005). link [BoSu] A. Bobenko, Y. Suris: Discrete differential geometry: Integrable structure. Graduate Studies in Mathematics 98. Providence: Amer. Math. Soc. 2008 [Bo1] R. Bott: On the iteration of closed geodesics and the Sturm intersection theory. Comm. Pure Appl. Math. 9, 171–206 (1956) [Bo2] R. Bott: Lectures on Morse theory, old and new. Bull. Amer. Math. Soc. 7, 331–358 (1982) ¨ [Br] H. Bruns: Uber die Integrale des Vielk¨ orper-Problems. Acta Math. XI, 25–96 (1887)
Literaturverzeichnis
611
[BrSe] H. Broer, M. Sevryuk: KAM Theory: quasi-periodicity in dynamical systems. In: Handbook of Dynamical Systems, Eds: B. Hasselblatt, A. Katok. North-Holland: 2007 [BrSi] F. Brini, S. Siboni: Estimates of correlation decay in auto/endomorphisms of the n-torus. Computers & Mathematics with Applications 42, 941–951 (2001) [BT] R. Bott, L. Tu: Differential forms in algebraic topology. Graduate Texts in Mathematics 82, New York: Springer 1995 [Bu] L.A. Bunimovich et al: Dynamical Systems, Ergodic Theory and Applications. Encyclopaedia of Mathematical Sciences 100, Berlin: Springer, 2000 [CB] R. Cushman, L. Bates: Global aspects of classical integrable systems. Basel: Birkh¨ auser, 1997 [CDD] Y. Choquet-Bruhat, C. DeWitt-Morette, M. Dillard-Bleick: Analysis, Manifolds and Physics, Part 1: Basics. North-Holland, 1982 [CFKS] H.L. Cycon, R.G. Froese, W. Kirsch, B. Simon: Schr¨ odinger Operators with Application to Quantum Mechanics and Global Geometry. Texts and Monographs in Physics. Berlin: Springer 1987 [CFS] I.P. Cornfeld, S.U. Fomin, Ya.G. Sinai: Ergodic Theory. Grundlehren der mathematischen Wissenschaften 245. Berlin: Springer 1982 [CJS] D. Currie, T. Jordan, E. Sudarshan: Relativistic Invariance and Hamiltonian Theories of Interacting Particles. Reviews of Modern Physics 35, 350–375 (1963) [CM] A. Chenciner, R. Montgomery , A remarkable periodic solution of the three-body problem in the case of equal masses. Annals of Mathematics, 152, 881–901 (2000) [CN] C.A.A. de Carvalhoa, H.M. Nussenzveig: Time delay. Physics Reports 364, 83–174 (2002) [Cr] F. Croom: Basic Concepts of Algebraic Topology. Undergraduate Texts in Mathematics. New York: Springer (1978) [CSM] R. Carter, G. Segal, I. Macdonald: Lectures on Lie groups and Lie algebras. London Mathematical Society Student Texts 32. Cambridge: Cambridge University Press (1995) [Cv] P Cvitanovi´ c, R. Artuso, R. Mainieri, G. Tanner, G. Vattay, N. Whelan and A. Wirzba: Chaos: Classical and Quantum. link [CW] N. Calkin, H. Wilf: Recounting the rationals. American Mathematical Monthly 107, 360–363 (2000) link [DB] P. Deuflhard, F. Bornemann: Numerische Mathematik II: Gew¨ ohnliche Differentialgleichungen. Berlin: de Gruyter, 2002 [De] M. Denker: Einf¨ uhrung in die Analysis dynamischer Systeme. Berlin: Springer, 2004 [DFN] B.A. Dubrovin, A.T. Fomenko, S.P. Novikov: Modern Geometry — Methods and Applications, Band I–III. Berlin: Springer, 1992 [DG] J. Derezi´ nski, C. G´ erard: Scattering Theory of Classical and Quantum N -Particle Systems. Texts and Monographs in Physics. Berlin: Springer, 1997 [DH] F. Diacu, P. Holmes: Celestial Encounters: The Origins of Chaos and Stability. Princeton: Princeton University Press, 1996 [Do] R. Douady: Applications du th´ eor` eme des tores invariants. Th` ese de 3e cycle, Universit´e Paris, Paris 1982
612
Literaturverzeichnis
[Du] J.J. Duistermaat: Symplectic Geometry, Course notes of the Spring School 2004. link [Ei1] A. Einstein: Zur Elektrodynamik bewegter K¨ orper. Annalen der Physik und Chemie 17, 891–921 (1905). link [Ei2] A. Einstein: Die Grundlage der allgemeinen Relativit¨ atstheorie. Annalen der Physik 49 (der ganzen Reihe: 354), 770–822 (1916). [EH] I. Ekeland, H. Hofer: Symplectic topology and hamiltonian dynamics. Mathematische Zeitschrift 100, 355–378 (1989) [El]
J. Elstrodt: Maß- und Integrationstheorie. Berlin: Springer 2009
[Ep] M. Epple: Die Entstehung der Knotentheorie: Kontexte und Konstruktionen einer modernen Mathematischen Theorie. Braunschweig: Vieweg, 1999 [Eu] L. Euler: De motu rectilineo trium corporum se mutuo attrahentium. Novi commentarii academiæ scientarum Petropolitanæ 11, 144–151 (1767). link [Fei] M.J. Feigenbaum: The Metric Universal Properties of Period Doubling Bifurcations and the Spectrum for a Route to Turbulence. Ann. New York. Acad. Sci. 357, 330–336 (1980) [Fej1] J. F´ ejoz: D´emonstration du ‘th´ eor` eme d’Arnold’ sur la stabilit´e du syst`eme plan´ etaire (d’apr` es Herman). Ergodic Theory and Dynamical Systems 24, 1521–1582 (2004) [Fej2] J. F´ ejoz: A simple proof of invariant tori theorems. Journal of Modern Dynamics 5 (2011) [Fej3] J. F´ ejoz: A proof of the invariant torus theorem of Kolmogorov (2011) [FOF] J. Figueroa-O’Farrill: Deformations of the Galilean Algebra. Journal of Mathematical Physics 30, 2735–2739 (1989) [FP] D. Fowler, P. Prusinkiewicz: Shell models in three dimensions. In H. Meinhardt: The Algorithmic Beauty of Sea Shells. Springer 4. Auflage, 2009 [Gali] P. Galison: Einsteins Uhren, Poincar´ es Karten. Die Arbeit an der Ordnung der Zeit. Frankfurt am Main: S. Fischer, 2003 [Galp] G. Galperin: Billiard balls count π. MASS Selecta, AMS, Providence, RI, 197-204 (2003) [Gal1] G. Galilei: Dialog ¨ uber die beiden haupts¨ achlichen Weltsysteme, das ptolem¨ aische und das kopernikanische (Dialogo sopra i due massimi sistemi, Florenz 1632. link) Leipzig 1891 ¨ [Gal2] G. Galilei: Uber zwei neue Wissenszweige. (Discorsi e dimostrazioni matematiche, Leiden 1638, link) In: S. Hawking, Ed. Die Klassiker der Physik. Hamburg: Hoffmann und Campe. 2004 [Ge] H. Geiges: Contact geometry. In: Handbook of Differential Geometry vol. 2 (Herausgeber: F.J.E. Dillen and L.C.A. Verstraelen), North-Holland, Amsterdam (2006). link [GHL] S. Gallot, D. Hulin, J. Lafontaine: Riemannian Geometry. Berlin: Springer, 1993 [Gi]
V.L. Ginzburg: The Weinstein conjecture and the theorems of nearby and almost existence. in ’The Breadth of Symplectic and Poisson Geometry’. Festschrift in Honor of Alan Weinstein; J.E. Marsden and T.S. Ratiu (Eds.), Birkh¨ auser, 2005, pp. 139–172
[GiHi] M. Giaquinta, St. Hildebrandt: Calculus of Variations II: The Hamiltonian formalism. Grundlehren der mathematischen Wissenschaften 311. Berlin: Springer
Literaturverzeichnis
613
[GS1] V. Guillemin, S. Sternberg: Symplectic Techniques in Physics. Cambridge: Cambridge University Press, 1984 [GS2] V. Guillemin, S. Sternberg: Convexity properties of the moment mapping. Inventiones mathematicae 67, 491–513 (1982) [GuHo] J. Guckenheimer, P. Holmes: Nonlinear Oscillation, Dynamical Systems and Bifurcations of Vector Fields (Applied Mathematical Sciences). Berlin: Springer 2002 [GZR] T. Geisel, A. Zacherl, G. Radons: Chaotic diffusion and 1/f -noise of particles in twodimensional solids. Z. Phys. B - Condensed Matter 71, 117–127 (1988). link [HaMe] G. Hall, K. Meyer: Introduction to Hamiltonian Dynamical Systems and the N -Body Problem. Berlin: Springer, 1991 [HaMo] M. Hampton, R. Moeckel: Finiteness of relative equilibria of the four-body problem. Inventiones Mathematicae 163, 289–312 (2006) [Hel] S. Helgason: The Radon Transform. Second Edition. Basel: Birkh¨ auser, 1999 [Her] M. Herman: Sur la conjugaison diff´ erentiable des diff´eomorphismes du cercle ` a des rota´ tions. Publ. Math., Inst. Hautes Etud. Sci. 49, 5–233 (1979) [Heu] H. Heuser: Gew¨ ohnliche Differentialgleichungen. Teubner, 1995 [Hil] S. Hildebrandt: Analysis 1 und 2. Berlin: Springer, 2002 [Hirs] M. Hirsch: Differential Topology. Graduate Texts in Mathematics 33. Berlin: Springer, 1988 [Hirz] F. Hirzebruch: Divisionsalgebren und Topologie. In: Ebbinghaus, H.-D. et al: Zahlen. Berlin, Heidelberg, New York: Springer, 1992 [HK] J. Hafele, R. Keating: Around the world atomic clocks: predicted relativistic time gains; observed relativistic time gains. Science 177, 166–168; 168–170 (1972) [Hun] W. Hunziker: Scattering in Classical Mechanics. In: Scattering Theory in Mathematical Physics. J.A. La Vita and J.-P. Marchand, Eds., Dordrecht: Reidel, 1974 [Huy] Ch. Huygens: Discours de la cause de la pesanteur. Addition. 1690, link [HZ] H. Hofer, E. Zehnder: Symplectic Invariants and Hamiltonian Dynamics. Basel: Birkh¨ auser, 1994 [Jac] C.G.J. Jacobi: Vorlesungen u ¨ber Dynamik. Neunundzwanzigste Vorlesung. Œvres compl` etes, tome 8, 1–290, 1866. link [Jae] K. J¨ anich: Topologie. Berlin, Heidelberg, New York: Springer, 1987 [JLJ] J. Jost, X. Li-Jost: Calculus of Variations. Cambridge: Cambridge University Press, 1999 [Jo] J. Jost: Riemannian geometry and geometric analysis. Universitext. Berlin, Heidelberg, New York: Springer, 2008 [KB] U. Kraus, M. Borchers: Fast lichtschnell durch die Stadt. Physik in unserer Zeit, Heft 2/2005, 64–69 [KH] A. Katok, B. Hasselblatt: Introduction to the Modern Theory of Dynamical Systems. Cambridge: Cambridge University Press, 1997 [Kh] A. Ya. Khinchin: Continued Fractions, Mineola: Dover, 1997
614
Literaturverzeichnis
[Ki] A. A. Kirillov: Merits and demerits of the orbit method. Bull. Amer. Math. Soc. 36, 433–488 (1999). link [Kl] F. Klein: Vergleichende Betrachtungen u ¨ber neuere geometrische Forschungen. (Erlanger Programm). 1872. link [KL] V. Kaloshin, M. Levi: An example of Arnold diffusion for near-integrable Hamiltonians. Bull. Amer. Math. Soc. 45, 409–427 (2008). link [Kle] A. Klenke: Wahrscheinlichkeitstheorie. Berlin: Springer, 2006 [Kli1] W. Klingenberg: Eine Vorlesung u ¨ber Differentialgeometrie. Berlin: Springer, 1973 [Kli2] W. Klingenberg: Riemannian Geometry. (De Gruyter Studies in Mathematics 1), 2nd Edition. Berlin: de Gruyter, 1995 [KMS] I. Kol´ a˘r, P. Michor, J. Slov´ ak: Natural Operations in Differential Geometry. Berlin, Heidelberg, New York: Springer, 1993. link [KN] S. Kobayashi, K. Nomizu: Foundations of Differential Geometry 1. New York: John Wiley & Sons, 1996 [Kn1] A. Knauf: Ergodic and Topological Properties of Coulombic Periodic Potentials. Commun. Math. Phys. 110, 89–112 (1987) [Kn2] A. Knauf: Closed orbits and converse KAM theory. Nonlinearity 3, 961–973 (1990) [Kn3] A. Knauf: The n-Centre Problem of Celestial Mechanics for Large Energies. Journal of the European Mathematical Society 4, 1–114 (2002) [Kop] N. Kopernikus: De Revolutionibus Orbium Coelestium. N¨ urnberg, 1543. link ¨ Zitat aus deutscher Ubersetzung, Seite 31 in: S. Hawking, Ed. Die Klassiker der Physik. Hamburg: Hoffmann und Campe. 2004 [KP] Th. Kappeler, J. P¨ oschel: KdV & KAM (Ergebnisse der Mathematik und ihrer Grenzgebiete 45). Berlin: Springer, 2003 [KR] M. Koecher, R., Remmert: Hamiltonsche Quaternionen. In: Ebbinghaus, H.-D. et al: Zahlen. Berlin, Heidelberg, New York: Springer, 1992 [Kre] U. Krengel: Ergodic Theorems (De Gruyter Studies in Mathematics 6). Berlin: de Gruyter, 1985 [KS] A. Knauf, Ya. Sinai: Classical Nonintegrability, Quantum Chaos. DMV–Seminar Band 27. Basel: Birkh¨ auser, 1997 [KT] V.V. Kozlov, D.V. Treshchev: Billiards : a genetic introduction to the dynamics of systems with impacts. AMS Translations of mathematical monographs 89, 1991 [Lag] J. Lagrange: Essai sur le Probl´eme des trois Corps (1772). Œuvres de Lagrange/ publ. par les soins de J.-A. Serret, Tome 6. Paris: Gauthier-Villars, 1873. link [LaMe] A. Laub, K. Meyer: Canonical forms for symplectic and Hamiltonian matrices. Celestial Mechanics and Dynamical Astronomy 89, 213–238 (1974) ¨ [Lap] P. de Laplace: Philosophischer Versuch u R. von Mises ¨ber die Wahrscheinlichkeit. Ub.: Reihe Ostwalds Klassiker, Bd. 233. Frankfurt am Main: Verlag Harri Deutsch, 2003 [Las1] J. Laskar: Large Scale Chaos and Marginal Stability in the Solar System. Celestial Mechanics and Dynamical Astronomy64, 115–162 (1996) link
Literaturverzeichnis
615
[Las2] J. Laskar: Existence of collisional trajectories of Mercury, Mars and Venus with the Earth. Nature 459, 817–819 (2009). link [Leu] H. Leutwyler: A no-interaction theorem in classical relativistic Hamiltonian particle mechanics. Nuovo Cimento 37, 556–567 (1965) [Lev] M. Levi: The Mathematical Mechanic: Using Physical Reasoning to Solve Problems. Princeton: Princeton University Press, 2009 [LF] L. Lusternik, A. Fet: Variational problems on closed manifolds. Dokl. Akad. Nauk. SSSR 81, 17–18 (1951); Amer. Math. Soc. Transl. 90 (1953) [Li]
¨ P. Littelmann: Uber Horns Vermutung, Geometrie, Kombinatorik und Darstellungstheorie. Jahresberichte der Deutschen Mathematiker-Vereinigung 110, 75–99 (2008)
[LiMa] P. Libermann, Ch.-M. Marle: Symplectic Geometry and Analytical Mechanics. Dordrecht: Reidel, 1987 [LL] A. Lichtenberg, M. Lieberman: Regular and chaotic dynamics. Applied Mathematical Sciences. Berlin, Heidelberg, New York: Springer, 1993 [Lon] Y. Long: Index theory for symplectic paths with applications. Progress in Mathematics 207. Basel: Birkh¨ auser, 2002 [Lou] A.K. Louis: Inverse und schlecht gestellte Probleme. Stuttgart: Teubner, 1989 [LW] C. Liverani, M.P. Wojtkowski: Ergodicity in Hamiltonian Systems. Dynamics Reported IV, 130–202. Berlin: Springer, 1995. link [Mac] R.S. MacKay, I.C. Percival: Converse KAM: theory and practice. Commun. Math. Phys. 98, 469–512 (1985) [MaMe] L. Markus, K.R. Meyer: Generic Hamiltonian dynamical systems are neither integrable nor ergodic. Memoirs of the AMS 144 (1974) [Mat] J. N. Mather: Existence of quasiperiodic orbits for twist homeomorphisms of the annulus. Topology 21, 457–467 (1982) [McD] D. McDuff: Floer theory and low dimensional topology. Bull. Amer. Math. Soc. 43, 25–42 (2006). link [Me] B. Meißner: Die mechanische Wissenschaft und ihre Anwendung in der Antike. In: Physik/Mechanik. Astrid Sch¨ urmann (Hg.). Geschichte der Mathematik und der Naturwissenschaften 3. Franz Steiner Verlag, 2005 [Mi] J. Milnor: Morse Theory. Annals Math. Stud. 51. Princeton: Princeton University Press, 1963 [MKO] R.J. MacKay, R.W. Oldford: Scientific method, statistical method and the speed of light. Statistical Science 15, 254–278 (2000) [MM] R. MacKay, J. Meiss: Hamiltonian Dynamical Systems: A reprint selection. Taylor & Francis, 1987 [MMC] J. Marsden, M. McCracken: The Hopf Bifurcation and Its Applications. Applied Mathematical Sciences 19. New York: Springer-Verlag, 1976. link [MMR] J. Marsden, R. Montgomery, T. Ratiu: Reduction, symmetry, and phases in mechanics. Memoirs of the American Mathematical Society 436, Volume 88. Providence (1990)
616
Literaturverzeichnis
[Mon1] R. Montgomery: A Tour of Subriemannian Geometries, Their Geodesics and Applications. (Mathematical Surveys and Monographs 91). American Mathematical Society, 2002 [Mon2] R. Montgomery: A New Solution to the Three-Body Problem. Notices of the AMS 48, 471–481 (2001). link [Mos1] J. Moser: Is the Solar System Stable? The Math. Intelligencer 1, 65–71 (1978). link [Mos2] J. Moser: Various aspects of integrable Hamiltonian systems. Dynamical systems, C.I.M.E. Lect., Bressanone 1978, Prog. Math. 8, 233–290 (1980) [Mos3] J. Moser: Regularization of Kepler’s problem and the averaging method on a manifold. Communications on Pure and Applied Mathematics 23, 609–636 (1970) [Mos4] J. Moser: Stable and random motion in dynamical systems. Princeton: Princeton University Press, 1973 [Mos5] J. Moser: Recent developments in the theory of Hamiltonian systems. SIAM review 28, 459–485 (1986) [Mos6] J. Moser: Dynamical Systems – Past and Present. Proc. Int. Congress of Math., Documenta Mathematica Extra Volume ICM 1998. link [Mou] F. Moulton: The straight line solutions of the problem of N bodies. Annals of Mathematics 12, 1–17 (1910) [MPC] H. M¨ uller, A. Peters, St. Chu: A precision measurement of the gravitational redshift by the interference of matter waves. Nature 463, 926–929 (2010) [MR] J. Marsden, T. Ratiu: Einf¨ uhrung in die Mechanik und Symmetrie. Berlin: Springer, 2001 [MS] D. McDuff, D. Salamon: Introduction to Symplectic Topology. Oxford: Oxford University Press, 1999 [MV] B. Marx, W. Vogt: Dynamische Systeme: Theorie und Numerik. Spektrum, Akad. Verlag, 2010 [MW] J. Marsden, A. Weinstein: Reduction of symplectic manifolds with symmetry. Rep. Math. Phys. 5, 121–130 (1974). link [Nar] H. Narnhofer: Another Definition for Time Delay. Phys. Rev. D 22, 2387–2390 (1980) [Nat] F. Natterer: The Mathematics of Computerized Tomography. Teubner, 1986 [Ne] I. Newton: Philosophiae Naturalis Principia Mathematica. 1687. link Deutsch in: S. Hawking, Ed. Die Klassiker der Physik. Hamburg: Hoffmann und Campe. 2004 [Ni] L. Nicolaescu: An Invitation to Morse Theory. Universitext. New York: Springer, 2007 [No] E. Noether: Invariante Variationsprobleme. Nachrichten von der K¨ onigl. Gesellschaft der Wissenschaften zu G¨ ottingen, Mathematisch-physikalische Klasse, 235–257 (1918). link [NT] H. Narnhofer, W. Thirring: Canonical Scattering Transformation in Classical Mechanics. Phys. Rev. A 23, 1688–1697 (1981) [OV] A. Onishchik, E. Vinberg: Lie Groups and Lie Algebras III: Structure of Lie Groups and Lie Algebras. Encyclopaedia of Mathematical Sciences 41, Berlin: Springer 1994
Literaturverzeichnis
617
[Pai] P. Painlev´ e: Le¸cons sur la th´ eorie analytique des ´ equations differentielles. Le¸cons de Stockholm, in ”Œuvres de P. Painlev´e I”, Editions du C.N.R.S., Paris, 199–818, 1972. link [Pat] G. Paternain: Geodesic Flows (Progress in Mathematics). Basel: Birkh¨ auser, 1999 [PdM] J. Palis, W. de Melo: Geometric theory of dynamical systems. New York: Springer, 1982 [Pen] R. Penrose: The apparent shape of a relativistically moving sphere. Proc. Cambridge Philos. Soc. 55, 137–139 (1959) [Per] L. Perko: Differential equations and dynamical systems. Berlin: Springer, 2. Aufl., 1991 [Poe] J. P¨ oschel: Integrability of Hamiltonian Systems on Cantor Sets. Commun. Pure Appl. Math. 35, 635–695 (1982) [Poi1] H. Poincar´ e: Sur les courbes d´ efinies par les ´ equations diff´ erentielles. Journal des Math´ ematiques pures et appliqu´ ees 3, 375–422 (1881) [Poi2] H. Poincar´ e: Les M´ ethodes Nouvelles de la M´ ecanique C´ eleste, Band 3. Paris: GauthierVillars, 1899 [Poi3] H. Poincar´ e: The present and the future of mathematical physics. Bull. Amer. Math. Soc. 37, 25–38 (1999). link [PR1] R. Penrose, W. Rindler: Spinors and Space-Time: Volume 1, Two-Spinor Calculus and Relativistic Fields. Cambridge: Cambridge University Press 1987 [PR2] I. Percival, D. Richards: Introduction to Dynamics. Cambridge: Cambridge University Press, 1983 [Ro] C. Robinson: Dynamical Systems: Stability, Symbolic Dynamics, and Chaos. CRC Press, 1999 [Qu] E. Quaisser: Diskrete Geometrie. Heidelberg: Spektrum, Akad. Verlag, 1994 [Sa] D. Saari: Collisions, rings, and other Newtonian N –body problems. AMS, Providence, 2005 [SB] H. Schulz-Baldes: Sturm intersection theory for periodic Jacobi matrices and linear Hamiltonian systems. 2010 [Schm] St. Schmitz: Zum inversen Streuproblem der klassischen Mechanik. Dissertation, TU M¨ unchen (2006) [Scho] M Schottenloher: Geometrie und Symmetrie in der Physik: Leitmotiv der mathematischen Physik. Wiesbaden: Vieweg 1995 [Schw] M. Schwarz: Morse homology. Progress in Mathematics 111. Basel: Birkh¨ auser, 1993 [Sib] K.F. Siburg: The Principle of Least Action in Geometry and Dynamics. Lecture Notes in Mathematics 844. Berlin: Springer, 2004 [Sim] B. Simon: Wave operators for classical particle scattering. Commun. Math. Phys. 23, 37–48 (1971) [Sin] Ya. G. Sinai: Dynamical Systems with Elastic Reflections. Russian Math. Surveys 25, 137–191 (1970) [SM] C.L. Siegel, J. Moser: Lectures on Celestial Mechanics. Grundlehren der mathematischen Wissenschaften 187. Berlin: Springer 1971
618
Literaturverzeichnis
[Smi] U. Smilansky: The Classical and Quantum Theory of Chaotic Scattering. In: Chaos and Quantum Physics. M.-J. Giannoni et al, Eds. Les Houches LII. Amsterdam: North-Holland 1989 [Sm1] S. Smale: Differentiable dynamical systems. Bull. Amer. Math. Soc. 73, 747–817 (1967). link [Sm2] S. Smale: Topology and mechanics, Part I. Inventiones Mathematicae 10, 305–331 (1970); Part II: The planar n-body problem. Inventiones Mathematicae 11, 45–64 (1970) [Sob1] D. Sobel: L¨ angengrad. M¨ unchen: Btb 1998 [Sob2] D. Sobel: Galileos Tochter. Berlin: BTV 2008 [Som] A. Sommerfeld: Mechanik. Vorlesungen u ¨ber Theoretische Physik, Band I. Thun: Harry Deutsch, 1977 [StSc] E. Stiefel, G. Scheifele: Linear and regular celestial mechanics. Grundlehren der mathematischen Wissenschaften in Einzeldarstellungen 174. Berlin: Springer, 1971 [SV] J. Sanders, F. Verhulst: Averaging methods in nonlinear dynamical systems. Berlin: Springer 1985 [SW] H. Sussmann, J. Willems: 300 years of optimal control: from the brachystochrone to the maximum principle. IEEE Control Systems Magazine 17, 32–44 (1997) [Ta] S. Tabachnikov: Geometry and Billiards. American Mathematical Society, 2005. link [Te] J. Terrell: Invisibility of the Lorentz contraction. Physical Review 116, 1041–1045 (1959) [Th1] W. Thirring: Lehrbuch der Mathematischen Physik, Band 1. Klassische Dynamische Systeme. Wien: Springer, 1988 [Th2] W. Thirring: Lehrbuch der Mathematischen Physik, Band 2. Klassische Feldtheorie. Wien: Springer, 1990 [Un] A. Ungar: The relativistic velocity composition paradox and the Thomas rotation Foundations of Physics 19, 1385–1396 (1989) [Wa1] W. Walter: Gew¨ ohnliche Differentialgleichungen. Springer 1996 [Wa2] P. Walters: An Introduction to Ergodic Theory. Graduate Texts in Mathematics 79. Berlin, Heidelberg, New York: Springer, 1982 [WDR] H. Waalkens, HR. Dullin, P. Richter: The problem of two fixed centers: bifurcations, actions, monodromy. Physica D: Nonlinear Phenomena 196, 265–310 (2004) [Weid] J. Weidmann: Spectral Theory of Ordinary Differential Operators (Lecture Notes in Mathematics 1258) Berlin: Springer, 2009 [Wein] A. Weinstein: Symplectic geometry. Bull. Amer. Math. Soc. 5, 1–13 (1981). link ¨ [Wey] H. Weyl: Uber die Gleichverteilung von Zahlen mod. eins. Mathematische Annalen 77, 313–352 (1916). link [Whi] E. Whittaker: A treatise on the analytical dynamics of particles and rigid bodies. Cambridge, 1904. link Analytische Dynamik der Punkte und starren K¨ orper. Nach der 2. Auflage u ¨bersetzt; Berlin: Springer, 1924
Literaturverzeichnis
619
[Wil] J. Williamson: On the algebraic problem concerning the normal forms of linear dynamical systems. American Journal of Mathematics 58, 141–163 (1936) [Wit] E. Witten: Supersymmetry and Morse theory. J. Differential Geometry 17, 661–692 (1982) [WPM] J. Wisdom, S. Peale, F. Mignard: The chaotic rotation of Hyperion. Icarus 58, 137–152 (1984) [Wu] R. W¨ ust: H¨ ohere Mathematik f¨ ur Physiker, Bd. 1. Berlin: de Gruyter, 1995 [Xi]
Z. Xia: The Existence of Noncollision Singularities in Newtonian Systems. Annals of Mathematics 135, 411–468 (1992)
[Yo] H. Yoshida: Construction of higher order symplectic integrators. Physics Letters A 150, 262–268 (1990) [Zee] E. Zeeman: Causality Implies the Lorentz Group. Journal of Mathematical Physics 5, 490–493 (1964) [Zeh] E. Zehnder: Lectures on Dynamical Systems. Textbooks in Mathematics. Z¨ urich: European Mathematical Society, 2010 [Zei] E. Zeidler (Hg.): Teubner - Taschenbuch der Mathematik. Vieweg+Teubner, 2003 [ZP] W. Zurek, J. Paz: Why We Don’t Need Quantum Planetary Dynamics: Decoherence and the Correspondence Principle for Chaotic Systems. arxiv.org (1996)
Namensregister In der pdf-Version des Buches sind die Namen mit der deutschsprachigen Wikipedia verlinkt. A Jean-Baptiste d’Alembert (1717–1783), 365 Archimedes von Syrakus (-287 – -212), 214 Vladimir Arnol’d (1937–2010), 121, 237, 310, 400 Michael Atiyah (geb. 1929), 330, 340 B Stefan Banach (1892–1945), 506 Ivar Otto Bendixson (1861–1935), 384 Jakob Bernoulli (1655–1705), 158, 191 Johann Bernoulli (1667–1748), 157 Michael Berry (geb. 1941), 173 George Birkhoff (1884–1944), 195, 306 Raoul Bott (1923–2005), 121 Werner Boy (1879–1914), 469 Tycho Brahe (1546–1601), 413 Heinrich Bruns (1848–1919), 252 C Georg Cantor (1845–1918), 275, 384 ´ Cartan (1869–1951), 471 Elie Ernesto Ces` aro (1859–1906), 184 Boris Chirikov (1928–2008), 408 Wei-Liang Chow (1911–1995), 365 Elwin Christoffel (1829–1900), 161 Steven Chu (geb. 1948), 423 Alexis Clairaut (1713–1765), 164 Lothar Collatz (1910–1990), 12 Nicolaus Copernicus (1473-1543), 411 Gaspard Gustave de Coriolis (1792–1843), 351 Allan Cormack (1924–1998), 281 D Jean Darboux (1842–1917), 214 Guillaume de L’Hospital (1661–1704), 158 Arnaud Denjoy (1884–1974), 25 Georges de Rham (1903–1990), 497 Diophant von Alexandrien , 381 Jean Marie Duhamel (1797–1872), 68 E Charles Ehresmann (1905–1979), 527
Albert Einstein (1879–1955), xii, 161, 386, 411 Leonhard Euler (1707–1783), 71, 154, 351, 352, 538 F Werner Fenchel (1905–1988), 501 Pierre de Fermat (ca 1607–1665), 169 Leonardo Fibonacci (ca. 1180–1241), 405 Andreas Floer (1956–1991), 448 Jean Baptiste Fourier (1768–1830), 111, 282 Maurice Ren´ e Fr´ echet (1878–1973), 153 Ferdinand Georg Frobenius (1849–1917), 208, 532 G Galileo Galilei (1564–1642), 1, 158, 411 Carl Friedrich Gauss (1777–1855), 49, 109, 161, 379, 406, 493 Johannes Geiger (1882–1945), 275 Alexander Givental, 208 Hermann Grassmann (1809–1877), 119, 475 Mikhail Gromov (geb. 1943), 438, 440 Thomas Hakon Gr¨ onwall (1877–1932), 51 H William Hamilton (1805–1865), 93, 154, 324, 425 Felix Hausdorff (1868–1942), 453 Michael Herman (1942–2000), 25 Jakob Hermann (1678–1733), 241 David Hilbert (1862–1943), 17, 178 Helmut Hofer (geb. 1956), 213, 441 Eberhard Hopf (1902–1983), 136 Heinz Hopf (1894–1971), 108, 228, 546 Alfred Horn (1918–2001), 341 Godfrey Hounsfield (1919–2004), 281 Christiaan Huygens (1629–1695), 251, 413 J Carl Jacobi (1804–1851), 26, 65, 166, 247 Marie Ennemond Jordan (1838–1022), 60 J¨ urgen Jost (geb. 1956), 448 K Anatole Katok (geb. 1944), 11
620
Namensregister Lord Kelvin (1824–1907), 492 Johannes Kepler (1571–1630), 3, 175, 261 Felix Klein (1849–1925), 414 Andrei Kolmogorov (1903–1987), 178, 237, 400 Bernard Koopman (1900–1981), 183 Nikolaus Kopernikus (1473–1543), 260 Ky Fan (1914–2010), 342 L Joseph-Louis Lagrange (1736–1813), 94, 116, 145, 154, 220, 365, 508 Pierre-Simon Laplace (1749–1827), 12, 240, 368 Joseph Larmor (1857–1942), 114 Jacques Laskar (geb. 1955), 385 Henri L´ eon Lebesgue (1875–1941), 178, 272 Adrien-Marie Legendre (1752–1833), 501 Gottfried Wilhelm Leibniz (1646–1716), 2, 72, 158 Wilhelm Lenz (1888–1957), 240 Urbain Le Verrier (1811–1877), 386 Tullio Levi-Civita (1873–1941), 245, 531 Alexander Liapunov (1857–1918), 19, 131 Paulette Libermann (1919-2007), 126, 213 Sophus Lie (1842–1899), 65, 487, 511 Ernst Leonard Lindel¨ of (1870–1946), 37 Joseph Liouville (1809–1882), 180, 205, 310 Rudolf Lipschitz (1832–1903), 36 Jules Antoine Lissajous (1822–1880), 107 Lasar Aronowitsch Ljusternik (1899–1981), 550 Hendrik Lorentz (1853–1928), 113, 118, 414 M Ernest Marsden (1899–1970), 275 Jerrold Marsden (1942-2010), 330 Viktor Maslov (geb. 1930), 121 John Mather (geb. 1942), 410 Pierre-Louis Maupertuis (1698–1759), 168 Dusa McDuff (geb. 1945), 213, 448 Meton (5. Jahrhundert v. Chr.), 408 Milutin Milankovi´ c (1879–1958), 385 Hermann Minkowski (1864–1909), 414 August M¨ obius (1790–1868), 427, 460 Christian Møller (1904–1980), 268 Marston Morse (1892–1977), 168, 537, 547 J¨ urgen Moser (1928–1999), 237, 245, 266, 400 Forest Ray Moulton (1872–1952), 254 N Isaac Newton (1643–1727), 2, 83, 145, 158, 251, 387, 413 Emmy Noether (1882–1935), 330 P Paul Painlev´ e (1863–1933), 266 Raymond Paley (1907-1933), 381 Giuseppe Peano (1858–1932), 37, 458
621 Roger Penrose (geb. 1931), 427 Emile Picard (1856–1941), 37 Henri Poincar´ e (1854–1912), 7, 91, 198, 238, 252, 291, 387, 414, 494, 544 Louis Poinsot (1777–1859), 357 Sim´ eon Poisson (1781–1840), 209, 290, 338 R Johann Radon (1887–1956), 281 Bernhard Riemann (1826–1866), 160, 161 Olinde Rodrigues (1795–1851), 518 Ole Rømer (1644–1710), 413 Wilhelm Conrad R¨ ontgen (1845–1923), 281 Carl David Tolm´e Runge (1856–1927), 240 S Dietmar Salamon (geb. 1953), 213 Winfried Scharlau (geb. 1940), 387 Lew Genrichowitsch Schnirelman (1905–1938), 550 Robert Schrader (geb. 1939), xiv Issai Schur (1875–1941), 341 Karl Schwarzschild (1873–1916), 386 Jakow Grigorjewitsch Sinai (geb. 1935), 190 Steven Smale (geb. 1930), 28, 256 Willebrord van Roijen Snell (1580–1626), 171 Jean-Marie Souriau (geb. 1922), 336 Shlomo Sternberg (geb. 1936), 340 Eduard Stiefel (1909–1978), 245, 342 George Gabriel Stokes (1819–1903), 492 T Walter Thirring (geb. 1927), xiv, 274 Llewellyn Thomas (1903–1992), 419 Walther von Tschirnhaus (1651–1708), 158 W Karl Weierstraß (1815–1897), 59 Alan Weinstein (geb. 1943), 219, 330 Hermann Weyl (1885–1955), 372 Hassler Whitney (1907–1989), 469 Edmund Taylor Whittaker (1873–1956), 252, 360 Norbert Wiener (1894-1964), 381 Eugene Wigner (1902–1995), xii Herbert Wilf (geb. 1931), 13 Edward Witten (geb. 1951), 539 Joseph Marie Wronski (1778–1853), 67 Y Yukawa Hideki (1907–1981), 308 Z Eduard Zehnder (geb. 1940), 213
Symboltabelle AB = {f : B → A} α(x) α–Limesmenge, 19 Alt(n, R), 517 Brd Kugel, xv Cf,g Korrelationsfunktion, 185 d¨ außere Ableitung, 477 Dk Ableitung nach dem k–ten Argument deg(f ) Abbildungsgrad, 122 exp Exponentialfunktion auf Lin(V ), 58 E(n) euklidische Gruppe, 344 E(f | I) bedingte Erwartung, 194 Jr (λ) Jordan–Block, 60 F ⊥ ω–orthogonales Komplement, 116 Gr(v, n) Grassmann–Mannigfaltigk., 119 g riemannsche Metrik, 160 Γhi,j Christoffel–Symbol, 161 f Birkhoff-Zeitmittel, 191 iX inneres Produkt mit Vektorfeld X, 487 IdM , identische Abbildung, IdM (x) = x J Impulsabbildung, 324 LK(c1 , c2 ) Verschlingungsintegral, 109 LX Lie–Ableitung nach Vektorfeld X, 487 L(c) L¨ ange einer Kurve c, 160, 545 λd Lebesgue–Mass auf Rd , 179 Λ(E, ω) Lagrange–Grassmann– Mannigfaltigkeit, 119 L(v) Lorentz–boost, 418 O(d) metrische Topologie, 451 O(f ), o(f ) Landausche Symbole O(F ) von F erzeugte Topologie, 450 O(m) Orbit durch m, 14 ω(x) ω–Limesmenge, 19 ω0 kanonische symplektische Form, 205 Ω± Møller-Transformationen, 268 außeren k–Formen, 472 Ωk (E) Raum der ¨ Ωk (U ) Raum der Differentialformen k–ter Stufe, 477 ∗ Fußpunktprojektion, 204 πM p± asymptotische Impulse, 261
P(N ) Partitionsverband, 292 R erweiterte Zahlengerade, 48 RP (m) projektiver Raum, 119 Rvir Virialradius, 261 σ(·) erzeugte σ–Algebra, 178 S Streutransformation 274 S Rd Schwartz–Raum, 282 are, xv S d Sph¨ SE(d) orientierungserhaltende euklidische Gruppe, 345 Sym(n, K), 512 Td Torus 167 T Zeitumkehr, 227 T ± Fluchtzeiten, 48 T ∗ f Kotangentiallift von f , 216 T M Tangentialb¨ undel von M , 464 T ∗ M Kotangentialb¨ undel von M , 202 v transponierter Vektor θ0 tautologische Form, 205 X (M ) Raum der Vektorfelder, 466 f (t) iterierte Abbildung f , 12 · : R → R ceil–Funktion, 49 · : R → R floor –Funktion, 49 x˙ Zeitableitung , 118 · gegl¨ attete Betragsfunktion, 260 f Birkhoff-Zeitmittel von f , 191 ∂A Rand einer Teilmenge A, 452 ∂M Rand einer Mannigfaltigkeit M , 461 dσ differentieller Wirkungsquersch., 276 dθ f : M → N Einbettung, 468 ∧¨ außeres Produkt, 473
622
Symboltabelle
623
Abbildungsnachweis • Die Abbildungen auf den Seiten 1, 8, 127, 143, Abb. 8.6.2 auf Seite 170, Abb. 8.7.1 (rechts) auf Seite 173, die Abbildungen auf den Seiten 176, 190, 225, 259 und 281, in der Aufgabe 12.35 auf Seite 288, auf den Seiten 343, 358, 360, 408, 413, 437, 469 und 546 entstammen wikimedia. • Die Abbildungen auf Seite 11 entstammen dem von D. Fowler und P. Prusinkiewicz geschriebenen Kapitel 10 des Buchs [FP] von H. Meinhardt. • Die Abbildung 8.3.1 (links) auf Seite 157 entstammt dem Artikel [SW] von H. Sussmann und J. Willems. • Die Abbildung auf Seite 175 verwendet das mathematica-Notebook ,Ray Diagrams for Lenses’ von Ernest Lee (Wolfram Demonstrations Project) • Die Abbildung auf Seite 177 stammt von Rick Hanley. • Die Abbildung auf Seite 266 entstammt dem Artikel [Mos6] von J¨ urgen Moser. • Die Abbildung auf Seite 305 stammt von Ulrich Pinkall. • Die Abbildung auf Seite 350 (links) entstammt www.astronet.ru. • Die Abbildungen auf Seite 356 entstammen The Mathematica Journal (links), NASA/JPL/Space Science Institute (Mitte) und The Mathematical Sciences Research Institute (MSRI), DVD ’The Right Spin’ (rechts). • Die Abbildung auf Seite 361 entstammt Physics: A World View, von L. Kirkpatrick und G. Wheeler, Cengage • Die Abbildung auf Seite 367 entstammt NASA/JPL-Caltech • Die Abbildung auf Seite 402 entstammt Figure 8.3-3 im Buch Foundations of Classical Mechanics [AM] von Ralph Abraham und Jerrold E. Marsden. • Die Abbildungen auf Seite 411 stammen von Ute Kraus und Marc Borchers, www.spacetimetravel.org • Die Abbildung auf Seite 566 stammt von Christoph Schumacher • Die Abbildung auf Seite 594 stammt von Markus Stepan. Ich danke Allen, die den Abdruck der genannten Abbildungen erlaubten. Die anderen Abbildungen wurden vom Autor produziert.
Sachregister Fett: Seitenzahlen von Definitionen.
Abbildungsgleichung 174 Abbildungsgrad 109, 122, 443 Aberration chromatische 175 sph¨arische 172 abgeschlossen 453 Achromat 175 adjungierte Darstellung 519 ¨aquivariant 328 ¨außere Ableitung 486 ¨außerer Punkt 453 Aharonov-Bohm–Effekt 494 Algebra ¨außere 475 Grassmann– 475 Lie– 101, 515 sigma– 178 symplektische 95, 101 Alphabet 18, 190 Anfangsbedingung 36 Anfangswertproblem 36 anharmonischer Oszillator 224 anomale Diffusion 237 Anomalie (Kepler–Ellipsen) 5 Antikythera–Mechanismus 408 antisymmetrisch 472, 517 aperiodischer Grenzfall 71, 86 Arnol’d–Diffusion 446 Arnol’d–Vermutung 447 asymptotische Vollst¨andigkeit 273, 291, 299 Atlas 458, 461 ¨aquivalente Atlanten 458
nat¨ urlicher 465 Attraktor 20 Autokorrelationsfunktion 185 Bahnkurve 14 ballistisch 235 banachscher Fixpunktsatz 37, 272, 387, 506 Basis eines Faserb¨ undels 522 Bassin 20, 132 bedingte Erwartung 194 bedingt-periodische Bewegung 314, 371 Frequenzen der 371 rational unabh¨angige 106, 371 Bernoulli–Maß 191 Beschleunigung 94 Betti–Zahlen 497, 537 Bifurkation 134, 152, 256 Bilinearform 96 antisymmetrische 96 Billard 190, 287, 445 Boysche Fl¨ache 469 Brachistochrone 157 B¨ undel 522 Hauptfaser- 108, 124, 334, 524 horizontales/vertikales 527 Vektor- 202, 525 Cantor–Menge 13, 275, 384, 455 Cantorus 410 Cayley–Transformation 561 Ces`aro–Mittel 184, 191, 263 Charaktere 183, 188, 509 charakteristische Linien 218 Choreographie 257 Christoffel–Symbol 161, 531 Cluster 287, 292, 299 Computertomographie 281 624
Sachregister Coriolis–Kraft 351 Coulomb–Potential 236, 261, 276 darstellende Matrix 96 Darstellung 509 Definitionsbereich des Flusses 49 Deformation einer Lie–Algebra 431 Deformationsretrakt 540 Derivation 210, 338, 478, 488 dichte Teilmenge 452 Diffeomorphismus 26, 28, 55, 462 lokaler 26, 519 Differentialform 486 Differentialgleichung 30 autonome 36 explizite 32 explizit zeitabh¨angige 36 geod¨atische 161 Gradienten- 90, 216 hamiltonsche 93 homogene 32 lineare 32, 57 Ordnung der 31 differentieller Wirkungsquerschnitt 276 differenzierbare Struktur 458 Diffusion 236 Dilatation 243, 362, 375, 420 diophantische Bedingung 380, 403 diskrete Teilmenge 312 Dispersionsrelation 112 Distribution 149, 208, 532 Doppelpendel 166 Drehgruppe SO(3) 121, 326, 517, 520 Drehimpuls 4, 164, 239, 306, 323, 354 Dreiachsenstabilisation 535 Dreik¨orperproblem 7, 385 Dualbasis 472 D¨ unne Linse 174 Duhamel–Prinzip 68 dynamisches System 13, 36 diskretes 14 ergodisches 181 mischendes 184 maßerhaltendes 180 stetiges 16 effektives Potential 308
625 Ehresmann–Zusammenhang 527 eigentliche Abbildung 331, 521 Einbettung 161, 161, 468 einfach zusammenh¨angend 456 Einfangorbit 251, 261 Einheitstangentialb¨ undel 524 Einsteinsche Summenkonvention 161 elastischer Stoß 287 Ellipse 5, 552 elliptische Matrix 103, 115, 187 Energie kinetische 144 potentielle 144 Ruhe– 148 Energiefunktional 156, 538 Energieschale 94 Epizykeltheorie 350 Ergodentheorie 181 ff., 229 ergodisch 181 eindeutig 372 Erwartungswert 193 erweiterte Zahlengerade 48 erzwungene Schwingung 87 escape-Funktion 133 Euler–Kraft 351 Euler–Lagrange–Gleichung 154 Euler–Winkel 358 exakte Differentialform 493 Sequenz 543 Experimente Aharonov-Bohm 494 Hafele–Keating 422 Rutherford 275 Exponentialabbildung Differentialgeometrie 546 Lie–Gruppen 58, 516 Exponentialfunktion 58 Extremum 154 Faktor eines dynamischen Systems 22 Faktorgruppe 509 Faltungssingularit¨at 172, 278 Faserb¨ undel 108, 124, 141, 202, 362, 368, 431, 513, 522 Fasertranslation 216, 389
626 Fata Morgana 169 Feder 84 fermatsches Prinzip 169 Fibonacci–Zahlen 405 Fixpunkt einer Abbildung 506 eines dynamischen Systems 14 nicht degenerierter 448 Fliehkraft 351 Floer–Theorie 448 floor –Funktion 13, 49 Fluchtzeiten 48 Fluss 14, 47 maximaler 49 Formsph¨are 257, 362 freie Bewegung 18, 84, 133, 261, 335 Freiheitsgrad 94 Fundamentalgruppe 456 Fundamentalsystem 66 Fußpunkt 464 -projektion 204 Gauss–Abbildung 109 (Differentialgeometrie) 180, 406 (Zahlentheorie) Gebiet 80 gebundener Orbit 261 generisch 28, 342, 368, 537 geod¨atisch vollst¨andig 546 geod¨atische Bewegung 245, 161 geschlossene Differentialform 493 Mannigfaltigkeit 206, 549, 550 Geschwindigkeit 94 glatte Abbildung 462 Gleichzeitigkeit 431 Goldener Schnitt 405, 407, 409 Gradient 470 Gradientenfluss 90, 216 Graf–Partition 296 Grassmann–Algebra 475 Grassmann–Mannigfaltigkeit 119 Gronwall–Ungleichung 51 Gruppe affin symplektische 439
Sachregister allgemeine lineare GL(n, K) 64, 512, 526 Drehgruppe SO(3) 121, 326, 517, 520 Drehgruppe SO(n) 348, 513 Euklidische E(n) 344, 511 Faktor– 509 Galilei– 430 GL(2, Z) 186 Holonomie– 534 indefinite orthogonale O(m, n) 414 Isotropie– 312, 331, 509 Lie– 511 Lorentz– 414 orthogonale O(n) 513 Poincar´e– 414 projektive lineare PGL(V ) 426 spezielle lineare SL(n, R) 102, 115, 337, 439, 513 speziell unit¨are SU(n) 514 Struktur– 524 SU(2) 466, 514 symplektische Sp(R2n ) 98, 102, 117, 126, 176, 337 topologische 511 unit¨are U(n) 513 Gruppengeschwindigkeit 111 Gruppenwirkung 17, 509, 519 ¨aquivariante 328 diagonale 345 eigentliche 521 freie 312, 509 lokal freie 311, 331 (schwach) hamiltonsche 324 symplektische 324 transitive 312, 509 Gullstrand–Formel 578 Haar–Maß 179, 498 H¨aufungspunkt einer Teilmenge 452 halbeinfach 104 Hamilton–Funktion 93, 148 relativistische 148 hamiltonsch 93, 204, 213, 324 lokal 204 schwach 324
Sachregister hamiltonsches System 204 harmonischer Oszillator 69, 71, 105, 224, 524 Hauptfaserb¨ undel 362, 524 Hauptkr¨ ummung 161 Haupttr¨agheitsmoment 353 Hausdorff–Raum 453 Hillsches Gebiet 227, 249 Himmelskugel 109, 425 holonome Zwangsbedingung 149, 167 Holonomiegruppe 534 Hom¨oomorphismus 454 homogener Raum 123 Homogenit¨at der Raumzeit 424 Homologie 541 Homotopie 125, 258, 318, 456 Homotopie¨aquivalenz 456 Hookesches Kraftgesetz 83 Hopf–Abbildung 108, 245, 428 Hopf–Verzweigung 136 Hyperbel 5, 417 hyperbolisch 76 hyperbolische Matrix 103, 115, 187 ideales Gas 376 Immersion 468 Impuls 94, 144, 145 Impulsabbildung 324 Index eines kritischen Punktes 537 einer Matrix 76 Maslov– 122 einer Ruhelage 76 infinitesimaler Erzeuger 520 infinitesimal symplektisch 95, 101 inneres Produkt 487 instabile Ruhelage 20 instabiler Unterraum 76 integrabel hamiltonsche Systeme 400, 409 Distributionen 532 invariante Teilmenge des Phasenraums 16 involutiv Distributionen 532 Transformationen 503
627 Involution 310 isotrop Untermannigfaltigkeit 219 Unterraum 116 Isotropie der Raumzeit 416 Isotropiegruppe 312, 331, 509 iterierte Abbildung 12 Jacobi–Identit¨at 64, 101, 212, 366, 515 Jordan–Matrix, –Normalform 60 reelle 63 Jacobi–Metrik 166, 228 kanonische Koordinaten 210, 214 kanonische Transformation 213 Karte einer berandeten Mannigfaltigkeit 461 einer Mannigfaltigkeit 457 nat¨ urliche 465 Kartenwechsel 457 Kaustik 172 Kepler–Potential 239, 261 Keplersche Gesetze 3 Kepler–Teleskop 175 Kette (Homologietheorie) 541 Knoten 81; 109 Kohomologie 497 kohomologische Gleichung 390 Kollisionsunterraum 293 Kommutator 101, 211, 536 kommutierendes Diagramm 23 kompakt 453 komplexe Struktur 98 Konfigurationsraum 94, 149, 463 Konjugation (Gruppen) 510 konjugiert dynamische Systeme 22 Gruppen 509 Punkte auf einer Geod¨ate 547 Konstante der Bewegung 309 Kontaktmannigfaltigkeit 207 kontrahierbar 456 Kontraktion auf metrischem Raum 39, 506 einer Lie–Algebra 431 konvex 500
628 Koordinaten 27, 457 B¨ undel– 202 Impuls– 474 kanonische 210 k¨orpereigene 348 Kugel– 467 lokales Koordinatensystem 457 nat¨ urliche 465 Orts– 474 Polar– 307, 481 raumfeste 348 spheroid-prolate 247 Winkel-Wirkungs– 315 Koordinatenvektorfeld 488 Korrelationsfunktion 185 Kotangentialb¨ undel 202 Kotangentiallift 215, 216, 389 Kotangentialraum 202 Kotangentialvektor 202 kovariante Ableitung 531 Kreisel 352 Kreisrotationen 15, 24, 182, 185 Kriechfall 86 kritische Menge 299 kritischer Punkt 153 Kr¨ ummung 161, 535 innere 161 K¨ unneth–Formel 499 Kurve 456 regul¨are 468 zeitartige 421 L¨angenfunktional 153, 545 Kustaanheimo-Stiefel– Transformation 245 Lagrange-d’Alembert– Bewegungsgleichungen 365 Lagrange–Funktion 145, 468 Lagrange–Gleichung 145 Lagrange–Grassmann– Mannigfaltigkeit 119 Lagrange–Mannigfaltigkeit 173, 219, 310 Lagrange–Punkt 255 Lagrange–Unterraum 116 Laplace–Runge–Lenz–Vektor 240
Sachregister Lebesgue–Mass λd auf Rd , 179 Legendre–Transformierte 146, 501 Legierung 231 Lemma von Hadamard 271 Levi-Civita–Transformation 245 Levi-Civita–Zusammenhang 531, 532 Liapunov–Funktion 131 liapunov–stabil 19, 102, 128, 129, 360 lichtartig 419 Lichtgeschwindigkeit 148, 148, 412, 414 Lie–Ableitung 487 Lie–Algebra 101, 515 Lie–Gruppe 511 Lie–Klammer 211 Lift bei B¨ undeln 528 Linkslift einer Gruppenwirkung 327 Limes superior/inferior 49 Linse 171 Liouville–Form 205 Liouville–Maß 180, 310 Lipschitz–Bedingung 36 Lissajous–Figur 107 Ljusternik–Schnirelmann–Kategorie 550 L¨ osung einer Differentialgleichung 36 allgemeine 33 homographische 253 maximale 48 singul¨are 33 spezielle 33 vollst¨andige 33 L¨ osungsraum 66 L¨ osungsoperator 66 logistische Familie 21 lokalkompakt 453 lokal trivial 141, 522 Lorentz–Gruppe 414 Lorentz–Kraft 113, 583 Magnetfeld 8, 113, 206, 227 Mannigfaltigkeit 458 berandete 461 riemannsche 469 Untermannigfaltigkeit des Rn 25 Untermannigfaltigkeit einer Mf. 219
Sachregister Maslov–Index f¨ ur Lagrange–Unterr¨aume 122 f¨ ur symplektische Abbildungen 126 Maß 179 Haar–Maß 179 Liouville–Maß 180, 310 Wahrscheinlichkeitsmaß 179 Matrixexponential 58 Maupertuis–Prinzip 168 Maxwellsche Gleichungen 480 Mechanik hamiltonsche 93 lagrangesche 145 newtonsche 145 Menge integrable 310 messbare 178 perfekte 384 unabh¨angige 310 Messraum 178 metrischer Raum 450 metrischer Tensor 469, 483 metrisierbar 453 Milankovi´c-Zyklen 385 Minkowski–Raum 414 mischend 184 Mittelungsprinzip 369 M¨ obius–Band 26, 460, 526 M¨obius–Funktion 554 M¨ obius–Transformation 115, 426 Møller–Transformation 268 monotone Twistabbildung 444 Morse–Funktion 448, 537 Morse-Bott–Funktion 548 perfekte 538 Morse–Lemma 540 Morse–Theorie 168, 537 Multiindex-Notation 260, 375, 381 Multiplizit¨at 61; 547 musikalischer Isomorphismus 470 n–K¨orper-Problem 7, 252, 266 n–Zentren-Problem 247 nat¨ urliches mechanisches System 363 Newton–Verfahren 507 nichtrelativistisch 412
629 nichttrivial 81, 139, 168, 442, 629 nicht trivial 108, 342, 523, 549, 629 nirgends dichte Teilmenge 452 normale Matrix 105 Normalenb¨ undel 525 Nullschnitt 525 Numerik 39, 314 Nutation 360 Obere Halbebene 115 oberhalbstetig 49 ω–Limesmenge 19, 23, 75 Operatornorm 58 Optik geometrische 171 lineare 173 optische Achse 171 Orbit 14, 47, 509 Einfang–, gebundener, Streu– 261 homokliner 321 periodischer 14, 19, 47, 90, 106, 136, 152, 168, 182, 194, 549 Orbit–Methode von Kirillov 338 Orientierung 466, 526 Ort 94 Orthonormalbasis der Charaktere 188 Palais-Smale–Bedingung 548 Paley-Wiener–Absch¨atzung 381, 391 Parabel 5, 158, 245 parabolische Matrix 103, 115, 187 parakompakt 453, 453 Parallelisierung 466 Parameter einer DGL 56 Parseval–Gleichung 189 Pauli–Matrizen 607 Pendel 320 Periode 14, 47 periodische Randbedingungen 110 Perizentrum 240, 277 Phasenportrait 73 Phasenraum 12, 36 erweiterter 36, 217 Phononen 113 Picard–Abbildung 39 Picard–Iteration 39 Poincar´e–Abbildung 138
630 Poincar´e–Gruppe 414 Poincar´e–Lemma 494, 497 Poisson–Formel 290 Poisson–Klammer 209 Poisson–Struktur 338 Polarisationsidentit¨at 97 Polarkoordinaten 3, 307, 481, 489 Potential 225 effektives 308 Kepler– 239, 261 kurz- und langreichweitiges 260 periodisches 228 separables 234 Yukawa– 236, 308 Zentral– 148, 375 zuf¨alliges 231 Pr¨azession 360, 419 Prinzipalb¨ undel 362, 524 Produktmaß 190, 191, 231 Produkttopologie 454 projektiver Raum P(V ) 512 CP(k) 108 RP(k) 119, 402, 526 RP(1) 120, 523 RP(2) 469 RP(3) 121 pull-back 96, 219, 476, 486 Punkttransformation 216 Quadratur 318 Quantenmechanik 10, 17, 121, 238, 274, 292, 494 Quasipolynom 70 Quaternionen 246, 425, 517 Quotiententopologie 450 Radon–Transformation 280 Rand einer Teilmenge 452 einer Mannigfaltigkeit 461 einer Kette 541 Rang einer ¨außeren Form 474 einer Bilinearform 96 einer Mengenpartition 292 eines Vektorb¨ undels 525 Rapidit¨at 417
Sachregister rational unabh¨angig 106, 371 raumartig 419 Raummittel 369 reduzierte Masse 3, 291 Regenbogensingularit¨at 278 regul¨are Abbildung 27 regul¨arer Punkt 468 regul¨arer Wert 25, 315, 468 Reibung 84 relativistisch 148, 375, 412 relativistische Periheldrehung 385 Restklassengruppe 110, 509 Resonanz klassisch: 87, 401 quantenmechanisch: 275 restringiertes drei-K¨orper-Problem 256 retrograde Planetenbewegung 349 reversibel 227 riemannsche Metrik 160, 469 Rodrigues–Formel 517, 566 R¨ ontgen–Transformation 280 Rotationsfl¨ache 162 Rotationszahl 24, 409 Ruhelage 47 Satz u ¨ber Asymptotische Vollst¨andigkeit 273, 299 die Begradigung 55 Eigenwerte symplektischer Abbildungen 99 Energieerhaltung 94 Fourier–slice 282 Fundamental-Lemma der Variationsrechnung 154 hamiltonsches Variationsprinzip 154 Hauptsatz der DGL-Theorie 53 Hauptsatz der riemannschen Geometrie 532 Inverse Streutheorie 285 Isoenergetische Nichtdegeneriertheit 402 Normalform reeller Bilinearformen 97 Normalform von Ellipsoiden 440 Møller-Transformation 268
Sachregister Polarzerlegung 103, 512 den regul¨aren Wert 468 Tennisschl¨ager 357 Viriale 374 Winkel-Wirkungskoordinaten 315 Satz von Atiyah u. Guillemin–Sternberg 340 Banach 506 Birkhoff 195, 229, 375, 410 Bogoliubov und Krylov 180 Cantor–Bendixson 384 Chow 365 Clairaut 164 Darboux 214 Darboux – lineare Version 97 Frobenius 533 Gromov 440, 442 Gronwall 51 Hopf und Rinow 107, 546 Igel 467, 532 Jordan (Kurvensatz) 444 Kolmogorov, Arnol’d, Moser (KAM) 9, 237, 400 K¨ unneth 499 Ky Fan 342 Lagrange 255 Liapunov 131 Liouville-Arnol’d 310 Marsden und Weinstein 331 Morse (Index–Satz) 548 Moulton 254 Noether 330 Peano 37 Picard–Lindel¨ of 37, 505 Poincar´e (P.–Lemma) 494, 497 Poincar´e (Wiederkehrsatz) 198 Poincar´e–Birkhoff 443 Poinsot 357 Rutherford (Streuquerschnitt) 276 Sard 299, 444, 549 Schur und Horn 341 Schwarzschild 274 Steiner 353 Stokes 490 Sylvester 97, 414
631 Tychonoff 18, 455 Weierstraß 59 Weyl 372 Whitney 469 schlecht gestellte Probleme 282 Schnitt f¨ ur Faserb¨ undel 522 f¨ ur Vektorfelder 138 Schr¨ odinger–Gleichung 10, 17, 238 Schwartz–Raum 282 Schwerpunkt 239, 290, 293, 347 Schwingfall 85 semidirektes Produkt von Gruppen 345, 414, 511 semikonjugiert 22, 234 Separatrix 321 Shiftraum 18, 190, 192 sigma–Algebra 178 Simplex 254, 340, 541 Sinai–Billard 190 singul¨arer Punkt einer Abbildung 468 eines Vektorfeldes 47 singul¨arer Wert 468 Spirale 81 Spur einer Kurve 456 stabil asymptotisch 20, 128, 131 liapunov– 19, 102, 128, 129, 360 stark 129 stabiler Unterraum 76 Standardabbildung 408, 444 stereographische Projektion 108, 245, 426, 459 Sterngebiet 494 stetig 454 Stiefel–Mannigfaltigkeit 342 St¨ orfunktion 57 Streuorbit 261, 267 Streutransformation 274 Strukturgruppe 524 Submersion 331, 468, 521 superintegrabel 244 Supremumsmetrik 41 symplektische Fl¨ache 441
632 symplektische Form 97, 203, 206 symplektische Gruppe 98 symplektische Gruppenwirkung 324 symplektischer Integrator 314 symplektische Transformation 213 symplektischer Vektorraum 98 Symplektomorphismus 213 Systemmatrix 57 Tangentialabbildung 465 Tangentialb¨ undel 464 Tangentialvektor 463 Tautochronen-Problem 159 Tautologische Form 205 Teilraumtopologie 450 Thomas–Matrix 419 topologische Gruppe 511 topologischer Raum 449 topologisch transitiv 19 Torus 107, 167, 207, 229, 310, 314, 325, 371, 499, 513 Torusautomorphismus 187, 194 Totalraum eines Faserb¨ undels 522 Tr¨agheitsmoment 295, 535 Tr¨agheitstensor 348, 365 Trajektorie 14 Translationsinvarianz 111 triviales B¨ undel 523 lokal triviales 522 Twistabbildung 409 ¨ Uberlagerung 523 Umgebung 453 unterhalbstetig 49 Untermannigfaltigkeit des Rn 25, 469 einer Mannigfaltigkeit 219, 468 Vektorb¨ undel 525 Vektorfeld 47, 464 affines 113 Gradienten– 91, 145 hamiltonsches 93 hyperbolisches 76 links–invariantes 514 Lipschitz-Bedingung f¨ ur 36 lokal hamiltonsches 204 vollst¨andiges 42
Sachregister zeitabh¨angiges 36 Vektorprodukt 114, 326, 517 Verfeinerung 453 Verschlingungszahl 109 Verzweigung 134, 152, 256 Verzweigungsdiagramm 81, 250 Verzweigungsmenge 141, 250 Vortexlinien 218 vorw¨artsinvariant 16, 90 Wahrscheinlichkeitsraum 178 wandernd 586 Weg 456 Wellengleichung 31 Weltlinie 421 Whitney–Summe von Vektorb¨ undeln 525, 527 Wirkung 153, 168 Wirkung einer Gruppe 17, 509, 519 Wronski–Determinante 67 Yukawa–Potential 236, 308 zeitartig 419, 421 Zeitmittel 369 Zeitumkehr 227 Zeitverz¨ogerung 272, 283 Zentralkonfiguration 253 Zentrum einer Gruppe 426 f¨ ur einen Fluss 80, 81 Zerlegbarkeit (¨außere Form) 239, 474 Zerlegung der Eins 453, 459, 491, 530 Zodiacus 109 zusammenh¨angend 455 Zusammenhang 527 auf Hauptfaserb¨ undeln 529 auf Vektorb¨ undeln 530 Produkt– 528 Zusammenhangskomponente 455 Zwangsbedingung 149 Zweik¨ orperproblem 291 Zweizentrenproblem 247 Zwillingsparadox 423 Zykel 541 Zykloide 157 Zylindermenge 190