Hamiltonsche Mechanik auf Mannigfaltigkeiten Jochen Merker 12. Juli 2006
2
Inhaltsverzeichnis 1 Newtonsche Mechanik ...
170 downloads
573 Views
509KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Hamiltonsche Mechanik auf Mannigfaltigkeiten Jochen Merker 12. Juli 2006
2
Inhaltsverzeichnis 1 Newtonsche Mechanik von Punktteilchen
7
1.1
Punktteilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
1.2
Newtonsche Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.3
Konservative Kr¨afte und Energie . . . . . . . . . . . . . . . . . . . . .
11
1.4
Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
1.5
Newtonsche Mechanik auf Mannigfaltigkeiten . . . . . . . . . . . . . .
19
2 Der starre K¨ orper
23
2.1
Lie-Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
2.2
Der freie starre K¨orper . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
3 Lagrangesche Mechanik
31
3.1
Die Euler-Lagrange Gleichungen . . . . . . . . . . . . . . . . . . . . . .
31
3.2
Das Noether-Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
4 Hamiltonsche Mechanik
35
4.1
Symplektische Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . .
35
4.2
Die Hamiltonschen Differentialgleichungen . . . . . . . . . . . . . . . .
37
4.3
Die Liouvillesche Volumenform . . . . . . . . . . . . . . . . . . . . . .
38
4.4
Hamiltonsche vs. Lagrangesche Mechanik auf Kotangentialb¨ undeln . . .
39
5 Poissonsche Mechanik
41
5.1
Poisson-Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . .
41
5.2
Symmetrie und Reduktion . . . . . . . . . . . . . . . . . . . . . . . . .
44
6 Elektromagnetismus
51
6.1
Geladene Teilchen im Magnetfeld . . . . . . . . . . . . . . . . . . . . .
51
6.2
Das elektromagnetische Feld . . . . . . . . . . . . . . . . . . . . . . . .
53
3
4
Einleitung Die theoretische Mechanik befasst sich mit der mathematischen Modellierung mechanischer Systeme und der mathematischen Untersuchung solcher Modelle. Beispiele f¨ ur mechanische Systeme sind Punktteilchen, starre Festk¨orper, Federn und daraus zusammengesetzte Gegenst¨ande wie Fahrzeuge und Roboter, aber auch elastische Festk¨orper, Fluide und Felder wie das elektromagnetische Feld oder die quantenmechanische Wellenfunktion eines Teilchens. Wir werden uns einerseits konkret und ausf¨ uhrlich mit Modellen bestimmter mechanischer Systeme besch¨aftigen. Andererseits werden wir parallel dazu aber auch eine abstrakte mathematische Theorie entwickeln, in deren Rahmen man Modelle f¨ ur mechanische Systeme formulieren und studieren kann. Einige Fragen, mit denen wir uns besch¨aftigen wollen, und Antworten, die uns die abstrakte mathematische Theorie darauf gibt (und die sie vermutlich erst im Lauf der Vorlesung verstehen k¨onnen), sind: • Wodurch kann man den Zustandsraum eines mechanischen Systems modellieren? Klassisch durch eine symplektische (oder eine Poisson- oder gar eine Dirac-) Mannigfaltigkeit, quantenmechanisch durch eine (fast) K¨ahler-Mannigfaltigkeit. • Wodurch kann man die zeitliche Entwicklung mechanischer Systeme modellieren? Durch eine Hamiltonsche Differentialgleichung auf der den Zustandraum modellierenden symplektischen Mannigfaltigkeit, oder allgemeiner durch einen Fluß, der die geometrische Struktur des Zustandsraumes erh¨alt. • Was f¨ ur Aussagen kann man u ¨ber die von einem Modell vorhergesagte zeitliche Entwicklung eines mechanischen System gewinnen? Man kann Erhaltungsgr¨oßen identifizieren und dadurch ein komplexes Modell reduzieren, man kann Stabilit¨at und Bifurkation diskutieren, und man kann untersuchen, wie man die zeitliche Entwicklung gezielt beeinflussen kann. W¨ahrend sich die in der ersten H¨alfte der Vorlesung behandelten Themen weitgehend von selbst ergeben - schließlich muß man zun¨achst die Grundlagen erlernen - , besteht f¨ ur die H¨orer in der zweiten H¨alfte durchaus die M¨oglichkeit, die Themenauswahl zu beeinflussen, sei es durch den Wunsch, ein bestimmtes physikalisches Problem zu untersuchen, oder durch das besondere Interesse an einem bestimmten mathematischen Teilbereich. Teilen sie mir einfach ihre Anregungen mit.
5
6
Kapitel 1 Newtonsche Mechanik von Punktteilchen Nach einem kurzen Einblick in die Modellierung von Punktteilchen und das Galileische Weltbild lernen wir die Newtonsche Grundgleichung der Bewegung kennen und wenden diese an, um einige spezielle Probleme zu l¨osen. Danach diskutieren wir im Rahmen der Newtonschen Mechanik konservative Kraftfelder und den Begriff der Energie. W¨ahrend zur Modellierung von Punktteilchen im Galileischen Weltbild noch der Rn als Konfigurationsraum ausreichte, ben¨otigt man f¨ ur die Modellierung allgemeinerer mechanischer Systeme Mannigfaltigkeiten. Aus diesem Grund formulieren wir abschließend die Newtonsche Mechanik auf Mannigfaltigkeiten.
1.1
Punktteilchen
Unter einem Punktteilchen wollen wir ein punktf¨ormiges physikalisches Teilchen verstehen, das sich im physikalischen Raum bewegen kann. Daß es ein solches Teilchen tats¨achlich gibt, muß wohl ob der Erkenntnisse der Physik im 20. Jahrhundert stark bezweifelt werden. Jedoch werden Punktteilchen als idealisierte Vorstellungen bzw. als N¨ahrungen f¨ ur einfache mechanische Systeme wie z.B. nichtrotierende kleine Kugeln auch heute noch sehr h¨aufig in der Physik verwendet. In unserer physikalischen Vorstellung wird ein Punktteilchen eindeutig durch seine Position im Raum zu einer bestimmten Zeit beschrieben. Um also ein mathematisches Modell f¨ ur ein Punktteilchen zu finden, muß man zun¨achst ein Modell f¨ ur die physikalische Raum-Zeit finden. Solch ein Modell liefert z.B. das Galileische Weltbild. In diesem Weltbild modelliert man den Raum durch den Euklidischen R3 , d.h. durch P die mit der Euklidischen Metrik √ n n d(x, y) := kx − yk, kxk = < x, x >, < x, y >:= i=1 xi yi , versehene Menge R von n-Tupeln reeller Zahlen im Spezialfall n = 3. Die Zeit modelliert man durch den Euklidischen R1 , und das kartesische Produkt R1 × R3 dient im Galileischen Weltbild als Modell f¨ ur die Raum-Zeit. Als Koordinaten der Raum-Zeit kann man nat¨ urlich kartesische Koordinaten (t, x1 , x2 , x3 ) 7
verwenden, jedoch sind diese in keinster Weise vor anderen Koordinatenwahlen ausgezeichnet: Ist 0 eine Transformation der alten Koordinaten (t, x) in neue Koordinaten (t0 , x0 ) und erf¨ ullt 0 die Beziehungen d(x, y) = d(x0 , y 0 ) f¨ ur alle Positionen x, y ∈ R3 0 0 und |t − s| = |t − s | f¨ ur alle Zeiten s, t ∈ R, so hat man keine M¨oglichkeit, durch Messung von Positionsabst¨anden oder Zeitabst¨anden einen Unterschied zwischen den Koordinatensystemen (t, x) und (t0 , x0 ) festzustellen. Man sollte diese neuen Koordinaten somit als gleichwertig zu den alten Koordinaten akzeptieren, und nennt die beiden Koordinatensysteme dann “gleichf¨ormig zueinander bewegt bzw. Inertialsysteme. ” Transformationen 0 der Raum-Zeit, die die Abst¨ande im Raum und in der Zeit erhalten, nennt man Galilei-Transformationen. Unter ihnen findet man die Translationen (t, x) 7→ (t0 , x0 ) := (t + s, x + y) in Raum und Zeit, die Drehungen und Spiegelungen des Raumes (t, x) 7→ (t0 , x0 ) := (t, Ax) mit einer Abbildung A aus der Gruppe O(3) := {A : R3 → R3 | kAxk = kxk} der normerhaltenden (⇔ orthogonalen) Abbildungen des Raumes, und gleichf¨ormige Bewegungen (t, x) 7→ (t0 , x0 ) := (t, x + tv) in Richtung v ∈ R3 . Dar¨ uberhinaus ist jede (die Richtung der Zeit erhaltende) Galilei-Transformation sogar eine Komposition aus diesen Grundtypen. Mit diesem Modell der Raum-Zeit und unserer physikalischen Vorstellung von einem Punktteilchen, das ja eindeutig durch seine Position im Raum zu einer bestimmten Zeit beschrieben werden sollte, macht es nun Sinn, ein Punktteilchen durch eine Kurve x : R → R3 zu modellieren: x(t) gibt die Position des Teilchens im Raum zur Zeit t an. Den Graph der Kurve, d.h. die Teilmenge {(t, x(t))|t ∈ R} der Raum-Zeit, nennt man die Weltlinie des Punktteilchens, die Ableitung x˙ : R → R3 nennt man die Geschwindigkeit des Punktteilchens und die zweite Ableitung x¨ : R → R3 die Beschleunigung.
1.2
Newtonsche Mechanik
Die Newtonsche Mechanik besch¨aftigt sich mit der Bewegung von n Punktteilchen. Sie basiert auf der Newtonschen Grundgleichung (oder Bewegungsgleichung) F = ma, die ein Modellierungsaxiom ist und besagt, daß die Beschleunigung a jedes Punktteilchens proportional zur Kraft F ist, die auf das Punktteilchen einwirkt, und daß die Proportionalit¨atskonstante die konstante Masse m des Punktteilchens ist. Dar¨ uberhinaus soll nach Newton die Kraft F nur von der Zeit sowie den Positionen und Geschwindigkeiten ¨ der Punktteilchen abh¨angen, und zwar so, daß sich die Grundgleichung bei Ubergang zu einem anderen inertialen Koordinatensystem nicht ¨andert. Mathematisch bedeutet dies, daß nach Newton die Bewegung von n Punktteilchen im Raum durch die L¨osung x : R → R3n eines Systems von gew¨ohnlichen Differentialgleichungen mj x¨j (t) = Fj (t, x1 (t), . . . , xn (t), x˙ 1 (t), . . . , x˙ n (t)) , j = 1, . . . , n zweiter Ordnung modelliert wird, das wir abgek¨ urzt auch als x¨ = F (t, x, x) ˙ schreiben, und daß die rechte Seite F dieses Differentialgleichungssystems, die die Kraft modelliert, 8
invariant unter Galilei-Transformationen zu sein hat. Die Komponente xi (t) ∈ R3 , i = 1, . . . , n, der Kurve x gibt dabei die Position des i-ten Punktteilchens zur Zeit t an. Lemma 1.1 Ein unter Galilei-Transformationen invariantes F h¨angt nicht von der Zeit t und nur von den relativen Positionen und relativen Geschwindigkeiten ab: F = F (xi − xj , x˙ i − x˙ j ), i 6= j, i, j = 1, . . . , n. Beweis: F ist invariant unter Zeit-Translationen, Raum-Translationen und gleichf¨ormigen Bewegungen. 2 Beispiel: Newton’s Gravitationsgesetz: In einem mechanischen System aus n Punktteilchen der Masse mi u ¨bt nach dem Newtonschen Gravitationsgesetz das i-te x −x Teilchen auf das j-te Teilchen die Gravitationskraft Gmi mj kxii−xjjk3 mit der Gravita−11 tionskonstanten G ≈ 6, 673 · 10P m3 kg −1 s−2 aus. Die Gesamtkraft, die auf das j-te x −x n Teilchen wirkt, ist also Fj = G i=1,i6=j mi mj kxii−xjjk2 , und als Bewegungsgleichung ergibt sich sich mj x¨j (t) = Gmj
n X
mi
i=1,i6=j
xi − xj kxi − xj k3
Man bemerke, daß die rechte Seite wirklich nur von der relativen Lage der Punktteilchen abh¨angt, und daß die ganze DGL auch invariant unter Drehungen und Spiegelungen ist, also den Newtonschen Anforderungen gen¨ ugt. Außerdem eine kleine Randbemerkung: Eigentlich m¨ ußte man die tr¨age Masse mj auf der linken Seite der DGL, d.h. die Masse, die eine Bewegung des Punktteilchens erschwert, und die schwere Masse mj auf der rechten Seite der DGL, d.h. die Masse, die f¨ ur die Gravitation eine Rolle spielt, unterscheiden. Empirisch konnte man bisher aber keinen Unterschied zwischen diesen beiden Massen feststellen, so daß man diese identifiziert. Beispiel: Freier Fall: Lassen sie uns den Spezialfall des freien Falls eines K¨orpers im Gravitationsfeld der Erde betrachten. Wir modellieren sowohl den fallenden K¨orper als auch die Erde durch ein Punktteilchen. Da die Erde im Verh¨altnis zum fallenden K¨orper eine sehr große Masse haben soll, ignorieren wir den Gravitationseinfluß des K¨orpers auf die Erde, w¨ahlen ein Koordinatensystem mit Ursprung im Erdmittelpunkt und erhalten dadurch die konstante Position 0 der Erde. Die Position x(t) des fallenden K¨orpers erf¨ ullt dann nach Newton’s Gravitationsgesetz die DGL x¨ = −
GM x kxk2 kxk
.
Diese N¨ahrung ist nicht mehr invariant unter Translationen im Raum und gleichf¨ormigen Bewegungen. Beispiel: Freier Fall nahe der Erdoberfl¨ ache: Interessieren wir uns f¨ ur den freien Fall eines K¨orpers nahe der Erdoberfl¨ache, so kann man die Gleichung noch etwas vereinfachen. Denn der K¨orper befindet sich ja immer nahe der Erdoberfl¨ache, 9
deswegen k¨onnen wir annehmen, daß der Abstand kxk fast immer gleich dem Erdradius R ≈ 6371 km ist. Dies vereinfacht den ersten Term in Newton’s Gravitationsgesetz f¨ ur den fallenden K¨orper zur Erdbeschleunigung g = GM ≈ 9.81 ms−2 . R2 x Dar¨ uberhinaus ist ν(x) := kxk weitgehend ein Vektor der konstanten L¨ange Eins, d.h. ν(x) ∈ S2 := {x ∈ R3 | kxk = 1}. Als N¨ahrung f¨ ur den freien Fall nahe der Erdoberfl¨ache ergibt sich somit die Gleichung x¨ = −gν(x), die weiterhin nicht invariant unter Translationen im Raum und gleichf¨ormigen Bewegungen ist. Beispiel: Optimaler Winkel beim Kugelstoßen: Wir wollen der Frage nachgehen, in welchem Winkel ein Kugelstoßer seine Kugel stoßen sollte, um eine optimale Weite zu erzielen. Da sich die Kugel nach dem Loslassen (unter Vernachl¨assigung von Reibung) im freien Fall befindet, bis sie auf der Erdoberfl¨ache auftrifft, k¨onnten wir die soeben ermittelte Gleichung x¨ = −gν(x) f¨ ur den freien Fall nahe der Erdoberfl¨ache benutzen. Da aber die Weite des Stoßes nicht so groß sein wird, daß sich ν(x) wesentlich ¨andert, verwenden wir die N¨ahrung x¨ = −gν mit einem konstanten Vektor ν. Diese Gleichung ist nun wieder invariant unter Translationen und gleichf¨ormigen Bewegungen (allerdings nicht unter Rotationen), daher k¨onnen wir insbesondere unserer Koordinatensystem vom Erdmittelpunkt wieder an die Erdoberfl¨ache verlegen. Die L¨osung der Gleichung x¨ = −gν zur Anfangsposition x0 ∈ R3 und Anfangsgeschwindigkeit v0 ∈ R3 ist x(t) = x0 + tv0 − 21 gνt2 . Wollen wir wissen, bei welchem Winkel der Abstoß in einer H¨ohe h u ussen wir ¨ber dem Erdboden optimal ist, so m¨ nat¨ urlich von einem festen Betrag kv0 k der Anfangsgeschwindigkeit ausgehen, und OE k¨onnen wir das Problem in der Ebene bei Startwert (0, h), Anfangsgeschwindigkeit (vx , vy ) = kv0 k(cos(φ), sin(φ)) und ν = (0, 1) betrachten. Die Zeit, zu der die Kugel auf den Erdboden auftritt, ist dann die L¨osung von y(t) = h + tkv0 k sin(φ) − 12 gt2 = 0, d.h. p kv0 k sin(φ) kv0 k2 sin2 (φ) + 2hg + . t= g g Zu dieser Zeit t befindet sich die Kugel bei der x-Koordinate s ! kv0 k2 cos(φ) 2hg x(t) = tkv0 k cos(φ) = sin(φ) + sin2 (φ) + g kv0 k2 Um herauszufinden, unter welchem Winkel φ die Wurfweite maximal ist, m¨ ussen wir das Maximum dieser Funktion in Abh¨angigkeit von φ bestimmen. Ableiten nach φ und Nullsetzen ergibt unter Nutzung von sin(2φ) = 2 cos(φ) sin(φ) die Gleichung s 2 kv0 k 2hg sin(φ) cos(φ) cos(2φ) − sin(φ) sin2 (φ) + + cos(φ) q =0 . 2 g kv0 k sin2 (φ) + 2hg kv0 k2
oder ¨aquivalenterweise unter Nutzung von sin2 (φ) − cos2 (φ) = − cos(2φ) die Gleichung 2hg kv0 k2
cos(2φ) − sin(φ) q
− cos(2φ) 2
sin (φ) + 10
2hg kv0 k2
=0 .
Umstellen und Quadrieren liefert gh 2 2 sin (φ) − cos(2φ) = cos2 (2φ) , 2 kv0 k und unter Nutzung von 2 sin2 (φ) = 1−cos(2φ) ergibt sich schließlich φ = 21 arccos
gh gh+kv0 k2
Realistische Werte f¨ ur den Weltrekordler sind v0 = 14 ms−1 und h = 2.2 m, der optimale Absto”winkel liegt dann etwa bei φ = 40o . Beispiel: Das ebene Pendel: Wir betrachten ein in einer Ebene schwingendes Pendel nahe der Erdoberfl¨ache, das an einem Faden der L¨ange l h¨angt, und w¨ahlen unser Koordinatensystem so, daß der Ursprung im Aufh¨angungspunkt des Pendels liegt und die Erdanziehung in y-Richtung wirkt. Die Gravitationskraft, die auf das Pendel wirkt, kann man zerlegen in einen zum Pendel parallelen Anteil, der den Faden spannt, und ¨ einen dazu senkrechten Anteil, der eine Anderung des Winkels φ ∈ S1 bewirkt, um den das Pendel gerade ausgelenkt ist. Bei Auslenkung φ des Pendels ist dieser senkrechte g sin(φ). Anteil gerade −g sin(φ), und die Bewegungsgleichung lautet daher φ¨ = − 2πl
1.3
Konservative Kr¨ afte und Energie
Die Kr¨afte F aus den vorigen Beispielen h¨angen nur von der Position x und nicht von der Geschwindigkeit x˙ ab. Außerdem besitzen sie jeweils ein Potential, d.h. es gibt eine Funktion U mit F = − grad U . Beispielsweise gilt f¨ ur die Gravitationskraft F zwischen zwei Punktteilchen mit Massen m1 , m2 die Gleichung F = − grad U mit m2 . U := −G kxm11−x 2k Aufgabe: Bestimmen Sie Potentiale f¨ ur die anderen Beispiele. Allgemein nennt man ein Kraftfeld F konservativ, wenn es nur von der Position x abh¨angt und ein Potential U besitzt, d.h. F = − grad U gilt. Solch ein Potential ist bis auf eine Konstante eindeutig, und man nennt U auch die potentielle Energie. Lemma 1.2 Ein Kraftfeld F ist konservativ genau dann, wenn die Arbeit Z Z t1 F dS := < F (γ(t)), γ(t) ˙ >Euklid dt γ
t0
l¨angs jedes Weges γ : [t0 , t1 ] → Rn nur vom Anfangspunkt γ(t0 ) und Endpunkt γ(t1 ) abh¨angt. Beweis: Ist F = − grad U , dann gilt Z Z t1 − F dS = (U ◦ γ)0 (t)dt = U (γ(t1 )) − U (γ(t0 )) . γ
t0
11
.
Umgekehrt weiß man aus der Analysis, daß die 1-Form F dS = F1 dx1 +· · ·+Fn dxn genau dann geschlossen ist, d.h. d(F dS) = 0 gilt, wenn ihr Integral ¨ber jeden geschlossen Weg R u verschwindet, oder ¨aquivalenterweise, wenn das Integral γ F dS nur vom Anfangs- und Endpunkt des Weges γ abh¨angt. Auf dem Rn ist aber jede geschlossene Form sogar exakt (Poincare-Lemma), d.h. es existiert eine Funktion U mit −F dS = dU , bzw. F = − grad U . 2 Aufgabe: Gib ein nur von x abh¨angiges Kraftfeld F an, das kein Potential besitzt. Fasst man die Newtonsche Bewegungsgleichung - eine Differentialgleichung zweiter Ordnung - als System von Differentialgleichungen erster Ordnung auf, so ergibt sich f¨ ur eine konservative Kraft x˙ = p, p˙ = − grad U (x). Die Bewegungsgleichhung kann man daher mit der Gesamtenergie H(x, p) := 12 kpk2 + U (x) (der Summe aus kinetischer und potentieller Energie) als x˙ =
∂H (x, p) = p ∂p
p˙ = −
∂H (x, p) = F (x) ∂x
schreiben. Ein System von Differentialgleichungen, daß auf diese Weise durch partielles Ableiten einer Fuktion H(x, p) entsteht, nennt man Hamiltonsche Differentialgleichung, und wir haben gerade gezeigt, daß die Hamiltonsche Differentialgleichung mit der Gesamtenergie H f¨ ur konservative Kr¨afte offensichtlich ¨aquivalent zur Newtonschen Bewegungsgleichung ist. Diese Umformulierung ist besonders n¨ utzlich, wenn es um Erhaltungsgr¨oßen geht. Lemma 1.3 Die Gesamtenergie H ist konstant entlang jeder L¨osung der Hamiltonschen Differentialgleichung, d.h. H ist eine Erhaltungsgr¨oße. Beweis: Ist (x(t), p(t)) eine L¨osung, so gilt 0.
d H(x, p) dt
=
∂H x˙ + ∂H p˙ ∂x ∂p
=
∂H ∂H ∂x ∂p
∂H − ∂H = ∂p ∂x 2
Korollar 1.4 Jede L¨osungskurve der Hamiltonschen Differentialgleichung liegt in einer Fl¨ache H = const, und hat man noch weitere Erhaltungsgr¨oßen, so liegt jede L¨osungskurven in einem Schnitt von deren Niveaufl¨achen. Beispiel: Das linearisierte ebene Pendel: F¨ ur kleine Auslenkungen stimmt sin(φ) g ungef¨ahr mit φ u sin(φ) f¨ ur das ¨berein, deswegen kann man die Gleichung φ¨ = − 2πl g ebene Pendel durch die linearisierte Gleichung x¨ = − 2πl x ann¨ahren. Diese hat die 2 2 potentielle Energie U (x) = gx , und die Gesamtenergie ist daher H(x, p) = p2 /2 + gx . 4πl 4πl Jede L¨osungskurve (x, p)(t) bewegt sich somit auf einem Kreis H = const.
1.3.1
Bewegung im Zentralfeld
Ein nur von der Position x abh¨angiges Kraftfeld F (x) heißt Zentralfeld, wenn es unter allen orthogonalen Abbildungen invariant ist. Dies ist genau dann der Fall, wenn F = f (kxk2 /2)x mit einer Funktion f : R+ 0 → R gilt. 12
Lemma 1.5 Jedes Zentralfeld ist konservativ. Beweis: Es gilt < γ, γ˙ >= dtd kγ(t)k2 /2, also Z Z t1 < f (kγ(t)k2 /2)γ(t), γ(t) ˙ > dt = F dS = γ
Z
t0
t1
t0
f (kγ(t)k2 /2)
d kγ(t)k2 /2dt = dt
2 kγ(t Z1 )k /2
f (r)dr kγ(t0 )k2 /2
mit der Substitution r := kγ(t)k2 /2, und dieses Integral h¨angt offensichtlich nur vom Anfangs- und Endpunkt ab. 2 Ein Beispiel f¨ ur ein Zentralfeld ist der freie Fall unter Gravitation. Wir wollen nun zeigen, daß es f¨ ur Zentralfelder auf dem R3 neben der Energie noch eine weitere Erhaltungsgr¨oße gibt, den Bahndrehimpuls. Lemma 1.6 F¨ ur ein Zentralfeld F im R3 ist der Bahndrehimpuls L := x × mx˙ eines Punktteilchens mit konstanter Masse m, das m¨ x = F (x) erf¨ ullt, eine Erhaltungsgr¨oße. Hierbei bezeichnet × das Vektorprodukt im R3 . Beweis: In der Tat, d L(x(t), x(t)) ˙ = m(x˙ × x) ˙ + x × m¨ x = m(x˙ × x) ˙ + f (kxk2 /2)(x × x) = 0 , dt da f¨ ur das Vektorprodukt im R3 die Gleichung v × v = 0 f¨ ur jeden Vektor v ∈ R3 gilt. 2 Beispiel: Keplersche Gesetze: Wir betrachten den freien Fall eines massearmen K¨orpers im Gravitationsfeld eines massereichen Zentrums, z.B. einen Planeten im Gravitationsfeld einer Sonne oder einen Satelliten im Gravitationsfeld eines Planeten. Die Gleichung f¨ ur die Bahn des K¨orpers hatten wir schon ermittelt, sie lautete in kartesischen Koordinaten mit 0 als Zentrum GM x , x¨ = − kxk2 kxk und man beachte, daß die rechte Seite ein Zentralfeld ist. Daher wird der Bahndrehimpuls L := x × x˙ erhalten. Weil x senkrecht auf dem konstanten Vektor L steht und die Bewegungsgleichung unter Drehungen invariant ist, kann man OE L = kLke3 annehmen, so daß sich die Bewegungsgleichungen auf ein System mit zwei Variablen (x, y) reduzieren. Dieses System wollen wir nun in Polarkoordinaten (x, y) = (r cos(φ), r sin(φ)) schreiben. Aus den beiden Gleichungen GM cos(φ) r2 GM y¨ = r¨ sin(φ) + 2r˙ cos(φ)φ˙ − r sin(φ)φ˙ 2 + r cos(φ)φ¨ = − 2 sin(φ) r
x¨ = r¨ cos(φ) − 2r˙ sin(φ)φ˙ − r cos(φ)φ˙ 2 − r sin(φ)φ¨ = −
13
ergeben sich durch Vergleich der Koeffizienten vor sin(φ) und cos(φ) die beiden Gleichungen GM r2 ¨ ˙ rφ + 2r˙ φ = 0 .
r¨ − rφ˙ 2 = −
d ˙ Die zweite Gleichung ist ¨aquivalent zu r φ + 2rr˙ φ = 0, d.h. zu dt r2 φ˙ = 0 und somit ˙ Tats¨achlich ist die Konstante r2 φ˙ gerade der Betrag des Bahnzur Konstanz von r2 φ. Rt ˙ = drehimpulses kLk 1 . Diesen Sachverhalt oder seine integrierte Variante t01 r2 φdt kLk(t2 − t1 ) nennt man auch das zweite Keplersche Gesetz: In gleichen Zeiten u ¨berstreicht die Verbindungslinie Zentrum-K¨orper gleiche Fl¨achen. Die Konstanz von kLk = r2 φ˙ nutzen wir, um die Bahn des K¨orpers um das Zentrum zu beschreiben: Ist kLk = 0, so gilt enweder r = 0 und der K¨orper befindet sich direkt ˙ = 0, und aus der Gleichung r¨ − rφ˙ 2 = − GM im Zentrum, oder es gilt phi sieht man r2 GM r¨ = − r2 . Dies ist wieder eine Newtonsche Bewegungsgleichung, und mit dem Potential − GM der rechten Seite impliziert die Energieerhaltung f¨ ur diese Gleichung die Konstanz r von H(r, r) ˙ = 12 r˙ 2 − GM . L¨ o sungskurven sind also durch H = const bestimmt. Mit GM ≈ r 3 −2 398600 km s ergibt sich das folgende Bild der H¨ohenlinien H = −50, −40, . . . , 40, 50: 2¨
Man sieht, daß f¨ ur H ≥ 0 der Abstand r beliebig groß wird, der K¨orper entflieht also dem Gravitationsfeld des Zentrums, w¨ahrend f¨ ur H < 0 der K¨orper zum Zentrum zur¨ uckf¨allt. Analytisch wollen wir nur den Grenzfall H = 0 behandeln: Die Bewegungsgleichung , und mit dem Ansatz r(t) = a(c ± t)b ermittelt man ab(c ± t)2b−2 = lautet dort r˙ 2 = 2GM r √ √ 2GM a−1/2 (c ± t)−b , was nur f¨ ur 2b − 2 = −b, d.h. b = 2/3, und p ab = 2GM a−1/2 , p d.h. a = ± 3 9GM/2, m¨oglich ist. Die L¨osung lautet somit r(t) = 3 9GM/2(c ± t)2/3 und existiert f¨ ur t mit c ± t ≥ 0. Ist der Bahndrehimpuls dagegen kLk = 6 0, so k¨onnen wir den Abstand des K¨orpers vom Zentrum zumindest lokal in Abh¨angigkeit vom Winkel durch eine Funktion h(φ) mit h(φ) = 1/r beschreiben, denn einerseits ist r 6= 0, so daß die rechte Seite definiert ist, und andererseits existiert h zumindest lokal, da φ wegen φ˙ 6= 0 lokal streng monoton GM 2 ˙ ist. Diese Hilfsfunktion h erf¨ ullt dann h00 + h = kLk 2 , denn wegen kLk = r φ gilt h0 ˙ ˙ 0 = −kLkh0 φ = −r2 φh h2 r¨ = −kLkh00 φ˙ = −kLk2 h2 h00
r˙ = −
1
Denn in Polarkoordinaten gilt L = x × x˙ = r
∂ ∂ ∂ × r˙ + φ˙ ∂r ∂r ∂φ
und somit ˙ kLk = kx × xk ˙ = rφk
∂ ∂ kk k = rφ˙ · 1 · r = r2 φ˙ ∂r ∂φ
14
.
und somit folgt aus r¨ − rφ˙ 2 = − GM die Gleichung r2 1 GM −kLk2 h2 h00 − kLk2 h4 = −GM h2 ⇔ h00 + h = h kLk2
.
GM Die L¨osung dieser Gleichung lautet h(φ) = kLk 2 + A cos(φ − φ0 ), und man kann durch Drehung in der (x, y)-Ebene OE φ0 = 0 und A ≥ 0 erreichen. Der Abstand zur Zeit t ist also durch
r(t) =
kLk2 /GM 1 + C cos(φ(t)) 2
gegeben mit der Exzentrizit¨at C := AkLk der Bahnkurve. F¨ ur C = 0 ergibt sich eine GM Kreisbahn des K¨orpers um das Zentrum, f¨ ur 0 < C < 1 eine elliptische Bahn, f¨ ur C = 1 eine Parabelbahn und f¨ ur C > 1 eine hyperbolische Bahn. Den Fall 0 < C < 1 nennt man auch das erste Keplersche Gesetz: K¨orper bewegen sich auf Ellipsen um das Zentrum.
15
Betrachten wir abschließend zur Gleichung r¨ − noch die H¨ohenlinien der Energie
kLk2 r3
= − GM bei kLk = 24000 km2 s−1 r2
1 kLk2 GM H(r, r) ˙ = r˙ 2 + , − 2 2r2 r so sieht man, daß f¨ ur H < 0 der K¨orper auf einer elliptischen Bahn um das Zentrum bleibt, w¨ahrend er f¨ ur H ≥ 0 dem Gravitationsfeld entfliehen kann:
Aufgabe: Bestimme die Fluchtgeschwindigkeit einer Rakete, d.h. die minimale Geschwindigkeit, bei der eine von der Erde gestartete Rakete dem Schwerefeld der Erde entkommt.
1.4
Mannigfaltigkeiten
Bereits beim linearisierten ebenen Pendel hatten wir gesehen, daß in der Mechanik auch allgemeinere R¨aume als der Rn , n¨amlich Mannigfaltigkeiten, eine Rolle spielen: Die Bewegungsgleichung f¨ ur das linearisierte ebene Pendel kann man als Differentialgleichung g x˙ = p p˙ = − x 2πl erster Ordnung auf dem R2 auffassen, doch die Erhaltung der Energie H(x, p) = 2 bewirkt, daß sich L¨osungskurven (bis auf (x, p) = (0, 0)) immer nur auf p2 /2 + gx 4πl Ellipsenbahnen H = const bewegen. Ellipsen und spezieller der Einheitskreis S1 im R2 sind Beispiele f¨ ur eindimensionale glatte Mannigfaltigkeiten. Und beim freien Fall in Erdn¨ahe war ein Normalenvektor ν aufgetaucht, der immer auf der Oberfl¨ache der Einheitskugel S2 lag, einer zweidimensionalen glatten Mannigfaltigkeit. Allgemeiner ist jede Teilmenge des Rn , die lokal genauso aussieht wie ein verbogener Rd , d ≤ n, ein Beispiel f¨ ur eine Mannigfaltigkeit, genauer f¨ ur eine Untermannigfaltigkeit des Rn . 16
Abstrakte Mannigfaltigkeiten: Abstrakt kann man Mannigfaltigkeiten folgendermaßen definieren: Definition 1.7 Eine d-dimensionale C k -Mannigfaltigkeit ist eine mit einem (maximalen) C k -Atlas von Karten in den Rd versehene Menge M , deren induzierte Topologie Hausdorffsch und abz¨ahlbar ist.
Um aus einer Menge M eine Mannigfaltigkeit zu machen, identifiziert man also Teilmengen Ui ⊂ M mit offenen Mengen Vi ⊂ Rd u ¨ber Karten genannte Bijektionen xi : Ui → Vi derart, daß jeder Punkt von M in einem Kartengebiet Ui liegt und daß jeder Kartenwechsel xj ◦ x−1 : xi (Ui ∩ Uj ) → xj (Ui ∩ Uj ) eine C k -Abbildung zwischen offenen i 17
Teilmengen des Rd ist. Eine solche Menge von Karten xi nennt man dann einen C k Atlas auf der Menge M und l¨aßt von ihr die Topologie auf M induzieren, bei der alle Kartengebiete Ui ⊂ M offen und alle Karten xi Hom¨oomorphismen sind. Ist diese Topologie Hausdorffsch und abz¨ahlbar, so erg¨anzt man den gew¨ahlten C k -Atlas noch zu einem maximalen C k -Atlas und nennt die mit diesem Atlas versehene Menge M eine C k -Mannigfaltigkeit. C 0 -Mannigfaltigkeiten werden auch topologische Mannigfaltigkeiten genannt, und C ∞ Mannigfaltigkeiten heißen auch glatt. Topologische Mannigfaltigkeiten sind also solche topologischen R¨aume, die lokal so aussehen wie der Rd , w¨ahrend man bei C k Mannigfaltigkeiten, k ≥ 1, dar¨ uberhinaus noch von Differenzierbarkeit sprechen kann: Definition 1.8 Eine Abbildung F : M → N zwischen C k -Mannigfaltigkeiten heißt C k Abbildung, wenn jeder lokale Repres¨antant yj ◦ F ◦ x−1 von F (xi Karte von M und yj i k Karte von N ) eine C -Abbildung ist. Um auch die Ableitung einer solchen Abbildung zu definieren, muß man zun¨achst den Tangentialraum Tm M an einem Punkt m einer C k -Mannigfaltigkeit M , k ≥ 1, einf¨ uhren. Dies kann man kinematisch oder algebraisch tun: Kinematisch besteht der ¨ Tangentialraum Tm M am Punkt m ∈ M aus den Aquivalenzklassen aller Kurven ¨ c(t) : (−, ) → M mit c(0) = m bzgl. der Aquivalenzrelation c1 ∼ c2 genau dann, wenn f¨ ur eine (und dann jede) Karte x bei m die Gleichung dtd (x ◦ c1 )(0) = dtd (x ◦ c2 )(0) ¨ gilt. Die einer Kurve c durch m entsprechende Aquivalenzklasse bezeichnet man dabei mit c(0), ˙ und Tm M wird unabh¨angig von der Wahl der Karte x u ¨ber die Identifikation Tm M 3 c(0) ˙ 7→ dtd (x ◦ c1 )(0) ∈ Rd ein Vektorraum. Algebraisch besteht der Tangentialraum Tm M am Punkt m ∈ M aus den Derivationen der Algebra der C k -Funktionen bei m, d.h. den linearen Funktionalen X mit X(f g) = f (m)X(g) + g(m)X(f ). F¨ ur glatte Mannigfaltigkeiten sind diese beiden Definitionen ∂ ∂ ∂ , wobei ∂c zu einer Kurve c durch m die Derivation ∂c f := a¨quivalent durch c 7→ ∂c d (f ◦ c) (0) bezeichnet und nur von c(0) ˙ abh¨angt. Insbesondere bilden dann zu einer dt Karte x mit x(m) = 0 die Tangentialvektoren ∂x∂ i , xi : t 7→ x−1 (tei ) mit dem i-ten Einheitsvektor des Rd , eine Basis von Tm M . Hat man ersteinmal den Tangentialraum an einem Punkt einer Mannigfaltigkeit definiert, dann f¨allt die Definition der Ableitung leicht: Eine C k -Abbildung F : M → N induziert durch c(0) ˙ 7→ (F ˙◦ c)(0) bzw. durch X 7→ (g 7→ X(g ◦ F )) eine lineare Abbildung Tm F : Tm M → TF (m) N , die Ableitung von F im Punkt m. Dar¨ uberhinaus kann man die Tangentialr¨aume Tm M zu einer C k−1 -Mannigfaltigkeit T M verbinden, ja die Projektion π : T M → M eines Tangentialvektors auf seinen Fußpunkt macht T M sogar zu einem Vektorraumb¨ undel u ¨ber M , und die Ableitung T F : T M → T N wird dann ein Vektorraumb¨ undel-Homomorphismus u ¨ber F .
18
Untermannigfaltigkeiten des Rn : Die Antwort darauf, welche Teilmengen M ⊂ Rn denn in nat¨ urlicher Weise d-dimensionale C k -Mannigfaltigkeiten sind, gibt der folgende Satz: Satz 1.9 F¨ ur eine nichtleere Teilmenge M ⊂ Rn sind ¨aquivalent: 1. Lokal ist M C k -diffeomorph zum Rd . 2. Lokal ist M Urbild eines regul¨aren Wertes einer C k -Funktion vom Rn in den Rn−d . 3. Lokal ist M der Graph einer C k -Funktion vom Rd in den Rn−d . Ist M lokal bei m das Urbild f −1 (ξ), dann ist Tm M ∼ = Kern(Df )(ξ), und ist M lokal ∼ bei m der Graph Graph(g), dann ist Tm M = Bild(Dg(Rd )). Bemerkung 1.10 Jede abstrakte Mannigfaltigkeit l¨aßt sich als Untermannigfaltigkeit in einen h¨oherdimensionalen Rn einbetten, oft hat man aber nur eine abstrakte Mannigfaltigkeit und keine bevorzugte Einbettung in den Rn zur Verf¨ ugung. Dies ist beispielsweise bei projektiven R¨aumen und auch bei den Isometriegruppen von Riemannschen Mannigfaltigkeiten der Fall. Deswegen macht es Sinn, Mannigfaltigkeiten auch ohne eine konkrete Einbettung in den Rn zu studieren. Weitere Informationen u ¨ber Mannigfaltigkeiten findet man im Skript Analysis auf ” Mannigfaltigkeiten“.
1.5
Newtonsche Mechanik auf Mannigfaltigkeiten
Wir wollen nun die Newtonsche Mechanik von Punktteilchen, deren Konfigurationsraum der Rn war, verallgemeinern auf mechanische Systeme, deren Konfigurationsraum eine beliebige Mannigfaltigkeit Q ist. Wie wir schon gesehen haben, basiert die Newtonsche Mechanik haupts¨achlich auf dem Modellierungsaxiom, daß die zeitliche Entwicklung der Konfiguration eines mechanischen Systems durch eine Differentialgleichung zweiter Ordnung beschrieben wird, und hinzu kommen dann noch zus¨atzliche Forderungen wie gewisse Invarianzen oder die Konservativit¨at der Kraft. Differentialgleichungen erster Ordnung auf Mannigfaltigkeiten M sind nun einfach anzugeben: Eine Schnitt X : M → T M des Tangentialb¨ undels π : T M → M heißt Vektorfeld und induziert durch c˙ = X ◦ c eine Differentialgleichung erster Ordnung. Um eine Differentialgleichung zweiter Ordnung auf einer Mannigfaltigkeit Q anzugeben, braucht man nun nat¨ urlich ein Vektorfeld F : T Q → T T Q auf T Q, aber damit jede L¨osungskurve von p˙ = F ◦ p tats¨achlich die Form p = q˙ mit einer Kurve q in Q hat, muß F noch eine zus¨atzliche Eigenschaft haben: Lemma 1.11 Genau dann ist jede Integralkurve des Vektorfeldes F auf T Q kanonischer Lift einer Kurve in Q, wenn T π ◦ F = IdT Q mit der Projektion π : T Q → Q gilt. 19
Beweis: Eine Kurve c in T Q ist kanonischer Lift einer Kurve in Q genau dann, wenn c = π ◦˙ c gilt, da wegen c(t) ∈ T(π◦c)(t) Q die Kurve π ◦ c in Q der einzige Kandidat ist. Daher ist c genau dann ein kanonischer Lift, wenn c = π ◦˙ c = T (π ◦ c) ◦
∂ = T π ◦ c˙ ∂t
gilt. Somit ist jede Integralkurve c von F ein kanonischer Lift, wenn c = T π ◦ F ◦ c gilt, und dies ist aufgrund der Beliebigkeit von c genau bei T π ◦ F = IdT Q der Fall. 2 Erf¨ ullt das Vektorfeld F auf T Q nun die Bedingung T π ◦ F = IdT Q , dann nennt man F ein Vektorfeld zweiter Ordnung auf Q und die assoziierte Gleichung x¨ = F ◦ x˙ f¨ ur eine Kurve x in Q heißt eine Differentialgleichung zweiter Ordnung auf Q. Wir halten als Modellierungsaxiom fest: Definition 1.12 Nach Newton wird ein mechanisches System durch eine Mannigfaltigkeit Q als Konfigurationsraum und eine Differentialgleichung zweiter Ordnung q¨ = F ◦ q˙ als Evolutionsgesetz modelliert. Lokal in Koordinaten x auf Q und den induzierten Koordinaten (x, y) auf T Q hat ein solches Vektorfeld zweiter Ordnung die Form n X i=1
n
yi
X ∂ ∂ + f (x, y) i ∂xi i=1 ∂y i
mit Funktionen fi : Rn × Rn → R, denn wegen T π( ∂x∂ i ) = ∂x∂ i , T π( ∂y∂ i ) = 0, impliziert T π ◦ F = IdT Q , daß f¨ ur einen lokal durch y1 , . . . , yn beschriebenen Vektor X ∈ T Q am lokal durch x1 , . . . , xn beschriebenen Punkt der Wert F (X) als ∂x∂ i -Komponenten gerade die urspr¨ unglichen Koordinaten yi von X haben muß. Insbesondere hat die Gleichung q¨ = F ◦ q˙ lokal die Form x˙ i = yi
y˙ i = fi (x, y) ,
d.h. lokal ist sie wirklich eine Differentialgleichung zweiter Ordnung auf dem Rn : x¨i = fi (x, x). ˙ Wie zuvor bei der Newtonschen Mechanik bleibt die Frage, wie man die (m¨oglicherweise sogar noch von der Zeit abh¨angige) Kraft F w¨ahlen sollte. Die Invarianz unter GalileiTransformationen macht ja nur f¨ ur Q = R3n Sinn, deswegen wollen wir uns darauf konzentrieren zu verstehen, wie eine Kraft aus kinetischer Energie und potentieller Energie entsteht. 20
Sprays: Ein Spray ist ein Vektorfeld F zweiter Ordnung, f¨ ur das die zugeh¨orige Differentialgleichung zweiter Ordnung mit q auch t 7→ q(ct) als Integralkurve hat. Dies ist genau dann der Fall, wenn f¨ ur die Zahl c ∈ R, aufgefasst als Abbildung c : T Q → T Q, X 7→ c · X, die Gleichung F (c · X) = c · T c(F (X)) gilt. In der Tat, ist q eine L¨osung von q¨ = F ◦ q, ˙ dann gelten f¨ ur h : t 7→ q(ct) die ˙ ¨ ¨ Gleichungen h(t) = cq(ct) ˙ und h(t) = T c(c¨ q (ct)), d.h. h = c · T c(F (q(ct))). ˙ Damit also ¨ = F ◦ h˙ = F (cq) h auch h ˙ erf¨ ullt, muß F (c · X) = c · T c(F (X)) f¨ ur alle X ∈ T M gelten. Lokal hat ein Spray dieselbe Form wie jedes Vektorfeld zweiter Ordnung, nur muß nun fi (x, cy) = c2 fi (x, y) gelten, denn in lokalen Koordinaten ist auch T c einfach Multiplikation mit c. Mit anderen Worten ist ein Spray ein Vektorfeld zweiter Ordnung, das quadratisch in q˙ ist, und hier erkennt man schon den Zusammenhang zur kinetischen Energie. Das bekannteste quadratische Objekt“ auf einer Mannigfaltigkeit Q ist mit Sicherheit ” eine Riemannsche Metrik g, d.h. an jedem Punkt q ∈ Q ist gq : Tq Q × Tq Q → R eine positiv-definite symmetrische bilineare Abbildung oder mit anderen Worten ein Skalarprodukt auf dem Tangentialraum. Solch ein g nennt man auch einen positivdefiniten symmetrischen (0, 2)-Tensor auf Q. Es ist nun nicht verwunderlich, daß eine Riemannsche Metrik g auf Q einen Spray auf Q induziert. Zur Konstruktion dieses Sprays verwenden wir nicht die u ¨blichen, von einer Karte P x auf Q induzierten Koordinaten (x, y) auf T Q, sondern statt y verwenden wir pi := j gijP (x)yi , wobei die Funktionen gij ≥ 0 die Koeffizienten der Riemannschen Metrik g = ij gij dxi ⊗ dxj sind. Dies erlaubt einem, mittels der in X quadratischen Funktion E(X) := 12 g(X, X) auf P 1 ullt, zumindest T Q, die kinetische Energie heißt und lokal E(x, p) = 2 ij gij (x)pi pj erf¨ lokal einen Spray durch X ∂E ∂ X ∂E ∂ F = − ∂pi ∂xi ∂xi ∂pi i i zu definieren. Da die Koordinatenwahl aber in nat¨ urlicher Weise von der Metrik g abhing, lassen sich die so in einzelnen Kartengebieten definierten Sprays zu einem globalen Spray auf Q zusammenf¨ ugen, der der Riemannsche Spray heißt. Die L¨osungen der Gleichung q¨ = F ◦ q˙ heißen Geod¨aten, sie modellieren die freie, nur von der kinetischen Energie induzierte zeitliche Evolution der Konfiguration. Die lokale Darstellung des Sprays in Koordinaten zeigt direkt dE(F ) = 0, d.h. die kinetische Energie E ist konstant entlang von Geod¨aten. Beispiel: Die geod¨atische Gleichung auf dem Euklidischen Rn lautet in kartesischen KoordinatenP x¨ = 0, denn der Riemannsche Spray ist wegen gij ≡ δij , d.h. pi = yi und 1 E(x, y) = 2 i yi2 , in kartesischen Koordinaten durch X ∂ X ∂ F = yi i − 0 i ∂x ∂y i i 21
gegeben, die Geod¨atengleichung lautet also x˙ i = yi und y˙ i = 0, d.h. x¨ = 0. Ein nur von der kinetischen Energie getriebenes Teilchen bewegt sich also auf einer Geraden.
Konservative Kr¨ afte: Hat man eine Riemannsche Metrik g auf dem Konfigurationsraum Q zur Verf¨ ugung, dann kann man nicht nur u ¨ber die von der kinetischen Energie induzierte Kraft (den Riemannschen Spray) sprechen, sondern auch u ¨ber die von einer potentiellen Energie induzierte Kraft. Solch eine wird als konservative Kraft bezeichnet. Eine Funktion V : Q → R heißt potentielle Energie, wenn man sie als Erzeugende des Vektorfeldes grad V auf Q interpretiert. Dabei ist grad V durch g(grad V, ·) = dV (·) definiert mit der Ableitung dV der Funktion V . Nun kann man dieses Vektorfeld grad V auf Q mittels der Metrik vertikal liften zu einem Vektorfeld ver(grad V ) auf T Q. Dabei nennt man ein Vektorfeld X auf T Q vertikal, wenn T π ◦ X = 0 gilt. Die Metrik induziert nun ein Splitting T T Q ∼ = T Q × T Q, bei dem T π : T T Q → T Q ein Isomorphismus auf die erste Komponente ist. Somit kann man das Vektorfeld grad V : Q → T Q auf Q durch ver(grad V ) ∼ = (0, grad V ) zu einem Vektorfeld auf T Q vertikal liften. Subtrahiert man dieses Vektorfeld von einem Spray F , dann ist F − ver(grad V ) immer noch ein Vektorfeld zweiter Ordnung, denn T P ◦ (F − ver(grad V )) = T P ◦ F = IdT Q . Ist F der Riemannsche Spray, dann heißt F − ver(grad V ) die von der Summe aus kinetischer Energie und potentieller Energie induzierte Kraft.
22
Kapitel 2 Der starre K¨ orper Der starre K¨orper wird in dieser Vorlesung als das Paradebeispiel herhalten, an dem wir die abstrakten Resultate der Theorie anschaulich darstellen wollen. Ein starrer K¨orper ist ein Festk¨orper im Raum mit der Eigenschaft, daß sich unter Einwirkung einer Kraft der Abstand zwischen zwei Bestandteilen des K¨orpers nicht ¨andert. Ein starrer K¨orper l¨aßt sich also im Gegensatz zu einem elastischen Festk¨orper nicht deformieren, verbiegen oder gar zerbrechen. Wiederum sei angemerkt, daß es in der Realit¨at wohl keine starren K¨orper gibt, aber daß sich n¨ahrungsweise viele Festk¨orper aus harten Materialien wie das Idealbild eines starren K¨orpers verhalten - zumindest bei nur schwachen auf sie einwirkenden Kr¨aften. Mathematisch l¨aßt sich die Starrheit eines Festk¨orpers durch die Annahme modellieren, daß f¨ ur zwei beliebige Punkte x, y ∈ R3 des K¨orpers im Euklidischen Raum R3 der Abstand kx − ykEuklid konstant in der Zeit bleibt. Daher kann man die Konfiguration eines starren K¨orpers durch die Gruppe der Euklidischen Isometrien des R3 beschreiben. Diese Gruppe ist die Lie-Gruppe SE(3) = SO(3) o R3 : Man fixiere ein orthonormales Dreibein an einem fixierten Punkt des K¨orpers, dann gibt der Vektor ∈ R3 an, wohin sich der fixierte Punkt im Lauf der Zeit bewegt hat, w¨ahrend das Element ∈ SO(3) angibt, wie sich das Dreibein im Lauf der Zeit gedreht hat. Um nun Mechanik auf der Konfigurationsmannigfaltigkeit SE(3) betreiben zu k¨onnen, m¨ ussen wir uns zun¨achst einmal mit Lie-Gruppen besch¨aftigen, bevor wir uns konkret mit dem starren K¨orper auseinandersetzen.
2.1
Lie-Gruppen
Lie-Gruppen sind Mengen, die sowohl die Struktur einer Gruppe als auch die einer Mannigfaltigkeit tragen, und bei denen diese beiden Strukturen kompatibel sind. Genauer besteht eine Lie-Gruppe aus einer Menge G mit einer assoziativen Multiplikation · : G × G → G, neutralem Element e ∈ G und Inversen, sowie einem C ∞ -Atlas auf G, der die Multiplikation · und die Inversion −1 zu glatten Abbildungen macht.
23
Dieser abstrakten Definition steht die konkrete Definition gegen¨ uber, daß eine LieGruppe eine abgeschlossene Untergruppe G der Gruppe GL(n) der invertierbaren linea¨ ren Abbildungen auf dem Rn ist. Ein Beweis der Aquivalenz dieser beiden Definitionen geht allerdings u ¨ber den Rahmen dieser Vorlesung hinaus. Da Lie-Gruppen sowohl Gruppen als auch glatte Mannigfaltigkeiten sind, ist nat¨ urlich das Zusammenspiel dieser beiden Strukturen interessant. F¨ ur die Mechanik am wichtigsten ist der folgende Sachverhalt: Ein Vektorfeld X : G → T G auf einer Lie-Gruppe G nennt man links¨aquivariant, wenn X ◦ g = T g ◦ X gilt, wobei man ein Element g ∈ G als Linksmultiplikationsabbildung g : h 7→ gh zu interpretieren hat. Man kann nun die links¨aquivarianten Vektorfelder mit den Elementen des Tangentialraums Te G im neutralen Element identifizieren. Denn da X(g) = X(ge) = T g(Xe ) gilt, ist einerseits jedes links¨aquivariante Vektorfeld X durch seinen Wert Xe ∈ Te G eindeutig festgelegt, und umgekehrt definiert diese Gleichung zu jedem vorgegebenem Xe auch ein links¨aquivariantes Vektorfeld. Bezeichnet Φt : G → G den von einem Vektorfeld X erzeugten lokalen Fluß, dann ist X genau dann links¨aquivariant, wenn Φt ◦ g = g ◦ Φt f¨ ur alle g gilt, also der lokale Fluß links¨aquivariant ist. Denn wegen t t ˙ ˙ gΦ h = T g Φ h = T g X(Φt h) = X(gΦt h) l¨osen sowohl Φt (gh) als auch gΦt (h) die zu X geh¨orige Differentialgleichung erster Ordnung auf G zum Anfangswert gh, m¨ ussen also identisch sein. Nun erinnere man sich an die algebraisch durch [X, Y ] := XY − Y X definierte LieKlammer zweier Vektorfelder X, Y (die man bei dieser Definition als Derivationen auffaßt), die man auch als Lie-Ableitung von Y in Richtung X bezeichnet und mit LX Y symbolisiert. Kinematisch kann man die Lie-Klammer mit dem Fluß Φt zu X und dem ∗ ∗ Pullback (Φt ) Y := T Φ−t ◦ Y ◦ Φt durch LX Y := dtd (Φt ) Y |t=0 definieren, und die kinematische Definition zeigt direkt, daß die Lie-Klammer zweier links¨aquivarianter Vektorfelder selbst wieder links¨aquivariant ist: T g ◦ [X, Y ] = T g ◦
∗ ∗ d d d Φt Y |t=0 = T g ◦ Φt Y |t=0 = dt dt dt
Φt
∗
Y ◦ g |t=0 = [X, Y ] ◦ g
Also bilden die links¨aquivarianten Vektorfelder mit der Lie-Klammer [·, ·] eine LieAlgebra, d.h. einen reellen Vektorraum zusammen mit einer bilinearen Multiplikation X, Y 7→ [X, Y ], die schiefsymmetrisch [X, Y ] = −[Y, X] ist und der Jacobi-Identit¨at ¨ [X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y ]] = 0 gen¨ ugt. Uber die Identifikation der linksinvarianten Vektorfelden mit den Tangentialvektoren im neutralen Element wird daher auch Te G zu einer Lie-Algebra, die man u uberhinaus tri¨blicherweise mit g bezeichnet. Dar¨ vialisieren die Linkstranslationen wegen Tg G = T g(Te G) sogar das Tangentialb¨ undel, ∼ man hat also G × g = T G u ¨ber (g, Xe ) 7→ T g(Xe ). Analoges gilt f¨ ur rechts¨aquivariante Vektorfelder und Rechtstranslationen.
24
Beispiel: Die Gruppe der Translationen des Rn : Mit der Addition + und seiner u urlich eine ¨blichen, durch die Karte IdRn gegebenen Mannigfaltigkeitsstruktur ist Rn nat¨ n Lie-Gruppe. Bei Interpretation eines Vektorfeldes X auf R als Abbildung X : Rn → Rn sind dabei die invarianten Vektorfelder gerade die konstanten Vektorfelder X ≡ v mit einem festen Richtungsvektor v. Daher ist die Lie-Algebra g der mit der trivialen Klammer [X, Y ] = 0 als Multiplikation versehene Rn . Beispiel: Die Gruppe SO(n) der Drehungen des Euklidischen Rn : Die Gruppe O(n) besteht aus den linearen Abbildungen A : Rn → Rn , die die Euklidische Norm oder ¨aquivalenterweise das Euklidische Skalarprodukt erhalten. Als Untergruppe der GL(n) kann man sie durch O(n) := {A ∈ GL(n)|AT A = En , det(A) = 1} -dimensionale Untermannigfaltigkeit der ofangegeben. Tats¨achlich ist O(n) eine n(n−1) 2 fenen Teilmenge GL(n) ⊂ L(n). Denn O(n) ist das Urbild von En unter der glatten Abbildung f (A) := AT A von L(n) in den Vektorraum der symmetrischen Matrizen S(n) ∼ = Rn(n+1)/2 , und En ist ein regul¨arer Wert dieser Abbildung. Tats¨achlich, AT A ist immer symmetrisch, und die Ableitung Df (A)H = AT H + H T A ist surjektiv f¨ ur alle 1 T T T A mit A A = En , da die Gleichung A H + H A = S die L¨osung H = 2 AS hat. Jedes Element A ∈ O(n) erf¨ ullt automatisch det(A) = ±1. Also hat O(n) zumindest zwei Zusammenhangskomponenten, denn det bildet als stetige Abbildung zusammenh¨angende Mengen auf zusammenh¨angende Mengen ab, {±1} ⊂ R ist aber unzusammenh¨angend. Tats¨achlich sind es sogar genau zwei Zusammenhangskomponenten, von denen SO(n) := {A ∈ O(n)| det(A) = 1} die Gruppe der Drehungen genannt wird. Als Zusammenhangskomponente ist somit auch SO(n) eine n(n−1) -dimensionale Man2 nigfaltigkeit. Man beachte, daß SO(n) dar¨ uberhinaus f¨ ur n > 2 eine nicht kommutative Gruppe ist. Genauer wollen wir uns noch den Tangentialraum der SO(n) im neutralen Element En und somit die Lie-Algebra so(n) anschauen. Wegen TEn SO(n) ∼ = Kern(Df (En )) kann man diese mit den schiefsymmetrischen Matrizen H T = −H identifizieren. Speziell f¨ ur n = 3 kann man die Wirkung jeder schiefsymmetrischen Matrix 0 −ω3 ω2 0 −ω1 H = ω3 −ω2 ω1 0 auf dem R3 mit der Kreuzproduktbildung x 7→ ω × x identifizieren, man hat also einen linearen Isomorphismus so(3) ∼ = R3 . Zus¨atzlich geht unter diesem Isomorphismus die 0 durch den Kommutator [H, H ] := HH 0 − H 0 H gegebene Lie-Klammer auf so(3) in das Vektorprodukt ω × ω 0 der zugeh¨origen Vektoren u ¨ber: (HH 0 − H 0 H)(x) = ω × (ω 0 × x) − ω 0 × (ω × x) = (ω × ω 0 ) × x Die angegebene Identifikation ist also sogar ein Isomorphismus der Lie-Algebren (so(3), [·, ·]) und (R3 , ×).
25
Beispiel: Die Gruppe E(n) der Isometrien des Euklidischen Rn : Die LieGruppe E(n) ist das semidirekte Produkt O(n) o Rn , also die Produktmenge O(n) × Rn mit der Produkt-Mannigfaltigkeitsstruktur und der Multiplikation (A, x)(B, y) := (AB, Ay + x). Verwendet man statt O(n) nur die Drehungen SO(n), dann symbolisiert man die entstehende Gruppe mit SE(n) und nennt sie die spezielle Euklidische Gruppe. Insbesondere kann man f¨ ur n = 3 die Lie-Algebra se(3) und den mit der Lie-Klammer 0 0 0 [(ω, v), (ω , v )] := (ω × ω , ω × v 0 + v) versehenen R3 × R3 identifizieren.
2.2
Der freie starre K¨ orper
Ein starrer K¨orper heißt frei, wenn auf ihn keine ¨außeren Kr¨afte einwirken. Die Bewegung wird also nur von der kinetischen Energie bestimmt. Wir wollen die Frage beantworten, wie sich ein freier starrer K¨orper bewegt. Newtonsche Beschreibung: Um die kinetische Energie zu spezifizieren, m¨ ussen wir in der Newtonschen Mechanik eine Riemannsche Metrik auf SE(3) w¨ahlen. Diese sollte invariant unter der Linksmultiplikation von SE(3) auf sich selbst sein, denn Drehung oder Translation unseres Koordinatensystems sollte nichts an dem physikalischen Bewegungsgesetz ¨andern (Galilei-Invarianz). Oder mit anderen Worten: Die Wahl des Punk¨ tes des K¨orpers sowie des Drei-Beins an diesem Punkt, bzgl. der wir die Anderung der Konfiguration durch ein Element von SE(3) beschreiben, sollte nicht das Bewegungsgesetz beeinflussen. F¨ ur die Wahl einer invarianten Riemannschen Metrik reicht es aber bereits, ein Skalarprodukt auf se(3) = so(3) × R3 vorzugeben. Dieses Skalarprodukt wollen wir im folgenden in Abh¨angigkeit von der Massenverteilung im starren K¨orper ermitteln. Wir betrachten zwei Koordinatensysteme des Euklidischen Raumes: Das Koordinatensystem x sei durch einen fixierten Punkt des K¨orpers und ein fixiertes Dreibein an diesem Punkt zur Zeit t = 0 gegeben und bewege sich nicht mit dem K¨orper mit, das Koordinatensystem X dagegen werde mit dem K¨orper so mitbewegt, daß der K¨orper in diesen Koordinaten ruht. Dann ist die Bewegung des starren K¨orpers gerade durch die Kurve g : R → SE(3) mit X = g(t)x gegeben. Mit Großbuchstaben wollen wir im folgenden immer Gr¨oßen bzgl. der mitbewegten Koordinaten X bezeichnen, w¨ahrend kleine Buchstaben Gr¨oßen bzgl. der fixierten r¨aumlichen Koordinaten x symbolisieren. Aus der Gleichung X = g(t)x folgt X˙ = g(t)x ˙ = (g(t) ˙ ◦ g −1 ) X, und da g(t) ˙ ◦ g −1 ∈ 3 3 ∼ ˙ se(3) = R × R gilt, kann man X = Ω(t) × X + V (t) mit Vektoren Ω, V ∈ R3 schreiben und Ω als Winkelgeschwindigkeit sowie V als lineare Geschwindigkeit in mitbewegten Koordinaten interpretieren. Sei ρ(x) die Massendichte des starren K¨orpers im festen Koordinatensystem zur Zeit t = 0, dann ist die gewichtete Summe Z Z 1 1 2 −1 ˙ kXk ρ(g(t) X) dX = kΩ × X + V k2 ρ(g(t)−1 X) dX 2 2 26
die kinetische Energie des K¨orpers in mitbewegten Koordinaten. Um die kinetische Energie in r¨aumlichen Koordinaten auszudr¨ ucken, definiere man bei g = (A, b) die Winkelgeschwindigkeit ω und die lineare Geschwindigkeit v in r¨aumlichen Koordinaten durch Aω = Ω und Av = V + Ω × b. Dann gilt wegen A ∈ O(n) kΩ × X + V k = kΩ × (Ax + b) + V k = kΩ × Ax + V + Ω × bk = kAω × Ax + Avk = kA(ω × x + v)k = kω × x + vk . Also ist die kinetische Energie in r¨aumlichen Koordinaten Z Z 1 1 2 −1 ˙ kXk ρ(g(t) X) dx = kω × x + vk2 ρ(x) dx = 2 2 Z Z Z 1 1 2 kω × xk ρ(x) dx + < ω × x, v > ρ(x) dx + kvk2 ρ(x) dx . 2 2 Wenn wir das feste Koordinatensystem x so fixieren, daß der Schwerpunkt des starren R K¨orpers im Ursprung liegt, d.h. xρ(x) dx = 0, dann folgt aus < ω×x, v >=< v×ω, x > das Verschwinden des mittleren Terms und wir erhalten als kinetische Energie Z Z 1 1 1 1 2 kω × xk ρ(x) dx + kvk2 ρ(x) dx = < Iω, ω > + M kvk2 2 2 2 2 R mit der Gesamtmasse M := ρ(x)dx K¨orpers und dem Tr¨agheitstensor I = Ijk , der R des 2 auf der Diagonalen den Wert Iii R= (xj +x2k )ρ(x) dx, {i, j, k} = {1, 2, 3}, und außerhalb der Diagonalen den Wert Iij = xi xj ρ(x) dx hat. Auf dem Translationsanteil R3 der SE(3) ist das gesuchte Skalarprodukt also einfach das mit der Gesamtmasse skalierte Euklidische Skalarprodukt, und daher erhalten wir: Lemma 2.1 Bei einem freien starren K¨orper bewegt sich der Schwerpunkt geradlinig und gleichf¨ormig. Beweis: Die Bewegungsgleichung des Translationsanteils lautet x¨ = 0.
2
Also kann man in ein Inertialsystem u ¨bergehen, in dem der Schwerpunkt des K¨orpers im Koordinatenursprung ruht, und dies reduziert die Konfigurationsmannigfaltigkeit von SE(3) zu SO(3). Die Metrik auf dem Rotationsanteil so(3) wird dann vom Tr¨agheitstensor I (engl.: inertia tensor) - einer positiv definiten symmetrischen Matrix - durch < Iω, ω > induziert. Die Geod¨atengleichung bzgl. der invarianten Riemannschen Metrik auf SO(3), die durch den Tr¨agheitstensor I auf se(3) induziert wird, ist dann gerade die Newtonsche Bewegungsgleichung zweiter Ordnung. Allerdings ist die Geod¨atengleichung als DGL erster Ordnung auf der sechsdimensionalen Mannigfaltigkeit T SO(3) nat¨ urlich nicht so leicht anzugeben. Denn um sie anzugeben, muß man ja zun¨achst SO(3) parametrisieren - z.B. durch die Eulerschen Winkel - und danach in den durch die Parametrisierung gegebenen Koordinaten die kinetische Energie sowie die Bewegungsgleichungen aufschreiben. Dies ist sehr langwierig, und im Endeffekt gewinnt man Bewegungsgleichungen, die auf den ersten Blick zu lang und kompliziert aussehen, um mit ihrer Hilfe etwas u ¨ber das mechanische System aussagen zu k¨onnen (siehe [MarsdenRatiu, 15.7]). 27
Dies ist der Nachteil der Newtonschen Herangehensweise an die Mechanik, man ber¨ ucksichtigt Erhaltungsgr¨oßen nicht bereits bei der Gewinnung der Bewegungsgleichungen, und dadurch erscheinen diese Gleichungen komplizierter, als sie eigentlich sind. Hamiltonsche Beschreibung: Die Hamiltonsche Beschreibung des starren K¨orpers erlaubt dagegen, Erhaltungsgr¨oßen von vornherein mit einzubeziehen und die komplizierten Geod¨atengleichungen durch die Lie-Poisson-Reduktion zu vereinfachen, siehe Kapitel 5. Wir wollen in diesem Abschnitt zeigen, wie die Lie-Poisson-Reduktion im Fall des starren K¨orpers funktioniert und wie man die reduzierten Gleichungen gewinnen und l¨osen kann. Zun¨achst bemerke man, daß aufgrund der Symmetrie des Tr¨agheitstensors I eine Basis existiert, in der I = diag(I1 , I2 , I3 ) mit bereits angeordneten I1 ≥ I2 ≥ I3 gilt. Im folgenden seien die Koordinaten bzgl. dieser Basis gew¨ahlt. Die Lagrange-Funktion f¨ ur die kinetische Energie auf so(3) ist ja L(ω) = 21 < Iω, ω >, wie wir schon in der Newtonschen Beschreibung gesehen hatten. Die Legendre-Transformation liefert die zugeh¨orige Hamilton-Funktion H(π) = 21 (π12 /I1 + π22 /I2 + π32 /I3 ), denn die Ableitung von L ist gerade < Iω, · >, und identifiziert man diese Linearform mit π ∈ R3 u ¨ber das Standard-Skalarprodukt, so gilt eben π = Iω, weswegen H zu 1 H(π) = 2 < π, I −1 π > wird. Die Lie-Poisson-Reduktion reduziert dann die Hamiltonschen Gleichungen auf T ∗ SO(3) bzgl. der invarianten Fortsetzung von H zu Hamiltonschen Gleichungen auf der PoissonMannigfaltigkeit so(3)∗ ∼ = R3 mit der Poisson-Klammer {F, F 0 }(π) = −π · (∇F × ∇F 0 ) bzgl. H. Die Hamiltonschen DGL f¨ ur eine Observable F lauten daher F˙ (π) = −π · (∇F (π) × ∇H(π)) und somit wegen ∇H(π) = I −1 π gerade F˙ (π) = π · (I −1 π × ∇F (π)) = ∇F (π) · (π × I −1 π) . Also sind die Hamiltonschen DGL gerade π˙ = π × I −1 π, oder in Koordinaten π˙ 1 =
I2 − I3 I3 − I1 I1 − I2 π2 π3 , π˙ 2 = π1 π3 , π˙ 3 = π1 π2 I2 I3 I1 I3 I1 I2
.
Dieses System von Differentialgleichungen auf R3 ∼ = so(3)∗ nennt man die Eulerschen DGL f¨ ur den starren K¨orper. Mittels der Eulerschen DGL kann man nun die Bewegung eines freien starren K¨orpers diskutieren: Wie schon zuvor bewegen wir das Koordinatensystem geradlinig und gleichf¨ormig mit dem Schwerpunkt des starren K¨orpers mit, so daß nur noch die Rotationsbewegung des starren K¨orpers um den Schwerpunkt ermittelt werden muß. Die Eulerschen DGL besagen nun, daß diese Rotationsbewegung - egal wie der starre K¨orper geformt ist - nur durch die drei Tr¨agheitsmomente I1 , I2 , I3 bestimmt wird. Ein starrer K¨orper bewegt sich also genauso wie ein Ellipsoid mit den Tr¨agheitsmomenten I1 , I2 , I3 , und solch ein Ellipsoid wird das Tr¨agheitsellipsoid des starren K¨orpers genannt. Wir wollen die Eulerschen DGL nun f¨ ur die verschiedenen auftretenden F¨alle l¨osen. F¨ ur die richtige Interpretation der Ergebnisse ist der Hinweis wichtig, daß die Richtung der 28
Winkelgeschwindigkeit ω = I −1 π gerade die Drehachse angibt, um die sich der starre K¨orper dreht. • I1 = I2 = I3 : In diesem Fall ist π˙ = 0, also sind sowohl der Drehimpuls π als auch die Winkelgeschwindigkeit ω konstant. Daher rotiert der starre K¨orper mit konstanter Geschwindigkeit um eine feste Achse, wie eine symmetrische Kugel mit gleichm¨aßiger Gewichtverteilung im Weltall, die einmal in Anfangsrotation versetzt wurde. • I1 = I2 > I3 : Hier sind zwei Achsen des Tr¨agheitsellipsoids gleichlang, aber eine Achse ist k¨ urzer. Dadurch hat das Tr¨agheitsellipsoid immerhin noch eine Symmetrieachse (unter Rotationen um diese Achse bleibt das Ellipsoid invariant). Aus den Eulerschen DGL folgt π˙ 3 = 0 und somit die Konstanz von π3 bzw. ω3 , also 3 Π3 ist in unseren Koordinaten die z-Achse die Symmetrie-Achse. Mit a := − II22−I I3 erh¨alt man wegen I1 = I2 f¨ ur die restlichen zwei Komponenten aus den Eulerschen DGL π˙ 1 + aπ2 = 0 , π˙ 2 − aπ1 = 0 . Die L¨osung ist somit π1 (t) = π1 (0) cos(at) − π2 (0) sin(at) , π2 (t) = π2 (0) cos(at) + π1 (0) sin(at) und besagt, daß die Symmetrieachse (d.h. die z-Achse) bzgl. des K¨orpers mit Winkelgeschwindigkeit a rotiert. Die Bewegung des starren K¨orpers entspricht daher dem Rollen eines kleinen Kegels in einem gr¨oßeren Kegel. • I1 > I2 > I3 : Mit der Erhaltung der Kasimirfunktion C = kπk2 = a2 b2 (siehe π2 π2 π2 Kapitel 5) und der Erhaltung der Energie 2H = I11 + I22 + I33 = ab2 erlauben es die Konstanten a = kπk2 /2H und b = 2H/kπk, π1 und π3 durch π2 auszudr¨ ucken: π12 =
I3 (I1 − I2 ) 2 I1 (I2 − I3 ) 2 (α − π22 ) , π32 = (β − π22 ) I2 (I1 − I3 ) I2 (I1 − I3 )
2
2
−a)b 3 )b mit α2 = aI2I(a−I , β 2 = aI2I(I11−I . Ist a = I3 oder a = I1 , dann gilt π2 = 0 = π3 2 −I3 2 oder π1 = 0 = π2 , und in diesem Fall liegt eine gleichf¨ormige Rotation um π mit der k¨orpereigenen Geschwindigkeit b vor. Sonst ist a ∈ (I3 , I1 ), und die vorige Rechnung reduziert die Eulerschen DGL zu einer Gleichung
(π˙ 2 )2 =
2 (I2 − I3 )(I1 − I2 ) 2 2 2 α − π β − π 2 2 I1 I22 I3
Trennung der Variablen liefert als L¨osung Z
π2 (t)
π2 (0)
du q
(I2 −I3 )(I1 −I2 ) I1 I22 I3
(α2
29
=t , −
π22 ) (β 2
−
π22 )
.
und dies zeigt, daß π2 und somit auch π1 , π3 elliptische Funktionen der Zeit sind (da elliptische Funktionen gerade die Umkehrfunktionen von solchen nicht explizit l¨osbaren Integralen sind). Um eine qualitative Vorstellung von der L¨osung zu gewinnen, nehmen wir noch einen anderen Standpunkt ein: Die Erhaltung der Energie H und des Drehimpulses C impliziert, daß sich die L¨osung auf dem Schnitt zweier Niveaufl¨achen von H und C bewegt, d.h. auf dem Schnitt eines Ellipsoids und einer Sph¨are. Bei konstanter Energie H ergibt sich somit in Abh¨angigkeit von C das folgende Verhalten: – C < 2HI3 bzw. C > 2HI1 : F¨ ur diese Werte ist der Schnitt leer, solche Bewegungen eines starren K¨orpers gibt es also nicht. – C = 2HI3 bzw. C = 2HI1 : Der Schnitt besteht nur aus zwei Punkten, dies sind station¨are Punkte der Dynamik. – 2HI3 < C < 2HI2 bzw. 2HI2 < C < 2HI3 : Der Schnitt besteht aus zwei disjunkten Kreisen, auf denen die Dynamik die station¨aren L¨osungen uml¨auft. – C = 2HI2 : Der Schnitt besteht aus der Vereinigung zweier Kreise, die sich in zwei Punkten ber¨ uhren. Diese Ber¨ uhrpunkte sind station¨are Punkte der Dynamik. Der zweite und vierte Punkt zeigen, daß die Rotationen um die drei Hauptachsen die einzig m¨oglichen mit fester Drehachse sind. Die Rotation um die Achse mittlerer L¨ange ist allerdings instabil, bei einer kleinen St¨orung entfernt sich aufgrund des dritten Punktes die L¨osung weit von der Rotation um die mittlere Drehachse.
30
Kapitel 3 Lagrangesche Mechanik In der Lagrangeschen Mechanik gewinnt man die Bewegungsgleichungen durch Variation eines Energie-Funktionals, das von einer Lagrange-Funktion induziert wird. Die auf diese Weise entstehenden Euler-Lagrange Gleichungen stimmen f¨ ur von kinetischer und potentieller Energie bestimmte mechanische Systeme mit den Newtonschen Bewegungsgleichungen u ¨berein. Im Gegensatz zur Newtonschen Mechanik erlaubt die Lagrangesche Mechanik aber eine bessere Handhabung von Symmetrien und Erhaltungsgr¨oßen.
3.1
Die Euler-Lagrange Gleichungen
Die Mannigfaltigkeit Q modelliere den Konfigurationsraum eines mechanischen Systems. Dann modelliert man in der Lagrangeschen Mechanik die zeitliche Entwicklung der Konfiguration durch eine Kurve q(t) in Q, die das Energie-Funktional I(q) := R L(q(t))dt ˙ minimisiert. Hierbei heißt die Funktion L : T Q → R Lagrange-Funktion des mechanischen Systems und modelliert in gewisser Weise die Energie. Mit anderen Worten besagt die Lagrangesche Mechanik, daß ein mechanisches System zu jedem Zeitpunkt versucht, seine Energie zu minimieren. Nun muß an einem Minimum von I nat¨ urlich die Ableitung dI verschwinden. Dabei beachte man allerdings, daß I nicht auf einem endlichdimensionalen, sondern einem unendlichdimensionalen Raum definiert ist, dem Raum aller Kurven q(t) in die Mannigfaltigkeit Q. Diesen Raum kann man rigoros zu einer unendlichdimensionalen Mannigfaltigkeit machen, deren Tangentialraum im Punkt q(t) der Raum aller Kurven X : R → T Q mit π ◦ X(t) = q(t) ist, wobei π : T Q → Q die Projektion von Tangentialvektoren auf ihren Fußpunkt bezeichnet 1 . Sei q ein Minimum von I. Bezeichne qλ eine Schar von Kurven mit q0 = q und Ableitung X, d.h. λ 7→ qλ ist eine Kurve durch q in den Raum aller Kurven in Q, die den 1
Da wir uns bisher auf endlichdimensionale Mannigfaltigkeiten beschr¨ankt haben, m¨ uste man hier etwas weiter ausholen, um die folgende Rechnung rigoros zu machen. Darauf verzichten wir und nehmen das folgende stattdessen als symbolisch hin.
31
Tangentialvektor X in q repr¨asentiert. Dann gilt d d I(qλ ) = 0 = dI(q)X = dλ dλ
Z L(q˙λ (t))dt .
In Koordinaten (x, y) auf T QPist die rechte Seite nach Vertauschung von Differentiation und Integration mit X(t) = i Xi (t) ∂x∂ i gerade Z X X ∂L d ∂L X (t)dt . X (t) + i i i dt i ∂x ∂y i i Partiellle Integration im zweiten Term liefert daher (zumindest bei Variation nur u ¨ber Kurven mit festem Anfangs- und Endpunkt [a, b], in denen dann X verschwindet) Z X Z X X d ∂L d ∂L ∂L ∂L 0= Xi (t) − Xi (t)dt = − Xi (t)dt . ∂xi dt ∂y i ∂xi dt ∂y i i i i Da diese Gleichung f¨ ur alle Richtungen X gelten muß, folgt in einem Minimum q die G¨ ultigkeit der Euler-Lagrange-Gleichungen d ∂L ∂L − =0 . i ∂x dt ∂y i H¨aufig bezeichnet man die Koordinaten (x, y) von T Q hierbei mit (q, q), ˙ dann nehmen ∂L d ∂L die Euler-Lagrange-Gleichungen die Form dt ∂ q˙i = ∂qi an. Man beachte, daß wir bei den Integrationsgrenzen etwas ungenau waren: Variiert man u ¨ber Kurven φ mit festem Anfangs- und Endpunkt, so muß X an diesen Punkten verschwinden und es ergeben sich die obigen Gleichungen. Variiert man aber bzgl. Kurven mit freiem Anfangs- und Endpunkt, so tritt bei der partiellen Integration noch ein Summand ∂∂L X auf, der an den Integrationsgrenzen auszuwerten ist. q˙i i Dar¨ uberhinaus sind nicht nur Minima von I, sondern alle station¨aren Punkte L¨osungen der Euler-Lagrange Gleichungen, also haben wir statt Minima nur station¨are Punkte von I gefunden. Man beachte auch, daß unser Vorgehen unabh¨angig von der Wahl der Koordinaten auf Q war, obwohl wir die Euler-Lagrange Gleichungen nur in Koordinaten formuliert haben, denn welche Koordinaten q wir in den Gleichungen verwenden, bleibt uns u ¨berlassen. Beispiel: Kinetische und Potentielle Energie: Ist die Lagrange-Funktion L = E − V ◦ π die Differenz aus kinetischer Energie E(X) := 12 g(X, X) und potentieller Energie V ◦ π : T Q → Q → R, wobei g eine Riemannsche Metrik auf Q ist, dann ist die Euler-Lagrange-Gleichung ¨aquivalent zur Newtonschen Gleichung. In der Tat, f¨ ur L(q, q) ˙ = 21 kqk ˙ 2 − V (q) gilt in orthonormalen Koordinaten ∂L = q˙i und q˙i ∂L ∂V = − ∂qi , also q¨ = − grad V (q). Somit verallgemeinert die Lagrangesche Mechanik die ∂qi Newtonsche Mechanik von durch kinetische und potentielle Energie generierten Kr¨aften.
32
Beispiel: Kugel im rotierenden Reifen: Wir betrachten ein mechanisches System aus einem Reifen an der Erdoberfl¨ache und einer Kugel, die in diesem Reifen (ohne Reibung) rollt. Wir nehmen an, daß in kartesischen Koordinaten (x, y, z) des R3 der Reifen aufrecht steht, den Ursprung 0 als Mittelpunkt sowie den Radius R hat und um die z-Achse mit konstanter Winkelgeschwindigkeit ω rotiert. Unser Ziel ist es, die Bewegungsgleichung f¨ ur die in dem Reifen rollende Kugel zu finden. Die Position der Kugel kann man in Polarkoordinaten durch x = R cos(φ) sin(θ) , y = R sin(φ) sin(θ) , z = −R cos(θ) beschreiben, wobei φ den Winkel der Drehung des Reifens um die z-Achse angibt und θ die Auslenkung der Kugel beschreibt Bei θ = 0 liegt die Kugel am tiefstem Punkt im Reifen, bei θ = π u ¨berschl¨agt sie sich gerade im h¨ochsten Punkt des Reifens. Mit φ˙ = ω ergibt sich als Geschwindigkeit x˙ = R θ˙ cos(φ) cos(θ) − ω sin(φ) sin(θ) , y˙ = R θ˙ sin(φ) cos(θ) + ω cos(φ) sin(θ) , z˙ = Rθ˙ sin(θ)
und somit als kinetische Energie bzgl. der Euklidischen Metrik 1 1 E = m x˙ 2 + y˙ 2 + z˙ 2 = mR2 θ˙2 + ω 2 sin2 (θ) 2 2
.
Die Gravitationskraft wird zum Teil durch den Reifen aufgefangen, der restliche auf die Bewegung der Kugel wirkende Anteil wird durch die potentielle Energie V = mgz = −mgR cos(θ) induziert. Die Lagrange-Funktion lautet somit 1 L = E − V = mR2 θ˙2 + ω 2 sin2 (θ) + mgR cos(θ) , 2 und als Euler-Lagrange-Gleichung
d ∂L dt ∂ θ˙
=
∂L ∂θ
ergibt sich
mR2 θ¨ = mR2 ω 2 sin(θ) cos(θ) − mgR sin(θ) . Man beachte, daß dies f¨ ur ω = 0 gerade die Gleichung des ebenen Pendels ist, was ja auch nicht erstaunlich ist. Studieren wir noch die Gleichgewichte des Systems, die ja Rω 2 sin(θ) cos(θ) = g sin(θ) erf¨ ullen m¨ ussen. urlich sind θ1,2 = 0, π wegen sin(θ) =p0 solche Gleichgewichte, p Nat¨ und bei ω < g/R sind dies auch die einzigen. F¨ ur ω ≥ g/R kommen noch zwei Gleichgewichte θ3,4 dazu, n¨amlich die L¨osungen von cos(θ) = g/Rω 2 ≤ 1. F¨ ur ω nahe p bei g/R liegen diese Gleichgewichte nahe bei 0, dort findet eine sogenannte HeugabelBifurkation statt. Da in einer Gleichung θ¨ = f (θ) ein Gleichgewicht θ0 bei f 0 (θ0 ) < 0 stabil und bei f 0 (θ0 ) > 0 instabil ist, folgt wegen f 0 (0) = ω 2 − mgR die Stabilit¨at von θ1 = 0 bei 33
p kleinen Winkelgeschwindigkeiten ω < g/R. Bei der kritischen Winkeleschwindigkeit p g/R verliert dagegen θ1 = 0 seine Stabilit¨at und gibt diese wegen f 0 (θ3,4 ) =
g 2 g g g − sin arccos <0 − ω 2 sin2 arccos Rω Rω 2 R Rω 2
zumindest kurzfristig an die neu entstandenen Gleichgewichte weiter.
3.2
Das Noether-Theorem
Ein Diffeomorphismus Φ : Q → Q heißt Invariante der Lagrange-Funktion L : T Q → R, wenn L ◦ T Φ = L gilt. Eine Funktion I : T Q → R nennt man Erhaltungsgr¨oße oder erstes Integral der Bewegungsgleichungen, wenn f¨ ur jede L¨osung q(t) der Bewegungsgleichungen der Wert I(q(t)) ˙ konstant in t ist. Der folgende Satz wurde von Emmy Noether entdeckt: Satz 3.1 Zu jeder einparametrigen Schar Φs , s ∈ (−, ), von Invarianten einer LagrangeFunktion L existiert eine Erhaltungsgr¨oße I der zu L geh¨origen Euler-Lagrange Gleichungen. Lokal in Koordinaten ist I gegeben durch I=
∂L d s Φ |s=0 ∂ q˙ ds
.
Beweis: Man leite die Gleichung L(Φ˙s q(t)) = (L ◦ T Φs ) (q(t)) ˙ = L(q(t)) ˙ an der Stelle s = 0 nach s ab. Dies ergibt ∂L d s ∂L d d s Φ q|s=0 + Φ q|s=0 = 0 . ∂q ds ∂ q˙ dt ds Mit der Produktregel folgt ∂L d s d (Φ q)|s=0 + ∂q ds dt
∂L d s Φ q|s=0 ∂ q˙ ds
Wegen der Euler-Lagrange Gleichung definierten I.
∂L ∂q
−
−
d ∂L dt ∂ q˙
34
d ∂L dt ∂ q˙
d s Φ q|s=0 = 0 . ds
= 0 gilt daher
d I dt
= 0 mit dem oben 2
Kapitel 4 Hamiltonsche Mechanik In der Hamiltonschen Mechanik modelliert man nicht mehr den Konfigurationsraum Q, sondern direkt den Zustandsraum eines mechanischen Systems durch eine Mannigfaltigkeit M , die zus¨atzlich mit einer symplektischen Form versehen ist. W¨ahrend in der Lagrangeschen Mechanik die Bewegungsgleichung durch eine Lagrange-Funktion L : T Q → R induziert wird, u ¨bernimmt diese Rolle in der Hamiltonschen Mechanik die Hamiltonsche Energie H : M → R, die die Hamiltonsche Differentialgleichung induziert. Speziell ist jedes Kotangentialb¨ undel T ∗ Q eine solche symplektische Mannigfaltigkeit M , und die Lagrangesche Mechanik auf T Q ist bei hyperregul¨arer Lagrange-Funktion ¨aquivalent zur Hamiltonschen Mechanik auf T ∗ Q mit einer hyperregul¨aren HamiltonFunktion. (Ko-)Tangentialb¨ undel sind in gewisser Weise einfache symplektische Mannigfaltigkeiten, da man eine globale Aufteilung in Konfigurations- und Impulskoordinaten hat. Auf allgemeinen symplektischen Mannigfaltigkeiten hat man solch eine Aufteilung zwar nicht mehr global, aber nach dem Satz von Darboux immerhin noch lokal.
4.1
Symplektische Mannigfaltigkeiten
Sei M eine Mannigfaltigkeit. Definition 4.1 Eine 2-Form ω auf M heißt symplektisch, wenn ω nicht-degeneriert und geschlossen ist. Genauer ist eine 2-Form ω auf M nichts anderes als an jedem Punkt m ∈ M eine bilineare und schiefsymmetrische Abbildung ωm : Tm M ×Tm M → R. Solch ein ω heißt nicht-degeneriert, wenn aus ω(X, Y ) = 0 f¨ ur alle Y bereits X = 0 folgt, und geschlossen, wenn mit dem Ableitungsoperator d auf Formen dω = 0 gilt. Betrachten wir erste einfache Beispiele auf Vektorr¨aumen: Beispiel: F¨ ur einen Banachraum V definiert ω((X, α), (Y, β)) = β(X) − α(Y ) eine symplektische Bilinearform auf V × V ∗ . Denn ist der obige Ausdruck gleich Null f¨ ur alle (Y, β), dann muß sowohl α als auch (nach dem Satz von Hahn-Banach) X schon Null sein, und fasst man ω als 2-Form auf V × V ∗ auf, dann gilt dω = 0 aufgrund der Konstanz der Koeffizienten. 35
Beispiel: Auf dem R2n ist mit einem Skalarprodukt < ·, · > die Abbildung ω((X1 , X2 ), (Y1 , Y2 )) :=< X2 , Y1 > − < X1 , Y2 > eine symplektische Form. Denn ω hat konstante Koeffizienten und erf¨ ullt daher dω = 0. Dar¨ uberhinaus ist ω nicht-degeneriert, denn gilt < X2 , Y1 > − < X1 , Y2 >= 0 f¨ ur alle Y1 , Y2 , dann auch X1 = 0 = X2 . Man bemerke, daß die symplektische Form aus dem vorigen Beispiel identisch mit dieser symplektischen Form ω ist, wenn man V = Rn mit dem Dualraum V ∗ u ¨ber X 7→< X, · > identifiziert. Desweiteren bemerke man, daß die bilineare Abbildung ω durch (X1 , X2 ), (Y1 , Y2 ) 7→< J(X1 , X2 ), (Y1 , Y2 ) >Euklid,R2n 0 1 aufgefasst werden kann. als schiefsymmetrische Matrix J := −1 0 Beispiel: F¨ ur einen komplexen Vektorraum V mit hermitschem Skalarprodukt definiert ω(X, Y ) = =(< X, Y >) eine symplektische Form. Die Schiefsymmetrie sieht man aus ω(Y, X) = =(< Y, X >) = =(< X, Y >) = −=(< X, Y >) = −ω(X, Y ), die NichtDegeneriertheit und Geschlossenheit sind trivial. W¨ahrend die vorigen Beispiele immer konstante symplektische Formen auf Vektorr¨aumen waren, liefern die n¨achsten Beispiele symplektische Formen auf echten Mannigfaltigkeiten. Beispiel: Auf jedem Kotangentialb¨ undel M := T Q∗ einer Konfigurationsmannigfaltigkeit Q ist ω := −dθ eine symplektische Form, wobei die 1-Form θ auf M durch θ(Xξ ) := ξ(T π(Xξ )) auf einen Vektor Xξ ∈ Tξ (T ∗ Q) = Tξ M am Punkt ξ ∈ T ∗ Q wirkt und π : T Q∗ → Q die Projektion auf den Fußpunkt bezeichnet. In der Tat, wegen d2 = 0 ist ω geschlossen, und ω ist auch nichtdegeneriert. Denn lokal in Koordinaten (ξ, X) ∈ (Rn )∗ × Rn ∼ = T ∗ Q gilt gerade θ(X) = ξ(X) und daher hat ω 0 0 lokal die Form ω((ξ, X), (ξ , X )) = ξ(X 0 ) − ξ 0 (X). Diese ist aber unter der Identifikation (Rn )∗ ∼ ¨bliche = Rn mittels des Euklidischen Skalarproduktes die gerade diskutierte u 2n symplektische Form auf dem R . Beispiel: Die Menge der Geraden durch 0 in einem Hilbertraum H kann man zu einer Mannigfaltigkeit PH machen, den man den projektiven Hilbertraum nennt. Dies geschieht dadurch, daß man jeden Punkt 0 6 x ∈ H auf die Gerade π(x) durch 0 und x abbildet und die von dieser Projektion π : H → PH induzierte Mannigfaltigkeitsstruktur auf PH betrachtet. Insbesondere liefert diese Konstruktion f¨ ur komplexe Hilbertr¨aume die komplex-projektiven R¨aume CPH. Das komplexe Skalarprodukt < ·, · >, das auf H die symplektische Form ω = =(< ·, · >) induziert, induziert eine Hermitesche Metrik h auf CPH, die im Punkt Cx ∈ CPH bei kxk = 1 und f¨ ur X, Y ∈ (Cx)⊥ durch h(TCx π(X), TCx π(Y )) :=< X, Y > 36
gegeben ist und Fubini-Study-Metrik genannt wird. Und nat¨ urlich bleibt wegen < ·, · >= ∗ π h der Imagin¨arteil eine symplektische Form, die CPH zu einer symplektischen Mannigfaltigkeit macht.
4.2
Die Hamiltonschen Differentialgleichungen
Sei H : M → R eine Funktion, die man im folgenden als Gesamtenergie interpretiert und Hamilton-Funktion nennt. Dann ist dH eine 1-Form, aufgrund der NichtDegeneriertheit von ω gibt es also ein eindeutiges Vektorfeld XH auf M mit ω(XH , ·) = dH(·). Dieses nennt man das Hamiltonsche Vektorfeld zu H. Die Hamiltonsche Mechanik modelliert die Bewegungsgleichungen gerade durch die zu XH geh¨orige Differentialgleichung erster Ordnung m ˙ = XH ◦ m f¨ ur den Zustand m. Diese Differentialgleichung nennt man Hamiltonsch, sie sagt in der Hamiltonschen Mechanik die zeitliche Entwicklung des Zustands eines mechanischen Systems voraus. Beispiel: Im R2n mit der u ¨blichen symplektischen Form und bei Koordinaten q, p lauten die Hamiltonschen DGL q˙ =
∂H (q, p) ∂p
p˙ = −
∂H (q, p) . ∂q
¨ Die Aquivalenz dieser Gleichungen mit den Newtonschen Bewegungsgleichungen bei kinetischer und potentieller Energie haben wir schon bewiesen. Lemma 4.2 H und ω sind konstant entlang von XH , d.h. die Energie und die symplektische Form werden entlang des Flusses erhalten. Beweis: Es gilt LXH H = dH(XH ) = ω(XH , XH ) = 0, da ω eine 2-Form ist. Desweiteren gilt LXH ω = iXH dω + diXH ω = 0 + d(ω(XH , ·)) = ddH = 0 aufgrund der Geschlossenheit von ω und der Definition von XH .
2
Man nennt einen Diffeomorphismus symplektisch, wenn er ω erh¨alt. Somit ist der von der Hamiltonschen Differentialgleichung erzeugte Fluß Φt : M → M symplektisch. Allgemeiner wird jeder symplektische Fluß von einer DGL m ˙ = X(m) generiert mit einem Vektorfeld X, f¨ ur das ω(X, ·) eine geschlossene 1-Form ist. Da jede geschlossene 1-Form zumindest lokal die Form dH mit einer Funktion H hat, werden symplektische Fl¨ usse also lokal von Hamiltonschen Differentialgleichungen generiert. Nicht auf jeder Mannigfaltigkeit M gibt es eine symplektische Form. Genauer muß M notwendigerweise eine gerade Dimension haben, und selbst dann h¨angt die Existenz 37
einer symplektischen Form noch von gewissen topologischen Eigenschaften ab. Wir wollen im folgenden durch den Satz von Darboux zeigen, wie eine symplektische Form lokal aussieht. Satz 4.3 Zu jedem Punkt m ∈ M einer symplektischen Mannigfaltigkeit M gibt es Koordinaten, in denen ω lokal konstant ist. Beweis: OE nehmen wir an, daß M ein Vektorraum ist und m der Nullpunkt. Sei ω 0 die im Nullpunkt gegebene und dann auf den ganzen Vektorraum konstant fortgesetzte 2-Form. Definiere in Abh¨angigkeit von einem Parameter t die 2-Form ω(t) := ω + t(ω 0 − ω). Da ω nicht-ausgeartet ist und ω 0 gerade die Form ω im Nullpunkt ist, existiert eine Umgebung des Nullpunktes, in der ω(t) nicht-ausgeartet ist f¨ ur alle t ∈ [0, 1], OE eine Kugel. Aufgrund von dω = 0 und der Lokalit¨at gibt es dann eine 1-Form α mit ω0 − ω = dα (jede geschlossene Form ist lokal exakt), und durch ω(t)(X(t), ·) = −α wird ein Vektorfeld X(t) induziert. Sei Φt der Fluss zu diesem Vektorfeld. K¨onnten wir (Φt )∗ ω(t) = ω f¨ ur alle t ∈ [0, 1] 1 zeigen, dann h¨atten wir bei t = 1 einen Diffeomorphismus f := Φ und somit Koordinaten gefunden, in denen ω wegen f ∗ ω 0 = (Φ1 )∗ ω(1) = ω gerade die konstante 2-Form ω 0 w¨are, und die Aussage des Satzes w¨are bewiesen. Nun liefert die Differentiation von (Φt )∗ ω(t) nach t aber d d t ∗ t ∗ (Φ ) ω(t) = (Φ ) LX(t) ω(t) + ω(t) = dt dt t ∗ t ∗ (Φ ) diX(t) ω(t) + (ω0 − ω) = (Φ ) (d(−α) + (ω0 − ω)) = 0 . Daher ist (Φt )∗ ω(t) = (Φ0 )∗ ω(0) = ω f¨ ur alle t ∈ [0, 1], und dies war genau zu zeigen. 2 Da jede konstante symplektische Form gerade zur kanonischen Form auf dem Rn ¨aquivalent ist, folgt somit: Korollar 4.4 Lokal gibt P es Koordinaten (qi , pi ) auf M , in denen die symplektische Form ω durch ω = i dqi ∧ dpi gegeben ist. Solche Koordinaten werden kanonisch genannt, und insbesondere ist die Dimension dim(M ) einer symplektischen Mannigfaltigkeit automatisch gerade.
4.3
Die Liouvillesche Volumenform
Ist M eine 2n-dimensionale symplektische Mannigfaltigkeit, dann heißt die 2n-Form (−1)n(n−1)/2 ω ∧ ··· ∧ ω n! Liouvillesche Volumenform auf M . Tats¨achlich ist d Vol nicht nur eine 2n-Form, sondern wirklich eine Volumenform auf M , denn in kanonischen Koordinaten gilt d Vol :=
d Vol = dq1 ∧ · · · ∧ dqn ∧ dq1 ∧ · · · ∧ dqn 38
,
und diese lokale Darstellung zeigt, daß d Vol nirgends verschwindet. Insbesondere ist eine symplektische Mannigfaltigkeit M also nicht nur von gerader Dimension, sondern auch orientierbar, denn gerade auf orientierbaren Mannigfaltigkeiten existieren Volumenformen. Dies zeigt, daß es neben der Geradzahligkeit der Dimension auch noch topologische Restriktionen f¨ ur die Existenz einer symplektischen Form auf einer Mannigfaltigkeit gibt. Eine weitere wichtige Erkenntnis ist, daß symplektische Fl¨ usse wie der durch eine Hamiltonsche Differentialgleichung generierte Fluß die Liouvillesche Volumenform erhalten. Denn wenn (Φt )∗ ω = ω gilt, dann auch (Φt )∗ d Vol = d Vol. R Insbesondere ¨andert sich also das Volumen U d Vol einer Teilmenge U ⊂ M unter einem symplektischen Fluß nicht: Vol (Φt (U )) = Vol(U ). Als Konsequenz daraus ergibt sich, daß symplektische Fl¨ usse keine asymptotisch stabilen Ruhelagen oder periodische Orbits haben k¨onnen. Denn w¨ urde eine solche flußinvariante Menge alle Punkte aus einer Umgebung U anziehen, dann w¨ urde limt→∞ Vol (Φt (U )) = 0 gelten, da Ruhelagen bzw. periodische Orbits kompakt sind und eine Dimension < 2n besitzen. Dies ist aber ein Widerspruch zu Vol (Φt (U )) = Vol(U ) > 0. Dies ist ein Hinweis darauf, daß der Fluß zu einer Hamiltonsche Differentialgleichung u ¨blicherweise ein komplexes oder gar chaotisches Verhalten zeigt.
4.4
Hamiltonsche vs. Lagrangesche Mechanik auf Kotangentialbu ¨ ndeln
Abschließend wollen wir uns noch fragen, inwieweit Hamiltonsche und Lagrangesche Mechanik gleichwertig sind. Sei Q die Konfigurationsmannigfaltigkeit eines mechanischen Systems und T Q das Tangentialb¨ undel. Die Dynamik des mechanischen Systems werde durch die LagrangeFunktion L : T Q → R modelliert. Da sich die Hamiltonsche Mechanik - wie wir im vorigen gesehen haben - in nat¨ urlicher Weise auf Kotangentialb¨ undeln T ∗ Q formulieren l¨aßt, suchen wir zun¨achst einen Isomorphismus T Q → T ∗ Q. Solch einen Isomorphismus liefert unter gewissen Umst¨anden die Faserableitung von L. Diese ist definiert durch FL(v)w :=
d (s 7→ L(v + sw)) |s=0 ds
f¨ ur v, w ∈ Tq Q. Offensichtlich ist FL(v) ∈ Tq∗ Q die Ableitung von L am Punkt v in Richtungen w aus der Faser Tq Q (und nicht in Richtungen aus Q in der Zerlegung TQ ∼ ˙ = Q × Tq Q nahe q), deswege der Name Faserableitung. Lokal in Koordinaten (q, q) von T Q gilt daher ∂L FL(q, q) ˙ = (q, , ∂ q˙ und somit gilt in Koordinaten (q, p) von T ∗ Q gerade p = 39
∂L . ∂ q˙
In der Hamiltonschen Mechanik auf T ∗ Q hatten wir ja in nat¨ urlicher Weise eine sym∗ plektische Form ω auf T Q definiert, und nun haben wir mit der Faserableitung eine Abbildung FL : T Q → T ∗ Q zur Verf¨ ugung, mittels der wir die Hamiltonsche Mechanik auf T ∗ Q mit der Lagrangeschen Mechanik auf T Q vergleichen k¨onnen: Wir nennen eine Lagrange-Funktion regul¨ar, wenn FL ein lokaler Diffeomorphismus ist oder ¨aquivalenterweise die geschlossene 2-Form ωL := (FL)∗ ω nichtdegeneriert und somit eine symplektische Form auf T Q ist. Ist FL sogar ein globaler Diffeomorphismus zwischen T Q und T ∗ Q, dann heißt L hyperregul¨ar. Definiere die Energie E(v) := FL(v)v − L(v) = pv − L(v) als Funktion auf T Q. Ist L regul¨ar, dann induziert die Energie als Hamilton-Funktion durch ωL (XE , ·) = dE eine Hamiltonsche DGL v˙ = XE (v) auf T Q. Tats¨achlich ist diese DGL erster Ordnung auf T Q eine DGL zweiter Ordnung auf Q und zu den Euler-Lagrange-Gleichungen ¨aquivalent. Ist L sogar hyperregul¨ar, dann induziert E durch H := E ◦ FL eine Hamilton-Funktion auf T ∗ Q, und die u ¨ber ω(XH , ·) = dH induzierten Hamiltonschen DGL p˙ = XH (p) auf ∗ T Q sind wegen (FL)∗ XH = XE ¨aquivalent zu den von E induzierten Hamiltonschen DGL v˙ = XE (v) auf T Q. ¨ Die Aquivalenz der Hamiltonschen und Euler-Lagrange Gleichungen kann man leicht wie folgt sehen: Ist die in Koordinaten durch T Q 3 (q, q) ˙ 7→ (q, p) ∈ T ∗ Q mit p = ∂L ∂ q˙ gegebene Faserableitung FL ein lokaler Diffeomorphismus, dann ist wegen q˙ = q(q, ˙ p) die Hamilton-Funktion auf T ∗ Q lokal durch H(q, p) = pq−L(q, ˙ q) ˙ gegeben. Als Ableitungen von H ergeben sich ∂H ∂ q˙ ∂L ∂L ∂ q˙ ∂L =p − − =− ∂q ∂q ∂q ∂ q˙ ∂q ∂q und ∂H ∂ q˙ ∂L ∂ q˙ = q˙ + p − = q˙ . ∂p ∂p ∂ q˙ ∂p Somit folgen aus den Euler-Lagrange-Gleichungen ∂L d ∂L = ∂q dt ∂ q˙
(= p) ˙
die Hamiltonschen Gleichungen q˙ =
∂H ∂p
p˙ = −
∂H ∂q
,
bzgl. der Form ω = dq ∧ dp, und umgekehrt folgen ebenso aus den Hamiltonschen Differentialgleichungen die Euler-Lagrange-Gleichungen. Wir halten fest: Satz 4.5 Im hyperregul¨aren Fall sind die Lagrange Mechanik auf T Q und die Hamiltonsche Mechanik auf T ∗ Q gleichwertig.
40
Kapitel 5 Poissonsche Mechanik Poisson- und Dirac-Mannigfaltigkeiten verallgemeinern symplektische Mannigfaltigkeiten. W¨ahrend Poisson-Mannigfaltigkeiten bei der Reduktion von mechanischen Systemen mit Erhaltungsgr¨oßen entstehen, modellieren Dirac-Mannigfaltigkeiten dar¨ uberhinaus sogar noch mechanische Systeme mit holonomen und nichtholonomen Zwangsbedingungen und erlauben eine Modellierung des Energie-Austausches zwischen gekoppelten mechanischen Systemen. Wir behandeln hier nur Poisson-Mannigfaltigkeiten.
5.1
Poisson-Mannigfaltigkeiten
Bevor wir uns allgemein mit Poisson-Mannigfaltigkeiten besch¨aftigen, wollen wir uns zun¨achst einmal anschauen, welche Eigenschaften die Poisson-Klammer auf einer symplektischen Mannigfaltigkeit besitzt. Danach studieren wir allgemeine Poisson-Mannigfaltigkeiten, und abschließend diskutieren wir die Reduktion von Hamiltonschen Gleichungen bei Erhaltungsgr¨oßen. Die Poisson-Klammer auf einer symplektischen Mannigfaltigkeit: Auf jeder symplektischen Mannigfaltigkeit kann man durch {F, G} := ω(XF , XG } = dF (XG ) ein Produkt“ von Funktionen F, G ∈ C ∞ (M, R) definieren. Dieses Produkt“ wird die ” ” Poisson-Klammer von F und G genannt. Als Verallgemeinerung kann man auch nur auf einer offenen Menge U ⊂ M definierte Funktionen F, G betrachten, f¨ ur die {F, G} dann selbst auch nur auf U definiert ist. Satz 5.1 Ein lokaler Diffeomorphismus Φ : M → N symplektischer Mannigfaltigkeiten (M, ωM ), (N, ωN ) ist genau dann symplektisch, d.h. erf¨ ullt Φ∗ ωN = ωM , wenn er die Poisson-Klammern erh¨alt, d.h. {F ◦ Φ, G ◦ Φ}M = {F, G}N ◦ Φ gilt f¨ ur alle (m¨oglicherweise nur auf einer offenen Menge U definierten) C ∞ -Funktionen F, G : M → R. Beweis: Wir zeigen, daß ein lokaler Diffeomorphismus genau dann symplektisch ist, wenn Φ∗ XH = XH◦Φ f¨ ur alle H gilt. Denn wegen {F, G} = dF (XG ) = LXG F und der 41
Kettenregel Φ∗ (LX F ) = LΦ∗ X (Φ∗ F ) gilt dann Φ∗ {F, G}N = LΦ∗ XG (Φ∗ F ) = LXΦ∗ G (Φ∗ F ) = {Φ∗ F, Φ∗ G}M
,
was zu zeigen war. Die Gleichung Φ∗ XH = XH◦Φ ist nur eine Abk¨ urzung f¨ ur TΦ(m) Φ−1 · XH (Φ(m)) = XH◦Φ (m) bei beliebigem m, also f¨ ur XH (Φ(m)) = Tm Φ · XH◦Φ (m). Dies ist wegen der Nichtdegeneriertheit jeder symplektischen Form und der Bijektivit¨at von Tm Φ ¨aquivalent zu ωN (XH (Φ(m)), Tm Φ · Y ) = ωN (Tm Φ · XH◦Φ (m), Tm Φ · Y ) f¨ ur alle Y ∈ Tm M . Nun ist Φ symplektisch genau dann, wenn der letzte Term f¨ ur jedes Y ∈ Tm M gerade ωM (XH◦Φ (m), Y ) ist. Die Gleichung ωN (XH (Φ(m)), Tm Φ · Y ) = ωM (XH◦Φ (m), Y ) ist dann ¨aquivalent zur wahren Aussage dH(Φ(m))(Tm Φ · Y ) = d(H ◦ Φ)(m) · Y (Kettenregel). 2 Korollar 5.2 Die Poisson-Klammer auf einer symplektischen Mannigfaltigkeit M ist eine Lie-Klammer auf C ∞ (M, R) und zus¨atzlich in jeder Komponente auch eine Derivation. Beweis: Offensichtlich ist {·, ·} bilinear und schiefsymmetrisch, nur noch die JacobiIdentit¨at {{F, G}, H} + {{G, H}, F } + {{H, F }, G} = 0 ist zu beweisen. Dazu bemerke man, daß XH {F, G} = {XH F, G} + {F, XH G} gilt. Denn der Fluß Φt zu XH besteht ja aus symplektischen Abbildungen und erf¨ ullt daher {F, G} ◦ Φt = {F ◦Φt , G◦Φt }. Ableiten nach t an der Stelle t = 0 liefert auf der linken Seite XH {F, G}. F¨ ur die Berechnung der rechten Seite bemerke man dtd XF ◦Φt |t=0 = XXH F , denn ω(
d d d XF ◦Φt |t=0 , ·) = ω(XF ◦Φt |t=0 , ·) = d(F ◦ Φt )|t=0 = d(XH F ) = ω(XXH F , ·) , dt dt dt
und daher d d {F ◦ Φt , G ◦ Φt }|t=0 = ω(XF ◦Φt , XG◦Φt ) = dt dt ω(XXH F , XG ) + ω(XF , XXH G ) = {XH F, G} + {F, XH G} . Die Jacobi-Identit¨at ergibt sich damit aus {F, G} = XG (F ), denn {{F, G}, H} = XH ({F, G}) = {XH F, G} + {F, XH G} = {{F, H}, G} + {F, {G, H}} .
Die Derivationseigenschaft folgt dar¨ uberhinaus ganz einfach aus {F G, H} = XH (F G) = F XH (G) + F XH (G) = F {G, H} + G{F, H}. 2 42
Korollar 5.3 Die Menge der Hamiltonschen Vektorfelder ist eine Unter-Lie-Algebra der Lie-Algebra aller Vektorfelder mit dem Kommutator als Lie-Klammer, denn es gilt [XF , XG ] = −X{F,G} . Beweis: Aufgrund der Jacobi-Identit¨at gilt [XF , XG ]H = XF XG H − XG XF H = XF {H, G} − XG {H, F } = {{H, G}, F } − {{H, F }, G} = −{H, {F, G}} = −X{F,G} H . 2 Hamiltonsche Mechanik auf Poisson-Mannigfaltigkeiten: Die Ergebnisse des vorigen Abschnitts zeigen, daß die Struktur einer symplektischen Mannigfaltigkeit M bereits eindeutig durch die Poisson-Klammern auf M bestimmt ist. Deswegen ist die folgende Definition eine sinnvolle Verallgemeinerung. Definition 5.4 Eine Mannigfaltigkeit M mit einer Lie-Klammer {·, ·} auf C ∞ (M, R), die in jeder Komponente eine Derivation ist, heißt eine Poisson-Mannigfaltigkeit, und {·, ·} nennt man die Poisson-Klammer auf M . Beispiel: Jede Mannigfaltigkeit ist mit der trivialen Poisson-Klammer {F, G} := 0 eine Poisson-Mannigfaltigkeit, und aufgrund des vorigen Abschnitts ist jede symplektische Mannigfaltigkeit (M, ω) mit {F, G} := ω(XF , XG ) eine Poisson-Mannigfaltigkeit. Auf Poisson-Mannigfaltigkeiten induziert jede Funktion H durch XH G := {G, H} (das Vektorfeld XH wird als Derivation angesehen) ein Vektorfeld, das das Hamiltonsche Vektorfeld zu H genannt wird. Man bemerke, daß dies eine Verallgemeinerung der Definition Hamiltonscher Vektorfelder auf symplektischen Mannigfaltigkeiten ist, denn dort gilt {G, H} = ω(XG , XH ) = dG(XH ) = LXH G = XH G . Die Hamiltonschen DGL auf Poisson-Mannigfaltigkeiten lauten nun F˙ = {F, H} . ¨ Diese Gleichung beschreibt die Anderung einer Observablen F ∈ C ∞ (M, R) entlang des Flusses Φt zum Hamiltonschen Vektorfeld XH , und ist eine Abk¨ urzung f¨ ur d (F ◦ Φt ) = {F ◦ Φt , H} = {F, H} ◦ Φt dt
.
Bei der letzten Umformung wurde die Energie-Erhaltung benutzt, die ganz einfach aus H˙ = {H, H} = 0 folgt. Allgemeiner sieht man sofort: Korollar 5.5 F ist genau dann eine Erhaltungsgr¨oße des von XH erzeugten Flusses, wenn {F, H} = 0 gilt. 43
Auf Poisson-Mannigfaltigkeiten kann man also Erhaltungsgr¨oßen besonders einfach handhaben. Funktionen F , die f¨ ur alle Hamilton-Funkionen H Erhaltungsgr¨oßen sind, d.h. {F, H} = 0 gilt f¨ ur alle H, werden dabei Casimir-Funktionen genannt. Bevor wir die einfache Handhabung von Erhaltungsgr¨oßen auf Poisson-Mannigfaltigkeiten systematisch durch das Studium von Symmetrien ausnutzen, sei noch erw¨ahnt, daß Korollar 5.3 nat¨ urlich auch auf Poisson-Mannigfaltigkeiten gilt, und daß Hamiltonsche Fl¨ usse analog zu Satz 5.1 ebenso die Poisson-Klammern erhalten. Beispiel: Identifizieren wir so(3)∗ u ¨ber das Skalarprodukt mit R3 und verwenden auf R3 das Vektorprodukt × als Lieklammer, so ist {F, G}(Π) := −Π · (∇F (Π) × ∇G(Π)) eine Poisson-Klammer. Tats¨achlich, offensichtlich ist die Klammer bilinear und schiefsymmetrisch, erf¨ ullt wegen ∇(F G) = F ∇G + G∇F die Derivationseigenschaft, und die Jacobi-Identit¨at gilt, da × die Jacobi-Identit¨at erf¨ ullt und ∇{F, G}(Π) = −(∇F (Π) × ∇G(Π)) − Π · ∇2 F (Π) × ∇G(Π) − Π · ∇F (Π) × ∇2 G(Π) gilt. Man bemerke, daß diese Poisson-Klammer nicht von einer symplektischen Struktur induziert wird (ungerade Dimension) und eng mit dem starren K¨orper verbunden ist. Dabei modelliert Π den Drehimpuls, und dessen Betrag wird f¨ ur jede Hamilton-Funktion erhalten. Tats¨achlich, F := kΠk2 /2 ist eine Casimir-Funktion, denn ∇F = Π gilt und daraus folgt {F, H} = −Π · (Π × ∇H) = −∇H(Π × Π) = 0 Auch jede Funktion der Form Π 7→ f (kΠk2 /2) mit einem f ∈ C ∞ (R, R) ist eine Casimir-Funktion, wie die Kettenregel zeigt.
5.2
Symmetrie und Reduktion
Impuls-Abbildungen: Der Satz 3.1 von Noether in der Lagrangeschen Mechanik garantiert zu jeder Ein-Parameter-Schar von Symmetrien des Konfigurationsraumes Q die Existenz einer Erhaltungsgr¨oße und umgekehrt. Hat man also ein n-dimensionale Lie-Gruppe G ⊂ Diff(Q), unter der die Lagrange-Funktion invariant ist, so erh¨alt man aus dem Satz von Noether n Erhaltungsgr¨oßen, und dies auch bereits dann, wenn die Symmetrien nur lokal beim neutralen Element Id ∈ G definiert sind. Wir wollen im folgenden den Satz von Noether im Rahmen der Hamiltonschen Mechanik auf Poisson-Mannigfaltigkeiten formulieren. Dort sind Symmetrien nicht mehr nur Diffeomorphismen der Poisson-Mannigfaltigkeit, sondern sie m¨ ussen zus¨atzlich auch 44
noch die Poisson-Klammer erhalten. Wie beim Satz von Noether in der Lagrangeschen Mechanik reicht es aber f¨ ur die Existenz von Erhaltungsgr¨oßen bereits, alles nur nahe des neutralen Elements von G zu betrachten. Deswegen geben wir uns im folgenden auf einer Poisson-Mannigfaltigkeit M statt einer Poisson-Aktion einer Gruppe G eine infinitesimale Poisson-Aktion einer Lie-Algebra g auf M vor, d.h. eine lineare Abbildung ξ 7→ ξM von Elementen ξ der Lie-Algebra g auf Vektorfelder ξM auf M mit der Eigenschaft, daß ξM ({F, G}) = {ξM (F ), G}+{F, ξM (G)} gilt. Diese Eigenschaft entspricht auf Gruppenebene gerade der Erhaltung der PoissonKlammern und somit einer Poisson-Aktion. Im symplektischen Fall ist die Bedingung an ξM ¨aquivalent zur Erhaltung LξM ω = 0 der symplektischen Form durch jedes ξM , wie wir schon zuvor gesehen haben. Die Bedingung ξM ({F, G}) = {ξM (F ), G} + {F, ξM (G)} an ξM , die im symplektischen Fall ja gerade besagt, daß ξM lokal Hamiltonsch ist, verst¨arken wir nun zu der Forderung, sie m¨oge sogar global Hamiltonsch sein. Dann gibt es eine lineare Abbildung J : g → C ∞ (M, R) mit XJ(ξ) = ξM , und zu dieser kann man die Impuls-Abbildung J : M → g∗ durch J(m)(ξ) := J(ξ)(m) definieren. Zu einer infinitesimalen Poisson-Aktion ist solch ein J aber nat¨ urlich nicht eindeutig festgelegt, denn man kann einfach CasimirFunktionen zu J dazuaddieren. Satz 5.6 Zu einer infinitesimalen Poisson-Aktion einer Lie-Algebra g auf der PoissonMannigfaltigkeit M sei J : M → g∗ eine Impulsabbildung, und H sei eine unter der infinitesimalen Poisson-Aktion invariante Hamilton-Funktion auf M , d.h. ξM (H) = 0 gilt f¨ ur alle ξ. Dann ist J eine Erhaltungsgr¨oße des durch (M, {·, ·}, H) modellierten mechanischen Systems, d.h. J ◦ Φt = J gilt f¨ ur den Hamiltonschen Fluß Φt zu H. Beweis: Aufgrund von ξM (H) = 0 gilt {J(ξ), H} = 0 f¨ ur alle ξ, daher ist jede der Funktionen J(ξ) eine Erhaltungsgr¨oße f¨ ur den Hamiltonschen Fluß zu H, und somit auch die Funktion J. 2 In dem besonderen Fall, daß die Abbildung J : g → C ∞ (M, R) nicht nur linear ist, sondern sogar die Lie-Klammern erh¨alt, d.h. J([ξ, ξ 0 ]) = {J(ξ), J(ξ 0 )} erf¨ ullt, bekommt die Impulsabbildung J noch einen speziellen Namen, man nennt sie infinitesimal ¨aquivari¨ ant. Bei nicht vorhandener Aquivarianz kann man eine zugeh¨orige Kohomologieklasse definieren und deren nichtverschwinden als eine charakteristische Gr¨oße des modellierten mechanischen Systems ansehen, z.B. bei Modellierung eines nichtrelativistischen freien quantenmechanischen Teilchens als Masse, siehe [MarsdenRatiu][Beispiel 12.4.5]. Poisson-Reduktion: Sei M eine Poisson-Mannigfaltigkeit, auf der eine Poisson-Aktion G ⊂ Diff Poisson (M ) einer Lie-Gruppe G gegeben ist. Genauer heißt dies, daß jedem Element g der Lie-Gruppe G eine die Poisson-Klammern erhaltende glatte Abbildung g : M → M zugeordnet ist, und zwar so, daß em = m f¨ ur das neutrale Element e ∈ G sowie (gh)m = g(hm) gilt und auch die Auswertungs-Abbildung G × M → M , (g, m) 7→ gm, glatt ist. Wir wollen nun M reduzieren, indem wir die Orbits Gm zu Punkten zusammenziehen, und betrachten daher die Menge M/G aller Orbits Gm von G in M , den sogenannten 45
Orbitraum. Unter gewissen Umst¨anden wird M/G dann wieder in nat¨ urlicher Weise eine Mannigfaltigkeit: Die Aktion einer Gruppe G auf M nennt man frei, wenn Gm = {Id} f¨ ur jeden Stabilisator Gm := {g ∈ G|gm = m} gilt, und eigentlich, wenn f¨ ur konvergente Folgen mn und gn mn in M die Folge gn in G automatisch eine konvergente Teilfolge enth¨alt. Satz 5.7 Operiert G frei und eigentlich auf M , so kann man den Orbitraum M/G eindeutig so zu einer glatten Mannigfaltigkeit machen, daß die Projektion π : M → M/G, m 7→ Gm, eine glatte Submersion ist. Beweis: siehe [AbrahamMarsdenRatiu][4.2.23] . Angemerkt sei, daß die Projektion π auch f¨ ur nicht-freie und nicht-eigentliche Aktionen immer eine sogenannte C ∞ -Struktur auf der Menge M/G induziert, diese muß aber i.a. nicht eine Mannigfaltigkeit aus M/G machen. Ist im Endlichdimensionalen die Operation von G zwar nicht frei, aber wenigstens noch eigentlich, so kann man immer noch Tubenumgebungen um Orbits herum finden und zumindest lokal die Dynamik in den zugeh¨origen Scheiben beschreiben, auch wenn M/G global keine Mannigfaltigkeit ist. 2 Nach dieser technischen Vorbemerkung wollen wir uns nun fragen, ob die PoissonStruktur auf M auch eine Poisson-Struktur auf M/G induziert. Dies ist tats¨achlich der Fall: Satz 5.8 Es gibt eine eindeutige Poisson-Struktur auf M/G, f¨ ur die die Projektion π : M → M/G die Poisson-Klammern erh¨alt. Beweis: π ist genau dann Poissonsch, wenn {H, H 0 }M/G ◦ π = {H ◦ π, H 0 ◦ π}M gilt. Da π surjektiv ist, ist die Funktion {H, H 0 }M/G und somit auch die Klammer durch π also wenigstens schon einmal eindeutig bestimmt. Andererseits kann man nat¨ urlich auch eine Klammer auf M/G durch die obige Gleichung definieren. Die Eigenschaften dieser Klammer sind dann nat¨ urlich dieselben wie die der Klammer {·, ·}M , und daher ist auch {·, ·}M/G eine Poisson-Klammer. Um dies vollst¨andig zu zeigen, muß man nur durch Umformungen wie {{H, H 0 }M/G , H 00 }M/G ◦ π = {{H, H 0 }M/G ◦ π, H 00 ◦ π}M = {{H ◦ π, H 0 ◦ π}M , H 00 ◦ π}M jede Klammer {·, ·}M/G auf eine Klammer {·, ·}M zur¨ uckf¨ uhren sowie die Surjektivit¨at von π ausnutzen. 2 Bemerkung 5.9 Man beachte, daß allein im Rahmen symplektischer Mannigfaltigkeiten ein solcher Reduktionssatz nicht h¨atte bewiesen werden k¨onnen, denn mit einer Surjektion kann man eine 2-Form nur zur¨ uckziehen, aber nicht vorw¨artsschieben. Reduktion ¨ macht also den Ubergang von symplektischen zu Poisson-Mannigfaltigkeiten notwendig, denn tats¨achlich entstehen bei der Poisson-Reduktion aus symplektischen Mannigfaltigkeiten u ¨blicherweise Poisson-Mannigfaltigkeiten, deren Poisson-Struktur nicht von einer symplektischen Struktur induziert wird. 46
Zu einem vollst¨andigen Verst¨andnis der Poisson-Reduktion m¨ ussen wir noch die durch eine G-invariante Hamilton-Funktion auf M induzierte Dynamik auf M/G u ¨bertragen. Wenn aber H invariant unter G ist, dann gibt es ein h : M/G → R mit h ◦ π = H. Da π Poissonsch ist, gilt T π ◦ XH = Xh ◦ π, und das Vektorfeld Xh auf M/G beschreibt die reduzierte Dynamik. Beispiel: Ein triviales Beispiel: Betrachte R2 mit der kanonischen Form ω((q, p), (q 0 , p0 )) := qp0 − q 0 p und die Hamilton-Funktion H(q, p) = p2 /2 + q 2 /2. Offensichtlich liefern die Drehungen des R2 eine Poisson-Aktion von S 1 auf R2 , allerdings ist diese frei nur auf R2 \ {0}. Identifiziert man R2 /S 1 mit [0, ∞) p (keine Mannigfaltigkeit!), so ist die Projektion durch π(q, p) = r mit dem Radius r = q 2 + p2 gegeben. Die Funktionen F auf [0, ∞) h¨angen also nur vom Radius ab, und als reduzierte Poisson-Klammer ergibt sich wegen ∂F (r) ∂F 0 (r) ∂F 0 (r) ∂F (r) − = ∂q ∂p ∂q ∂p ∂F q ∂F 0 p ∂F 0 q ∂F p − =0 ∂r r ∂r r ∂r r ∂r r
{F, F 0 }R2 /S 1 = {F ◦ π, F 0 ◦ π}R2 =
die triviale Klammer. Da außerdem H invariant unter den Drehungen ist, reduziert sich die Dynamik auf das von h(r) = r2 u ¨ber Xh f = {f, h}R2 /S 1 = 0 induzierte Vektorfeld Xh = 0, und Xh ◦ π = 0 stimmt mit der Vektorfeld T π(XH ) u ¨berein, denn XH (q, p) = (p, −q) ist tangential zu allen Kreisen und wird somit durch T π auf Null abgebildet. Die reduzierte Dynamik ist also trivial.
¨ Lie-Poisson Reduktion: Uber die allgemeine Poisson-Reduktion l¨aßt sich zwar auch noch einiges sagen, wir wollen uns aber lieber dem wichtigsten Beispiel widmen, der Poisson-Reduktion des Kotangentialb¨ undels T ∗ G an eine Lie-Gruppe G, die auch LiePoisson-Reduktion genannt wird. Man bemerke, daß G auf T ∗ G (von links) durch die symplektischen Abbildungen g : T ∗ G → T ∗ G, αh 7→ T ∗ Lg (αh ), mit der Linksmultiplikation Lg : h 7→ gh auf G wirkt. Somit liegt wirklich ein Spezialfall der Poisson-Reduktion vor: Die Gruppe G operiert durch symplektische Abbildungen auf der symplektischen Mannigfaltigkeit M := T ∗ G. Wir wollen nun den Orbitraum T ∗ G/G genauer charakterisieren: Da T ∗ G durch T ∗ G 3 αg 7→ (g, T ∗ Lg αg ) ∈ G × g∗ trivialisiert wird und in dieser Trivialisierung die Wirkung von G auf T ∗ G durch (g, (g 0 , µ)) 7→ (gg 0 , µ) gegeben ist, ist T ∗ G/G diffeomorph zu g∗ , denn die obige Wirkung von G betrifft ja nur den G-Anteil von G × g∗ , und dieser wird komplett herausgeteilt. In der Trivialisierung ist also die Impulsabbildung J : T ∗ G → g∗ , J(αg ) := T ∗ Lg αg , gerade die kanonische Projektion π : T ∗ G → T ∗ G/G, und die Poisson-Klammer auf g∗ ist dann gegeben durch {F, F 0 }g∗ ◦ J = {F ◦ J, F 0 ◦ J}T ∗ G . 47
Wir wollen im folgenden diese Poisson-Klammer genauer berechnen und zeigen, daß sie durch δF δF 0 0 , {F, F }g∗ (µ) := −µ δµ δµ gegeben ist, wobei die Funktionalableitung vonF : g∗ → R nach µ als das Element δF ∈ g definiert ist, mit dem dF (µ)ν = ν δF gilt (dabei hat man die Reflexivit¨at δµ δµ ∗∗ ∼ g = g ausgenutzt). Von diesen beiden Funktionalableitungen bildet man dann die Lie-Klammer in g und erh¨alt dadurch wieder ein Element aus g, das man in µ ∈ g∗ einsetzen kann, wodurch man schließlich die reelle Zahl erh¨alt, deren Negatives die Funktion {F, F 0 } am Punkt µ als Wert annehmen soll. Um zu beweisen, daß die Poisson-Klammer diese Gestalt hat, bemerke man zun¨achst, daß der Wert der Poisson-Klammer {F, F 0 }g∗ (µ) aufgrund der Derivationseigenschaft und der damit einhergehenden Lokalit¨at nur von der ersten Ableitung von F, F 0 bei µ abh¨angt. Die obige Formel muß man also ur lineare F, F 0 auf g∗ beweisen, und f¨ ur nur f¨ δF solche hat man nat¨ urlich F (µ) = µ δµ (hier geht wieder die Reflexivit¨at ein). Dann gilt aber δF ∗ ∗ (F ◦ J) (αg ) = F (T Lg αg ) = T Lg αg = δµ δF δF =P |L (αg ) αg T Lg δµ δµ | (g) := T Lg δF von mit der linksinvarianten Fortsetzung δF δµ L δµ auf G und der Abbildung P(X)(αg ) := αg (X(g)).
δF δµ
∈ g zu einem Vektorfeld
Die Abbildung P ist nun aber ein Anti-Lie-Algebren-Homomorphismus von den Vektorfeldern auf G in die (auf den Fasern linearen) Funktionen auf T ∗ G.PDenn P erf¨ ullt {P(X), P(Y )}T ∗ G = −P([X, Y ]), da in Koordinaten P(X)(qi ,P pi ) = j Xj (qi )pj gilt 0 und f¨ u r zwei auf den Fasern lineare Funktionen F (q, p) = j Xj (q)pj , F (q, p) = P 0 0 j Xj (q)pj , die kanonische Poisson-Klammer {F, F }T ∗ G gerade das Negative des Kommutators ist: X ∂F ∂F 0 ∂F 0 ∂F {F, F 0 }T ∗ G (q, p) = − = ∂qj ∂pj ∂qj ∂pj j ! 0 X X ∂Xi X ∂X i Xj0 − Xj pi − [X, Y ]i (q)pi . ∂q ∂q j j i j i Also gilt 0 δF δF {F, F }g∗ (µ) = {F ◦ J, F ◦ J}T ∗ G (µ) = P |L , P |L (µ) = δµ δµ δF δF 0 δF δF 0 −P |L , |L (µ) = −µ |L , |L , δµ δµ δµ δµ 0
0
48
und dies ist gerade die zu beweisende Formel. Nachdem man somit die Poisson-Klammer auf der Poisson-Reduktion g∗ von T ∗ G kennt, wollen wir noch die Bewegungsgleichungen gewinnen, die von einer G-invarianten Hamilton-Funktion H auf T ∗ G induziert werden. Solche Funktionen spielen eine große Rolle, denn jede kinetische Energie H, die durch ein Skalarprodukt auf g∗ und dessen G-invariante Fortsetzung auf T ∗ G induziert wird, ist G-invariant. Eine G-invariante Funktion H auf T ∗ G induziert aber eine Funktion H 0 auf g∗ durch H 0 ◦ π = H und umgekehrt, wobei π : T ∗ G → T ∗ G/G ∼ = g∗ die Projektion auf den Orbitraum bezeichnet. Dieses Vorgehen liefert zu einer invarianten Hamilton-Funktion H auf T ∗ G eine Hamilton-Funktion H 0 auf g∗ und reduziert somit die Dynamik.
49
50
Kapitel 6 Elektromagnetismus In der Elektrodynamik besch¨aftigt man sich mit elektromagnetischen Feldern und geladenen Punktteilchen, die sich in einem solchen Feld bewegen.
6.1
Geladene Teilchen im Magnetfeld
Wir wollen die Bewegung eines geladenen Punktteilchens in einem festen Magnetfeld modellieren. Wieder sei darauf hingewiesen, daß dies eine Idealisierung ist: Ein bewegtes geladenes Teilchen ver¨andert das umgebende Magnetfeld nat¨ urlich, aber wir wollen eben nur den Einfluß des Magnetfeldes auf das Teilchen studieren und nicht umgekehrt. Das geladene Punktteilchen habe den Konfigurationsraum Q := R3 . Wir wollen im Rahmen der Hamiltonschen Mechanik auf dem Kotangentialb¨ undel T ∗ Q die Bewegungsgleichung f¨ ur ein geladenes Punktteilchen ermitteln. Das Magnetfeld in Q sei durch ein divergenzfreies Vektorfeld B : Q→ T Q gegeben. Im Fall Q = R3 hat B also die Form B(x) = B1 (x) B2 (x) B3 (x) mit vom Ort x abh¨angigen Funktionen Bi (x): Am Punkt x zieht das Magnetfeld ein geladenes Teilchen in Richtung B(x). Die Divergenzfreiheit div(B) =
∂B1 ∂B2 ∂B3 + + =0 ∂x1 ∂x2 ∂x3
von B ergibt sich aus den Maxwellschen Gleichungen des Elektromagnetismus oder R spezieller aus der Annahme, daß f¨ ur jedes Gebiet Ω ⊂ Q die Gleichung ∂Ω BdS = 0 gilt. Diese Annahme besagt, daß es keine magnetischen Quellen gibt, denn f¨ ur jedes Gebiet Ω ⊂ Q ist die Str¨omung entlang der Magnetfeldlinien u ¨ber ∂Ω Rnach Ω hinein R genau so groß wie hinaus. Aufgrund des Satzes von Stokes (bzw. Gauß) ∂Ω BdS = Ω div(B) dx folgt aus dieser Annahme dann die Divergenzfreiheit von B. Nun kann man solch ein divergenzfreies Vektorfeld auf R3 u ¨ber die Riemannsche Metrik und den Hodge-Isomorphismus ∗ auch als geschlossene 2-Form B1 dx2 ∧ dx3 + B2 dx3 ∧ dx1 + B3 dx1 ∧ dx2 51
ansehen. Mit der Projektion π : T ∗ Q → Q kann man dann anschließend diese 2-Form B auf Q zur¨ uckziehen zu einer 2-Form π ∗ B auf T ∗ Q. Lemma 6.1 Sei B eine geschlossene 2-Form auf Q. Dann ist die St¨orung ωB := ω − π ∗ B der kanonischen symplektischen Form ω auf T ∗ Q selbst wieder eine symplektische Form. Beweis: Da ω und B geschlossen sind sowie das Pullback π ∗ und d kommutieren, ist ωB geschlossen. Die Nichtausgeartetheit sieht man aus der lokalen Darstellung ωB : (a, α), (b, β) 7→ β(a) − α(b) − B(q)(a, b) 2
in einer Karte an einem Punkt aus Tq∗ Q.
Bez¨ uglich dieser symplektischen Form ωB und der kinetischen Energie ist die Hamiltonsche Bewegungsgleichung dann gerade die u x = ec (x˙ × B) ¨bliche Bewegungsgleichung m¨ eines geladenen Teilchens im Magnetfeld. Tats¨achlich, auf T ∗ Q ∼ ˙ ist die Differenz = R3 × R3 in Koordinaten (x, x) e ωB = mω − π B c ∗
mit der kanonischen symplektischen Form ω gerade ωB = m (dx1 ∧ dx˙ 1 + dx2 ∧ dx˙ 2 + dx3 ∧ x˙ 3 )
.
Mit der kinetischen Energie H(x, x) ˙ := m2 (x˙ 21 + x˙ 22 + x˙ 23 ) ergibt sich dann das Hamiltonsche Vektorfeld XH durch ωB (XH , ·) = dH. Nutzt man die Notation XH (u, v, w) = (u, v, w, u, ˙ v, ˙ w), ˙ so ist ωB (XH , ·) = dH a¨quivalent zu m (udx˙ 1 − udx ˙ 1 + vdx˙ 2 − vdx ˙ 2 + wdx˙ 3 − wdx ˙ 3) − e (B1 vdx3 − B1 wdx2 + B2 wdx1 − B2 udx3 + B3 udx2 − B3 vdx1 ) = c m (x˙ 1 dx˙ 1 + x˙ 2 dx˙ 2 + x˙ 3 dx˙ 3 ) . Somit ist das Hamiltonsche Vektorfeld durch u = x˙ 1 , v = x˙ 2 , w = x˙ 3 sowie mu˙ =
e e e (B3 v − B2 w) , mv˙ = (B1 w − B3 u) , mw˙ = (B2 u − B1 v) c c c
gegeben, und die Hamiltonschen DGL nehmen die behauptete Form an: e m¨ x = (x˙ × B) c
52
6.2
Das elektromagnetische Feld
W¨ahrend im vorigen Abschnitt die Bewegung eines geladenen Punktteilchens in einem festen Magnetfeld behandelt wurde, wollen wir nun diskutieren, wie sich das elektromagnetische Feld selbst in einem Gebiet mit der Zeit ¨andert. Im Gegensatz zu den zuvor behandelten mechanischen Systemen mit endlichdimensionalem Konfigurationsund Zustandsraum muß man Felder i.a. durch unendlichdimensionale R¨aume modellieren. Beispielsweise kann man die Konfiguration eines Magnetfeldes in einem Gebiet Ω zu einer festen Zeit t durch ein Vektorfeld B(t) beschreiben, das jedem Punkt x ∈ Ω die Richtung B(t, x) zuordnet, in die das Magnetfeld ein geladenes Teilchen im Punkt x nach dem Bewegungsgesetz aus dem vorigen Abschnitt bewegen w¨ urde. Die Menge aller solcher Vektorfelder ist aber ein unendlichdimensionaler Vektorraum. Ein Großteil dessen, was Physiker als Feldtheorie bezeichnen, ist also mathematisch die Theorie unendlichdimensionaler Hamiltonscher Systeme.
Unendlichdimensionale Hamiltonsche Systeme: Um mathematisch korrekt u ¨ber unendlichdimensionale Hamiltonsche Systeme sprechen zu k¨onnen, muß man zun¨achst einmal unendlichdimensionale Mannigfaltigkeiten definieren und sich danach fragen, ob die wesentlichen Begriffe wie die einer symplektischen Form und eines Hamiltonschen Vektorfeldes ganz analog zum endlichdimensionalen Fall definiert werden k¨onnen. Unendlichdimensionale Mannigfaltigkeiten M sind solche, bei denen die Karten xi : M ⊃ Ui → Vi eben nicht in eine offene Teilmenge des Rn , sondern in eine offene Teilmenge Vi eines festen unendlichdimensionalen Banachraums X abbilden. Da man (Fr´echet-)Differenzierbarkeit ganz analog zum endlichdimensionalen Fall auch f¨ ur Ba1 k nachr¨aume definieren kann , macht es auch hier Sinn, von einem C -Atlas zu sprechen und damit unendlichdimensionale C k -Mannigfaltigkeiten (modelliert u ¨ber dem Banachraum X) zu definieren. Danach kann man ebenso das Tangentialb¨ undel sowie Vektorfelder, Formen, die Lie-Ableitung und das Differential d auf Formen definieren. Aufpassen muß man bei ein paar kleinen Unterschieden, die haupts¨achlich darauf beruhen, daß selbst f¨ ur einen reflexiven Banachraum2 die Banachr¨aume X und X ∗ i.a. nicht isomorph sind (im Gegensatz zu einem Hilbertraum). So ist f¨ ur eine 2-Form die Nichtdegeneriertheitsbedingung (∀Y : ω(X, Y ) = 0) ⇒ X = 0 schw¨acher als die Forderung nach Isomorphie von T M und T M ∗ durch X 7→ ω(X, ·). Eine geschlossene 2-Form ω, die der ersten Bedingung gen¨ ugt, nennt man schwach symplektisch, und wenn die zweite ¨ Bedingung erf¨ ullt ist, spricht man von einer stark symplektischen Form. Ublicherweise sind die in der Feldtheorie vorkommenden symplektischen Formen jedoch nur schwach symplektisch. Dies bewirkt, daß Hamiltonsche Vektorfelder i.a. nicht u ¨berall, sondern nur auf dichten Teilmengen definiert sind, und daher braucht man eine ausgefeiltere Theorie, um die Existenz von L¨osungen zu beweisen. 1
Eine Abbildung F : X → Y zwischen Banachr¨aumen heißt differenzierbar in x ∈ X, wenn es eine (x)−DF (x)h lineare Abbildung DF (x) : X → Y gibt mit F (x+h)−Fkhk → 0 bei h → 0. 2 Ein Banachraum X heißt reflexiv, wenn X und der Doppeldual X ∗∗ durch x 7→ (x∗ 7→ x∗ (x)) isomorph sind.
53
Statt uns aber lange mit der allgemeinen Theorie unendlichdimensionaler Mannigfaltigkeiten und Hamiltonscher Systeme zu besch¨aftigen, wollen wir lieber anhand von Beispielen sehen, wie man die Theorie elektromagnetischer Felder als unendlichdimensionales Hamiltonsches System auffassen kann. ~ Die Maxwellschen Gleichungen: Die zeitliche Evolution des elektrischen Feldes E ~ in einem Gebiet des R3 mit Ladungsdichte ρ und Stromund des magnetischen Feldes B dichte ~j kann man in kartesischen Koordinaten durch die Maxwellschen Gleichungen beschreiben: ~˙ = − rot E ~ B ~˙ = rot B ~ + ~j E
~ =0 div B ~ =ρ div E
.
Bevor wir die Maxwellschen Gleichungen als unendlichdimensionale Hamiltonsche Differentialgleichungen interpretieren, wollen wir uns zun¨achst dem einfacheren Problem der Wellengleichung widmen. Die Wellengleichung: Aus den Maxwellschen Gleichungen des Vakuums (also ρ = 0, ~ als auch B ~ sowie etwaige Potentiale die Wellengleichung ~j = 0) folgt, daß sowohl E φ¨ = ∆φ erf¨ ullen. Denn die Maxwellschen Gleichungen des Vakuums implizieren ¨~ ~ = rot˙ B ~ =E − rot rot E
,
¨~ ~ = grad div E ~ − ∆E ~ sowie div E ~ = 0 folgt daher E ~ (wobei und wegen rot rot E = ∆E ~ wirkt). Analog gilt dies f¨ hier ∆ einzeln auf die Komponenten von E ur jede Komponente ~ oder B, ~ falls man diese so w¨ahlt, daß φ an einem von B und auch f¨ ur Potentiale φ von E festen Punkt x0 konstant in t ist. Die Wellengleichung ist aber nicht nur in der Elektrodynamik, sondern auch in vielen anderen Bereichen der Physik wichtig. Als Beispiel sei hier die Akustik erw¨ahnt: Aus den linearisierten Gleichungen der Akustik ρt + ρ0 div(v) = 0
vt +
c2 ∇ρ = 0 ρ0
f¨ ur eine kleine St¨orung v(t, x) ∈ R3 des Geschwindigkeitsfeldes und eine kleine St¨orung ρ(t, x) ∈ R der konstanten Massendichte ρ0 eines ruhenden Gases mit Schallgeschwindigkeit c im R3 ergibt sich die Wellengleichung sowohl f¨ ur ρ als auch f¨ ur das Potential φ eines rotationsfreien v. In der Tat, einerseits ergibt sich ρtt = (ρt )t = − (ρ0 div(v))t = −ρ0 div(vt ) = −ρ0 div(− 54
c20 ∇ρ) = c20 ∆ρ . ρ0
Andererseits impliziert rot(v(0)) = 0 auch rot(v(t)) = 0, denn rot(v) erf¨ ullt die PDGL (rot(v))t = rot(vt ) = −
c20 rot(∇ρ) = 0 ρ0
und ist daher konstant. Weiterhin ist rot(v(t)) = 0 auf dem R3 ¨aquivalent zur Existenz eines Potential φ, v = ∇φ, und w¨ahlt man φ(t) so, daß φ(t, x0 ) = 0 f¨ ur eine Stelle x0 und alle t gilt, so erf¨ ullt dieses Potential wegen vtt = −
c20 ∇ρt = c20 ∇ div(v) = c20 ∆v ρ0
(wobei f¨ ur die letzten Gleichheit die von derRRotationsfreiheit implizierte Beziehung ∂vi ∂ ∂vj = ∂x∂ j ∂x genutzt wurde) und φ(t, x) = c v(t, ·)ds f¨ ur jede x0 und x verbindende ∂xi ∂xj j 3 Kurve c : [0, 1] → R auch die Wellengleichung. Daher macht es Sinn die Wellengleichung φ¨ = ∆φ unabh¨angig davon zu behandeln, ob es sich um elektromagnetische, akustische oder Dichtewellen handelt. Man stelle sich φ einfach als Intensit¨at an jedem Punkt des Gebietes Ω vor (z.B. auch als Auslenkung einer schwingenden Saite in dem jeweiligen Punkt). Mathematisch kann man die Intensit¨at einer Welle also durch eine Funktion φ : Ω → R beschreiben, und der Konfigurationsraum ist dann der Vektorraum Q all solcher Intensit¨aten, also ein unendlichdimensionaler Vektorraum von Funktionen. In der Hamiltonschen Mechanik beschreibt man ja die Bewegungsgleichung durch ein Hamiltonsches Vektorfeld auf dem Kotangentialb¨ undel T ∗ Q. Dieses kann man hier aufgrund der Vektorraumstruktur von Q einfachR mit Q × Q∗ identifizieren. Die Elemente von Q∗ sind dabei Dichten π, die durch φ 7→ Ω φπdx als Elemente des Dualraums von Q interpretiert werden. Man bemerke, daß es bereits reicht, ein duales Paar Q × R zu betrachten, auch wenn R nur Teilmenge von Q∗ ist. Genauer k¨onnte man hier die Funktionenr¨aume Q := H 1 (Ω) und R := L2 (Ω) ⊂ H −1 (Ω) = Q∗ als duales Paar betrachten. Dann macht n¨amlich die Hamilton-Funktion Z Z Z 1 1 2 2 |π| dx + |∇φ| dx + U (φ)dx H(φ, π) = 2 Ω 2 Ω Ω zumindest f¨ ur gen¨ ugend gute Funktionen U Sinn. Der erste Summand modelliert die kinetische Energie, der zweite die potentielle Energie der Wellenspannung, die eine (hier lineare) R¨ uckstellkraft bewirkt, und der dritte eine allgemeine potentielle Energie, die nur von der Auslenkung φ abh¨angt. F¨ ur diese Hamilton-Funktion ergeben sich mit der kanonischen symplektischen Struktur ω((φ1 , π1 ), (φ2 , π2 )) := π1 (φ2 ) − π2 (φ1 ) auf Q × R ⊂ Q × Q∗ die Hamiltonschen DGL δH =π φ˙ = δπ
π˙ = −
δH = ∆φ − U 0 (φ) . δφ
oder zusammen die Wellengleichung φ¨ = ∆φ + U 0 (φ). Man beachte, daß das Hamiltonsche Vektorfeld nicht u ¨berall definiert ist, deswegen ist eine Existenztheorie viel schwieriger als im Endlichdimensionalen, f¨ ur verschwindende oder quadratische U (KleinGordon-Gleichung) aber m¨oglich. Und nat¨ urlich erh¨alt der Fluß dann wie im Endlichdimensionalen die Energie H. 55
Koordinatenunabh¨ angige Formulierung der Maxwellschen Gleichungen: Bei den Maxwellschen Gleichungen hat man das zus¨atzliche Problem, daß man die Nebenbedingungen div(B) = 0 und div(E) = j in die Evolutionsgleichung einbeziehen muß. Deswegen formulieren wir die Maxwellschen Gleichungen auf dem R3 zun¨achst koordi~ natenfrei. Dazu fasse man die in kartesischen Koordinaten gegebenen Vektorfelder E ~ als 1-Form und B ~ 1 dx + E ~ 2 dy + E ~ 3 dz E=E bzw. als 2-Form ~ 1 dy dz + B ~ 2 dz dx + B ~ 3 dx dy B=B auf. Man erinnere sich dabei, daß wir auch bei der Bewegung eines Punktteilchens im Magnetfeld B schon als 2-Form aufgefasst hatten. Mit dieser Interpretation gilt ~ dB = div(B)dx dy dz
~ 1 dy dz + rot(E) ~ 2 dz dx + rot(E) ~ 3 dx dy sowie dE = rot(E)
.
Ebenso kann man das Vektorfeld ~j als 2-Form j = ~j1 dy dz + ~j2 dz dx + ~j3 dx dy und die Funktion ρ als Volumenform ρ dx dy dz auffassen. Mit dem Hodge-Operator ∗ lauten die Maxwellschen Gleichungen dann B˙ = −dE ˙ =d∗B+j ∗E
dB = 0 d∗E =ρ
.
Diese Formulierung ist offensichtlich koordinatenunabh¨angig. Man beachte, daß B als geschlossene 2-Form (zumindest lokal) exaxt ist, also gilt B = dA mit einer 1-Form A, dem magnetischen Potential. Wegen dA˙ = B˙ = −dE ist auch die 1-Form E + A˙ geschlossen und daher (zumindest lokal) exaxt, also gilt E + A˙ = dU mit einer Funktion U , dem elektrischen Potential. Vereinheitlichte Theorie des Elektromagnetismus: Die bisher gewonnene Formulierung der Maxwellschen Gleichungen ist unabh¨angig von den Raum-Koordinaten, aber noch nicht unabh¨angig von der Zeit-Koordinate. Daher wollen wir die Maxwellschen Gleichungen im folgenden noch weiter so umformulieren, daß die Zeit-Koordinate gleichberechtigt mit den Raum-Koordinaten wird, d.h. wir wollen die Maxwellschen Gleichungen relativistisch formulieren. Dabei werden wir sehen, daß dies eine verein” heitlichte Theorie“der elektrischen und magnetischen Kraft produziert, n¨amlich eine Theorie der elektromagnetischen Kraft. Historisch war dies die erste gr¨oßere vereinheitlichte Theorie in der Physik, und da man heute ja nach einer vereinheitlichten Theorie aller bekannten Kr¨afte sucht, ist die folgende Konstruktion als Modellbeispiel auch heute noch interessant. Sind (E, B) das elektrische und magnetische Feld aufgefasst als 1- bzw. 2-Form auf einem Raumgebiet Ω, dann ist F := dt∧E +B eine 2-Form auf der Raum-Zeit M := R× 56
Ω, genannt das elektromagnetische Feld. Lokal hat F das elektromagnetische Potential A := −U dt + A (eine 1-Form auf M ) mit dem alten magnetischen Potential A und dem alten elektrischen Potential U , d.h. F = dA gilt mit dem neuen A. Mit dem elektromagnetischen F , der Ladungsstromform J := ρ + dt ∧ j (einer 3-Form auf M ) und dem Codifferential ∂ := ∗d∗ sind die Maxwellschen Gleichungen dann ¨aquivalent zu dF = 0
∂F = ∗J
.
Denn 0 = dF = −dt∧dE +dB +dt∧ B˙ ist a¨quivalent zu dB = 0 (nur Raumkoordinaten) und B˙ = −dE (Zeitkoordinate), w¨ahrend J = d∗F = d∗(dt∧E)+d∗B zu d∗E = ρ und ∗E˙ = d∗B +j ¨aquivalent ist. Dabei wurde benutzt, daß B = B1 dydz +B2 dzdx+B3 dxdy die Gleichung ∗B = B1 dtdx + B2 dtdy + B3 dtdz impliziert, und Ableitung liefert dann d ∗ B = (∂y B1 − ∂x B2 )dtdxdy + (∂z B1 − ∂x B3 )dtdxdz + (∂z B2 − ∂y B3 )dtdydz
.
Analog impliziert dt ∧ E = E1 dtdx + E2 dtdy + E3 dtdz die Gleichung ∗(dt ∧ E) = E1 dydz − E2 dxdz + E3 dxdy und daher d ∗ (dt ∧ E) = E˙1 dtdydz + ∂x E1 dxdydz + −E˙2 dtdxdz + ∂y E2 dxdydz + E˙3 dtdxdy + ∂z E2 dxdydz Auf der Raum-Zeit M verschmelzen elektrisches und magnetisches Feld also zum elektromagnetischen Feld F , das durch eine geschlossenen 2-Form modelliert wird und ∂F = ∗J mit der Ladungsstromform J erf¨ ullt. Insbesondere hat F aufgrund der Geschlossenheit (zumindest lokal) ein elektromagnetisches Potential A, F = dA. Nutzen wir das Potential A als die eigentliche Feldvariable, dann werden in dieser Variablen die R Maxwellschen Gleichungen im Vakuum (also J = 0) von der Energie H(A) = 21 M |dA|2 erzeugt. Denn Variation dieser Energie liefert < dA, dH >= 0, d.h. < ∂dA, H >= 0 f¨ ur alle H und somit ∂F = ∂dA = 0, und die Geschlossenheit von F entspringt aus der Tatsache, daß man F = dA mit dem Potential A hat. Dies ist also die Hamiltonsche R Formulierung der Elektrodynamik im Vakuum, die Energie ist H(A) = 12 M |dA|2 . Ganz analog erh¨alt man die Hamiltonsche Formulierung der Elektrodynamik auch bei fest vorgegebener Ladungsstromform J 6= 0: Wegen 0 = ∂∂F = ∂ ∗ J ist die 3-Form J auf der Raum-Zeit geschlossen und hat daher zumindest lokal eine 2-Form j als Potential, J = dj. RDie Gleichung ∂F = ∗J ist damit a¨quivalent zur Variation der Energie H(A) := 21 M kdA − ∗jk2 , denn es gilt dH(A)(h) =< dA − ∗j, dh >=< ∂dA − ∂ ∗ j, h >=< ∂F − ∗J, h > f¨ ur alle h und somit ∂F = ∗J. Es sei nochmal darauf hingewiesen, daß sich Ladung und Strom hier nicht mit dem Feld mitbewegen, sondern fest vorgegeben sind, man ist also immer noch nicht im allgemeinsten Fall der Elektrodynamik. 57
Elektrodynamik auf der Raum-Zeit-Ladung: Bisher sind immer noch einige Fragen offen geblieben: Inwieweit ist die geschlossene 2-Form F ein Feld ? Wie wirkt F auf geladene Teilchen ? Wie erh¨alt man ein globales Potential A von F ? Diese Fragen kann man wie folgt beantworten: F ist Teil der Kr¨ ummung der 5-dimensionalen Raum-Zeit-Ladung, analog dazu, wie das Gravitationsfeld durch die Kr¨ ummung der 4dimensionalen Raum-Zeit modelliert wird. Dabei bewegen sich geladene Teilchen auf k¨ urzesten Bahnen in der Raum-Zeit-Ladung, werden also nur von der kinetischen Energie getrieben, und ein globales Potential erh¨alt man durch eine nichttriviale Verwicklung von Ladung und Raum-Zeit. Diese Antworten bed¨ urfen nat¨ urlich einer Pr¨azisierung, und dies wollen wir im folgenden angehen. Als erstes wollen wir uns mit der Frage besch¨aftigen, was denn die Raum-ZeitLadung ist. Neben den Variablen f¨ ur Raum und Zeit braucht man zur Beschreibung der Konfiguration eines Punktteilchens auch noch eine Variable f¨ ur die Ladung. Diese soll Werte in einer kompakten Lie-Gruppe G haben, f¨ ur Elektromagnetismus G = U (1), f¨ ur die schwache Kernkraft G = SU (2) und f¨ ur die starke Kernkraft G = SU (3). Der Konfigurationsraum eines geladenen Punktteilchens ist dann ein prinzipales G-B¨ undel P u ber der Raum-Zeit M , das wir eben Raum-Zeit-Ladung nennen. ¨ Ein prinzipales G-B¨ undel ist eine B¨ undel π : P → M , bei dem G einfach transitiv auf den Fasern von π rechts operiert. Mit anderen Worten liegt u ¨ber jedem Punkt M der Raum-Zeit eine zu G isomorphe Faser, bei der man jedoch nicht festgelegt hat, wo genau das neutrale Element e ∈ G liegt. Diese Wahlfreiheit des Ursprungs ist es, was in der Physik die Eichsymmetrie bewirkt. ¨ Aquivalenterweise kann man das prinzipale G-B¨ undel π : P → M als mit einem Atlas von Karten φ : P ⊃ π −1 (U ) → U × G u ur die π = π1 ◦ φ gilt und ¨ber offenen U ⊂ M ausgestatte Mannigfaltigkeit ansehen, f¨ bei der Kartenwechsel auf der Faser G gerade Linksmultiplikationen sind. Um von der Kr¨ ummung eines solchen B¨ undels sprechen zu k¨onnen, brauchen wir noch eine prinzipale Zusammenhangsform, und diese werden wir sp¨ater mit dem elektromagnetischen Potential A identifizieren. Ein prinzipaler Zusammenhang ist eine Projektion Φ : T P → V P auf das vertikale B¨ undel V P := ker(T π), die G-¨aquivariant ist in dem Sinne, daß T g ◦ Φ = Φ ◦ T g gilt. Da V P ∼ = P × g trivial ist, gibt es eine eindeutige prinzipale Zusammenhangsform A mit Φ(Xp ) = XA(Xp ) (p), wobei Xξ das von ξ ∈ g induzierte Vektorfeld auf P bezeichnet 3 . Abstrakt ist eine prinzipale Zusammenhangsform A auf P also eine 1-Form auf P mit Werten in der Lie-Algebra g = Te G von G, die G-¨aquivariant im Sinne von g ∗ (A) = Ad(g −1 )A und projektiv im Sinne von A ◦ Xξ ≡ ξ ist. Die lokalen Potentiale eines elektromagnetischen Feldes F u ¨ber der Raum-Zeit kann man dann zu einer prinzipalen Zusammenhangsform auf einem m¨oglicherweise nichttrivialen prinzipalen B¨ undel verbinden. Denn ist die 1-Form A|U auf der Raum-Zeit 3
Genauer ist Xξ = Te p(ξ), wobei p ∈ P als p : G → P , g 7→ pg, interpretiert wurde, und Xξ ∈ V P wegen T π(Te p(ξ)) = T (π ◦ p) = 0 gilt (da π ◦ p ≡ π(p)).
58
M lokal das elektromagnetische Potential in einem Gebiet U , u ¨ber dem P durch den Schnitt σ : U → P trivialisiert ist, d.h. (u, g) 7→ σ(m)g liefert U × U (1) ∼ = P |U , dann ∗ definiert −iA|U = σ A einerseits eine prinzipale Zusammenhangsform A auf P |U , wo¨ bei man u(1) mit −iR identifiziert. In der Tat, verlangt man von A die G-Aquivarianz, ∗ dann definiert die Gleichung −iA|U = σ A die −iR-wertige 1-Form A auf P eindeutig, und wegen π ◦ σ = IdM gilt auch die Konstanz A ◦ Xξ ≡ ξ. Beispiel: Der Diracsche Monopol: Auf M = R3 \ {0} hat die geschlossene Form nx F = 2rn3 (x dy dz − y dx dz + z dx dy), die durch E = 0, B = 2kxk 3 , induziert wird und somit eine magnetische Ladung der St¨arke n/2 im Ursprung beschreibt, Rkein globales n Potential. Denn in Polarkoordinaten R ist F R= 2 sin(φ) dφ dθ und hat damit S 2 F = 2nπ, w¨ahrend bei F = dA nach Stokes S 2 F = ∂S 2 A = 0 w¨are. Entfernt man aber nicht nur den Punkt 0, sondern eine ganze Halbgerade, dann wird der entstehende Raum isomorph zu R3 und jede geschlossene Form ist exakt. Auf R3 \ ur das in kartesischen Koordinaten {z ≥ 0} ist AS = n2 (−1 − cos(φ)) dθ ein Potential, f¨ n 3 AS = 2r(r−z) (ydx − ddy) gilt, und auf R \ {z ≤ 0} ist AN = n2 (1 − cos(φ)) dθ ein n Potential, in kartesischen Koordinaten AN = 2r(r+z) (ydx − ddy) Auf S 2 betrachtet und mit dem Vorfaktor i der Lie-Algebra ergibt sich als Differenz AS − AN = nidθ. Betrachte man die Projektion C2 ⊃ S 3 → S 2 ∼ = CP1 , so macht diese S 3 zu einem nichttrivialen prinzipalen U (1)-B¨ undel u ¨ber S 2 , wobei die Operation von U (1) auf C2 die skalare Multiplikation ist. Bei n = 1 liefert die prinzipale Zusammenhangsform in= (¯ z1 dz1 + z¯2 dz2 ) auf S 3 , die wegen eit¯zd(eit z) = e−it eit z¯dz = z¯dz invariant unter U (1) ist, gerade AS und AN bzgl. der u ¨blichen Schnitte. Also setzen sich AS und AN zu einer prinzipalen Zusammenhangsform auf einem nichttrivialen prinzipalen U (1)-B¨ undel u ¨ber S 2 zusammen. Die Topologie eines prinzipalen U (1)-B¨ undels kann man also physikalisch als magnetische Ladung interpretieren. Im Gegensatz zur elektrischen Ladung, f¨ ur die man die U (1)-Variable zur Verf¨ ugung hat hat, wird magnetische Ladung durch die topologische Verwicklung“ des prinzipalen B¨ undels modelliert. Solche magnetischen Ladungen sind ” z.B. bei der Modellierung von Supraleitern interessant, dort ist ein einzelnes Vortex eine magnetische Ladung. Abschließend wollen wir noch die Beziehung zwischen der Kr¨ ummung der Raum-ZeitLadung und der prinzipalen Zusammenhangsform angegeben. Sei Φ : T P → V P ⊂ T P der prinzipale Zusammenhang zur prinzipalen Zusammenhangsform A und Ψ := IdT P −Φ die zugeh¨orige Projektion auf die horizontalen Tangentialvektoren HP ⊂ T P . Die kovariante Ableitung von Formen ω auf P ist dA ω := Ψ∗ (Ω), wobei Ψ∗ (Ω)(X1 , . . . , Xk ) = Ω(Ψ(X1 ), . . . , Ψ(Xk )) definiert ist. Eine Form ω auf P heißt horizontal, wenn ω|V P ≡ 0 gilt, und vertikal, wenn ω|HP ≡ 0. A ist vertikal, denn Φ(X) = 0 f¨ ur horizontale X gilt. Auf G-¨aquivarianten horizontalen g-wertigen Formen gilt nun dA ω = dω + [A, ω]∧ , wobei [A, ω]∧ die Alternatisierung des Tensors (X0 , X1 , . . . , Xk ) 7→ [A(X0 ), ω(X1 , . . . , Xk )]g ist. Die Kr¨ ummung von A ist nun die g-wertige 2-Form F := dA A = dA + 21 [A, A]∧ . Denn 59
f¨ ur horizontale Vektorfelder X, Y gilt dA A(X, Y ) = (Ψ∗ (dA))(X, Y ) = dA(Ψ(X), Ψ(Y )) = Ψ(X)A(Ψ(Y )) − Ψ(Y )A(Ψ(X)) − A([Ψ(X), Ψ(Y )]) = XA(Y ) − Y A(X) − A([X, Y ]) = −A([X, Y ]) da X, Y horizontal sind und A vertikal ist, also Ψ(X) = X, Ψ(Y ) = Y und A(X) = 0 = A(Y ) gilt, und 1 dA + [A, A]∧ (X, Y ) = 2 XA(X) − Y A(X) − A([X, Y ]) + [A(X), A(Y )]g = −A([X, Y ]) wegen [A, A]∧ = [A(X), A(Y )]g − [A(Y ), A(X)]g = 2[A(X), A(Y )]g und da wiederum A(X) = 0 = A(Y ) aufgrund der Vertikalit¨at von A gilt. F¨ ur vertikale Vektorfelder gilt dagegen iXξ dA A = dA(Ψ(Xξ ), ·) = 0, da Xξ vertikal ist, und 1 1 1 iXξ (dA + [A, A]∧ ) = iXξ dA + [A(Xξ ), A]∧ − [A, A(Xξ )]∧ = 2 2 2 LXξ A + [ξ, A]∧ = − ad(ξ)A + ad(ξ)A = 0 da LX = iX d + diX gilt und d(iXξ A) = 0 wegen A ◦ Xξ ≡ ξ, sowie da LXξ A = − ad(ξ)A d ¨ wegen der G-Aquivarianz | g(t)∗ A = dtd |t=0 Ad(g(t)−1 )A = − ad(ξ)A f¨ ur eine Kurve dt t=0 mit g(0) ˙ = ξ gilt und da A(Xξ ) ≡ ξ sowie [ξ, A]∧ (·) = [ξ, A(·)] = ad(ξ)A(·) gilt. Dar¨ uberhinaus erf¨ ullt die Kr¨ ummung F die Gleichung dA F = 0, da 1 1 dA (dA + [A, A]∧ ) = Ψ∗ (ddA) + Ψ∗ (d[A, A]∧ ) = 2 2 1 ∗ Ψ ([dA, A]∧ − [A, dA]∧ ) = Ψ∗ [dA, A]∧ = [Ψ∗ dA, Ψ∗ A]∧ = 0 2 gilt und Ψ∗ A = 0 aufgrund der Vertikalit¨at von A erf¨ ullt ist. Nun kommen wir zur¨ uck zur Raum-Zeit-Ladung und sehen, daß F tats¨achlich ein Teil der Kr¨ ummung der Raum-Zeit-Ladung ist. Eine feste Metrik auf der Raum-Zeit M , eine feste invariante Metrik auf G und das von der prinzipalen Zusammenhangsform A gelieferte Splitting Tp P = Hp P × Vp P ∼ =R Tπ(p) M × g induzieren n¨amlich eine Metrik auf P . Die Kr¨ ummung dieser Metrik ist P S(g)d Volg mit der Skalarkr¨ ummung S(g), der AR abh¨angige Teil ist dabei gerade die bekannte elektromagnetische Energie R von 2 |F | = |dA A|2 Rmit der Metrik | · | auf g. Genauer: Hat man P trivialisiert, so ist RP S(g)d Volg = Λ M S(gM ) − Λ12 |F |2 VolgM , wobei Λ die L¨ange des Kreises U (1) in P der Faser ist. Das Elektromagnetische Feld dominiert also gegen¨ uber der Gravitation bei kleinem Λ. Punktteilchen bewegen sich dann bzgl. der Gesamtmetrik auf P auf k¨ urzesten Bahnen in der Raum-Zeit-Ladung.
60
Literaturverzeichnis [AbrahamMarsdenRatiu] Ralph Abraham, Jerrold E. Marsden, Tudor Ratiu, Manifolds, Tensor Analysis and Applications, Applied Mathematical Sciences, 75. Springer-Verlag, New York, 1988. [BrickellClark] Frederick Brickell, Ronald S. Clark, Differentiable Manifolds - An Introduction, Van Nostrand, 1968. [Forster] Otto Forster, Analysis 3, Vieweg, 3. Auflage, 1984. [K¨onigsberger] Konrad K¨ onigsberger, Analysis 2, Springer, 1. Auflage, 1993. [K¨ uhnel] Wolfgang K¨ uhnel, Differentialgeometrie, Vieweg, 1999. [MarsdenRatiu] Jerrold E. Marsden, Tudor Ratiu, Introduction to Mechanics and Symmetry, Springer, 1999. [tomDieck] Tammo tom Dieck, Differentialtopologie, Skript, 2004. Download unter http://www.uni-math.gwdg.de/tammo/skripten/skripten.html
61