Theoretische Physik: Relativistische Quantenmechanik, Quantenfeldtheorie und Elementarteilchentheorie
Eckhard Rebhan
Theoretische Physik: Relativistische Quantenmechanik, Quantenfeldtheorie und Elementarteilchentheorie
Autor Prof. Dr. Eckhard Rebhan Institut für Theoretische Physik Universität Düsseldorf e-mail:
[email protected]
Wichtiger Hinweis für den Benutzer Der Verlag und der Autor haben alle Sorgfalt walten lassen, um vollständige und akkurate Informationen in diesem Buch zu publizieren. Der Verlag übernimmt weder Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Informationen, für deren Wirtschaftlichkeit oder fehlerfreie Funktion für einen bestimmten Zweck. Der Verlag übernimmt keine Gewähr dafür, dass die beschriebenen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sämtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag gegenüber dennoch der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar gezahlt. Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer ist ein Unternehmen der Springer Science+BusinessMedia Springer.de © Springer-Verlag Berlin Heidelberg 2010 Spektrum Akademischer Verlag ist ein Imprint von Springer 10 11 12 13 14
5 4 3 2 1
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Planung und Lektorat: Dr. Andreas Rüdinger, Bianca Alton Satz: Autorensatz Umschlaggestaltung: SpieszDesign, Neu-Ulm ISBN 978-3-8274-2602-4
Vorwort Nach der Mechanik, der Elektrodynamik und der Quantenmechanik werden hiermit drei weitere Teilgebiete meines zweibändigen Lehrbuchs Theoretische Physik in einem dünneren Einzelband vorgelegt, die Relativistische Quantenmechanik, die Quantenfeldtheorie und die Einführung in die Elementarteilchentheorie. Nachdem mittlerweile beide Bände des ursprünglichen Lehrbuchs vergriffen sind, sollen die noch nicht in dünneren Einzelbänden erschienen Teilgebiete möglichst bald wieder verfügbar gemacht werden. Aus diesem Grund und auch, weil sich in der relativ kurzen Zeit seit dem ersten Erscheinen keine Notwendigkeit für eine Überarbeitung ergeben hat, wurden die im vorliegenden Band aufgenommenen Teilgebiete weitgehend unverändert aus Band II des zweibändigen Lehrbuchs übernommen; im Wesentlichen wurden nur die Nummerierungen, das Inhaltsverzeichnis und das Sachregister angepasst. Das meiste, was in den Vorworten zu dem ursprünglichen Lehrbuch und den bereits erschienenen Einzelbänden steht, gilt auch für diesen Band und wird hier nicht wiederholt. Wie dort wird als Maßsystem durchgängig das SI-System benutzt. Im Teil Quantenfeldtheorie weicht das von der üblichen Vorgehensweise ab; im allgemeinen werden in dieser sogenannte natürliche Einheiten bevorzugt, in denen h c1 gesetzt ist und bezüglich der Dimensionen [Länge]=[Zeit]=1/[Energie] =1/[Masse] gilt. Der Leser wird feststellen, dass die Formeln in SI-Einheiten kaum unübersichtlicher werden, hat jedoch den Vorteil, dass die Kontrolle von Rechenergebnissen durch Überprüfen der Dimensionen erheblich wirkungsvoller wird. Zum Gebrauch des Buches sei Folgendes bemerkt: In Formelzeilen mit mehreren Formeln, aber nur einer Formelnummer werden die Formeln gedanklich von links nach rechts oder von oben nach unten mit a, b, c usw. durchnummeriert und später in diesem Sinne zitiert. Rückverweise auf Formeln erfolgen entweder im Text oder innerhalb einer Formel über einem Verbindungszeichen wie = oder > an der Stelle, wo sie benötigt werden. Manchmal ergibt es sich aus sprachlichen Gründen, dass Teile der Erklärungen zu einer Formel erst in den auf diese folgenden Sätzen gegeben werden können. Diesem mitunter zu unnötigen Verständnisschwierigkeiten führenden Umstand wird in diesem Lehrbuch durch Vorverweise vorzubeugen versucht: Wo zu einer Formel s.u. nach ihrer Ableitung noch erklärende Kommentare kommen, wird das z. B. durch gekennzeichnet, wobei „s. u.“ als Abkürzung für „siehe unten“ steht. Rückverweise auf Formeln oder Kapitel bzw. Abschnitte anderer Einzelbände werden durch Voranstellen eines Buchstabens gekennzeichnet, z. B. Kapitel Q3.1 oder Gleichung (E5.21), wobei M für die Mechanik, E für die Elektrodynamik und Q für die Quantenmechanik steht. Ich hoffe, dass dieses Buch das Studium der in ihm dargebotenen, als schwierig geltenden Teilgebiete der theoretischen Physik etwas erleichtert und zu deren Verständnis beiträgt. Einen wichtigen Zweck würde es erfüllen, wenn sein Durcharbeiten oder das Arbeiten mit ihm nicht nur Mühe bereiten, sondern auch ein Stück Erkenntnisfreude bescheren würde. Düsseldorf, im Oktober 2009
Eckhard Rebhan
Kurzinhaltsverzeichnis
I
Relativistische Quantenmechanik
1
1
Einleitung zur Relativistischen Quantenmechanik
3
2
Dirac-Theorie des Elektrons und des Neutrinos
4
3
Anwendungen der Dirac-Theorie
4
Klein-Gordon-Theorie
116
II
Quantenfeldtheorie
133
5
Einleitung zur Quantenfeldtheorie
135
6
Fock-Darstellung von Viel-Teilchen-Zuständen
137
7
Klassische relativistische Feldtheorie
156
8
Kanonische Feldquantisierung
189
9
Wechselwirkende Felder
250
10
Quantenelektrodynamik
276
III
Einführung in die Elementarteilchentheorie
373
11
Einleitung zur Elementarteilchentheorie
375
12
Elemente der Gruppentheorie
391
13
Gruppierung von Teilchenzuständen
423
14
Teilchen, Felder und Lagrange-Funktion
441
15
Eichinvarianz und Eichfelder
451
16
Standardmodell
477
17
Über das Standardmodell hinausführende Entwicklungen
523
Literaturverzeichnis
86
539
Inhaltsverzeichnis
I
Relativistische Quantenmechanik
1
1
Einleitung zur Relativistischen Quantenmechanik
3
2 2.1 2.2
Dirac-Theorie des Elektrons und des Neutrinos Ergebnisse der klassischen relativistischen Mechanik . . . . . . . Aufstellung der Dirac-Gleichung . . . . . . . . . . . . . . . . . . 2.2.1 Dirac-Gleichung im kräftefreien Fall . . . . . . . . . . . 2.2.2 Bestimmung der Dirac-Matrizen αl und β . . . . . . . . 2.2.3 Dirac-Gleichung mit elektromagnetischem Feld . . . . . 2.3 Operatoren, Mittelwerte und Ehrenfestsches Theorem . . . . . . . 2.4 Ebene-Welle-Lösungen für freie Teilchen . . . . . . . . . . . . . 2.5 Wellenpakete und Gruppengeschwindigkeit . . . . . . . . . . . . 2.6 Frontgeschwindigkeit von Wellenpaketen . . . . . . . . . . . . . 2.7 Mischung positiver und negativer Energien . . . . . . . . . . . . . 2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung . . . . . . . . 2.8.1 Zeitunabhängige Felder A und Φ . . . . . . . . . . . . . 2.8.2 Zeitabhängige Felder A und Φ . . . . . . . . . . . . . . Exkurs 2.1: Ableitungs-Linearisierung der Schrödinger-Gleichung 2.9 Spinoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.10 Kovarianz der Dirac-Gleichung . . . . . . . . . . . . . . . . . . . Exkurs 2.2:Allgemeines Transformationsgesetz für Dirac-Spinoren 2.11 Eigenschaften der Dirac-Matrizen γ α . . . . . . . . . . . . . . . 2.12 Kovariante Kontinuitätsgleichung . . . . . . . . . . . . . . . . . . 2.13 Diracs Löchertheorie und Theorie des Positrons . . . . . . . . . . 2.13.1 Lösungen negativer Energie und Löchertheorie . . . . . . 2.13.2 Positronlösungen durch Ladungskonjugation . . . . . . . 2.13.3 P-Invarianz, T-Invarianz und CPT-Symmetrie . . . . . . . 2.14 Dirac-Gleichung für Neutrinos . . . . . . . . . . . . . . . . . . . 2.15 Viel-Teilchen-Phänomene in der Dirac-Theorie . . . . . . . . . . 2.15.1 Kleinsches Paradoxon . . . . . . . . . . . . . . . . . . . 2.15.2 Polarisation des Vakuums . . . . . . . . . . . . . . . . . 2.15.3 Orts-Impuls-Unschärferelation und Paarerzeugung . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 4 7 10 14 16 17 20 24 26 29 33 34 39 40 42 45 49 53 55 57 57 62 66 74 76 76 79 80 81
Anwendungen der Dirac-Theorie Zitterbewegung des Elektrons . . . . . . . . . . . . . . . . . . . . . . .
86 86
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
viii
Inhaltsverzeichnis
3.2
Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen 3.2.1 Freie Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Teilchen mit elektromagnetischer Wechselwirkung . . . . . . . 3.3 Zur Feinstruktur des Wasserstoffatoms . . . . . . . . . . . . . . . . . . 3.4 Relativistisches Wasserstoffatom bei ruhendem Kern . . . . . . . . . . 3.4.1 Einführen von Polarkoordinaten und Variablenseparation . . . 3.4.2 Lösung für die winkelabhängigen Funktionen . . . . . . . . . 3.4.3 Lösung der Radialgleichungen, Energieeigenwerte und Eigenzustände . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.4 Diskussion der Energieniveaus . . . . . . . . . . . . . . . . . 3.5 Zur Hyperfeinstruktur des Wasserstoffatoms . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89 90 96 101 103 104 107
4 4.1 4.2 4.3 4.4 4.5 4.6 4.7
116 116 119 120 122 123 124 125 125 126 129 130
Klein-Gordon-Theorie Klein-Gordon-Schrödinger-Gleichung . . . . . . . . . . . . . . . Nicht-relativistischer Grenzfall . . . . . . . . . . . . . . . . . . . Schrödinger-Form der Klein-Gordon-Schrödinger-Gleichung . . . Geschwindigkeitsoperator . . . . . . . . . . . . . . . . . . . . . . Ebene-Welle-Lösungen für freie Teilchen . . . . . . . . . . . . . Ladungskonjugation . . . . . . . . . . . . . . . . . . . . . . . . . Reinterpretation der Klein-Gordon-Theorie . . . . . . . . . . . . 4.7.1 Kontinuitätsgleichung, Teilchendichte und Teilchenstrom 4.7.2 Physikalische Interpretation . . . . . . . . . . . . . . . . 4.8 Ladungskonjugation und CPT-Symmetrie . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
108 110 112 113
II
Quantenfeldtheorie
133
5
Einleitung zur Quantenfeldtheorie
135
6 6.1 6.2 6.3 6.4 6.5 6.6
Fock-Darstellung von Viel-Teilchen-Zuständen Darstellung von N-Teilchen-Zuständen . . . . . . . . . . . . . . . . . Erzeugungs- und Vernichtungsoperatoren für Bosonen . . . . . . . . . Erzeugungs- und Vernichtungsoperatoren für Fermionen . . . . . . . . Besetzungszahl- und Teilchenzahloperatoren . . . . . . . . . . . . . . . Darstellung physikalischer Observablen durch Erzeuger und Vernichter Feldoperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6.1 Unitäre Transformation zu Feldoperatoren . . . . . . . . . . . 6.6.2 Darstellung physikalischer Observablen durch Feldoperatoren . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
137 137 139 142 145 146 150 150 151 153
7 7.1 7.2 7.3
156 157 159 161
Klassische relativistische Feldtheorie Mechanisches Beispiel einer Feldtheorie . . . . . . . . . . . . . . . . . Hamiltonsches Prinzip für Feldtheorien . . . . . . . . . . . . . . . . . Hamiltonsche Bewegungsgleichungen für Feldtheorien . . . . . . . . .
Inhaltsverzeichnis
7.4
Anwendung auf spezielle Felder . . . . . . . . . . . . . . . 7.4.1 Schrödinger-Feld . . . . . . . . . . . . . . . . . . . 7.4.2 Klein-Gordon-Schrödinger-Feld . . . . . . . . . . . 7.4.3 Maxwell-Feld . . . . . . . . . . . . . . . . . . . . 7.4.4 Dirac-Feld . . . . . . . . . . . . . . . . . . . . . . 7.5 Noether-Theorem und Erhaltungssätze . . . . . . . . . . . . 7.5.1 Ableitung des allgemeinen Noether-Theorems . . . 7.5.2 Translationsinvarianz und Energie-Impuls-Erhaltung 7.5.3 Rotationsinvarianz und Drehimpulserhaltung . . . . 7.5.4 Eichinvarianz und Ladungserhaltung . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ix
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
8 8.1
164 164 167 170 172 174 174 177 180 184 185
Kanonische Feldquantisierung Quantisierung des Schrödinger-Feldes . . . . . . . . . . . . . . . . . . 8.1.1 Quantisierung für Bosonen . . . . . . . . . . . . . . . . . . . 8.1.2 Jordan-Wigner-Quantisierung für Fermionen . . . . . . . . . . 8.1.3 Zur physikalischen Bedeutung der Feldquantisierung . . . . . . 8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes . . . . . . . . . . 8.2.1 Bosonische Feldquantisierung . . . . . . . . . . . . . . . . . . 8.2.2 Lorentz-invariante Vertauschungsrelationen . . . . . . . . . . . 8.2.3 Mikrokausalität . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Quantisierung des Maxwellschen Vakuumfeldes . . . . . . . . . . . . . 8.3.1 Zahl der Freiheitsgrade des freien Feldes . . . . . . . . . . . . 8.3.2 Vertauschungsrelationen und Bewegungsgleichung . . . . . . . 8.3.3 Entwicklung nach Erzeugungs- und Vernichtungsoperatoren . . 8.3.4 Energie und Impuls der Photonen . . . . . . . . . . . . . . . . 8.3.5 Teilchenzahloperatoren und Metrik des Photonen-Hilbert-Raums 8.3.6 Berücksichtigung der Lorenz-Eichung . . . . . . . . . . . . . 8.3.7 Photonenspin . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.8 Vakuumfluktuationen . . . . . . . . . . . . . . . . . . . . . . 8.4 Quantisierung des freien Dirac-Feldes . . . . . . . . . . . . . . . . . . 8.4.1 Bewegungsgleichung für den Feldoperator ψ(x, t) . . . . . . . 8.4.2 Entwicklung nach ebenen Wellen . . . . . . . . . . . . . . . . 8.4.3 Eigenschaften der Spinoren u(l, p) und v(l, p) . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
189 191 192 199 201 202 203 214 216 218 218 219 222 226 227 229 231 234 236 237 238 245 247
9
250 252 255 258 264 264 265 269 271 273
9.1 9.2 9.3
9.4
Wechselwirkende Felder Exkurs 9.1: Erinnerung an das Wechselwirkungsbild . . . . . . . . Zeitgeordnete Produkte . . . . . . . . . . . . . . . . . . . . . . . . Wicksches Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . Propagatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.1 Feynman-Propagator des Klein-Gordon-Schrödinger-Feldes Exkurs 9.2: Hilfsmittel aus der Funktionentheorie . . . . . . . . . . 9.3.2 Feynman-Propagator des Dirac-Feldes . . . . . . . . . . . 9.3.3 Feynman-Propagator des Maxwell-Feldes . . . . . . . . . Anwendung der Störungstheorie auf Streuprozesse . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
x
Inhaltsverzeichnis
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
274
10 10.1 10.2
276 278 280 280 285 292 299 305 315 317 317 320 322 322 324 325 326 329 330 339 339 344 349 349 352 361 364 368
Quantenelektrodynamik Alphabet der Feynman-Diagramme . . . . . . . . . . . . . . . Streuprozesse erster Ordnung . . . . . . . . . . . . . . . . . . 10.2.1 Streuprozesse freier Teilchen . . . . . . . . . . . . . 10.2.2 Elektronenstreuung an festem Kern . . . . . . . . . . 10.3 Streuprozesse zweiter Ordnung . . . . . . . . . . . . . . . . . 10.3.1 Übergangsamplituden . . . . . . . . . . . . . . . . . 10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen . . . . . . . . 10.5 Teilchenzerfälle . . . . . . . . . . . . . . . . . . . . . . . . . 10.6 Feynman-Regeln . . . . . . . . . . . . . . . . . . . . . . . . 10.6.1 Feynman-Regeln der QED im Impulsraum . . . . . . 10.7 Korrekturen vierter Ordnung . . . . . . . . . . . . . . . . . . 10.8 Strahlungskorrekturen . . . . . . . . . . . . . . . . . . . . . . 10.8.1 Primitiv divergente Feynman-Graphen . . . . . . . . 10.8.2 Vakuumgraphen und Fermionenringe . . . . . . . . . 10.8.3 Photon-Photon-Streuung . . . . . . . . . . . . . . . . 10.8.4 Selbstenergien, Vertexkorrektur und Ward-Identität . . 10.9 Dimensionsmäßige Regularisierung . . . . . . . . . . . . . . Exkurs 10.1: Mathematische Hilfsmittel zur Regularisierung . 10.10 Renormierung . . . . . . . . . . . . . . . . . . . . . . . . . . 10.10.1 Vorbereitung . . . . . . . . . . . . . . . . . . . . . . 10.10.2 Renormierung in niedrigster Ordnung . . . . . . . . . 10.11 Auswirkungen regulärer Strahlungskorrekturen . . . . . . . . 10.11.1 Uehling-Potential . . . . . . . . . . . . . . . . . . . 10.11.2 Anomales magnetisches Moment des Elektrons . . . . 10.12 Strahlungskorrekturen höherer Ordnung und Renormierbarkeit 10.13 Quantentheorie versus Quantenfeldtheorie . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
III
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
Einführung in die Elementarteilchentheorie
373
11 Einleitung zur Elementarteilchentheorie 11.1 Historischer Rückblick auf die Entdeckung der Elementarteilchen . . . 11.2 Erster Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
375 378 385 390
12 12.1 12.2 12.3 12.4 12.5 12.6
391 391 396 400 403 405 407
Elemente der Gruppentheorie Definitionen . . . . . . . . . . . . . . . . . . . . . . Morphismen, Wirkung und Darstellung von Gruppen Matrixgruppen . . . . . . . . . . . . . . . . . . . . . Lie-Gruppen und Generatoren . . . . . . . . . . . . Lineare Lie-Gruppen . . . . . . . . . . . . . . . . . Lie-Algebra der Generatoren . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Inhaltsverzeichnis
xi
Erzeuger der Gruppe SU (2) . . . . . . . . . . . . . Gruppe S O(3) . . . . . . . . . . . . . . . . . . . . . Lokale Äquivalenz der Gruppen SU (2) und S O(3) . Gruppe SU (3) . . . . . . . . . . . . . . . . . . . . . Höherdimensionale Darstellungen der Gruppe SU (2) Gruppen und Symmetrien . . . . . . . . . . . . . . . Anhang: Ergebnisse aus der Matrizentheorie . . . . . 12.13.1 Invarianten äquivalenter Matrizen . . . . . . 12.13.2 Determinante der Matrix e J . . . . . . . . . 12.13.3 Determinante unitärer Matrizen . . . . . . . 12.13.4 Eigenschaften der Pauli-Matrizen . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
409 410 413 415 416 418 418 418 419 420 420 421
13 Gruppierung von Teilchenzuständen 13.1 Spin 1/2 und Gruppe SU (2) . . . . . 13.2 Isospin . . . . . . . . . . . . . . . . . 13.3 Farbladung und Gruppe SU (3) . . . . 13.4 Baryonen aus u, d und s . . . . . . . . 13.5 Mesonen aus u, d und s . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
423 424 427 433 434 438 440
14 Teilchen, Felder und Lagrange-Funktion 14.1 Lagrange-Funktion und Hamiltonsches Variationsprinzip für Felder 14.2 Klein-Gordon-Schrödinger-Gleichung . . . . . . . . . . . . . . . . 14.3 Maxwell- und Proca-Gleichungen . . . . . . . . . . . . . . . . . . 14.4 Lorentz-Invarianz und Dirac-Gleichung . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
441 441 442 443 444 450
12.7 12.8 12.9 12.10 12.11 12.12 12.13
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
15 15.1 15.2
Eichinvarianz und Eichfelder U (1)-Invarianz von Klein-Gordon-Schrödinger- und Dirac-Feld . . . . SU (2)-Invarianz und Yang-Mills-Feld . . . . . . . . . . . . . . . . . . 15.2.1 Feldgleichungen für das Yang-Mills-Feld . . . . . . . . . . . . 15.3 SU (3)-Invarianz und Gluonenfeld . . . . . . . . . . . . . . . . . . . . Exkurs 15.1: Geometrische Interpretation der kovarianten Ableitung . . . . . . . . . . . . . . . . . . . . 15.4 Gebrochene Eichsymmetrie und Ruhemassen . . . . . . . . . . . . . . 15.4.1 Brechung einer globalen U (1)-Symmetrie . . . . . . . . . . . 15.4.2 Brechung einer lokalen U (1)-Symmetrie und Higgs-Mechanismus Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
451 452 456 462 464
16 16.1 16.2
477 477 479 479 486 487
Standardmodell Voraussetzungen des Standardmodells . . . . . . . . . . . . . . Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung 16.2.1 Leptonenanteil L . . . . . . . . . . . . . . . . . . . . Exkurs 16.1: Fall unterschiedlicher U º1»-Kopplungsfelder . . . 16.2.2 Lagrange-Dichte B für freie Bosonenfelder . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
465 467 468 473 475
xii
Inhaltsverzeichnis
16.2.3 Modifizierte Maxwell-Gleichungen . . . . . . . . . . . . . . . Einbeziehung der Quarks . . . . . . . . . . . . . . . . . . . . . . . . . 16.3.1 U (1)- und SU (2)-invarianter -Anteil der Quarks . . . . . . . 16.3.2 SU (3)-invarianter -Anteil der Quarks: Quantenchromodynamik 16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes . . . . . . . 16.4.1 Bosonenmassen . . . . . . . . . . . . . . . . . . . . . . . . . 16.4.2 Leptonenmassen . . . . . . . . . . . . . . . . . . . . . . . . . 16.4.3 Ruhemassen freier Quarks . . . . . . . . . . . . . . . . . . . . Exkurs 16.2: Quarkeinschluß und Gluonen . . . . . . . . . . . . . . . . 16.4.4 Quarkmischung . . . . . . . . . . . . . . . . . . . . . . . . . 16.5 Gesamt-Lagrange-Dichte . . . . . . . . . . . . . . . . . . . . . . . . . 16.6 Kosmologische Implikationen des Higgs-Feldes . . . . . . . . . . . . . 16.7 Experimentelle Tests des Standardmodells . . . . . . . . . . . . . . . . 16.7.1 Nachweis der Eichbosonen . . . . . . . . . . . . . . . . . . . 16.7.2 Zahl der Familien . . . . . . . . . . . . . . . . . . . . . . . . 16.7.3 Weitere Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.7.4 Zum Nachweis des Higgs-Bosons . . . . . . . . . . . . . . . . 16.8 Anhang zur Diagonalisierung von Matrizen . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
490 491 491 493 494 494 500 502 504 507 513 515 517 517 518 519 519 520 521
17 17.1
523 523 524 525 528 534 538
16.3
Über das Standardmodell hinausführende Entwicklungen Neutrinomassen und Neutrinooszillationen . . . . . . . . . . . . . . . 17.1.1 Neutrinos als massive Majorana-Teilchen . . . . . . . . . . . 17.1.2 Neutrinooszillationen . . . . . . . . . . . . . . . . . . . . . 17.2 Große Vereinheitlichungstheorien . . . . . . . . . . . . . . . . . . . 17.3 Supersymmetrie, Einbindung der Gravitation und Superstringtheorien Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
Literaturverzeichnis
539
Sachregister
540
I
Relativistische Quantenmechanik
1
Einleitung zur Relativistischen Quantenmechanik
Aus dem Korrespondenzprinzip folgt, daß es in Analogie zur relativistischen Mechanik auch eine relativistische Quantenmechanik geben muß. Interessanterweise hat E. Schrödinger noch vor der Schrödinger-Gleichung als erstes eine relativistische „Wellengleichung“ aufgestellt. Er publizierte diese jedoch nicht, weil sie nicht die richtige Feinstruktur der Energieniveaus des Wasserstoffatoms lieferte. Erst, nachdem er bemerkt hatte, daß sie einen brauchbaren nicht-relativistischen Limes liefert, wollte er das nachholen, doch da waren ihm bereits O. Klein und W. Gordon zuvorgekommen. Aus diesem Grund wird die auch von ihm entdeckte Gleichung heute meist als KleinGordon-Gleichung bezeichnet. Sie hat sich als korrekte relativistische Gleichung für Spin-0-Teilchen erwiesen und wird daher ausführlich in Kapitel 4 untersucht. Dabei soll der frühere Usus, sie als Klein-Gordon-Schrödinger-Gleichung zu bezeichnen, wieder aufleben. Anders als die Schrödinger-Gleichung enthält die Klein-Gordon-SchrödingerGleichung Zeitableitungen zweiter Ordnung. Sie paßt daher zunächst nicht nicht in das in Kapitel Q6 entwickelte allgemeine Schema der Quantenmechanik, kann jedoch durch eine geeignete Umformulierung in dieses eingepaßt werden. 1928 gelang es P. A. M. Dirac, eine relativistisch invariante Gleichung vom Typ der Schrödinger-Gleichung aufzustellen. Möglich wurde das durch den Übergang von der einkomponentigen komplexen Wellenfunktion der Schrödinger-Gleichung zu einem mehrkomponentigen komplexen Spinor, und als nicht-relativistischer Limes der DiracGleichung ergab sich die Pauli-Gleichung für Spin-1/2-Teilchen. Die Dirac-Gleichung erwies sich dadurch als relativistische Gleichung für spinbehaftete Teilchen, während sich der Spin damit als ein Effekt der Relativitätstheorie herausstellte. Wie bei der KleinGordon-Schrödinger-Gleichung gibt es Lösungen positiver und negativer Energie. Um das Problem zu vermeiden, daß von allen Lösungen positiver Energie der Übergang zu Lösungen negativer Energie erfolgt, erklärte Dirac alle Zustände negativer Energie als bereits besetzt. Die konsequente Fortführung dieser Idee führte ihn schließlich dazu, den durch Anregung bzw. Überführung von besetzten Zuständen negativer in Zustände positiver Energie entstehenden Leerplätzen eine Rolle als Antiteilchen zuzuweisen. Im Teil Quantenmechanik wurden Wellenfunktionen für ein und für mehrere Teilchen eingeführt. Die hier dargebotene relativistische Quantenmechanik beschränkt sich auf eine Ein-Teilchen-Beschreibung. Schon bei dieser treten verschiedentlich Mehr-Teilchen-Effekte auf, wie das angeführte Beispiel der Erzeugung von Antiteilchen durch Löcherbildung demonstriert. Mit derartigen Effekten ist immer dann zu rechnen, wenn die Energie des durch die relativistische Gleichung beschriebenen Einzelteilchens die der Ruhemasse eines geeigneten anderen Teilchens äquivalente Energie übersteigt. Dies zeigt, daß es im Grunde keine konsistente relativistische Ein-Teilchen-Quantenmechanik gibt. Die logische Konsequenz davon besteht im Ausbau der relativistischen Quantenmechanik zu einer systematischen relativistischen Mehr-Teilchen-Theorie, was in der im nächsten Teil des Buches behandelten Quantenfeldtheorie geschehen wird.
2
Dirac-Theorie des Elektrons und des Neutrinos
Die im ersten Teil dieses Buchs behandelte Quantenmechanik ist nicht-relativistisch. Sie steht in Korrespondenz zur Newtonschen Mechanik und ist dementsprechend Galileiinvariant. Wir können nicht erwarten, daß sie auch im relativistischen Regime gültig bleibt. Schon bei der Dynamik eines Elektrons im Atom ergeben sich bei klassischer Rechnung so hohe Geschwindigkeiten, daß meßbare relativistische Korrekturen zu erwarten sind. Das gilt um so mehr z. B. für hochenergetische Stoßprozesse in Teilchenbeschleunigern. Dieses Kapitel ist einer relativistischen Quantenmechanik von Elektronen gewidmet. Es wird sich herausstellen, daß die bisherigen Konzepte der Quantenmechanik auch im relativistischen Regime brauchbar bleiben. Dennoch liefert eine relativistische Quantentheorie wesentlich mehr als nur relativistische Korrekturen zur bisherigen Theorie. So erklärt z. B. die von Dirac entwickelte Quantentheorie geladener Punktteilchen ganz von selbst den Spin 1/2 der Elektronen und Positronen. Nun besitzen aber beileibe nicht alle Teilchen den Spin 1/2. Dies deutet darauf hin, daß mit dem Einbringen relativistischer Konzepte in die Quantenmechanik auch eine stärkere Diversifizierung verbunden ist. Ein generelles Problem der relativistischen Quantenmechanik ist das Auftreten von Zuständen negativer Energie. Wie bereits in der Einleitung gesagt löste Dirac dieses, indem er forderte, daß alle negativen Energiezustände der Elektronen im allgemeinen von Elektronen besetzt sind. Wird eines von diesen durch Energiezufuhr in einen Zustand positiver Energie überführt, so hinterläßt es ein unbesetztes Loch, das Dirac als positiv geladenes Teilchen interpretierte. Mit Hilfe dieser Vorstellung kann nicht nur die Existenz des Positrons gefolgert, sondern auch noch eine Reihe weiterer, bei Elektronen und Positronen auftretender Phänomene gedeutet werden. Wir werden allerdings sehen, daß diese Interpretation nicht in allen Konsequenzen haltbar ist, und werden sie daher später im Rahmen der Quantenfeldtheorie ersetzen.
2.1 Ergebnisse der klassischen relativistischen Mechanik Wir beabsichtigen, eine relativistische Bewegungsgleichung quantenmechanischer Zustände für die Dynamik geladener Punktteilchen in einem elektromagnetischen Feld aufzustellen. Dabei möchten wir uns so eng wie möglich an das erprobte Vorgehen im nicht-relativistischen Fall anlehnen und benötigen die Bewegungsgleichung daher in Hamiltonscher Form.
2.1 Ergebnisse der klassischen relativistischen Mechanik
5
Die relativistische Bewegungsgleichung für die Bewegung eines Punktteilchens im elektromagnetischen Feld lautet in der Newtonschen Form d mÚ dt mit m
q E Ú B
(2.1)
m0 . 1v 2 /c2
(2.2)
Die Felder E und B lassen sich durch E
Φ ∂∂tA ,
B
A
(2.3)
auf die Potentiale A und Φ zurückführen. Die (2.1) äquivalente Hamiltonsche Form der Bewegungsgleichung ist nach der Speziellen Relativitätstheorie, Abschn. „Lagrange und Hamilton-Formulierung der Bewegungsgleichung“ ∂H ∂H p , ∂p ∂x 2 qΦ(x, t) c m 02 c2 p q A(x, t) . x
mit H
(2.4) (2.5)
(Wir benutzen in der relativistischen Quantenmechanik für den Ortsvektor die Bezeichnung x.) Der Zusammenhang zwischen der Geschwindigkeit Ú x und dem Impuls p folgt aus (2.4a) mit (2.5) und lautet p
q A mÚ .
(2.6)
Für spätere Zwecke sei angemerkt, daß sich aus (2.5) mit (2.6) H
qΦ mc2
(2.7)
ergibt. Die Gleichungen (2.4) sind formal identisch mit den kanonischen Bewegungsgleichungen der nicht-relativistischen Mechanik. Daher gelten für sie alle Konsequenzen, die in der klassischen Mechanik aus ihrer kanonischen Form abgeleitet wurden. Insbesondere bedeutet dies, daß sie auch in die Form 2 ∂S ∂S ∂S ∂S 2 2 H x, p ∂ x , t ∂t qΦ c m 0 c ∂ x q A 0 (2.8) ∂t von Hamilton und Jacobi gebracht werden können. Der Zusammenhang zwischen der Wirkungsfunktion S und den mechanischen Größen p bzw. x ist dabei wie in der klassischen Mechanik durch ∂S p (2.9) ∂x und (2.6) mit Ú und es folgt
x gegeben. Im Fall ∂ H /∂t
0 gilt Energieerhaltung, H
E
const,
6
2 Dirac-Theorie des Elektrons und des Neutrinos
∂S ∂t
E.
(2.10)
Wir werden später bei der Quantisierung von Gleichung (2.8) zu deren Quadrat
∂S ∂t
qΦ
2
m 02 c4 c2
∂S ∂x
2
qA
(2.11)
übergehen. Man kann sich schon klassisch einen Teil der Konsequenzen überlegen, die dieses Vorgehen mit sich bringt: Für Φ 0 und A A(x) ist H nicht explizit zeitabhängig, es gilt der Energieerhaltungssatz, und (2.11) ist dann den zwei Gleichungen ∂S ∂t
H E
(2.12)
äquivalent. Dies bedeutet, daß zu jeder Lösung positiver Energie (mit ∂ S/∂t E) auch eine Lösung negativer Energie (mit ∂ S/∂t E) existiert. Beim Aufstellen der Schrödinger-Gleichung in der nicht-relativistischen Quantenmechanik (Abschn. Q3.2.3) wurde neben der Hamilton-Jacobi-Gleichung auch eine Kontinuitätsgleichung benutzt. Wir wollen daher auch eine entsprechende relativistische Kontinuitätsgleichung bereitstellen. n 0 N/V0 sei die Dichte ruhender Teilchen. Mit dem Vierervektor der Geschwindigkeit 1 Uμ c, Ú (2.13) 1 v 2 /c2 und der Summenkonvention ist ∂μ (n 0 U μ ) bzw.
n0 ∂ ∂t 1 v 2 /c2
div
0
(2.14)
n0 Ú
1 v 2 /c2
0
(2.15)
eine Lorentz-invariante Erhaltungsgleichung, die im Limes v/c 0 in die klassische Kontinuitätsgleichung übergeht. Definieren wir noch durch n N/V (mit N Zahl der Teilchen und V V0 1 v 2 /c2 bewegtes Volumen) bzw. n
n0 1 v 2 /c2
mit
n0
N V0
(2.16)
eine Dichte der bewegten Teilchen, so erhalten wir aus (2.15) schließlich die Kontinuitätsgleichung ∂n div(nÚ) 0 . (2.17) ∂t Dabei ist Ú aus (2.4)–(2.6) zu entnehmen.
2.2 Aufstellung der Dirac-Gleichung
7
2.2 Aufstellung der Dirac-Gleichung In der nicht-relativistischen Quantenmechanik hatte sich als allgemeines Schema zur Aufstellung einer „Wellengleichung“ ergeben, daß man für diese ih ∂t ψ
ψ H
ansetzt und in ihr den Hamilton-Operator H aus der Hamilton-Funktion H (q, p, t) gemäß h H H q, p p , t i berechnet. Eine äquivalente Korrespondenzregel, die Ort und Zeit symmetrisch behandelt, wäre: In der klassischen Definitionsgleichung H H (q, p, t) der HamiltonFunktion, die auf der rechten Seite eine dem speziellen Problem angepaßte Funktion von q, p und t enthält, ersetzt man h (2.18) i und erhält dadurch eine Operatorgleichung. Wird diese von rechts mit ψ multipliziert, so daß die Operatoren auf die Wellenfunktion ψ einwirken, so erhält man die quantenmechanische Bewegungsgleichung. Wird nach diesem Schema auch der relativistische Fall behandelt, so ergibt sich aus (2.5) 2 h ih ∂t ψ qΦ ψ c m 02 c2 q A ψ. (2.19) i H
ih ∂t ,
p p
Da der Operator unter der Wurzel erscheint, wäre die rechte Seite zunächst nicht definiert. Hier könnte man sich damit behelfen, die rechte Seite durch eine geeignete Potenzreihenentwicklung zu erklären. Dann treten auf dieser aber sämtliche Ortsableitungen von ψ auf, die symmetrische Behandlung von Raum und Zeit in der Korrespondenzregel schlagen sich also im relativistischen Fall nicht in der mit dieser abgeleiteten Bewegungsgleichung nieder. Physikalisch würde die Abhängigkeit der Zeitableitung ∂t ψ von allen Ortsableitungen (also von sämtlichen Koeffizienten einer Taylor-Entwicklung von ψ) bedeuten, daß wir es mit einer nicht-lokalen Theorie zu tun haben, weil die zeitliche Veränderung von ψ an einem Raumpunkt durch alle räumlichen Werte, die ψ zum selben Zeitpunkt annimmt, beeinflußt würde. Ein derartiges Verhalten ist nicht, was wir von einer relativistischen Theorie erwarten. Wir müssen uns daher nach anderen Wegen umsehen, zu einer relativistischen quantenmechanischen Bewegungsgleichung zu gelangen.1 Wie im nicht-relativistischen Fall suchen wir nach einer Bewegungsgleichung, die eine Reihe physikalisch motivierter Forderungen erfüllt. Dabei können die meisten Forderungen des nicht-relativistischen Falls mit unveränderter Begründung direkt übernommen werden. (Es empfiehlt sich also, noch einmal einen Blick auf Abschn. Q3.2.3 1 Schon hier sei darauf hingewiesen, daß wir im Rahmen der Theorie der im folgenden aufgestellten DiracGleichung bei einer speziellen Fragestellung dennoch auf Gleichung (2.19) zurückgeführt werden (siehe Abschn. 3.2.1).
8
2 Dirac-Theorie des Elektrons und des Neutrinos
der Quantenmechanik zu werfen.) Wo unsere Forderungen von dem früher betrachteten Fall abweichen müssen, ist unmittelbar evident, so daß sie hier ohne weitere Begründung aufgeführt werden können. 1. Die Gleichung ist linear und homogen im Zustand ψ. Zur besseren Vergleichbarkeit mit der klassischen relativistischen Mechanik wird für diesen die Ortsdarstellung benutzt. 2. Die Gleichung enthält nur Zeitableitungen erster Ordnung. Wegen der Gleichberechtigung von Raum und Zeit in der Relativitätstheorie wird zusätzlich gefordert, daß sie auch nur Ortsableitungen erster Ordnung enthält. 3. Die im quasiklassischen Grenzfall in die Teilchendichte übergehende Wahrscheinlichkeitsdichte n ist eine quadratische Funktion der Wellenamplitude. 4. Die Forderungen des Korrespondenzprinzips sollen erfüllt sein, d. h. die Bewegungsgleichung soll im quasiklassischen Grenzfall zu Gleichung (2.8) bzw. (2.11) und der zugehörigen Kontinuitätsgleichung (2.17) führen. 5. Die Bewegungsgleichung soll die einfachste aller möglichen Gleichungen sein, welche die Forderungen 1–4 erfüllen. Forderung 2 ist im Grunde sogar überflüssig, denn die Bewegungsgleichung wird sicher am einfachsten (Forderung 5), wenn sie nur Ableitungen erster Ordnung enthält, und es stellt sich heraus, daß damit alle anderen Forderungen erfüllt werden können. Der einfachste Ansatz für eine mit den gestellten Forderungen verträgliche Bewegungsgleichung ist ∂t ψ
aψ
al ∂l ψ
(2.20)
mit komplexen Koeffizienten a und al . Dabei wird die Summenkonvention in der Form benutzt, daß bei doppeltem Auftreten lateinischer Indizes nur über die räumlichen Komponenten 1, 2 und 3 summiert wird. Daß der Zeitableitungsterm nicht mit einem Koeffizienten behaftet ist, bedeutet keine Einschränkung, denn man kann sich vorstellen, daß ein etwaiger Koeffizient herausgekürzt wurde. (Diese Möglichkeit besteht auch für den sich später als notwendig herausstellenden Fall, daß ψ ein Spaltenvektor ist und a sowie al dementsprechend Matrizen repräsentieren. Man müßte in diesem Fall einfach mit einer inversen Matrix multiplizieren.) Jetzt zerlegen wir ψ mit dem Ansatz ψ
A eiS/h
(2.21)
in einen Amplitudenfaktor A und einen (skalaren) Phasenfaktor eiS/h mit reellem S. Im nicht-relativistischen Fall hatten wir verlangt, daß auch A ein reeller Skalar ist. Da wir mit dieser Forderung im relativistischen Fall nicht durchkommen werden, lassen wir sie fallen. Im nicht-relativistischen Fall hatten wir außerdem den Phasenfaktor in der Form eiG angesetzt und für den quasiklassischen Grenzfall nur G S/h verlangt, der Proportionalitätsfaktor ergab sich im Nachhinein aus den de Broglie-Relationen zu eins. Wir ersparen uns diesmal das Mitschleppen eines Proportionalitätsfaktors, indem wir mit dem Ansatz (2.21) gleich dessen richtigen Wert einführen. Allerdings werden wir das der Ordnung halber nachträglich überprüfen.
2.2 Aufstellung der Dirac-Gleichung
9
ψ
Abb. 2.1: Lokalisiertes Wellenpaket im quasiklassischen Grenzfall.
d
Mit dem Ansatz (2.21) ergibt sich aus (2.20) nach Herauskürzen des Phasenfaktors
i i (2.22) ∂t A A ∂t S a A al ∂l A A ∂l S . h h Nun wenden wir uns dem quasiklassischen Grenzfall dieser Gleichung zu. In diesem wird sich das das Teilchen repräsentierende Wellenpaket auf eine kleine Umgebung des klassischen Teilchenorts konzentrieren (Abb. 2.1), während S direkt mit der klassischen Wirkungsfunktion übereinstimmen muß. Größenordnungsmäßig gilt ∂t A A/t, wobei t d/v die Zeit ist, die das Wellenpaket zum Durchlaufen eines Gebietes der Ausdehnung d benötigt. Mit (2.10) ergibt sich dann
∂t A h . A ∂t S Et i h
(2.23)
Analog ist ∂l A A/d, und mit (2.9) ergibt sich
∂l A h . A ∂l S pl d i h
(2.24)
Es wird sich herausstellen, daß A ein Spaltenvektor sein muß. Die Abschätzungen (2.23)–(2.24) sind dann so zu verstehen, daß sie für dessen Komponenten gelten. Etwas vage ausgedrückt steht zu erwarten, daß die Quantenmechanik für große Energien und Impulse in die klassische Mechanik übergeht. Präziser definieren wir als quasiklassischen Grenzfall, daß die Bedingungen Et
h ,
pl d h
(2.25)
erfüllt sind. Aufgrund der Abschätzungen (2.23)–(2.24) können wir dann in Gleichung (2.22) zwei Terme, ∂t A und al ∂l A, vernachlässigen und erhalten als deren quasiklassischen Grenzfall h ∂t S a al ∂l S . (2.26) i Offensichtlich läßt sich durch keine Wahl der Koeffizienten a und al erreichen, daß (2.26) die Form von Gleichung (2.8) annimmt, ja das wäre selbst dann nicht möglich, wenn wir in den Ansatz (2.22) Terme mit höheren Ableitungen von S aufgenommen hätten. Das unser Vorhaben störende Element ist die in (2.8) auftretende Wurzel. Diese
10
2 Dirac-Theorie des Elektrons und des Neutrinos
können wir beseitigen, indem wir Gleichung (2.8) quadrieren. Die entstehende Gleichung (2.11) vergleichen wir mit dem Quadrat von Gleichung (2.26) in der symmetrisierten Form2 h 1 (∂t S)2 h 2 a 2 (2.27) a al al a ∂l S al am am al (∂l S)∂m S . i 2 Es wurde schon darauf hingewiesen, daß (2.11) eine größere Lösungsmannigfaltigkeit als (2.8) besitzt. Dementsprechend steht zu erwarten, daß auch die Bewegungsgleichung für ψ eine größere Lösungsmannigfaltigkeit aufweisen wird, als ursprünglich beabsichtigt wurde: Wir müssen darauf gefaßt sein, auch quantenmechanische Lösungen mit negativer Energie zu erhalten. Da die Bewegungsgleichung (2.26) alle Lösungen generieren wird, die mit den Lösungen von (2.8) in Korrespondenz stehen, bedeutet unser Verfahren jedenfalls keine Einschränkung. Es erhebt sich nur die Frage, wie die zusätzlichen Lösungen zu deuten sind. Diesem Problem werden wir uns später ausführlich zuwenden.
2.2.1 Dirac-Gleichung im kräftefreien Fall Jetzt wenden wir uns der Bestimmung der Koeffizienten a und al zu. Der besseren Übersichtlichkeit halber behandeln wir zunächst den einfachen Fall, in dem die Felder Φ und A verschwinden. Gleichung (2.11) reduziert sich in diesem auf
∂S ∂t
2
m 02 c4 c2
∂S ∂x
2 .
(2.28)
Der Koeffizientenvergleich zwischen (2.27) und (2.28) liefert die Bedingungen
a2
m 0 c2 h
2 ,
a al
al a
0,
al am
am al
2δlm c2 .
(2.29)
Wieder geht es nicht so glatt wie im nicht-relativistischen Fall, denn wir müssen feststellen, daß die Gleichungen (2.29) nicht mit skalaren Koeffizienten a und al befriedigt werden können: Aus der ersten Gleichung folgt a 0, die zweite ist dann nur mit al 0 erfüllbar, und das steht im Widerspruch zur dritten Gleichung. Die Situation ist jedoch nicht so gravierend, wie es zunächst erscheint: Das Feld ψ(x, t) muß nicht notwendig 2
Es gilt (∂t S)2
h a al ∂l S i
h a al ∂l S i
h 2 a2 hi
a al
al a
∂l S (al ∂l S)2 .
Die Symmetrisierung des Terms (al ∂l S)2 ergibt sich gemäß (al ∂l S)2
al (∂l S) am (∂m S) am (∂m S) al (∂l S) 1 al (∂l S) am (∂m S) am (∂m S) al (∂l S) 2
1 (al am 2
am al ) (∂l S)(∂m S) .
Sie ist nur von Belang, wenn das Produkt al am nicht vertauschbar ist, was der Fall ist, wenn es sich bei den al um Matrizen handelt.
2.2 Aufstellung der Dirac-Gleichung
11
ein Skalarfeld wie das Schrödinger-Feld sein. Wir kennen anderes aus der Elektrodynamik, und im Rahmen der Quantenmechanik hat uns schon die Pauli-Gleichung mit Alternativen vertraut gemacht. Setzen wir ψ als mehrkomponentige Wellenfunktion ⎛ ⎞ ⎛ ⎞ ψ1 A1 . ψ ⎝ ... ⎠ ⎝ .. ⎠ eiS/h (2.30) An ψn
an, so müssen die Koeffizienten a und al in Gleichung (2.20) n n–Matrizen sein, damit diese einen Sinn ergibt. Die linke Seite von Gleichung (2.26) ist entsprechend so zu interpretieren, daß ∂t S mit der n n–Einheitsmatrix multipliziert ist, ∂t S E ∂t S .3 Die Größe S bleibt dabei wie vorausgesetzt ein reeller Skalar. Man prüft leicht nach, daß alle zwischen (2.20) und (2.29) ausgeführten Schritte mit unserer jetzigen Interpretation der Größen ψ, a und al verträglich sind. Auch der Übergang von der Matrixgleichung (2.27) zu der skalaren Gleichung (2.28) bereitet keine weiteren Interpretationsschwierigkeiten: Unter den Bedingungen (2.29) enthält jeder Term in (2.27) die Einheitsmatrix; kürzt man diese heraus, so ergibt sich für die quantenmechanische Phase S die skalare Gleichung (2.28). Wir haben noch eine weitere Forderung des Korrespondenzprinzips zu erfüllen: Die quantenmechanische Wahrscheinlichkeitsdichte n muß im quasiklassischen Grenzfall der Kontinuitätsgleichung (2.17) genügen. Für die Zustände (2.30) ist die sinnvollste Definition einer mit der Forderung 3 des letzten Abschnitts verträglichen Wahrscheinlichkeitsdichte n ψi ψi . Definieren wir als zu ψ adjungierten Zustand den Zeilenvektor bzw. die Zeilenmatrix ψ ψ1 , . . . , ψn , (2.31) n so läßt sich dafür ψi ψi (2.32) n ψψ i 1
schreiben. (Wir werden später zu einer etwas anderen Dichte ψψ mit einer noch zu definierenden Größe ψ übergehen.) n ist positiv definit, wie zu fordern ist, wenn n als Wahrscheinlichkeitsdichte interpretiert werden soll. Die Zeitableitung von n erhalten wir mit Hilfe der auch bei Anwesenheit von Feldern Φ und A gültigen Bewegungsgleichung (2.20) und der zu dieser adjungierten Gleichung (∂t ψ)
ψ a (∂l ψ) al ,
(2.33)
indem wir (2.20) von links mit ψ , (2.33) von rechts mit ψ multiplizieren und die erhaltenen Gleichungen addieren. Mit (∂t ψ) ∂t ψ und (∂l ψ) ∂l ψ erhalten wir auf diese Weise (2.34) ∂t n ψ (a a ) ψ ψ al ∂l ψ (∂l ψ ) al ψ . Für den quasiklassischen Grenzfall ergibt sich keine Vereinfachung der Struktur dieser Gleichung. Wenn sie also im quasiklassischen Grenzfall die Form einer Kontinuitätsgleichung annehmen soll, muß das ganz allgemein gelten. Dazu muß der erste Term der 3 Man beachte den Unterschied zwischen der Einheitsmatrix E und der Energie E.
12
2 Dirac-Theorie des Elektrons und des Neutrinos
rechten Seite verschwinden und die beiden letzten müssen zusammen eine Divergenz ergeben, d. h. wir erhalten die Forderungen a
a
0,
al
al
,
(2.35)
die aufgrund der Allgemeingültigkeit des Ansatzes (2.26) auch für Φ 0 und A0 gelten. Mit (2.35) vereinfacht sich (2.34) zu ∂t n ∂l (ψ al ψ) 0 .
(2.36)
Wir werden sehen, daß diese Gleichung im quasiklassischen Grenzfall (2.17) liefert, ohne daß weitere Forderungen gestellt werden müssen. Im nächsten Abschnitt wird sich herausstellen, daß die Matrizen a und al mindestens 4 4–Matrizen sein müssen, damit alle Gleichungen (2.29) und (2.35) erfüllt werden können. Sie werden bis auf eine unitäre Transformation eindeutig festgelegt (siehe nächster Abschnitt), wenn es sich um 4 4–Matrizen handelt, bei höherer Dimension der Matrizen geht diese Art der Eindeutigkeit verloren. Im Sinne unserer Forderung nach maximaler Einfachheit der Bewegungsgleichung werden wir uns für 4 4–Matrizen entscheiden. Die Wellenfunktion wird damit zu einem vierkomponen⎛ ⎞ tigen Spaltenvektor ψ1 ⎜ ψ2 ⎟ ψ ⎝ ⎠, (2.37) ψ3 ψ4 für den sich aus später ersichtlichen Gründen (siehe Exkurs 2.1) der Name Spinor oder Dirac-Spinor eingebürgert hat. Der zu ψ adjungierte Spinor ist nach (2.31) ψ
(ψ1 , ψ2 , ψ3 , ψ4 ) ,
(2.38)
es handelt sich bei ihm um eine Zeilenmatrix. Nach den Regeln der Matrizenmultiplikation, Multiplikation der Zeilen der linken mit den Spalten der rechten Matrix, gibt es zwischen zwei Rechtecksmatrizen ψ und ϕ mit einer Zeile bzw. einer Spalte zum einen das Produkt ⎛ ⎞ ϕ1 ϕ ⎜ ⎟ (2.39) ψ ϕ (ψ1 , ψ2 , ψ3 , ψ4 ) ⎝ 2 ⎠ ψ1 ϕ1 ψ2 ϕ2 ψ3 ϕ3 ψ4 ϕ4 , ϕ3 ϕ4 das zu einer 1 1-Matrix mit dem Element 4i 1 ψi ϕi Produkt ⎛ ⎞ ⎛ ϕ1 ϕ1 ψ1 ϕ1 ψ2 ⎜ϕ ⎟ ⎜ ϕ ψ ϕ2 ψ2 ϕψ ⎝ 2 ⎠ (ψ1 , ψ2 , ψ3 , ψ4 ) ⎝ 2 1 ϕ3 ϕ3 ψ1 ϕ3 ψ2 ϕ4 ϕ4 ψ1 ϕ4 ψ2 das zu einer 4 4-Matrix mit den Elementen ϕi ψk führt.
führt, und zum anderen das ϕ1 ψ3 ϕ2 ψ3 ϕ3 ψ3 ϕ4 ψ3
⎞ ϕ1 ψ4 ϕ2 ψ4 ⎟ ⎠, ϕ3 ψ4 ϕ4 ψ4
(2.40)
2.2 Aufstellung der Dirac-Gleichung
13
Es erweist sich als zweckmäßig, mit den Definitionen m 0 c2 β, ih
a
al
cαl
(2.41)
von a und al zu neuen Matrizen β und αl überzugehen. Die Forderungen (2.29) und (2.35) transformieren sich dabei in4 β2
1,
β, αl
0,
αl , αm
2δlm
(2.42)
und β
β ,
αl
αl .
(2.43)
(Wir lassen die Einheitsmatrix weg, wenn wie in der Gleichung β 2 1 klar ist, was gemeint ist.) Aus (2.20) wird damit die von P. A. M. Dirac entdeckte Dirac-Gleichung für freie Teilchen h ih ∂t ψ (2.44) m 0 c2 β cαl ∂l ψ. i Die Mehrkomponentigkeit der Wellenfunktion bedeutet, daß gegenüber der Schrödingerschen Wellenmechanik weitere Freiheitsgrade hinzugekommen sind. Welche Bedeutung diese haben, werden wir später sehen. Hier sei nur darauf hingewiesen, daß sich das Auftreten mehrerer Freiheitsgrade zwangsläufig aus den Forderungen (2.29) ergab. Für ebene Wellen ψ ψ0 ei(k x ωt ) liefert (2.44) die Matrix-Gleichung h ω
m 0 c2 β c h kl αl .
Durch Quadrieren folgt hieraus unter Benutzung der Gleichungen (2.42) und nach Herauskürzen der Einheitsmatrix die Dispersionsrelation (h ω)2
(m 0 c2 )2 c2 (h k)2 .
(2.45)
Genau dasselbe ergibt sich, wenn wir den im kräftefreien Fall ( A0 und Φ 0) gültigen, aus (2.8) mit (2.9) und (2.10) folgenden Energiesatz H E c m 02 c2 p2 quadrieren und in ihm die – auch relativistisch gültigen – de Broglie-Relationen E h ω und p h k einsetzen. Damit ist im Nachhinein gezeigt, daß der in (2.21) gewählte Ansatz G S/h mit S = Wirkungsfunktion berechtigt war. 4 In der Relativistischen Quantenmechanik und der Quantenfeldtheorie treten sowohl Kommutatoren a, b als auch Antikommutatoren a, b auf. Die letzteren werden in diesem Buch generell durch ein tief gestelltes markiert. Für Minus-Kommutatoren werden die Notationen a, b und a, b benutzt, die letztere überwiegend dann, wenn es um die deutliche Absetzung von Antikommutatoren geht oder wenn eine Verwechslung droht.
14
2 Dirac-Theorie des Elektrons und des Neutrinos
Mit den Definitionen (2.41) wird aus der Kontinuitätsgleichung (2.36) ∂t n
div j
0
mit
jl
cψ
αl ψ .
(2.46)
(Später werden wir zu einem Teilchenstrom übergehen, bei dem ψ durch ψ ersetzt ist.) Im quasiklassischen Grenzfall ist sowohl n ψ ψ als auch jl nur in der unmittelbaren Nachbarschaft des klassischen Teilchenorts von Null verschieden. Wir dürfen dann näherungsweise n
δ3(x x(t)) ,
jl
Jl δ3(x x(t)) n Jl
setzen und erhalten aus (2.47b) für Jl die Beziehung (2.46b) Jl jl d 3x cαl ,
(2.47)
(2.48)
wobei in (2.56)–(2.57) definiert ist, wie der Mittelwert cαl gebildet werden muß. Unter Vorgriff auf das Ergebnis (2.61) erhalten wir mit d x /dt Úkl aus den Gleichungen (2.47)–(2.48) schließlich j n Úkl . Damit ist gezeigt, daß auch die Kontinuitätsgleichung (2.46) die Forderungen des Korrespondenzprinzips erfüllt.
2.2.2 Bestimmung der Dirac-Matrizen «l und ¬ Die Matrizen αl und β sind nach (2.43) hermitesch und erfüllen nach (2.42) die Beziehungen αx2 α y2 αz2 β 2 1 . (2.49)
Hieraus folgt, daß sie als Eigenwerte nur 1 oder 1 besitzen können. (Jede hermitesche Matrix kann durch eine unitäre Transformation auf Diagonalform gebracht werden, in der ihre Eigenwerte auf der Diagonalen stehen, und nach (2.49) sind deren Quadrate gleich eins.) Weiterhin folgt aus (2.42b) β β, αl
β 2αl
βαl β
(2.42a)
αl
βαl β
0.
Hieraus folgt unter Benutzung der allgemeingültigen Beziehung Sp(AB) Sp(B A) für die Spur des Produktes zweier Matrizen A und B
Sp(βαl β) Sp β Sp(αl β) Sp(αl β 2 ) Sp αl mit der Konsequenz Sp αl 0, und analog folgt aus αl β, αl αl βαl αl2 β αl βαl β 0 das Ergebnis Sp β 0. Die Spur ist bei unitären Transformationen, durch die hermiSp αl
tesche Matrizen auf Diagonalform gebracht werden können, eine Invariante. Daher ist die Spur hermitescher Matrizen gleich der Summe ihrer Eigenwerte. Da die letzteren bei den hermiteschen Matrizen αl und β jedoch gleich 1 oder 1 sind, kann Sp αl bzw. Sp β nur bei geradzahliger Dimension verschwinden. Weiterhin müssen die fünf Matrizen αx , α y , αz , β und E linear unabhängig sein, denn die Einheitsmatrix läßt sich nicht als Linearkombination der Matrizen αl und β darstellen.
2.2 Aufstellung der Dirac-Gleichung
15
Beweis: Aus der Gleichung 3
cl αl
bβ
E
(2.50)
l 1
folgt durch Antikommutation mit αm bzw. β unter Ausnutzung der Beziehungen (2.42) sowie von αm E E αm αm und β E Eβ β cm E αm ,
bE β .
Durch nochmalige Antikommutation mit αl αm folgt aus diesen Gleichungen cm αl
0,
b αl
0
und damit c1 c2 c3 b 0. Mit diesen Koeffizienten läßt sich (2.50) nicht erfüllen.
Dieses Ergebnis bedeutet, daß der Matrizenraum, in welchem αl und β erklärt sind, mindestens fünf linear unabhängige Matrizen enthalten muß. Da es insgesamt nur vier linear unabhängige hermitesche 2 2–Matrizen gibt, existiert in deren Raum keine Lösung der Gleichungen (2.42)–(2.43). Nach zwei ist die nächste geradzahlige Dimension vier. Im Raum der 4 4–Matrizen ist das Gleichungssystem (2.42)–(2.43) tatsächlich lösbar, und es bereitet keine weiteren Schwierigkeiten, sich eine explizite Lösung zu verschaffen. Wir begnügen uns damit, uns davon zu überzeugen, daß 0 σl 1 0 αl (2.51) , β σl 0 0 1 eine Lösung ist, wobei 0, 1 und σl die zweidimensionale Nullmatrix, Einheitsmatrix bzw. die Pauli-Matrizen sind. Beweis: Da die 2 2–Matrizen 0, 1 und σl hermitesch sind, gilt das auch für die 4 4–Matrizen αl und β. In Aufgabe 2.4 wird gezeigt, daß mit den Blockmatrizen αl und β so gerechnet werden kann, als wären die 2 2–Matrizen 0, 1 und σl gewöhnliche Matrixelemente. Die Gültigkeit von β 2 1 ist offensichtlich. Mit den üblichen Regeln der Multiplikation und Addition von Matrizen erhalten wir außerdem 0 σl 0 σl 0 β αl αl β σl 0 σl 0 sowie σl σm σm σl 0 0 σl , σm 0 αl αm αm αl σl , σm , 0 σl σm 0 σm σl 0
und mit den Vertauschungsrelationen (Q7.43), σl , σm 2δlm , folgt daraus (2.42c).
(2.51) ist eine spezielle Lösung der Gleichungen (2.42)–(2.43). Man erhält aus ihr die weiteren Lösungen β
U β U,
αl
U αl U ,
wenn man für U eine beliebige unitäre Matrix wählt, denn beispielsweise gilt (β )2
U β UU β U U β 2U U U 1
(2.52)
16
2 Dirac-Theorie des Elektrons und des Neutrinos
die übrigen Relationen (2.42)–(2.43) beweist man analog. Ob man in der DiracGleichung die Matrizen αl und β oder αl und β einsetzt, ist irrelevant, die physikalischen Ergebnisse bleiben davon unberührt: Ist ψ eine Lösung der Dirac-Gleichung (2.44) mit den Matrizen αl und β, und setzt man ψ U ψ bzw. ψ U ψ , so ergibt sich aus (2.44) durch Multiplikation mit U von links h m 0 c2 β cαl ∂l ψ . ih ∂t ψ i ψ ist demnach eine Lösung der Dirac-Gleichung mit den Matrizen αl und β , und die physikalische Äquivalenz der Lösungen ψ und ψ ergibt sich aus ψ ψ ψ ψ . Im folgenden bedeutet es oft eine nützliche Abkürzung, wenn wir die drei Matrizen α1 αx , α2 α y und α3 αz durch die Definition
« α x e x α y e y α z ez
(2.53)
zu einem Vektor « zusammenfassen, dessen Komponenten Matrizen sind.
2.2.3 Dirac-Gleichung mit elektromagnetischem Feld Der allgemeine Ansatz (2.20) gilt auch für den Fall, daß die Teilchendynamik in einem beliebigen elektromagnetischen Feld erfolgt. Die Koeffizienten a und al müssen nur so bestimmt werden, daß ein Quadrat der im quasiklassischen Grenzfall gültigen Beziehung (2.26) mit (2.11) übereinstimmt. Statt mit (2.41) gehen wir jetzt mit m 0 c2 i β al cαl qΦ cαl q Al , (2.54) a ih h
von al und a zu den Matrizen αl und β über und erhalten damit aus (2.26) ∂t SqΦ m 0 c2β cαl ∂l Sq Al bzw. das symmetrisierte Quadrat5 davon,
∂t S qΦ
2
m 02 c4 β 2
c2 αl , αm (∂l Sq Al ) (∂m Sq Am ) 2
m 0 c3 β, αl
(∂l S q Al ) .
Der Koeffizientenvergleich mit (2.11) zeigt, daß αl und β wieder die Gleichungen (2.42) erfüllen müssen, und aus den Forderungen (2.35) ergeben sich wieder die Bedingungen (2.43). Dies bedeutet, daß für die Matrizen αl und β die schon bekannten Lösungen (2.51) herangezogen werden dürfen. Mit den Ansätzen (2.54) und der Notation (2.53) lautet die Bewegungsgleichung (2.20) jetzt ih ∂t ψ
h qΦ m 0 c2 β c« qA ψ . i
5 Vergleiche Fußnote 2 von Seite 12.
(2.55)
2.3 Operatoren, Mittelwerte und Ehrenfestsches Theorem
17
Dies ist die Dirac-Gleichung für die Dynamik eines Teilchens der Ladung q im elektromagnetischen Feld. Die zugehörige Kontinuitätsgleichung ist identisch mit der des kräftefreien Falls, d. h. es gilt wieder (2.46). Mit ψ U ψ, αl U αl U und β U βU ist auch hier wieder der Übergang zu einer anderen Darstellung der DiracMatrizen möglich.
2.3 Operatoren, Mittelwerte und Ehrenfestsches Theorem Durch die Einwirkung eines Operators L auf einen Dirac-Spinor (2.37) wird diesem ein – im allgemeinen von ihm verschiedener – Spinor ϕ aus dem Hilbert-Raum der Dirac-Spinoren zugeordnet, L ψ ϕ L ψ . In Komponenten bedeutet dies ψi
L ϕi
4
L ik ψk ,
k 1
wobei L eine Matrix ist, deren Komponenten L ik Operatoren sind. Als Spezialfall ist darunter der Fall enthalten, bei dem der Operator L nur gleiche Diagonalelemente enthält, L l E. (Dabei werden wir im allgemeinen die Matrix E nicht eigens anschreiben.) Wie in der bisherigen Quantenmechanik werden wir nur lineare Operatoren L betrachten. Um zu L einen adjungierten Operator definieren zu können, wird ein Skalarprodukt von Dirac-Spinoren benötigt, das wir durch (ϕ, χ) (2.56) ϕ χ d 3x definieren. Der zu L adjungierte Operator L ist dadurch definiert, daß für beliebige Elemente ϕ und χ des Hilbert-Raums der Dirac-Spinoren (ϕ, L χ)
( L ϕ, χ)
gilt. Ein Operator L heißt hermitesch, wenn wie üblich L L oder (ϕ, L χ) gilt. Der durch L (ψ, L ψ)
χ) ( Lϕ, (2.57)
definierte Erwartungswert eines hermiteschen Operators ist reell. Schreiben wir die Dirac-Gleichung (2.55) mit der Definition H
qΦ m 0 c2 β c«
h qA i
(2.58)
18
2 Dirac-Theorie des Elektrons und des Neutrinos
in der Form ih ∂t ψ
H ψ ,
(2.59)
so folgt aus ihr genau wie aus der nicht-relativistischen Schrödinger-Gleichung (siehe Quantenmechanik, Gleichung (Q3.118) für einen beliebigen linearen hermiteschen Operator L 1 d ∂L L L, H . (2.60) dt ih ∂t Für L x und mit x m , H
cαl
h h (∂l x m ) cαm i i
sowie (2.53) folgt daraus insbesondere d x dt
«
c .
(2.61)
c « ist demnach der Operator der Teilchengeschwindigkeit. Er ergibt sich auch aus der Rückübersetzung (Q6.117) der Heisenbergschen Bewegungsgleichung (Q6.114) für Operatoren ins Schrödinger-Bild, angewandt auf den Ortsoperator x, denn dx dt
1 x, c « x , H ih
c(« x) c« .
Für L (h/i) erhalten wir mit
h h ∂m , H q (∂m Φ) c(∂m αl Al ) i i und der Definition
aus (2.60)
d p dt
q
p
h i
Φ
qc (« A) .
(2.62)
(2.63)
Unter Benutzung von c«
∂ H , ∂ p
q
∂Φ ∂x
∂ H c (« A) ∂x
lassen sich die Gleichungen (2.61) und (2.63) auch in die Form d x d p ∂H ∂H
, dt ∂ p dt ∂x
(2.64)
bringen. Dies ist das Ehrenfest-Theorem in derselben Form, wie es im nicht-relativistischen Fall erhalten wurde. (Wie dort handelt es sich um rein formale Beziehungen, aus denen keine Lösungen für x und p als Funktionen von t gewonnen werden
2.3 Operatoren, Mittelwerte und Ehrenfestsches Theorem
19
können.) Es erlaubt, p auch im relativistischen Regime als kanonischen Impulsoperator aufzufassen. Die klassische Beziehung (2.6) läßt erwarten, daß der Operator h qA i
(2.65)
dem klassischen kinetischen Impuls m zugeordnet werden kann. wird dementsprechend als Operator des kinetischen Impulses bezeichnet. Aufgrund des Korrespondenzprinzips ist es sinnvoll, H als Energieoperator zu bezeichnen. Ist H nicht explizit zeitabhängig, was nach (2.58) für ∂t Φ 0 und ∂t A 0 der Fall ist, so folgt aus (2.60) 1 H , H ih
d H dt
0,
und es gilt der Energieerhaltungssatz H const. In derrelativistischen Mechanik ist wegen ihrer Abhängigkeit von v auch die Masse m m 0 / 1v 2 /c2 eine dynamische Variable. Nach (2.5)–(2.6) gilt 1 H c2
qΦ
1 2 2 m0 c m2v2 c
m0 1v 2 /c2
m.
Das Korrespondenzprinzip führt uns dazu, m
(2.58) 1 1 H qΦ m 0β
2 c c
(2.66)
als quantenmechanischen Masseoperator zu definieren. Multipliziert man Gleichung (2.66) einmal von links, einmal von rechts mit dem Operator und addiert die erhaltenen Gleichungen, so ergibt sich
m m
m0
β β
1c
.
Aus den Vertauschungsrelationen (2.42b) folgt, daß der erste Term der rechten Seite verschwindet. In Komponenten gilt weiterhin (mit Summenkonvention)
αl αm
αm αl π m (2.42c) 2δlm π m
2π l ,
womit schließlich der Zusammenhang
1 c m mc 2
(2.67)
folgt. Da c der Geschwindigkeitsoperator ist, entspricht Gleichung (2.67), deren rechte Seite in den Operatoren c und m symmetrisiert ist, zusammen mit (2.65) wie erwartet der klassischen Beziehung p q A m (siehe dazu aber Abschn. 3.1). Für freie Teilchen gilt nach (2.66) m
H . c2
(2.68)
20
2 Dirac-Theorie des Elektrons und des Neutrinos
Wir werden im nächsten Abschnitt sehen, daß der Hamilton-Operator freier Teilchen positive und negative Energieeigenwerte besitzt. Da der Masseoperator mit dem Hamilton-Operator bis auf einen konstanten Faktor übereinstimmt, hat auch der Masseoperator positive und negative Eigenwerte, wobei positive Massen mit positiven Energien und negative Massen mit negativen Energien verbunden sind.
2.4 Ebene-Welle-Lösungen für freie Teilchen Die Dynamik freier Teilchen wird durch Gleichung (2.44) beschrieben. Mit dem Ansatz ωt )
U ei(k x
ψ
,
(2.69)
in dem U ein orts- und zeitunabhängiger Viererspinor ist, suchen wir Lösungen für ebene Wellen der Frequenz ω, die sich in Richtung des Vektors k ausbreiten. Die durch (2.69) gegebenen Spinoren ψ sind Eigenspinoren des Operators p , es gilt h ψ i
p ψ
pψ
mit
h k .
p
(2.70)
Durch Einsetzen von (2.69) und (2.70) in (2.44) ergibt sich, daß sie auch Eigenspinoren des Hamilton-Operators H m 0 c2 β c« p sind, H ψ
Eψ
mit
h ω ,
E
(2.71)
wenn der Spinor U die Gleichung (m 0 c2 β c« p) U
EU
(2.72)
erfüllt. Im folgenden geht es nur noch darum, die Lösungen dieser Gleichung zu finden. Werden diese in (2.69) eingesetzt, so sind die Wellenlösungen festgelegt. Die Tatsache, daß die in H enthaltenen Matrizen « und β mit Hilfe von 2 2-Matrizen dargestellt werden können, legt es nahe, auch für die Viererspinoren eine Zerlegung in zwei Zweierspinoren vorzunehmen, d. h. wir wählen den Ansatz ψ
ϕ χ
Mit (2.51) und U
ϕ
mit ϕ0 χ0
ϕ1 ϕ2
ψ1 ψ2
,
χ
χ1 χ2
ψ3 ψ4
.
(2.73)
wird aus Gleichung (2.72a) m 0 c2 c p
c p m 0c2
ϕ0 χ0
E
ϕ0 χ0
,
nach Ausführen der Matrizenmultiplikation zerfällt sie in die zwei Gleichungen (m 0 c2 E) ϕ0 c
p χ0
0,
c
p ϕ0 (m 0 c2 E) χ0
0.
(2.74)
2.4 Ebene-Welle-Lösungen für freie Teilchen
21
E m 0 c2 0 m0
Abb. 2.2: Die positiven und negativen Energieeigenwerte zu einem gegebenen Impuls liegen in den sich bis E bzw. erstreckenden schattierten Bereichen.
c2
Aus der zweiten dieser Gleichungen ergibt sich χ0
m cc2p E ϕ0 ,
(2.75)
0
und die Elimination von χ0 aus der ersten Gleichung mit Hilfe dieses Ergebnisses führt zu c2 p p ϕ0 0 . (m 0 c2 E) ϕ0 m 0 c2 E Zur Weiterbehandlung dieser Gleichung benutzen wir die für beliebige Vektoren oder Vektoroperatoren a und b (die jedoch keine Matrizen als Komponenten haben sollen) gültige und am Ende dieses Abschnitts bewiesene Identität
a b a b i (a b) ,
(2.76)
setzen in dieser a b p und erhalten mit
p p p2 die Gleichung
m 0 c2
E
c 2 p2 m 0 c2 E
(2.77) ϕ0
0.
Die Lösbarkeitsbedingung für diese Gleichung, das Verschwinden der Klammer, führt zu den beiden Energieeigenwerten mit Ep (m 0 c2 )2 c2 p2 . (2.78) E Ep Zu jeder Lösung E Ep positiver Energie existiert auch eine Lösung E Ep negativer Energie, und es gilt Ep m 0 c2 (Abb. 2.2). Gleichung (2.78) ist natürlich der Dispersionsbeziehung (2.45) äquivalent. Wenn sie erfüllt ist, kann ϕ0 beliebig gewählt werden. Jetzt wenden wir uns der Bestimmung der Vierer-Eigenspinoren U zu, die wir bei den Lösungen positiver Energie mit U ( ) und bei denen negativer Energie mit U ( ) bezeichnen. Wie bereits gesagt kann der Zweierspinor ϕ0 beliebig gewählt werden. Die beiden Zweierspinoren 1 0 , χ , (2.79) χ 0 1
22
2 Dirac-Theorie des Elektrons und des Neutrinos
die nach Gleichung (Q7.73) der Quantenmechanik Eigenspinoren der Matrix σz zu den Eigenwerten 1 sind, bilden eine orthonormierte Basis, und ϕ0 kann eine beliebige Linearkombination der beiden Basisspinoren (2.79) sein. Dies bedeutet, daß es auch für U ( ) und U ( ) eine Basis von je zwei Viererspinoren gibt, aus denen sich die allgemeine Lösung durch Linearkombination ergibt. Die zwei (2.79) entsprechenden Basisspinoren haben nach (2.73) und (2.75) mit E Ep die Form ⎛ ⎞ χi ⎜ ⎟ ( ) für i . Ui N ⎝ c p χi ⎠ (2.80) m 0 c2 Ep N sind Konstanten, die durch die Normierungsforderung () () c2 ( pχi ) pχi 2 Ui Ui N χi χi (m c2 E )2 0 p 2 c χi p pχi (2.77) c 2 p2 (Q7.47) 2 2 N 1 (m c2 E )2 N 1 (m c2 E )2 0 p 0 p
N 2
(m 0 c2 )2 2m 0 c2 Ep Ep2 c2 p2 (m 0
c2
bei der χi χi 1 benutzt wurde, zu N
Ep
N 2 E
2Ep 2 p m0c
(2.78)
)2
Ep m 0 c2 2Ep
(2.81)
festgelegt werden können. Damit ergibt sich schließlich ⎛ ⎞ χi 2 Ep λm 0 c ⎜ ⎟ (λ) für i Ui ⎝ c p χi ⎠ 2Ep m 0 c2 λEp (Als Index ist λ , als Faktor 1.) Die Ui
(λ)
(λ) (μ) Uj Ui
1,
, λ
s.u.
(1) .
(2.82)
erfüllen die Normierungsbedingungen
δλμ δi j .
(2.83)
Für i j und λμ ergibt sich das aus der vorangegangenen Berechnung der Normierungskonstanten Nλ . Für i j folgt es aus χi χ j 0, und für λμ, aber i j aus ()
Ui
( )
Ui
χi χi cm( c 2pχEi ) 0 p
c p χi m 0 c2 Ep
1 (m
c 2 p2 2 2 2 0 c ) Ep
0.
Mit (2.82) ergeben sich aus (2.69)–(2.71) die auf eins normierten Wellenlösungen ⎛ ⎞ χ i Ep m 0 c2 ⎜ ⎟ i( px Ep t )/h für i , (2.84) ψi() ⎝ c p χi ⎠ e 2Ep 2 m 0 c Ep ( )
wobei ψi
( )
Lösungen positiver und ψi
Lösungen negativer Energie sind.
2.4 Ebene-Welle-Lösungen für freie Teilchen
23
Für manche Zwecke ist es günstiger, wenn man bei den zu negativer Energie E Ep gehörigen Eigenspinoren aus den zwei Gleichungen (2.74) ϕ0 statt χ0 eliminiert. Man erhält dann aus der ersten von diesen
mc c 2pχE0 , 0
ϕ0
c p χi ⎝ m c2 E ⎛
und der Ansatz ( )
Ui
N
0
p
χi
(2.85)
⎞ ⎠
für
i
,
in dem benutzt ist, daß auch der beliebig wählbare Zweierspinor χ0 aus den Basisspinoren (2.79) superponiert werden kann, führt mit der Normierungsforderung ( ) ( ) Ui 1 zu den alternativen Eigenlösungen negativer Energie Ui ⎛ c pχ ⎞ i Ep m 0 c2 ( ) 2 E ⎠ ⎝ m c 0 p Ui . (2.86) 2Ep χ i
Im nicht-relativistischen Grenzfall werden die gefundenen Wellenlösungen besonders einfach. Nicht-relativistische Verhältnisse liegen vor, wenn Ep von der Größenordnung der Ruheenergie ist, Ep m 0 c2 bzw. nach (2.78b) p/(m 0 c)1 und Ep m 0 c2 p2 /(2m 0 ). Dann gilt nach (2.81) p N 1, N 1, 2m 0 c und aus (2.80) folgt ⎞ ⎛ ⎛ ⎞ ⎞ ⎛ ⎞ ⎛ χi 0 χi χ i p ⎜ ⎟ ⎜ ⎟ Ui( ) ⎝ pχi ⎠ ⎝ ⎠ , Ui() ⎝ 2m 0 c pχi ⎠ ⎝ pχi ⎠ . 2m c 0 p2 0 p 2m 0 c Für die Lösungen positiver Energie sind also im nicht-relativistischen Grenzfall nur die zwei oberen Spinorkomponenten u 1 und u 2 von Bedeutung, für die Lösungen negativer Energie nur die zwei unteren Komponenten u 3 und u 4 . Zum Abschluß soll noch der Beweis der Beziehung (2.76) nachgeholt werden. Beweis: Bilden i, k und l eine zyklische Permutation der Zahlen 1,2 und 3, so gilt nach (Q7.45) σ i σk
(Q7.43)
σk σi i σl , (2.87) 2 k gilt nach (Q7.44) σi 1. Diese Ergebnisse lassen sich unter Benutzung des Tensors
und für i εikl zu der Formel
σi σk δik i εikl σl (2.88) zusammenfassen. Sind a i und bk die Komponenten zweier beliebiger Vektoren oder Vektoroperatoren a und b , so ergibt sich hieraus durch Multiplikation mit a i und b k sowie Summation über die doppelt auftretenden Indizes
σi a i σk bk
δik a i bk
i εikl a i bk σl .
Mit εikl a i bk σl σl εlik a i bk und ( a b )l εlik a i b k ergibt sich die behauptete Beziehung.
24
2 Dirac-Theorie des Elektrons und des Neutrinos
2.5 Wellenpakete und Gruppengeschwindigkeit Aus den ebenen Wellen (2.84) ergeben sich durch Superposition Wellenpakete. Das allgemeinste Wellenpaket hat die Form () 1 ( ) 3 i p x/h Ci ( p)Ui ( p) ei Ep t /h d ψ(x, t) p e (2.89) (2π h 2 )3/2 i Ci()( p)Ui()( p) ei Ep t /h . Die Wellenlösungen negativer Energie müssen dabei mit berücksichtigt werden, denn zu jedem Impuls p existieren vier voneinander unabhängige Eigenspinoren, und nur unter Einbeziehung der zwei zu negativen Energien gehörigen Spinoren bilden die ebenen Wellen (2.84) ein vollständiges Spinorsystem. Ist zur Zeit t 0 der Spinor ψ(x, 0) vorgegeben, so können die Koeffizienten () ( ) Ci ( p) und Ci ( p) aus Gleichung (2.89) durch Fourier-Transformation berechnet werden. Die Grundlage dafür bildet die dreidimensionale Verallgemeinerung der Gleichungen (E2.50), 1 1 ik x 3 f (x) ck e f (x) ei k x d 3x . d k, ck (2.90) (2π)3/2 (2π)3/2 Aus dem Vergleich von (2.90a) mit der für t 0 angeschriebenen Gleichung (2.89) ergibt sich mit f (x) ψ(x, 0) und k p/h () ck Ci ( p)Ui()( p) Ci()( p)Ui()( p) . i
Aus (2.89b) folgt daher ( ) ( ) Ci Ui Ci()Ui() i
1 (2π)3/2
ψ(x, 0) ei p x/h d 3x
w( p) .
w( p) ist ein Viererspinor, der durch ψ(x, 0) festgelegt wird. In Analogie zu ψ, Gleichung (2.73), zerlegen wir ihn in der Form u w v mit zwei Zweierspinoren u und v. Multiplizieren wir die zuletzt erhaltene Gleichung () , so ergibt sich mit Hilfe der Orthogonalitätsrelationen (2.83) mit Ui c ( pχi ) v (2.80) Ci()( p) N χi u , Ui() w( p) m 0 c2 Ep ⎡
und hieraus folgt ( )
Ci ( p) Ci()( p)
N N
c ( pχi ) v ⎢ χi u E m c2 p 0 ⎢ ⎢ ⎣ c ( pχi ) v χi u Ep m 0 c2
⎤ ⎥ ⎥ ⎥. ⎦
2.5 Wellenpakete und Gruppengeschwindigkeit
25
Unter nicht-relativistischen Verhältnissen, also für p m 0 c, ist nach (2.78b) Ep m 0 c2 p 2 /(2m 0 ) , Ep m 0 c2 2m 0 c2 und damit p N (2.81) Ep m 0 c2 1. N Ep m 0 c2 2m 0 c
()
( )
Dies bedeutet, daß dann im allgemeinen Ci ( p) Ci ( p) gilt, es sei denn, der Anfangszustand ψ(x, 0) ist so konstruiert, daß der Nenner in der eckigen Klammer ebenso klein wie N /N ist. Dies würde bedeuten, daß der zweite Term des Nenners dieselbe Größenordnung wie der erste besitzen und diesen im wesentlichen kompensieren müßte. Da er den sehr kleinen Faktor c p/(m 0 c) enthält, müßte v dazu wesentlich ( ) ( ) Ci größer als u sein. Solange diese künstliche Situation nicht gegeben ist, gilt Ci und der Anfangszustand enthält überwiegend Wellen positiver Energie. Unter relativistischen Verhältnissen, also für p m 0 c ist Ep m 0 c2 ( 2 1)m 0 c2, Ep m 0 c2 ( 2 1)m 0 c2 und 2 1 N (1) . N 2 1
Der Anteil von Wellen negativer Energie am Anfangszustand ist dann im allgemeinen derselbe wie der von Wellen positiver Energie, es sei denn, es wurde wieder durch eine besondere Präparierung des Anfangszustands für das Gegenteil gesorgt. Betrachten wir jetzt einen Anfangszustand, in dem ein Wellenpaket auf ein sehr enges Gebiet mit dem Durchmesser d h /(2m 0 c) lokalisiert ist. Aufgrund der Unschärferelation muß z. B.
p h /(2x) gelten. Wegen x d h /(2m c) gilt dann p m c und infolgedessen auch pm c. x
0
x
0
0
Sehr starke Lokalisierung des Wellenpakets führt also zu relativistischen Verhältnissen, und nach den vorangegangenen Überlegungen sind dann am Zustand ψ im allgemeinen Wellen positiver und negativer Energie in etwa gleichem Maße beteiligt. Bei sehr eng lokalisierten Zuständen wie z. B. Bindungszuständen des Elektrons im Atom spielen daher Zustände negativer Energie eine wesentliche Rolle. Bei ausgedehnten Zuständen mit einem Wellenpaketdurchmesser d h /(m 0 c) spielen Wellen negativer Energie dagegen keine wesentliche Rolle, wenn nicht durch eine spezielle Präparation des Anfangszustands dafür gesorgt wurde. Für ein nur aus Wellen positiver Energie aufgebautes Wellenpaket folgt aus (2.78b) mit E Ep h ω und p h k die Dispersionsrelation c ω m 02 c2 h 2 k 2 . (2.91) h
Mit der bekannten Beziehung Ú ∂ω/∂ k ergibt sich daraus als Gruppengeschwindigkeit des Wellenpakets Ú m cc h k h k cE p . (2.92) g
( ) g
2
2 2 0
2 2
p
26
2 Dirac-Theorie des Elektrons und des Neutrinos
Der daraus folgende Zusammenhang Ep ( Ú c2 g
p
)
(2.93)
zwischen Impuls und Gruppengeschwindigkeit entspricht der klassischen Beziehung p m Ú mit m E/c2 . Die Dispersionsrelation für ein nur aus Wellen negativer Energie aufgebautes Wellenpaket stimmt bis auf das Vorzeichen der Wurzel mit (2.91) überein, daher erhalten wir als Gruppengeschwindigkeit Úg(
)
2
cE p .
(2.94)
p
In diesem Fall haben wir das merkwürdige Ergebnis, daß die Gruppengeschwindigkeit des Wellenpakets dem Impuls entgegengerichtet ist. Es ist darauf zurückzuführen, daß die Masse m E/c 2 von Teilchen negativer Energie ebenfalls negativ ist (siehe Abschn. 2.3), so daß sich aus der Beziehung p m Ú entgegengesetzte Vorzeichen von p und Ú ergeben. Dieser ungewohnte Zusammenhang führt zu großen Schwierigkeiten bei der physikalischen Interpretation der Wellen negativer Energie. Zunächst sieht es allerdings so aus, als könnte man die letzteren einfach als unphysikalisch erklären und ignorieren: Die Wellen positiver und negativer Energie entwickeln sich nach dem allgemeinen Ergebnis (2.89) zeitlich völlig unabhängig voneinander, d. h. die kräftefreie Dirac-Gleichung separiert bezüglich der Zustände positiver und negativer Energie. Zustände negativer Energie können sich demnach nicht von sich aus entwickeln, wenn sie nicht anfänglich angeregt worden sind. Wie im nächsten Abschnitt gezeigt wird, geschieht das jedoch, sobald elektromagnetische Kräfte im Spiel sind. Wir werden uns daher mit den Wellen negativer Energie noch verschiedentlich auseinandersetzen müssen. Aus (2.78), (2.92) und (2.94) folgt übrigens Úg c/ 1 (m 0 c)2/ p 2 c, d. h. relativistische Wellenpakete breiten sich höchstens mit Lichtgeschwindigkeit aus. Dieses Ergebnis betrifft auch das Auseinanderfließen von Wellenpaketen (siehe Abschn. 2.6), so daß das relativistische Kausalitätsprinzip bei diesen Prozessen gewahrt bleibt.
2.6 Frontgeschwindigkeit von Wellenpaketen In der nicht-relativistischen Quantenmechanik können sich Teilchen mit Überlichtgeschwindigkeit bewegen, die Gruppengeschwindigkeit eines ein Teilchen repräsentierenden Wellenpakets ist Úg h k/m p/m, und p kann beliebige Werte annehmen. In Aufgabe Q3.2–3.3 der Quantenmechanik wurde gezeigt, daß sich die Front eines nichtrelativistischen Wellenpakets mit unendlicher Geschwindigkeit ausbreitet, selbst wenn das Wellenpaket ruht, seine Gruppengeschwindigkeit also verschwindet. Daraus, daß die Gruppengeschwindigkeit der Dirac-Gleichung genügender Wellenpakete nach dem letzten Abschnitt auf Werte Úg c eingeschränkt ist, kann also nicht geschlossen werden,
2.6 Frontgeschwindigkeit von Wellenpaketen
27
daß ihre Frontgeschwindigkeit derselben Einschränkung unterliegt. Die Frontgeschwindigkeit relativistischer Wellenpakete zu berechnen ist das Ziel dieses Abschnitts. Hierzu benutzen wir, daß aus der Dirac-Gleichung (2.44) für freie Teilchen die Gleichung 1 m 02 c2 ∂t t ψ ψ 0 (2.95) 2 c h 2 folgt, d. h. jede Komponente des Dirac-Spinors ψ genügt bei freien Teilchen der im nächsten Kapitel behandelten Klein-Gordon-Schrödinger-Gleichung (4.6). Beweis: Zum Beweis dieser Tatsache multiplizieren wir Gleichung (2.44) mit β, benutzen (2.42a), β 2 1, und schreiben sie in der Form
h (2.96) β(∂t c« ) m 0 c2 ψ 0 . i
c« ) folgt hieraus h 2 β(∂t c« )β(∂t c« )ψ m c2 h β(∂t c« )ψ
Durch Multiplikation mit dem Operator (h /i)β(∂t 0
0
(2.96)
h 2
∂t t
i
cβ « β∂t c« ∂t c2 β « β «
ψ
m 02 c4 ψ .
Wegen (2.42b) bzw. β « « β hebt sich im letzten Ausdruck der zweite gegen den dritten Klammerterm weg, und unter erneuter Benutzung von β 2 1 ergibt sich nach Multiplikation mit 1 h 2 ∂t t c2 « « ψ m 02 c4 ψ 0 . Unter Vorgriff auf die (2.76) entsprechende Beziehung (2.168), in der wir a b ten wir « « i τ .
setzen, erhal
Wird dies in das letzte Ergebnis eingesetzt, so folgt unmittelbar (2.95).
Im weiteren Verlauf betrachten wir nur noch eine Komponente des Spinors ψ, bezeichnen diese mit ϕ und untersuchen die Ausbreitung eines Wellenpakets in x-Richtung. Dieser Prozeß wird durch die Gleichung 1 ∂ 2ϕ c2 ∂t 2
∂ 2ϕ ∂x2
α2 ϕ 0
mit
α2
m 02 c2 h 2
(2.97)
beschrieben. Bezüglich des Wellenpakets machen wir die Annahme, daß sich seine Front zur Zeit t 0 bei x x 0 befindet, und daß ϕ zu dieser Zeit für alle x x 0 verschwindet. ϕ soll an der Wellenfront mitsamt seinen ersten Ableitungen stetig sein. (Die Stetigkeit der ersten Ableitungen muß gefordert werden, damit die in (2.97) stehenden zweiten Ableitungen überall definiert sind.) Für die zweiten Ableitungen können Unstetigkeiten zugelassen werden, und wir nehmen an, daß solche existieren. Die Wellenfront hat dann das in Abb. 2.3 (a) dargestellte Aussehen. Ist x(t) die Position der Wellenfront zu beliebigen Zeiten t (Abb. 2.3 (b)), so gilt x(0)x 0 . Jetzt nehmen wir an, daß x(t) eine Lösung der Gleichung C(x, t)0 ist. Die
28
2 Dirac-Theorie des Elektrons und des Neutrinos t ϕ
2
et ex
C (x , t )
0
1 x0
(a)
x
x (b)
Abb. 2.3: (a) Wellenpaket mit Front bei x x0 , wo die Krümmung und damit ϕ x x eine Unstetigkeit besitzt. (b) Position x(t) der Wellenfront in der x, t-Ebene. Das Wellenpaket befindet sich in dem mit 1 bezeichneten schattierten Gebiet, Gebiet 2 liegt vor der Wellenfront.
Ableitungen von ϕ x ∂x ϕ und ϕt ∂t ϕ tangential zur Kurve C(x, t) 0 müssen über diese hinweg an allen Kurvenpunkten stetig sein, weil ϕt und ϕ x sonst nicht überall über die Kurve hinweg, also zu allen Zeiten über die Wellenfront hinweg, stetig sein könnten. Wir fordern also die Stetigkeit von
C ϕx und
(C x ex
Ct et ) (ϕx x ex ϕxt et )
C ϕt
(C x ϕt t
(C x ϕ xt
Ct ϕx x ) ex et
Ct ϕt x ) ex et .
Bezeichnet der Index 1 den Grenzwert, den eine Funktion vom Inneren des Wellenpakets her auf der Kurve x(t) annimmt, und der Index 2 den Grenzwert auf dieser von vor der Front her (Abb. 2.3 (b)), so folgen aus den zwei gestellten Stetigkeitsforderungen mit f f2 f1 die zwei Gleichungen C x ϕ xt
C t ϕ x x ,
C x ϕ t t
C t ϕ t x ,
(2.98)
da C x und Ct stetig sind. Aus der beiderseits der Kurve x(t) gültigen Differentialgleichung (2.97) ergibt sich andererseits 1 ϕ t t c2
ϕ x x .
Werden ϕ x x und ϕt t mit Hilfe von (2.98) durch ϕ xt hieraus 1 Ct Cx ϕxt 0 . c2 C x Ct
ϕt x ausgedrückt, so folgt (2.99)
Kurven, auf denen sich Unstetigkeiten der zweiten Ableitungen ausbreiten können, werden als Charakteristiken bezeichnet. Auch die Wellenfront x(t) bewegt sich demnach auf einer Charakteristik. Da C(x, t) 0 eine implizite Darstellung der Kurve x(t) ist, gilt C(x(t), t) 0 .
2.7 Mischung positiver und negativer Energien
29
Aus dieser Identität folgt C x x(t) Ct
0
und
x(t)
Ct . Cx
Wird das letzte Ergebnis in Gleichung (2.99) eingesetzt, so ergibt sich aus dieser nach Herauskürzen von ϕxt x 1 0 oder x c . 2 x c Damit ist gezeigt, daß sich die Front x(t) des Wellenpakets mit Lichtgeschwindigkeit ausbreitet, unabhängig davon, welche Gruppengeschwindigkeit es besitzt. Dies zeigt, daß Wellenpakete auch in der relativistischen Quantenmechanik zerfließen. Anders als in der nicht-relativistischen Quantenmechanik wird dabei allerdings die Lichtgeschwindigkeit nicht überschritten.
2.7 Mischung positiver und negativer Energien In diesem Abschnitt wird gezeigt, daß die Dirac-Gleichung bei Anwesenheit eines Vektorpotentials A 0 nicht mehr bezüglich der Zustände positiver und negativer Energie separiert. Auch bei Einwirkung äußerer Kräfte kann ein beliebiger Teilchenzustand in eine Fourier-Reihe (2.89) zerlegt werden. Wir schreiben diese in der Form ψ(x, t)
mit ψ (λ) (x, t)
1
ψ ( ) (x, t) ψ ( ) (x, t)
(2π h 2 )3/2 i
d 3 p Ci(λ)( p)Ui(λ)( p) ei ( px
(2.100) λEp t )/h
.
(2.101)
Für den Hamilton-Operator (2.58) schreiben wir H
H f
qΦ cq « A
mit
H f
m 0 c2 β c« p ,
wobei H f der Hamilton-Operator für freie Teilchen ist. Es gilt 1 (λ) (λ) d 3 p Ci ( p) H f Ui ( p) ei ( px H f ψ (λ) (2π h 2 )3/2 i (2.71) λ (2.78) d 3 p Ci(λ)( p) Ep Ui(λ)( p) ei ( px (2π h 2 )3/2 i (2.101)
(2.102)
λEp t )/h
λEp t )/h
(λ) i h∂ ,
tψ
womit die separate Entwicklung von Zuständen positiver und negativer Energie bei freien Teilchen nochmals formal bewiesen ist.
30
2 Dirac-Theorie des Elektrons und des Neutrinos
Für gewisse Zwecke ist es nützlich, einen Operator zu definieren, dessen Anwendung auf Zustände rein positiver bzw. rein negativer Energie das Vorzeichen der Energie erkennen läßt. Zu dessen Konstruktion berechnen wir aus (2.102b) unter Vorgriff auf die Beziehung (2.168), aus der sich für a b p die Identität « p « p p 2 ergibt, zunächst H 2f
(m 0 c2 β c« p )(m 0 c2 β c« p ) m 02 c4 β 2 m 0 c3 (β « p « p β) c2 « p « p
(2.42a,b),(2.168)
m 02 c4 c2 p 2 .
Der hiermit gebildete und durch Reihenentwicklung nach p erklärte Vorzeichenoperator H f m 0 c2 β c« p Λ (2.103) m 02 c4 c2 p 2 H f 2 besitzt die gewünschte Eigenschaft: Mit der aus der Reihenentwicklung eines Operators f ( p ) folgenden Beziehung f ( p )ψ f ( p)ψ für p ψ pψ ergibt sich durch Anwendung von Λ auf die gemeinsamen Eigenzustände (2.84) der Operatoren p und H f mit den zur Abkürzung benutzten Beziehungen (2.80)–(2.81) Λ Ui(λ)( p) ei ( p x λEp t )/h
(2.71)a (2.78)
(2.78b)
λEp
m 02 c4 c2 p2
Ui(λ)( p) ei ( p x λEp t )/h
(λ)
λ Ui ( p) ei ( p x λEp t )/h ,
und durch ähnliche Rechnung wie bei der oben durchgeführten Berechnung von H f ψ (λ) ergibt sich hiermit (λ) λψ (λ) . Λψ (2.104) Der Operator Λ ist hermitesch und unitär, Λ Λ Λ 1 . Mit Hilfe von Λ können Projektionsoperatoren Π konstruiert werden, die aus einem allgemeinen Zustand, der bei seiner Zerlegung (2.89) bzw. (2.100) im allgemeinen Energieeigenzustände positiver und negativer Energie enthält, die Zustände positiver bzw. negativer Energie herausprojizieren. Wir definieren Π
1 , (1 Λ) 2
Π
1 (1 Λ) 2
(2.105)
und erhalten mit (2.104) zunächst die Eigenschaften Π ψ () Π ψ ()
ψ ( ) , 0,
Π ψ ()
Π ψ ()
0,
(2.106)
ψ ( ) .
(2.107)
Die Anwendung auf einen allgemeinen Zustand (2.100), ψ ψ () ψ () , liefert hiermit Π ψ
ψ () ,
Π ψ
ψ () .
Aus (2.106)–(2.108) ergibt sich für beliebige Zustände ψ Π 2 ψ
Π ψ ()
ψ ( )
Π ψ .
(2.108)
2.7 Mischung positiver und negativer Energien
Dies hat
31
Π
Π 2
(2.109)
zur Folge. Jetzt wollen wir untersuchen, wie die Einwirkung von Operatoren auf einen Spinor ψ die Zerlegung in Anteile positiver und negativer Energie beeinflußt. Dabei lassen wir alle möglichen Operatoren zu, also Matrizen wie « und β, welche die Anordnung der Spinorkomponenten verändern, und Differentialoperatoren wie p oder Multiplikationsoperatoren, welche diese unverändert lassen. Ein Operator, der aus jedem Zustand positiver (bzw. negativer) Energie wieder einen Zustand positiver (bzw. negativer) Energie erzeugt, wird als gerader Operator bezeichnet und zwischen eckige Klammern gestellt, L ψ () ψ () , L ψ () ψ () . (2.110) Ein Operator, der aus jedem Zustand positiver Energie einen Zustand negativer Energie und aus jedem Zustand negativer Energie einen Zustand positiver Energie erzeugt, wird als ungerader Operator bezeichnet und zwischen geschweifte Klammern gestellt,
L ψ () ψ () , L ψ () ψ () . (2.111) Der Hamilton-Operator H f für freie Teilchen und der Impulsoperator p sind offensichtlich gerade Operatoren, d. h. es gilt
H f ,
H f
p
p .
(2.112)
Jeder Operator L kann in einen geraden und einen ungeraden Anteil zerlegt werden, L
L L ,
(2.113)
wobei L oder L natürlich auch verschwinden kann. Den Beweis erbringen wir durch explizite Berechnung von L und L . Zunächst gilt Λ L Λ ψ Λ L Λ ψ () ψ () (2.104) (2.113)
(2.104)
Λ L L ψ () ψ () ψ () ψ () ψ () ψ ()
(2.110) (2.111)
(2.110) (2.111)
Λ ψ () ψ () ψ () ψ ()
L ψ () L ψ () L ψ () L ψ ()
L ψ L ψ . Wird dieses Ergebnis zu der aus (2.113) folgenden Gleichung L ψ
L ψ L ψ
addiert bzw. von ihr subtrahiert, so ergibt sich
L ψ
1 L Λ L Λ ψ , 2
L ψ
1 L Λ L Λ ψ , 2
32
2 Dirac-Theorie des Elektrons und des Neutrinos
und weil diese Beziehungen für beliebige Spinoren ψ gelten, erhalten wir schließlich L
1 L Λ L Λ , 2
L
1 L 2
Λ L Λ
.
(2.114)
,
(2.115)
Die Anwendung dieser Formeln auf die Operatoren « und x liefert c p Λ
«
i hc «Λ x x 2 H f 2
,
H f 2
2p i hc
2 H f 2
die ungeraden Anteile ergeben sich gemäß (2.113) aus « « « bzw. x x x und sind wie die geraden Anteile beide ungleich null. Beweis: 1. Λ «Λ
2 (2.103) m 0 c β c« p 2 m 0 c4 c 2 p 2
m c 2 β c« p
« 0
m 02 c4 c2 p2
(m 0 c2 β « c« p « )(m 0 c2 β c« p) . m 02 c4 c2 p2
Mit (m 0 c2 β « c« p « )(m 0 c2 β c« p) m 02 c4 β « β m 0 c3 (β « « p« p « β) c2 « p « « p (2.42b)
2 c4 « m c3 β(α α α α ) p e 0 k l l k l k
(2.42c)
2 c4 « m c3 β2δ p e 0 kl l k
(2.168)
2 c4 « 2m c3 β pc2 « p2 2c2 p « p (2.102b) 2 4 2 2 « (m 0 c c p )2c H f p 0
m 0
m 0
c2 αl pl αk αm pm ek
c2 αk αl pl αm pm ek
2c2 δkl pl αm pm ek
m 0
ergibt sich daraus Λ « Λ «
2c Hf p
und
Hf 2
«
cH p 1 « Λ « Λ f 2 2 Hf
c pΛ . Hf 2
2. In Kapitel Q3.6 der Quantenmechanik wurde aus dem Ansatz H f (x, p) Gleichung H /∂ p abgeleitet. Aus Λg( Hf ) und Hf f ( p) folgt Λ g( f ( p))g( p), (Q3.128), x, H (h/i)∂ und daher ergibt sich mit dem gleichen Beweisgang wie für Gleichung (Q3.128) x, Λ
Aus (2.103) folgt ∂Λ ∂p
c« 2 m 0 c4 c2 p 2
h ∂ Λ . i ∂p
c2 H f p 3/2 m 02 c4 c2 p2
c« Hf 2
und durch Kombination mit der Formel für x, Λ ergibt sich Λx
c« x Λ i h Hf 2
c2 Λ p Hf 2
.
c2 Λ p Hf 2
,
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
33
Damit und mit Λ2 Hf2 / H f2 1 erhalten wir Λx Λ x Λ2
c« Λ i h Hf 2
c2 Λ2 p Hf 2
c« Λ x i h Hf 2
c2 p Hf 2
Hieraus folgt mit (2.114a) unmittelbar (2.115b).
.
Mit x hat auch jede Potenz und allgemeiner jede Funktion von x einen geraden und einen ungeraden Anteil, d. h. Φ(x), Φ(x), A(x) und A(x) sind alle von null verschieden. Durch Einwirken des Operators « A(x) wird das Energievorzeichen von ψ ( ) zweimal verändert und bleibt daher insgesamt unverändert, d. h. « A(x) ist ein gerader Operator. « A(x) und « A(x) ändern das Vorzeichen von ψ ( ) nur einmal und sind daher ungerade Operatoren. Damit und mit (2.112a) erhalten wir für den Hamilton-Operator (2.102) H
H
mit H
H H
(2.116)
q Φ(x) cq « A(x)« A(x) , q Φ(x) cq « A(x) « A(x) . H f
(2.117) (2.118)
Ist nun ψ(x, 0)ψ () (x, 0) ein Anfangszustand positiver Energie, so entwickeln sich aufgrund der Bewegungsgleichung i h∂
tψ
H ψ H ψ H ψ
aus diesem zwangsläufig auch ψ-Anteile negativer Energie, weil () i h∂
tψ
H ψ () H ψ ()
gilt und H ψ () (x, 0) von null verschieden ist.
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung Es ist interessant, den nicht-relativistischen Grenzfall der Dirac-Gleichung allgemein zu untersuchen. Bei den Ebene-Welle-Lösungen positiver Energie waren in diesem nur die zwei oberen Spinorkomponenten von Bedeutung, bei denen negativer Energie nur die zwei unteren. Dieser Sachverhalt motiviert dazu, auch bei Teilchen in äußeren Feldern im nicht-relativistischen Grenzfall die Zerlegung (2.73) des Viererspinors ψ in zwei Zweierspinoren ϕ und χ vorzunehmen. Für jeden beliebigen Zustand ψ(x, t) ist eine Fourier-Zerlegung (2.89) möglich, und ϕ wird dann im wesentlichen die Lösungsanteile positiver enthalten, χ die Lösungsanteile negativer Energie. Mit (2.51b) 1 ϕ χ 0 ϕ 0 ϕ βψ « ψ , 0 1 χ χ 0 χ ϕ
34
2 Dirac-Theorie des Elektrons und des Neutrinos
und (2.65) zerfällt die Dirac-Gleichung (2.55) dann in die zwei Gleichungen ih ∂t ϕ ih ∂t χ
(m 0 c2 qΦ) ϕ c χ , (m 0 c2 qΦ) χ c ϕ .
(2.119)
2.8.1 Zeitunabhängige Felder A und Wir behandeln zuerst den einfacheren Fall, daß die Felder A und Φ nicht von t abhängen. In diesem kann die allgemeine Lösung ψ(x, t) nach den Eigenfunktionen des Hamilton-Operators entwickelt werden, der ebenfalls zeitunabhängig ist. Mit dem Ansatz ϕ ϕα e iEα t /h , χ χα eiEα t /h (2.120) erhalten wir die letzteren nach (2.119) aus den Gleichungen E α ϕα
(m 0 c2 qΦ) ϕα cσl π l χα ,
E α χα
2
(m 0 c qΦ) χα cσl π l ϕα
. (2.121)
(Dabei wird die Summenkonvention benutzt, wobei über unterstrichene Indizes nicht summiert wird.) Indem wir (2.121b) nach χα auflösen, χα
c σm π m ϕα , (E α m 0 c2 qΦ)
(2.122)
und das Ergebnis in (2.121a) einsetzen, erhalten wir c2 σl σm π l π m ϕα h 1 π ϕ σ . ∂l E α ϕα (m 0 c2 qΦ) ϕα c2 σl m m α i E α m 0 c2 qΦ E α m 0 c2 qΦ (2.123) Hierin gilt 2 h σl σm π l π m q A q h B . (2.124) i Beweis: Für die linke Seite von (2.124) folgt zunächst σm σl πm πl σl σm πl πm σl σm πm πl πl , πm 12 σl , σm πm πl (Q7.43)
2
1 σ σ π , π 2 l m l m
1 σ σ π , π , 2 l m l m
wobei die vierte Form des Ausdrucks durch Kombination der ersten und dritten entstanden ist. Im zweiten Term des zuletzt erhaltenen Ergebnisses liefern alle Summanden mit l m keinen Beitrag, es verbleibt die Summe über die drei zyklischen Kombinationen 12, 23 und 31 sowie die drei antizyklischen Kombinationen 21, 32 und 13 von l und m. Mit πl , πm πm , πl , (Q7.45)–(7.46) und h h h h ∂l q Al ∂m q Am ∂m q Am ∂l q Al πl , πm i i i i h q h (∂l Am ) (∂m Al ) q für l, m, n zyklisch Bn i i
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
35
folgt daher (ohne Summenkonvention)
1 σ σ π , π 2 l m l m
l,m l m
σl σm π l , π m
(Q7.45)
q h
l,m zykl
3
σn B n .
n 1
Setzt man dies und die Definition (2.65) in die beim ersten Beweisschritt abgeleitete Formel ein, so erhält man (2.124).
Mit (2.124) und
h 1 ∂l i E α m 0 c2 qΦ
q h(∂l Φ) i (E α m 0 c2 qΦ)2
lautet (2.123) E α ϕα
q hc2 σl (∂l Φ) σm π m ϕα i (E α m 0 c2 qΦ)2 % $ 2 2m 0 c2 h qh 1 q A 2m B ϕα . E α m 0 c2 qΦ 2m 0 i 0
(m 0 c2 qΦ) ϕα
(2.125)
Dies ist eine lineare Eigenwertgleichung zweiter Ordnung für ϕα alleine, die den Eigenwert E α allerdings in nichtlinearer Weise enthält. Ist aus ihr ϕα bestimmt, so erhält man aus (2.122) auch unmittelbar χα . Wir suchen jetzt den nicht-relativistischen Grenzfall der Gleichung (2.125) für Zustände positiver Energie E α . Im quasiklassischen Grenzfall ergibt sich aus (2.5) mit (2.6) für positive Energien H E m 0 c2 1 v2 2 1 E qΦ c m 02 c2 m 2 v 2 m 0c . 2 c2 1v 2 /c2 Bei nicht-relativistischen Geschwindigkeiten v/c 1 ist demnach & 1 v2 (E m 0 c2 qΦ) (m 0 c2 ) 2 c2
1.
In Analogie dazu definieren wir den nicht-relativistischen Grenzfall für die quantenmechanischen Lösungen positiver Energie durch ' '& ' E α m 0 c2 qΦ ' (m 0 c2 ) 1 . (2.126) Diese Bedingung wird erfüllt, wenn sich E α nur wenig von der Ruheenergie m 0 c2 unterscheidet und qΦ m 0 c2 gilt. Häufig hat man es allerdings mit Problemen zu tun, bei denen qΦ divergiert. (Das tut z. B. das Potential des Atomkerns.) In der klassischen Mechanik entsteht hierdurch kein Problem, weil die Bedingung nur dort erfüllt sein muß, wohin das Teilchen wirklich gelangt. Quantenmechanisch muß die Bedingung überall dort erfüllt sein, wo die Wellenfunktion ϕ wesentlich von Null verschieden ist. Wir überzeugen uns anhand eines Beispiels davon, daß hierdurch im allgemeinen kein
36
2 Dirac-Theorie des Elektrons und des Neutrinos
Problem entsteht. Dazu betrachten wir den Grundzustand des Wasserstoffatoms. In ihm ist die Wellenfunktion nur in der unmittelbaren Umgebung einer Kugelschale, die vom Kern den Abstand rB h /(αm 0 c) (Bohrscher Radius) besitzt, wesentlich von Null verschieden. In dieser Zone ergibt sich aber
qΦ m 0 c2
e2 α 4πε0 h c
e2 4πε0rB m 0 c2
5 10 5 1 ,
(2.127)
E α m 0 c2 qΦ m 0 c2 2 2m 0c2 , m 0 c2
(2.128)
s.u.
α2
wobei α e2 /(4πε0 h c) 1/137 benutzt wurde. Ist die Bedingung (2.126) erfüllt, so gilt E α m 0 c2 qΦ
und der letzte Term der rechten Seite von (2.125) vereinfacht sich zu
1 2m 0
2
h q h q A 2m B ϕα . i 0
Von dem Ausdruck π m ϕα im zweiten Term der rechten Seite von (2.125) erhalten wir die Größenordnung, indem wir ihn für die Wellenlösung (2.69) der kräftefreien DiracGleichung ( (h /i) ) abschätzen: Da die Elemente der Matrizen σi die Größenordnung eins besitzen, gilt im nicht-relativistischen Grenzfall ' ' ' ϕα ' pϕα m 0 v ϕα . (2.129) ∂l Φ hat z. B. im Wasserstoffatom die Größenordnung Φ/rB . Damit erhalten wir für das Verhältnis des zweiten Terms der rechten Seite von (2.125) zum Anteil qΦϕα des ersten Terms ' ' ' q h c2 σl (∂l Φ)σm π m ϕα ' (2.128) q h c2 (Φ/rB )m 0 v ϕα ' ' m hcv2r αvc 1 , ' i (E m c2 qΦ)2 qΦϕ ' m 02 c4 qΦϕα α 0 α 0 B d. h. der zweite Term kann vernachlässigt werden. Insgesamt ergibt sich damit für den nicht-relativistischen Grenzfall von Gleichung (2.125) E α ϕα
(m 0 c2 qΦ) ϕα
1 2m 0
2
h q h qA B ϕα , i 2m 0
(2.130)
und Gleichung (2.122) führt näherungsweise zu χα
1 σl π l ϕα . 2m 0 c
(2.131)
Mit der Abschätzung (2.129) ergibt sich hieraus im nicht-relativistischen Grenzfall χα
vc ϕα .
(2.132)
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
37
Wegen v/c 1 können daher die Komponenten χα gegen die Komponenten ϕα vernachlässigt werden – oft werden deshalb die zwei oberen Komponenten des DiracSpinors ψ als große Komponenten und die zwei unteren als kleine Komponenten bezeichnet. Dieses Ergebnis bedeutet, daß der Viererspinor ψ der Dirac-Theorie im nicht-relativistischen Grenzfall effektiv zu einem Zweierspinor zusammenschrumpft. Nach (2.120) und wegen der Linearität der Dirac-Gleichung ist cα ϕα e iEα t /h (2.133) ϕ
α
eine Lösung des zeitabhängigen Problems. Da die Eigenfunktionen ϕα wie in der nichtrelativistischen Quantentheorie ein vollständiges Funktionensystem bilden, kann die Lösung (2.133) jeder beliebigen Anfangsbedingung angepaßt werden und ist daher die allgemeinste zeitabhängige Lösung. Die Anfangsbedingung kann insbesondere so gestellt werden, daß nur Eigenzustände ϕα zu positiven Eigenwerten E α angeregt sind, welche die Bedingung (2.126) erfüllen. Dann gilt jedoch Gleichung (2.130), und wir erhalten mit dieser aus (2.133) ih ∂t ϕ cα E α ϕα eiE α t /h
α
(m 0 c2 qΦ)
α
(m 0 c2 qΦ)
2 1 h qh qA B 2m 0 i 2m 0
2 h 1 qA 2m 0 i
Nun gehen wir noch mit der Transformation 2 im 0 c t /h ∂t Ψ ∂t ϕ ϕ Ψe
2mq h B
cα ϕα eiEα t /h
ϕ.
0
i m 0 c2 Ψ h
eim 0 c
(2.134)
2 t /h
(2.135)
von ϕ zu einem Spinor Ψ über, der wegen ϕϕ
Ψ
Ψ
dieselben physikalischen Eigenschaften wie ϕ besitzt. Gleichung (2.134) wird durch die Transformation in
ih ∂t Ψ
$ qΦ
1 2m 0
2 % h qA Ψ i
2mq h B 0
Ψ
(2.136)
überführt. Das ist gerade die Pauli-Gleichung (Q7.41) für die Quantendynamik eines geladenen Spin-1/2-Teilchens mit dem gyromagnetischen Verhältnis gs 2 im elektromagnetischen Feld. Wir dürfen die Dirac-Gleichung daher als relativistische Verallgemeinerung der Pauli-Gleichung für Elektronen interpretieren.
38
2 Dirac-Theorie des Elektrons und des Neutrinos
Dieses Ergebnis ist einerseits höchst erfreulich, bedeutet andererseits aber eine erhebliche Einschränkung: Die unter ganz allgemeinen Gesichtspunkten aufgestellte relativistische „Wellengleichung“ (2.55) ist in ihrer Gültigkeit auf Teilchen eingeschränkt, die den Spin 1/2 und das gyromagnetische Verhältnis gs 2 besitzen. Wir können mit ihr zwar Elektronen und Positronen beschreiben, und für m 0 0 sowie q 0 auch noch Neutrinos, worauf wir in Abschn. 2.14 zurückkommen werden. Für Teilchen mit anderen Eigenschaften wie z. B. Protonen ist sie jedoch ungeeignet. Es sei ausdrücklich darauf hingewiesen, daß bei unserer Ableitung des nichtrelativistischen Grenzfalls als wesentlicher Faktor einging, daß wir es mit Lösungen positiver Energie zu tun haben. Analog läßt sich auch ein nicht-relativistischer Grenzfall für Lösungen negativer Energie herleiten. Für diesen müßte E α in der Nähe von m 0 c2 liegen, und wir hätten anstelle der Bedingung (2.126) E α m 0 c2 qΦ /(m 0 c2 ) 1 zu fordern. Es zeigt sich, daß in diesem Fall die zwei unteren Komponenten von ψ die großen Komponenten sind, gegenüber denen die zwei oberen Komponenten vernachlässigt werden können (Aufgabe 2.5). Anmerkungen: 1. Im Spezialfall Φ 0 entfällt in Gleichung (2.125) der zweite Term der rechten Seite. Wird m 0 c2 ϕα auf die linke Seite gebracht und die Gleichung anschließend mit E α m 0 c2 multipliziert, so erhält sie die Form E α2 ϕα
m 02 c4 ϕα
c
$ 2
% 2 h q A q h B ϕα , i
(2.137)
in die keine Näherung eingegangen ist. Man erkennt an dieser unmittelbar, daß zu jeder Eigenlösung ϕα zum Eigenwert E α > 0 auch E α ein möglicher Eigenwert ist, d. h. zu jedem positiven existiert ein negativer Eigenwert der Energie. 2. Aus dem Ansatz (2.133) folgt durch zweimalige Zeitableitung h 2 ∂t t ϕ
cα E α2 ϕα e
iE α t /h
.
Setzen wir hier auf der rechten Seite (2.137) ein und benutzen nochmals (2.133), so erhalten wir
h
2
∂t t ϕ
m 02 c4 ϕ
c
$ 2
% 2 h q A q h B ϕ . i
(2.138)
Man erhält diese Gleichung auch direkt, indem man (2.119a) für Φ 0 einmal nach t differenziert und in der dabei erhaltenen Gleichung ∂t ϕ und ∂t χ durch die Gleichungen (2.119) ausdrückt. (Man beachte dabei unsere Voraussetzung ∂t A 0.) Im Fall Φ 0 können die für ϕ und χ erhaltenen Gleichungen also exakt separiert werden, was eine erhebliche Vereinfachung bei der Lösung der Dirac-Gleichung darstellt.
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
2.8.2 Zeitabhängige Felder A und
39
Bei zeitabhängigen Feldern A und Φ wird der Hamilton-Operator (2.58) zeitabhängig. Der in Abschn. 2.8.1 durchgeführte Grenzübergang zum nicht-relativistischen Fall über das Eigenwertproblem ist dann nicht mehr möglich. Wir machen stattdessen den zu (2.135a) analogen Ansatz 2 ϕ ϕ (2.139) e im 0 c t /h χ χ und erhalten mit ihm aus dem Gleichungssystem (2.119) ih ∂t ϕ
qΦ ϕ cσl π l χ ,
ih ∂t χ
qΦ χ
2m 0c2χ cσl π l ϕ .
(2.140)
Bei zeitunabhängigen Potentialen Φ und A gilt für die stationären Eigenlösungen (2.120) positiver Energie χ oder
χα e χ α
iE α t /h (2.139)
χα e
χ α e
im 0 c2 t /h
i(E α m 0 c2 )t /h
.
Im nicht-relativistischen Grenzfall E α m 0 c2 ergibt sich hieraus
h ∂t χα (Eα m 0c2)χα 2m 0c2χα . Analog dazu definieren wir den nicht-relativistischen Grenzfall bei zeitabhängigen Feldern unter zusätzlicher Benutzung der Abschätzung (2.127) durch die Forderungen
qΦ m 0 c2,
h ∂t χ 2m 0c2 χ .
(2.141)
Sind diese erfüllt (der Ansatz (2.139) ermöglicht das nur für Lösungen positiver Energie, denn für E α m 0 c2 gilt ih ∂t χ α 2m 0 c2 χ α ), so folgt aus (2.140b) χ
1 σm π m ϕ . 2m 0 c
(2.142)
Setzen wir dies in (2.140a) ein, so erhalten wir wieder die Pauli-Gleichung (2.136). Für die Erfüllbarkeit der Bedingungen (2.141) ist sicher notwendig, daß sich die Felder A und Φ hinreichend langsam verändern und daß H m 0 c2 gilt. Ob (2.141) von einer Lösung der Pauli-Gleichung tatsächlich erfüllt wird, überprüft man an der Bedingung ' ' ' 2 ' ' '' 2mh0c '' ϕ '' , (2.143) '∂t ( ϕ) die sich durch Einsetzen von (2.142) in (2.141b) ergibt.
40
2 Dirac-Theorie des Elektrons und des Neutrinos
Exkurs 2.1: Ableitungs-Linearisierung der Schrödinger-Gleichung Die Quantisierung der relativistischen Mechanik liefert auch unter nicht-relativistischen Verhältnissen nicht die Schrödinger-Gleichung. Andererseits ist die klassische relativistische Mechanik bei nicht-relativistischen Geschwindigkeiten praktisch der klassischen nicht-relativistischen Mechanik äquivalent. Letzteres läßt vermuten, daß es möglich sein sollte, die Pauli-Gleichung auch direkt aus der Schrödinger-Gleichung abzuleiten. In diesem Abschnitt wird gezeigt, daß dies tatsächlich gelingt. Dabei werden zum Teil dieselben Ideen benutzt, die Dirac zur Ableitung der Dirac-Gleichung führten. Unter Benutzung der Definition (2.65) schreiben wir die Schrödinger-Gleichung (Q3.46) in der Form 2m (ih ∂t qΦ) 2 ψ 0 (2.144) und merken an, daß der Übergang vom kräftefreien Fall (Φ 0, A 0) zum allgemeinen Fall durch die Ersetzungen h h p q A (2.145) ih ∂t ih ∂t qΦ , i i bewirkt wird. Die damit verbundene Kopplung der Felder Φ und A an geladene Teilchen wird als minimale Kopplung bezeichnet. Als erstes betrachten wir den kräftefreien Fall mit der Schrödinger-Gleichung
Ëψ
2m ih ∂t
h 2 ψ
0.
(2.146)
In Analogie zum Diracschen Ansatz (2.20) suchen wir eine lineare und homogene „Wellengleichung“ Lψ 0, (2.147) der die gestellten die in den Zeit- und Ortsableitungen linear ist. Der allgemeinste Ansatz für L, Forderungen erfüllt, ist L a ∂t b c . (2.148)
Um den Zusammenhang mit der Schrödinger-Gleichung herzustellen, verlangen wir, daß sämtliche Lösungen der „Wellengleichung“ (2.147) auch die Schrödinger-Gleichung (2.146) erfüllen. Das ist sicher dann der Fall, wenn ein Operator M
a ¼ ∂t
b¼ c¼
(2.149)
existiert, mit dem die Beziehung M L
Ë
(2.150)
0.) erfüllt werden kann. (Aus L 0 folgt dann Ëψ M Lψ Operatoren M und L, die alle gestellten Forderungen erfüllen, sind
h m (β 1) , i (2.151) wobei β und « die vertrauten Dirac-Matrizen sind. (Es kann gezeigt werden, daß L und M MatrixOperatoren sein müssen, die mindestens die Dimension 4 4 besitzen.) Aus den Gleichungen L
1 (β 1) ih ∂t 2
i «
h m (β 1) , i
M
1 (β 1) ih ∂t 2
i «
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
41
(2.151) ergibt sich nämlich ML
h 2 2 (β 1) ∂t t 4
h
2α α ∂ ∂ l m l m
ih 2 β, « 2
h
m « , β
∂t
m2
(β 1)2 (β 1)2 ih ∂t
m 2 (β 2 1).
(2.42c)
Mit (2.42) und αl αm ∂l ∂m αm αl ∂m ∂l 12 αl , αm ∂l ∂m δlm ∂l ∂m folgt hieraus sofort die Gültigkeit von (2.150). Aus (2.147) mit (2.151a) läßt sich auch eine Kontinuitätsgleichung für ψ ψ ableiten, die gelten muß, damit ψ ψ als Wahrscheinlichkeitsdichte interpretiert werden kann. (Wir hätten das gleich zu Beginn durch entsprechende Forderungen an die Koeffizienten a, b und c verlangen können.) Den Übergang zum Fall mit elektromagnetischem Feld vollziehen wir jetzt in (2.147) wie bei der Schrödinger-Gleichung, d. h. wir nehmen in dem durch (2.151) gegebenen Operator L die Ersetzungen (2.145) vor und erhalten die Gleichung 1 (β 1) (ih ∂t qΦ) ψ i « ψ m (β 1) ψ 0 . (2.152) 2 Zerlegen wir ψ wie bei der Dirac-Gleichung gemäß (2.73) in Zweierspinoren und benutzen die Darstellung (2.51) der Dirac-Matrizen, so ergibt sich aus (2.152) 0 i ϕ ϕ 0 0 ϕ 1 0 2m 0 (ih ∂t qΦ) i 0 χ χ 0 1 χ 0 0 oder
(ih ∂t qΦ) ϕ i χ
0,
i ϕ 2m χ
0.
(2.153)
Setzen wir die aus (2.153b) folgende Beziehung χ
i 2m
ϕ
(2.154)
in (2.153a) ein, so ergibt sich mit (2.124) (ih ∂t
qΦ) ϕ
1 2m
2 h q h qA ϕ B ϕ , i 2m
also wieder die Pauli-Gleichung (Q7.41). Die Mehrkomponentigkeit der Wellenfunktion und das damit verbundene Auftreten der Spinfreiheitsgrade – daher der Name Spinor für ψ – kommt von der Forderung, daß die Bewe nur linear sein soll. Diese Forderung kann im gungsgleichung (2.147) im Impulsoperator (h/i) Grunde nur durch die Relativitätstheorie begründet werden, und insofern ist der Spin des Elektrons ein relativistischer Effekt. Sobald diese Forderung akzeptiert ist, kann die Pauli-Gleichung jedoch aus der Schrödinger-Gleichung deduziert werden, wodurch der nicht-relativistische Grenzwert des gyromagnetischen Verhältnisses erhalten wird. Man könnte also sagen: Der Spin ist ein relativistischer Effekt, die Stärke seiner Wechselwirkung mit dem Magnetfeld ist jedoch nicht-relativistisch determiniert. Führt man die Ersetzungen (2.145) in den Gleichungen (2.151) auch beim Operator M durch, so führt der Operator M L im Fall zeitunabhängiger Vektorpotentiale A ebenfalls zur PauliGleichung, es ergibt sich (Aufgabe 2.6) 2 h 0 . M L 2m(ih ∂t qΦ) q A qh B mit 0 i
42
2 Dirac-Theorie des Elektrons und des Neutrinos
2.9 Spinoperator
Wir benötigen im weiteren Verlauf einen Operator, der im Raum der Dirac-Spinoren den Spin repräsentieren kann, und wählen hierfür den Operator, dessen Mittelwert im nicht-relativistischen Grenzfall den Mittelwert des Spinoperators der Pauli-Gleichung liefert. Der Operator 0 0 , (2.155) bei dem die Komponenten σl von die Pauli-Matrizen sind, erfüllt diesen Zweck. Wegen der Hermitezität der 2 2-Matrizen σl sind auch die Komponenten Σl von hermitesche Matrizen. Mit der Zerlegung (2.73) erhalten wir
ψ
0
0
ϕ χ
ϕ χ
und der gemäß (2.57) gebildete Mittelwert ist somit 3 3 (2.135a) Ψ ϕ ϕ d x χ χ d x
,
Ψd x
χ
3
χ d 3x .
Im nicht-relativistischen Grenzfall ist der letzte Term nach (2.132) im Verhältnis v 2/c2 kleiner als der vorletzte, und wir erhalten Ψ Ψ d 3x . Rechts steht – bis auf den Faktor h /2 – der Erwartungswert des Spins nach der PauliTheorie. Daher ist S
h 2
(2.156)
ein für viele Zwecke geeigneter relativistischer Operator für den Spin. Aus der Darstellung (2.155) von ergibt sich fast unmittelbar, daß sich die Beziehungen (Q7.43), (2.87), (2.88) und (2.76) von auf übertragen lassen, d. h. es gilt
Σl , Σm 2δlm , Σl Σm a b a b i ( a b ) . Beweis: Aus
Σl Σm
σl 0
0 σl
σm 0
0 σm
δlm
i εlmn Σn
(2.157) (2.158)
σl σm 0
0 σl σm
folgt, daß alle Produkte von -Komponenten zu Matrizen führen, deren Elemente die entsprechenden Produkte von -Komponenten enthalten und die gleiche Diagonalstruktur wie die Matrix aufweisen.
2.9 Spinoperator
43
Eine unmittelbare Folge von (2.157a) bzw. Σx2 Σ y2 Σz2 1 ist S2
h 2 2 Σx Σ y2 Σz2 4
3 2 h , 4
(2.159)
d. h. die Matrix S2 ist proportional zur Einheitsmatrix. Hieraus folgt, daß jeder beliebige Viererspinor ein Eigenzustand von S2 zu dem einzigen Eigenwert 3h 2 /4 ist. Der durch beschriebene Spin hat gemäß der Formel S2 ψ h 2 s(s 1)ψ die Spinquantenzahl s 1/2. Wir berechnen auch noch die Eigenwerte sz und Eigenzustände des Operators ⎛ ⎞ 1 0 σz 0 1 ⎜ ⎟ Σz (2.160) ⎝ ⎠. 0 σz 1 0 1 Aus der Eigenwertgleichung Σz sz bzw. ⎞⎛ ⎞ ⎛ ⎛ 1 0 1 1 ⎟⎜ 2⎟ ⎜ ⎜ ⎠⎝ ⎠ ⎝ ⎝ 1 3 0 1 4
1
⎞
2⎟ 3 4
⎠
⎛
sz ⎜ sz ⎝ sz sz
1
⎞
2⎟ 3
⎠
4
ergeben sich die Gleichungen (1 sz )
1
0,
(1 sz )
0,
2
(1 sz )
3
0,
aus denen entweder sz 1 und 2 4 0 oder sz 1 und 1 erhalten wir die auf eins normierten Eigenzustände ⎛ ⎞ ⎛ ⎞ 1 0 1 ⎜0⎟ 1 ⎜1⎟ ⎝ 1 ⎠ zu sz 1 , ⎝ 0 ⎠ zu 2 2 0 1 die Σz
(1 sz ) 3
sz
4
0,
0 folgt. Daraus
1 ,
(2.161)
(2.162)
erfüllen. Um einen Zusammenhang zwischen den Operatoren « und ¦ herzustellen, führen wir eine weitere Matrix (2.163) τ i αx α y αz ein. Diese hat die Darstellung τ
0 1 1 0
(2.164)
und besitzt die Eigenschaften τ
τ,
τ2
1.
(2.165)
44
2 Dirac-Theorie des Elektrons und des Neutrinos
Der Zusammenhang zwischen « und
«
τ¦
¦τ
¦ ist
¦
bzw.
τ«
«τ ,
(2.166)
es gelten die Vertauschungsrelationen
«, τ
β, τ
0,
¦ , τ
0,
¦ , β
0,
0,
(2.167)
und aus (2.158) folgt
« a « b a b i τ « (a b) .
(2.168)
Beweis: Durch Einsetzen von (2.51a) in (2.163) ergibt sich 0 σ x σ y σz i τ . σ x σ y σz 0 Für die Darstellung (Q7.39) der Pauli-Matrizen gilt 0 1 0 i 1 σx σ y σz 1 0 i 0 0 Damit ist τ
i
0 iE
iE 0
0 1
0 1 1 0
i 0 0 i
iE.
.
(2.165) folgt gemäß τ
i αz α y α x
τ2
(2.43b)
α x α y αz α x α y αz
i αz α y α x
(2.42c)
(2.42c)
αx2 α 2y αz2
i α y αz α x
(2.42c)
Für zyklische l, m und n gilt 0 σl 0 σm σl 0σm αl αm σl 0 σm 0
i α y α x αz
i α x α y αz
τ,
1.
0 σl σm
i
σn 0
0 σn
(2.155)
i Σn .
(2.169)
Unter Benutzung von αx2 1 ergibt sich damit z. B. Σx
i α y αz
i α x2 α y αz
αx τ
i α y αx2 αz
(2.42c)
i αx α y αz α x
τ αx ,
und analog findet man Σ y α y τ τ α y sowie Σz αz τ τ αz , insgesamt also (2.166b). (2.166a) ergibt sich aus (2.166b) durch Links- oder Rechtsmultiplikation mit τ und Benutzung von (2.165b). Die Vertauschungsrelationen (2.167a) und (2.167c) folgen unmittelbar aus den verschiedenen Darstellungen von « bzw. ¦ in (2.166). (2.167b) und (2.167d) folgen gemäß βτ
¦ , β
(2.166b)
i βαx α y αz
«τβ
β«τ
i α x α y αz β
«βτ
(2.42b) (2.167b)
β«τ
τβ ,
(2.42b)
β «τ
β«τ
0.
Der Beweis von (2.168) ergibt sich aus (2.158) mit (2.166b) gemäß a b i τ « ( a b )
a b i ¦ (a b ) ¦ a ¦ b τ « a τ « b (2.167a) 2 τ « a « b (2.165b) « a « b .
2.10 Kovarianz der Dirac-Gleichung
45
Ableitungsgemäß stellt S h /2 für hinreichend kleine Teilchenenergien eine gute Näherung an den Spinoperator dar, die im (mittleren) Ruhesystem des Teilchens sogar exakt wird. Gleichung (2.156) mit (2.155) definiert allerdings nur einen Dreiervektor und liefert daher keine relativistisch invariante Darstellung des Spins. Die Ableitung eines relativistisch invarianten Spinoperators ist ziemlich kompliziert und wird hier nicht weiter verfolgt.6
2.10 Kovarianz der Dirac-Gleichung In diesem Abschnitt werden die Transformationseigenschaften der Dirac-Gleichung untersucht, die als relativistische Gleichung natürlich Lorentz-invariant sein muß. Dabei muß auch die Frage geklärt werden, wie die Spinoren ψ zu transformieren sind. Als erstes bemühen wir uns um eine in der Zeit- und den Ortskoordinaten symmetrische Schreibweise der Dirac-Gleichung (2.55). Dazu multiplizieren wir diese mit β/c und erhalten mit x 0 ct, x 1 x, x 2 y und x 3 z ih (β∂0 βαl ∂l ) ψ
(2.42a)
m 0c ψ
q (βΦ/cβαl Al ) ψ .
(2.170)
Die Gleichung ist wie bisher gewohnt so zu verstehen, daß lateinische Indizes die drei Werte 1, 2 und 3 annehmen können und daß über doppelt auftretende Indizes summiert wird. Nun führen wir durch γ0 neue Matrizen γ α (α
β,
γl
βαl (l
1, 2, 3)
0, 1, 2, 3) ein, die nach (2.51) durch 1 0 0 σl , γl γ0 σl 0 0 1
(2.171)
(2.172)
gegeben sind. Nach der Speziellen Relativitätstheorie, Kapitel „Relativistische Formulierung der Elektrodynamik“ ist ( ) Aα Φ/c, A ein kovarianter Vierervektor. Hiermit, mit den Definitionen (2.171) und der Elektronenladung q e läßt sich Gleichung (2.170) in die symmetrische Form γ
α
h ∂α e Aα ψ i
m 0c ψ
0
(2.173)
bringen. Dies ist die kovariante Form der Dirac-Gleichung. (Griechische Indizes können die vier Werte 0, 1, 2 und 3 annehmen. Bei doppeltem Auftreten griechischer Indizes wird dementsprechend über vier Terme summiert, wobei jetzt die Konvention der 6 Für nähere Einzelheiten siehe z. B. S. 57 ff. des Buchs [12] der Literaturliste und die dort angegebene Literatur.
46
2 Dirac-Theorie des Elektrons und des Neutrinos
Relativitätstheorie benutzt wird, nach der von doppelt auftretenden Summationsindizes einer unten und einer oben stehen muß.) Für die Kombination γ α A α hat R. Feynman die als Feynman-Dolch oder (englisch) als Feynman-Dagger bezeichnete Kurznotation γ α Aα
A /
(2.174)
eingeführt, mit der die Dirac-Gleichung die Form h ∂/ ψ i
e/Aψ m 0 c ψ
0
(2.175)
erhält. Jetzt wenden wir uns den Transformationseigenschaften der Gleichung (2.173) zu. Bei der Lorentz-Transformation d x ¼α Λαβ d x β transformieren sich die kovarianten Vektorgrößen ∂α und Aα nach der Speziellen Relativitätstheorie, Abschn. „Vektoren und Tensoren der vierdimensionalen Raum-Zeit“ gemäß ∂α
Λβα ∂ ¼β
Aα
Λβα A ¼β .
Wird dies in (2.173) eingesetzt, so erhalten wir h ¼ Λβα γ α ∂ β e A¼β ψ m 0 c ψ i
(2.176)
0.
(2.177)
Weiter unten wird bewiesen, daß eine – nicht notwendig unitäre und nur von Λαβ abhängige – 4 4-Matrix S existiert, die für alle Indizes β die Gleichung S 1 γ β S
Λβα γ α
(2.178)
erfüllt. Setzen wir dies in Gleichung (2.177) ein und multiplizieren diese noch von links mit S, so erhalten wir schließlich β h ¼ ¼ (2.179) ∂ β e A β ψ ¼ m 0 c ψ ¼ 0 , γ i sofern ψ ¼ (x ¼ ) Sψ x(x ¼ ) (2.180) gesetzt wird. (Man beachte, daß die Dirac-Matrizen untransformiert bleiben!) Die Ruhemasse m 0 , die Elementarladung e und die Lichtgeschwindigkeit c sind LorentzInvarianten. Der Vergleich mit (2.173) zeigt: Die Dirac-Gleichung ist dann Lorentzinvariant, wenn auch noch h als Lorentz-Invariante definiert wird, wenn angenommen wird, daß die Dirac-Matrizen γ α in allen Inertialsystemen dieselbe Form besitzen, und wenn (2.180) das Transformationsgesetz für Spinoren ist. Wir überzeugen uns jetzt davon, daß Gleichung (2.178) eine Lösung besitzt. Dabei beschränken wir unsere Betrachtung zunächst auf den Fall einer LorentzTransformation zwischen Systemen in Standardkonfiguration. (Das System S¼ bewegt
2.10 Kovarianz der Dirac-Gleichung
47
sich relativ zu S mit der Geschwindigkeit Ú v ex , zur Zeit t 0 sind S und S ¼ deckungsgleich.) Die Transformationsgleichungen lauten in diesem Fall t¼
t vx/c2 1 v 2 /c2
x¼
vt 1 v 2 /c2 x
y¼
z¼
y,
z
und können mit ϕ bzw.
sinh ϕ in die Form x ¼ α
artanh(v/c)
v/c
1
v 2 /c2
,
Λαβ x β mit ⎛
cosh ϕ ⎜ sinh ϕ ⎝ 0 0
Λαβ
1 1 v 2 /c2
cosh ϕ
sinh ϕ
⎞ 0 0⎟ ⎠ 0 1
0 0 1 0
cosh ϕ 0 0
(2.181)
gebracht werden. Für diese Transformationsmatrix erhält die rechte Seite von Gleichung (2.178) die Komponenten Λ0α γ α
γ 0 γ 0 (cosh ϕ 1) γ 1 sinh ϕ ,
Λ1α γ α
γ 1 γ 1 (cosh ϕ 1) γ 0 sinh ϕ ,
Λ2α γ α
γ2 ,
Λ3α γ α
γ3 ,
zusammengefaßt γ 0 (cosh ϕ 1)γ 1 sinh ϕ δ β0 γ 1 (cosh ϕ 1)γ 0 sinh ϕ δ β1 . (2.182) Wir verifizieren nun einfach durch Einsetzen, daß (2.178) die Lösung Λβα γ α
γβ
S
e
α1 ϕ/2
(2.183)
besitzt, wobei α1 die erste der in (2.51) definierten Matrizen ist. Die rechte Seite der Gleichung ist durch die Potenzreihenentwicklung der Exponentialfunktion erklärt, ϕ 2 ϕ 1 1 3 ϕ 3 S 1 α1 α12 α1 . (2.184) 2 2 2 3 2 Beweis: Mit α12
1,
folgt aus (2.184) 1 ϕ 2 S 1 2 2 ϕ cosh 2 α1 sinh
α13
1 ϕ 4 4 2 ϕ . 2
α1
α14
1,
ϕ . . . α1 2
α15
α1 ,
1 ϕ 3 3 2
... 1 ϕ 5 5 2
... (2.185)
48
2 Dirac-Theorie des Elektrons und des Neutrinos
Die Darstellung (2.183) ermöglicht in besonders einfacher Weise die Berechnung der inversen Matrix S 1 , es ergibt sich ϕ ϕ S 1 eα1 ϕ/2 cosh α1 sinh . (2.186) 2 2 Hieraus folgt sofort S 1γ β
γ β cosh ϕ2
α1 γ β sinh
ϕ 2
γβS
ϕ α1 , γ β sinh 2
1
und mit sinh(ϕ/2) cosh(ϕ/2) (1/2) sinh ϕ sowie sinh2 (ϕ/2) (1/2)(cosh ϕ 1) (2.185) S 1γ β S γ β
γβ
ϕ ϕ ϕ α1 , γ β sinh cosh α1 , γ β α1 sinh2 2 2 2 1 1 α1 , γ β sinh ϕ α1 , γ β α1 cosh ϕ 1 . 2 2
(2.187)
Nun gilt
α1 , γ l
(2.171b)
α1 βαl
βαl α1 (2.42b) β α1, αl
(2.171a) α1 , γ 0 α1β βα1 (2.42b)
2βα1
(2.42c) (2.171a)
2 γ 0δ1l ,
2γ 1 ,
(2.171b)
zusammengefaßt also α1 , γ β 2 γ 0 δ β1 Mit (2.171) und α12 1 folgt hieraus α1 , γ β α1 2 βα1 δ β1
βα12 δ β0
γ 1 δ β0 .
2
γ 0 δ β0
(2.188)
γ 1 δ β1 .
(2.189)
Setzen wir (2.188)–(2.189) in (2.187) ein und vergleichen das Ergebnis mit (2.182), so finden wir (2.178) bestätigt.
Ein systematischer Weg zur allgemeinen Lösung von (2.178) wird im Exkurs 2.2 aufgezeigt. Für Systeme in Standardkonfiguration ergibt sich aus (2.180) mit (2.185) das Spinor-Transformationsgesetz ψ
ψ cosh
ϕ 2
α1 ψ sinh ϕ2 .
(2.190)
Offensichtlich unterscheidet sich dieses von dem Transformationsgesetz für Vierervektoren. Alle vierkomponentigen Größen, die sich wie ψ transformieren, werden als Dirac-Spinoren oder kurz Spinoren bezeichnet.
2.10 Kovarianz der Dirac-Gleichung
49
Exkurs 2.2: Allgemeines Transformationsgesetz für Dirac-Spinoren Die Transformationsmatrix S im Transformationsgesetz ψ ¼ Sψ für Spinoren ist eine Lösung der Gleichung (2.178), in (2.183) ist deren durch Einsetzen verifizierte Lösung für einen Spezialfall angegeben. Im folgenden wird systematisch die allgemeine Lösung abgeleitet. Wir führen zunächst eine für diesen Zweck besonders geeignete Darstellung der LorentzTransformation ein. Die allgemeinste affine Transformation eines Koordinatensystems setzt sich aus einer Translation, einer Streckung in Richtung jeder Koordinatenachse und einer Drehung zusammen. (Dabei sind unter den Streckungen auch Spiegelungen enthalten, wenn man diese als Streckungen um den Faktor 1 auffaßt.) Das gilt auch im vierdimensionalen Raum der Koordinaten x 0 , ..., x 3 . Lorentz-Transformationen sind spezielle affine Transformationen, sie setzen sich aus einer Translation, einer Drehung7 bezüglich der pseudoeuklidischen Metrik gμν und im Fall uneigentlicher Lorentz-Transformationen zusätzlich aus einer Spiegelung am Koordinatenursprung zusammen, es gilt x ¼ ν a ν Λνμ x μ . Durch geeignete Wahl des Koordinatenursprungs kann erreicht werden, daß sie nur aus einer Drehung und gegebenenfalls einer Spiegelung bestehen, so daß ν x ¼ Λνμ x μ mit Λνμ Λ μρ δ νρ gilt, wobei Λ μρ die Transformationsmatrix für die inverse Lorentz-Transformation ist. (Siehe Spezielle Relativitätstheorie, Abschn. „Vektoren und Tensoren der vierdimensionalen RaumZeit“.) Die in Abschn. 2.10 untersuchte Transformation mit der Matrix (2.181) bildet ein spezielles Beispiel, der bei ihr aufgetretene Winkel ϕ kann als Drehwinkel aufgefaßt werden. In diesem Exkurs betrachten wir nur eigentliche Lorentz-Transformationen und ordnen jeder von diesen einen Drehwinkel um eine geeignet gewählte Achse zu, bei gegebener Drehachse schreiben wir Λνμ Λνμ (ϕ).
(Uneigentliche Lorentz-Transformationen werden später in Abschn. 2.13.3 betrachtet.) Außerdem benutzen wir im folgenden für (eigentliche) Lorentz-Transformationen zum Teil die Kurznotation x ¼ Λ(ϕ) x , bei der x und x ¼ Spaltenvektoren sind und Λ die Matrix mit den Komponenten Λνμ . Das Hintereinanderschalten zweier Lorentz-Transformationen ergibt wieder eine LorentzTransformation. Bewirkt die erste Transformation eine Drehung des Systems um den Winkel ϕ und die zweite bei gleicher Drehachse eine Drehung um dϕ, so ist das Ergebnis beider Transformationen zusammen dasselbe wie das einer einzigen Transformation, die auf dieselbe Drehachse bezogen um ϕ dϕ dreht, (2.191) Λ(ϕ dϕ) Λ(dϕ) Λ(ϕ). Nun gilt
Λ(dϕ) Λ(0) ω dϕ
1 ω dϕ,
(2.192)
da die Transformation Λ(0) das System unverändert läßt. Dabei ist ' dΛ(ϕ) '' ω . dϕ 'ϕ 0 7 Unter Drehung bezüglich der pseudoeuklidischen Metrik wird eine Bewegung verstanden, welche ds 2 gμν d x μ d x ν invariant läßt.
50
2 Dirac-Theorie des Elektrons und des Neutrinos
Gehen wir mit (2.192) in (2.191), so folgt Λ(ϕ dϕ) Λ(ϕ) ωΛ(ϕ) dϕ oder
dΛ dϕ
Diese Gleichung hat die Lösung
ωΛ .
Λ eωϕ ,
wobei die rechte Seite durch die Reihenentwicklung der Exponentialfunktion erklärt ist. Damit kann jede (eigentliche) Lorentz-Transformation in der Form ν μ x ¼ eωϕ μ x μ geschrieben werden. Aus der Bestimmungsgleichung (2.178) für S folgt, daß auch S eine Funktion des Drehwinkels ϕ wird. Wird das System erst um den Winkel ϕ gedreht, so wird der Spinor ψ in S(ϕ) ψ transformiert. Wird anschließend um den Winkel dϕ weitergedreht, so wirkt auf diesen Spinor die Transformation S(dϕ), und wir erhalten ψ¼
S(dϕ)S(ϕ) ψ .
Dasselbe Ergebnis wird erhalten, wenn gleich um den Winkel ϕ wieder S(ϕ dϕ) S(dϕ)S(ϕ) . Mit
S(dϕ) S(0)
erhalten wir analog
s dϕ
1
dϕ gedreht wird, d. h. es gilt
s dϕ
S(ϕ) esϕ ,
(2.193)
wobei die rechte Seite wieder durch die Reihenentwicklung erklärt ist. Ergebnis: Zur Lorentz-Transformation eωϕ gehört die Spinortransformation S esϕ , wobei ω und s durch die infinitesimale Transformation erklärt sind. Es genügt also, den Zusammenhang zwischen s und ω zu bestimmen, d. h. S für eine infinitesimale Transformation zu berechnen.
Infinitesimale Transformationen Für die infinitesimale Drehung um dϕ hatten wir S
1
s dϕ.
Wir setzen S 1 1 s dϕ und erhalten aus der Forderung S S 1 1 die Beziehung s S 1 Setzen wir dies und Λνμ
s 0 bzw.
1 s dϕ .
(2.192) ν δμ
ωνμ dϕ
(2.194)
2.10 Kovarianz der Dirac-Gleichung
51
in der Bestimmungsgleichung (2.178) für S ein, s dϕ) γ ν (1 s dϕ) (δ νμ ωνμ dϕ) γ μ ,
(1
so folgt durch Vergleich des in dϕ linearen Terms γ νs
s γν
ωνμ γ μ .
(2.195)
Multiplizieren wir diese Gleichung für ν 0 von links mit γ 0 β und berücksichtigen β 2 1, so folgt s γ 0 s γ 0 ω0μ γ 0 γ μ . Diese Form legt es nahe, s als Bilinearform in den γ ν bzw. γν gνμ γ μ anzusetzen,
cρσ γρ γσ .
s
(2.196)
Einsetzen dieses Ansatzes in (2.195) liefert γρ γσ γ ν ) ωνμ γ μ .
cρσ (γ ν γρ γσ
Aus den Vertauschungsrelationen (2.204) der γ ν wird nach Multiplikation mit gρα und mit β ν γρ γ ν
γ ν γρ 2 δνρ .
Hiermit folgt γ ν γρ γσ und
γρ γσ γ ν
2 δνρ γσ
γρ γ ν γσ
2 γρ δσ ν
γρ γ ν γσ 2 (δνρ γσ
γρ δσ ν )
ωνμ gμλ γλ ωνλ γλ . Nach Umbenennung der Summationsindizes ergibt sich daraus 2 (cνλ cλν ) γλ ωνλ γλ bzw. cρσ (γ ν γρ γσ
γρ γσ γ ν ) 2 (cνσ γσ cρν γρ ) ωνμ γ μ
cνλ
cλν
12 ωνλ .
(2.197)
Hieraus folgt ωνλ ωλν , und nur, wenn die Koeffizienten ωνλ der infinitesimalen LorentzTransformation diese Bedingung erfüllen, hat Gleichung (2.197) eine Lösung für cνλ . Daß ωνλ ωλν tatsächlich erfüllt ist, folgt aus der Lorentz-Invarianz von ds 2 gμν d x μ d x ν . Beweis: In der Spezielle Relativitätstheorie, Abschn. „Metrik, Skalarprodukt, Heben und Senken von Indizes“ wurde aus der Invarianz von ds 2 die Gleichung gαβ Λμα Λνβ gμν abgeleitet. Durch Multiplikation mit g αλ folgt daraus Λμλ Λμβ
gαλ gαβ δλβ .
(2.198)
Aus (2.192) bzw. in Komponenten Λμν
δμν ωμν dϕ
folgt Λμλ
Λμν gνλ gμλ ωμλ dϕ
und analog
Λμβ
gμβ ωμβ dϕ.
Einsetzen in (2.198) liefert (g μλ ωμλ dϕ)(gμβ
ωμβ dϕ) δλβ (gμλ ωμβ ωμλ gμβ ) dϕ (dϕ 2) δλβ .
52
2 Dirac-Theorie des Elektrons und des Neutrinos
Der lineare Term in dϕ muß verschwinden, d. h. ωλβ
ωβλ
0.
Durch Heraufziehen des Index β folgt die Behauptung.
Setzen wir cνλ csνλ caνλ mit csνλ (cνλ cλν )/2 und caνλ (cνλ cλν )/2, so gilt cνλ cλν 2caνλ , d. h. in Gleichung (2.197) geht nur der antisymmetrische Anteil caνλ caλν von cνλ ein. Zu deren Lösung können wir daher cνλ cλν annehmen und erhalten aus ihr damit cνλ Hiermit und mit ωρσ s
14 ωνλ .
ωσρ ergibt sich aus (2.196) schließlich
14 ωρσ γρ γσ ρ σ
1 σρ ω γσ γρ 4
14 ωρσ γσ γρ 18 ωρσ γρ , γσ .
Herauf- und Herunterziehen von Indizes führt zu dem gleichwertigen Ergebnis s
18 ωρσ γ ρ , γ σ .
(2.199)
Endliche Transformationen Für eine endliche Lorentz-Transformation mit Λνμ (eωϕ )νμ erhalten wir damit nach (2.193) eine Spinortransformation mit 1 ωρσ γ ρ , γ σ ϕ . S exp (2.200) 8 Es soll noch gezeigt werden, wie hieraus der in Abschn. 2.10 betrachtete Spezialfall folgt. Mit cosh ϕ
1
,
ϕ 2/2
sinh ϕ
ϕ
ϕ 3/3
ergibt sich für die infinitesimale Transformation Λνμ aus (2.181) die Drehmatrix
δν μ
⎛ 0 ⎜ 1 ωνμ ⎝ 0 0
ωνμ dϕ
1 0 0 0
0 0 0 0
0⎞ 0⎟ ⎠, 0 0
d. h. ω01 ω10 1 und ωμν 0 sonst. Damit und mit ωρσ gρλ ωλ σ erhalten wir ωρσ γ ρ , γ σ
gρ0 ω0 1 γ ρ , γ 1 gρ1 ω1 0 γ ρ , γ 0 g00γ 0, γ 1 g11γ 1, γ 0 γ 0, γ 1 γ 1, γ 0 2 γ 0, γ 1 2 (ββα1 βα1 β) 4 α1
und nach (2.200) in Übereinstimmung mit (2.183) S
e
α1 ϕ/2 .
2.11 Eigenschaften der Dirac-Matrizen γ α
53
2.11 Eigenschaften der Dirac-Matrizen « Wir werden im weiteren Verlauf viele Rechnungen durchführen, bei denen die in (2.171) definierten Matrizen γ α involviert sind. Daher sollen hier deren wichtigste Eigenschaften und einige nützliche Rechenregeln zusammengestellt werden. Die Matrizen γ α besitzen die Eigenschaften 0 l 0 1 γ γ0 , γ (2.201) γ γ l bzw.
sowie
γ
α
*
γα
γα γ α
γ 0γ αγ 0
(2.202)
für α für α
(2.203)
0, 1 und 3 2,
und sie erfüllen die Vertauschungsrelationen α β γ , γ γ αγ β γ βγ α
2g αβ
(2.204)
mit der unmittelbaren Folge γ αγ α
g αα .
(2.205)
(g αβ ist der metrische Fundamentaltensor der speziellen Relativitätstheorie – in der Speziellen Relativitätstheorie wurde er mit ηαβ bezeichnet; da der Index α zweimal oben steht, wird nicht über ihn summiert.) Die Komponenten Σn des Spin-Operators können durch die γ -Matrizen in der Form Σn i γ l γ m für l, m, n zyklisch (2.206) dargestellt werden. Beweis: 1. Für beliebige Indizes l und m, die die Werte 1, 2 und 3 annehmen können, gilt γ lγ m und
γ mγ l
(2.171b)
γ 0γ l
außerdem
βαl βαm
γ lγ 0
(2.171)
γ 0γ 0
βαm βαl ββαl γ 0γ 0
β 2 (αl αm
(2.42b)
βαl β
β2
(2.42b)
β2
β 2 (αl
αm αl )
2δlm
(2.42a,c)
αl ) 0 ,
2.
Zusammengefaßt folgen daraus die Vertauschungsrelationen (2.204). 2. (2.201a) folgt direkt aus (2.171a), (2.42a) und (2.43a), (2.201b) folgt gemäß (2.171b) γl βαl αl β (2.43) αl β (2.42b) βαl (2.171b)
γ l .
2 Durch Rechtsmultiplikation von (2.201) mit γ 0 1 und mit der aus (2.204) folgenden
Vertauschung γ 0 γ l
γ l γ 0 ergibt sich (2.202).
54
2 Dirac-Theorie des Elektrons und des Neutrinos
3. Die Beziehungen (2.203) folgen aus den Definitionen (2.171) und der Tatsache, daß nach (2.51) und (Q7.39) die Matrizen β, α1 und α3 reell sind, während α2 rein imaginär ist und daher (α2 ) α2 erfüllt. 4. Für zyklische l, m und n ergibt sich aus (2.169) und (2.171) γ lγ m
βαl βαm (2.42b)
(2.42a)
β 2 αl αm
αl αm
(2.169)
i Σn .
Durch Multiplikation mit i folgt daraus (2.206).
Die durch (2.163) definierte Matrix τ wird bei der kovarianten Formulierung der Dirac-Theorie mit γ 5 bezeichnet und läßt sich durch γ5
τ
i γ 0γ 1γ 2γ 3
(2.207)
auf die Matrizen γ 0 bis γ 3 zurückführen, denn i γ 0γ 1γ 2γ 3
(2.171)
i β 2 αx βα y βαz
(2.42a,b)
i αx β 2αy αz i αx αy αz
τ.
Sie erfüllt die Beziehungen
γ5
sowie
γ α γ 5 γ 5γ α
γ5,
γ5
γ5
γ 5γ 5
1
0
(2.208) (2.209)
und läßt sich nach (2.164) in der Form γ5
0 1
1 0
(2.210)
aus den 2 2-Matrizen 0 und 1 darstellen. Beweis: (2.208b) folgt unter Benutzung von (2.204) daraus, daß zum Verschieben von γ α nach ganz links in γ 5 γ α i γ 0 γ 1 γ 2 γ 3 γ α eine ungerade Anzahl von Vertauschungen ungleicher γ -Matrizen notwendig ist, z. B. γ 5 γ 1 i γ 0 γ 1 γ 2 γ 3 γ 1 i γ 0 γ 1 γ 2 γ 1 γ 3 i γ 0 γ 1 γ 1 γ 2 γ 3 γ 1 i γ 1 γ 0 γ 1 γ 2 γ 3 γ 1 γ 1 γ 5 . (2.209a) folgt mit (2.207) gemäß
γ5
γ5
(2.205)
(2.201) γ2 γ1 γ 0 i γ 0γ 1γ 2γ 3 i γ3 γ 3γ 2γ 1γ 0γ 0γ 1γ 2γ 3 3 + α 0
g αα
1.
Ähnlich beweist man γ 5 γ 5 1 , womit aus (2.209a) durch Rechtsmultiplikation mit γ 5 (2.208a) folgt.
2.12 Kovariante Kontinuitätsgleichung
55
2.12 Kovariante Kontinuitätsgleichung Natürlich kann auch die Kontinuitätsgleichung (2.46) in eine Lorentz-invariante Form gebracht werden. Zu diesem Zweck benötigen wir die aus (2.173) durch Übergang zu adjungierten Spinoren hervorgehende Gleichung h (2.211) ∂α e Aα ψ γ α m 0 c ψ 0 . i Würde diese Gleichung von rechts mit ψ multipliziert und von der von links mit ψ multiplizierten Dirac-Gleichung, (2.173), abgezogen, so ließen sich die Ableitungsterme wegen (2.201) nicht zur Ableitung eines Viererstroms zusammenfassen. Das Letztere gelingt, wenn wir noch eine andere Art von Adjunktion einführen. Hierzu multiplizieren wir Gleichung (2.211) von rechts mit γ 0 und nehmen mit Hilfe 2 der Gleichungen (2.202) und (2.205) die Umrechnung γ α γ 0 γ 0 γ α γ 0 γ 0 γ α vor. Damit und mit der Definition ψ
ψ
γ0
(2.212)
eines adjungierten Dirac-Spinors ψ erhalten wir die adjungierte Dirac-Gleichung h (2.213) ∂α e A α ψ γ α m 0 c ψ 0 . i Mit den Transformationsformeln ∂α Λβα ∂ β , Aα Λβα A β und (2.178) ergibt sich hieraus nach Rechtsmultiplikation mit S 1 h ∂ β e A β ψ γ β m 0c ψ 0 , i wenn ψ
ψS
1
(2.214)
gesetzt wird. Gleichung (2.213) ist also Lorentz-invariant, wobei (2.214) das Transformationsgesetz für adjungierte Spinoren ψ ist. Die Operationen Adjunktion und Lorentz-Transformation sind übrigens vertauschbar, es gilt ψ ψ . (2.215) 2 Beweis: Mit γ 0 ψ
(2.180) s.u.
Sψ
1 folgt aus (2.180) und (2.212)
(2.212)
ψ S 1
(Sψ) γ 0
(2.214)
ψ Sγ 0
(2.205)
ψ γ 0γ 0 Sγ 0
(2.212)
ψ γ 0 Sγ 0
ψ .
Die dabei benutzte Identität γ 0 Sγ 0
S 1
(2.216)
56
2 Dirac-Theorie des Elektrons und des Neutrinos
folgt für die Transformation zwischen Systemen in Standardkonfiguration aus (2.185)–(2.186) gemäß γ 0S γ 0
(2.185) (2.43b)
(2.42b)
γ 0 Sγ 0
γ0
γ0
2
2 ϕ cosh 2
cosh
ϕ 2
γ 0 α1 γ 0 sinh
α1 sinh ϕ2
(2.42a)
ϕ 2
cosh
ϕ 2
α1 sinh ϕ2 (2.186) S
1.
Für allgemeine Lorentz-Transformationen folgt sie aus den Beziehungen (2.193) und (2.199) des Exkurses 2.2. Mit 2 2 (2.199) 1 (2.202) 1 ωρσ γ 0 γ σ , γ ρ γ 0 ωρσ γ 0 γ σ , γ ρ γ 0 γ 0sγ 0 8 8 1 1 (2.199) 8 ωρσ γ σ , γ ρ 8 ωρσ γ ρ , γ σ s ergibt sich durch mehrfaches Zwischenschieben von γ 0 γ 0 1
(2.193) 1 0 ν 0 γ (s ϕ) γ γ 0 Sγ 0
ν 1
ν 1
ν
1 ( s)ν ϕ ν ν
e
1
2
ν
1 , -. / , -. / , -. / γ 0 (s γ 0 γ 0 s γ 0 . . . γ 0 s )γ 0 ϕ ν ν
ν 1
sϕ (2.193) S 1 .
Aus (2.180) und (2.214) folgt sofort die Lorentz-Invarianz des Skalarprodukts,
ψ χ
ψS
1
ψχ .
Sχ
(2.217)
Dabei sei darauf hingewiesen, daß die skalare Größe ψ χ nicht Lorentz-invariant ist, vielmehr gilt
ψ χ
(Sψ) Sχ
ψ S Sψ
ψ S2ψ ,
weil S nach (2.43b) und (2.185) ein hermitescher Operator ist. Für die durch (2.212) definierte Operation der Adjunktion wollen wir erreichen, daß sie ψ ψ (2.218) erfüllt. Dabei ist jedoch zu beachten, daß sie für Zeilenspinoren ψ noch nicht erklärt ist. Zunächst gilt (2.51b) 0 ϕ ϕ ψ 0 γ 0 (2.201a) 0 (2.171a) 1 ψ γ ψ γ ψ 0 1 χ χ . Definieren wir jetzt ψ
γ 0ψ
,
(2.219)
dann ergibt sich mit dem vorherigen Ergebnis gerade (2.218). Um nun die Lorentz-invariante Form der Kontinuitätsgleichung (2.46) abzuleiten, multiplizieren wir die Dirac-Gleichung (2.173) von links mit cψ, die adjungierte
2.13 Diracs Löchertheorie und Theorie des Positrons
57
Gleichung (2.213) von rechts mit cψ und addieren die sich ergebenden Gleichungen. Da sich die undifferenzierten Terme gegenseitig wegheben, erhalten wir ∂α j α
0
jα
mit
cψ γ α ψ .
(2.220)
Diese Gleichung ist eine Folge der Lorentz-invarianten Dirac-Gleichung und muß daher ebenfalls Lorentz-invariant sein. Das ist auch unmittelbar einsichtig, da sich der Viererstrom j α gemäß j ¼β
ψ γ β ψ¼ ¼
(2.180) (2.214)
ψS
1 β
γ Sψ
(2.178)
Λβα ψ γ α ψ
Λβα j α
(2.221)
wie ein Vierervektor transformiert. (Man beachte, daß ψ γ α ψ dagegen kein Vierervektor ist.) Die Nullkomponente des Viererstroms ist wegen j0
cψ γ 0 ψ
2 cψ γ 0 ψ
cψ ψ
(2.222)
identisch mit der Teilchendichte mal Lichtgeschwindigkeit und reell. Auch der Dreierstrom j mit den Komponenten cψ γ l ψ ist eine reelle Größe: Aus dem Transformationsgesetz für Systeme in Standardkonfiguration folgt j 0
Λ0 0 j 0 Λ0 1 j 1
(2.181)
j 0 cosh ϕ j 1 sinh ϕ ,
j 0 ist nach (2.222) reell, und j 0 kann nur reell sein, wenn das auch für j 1 gilt. (Bei Relativbewegungen in Richtung der Koordinatenachsen x2 bzw. x 3 erhält man entsprechende Reellwertigkeits-Forderungen für j 2 und j 3 .)
2.13 Diracs Löchertheorie und Theorie des Positrons 2.13.1 Lösungen negativer Energie und Löchertheorie Schon bei der Behandlung von Wellenpaketen für freie Teilchen ergaben sich Schwierigkeiten mit den Lösungen negativer Energie (siehe Abschn. 2.4). Auch die in Abschn. 3.1 untersuchte Zitterbewegung des Elektrons paßt nicht zu unseren bisherigen Erfahrungen über die mittlere Dynamik von Punktteilchen. Am bequemsten wäre es, wenn Lösungen negativer Energie als unphysikalisch ausgeschlossen werden könnten. Bei der Behandlung zeitunabhängiger Eigenwertprobleme wäre das unter gewissen Einschränkungen möglich. Sobald jedoch zeitabhängige Felder vorliegen, gibt es Übergänge zwischen Zuständen positiver und negativer Energie. Das gleiche Problem tritt bei der Behandlung der Stabilität stationärer Zustände positiver Energie auf. Wir betrachten das am Beispiel der stationären Energieniveaus eines Elektrons, das sich im Feld eines Atomkerns befindet. Die Lösung der Dirac-Gleichung liefert qualitativ das Energiespektrum von Abb. 2.4. Über einem diskreten Spektrum positiver Energiewerte beginnt bei E m 0 c2 ein Kontinuum. Außerdem gibt es jedoch noch ein
58
2 Dirac-Theorie des Elektrons und des Neutrinos
E m 0 c2 0
.. . E2 E1
m 0 c2 Abb. 2.4: Energieniveaus eines Ein-Elektronen-Atoms.
kontinuierliches Spektrum negativer Energiewerte, das bei E m 0 c2 beginnt. Befindet sich das Elektron in einem angeregten Zustand positiver Energie, so kann es unter Abstrahlung von Licht in einen Zustand niedrigerer Energie übergehen. Dieses Ergebnis ist anschaulich plausibel. Zu seiner quantitativen Verifizierung betrachtet man eine kleine Störung eines stationären Zustands. Da der gestörte Zustand instationär ist, wird das Elektron in ihm zu einer Quelle eines zeitabhängigen elektromagnetischen Feldes, das es abstrahlt. Dieses Feld wird durch die Maxwell-Gleichungen beschrieben und muß mit in die Betrachtung einbezogen werden. Ein instationäres Elektron als Quelle eines von ihm erzeugten elektromagnetischen Feldes und dessen Ankopplung an das Elektron wurde in der bis hier behandelten Quantentheorie noch nicht erörtert. Die exakte Lösung dieses Problems zwingt zu einer Quantisierung des elektromagnetischen Strahlungsfeldes und muß im Rahmen einer Quantenfeldtheorie, genauer der Quantenelektrodynamik, erfolgen, die in Kapitel 10 vorgestellt wird. In der Schrödinger-Theorie ist der dem niedrigsten Eigenwert positiver Energie entsprechende Energieeigenwert des H-Atoms stabil, weil es unterhalb von diesem keine weiteren Eigenwerte mehr gibt. Nach der Dirac-Theorie liegt unter diesem jedoch noch ein ganzes Kontinuum negativer Energiewerte. Das Elektron könnte nach den Gesetzen der bisher betrachteten Quantentheorie aus dem niedrigsten Zustand positiver Energie (Grundzustand) unter Abstrahlung erheblicher Strahlungsenergie in diese Zustände negativer Energie übergehen. Da diese bis E reichen, wäre diesem Prozeß kein Ende gesetzt, und es könnte ein unerschöpflicher Vorrat an Strahlungsenergie abgegeben werden. Eine quantitative Berechnung in der geschilderten Weise würde für diese Übergänge eine erhebliche Wahrscheinlichkeit liefern. Der Grundzustand des Wasserstoffatoms besäße danach nur eine Lebensdauer von etwa 10 9 s. Dies widerspricht jeglicher Erfahrung und bedeutet einen gravierenden Mißerfolg der Dirac-Theorie, wenn man an ihrer konventionellen Interpretation à la Schrödinger festhält. Demgegenüber stehen jedoch überzeugende Erfolge der Dirac-Theorie, z. B. die theoretische Begründung des Spins, die richtige Vorhersage des gyromagnetischen Faktors und sehr genaue relativistische Korrekturen zum Termschema des Wasserstoffatoms. Um seine Theorie zu retten, fand Dirac einen genialen Ausweg. Nach dem PauliPrinzip kann jeder Ein-Teilchen-Zustand des Elektrons nur von einem einzigen Elektron eingenommen werden. Dirac postulierte nun, daß alle Zustände negativer Energie schon von Elektronen besetzt sind. Wegen des Pauli-Prinzips kann damit der Übergang von Zuständen positiver zu Zuständen negativer Energie nicht mehr stattfinden,
2.13 Diracs Löchertheorie und Theorie des Positrons
59
E m 0 c2 0
hν
m 0 c2
Elektronenloch Abb. 2.5: Anregung eines Elektrons negativer Energie.
und die oben geschilderte Strahlungskatastrophe ist aus der Welt geschafft. Wir werden allerdings sehen, daß es noch andere Probleme gibt, die nicht überwunden werden können. Dies bedeutet, daß die Löchertheorie letzten Endes ein Provisorium darstellt, das wir später aufgeben müssen. Wenn wir uns im folgenden dennoch etwas näher mit ihr beschäftigen, geschieht das deshalb, weil sie für eine Reihe wichtiger Phänomene eine sehr anschauliche Erklärung liefert und in vielen Fällen auch zu quantitativ brauchbaren Ergebnissen führt. In der Quantenfeldtheorie wird sie allerdings durch eine Theorie anderer Art ersetzt. Da die Zustände negativer Energie ein Kontinuum bilden, ist die Welt nach Dirac unendlich dicht vollgepackt mit Elektronen negativer Energie. Das Vakuum ist nicht mehr leer, es ist eine „Fermi-See“ aus Elektronen negativer Energie, nur gibt es in ihm keine Elektronen positiver Energie. Diese Fermi-See hat die unschöne Eigenschaft, unendlich große Ladung und Masse zu besitzen. Von der ersten Eigenschaft können wir uns (siehe unten) durch eine geringfügige Modifizierung des Dirac-Modells freimachen. Die unendliche Masse ( Energie) kann durch eine Verschiebung des Energienullpunkts (Renormierung) beseitigt werden. Wenn alle Zustände negativer Energie besetzt sind, kann das oben betrachtete, vom Absturz zu negativen Energiewerten bedrohte Elektron nur noch positive Energiewerte annehmen. Die Besetzung der negativen Energieniveaus verbietet zwar den Übergang eines Elektrons positiver Energie zu negativen Energien. Umgekehrt kann aber sehr wohl ein Elektron negativer Energie z. B. durch Lichteinwirkung in einen „angeregten“ Zustand positiver Energie überführt werden. Beim Fehlen äußerer Felder ist hierzu mindestens die Energie 2m 0 c2 erforderlich (Abb. 2.5). Wir denken uns jetzt das Elektron, dem vor seiner Anregung im Zustand des Vakuums keine reale Existenz zukommt, vom Ort seiner Anregung entfernt. Wie muß das Loch, das es in der Fermi-See zurückläßt, physikalisch beurteilt werden? Da das Vakuum bei Anwesenheit des Elektrons negativer Energie als elektrisch neutral beurteilt wird, muß das Fehlen der negativen Ladung q e als positive Ladung q e aufgefaßt werden. Hat das Vakuum, wie vereinbart, die Gesamtenergie null, so besitzt es nach Entfernen der Energie E die Energie E mit der zugehörigen Masse E/c2 . Wir haben somit das Ergebnis: Ein Loch in der Fermi-See verhält sich wie ein Teilchen positiver Masse und positiver Energie mit der Ladung q e. Wir werden gleich sehen, daß dieses neue Teilchen bis auf die Ladung alle Eigenschaften eines Elektrons besitzt. Es wird daher als Antiteilchen des Elektrons bezeichnet und hat den Namen Positron erhalten. Dirac hat seine Löchertheorie im Jahre 1929 aufgestellt und die Löcher richtig als positiv geladene Teilchen gedeutet; zunächst allerdings als Protonen, obwohl diese dafür viel zu schwer sind, weil er die
60
2 Dirac-Theorie des Elektrons und des Neutrinos
Existenz eines neuen Teilchens nicht zu postulieren wagte. Erst in einer 1931 erschienenen Arbeit über magnetische Monopole stellte er klar, daß es sich sich um Antielektronen handeln müsse. Kurze Zeit später (1932) wurde das Positron experimentell von C. D. Anderson nachgewiesen. Seine Entdeckung lieferte somit eine weitere Bestätigung der um die Löchertheorie erweiterten Dirac-Theorie. Der in Abb. 2.5 dargestellte Vorgang wird als Paarerzeugung bezeichnet. Der Ort, an dem das Photon absorbiert wird, ist der Ausgangspunkt der Trajektorien eines Elektrons und eines Positrons. Nach (2.5) (für Φ 0 und A 0) ist die quasiklassische Energiebilanz der dabei involvierten Vorgänge 2 2 2 2 2 2 , h ω c m 0 c p c m 0 c p wobei p der Impuls des Elektrons im Zustand positiver und p der im Zustand negativer Energie ist. Schreiben wir h ω
mit E e
Ee Ep
(2.223)
Energie des Elektrons und E p Energie des Positrons, so muß E p c m 0 2 c2 p 2
(2.224)
gelten. Hieraus folgen als Ruheenergie bzw. Ruhemasse des Positrons m 0 c2 bzw. m 0 , also dieselben Werte wie beim Elektron. Impuls- und Spinbilanz liefern in analoger Weise s.u. h k p p pe pp (2.225) und
SPhoton S S
s.u.
Se Sp ,
(2.226)
denn: Das Vakuum hat Impuls und Spin null; daher besitzt das Elektronenloch, das durch Entfernen eines Elektrons negativer Energie mit dem Impuls p und Spin S entsteht, den Impuls p ( p), den Spin S ( S), und hieraus folgen die Beziehungen pp p und Sp S . (2.227) Eine Folge der Gleichung (2.227b) ist, daß das Positron denselben Spin 1/2 wie das Elektron besitzt, und Gleichung (2.226) wird dadurch erfüllt, daß sich die Spins von Elektron und Positron zum Spin 1 des Photons addieren. Damit ist – vorerst allerdings nur mit Hilfe quasiklassischer Beziehungen – plausibel gemacht, daß das Positron dieselbe Ruhemasse und denselben Spin wie ein Elektron besitzt. Eine genauere Analyse, die für den Impuls die Beziehung p m 0 Ú / 1v 2 /c2 benutzt, zeigt, daß die Gleichungen (2.223) und (2.225) keine gemeinsame Lösung besitzen: Impuls- und Energiesatz können nicht gleichzeitig erfüllt werden, Elektron und Positron können nicht den gesamten Impuls des Photons aufnehmen (Aufgabe 2.8). Hierzu bedarf es noch eines weiteren Partners, z. B. eines Atomkerns, der den überschüssigen Impuls aufnimmt. Dies bedeutet, daß der Prozeß der Paarerzeugung nur in einem externen Potential – z. B. dem eines Atomkerns – stattfinden kann.
2.13 Diracs Löchertheorie und Theorie des Positrons E m 0 c2 0 m 0 c2 Positronen
Elektronen
61
Abb. 2.6: Symmetrischer ladungsfreier Vakuumzustand. Die Abbildung ist symbolisch aufzufassen, Elektronen und Positronen befinden sich nicht in räumlich voneinander abgegrenzten Gebieten.
Etwas anders lassen sich die gewonnenen Ergebnisse auch in folgender Weise zusammenfassen: In den Eigenschaften Ladung, Energie, Masse, Impuls und Spin verhält sich ein Elektronenloch gerade umgekehrt wie ein Elektron negativer Energie p p, S S). Dies läßt die Vermutung ( e e, E E, m 0 m 0 , aufkommen, daß sich die Dynamik des Positrons auch durch Elektronenlösungen negativer Energie ausdrücken läßt. Schon hier sei darauf hingewiesen, daß dies der Weg ist, auf dem wir zu einer korrekten Begründung der Zusammenhänge (2.224)–(2.227) gelangen werden. Neben dem Vorgang der Paarerzeugung erlaubt die Löchertheorie auch den Vorgang der Paarvernichtung: Bei diesem springt ein „angeregtes“ Elektron positiver Energie in ein freies Loch der Fermi-See, wobei ein Photon emittiert wird. Das Verschmelzen des Elektrons mit einem Elektronenloch ist seinem Zusammenstoß mit einem Positron unter anschließender Teilchenvernichtung bzw. Umwandlung in ein Photon äquivalent. Wegen der großen Symmetrie zwischen dem Ein-Teilchen-Verhalten von Positronen und Elektronen ist es nützlich, auch eine Ein-Teilchen-Theorie für Positronen aufzustellen. Wir müssen hierzu nur in der Dirac-Gleichung (2.173) die Ladung q e durch q e ersetzen, und erhalten als Dirac-Gleichung für Positronen γα
h ∂α i
e Aα ψ
m0c ψ 0 .
(2.228)
Die durch diese Gleichung beschriebenen Teilchen haben sämtliche dem Positron zugeschriebenen Eigenschaften. Wie bei der Dirac-Gleichung für Elektronen gibt es Zustände positiver und negativer Energie. Es ist daher auch möglich, Elektronen als Löcher in einer Fermi-See aus Positronen zu deuten. Diese Deutung erlaubt es, einen bezüglich der beiden Teilchenarten symmetrischen Vakuumzustand einzuführen. In diesem gibt es sowohl ein Kontinuum von Elektronenzuständen als auch von Positronenzuständen negativer Energie. Beide Kontinua sind gemäß dem Pauli-Prinzip vollständig besetzt (Abb. 2.6). Als Gesamtladung des Vakuums ergibt sich null, da sich positive und negative Ladungen gegenseitig kompensieren. Die Gesamtenergie ist allerdings wie früher unendlich und muß auf null renormiert werden. Abschließend sei bemerkt, daß äußere Felder die im Vakuum befindlichen Ladungen räumlich verschieben und deren Energieniveaus (für Elektronen und Positronen unterschiedlich) verbiegen. Eine hieraus entstehende Konsequenz – die Polarisation des Vakuums – wird in Abschn. 2.15.2 besprochen.
62
2 Dirac-Theorie des Elektrons und des Neutrinos
Die Möglichkeiten der Paarerzeugung und Paarvernichtung zeigen, daß die Interpretation der Dirac-Theorie als Ein-Teilchen-Theorie des Elektrons nicht haltbar ist, und entsprechend müßte auch das Positron als Loch in einer Fermi-See unendlich vieler Elektronen im Rahmen einer Viel-Teilchen-Theorie behandelt werden können. Die hier geschilderte Löchertheorie kann nur als grobe Vorstufe zu einer derartigen Theorie aufgefaßt werden, denn sie erfaßt nicht die Wechselwirkung zwischen den an diesem Bild beteiligten Teilchen. Dementsprechend findet man, daß sie bei einer präziseren Untersuchung von Vorgängen zu Fehlern und Widersprüchen führt. Diese können erst in einer Quantenfeldtheorie der Dirac-Gleichung bereinigt werden. Im Rahmen dieser Theorie müssen dann auch gewisse Aussagen der bisherigen Ein-Teilchen-Theorie revidiert werden. Beschränkt man sich jedoch auf Wechselwirkungsprozesse hinreichend niedriger Energie, so hat sich die um das Konzept der Fermi-See erweiterte Dirac-Gleichung bei der Behandlung von Ein-Teilchen-Problemen als außerordentlich nützlich erwiesen.
2.13.2 Positronlösungen durch Ladungskonjugation Aus der Existenz von Elektronenlösungen negativer Energie konnten sowohl die Existenz als auch verschiedene Eigenschaften von Positronen abgeleitet werden. Den Ausgangspunkt bildeten dabei zunächst qualitative Vorstellungen, die sich jedoch soweit präzisieren ließen, daß schließlich mit (2.228) sogar eine „Wellengleichung“ für Positronen aufgestellt werden konnte. Jetzt soll ein Weg aufgezeigt werden, auf dem die Zustände von Positronen direkt aus Elektronenzuständen negativer Energie abgeleitet werden können. Hierzu schreiben wir zunächst die Gleichung an, die durch komplexe Konjugation aus der DiracGleichung (2.173) entsteht, (γ α )
h ∂α i
e Aα ψ m 0 c ψ
0.
(2.229)
Nun existiert eine nicht-singuläre Matrix U , die für alle Indizes α die Gleichung U (γ α ) U
1
γα
(2.230)
erfüllt (Beweis folgt weiter unten). Multiplizieren wir Gleichung (2.229) von links mit U , definieren (2.231) ψC U ψ Cψ und benutzen die Identität ψ U 1 U ψ sowie (2.230), so erhalten wir α h γ ∂α e Aα ψC m 0 c ψC 0 . i
(2.232)
Dies ist die Positronengleichung (2.228), d. h. die gemäß (2.231) durch die Ladungskonjugation Cψ aus Elektronenlösungen ψ erhaltenen Spinoren ψC sind Positronenlösungen.
2.13 Diracs Löchertheorie und Theorie des Positrons
63
Den Beweis dafür, daß Gleichung (2.230) tatsächlich eine Lösung besitzt, erbringen wir für den Spezialfall der Darstellung (2.172) für die Matrizen γ α . In diesem ist iγ2
U
(2.233)
eine mögliche Lösung mit den Eigenschaften UU
UU
1,
i γ 2γ 2
1.
(2.234)
Beweis: Es gilt U γ2
(2.203b)
Uγ 2
(2.203a)
U (γ α )
Uγ α
(2.233)
(2.233)
zusammengefaßt für alle α
(2.233)
(2.204)
i γ 2γ α
U (γ α )
γ 2U ,
i γ αγ 2
γ αU
für
γ αU ,
α 2 , (2.235)
und hieraus folgt durch Rechtsmultiplikation mit U 1 Gleichung (2.230). Die Beziehungen (2.234) folgen gemäß UU UU
(i γ 2)(i γ 2 ) γ 2 (i γ 2)(i γ 2 ) γ 2
(2.201b) γ2
γ
γ 2γ 2
(2.203b) 2
γ 2γ 2
(2.205)
(2.205)
1,
1.
Die Operation der Ladungskonjugation ist reziprok, d. h. die Ladungskonjugation einer Positronlösung ψC führt zurück auf die Elektronlösung, (ψC )C
ψ,
(2.236)
denn es gilt (ψC )C
U ψC
U (U ψ )
UU ψ
(2.234a)
ψ.
Außerdem genügen die Spinoren ψC demselben Transformationsgesetz wie die Spinoren ψ, (2.180) mit (2.183), denn ψC
(2.231)
U ψ
(2.180) (2.233)
i γ 2 (Sψ)
s.u.
i γ 2 Sψ
s.u.
i Sγ 2 ψ
(2.233)
SU ψ
SψC .
Dabei wurde benutzt, daß S cosh(ϕ/2) α1 sinh(ϕ/2) (nach (2.185)) mit α1 reell ist (siehe (2.51a) und (Q7.39a)) und mit γ 2 vertauscht, γ 2S
γ 2 cosh
ϕ 2
γ 2 α1 sinh ϕ2
(2.188)
γ 2 cosh
ϕ 2
α1 γ 2 sinh ϕ2
Sγ 2 .
Jetzt vergleichen wir die physikalischen Eigenschaften der ladungskonjugierten Lösung ψC mit denen der Elektronenlösung ψ. Der Teilchen-Viererstrom ist für beide Lösungen identisch, j αC jα , (2.237)
64
2 Dirac-Theorie des Elektrons und des Neutrinos
denn es gilt j αC c
ψC γ α ψC
(2.212)
(ψC ) γ 0 γ α ψC
(ψ ) U γ 0 γ α U ψ (2.235)
(2.235)
(U ψ ) γ 0 γ α U ψ
(ψ ) U γ 0U (γ α ) ψ (2.234b)
(ψ ) U U (γ 0 ) (γ α ) ψ ( j α) c
(2.231)
(2.212)
(ψ γ 0 γ α ψ)
(ψ γ α ψ)
jα . c
Dabei wurde zuletzt benutzt, daß j α nach Abschnitt 2.12 reell ist. Für den Mittelwert L C eines Operators L im Zustand ψC erhalten wir
L C Mit
(ψC ) U L U
L ψC d 3x
(ψ ) U
(2.233)
(2.203b)
γ 2 L
γ2
folgt daraus
L γ 2
L U ψ
(2.201b)
3
dx
γ 2 L γ 2
ψ U L U ψ d 3x
γ 2 L
.
2 γ
γ2
L C γ 2 L
γ2 .
(2.238)
Die Spezialisierung dieses Ergebnisses auf die in Abschnitt 2.3 und 2.9 eingeführten Observablen liefert
x C x , c«C c« , p C p , C .
(2.239)
Beweis: x gemäß
1. (2.239a) folgt mit x 0 x C
γ 2x γ 2
1
0
γ 2 xγ 2
1
0
γ 2γ 2 x
1 (2.205)
x
x .
2. (2.239b) ergibt sich mit αl β 2 αl γ 0 γ l nach (2.171) gemäß αl C
0
(2.204)
0
γ 0γ l
1 (2.238) C
γ 0γ 2 γ l
γ2
0
1
1 (2.203) 0 1 2 0 γl γ2 γ γ γ 2 γ 0γ l γ 2
s.u.
0
γ 0γ l
1
αl
(2.61)
αl ,
denn (2.233) (2.201b) l U (2.234b) l U 1 , γ2 γ 2 γ l γ 2 γ 2 γ l U γ U γ und daraus folgt mit (2.230)
γ2 γl γ2
γl .
(2.240)
2.13 Diracs Löchertheorie und Theorie des Positrons
65
3. (2.239c) folgt mit p p und p p gemäß 0 1 0 1 0 1 (2.205) 2 2 γ2 p C γ p γ pγ 2 γ 2 γ 2 p p
p .
4. Mit (2.206) und ergibt sich für die Komponenten von (für zyklische l, m, n) 0 1 (2.238) 0 1 i γ lγ m γ2 i γl γm γ2 Σn C (2.205)
0
C
1 (2.240) 0 1 l m i γ 2 γ l γ 2γ 2 γ m γ 2 iγ γ
Σn
Σn .
Fassen wir diese wieder zu einem Vektor zusammen, so ergibt sich (2.239d).
Die Beziehungen (2.239) liefern die exakte quantenmechanische Bestätigung der quasiklassisch „abgeleiteten“ Relationen (2.227). Als letztes vergleichen wir die Erwartungswerte der Energie. Der HamiltonOperator (2.58) der Dirac-Gleichung lautet in der Notation von Gleichung (2.173) mit (2.42a) und (2.171)
h H (q) qΦ cγ 0 γ l (2.241) ∂l q Al m 0 c , i wobei das Argument q von H (q) die Ladung des betrachteten Teilchens angibt. Der Hamilton-Operator des Elektrons ist H (e) und der zur ladungskonjugierten Gleichung (2.232) gehörige Hamilton-Operator ist H (e), wofür man H C (e) H (e) oder allgemeiner H C (q) H (q) schreiben kann. Aus (2.238) ergibt sich der Zusammenhang
H (e) C
H (e) .
(2.242)
Beweis: Setzen wir (2.241) mit q e in (2.238) ein, so ergibt sich mit γ 0 γ 0 0
H (e)
1
h γ 2 eΦ cγ 0 γ l ∂l e Al m 0 c γ2 C i
h (2.204) 2 2 0 2 γl 2 2 2 γ eΦ γ γ cγ γ ∂l e Al γ γ m 0 c i
(2.205) 1 1 0 0 (2.240) 0 γ l h ∂ e A m c H (e) eΦ cγ H (e) . l l 0 i
Erfolgt die Mittelung mit Lösungen der Bewegungsgleichung ih ∂t ψ Hψ, so ergibt sich der Beweis viel einfacher aus der in diesem Unterraum gültigen Identität H ih ∂t gemäß ih
(2.205) ∂t C γ 2 (ih ∂t ) γ 2 γ 2 ih ∂t γ 2 γ 2 γ 2 ih ∂t ih ∂t ih ∂t .
Die Wahrscheinlichkeitsdichte n C j 0C des durch ψC beschriebenen Positrons ist nach (2.237) identisch mit der eines Elektrons im Zustand ψ, das nach (2.242) negative Energie besitzt. Demnach kann die Quantendynamik eines Positrons nicht von der eines Elektrons negativer Energie unterschieden werden. Mit anderen Worten: Ein Positron
66
2 Dirac-Theorie des Elektrons und des Neutrinos
bzw. ein Elektronenloch verhält sich wie ein Elektron negativer Energie. Dem entspricht, daß der Erwartungswert für den Geschwindigkeitsoperator nach (2.239b) im Zustand ψ und ψC derselbe ist. Der Spin des Lochs ist allerdings dem Spin des Elektrons entgegengesetzt. Dieselbe Aussage gilt auch für den Impuls, was dadurch zustande kommt, daß mit den Energien (siehe (2.242)) auch die Massen entgegengesetztes Vorzeichen haben. Im folgenden Abschnitt werden wir eine noch weitergehende Symmetrie bzw. Antisymmetrie zwischen dem Zustand eines Positrons und dem eines Elektrons negativer Energie aufdecken, die sogenannte CPT-Symmetrie.
2.13.3 P-Invarianz, T-Invarianz und CPT-Symmetrie Für die Eigenschaften von Elementarteilchen spielen Symmetrien eine ausschlaggebende Rolle. In diesem Abschnitt werden wir feststellen, daß die Dirac-Gleichungen für Elektron und Positron eine Reihe von Symmetrien aufweisen. In der Elementarteilchentheorie ist die Vorgehensweise umgekehrt oft so, daß gewisse Symmetrien gefordert werden und eine Gleichung so gesucht wird, daß die durch sie beschriebenen Teilchen diese aufweisen. P-Invarianz. Die Raumspiegelung am Koordinatenursprung t¼
x¼
t,
x
(2.243)
ist eine spezielle Lorentz-Transformation. (Es handelt sich um eine uneigentliche Lorentz-Transformation, da sie nicht kontinuierlich in die identische Transformation überführt werden kann.) Da die Dirac-Gleichung gegenüber sämtlichen LorentzTransformationen invariant ist, muß sie auch gegenüber der Transformation (2.243) invariant sein. Für die Dirac-Spinoren muß dabei Gleichung (2.180) gelten, wobei S eine Lösung von (2.178) ist. S kann allerdings nicht durch Spezialisierung von Gleichung (2.185) gewonnen werden, da (2.243) keine Transformation zwischen Systemen in Standardkonfiguration ist. Die Lösung von (2.178) für die spezielle Transformation (2.243) bezeichnen wir mit P. Selbst für die spezielle Standarddarstellung (2.172) der Dirac-Matrizen gibt es mehrere Lösungen P. Die einfachste von diesen ist P Wegen γ 0
(γ 0 )
1
γ0.
(2.244)
(γ 0 ) nach (2.201) ist P ein unitärer hermitescher Operator.
Beweis: In der allgemeinen Lorentz-Transformation d x α Λαβ d x β ist die Transformationsmatrix für den Fall (2.243) mit ⎛1 0 ⎞ 1 ⎜ ⎟ Λαβ ⎝ (2.245) ⎠ 1 0 1 enthalten. Mit S P γ 0 haben wir nach (2.178) also P 1γ 0 P
γ0
und
P 1γ l P
γl
2.13 Diracs Löchertheorie und Theorie des Positrons
zu beweisen. Wegen (γ 0 )2 P 1γ 0 P
γ 0γ 0γ 0
1 und P 1 γ0
und
(γ 0 ) 1
67
γ 0 gilt tatsächlich
P 1γ l P
γ 0γ l γ 0
(2.204)
γ l γ 0γ 0
γl .
Das Transformationsgesetz (2.180) lautet in dem betrachteten Spezialfall ausführlicher ψ (x , t ) ψ ( x, t) Pψ(x, t) . (2.246) Für die Potentiale Φ und A des elektromagnetischen Feldes gilt bei der Raumspiegelung (2.243) Φ (x , t ) Φ(x, t), A (x , t ) A(x, t) , (2.247) da sich die Komponenten des Vierervektors Aα transformieren. In der Schrödinger-Theorie wurde der durch
Φ/c, A wie d x α c dt, d x
ψ(x, t) ψ( x, t)
(2.248)
definierte Operator als Paritätsoperator bezeichnet, und bei gleichzeitiger Berücksichtigung der Transformationsformeln (2.247) ist die Schrödinger-Gleichung gegenüber der Transformation ψ ψ invariant. Wenn die Definition (2.248) auf DiracSpinoren erweitert wird, gilt ψ(x, t)
(2.243)
ψ( x , t )
ψ(x , t ) ,
und damit läßt sich das Transformationsgesetz (2.246) für Spinoren auch in die Form
ψ (x , t ) P ψ(x , t ) (2.249) bringen. Die Invarianz der Dirac-Gleichung gegenüber der Transformation (2.243) kann physikalisch so interpretiert werden: Zu jeder Zeitfolge ψ(x, t) physikalischer Zustände existiert eine zweite Folge physikalischer Zustände, die aus der ersten durch räumliche Spiegelung am Koordinatenursprung hervorgeht. Dabei ist prinzipiell nicht feststellbar, welcher Vorgang das Bild und welcher das Spiegelbild ist, beide sind gleichermaßen physikalisch. Für den Erwartungswert L der Observablen L , die aus einer Observablen L durch Spiegelung am Koordinatenursprung hervorgeht, im gespiegelten Zustand ψ gilt L γ 0 L γ 0 , (2.250) denn (2.180) (2.244),s.u. 3 0 0 3 (ψ ) L ψ d x ψ (γ ) L γ ψ d x ψ γ 0 L γ 0 ψ d 3x . L Dabei wurde benutzt, daß zwar d x l d xl gilt, daß sich bei der Raumspiegelung 21 2 1 20 jedoch auch die Integrationsgrenzen umkehren, also z. B. 0 d x 0 d x 1 d x, 2 2 3 so daß d 3x d x gilt. Mit (2.250) sowie x
x ,
H
qΦ
p
h
i
h i p ,
m 0c2β c« ( p q A )
qΦ m 0 c2 β c« ( p q A)
68
2 Dirac-Theorie des Elektrons und des Neutrinos
nach (2.243b), (2.247) und (2.58) folgen die Beziehungen x ¼ ¼ Beweis:
x , 0
x ¼ ¼
p ¼ ¼
p ,
p ¼ ¼
H .
(2.251)
1 (γ 0 )2 x ¼ x ¼ x , 0 1 0 1 γ 0 p ¼ γ 0 (γ 0 )2 p ¼ p ¼ p γ 0 x¼γ 0
1
H ¼ ¼
0
und 0
H ¼ ¼
1 γ 0 qΦ m 0 c2 β c« ( p q A) γ 0 1
(2.42b)
0 (γ 0 )2 qΦ
(2.42a)
1 0 qΦ m 0 c2 β c« ( p q A) H .
m 0 c2 β c« ( p q A)
Der vektorielle Matrixoperator wurde in (2.155) als Dreiervektor mit drei räumlichen Komponenten eingeführt. Wir wissen daher nicht, ob es sich dabei um die räumlichen Komponenten eines Vierervektors (im nicht-relativistischen Grenzfall) handelt oder z. B. um drei Komponenten eines Tensors, wie das beim Magnetfeld B der Fall ist. Dieses ist in dem Tensor ∂α A β ∂β A α enthalten, und aus B j ∂k Al ∂l A k für zyklische j, k, l folgt bei der Spiegelung am Ursprung B ¼j ∂k¼ Al¼ ∂l¼ A ¼k ∂k Al ∂l A k B j , denn ∂α und Aβ sind Vierervektoren, für die ∂k¼ ∂k und Al¼ Al gilt. Die B j transformieren sich also nicht wie die Komponenten eines echten Vierervektors, sondern wie die eines Pseudovektors, also gemäß V ¼α
α
Λ β V
β
.
(2.252)
Da der Spin geladener Teilchen mit einem magnetischen Moment verbunden ist, muß er sich bei einer Raumspiegelung wie das Magnetfeld verhalten. Dies bedeutet, daß der Spin ein Pseudovektor ist, so daß
¼
(2.253)
gilt. Damit erhalten wir
¼
¼
,
(2.254)
denn aus (2.250) folgt Σn¼ ¼
(2.205)
(2.253) (2.206) γ 0 Σn¼ γ 0 γ 0 Σn γ 0 γ 0 i γ l γ m γ 0 l m (2.206) iγ γ Σn .
(2.204)
i γ l γ 0γ 0 γ m
T-Invarianz. Auch die Zeitumkehrtransformation t¼
t
,
x¼
x
(2.255)
2.13 Diracs Löchertheorie und Theorie des Positrons
69
ist eine spezielle Lorentz-Transformation mit der Transformationsmatrix ⎛ ⎞ 1 0 1 ⎜ ⎟ Λαβ ⎝ ⎠. 1 0 1
(2.256)
Der Vierervektor ∂α transformiert sich bei dieser nach (2.176) gemäß ∂ ¼0
∂0 ,
∂ ¼l
∂l ,
(2.257)
womit aus der komplex-konjugierten Dirac-Gleichung (2.229) l h 0 h ∂ 0 e A0 ψ γ ∂ l e Al ψ m 0 c ψ γ i i
0
(2.258)
folgt. A 0 und Al wurden dabei vorerst noch bewußt untransformiert gelassen. Nun existiert eine Matrix T0 , welche die Beziehungen T0 γ l T01 γ l (2.259) T0 γ 0 T01 γ 0 , erfüllt. In der Standarddarstellung (2.171) ist eine mögliche Lösung für T0 durch T0
i γ 1γ 3
(2.260)
mit den Eigenschaften T0
T0
T01
(2.261)
gegeben. Beweis: Aus T0 T0 und T0 T0
γ 1γ 3γ 1γ 3
(2.204)
γ 1γ 3γ 3γ 1
(2.205)
1
(2.262)
(2.201b) (2.205) γ 1 i γ 1γ 3 γ 3γ 1γ 1 γ 3 1 i γ3
folgen unmittelbar die Beziehungen (2.261). Mit (2.203) und (2.204) ergibt sich T0 γ 0 T0 γ 0 i γ 1 γ 3 γ 0 i γ 1 γ 0 γ 3 i γ 0 γ 1 γ 3 γ 0 T0 , T0 γ 1 T0 γ 1 i γ 1 γ 3 γ 1 i γ 1 γ 1 γ 3 γ 1 T0 , T0 γ 2 T0 γ 2 i γ 1 γ 3 γ 2 i γ 1 γ 2 γ 3 i γ 2 γ 1 γ 3 γ 2 T0 , T0 γ 3 T0 γ 3 i γ 1 γ 3 γ 3 i γ 3 γ 1 γ 3 γ 3 T0 , was mit den Beziehungen (2.259) übereinstimmt.
Multiplizieren wir jetzt (2.258) von links mit T0 , so erhalten wir mit der Identität ψ T01 T0 ψ und den Beziehungen (2.259) 0 h l h ∂ 0 e A0 ψ γ ∂ l e Al ψ m 0 c ψ 0 (2.263) γ i i
70
2 Dirac-Theorie des Elektrons und des Neutrinos
mit ψ ¼ (x ¼ , t ¼ )
T0 ψ £
Tψ .
(2.264)
Würde Aα als echter Vierervektor transformiert, so erhielten wir für die Zeitspiegelungstransformation (2.255) nach (2.257) A ¼0 A0 , Al¼ Al , und die Gleichung für ψ ¼ ginge in die Dirac-Gleichung (2.228) für Positronen über. Aus den im folgenden geschilderten Gründen ist das jedoch nicht richtig. Für den Vierervektor Uα
d Xα dτ
d X α dt dt dτ
der Geschwindigkeit ergäbe sich bei der Zeitumkehrtransformation (2.255) aus der Transformationsformel U ¼ α Λαβ U β für die räumlichen Komponenten U ¼l U l . Mit U ¼l d X ¼l /dτ ¼ , U l d X l /dτ und d X ¼l d X l ergäbe sich daraus dτ ¼ dτ , und damit würde d X ¼l d X ¼l d X ¼l dt ¼ d X ¼l dt 1 d X ¼l . U ¼l dτ ¼ dτ dt ¼ dτ dt ¼ dτ 1 u 2 /c2 dt ¼ folgen, die räumlichen Komponenten U ¼l der vektoriellen Geschwindigkeit im System S ¼ wären der Bewegung d X ¼ l /dt ¼ entgegen gerichtet. Dieses unsinnige Ergebnis ist darauf zurückzuführen, daß die Eigenzeit bei der Zeitspiegelung nicht ebenfalls umgekehrt wurde. Kehren wir jedoch mit der Zeit t auch die Eigenzeit τ um, so erhalten wir für die Geschwindigkeit das Transformationsgesetz d X ¼α dτ ¼
U ¼α
Λαβ d X β dτ ¼
β
Λαβ ddτX
Λαβ U β
bzw. U ¼0
U0 ,
U ¼l
U l
eines Pseudovektors, und die Geschwindigkeit weist sowohl in S als auch in S ¼ in die Bewegungsrichtung. Wegen der für die elektrische Stromdichte J α gültigen Beziehung J α qU α δ 4 X X (t) erhält man dann aufgrund der Maxwell-Gleichungen bzw. Aα das Transformationsgesetz eines Pseudovektors, also A0 A¼ 0 ,
Al
A¼ l
bzw.
A0 A ¼0 ,
Al
μ0 J α auch für Aα A¼l .
(2.265)
Anschaulich bedeutet das: Bei Zeitumkehr laufen die Ladungen rückwärts, und mit dem Strom dreht auch das durch Al beschriebene Magnetfeld sein Vorzeichen um, während das Potential Φ c A0 unverändert bleibt. Mit (2.265) nimmt Gleichung (2.263) die Form α h ¼ ¼ ∂ α e A α ψ ¼ m 0 c ψ ¼ 0 γ i
2.13 Diracs Löchertheorie und Theorie des Positrons
71
der Dirac-Gleichung (2.173) an. Diese ist also bei Zeitumkehr invariant, wobei das Potential A¼α gemäß (2.265) als Pseudovektor transformiert wird. Das Transformationsgesetz für den Spinor ψ ist (2.264) mit (2.260). Man kann T
T0 K
schreiben. Nach (2.261) gilt T0 T0 Operator K erfüllt K (λ1 ψ1 λ2 ψ2 )
Kψ
mit T01 T01
ψ
(2.266)
1, d. h. der Operator T0 ist unitär. Der
(λ1 ψ1 λ2 ψ2 )
λ1 K ψ1 λ2 K ψ2 ,
eine Eigenschaft, für die er als antilinear bezeichnet wird; außerdem erfüllt er (K ϕ, K ψ)
(ϕ , ψ )
(ϕ, ψ) ,
weshalb er auch noch als antihermitesch bezeichnet wird. Auch der Operator T ist als Produkt eines unitären und eines antilinearen sowie antihermiteschen Operators antilinear und antihermitesch, es gilt T (λ1 ψ1 λ2 ψ2 )
T0 (λ1 ψ1
λ2 ψ2 )
λ1 T0 ψ1
λ2 T0ψ2
λ1 T ψ1 λ2 T ψ2
sowie (T ϕ, T ψ)
(ϕ , T0 T0 ψ )
(T0 ϕ , T0 ψ )
(ϕ , ψ )
(ϕ, ψ) .
Bei Angabe der Lösung (2.260) der Gleichungen (2.259) wurde schon darauf hingewiesen, daß es mehrere mögliche Lösungen gibt. Die Lösung (2.260) wurde so gewählt, daß die Spinor-Transformation (2.264) die Eigenschaften besitzt, die man physikalisch bei Zeitumkehr erwartet: Während die Energie unverändert bleibt, wird der Teilchenimpuls umgekehrt (siehe unten). Für den Erwartungswert einer Observablen L gilt 3 (2.264) L (ψ ) L ψ d x (ψ ) T0 L T0 ψ d 3x ψ T0 L T0 ψ d 3x T0 L T0 . 1 3 Mit T0 iγ γ wird daraus
i
1 3 γ γ
i γ 1 γ 3 T0 T0 L T0 .
(2.203)
L
und T0
(2.261)
T0
T0
(2.267)
Mit Hilfe dieser Formel können die Beziehungen
H H , (2.268) abgeleitet werden (Aufgabe 2.9), wobei wie A transformiert werden muß, nach x x ,
(2.265d) also gemäß
p p ,
.
(2.269)
72
2 Dirac-Theorie des Elektrons und des Neutrinos
CPT-Symmetrie Da die Operationen der Raumspiegelung am Koordinatenursprung und der Zeitumkehr die Dirac-Gleichung invariant lassen, können sie bei der Konstruktion ladungskonjugierter Positronlösungen mit einbezogen werden. Dementsprechend erwarten wir, daß ψC PT (x ¼ , t ¼ )
C PT ψ(x, t)
t¼
mit
t,
x¼
x
(2.270)
eine Lösung der Dirac-Gleichung für Positronen ist, wenn ψ(x, t) eine Elektronenlösung ist. Dabei ist (2.271) A ¼α A α zu fordern, da die sich gegenseitig kompensierenden Transformationen (2.247b) und (2.265b) hintereinander ausgeführt werden. Zunächst folgt aus den Definitionen (2.231) mit (2.233), (2.244) und (2.264) mit (2.260), also C i γ 2 (...) , P γ 0 und i γ 1 γ 3 (...) ψC PT (x , t ) i γ 2 γ 0 i γ 1 γ 3 ψ oder mit (2.207)
ψC PT (x , t )
(2.203)
γ 2 γ 0γ 1γ 3ψ
γ 0 γ 1γ 2γ 3ψ
i γ 5 ψ(x, t) .
(2.272)
Jetzt multiplizieren wir die Dirac-Gleichung (2.173) von links mit i γ 5 und erhalten mit (2.208b) α h γ i γ 5 ψ m0c i γ 5 ψ 0. ∂α e Aα i Indem wir zur Abkürzung ψ ψC PT schreiben, erhalten wir mit ∂α (2.270b,c)), (2.271) und (2.272) h γα ∂ α e Aα ψ m 0 c ψ 0 , i
∂α (nach
also die Positronengleichung (2.232). Der Zusammenhang zwischen transformierten und untransformierten Erwartungswerten kann durch die Kombination ihres Verhaltens bei den Einzeltransformationen C, P und T erschlossen werden. x bleibt z. B. bei den Transformationen C und T erhalten und wird durch P im Vorzeichen umgekehrt, d. h. wir erwarten x x . Analog kann bei allen anderen Erwartungswerten vorgegangen werden. Es ist jedoch auch nützlich, ihr Verhalten in einem Schritt aus der Transformationsgleichung (2.272) abzuleiten. Für einen beliebigen Operator L gilt L (ψ ) L ψ d 3x ψ γ 5 L γ 5ψ d 3x γ 5 L γ 5 . (2.273) Dabei wurde beachtet, daß wie bei der Paritätstransformation alleine der Vorzeichenwechsel d 3x d 3x durch einen Vorzeichenwechsel beim Vertauschen der oberen und
2.13 Diracs Löchertheorie und Theorie des Positrons
73
unteren Integralgrenzen kompensiert wird. Operatoren L ¼ , die keine Matrizen sind, vertauschen mit γ 5 , so daß man für sie mit (2.209) noch einfacher L ¼ ¼
L ¼
erhält. Durch Anwendung auf x ¼ x, ¼ bzw. p ¼ p erhalten wir auf diese Weise unmittelbar x ¼ ¼ x , p ¼ ¼ p . (2.274) Mit q ¼ q, (2.270c) und (2.271) ergibt sich aus (2.241) ¼ ¼ 0 l h H (q ) qΦ cγ γ ∂l q Al m 0 c2 γ 0 , i und die Anwendung von (2.273) liefert 5 0 l h ∂l q Al m 0 c2 γ 0 γ 5 γ H ¼ (q ¼ )¼ qΦ cγ γ i (2.208b) 5 5 0 l h 2 0 γ qΦ cγ γ ∂l q Al m 0 c γ γ i (2.209) 0 l h 2 0 ∂l q Al m 0 c γ qΦ cγ γ i oder mit (2.241)
H (q )
H (q) .
(2.275)
Für den Spinoperator gilt bei der Zeitspiegelung nach (2.269) , bei der Raumspiegelung nach (2.253) und bei der Ladungskonjugation , letzteres, weil bei dieser alle Operatoren unverändert gelassen werden und nur deren Mittelwerte mit ladungskonjugierten Zuständen berechnet werden (siehe vor Gleichung (2.238)). Bei der CPT-Transformation gilt also insgesamt
.
(2.276)
Aus (2.273) ergibt sich damit für zyklische Indizes l, m, n Σn
(2.208b)
5 (2.206) 5 γ Σn γ 5 γ 5 Σn γ 5 γ i γ lγ mγ 5 5 5 l m (2.209a) l m γ γ iγ γ iγ γ Σn ,
in Vektornotation also
.
(2.277)
Für die Teilchendichte gilt n ( x, t) n (x , t ) (ψ ) ψ
ψ
5 5 γ ψ γ
(2.209a)
ψ ψ
n(x, t) ,
74
ct
2 Dirac-Theorie des Elektrons und des Neutrinos
e
Paarvernichtung
Abb. 2.7: Ein Elektron negativer Energie, das in der Zeit rückwärts läuft, ist nicht unterscheidbar von einem Positron positiver Energie, das in der Zeit vorwärts läuft. Die Vorgänge der Paarerzeugung und Paarvernichtung können als Richtungswechsel des Elektrons in der Zeit betrachtet werden.
e e Paarerzeugung
x
was im quasiklassischen Grenzfall bedeutet, daß die (raumgespiegelten) Bahnen rückwärts durchlaufen werden. Ein Elektron mit negativer Energie und negativem Impuls, das rückwärts in der Zeit läuft, ist also nicht unterscheidbar von einem Positron mit positiver Energie und positivem Impuls, das vorwärts in der Zeit läuft (Abb. 2.7). Dies ist die Feynman-Stückelberg-Interpretation des Antiteilchens.
2.14 Dirac-Gleichung für Neutrinos Wird in der Dirac-Gleichung (2.55) m 0 0 und q 0 gesetzt, so ergibt sich aus ihr i h ∂t ψ
c« p ψ
(2.278)
als Gleichung für neutrale Teilchen verschwindender Ruhemasse. Wie wir feststellen werden, handelt es sich bei den Teilchen um Neutrinos. Mit dem Ansatz ψ e i Et /h folgt aus (2.278) Eψ
c« p ψ ,
(2.279)
und der Zusammenhang (2.78) vereinfacht sich zu E
cp .
(2.280)
Die de Broglie-Relationen E hω, p hk und die Definition Úg ∂ω/∂ k führen hiermit zu der Ausbreitungsgeschwindigkeit p (2.281) Úg c p von Wellenpaketen. Teilchen der Ruhemasse null können sich also nur mit Lichtgeschwindigkeit ausbreiten. Dies hat zur Folge, daß es keinen nicht-relativistischen Grenzfall gibt, bei dem man zwischen großen und kleinen Komponenten des Spinors ψ unterscheiden könnte. Wird die Zerlegung (2.73) in die Energieeigenwertgleichung (2.279) mit (2.280) eingesetzt, so geht diese mit der Definition n
p p
(2.282)
2.14 Dirac-Gleichung für Neutrinos
in
« n ψ
(2.51)
0 n
n 0
75
ϕ χ
nχ nϕ
ψ
ϕ χ
bzw. in die beiden Gleichungen ϕ
n χ ,
χ
n ϕ
(2.283)
über. Indem wir aus diesen χ oder ϕ eliminieren, erhalten wir ϕ n χ n n χ und daraus mit (2.282), (2.76) und p (h/i) h 2 ϕ
p2ϕ ,
h 2 χ
p2χ .
n ϕ oder (2.284)
Die in den zwei Komponenten von ϕ enthaltenen zwei Freiheitsgrade – χ wird nach (2.283b) durch ϕ festgelegt – bedeuten, daß wir es wie beim Elektron mit Spin-1/2Teilchen zu tun haben. Präziser käme diese Eigenschaft bei Wechselwirkungen mit anderen Teilchen zum Ausdruck, bei denen Drehimpuls übertragen wird. Die durch (2.278) beschriebenen Teilchen sind masselos, elektrisch neutral, breiten sich mit Lichtgeschwindigkeit aus und haben den Spin 1/2. Hieraus folgt, daß es sich um Neutrinos handelt. ϕ und χ erfüllen nach (2.284) dieselbe Gleichung, was zur Folge hat, daß zusammen mit einer Lösung ϕ der Gleichung (2.284a) nach (2.283b) auch χ n ϕ eine Lösung ist. Da die Gleichung (2.284a) linear ist, sind dann auch die beiden Linearkombinationen 1 1 F (1 n) ϕ, G (1 n) ϕ (2.285) 2 2 Lösungen. Durch Anwendung des Operators n F
1 ( n n 2 1 h 2 ϕ
2
p2
n) ϕ
(2.76)
n ϕ
n auf F ergibt sich
1 n 2
(2.284a)
n2 ϕ
1 (1 2
n) ϕ
1 p 2 2 p2
n ϕ
F.
Eine entsprechende Rechnung kann für G durchgeführt werden, und die Zusammenfassung beider Ergebnisse führt zu n F
F,
n G
G.
(2.286)
p projiziert – bis auf den Faktor h/2 – den Spin des TeilDer Operator n p/ chens auf seine Bewegungsrichtung. Die beiden Gleichungen (2.286) besagen daher, daß im Zustand F bzw. G die Spinkomponente in Bewegungsrichtung h/2 bzw. h/2 beträgt. Die Eigenwerte 1 des Operators n werden als Spiralität oder Helizität des Neutrinos bezeichnet. Die Erfahrung zeigt, daß Neutrinos in Zuständen wohldefinierter Helizität, also entweder im Zustand F oder G angetroffen werden. Wegen v c kann ein Neutrino nicht abgebremst werden und seine Geschwindigkeit umkehren. Daraus folgt, daß die Helizität eine feste Teilcheneigenschaft der Neutrinos ist.
76
2 Dirac-Theorie des Elektrons und des Neutrinos
Trotz fehlender Ladung ist auch bei Neutrinos die Operation (2.231) der Ladungskonjugation möglich. Aus dem Spinor ψ entsteht dabei der Spinor ψC
i γ 2ψ ,
der nach (2.232) (mit e 0 und m 0 0) wieder die Neutrinogleichung (2.278) erfüllt. Offensichtlich gelten auch jetzt die Relationen (2.239). Da bei der Ladungskonjugation Impuls und Spin beide das Vorzeichen wechseln, bleibt das Vorzeichen der Helizität erhalten. Experimentell hat man festgestellt, daß Neutrino und Antineutrino verschiedene Teilchen sind: Das Neutrino hat negative und das Antineutrino positive Helizität. Dies bedeutet, daß die Ladungskonjugation nicht den Übergang vom Neutrino zum Antineutrino darstellen kann.
2.15 Viel-Teilchen-Phänomene in der Dirac-Theorie Daß das Vakuum nach der Diracschen Löchertheorie mit Elektronen und Positronen negativer Energie besetzt ist, muß sich irgendwie bemerkbar machen. Mit Auswirkungen davon wird man insbesondere dort rechnen, wo starke elektromagnetische Felder auftreten. Das Pauli-Prinzip wird zwar dafür sorgen, daß nicht zwei Teilchen den gleichen Teilchenzustand einnehmen, aber es kann nicht verhindern, daß die geladenen Teilchen im Vakuumuntergrund durch starke elektromagnetische Felder verschoben werden. Eine Theorie, die derartige Situationen korrekt beschreibt, müßte im Prinzip eine Viel-Teilchen-Theorie sein. Wir werden im folgenden jedoch zwei Beispiele im Rahmen der für Einzelteilchen abgeleiteten Dirac-Theorie untersuchen. Beim ersten liefert schon diese quantitative Aussagen, die allerdings einer Viel-Teilchen-Interpretation bedürfen. Beim zweiten werden wir nur zu qualitativen Aussagen gelangen. Eine den Viel-Teilchen-Phänomenen angemessene Theorie ist die Quantenfeldtheorie. Ihre Anfangsgründe werden im nächsten Teil des Buches behandelt.
2.15.1 Kleinsches Paradoxon Sehr starke elektrische Felder sind mit starken Änderungen des elektrischen Potentials über kurze Distanzen verknüpft. Das theoretische Konzept eines Potentialsprungs an einer Potentialschwelle impliziert sogar eine unendlich große elektrische Feldstärke. Nach den vorangegangenen Überlegungen müssen wir daher mit Viel-TeilchenAspekten der Dirac-Theorie rechnen, wenn ein Elektron auf eine Potentialschwelle auftrifft. Diese Situation wird im folgenden zunächst anhand der Ein-Teilchen-Theorie untersucht und anschließend unter Benutzung von Viel-Teilchen-Aspekten interpretiert. Zur Vorbereitung betrachten wir die stationäre Dynamik eines Elektrons in einem räumlich und zeitlich konstanten Potential V0 . Die Dirac-Gleichung dafür lautet
(V m c β c« p ) ψ .
ih ∂t ψ
0
0
2
2.15 Viel-Teilchen-Phänomene in der Dirac-Theorie
77
E V0 m 0 c2 V0 0 V0 m 0 c2
Abb. 2.8: Energiespektrum eines Elektrons im konstanten Potential V0 . Gegenüber dem freien Elektron sind die Energiekontinua um V0 nach oben verschoben.
Zu ihrer Lösung wählen wir den Ansatz
U ei ( p x
ψ
Et )/h
,
(2.287)
der mit p ψ pψ und ih ∂t ψ Eψ die Beziehung (E
V0)ψ (m 0c2 β
c« p)ψ
zur Folge hat. Das ist dieselbe Gleichung, die wir bei freien Elektronen erhalten hatten, nur daß E durch E V0 ersetzt ist. Daher erhalten wir statt der Dispersionsrelation (2.78) jetzt E V0 Ep mit Ep (m 0 c2 )2 c2 p 2 . (2.288) Wieder haben wir zwei Energiekontinua, die jedoch gegenüber denen bei freien Teilchen um V0 verschoben sind, statt Abb. 2.2 erhalten wir nun Abb. 2.8. Nun betrachten wir den Fall, daß ein stationärer Elektronenstrahl von links aus dem Gebiet x < 0 nach rechts auf eine Potentialschwelle * 0 für x < 0 V (x) V0 für x 0 bei x 0 zuläuft. Solange die kinetische Energie E kin E m 0 c2 größer als V0 ist, erwarten wir neben der von links einfallenden Welle eine durchlaufende und eine reflektierte Welle. Für V0 > E m 0 c2 sollte dagegen Totalreflexion auftreten und bei x > 0 nur noch eine gedämpfte Welle existieren. Nach (2.78) und (2.288) gilt für x < 0 (vor der Schwelle) E 2 /c2 p 2 m 02 c2 und für x 0 (hinter der Schwelle) (E V0 )2 c2 bzw.
p
(E
p 2
m 02 c2
V0)2 m 2c2 . c2
0
(2.289)
(2.290)
Der Ansatz (2.287) gilt vor und hinter der Schwelle. Die über die Schwelle nach x 0 eindringende Welle wird gedämpft, sobald p 2 < 0 und damit p imaginär wird. (Neben
78
2 Dirac-Theorie des Elektrons und des Neutrinos
E V0 m 0 c2 V0 m 0 c2
V0 m 0 c2
E
Abb. 2.9: Übergang der von links einlaufenden Elektronen positiver Energie in ein Band negativer Energie rechts der Potentialschwelle für den Fall V0 > E m 0 c2 .
0 m 0 c2
der gedämpften liefert (2.290) auch eine angefachte Welle, die jedoch aus physikalischen Gründen ausgeschlossen werden muß.) Das ist für E V0 < m 0 c2 bzw. E
m 0 c2 < V0 < E
m 0 c2
der Fall. Daß p imaginär wird, wenn V0 den Wert E m 0 c2 überschreitet, entspricht der Erwartung. Überraschenderweise wird p jedoch reell, wenn V0 über den Wert E m 0 c2 hinauswächst (Abb. 2.9). Es gibt dann wieder eine durchlaufende Welle, und nur ein Teil der einfallenden Welle wird reflektiert. Für ein durchlaufendes Elektron folgt aus V0 >E m 0 c2 allerdings E kin
E
m 0 c2
V0 <
2m 0 c2 ,
die kinetische Energie ist negativ, und aus (2.289) ergibt sich in diesem Fall bzw. für E V0 < m 0 c2 E V0 c p 2 m 02 c2 .
Setzt man hierin die de Broglie-Relationen E h ω sowie p h k ein, so erhält man die Gruppengeschwindigkeit dω ch k c2 p vg . E V0 d k p 2 m 02 c2
Da die Elektronen im Einfallbereich x 0 von links nach rechts laufen, müssen sie das auch im Bereich x > 0 tun, d. h. v g 0. Wegen E V0 < 0 ist das nur für p 0 möglich. Das Kleinsche Paradoxon besteht darin, daß die Potentialschwelle für V0 > E m 0 c2 Teilchen durchläßt. Es kommt dadurch zustande, daß einige Elektronen nach deren Durchdringen mit negativer kinetischer Energie nach rechts weiterlaufen können. Eine Viel-Teilchen-Theorie mit einem Kontinuum von Zuständen negativer Energie liefert die Möglichkeit zu einer physikalischeren Deutung: Für V0 m 0 c2 > E > m 0 c2 können die von links auf die Potentialschwelle auftreffenden Elektronen aus dem Vakuum des Gebiets rechts der Schwelle Elektronen herausschlagen, die nach links laufen. Der Reflexionskoeffizient wird hierdurch – anders als bei der zuerst besprochenen Ein-Teilchen-Interpretation – größer als eins. Die dabei entstehenden Löcher laufen als Positronen mit positivem Impuls ( p > 0) nach rechts. Mit anderen Worten bedeutet das, daß es beim Aufprall der Elektronen auf die Potentialschwelle zur Paarerzeugung kommt. Die vollständige Durchrechnung des Reflexionsproblems wird zur Übung empfohlen (Aufgabe 2.10).
2.15 Viel-Teilchen-Phänomene in der Dirac-Theorie
79
2.15.2 Polarisation des Vakuums In der Nachbarschaft geladener Punktteilchen treten sehr starke Felder auf. Wir erwarten, daß z. B. ein im Vakuum befindliches Elektron positiver Energie die ihm benachbarten Vakuumelektronen negativer Energie abstößt, während es die benachbarten Vakuumpositronen anzieht (Abb. 2.10 (a)). Dies bedeutet, daß das Vakuum als ein polarisierbares Medium aufgefaßt werden kann, dessen Polarisation aus Elektron-PositronPaaren gebildete Dipole hervorrufen. Für das elektrische Feld in einem polarisierbaren Medium (siehe Elektrodynamik, Abschn. E4.8.4) gilt div(ε0 E
P) λ
oder
div ε0 E
λ div P λ
λP ,
wobei λ P div P als Polarisationsladungsdichte bezeichnet wird. Die eigentliche Ladung des Elektrons, die auch den Namen nackte Ladung trägt, wird demnach durch die Polarisationsladungen des Vakuums abgeändert. Da die aus Elektron-PositronPaaren gebildeten Dipole ein elektrisches Feld erzeugen, das dem des Elektrons entgegengerichtet ist, wird dessen Feld abgeschwächt. Die Polarisationsladung hat daher das entgegengesetzte Vorzeichen wie die Ladung des Elektrons. Der qualitative Verlauf der Ladungsdichte in der Umgebung des Elektrons ist in Abb. 2.10 (b) dargestellt. In größerem Abstand vom Elektron mißt man die Ladung e (λ λ P ) d 3x . Rückt man dem Elektron sehr nahe, so mißt man dagegen die nackte Ladung en λ d 3x , U
wobei das Integrationsgebiet U nur die unmittelbare Nachbarschaft des Elektrons erfaßt und en >e gilt. Die Polarisation des Vakuums macht sich im Wasserstoffatom bei den l 0 -Zuständen des Elektrons bemerkbar, deren Aufenthaltswahrscheinlichkeit ψψ auch noch λ
λP λ λP r λ
(a)
(b)
Abb. 2.10: (a) Polarisierende Wirkung eines Elektrons auf seine Umgebung. (b) Qualitativer Verlauf der Ladungsdichte λ, der Polarisationsladungsdichte λ P und der Gesamtladungsdichte λ λ P in der Umgebung eines Elektrons.
80
2 Dirac-Theorie des Elektrons und des Neutrinos
sehr nahe dem Kern wesentlich von null verschieden ist: Dort macht sich die höhere nackte Ladung des Elektrons bemerkbar und bewirkt eine stärkere Anziehung durch den Kern, was zu einer Erniedrigung der Energie der l 0 -Niveaus führt. Allerdings wird diese zum Teil durch die Lamb-Shift (siehe Abschn. 8.3.8) der Elektronen kompensiert, die durch fluktuierende elektromagnetische Felder hervorgerufen wird. Dabei handelt es sich um zeitabhängige Felder, die durch statistische Fluktuationen im Zustand des Vakuums auftreten. Deren zeitliche Mittelwerte verschwinden zwar, ihre quadratischen Mittelwerte sind aber von null verschieden und beeinflussen die Elektronenbahnen.
2.15.3 Orts-Impuls-Unschärferelation und Paarerzeugung Je genauer der Ort eines Teilchens gegeben ist, desto größer wird nach der Orts-ImpulsUnschärferelation h (2.291) x p 2 seine Impulsunschärfe p, und desto größer werden damit auch die möglichen Werte seines Impulses. Mit einem hohen Impuls des Teilchens ist gleichzeitig eine hohe kinetische Energie verbunden. Wenn diese den Wert 2m 0 c2 überschreitet, wobei m 0 die Ruhemasse eines Elektrons bzw. Positrons ist, kann sie von dem betrachteten Teilchen auf ein Elektron (oder Positron) negativer Energie übertragen werden und dieses aus der DiracSee heraus in einen Zustand positiver Energie E m 0 c2 überführen. Bei hinreichend starker Lokalisierung kann das Teilchen also im Vakuum die Erzeugung eines ElektronPositron-Paares herbeiführen. Im Anschluß an diesen Prozeß hat man es mit drei Teilchen zu tun, dem ursprünglichen Teilchen und dem Elektron-Positron-Paar. Dies zeigt erneut, daß die relativistische Quantenmechanik keine genuine Ein-Teilchen-Theorie ist, sondern unter gegebenen Umständen zwangsläufig zu Viel-Teilchen-Phänomenen führt. Durch die Paarerzeugung werden der Impuls und die Impulsunschärfe des ursprünglichen Teilchens kleiner, was zur Folge hat, daß nach (2.291) die Ortsunschärfe wieder größer wird. Dies bedeutet, daß in der relativistischen Quantenmechanik anders als in der nicht-relativistischen Quantenmechanik der Ort eines Teilchens nicht beliebig scharf werden kann. Die Ortsunschärfe besitzt vielmehr eine untere Grenze, die im folgenden berechnet werden soll. Da es uns nur auf deren ungefähren Wert ankommt, werden wir in der folgenden Rechnung zum Teil klassische Elemente benutzen. Wir nehmen an, daß das Teilchen, dessen minimale Ortsunschärfe berechnet werden soll, ebenfalls ein Elektron oder Positron ist, so daß seine Ruhemasse m 0 die gleiche wie die der bei der Paarerzeugung entstehenden Teilchen ist. Die kinetische Energie des Teilchens ist 1 1 m 0 c2 . E kin mc2 m 0 c2 1v 2 /c2 Für
1 1v 2 /c2
1
m 0 c2
2m 0 c2
Aufgaben
81
oder
1 1 v 2 /c2
3
reicht diese zur Paarerzeugung aus. Die Auflösung der letzten Ungleichung nach v/c liefert 2 2 v c 3 und m0v p mv 3m 0v 2 2 m 0 c . (2.292) 2 2 1 v /c Gleichung (2.291) entnehmen wir für die Unschärfe des Teilchenorts die Abschätzung x
h p .
(2.293)
< p < p annehmen, für p 0 Für p 0 kann der Impuls Werte im Bereich p
sind noch größere Impulswerte möglich. Demnach wird gemäß (2.292) für p
2m 0c
(2.294)
(wegen des Überschlagscharakters unserer Rechnung konnte der Faktor 2 weggelassen werden) die Paarerzeugung möglich. Nach (2.293) mit (2.294) geschieht das für < x
h 2m 0 c
(Q2.26)
λCompt .
(2.295)
Die untere Grenze der Ortsunschärfe eines relativistischen Teilchens ist also in etwa die Compton-Wellenlänge. Versucht man, das Teilchen in ein Gebiet kleinerer Ausdehnung zu zwängen, so kommt es zur Paarerzeugung.
Aufgaben 2.1
Ehrenfestsche Theoreme. Beweisen Sie für die Dirac-Gleichung mit Magnetfeld die Gültigkeit der Ehrenfestschen Theoreme d x dt
0 ∂ H 1 ∂ p
,
d p dt
0 ∂ H 1 ∂x
Hinweis: p kann durch p q A ausgedrückt werden.
2.2
.
Welcher Zusammenhang besteht im Fall Φ 0 zwischen den Eigenfunktionen bzw. Eigenwerten des zur Dirac-Gleichung gehörigen Hamilton-Operators H und denen des Masseoperators m ?
82
2 Dirac-Theorie des Elektrons und des Neutrinos
2.3
1. Welche Näherung muß gelten, damit der Mittelwert m des Masseoperators im quasiklassischen Grenzfall in die klassische relativistische Masse übergeht? 2. Berechnen Sie die Zeitableitung des Mittelwerts m des Masseoperators in einem elektrischen Feld und zeigen Sie, daß sie im quasiklassischen Grenzfall in die klassische zeitliche Massenänderung übergeht. Hinweis: Man beachte, daß der quasiklassische und der nicht-relativistische Grenzfall nicht dasselbe sind. Der quasiklassische Grenzfall der relativistischen Quantenmechanik ist relativistisch!
2.4
Beweisen Sie für 44–Matrizen die Multiplikationsregel
A11 A21
A 12 A 22
B11 B21
B12 B22
A11 B11 A 12 B21 A21 B11 A 22 B21
A 11 B12 A 12 B22 , A 21 B12 A 22 B22
wobei Ai j und Bi j (i 1, 2, j 1, 2) 22–Blockmatrizen sind. 2.5
Lösungen negativer Energie im nicht-relativistischen Grenzfall. Berechnen Sie den nicht-relativistischen Grenzfall der Dirac-Gleichung mit zeitlich veränderlichen Feldern für Lösungen negativer Energie. Gehen Sie analog zum Fall der Lösungen positiver Energie vor.
2.6
Zur Ableitungslinearisierung der Schrödinger-Gleichung. 1. Berechnen Sie den Operator M L für den Fall minimaler Kopplung zeitabhängiger Felder Φ und A. 0 im Spezialfall E (∂t A Φ)0 2. Zeigen Sie, daß die Gleichung M Lψ wieder zur Pauli-Gleichung führt. Anleitung: Es vereinfacht die Rechnung, wenn man die Operatoren τ ih ∂t qΦ und (h/i) q A benutzt. Behandeln Sie den Ausdruck αl αm π l π m genauso wie den Ausdruck σl σm π l π m in Abschn. 2.8.1.
2.7
Geschwindigkeitsoperator in der Dirac-Theorie. Wie ist es möglich, daß in der Dirac-Theorie der Mittelwert cαi
ψ αi ψ d 3 τ
der konstanten Matrizen cαi die – beliebig vorgebbare – Teilchengeschwindigkeit d x i /dt ergibt, obwohl sich bei der Mittelung die Phasen von ψ U eiS/h herausheben? Anleitung: 1. Berechnen Sie zunächst, was sich bei den in Abschn. 2.4 abgeleiteten Ebene-Welle-Lösungen bei in z-Richtung laufenden Wellen für cαz und cαx ergibt. 2. Konstruieren Sie dann in x-Richtung laufende ebene Wellen positiver Energie derart, daß sich cαx u x ergibt. Was ist der Unterschied gegenüber den in z-Richtung laufenden Wellen? Welcher Unterschied besteht gegenüber den Ebene-Welle-Lösungen der Schrödinger-Theorie? 2.8
1. Zeigen Sie, daß beim Zerfall eines Photons in ein Elektron-Positron-Paar die Erhaltungsgleichungen für Energie und Impuls nicht gleichzeitig erfüllt werden können. 2. Durch Betrachten des Verhältnisses aus Energie und Impuls kann qualitativ gezeigt werden, daß der Impuls des Photons zu groß ist, um vom Elektron-Positron-Paar aufgenommen zu werden.
Aufgaben
83
2.9
Transformationsverhalten bei Zeitumkehr. Wie hängen bei der Zeitspiegelung x ¼ x, t ¼ t die Mittelwerte x ¼ ¼ , p ¼ ¼ , H ¼ ¼ und ¼ ¼ mit den Mittelwerten x , p , H und zusammen?
2.10
Kleinsches Paradoxon: Untersuchen Sie die Streuung von relativistischen Elektronen der Energie E und des Impulses p p ex an der Potentialschwelle * 0 für x < 0, V (x) V0 > 0 für x 0. Berechnen Sie den Reflexionskoeffizienten R jr /je und den Durchlaßkoeffizienten D jd /je, wenn je der einfallende, jd der durchgehende und jr der an der Potentialschwelle reflektierte Teilchenstrom ist. Wie verhalten sich diese Koeffizienten, wenn V0 die Grenzen E m 0 c2 bzw. E m 0 c2 überschreitet? Was passiert für V0 ?
Lösungen 2.2
Für Φ 0 gilt m H /c2 . Aus H ψ Eψ folgt E m ψ 2 ψ m ψ . c Die Eigenzustände sind die gleichen, zwischen den Eigenwerten besteht der Zusammenhang m E/c2 .
2.6
1. Mit « τ τ « , β β und τ τ i h q (∂t A Φ) ergibt sich
1 1 (β 1)τ i m(β 1) (β 1)τ i m(β 1) M L 2 2
1 2 i m (β 1) τ 2 (β 1) τ (β 1)2 τ 4 2 2 i 2 (β 1) τ i m (β 1) m2 (β 1)2 τ i m(β 1) m 2 (β 2 1) 2i β τ β τ ( τ τ ) m2 (β 1)2 (β 1)2 τ i m( β β ) 2i (β 1) (τ τ ) ( β β ) τ 2m τ 2m τ h2q (β 1) (∂t AΦ) . 2. Für ∂t A Φ 0 folgt daraus M L
2m τ .
84
2 Dirac-Theorie des Elektrons und des Neutrinos
Ähnlich wie in Abschn. 2.8.1 ergibt sich
«
αl αm π l π m
2
αl αm π l , π m .
l,m zykl
Aus σl σm i σ n für zyklische l, m, n und (2.51) folgt 0 σm 0 σl σl σm 0 σn αl αm i σl 0 σm 0 0 σl σm 0
0 σn
.
Mit π l , π m (q h/i)B n für zyklische l, m, n folgt schließlich
2
q h B
und
ML
2m τ
2
q h B
Σl
mit
σl 0
0 σl
.
Für die zwei oberen Komponenten des Viererspinors ψ folgt damit aus der Gleichung M Lψ 0 die Pauli-Gleichung. 2.8
1. Mit E
c m 20 c2 p2
mc2
m 0 c2
m0 p 1v 2 /c2
,
1v 2 /c2
und der Abkürzung γ 1/ 1v 2 /c2 sind die Erhaltungsgleichungen hω
m 0 c2 (γ1 γ2 ) ,
hk
m 0 (γ1 1 γ2 2 )
unter der Bedingung ω/k c zu lösen. Werden die beiden Gleichungen erst quadriert und dann durcheinander dividiert, so ergibt sich c4 γ12 γ22 2γ1 γ2 ω2 2 c , k2 γ12 12 γ22 22 2γ1 γ2 1 2 daraus folgend 2 2 γ12 1 12 γ22 1 22 2γ1 γ2 1 1 2 2 1 1 2γ1 γ2 1 1 2 2 0 c c c c γ 1 γ 2 1 1 2 2 1 . c
und schließlich
Es gilt γ1 >0, γ2 >0, 11 2 /c2 >0, und daher ist die linke Seite positiv. Da die rechte Seite negativ ist, kann die Gleichung nicht erfüllt werden. 2. Das Verhältnis Impuls/Energie beim Elektron und Positron bzw. Photon ist p '' ' E
mv mc2
v , c2
p '' ' E γ
pγ
Eγ , c
p
Hieraus folgt
hk hω
v E , c2
k ω
1 . c
Aufgaben
85
und bei Energieerhaltung gilt E E γ /2. Hiermit folgt v Eγ
p
v pγ . 2c
2 c2
Der mit der Energie des Photons aufgenommene Impuls ist also viel zu klein zur Impulserhaltung, für die p pγ /2 gelten müßte.
2.9
Mit x ¼ x und p ¼ (h /i) ∂ x
¼
(h /i) ∂x p sowie p p ergibt sich £
x (2.267) T0 (x ) T0 (T0 )2 x (2.261) x x , 2 p T0 ( p ) T0 T0 ( p ) p p . ¼ ¼
¼ £
£
£
£
¼ ¼
¼ £
£
£ £
£
Es gilt H ¼ £
qΦ m 0 c2 β c« ( p q A) qΦ m 0 c2 β c« ( p q A ) (2.265) qΦ m 0 c2 β c« ( p q A) (2.203) qΦ m 0 c2 β cα1 ( p1 q A1 ) cα2 ( p2 q A2 ) cα3 ( p3 q A3 ) , ¼
¼
£
£
£
¼
£
£
und damit wird
H (2.260) ¼ ¼
0
T02 qΦ
1£
0
1£
0
m 0 c2 γ 1γ 3 βγ 1γ 3 c ( p1 q A1 )γ 1γ 3α1 γ 1γ 3
0
0
1£
c ( p2 q A2)γ 1γ 3 α2γ 1γ 3 c ( p3 q A3 )γ 1γ 3α3 γ 1γ 3
1£
1£
.
Mit α1 β 1 γ 1 βγ 1 γ 0 γ 1 , α2 γ 0 γ 2 und α3 γ 0 γ 3 ergibt sich
γ 1γ 3γ 0γ 1γ 3 γ 1 γ 0γ 1 γ 0 β , γ 1 γ 3 α1 γ 1 γ 3 γ 1 γ 3 γ 0 γ 1 γ 1 γ 3 γ 1 γ 3 γ 0 γ 3 γ 0 γ 1 β 2 α1 α1 γ 1 γ 3 α2 γ 1 γ 3 γ 1 γ 3 γ 0 γ 2 γ 1 γ 3 γ 1 γ 0 γ 2 γ 1 γ 0 γ 2 α2 γ 1 γ 3 α3 γ 1 γ 3 γ 1 γ 3 γ 0 γ 3 γ 1 γ 3 γ 1 γ 0 γ 1 γ 3 γ 0 γ 3 α3 , und aus H wird schließlich 0 1 H qΦ m 0 c2 β cα1 ( p1 q A1 ) cα2 ( p2 q A2 ) cα3 ( p3 q A3 ) γ 1 γ 3 βγ 1 γ 3
¼ ¼
£
¼ ¼
0 qΦ
1£
m 0 c2 β c« ( p q A) H H . £
Bezüglich ¼ ¼ ergibt sich z. B. für die 3-Komponente 0 £ 1£ Σ3¼ ¼ T0 (Σ3¼ )£ T0 £ T0 Σ3£ T0 £ i γ 1γ 3 i γ 1γ 2 i γ 1γ 3 0
0
1£
i γ 1γ 3
γ1
£
i γ 2γ 1
0
γ2
£
i γ 1γ 2
γ 1γ 3
1£
1£
0 1£ i γ 1γ 3γ 1γ 2γ 1 γ 3
Σ3 Σ3 . £
Der Beweis für die 1- und 2-Komponente erfolgt analog.
0
i γ 3γ 2γ 1γ 3
1£
3
Anwendungen der Dirac-Theorie
3.1
Zitterbewegung des Elektrons
Für die mittlere Geschwindigkeit eines freien Elektrons fanden wir das Ergebnis (2.61). Wenn wir danach fragen, welchen Wert der Geschwindigkeit eine einzelne Messung liefert, stoßen wir auf ein merkwürdiges Resultat: Als Folge der Beziehungen (2.49) besitzt jede Komponente von c« nur die Eigenwerte c, d. h. bei der Messung einer Geschwindigkeitskomponente findet man nach den üblichen Regeln der Quantenmechanik nur entweder c oder c. (Wie das mit den Ergebnissen praktischer Messungen zu vereinbaren ist, wird am Ende dieses Abschnitts diskutiert.) Das ist ganz anders als in der Schrödingerschen Wellenmechanik, in der sich für den Geschwindigkeitsoperator p /m das kontinuierliche Spektrum der Eigenwerte p/m ergibt. Von ausschlaggebender Bedeutung für dieses Ergebnis ist, daß in den Eigenzuständen des Geschwindigkeitsoperators c neben Wellen positiver auch Wellen negativer Energie enthalten sind: In Aufgabe 3.1 wird gezeigt, daß ⎞ ⎛ ϕ ⎟ ⎜ (3.1) ψ ⎝ p ⎠ ei px/h ϕ p für beliebige Zweierspinoren ϕ die gemeinsamen Eigenzustände der Operatoren c p und p zu den Eigenwerten cp und p sind. Andererseits sind nach (2.69), (2.73), (2.75) und (2.78) die gemeinsamen Eigenzustände von p und H für freie Teilchen ⎛ ⎞ ϕ ⎜ ⎟ i ( px Et )/h ψ ( ) ⎝ c p (3.2) ⎠e ϕ m 0 c2 Ep mit beliebigem ϕ, wobei das obere Vorzeichen für Zustände positiver und das untere Vorzeichen für Zustände negativer Energie gilt. Zur Überlagerung der Zustände (3.1) aus ebenen Wellen (3.2) werden immer Lösungen sowohl positiver als auch negativer Energie benötigt (Aufgabe 3.2). Die in Richtung des Impulses p liegende Komponente c p/ p des Geschwindigkeitsoperators besitzt daher keine Eigenzustände rein positiver Energie, vielmehr sind an ihr auch negative Energien beteiligt. Für i k folgt aus (2.42c) αi , αk 2αi αk 0, d. h. verschiedene Komponenten der Geschwindigkeit lassen sich nicht gleichzeitig scharf messen. Auch dieses Ergebnis ist sehr merkwürdig, denn der Impulsoperator p (h /i) verhält sich ganz anders: Seine Komponenten vertauschen miteinander, und er besitzt beliebige Vektoren p als Eigenwerte. Dieses unterschiedliche Verhalten hat zur Folge, daß zwischen den Eigenwerten des Impuls- und Geschwindigkeitsoperators im allgemeinen nicht der klassische
3.1 Zitterbewegung des Elektrons
87
Zusammenhang p m Ú m 0 Ú /(1 v 2 /c2 )1/2 gelten kann, was auch daraus hervorgeht, daß für A0 nach (2.66) mit (2.65) mc « p gilt. Die mittlere Geschwindigkeit c« kann dagegen dem Betrage nach jeden beliebigen Wert zwischen den scharfen Meßwerten c annehmen. Für das mittlere Schwankungsquadrat der Geschwindigkeitskomponenten finden wir (2.42c) v i 2 c2 αi 2 cαi 2 c2 v i 2 , es ist um so größer, je kleiner die Geschwindigkeit vi ist. Dies bedeutet, daß die Bewegung eines Elektrons bei kleiner mittlerer Geschwindigkeit mit großen Schwankungen um diese herum erfolgt. Alle diese merkwürdigen Ergebnisse finden ihre Erklärung darin, daß der mittleren Bewegung x (t) des Elektrons eine hochfrequente Oszillation überlagert ist. Einen deutlichen Hinweis auf diese liefern schon die großen Schwankungen um die mittlere Geschwindigkeit. Genaueres erfahren wir durch die Untersuchung der Bahndynamik im Heisenberg-Bild. Der Hamilton-Operator eines freien Teilchens ist nach (2.58) H f
m 0c2 β c« p .
(3.3)
Für die zeitliche Änderung des die Geschwindigkeit beschreibenden HeisenbergOperators «H T (t, 0) « T (t, 0) erhalten wir nach (Q6.114) (mit H H H H f gemäß (Q6.120)) d «H dt
i1h «H, H f i1h «H , H f i2h «H H f s.u. 2hi c pH
«H H f ,
(3.4)
wobei zuletzt (mit Summenkonvention)
(αH )i , H f
(αH)i , H H (3.3) m 0c2 (αH)i , βH (αH )i , (αH )k c( p H)k s.u. m 0c2αi , β αi , αk c( p H)k (2.42b) αi , αk c( pH)k (2.42c) 2δik c( pH)k 2c( p H)i
benutzt wurde. (Beim Schritt von der ersten zur zweiten Zeile ging die Invarianz komplexwertiger Kommutatoren gegenüber unitären Transformationen nach (Q6.88) ein.) Wegen d p H /dt p H , H H /(ih )T p , H f T /(ih )0 mit der Folge p H (t) p H (0) p (nach (Q6.110) für t0 0) und d H f /dt 0 kann (3.4) sofort integriert werden. Ableitungen von Operatoren sind wie die von gewöhnlichen Funktionen erklärt. Daher dürfen wir genau wie bei diesen integrieren, indem wir zur Lösung «H exp( 2i H f t/h ) der homogenen Gleichung die spezielle Lösung «H c p / H f der inhomogenen Gleichung addieren und die Integrationskonstante der Anfangsbedingung anpassen, c p 2i H f t /h «H (t) «H (0) cp . (3.5) Hf e Hf (Der Operator 1/ H f H f d xH dt
1
ist der zu H f inverse Operator.) Setzen wir dies in
i1h xH, H f i1h c αk pk T xi T ei cT αi T ei c «H
88
3 Anwendungen der Dirac-Theorie
ein (xH ist der Ortsoperator im Heisenberg-Bild) und integrieren über t, so erhalten wir xH (t)
xH (0)
c2 p H f
t
c p e 2i Hf t /h ih c «H (0) . H f 2 H f
(3.6)
Hieraus folgt aufgrund der Invarianz von Mittelwerten gegenüber der unitären Transformation, die vom Heisenberg-Bild zurück zum Schrödinger-Bild führt, und mit «H (0)« (nach (Q6.110) für t0 0) 2 ' ' c p c p e2i Hf t /h ' ' t ih c « . (3.7) x t x 0 H f H f 2 H f Dieses Ergebnis vergleichen wir mit dem klassischen Ergebnis x(t) x0
c2 p t, H
das sich durch Integration der aus (2.6) und (2.7) für Φ 0 und A 0 folgenden Gleichung x p/m c2 p/H ergibt. Die mittlere Bewegung (3.7) enthält zwei Terme, die der klassischen Bewegung entsprechen, unterscheidet sich von dieser allerdings in markanter Weise durch den letzten Term. Dieser beschreibt eine als Zitterbewegung bezeichnete Oszillation mit einer (sehr kleinen) Amplitude der Größenordnung h c/2E h /(2m 0 c) und einer (sehr großen) Frequenz der Größenordnung 2E/h (2m 0 c2 )/h . Das Elektron verhält sich demnach im zeitlichen Mittel ähnlich wie ein klassisches Elektron, führt jedoch um die quasi klassische mittlere Bewegung herum hochfrequente Oszillationen aus. Die Zitterbewegung tritt allerdings nur bei Wellenpaketen auf, die eine Mischung aus Wellen positiver und negativer Energie enthalten. Für Zustände ausschließlich positiver oder negativer Energie verschwindet sie (siehe dazu auch (2.93) und Abschn. 3.2.1), in diesen gilt c p e2i Hf t /h 0. Z « H f 2 H f Beweis: Nach (2.104) und (2.106) gilt z. B. für beliebige Zustände positiver Energie ψ () Π ψ () ΛΠ ψ () und damit (unter Benutzung von Π (Π ) und ΛΛ ) Z
s.u.
' ' ' ' 2i Hf t /h ' ' ' ( ) c p e2i Hf t /h '' () () 'Π Λ « c p e 'ψ ψ () '' « ψ Π ψ ' ' ' Hf 2 Hf Hf 2 Hf ' ' ' cp e2i Hf t /h '' () ( ) ' Π ψ 'Π Λ « . 'ψ Hf 2 Hf
Der Operator Π 1 Hf /( Hf2 )1/2 /2 konnte nach links durchgeschoben werden, weil der Term, an dem er vorbeigeschoben wurde, wie Π nur von Hf abhängt und daher mit ihm
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
89
vertauscht. Mit H f , «
(3.3)
m 0 c2 β, « c « p, «
(2.42b,c)
c p 2m 0 c2 β « 2c« p « 2c p 2 H f « H f
ergibt sich Π , «
(2.105a) 1
« Λ,
2
(2.103)
H f , « c p (2.103) Λ « . H f 2 m 02 c4 c2 p 2
Damit erhalten wir 3 Π
Λ
«
c p H f
4 Π
(2.109)
Π
Π , « Π
Π « Π
Π
2 Π
« Π
« Π
Π
« Π 2
0
mit der unmittelbaren Folge Z 0. Zum Beweis für Zustände negativer Energie muß nur Π durch Π ersetzt werden.
Anteile negativer Energie sind unvermeidbar, sobald sich das Elektron in einem Kraftfeld bewegt, so daß die Zitterbewegung bei allen Teilchenwechselwirkungen eine Rolle spielt. Ein Beispiel hierfür werden wir in Abschn. 3.3 bei der Dynamik des Elektrons im Wasserstoffatom kennenlernen. Wir kommen auf das Problem der Meßwerte für die Geschwindigkeit zurück. In der Praxis beobachtet man bei Elektronen alle möglichen Geschwindigkeiten v
3.2
Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
Bei dem in Abschn. 2.8 untersuchten Übergang zum nicht-relativistischen Grenzfall schrumpfte der Dirac-Spinor ψ für Lösungen positiver Energie nach einer geeigneten Phasentransformation zu einem Spinor mit nur zwei oberen Komponenten zusammen, die der Pauli-Gleichung genügen. Für Lösungen negativer Energie schrumpft er, ebenfalls nach einer geeigneten Phasentransformation, zu einem Spinor mit nur zwei unteren Komponenten zusammen, die einer modifizierten Pauli-Gleichung genügen. Bei Vernachlässigung von Termen der Größenordnung v 2 /c2 , also ohne die Berücksichtigung relativistischer Effekte, folgen demnach aus der Dirac-Gleichung für die in dem
90
3 Anwendungen der Dirac-Theorie
Zweierspinor ϕ enthaltenen oberen zwei Komponenten und die in dem Zweierspinor χ enthaltenen unteren zwei Komponenten von ψ nach einer geeigneten Transformation entkoppelte Gleichungen, die unabhängig voneinander gelöst werden können. Durch eine unitäre Transformation, die auf L.L. Foldy und S.A. Wouthuysen zurückgeht und als Foldy-Wouthuysen-Transformation bezeichnet wird, kann die Dirac-Gleichung im kräftefreien Fall auch unter Einschluß sämtlicher relativistischer Effekte in zwei entkoppelte Gleichungen für zwei Zweierspinoren zerlegt werden (nächster Abschnitt). Aus diesen ergeben sich interessante Einsichten in die Ursachen der Zitterbewegung des Elektrons. Bei dem im anschließenden Abschnitt unternommenen Versuch, eine derartige Zerlegung auch für den Fall eines Elektrons in elektromagnetischen Feldern vorzunehmen, werden wir auf eine Reihenentwicklung nach einem Parameter v 2 /c2 stoßen, die einer unendlichen Folge unitärer Transformationen ψ ψ ¼ ψ ¼¼ . . . des Spinors ψ entspricht. Bei jedem Schritt kommt man dabei dem Ziel der gewünschten Zerlegung in dem Sinne näher, daß man entkoppelte Näherungsgleichungen für die oberen und unteren Komponenten des transformierten Spinors erhält, bei denen die vernachlässigten Terme von immer höherer Ordnung in v 2 /c2 werden. Wir werden diese Prozedur bis zu Gleichungen, die einschließlich der Terme (v 2 /c2 ) korrekt sind, verfolgen. Leider muß jede Ordnung für sich behandelt werden, eine alle Ordnungen umfassende geschlossene Lösung des allgemeinen relativistischen Falls ist nicht bekannt. Bei freien Teilchen besitzt die eine der bei der Zerlegung erhaltenen Gleichungen nur Lösungen positiver Energie, die andere nur Lösungen negativer Energie. Bei den bis zu relativistischen Termen der Ordnung v 2 /c2 korrekten zwei Gleichungen für die Dynamik eines Elektrons in elektromagnetischen Feldern führt die Separation bezüglich der oberen und unteren Komponenten nicht mehr gleichzeitig zu einer Separation bezüglich positiver und negativer Energien: Es wird sich zeigen, daß die für die zwei oberen Komponenten erhaltene Gleichung Terme enthält, die auf die Zitterbewegung des Elektrons zurückzuführen sind, und wir wissen aus dem letzten Abschnitt, daß für diese Lösungen negativer und positiver Energie zusammenwirken müssen.
3.2.1 Freie Teilchen Für ebene Wellen mit dem Impuls p0 gilt nach (2.72) die Gleichung i h ∂t ψ
Eψ m 0 c2βψ .
Der Ansatz (2.73) führt zu den entkoppelten Gleichungen
m 0 c2ϕ , Eχ m 0c2χ . (3.8) Bei nicht-verschwindendem Impuls, p0, ergeben sich die nicht entkoppelten Gleichungen (2.74). Den Grund für die Kopplung liefert die Matrix « τ , die obere und Eϕ
untere Komponenten vertauscht. Die Einheitsmatrix sowie die Matrizen β und Σi sind nur auf der Diagonalen mit 22-Matrizen besetzt, d. h. sie haben die Struktur g1 0 G . (3.9) 0 g2
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
91
Bei der Einwirkung auf Dirac-Spinoren lassen sie die oberen Komponenten oben und die unteren unten, ϕ g1 0 ϕ g1 ϕ G , χ χ 0 g2 g2 χ weshalb wir sie als gerade Matrizen bezeichnen.1 Die Matrizen αi und τ sind nur außerhalb der Diagonalen mit 2 2-Matrizen besetzt, sie haben die Struktur 0 u1 U , (3.10) u2 0 und bei ihrer Einwirkung auf Dirac-Spinoren werden obere und untere Komponenten vertauscht, ϕ ϕ 0 u1 u1 χ . U u2 ϕ u2 0 χ χ Wegen dieser Eigenschaft bezeichnen wir sie als ungerade Matrizen. Wir suchen jetzt eine unitäre Transformation2 ¼ ϕ ϕ ψ¼ T Tψ , H¼ T HT , χ¼ χ welche die Dirac-Gleichung für freie Teilchen, 2 i h∂ t ψ H ψ m 0 c β c« p ψ ,
(3.11)
(3.12)
so transformiert, daß der neue Hamilton-Operator H nur noch gerade Matrizen enthält. Wegen der Unitarität der Transformation, T T 1, können wir T
eS
1 Sν ν
(3.13)
ν 0
ansetzen, außerdem nehmen wir an, daß der Matrixoperator S zeitunabhängig ist. e S wird dabei durch die Potenzreihe definiert, in der nur wohldefinierte Produkte von Matrizen auftreten. Es gilt T
1 Sν ν ν 0
1 ν S ν ν 0
eS ,
1 In manchen Büchern findet sich für sie die Bezeichnung „gerade Operatoren“. Der Begriff gerader und ungerader Operatoren wurde jedoch schon in Abschn. 2.7 eingeführt und hat eine andere Bedeutung. Da Matrizen auch als Operatoren aufgefaßt werden können, muß sorgfältig zwischen ihrer hier betrachteten Wirkung auf die Anordnung der Komponenten von ψ und ihrer in Abschn. 2.7 betrachteten „Operatorwirkung“ auf die Zerlegung von ψ in Anteile positiver und negativer Energie unterschieden werden. So ist z. B. β als Matrix gerade, als Operator enthält β jedoch gerade und ungerade Anteile, es gilt β β β mit β 0. 2 Auch in der relativistischen Quantenmechanik ist der Übergang zwischen verschiedenen Darstellungen mit Hilfe unitärer Transformationen möglich, in den Ausführungen von Abschn. Q6.2.5 über unitäre Transformationen gab es keinerlei Einschränkung auf nicht-relativistische Verhältnisse. Der HilbertRaum relativistischer Elektronenzustände wird durch Vektoren ψ aufgespannt, deren Ortsdarstellung zu Dirac-Spinoren führt.
92
3 Anwendungen der Dirac-Theorie
und die Unitaritätsforderung T T
eS eS
eSS
S
S ,
1 führt zu der Bedingung (3.14)
S muß antiunitär sein. Aus (3.12) ergibt sich durch Linksmultiplikation mit e S und mit der aus (3.11a) folgenden Beziehung ψ T ψ e S ψ i h ∂t ψ
H ψ .
e S H e S ψ
Um einen Matrixoperator S zu bestimmen, der H die gewünschte Struktur verleiht, empfiehlt es sich, in e S m 0 c2 β c« p e S
H
(2.42a)
e S β m 0 c2 cβ « p e S
den Term e S mit dem Term e S zusammenzubringen. e S vertauscht mit dem Klammerausdruck, wenn S die Form 1 S (3.15) β « p θ ( p ) 2 besitzt, wobei θ eine skalare Funktion des Operators p , aber kein Matrixoperator ist. Der Faktor 1/2 wurde aus Gründen späterer Bequemlichkeit eingeführt. Die Vertauschbarkeit mit m 0 c2 wäre für jedes S gegeben, und die Vertauschbarkeit mit cβ « p besteht deshalb, weil jeder Operator mit sich und jeder Funktion von sich selbst vertauscht. Mit θ ( p ) θ ( p ) θ ( p ) sowie « « und β β nach (2.43) gilt S
1 (« p ) β θ ( p ) 2
1 (« p ) β θ ( p ) 2
(2.42b)
12 β (« p ) θ ( p ) ,
d. h. S erfüllt auch die Bedingung (3.14). Damit haben wir H
e S βe S m 0 c2 cβ « p .
Unter Benutzung der Beziehungen β (β « p )
(β « p ) β ,
β (β « p )2 (β « p )2 β , ... , β (β « p )ν (1)ν (β « p )ν β
und deren Folge βe S
(3.15)
β
(1)ν β « p ν
ν 0
ν
1 β « p ν
ν 0
ν
2
2 θνβ
(1)2ν β « p ν
θν
ν 0
ν
2
eS β
ergibt sich daraus H
e2 S β m 0 c2 cβ « p
e2 S m 0 c2 β c « p .
θνβ
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
93
Mit der Definition p p 2 (Folge: p 2 p 2 ) und den Beziehungen (2.42b)
2 (β « p)
β « p β « p
3 (β « p)
2 β « p(β « p)
2 β 2 (« p)
β « p p 2 ,
(2.42a)
2 (« p)
4 (β « p)
p4 ,
(2.168)
p2 ,
5 (β « p)
β « p p 4
usw. gilt Ç
e2 S
Ç eβ « ¡ pθ
( p θ )2 2
1
cos( p θ )
Ersetzt man θ durch
( p θ )4 4
...
β « p p θ p
( p θ )3 3
( p θ )5 5
β « p sin( p θ ) . p
...
(3.16)
θ , so folgt daraus
Ç
e 2 S
cos( p θ )
β « p sin( p θ ) . p
(3.17)
Einsetzen von (3.16) in das zuletzt für H ¼ erhaltene Ergebnis liefert β « p sin( p θ ) m 0 c2 β c « p p m c2 β « pβ 2 c(« p) 0 2 sin( p θ ) sin( p θ )c« p cos( p θ ) β m 0 c cos( p θ ) p p m0c (2.168) β m 0 c2 cos( p θ ) c p sin( p θ ) c« p cos( p θ ) sin( p θ ) . p
H ¼
cos( p θ )
Der erste Term in H ¼ enthält die gerade Matrix β und liefert daher einen Beitrag, der wie bei einem ruhenden Teilchen (siehe (3.8)) zu einer Separation oberer und unterer ψ-Komponenten führen würde. Der zweite Term enthält die ungerade Matrix « und würde zu einer Mischung oberer und unterer ψ-Komponenten führen. Durch die mit der Identität sin2 ( p θ ) cos2 ( p θ )1 verträgliche Festlegung der bisher noch frei verfügbaren Funktion θ ( p) gemäß sin( p θ )
p m 02 c2
p 2
cos( p θ )
,
m0c m 02 c2
p2
(3.18)
bringen wir ihn zum Verschwinden und erhalten auf diese Weise den transformierten Hamilton-Operator H ¼ cβ m 02 c2 p 2 . Da der Operator p mit sich selbst vertauscht, Ç Ç p gilt S, β « p θ ( p), p /20 und daraus folgend e S p p e S sowie p ¼
Ç
Ç
e S p e S
womit wir schließlich H ¼
cβ
Ç
Ç
p eS S
p,
m 02 c2 p ¼ 2
(3.19)
(3.20)
94
3 Anwendungen der Dirac-Theorie
erhalten. Zerlegen wir den Spinor ψ ¼ gemäß (2.73), so führt i h∂t ψ ¼ H ¼ψ ¼ zu den entkoppelten Gleichungen i h∂t ϕ ¼ c
m 02 c2 p ¼ 2 ϕ ¼ ,
i h∂t χ ¼ c
m 02 c2 p ¼ 2 χ ¼ .
Der Ansatz ϕ ¼ , χ ¼ ei ( p x Et )/h) zeigt, daß ϕ zu Lösungen positiver und χ zu Lösungen negativer Energie führt. Der Operator (3.20) entspricht der klassischen Beziehung (2.5) für Φ 0, A0. Die zu ihm gehörige Bewegungsgleichung i h∂t ψ H ψ führt bei positiven Energien gerade zu der Gleichung (2.19) mit Φ 0 und A0, die wir früher wegen ihrer NichtLokalität abgelehnt hatten. Jetzt werden wir durch die Suche nach Lösungen, die entweder zu nur positiver oder nur negativer Energie gehören, zu dieser zurückgeführt. Wir werden weiter unten sehen, daß die früher festgestellte Nicht-Lokalität von H bei geeigneter physikalischer Interpretation akzeptabel ist. Um das zu erkennen, untersuchen wir zunächst den zum Hamilton-Operator H gehörigen Operator Ú der Geschwindigkeit. Für diesen ergibt sich nach (Q6.117) ¼
Ú
d x (Q6.116) d x H T T dt dt
¼
1 (Q6.155) ∂ H (3.20) cβ p x , H , (3.21) ih ∂ p m 02 c2 p 2
wobei T der Operator für die unitäre Transformation vom Schrödinger- zum Heisen bergbild ist und nichts mit T e S zu tun hat. Anders als beim Geschwindigkeitsoperator Ú c« aus Abschn. 2.3 sind die Komponenten des Operators Ú wie die von p miteinander vertauschbar. Für die oberen Komponenten des Spinors ψ ergibt sich bei ebenen Wellen positiver Energie, ϕ ei ( p x Et )/h und χ 0 , ¼
Ú
ϕ 0
cβ p m 02 c2 p 2
ϕ 0
⎛
⎝
c p m 02 c2 p 2 0
ϕ
⎞
⎠ cp m 02 c2 p 2
ϕ 0
,
wobei p ϕ p ϕ und f ( p )ϕ f ( p )ϕ benutzt wurde. Die Eigenwerte Ú von Ú zu Zuständen positiver Energie können demnach mit p beliebige Werte annehmen, die im 2 2 Bereich 0 Ú c liegen, und aus Ú c p / m 0 c p 2 folgt durch Auflösung nach p der klassische Zusammenhang m 0 Ú p . 1v 2 /c2 Aus d p /dt p , H /(i h)0 folgt weiterhin d Ú /dt 0, d. h. der Operator Ú führt auch nicht zu einer Zitterbewegung des Elektrons. Der Geschwindigkeitsoperator c « wurde aus H in der gleichen Weise wie Ú aus H abgeleitet. Es mag daher verwundern, daß c« und Ú so unterschiedliche physikalische Eigenschaften aufweisen. Die Erklärung dafür ist, daß Ú nicht durch eine unitäre Transformation mit e S aus c« hervorgeht. Um das zu erkennen, müssen wir erst aus (3.16) und (3.17) mit (3.18) die Transformationsmatrizen e S und e S berechnen. Wie
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
95
man leicht durch Quadrieren verifiziert, gilt e S Ç
m 0 c h( p ¼ ) β « p ¼ 2h( p ¼ )(m 0 c h( p ¼ ))
mit
h( p ¼ )
m 02 c2 p ¼ 2 ,
(3.22)
wobei p gemäß (3.19) durch p ¼ ersetzt wurde. Hiermit ergibt sich m 0 c h( p ¼ ) β « p ¼ c« m 0 c h( p ¼ )β « p ¼ Ç SÇ S ¼ c« e c « e 2h( p ¼ ) m 0 c h( p ¼ )
Ú
(3.21)
¼
c«
c« p ¼ p ¼ . h( p ) m 0 c h( p ¼ ) ¼
(3.23)
(Der Schritt von der ersten zur zweiten Zeile wird in Aufgabe 3.3 vollzogen.) Anmerkung: Es gilt zwar c « ∂ H /∂ p und Ú ¼ ∂ H ¼/∂ p ¼ . Aus der nach Abschn. Q6.2.5 gültigen Invarianz von Operatorbeziehungen folgt jedoch nicht Ú ¼ (c« )¼ , denn dazu müßte ∂ H ¼/∂ p ¼ (∂ H /∂ p )¼ gelten, was, wie wir gesehen haben, nicht der Fall ist. c « ¼ unterscheidet sich von Ú ¼ durch zwei Zusatzterme, welche die ungerade Matrix « enthalten und daher Zustände positiver und negativer Energie mischen. Anders als der Operator Ú ¼ besitzt der Operator c« ¼ daher keine Eigenwerte, die zu Zuständen nur positiver oder nur negativer Energie gehören, in den Eigenzuständen von c « ¼ sind immer Zustände positiver und negativer Energie gemischt. Diese Mischung muß auch die Ursache für die Zitterbewegung des Elektrons sein, da der Operator Ú ¼ zu keiner Zitterbewegung führt. Um zu einer physikalischen Interpretation der zwei physikalisch so unterschiedlichen Geschwindigkeiten c« ¼ und Ú ¼ zu gelangen, rufen wir uns einige Erkenntnisse über die klassische Bewegung des Elektrons in Erinnerung. Nach dem Exkurs „Skizze der Diracschen Ableitung“ im Abschn. „Lorentz-Dirac-Gleichung“ der Speziellen Relativitätstheorie ist die Masse des Elektrons nicht in einem Punkt konzentriert, vielmehr ist ein wesentlicher Teil von ihr in dem von der Ladung des Elektrons erzeugten elektromagnetischen Feld enthalten und wie dieses im Raum verteilt; die Ladung wird dagegen als punktförmig lokalisiert angenommen. Wenn das Elektron beschleunigt wird, verhält sich die Punktladung daher anders als die Masse, sie kann den einwirkenden Kräften instantan folgen (siehe unten), während die nicht am Ort der Ladung sitzenden Massenanteile, durch die Laufzeit des Lichts bedingt, nur verzögert folgen. Dies hat die Konsequenz, daß der Massenschwerpunkt des Elektrons und der Ort seiner Punktladung im allgemeinen nicht zusammenfallen. Der Zusammenhang (3.21) verknüpft Ú ¼ mit dem Impuls und infolgedessen mit der Massenbewegung des Elektrons; der c« ¼ entsprechende Operator c« ist in der DiracGleichung bei Anwesenheit elektromagnetischer Felder dagegen direkt an das Vektorpotential A gekoppelt. Dies legt die Annahme nahe, daß Ú ¼ die Bewegung des Massenschwerpunkts und c « bzw. c« ¼ die Bewegung der Ladung beschreibt. Für diese Interpretation sprechen auch noch folgende Umstände: 1. Der Operator Ú ¼ hat nach (3.20) und (3.21) eine ähnliche Struktur wie der Operator H ¼, von der wir früher (Abschn. 2.2) festgestellt hatten, daß sie nicht-lokaler Natur ist. Das paßt zu einer nicht-lokalisierten Mas-
96
3 Anwendungen der Dirac-Theorie
senverteilung, obwohl dazu folgendes anzumerken ist: In dem zitierten Abschnitt der Speziellen Relativitätstheorie wurde für das Elektron eine nackte Ruhemasse m 0 angesetzt und der elektromagnetische Anteil der Masse durch das von der Ladung erzeugte elektromagnetische Feld beschrieben. Da diese Zerlegung nicht in die Dirac-Gleichung eingegangen ist, kann hier eine nicht-lokale Beschreibung der Massenbewegung nicht zwingend gefolgert werden; daher wurde auch nur gesagt, daß sie „gut paßt“. (Eine entsprechende Zerlegung wird in der Quantenelektrodynamik vorgenommen, in der das Feld der Ladung mit berücksichtigt und zusammen mit dem Dirac-Feld ψ quantisiert wird.) 2. Die Zitterbewegung paßt – im gleichen Sinne wie oben – zu der Bewegung der Punktladung, da diese den äußeren Feldern ohne die Verzögerung durch Laufzeiteffekte und nur von der Trägheit der reduzierten Masse m 0 behindert leicht folgen kann.
3.2.2 Teilchen mit elektromagnetischer Wechselwirkung Wir wenden uns jetzt der Foldy-Wouthuysen-Transformation der Dirac-Gleichung mit elektromagnetischen Feldern (Gleichung (2.55)) zu, die wir in der Form ih ∂t ψ
ψ H
H
mit
m 0 c2 β qΦ c«
,
h q A i
(3.24)
schreiben. Wie im letzten Abschnitt können wir ψ¼
Ç
eS ψ ,
ψ
Ç
e S ψ ¼
ansetzen, wobei S wieder die Bedingung (3.14) erfüllen muß und jetzt als zeitabhängig angenommen wird. Wenn hiermit in Gleichung (3.24a) ψ durch ψ ¼ ausgedrückt wird, Ç lautet diese nach Linksmultiplikation mit eS ih ∂t ψ ¼
¼ψ ¼ H
,
H ¼
Ç Ç Ç Ç Ç Ç e S H e S e S ih ∂t e S e S H ih ∂t e S .
(3.25)
Die Notation ∂t soll dabei bedeuten, daß die Zeitableitung nur auf e S und nicht auf ψ ¼ wirkt. Ç Der Ansatz (3.15) führt jetzt nicht mehr dazu, daß e S wie im kräftefreien Fall nach Ç links bis auf ein dazwischen stehendes β zu e S durchgezogen werden kann, denn p Ç Ç vertauscht nicht mit Φ und A. Werden e S und e S durch Vertauschen von H ih ∂t und Ç e S zusammengebracht, so treten Kommutatoren auf, die der für beliebige Operatoren S und O gültigen Baker-Hausdorff-Identität Ç
1 1 1 .. O S, S, O S, S, S, O .. S, S, .. S, 2
3
n
(3.26) entnommen werden können. (Mit den Kommutatoren sind Minus-Kommutatoren gemeint. Weil in diesem Abschnitt nur diese benutzt werden, wird auf ihre besondere Kennzeichnung verzichtet.) Ç
Ç
e S O e S
S, O O
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
97
Beweis: Der von dem Parameter λ abhängige Operator F(λ) eλ S O eλ S
(3.27)
besitzt um λ0 die Potenzreihenentwicklung
' λn ∂ n F '' . n ∂λn 'λ0
F(λ)
(3.28)
n 0
Aus (3.27) folgt ∂F ∂λ hieraus durch erneute Ableitung nach λ ∂2 F ∂λ2
eλ S S, O eλ S ,
eλ S S, S, O eλ S
usw. Wertet man F(λ) und die erhaltenen Ableitungen bei λ0 aus und setzt sie in (3.28) ein, so ergibt sich (3.26).
S kann nicht so bestimmt werden, daß die im Operator H ih ∂t enthaltenen Anteile mit ungeraden Matrizen verschwinden. Wir versuchen daher, diese durch geeignete Wahl von S möglichst klein zu machen. Da sie im nicht-relativistischen Grenzfall auch bei Anwesenheit elektromagnetischer Felder zum Verschwinden gebracht werden können, empfiehlt sich eine Entwicklung nach v 2 /c2 m 0 v 2 /(m 0 c2 ). Die Größe m 0 v 2 tritt in einer quantenmechanischen Gleichung natürlich nicht auf. Wir erreichen jedoch dasselbe, wenn wir statt der Entwicklung nach der dimensionslosen Größe m 0 v 2 /(m 0 c2 )< 1 eine Entwicklung nach der dimensionsbehafteten Größe ε
m 1c2
(3.29)
0
vornehmen. (Sauberer wäre es, einen Parameter E<m 0 c2 einzuführen und nach E/m 0 c2 zu entwickeln. Da E aus den Endformeln herausfallen würde, läuft unsere Vorgehensweise auf dasselbe hinaus.) Hiermit haben wir nach (3.24b) H ih ∂t
βε G U mit G qΦ ih ∂t , U c « , (3.30) wobei G alle geraden und U alle ungeraden Matrizen des Operators H ih ∂t enthält. Den Operator S entwickeln wir ebenfalls nach ε, S ε S1 ε2 S2 ε3 S3 . . . , (3.31) womit sich ψ eε S ε S ψ . . . eε S (eε S ψ) ergibt, d. h. wir haben es mit einer Folge von Transformationen, ψ eε S ψ, ψ eε S ψ etc. zu tun. Mit (3.26) und
1
2
2
2
1
2
1
2
2
(3.30)–(3.31) ergibt sich aus (3.25b) bis zu Termen der Ordnung ε2 β β H G U ε S1 ε2 S2 ε3 S3 , G U ε ε β 1 2 ε S1 ε2 S2 , ε S1 ε2 S2 , ε G U 31 ε S1 , ε S1 , ε S1 , βε G U .
98
3 Anwendungen der Dirac-Theorie
Hieraus folgt
β ε
H ¼ mit
H 0 ε H 1 ε2 H 2 . . . ¼
¼
¼
(3.32)
H 0¼
S1 , β G U , H 1 S2 , β S1 , G U 12 S1, S1 , β ,
(3.33)
H 2¼
S3 , β S2 , G U 12 S2, S1 , β 12 S1 , S2 , β
(3.34)
¼
12 S1 , S1 , G U 16 S1 , S1 , S1 , β . Jetzt bestimmen wir die Operatoren Sn 1 so, daß in allen Entwicklungstermen H n der ungerade Anteil, den wir mit U n bezeichnen, verschwindet, d. h. wir verlangen
Sn
1, β
U n
0.
(3.35)
Bezeichnen wir den – an dieser Stelle noch unbestimmten – Kommutator Sn so genügt Sn 1 den zwei Gleichungen mit X,
β Sn 1 X , (3.36) und hieraus durch Subtraktion der ersten von der zweiten ergibt sich 2β Sn 1 U n X, Sn
β Sn
1β
U n ,
1, β
1
Sn
1β
folgt durch Multiplikation mit β unter Benutzung von β 2 1 Sn
β(U n
1
X )/2 .
Da X nicht weiter festgelegt ist, setzen wir X 0 und erhalten Sn
1
β U n , 2
(3.37)
während sich aus aus (3.36b) die Forderung Sn
1β
β Sn
1
0
(3.38)
ergibt. Mit β U n
(3.10)
1 0
0 1 0 u n2
0 u n1 0 u n1 u n2 0 u n2 0 u n1 0 u n1 1 0 0 u n2 0 0 1
(3.39)
U n β ,
β β und der aus H H bzw. H n H n folgenden Beziehung U n U n , in die eingeht, daß mit G n (bzw. Un ) auch G n (bzw. Un ) gerade (bzw. ungerade) ist, erhalten wir aus (3.37) U n β U n β β U n Sn 1 Sn 1 2 2 2 ¼
¼
¼
¼
¼
¼
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
und Sn
1β
β Sn
β U2n β ¼
1
β 2 U n¼ 2
(3.39)
β2
U2n ¼
99
U n¼ 0. 2
Damit werden von der Lösung (3.37) die Forderungen (3.14) und (3.38) erfüllt. Nach (3.33a) ist U 0¼ U , und aus (3.35) bzw. (3.37) folgt damit
S1 , β U ,
S1
β2U .
(3.40)
Da der ungerade Anteil von H 0¼ mit S1 zum Verschwinden gebracht wurde, gilt nach (3.33a) H 0¼ G . (3.41) Für H 1¼ ergibt sich aus (3.33b) mit (3.40) H 1¼
S2 , β S1 , G
U
1 S1 , U S2, β 2
1 G β U, 2
1 β U , U . 4
U /4 ist gerade, β U, G /2 ungerade, und daher gilt U 1β U, G /2. Nach (3.35) β U, bzw. (3.37) wird S2 so bestimmt, daß S2 , β β U,2 G (3.42) ¼
bzw. S2
G β 2U G β Gβ U s.u. U , G β U2 1 β β U, 4 4 4 ¼
gilt – dabei wurde β G
benutzt –, und für H 1 ergibt sich damit Gβ 2 1 (3.39) β U H 1 (β U 2 U β U ) . 4 2
(3.9)
(3.43)
¼
¼
(3.44)
Durch Einsetzen von (3.40), (3.42) und (3.43) ergibt sich aus (3.34) H 2¼
1 G G , U 1 U, G , U 1 β U , β U, U , G , G 14 U, 4 8 8 1 β U , G 1 β U, β U , U 1 β U, β U , U β U, 8 8 24 β U , U . G , U 1 β U, S3 , β 14 U , G , G 18 U, 12
S3 , β
Der zweite und vierte Term von H 2¼ sind ungerade und werden mit dem ersten Term zum Verschwinden gebracht, so daß wir mit (3.37) S3
G , G β8 U,
1 β U, β U , U 3
100
3 Anwendungen der Dirac-Theorie
und H 2¼
1 U , G , U 8
(3.45)
erhalten. Nach (3.32) gilt mit (3.29), (3.41), (3.44) und (3.45) bis zu Termen der Ordnung ε 2 m 0 c2 β G
H ¼
1 1 β U 2 U , G , U . 2m 0 c2 8m 02 c4
Mit
U , G
(3.24c) (3.30)
c « ( p q A)qΦ (qΦ ih ∂ t ) c « ( p q A)
cq « p Φ cq 2 « AΦ cqΦ « p cq 2 Φ « A i h cq « (∂t A) i h cq « ( Φ)(∂t A) i h cq « E
(der Term mit ∂ t verschwindet, wenn rechts von ihm keine zeitabhängige Funktion steht, und es wurde E ( Φ)(∂t A) nach Gleichung (E7.3) benutzt) und mit
« E, U /c
(3.30) (2.166b)
« E «
E (2.168) E Ei τ E E i h div E i 2 E p 2q E A i h rot E
ergibt sich
G , U U,
i h cq E, U h c2q h div E 2 (E p q E A) i h 2 c2qΣ rot E .
Weiterhin gilt U 2
c2
(2.168)
c2
2 i τ ( )
c2
2 i ( )
,
mit rot A B gilt
und damit
p p q p A q A p U 2
q( p A)
i q h rot A
i q h B
c2 ( p q A)2 q h B .
Mit diesen Ergebnissen und (3.30b) ergibt sich schließlich H ¼
1 q h β m 0 c2 ( p q A)2 B qΦ (3.46) 2m 0 2m 0 4mq h2 c2 h2 div E i2h rot E (E p ) q (E A) . 0
3.3 Zur Feinstruktur des Wasserstoffatoms
101
Hiermit und mit der Zerlegung (2.73) sowie ϕ ¼ zu der Gleichung
∂ϕ∂t
ih
ϕ bzw. χ ¼
χ führt i h ∂t ψ ¼ H ¼ ψ ¼
2m1 ( p q A) 2mq h B qΦ (3.47) 4mq h c h2 div E i2h rot E (E p ) q (E A) ϕ
m 0 c2
2
0
0
2 2 0
für die zwei oberen Komponenten und die von dieser entkoppelte Gleichung
m c 2m1 ( p q A) 2mq h B qΦ (3.48) 4mq h c h2 div E i2h rot E (E p ) q (E A) χ ∂χ ∂t
ih
0
2
2
0
0
2 2 0
für die zwei unteren Komponenten von ψ. Gleichung (3.47) stimmt bis auf die in der zweiten Zeile stehenden relativistischen Korrekturen mit der Pauli-Gleichung (2.136) überein, in der allerdings der Beitrag der Ruheenergie wegtransformiert ist.
3.3
Zur Feinstruktur des Wasserstoffatoms
Aus Gleichung (3.47) ergibt sich im Fall zeitunabhängiger Felder mit dem Ansatz ϕ Ψ (x)e Et /hÆ eine Eigenwertgleichung für die Energie. Diese kann auf das Wasserstoffatom angewandt werden, wenn die Näherungsannahme gemacht wird, daß dessen Kern ruht. Wenn auch noch das magnetische Moment des Kerns vernachlässigt wird, erzeugt dieser nur ein zeitlich konstantes elektrisches Feld, d. h.
Φ , qΦ αrh c V (r ) , A 0 , B 0 . (3.49) Dann ist q E (qΦ) V (r )V ¼ (r ) x/r , und mit L x p sowie S(h /2) ergibt sich q h (E p )2S L V ¼ (r )/r . Mit (E2.56) bzw. (1/r ) 4πδ(x) folgt q div E (qΦ)α h c(1/r ) 4π α h cδ(x) . Wegen des Verschwindens von A und B ergibt sich damit und mit dem Ansatz ϕ Ψ (x) e Æ aus (3.47) die E
Et /h
Eigenwertgleichung
p2 V (r ) 2m 0
παh δ(x) Ψ (E m c )Ψ . 2m c
V ¼ (r ) S L 2m 02 c2r
3
2 0
0
2
(3.50)
Werden die relativistischen Korrekturterme vernachlässigt (dritter und vierter Term der linken Seite) und wird E m 0 c2 E ¼ gesetzt, so geht (3.50) in die aus der SchrödingerGleichung erhaltene Energieeigenwertgleichung für das Wasserstoffatom über. Deren diskrete Energieeigenwerte E ¼ sind zwar negativ, aber E E ¼ m 0 c2 wird positiv. Da sich die Eigenwerte E der vollen Gleichung (3.50) von diesen nur durch kleine
102
3 Anwendungen der Dirac-Theorie
relativistische Korrekturen unterscheiden, führt auch die volle Gleichung zu positiven Energien. Der dritte Term der Klammer linkerhand beschreibt die Wechselwirkung des Elektronenspins mit dem Magnetfeld, das durch die Bahndynamik des Elektrons im elektrischen Feld des Kerns induziert wird, und wird als Operator der Spin-BahnWechselwirkung bezeichnet. Der letzte Term der linken Seite wird als Darwin-Term bezeichnet. Er wirkt nur am Ort r 0 der Kernladung und ist auf die Zitterbewegung δx δx(t) des Elektrons zurückzuführen: Für deren Amplitude ergibt sich aus (3.7) die Größenordnung δr h c/H h /(m 0 c), so daß das Elektron in dem durch Überstreichen gekennzeichneten zeitlichen Mittel statt V (r ) das Potential V (x δx)
V (x) δx V 12 δxi δx j ∂i j V 2 2 V (x) (δr ) V V (x) h 6
6m 02 c
V 2
h δ(x) V (x) 2πα 2 3m c 3
0
sieht, wenn angenommen wird, daß δx(t) statistisch gleichmäßig über alle Raumrichtungen verteilt ist, was δx i 0, δx i δx j 0 für i j und δx 2 δy 2 δz 2 (δr )2/3 zur Folge hat. Das ist in guter, wenn auch nicht exakter Übereinstimmung mit dem Ergebnis (3.50). Da der Darwin-Term außer für r 0 verschwindet, kommt er nur zur Auswirkung, wenn das Elektron mit einiger Wahrscheinlichkeit nach r 0 gelangt, was nur für Zustände mit der Drehimpulsquantenzahl l 0 der Fall ist. Weil das Elektron den Kern dann aus klassischer Sicht „berührt“, wird der Darwin-Term auch als Kontaktwechselwirkungsterm bezeichnet. Da die Zitterbewegung des Elektrons nach Abschn. 3.1 auf die Wechselwirkung von freien Wellen negativer und positiver Energie zurückzuführen ist, muß eine Fourier-Zerlegung (2.100)–(2.101) derjenigen Eigenzustände, für welche die Zitterbewegung eine Rolle spielt, zu Wellenanteilen beider Energievorzeichen führen, wobei die Anteile negativer Energie allerdings wesentlich kleiner als die positiver Energie sind. (Erst die Einbeziehung sämtlicher ε-Potenzen der Entwicklung (3.32) würde zu Lösungen ϕ Ψ (x) e Et /h der Energie-Eigenwertgleichung führen, an denen insgesamt keine negativen Energien mehr beteiligt sind. Dies bedeutet, daß die in unserem Ergebnis der Ordnung ε2 erhaltenen Beiträge negativer Energie durch die Summe von aus höheren Ordnungen stammenenden Beiträgen negativer Energie kompensiert werden. Daraus darf allerdings nicht geschlossen werden, daß der Darwin-Term physikalisch unwirksam wäre, vielmehr treten in höheren Ordnungen weitere Korrekturterme auf, in denen das Zusammenspiel positiver und negativer Energien zu unerwarteten physikalischen Wirkungen führt.) Der auf die rechte Seite von Gleichung (3.50) gebrachte Term mit der Ruhemasse und der Operator p 2 /(2m 0 ) für die nicht-relativistische kinetische Energie repräsentieren Anteile der relativistischen Energie, die mit dem ersten und zweiten Term der Entwicklung p2 p2 p4 2 qΦ c m 02 c2 p 2 qΦ m 0 c 1 2 2 qΦ m 0 c2 ... 2m 0 m0 c 8m 03 c2 der klassischen relativistischen Energie (Gleichung (2.5) mit A 0) korrespondieren. Dieser kann entnommen werden, daß in der Ordnung ε 3 der ε-Entwicklung des letzten
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
103
Abschnitts für die kinetische Energie in H ¼ ein Korrekturterm p 4 8m 03 c3 zu erwarten ist. Die relativistischen Korrekturterme führen zu schwachen Verschiebungen der Energieniveaus, die mit den Methoden der Störungsrechnung bestimmt werden können, und dabei zum Teil auch zur Aufhebung der Entartung nicht-relativistischer Zustände. Die hierdurch erhaltene Struktur der Energieniveaus wird als Feinstruktur bezeichnet. Ihre Berechnung aus den Näherungsgleichungen dieses Abschnitts werden wir jedoch nicht weiter verfolgen, weil sich unter der Annahme eines ruhenden Kerns auch das volle relativistische Problem lösen läßt. (Das wird im folgenden Abschnitt geschehen.) Wir sehen uns noch die aus (3.48) mit dem Ansatz χ (x) e i Et /hÆ folgende Eigenwertgleichung
p 2 2 qΦ(r ) E m 0c 2m 0 ohne relativistische Korrekturterme für die zwei unteren Komponenten des Spinors ψ an. Diese kann auch in der Form 2 p qΦ(r ) E¼ mit E ¼ (E m 0 c2 ) 2m 0 geschrieben werden. Im Fall des Wasserstoffatoms gilt q e< 0, d. h. wir haben die Energieeigenwertgleichung für die Dynamik eines Teilchens in einem abstoßenden Zentralfeld. Für diese gibt es keine gebundenen Zustände mit einem diskreten Spektrum wie beim Wasserstoffatom, sondern nur ein kontinuierliches Spektrum mit Energien E ¼ 0 bzw. E m 0 c2 . Die Gleichung für die unteren Komponenten von ψ hat also nur Lösungen zu negativen Energien E m 0 c2 , und dasselbe gilt für die um die relativistischen Korrekturterme erweiterte Gleichung. Ein qualitatives Bild des Spektrums positiver und negativer Energieeigenwerte liefert Abb. 2.4 in Abschn. 2.13.
3.4
Relativistisches Wasserstoffatom bei ruhendem Kern
Wenn die Bewegung und das magnetische Moment des Atomkerns vernachlässigt werden, lassen sich die Eigenwerte und Eigenzustände des Hamilton-Operators für die relativistische Dynamik des Elektrons im Coulomb-Feld des Wasserstoffkerns exakt berechnen. Das Proton erzeugt dann nur das in (3.49a,b) angegebene zeitlich konstante elektrische Feld, d. h. A0, und aus (2.55) ergibt sich mit dem Ansatz ψ Ψ e iEt /hÆ sowie mit (2.166a), « τ , die Eigenwertgleichung H Ψ
EΨ
mit
H
V (r ) m 0c2β cτ p .
(3.51)
104
3 Anwendungen der Dirac-Theorie
3.4.1 Einführen von Polarkoordinaten und Variablenseparation Um im Hamilton-Operator H Polarkoordinaten einzuführen, benutzen wir die für die Radialkomponente von , Σr
er (2.155)
gültige Beziehung
Σr2
σr 0
0 σr
σr2 0
0 σr2
er ,
σr
mit
er er
(2.158)
x , r
er
er er
1
(3.52)
(3.53)
zur Umformung von p ,
p
Σr2 p
Σr (2.158) Σr x p x p i (x p ) r r
Mit den Definitionen
h i
p r
∂r
1 r
,
K
1
L h
Σr
h L ∂r i . i r
(3.54)
(der Operator p r wurde auch in der nicht-relativistischen Theorie des Wasserstoffatoms benutzt) ergibt sich daraus h p Σr pr K , (3.55) ir und der Hamilton-Operator (3.51b) erhält damit die Form H
V (r ) m 0 c2 β cτ Σr p r
ihr K .
Mit Hilfe der Beziehungen
Σr , K
Σr , pr
0,
0,
(3.56)
die am Ende dieses Teilabschnitts bewiesen werden (Schritte 1 und 2 des Beweises), kann noch der Operator Σr nach rechts durchgeschoben werden – der Term mit K erleidet dabei einen Vorzeichenwechsel –, so daß sich schließlich H
V (r ) m 0 c2 β cτ pr
ihr K Σr
(3.57)
ergibt. Nun zerlegen wir die Eigenwertgleichung (3.51) für den Viererspinor ψ in zwei Gleichungen für Zweierspinoren. Unter Benutzung der aus (3.54b) mit (2.155) folgenden Beziehungen K
k 0 0 k
mit
k
1
L h
(3.58)
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
und
p r
h K Σr ir
⎛
⎝
pr
h k σr ir 0
105
p r
⎞ 0 ⎠ h k σr ir
sowie mit (2.51b) und (2.164) ergibt sich ⎛ h ⎞ c pr k σr V m 0 c2 ir ⎠. H ⎝ h c pr k σr V m 0 c2 ir Für ψ wählen wir den Separationsansatz 1 f (r )φ(ϑ, ϕ) , ψ r i g(r )χ(ϑ, ϕ)
(3.59)
(3.60)
bei dem φ und χ nur von den Polarwinkeln ϑ und ϕ abhängige Zweierspinoren sind, f (r ) und g(r ) dagegen skalare Funktionen. (Die Faktoren 1/r und i sind zwar nicht notwendig, werden aber zu einer bequemen Vereinfachung führen.) Mit (3.59), (3.60) und f (r ) i p r r
h
(3.54a)
∂r
f (r ) r
f ¼ (r ) f (r ) h r r2
f (r ) r2
f (r ) h f ¼ (r ) r r2
sowie einer entsprechenden Beziehung für g(r ) zerfällt die Eigenwertgleichung (3.51) in die zwei Gleichungen g(r ) (V m 0 c2 E) f (r ) φ(ϑ, ϕ) h c g ¼ (r ) k σr χ(ϑ, ϕ) 0 , (3.61) r f (r ) k σr φ(ϑ, ϕ) 0 . (3.62) (V m 0 c2 E) g(r ) χ(ϑ, ϕ) h c f ¼ (r ) r Beim nicht-relativistischen Wasserstoffatom konnte der winkelabhängige Faktor der Eigenfunktionen von H durch die Kugelfunktionen ausgedrückt werden, die gemeinsame Eigenfunktionen der Operatoren L 2 und L z sind. Das ist jetzt nicht mehr möglich, weil L nicht mit H vertauscht und daher nach (Q6.117) im Sinne der durch (Q6.116) definierten totalen Zeitableitung auch nicht zeitlich konstant ist, vielmehr gilt nach Schritt 3 des unten folgenden Beweises i h
d L dt
L , H hi cτ p ,
Für den Gesamtdrehimpuls J folgt hieraus allerdings i h
d J dt
i h L
d dt
, H
h 2
J, H
2 cτ p . i
(3.63) 0.
J ist also eine Erhaltungsgröße und vertauscht mit H , und dasselbe gilt insbesondere für Jz . Es bietet sich daher an, die Eigenwerte von H als gemeinsame Eigenwerte von
106
3 Anwendungen der Dirac-Theorie
H , J 2 und Jz aufzusuchen. Dies bedeutet, daß sich die winkelabhängigen Faktoren der Eigenfunktionen, also die Spinoren φ(ϑ, ϕ) und χ(ϑ, ϕ), mit den Eigenzuständen der Operatoren J 2 und Jz in Zusammenhang bringen lassen, was im nächsten Abschnitt geschehen wird. Hier folgt noch der Beweis der oben unbewiesen gebliebenen Beziehungen. Beweis: 1. Aus der Definition (3.54b) von K ergibt sich Σr ,
K
Σr , 1
L
h
2Σr
1 Σr , L . h
Setzt man in (2.158) a gleich er bzw. gleich L und b gleich L bzw. gleich er , so ergibt sich Σr , L er , L er L L er i er L L er . Unter Benutzung des ε-Tensors gilt (mit er x 0) er L L er
2(er x) p p (er x)
x h δi j xj 1 h j εi j k xk ∂i εi j k x k ∂ i i r i r r r2
εi j k x j x k h εiik xk 1 h x x 1 εiik 0 ∂ 0 i i r r i r2 r r2
er (x p) (x p) er
(die Differentiation wirkt nur auf die durch gekennzeichnete Größe) und er L L er
h h er (x ) (x )er (x ) er i i
3 x h h x er x div r ( er er ) x i r i r
h r 2 2h ( er er ) x er . i 2 r i
Damit ergibt sich Σr ,
L 2hΣ r
und
Σr ,
K
x
1 r
0.
2. Es gilt Σr ,
pr
h i
er , ∂r hi (∂r er ) 0 .
3. Für die totale Zeitableitung der nicht explizit von der Zeit abhängigen Operatoren L und ergibt sich nach (Q6.117) mit h h L, V x , V (r ) x V (r ) 0 , i i unter Benutzung der Summenkonvention für doppelt auftretende Indizes und mit x x j e j i h L
(3.51b)
L, cτ
p cτ Σi x p, pi hcτ Σi (∂i x) p i
hcτ hcτ hcτ p Σi (∂i x j e j ) p Σi δi j e j p i i i
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
107
sowie i h Σx
cτ Σx , p
(2.157a)
cτ Σ x , Σi p i
2cτ (Σx Σ y p y Σz Σx p z )
cτ (Σ x Σ y Σ y Σ x ) p y
(2.157b)
cτ (Σ x Σz Σz Σ x ) p z
2cτ i (Σ y p z Σz p y ) 2cτ i (
p) x .
Der Beweis für Σy und Σ z verläuft analog.
3.4.2 Lösung für die winkelabhängigen Funktionen Nach (Q7.129) und den auf (Q7.139) folgenden Gleichungen in Abschn. Q7.5.4 der Quantenmechanik sind die gemeinsamen Eigenzustände j, m der Operatoren J 2 und Jz zugleich Eigenzustände des Operators k zum Eigenwert k, wobei k für gegebenes j die Werte ( j 12 ) annehmen kann. Bezeichnen wir diese Eigenzustände, die in der Orts- und Zweierspinor-Darstellung durch (Q7.137) gegeben sind, hier mit φk,m , so gilt nach (Q7.129) also * j 12 l 1 k φk,m k φk,m mit k . (3.64) 1 ( j ) l 2 Nun folgt aus (3.56a) mit (3.58) kσ r
σr k .
Durch Anwendung des Operators σr auf Gleichung (3.64) ergibt sich daher kσ r φk,m
σr kφ k,m
kσr φk,m ,
d. h. die Anwendung des Operators σr auf den Eigenzustand φk,m zum Eigenwert k erzeugt aus diesem den wegen (σr φk,m ) σr φk,m
φk,m σr σr φk,m
φk,m σr2 φk,m
(3.53)
φk,m φk,m
1
schon richtig normierten Eigenzustand zum Eigenwert k, σr φk,m
(3.53)
φk,m
φk,m
σr φk,m .
(3.65)
Setzen wir in den Gleichungen (3.61)–(3.62) φ
φk,m ,
χ
φk,m ,
(3.66)
so können die winkelabhängigen Funktionen wegen σr χ
σr φk,m
φk,m ,
σr φ
σr φk,m
φk,m
und (3.64) bzw. kφ k,m kφk,m herausgekürzt werden. Zur Lösung verbleibt das System kg kf (V m 0 c2 E) f hc g 0, (V m 0 c2 E) g hc f 0 (3.67) r r
gekoppelter gewöhnlicher Differentialgleichungen zur Bestimmung der Funktionen f (r ) und g(r ).
108
3 Anwendungen der Dirac-Theorie
3.4.3 Lösung der Radialgleichungen, Energieeigenwerte und Eigenzustände α h c/r und den Abkürzungen
Mit V (r )
a lauten die Gleichungen (3.67) 1 α kg f g a r r
m ch2c E 0 1 a
0,
(3.68)
αr
kf g f r
0.
(3.69)
Für große r folgt aus der ersten Gleichung f a g und damit aus der zweiten g a f a a g . Dies zeigt, daß sich f und g für r wie e r/ a a verhalten müssen. (Die Möglichkeit eines Verhaltens e r/ a a kann ausgeschlossen werden.) Dieses asymptotische Verhalten führt dazu, zur Lösung der Gleichungen den Ansatz f (r ) e
r/a s
r
ν 0
fν r ν ,
g(r ) e
r/a s
r
ν 0
gν r ν
mit a
a a
(3.70)
zu wählen. Unter Benutzung von f (r ) e
r/a s
r
daraus folgend
ν 1
f e
r/a r s
f e
r/a r s
fν
1r
ν 1
s f0 r
ν 1
fν
f (r )
,
1r
ν 1
ν 1
f a
f /r
,
e fν a
1
r/a r s
srf e
f0 r
(s ν) fν
r/a s
r
ν 1
rν
fν r ν
ν 1 1
ν fν r ν
1
,
,
1
und entsprechenden Formeln für g(r ) führt das Einsetzen des Ansatzes in (3.69) zu
α f 0 kg0 sg0 f ν 1 gν 1 α fν (s ν k) gν r ν 1 0 , r a a ν 1
fν 1 αg0 k f 0 s f 0 gν 1 αgν a (s ν k) fν r ν 1 0 . r a ν 1
Der Koeffizientenvergleich der 1/r -Terme liefert die Gleichungen α f0 (k s)g0 für die r ν 1 -Terme führt er
0,
αg0 (s
k) f 0
0,
(3.71)
nach Multiplikation mit a bei den Koeffizienten der ersten
und mit a a a bei denen der zweiten Gleichung zu den Rekursionsformeln 5 a f ν 1 αa f ν gν 1 (s ν k) a gν 0 , (3.72) a 5 a gν 1 αagν f ν 1 (s ν k) a f ν 0 . (3.73) a
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
109
Die Lösbarkeitsbedingung α 2 (s k)(s k)α 2 s 2 k 2 0 für die Gleichungen (3.71) liefert die Bedingung s.u. s k 2 α2 . (3.74) (Die Alternative mit dem Minuszeichen vor der Wurzel würde zu Lösungen führen, die für r 0 divergieren.) Durch Addition der Rekursionsformeln (3.72)–(3.73) ergibt sich der Zusammenhang αa (s ν k) a gν fν (3.75) αa (s ν k) a zwischen den Koeffizienten f ν und gν . Für ν folgt aus der letzten Beziehung näherungsweise a gν fν , (3.76) a und aus (3.72) ergibt sich damit die Näherung 5 a a f ν 1 αa f ν fν 1 νa fν a a die mit (3.70c) und (3.76) fν
f ν 1 2 aν ,
gν
0,
2gaνν 1
zur Folge hat. Drückt man mit Hilfe der ersten Iterationsformel f ν 1 durch f ν 2 , f ν 2 durch f ν 3 aus usw., so ergibt sich aus (3.70a) für f (r ) das asymptotische Verhalten f (r ) er/a r s
1 2r ν ν a ν 0
er/a r s e2r/a ,
und für g(r ) erhält man ein analoges Verhalten, beide Funktionen divergieren. Konvergente Lösungen ergeben sich daher nur, wenn die Reihen (3.70) bei einem endlichen ν N abbrechen, wenn also f N 1 g N 1 0 gilt. Aus den zwei Gleichungen (3.72) und (3.73) ergibt sich für ν N 1 daraus die gleiche Bedingung 5 a fN gN . a Wird dies in die für ν N angeschriebene Beziehung (3.75) eingesetzt, so folgt 5 αa (s N k) a a 1, αa (s N k) a a was unter Benutzung von (3.70c) in 2(s
N) α
aaaa
(3.68)
2E
(m 0 c2 )2 E 2
umgeformt werden kann. Durch Quadrieren ergibt sich hieraus eine quadratische Gleichung für E, deren Lösung wegen 2(s N)/α 0 positiv sein muß und nach Ersetzung
110
3 Anwendungen der Dirac-Theorie
von s durch (3.74) E
1
α2 /
m 0 c2 N
k2
2 α2
(3.77)
lautet. (Dieses Ergebnis für das diskrete Energiespektrum des relativistischen Wasserstoffatoms wurde erstmalig von A. Sommerfeld mit Hilfe des Bohrschen Atommodells abgeleitet.) k kann nach (3.64) die Werte l 1 und l annehmen und ist mit l ganzzahlig. Damit k 2 α 2 und E reell sind, muß der Wert k 0 ausgeschlossen werden, so daß k die Werte 1, 2 etc. annehmen kann. Die möglichen Werte von N sind 0, 1, 2 etc. Die zu den Eigenwerten (3.77) gehörigen Eigenzustände sind nach (3.60) und (3.66) ψ
3 4 1 f (r ) φk,m , r i g(r ) φ k,m
(3.78)
wobei die Zweierspinoren φk,m durch (Q7.137) mit j k, die Funktionen f (r ) und g(r ) durch (3.70) gegeben sind. Mit Hilfe der Rekursionsformel (3.72) und des Zusammenhangs (3.75) können alle Entwicklungskoeffizienten f ν und gν der Reihenentwicklungen (3.70) auf 2 f0 zurückgeführt werden, f 0 wiederum kann mit Hilfe der Normierungsbedingung ψ ψ d 3x 1 bestimmt werden. Einige der Eigenzustände haben bei r 0 eine schwache Singularität. Für r 0 gilt nach (3.70) f (r ) f 0 r s sowie g(r ) g0 r s , und nach (3.78) folgt daraus mit (3.74) 2 2 f 0 φk,m r k α 1 . ψ i g0 φk,m Für k 2 verhalten sich alle Zustände regulär, für k 1 gilt jedoch k 2 α 2 1 1α 2 1 α 2 /2 0, 000027 .
Nach (3.64) wird k 1 für l 0 und l 1, d. h. alle s- und p-Zustände divergieren für r 0 wie r 0,000027. Diese Singularität stellt allerdings kein echtes Problem dar: Sie ist darauf zurückzuführen, daß wir für den Wasserstoffkern das divergente Potential V (r )α h c/r benutzt haben, während der reale Wasserstoffkern wegen seiner endlichen Ausdehnung kein divergentes Potential besitzt. Im übrigen sorgt die endliche Kernausdehnung auch dafür, daß das Elektron gar nicht bis nach r 0 gelangen kann.
3.4.4 Diskussion der Energieniveaus Die durch (3.77) gegebenen Energieeigenwerte hängen nur von der radialen Quantenzahl N und dem Betrag der Spin-Bahn-Quantenzahl k ab. Wegen α 1/137 ist α2 k 2 , die Energieeigenwerte werden daher näherungsweise durch die Hauptquantenzahl n
N k
(3.79)
allein festgelegt. Zur besseren Vergleichbarkeit mit dem nicht-relativistischen Ergebnis führen wir die letztere in (3.77) ein und erhalten
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
E
m 0 c2
1
α2
& n
k 2 α 2 k
111
2 .
(3.80)
Durch Entwicklung nach dem kleinen Parameter α 2 und mit k j 1/2 nach (3.64b) erhalten wir hieraus für die um die Ruheenergie reduzierten Energieniveaus E ¼ E m 0 c2 die Reihe m 0 c2 α2 m 0 c2 α4 3 1 ¼ E 2n3 j 1/2 4n . . . . (3.81) 2n 2 In niedrigster Ordnung ist dies das Ergebnis (Q4.144) der nicht-relativistischen Quantenmechanik. Der Term α 4 enthält die in der Näherung (3.50) durch zwei Zusatzterme beschriebenen relativistischen Korrekturen. Durch ihn wird die l-Entartung der Energieniveaus aufgehoben, weil j 1/2 von l abhängt. (Nach (3.64) kann k j 1/2 bei gegebenem l die Werte l und l 1 annehmen.) Weil der zu α 4 proportionale Korrekturterm jedoch wesentlich kleiner als der zu α2 proportionale Term niedrigster Ordnung ist, ergibt sich eine Aufspaltung in sehr nahe beisammen gelegene Energieniveaus, die sehr nahe bei den entarteten Niveaus der nicht-relativistischen Theorie liegen. Die Breite des Energieintervalls, in das bei gegebenem n die Aufspaltung der Energieniveaus erfolgt, errechnet sich wegen j 1/2 l 1 n und damit 1/2 j n 1/2 aus der Differenz der Energien E ¼ (n, j 1/2) und E ¼ (n, j n 1/2) zu E ¼
n2n41 m 0 c2α4 ,
(3.82)
sie wird mit zunehmendem n sehr schnell sehr klein. Wie in der nicht-relativistischen Theorie hängt E ¼ nicht von der in den Eigenzuständen auftretenden Quantenzahl m ab. Diese beschreibt ja die Projektion des Gesamtdrehimpulses auf die z-Richtung, die wegen der Rotationsinvarianz des Problems durch nichts ausgezeichnet ist und daher willkürlich gewählt werden kann, und E ¼ darf davon nicht abhängen. Die m-Entartung bleibt also weiter bestehen, und weil m die Werte j, ( j 1), . . . , 1/2 oder (l 1/2), (l 1/2), . . . , 1/2 annehmen kann (nach (3.64b) gilt j l 1/2), ist sie 2(l 1)-fach. Zu gegebener Bahndrehimpulsquantenzahl l gibt es wegen j l 1/2 zwei mögliche Quantenzahlen j des Gesamtdrehimpulses, die zwei Orientierungsmöglichkeiten des Elektronenspins entsprechen. Die Zahl möglicher Elektronenzustände zu gegebener Hauptquantenzahl n, die nach der Schrödinger-Theorie n 2 beträgt, erhöht sich dadurch auf 2n 2 . Die in der nicht-relativistischen Theorie durch das Quantenzahlenpaar n l als 1s, 2s, 2 p, 3s, 3 p, 3d etc. gekennzeichneten Energieniveaus werden in der relativistischen Theorie unter Hinzufügen der Quantenzahl j für den Gesamtdrehimpuls durch n lj mit tiefgestelltem j charakterisiert. Auf diese Weise erhält man die Energieniveaus -. / -. / , -. / , , 1s1/2 , 2s1/2 , 2 p1/2, 2 p3/2, 3s1/2 , 3 p1/2 , 3 p3/2, 3d3/2, 3d5/2, . . . . Weil einerseits die Energiewerte (3.80) nach (3.64b) bei gegebenem j nicht zusätzlich von l abhängen, andererseits jedoch nach (3.64b) zwischen l und j der Zusammenhang l j 1/2 besteht, ergeben sich bei gegebenem n dieselben Energiewerte für
112
3 Anwendungen der Dirac-Theorie
E¼ n 3 n 2
n 1
3s, 3 p, 3d 2s, 2 p
1s
0 3d5/2 3s1/2, 3 p1/2 2 p3/2 2s1/2, 2 p1/2
k 3 k 1 k 2 k 1
3 p3/2, 3d3/2
k 2
1s1/2
k 1
Abb. 3.1: Termschema des Wasserstoffatoms von n 1 bis n 3 nach der nicht-relativistischen Theorie (links) und der relativistischen Theorie (rechts). Die relativistischen Energieniveaus liegen etwas tiefer als die nicht-relativistischen. Ihre Absenkung ist allerdings wesentlich geringer als eingezeichnet, Aufspaltung und Absenkung wurden zur Sichtbarmachung stark übertrieben.
l j 1/2 und l j 1/2. Alle dieserart gleichen Energieniveaus sind in der obigen Aufzählung miteinander durch eine geschweifte Klammer verbunden. Zu gegebenem n finden sich in der obigen Aufstellung 2(n1)12n 1 Energieniveaus, von denen sich (n 1)1n unterscheiden. In Abb. 3.1 ist das Termschema des Wasserstoffatoms von n 1 bis n 3 nach der nicht-relativistischen Theorie (links) und nach der relativistischen Theorie (rechts) wiedergegeben. Die k-Werte müssen sich dabei sowohl durch j als auch durch l gemäß (3.64b) ausdrücken lassen. Für den l 2 und j 5/2 Zustand 3d5/2 z. B. kommt daher nur k j 1/23 in Frage, weil k ( j 1/2)3 nur mit l 3 verträglich wäre.
3.5
Zur Hyperfeinstruktur des Wasserstoffatoms
Mit dem Spin des Atomkerns ist ein im Vergleich zum Moment des Elektrons sehr schwaches magnetisches Moment gs (e/2mp ) S verbunden, in dessen Magnetfeld B μ0 /(4π) rot( x/r 3 ) sich der Spin des Elektrons einstellt, es kommt zu einer Spin-Spin-Wechselwirkung. Die hieraus folgenden Korrekturen sind noch kleiner als die Feinstrukturkorrekturen und führen zu einer Struktur der Energieniveaus, die als Hyperfeinstruktur bezeichnet wird. Eine weitere, sehr schwache Korrektur ergibt sich, wenn man die Bewegung des Kerns mitberücksichtigt. Deren Berücksichtigung führt dazu, daß die Masse des Elektrons durch die reduzierte Masse ersetzt werden muß. Außerdem wird durch die Bewegung der Kernladung ein schwaches Magnetfeld hervorgerufen, das sowohl die Bahndynamik des Elektrons beeinflußt als auch auf den Elektronenspin einwirkt. Das sich hierdurch ergebende relativistische Zwei-Körper-Problem ist jedoch viel schwieriger als das nicht-relativistische und kann nur noch mit Näherungsmethoden behandelt werden. Nochmals weitere Korrekturen ergeben sich durch eine elektrische Polarisation des Vakuums, die wir in Abschn. 2.15.2 besprechen werden, und dadurch, daß im Vakuum fluktuierende elektromagnetische Felder auftreten (siehe Abschn. 8.3.8).
Aufgaben
113
Aufgaben 3.1
3.2
Zeigen Sie: Die gemeinsamen Eigenzustände der Operatoren p und c« p zu den ϕ Eigenwerten p und cp sind ψ e i p x/h . ( p/ p) ϕ Beweisen Sie: Zur Superposition der in Aufgabe 3.1 berechneten Eigenzustände der p-Komponente des Geschwindigkeitsoperators aus den ebenen Wellen 3 4 ϕ () e i ( p x ωt )/h ψ p ϕ m c2 E 0
p
positiver und negativer Energie werden beide benötigt. Hinweis: Es genügt der Beweis für t 0. 3.3
Beweisen Sie die Transformationsgleichung (3.23), (c )
3.4
cβ p p h( )
c
c p p . p p h( ) m 0 c h( )
h die Gültigkeit der Beziehung Beweisen Sie für den Operator K 1 L/ K 2 J 2 /h 2 1/4 mit J L h /2. Welche Eigenwerte folgen daraus für K ?
3.5
Der bei der Berechnung der Energieniveaus des Wasserstoffatoms benutzte Ope h, der in der Näherung (3.50) für den Hamilton-Operator rator K 1 L/ (genauer im Beitrag H 2 zu H ) die Spin-Bahn-Kopplung repräsentiert, vertauscht nur mit den zwei ersten Termen von H , anti-vertauscht jedoch mit dem dritten Term und vertauscht daher nicht mit H . Beweisen Sie die behauptete AntiVertauschung K , τ p 0.
3.6
Zeigen Sie, daß der aus K hervorgehende Operator β K mit dem HamiltonOperator (3.51b) des Wasserstoffatoms, H V (r )m 0 c2 β cτ p, vertauscht. Anmerkung: β K ist infolgedessen zeitlich konstant und daher der relativistisch korrekte Operator für die Spin-Bahn-Kopplung.
Lösungen 3.1
Der Spinor ψ U e i p x/h ist für beliebige U ein Eigenzustand des Operators p. Einsetzen in die Eigenwertgleichung c« p ψ αψ führt zu c« p U αU oder mit dem Ansatz ϕ U zu χ ϕ p pχ 0 ϕ c α c« pU c p 0 χ pϕ χ bzw. zu den Einzelgleichungen pχ
(α/c) ϕ ,
pϕ
(α/c) χ .
Aus diesen folgt χ
(c/α)
pϕ
und
p
pϕ
(α/c)2 ϕ .
114
3 Anwendungen der Dirac-Theorie
Mit (2.76) folgt aus der letzten Gleichung p2 ϕ
(α/c)2 ϕ
pp ϕ .
und damit aus der vorletzten χ Für ψ ergibt sich wie behauptet
3
ψ 3.2
α
pc ,
4
ϕ
e i p x/h .
pϕ p
Wir beschränken uns auf den Fall positiver Geschwindigkeit, pψ pψ, betrachten den Zeitpunkt t 0 (für andere Zeitpunkte müßte in die Eigenlösungen von c p eine den ebenen Wellen entsprechende Zeitabhängigkeit aufgenommen werden) und haben das Superpositionsproblem 3 4 4 3 4 3 ϕ1 ϕ2 ϕ , c p c p p ϕ1 ϕ2 p ϕ m c2 E m c2 E
ϕ2 ϕ ,
p
0
in Komponenten also ϕ1
p
0
p
c
pϕ . ϕ2 2 p m0 c Ep
ϕ1 m 0 c2 Ep
Unter Benutzung der ersten Gleichung ergibt sich aus der zweiten ϕ2 ϕ 1 ϕ2 m0c2 Ep cp
ϕ1 m 0 c2 Ep oder
1
m 0 c2 Ep
1 cp
ϕ1
m0 c2 Ep
1 cp
1
ϕ2 .
ϕ1 repräsentiert eine Lösung positiver, ϕ2 eine Lösung negativer Energie. Da ϕ1 und ϕ2 zueinander proportional sind, müssen beide von null verschieden sein. Nur für m 0 0 und daraus folgend Ep cp wäre ϕ1 0 und ϕ2 0 möglich.
(m 0 ch β p ) (m 0 ch β p ) (2h )(m 0 ch ) p β p . m02chh 21h (β p β p ) (2βh )(m 0 ch ) Mit zweimaliger Vertauschung von β mit sowie mit p p 2 p im letzten Term, mit β p β p β( p p )2β p (folgt aus der letzten Gleichung) im zweiten Term und mit p p p 2 ergibt sich daraus m ch β p β 2 ( p 2 p ) p 0 2h h (2h )(m 0 ch ) 2 p p 0 ch ) p . βhp (m 0c(2hh)(m )(m 0 ch ) h (m 0 ch )
3.3
Wegen (3.22) verschwindet der dritte Term, und damit ist die Beziehung bewiesen.
Aufgaben
3.4
115
Setzt man in der Identität (2.158) a b L, so folgt aus dieser ( L)2
L 2 i ( L L) .
Mit der Beziehung L L i h L , die gleich im Anschluß abgeleitet wird, sowie mit J 2 L 2 h L h 2 2 /4 und 2 Σ x2 Σ y2 Σz2 3 läßt sich diese in 3 ( L)2 L 2 h L J 2 2h L h 2 4 überführen, woraus wie behauptet K2
1
2 L h
( L)2 h2
1
2 L h
J2 h2
2 L h
3 4
J2
h 2
1 4
folgt. Der Operator L L ist nicht der Nulloperator, weil die im ersten L enthaltene Ableitung auf den Ortsvektor x im zweiten L wirkt, LL
(x p)(x p) h 2 (x )(x ) h 2 (x )( x
) .
Der letzte Ausdruck ist dabei so zu verstehen, daß der vor x stehende Nablaoperator nur noch auf x wirkt. Mit div( x (x )( x
)( x)0 ergibt sich weiterhin
) x( x ) x div(x )x( x ) ∂i (xk εklm x l ∂m ) x k εklm δil ∂m x k εkim ∂m εikm x k ∂m x und damit L L h 2 ( x )i hx p i h L. 3.5
Mit L p
p L
h 2
und L p p L
(x )
h 2
x () 0 , i i h 2 h 2 rot x x ( ) 0 (x ) i i
(x p) p p(x p) p( x
p( p x) ( p x) p
p)
h 3h 2h pi (∂i x j e j ) p p i i i
ergibt sich aus (2.158), a b ab i ( a b),
L p i ( L p) , p L i ( p L) , L p p L i ( L p p L) 2h p
und
L h, p 0 . p L p p L 2h
Wird diese Gleichung mit τ/h multipliziert, so folgt aus ihr mit (2.167c), τ τ , daß der Operator K mit dem Operator τ p anti-kommutiert. 3.6
β K β β L/h kommutiert mit den zwei ersten Termen des Hamilton-Operators, H V (r )m 0 c2 β cτ p, weil β und L mit V (r ) und β kommutieren, L dabei nach (2.167d) und wegen (x )V (r )0. Bezüglich des dritten Terms gilt β K , τ
p β K τ p τ p β K
β K , τ p
Aufg. 3.6
(2.167b,d)
0.
β K τ p βτ p K
4
Klein-Gordon-Theorie
1926, schon zwei Jahre, bevor Dirac die Dirac-Gleichung aufstellte, wurde von O. Klein und W. Gordon eine Gleichung für die relativistische Quantendynamik von Teilchen angegeben.1 Aufgrund von Schwierigkeiten, die wir erörtern werden, wurde sie jedoch vorübergehend aufgegeben. Einige dieser Schwierigkeiten lassen sich auf einfache Weise beseitigen, andere, denen man in ähnlicher Weise auch bei der Dirac-Gleichung begegnet, können erst im Rahmen einer Quantenfeldtheorie, dort aber vollständig, behoben werden. Der letzte Umstand macht die Klein-Gordon-Schrödinger-Gleichung zu einer nützlichen relativistischen „Wellengleichung“, deren Untersuchung sich lohnt. Wie schon bemerkt wurde, beschreibt die Dirac-Gleichung nur spezielle Spin-1/2Teilchen. Die Klein-Gordon-Schrödinger-Gleichung wird sich als adäquate Gleichung zur Beschreibung von Teilchen mit Spin 0 herausstellen (siehe Abschn. 4.2).
4.1
Klein-Gordon-Schrödinger-Gleichung
Die Anwendung der Korrespondenzregeln (2.18) auf die klassische relativistische Gleichung (2.5) hat uns in Abschn. 2.2 zu der quantenmechanischen Bewegungsgleichung (2.19) geführt. Diese erschien uns aus mehreren Gründen als ungeeignet: Zum einen, weil in ihr Raum und Zeit nicht gleichberechtigt behandelt werden, und zum anderen, weil sie zu einer nicht-lokalen Theorie führt. Als Alternative zur Vorgehensweise von Dirac bietet sich an, in einer gewissen Analogie zu dieser in Gleichung (2.5) die Wurzel durch Quadrieren zu beseitigen, (H qΦ)2
m 02c4 c2 ( p
q A)2 ,
(4.1)
und dann die Korrespondenzregeln (2.18) anzuwenden. Auf diese Weise ergibt sich mit V qΦ die Klein-Gordon-Schrödinger-Gleichung2 (ih ∂t V )2 φ
c2
2 h qA φ i
m 02 c4 φ
0.
(4.2)
1 Wie in der Einleitung zur Relativistischen Quantenmechanik dargelegt hatte auch schon Schrödinger diese Gleichung gefunden. 2 Es ist üblich, die skalare Wellenfunktion der Klein-Gordon-Theorie mit φ zu bezeichnen, um sie von den Spinoren ψ der Dirac-Theorie abzuheben. Beim gleichzeitigen Auftreten des hier mit Φ bezeichneten elektrischen Potentials kann das leicht zu Verwechslungen führen, weshalb im folgenden qΦ V gesetzt wird.
4.1 Klein-Gordon-Schrödinger-Gleichung
117
Dabei sei angemerkt, daß (4.1) nicht der Gleichung (2.5), sondern den Gleichungen 2 H V c m 02 c2 pq A äquivalent ist. Wie bei der Dirac-Theorie erwarten wir daher, daß Gleichung (4.2) auch Lösungen negativer Energie besitzt. Gleichung (4.2) läßt sich sofort in eine Form bringen, die ihre Kovarianz erkennen läßt. Wir teilen sie zu diesem Zweck durch c2 , führen den Vierervektor Aα Φ/c, A ein, und erhalten 3 3 h 2 2 2 2 i ∂0 q A0 φ hi ∂l q Al φ hi ∂0 q A0 φ hi ∂l q Al φ m 02c2 φ l 1
l 1
bzw. in relativistischer Schreibweise unter Benutzung kovarianter und kontravarianter Vektoren h ∂ α q Aα h ∂α q Aα φ m 02c2φ . (4.3) i i Diese Gleichung ist offensichtlich Lorentz-invariant, wenn sich φ wie ein Skalar transformiert, d. h. gemäß φ ¼ (x ¼ ) φ x(x ¼ ) . (4.4) φ kann dabei komplexwertig sein. Durch Ausmultiplizieren der in Klammern stehenden Operatoren in (4.3) ergibt sich für den Fall der Lorenz-Eichung ∂ αA α 0 die (4.2) und (4.3) äquivalente Form
h 2φ 2 ih q Aα ∂α φ q 2AαAα φ m 02 c2φ
(4.5)
der Klein-Gordon-Schrödinger-Gleichung, wobei die Definition ∂ α ∂α und die Identität A α ∂ α φ A α ∂α φ benutzt wurden. Der Spezialfall der Klein-Gordon-Schrödinger-Gleichung für freie Teilchen ( A α 0) ist φ
m 02 c2 h 2
φ
0.
(4.6)
Ein anderer Zugang zur Klein-Gordon-Schrödinger-Gleichung ist auch mit unserer bewährten Methode möglich, einen allgemeinen Ansatz mit zunächst offen gelassenen Koeffizienten zu wählen und diese über das Korrespondenzprinzip zu bestimmen. Dabei muß nur die – bei der Dirac-Gleichung mit Kausalitätsargumenten begründete – Forderung aufgegeben werden, daß die „Wellengleichung“ nur Zeitableitungen erster Ordnung enthalten soll. Das im Detail auszuführen bleibt dem Leser überlassen (Aufgabe 4.1). Hier wird nur gezeigt, daß Gleichung (4.5) im quasiklassischen Grenzfall auf die Gleichungen (2.11) und (2.14) zurückführt. Beweis: Wir setzen φ
A eiS/hÆ
118
4 Klein-Gordon-Theorie
und nehmen an, daß sowohl A als auch S reell sind. (Man beachte, daß die Amplitude A nichts mit dem Vektorpotential A α zu tun hat.) Mit 6 7 i ∂α φ (∂α A) A(∂α S) eiS/h , h 6 7 1 i α 2(∂ A)(∂α S) AS eiS/h φ A 2 A(∂ α S)(∂α S) h h folgt aus (4.5) für den Realteil h
2 A
A
(∂ α S)(∂α S) 2q Aα (∂α S) q 2A αA α
m 02 c2
(4.7)
und für den Imaginärteil 2(∂ αA)(∂α S) AS 2q A α (∂α A) 0 .
(4.8)
Im quasiklassischen Grenzfall kann der erste Term in (4.7) vernachlässigt werden (es gelten zu (2.23)–(2.24) analoge Abschätzungen). Der Rest von Gleichung (4.7) kann in der Form (∂ α S q Aα )(∂α S q Aα ) m 02 c2 geschrieben werden und ist identisch mit (2.11). Gleichung (4.8) multiplizieren wir mit A, setzen n 0 A 2 (A ist wie φ nach (4.4) ein Skalar) und erhalten unter Benutzung von ∂ α Aα 0 ∂ α n 0 (∂α S q Aα ) 0 . (4.9) Mit m 0 Uα m c, Ú können die Gleichungen (2.6) mit (2.9) sowie (2.7) mit (2.10) und H E zu ∂α S q Aα m 0 Uα (4.10) zusammengefaßt werden, Gleichung (4.9) und (4.10) ergeben zusammen (2.14).
In Abschn. 2.6 wurde gezeigt, daß jede Komponente eines Dirac-Spinors, welcher der Dirac-Gleichung für freie Teilchen genügt, auch eine Lösung der Klein-GordonSchrödinger-Gleichung (4.6) für freie Teilchen ist. Bei freien Teilchen besteht daher kein wesentlicher Unterschied zwischen diesen beiden Gleichungen, ein solcher ergibt sich erst im Fall nicht-verschwindender Felder. In Aufgabe 4.3 wird gezeigt, daß die Dirac-Spinoren in diesem Fall die Gleichung « E Gψ h q i B ψ (4.11) c mit
G
h 2 2 ih q Aα ∂α q 2AαAα m 02 c2
erfüllen. Diese unterscheidet sich von der Klein-Gordon-Schrödinger-Gleichung (4.5) durch die Terme der rechten Seite. Elektronen und Positronen verhalten sich demnach nicht nur in Magnetfeldern aufgrund ihres Spins anders als geladene Spin-0-Teilchen, sondern auch bei Abwesenheit eines Magnetfelds in rein elektrischen Feldern.
4.2 Nicht-relativistischer Grenzfall
4.2
119
Nicht-relativistischer Grenzfall
Die Klein-Gordon-Schrödinger-Gleichung (4.2) lautet ausführlicher h 2 ∂t t φ
2 ih V ∂t φ
ih φ ∂t V
Mit dem Ansatz φ
V 2 φ c2 hi
ψe
2 q A φ m 02 c4 φ .
im 0 c2 t /h
(4.12)
transformieren wir zunächst wie bei der Dirac-Gleichung (siehe (2.139)) den Ruheenergieterm m 02 c4 φ weg und erhalten für ψ die Gleichung c2 hi
2 q A ψ. (4.13) Mit den gleichen Argumenten, die zu den Ungleichungen (2.141) geführt haben, erklären wir den nicht-relativistischen Grenzfall dadurch, daß überall, wo ψ merklich von null verschieden ist, die Forderungen h 2 ∂t t ψ 2m 0 c2 ih ∂t ψ 2 ih V ∂t ψ 2V m 0 c2 ψ ih ψ ∂t V V 2
V m 0 c2 ,
' ' ' ' 'ih ∂t f ' 'm 0 c2 f '
(4.14)
erfüllt sein sollen, wobei f entweder für ψ, eine Ableitung von ψ oder das Potential V steht. (Wir erwarten, daß sich ∂t ψ und ψ so schnell wie V ändern.) Auf der linken Seite von (4.13) kann damit eine Reihe von Termen vernachlässigt werden: Wegen (4.14a) der letzte gegen den vierten, wegen (4.14b) mit f ∂t ψ der erste gegen den zweiten und mit f ψ der dritte gegen den vierten sowie mit f V der fünfte gegen den vierten. Aus (4.13) folgt dann nach Division durch 2m 0 c2 ih ∂t ψ
V ψ 2m1
0
2 h qA ψ . i
Das ist die Schrödinger-Gleichung für ein geladenes Teilchen ohne Spin in elektromagnetischen Feldern. Da die Eigenschaft der Spinlosigkeit nicht vom Bewegungszustand des Teilchens abhängt, erweist sich die Klein-Gordon-Schrödinger-Gleichung damit als Gleichung für Teilchen mit Spin 0. Anmerkung: Die Schrödinger-Gleichung besitzt nur stationäre Zustände positiver Energie. Daß die Klein-Gordon-Schrödinger-Gleichung auf sie führte, darf nicht zu dem Schluß verleiten, daß auch diese nur positive Energien zuließe. Mit dem Ansatz (4.12) wird ψ nur dann langsam zeitveränderlich und damit (4.14b) nur dann gültig, wenn φ ein Zustand positiver Energie ist (siehe Abschn. 4.5). Für Lösungen 2 negativer Energie müßte man stattdessen φ ψ ei m 0 c t /h ansetzen und bekäme im nicht-relativistischen Grenzfall für ψ eine Schrödinger-Gleichung zu negativen Energien (ih ∂t ψ ih ∂t ψ , siehe Aufgabe 4.4).
120
4.3
4 Klein-Gordon-Theorie
Schrödinger-Form der Klein-Gordon-Schrödinger-Gleichung
Es verstößt gegen eines unserer Grundprinzipien bei der Aufstellung quantenmechanischer Bewegungsgleichungen, daß die Klein-Gordon-Schrödinger-Gleichung zweite Zeitableitungen enthält: Die zeitliche Weiterentwicklung der Wellenfunktion φ ist dann nicht durch den momentanen Zustand determiniert, vielmehr muß auch noch ∂t φ vorgegeben werden. Dies ist ein Mangel, der sich auf einfache Weise beheben läßt: Man muß dazu nur die Wellengleichung zweiter Ordnung hinsichtlich der Zeitableitung in ein System von zwei Gleichungen erster Ordnung zerlegen, indem man z. B. φ und (ih/m 0 c2 ) ∂t φ zu Komponenten eines Zweierspinors erklärt. (Dies entspricht in der Mechanik dem Übergang von den Lagrange-Gleichungen, die doppelte Zeitableitungen enthalten, zu den Hamilton-Gleichungen, die nur einfache Zeitableitungen enthalten, wobei in ähnlicher Weise die Ortsvariablen qi durch jeweils zwei Variablen, qi und pi , ersetzt werden. Allerdings ergeben sich trotz dieses Tricks Schwierigkeiten bei der physikalischen Interpretation der Klein-Gordon-Schrödinger-Gleichung, die in Abschn. 4.5 untersucht werden.) Dem äquivalent, aber noch symmetrischer und übersichtlicher ist die Einführung des Spinors ϕ (4.15) Ψ χ mit den Komponenten 1 ih 1 ih ∂t φ , χ ∂t φ . (4.16) ϕ φ φ 2 m 0 c2 2 m 0 c2 (Auch in der Mechanik wird als zweite Variable nicht qi , sondern pi m i qi q Ai benutzt.) Zur Ableitung der Bewegungsgleichung für den Spinor Ψ lösen wir diese Beziehungen nach φ und ∂t φ auf, φ
ϕ χ,
ih ∂t φ m 0 c2
ϕ χ,
(4.17)
und setzen dies in die Klein-Gordon-Schrödinger-Gleichung ein. Dabei beschränken wir unsere Betrachtung auf den kräftefreien Fall. (Der Fall Aα 0 wird in Aufgabe 4.5 untersucht.) Aus (4.2) folgt mit V 0, A 0 und dem Ansatz (4.17) ih ∂t (ϕ χ)
h2 (ϕ χ) m 0 c2 (ϕ χ) . m0
(4.18)
Einsetzen von (4.17a) in (4.17b) liefert als zweite Differentialgleichung ih ∂t (ϕ χ) m 0 c2 (ϕ χ) .
(4.19)
Addition und Subtraktion der Gleichungen (4.18)–(4.19) führt schließlich zu dem Gleichungssystem h2 (ϕ χ) m 0 c2 ϕ , ih ∂ t ϕ 2m 0 (4.20) h2 2 (ϕ χ) m 0 c χ . ih ∂ t χ 2m 0
4.3 Schrödinger-Form der Klein-Gordon-Schrödinger-Gleichung
121
Unter Benutzungen der Pauli-Matrizen (Q7.39) kann dieses mit 0 (i σ2 σ3 ) Ψ i i
i
0
und σ3 Ψ
1 0
0 1
ϕ χ
11 11
0 ϕ 1 χ
1 0
ϕ χ
ϕϕ χχ
(4.21)
ϕ χ
in die kompakte Form ih ∂t Ψ
H Ψ
H
mit
i σ2
σ3
h2 2m 0
m 0 c2 σ3
(4.22)
überführt werden, wobei der Hamilton-Operator H offensichtlich nicht-hermitesch ist. (4.22) ist die Schrödinger-Form der Klein-Gordon-Schrödinger-Gleichung. In Aufgabe 4.6 wird gezeigt, daß jeder Lösungsspinor Ψ dieser Gleichung (und damit jede seiner Komponenten ϕ und χ) auch die Klein-Gordon-Schrödinger-Gleichung erfüllt. Den nicht-relativistischen Grenzfall für Lösungen positiver Energie untersuchen wir 2 mit Hilfe des zu (4.12) analogen Ansatzes Ψ Ψ e im 0 c t /h . Statt der Gleichungen (4.20) erhalten wir mit diesem ih ∂t ϕ
h 2 2m
0
(ϕ
χ) ,
ih ∂t χ
h 2 (ϕ 2m 0
χ) 2m 0c2χ .
(4.23)
Die Anwendung der den nicht-relativistischen Grenzfall charakterisierenden Forderung (4.14b) auf χ reduziert die zweite Gleichung (4.23) auf χ
2 4mh 2c2 (ϕ χ) . 0
Mit (4.23a) und Anwendung der Forderung (4.14b) auf ϕ erhalten wir hieraus ' ' ' ' ' χ '
h 2m 0 c2
' ' ' ' ' ' ' ' ' ∂t ϕ ' ' ϕ ' .
(4.24)
Dies bedeutet, daß die untere Komponente des Spinors Ψ im nicht-relativistischen Grenzfall gegen die obere vernachlässigt werden kann, Ψ
ϕ0 ,
so daß sich für ϕ aus (4.23a) mit (4.24) schließlich, wie zu erwarten, die SchrödingerGleichung h 2 ϕ ih ∂t ϕ 2m 0 ergibt.
122
4 Klein-Gordon-Theorie
4.4
Geschwindigkeitsoperator
Der Geschwindigkeitsoperator Ú der durch die Klein-Gordon-Schrödinger-Gleichung beschriebenen Spin-0-Teilchen ist nach (Q6.117) durch Ú
dx dt
1 p (4.22b) x, H (i σ2 σ3 ) . i h m0
(4.25)
definiert. Beweis: Wir führen den Beweis für die x-Komponente. Es gilt ih
dx dt
x, (i σ2
σ3 )
h2 h2 x, m 0 c2 σ3 (i σ2 σ3 ) (∂x x x 2m 0 2m 0
x ∂x x ) .
Mit ∂x x x
∂x (1 x ∂x ) (∂x 1) 1 ∂x
(∂x x) ∂x
x ∂x x
2∂x
x ∂x x
wird daraus ih
dx dt
(i σ2 σ3 )
h2 2 ∂x 2m 0
i h (i σ2 σ3 )
h ∂x m0 i
Der Beweis für die übrigen Komponenten verläuft analog.
i h (i σ2 σ3 )
p x . m0
Die Eigenwerte λ der in (4.21) berechneten Matrix i σ2 σ3 ergeben sich aus der Gleichung (1λ)(1λ)1 0 zu null. Hieraus folgt, daß auch die Eigenwerte des Geschwindigkeitsoperators Ú gleich null sind, was bedeutet, daß auch die theoretischen Meßwerte der Geschwindigkeit verschwinden. Es stellt sich also ein ähnliches Problem wie beim Geschwindigkeitsoperator c« der Dirac-Theorie. Für die Zeitableitung des Geschwindigkeitsoperators ergibt sich
p p 2 p d Ú i h Ú, H , (i σ2 σ3 ) , m 0 c2 σ3 (i σ2 σ3 ) (i σ2 σ3 ) dt m0 2m 0 m0
p (2.87) , m 0 c2 σ3 i p c2 σ2 , σ3 σ1 c2 p i σ2 m0 (4.25)
m 0c2σ1 (i σ2 σ3 ) 1 Ú .
Obwohl wir es mit kräftefreien Teilchen zu tun haben, ist die Zeitableitung des Geschwindigkeitsoperators von null verschieden. Der Grund dafür ist, daß es auch bei den durch die Klein-Gordon-Schrödinger-Gleichung beschriebenen Spin-0-Teilchen als Folge der Existenz von Lösungen positiver und negativer Energie eine Zitterbewegung gibt. Allerdings ist die Lösung für diese nicht so einfach wie bei den Dirac-Teilchen zu erhalten.
4.5 Ebene-Welle-Lösungen für freie Teilchen
4.5
123
Ebene-Welle-Lösungen für freie Teilchen
Mit dem Ansatz
Ψ0 ei( p x Et )/h
Ψ
(4.26)
für ebene Wellen führt Gleichung (4.22a) zu dem Eigenwertproblem HΨ
EΨ ,
(4.27)
und das Gleichungssystem (4.20) für die Komponenten des Spinors Ψ reduziert sich auf die algebraischen Gleichungen p2 p2 p2 p2 2 2 ϕ0 χ0 0 . m 0 c χ0 0 , ϕ0 E m 0 c E 2m 0 2m 0 2m 0 2m 0 Die Lösbarkeitsbedingung für diese ist E
2
oder E
Ep
p2 2m 0
2
m0c
mit
2
Ep
p2 2m 0
2
0
(m 0 c2 )2 c2 p 2 .
(4.28)
Lösungen zum positiven bzw. negativen Eigenwert bezeichnen wir mit Ψ () bzw. Ψ () . Man überprüft durch Einsetzen, daß (mit willkürlicher Normierung) 3 4 3 E m c2 4 1 p 0 2 () i ( p x Ep t )/h () E m c 2 p 0 Ψ , Ψ ei ( p x Ep t )/h e E m p 0c 2 1 Ep m 0 c (4.29) die zu Ep bzw. Ep gehörige Lösung ist. Im nicht-relativistischen Grenzfall, Ep m 0 c2, geht Ψ () gegen einen Spinor mit verschwindender unterer und Ψ () gegen einen Spinor mit verschwindender oberer Komponente. Der Ansatz (4.26) für den Zweierspinor Ψ überträgt sich nach (4.15) und (4.17a) auf die Wellenfunktion φ, φ φ0 ei( p x Et )/h . (4.30) Durch Vergleich mit der Zerlegung φ A eiS/h erhalten wir den Zusammenhang S
p x Et .
Im quasiklassischen Grenzfall dürfen wir daher nach (2.9) und (2.10) p mit dem Impuls und E mit der Energie identifizieren. Übertragen wir diese Interpretation auf das Quantenregime, so ist (4.27) die Eigenwertgleichung für die Energie. Dementsprechend ist der Impulsopeder in (4.22b) definierte Operator H der Energieoperator und (h/i) rator. Überträgt man die Orts- und Zeitabhängigkeit (4.30) mit (4.12) von φ auf ψ, so 2 ergibt sich ψ φ0 ei p x (E m 0 c )t /h . Dies läßt erkennen, daß ψ wie in Abschn. 4.2 behauptet nur für Zustände positiver Energie langsam zeitveränderlich wird.
124
4.6
4 Klein-Gordon-Theorie
Ladungskonjugation
Die Eigenwerte (4.28) des in Gleichung (4.22b) definierten Operators H konnten als Energien interpretiert werden. Neben den freien Teilchen positiver Energie gibt es auch freie Teilchen negativer Energie, es besteht also dieselbe Situation wie bei der Dirac-Gleichung. Wie dort könnte man versucht sein, den fortwährenden Übergang zu Zuständen immer tieferer negativer Energie durch die Annahme zu vermeiden, daß alle Zustände negativer Energie bereits besetzt sind. Das würde wieder zu der Forderung führen, daß zu jedem durch die Klein-Gordon-Schrödinger-Gleichung beschriebenen Teilchen auch ein Antiteilchen existiert. Allerdings handelt es sich sowohl bei den Teilchen als auch bei den Antiteilchen um Spin-0-Teilchen, und für diese gilt kein Pauli-Prinzip, durch das sich der Übergang zu bereits besetzten Zuständen verbieten ließe. Auf der gegenwärtigen Betrachtungsstufe läßt sich daher die Annahme, die KleinGordon-Schrödinger-Gleichung könne zu einer durchgängig sinnvollen Beschreibung von Teilchen herangezogen werden, nicht rechtfertigen, und dasselbe gilt für die aus ihr abgeleitete Existenz von Antiteilchen. Dennoch werden wir sie in diesem Abschnitt weiterhin als brauchbare Gleichung für Spin-0-Teilchen benutzen und die mit dem Auftreten negativer Energien verbundenen und auf der gegenwärtigen Stufe nicht mehr lösbaren Probleme einfach ignorieren. Der Grund dafür ist, daß sich die angeführten Probleme im Rahmen einer Quantenfeldtheorie von selbst auflösen werden (siehe auch Abschn. 4.7.2). Wenn man akzeptiert, daß es positiv (oder negativ) geladene Teilchen gibt, die durch die Klein-Gordon-Schrödinger-Gleichung beschrieben werden, läßt sich noch viel direkter als bei der Dirac-Gleichung auf die Existenz dazugehöriger negativ (oder positiv) geladener Antiteilchen schließen. Zu diesem Zweck stellen wir die zur KleinGordon-Schrödinger-Gleichung (4.3) konjugiert-komplexe Gleichung auf,
h α ∂ q Aα i
h ∂α q A α φ i
m 02 c2 φ .
(4.31)
Durch Vergleich mit (4.3) erkennt man sofort: Ist φ eine Lösung positiver Ladung, so ist φ eine Lösung negativer Ladung, d. h. es besteht die Ladungskonjugation φC
Cφ
φ .
(4.32)
Anmerkung: Es sei darauf hingewiesen, daß diese einfache Möglichkeit der Ladungskonjugation durch die Transformation (4.12) zerstört wird, ψC erfüllt keine ladungskonjugierte Gleichung. Während in (4.31) alle beim Übergang zum Konjugiert-Komplexen aufgetretenen Vorzeichenwechsel durch q q kompensiert werden können, wird dies in (4.13) durch den zweiten Term der linken Seite verhindert, und der vierte Term wechselt mit q q sein Vorzeichen. Dementsprechend besteht diese Möglichkeit auch nicht bei der Schrödinger-Gleichung. Die Ursache dafür ist die mit der Transformation (4.12) verbundene Verschiebung des Energienullpunkts.
4.7 Reinterpretation der Klein-Gordon-Theorie
4.7
125
Reinterpretation der Klein-Gordon-Theorie
4.7.1 Kontinuitätsgleichung, Teilchendichte und Teilchenstrom Die konjugiert-komplexe Klein-Gordon-Schrödinger-Gleichung (4.31) lautet für den Fall der Lorenz-Eichung nach (4.5) ausführlicher h 2 φ
2 ih q Aα ∂α φ q 2AαAα φ
m 02c2 φ .
(4.33)
Um aus ihr eine Kontinuitätsgleichung abzuleiten, multiplizieren wir sie mit φ und ziehen von ihr die mit φ multiplizierte Gleichung (4.5) ab. Mit ∂ α φ ∂α φ φ∂α φ (∂ α φ )(∂α φ) (∂ α φ)(∂α φ ) φ φ φφ
φ φ
φφ
und nochmaliger Benutzung der Lorenz-Eichung ∂ αA α 0 erhalten wir ∂ α h 2 φ ∂α φ φ∂α φ 2 ih q Aα φφ 0 . Nach Multiplikation mit i/(2m 0 h ) ergibt sich daraus die Lorentz-invariante Kontinuitätsgleichung ∂ α jα
0
(4.34)
mit der Vierer-Teilchenstromdichte jα
ih 2m
0
φ ∂α φ
φ∂α φ
mq
0
A α φφ .
(4.35)
Im quasiklassischen Grenzfall stimmt diese mit der aus (4.10) folgenden Teilchenstromdichte n 0 Uα φφ (q Aα ∂α S)/m 0 überein (Aufgabe 4.7). Wird in Gleichung (4.31) φ φC gesetzt, so ist Gleichung (4.3) mit φ φC zu dieser komplex-konjugiert, und man erhält wie eben die Gültigkeit der Kontinuitätsgleichung (4.34) für die Teilchendichte jC α
ih 2m
0
φC ∂α φC
φC ∂α φC
q A α φC φC m0
jα .
(4.36)
Mit jα erfüllt auch a jα die Kontinuitätsgleichung, wobei a eine beliebige Konstante ist, die auch negativ und insbesondere gleich 1 sein kann. In der Definitionsgleichung (4.35) wurde über diesen freien Faktor so verfügt, daß j0 /c im nicht-relativistischen Grenzfall für positive Energien gerade die Teilchendichte ψψ ergibt (Beweis folgt). Wir können daher die Identifikation n j0 /c vornehmen. Aus (4.35) ergibt sich damit zunächst allgemein n
2mih c2 0
φ ∂t φ
φ∂t φ
V φφ . m 0 c2
(4.37)
126
4 Klein-Gordon-Theorie
Mit (4.12) folgt hieraus im nicht-relativistischen Grenzfall wie behauptet
2 ih i m 0 c2 V i m 0c ψ ψ ∂ ψ ψψ n ψ ψ ψ ∂ t t 2m 0 c2 h h m 0 c2
ψψ .
Dabei wurde V m 0 c2 benutzt, außerdem wurden die Zeitableitungen von ψ aufgrund der Bedingung (4.14b) vernachlässigt, was allerdings nur möglich ist, wenn der Zustand φ keine Anteile negativer Energie enthält. Setzen wir j α nc, jT , jα nc, jT , so ergibt sich aus (4.35) mit A α Φ/c, A und ∂α ∂0 , die Teilchenstromdichte ih q A φφ . (4.38) φ φ φ φ jT 2m 0 m0 Für kräftefreie Teilchen vereinfachen sich die Ergebnisse (4.37) und (4.38) zu n
ih ∂ φ φ∂t φ φ , t 2m 0 c2
jT
ih φ φ φ φ . 2m 0
(4.39)
Es ist nützlich, n und jT auch durch die in (4.15)–(4.16) definierten Spinoren auszudrücken. Mit (4.17) ergibt sich für den kräftefreien Fall n
1 (ϕ χ )(ϕ χ) (ϕ χ)(ϕ χ ) ϕ ϕ χ χ . 2
Wie man leicht verifiziert, kann dafür n
ϕ ϕ χ χ
Ψ σ3 Ψ
(4.40)
geschrieben werden. Ebenso leicht überzeugt man sich von jT
ih Ψ (1σ1 ) Ψ 2m 0
Ψ
(1σ1 )Ψ .
(4.41)
4.7.2 Physikalische Interpretation Wir kommen jetzt zur physikalischen Interpretation der erzielten Ergebnisse. Für n gilt zwar ein Erhaltungssatz, n ist jedoch nicht positiv definit, wie das bei der Identifizierung mit einer Wahrscheinlichkeitsdichte zu fordern wäre. Bei den Ebene-Welle-Lösungen (4.30) erhalten wir aus (4.39) mit i ∂t φ Eφ , φ hi p φ h als Teilchendichte und Teilchenstromdichte n
E φφ , m 0 c2
jT
p φφ . m0
(4.42)
4.7 Reinterpretation der Klein-Gordon-Theorie
127
Für Lösungen positiver Energie ist n positiv, für Lösungen negativer Energie dagegen negativ. Da bei freien Teilchen die Lösungen positiver und negativer Energie separieren, wäre das noch tolerierbar. Bei Anwesenheit elektromagnetischer Felder ist jedoch keine Separation mehr möglich. Um das zu erkennen, betrachten wir die Teilchendichte eines stationären Zustand in einem Coulomb-Feld. Mit dem Ansatz φ(x, t)
φ(x) e
i Et /h
(4.43)
folgt aus (4.37) n
E V φ(x) φ (x) . m 0 c2
(4.44)
Zunächst ist festzuhalten, daß auch die ungewohnte Definition (4.37) eine stationäre Dichte liefert. Beschreibt diese zum Beispiel ein positiv geladenes Teilchen im Feld eines positiv geladenen Kerns, so ist V positiv. Bei positiver Teilchenenergie wird dann n<0
für
V > E,
n>0
für
V < E,
d. h. nahe dem Kern, und
d. h. weiter weg vom Kern. Dieser Befund kann auf keine Weise mit einer Ein-TeilchenTheorie in Einklang gebracht werden. Schon die Existenz von Lösungen negativer Energie hat uns dazu geführt, das EinTeilchen-Konzept aufzugeben. Wir sollten daher gar nicht versuchen, n als Wahrscheinlichkeitsdichte für ein Teilchen zu aufzufassen. Stattdessen führen wir die Größen λ qn,
j
q jT
(4.45)
als elektrische Ladungs- und Stromdichte ein. Aus (4.34) folgt dann sofort der Ladungserhaltungssatz ∂t λ div j 0 . (4.46) Das Auftreten positiver und negativer Ladungen, das sich aus (4.44) und (4.45a) im Feld eines Kerns ergibt, kann im Rahmen einer Mehrteilchentheorie ganz zwanglos gedeutet werden: Die stationäre Lösung sieht so aus, daß sich nahe dem Kern überwiegend Teilchen negativer und fern dem Kern überwiegend Teilchen positiver Ladung aufhalten. Die Wellenlösungen für freie Teilchen lassen sich nach unserer Reinterpretation so deuten, daß die durch sie beschriebenen Teilchen bei negativer Energie die entgegengesetzte Ladung wie bei positiver Energie tragen. Für freie Teilchen folgt aus (4.42) und (4.45a) mit (4.28) λ()
mq Ec2 φφ mq Ecp2 φφ
0
0
,
(4.47)
wobei sich der obere Index (() oder ( )) auf Lösungen positiver bzw. negativer Energie bezieht. Es ist zweckmäßig, q>0 zu setzen, weil sich damit folgende Zuordnung ergibt: Positives E bedeutet positive und negatives E negative Teilchenladung.
128
4 Klein-Gordon-Theorie
Wegen des Erhaltungssatzes für die Ladung kann die Gesamtladung normiert werden. Wie bei der Dirac-Theorie läßt sich erwarten, daß die Klein-Gordon-SchrödingerGleichung unter gewissen eingeschränkten Bedingungen eine einigermaßen brauchbare Ein-Teilchen-Theorie zuläßt. In diesem Fall ist λ() d 3x q n () d 3x q bzw. 2 (4.47) m 0 c ( ) 3 n dx 1 oder φ () φ () d 3x (4.48) Ep zu fordern. In der Spinorformulierung bedeutet dies mit (4.40) ( ) σ3 Ψ () d 3x 1 . Ψ
(4.49)
Durch die obige Uminterpretation erhält auch das Ergebnis (4.28) eine andere Bedeutung: E Ep ist als Parameter aufzufassen, der gemäß (4.43) das Zeitverhalten von φ bestimmt, jedoch nicht mehr als physikalische Energie. In der im nächsten Teil des Buches behandelten Quantenfeldtheorie des Klein-Gordon-Schrödinger-Feldes erhalten wir als Mittelwert der physikalischen Energie Gleichung (7.60), H Ψ () σ3 H Ψ () d 3x . In Eigenzuständen von H ist der Mittelwert gleich dem Eigenwert. Mit (4.27) und (4.28) ergibt sich daher () (4.49) ( ) 3 σ3 H Ψ d x Ep Ψ () σ3 Ψ () d 3x Ep > 0 . E phys H Ψ Die physikalische Energie ist also immer positiv, auch dann, wenn der Zeitentwicklungsparameter E negativ wird. Das zu Beginn des Abschnitts 4.6 besprochene Problem der Klein-Gordon-Schrödinger-Theorie, daß der Übergang zu negativen Energien nicht wie bei der Dirac-Theorie durch deren Besetzung mit Teilchen verhindert werden kann, wird mithin durch unsere Reinterpretation behoben. Bei der Dirac-Theorie gab es keine vergleichbare Reinterpretation der Zustände negativer Energie, und daher steht zu erwarten, daß bei dieser auch die Feldtheorie zu Zuständen positiver und negativer Energie führen wird. Diese Vermutung wird sich in Abschn. 7.4.4 als richtig erweisen. Weil φC φ aus einer Lösung eines Ladungsvorzeichens eine Lösung des anderen Vorzeichens macht, kann die Klein-Gordon-Schrödinger-Gleichung (4.5) für reelle φ φ auch ungeladene Teilchen beschreiben. Real- und Imaginärteil müssen jeweils für sich die Gleichung erfüllen, daher folgt in diesem Fall 2q h Aα ∂α φ
0.
Diese Gleichung hat entweder die – nicht weiter interessierende – triviale Lösung φ const, oder aber es muß q 0 gelten. Im dem uns hier interessierenden zweiten Fall reduziert sich (4.5) auf die Gleichung (4.6) für freie Teilchen. Aus (4.45) folgt
4.8 Ladungskonjugation und CPT-Symmetrie
129
mit q 0 sinnvollerweise λ 0 und j 0. Aus den Definitionsgleichungen (4.39) für die Teilchendichte und den Teilchenstrom folgt jedoch mit φ φ auch n 0 und jT 0, d. h. diese Definitionen sind für ungeladene Teilchen nicht brauchbar. Eine brauchbare Teilchendichte wäre z. B. n Ψ Ψ ϕϕ χχ . Für reelle φ folgt aus (4.16) χ ϕ , was zu h 2 (4.16) 1 n 2ϕϕ φ 2 2 4 (∂t φ)2 2 m0c führt. Für diese Dichte gilt allerdings kein Erhaltungssatz, vielmehr ist ∂t n
∂t φ
h 2 φ 2 ∂t t φ m 0 c4
2 h (∂t2φ)φ , 2
(4.6)
m0c
und die rechte Seite läßt sich nicht in eine Divergenz umformen. Zum Schluß dieses Abschnitts gehen wir der Frage nach, welche Teilchen durch die Klein-Gordon-Schrödinger-Gleichung beschrieben werden. Wie schon festgestellt wurde, muß es sich um Spin-0-Teilchen endlicher Masse handeln. Stabile Teilchen mit diesen Eigenschaften sind nicht bekannt. Relativ langlebige Teilchen mit diesen Eigenschaften sind das π -, das π - und das π 0 -Meson. Das π - und das π -Meson tragen entgegengesetzte Ladung und sind Teilchen und Antiteilchen. Das π 0 -Meson ist sein eigenes Antiteilchen.
4.8
Ladungskonjugation und CPT-Symmetrie
Die zu φ konjugiert-komplexe Wellenfunktion φC beschreibt ein Teilchen der umgekehrten Ladung wie φ. Am Beispiel der freien Wellenlösung (4.30) erkennen wir, daß das durch φC φ φ0 ei ( px Et )/h beschriebene Antiteilchen auch umgekehrten Impuls und eine Energie umgekehrten Vorzeichens besitzt wie das durch φ beschriebene Teilchen. Die Situation ist also völlig analog zum Fall der Dirac-Gleichung (siehe (2.239) und (2.242)). Es ist nützlich, die Transformation der Ladungskonjugation auf die Spinordarstellung zu übertragen. Aus den Gleichungen (4.16)–(4.17) ergibt sich mit φC φ ϕC χC
12
φC
1 φC 2
mihc2 ∂t φC 12 0
ih ∂t φ C m 0 c2
oder ΨC
12
ϕ χ ϕ χ χ , ϕ χ ϕ χ ϕ
χ σ1 Ψ . ϕ
(4.50)
130
4 Klein-Gordon-Theorie
Aus (4.40b) folgt, wie zu erwarten, nC
(Q7.43) (Q7.47)
ΨC σ3 ΨC
(4.50)
(Ψ ) σ3 Ψ
(Ψ ) σ1 σ3 σ1 Ψ
(Q7.39c)
(Q7.43)
(Ψ σ3 Ψ )
n
(Ψ ) σ1 σ1 σ3 Ψ
n.
Kombiniert man die Transformation der Ladungskonjugation mit der Raumspiegelung am Koordinatenursprung und der Zeitumkehr, so erhält man mit ∂ α ∂ α und Aα Aα (wie bei der Dirac-Gleichung) aus (4.31) die Gleichung
h α ∂ q Aα i
h ∂α i
q A α φC
m 02 c2φC .
Diese Gleichung ist identisch mit der Klein-Gordon-Schrödinger-Gleichung für φ, was bedeutet: Ein Teilchen, das am Ursprung gespiegelt zeitlich rückwärts läuft, ist nicht zu unterscheiden von einem Teilchen umgekehrter Ladung, das räumlich ungespiegelt in der Zeit vorwärts läuft.
Aufgaben 4.1
Die Ableitung der Klein-Gordon-Schrödinger-Gleichung ist auch möglich, indem man einen allgemeinen Ansatz für eine lineare partielle Differentialgleichung zweiter Ordnung mit zunächst offengelassenen Koeffizienten wählt und diese über das Korrespondenzprinzip bestimmt.
4.2
Beweisen Sie in relativistischer Notation, daß jede Komponente eines die Dirac-Gleichung freier Teilchen erfüllenden Dirac-Spinors auch der KleinGordon-Schrödinger-Gleichung genügt. (Der Beweis wird viel einfacher als in Abschn. 2.6.)
4.3
Welche Differentialgleichung zweiter Ordnung anstelle der Klein-GordonSchrödinger-Gleichung erfüllen die Komponenten eines Dirac-Spinors bei Anwesenheit elektromagnetischer Felder ?
4.4
Leiten Sie den nicht-relativistischen Grenzfall der Klein-Gordon-SchrödingerGleichung für negative Energien ab.
4.5
Bestimmen Sie die Schrödinger-Darstellung der Klein-Gordon-SchrödingerGleichung mit elektromagnetischem Feld Aα Φ/c, A. Anleitung: Führen Sie die Felder über die minimale Kopplung in die SpinorGleichung ein und zeigen Sie, daß daraus die skalare Klein-Gordon-SchrödingerGleichung für Teilchen in elektromagnetischen Feldern folgt.
4.6
Zeigen Sie, daß jeder Lösungsspinor Ψ der Schrödinger-Form i h ∂t Ψ H Ψ der Klein-Gordon-Schrödinger-Gleichung diese auch in ihrer ursprünglichen Form erfüllt.
Aufgaben
4.7
131
Zeigen Sie, daß die Stromdichte jα
ih q Aα φφ φ ∂α φ φ∂α φ 2m 0 m0
im quasiklassischen Grenzfall – auch relativistisch – mit der Stromdichte jα φφ Uα übereinstimmt. Besteht diese Übereinstimmung auch im Quantenregime? Anleitung: Setzen Sie für den quasiklassischen Grenzfall φ A eiS/h an. 4.8
4.9
Leiten Sie eine Formel für d L /dt ab, wenn L durch Ψ σ3 LΨ L d 3x definiert wird. Setzen Sie insbesondere L x und bestimmen Sie den Geschwindigkeitsoperator Ú aus der Definitionsgleichung Ú d x /dt. ϕ L sei ein Operator im Raum der Klein-Gordon-Spinoren Ψ χ . 1. Welche Bedingung muß L erfüllen, damit der durch Ψ σ3 LΨ L d 3x definierte verallgemeinerte Mittelwert reell ist? (Beweis!) 2. Wird diese Bedingung vom Hamilton-Operator p 2 2 H i σ2 σ3 m 0 c σ3 2m 0 des kräftefreien Falls erfüllt? 3. In der Literatur findet sich die Behauptung, der Operator ih ∂t erfülle diese Bedingung. Ist das richtig? Gehen Sie zur Diskussion dieser Frage zur Definition des adjungierten Operators zurück.
Lösungen 4.2
Wird auf die Dirac-Gleichung für freie Teilchen, (h/i)γ α ∂α ψ m 0 c ψ 0 , der Operator γ β (h/i) ∂β angewandt, so folgt mit γ β γ α ∂β ∂α h
α β α β 1 α β β α γ γ ∂α ∂β (γ γ γ γ )∂α ∂β 2
2 β α
γ γ ∂β ∂α ψ m 0 cγ β (h/i)∂β ψ h2 γ α , γ β ∂α ∂β ψ m 02 c2 ψ (2.204) 2 αβ ∂ ∂ ψ m 2 c2 ψ h 2 ψ m 2 c2 ψ 0 . h g α β 0 0 2
(Im zweiten Schritt wurde die Vertauschbarkeit der Ableitungen ∂α und ∂β benutzt.) 4.3
Läßt man auf die Dirac-Gleichung h γ α ∂α i
q Aα ψ
m0c ψ
0
132
4 Klein-Gordon-Theorie den Operator γ β (h/i)∂β q Aβ einwirken, so ergibt sich unter erneuter Benutzung der Dirac-Gleichung für den letzten Term der linken Seite γ β γ α L βα m 20 c2 ψ i hqγ β γ α ∂β A α ψ mit L βα h 2 ∂α ∂β i hq(A α ∂β Aβ ∂α ) q 2 A α Aβ L αβ . Unter Benutzung von γ α γ β L αβ γ β γ α ∂β A α
1 α β (2.204) γ β γ α L βα γ β γ α L αβ γ γ γ β γ α L αβ g αβ L αβ , 2 γ α γ β ∂α Aβ γ α , γ β γ β γ α ∂α A β
∂ β Aβ 0 β α ∂ A 2g αβ ∂α A β γ β γ α ∂α A β γ γ α β α β 1 α β 1 β α γ γ γ γ ∂β A α ∂α A β ∂α Aβ ∂β A α 2 2 ergibt sich die Differentialgleichung
Gψ
i hq α β γ γ ∂α A β ∂β A α 2
mit G h 2 2 ih q Aα ∂α q 2A αA α m 02 c2 . Nun ist γ α γ β ∂α A β ∂β Aα γ 0 γ l (∂0 Al ) (∂l A 0 ) γ l γ 0 (∂l A 0 ) (∂0 Al ) γ l γ m (∂l A m ) (∂m Al ) l,m zykl l,m antizykl
2γ 0 γ l (∂0 Al ) (∂l A0 ) 2
γ l γ m (∂l A m ) (∂m Al )
l,m zykl (2.206) 2
c
« (∂t A Φ)
2 n Σ (rot A)n i n
2
« E c
i ¦B ,
wobei zuletzt E ∂t AΦ und B rot A benutzt wurde. Damit ergibt sich schließlich die Gleichung « E ¦ B . Gψ hq i c 4.6
Läßt man auf die Gleichung (ih ∂t H )Ψ 0 den Operator (ih ∂t H ) einwirken, so ergibt sich (h 2 ∂t t H 2 )Ψ 0 . Mit (4.21) 1 1 1 1 0 0 (i σ2 σ3 )(i σ2 σ3 ) , 1 1 1 1 0 0 σ2 σ3 σ3 σ2 0 und σ32 1 folgt aus (4.22b) H 2
(i σ2
σ3 )σ3 σ3 (i σ2 σ3 )
Damit ergibt sich schließlich h2
1 ∂t t c2
h 2 c2 2
Ψ
m 20 c4 σ32
m 20 c2 Ψ
0.
h
2 c2 m 2 c 4 . 0
II
Quantenfeldtheorie
5
Einleitung zur Quantenfeldtheorie
In der gewöhnlichen Quantenmechanik mußten wichtige Ingredienzien wie die Normierung der Wellenfunktion auf eins oder ganze Zahlen n>1 und das Spin-StatistikTheorem als nicht aus der Theorie ableitbare Postulate eingeführt werden. Die relativistische Quantenmechanik wiederum erwies sich verschiedentlich unbrauchbar als Theorie für Systeme fester Teilchenzahl. Dies und anderes weist auf die Notwendigkeit eines Überbaus beider Theorien hin, und einen solchen liefert die Quantenfeldtheorie. Im Grunde markiert schon A. Einsteins Lichtquantenhypothese aus dem Jahr 1905 den Beginn einer Quantenfeldtheorie, der Quantentheorie des elektromagnetischen Feldes. (Es sei daran erinnert, daß Planck seine Quantenhypothese auf den Energieaustausch zwischen den atomaren Oszillatoren in den Wänden eines Strahlungshohlraums und der Hohlraumstrahlung beschränkte.) Allerdings war das zu einer Zeit, in der die Quantenmechanik noch in den Kinderschuhen steckte und ihre Grundlagen erst nach und nach gelegt bzw. entdeckt wurden. Erst nach ihrer Ausarbeitung durch M. Born, W. Heisenberg sowie P. Jordan einerseits und E. Schrödinger andererseits war die Zeit reif für den Beginn systematischer Arbeiten in Richtung einer Quantenfeldtheorie. 1926 wandten Born, Heisenberg und Jordan die von ihnen entwickelten Methoden der Quantenmechanik auf ein freies Strahlungsfeld an und stellten fest, daß sich dieses wie eine Ansammlung harmonischer Oszillatoren verhält. Schon kurz darauf wurden die gleichen Methoden auf andere Felder wie das zur Beschreibung der Quantendynamik von Punktteilchen benutzte Schrödinger-Feld ψ(x, t) angewandt, erstmals 1927 von Jordan. Weil es sich dabei um die Quantisierung eines selbst zu Quantisierungszwecken eingeführten Feldes handelt, wurde dafür der Begriff zweite Quantisierung eingeführt. (Heute wird dieser überwiegend als unpassend empfunden, beim elektromagnetischen Feld z. B. gibt es keine vorangegangene Quantisierung.) Durch die Quantisierung werden den Feldern Teilchen zugeordnet. Umgekehrt werden die Quanteneigenschaften aller Teilchen durch Felder beschrieben, so daß heute eine Gleichberechtigung zwischen Feldern und Teilchen besteht. Die Ausarbeitung einer allgemein anwendbaren Quantenfeldtheorie zog sich bis etwa 1950 hin, und an ihr waren außer den bereits genannten unter anderen P. Dirac, F. Dyson, E. Fermi, R. Feynman, V. Fock, W. Furry, H. Kramers, R. Oppenheimer, W. Pauli, J. Schwinger, S.-I. Tomanaga, V. Weisskopf, J. Wheeler, E. Wigner und H. Yukawa beteiligt. 1948-50 publizierte Feynman seine Arbeiten über die heute so berühmten Feynman-Diagramme und die Regeln zu ihrer mathematischen Auswertung. Einen gewissen Abschluß erhielt die Theorie 1949 durch eine Arbeit Dysons über Renormierbarkeit, der damit ein erstmals 1929-30 in Arbeiten von Heisenberg und Pauli aufgezeigtes Divergenzproblem einer breit akzeptierten Lösung zuführte und damit die Basis für das Vertrauen in die allgemeine Anwendbarkeit der Quantenfeldtheorie schuf. Die Quantenfeldtheorie vereint in sich drei Theorien, die Quantentheorie, die Feldtheorie und die Spezielle Relativitätstheorie. Sie ist eine unabdingbare Voraussetzung
136
5 Einleitung zur Quantenfeldtheorie
der Elementarteilchentheorie, auch wenn sich möglicherweise einmal herausstellen könnte, daß auch sie eine nur für hinreichend niedrige Energien gültige Näherung an eine noch fundamentalere Theorie wie z. B. die Stringtheorie darstellt. Ihre Methoden haben sich auch in anderen Gebieten wie der Kernphysik, der Physik der kondensierten Materie oder der Astrophysik bewährt. Viele Physiker werden sie in ihrer beruflichen Tätigkeit kaum je benötigen, aber sie ist eine grandiose Errungenschaft des menschlichen Geistes, von der wenigstens die Anfangsgründe zur Allgemeinbildung jedes interessierten Physikers gehören sollten. Ihre prinzipiellen Ideen sind einleuchtend und nicht schwerer zu verstehen als die Grundlagen anderer Gebiete der Physik. Leider sind jedoch viele Rechnungen sehr aufwendig, und oft werden diese aus Platzgründen so verkürzt dargestellt, daß das Nachvollziehen zu einer mühevollen Angelegenheit wird. Die in diesem Buch angebotene Einführung in die Theorie hat nicht das Ziel, demjenigen, der auf dem Gebiet arbeiten will, das gesamte dafür notwendige Rüstzeug bereitzustellen. Vielmehr wird versucht, unter dem Verzicht auf Vollständigkeit den Leser ohne allzugroße Mühen und daher in großer Ausführlichkeit so weit in die Theorie einzuführen, daß er am Ende in der Lage sein sollte, bei Bedarf ausführlichere Spezialwerke studieren zu können. Der Versuch möglichst hoher Verständlichkeit wird also mit dem Preis hochgradiger Unvollständigkeit bezahlt, das Ziel ist ein pädagogisches und kein enzyklopädisches. Wegen dieser Unvollständigkeiten ist am Ende des Buches auch eine kurze Liste weiterführender Literatur angegeben. Das erste Kapitel dieses Buchteils (Kapitel 6) knüpft direkt an die Ausführungen der Abschnitte Q9.1 und Q9.2 über Vielteilchensysteme an. Durch die Einführung von Erzeugungs- und Vernichtungsoperatoren gelingt der Übergang zu einer Darstellung, bei der auch formal nicht mehr zwischen ununterscheidbaren Teilchen unterschieden werden muß. Die dadurch erhaltene Struktur ist schon die der Quantenfeldtheorie. Von den verschiedenen Wegen, auf denen man zu einer systematischen Quantenfeldtheorie gelangen kann, wird hier nur der Weg der kanonischen Feldquantisierung beschritten, der eine direkte Verallgemeinerung des Quantisierungsverfahrens der gewöhnlichen Quantenmechanik darstellt. Zur seiner Vorbereitung werden zuerst ein Lagrangescher und ein Hamiltonscher Formalismus für „klassische Felder“ entwickelt. Dann werden in Analogie zu dem Übergang von den Variablen qi und pi der klassischen Mechanik zu Operatoren qi und p i Feldern wie den Klein-Gordon-Schrödinger-Feldern φ(x, t) und h 2 ∂t φ(x, t)/(2m 0 c2 ) Feldoperatoren φ(x, t) und π(x, t) zugeordnet. Ein zweiter und ebenso wichtiger Weg, der die Feynmansche Pfadintegralmethode benutzt, bleibt ebenso unbesprochen wie mehr intuitive Methoden der Feldquantisierung, die denen von Born, Heisenberg und Jordan ähneln. Die Methode der kanonischen Feldquantisierung wird zunächst auf freie Felder angewandt. Anschließend werden Wechselwirkungsprozesse untersucht, wobei die in Abschn. Q8.4 entwickelten Methoden der Störungsrechnung im Wechselwirkungsbild zum Einsatz kommen. Ein wichtiges Phänomen ist dabei das Auftreten von Divergenzen. Diese können jedoch durch eine Renormierung beseitigt werden, bei der physikalische Parameter so umdefiniert werden, daß am Schluß nur endliche Größen übrig bleiben. Auch hier können nur die Anfangsgründe besprochen werden. Da im nächsten Teil des Buches eine kurze Einführung in die Elementarteilchentheorie folgt, konzentrieren sich die Anwendungen in diesem Teil im wesentlichen auf die Quantenelektrodynamik.
6
Fock-Darstellung von Viel-Teilchen-Zuständen
Die Konstruktion vollständig symmetrischer bzw. vollständig antisymmetrischer Zustände durch Superposition von Viel-Teilchen-Zuständen, bei denen formal zwischen – an sich ununterscheidbaren – identischen Teilchen unterschieden wird, ist einerseits konzeptionell unbefriedigend und andererseits auch umständlich. Es gibt jedoch auch eine Darstellung ohne dieses Manko. Bei dieser wird das System identischer Teilchen nicht mehr durch Permutationen konkreter, aus Ein-Teilchen-Zuständen aufgebauter Viel-Teilchen-Zustände beschrieben, sondern es wird nur noch angegeben, mit wievielen Teilchen jeder mögliche Ein-Teilchen-Zustand besetzt ist. Es wird sich zeigen, daß die derart charakterisierten Zustände durch die sukzessive Einwirkung von Erzeugungsoperatoren auf einen Vakuumzustand erzeugt werden können. Wir beschränken unsere Beschäftigung mit dieser Darstellung zunächst auf den Fall, daß die Ein-TeilchenZustände der betrachteten identischen Teilchen vollständig durch die Eigenzustände eines Operators mit diskretem Spektrum beschrieben werden können. Wie die dabei erzielten Ergebnisse auf den Fall eines kontinuierlichen Spektrums übertragen werden können, ist evident und wird bei der Einführung von Feldoperatoren demonstriert.
6.1
Darstellung von N-Teilchen-Zuständen
Wir gehen in diesem Abschnitt von den in Abschn. Q9.2.5 eingeführten Basiszuständen α1 . . . ζ N zu einer neuen Darstellung, der Besetzungsdarstellung oder FockDarstellung mit den Basisvektoren N n 1 , n 2 , . . . über. Die durch ein Semikolon abgetrennte erste Zahl N gibt die Gesamtteilchenzahl des Zustands an. An diese anschließend kommt für jeden der nach einem festgelegten Schema angeordneten Ein-Teilchen-Zustände der Reihe nach ein fester Platz; die dem κ-ten Zustand zugeordnete Besetzungszahl n κ gibt an, wieviele Teilchen sich in diesem befinden. Das Subskript oder indiziert wie bisher, ob es sich um einen vollständig symmetrischen oder antisymmetrischen Zustand handelt. Bei Bosonen besteht für die auf eins normierten Zustände neuer Schreibweise der Zusammenhang N 1 (Q9.68) N n 1 , n 2 , . . . α1 . . . ζ N 8 Pρ α1 β2 . . . ζ N (6.1) N κ n κ ρ 1
138
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Teilchennummer Zustandsnummer Besetzungszahl
i κ nκ
1 0
1 2 1
2 3 1
4 0
3 6 1
5 0
7 0
4 8 1
9 0
5 10 1
... ... ...
Tabelle 6.1: Beispiel einer geordneten Besetzung des Basiszustands bei Fermionen.
mit den Ein-Teilchen-Zuständen ακ . Auf der linken Seite können die Zahlen nκ beliebige Werte zwischen 0 und N annehmen und müssen nur κ n κ N erfüllen.1 Auf der rechten Seite treten nur besetzte Ein-Teilchen-Zustände auf. Weil in N n 1 , n 2 , . . . der κ-te Zustand von n κ Teilchen angenommen wird, κ 1, 2, . . . , befinden sich in dem Produktzustand α1 β2 . . . ζ N für jedes n κ 2 jeweils n κ gleiche Ein-Teilchen-Zustände, die gleichzeitig von verschiedenen Teilchen angenommen werden. Die Zuordnung der Teilchennummern i zu den in der neuen Notierung mit Nummern κ versehenen Zuständen im Basiszustand α1 β2 . . . ζ N , aus dem die permutierten Zustände Pρ α1 β2 . . . ζ N hervorgehen, kann willkürlich gewählt werden, beispielsweise kann der von Teilchen 1 besetzte Zustand α in der für N n 1 , n 2 , . . . gewählten Reihenfolge der Zustände an beliebiger Stelle stehen. Bei Fermionen besteht der Zusammenhang N n 1 , n 2 , . . .
α1 . . . ζ N
(Q9.68)
N
1
N
ρ 1
( 1) p(ρ) Pρ α1 β2 . . . ζ N (6.2)
mit den Ein-Teilchen-Zuständen ακ . Durch das Pauli-Verbot ist n κ auf die Werte 0 oder 1 eingeschränkt, alle Zustände sind entweder unbesetzt oder nur einfach besetzt, und wieder muß κ n κ N gelten. Auf der rechten Seite treten wieder nur besetzte Ein-Teilchen-Zustände auf, jeder allerdings nur einmal. Bei den Fermionen erweist sich eine festgelegte Zuordnung i i (κ) der Teilchennummern i zu den Zustandsnummern κ im Basiszustand α1 β2 . . . ζ N als nützlich. Diese wird so gewählt, daß Teilchen 1 in der für N n 1 , n 2 , . . . festgelegten Reihenfolge der Zustände den ersten, Teilchen 2 den zweiten besetzten Zustand einnimmt usw. Weil es im allgemeinen mehr Zustände als Teilchen gibt und daher immer einige Zustände unbesetzt bleiben, ist die Zustandsnummer im Basiszustand mindestens gleich der Teilchennummer. (Tabelle 6.1 gibt dafür ein Beispiel.) Der Zusammenhang zwischen der Teilchennummer i und Zustandsnummer κ ist für das angegebene Ordnungsschema i (κ)
κ
nλ .
(6.3)
λ 1
Der Hilbert-Raum N der N-Teilchen-Besetzungszustände ist gegenüber dem von den Basiszuständen α1 . . . ζ N aufgespannten Hilbert-Raum sowohl für Bosonen als 1 In den Zuständen α1 β2 . . . ζ N werden für allgemeine Teilchennummern lateinische Buchstaben, z. B. i und j, benutzt. Zur besseren Unterscheidung zwischen Teilchen- und Zustandsnummern werden im folgenden für allgemeine Zustandsnummern griechische Indizes benutzt, z. B. n κ und n λ für die Besetzungszahlen des κ-ten bzw. λ-ten Zustands.
6.2 Erzeugungs- und Vernichtungsoperatoren für Bosonen
139
auch Fermionen dahingehend erweitert, daß auch Zustände zugelassen werden, in denen Ein-Teilchen-Zustände unbesetzt bleiben. Im Zustand 0, dem einzigen Zustand des Raums 0 , sind alle Ein-Teilchen-Zustände unbesetzt. Sowohl bei Bosonen als auch bei Fermionen sind zwei Zustände genau dann gleich, wenn sie in allen Besetzungszahlen übereinstimmen. Die Wirkung von Operatoren auf die Zustände N n 1 , n 2 , . . . läßt sich am besten mit Hilfe einer Kombination von Erzeugungs- und Vernichtungsoperatoren darstellen, deren separate Einwirkung die Gesamtteilchenzahl N um eins erhöht bzw. erniedrigt (Abschn. 6.2, 6.3 und 6.5). Es ist daher nützlich, auch einen Hilbert-Raum 9
N
N 0
zuzulassen, der die Zustände aller N-Teilchen-Hilberträume inklusive den Vakuumzustand 0 0 0, 0, . . . , 0 (6.4) enthält. In wird ein Skalarprodukt erklärt, das den üblichen Linearitätseigenschaften genügt. Die Basiszustände (6.1) bzw. (6.2) sollen die Orthonormalitätsrelationen + (6.5) N n1 , . . . N n1 , . . . δ N N δnκ nκ ¼
¼
κ
erfüllen, womit auch das bisher nicht erklärte Skalarprodukt zweier Zustände mit verschiedener Gesamtteilchenzahl (N N ) zu null erklärt wird. Auch der Vakuumzustand ist auf eins normiert, 0 0 1 . (6.6) Die Übertragung der Vollständigkeitsrelationen (Q9.66) auf die jetzige Notation ergibt die für den N gültige Vollständigkeitsrelation N n 1 , . . . N n 1 , . . . 1 . (6.7)
n 1 ,n 2 ,... nκ N
Für N 0 folgt hieraus insbesondere 00
6.2
1.
(6.8)
Erzeugungs- und Vernichtungsoperatoren für Bosonen
Für Bosonen definieren wir jetzt einen Erzeugungsoperator b κ , der einem vorerst noch offen gelassenen Operator bκ adjungiert ist. bκ soll jedem vollständig symmetrischen N-Teilchen-Basiszustand N . . . , n κ , . . . durch die Festlegung bκ N . . . , n κ , . . .
n κ 1 N 1 . . . , n κ 1, . . .
(6.9)
140
6 Fock-Darstellung von Viel-Teilchen-Zuständen
einen vollständig symmetrischen (N 1)-Teilchen-Zustand zuordnen, bei dem sich im κ-ten Zustand ein Teilchen mehr befindet. (Die Erklärung für den Faktor n κ 1 wird in Abschn. 6.5 gegeben.) Insbesondere soll der Operator bκ den Ein-Teilchen-Zustand 1 0, . . . , 1, . . . aus dem Vakuumzustand 00 0, . . . , 0, . . . erzeugen, bκ 0 b κ 0 0, . . . , 0, . . . 1 0, . . . , 1, . . . .
(Die in (Q4.97) eingeführten Leiteroperatoren L mit den Eigenschaften (Q4.106) erhöhen bzw. erniedrigen den Quantenzustand eines Teilchens um ein Quant und sind den hier bzw. weiter unten eingeführten Erzeugungs- und Vernichtungsoperatoren verwandt – durch L wird sozusagen ein Teilchen in einem Quantenniveau vernichtet und eines in dem darunter bzw. darüber gelegenen erzeugt.) Jeder N-Teilchen-Zustand kann durch sukzessive Anwendung von Erzeugungsoperatoren aus dem Vakuumzustand erzeugt werden, denn es gilt
N . . . , nκ , . . . 1n bκ N 1 . . . , nκ 1, . . . κ
n
1 (bκ )2 N 2 . . . , n κ 2, . . . κ (n κ 1)
...
1n (bκ)n N nκ . . . , 0, . . . κ κ
usw., d. h.
N n 1 , n 2 , . . .
$
+ κ 1,2,... nκ N
% ' 1 n n (bκ ) κ '0 0, 0, . . . . κ
(6.10)
Dadurch, daß das Skalarprodukt in (6.5) auch für Zustände verschiedener Gesamtteilchenzahl N erklärt wurde, erhalten wir die Möglichkeit, den zu bκ adjungierten Operator bκ zu berechnen. Aus der üblichen Definition b κ N . . . , N . . . N . . . , bκ N ergibt sich
N . . . , n κ , . . . bκ N . . . , nκ , . . . bκ N . . . , n κ , . . . , N . . . , nκ , . . .
(6.9)
n κ 1 N 1 . . . , n κ 1, . . . N . . . , nκ , . . . (6.5) nκ 1 δ N 1,N δn1 ,n1 . . . δnκ 1,nκ . . . nκ δ N,N 1 δn1 ,n1 . . . δnκ ,nκ 1 . . .
(6.5)
n κ N . . . , n κ , . . . N 1 . . . , n κ 1, . . . ,
wobei δκλ δκ 1,λ1 und zuletzt die Orthonormalitätsrelation (6.5) (von rechts nach links gelesen) benutzt wurde. Die abgeleitete Gleichung gilt für sämtliche Basiszu-
6.2 Erzeugungs- und Vernichtungsoperatoren für Bosonen
141
N . . . , n κ , . . . und kann nur zutreffen, wenn
stände
bκ N . . . , n κ , . . .
n κ N 1 . . . , n κ 1, . . .
(6.11)
gilt. (Die gestrichenen Größen, für die sie abgeleitet wurde, haben wir dabei in ungestrichene umbenannt.) Die Wirkung des Operators bκ auf einen Zustand N . . . , n κ , . . . besteht also darin, daß im κ-ten Ein-Teilchen-Zustand ein Teilchen weggenommen wird – daher der Name Vernichtungsoperator. Aus (6.11) folgt insbesondere bκ N . . . , 0, . . . 0 ,
bκ 0 0 .
Die Erzeugungs- und Vernichtungsoperatoren erfüllen die Vertauschungsrelationen b κ , b λ b κ
, bλ 0 ,
b κ , b λ δκλ .
(6.12)
Beweis: (6.12a,b) folgt aus der Gültigkeit der Relationen bκ bλ N . . . , n κ , . . . , n λ , . . .
n κ n λ N 2 . . . , n κ 1, . . . , n λ 1, . . .
bλ bκ N . . . , n κ , . . . , n λ , . . .
und bκ bλ N . . . , n κ , . . . , n λ , . . .
(n κ 1)(n λ 1) N 2 . . . , n κ 1, . . . , n λ 1, . . .
bλ bκ N . . . , n κ , . . . , n λ , . . .
für sämtliche Basiszustände. (6.12c) folgt aus bκ bλ N . . . , n κ , . . . , n λ , . . .
n κ (n λ 1) N . . . , n κ 1, . . . , n λ 1, . . .
bλ bκ N . . . , n κ , . . . , n λ , . . .
(6.13)
für κ λ sowie bκ bκ N . . . , n κ , . . .
bκ n κ 1 N 1 . . . , n κ 1, . . .
(n κ 1) N . . . , n κ , . . .
und bκ bκ N . . . , n κ , . . .
bκ
n κ N 1 . . . , n κ 1, . . .
n κ N . . . , n κ , . . . (6.14)
mit der Folge (bκ bκ
bκ bκ ) N . . . , n κ , . . .
für alle Zustände N . . . , n κ , . . . .
(n κ 1n κ ) N . . . , n κ , . . .
N . . . , n κ , . . .
142
6.3
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Erzeugungs- und Vernichtungsoperatoren für Fermionen
Für Fermionen definieren wir einen Erzeugungsoperator a κ durch die Forderung a κ N . . . , n κ , . . .
(1) Nκ δn κ ,0 N 1 . . . , n κ 1, . . .
mit Nκ
nλ .
(6.15)
(6.16)
λ<κ
Der Faktor δn κ ,0 erlaubt für a κ N . . . , n κ , . . . gemäß dem Pauli-Verbot im κ-ten EinTeilchen-Zustand nur einfache Besetzung, die Anwendung von a κ auf einen im κ-ten Ein-Teilchen-Zustand schon besetzten Viel-Teilchen-Zustand liefert null, a κ N . . . , n κ 1, . . .
0.
Man beachte, daß dies nicht mit einer Erzeugung des Vakuumzustands verwechselt werden darf, die erneute Anwendung von a κ liefert a κ a κ N . . . , n κ 1, . . . a κ 00 , während a κ 0 1 0, . . . , n κ 1, . . . wäre. Infolgedessen gilt für jeden beliebigen Zustand N . . . , n κ , . . . 2 a κ N . . . , n κ , . . . 0 , woraus 2 a κ 0 (6.17) folgt. Der Faktor ( 1) Nκ auf der rechten Seite von (6.15) ist eine nützliche Konvention, die mit der Darstellung antisymmetrischer Zustände durch Slater-Determinanten bzw. durch (6.2) zu tun hat und wie folgt verstanden werden kann: Wird für den Fermionenzustand N n 1 , n 2 , . . . die Darstellung (6.2) mit der dort gewählten und in Tabelle 6.1 illustrierten Zuordnung zwischen Teilchen- und Zustandsnummern des Basiszustands α1 β2 . . . ζ N benutzt, so definiert man die Wirkung des Erzeugungsoperators a κ auf diese durch N 1 a κ (1) p(ρ) Pρ α1 β2 ζ N (6.18) N ρ 1 (N 1) 1 (1) p(ρ) Pρ κ1 α2 β3 ζ N 1 . (N 1) ρ 1
Der durch a κ erzeugte Ein-Teilchen-Zustand wird also mit Teilchen 1 besetzt, und um das zu ermöglichen, werden die Platzziffern der bereits vorhandenen Teilchen um eins heraufgesetzt. Damit der neue Viel-Teilchen-Zustand in der Besetzungsdarstellung ausgedrückt werden kann, muß κ1 α2 β3 ζ N 1 gemäß dem für die Darstellung (6.2) benutzten Ordnungsschema angeordnet werden. Hierzu wird der Ein-Teilchen-Zustand κ in κ1 α2 β3 ζ N 1 durch sukzessive Zwei-TeilchenVertauschungen so lange nach rechts geschoben, bis er an seinen richtigen Platz i (κ)
6.3 Erzeugungs- und Vernichtungsoperatoren für Fermionen
143
gelangt ist. Weil hierzu i (κ) 1 Zwei-Teilchen-Vertauschungen notwendig sind, gilt mit i (κ) 1 κλ 1 n λ 1 λ<κ n λ Nκ nach (6.3) und (6.16) (der vorletzte Schritt folgt aus n κ 1) ( 1) p(ρ) Pρ κ1 α2 β3 ζ N
1
(
1) p(ρ)
Nκ
Pρ α1 β2 κi ζ N
1
.
Hiermit folgt aus der Definition (6.18) a κ
1
N
N ρ 1
( 1) p(ρ) Pρ α1 β2 ζ N
((N1) 1) Nκ
(N 1) ρ 1
( 1) p(ρ) Pρ α1 β2 κi ζ N
1
,
was mit (6.2) schließlich zu (6.15) führt. Auch bei Fermionen läßt sich jeder Zustand durch sukzessive Einwirkung von Erzeugungsoperatoren auf den Vakuumzustand darstellen: Aus (6.15) folgt
N . . . , 1, . . . ( und
N n1 , n2 , . . .
$
1) Nκ a κ N 1 . . . , 0, . . . % + ' Nκ ( 1) a '0 0, 0, . . . . κ
(6.19)
κ 1,2,... nκ N
Der zu a κ adjungierte Operator a κ ist wieder ein Vernichtungsoperator: Zunächst gilt
N
. . . , n , . . . a N . . . , n , . . . a N
. . . , n , . . . , N . . . , n , . . . κ κ κ κ κ κ
(6.5) s.u. (6.5)
(6.15)
( 1) Nκ δn κ ,0 N 1 . . . , n κ 1, . . . N , . . . , n κ , . . . ( 1) Nκ δn κ ,0 δ N
1,N δn 1 ,n 1
. . . δn κ
1,n κ
...
( 1)n κ δn κ ,1 δ N,N 1 δn 1 ,n1 . . . δn κ ,nκ 1 . . .
( 1)n κ δn κ ,1 N . . . , n κ , . . . N 1 . . . , n κ 1, . . . , wobei für den Ausdruck in der vorletzten Zeile Nκ Nκ λ<κ nλ und δn κ ,0 δn κ ,1 benutzt wurde. Das gilt, weil dieser wegen der Faktoren δn ζ ,nζ für ζ < κ sowie der Faktoren δnκ 1,nκ und δn κ ,0 in der Zeile davor nur für n 1 n1, . . . , n κ 1 n κ 1 und für 0 n κ n κ 1 von null verschieden ist. Unter erneutem Weglassen des Strichs folgt daher a κ N . . . , n κ , . . .
(
1) Nκ δn κ ,1 N 1 . . . , n κ 1, . . . .
(6.20)
Der Faktor δn κ ,1 erlaubt für N . . . , n κ , . . . nur einfach besetzte Zustände κ, und die Anwendung von a κ auf einen an der κ-ten Stelle unbesetzten Zustand liefert null, a κ N . . . , n κ 0, . . .
0.
144
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Generell gilt a κ2 N . . . , n κ , . . . mit der Folge
0 für jeden beliebigen Zustand N . . . , n κ , . . . a κ2
0.
(6.21)
Für die Erzeugungs- und Vernichtungsoperatoren gelten die Vertauschungsrelationen a , a λ
a , a λ
κ
κ
0,
a , a λ
κ
δκλ ,
(6.22)
wobei die Definition
L, M
LM
ML
(6.23)
für Antikommutatoren L, M eingeführt wurde. Beweis: Für κ λ folgen die Vertauschungsrelationen (6.22a,b) unmittelbar aus (6.17) und (6.21). Sei daher λ > κ. Dann ist aκ aλ N .., n κ , .., n λ , .. (1) Nκ (1) Nλ δnκ ,0 δn λ ,0 N 2 .., n κ 1, .., n λ 1, .. mit Nκ n μ , Nλ n μ und μ<κ
μ<λ
aλ aκ N .., n κ , .., n λ , ..
¼
(1) Nλ (1) Nκ δn κ ,0 δn λ ,0 N 2 .., n κ 1, .., n λ 1, ..
s.u.
aκ
aλ N .., n κ , .., n λ , ..
mit Nκ wie oben und Nλ Nλ 1, weil n κ vor der Einwirkung von aλ um 1 erhöht wurde. Hieraus folgt (6.22b). Der Beweis von (6.22a) und der Beweis für λ<κ verlaufen ähnlich. Zum Beweis von (6.22c) berechnen wir zunächst aκ aκ N .., n κ , ..
(6.20)
aκ (1) Nκ δn κ ,1 N 1 .., n κ 1, ..
(6.15)
(1)2Nκ δnκ ,1 N .., n κ , ..
(6.24)
δnκ ,1 N .., n κ , ..
und aκ aκ N .., n κ , ..
aκ (1) Nκ δnκ ,0 N 1 .., n κ 1, ..
(1)2Nκ δn κ ,0 N .., n κ , ..
(6.25)
δnκ ,0 N .., n κ , .. .
Hieraus folgt sowohl für n κ 0 als auch für n κ 1 (aκ aκ d. h. aκ , aκ
1.
aκ aκ ) N .., n κ , ..
N .., n κ , .. ,
Für λ > κ gilt
aκ aλ N .., n κ , .., n λ , ..
(1) Nκ (1) Nλ δn κ ,1 δnλ ,0 N .., n κ 1, .., n λ 1, .. ,
aλ aκ N .., n κ , .., n λ , ..
aλ (1) Nκ δn κ ,1 N 1 .., n κ 1, .., n λ , ..
N N (1) κ (1) λ δn κ ,1 δn
und damit (aκ aλ Dasselbe ergibt sich für λ<κ.
λ ,0
N .., n κ 1, .., n λ 1, ..
aλ aκ ) N .., n κ , .., n λ , ..
(6.26)
0.
6.4 Besetzungszahl- und Teilchenzahloperatoren
6.4
145
Besetzungszahl- und Teilchenzahloperatoren
Die Gleichungen (6.14) und (6.24) lassen erkennen, daß die Operatoren n
bκ bκ ,
,κ
n
a κ a κ
,κ
(6.27)
die Zustände N n 1 , n 2 , . . . als Eigenzustände zu den Eigenwerten n κ (im Fall der Fermionen n κ 0 oder n κ 1) besitzen, n ,κ N . . . , n κ , . . .
n κ N . . . , n κ , . . . .
(6.28)
Sie werden daher als Besetzungszahloperatoren bezeichnet, die Operatoren
N mit der Eigenschaft
n ,κ
(6.29)
N N n 1 , n 2 , . . .
(6.30)
κ
N N n 1 , n 2 , . . .
als Teilchenzahloperatoren. Werden die Operatoren a λ und bλ zur Vereinheitlichung in c
,λ
c,λ bλ
a λ ,
(6.31)
umbenannt (Index für Fermionen, + für Bosonen), so gelten die Vertauschungsrelationen n ,κ , c,λ δκλ c,λ , n ,κ , c,λ δκλ c,λ bzw.
wobei
N , c,λ
c,λ ,
N , c,λ
c,λ ,
den Minus-Kommutator bezeichnet.
b z. B. gilt Beweis: Für den Bosonen-Erzeugungsoperator c ,λ λ n ,κ , bλ
und
bκ bκ bλ bλ bκ bκ
N , c ,λ
κ
(6.12b)
n ,κ , c,λ
(6.12c) bκ bκ , bλ bκ δκλ
κ
δκλ c,λ
δκλ bλ
c,λ .
Für den Fermionen-Vernichtungsoperator c ,λ aλ z. B. gilt n ,κ , aλ
(6.22a) aκ aκ , aλ aκ aκ aλ aλ aκ aκ
(6.22c) aλ , aκ aκ
Der Beweis der übrigen Vertauschungsrelationen verläuft analog.
δκλ aλ
.
146
6.5
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Darstellung physikalischer Observablen durch Erzeuger und Vernichter
In der Besetzungszahldarstellung wird selbst gedanklich nicht zwischen gleichartigen Teilchen unterschieden. Bei der Behandlung konkreter Probleme hat man es jedoch mit der Einwirkung von Operatoren auf Zustände zu tun, und hier kennen wir bisher nur Operatoren, die zwischen Teilchen unterscheiden, auch wenn die Ununterscheidbarkeit der Teilchen durch symmetrisierte Linearkombination der spezifischen Teilchenzustände, auf die sie wirken, zum Ausdruck gebracht ist. Mit unserer neuen Darstellung von Zuständen wäre jedoch wenig gewonnen, wenn es nicht gelänge, eine entsprechende Darstellung für Operatoren zu finden, denn wir wüßten z. B. nicht, wie der Operator i p i 2 /(2m) auf einen Zustand N n 1 , n 2 , . . . wirkt. Tatsächlich können die üblichen, Viel-Teilchen-Observablen repräsentierenden Operatoren durch Erzeugungsund Vernichtungsoperatoren dargestellt werden. In dieser Darstellung treten allerdings Koeffizienten auf, die mit Hilfe von Zuständen berechnet werden müssen, die zwischen den Teilchen unterscheiden. Wir werden unsere diesbezügliche Betrachtung auf Operatoren beschränken, die sich wie der Hamilton-Operator H H 1 H 2 V (x1 x2 ) des Heliumatoms, aus Ein-Teilchen-Operatoren (wie H i p i 2 /(2m)Vi (xi ) beim Heliumatom) und ZweiTeilchen-Operatoren (wie V (x1 x2 )) zusammensetzen, L
N
L i
i 1
1 Li j . 2 i j
Dabei nehmen wir an, daß die Wirkung von L i auf das i -te Teilchen dieselbe ist wie die ) und analog L von L k auf das k-te Teilchen: L i (i j ). i j (i, Wir nehmen uns zuerst Ein-Teilchen-Operatoren L i vor. Im Fall eines Ein Teilchen-Systems ergibt sich für einen beliebigen Ein-Teilchen-Operator L aus der Vollständigkeitsrelation α α α β β β 1 L α α L β β . α,β
Bezeichnen wir den Erzeugungsoperator für den Zustand α mit c,α , so gilt α c,α 0 ,
(6.32)
und aus der Gültigkeit von β γ β , γ c,β 0, γ 0 c,β γ für beliebige Zustände γ folgt β
Hiermit sowie mit (6.32) erhalten wir L c,α 0α L β 0 c,β α,β
0 c,β .
(6.33) α L β c,α 00 c,β ,
α,β
6.5 Darstellung physikalischer Observablen durch Erzeuger und Vernichter
147
und mit der Vollständigkeitsrelation (6.8) ergibt sich schließlich die Darstellung
L
α,β
α L β c ,α c
,β
.
(6.34)
Ihre Anwendung auf die Zustände 1 n 1, n 2 , . . . ist wohldefiniert, weil die Größen α L β Zahlen sind, die aus den Ein-Teilchen-Zuständen α, β und dem Operator L berechnet werden können. Im folgenden überzeugen wir uns daß für den aus Ein-Teilchen-Operatoren davon, L zusammengesetzten Operator L i i i (i ) eines Systems identischer Teilchen ebenfalls (6.34) gilt. Beweis: Die Wirkung des Operators L bzw. (6.2) und (1) p(ρ) 1 L N n 1 , n 2 , . . .
N s.u.
s.u.
i 1 N i 1 ξ
N
1 8
N
i 1 (i) auf die Zustände N n 1 , . . .
N λ n λ ρ 1
ξ γ
N
1 8
ist mit (6.1)
(1) p(ρ) Pρ α1 (i)γi ζ N N
n λ ρ 1
(1) p(ρ) Pρ α1 ξi(γ ) ζ N
,
wobei für den Fall der Fermionen n λ 1 (wegen n λ 0 oder 1) und zuletzt die Zerlegung (i)γi
ξ ξ (i)γi
ξ
ξ
ξ γ ξi(γ )
mit
ξ γ
ξ γ
benutzt wurde. Der Index i wurde dabei vom Zustand γ auf den Zustand ξ übertragen, wobei durch die Notation i(γ ) erkennbar gemacht ist, daß sich der letztere am Platz des Zustands γ befindet. Für ξi γi ξ liefert der Ausdruck in runden Klammern wieder den Ausgangszustand Ni n 1 , n 2 , . . . . Das gilt für n ξ verschiedene Indizes i, wenn n ξ die Besetzungszahl des Zustands ξ ist. Da der Koeffizient ξ γ für all diese Indizes den gleichen Wert ξ ξ besitzt, kommt von den Zuständen ξi γi zur Summe über i der Beitrag
n ξ ξ ξ N n 1 , n 2 , . . . .
(6.35)
ξ
Den von ξi γi kommenden Beitrag berechnen wir zuerst für Bosonen. In diesem Fall liefert der Klammerausdruck einen neuen Viel-Teilchen-Zustand, bei dem der Zustand γ einmal mehr besetzt ist. Unter Berücksichtigung der Vorfaktoren – weniger und der Zustand ξ einmal es gilt 1/ n ξ n γ (n ξ 1)/n γ / (n ξ 1) (n γ 1) – ist er durch
n ξ 1 N . . . , n γ 1, . . . , n ξ 1, . . . nγ
gegeben. Der gleiche Klammerausdruck und der gleiche Koeffizient ξ γ ergeben sich bei gegebenem ξ γ für alle Zustände γi γi . . . γ , also n γ mal, wenn n γ die Besetzungszahl ¼
148
6 Fock-Darstellung von Viel-Teilchen-Zuständen
des Zustands γ ist. Insgesamt folgt damit zusammen mit dem vorherigen Ergebnis L N n 1 , n 2 , . . .
n ξ ξ ξ
N n 1 , n 2 , . . .
(6.36)
ξ
n γ (n ξ 1) ξ γ N . . . , n γ 1, . . . , n ξ 1, . . . . γ ,ξ γ ξ
Mit (6.13) und (6.14) läßt sich dieses Ergebnis zu L N n 1 , n 2 , . . . ξ γ bξ bγ N n 1 , n 2 , . . .
(6.37)
γ ,ξ
zusammenfassen. Jetzt berechnen wir den von ξi γi kommenden Beitrag für Fermionen. Hierzu muß der Ein-Teilchen-Zustand ξ in α1 ξi(γ ) ζ N erst durch Zwei-Teilchen-Vertauschungen vom Platz des Zustands γ an seinen richtigen Platz gebracht werden. Unter der Annahme ξ >γ sind hierfür i(ξ )i(γ ) Vertauschungen notwendig, wobei i(ξ ) die mit dem Zustand ξ verbundene Teilchenplatzziffer nach der Verschiebung und i(γ ) die vor der Verschiebung ist. Nach (6.3) handelt es sich demnach um ξ λ 1
nλ
γ
nλ
s.u.
λ 1
λ<ξ
nλ
λ<γ
(6.16)
nλ
Nξ
Nγ
Verschiebungen, wobei im zweiten Schritt benutzt wurde, daß in der ersten Summe n ξ 1 und in der zweiten n γ 1 ist. (Man beachte, daß n γ und n ξ vor und nach der Verschiebung jeweils verschiedene Werte haben: Vorher hat das Teilchen im Zustand ξ die Teilchenplatzziffer des Zustands γ ; dieser wird daher als besetzt behandelt, n γ 1, während der Zustand ξ als unbesetzt behandelt wird, n ξ 0. Nachher ist der Zustand γ unbesetzt und der Zustand ξ besetzt, also n γ 0 und n ξ 1. Hieraus folgt, daß Nξ mit n γ 0 berechnet wird.) Damit und mit n λ 1 ergibt sich für den fraglichen Beitrag zu L N n 1 , . . . , da sich bei Fermionen nur ein Teilchen im Zustand γ befindet, N (1)(Nξ Nγ ) ξ γ (1) p(ρ) Pρ α1 ξi(ξ ) ζ N , N
ξ >γ ρ 1 wobei sich ξ jetzt am richtigen Platz befindet. Nun gilt nach (6.15) und (6.20) a ξ a γ N .., n γ 1, .., n ξ 0, ..
a ξ (1) Nγ N 1 .., n γ 0, .., n ξ 0, .. (1) Nγ Nξ N .., n γ 0, ..n ξ 1, ..
N N Nξ (6.2) (1) γ
N
ρ 1
(1) p(ρ) Pρ α1 ξi(ξ ) ζ N ,
wobei Nξ wie oben mit n γ 0 berechnet wird. (Dieses Ergebnis stimmt trotz des scheinbar unterschiedlichen Vorzeichens mit dem früheren Ergebnis (6.26) überein, weil dort Nκ und Nλ auf den Ausgangszustand N .., n κ , .., n λ , .. bezogen sind, Nλ also mit n κ 1 berechnet wird und daher um 1 größer ist als hier.) Hiermit läßt sich der fragliche Beitrag schließlich in die Form ξ γ (1)2Nγ a ξ a γ N . . . ξ γ a ξ a γ N . . . ξ >γ
ξ >γ
6.5 Darstellung physikalischer Observablen durch Erzeuger und Vernichter
149
bringen, und für ξ <γ erhält man Summanden derselben Form. Die Zusammenfassung dieser Beiträge mit dem auch für Fermionen gültigen Beitrag (6.35) von ξi γi ξ führt mit der aus (6.24) für n ξ 0 oder 1 folgenden Beziehung n ξ N ..., n ξ , .. a ξ a ξ N ..., n ξ , .. schließlich zu L N n 1 , n 2 , . . . ξ γ a ξ a γ N n 1 , n 2 , . . . . (6.38) γ ,ξ
Da (6.37) bzw. (6.38) für alle Zustände des Raums N gilt, können wir daraus für L die Darstellung γc L ξ (6.39) ,ξ c,γ γ ,ξ
ablesen. (6.39) stimmt wie behauptet mit dem für Ein-Teilchen-Zustände abgeleiteten Ergebnis (6.34) überein.
Die Einwirkung des Operators L auf den Viel-Teilchen-Zustand N n 1 , n 2 , . . . hat von selbst zu Zuständen mit veränderten Besetzungszahlen n κ geführt. Dies liefert die eigentliche Begründung für die Einführung von Erzeugungs- und Vernichtungsoperatoren. Die Wahl der Vorfaktoren in den Definitionsgleichungen (6.9) und (6.11) bzw. (6.15) und (6.20) ist dadurch begründet, daß sie zu dem einfachen, für Bosonen und Fermionen formal identischen Ergebnis (6.39) führt. Für den Zwei-Teilchen-Operator L 12 i j (i, j ) erhält man mit analoger Rechnung (Aufgabe 6.1) L
1 α1 β2 (12) α1β2 c,α c,β c,α c,β . 2 ¼
¼
(6.40)
α,β α ¼ ,β ¼
Beispiel 6.1: Als Beispiel betrachten wir den Hamilton-Operator H
p i 2 2m i
1 V ( xi x j ) 2 i j
eines in einem Würfel der Kantenlänge L eingesperrten Systems spinloser identischer Teilchen mit dem Zwei-Teilchen-Wechselwirkungspotential V ( xi x j ). Benutzt man die ebenen Wellen ϕk
1 L 3/2
eik x
mit
k
2π l ex L
me y
nez
als Basisfunktionen, wobei l, m und n ganze Zahlen sind, so findet man für Bosonen H
h 2 k 2 1 b k b k Vq b k q b k q b k b k , 2m 2L 3 ¼
l,m,n
q,k,k ¼
wobei Vq durch Vq definiert ist (Aufgabe 6.2).
1 L3
V ( x ) eiq x d 3x
¼
150
6.6
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Feldoperatoren
6.6.1 Unitäre Transformation zu Feldoperatoren Erzeugungs- und Vernichtungsoperatoren hängen von der für die Ein-Teilchen-Zustände gewählten Basis ab. Gehen wir von einer Basis aκ zu einer neuen Basis bκ über – dabei seien die Zustände numeriert, während der Buchstabe eine spezielle Basis markiert –, so gilt der Zusammenhang aκ bλ bλ aκ Uκλ bλ . (6.41) λ
λ
Die Matrix Uκλ bλ aκ
(6.42)
ist nach Abschn. Q6.2.5 unitär, UU U U 1 bzw. in Komponenten mit (U )κλ Uλκ Uκλ Uμλ Uλκ Uλμ δκμ . (6.43) λ
λ
Damit folgt aus (6.41) b λ
κ
Uκλ aκ .
(6.44)
Definieren wir die Erzeugungsoperatoren bezüglich der Basis aκ bzw. bκ durch
aκ cκ 0
bzw.
bλ dλ 0 ,
(6.45)
wobei cκ Erzeugungsoperatoren für Bosonen oder Fermionen sein sollen, also der Kürze halber c ,κ cκ gesetzt ist, so folgt aus (6.45a) cκ 0
(6.41)
λ
Uκλ bλ
(6.45b)
λ
Uκλ dλ 0 ,
und weil der Zustand 0 den ganzen Raum 0 aufspannt, erhalten wir den Zusammenhang cκ Uκλ dλ , dλ Uκλ cκ . (6.46) κ
λ
Mit (Uκλ dλ ) Uκλ dλ folgt daraus für die Vernichtungsoperatoren cκ (cκ ) und dλ (dλ ) cκ Uκλ dλ , dλ Uκλ cκ . (6.47) dκ
κ
λ
und denselben Vertauschungsrelationen genügen wie cκ Man findet leicht, daß und cκ (Aufgabe 6.3). Jetzt betrachten wir speziell den Übergang von einer diskreten Basis aκ zur kontinuierlichen Basis der Ortszustände x . In der letzteren erhalten wir nach (6.46b) aus cκ die – kontinuierlich von x abhängigen – Erzeugungsoperatoren (6.42) ψ (x) dx Uκ x cκ x aκ cκ . (6.48) dκ
κ
κ
6.6 Feldoperatoren
151
2 2 Mit x x d 3x 1 gilt aκ x x aκ d 3x, d. h. die Größen ϕκ (x) x aκ sind die Komponenten der Basiszustände aκ in der Ortsdarstellung. Mit diesen können wir (6.48) auch in der Form ψ (x) ϕκ (x) cκ (6.49) κ
(x) ψ folgt daraus schreiben. Für die Vernichtungsoperatoren ψ(x) ψ(x)
κ
ϕκ (x) cκ
ϕκ (x) x aκ .
mit
(6.50)
ψ (x) und ψ(x) werden als Feldoperatoren bezeichnet. Aus (6.49) folgt
ψ (x) 0
κ
ϕκ (x) cκ 0
(6.45a) (6.50b)
κ
x aκ aκ
aκ aκ x x ,
(6.51)
κ
d. h. ψ (x) erzeugt aus dem Vakuum den Ein-Teilchen-Zustand x . Da dieser ein Eigenzustand des Ortsoperators X zum Eigenwert x ist, bedeutet dies, daß ψ (x) ein Teilchen am Ort x erzeugt. Aus (6.51) folgt in Analogie dazu, wie sich (6.33) aus (6.32) ergibt, 0 ψ(x) x . (6.52) Die Feldoperatoren ψ (x) und ψ (x) erfüllen die Vertauschungsrelationen ψ(x), ψ(x ) ψ (x), ψ (x )
0,
ψ(x), ψ (x ) δ 3 (x x ) ,
(6.53)
wobei der Kommutator für Bosonen und der Antikommutator für Fermionen gilt. Beweis: (6.53a,b) folgt durch Einsetzen von (6.49) und (6.50) in die Vertauschungsrelationen (6.12a,b) bzw. (6.22a,b). (6.53c) ergibt sich gemäß ψ(x), ψ (x )
(6.49) (6.50) ϕκ (x) ϕ
κ,λ
) c (x , c ,κ λ ,λ
(6.12c) (Q3.208) (6.22c) ϕκ (x) ϕκ (x ) δ 3 (x x ) .
κ
6.6.2 Darstellung physikalischer Observablen durch Feldoperatoren Mit den Methoden und Ergebnissen von Abschn. 6.5 soll jetzt der Hamilton-Operator durch die Erzeugungs- und Vernichtungsoperatoren ψ (x) und ψ(x) der Ortsdarstellung ausgedrückt werden. Wir tun dies für den Hamilton-Operator H
p 2 (i ) 2m i
i
V (i )
1 V (i, j ) 2 i< j
152
6 Fock-Darstellung von Viel-Teilchen-Zuständen
eines Systems identischer Teilchen, die einem externen Ein-Teilchen-Potential V (i ) ausgesetzt sind und aufeinander Zwei-Teilchen-Wechselwirkungskräfte 2 2 mit dem Potential V (i, j ) ausüben. Mit der Vollständigkeitsrelation d 3x x x d 3x ¼ x ¼ x ¼ 1 ergibt sich für den Fall eines Einzelteilchens (6.51) ' ' ' ' p 2 1 (6.52) 1 ) d 3x d 3x ¼ x x ' p 2 ' x ¼ x ¼ d 3x d 3x ¼ ψ (x) 0 x ' p 2 ' x 0 ψ(x 2m 2m 2m ' ' 1 (6.8) ) d 3x d 3x ψ (x) x ' p 2 ' x ψ(x 2m ' ' (6.50) 1 cκ d 3x ψ (x) x ' p 2 ' x ϕκ (x ) d 3x . 2m κ Unter Benutzung der Beziehung (Q6.166) mit V (x)0 wird daraus p 2 h 2 h 2 (6.50) cκ d 3x ψ (x) ϕκ (x) ψ (x)ψ(x) d 3x 2m 2m κ 2m 2 s.u. h ψ (x)ψ(x) d 3x , (6.54) 2m wobei im letzten Schritt eine partielle Integration ausgeführt wurde. Für mehr als ein Teilchen ergibt sich nach Abschn. 6.5 dasselbe Ergebnis. Für das Ein-Teilchen-Potential V (X), in dem X der Ortsoperator ist, gilt d 3x d 3x x x V (X) x x d 3x d 3x ψ (x) x V (X) x ψ (x ) , V (X) wobei der Faktor 00
1 gleich weggelassen wurde. Mit
x V (X) x x V (x ) x V (x ) x x V (x ) δ 3 (x x )
folgt hieraus ) d 3x V (x) ψ (x) ψ(x) d 3x d 3x ψ (x) V (x ) δ 3 (x x ) ψ(x V (X) . (6.55) Auch dieses Ergebnis gilt wieder sowohl für ein Einzelteilchen als auch für mehrere Teilchen. Für den Zwei-Teilchen-Operator V (X 1 , X 2 ), in dem X 1 der Ortsoperator für Teilchen 1 und X 2 der Ortsoperator für Teilchen 2 ist, ergibt sich mit ähnlicher Rechnung (Aufgabe 6.5) 1 ) . ψ(x (6.56) V (X 1 , X 2 ) d 3x d 3x V (x, x ) ψ (x) ψ (x ) ψ(x) 2 Die Zusammenfassung aller Ergebnisse liefert für den Hamilton-Operator H
h 2 (x)ψ(x) ψ (x) ψ(x) V (x)ψ d 3x 2m 1 ) d 3x d 3x . V (x, x ) ψ (x) ψ (x ) ψ(x) ψ(x 2
(6.57)
Aufgaben
153
Aufgaben 6.1
Beweisen Sie für ein System zweier identischer Teilchen die Darstellung 1 α1 β2 L 12α1 ¼β2 ¼ cα cβ cα cβ L 12 2 ¼
¼
α,β,α ¼ ,β ¼
des Zwei-Teilchen-Operators L 12 L 21 .
6.2
Der Hamilton-Operator eines in einem Würfel der Kantenlänge L eingesperrten Systems zweier identischer spinloser Teilchen sei P2 1 i H V ( X i X j ) , 2m 2 i j
i
wobei Pi die Impuls- und X i die Ortsoperatoren ohne Bezug auf eine spezielle Darstellung sind. Berechnen Sie die in Beispiel 6.1 angegebene FockDarstellung von H durch die Erzeugungs- und Vernichtungsoperatoren b k und b k der Basis ebener Wellen eik x 2π ϕ k x k , k me ne le . x y z L 3/2 L Hinweis: Das Potential V ( x ) besitzt die Fourier-Darstellung 1 1 iq x Vq e mit Vq V ( x ) V ( x ) eiq x d 3x . (2π)3 q L3 6.3
Zeigen Sie, daß der Zusammenhang b k Ukl cl ,
bk
l
Ukl cl
l
zwischen den Erzeugungs- bzw. Vernichtungsoperatoren verschiedener EinTeilchen-Basen zwischen den b-Operatoren die Vertauschungsrelationen
bi , bk
6.4
0,
bi , bk
bi , bk
0,
δik
induziert, wenn diese zwischen den c-Operatoren gelten. Beweisen Sie für den Ein-Teilchen-Operator L i L i mit L i L(xi ) die Dar stellung L ψ (x) L ψ (x) d 3 x,
in der L die Ortsdarstellung des Ein-Teilchen-Operators L(X) ist. Anleitung: 1. Gehen Sie von der in Abschn. 6.6.2 bewiesenen Fock-Darstellung (6.34), L α,β α L β bα bβ , des Ein-Teilchen-Operators in der diskreten Basis α aus und invertieren Sie ψ (x) ϕα (x) b α , ψ(x) ϕα (x) b α . α
α
2. Berechnen Sie den Zusammenhang zwischen den Matrixkomponenten L αβ α L β in der diskreten Basis α und den Komponenten L x x in der kontinuierlichen Basis x . 3. Benutzen Sie schließlich die Beziehung ¼
L x x φ(x ) d 3 x ¼
L φ(x)
zwischen den Operatoren und den Matrixelementen.
154
6 Fock-Darstellung von Viel-Teilchen-Zuständen
6.5
Drücken Sie den Zwei-Teilchen-Operator V (X 1 , X 2 ), in dem X 1 und X 2 die Ortsoperatoren für Teilchen 1 bzw. 2 sind, durch die Erzeugungs- und Vernich tungsoperatoren ψ (x) und ψ(x) der Ortsdarstellung aus.
Lösungen 6.1
Unter Ausnutzung der Vollständigkeitsrelation gilt L 12
1 L 12 1
α1 β2
L 12
α,β,α ,β
1 β2
α
1 β2
α1 β2
1 2
α
1 β2 .
¼
(1 P12 )α1 β2 /2
α1 β2 L 12 α
α
α ¼ ,β ¼
α1 β2 L 12 α β
¼
Mit (Q9.49), α1 β2
α1 β2
α,β
2 1 wird sowie P12
β
1 (1 P )α β , L (1 P )α β 12 1 2 12 12 1 2 4
1 2
1 4
L 12 (1 P12 )2 α1 β2
α1 β2 ,
1 α β L α β 1 α β L P α β 2 1 2 12 1 2 2 1 2 12 12 1 2
1 α β L α β 1 α β L β α 2 1 2 12 1 2 2 1 2 12 1 2
und L 12
1 α1 β2 L 12 α β α1 β2 1 2 2 α,β α¼ ,β ¼
Term 2Î α ¼ °β ¼ 1 α1 β2 L 12 α
2
α,β α¼ ,β ¼
s.u.
1 β2 α1 β2
α1 β2 L 12 α
α,β α,β α¼ ,β ¼ α ¼ ,β ¼
α
1 2
β
1 β2 α1 β2 L 12 α1 β2 α1 β2
1 2
α
α
1 β2 α1 β2
β α1 β2 L 12 β α α1 β2
α
α
β
1 2
1 α2
1 β2 ,
1 β2 benutzt worden ist. Mit
wobei im letzten Schritt
β
1 α2
α1 β2
c α c β 0 ,
α
1 β2
0c
α¼ c β ¼
und 001 folgt daraus die behauptete Beziehung. 6.2
Mit (6.34) und dem Ergebnis von Aufgabe 6.1 lautet die Fock-Darstellung von H mit etc.
α k
H
0 '' p2 '' 1 k' 'k bk bk 2m k,k ¼
¼
1 k1 k2 V ( X 1 X 2 ) k k b b b ¼ b ¼ . 1 2 k1 k2 k k 2 1 2 ¼ ¼ k1 ,k2 ,k1 ,k2
Aufgaben
155
Durch Einschieben des Operators
2 3 d x x x
k p 2 k
(Q6.164)
k x x p 2 k d 3x
h 2 L3
und
1 ergibt sich mit x k eik x /L 3/2
h ∂ 2 3 x k d x i ∂x h 2 k 2 ei (k k) x d 3x h 2 k 2 δkk L3
ei k x 2 ei k x d 3x
¼
0 '' p 2 '' 1 k' 'k b k b k 2m
¼
¼
k x
¼
h 2 k 2 b b . 2m k k k
k,k ¼
2 Durch Einschieben des Operators d 3x1 d 3x2 x1 x2 x1 x2 1 erhalten wir weiterhin mit V (X) x V (x) x (siehe nach (Q6.165)) 3 3 k1 k2 V k k k1 k2 V ( X 1 X 2 ) x1 x2 x1 k x2 k d x1 d x2 1 2 1 2 3 3 k1 x1 k2 x2 V ( x1 x2 ) x1 k x2 k d x1 d x2 1 2 1 V ( x1 x2 ) ei (k1k1 ) x1 ei (k2 k2 ) x2 d 3x1 d 3x2 . L6 ¼
¼
Mit der Substitution x1 x2 x (Folge d 3x1 d 3x) wird daraus 1 i (k1 k ) x 3x ei (k1 k1 k2 k2 ) x2 d 3x 1 k1 k2 V k k x ) e d V ( 2 1 2 L6 1 V δ . L 3 k1 k1 k1 k2 ,k1 k2 ¼
¼
¼
¼
¼
¼
Hiermit, mit der Definition q k1 k1 sowie den Umbenennungen k1 k und k2 k , die wegen der Kronecker-Funktion k2 k1 k2 k1 k q zur Folge haben, erhalten wir
k1 k2 V k1 k2 b k b k b k b k 1 2 1 2 ¼
k1 ,k2 ,k1¼ ,k2¼
¼
1 Vq b kq b kq b k b k L3 ¼
k,k ¼ ,q
und damit insgesamt wie behauptet H
h 2 k 2 b b 2m k k k
1 Vq b kq b kq b k b k . 2L 3 ¼
k,k ¼,q
¼
¼
7
Klassische relativistische Feldtheorie
In Schrödingers Wellenmechanik kann ψ(x, t) als Wellenfunktion für ein oder mehrere Teilchen aufgefaßt werden. In beiden Fällen ergibt sich ein Erhaltungssatz d ψψ d 3x 0 dt für die Wahrscheinlichkeitsdichte ψψ . Da mit ψ auch jedes Vielfache von ψ eine Lösung der Schrödinger-Gleichung ist, mußt die Quantisierung * 1 für eine Ein-Teilchen-Theorie, 3 ψψ d x N für eine N-Teilchen-Theorie als zusätzliche Bedingung mit in die Theorie aufgenommen werden, sie ergibt sich nicht als eine Folge der Theorie. Das muß als eine deutliche Schwäche der SchrödingerTheorie angesehen werden, diese ist keine vollständige Quantentheorie. Die aus dem Photoeffekt erschlossenen Quantisierungsregeln E
hω,
p hk
(7.1)
von Einstein legen es nahe, den Maxwell-Gleichungen die gleiche Rolle bezüglich der Photonen zuzuschreiben, welche z. B. die Schrödinger-Gleichung im nichtrelativistischen Grenzfall bezüglich spinloser Teilchen spielt. Dementsprechend wäre die durch hω geteilte Energiedichte des elektromagnetischen Feldes, 1 ε0 2 1 2 n B , E hω 2 2μ0 als Wahrscheinlichkeitsdichte von Photonen der Energie hω zu interpretieren. In diesem Sinne ist also auch schon die Maxwellsche Elektrodynamik eine Quantentheorie. Aber auch sie liefert nicht die Quantisierungsregeln (7.1). Das Ziel dieses Teils des Buches ist es, eine Theorie zu entwickeln, welche die aufgezeigten Lücken schließt. Der hier beschrittene Weg steht in enger Analogie zur Quantisierung der klassischen Mechanik von Punktteilchen, die in der Quantenmechanik behandelt wurde. Es stellt sich heraus, daß Feldtheorien wie die Maxwell-Theorie in eine kanonische Form gebracht werden können, die dem kanonischen Formalismus der Mechanik entspricht. Wendet man auf diese die Quantisierungsregeln der Quantenmechanik an, so gelangt man zu einer Quantentheorie von Feldern. Mit der letzteren können nicht nur die oben aufgeführten Lücken der bisher von uns betrachteten Quantentheorie geschlossen werden, sondern es tun sich auch neue Ergebnisse und Erkenntnisse
7.1 Mechanisches Beispiel einer Feldtheorie
157
auf. Dabei soll allerdings nicht verschwiegen werden, daß auch viele neue Schwierigkeiten und Probleme auftauchen, die nur mit großer Mühe behoben bzw. gelöst werden können. Die auf diese Weise erhaltene Quantenfeldtheorie ist so umfangreich, daß in diesem Buch nur ihre Anfangsgründe behandelt werden können.
7.1
Mechanisches Beispiel einer Feldtheorie
Anhand eines einfachen mechanischen Beispiels kann gezeigt werden, wie man zu kanonischen Bewegungsgleichungen für ein Feld kommt. Wir gehen dazu von einem vertrauten mechanischen Problem mit endlich vielen Freiheitsgraden aus und vollziehen an diesem den Grenzübergang zu einem kontinuierlichen System mit unendlich vielen Freiheitsgraden. Das mechanische System bestehe aus N 1 Massenpunkten gleicher Masse m, die sich an den Punkten x i , i 0, 1, . . . , N , der x-Achse befinden und durch gleichartige Federn der Federkonstante k verbunden sind (Abb. 7.1). Die Gleichgewichtslagen der Massenpunkte seien x i,0 i a , i 0, 1, . . . , N, ihre Bewegung sei an die x-Achse gebunden. Nun definieren wir Verschiebungen η(x i,0 , t) x i (t) x i,0
(7.2)
und erhalten für die kinetische Energie des Systems mit der Notation η ∂t η T
N m i 0
2
xi 2
N m 2 η i . 2
(7.3)
i 0
Die potentielle Wechselwirkungsenergie benachbarter Teilchen ist *k (x j x i a)2 k2 (η j ηi )2 für j i 1, Vi j 2 0 sonst. Mit der aus der Mechanik bekannten Formel V i< j Vi j für die gesamte potentielle Energie erhalten wir daher N 1 V k (ηi 1 ηi )2 . (7.4) 2 i 0
Die Lagrange-Funktion des Systems ist L
T V
N η 2
1 m 2 i 1 ηi η i ka a, 2 a a i 0
(7.5)
wobei sich der für spätere Zwecke eingeschobene Faktor a herauskürzt. Hieraus folgen die Lagrangeschen Bewegungsgleichungen m ηi 1 ηi η i (t) ka a a2
ka ηi a 2ηi 1 .
(7.6)
158
7 Klassische relativistische Feldtheorie
k
m a x0
x1
x2
x3
x4
Abb. 7.1: Modell durch gleichartige Federn gekoppelter Punktmassen.
Nun lassen wir gleichzeitig a die Ausdrücke Na
und N gehen derart, daß dabei m μ, ka Y (7.7) a
0, m
0, k
,
konstant bleiben. η(x i,0 , t) ist die Verschiebung des Teilchens mit der Gleichgewichtslage x i,0 . Beim Grenzübergang a 0 erhalten wir unendlich viele Gleichgewichtslagen und schreiben kürzer ηi (x i,0 , t) η(x, t) , wobei η(x, t) die Verschiebung des Teilchens mit der Gleichgewichtslage x bedeutet. Wegen x i 1,0 x i,0 a erhalten wir
ηi
1
η η(x a, t) η(x a i
i,0
i,0 , t) a
a
0
∂η , ∂x
und mit den Gleichungen (7.7) ergeben sich für den betrachteten Grenzfall aus (7.5)–(7.6) die Lagrange-Funktion 2 % $ ∂η 1 L μ η2 Y dx (7.8) 2 0 ∂x
und die Bewegungsgleichung
Y ∂∂ xη . 2
μη
(7.9)
2
2t Gleichung (7.6) kann durch Variation des Integrals t01 L dt gewonnen werden, wenn L durch (7.5) gegeben ist. Daher steht zu erwarten, daß Gleichung (7.9) durch Variation des Integrals 2 % $ ∂η 1 t1 2 Y μη d x dt (7.10) I 2 t0 0 ∂x
erhalten werden kann. Aus den endlich vielen abhängigen Variablen ηi (t) in (7.5), die durch den Index i unterschieden werden, wurden dabei die unendlich vielen Variablen η(x, t), die sich im Ort x unterscheiden. Mathematisch kann η(x, t) natürlich auch als eine Variable aufgefaßt werden, die von den zwei unabhängigen Parametern x und t abhängt. Wir variieren jetzt das Integral (7.10), indem wir η(x, t) η(x, t) ε ζ (x, t) setzen, und erhalten durch Differentiation nach ε ' t1 d I '' μ η ζ Y η ζ d x dt, ' dε ε 0 t0 0
7.2 Hamiltonsches Prinzip für Feldtheorien
159
wobei η¼ ∂x η gesetzt wurde. Durch partielle Integration nach t im ersten und nach x im zweiten Term des Integranden erhalten wir ' d I '' dε 'ε
0
t1 μ η t0
0
Y η ζ d x dt
0
μ η ζ
t1 t0
t1
dx t0
Y η ζ
0
dt.
Bei der Variation des Zeitintegrals über den Integranden (7.5) muß ζi (t0 ) ζi (t1 ) 0 gesetzt werden, damit (7.6) erhalten wird. Hier müssen wir offensichtlich die etwas weitergehenden Randbedingungen ζ (x, t0 ) ζ (x, t1 ) 0,
ζ (0, t) ζ (, t) 0
(7.11)
stellen, um aus der Forderung d I /dεε 0 0 die partielle Differentialgleichung (7.9) zu erhalten. Die zweite der Bedingungen (7.11) bedeutet, daß die Amplitude der durch (7.9) beschriebenen elastischen Welle η(x, t) bei x 0 und x festgehalten wird. Auch die Periodizitätsforderung η(x, t) η(x
, t) mit den Konsequenzen ζ (0, t) ζ (, t) und η (0, t) η (, t) würde das letzte Integral in dem für d I /dεε 0 erhaltenen Ausdruck zum Verschwinden bringen. 7.2
Hamiltonsches Prinzip für Feldtheorien
Es ist nun leicht, zu sehen, wie sich das eben betrachtete spezielle Beispiel verallgemeinern läßt. η(x, t) sei ein Feld – jedem Ort x wird zu jeder Zeit t ein Wert des Feldes η zugeordnet –, das einer gegebenen Differentialgleichung genügen soll. η kann ein skalares reelles, ein skalares komplexes, ein Vektor- oder ein Tensorfeld sein. Wir können alle diese Fälle zusammenfassen, indem wir η mit einem Index r versehen und diesen entsprechend viele Werte durchlaufen lassen. Mit x 0 ct und x, t x α ct, x gehen wir zu einer Schreibweise über, die gleich die relativistische Gleichwertigkeit von Orts- und Zeitvariablen enthält. Wir haben dann ein Feld ηr
ηr (x)
(7.12)
zu betrachten – x steht dabei wieder als Abkürzung für die vier Komponenten x α –, das gegebenen Differentialgleichungen genügen soll. Die Ableitungen von ηr nach den x α werden wir im folgenden durch ∂ηr ηr,α ∂xα abkürzen. In leichter Verallgemeinerung der Betrachtungen des vorigen Abschnitts suchen wir nach einer Lagrange-Dichte
(ηr , ηr,α , x) ,
(7.13)
160
7 Klassische relativistische Feldtheorie
welche die Eigenschaft besitzt, daß das Variationsproblem δ G
d4x
' ' δηr '
0,
∂G
0
(7.14)
zu der gegebenen Differentialgleichung führt. Der Lagrange-Funktion (7.8) entspricht dabei das Integral L G3
d 3x.
Die Variationsnebenbedingung δηr ∂G 0 (d. h. δηr soll auf dem Rand ∂ G des Gebietes G verschwinden) wurde dabei in Analogie zu den Forderungen (7.11) gestellt. Zur Lösung des Variationsproblems (7.14) ziehen wir die Variation unter das Integral. Das ist möglich, weil nur ηr variiert werden soll und die Grenzen des Integrationsgebiets nichts mit dieser Variation zu tun haben sollen. Nun gilt δ und1
∂ δηr,α ∂ηr,α
∂ ∂xα
∂ δηr ∂ηr
∂ δηr ∂ηr,α
∂ δηr,α ∂ηr,α
(7.15)
∂ ∂ ∂ x α ∂ηr,α
δηr ,
(7.16)
wobei wir bezüglich des Index α die – später auch für nicht-relativistische Zwecke brauchbare – Summenkonvention A α B α A 0 B 0 A1 B 1 A 2 B 2 A 3 B 3 benutzen und bezüglich des Index r vereinbaren, daß über die Zahl der Feldkomponenten summiert wird, wenn der Index unten und oben auftritt. Außerdem wurde die Relation δηr,α
∂α δηr
benutzt, die aus ηr
ηr0 δηr
ηr0 εζr ,
ηr,α
und
ηr0,α
δηr,α
ηr0,α
εζr,α
gemäß δηr,α εζr,α ∂α (εζr ) ∂α δηr hervorgeht. Aus dem Gaußschen Satz in vier Dimensionen ergibt sich mit der Randbedingung (7.14b) ∂ ∂ ∂ 4 δηr d x δηr d 4 fα 0 . α ∂ηr,α G ∂x ∂G ∂ηr,α
Mit (7.15) und (7.16) liefert das Variationsprinzip (7.14) somit ∂ ∂ ∂ δηr d 4 x 0 . ∂ x α ∂ηr,α G ∂ηr
1
(7.17)
In (7.16) ist unter ∂/∂x α die partielle Ableitung nach x α bei festgehaltenen x β x α verstehen, nicht jedoch bei festgehaltenen ηr und ηr,α . Diese sind Funktionen von x und sollen bei der Ableitung nach x α mit differenziert werden.
7.3 Hamiltonsche Bewegungsgleichungen für Feldtheorien
161
Die Variationen δηr können beliebig gewählt werden, insbesondere so, daß nur ein δηr in der infinitesimalen Umgebung des Raum-Zeit-Punktes x von Null verschieden ist. Daher erhalten wir aus (7.17) die Lagrangeschen Feldgleichungen
∂ ∂ ∂ x α ∂ηr,α
∂ . ∂ηr
(7.18)
Man überzeugt sich leicht davon, daß sich hieraus im Fall der Lagrange-Dichte 1 1 2 2 2 μ η 2 Y (∂η/∂ x) die partielle Differentialgleichung (7.9) ergibt. Es verbleibt anzumerken, daß die zu den Differentialgleichungen (7.18) gehörige Lagrange-Dichte nicht eindeutig ist. Offensichtlich führt die Lagrange-Dichte
¼
γ
∂ ∂x β Λβ (ηr , x)
(7.19)
mit einer beliebigen Konstanten γ und Funktion Λβ (ηr , x) zu denselben Feldgleichungen, da die vierdimensionale Divergenz bei der Variation wegen δηr ∂G 0 keinen Bei2 2 2 2 S. v. Gauß γ δ G d 4 x δ ∂G Λβ (ηr , x) d f β γ δ G d 4 x . trag liefert. δ G ¼ d 4 x
7.3
Hamiltonsche Bewegungsgleichungen für Feldtheorien
Während die Lagrange-Gleichungen (7.18) eine gleichartige Behandlung von Zeit- und Ortskoordinaten zulassen – für die Mechanik von Massenpunkten gibt es eine ähnliche Formulierung –, spielt in der Hamiltonschen Mechanik die Zeit eine besondere Rolle. Um aus (7.18) eine Hamiltonsche Formulierung ableiten zu können, müssen wir daher erst Orts- und Zeitvariablen trennen: Erstreckt sich die Summation bei lateinischen Indizes wieder nur von 1 bis 3, so erhalten wir aus (7.18) mit ηr ηr,t
∂
∂ ∂ ∂t ∂ ηr
∂ηr
∂ ∂ . ∂ x l ∂ηr,l
(7.20)
In Anlehnung an die Mechanik von Massenpunkten definieren wir nun durch πr
∂ ∂ ηr
(7.21)
aus der Lagrange-Dichte eine kanonische Impulsdichte. Es besteht die Abhängigkeit πr
π r (ηs , ηs , ηs , x).
(7.22)
Wir stellen uns vor, daß diese Beziehungen nach den ηs aufgelöst werden können (was häufig explizit nicht möglich ist), ηr
fr (ηs , ηs , π s , x)
(7.23)
162
7 Klassische relativistische Feldtheorie
und definieren dann durch π r ηr
(7.24)
eine Hamilton-Dichte. Sind in dieser die ηr gemäß (7.23) durch die π r ersetzt, so gilt (ηr , ηr,l , π r , x) .
(7.25)
Aus der Definitionsgleichung (7.24) folgt ∂ ∂ ηs ∂ s ηr π r ∂π ∂ ηs ∂π r
bzw. mit (7.21) ηr
Analog ergibt sich ∂ ∂ηr
πs
und
∂ ηs ∂
∂ ∂ ηs
∂ ∂ηr,l
∂ηr πs
∂ ∂ ηs
(7.26)
(7.20) (7.21)
∂ ∂ηr
∂ ηs ∂ηr,l
∂ ∂ηr,l
(7.21)
∂ηr
∂ . ∂π r
π
r
∂ ∂ ∂ x l ∂ηr,l
∂ . ∂ηr,l
Die Kombination der beiden letzten Ergebnisse führt zu πr
∂ ∂ηr
∂ ∂ . ∂ x l ∂ηr,l
(7.27)
Gegenüber der Mechanik von Massenpunkten gibt es auf der rechten Seite einen weiteren Term. Der Grund für sein Auftreten ist, daß nach (7.25) nicht nur von den ηr , sondern auch von deren Ortsableitungen abhängt. Um eine engere formale Übereinstimmung mit der Mechanik von Massenpunkten zu erhalten, führen wir für eine Funktion f
f (ηr , ηr,l , π r , π r,l , x)
(7.28)
die sogenannten Variationsableitungen δf δηr
∂f ∂ηr
∂ ∂f , ∂ x l ∂ηr,l
δf δπ r
∂f ∂π r
∂ ∂f ∂ x l ∂π r,l
(7.29)
ein. Die Motivation zu dieser Notation ergibt sich aus der zur linken Seite von (7.17) analogen Beziehung ∂f ∂f ∂f ∂f 3 3 δ f d x δf d x δηr δηr,l δπr δπr,l d 3x ∂ηr ∂ηr,l ∂πr ∂πr,l ∂ ∂f ∂ ∂f ∂f ∂f 3 δηr d x δπr d 3x . ∂ηr ∂ x l ∂ηr,l ∂πr ∂ x l ∂πr,l
7.3 Hamiltonsche Bewegungsgleichungen für Feldtheorien
163
(Variiert wird nur bezüglich der von x abhängigen Funktionen ηr und πr sowie ihrer Ortsableitungen. Man beachte, daß f nicht von ηr und πr abhängt.) Wird bei festen πr nur ein ηr variiert, und ist dessen Variation auf ein kleines, den Punkt P umgebendes Volumen V begrenzt, so folgt aus der letzten Beziehung
δ f d x/V 3
und
δ f δηr
∂f ∂ηr
∂f ∂ηr
' ∂ ∂ f '' d 3x δη r ' ∂ x l ∂ηr,l P V
' ∂ ∂ f '' , ∂ x l ∂ηr,l ' P
(7.30)
wobei δ f und δηr die Mittelwerte der schnell veränderlichen Funktionen δ f und δηr über V darstellen, während auf der rechten Seite von (7.30) eine in V langsam veränderliche Funktion steht, die an einem Punkt P innerhalb von V zu nehmen ist. Geht nun V derart gegen null, daß sich V auf einen Punkt zusammenzieht, so steht rechts der Funktionswert an dieser Stelle. Der Vergleich von (7.29a) mit (7.30) zeigt die Bedeutung der Variationsableitung: In (7.29a) sind δ f und δηr die mittleren Variationen in einem infinitesimalen Volumen. Die Interpretation von (7.29b) ist analog. Mit den Definitionen (7.29) lauten die Beziehungen (7.26) und (7.27) ηr
δ , δπ r
πr
δ . δηr
(7.31)
Dies sind die Hamiltonschen Bewegungsgleichungen für das Feld ηr (x, t). Für die totale Zeitableitung einer Funktion (7.28) ergibt sich mit ihnen df dt
∂f ∂f ∂f r ∂f ∂f ηr ηr,l π π r,l r r ∂ηr ∂ηr,l ∂π ∂π ,l ∂t ∂f ∂f ∂ ∂f ∂ ηr l ηr ∂ηr ∂ x l ∂ηr,l ∂ x ∂ηr,l ∂f ∂f ∂ ∂f ∂ ∂f r r π π ∂π r ∂ x l ∂π r,l ∂ x l ∂π r,l ∂t ∂f δf δ δf δ ∂f ∂ ∂f r η π . r δηr δπ r δπ r δηr ∂t ∂ x l ∂ηr,l ∂π r,l
Nun definieren wir als Poisson-Klammer
f,
δf δ δηr δπ r
δf δ δπ r δηr
(7.32)
und erhalten damit für das letzte Ergebnis df dt
f,
∂f ∂t
∂ ∂xl
∂f ηr ∂ηr,l
∂f r π . ∂π r,l
(7.33)
164
7 Klassische relativistische Feldtheorie
Setzen wir speziell f
, so folgt hieraus ∂ ∂t
d dt
∂ ∂xl
∂ ηr , ∂ηr,l
(7.34)
da nicht von π r,l abhängt. Sowohl Gleichung (7.33) als auch Gleichung (7.34) unterscheidet sich von den aus der Mechanik von Massenpunkten vertrauten Ausdrücken, obwohl durch Benutzung der Variationsableitung schon eine bessere Angleichung erzielt wurde. Das ändert sich, wenn wir zu den integralen Größen f d 3x bzw. H d 3x (7.35) F IR3
IR3
übergehen. Es gilt dF dt
∂F ∂t
df 3 d x, 3 IR dt
IR3
∂f 3 d x, ∂t
und unter der Annahme, daß die Feldgrößen ηr und π r bzw. deren Zeitableitungen ηr und π r für x hinreichend schnell verschwinden, folgt hieraus mit (7.33) nach Umwandlung des Divergenzterms in ein – verschwindendes – Oberflächenintegral mit Hilfe des Gaußschen Satzes dF dt wobei F,
durch
definiert ist. Für f
F, H
F, H
IR3
(7.36)
f, d 3x
folgt aus (7.36) wegen , dH dt
7.4
∂F , ∂t
(7.37)
0
∂∂tH .
(7.38)
Anwendung auf spezielle Felder
Im folgenden werden zu einer Reihe quantenmechanischer Bewegungsgleichungen und für das elektromagnetische Feld die Lagrange- und die Hamilton-Dichte berechnet.
7.4.1 Schrödinger-Feld Wir suchen als erstes eine Lagrange-Dichte für das der Schrödinger-Gleichung ih ∂t ψ
h 2 ψ 2m
Vψ
(7.39)
7.4 Anwendung auf spezielle Felder
165
genügende Schrödinger-Feld ψ(x, t). Dieses ist komplexwertig, und wir setzen ψ
ψ1
i ψ2 .
Mit Hilfe der Beziehungen ψ1
12
ψ ,
ψ
2i
ψ2
ψ
ψ
können wir die Lagrange-Dichte statt durch ψ1 und ψ2 auch durch die komplexwertigen Felder ψ und ψ ausdrücken und die letzteren als unabhängig auffassen, da zwischen ihnen und den Funktionen ψ1 und ψ2 ein eindeutiger Zusammenhang besteht. Mit
(ψ, ψ ) (ψ1 , ψ2 ) erhalten wir ∂ ∂ψ
∂ ∂ψ1 ∂ψ1 ∂ψ 1 ∂ ∂ ∂ψ 2 ∂ψ 1
∂ ∂ψ2 ∂ψ2 ∂ψ ∂ i ∂ψ2
1 2
i ∂ , ∂ψ
∂ ∂ψ1
(7.40)
2
(7.41)
sowie ∂ ∂ψ,α
∂ ∂ψ1,α ∂ ∂ψ2,α 1 ∂ i ∂ , ∂ψ1,α ∂ψ,α ∂ψ2,α ∂ψ,α 2 ∂ψ1,α ∂ψ2,α ∂ ∂ 1 ∂ i . ∂ψ 2 ∂ψ ∂ψ ,α
1,α
(7.42) (7.43)
2,α
Aus den Variationsgleichungen (7.18) folgt mit η1 ψ1 und η2 ψ2 zunächst
∂ , ∂ψ
∂ ∂ ∂ x α ∂ψ1,α
1
∂ . ∂ψ
∂ ∂ ∂ x α ∂ψ2,α
2
Wird dies in (7.40) und (7.41) eingesetzt, so ergibt sich mit (7.42) und (7.43) ∂ ∂ ∂ x α ∂ψ,α
∂ ∂ψ
und
∂ ∂ ∂ x α ∂ψ ,α
∂ , ∂ψ
(7.44)
d. h. die Feldgleichungen haben in den komplexen Größen ψ und ψ die gleiche Form wie in ψ1 und ψ2 . Man überprüft leicht, daß die Gleichungen (7.44) mit (7.39) bzw. der zu (7.39) konjugiert-komplexen Gleichung übereinstimmen, wenn mit der Umbenennung die Lagrange-Dichte
h 2 ih ψ ψ 2m ψ ψ V ψψ ,
(7.45)
166
7 Klassische relativistische Feldtheorie
–wegen
sowie
ih ∂t (ψψ ) ist diese nicht reell– genommen wird: Es gilt h 2 ∂ ∂ ∂ ih ψ , V ψ ψ ,l , ∂ψ,l 2m ∂ψ ∂ψ 0,
h 2 ψ , ,l 2m
ih ψ
∂ ∂ψ ,l
∂ ∂ ψ
∂ ∂ψ
Vψ ,
und durch Einsetzen in die Lagrange-Gleichungen (7.44) in der Form (7.20) ergibt sich ih ∂t ψ
V ψ
h 2 ψ ,l,l 2m
0 ih ψ
und
Vψ
h 2 2m ψ,l,l ,
also die Schrödinger-Gleichung (7.39) und die zu ihr konjugiert-komplexe Gleichung. Als kanonische Impulse erhalten wir π
∂∂ ih ψ , ψ
π
∂∂ψ 0 .
(7.46)
(Der durch (7.46b) definierte Impuls π ist offensichtlich nicht zu π komplexkonjugiert.) Die Hamilton-Dichte (7.24) ist
π ψ π ψ π ψ (π bzw. mit (7.46a)
ih ψ ) ψ
h 2 ψ ψ V ψψ 2m
h 2 2m ψ ψ V ψψ ,
(7.47)
im Gegensatz zur Lagrange-Dichte ist sie reell. Die Gleichungen (7.46) lassen sich nicht zur Elimination von ψ bzw. ψ benutzen, andererseits ist von π und π unabhängig. Daher bleibt zunächst unklar, ob die Gleichungen (7.31) mit (7.47) der Schrödinger-Gleichung und der zu dieser komplexkonjugierten Gleichung äquivalent sind. Aus (7.31b) folgt π
δ δψ
(7.29a)
V ψ
h 2 ψ , 2m
und mit (7.46a) ergibt sich daraus wie erwünscht die zur Schrödinger-Gleichung komplex-konjugierte Gleichung. Aus (7.31a) folgt jedoch ψ δ /δπ 0, was sicher nicht richtig ist. Setzt man allerdings schon bei der Variation π i h ψ , so ergibt sich 1 δ 1 ∂ ∂ 1 h 2 V ψ ψ , ψ ∂ l i h δψ i h ∂ψ ∂ψ , l i h 2m also die Schrödinger-Gleichung. Dieser Vorgehensweise äquivalent ist es, wenn man ψ in mit Hilfe von (7.46a) durch π ersetzt, also statt (7.47) die Hamilton-Dichte
h 2 i1h 2m ψ π V ψπ
(7.48)
7.4 Anwendung auf spezielle Felder
167
benutzt. Entgegen der Voraussetzung (7.25) wird dann allerdings auch zu einer Funktion von π,l . Gleichung (7.31a) mit (7.29b) liefert dann ψ
δ δπ
∂ ∂π
∂ ∂ ∂ x l ∂π,l
1 i h
h 2 ψ 2m
Vψ
,
(7.49)
stimmt also mit der Schrödinger-Gleichung überein, während aus (7.31b) mit (7.48) die zu dieser komplex-konjugierte Gleichung π
(7.46a)
ih ψ
(7.31b) (7.29a)
1 Vπ ih
h 2 π,l,l 2m
(7.46a)
h 2 ψ V ψ 2m
folgt. Für die durch (7.35b) definierte Hamilton-Funktion H erhalten wir mit (7.48) nach jeweils einer partiellen Integration die beiden äquivalenten Formen H
1 ih
IR3
π
h 2 V 2m
ψ d 3x
1 ih
IR3
ψ
h 2 V π d 3x. 2m
(7.50)
7.4.2 Klein-Gordon-Schrödinger-Feld Wir betrachten nur den kraftfreien Fall (4.6) der Klein-Gordon-Schrödinger-Gleichung. Die dazu konjugiert-komplexe Gleichung hat die gleiche Form. Wie beim SchrödingerFeld können φ und φ als unabhängige Variablen aufgefaßt werden. Als mögliche Lagrange-Dichte errät man 2
h 2m
0
g αβ (∂α φ)(∂β φ )
m 0 c2 φφ . 2
(7.51)
Diese Wahl von ist nicht die in der Literatur übliche, gebräuchlicher ist 2m 0, was zusammen mit der häufig zur Abkürzung des Schreibaufwands getrof-
fenen Konvention, h 1 und c1 zu setzen, zur Lagrange-Dichte
gαβ (∂α φ)(∂β φ
) m 20 φφ
(7.52)
führt. Zu Gunsten der Definition (7.51) gibt es folgende Argumente: 1. Wenn φφ wie ψψ im Fall des Schrödinger-Feldes und ψ ψ im Fall des Dirac-Feldes mit l = Länge die Dimension 1/l 3 einer Teilchendichte besitzt, hat die Dimension einer Energiedichte. Im Fall der Lagrange-Dichte (7.52) muß φφ dagegen aus dem gleichen Grund die Dimension m/l 3 einer Massendichte besitzen. Die Vermeidung dieser etwas unglücklichen Dimension begründet in /(2m 0 ) den Faktor 1/m 0 . 2. Aus (7.51) folgt in dem formal mit c erhältlichen nicht-relativistischen Limes die in Aufgabe 7.1 angegebene Lagrange-Dichte des Schrödinger-Feldes, die wie (7.45) die mit
168
7 Klassische relativistische Feldtheorie
der klassischen Energie E m Ú 2 /2 V korrespondierende Energiedichte (7.47) zur 2 Folge hat. Mit dem Ansatz φ ψ e i m 0 c t /h ergibt sich nämlich i h (ψ ψ ψ ψ ) h 2 ψ ψ 2m 2 0
2 φ φ h 2 φφ m 0 c2φφ h 2 ψ ψ h2m 2m 2 c2 2m c2
0
0
c
0
i h h 2 ψ ψ . ψ ψ ψ ψ 2 2m 0
Die Kompatibilität von mit dem nicht-relativistischen Ergebnis begründet in /(2m 0) den Faktor 1/2. 3. Weiterhin paßt die Definition (7.51) zum HamiltonOperator (4.22) der nicht-quantisierten Klein-Gordon-Theorie: Die aus berechnete Energie reproduziert z. B. im Fall ebener Wellen das Ergebnis (4.28) (Aufgabe 7.3), mit (7.52) dagegen erhielte das spätere Ergebnis (7.60) auf der rechten Seite einen Faktor zwei. In der nicht-quantisierten Klein-Gordon-Theorie ist die Definition (7.51) übrigens üblich. In vielen Büchern kommt es daher beim Übergang von der klassischen Theorie zur Quantenfeldtheorie zu einem Bruch der Darstellung, der hier vermieden wird. Da in diesem Buch durchgängig SI-Einheiten benutzt werden, dimensionsbehaftete Faktoren also immer berücksichtigt werden, bedeutet es keinen großen zusätzlichen Aufwand, wenn in aus Gründen der Kompatibilität mit der Schrödinger- und der klassischen Klein-Gordon-Theorie der zusätzliche Faktor 1/(2m 0 ) eingebaut wird. Dieser wirkt sich nicht auf alle Ergebnisse aus, wird aber bei einigen zwangsläufig auftreten. Das wird nicht in jedem Fall eigens vermerkt, sondern nur bei einigen besonders wichtigen Ergebnissen. Dem Leser wird empfohlen, beim Vergleich mit anderen Büchern den Faktor in Erinnerung zu behalten. ist offensichtlich ein Lorentz-Skalar. Aus (7.18) folgt wieder (7.44) bzw.
∂ ∂φ
∂ ∂ ∂ x β ∂φ,β wobei
und
∂ , ∂φ
∂ ∂ ∂ x β ∂φ ,β
wieder in umbenannt wurde. Mit ∂ (7.51) h 2 αβ h 2 β g ∂α φ ∂ φ, ∂φ ,β
2m 0
(7.53)
m 0 c2 φ 2
∂ ∂φ
2m 0
(7.54)
und entsprechenden Ausdrücken für ∂ /∂φ,β etc. ergeben sich aus den Gleichungen (7.53) die Klein-Gordon-Schrödinger-Gleichung h 2 ∂β ∂ β φ
h 2 φ m 02 c2φ
(7.55)
und die zu ihr konjugiert-komplexe Gleichung. Zur Ableitung der kanonischen Impulse benötigen wir die ausführliche Form 2 2 h 2 2mh c2 φ φ 2m φ φ m 02c φφ
von
. Es folgt π
0
(7.56)
0
2 ∂∂φ 2mh c2 φ 0
,
π
2 ∂∂φ 2mh c2 φ π
0
(7.57)
7.4 Anwendung auf spezielle Felder
169
(π ist der zu φ kanonisch-konjugierte Impuls, π ist das Konjugiert-Komplexe des zu φ konjugierten Impulses), und die Hamilton-Dichte lautet
πφ π φ
4m 0 c2
h 2
ππ
2m 0 c2 h 2
ππ
h 2 φ 2m 0
φ
m 0 c2 φφ 2
oder 2m 0 c2
h 2
ππ
h 2 φ 2m 0
φ
m 0 c2 φφ . 2
(7.58)
Hiermit und mit η φ folgen aus (7.31) die Gleichungen φ
δ δπ
δ δπ
2m 0 c2
π
π,
h 2
δ δφ
m 0 c2 h 2 φ φ . 2 2m 0
2 Aus der zweiten Gleichung folgt mit der ersten bzw. π h 2 φ/(2m 0 c ) nach Multiplikation mit 2m 0 die Klein-Gordon-Schrödinger-Gleichung (7.55). Mit (7.57) kann (7.58) auch in der Form
h 2 h 2 φ φ φ 2 2m 0 c 2m 0
φ
m 0 c2 φφ 2
(7.59)
2 geschrieben werden. Für die Hamilton-Funktion H d 3x ergibt sich hieraus durch Übersetzung in die Schrödinger-Form von Abschn. 4.3 (7.60) H Ψ σ3 H Ψ d 3x . Beweis: Es gilt σ3 H Ψ
Ψ
(4.22b)
Mit σ3 (i σ2 σ3 )
Ψ
σ3 (i σ2 σ3 )
(4.21)
1 0
0 1
h 2 Ψ 2m 0 1 1
1 1
Ψ σ3 m 0 c 2 σ3 Ψ .
1 1 1 1
und σ32 1 ergibt sich daraus Ψ σ3 H Ψ
h 2 (ϕ , χ ) 2m 0
h 2 (ϕ χ) (ϕ χ) m 0 c2 (ϕϕ χχ ) . 2m 0
Aus (4.16) folgt ϕχ
φ,
1 1 1 1
ϕϕ χχ
ϕ χ
m 0 c2 Ψ ψ
1 h 2 φφ 2 φ φ , 4 2 m0 c
170
7 Klassische relativistische Feldtheorie
womit aus dem letzten Ergebnis Ψ σ3 HΨ
h 2 φ φ 2m 0 c2
h 2 m c2 φ φ 0 φφ 2m 0 2
wird. Hieraus ergibt sich durch Integration nach einer partiellen Integration bezüglich des zweiten Terms 4 3 2 h φ φ h 2 φ φ m 0 c2 φφ 3 3x (7.59) d d 3x H . Ψ σ3 H Ψ d x 2m 0 2 2m 0 c2
7.4.3 Maxwell-Feld Stellt man die Felder E und B mit
φ
E
∂t A ,
B
rot A
durch die Potentiale φ und A dar, so ergeben sich für diese aus den Maxwell-Gleichungen nach (E7.4)–(7.5) die Gleichungen φ ∂t ∂t φ/c 2 div A λ/ε0 , A ∂t φ/c 2 div A μ0 j .
Mit dem Viererpotential Aα φ/c, A, dem Viererstrom jα λc, j sowie mit ∂t φ/c2 div A ∂ σ A σ und ε0 μ0 1/c2 lassen sich diese Gleichungen in die Form ∂0 (∂ σ A σ )
A0
μ0 j0 ,
∂l (∂ σ A σ )
Al
μ0 jl
überführen, oder nach Heben der Indizes 0 und l zusammengefaßt in Aα
∂ α (∂ σ Aσ )
μ0 j α .
(7.61)
Gleichung (7.61) gilt, wenn keine spezielle Eichung zugrunde gelegt ist. Im Fall der Lorenz-Eichung ∂ σ A σ 0 entfällt der zweite Term der linken Seite. Als Lagrange-Dichte mit der Dimension einer Energiedichte, bei der über einen freien Multiplikationsfaktor so verfügt ist, daß sie die mit φ verknüpfte potentielle Energiedichte wie in der klassischen Mechanik als Beitrag λφ A0 j 0 enthält, erweist sich 2μ1 (g αβ ∂α Aβ )2 (∂α Aβ )(∂ αAβ ) Aβ j β . (7.62) 0
Dabei ist der Strom j β als vorgegebenes (externes) Feld aufgefaßt, das nicht variiert wird. Die Lagrange-Gleichung (7.18) lautet mit ηr A β
∂ ∂A
∂ ∂ ∂ x α ∂ Aβ,α und mit
1 gαβ ∂ σ A σ μ
∂ ∂ Aβ,α
0
β
∂ αA β ,
,
(7.63)
jβ
∂ ∂ Aβ
(7.64)
7.4 Anwendung auf spezielle Felder
171
ergeben sich aus ihr unmittelbar die Maxwell-Gleichungen (7.61).2 Für den Fall der Lorenz-Eichung, ∂ β A β g αβ ∂α Aβ 0, lautet (7.62) ausführlicher 1 β Aβ A 2μ0 c2
1 (∂l Aβ )(∂ lA β ) Aβ j β . 2μ0
(7.66)
Hieraus folgen nach (7.21) mit ηr A β bzw. A β die zu A β bzw. A β konjugierten Impulsdichten ∂ 1 ∂ 1 β Aβ , πβ A . (7.67) πβ 2 β μ0 c μ0 c 2 ∂ A ∂ A β
(Der Faktor 1/2 entfällt aus Gründen, die den in Fußnote 2 angegebenen entsprechen.) Als Hamilton-Dichte ergibt sich damit
πβ A β πβ A β 2μ1 c2 A β A β 2μ1 0
0
(∂l A β )(∂ lAβ )
Aβ j β
oder nach Elimination von A β mit Hilfe von (7.67)
Aus π β onsverhalten
μ0 c 2 πβ π β 2
2μ1
0
(∂l A β )(∂ lA β )
Aβ j β .
(7.68)
∂0 A β /(μ0 c) folgt bei einer Lorentz-Transformation das Transformati-
π ¼β
∂0¼ A¼ β μ0 c
Λ 0 0 Λβ γ π γ
∂ x α/∂ x ¼ 0 ∂α (Λβ γ Aγ ) μ0 c Λl 0 Λβ γ ∂l Aγ , μ0 c
Λ α 0 Λβ γ ∂α Aγ μ0 c
d. h. die kanonischen Impulse sind keine Vierervektoren. Die Auswertung der Hamiltonschen Bewegungsgleichungen (7.31) mit (7.68) führt zu den Feldgleichungen (7.61) ohne den Term ∂ α (∂ σ Aσ ) zurück (Aufgabe 7.4). Bei der Berechnung ihrer Lösungen muß die Eichbedingung ∂ σ A σ 0 als Nebenbedingung berücksichtigt werden.
2 Man beachte, daß bei der Ableitung des Klammerterms von nach Aβ,α auch ∂ α Aβ g αρ g βσ Aρ,σ differenziert werden muß, was am einfachsten wird, wenn man Tαβ ∂ α Aβ T αβ ∂α Aβ benutzt. In der Literatur wird häufig statt (7.62) die Lagrange-Dichte
¼
1 (∂α Aβ )(∂ β Aα ) 2μ0
(∂α Aβ )(∂ α Aβ )
Aβ j β
1 Fαβ F αβ 4μ0
Aβ j β
(7.65)
mit Fαβ ∂α Aβ ∂β Aα Aβ,α Aα,β benutzt, die ebenfalls zu (7.61) führt. Diese besitzt jedoch den Nachteil, daß sie in der Hamilton-Theorie π 0 0 zur Folge hat. Bei der kanonischen Feldquantisierung geht man dann zu einer anderen Dichte über, die im wesentlichen (7.62) entspricht.
172
7 Klassische relativistische Feldtheorie
In Aufgabe 7.5 werden die Ausdrücke berechnet, die sich für πα bzw. π α und für ohne die Lorenz-Eichung ergeben. Sie lauten π0 und
1 l ∂ Al , μ0 c
π0
2μ1
0
1 Al , μ0 c2
πl
πl
1 l A μ0 c 2
(7.69)
1 β 2 σ l β σ 2 A A (∂ A )(∂ A ) A ∂ A (∂ A ) Aβ j β . β l β 0 σ σ c2 c
(7.70)
7.4.4 Dirac-Feld Wir betrachten zunächst den Spezialfall freier Teilchen, also die Dirac-Gleichung h α γ ∂α ψ i
m 0c ψ 0
(7.71)
und die dazu adjungierte Gleichung, (2.213) mit Aα 0, h ∂α ψ γ α i
m0c ψ
0.
(7.72)
Als Lagrange-Dichte mit der Dimension einer Energiedichte errät man
h c ψ γ α ∂α ψ m 0 c2 ψψ . i
(7.73)
Für diese gilt
∂ ∂ψ
2
m 0c ψ ,
h c ψ γ α , i
∂ ∂ψ,α
∂
∂ψ
∂
h c α γ ∂α ψ i
m0c ψ
2
,
0,
∂ψ ,α
und aus (7.18) folgt für ηr ψ bzw. ηr ψ h α γ ∂α ψ i
m0c ψ 0
bzw.
h ∂α ψ γ α i
m0c ψ ,
also die Dirac-Gleichung (7.72) bzw. die zu dieser adjungierte Gleichung. (An sich müßte dies für jede Spinorkomponente der Gleichung einzeln gezeigt werden, aber man kann die dabei erhaltenen Ergebnisse, wie geschehen, gleich wieder zu Spinoren zusammenfassen. Die Ableitung ∂ /∂ψ ist dabei als Spaltenmatrix aufzufassen, in der die Elemente ∂ /∂ψ 1 , ∂ /∂ψ 2 usw. stehen.) Ausführlicher ist durch
ih ψ γ 0 ψ hic ψ γ l ∂l ψ
m 0 c2 ψ ψ
(7.74)
7.4 Anwendung auf spezielle Felder
173
gegeben. Hieraus folgt der zu ψ kanonisch-konjugierte Impuls π
ih ψ γ 0
∂ ∂ψ
(2.212)
ih ψ γ 0 γ 0
der zu ψ konjugierte Impuls π verschwindet. Für
πψ
(7.75) hc
i
ψ γ l ∂l ψ
ψ γ0 ψ
π
ih
m 0 c2 ψψ .
(2.205)
ih ψ ,
(7.75)
finden wir daher hc ψ γ l ∂l ψ i
m 0 c2 ψψ (7.76)
von den kanoniWie bei der Schrödinger-Gleichung besteht das Problem, daß schen Impulsen π und π unabhängig ist, so daß aus (7.29a) ψ δ /δπ 0 folgen würde. Ähnlich wie bei dieser muß daher Gleichung (7.75) zur Elimination von ψ benutzt werden. Dazu multiplizieren wir diese von rechts mit γ 0 und erhalten ψ πγ 0 /(i h). Aus (7.76) ergibt sich damit die komplexwertige Hamilton-Dichte
cπγ 0 i h
h l γ ∂l ψ i
m 0 cψ
.
(7.77)
Für spätere Zwecke sei angemerkt, daß sie mit (7.75d) und (2.171) auch in der Form
ψ H D ψ
mit
H D
cαl
h ∂l i
m 0 c2 β
(7.78)
geschrieben werden kann, wobei H D nach (2.44) der Hamilton-Operator der in der Form ψ geschriebenen Dirac-Gleichung ist. Die Hamilton-Funktion (7.35b) ist i h∂ tψ H D H ψ H D ψ d 3x . (7.79) Für die in Abschn. 2.4 untersuchten Ebene-Welle-Lösungen ergibt sich hieraus mit (2.71a) und (2.78) H Ep ψ ψ d 3x , was bei Einschränkung der Lösungen auf das Volumen eines Würfels zum Zwecke der 2 Normierbarkeit mit der Normierungsbedingung ψ ψ d 3x 1 zu H Ep führt. Im Gegensatz zu dem, was wir in Abschn. 7.5.2 beim Klein-Gordon-Schrödinger-Feld feststellen werden, führt hier auch die (klassische) Feldtheorie (außer zu positiven) noch zu negativen Energien. Erst die Feldquantisierung verhilft schließlich auch dem Dirac-Feld zu ausschließlich positiven Energien (Abschn. 8.4.2). Die zu (7.77) gehörigen Hamilton-Gleichungen (7.31) lauten δ 1 hc δ 1 0 l 2 0 2 0 hc 0 l γ γ ∂l ψ m 0 c γ ψ , π m 0 c πγ ∂l πγ γ . ψ δπ i h i δψ i h i
174
7 Klassische relativistische Feldtheorie
Aus der ersten dieser Gleichungen folgt nach Linksmultiplikation mit γ 0 /c die DiracGleichung (7.71), aus der zweiten nach Multiplikation mit 1/c und Einsetzen von (7.75) die zu dieser adjungierte Gleichung (7.72). Jetzt wenden wir uns dem Fall der Dirac-Gleichung mit elektromagnetischem Feld zu. Nach (2.173) geht diese mit e q aus der Dirac-Gleichung für freie Teilchen durch die (2.145) entsprechende Ersetzung (h /i)∂α (h /i)∂α q Aα hervor. Statt (7.73) erwarten wir daher die Lagrange-Dichte
hc ψ γ α ∂α ψ i
m c ψψ cqψγ A ψ . 0
α
2
(7.80)
α
Die daraus folgenden Lagrangeschen Bewegungsgleichungen (7.18) lauten
h α γ ∂α ψ i
qγ A ψ m cψ 1c ∂∂ψ 1c ∂ ∂x α
α
0
∂ α
∂ψ ,α
0,
führen also zu (2.173). Da der durch das Feld Aα hinzugekommene Term nicht von ψ und ψ abhängt, ergeben sich als kanonische Impulse wieder π 0 und (7.75) sowie die Hamilton-Dichte
π ψ cqψγ A ψ cqπγ γ A ψ/(i h ) , α
0
α
0 α
0
α
(7.81)
wobei 0 die Hamilton-Dichte (7.77) ohne elektromagnetisches Feld ist. Nach (2.220b) ist cψγ α ψ die Teilchenstromdichte. Wird diese mit der Teilchenladung q multipliziert, so entsteht aus ihr die elektromagnetische Stromdichte.Wird diese mit jelα bezeichnet, so können wir auch in der Form
j 0
α el A α
mit
jelα
qcψγ
α
ψ
(7.82)
schreiben.
7.5
Noether-Theorem und Erhaltungssätze
7.5.1 Ableitung des allgemeinen Noether-Theorems
Wie in der Mechanik folgen auch in einer Feldtheorie Erhaltungssätze, beson2 wenn dere Symmetrien vorliegen. Das ist der Fall, wenn die Wirkung S d 4 x bei einer gemeinsamen (aktiven) Transformation xα
α
x¼ ,
ηr (x)
ηr¼ (x ¼ )
der Koordinaten und Feldvariablen unverändert bleibt, d. h. wenn ¼ ¼ ¼ ¼ 4 ¼ (ηr , ∂ α ηr , x ) d x (ηr , ∂α ηr , x) d 4 x
(7.83)
(7.84)
7.5 Noether-Theorem und Erhaltungssätze
175
gilt. Da jede endliche Transformation aus infinitesimalen Transformationen zusammengesetzt werden kann, genügt es, wenn wir unsere Betrachtung auf letztere einschränken. Wir definieren dxα
x¼
α
xα ,
dηr
ηr (x ) ¼
ηr (x) .
¼
(7.85)
Aus x ¼ α x α d x α folgt ∂ x ¼α ∂xβ
∂xβ ∂ x ¼α
δαβ ∂β d x α ,
δβα
∂ ¼α d x β
δβα
∂α d x β ,
da unter Vernachlässigung von Termen quadratischer Ordnung in den Differentialen ∂ dxβ ∂ x ¼α
β
∂∂dxxγ
∂xγ ∂ x ¼α
β
∂∂dxxγ
gilt, außerdem ist d4x ¼
det
δγα
∂ ¼α d x γ
∂ x ¼α ∂xβ
β
∂∂dxxα (d x 2)
d4x .
Die Determinante besteht aus einer Summe von Produkten aus jeweils vier Elementen der Matrix ∂ x ¼ α/∂ x β δ αβ ∂β d x α , unter denen auch das Produkt der Diagonalterme enthalten ist. Alle außer diesem enthalten mindestens zwei Nicht-Diagonalterme und sind daher mindestens von der Ordnung (d x 2 ), sodaß sie weggelassen werden dürfen. Einen Beitrag erster Ordnung liefert nur das Produkt der Diagonalterme, und dieses ist 3 + ∂x α ∂xα ¼
α 0
3 +
(1 ∂α d x α ) 1 ∂α d x α (d x 2 ) .
α 0
Damit ergibt sich d4x
(1 ∂α d x α ) d 4 x .
(7.86)
Weiterhin gilt ∂ηr ∂ x α
∂(ηr∂x βdηr ) ∂∂xxα β
ηr,β ∂β dηr
δ βα ∂α d x β
ηr,α (dηr ),α
ηr,β ∂α d x β,
wobei das Produkt zweier Differentiale weggelassen wurde. Damit erhalten wir bis zu Termen erster Ordnung (ηr , ∂ α ηr , x ) d 4x ηr dηr , ηr,α (dηr ),α ηr,β ∂α d x β, x α d x α 1∂β d x β d 4x
(ηr , ηr,α , x) d 4 x d d 4x (ηr , ηr,α , x) (∂β d x β ) d 4x
mit d
∂ ∂ ∂η dηr ∂η r
r,α
(dηr ),α
∂ ηr,β ∂α d x β ∂ηr,α
(7.87)
∂∂xβ d x β ,
wobei die „explizite Ableitung“ ∂ /∂ x β bedeutet, daß die Ableitung nach x β entgegen unserer früheren Verabredung (Fußnote 1) bei festegehaltenen ηr und ηr,α gebildet
176
7 Klassische relativistische Feldtheorie
wird. Mit der Ableitung ∂ /∂ x β , bei der nur die unabhängigen Variablen x β x α festgehalten und die Feldgrößen ηr sowie ηr,α variiert werden, besteht der Zusammenhang
∂ (ηr , ηr,α , x) ∂xβ
∂ ∂ ∂η ηr,β ∂η
r
r,α
∂β ηr,α
∂∂xβ .
Wenn dies in d eingesetzt und ∂ /∂ηr (zweimal) mit Hilfe von (7.18) ersetzt wird, folgt ∂ ∂ ∂ ∂ s.u. ∂α dηr ηr,β ∂α d x β d dηr ∂ x α ∂ηr,α ∂ηr,α ∂ηr,α ∂ ∂x α ∂η∂ ηr,β d x β ∂η∂ (∂α ηr,β ) d x β ∂∂x β d x β , r,α r,α
wobei für den vorletzten Term ∂β ηr,α ∂α ηr,β benutzt wurde. Durch das Zusammenfassen von Ableitungen ergibt sich schließlich ∂ ∂ ∂ ∂ d α dηr ηr,β d x β β d x β . (7.88) ∂x ∂ηr,α ∂ηr,α ∂x
Hiermit und mit (7.87) lautet die Symmetrieforderung (7.84)
∂ ∂ ∂ α β dη η δ d x d4x d ∂β d x β d 4 x r r,β β α ∂η ∂ x ∂η r,α r,α G G
0.
Wenn wir verlangen, daß (7.84) bzw. diese Bedingung für beliebige Gebiete G gilt, erhalten wir aus ihr den als Noether-Theorem bezeichneten differentiellen Erhaltungssatz
∂ ∂ ∂ α β d x dη η δ 0. (7.89) r r,β β ∂ x α ∂ηr,α ∂ηr,α
Hinweis. Auf folgendes sei noch hingewiesen. In Gleichung (7.83b) kann sich ηr einerseits dadurch ändern, daß bei gleichbleibendem Ort das Feld abgeändert wird, andererseits dadurch, daß bei festgehaltenem Feld im Ort von x zu x ¼ übergegangen wird. Wird der erste dieser beiden Bestandteile mit δηr (x) ηr¼ (x) ηr (x)
(7.90)
bezeichnet, so folgt aus (7.85b)
ηr (x ) ηr (x ) ηr (x ) ηr (x) (7.90) δηr (x ) ηr,α d x α s.u. δηr (x) ηr,α d x α. (Dabei wurde in δηr (x )δηr (x)(∂α δηr )d x α der in differentiellen Größen quadratidηr
¼
¼
¼
¼
¼
¼
sche zweite Term weggelassen.) Hiermit kann (7.89) auch in die Form ∂ ∂ α δη d x 0 r ∂ x α ∂ηr,α
gebracht werden.
(7.91)
7.5 Noether-Theorem und Erhaltungssätze
177
7.5.2 Translationsinvarianz und Energie-Impuls-Erhaltung Besitzt das Feld ηr (x) raum-zeitliche Verschiebungsinvarianz, so gilt dηr bige konstante d x β εβ 0. Mit der Definition Θ αβ
∂η∂
r,α
ηr,β
δαβ
0 für belie-
(7.92)
folgt dann aus (7.89) wegen der raum-zeitlichen Konstanz der ε β εβ ∂α Θ αβ
0.
Da die Verschiebungsinvarianz bei beliebigen Verschiebungen bestehen soll, können die Verschiebungen ε β unabhängig voneinander beliebig gewählt werden, insbesondere so, daß nur eine der vier von null verschieden ist. Damit folgt aus der zuletzt abgeleiteten Gleichung die Kontinuitätsgleichung ∂α Θ αβ
∂ α Θαβ 0 .
(7.93)
Nach unseren Erfahrungen aus der Mechanik und der Elektrodynamik erwarten wir, daß Θ αβ der Energie-Impuls-Dichtetensor ist. Tatsächlich gilt Θ 00
∂∂η ηr (7.21) π r ηr (7.24) r
,
(7.94)
d. h. Θ 0 0 ist die Hamilton-Dichte des betrachteten Feldes, die in sämtlichen der in Abschn. 7.4 untersuchten Spezialfälle mit der Energiedichte übereinstimmt. Nach der Speziellen Relativitätstheorie, Abschn. „Kovariante Formulierung der Elektrodynamik“, muß demnach 1 Θ 0 α d 3x E/c, p (7.95) c gelten, wobei E die Energie und p der Impuls des Feldes ist. Mit (7.94), der Beziehung Θ 0l c(∂ /∂ η r )ηr,l cπ r ηr,l und pl pl ergibt sich aus (7.95)
E
p
d 3x ,
π r ηr d 3x .
(7.96)
Bei der Ableitung des Erhaltungssatzes (7.93) wurde nichts über das zugrundeliegende Inertialsystem ausgesagt,2d. h. dieses kann beliebig gewählt werden. Allerdings ist zu beachten, daß die Größen Θ 0α d 3x/c keine Vierervektoren sind, im allgemeinen gilt vielmehr 1 1 0α 3 ¼ Θ dx Θ 0β d 3x Λ αβ . c c ¼
Dies bedeutet, daß beim Übergang 2S S ¼ zwischen Inertialsystemen Θ αβ als Tensor transformiert und dann E ¼ /c, p¼ Θ 0α d 3x ¼ gesetzt werden muß. ¼
178
7 Klassische relativistische Feldtheorie
(7.93) ist äquivalent zu ∂t Θ 0β c∂l Θ lβ . Für β 0 bzw. β 1, 2, 3 ergibt sich hieraus durch räumliche Integration der Energie- bzw. Impulserhaltungssatz dE dt
d dt
IR3
Θ
0
0d
3
x
0,
d pl dt
s.u.
d dt
Θ 0l 3 dx IR3 c
0.
s.u.
(7.97)
(Man beachte pl pl und Θ 0 l Θ 0l .) Dabei wurde mit Hilfe des Gaußschen Satzes die Umformung ∂ l 3 Θβd x Θ lβ d fl 0 l IR3 ∂ x vorgenommen und angenommen, daß Θ lα im Unendlichen hinreichend schnell verschwindet. Die Voraussetzungen für die Gültigkeit der Erhaltungssätze (7.97) sind offensichtlich immer erfüllt, wenn die Lagrange-Dichte nicht explizit vom Ort und von der Zeit abhängt. Für das Klein-Gordon-Schrödinger-Feld ergibt sich aus (7.96a) mit (7.59) die Feldenergie 2 1 h h 2 2 E φφ φ φ m 0c φφ d 3x. (7.98) 2 IR3 m 0 c2 m0 Diese ist positiv definit, d. h. die Feldtheorie liefert nur positive Energiewerte für das Klein-Gordon-Schrödinger-Feld und beseitigt damit die Schwierigkeiten, die bei der Ein-Teilchen-Deutung hinsichtlich der Energie entstanden sind. In Abschn. 7.4.2 wurde gezeigt, daß (7.98) mit dem verallgemeinerten Mittelwert (7.60) für die Energie übereinstimmt. Der Impuls des Klein-Gordon-Schrödinger-Feldes ist nach (7.96b) mit η1 φ und η2 φ p (7.99) π φ π φ d 3x . IR3
Beim freien Dirac-Feld hängt ist pl
1c
Θ 0l d 3x
nach (7.74) nur von ψ und nicht von ψ ab. Daher
(7.92)
oder p
∂ ψ,l d 3x ∂ ψ
i h
i h
(7.75)
ψ ψ,l d 3x
ψ ψ d 3x .
(7.100)
Symmetrie des Energie-Impuls-Tensors. Aus (7.92) folgt mit (7.51) Θαβ
h 2 2m
0
(∂α φ )(∂β φ) (∂α φ)(∂β φ )
gαβ
Θβα .
(7.101)
Der Energie-Impuls-Tensor des Klein-Gordon-Schrödinger-Feldes ist also symmetrisch, was darauf zurückzuführen ist, daß φ ein skalares Feld ist. Aus der Definition (7.92) folgt dagegen im allgemeinen kein symmetrischer Energie-Impuls-Tensor. In
7.5 Noether-Theorem und Erhaltungssätze
179
der Speziellen und Allgemeinen Relativitätstheorie wiederum erwies sich der EnergieImpuls–Tensor bzw. der Materietensor eines Systems von Punktteilchen, des elektromagnetischen Feldes und allgemeiner aller gravitationserzeugenden Ursachen als symmetrisch (siehe Spezielle Relativitätstheorie und Allgemeine Relativitätstheorie). Da die von uns betrachteten Felder materielle Teilchen beschreiben sollen, ist es daher wünschenwert, auch bei allen Quantenfeldern mit einem symmetrischen EnergieImpuls-Tensor rechnen zu können. Das ist tatsächlich möglich, weil sich aus dem Erhaltungssatz (7.93) für Θαβ eine ganze Klasse weiterer Erhaltungssätze für Größen Tαβ ableiten läßt, an die weitergehende Forderungen gestellt werden können. Um diese zu erhalten, wählen wir den Ansatz Θαβ
Tαβ
∂ σ f σ αβ
(7.102)
mit einem dreistufigen Tensor f σ αβ . Die Symmetrieforderung Tαβ führt zu der Gleichung ∂ σ ( f σ αβ
Tβα
(7.103)
fσβα ) Θβα Θαβ ,
(7.104)
und die aus (7.102) mit (7.93) folgende Gleichung ∂ α Tαβ
∂ α ∂ σ fσ αβ ∂ σ ∂ α fασβ 12 ∂ α ∂ σ
f ασβ
fσ αβ
führt zu der Kontinuitätsgleichung ∂ α Tαβ
0,
(7.105)
wenn wir an fασβ noch zusätzlich die Antisymmetrieforderung f ασβ
fσ αβ
(7.106)
stellen. Aus dieser folgt f ααβ 0, was zur Folge hat, daß bei festem β noch sechs Komponenten frei wählbar sind, so daß es unter Einschluß der vier Möglichkeiten für die Wahl von β insgesamt 4 624 unabhängige Komponenten fσ αβ gibt. Von diesen müssen die linearen partiellen Differentialgleichungen (7.104) erfüllt werden. Da wegen der Antisymmetrie in α und β nur 6 von ihnen unabhängig sind, haben sie immer eine Lösung. Wird diese in (7.102) eingesetzt, so besitzt Tαβ die Symmetrieeigenschaft (7.103) und erfüllt die Kontinuitätsgleichung (7.105). Die aus Tαβ in Analogie zu (7.95) gemäß 1 (7.107) T 0α d 3x E/c, p c abgeleiteten Werte für Energie und Impuls stimmen mit den aus Θαβ abgeleiteten Werten überein, denn es gilt s.u. σ 0 3 s.u. l 0 3 ∂ fσ α d x ∂ fl α d x fl 0 α d f l 0 IR3
IR3
½
180
7 Klassische relativistische Feldtheorie
), und damit folgt
( f 0 0 α verschwindet wegen (7.106), und es gilt fl 0 α 0 für x Θ 0α d 3x . T 0α d 3x
7.5.3 Rotationsinvarianz und Drehimpulserhaltung In diesem Abschnitt werden Erhaltungssätze abgeleitet, die aus dem Noether-Theorem bei Invarianz der Wirkung gegenüber raum-zeitlichen Drehungen folgen. Ausder für räumlicheDrehungen gültigen Beziehung d x (x ¼ x) d x bzw. d xi j,k εi j k dϕ j x k k dϕik x k mit dϕik j εi j k dϕ j entnehmen wir für raumzeitliche Drehungen um den Koordinatenursprung x α 0 den Ansatz
x x dϕ
dxα
¼
α
α
αβ
xβ
(7.108)
mit in Raum und Zeit konstanten Drehwinkeln dϕ αβ . Damit es sich wirklich um Drehungen handelt, muß die Invarianz des Abstands vom Koordinatenursprung, also (x α d x α )(x α d x α ) x α x α gefordert werden, unter Vernachlässigung von Termen zweiter Ordnung also 2x α d x α 2x α x β dϕ αβ 2xβ x α dϕ βα x α x β dϕ αβ dϕ βα 0.
Hieraus folgt
dϕ αβ
dϕ
βα
.
(7.109)
Bei der räumlichen Drehung eines Vektorfeldes ist die Feldänderung proportional zum Drehwinkel und zur Feldstärke (Abb. 7.2). In Verallgemeinerung dieses Sachverhalts betrachten wir Änderungen des Feldes ηr (x), die durch dηr
η (x ) η (x ) 12 I ¼
r
¼
α
α
r
βγ s rs dϕβγ η
(7.110)
gegeben sind, wobei ηr ηr gesetzt wurde, um auch bezüglich des Index r die relativistische Summenkonvention (Summation, wenn ein oberer und ein unterer Index überβγ einstimmen) benutzen zu können. Dabei kann an die Koeffizienten Irs die Antisymmetrieforderung βγ
Irs
I
γβ rs
(7.111)
gestellt werden, da wegen βγ
Irs dϕβγ
I
I
(7.109) γβ rs dϕγ β
γβ rs dϕβγ
12 I I βγ rs
γβ rs
dϕβγ
nur ihr antisymmetrischer Anteil einen Beitrag zu dηr liefert. Der Zusammenhang (7.108) zwischen x ¼ α und x α ist eine affine Transformation, die den Abstand x α x α invariant läßt. Nach Abschn. „Lorentz-Transformation – Affinität der Transformation“ der Speziellen Relativitätstheorie handelt es sich daher um
7.5 Noether-Theorem und Erhaltungssätze
181
B B d B B dϕ Abb. 7.2: Drehung eines Vektorfeldes um den Koordinatenursprung.
dϕ
dϕ
eine Lorentz-Transformation. Gleichung (7.110) beschreibt die durch diese induzierte Transformation des Feldes ηr (x). (In Aufgabe 7.7 wird gezeigt, daß das aus (2.180) mit (2.200) hervorgehende Transformationsgesetz für Spinoren bei infinitesimalen Drehungen (ϕ dϕ) in (7.110) enthalten ist.) Die funktionale Abhängigkeit der LagrangeDichte von ηr , ∂α ηr und x muß in jedem Inertialsystem die gleiche sein, außerdem ist ein Skalar und daher invariant. Dies hat zur Folge, daß für die durch (7.108) und (7.110) beschriebenen infinitesimalen Lorentz-Transformationen ¼ ¼ ¼ ¼ ¼ ¼ (7.112) ηr (x ), ∂α ηr (x ), x ηr (x), ∂α ηr (x), x
gelten muß. Da für diese außerdem d 4 x ¼ d 4 x ist, folgt die Gültigkeit der Invarianzbeziehung (7.84) und damit des Erhaltungssatzes (7.89). Mit (7.108), (7.110) und (7.92) lautet dieser ∂ 1 ∂ βγ s αβ γ dϕβγ I η Θ x 0, (7.113) rs ∂ x α 2 ∂ηr,α
wobei die raum-zeitlich konstanten dϕβγ vor die Ableitung gezogen werden konnten. Unter Benutzung von β γ (7.109) 1 dϕβγ Θ αβ x γ dϕγ β Θ αγ x β Θ αβ x γ Θ αγ x β dϕβγ 2 kann die letzte Gleichung auch in die Form 1 dϕβγ ∂α 2 mit
αβγ s.u.
1 ∂ βγ Irs ηs c ∂ηr,α
αβγ
0
(7.114)
Θ αβ x γ Θ αγ x β
(7.115)
gebracht werden, in der der Faktor 1/c eingefügt wurde, damit αβγ eine geeignete Dimension erhält. Der Tensor αβγ ist in den beiden letzten Indizes antisymmetrisch,
αβγ
αγ β ,
was aus (7.111) und der Struktur des Terms in runden Klammern hervorgeht. Nach (7.114) muß das Produkt des antisymmetrischen Tensors ∂α αβγ mit dem antisymmetrischen Tensor dϕβγ für jede beliebige Wahl des letzteren verschwinden. Das ist nur möglich, wenn
∂ βγ s αβγ (7.93) 1 βγ γβ c ∂α ∂η Irs η Θ Θ 0 (7.116) ∂α r,α
182
7 Klassische relativistische Feldtheorie
gilt. (7.116) ist ein differentieller Erhaltungssatz für die Tensordichte der integrale Erhaltungssatz d 0βγ 3 dx 0 dt folgt, d. h. die Größe
αβγ,
aus dem
M αβ
0αβ
d 3x
L αβ
S αβ
M βα
(7.117)
mit L
αβ
1 c
α
x Θ
0β
β
x Θ
0α
3
d x L
βα
,
1 ∂ S I αβ ηs d 3x c ∂ηr,0 rs αβ
(7.111)
S βα
(7.118) ist eine Erhaltungsgröße. Nach (7.95) ist Θ 0l/c eine Impulsdichte, der Integrand von L lm also das Kreuzprodukt aus dem Ortsvektor und der Impulsdichte in Komponentendarstellung. Die räumlichen Komponenten von L αβ können daher als Bahndrehimpulskomponenten aufgefaßt werden. lm 0 gilt für den Bahndrehimpuls allein offensichtlich kein ErhaltungsIm Fall Irs satz. Es liegt nahe, S lm als einen intrinsischen Drehimpuls des Feldes aufzufassen, der durch den Spin der dem Feld zugeordneten Teilchen zustande kommt. Von der Richtigkeit dieser Interpretation werden wir uns später am Beispiel des Dirac-Feldes überzeugen. Die Erhaltung der raum-zeitlichen Komponenten M 0α M α0 stellt den Schwerpunktsatz dar (Aufgabe 7.9). βγ Im Fall skalarer Felder, ηr φ, sind alle Koeffizienten Irs 0, und aus (7.116) folgt Θ γ β Θ βγ 0, d. h. der Tensor Θ αβ muß symmetrisch sein, wie wir das z. B. auch beim Klein-GordonSchrödinger-Feld festgestellt haben. Wenn Θ αβ nicht symmetrisch ist, kann mit (7.102) zu einem symmetrischen Energie-Impuls-Tensor übergegangen werden. Dann stellt sich allerdings die Frage, wie sich durch T αβ eine geeignete Drehimpulsdichte darstellen läßt. Der einfache Zusammenhang :αβγ 1 T αγ x β T αβ x γ , (7.119) c
der dem Spin scheinbar nicht Rechnung trägt, erweist sich als passend. Mit (7.103) und (7.105) ergibt sich, daß :αβγ die Kontinuitätsgleichung
∂α :αβγ
0
erfüllt. Die zur Symmetrisierung von Θ αβ benutzte Funktion f σ αβ und eine weitere, in den beiden ersten Indizes antisymmetrische Funktion g σ αβγ
g ασβγ
(7.120)
7.5 Noether-Theorem und Erhaltungssätze
lassen sich so bestimmen, daß zwischen
:
αβγ
183 αβγ
αβγ
und :αβγ der Zusammenhang 1 ∂σ g σ αβγ c
(7.121)
besteht (Beweis unten), der mit g 00βγ g 00βγ 0 die Gleichung 1 l0αβ 3 αβ 0αβ 3 0αβ 0αβ 3 : : dx dx M ∂l g dx c
M αβ
zur Folge hat. Die aus :αβγ berechneten Drehimpulse stimmen also mit den aus berechneten überein und enthalten daher auch einen Spinanteil.
αβγ
Beweis: Aus (7.119) und (7.121) folgt mit (7.102) und (7.115), daß g σ αβγ die Gleichung x β ∂σ f σ αγ
x γ ∂σ f σ αβ
∂η∂
r,α
βγ
Irs ηs
∂σ gσ αβγ
erfüllen muß. Mit dem Ansatz g σ αβγ
x β f σ αγ
x γ f σ αβ
(7.122)
folgt aus dieser die Gleichung f γ αβ
f βαγ
∂η∂
r,α
βγ
Irs ηs ,
und man verifiziert leicht durch Einsetzen, daß sich hieraus 1 αβ ∂ ∂ βσ ∂ σ αβ ασ 2 Irs ∂η Irs ∂η Irs ∂η ηs f r,σ r,α r,β
ergibt. f σ αβ genügt der Symmetriebedingung (7.106), denn 1 σβ ∂ f ασβ Irsβα ∂η∂ Irsσ α Irs 2 ∂ηr,α r,σ 1 βσ ∂ (7.111) Irsαβ ∂η∂ Irsασ Irs 2 ∂ηr,α r,σ
∂ ∂ηr,β ∂ ∂ηr,β
ηs ηs
f σ αβ ,
und hiermit sowie mit (7.122) folgt die Erfüllung der Symmetriebedingung (7.120). Es verbleibt, zu zeigen, daß auch Gleichung (7.104) erfüllt wird. Hierzu berechnen wir 1 αβ ∂ βσ ∂ βα ∂ βσ ∂ ασ ∂ ασ ∂ ηs f σ αβ f σβα Irs Irs Irs Irs Irs Irs 2 ∂ηr,σ ∂ηr,α ∂ηr,β ∂ηr,σ ∂ηr,β ∂ηr,α
(7.106) αβ Irs
∂ ηs . ∂ηr,σ
Aus (7.104) wird damit
αβ ∂ ∂σ Irs ηs Θβα ∂ηr,σ
und nach (7.116) ist diese Gleichung erfüllt.
Θαβ ,
184
7 Klassische relativistische Feldtheorie
7.5.4 Eichinvarianz und Ladungserhaltung
Die Lagrange-Dichte (7.51) des Klein-Gordon-Schrödinger-Feldes ist offensichtlich invariant gegenüber der Eichtransformation φ φ ¼ φ e iδ , die bei der Wellenfunktion eine konstante Phasenverschiebung δ bewirkt – es gilt φ ¼ φ ¼ £ φφ £ und (∂α φ ¼ )(∂α φ ¼ £ ) (∂α φ)(∂α φ £ ). Diese Invarianz gilt natürlich erst recht für die Wirkungsfunktion, so daß daraus nach dem Noether-Theorem ein Erhaltungssatz folgen muß. Für infinitesimale Transformationen δ dδ gilt
dφ
φ¼ φ φ (e 1) i dδ φ,
dφ £
i dδ
i dδ φ£ .
(7.123)
Die Transformation erfolgt ohne Veränderung der unabhängigen Variablen x α , also mit d x α 0. Die Lagrange-Dichte (7.73) des Dirac-Feldes ist invariant gegenüber der Eichtransformation ψ ψ ¼ ψ e iδ , es gilt ψ ¼ γ α ∂α ψ ¼ ei δ ψγ α ∂α ψe i δ ψγ α ∂α ψ und ¼ ¼ ψ ψ ψψ sowie
dψr
i dδ ψ ,
dψ r
r
i dδ ψ
r
dxα
,
0
(7.124)
für die infinitesimale Transformation der Spinorkomponenten ψr bzw. ψ r . Beide Beispiele sind als Spezialfälle unter den Eichtransformationen dηr
dδ λ
rs η
s
,
dxα
0
(7.125)
mit raum-zeitlich konstanten dδ und λrs enthalten. Ist die Wirkung S unter den Transformationen (7.125) invariant, so folgt aus dem allgemeinen Noether-Theorem (7.89) der differentielle Erhaltungssatz ∂ ∂ s λrs η 0 (7.126) ∂ x α ∂ηr,α
und aus diesem der integrale Erhaltungssatz ∂ d (7.21) d λrs ηs d 3x π r λrs ηs d 3x dt ∂ ηr dt
0.
(7.127)
Die hierin auftretende Erhaltungsgröße Q
π r λrs ηs d 3x
(7.128)
wird als Ladung bezeichnet. Im Fall des Klein-Gordon-Schrödinger-Feldes zeigt der Vergleich von (7.125a) mit (7.123), daß λrs i für ηs φ und λrs i für ηs φ £ zu setzen ist. Der Erhaltungssatz (7.126) erhält damit die Form ∂ ∂ α α s.u. 1 £ ∂α j 0 , (7.129) mit j i φ i £ φ h ∂φ,α ∂φ ,α
Aufgaben
185
wobei in j α aus Dimensionsgründen der Faktor 1/h hinzugefügt wurde. Mit (7.54) ergibt sich hieraus ih α φ ∂ φ φ ∂ α φ nc, j , jα (7.130) 2m 0 d. h. (7.129) ist die Kontinuitätsgleichung (4.34) mit (4.35) für den Fall Aα 0. (Die Definition (7.52) würde zu j α 2m 0 j α führen.) Für elektrisch geladene Teilchen der Ladung q folgt daraus, daß die Gesamtladung Q q
3 (7.57) i q j0 3 i hq d x φ π φπ d 3x φ ∂t φ φ ∂t φ d x c h 2m 0 c2
(7.131)
eine Erhaltungsgröße ist. Im Fall des Dirac-Feldes ist nach Gleichung (7.73) nur von ψ,α , nicht jedoch von ψ ,α abhängig, und der Vergleich von (7.125a) mit (7.124a) zeigt, daß λrs i δrs für ηs ψs zu setzen ist. Der Erhaltungssatz (7.126) erhält in diesem Fall die Form
∂α j α
0
mit
jα
i ∂ δrs ψs h ∂ψr,α
i ∂ (7.73) ψ cψγ α ψ, h ∂ψ,α
(7.132) wobei in j α aus Dimensionsgründen wieder der Faktor 1/h hinzugefügt wurde. Mit ψγ 0 ψ ψ (γ 0 )2 ψ ψ β 2 ψ ψ ψ folgt daraus für elektrisch geladene Teilchen der Ladung q die Erhaltung der Gesamtladung Q
q
j0 3 dx c
q
ψ ψ d 3x .
(7.133)
Aufgaben 7.1
1. Zeigen Sie, daß die reelle Lagrange-Dichte ih h2 ψ ψ ψψ ψ ψ V ψψ 2 2m 0
wie die Dichte (7.45) auf die Schrödinger-Gleichung führt. 2. Was ergibt sich aus ihr für die kanonischen Impulse π und π ? 3. Welche Hamilton-Dichte folgt aus ihr? 7.2
1. Zeigen Sie, daß die Lagrange-Dichte der Klein-Gordon-Schrödinger-Gleichung in der Schrödinger-Form durch
ih Ψ
σ3 (∂t Ψ )
h2 ( Ψ )σ3 (i σ2 σ3 )( Ψ ) m 0 c2 Ψ Ψ 2m 0
gegeben ist. 2. Inwiefern stimmt diese mit der Lagrange-Dichte der skalaren Klein-Gordon-Schrödinger-Gleichung überein bzw. unter welchen Umständen ist das der Fall?
186
7 Klassische relativistische Feldtheorie
7.3
Bestimmen Sie den freien Faktor in der Lagrange-Dichte des Klein-Gordon2 3 x freier Wellen Schrödinger-Feldes so, daß sich als Energie E d V E
(m 0 c2 )2
c2 p2
ergibt, wenn das Volumen V die Ladung q trägt. Anleitung: Betrachten Sie ebene Wellen der Form φ(x, t) A ei(Et px)/hÆ und bestimmen Sie A aus der Normierungsforderung für die Ladung. Nach Einsetzen der normierten Ebene-Welle-Lösungen in
1 £ φφ c2
φ φ
£
m 02 c2 h 2
φφ
£
ergibt sich aus der Normierungsforderung für die Energie der zu bestimmende freie Faktor. 7.4
Zeigen Sie, daß die Hamiltonschen Bewegungsgleichungen (7.31) mit der Hamilton-Dichte (7.68) zu den Feldgleichungen (7.61) führen.
7.5
Berechnen Sie die aus der Lagrange-Dichte (7.62) folgenden Impulse πα und π α sowie die zu gehörige Hamilton-Dichte ohne Lorenz-Eichung.
7.6
1. Welche Bedingungen müssen die Komponenten der Dirac-Spinoren erfüllen, damit die Lagrange-Dichte (7.73) des Dirac-Feldes reellwertig ist? 2. Zeigen Sie, daß die Langrange-Dichte
12 hic ψ γα ∂ α ψ ψ γα∂ α ψ m 0 c2 ψψ (7.134) (der Operator ∂ α wirkt nach links auf den Spinor ψ) reell ist und wie die Lagrange-Dichte (7.73) auf die Dirac-Gleichung führt. (Explizite Rechnung!) Hinweis: In der Literatur findet man für die obige Darstellung der LagrangeDichte häufig die abkürzende Notation
hic ψ γα ∂ α ψ m 0 c2 ψψ,
(7.135)
wobei der Operator ∂ nach links und rechts wirkt und oft nach dem römischen Gott Janus der Türen und Tore mit zwei in entgegengesetzte Richtungen blickenden Gesichtern als Janus-Operator bezeichnet wird. 7.7
Zeigen Sie, daß das relativistische Transformationsgesetz für Dirac-Spinoren, 1 ¼ ¼ ¼ ρ σ ψ (x ) Sψ x(x ) mit S exp ωρσ γ , γ dϕ , 8 in dem Transformationsgesetz dηr enthalten ist.
ηr (x α ) ηr (x α ) 12 Irsβγ dϕβγ ηs ¼
¼
Aufgaben
7.8
187
Wie müssen die bei der Ableitung des Drehimpulssatzes benutzten Koeffizienten μν Irs in der Transformationsgleichung ηr¼ (x ¼α )
1 μν s η dωμν Irs 2
ηr (x α )
aussehen, damit der intrinsische Anteil S mn des Drehimpulstensors mit dem Elektronenspin Sh /2 übereinstimmt? Anleitung: Für das Dirac-Feld ist S mn durch 1 ∂ mn I mn ψ d 3x S c ∂ψ,0
gegeben. Dieser Ausdruck ist mit dem Mittelwert h S mn l, m, n zyklisch ψ Σl ψ d 3x, 2 des Spinoperators zu vergleichen. 7.9
Zeigen Sie, daß die Erhaltung der Komponenten M 0α M α0 des Tensors
α 0β β 0α 1 ∂ αβ s x Θ x Θ M αβ Irs η d 3x c ∂ηr,0
den Schwerpunktsatz darstellt.
Lösungen 7.1
1. Mit
∂ ∂ψ
i h ψ , 2
folgt aus ∂0
∂0
i h ψ , 2
∂ ∂ψ,0
∂l
∂ ∂ψ,l
h 2 ψ 2m 0
∂ ∂ ∂ α ∂ψ ∂ψ
∂ ∂ ∂l ∂ψ ∂ψ,0 ,l
,α
die Bewegungsgleichung i h ψ 2. Es gilt π
h 2 2m
0
ψ
∂∂ i2h ψ , ψ
i h ψ
π
∂∂ψ
h 2 ψ . 2m 0 i h ψ. 2
3. Damit folgt
π ψ π ψ i2h
h 2 ψ ψ V ψψ ψ ψ ψ ψ ψ ψ ψ ψ 2m 0
h 2 ψ ψ V ψψ . 2m 0
188
7 Klassische relativistische Feldtheorie
7.4
Aα
∂ ∂πα
1 α A μ0 c2
πα
Hieraus folgt
7.5
μ0 c
1 ∂00 A α μ0
∂ ∂ Aα
2π α ,
∂l
∂l ∂ l A α
∂ ∂ A α,l
jα
1 Aα μ0
j
1 ∂l ∂ l A α . μ0 α.
Mit (7.64a) ergibt sich cπ β
c
∂ ∂ Aβ
∂ ∂ A β,0
1 0β σ g ∂ Aσ μ0
∂ 0Aβ
1 0β σ g ∂ Aσ μ0
Aβ . c
Mit g 00 1 folgt hieraus π 0
1 00 σ A0 1 0 A0 1 l g ∂ Aσ ∂ A 0 ∂ l A l ∂ Al , μ0 c c μ0 c c μ0 c
π l
1 Al μ0 c2
und
π β Aβ
(7.62)
1 0β σ Aβ 1 Aβ (∂ σ A σ )2 g ∂ Aσ μ0 c c 2μ0
7.7
1 1 Aβ Aβ (∂l Aβ )(∂ l A β ) A β j β 2 2μ 2μ0 c 0
1 1 1 1 (∂ σ A σ ) A 0 (∂ σ A σ )2 Aβ Aβ (∂l Aβ )(∂ l A β ) A β j β . 2 μ0 c 2μ0 2μ 2μ0 c 0
Mit der Entwicklung S 1 18 ωρσ γ ρ , γ σ dϕ ergibt sich 1 ψ ¼ (x ¼ ) 1 ωρσ γ ρ , γ σ dϕ ψ 8
dψ
1 ωρσ γ ρ , γ σ dϕ ψ . 8
In Komponenten folgt daraus mit Summenkonvention bezüglich s dψr
1 ωρσ γ ρ , γ σ rs dϕ ψ s . 8
ωρσ ist durch (2.194) definiert, es gilt x¼
ρ
Λρσ x σ
(δ ρσ
ωρσ dϕ) x σ
xρ
ωρσ dϕ x σ
(7.108)
xρ
dϕ ρσ x σ
und als Folge davon dϕρσ
ωρσ dϕ
sowie
dψr
1 ρ σ s γ , γ rs dϕρσ ψ . 8
ρσ
(7.110) bzw. dψr 12 Irs dϕρσ ψ s ist erfüllt, wenn ρσ
Irs
1 ρ σ γ , γ rs 4
gesetzt wird. Mit γ ρ , γ σ γ σ , γ ρ ist auch die Bedingung (7.111) erfüllt.
8
Kanonische Feldquantisierung
Nachdem wir uns mit einer zur Hamiltonschen Mechanik analogen Formulierung für Felder vertraut gemacht haben, können wir jetzt eine an die Quantenmechanik angelehnte Quantisierung von Feldern in Angriff nehmen. Aus dem in Abschn. 7.1 behandelten Beispiel der Mechanik (Gleichung (7.2)) geht hervor, daß das Feld ηr (x, t) der Ortskoordinate x(t) der Mechanik entspricht. Das wird noch deutlicher, wenn wir den Raum in sehr kleine, durchnumerierte Volumenelemente Vi unterteilen und ηr (x, t) durch den Mittelwert 1 ηri (t) ηr (x, t) d 3x (8.1) Vi Vi in Vi ersetzen. Der Feldimpuls in diesem Volumenelement ist pri (t) π r (x, t) d 3x π ri (t)Vi ,
(8.2)
Vi
wobei π ri (t) die mittlere Impulsdichte in Vi ist. Jetzt machen wir die „Orte“ ηri (t) und Impulse pri (t) zu Heisenberg-Operatoren, 1 3 ri ηri (t) ηr (x, t) d x, p (t) π r (x, t) d 3x π ri (t) Vi , (8.3) Vi Vi Vi und verlangen, daß diese den vertrauten Vertauschungsrelationen p
ri
(t), p sk (t) 0,
ηri (t), ηsk (t)
0
(8.4)
und ηri (t),
p sk (t) i h δr s δi k
(8.5)
(mit dem Minus-Kommutator) genügen. Die zusammen mit ηri und pri eingeführten lokalen Operatoren ηr (x, t) und π r (x, t) hängen vom Ort und von der Zeit ab. Beim Grenzübergang Vi 0 gilt ηri (t) ηr (x, t), π ri (t) π r (x, t) sowie ri p (t) π r (x, t) Vi , und mit p
ri
(t), p sk (t) π ri (t), π sk (t) Vi Vk
folgen aus (8.4) die für alle r , s, x und x ¼ gültigen Vertauschungsrelationen π
r
(x, t), π s (x ¼ , t) 0,
ηr (x, t), ηs (x
¼
, t) 0 .
(8.6)
190
8 Kanonische Feldquantisierung
Aus (8.5) wird ηr (x, t), π s (x ¼ , t) i h δrs lim Vk
denn es gilt
δi k 3 f (x) dx Vk
*
δi k 0 Vk
f (x) f (x)
i h δrs δ 3 (x x ), für i für i
0
(8.7)
k, k.
Ersetzen wir in der Hamilton-Funktion (7.35b) mit (7.25) die Funktionen ηr (x, t) und π s (x, t) durch die zugehörigen Operatoren, so erhalten wir den Hamilton-Operator H (t) ηr (x, t), ηr,l (x, t), π s (x, t), x d 3x. (8.8) In Analogie zu den Heisenbergschen Bewegungsgleichungen q
1 q, H , i h
p
1 p, H i h
für die Operatoren q und p fordern wir als Bewegungsgleichungen für die Feldoperatoren i h ηr
ηr , H ,
i h π r
π r , H ,
(8.9)
wobei η r ∂t η r gesetzt ist und die letzte Gleichung unmittelbar aus der eigentlich zu fordernden Gleichung i h p ri p ri , H durch Herauskürzen von Vi hervorgeht. Allgemeiner fordern wir als Bewegungsgleichung für einen beliebigen Operator L
i h L
H (t) . L,
(8.10)
Da wir es in der Quantenmechanik häufig mit komplexen Wellenfeldern zu tun haben, überlegen wir uns noch, wie sich die obigen Quantisierungsregeln direkt auf diese übertragen lassen, beschränken unsere Betrachtung jedoch im Moment auf den Fall komplexer Skalarfelder. Den komplexen Wellenfunktionen ψ ψ1 i ψ2 , ψ ψ1 i ψ2 und den dazu kanonisch-konjugierten Impulsdichten1 ∂ 1 ∂ 1 1 ∂ π i (π i π 2 ) , 2 ∂ ψ1 2 ∂ψ ∂ ψ2
1 Für die Ableitung einer komplexen Funktion f (z) f ¼ (z) ∂x u
i ∂x v
u(x, y)
∂y v i ∂y u
Wenn f (z) reell ist, gilt v 0, und es ergibt sich df dz
12 ∂x u 2i ∂ y u 12 (∂x f i ∂ y f ) ,
1 (∂x u 2 df dz
i v(x, y) nach der Variablen z x ∂ y v)
i (∂ x v 2
df dz
i y gilt
∂ y u) .
12 (∂x f
i ∂y f ) .
Die Lagrange-Dichte ist eine reelle Funktion komplexer Argumente, und zur Berechnung von ∂ /∂ ψ x ψ 1 und y ψ 2 gesetzt werden. muß in der vorletzten Formel f , z ψ,
8.1 Quantisierung des Schrödinger-Feldes
∂ ∂ψ
π
1 2
∂ ∂ ψ1
191
1 (π 1 i π 2 )
∂ i ∂ ψ2
2
ordnen wir die Operatoren 1 1 π i π 2 , 2 (8.11) 1 1 ψ ψ1 i ψ2 , π π i π 2 2 zu, was allerdings nur möglich ist, wenn π nicht, wie im Fall des Schrödinger-Feldes, verschwindet. Aus den nach (8.6) und (8.7) für ψ i und π k gültigen Vertauschungsrelationen i k i (x, t), ψ k (x , t) 0 , ψ π (x, t), π (x , t) 0, ψ
ψ 1
i ψ 2 ,
(x, t), π ψ i
k
(x , t)
π
i h δi k δ 3 (x x )
folgen dann die Vertauschungsrelationen ψ(x, t), ψ(x π(x, t), π(x
, t) , t)
ψ(x, t), ψ π(x, t), π
(x , t) ψ (x, t), ψ (x , t) 0,
(x , t)
π
, t) 0 ψ(x, t), π (x , t) ψ (x, t), π(x
(x, t), π (x , t) 0,
(8.12)
ohne und die Vertauschungsrelation ψ(x, t), π(x
, t) ψ (x, t), π (x , t) i h δ 3 (x x)
(8.13)
mit Kommutationsrest. Bisher wurde noch nichts über den Zustandsraum gesagt, in dem die eingeführten Operatoren wirken sollen. Da die Quantisierung im Heisenberg-Bild vorgenommen wurde, muß es sich um zeitunabhängige Zustände handeln. Nähere Einzelheiten werden anhand der konkreten Beispiele besprochen, denen wir uns jetzt zuwenden wollen.
8.1
Quantisierung des Schrödinger-Feldes
Unsere ursprüngliche Motivation zur Feldquantisierung bestand darin, eine Quantentheorie des elektromagnetischen Feldes bzw. für Photonen zu finden. Da das elektromagnetische Feld für Photonen eine ähnliche Rolle spielt wie das SchrödingerFeld für die durch dieses beschriebenen Teilchen, ist es möglich und in der Tat auch einfacher, das Schrödinger-Feld auf der Ebene der Elektrodynamik als klassisches Feld zu interpretieren und der im letzten Abschnitt beschriebenen Feldquantisierung zu unterziehen.2 Da hierbei ein Feld quantisiert wird, das vorher zur Quantenbeschreibung von Teilchen eingeführt wurde, spricht man dabei manchmal von der zweiten Quantisierung. 2 Ein wesentlicher Unterschied besteht allerdings darin, daß die Schrödinger-Gleichung ebenso wie die Klein-Gordon-Schrödinger- und die Dirac-Gleichung die Quantengröße h enthält, während das auf die Maxwell-Gleichungen nicht zutrifft.
192
8 Kanonische Feldquantisierung
8.1.1 Quantisierung für Bosonen Beim Schrödinger-Feld liegt der Fall vor, der bei der Einführung der Operatoren (8.11) und der Vertauschungsrelationen (8.12)–(8.13) gerade ausgeschlossen wurde: Nach (7.46b) ist π 0, und daher läßt sich kein zum Operator ψ adjungierter Impulsoperator π definieren. Das ist allerdings auch nicht nötig, denn nach (8.8) mit (7.48) bzw. (7.50) und nach (8.9) kann die Dynamik des Systems schon durch die Operatoren ψ und π allein beschrieben werden. Für diese gilt nach (8.12)–(8.13) ψ(x, t), ψ(x ψ(x, t), π(x
, t) 0,
π(x, t), π(x
, t) 0,
, t) i h δ 3 (x x ) ,
(8.14)
und nach (7.50) ist H (t)
π(x , t) π(x , t) 3 HS (x ) ψ(x , t) d 3x ψ(x , t) HS(x ) dx i h i h
(8.15)
mit dem Schrödinger-Operator HS(x )
h 2 V (x ) . 2m
(8.16)
Dieser ist als Differentialoperator zu behandeln, der auf die Ortsabhängigkeit im Opeder rator ψ(x , t) bzw. π (x , t) einwirkt, und nicht als Operator im Hilbertraum Zustände ψ , auf die die Operatoren ψ(x , t) und π(x , t) einwirken. Wir wollen den Erwartungswert
H ψ H ψ
des Hamilton-Operators H in einem beliebigen Zustand ψ als Erwartungswert der Energie deuten und müssen daher fordern, daß er reell ist. Dies hat zur Folge, daß H hermitesch sein muß (siehe Quantenmechanik, Abschn. Q3.7.1), was mit (8.15) zu π(x , t) π(x , t) H H HS(x ) ψ (x , t) d 3x ψ (x , t) HS (x ) d 3x i h i h (8.17) führt. Schreiben wir die letzte der Vertauschungsrelationen (8.14) und mit der Umbenennung x x die zu ihr adjungierte Vertauschungsrelation in aufgelöster Form an, so erhalten wir mit den Abkürzungen ψ(x, t) ψ und π(x , t) π π π π π 3 ψ ψ ψ ψ (8.18) δ (x x ) , i h i h i h i h während nach (8.14 a,b) ψ mit ψ und (π/i h) mit (π /i h) vertauscht. Die ganze Physik des quantisierten Schrödinger-Feldes ist in den Vertauschungsrelationen und in der Struktur des Hamilton-Operators enthalten. Der Vergleich von
8.1 Quantisierung des Schrödinger-Feldes
193
(8.17b) mit (8.15a) und der Vergleich der beiden Vertauschungsrelationen (8.18) zeigt, daß (π/i h) dieselbe Rolle wie ψ und (π/i h) dieselbe Rolle wie ψ spielt. Die Anwendung auf einen beliebigen Zustand ψ führt daher zum gleichen Ergebnis, und infolgedessen sind die Operatoren gleich, π ih
ψ
.
(8.19)
(Diese Beziehung zwischen Operatoren steht in Korrespondenz zur „klassischen“ Beziehung (7.46a).) Aus (8.14c) ergibt sich damit ψ(x, t), ψ
(x , t) δ 3 (x x ) ,
(8.20)
woraus unmittelbar folgt, daß der Feldoperator des Schrödinger-Feldes nicht hermi tesch ist. (Wäre er hermitesch, so würde aus (8.20) ψ(x, t), ψ(x , t)δ 3 (x x ) folgen, was im Widerspruch zu (8.14a) steht.) In Abschn. 8.2.1 wird sich am Beispiel des Klein-Gordon-Schrödinger-Feldes zeigen, daß dies ein wesentliches Merkmal eines „geladenen Feldes“ ist. Aus (8.9) folgen mit ψ(x, t), H (t) (8.15a) 1 ψ(x, t)π(x , t) H S (x ) ψ(x , t)π(x , t) H S (x ) ψ(x , t)ψ (x, t) d 3x ih (8.14a) 1 ψ(x.t), π(x , t) H S (x ) ψ(x , t) d 3x ih (8.14c) , t) d 3x H S(x) ψ(x, t) δ 3 (x x ) H S(x ) ψ(x und
π(x, t), H (t)
(8.15b)
(8.14c)
1 π(x, t), ψ(x , t) H S(x ) π(x , t) d 3x ih , t) d 3x H S(x) π(x, t) δ 3 (x x ) H S (x ) π(x
die Bewegungsgleichungen t) H S (x) ψ(x, t) , i h ψ(x,
i h π(x, t) H S (x) π(x, t) ,
(8.21)
wobei (8.21b) nach (8.21a) auch für π ψ gilt. ψ(x, t) genügt also der SchrödingerGleichung und π(x, t) bzw. ψ (x, t) der zu dieser adjungierten Gleichung, was in Übereinstimmung mit (8.19) steht. Im folgenden soll gezeigt werden, daß N (t) ψ (x, t) ψ(x, t) d 3x (8.22)
194
8 Kanonische Feldquantisierung
der Teilchenzahloperator ist. Der Beweis hierfür wird am einfachsten, wenn man die Feldoperatoren ψ(x, t) und ψ (x, t) gemäß ψ(x, t)
bi (t) ψi (x),
ψ (x, t)
i
bi (t) ψi (x)
(8.23)
i
nach einer Basis von Operatoren bi (t) entwickelt, die wie die in (8.3) eingeführten Operatoren ηri (t) und p ri (t) ortsunabhängig sind. Damit sich auf diese Weise beliebige t) bzw. ψ (x, t) darstellen lassen, müssen die EntwicklungskoefFeldoperatoren ψ(x, fizienten ψi (x) ortsabhängig sein und ein vollständiges Funktionensystem bilden, von dem wir annehmen, daß es orthonormiert ist. Aus (8.23) folgen durch Umkehrung (Multiplikation mit ψk (x) bzw. ψk (x) und Integration) die Relationen t) ψk (x) d 3x, bk (t) ψ (x, t) ψk (x) d 3x, bk (t) ψ(x, und hiermit ergeben sich aus (8.14) die Vertauschungsrelationen
bi , bk
bi, bk
0,
bi , bk
0,
δik .
(8.24)
Beweis: Die dritte Vertauschungsrelation folgt gemäß b
i
, b k
ψ(x, t) ψ
3 i (x) d x,
ψ (x , t) ψ
k
(x ) d 3x
ψ(x, t), ψ (x , t) ψi (x) ψk (x ) d 3x d 3x (8.20) δ 3 (x x ) ψi (x) ψk (x ) d 3x d 3x ψi (x) ψk (x) d 3x
δik .
, ψ ψ ψ 0. Die erste und zweite beweist man analog mit ψ,
Aus dem Hamilton-Operator (8.15a) und dem Teilchenzahloperator (8.22) wird in der Darstellung (8.23) (8.19) ψi (x) H S(x) ψk (x) d 3x H (t) Hik bi (t) bk (t) mit Hik (8.25) i,k
bzw. N (t)
b i (t) bi (t) .
(8.26)
i
Aus der Bewegungsgleichung (8.10) folgt für L N i h N
N , H
(8.25) (8.26)
i
bi bi ,
j,k
H j k b j bk
j,k
H jk
i
bibi , b j bk
0,
8.1 Quantisierung des Schrödinger-Feldes
weil
bi bi b j bk
(8.24c)
i
bi b j bi
i
b j b k
195
δi j bk (8.24a,b) b j bk b j bi bk bi
b j bk bi
δik bi
i
i
b j bk bi bi
i
gilt. Dies bedeutet, daß der Operator N zeitunabhängig ist, während die einzelnen Summanden n i bi bi im allgemeinen zeitabhängig sind (Aufgabe 8.1). Für die folgenden Betrachtungen nehmen wir an, daß das Potential in H zeitunabhängig ist, V V (x), und wählen als Entwicklungsfunktionen ψk (x) die Eigenfunktionen des Schrödinger-Operators H S (x), H S ψk (x) E k ψk (x). 2 ψi E k ψk d 3x E k δik und Dann erhalten wir aus (8.25) Hik H (t) E i bi bi .
(8.27)
i
Dieses Ergebnis legt zusammen mit (8.26) die Vermutung nahe, daß der Operator n i (t)
b i bi
(8.28)
die Teilchenbesetzungszahl im i -ten Energieniveau E i festlegt. Dem Nachweis dieser Vermutung gelten die folgenden Betrachtungen. Als erstes ist zu bemerken, daß die Operatoren n i miteinander vertauschen, n i , n j 0, (8.29) denn nach (8.24) gilt für i j (für i n i n j
bi bi b j b j
j ist die Vertauschbarkeit trivial)
bi b j bi b j
b j bi b j bi
b j b j bi bi
n j n i .
Weiterhin vertauschen alle n i auch mit dem Hamilton-Operator (8.27), der mit (8.28) in die Form H (t) (8.30) E i n i gebracht werden kann. In dem hier betrachteten Spezialfall ∂t V 0 sind die n i daher zeitunabhängig. Da der Hamilton-Operator (8.30) mit sämtlichen n i und diese alle miteinander vertauschen, existiert ein System gemeinsamer Eigenzustände sämtlicher n i und von H . Weil H jedoch nach (8.30) von den Operatoren n i linear abhängig ist, lassen sich diese Eigenzustände schon vollständig durch die Eigenwerte n i der Operatoren n i charakterisieren, so daß wir für sie n 1 , n 2 , . . . schreiben können. Sie erfüllen die Eigenwertgleichungen n i n 1 , n 2 , . . .
n i n 1 , n 2 , . . .
für alle i .
(8.31)
196
8 Kanonische Feldquantisierung
Aus der Definition (8.28) folgt, daß die Operatoren n i hermitesch sind, n i bi bi bi bi bi bi n i . Ihre Eigenwerte n i sind daher reell. Die Eigenzustände können orthonormiert werden,
n1 , n2 , . . . n1 , n2 , . . .
δn 1 ,n1 δn 2 ,n2 . . . , ¼
(8.32)
¼
was im weiteren vorausgesetzt wird. Jetzt überzeugen wir uns davon, daß die bi Erzeugungs- und die bi Vernichtungsoperatoren sind. Unter Benutzung von (8.24) und (8.31) ergibt sich bi bi bi . . . , n i , . . .
n i bi . . . , n i , . . .
(8.24c)
bi (n i 1) . . . , n i , . . . (n i 1) b i . . . , n i , . . .
und analog
n i bi . . . , n i , . . .
bi (bi bi 1) . . . , n i , . . .
bi (n i 1) . . . , n i , . . .
(n i 1) b i . . . , n i , . . . .
bi . . . , n i , . . . ist also ein Eigenzustand des Operators n i zum Eigenwert n i 1, bi . . . , n i , . . . ein Eigenzustand zum Eigenwert n i 1. Außerdem gilt für alle j i mit n j bi b j b j bi b j bi b j bi b j b j bi n j und n j bi bi n j n j bi . . .
bi n j . . .
n j bi . . . ,
n j bi . . .
n j bi . . . .
Nach (8.31) kann daher bi . . . , n i , . . . bi . . . , n i , . . .
αi . . . , n i 1, . . .,
(8.33)
βi . . . , n i 1, . . .
geschlossen werden. Indem wir in jeder dieser Gleichungen das Skalarprodukt der linken und der rechten Seite mit sich selbst bilden, erhalten wir mit bi . . . , n i , . . ., bi . . . , n i , . . . . . . , ni , . . . bi bi . . . , ni , . . . (8.24c) (8.28)
(8.31) (8.32)
. . . , ni , . . . ni 1 . . . , ni , . . . ni 1 , bi . . . , n i , . . ., bi . . . , n i , . . . . . . , ni , . . . ni . . . , ni , . . . und . . . , n i 1, . . . . . . , n i 1, . . . 1 für αi und βi die Gleichungen αi 2 ni 1, βi 2 ni .
ni
(8.34)
Über eine nicht weiter festgelegte Phase der Zustände verfügen wir derart, daß αi und βi reell werden. Aus (8.33) und (8.34) ergeben sich damit die mit (6.9) und (6.11) übereinstimmenden Gleichungen
n 1 . . . , n 1, . . ., i i bi . . . , ni , . . . ni . . . , ni 1, . . ., bi . . . , n i , . . .
(8.35)
8.1 Quantisierung des Schrödinger-Feldes
197
die bi und bi wie behauptet als Erzeugungs- und Vernichtungsoperatoren ausweisen. Jetzt kann gezeigt werden, daß die reellen Eigenwerte n i ganzzahlig sind. Wären sie das nicht, so käme man durch (n i 1)-malige Anwendung des Operators b i auf den Zustand . . . , n i , . . . zu dem Zustand . . . , n i (n i 1), . . . mit negativer Besetzungszahl des i -ten Energieniveaus, und indem man auf diese Weise mit allen Energieniveaus verführe, zu einem Zustand mit ausschließlich negativen Besetzungszahlen. Für diesen ergäbe sich nach (8.27)–(8.28) gemäß H n 1 , n 2 , . . .
E i n i n 1 , n 2 , . . .
i
Ei ni
(8.36)
i
auch eine negative Gesamtenergie. Aus physikalischen Gründen muß nun einerseits gefordert werden, daß die Energie positiv ist, andererseits muß jeder zulässige Operator durch Einwirkung auf einen beliebigen Zustand des Hilbert-Raums wieder einen Zustand aus diesem Raum erzeugen. Mit anderen Worten heißt das: Wir können das Problem negativer Energien nicht einfach dadurch lösen, daß wir negative Besetzungszahlen als unzulässig erklären, vielmehr dürfen diese nicht auftreten können. Das ist nur dann der Fall, wenn die n i ganzzahlig sind, nur dann gilt bi . . . , n i 1, . . . 1 . . . , n i 0, . . . und
bi . . . , n i 0, . . . 0 . . . , n i 1, . . . 0 ,
so daß keine Zustände negativer Energie erzeugt werden. Aus der Ganzzahligkeit der Eigenwerte n i und den Gleichungen (8.30)–(8.31) folgt schließlich, daß n i wie vermutet der Operator der Teilchenbesetzungzahl im i -ten Energieniveau ist. Den völlig unbesetzten Zustand 0 0, . . . bezeichnen wir wie in Abschn. 6.1 als Vakuumzustand 0, für ihn gilt b i 0 0 ,
bi 0 0, . . . , n i 1, . . . , 0.
(8.37)
Die Zustände n 1 , n 2 , . . . entstehen demnach und nach (8.35a) aus dem Vakuumzustand gemäß n1 , n2 , . . . n 1n . . . (b1 )n1 (b2 )n2 . . . 0. (8.38) 1 2 Die Gesamtteilchenzahl in diesem Zustand berechnet sich nach (8.26) und (8.28) gemäß N n 1 , n 2 , . . . n i n 1 , n 2 , . . . n i n 1 , n 2 , . . . i i zu N ni . i
Offensichtlich sind wir durch die Feldquantisierung genau zu dem Formalismus gelangt, der in Abschn. 6.1 für vollständig symmetrische N-Teilchen-Wellenfunktionen abgeleitet wurde. Wir können uns davon auch noch explizit überzeugen, indem wir
198
8 Kanonische Feldquantisierung
mit der Definition x1 , . . . , x N , t
1
(8.23b)
1
N
N
i1 ,...,i N
ψ (x1 , t) ψ (x N , t) 0 ψi1 (x1 ) ψi N (x N ) bi1 (t) biN (t) 0
(8.39)
zu ortsabhängigen Zuständen übergehen. Dabei handelt es sich um eine Superposition von Zuständen n 1 , n 2 , . . . mit ortsabhängigen Koeffizienten, wenn die in (8.23) auftretenden Entwicklungskoeffizienten ψi (x) die Eigenfunktionen eines zeitunabhängigen Hamilton-Operators sind. Die Zustände x1 , . . . , x N , t sind Eigenzustände des Operators n(x, t) ψ (x, t) ψ (x, t) , (8.40) der nach (8.22) die Bedeutung des Teilchendichteoperators hat. Ersichtlich wird das aus der kurzen Rechnung n(x, t) x1 , . . . , x N , t 1
ψ (x, t) ψ (x, t) ψ (x1 , t) ψ (x N , t) 0
ψ (x, t) ψ (x1 , t)ψ (x, t) δ 3 (x x1 ) ψ (x2 , t) 0
(8.14b) (8.19)
ψ (x1 , t) ψ (x, t)ψ (x, t) δ 3 (x x1 ) ψ (x2, t) 0
(8.20)
N 1 N 1
N ........................
(8.39a),s.u.
1
N N
N ψ (x1 , t) ψ (x N , t) ψ (x, t)ψ (x, t) δ 3 (x xi ) 0
δ 3 (x xi )
i 1
x1 , . . . , x N , t ,
(8.41)
i 1
bei der zuletzt ψ (x, t) 0 i ψi (x)bi (t) 0 0 benutzt wurde. Zum Zeitpunkt t sind die durch den Zustand x1 , . . . , x N , t beschriebenen Teilchen offensichtlich scharf an den Punkten x1 , . . . , xn lokalisiert. Da n(x, t) im allgemeinen nicht mit dem HamiltonOperator vertauscht (Aufgabe 8.2), geht diese Lokalisierung verloren, die Wellenfunktion der Teilchen zerfließt. Da die Feldoperatoren ψ (xi , t) nach (8.14b) und (8.19) alle miteinander vertauschen, sind die Zustände (8.39a) vollständig symmetrisch gegenüber beliebigen Teilchenvertauschungen und beschreiben daher Bosonen. Für N 1 besagt (8.39) und (8.41) n(x, t) x , t δ 3 (x x ) x , t
mit
x, t ψ (x, t) 0 .
(8.42)
Dies bedeutet, daß der Feldoperator ψ (x, t) zur Zeit t am Ort x ein Teilchen erzeugt, und entsprechend wird durch den Operator ψ(x, t) ein dort befindliches Teilchen vernichtet.
8.1 Quantisierung des Schrödinger-Feldes
199
8.1.2 Jordan-Wigner-Quantisierung für Fermionen In Kapitel Q9 wurde zur Behandlung der Dynamik von Systemen identischer Teilchen unabhängig davon, ob es sich um Bosonen oder Fermionen handelte, die SchrödingerGleichung benutzt. Der Unterschied der beiden Teilchensorten ergab sich dadurch, daß Bosonen durch eine vollständig symmetrische und Fermionen durch eine vollständig antisymmetrische Wellenfunktion beschrieben wurden. Die Methode der Feldquantisierung führte uns bislang nur zu Bosonen. 1928 entdeckten P. Jordan und E. P. Wigner, daß man durch eine Abänderung der Quantisierungsregeln (8.14) bzw. (8.20) auch zu Fermionen gelangt: Dazu müssen nur die Kommutatoren durch Antikommutatoren ersetzt werden, d. h. für Fermionen müssen die Vertauschungsrelationen ¼ ψ(x, t), ψ(x , t)
ψ(x, t), ψ (x , t)
ψ (x, t), ψ (x , t)
0,
0, (8.43)
δ 3 (x x )
benutzt werden, die übrigen Regeln bleiben unverändert. (8.15) ist also der HamiltonOperator, und in den Bewegungsgleichungen (8.9) bzw. (8.10) sind Minus-Kommutatoren zu benutzen, damit das Korrespondenzprinzip erfüllt wird. Auch mit den Vertauschungsrelationen (8.43) erfüllen die Feldoperatoren wieder die Schrödinger-Gleichung bzw. die zu dieser adjungierte Gleichung, z. B. i h ψ
(8.9a)
(8.17c) (8.19)
H ψ,
(8.43a)
d 3x (ψ ψ H S(x ) ψ ψ H S(x ) ψ ψ)
(ψ ψ H S (x ) ψ ψ ψ H S(x ) ψ ) d 3x ψ ψ,
H S (x ) ψ d 3x
(8.43c)
δ 3 (x x ) H S (x ) ψ d 3x H S (x) ψ.
Mit einer (8.23) entsprechenden Entwicklung ψ(x, t) i a i (t) ψi (x) der Feld operatoren ψ(x, t) nach ortsunabhängigen Operatoren a i (t) ergeben sich aus (8.43) statt (8.24) die Vertauschungsrelationen a i , a k
a i , a k
0,
a i , a k
0,
δik
(8.44)
mit der Folge (a i )2
(a i )2
0,
0.
(8.45)
Damit folgt für die Teilchenbesetzungszahloperatoren n i (t) a i a i ,
(8.46)
deren Summe N
n i
(8.47)
200
8 Kanonische Feldquantisierung
wieder zeitunabhängig ist (Aufgabe 8.3), die Beziehung (8.45) (8.44c) n i 2 a i a i a i a i a i 1 a i a i a i a i a i
n i .
(8.48)
Aus der Eigenwertgleichung n i . . . , n i , . . .
n i . . . , n i , . . .
(8.48)
n i 2 . . . , n i , . . .
n i 2 . . . , n i , . . .
n i n i . . . , n i , . . .
ergibt sich daher n i (n i 1)
0
ni
0
oder n i
1.
Es gibt also nur die Besetzungszahlen n i 0 und n i 1, die früher (Abschn. 6.4) für Fermionen abgeleitet wurden. In Analogie zu (8.38) führt man die Basiszustände
n1, n 2 , . . . (a1 )n (a 2 )n . . . 0 (8.49) ein und weist für a i und a i leicht die Erzeugungs- bzw. Vernichtungseigenschaften 1
2
(6.15) und (6.20),
a i N . . . , n i , . . . a i N . . . , n i , . . .
(1) Ni δn i ,0 N 1 . . . , n i 1, . . .
(1) Ni δn i ,1 N 1 . . . , n i 1, . . . .
(8.50) (8.51)
mit Ni k
x1, . . . , x N , t 1 ψ (x1, t) ψ (x N , t) 0 N
(8.52)
erweist sich als vollständig antisymmetrisch: Da die Vertauschung je zwei benachbarter Feldoperatoren nach (8.43b) zu einem Vorzeichenwechsel führt und jede Teilchenvertauschung i j die ungerade Anzahl ( j i )( j 1i ) von Nachbarvertauschungen erfordert, gilt Pi j x1 , . . . , x N , t
x1, . . . , x N , t
für alle i, j .
Für den Hamilton-Operator ergibt sich auch hier Gleichung (8.25) mit bi ai , da zu deren Ableitung keine Vertauschungsregeln benutzt wurden. Wenn zu der (8.23) entsprechenden Entwicklung als Entwicklungskoeffizienten wieder die Eigenfunktionen ψi (x) H S ψi (x)/E i des Hamilton-Operators H S herangezogen werden, gilt erneut Gleichung (8.30), also H
E i n i .
(8.53)
8.1 Quantisierung des Schrödinger-Feldes
201
8.1.3 Zur physikalischen Bedeutung der Feldquantisierung Wir gehen jetzt der Frage nach, was durch den Prozeß der Feldquantisierung physikalisch gewonnen wurde. Zieht man die bislang hauptsächlich zur Berechnung von Ein-Teilchen-Zuständen benutzte Schrödinger-Gleichung für ψ(x, t) als klassische Feldgleichung für viele Teilchen heran – dies steht in Analogie dazu, daß die Maxwell-Gleichungen als Gleichungen für viele Photonen aufgefaßt werden können –, so muß die Bedingung, daß es sich um N Teilchen handelt, zusätzlich als Normierungseigenschaft gefordert werden. Dagegen liefert die Feldquantisierung die Quantisierung der Teilchenzahl als Ergebnis. Weiterhin läßt sich sagen, daß die Feldquantisierung in recht natürlicher Weise zu einer Klassifizierung der Teilchen in Bosonen und Fermionen führt. Zwar ergaben sich zunächst nur Bosonen, und erst durch eine ad hoc eingeführte Abänderung der Quantisierungsvorschrift ließen sich auch Fermionen beschreiben. Wir werden allerdings später sehen, daß bei der Quantisierung relativistischer Wellenfelder diejenigen, die wie das Klein-Gordon-Schrödinger- und das Maxwell-Feld Bosonen beschreiben, nur mit Minus-Kommutator-Regeln zu physikalisch sinnvollen Ergebnissen führen, während Fermionen-Felder wie das Dirac-Feld nur mit Antikommutator-Regeln physikalisch sinnvoll quantisiert werden können. Dennoch liegt es natürlich an der ausschließlichen Benutzung entweder von Kommutator- oder von Antikommutator-Vertauschungsrelationen, daß nur für Bosonen oder Fermionen eine Theorie erhalten wurde. Da nicht bewiesen wurde, daß es keine anderen Quantisierungsmöglichkeiten gibt, läßt sich nicht behaupten, daß das Spin-Statistik-Theorem von Abschn. Q9.2.6 vollständig bewiesen worden bzw. daß es eine eindeutige Folge der Feldquantisierung wäre. An der Aussage, daß die Feldquantisierung in natürlicherer Weise zum Spin-Statistik-Theorem führt, läßt sich jedoch festhalten. Ansonsten wurde beim Schrödinger-Feld durch die Feldquantisierung nichts hinzugewonnen – wir sind zu einer Theorie gelangt, deren Ergebnisse mit denen der gewöhnlichen N-Teilchen-Quantenmechanik für vollständig symmetrisierte bzw. vollständig antisymmetrisierte Wellenfunktionen in der Fock-Darstellung identisch sind. Hierin liegt der eigentliche Grund dafür, warum der Begriff „zweite Quantisierung“ nicht besonders sinnvoll ist, denn letztlich kam es zu keiner weitergehenden Quantisierung. Und beim Maxwell-Feld, wo die Feldquantisierung zu den Einsteinschen Quantenbedingungen für Photonen führt, handelt es sich um die erste Quantisierung. Die Situation ändert sich allerdings, wenn die Wechselwirkung verschiedener Felder betrachtet wird. Dann werden die Prozesse der Teilchenerzeugung und -vernichtung, die bisher wegen der Erhaltung der Gesamtteilchenzahl nur formalen Charakter hatten, zu dynamischen Prozessen, bei denen gegenüber den klassischen Feldtheorien Neuerungen auftreten. Zwar tauchten auch schon in deren Rahmen Phänomene wie das Kleinsche Paradoxon auf, die auf Paarerzeugungsprozesse hinweisen, aber über eine quantitativ richtige Beschreibung derartiger Prozesse hinausgehend führt die Feldquantisierung dann auch zu Phänomenen wie der Streuung von Licht an Licht (dabei spielen auch „virtuelle Teilchen“ eine Rolle), die über die klassischen Feldtheorien hinausgehen. Hierzu sei allerdings bemerkt, daß die „klassischen Feldtheorien“ in vielen Fällen zu denselben Ergebnissen wie die Quantenfeldtheorie führen, wenn sie durch relativ harmlos erscheinende Zusatzannahmen wie die Feynman-Stückelberg-Interpretation
202
8 Kanonische Feldquantisierung
der Lösungen negativer Energie der Dirac-Gleichung ergänzt werden (siehe dazu auch Abschn. 10.13). Die für Bose-Teilchen geforderten Vertauschungsrelationen (8.12)–(8.13) mit dem Minus-Kommutator haben eine klassische Korrespondenz, da Minus-Kommutatoren dieselben algebraischen Eigenschaften wie die in den „klassischen“ Bewegungsgesetzen (7.36) auftauchenden Poisson-Klammern besitzen. Für die FermionenVertauschungsregeln (8.43) gilt das nicht. Hieraus muß geschlossen werden, daß die Feldoperatoren bei Fermionen keine klassische Korrespondenz haben, mit anderen Worten: Es gibt keinen klassischen Grenzfall, in dem das Fermionen-Feld gemessen werden kann. Das läßt sich auch physikalisch verstehen, denn zur Meßbarkeit müßte das Feld lokal hinreichend stark werden, was die Anwesenheit vieler Teilchen am selben Ort voraussetzt, und das ist für Fermionen aufgrund des Pauli-Prinzips nicht möglich. Demnach können nur Bosonen-Felder wie das elektromagnetische Feld klassisch gemessen werden, was durch die Praxis bestätigt wird. Die letzten Ausführungen zeigen, daß die scheinbare Willkür, als welche die Einführung von Antikommutatoren aufgefaßt werden könnte, unvermeidbar ist: Da es keinen quasiklassischen Grenzfall gibt, kann es auch keine Deduktion der Antikommutationsregeln aus einer Quantenmechanik mit quasiklassischem Grenzfall geben. Völlig vom Himmel fallen die Antikommutatoren aber nicht, denn in der gewöhnlichen Quantenmechanik identischer Teilchen sind wir bei der Forderung nach vollständiger Antisymmetrie der Zustände von selbst auf Antikommutatoren gestoßen (siehe Abschn. 6.3, Gleichung (6.22)–(6.23)). Die völlige Äquivalenz, die zwischen der Quantenfeldtheorie mit Antikommutatoren und der gewöhnlichen Quantenmechanik für vollständig antisymmetrische Viel-Teilchen-Zustände besteht, läßt sich als nachträgliche Rechtfertigung der Antikommutationsregeln oder sogar als deren indirekter Beweis für freie Felder deuten, mit weit über diese Analogie hinausgehenden Konsequenzen für den Fall der Wechselwirkung.
8.2
Quantisierung des Klein-Gordon-Schrödinger-Feldes
Beim Klein-Gordon-Schrödinger-Feld wird sich herausstellen, daß nur die bosonische Quantisierung physikalisch sinnvoll ist. Dies bedeutet, daß die durch das KleinGordon-Schrödinger-Feld beschriebenen Teilchen, bei denen es sich nach Abschn. 4.2 um Spin-0-Teilchen handelt, Bosonen sind. Im ersten Teil dieses Abschnitts wird unter Vorwegnahme dieses Ergebnisses die entsprechende Feldquantisierung durchgeführt. Daß nur diese Sinn macht, wird nachträglich in den Teilabschnitten 8.2.2 und 8.2.3 gezeigt. Diese befassen sich mit einer relativistisch invarianten Formulierung der Vertauschungsregeln für Feldoperatoren und Konsequenzen der relativistischen Kausalitätsforderung für die Messungen lokaler Observablen an verschiedenen Punkten der Raum-Zeit.
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
203
8.2.1 Bosonische Feldquantisierung Wir betrachten zuerst den allgemeinen Fall eines komplexen Feldes φ, das nach Abschn. 4.2 geladene Teilchen beschreibt, und spezialisieren diesen anschließend auf ein ungeladene Teilchen beschreibendes reelles Feld.
Komplexes Feld Das komplexe Klein-Gordon-Schrödinger-Feld wird quantisiert, indem den „klassischen“ Feldern φ(x, t) und φ (x, t) sowie den diesen durch (7.57) zugeordneten kanonischen Impulsdichten π(x, t) und π (x, t) die Operatoren φ(x, t) und φ (x, t) bzw. π(x, t) und π (x, t) zugeordnet und für diese die Vertauschungsrelationen (8.12)–(8.13) gefordert werden, also
, t) φ(x, φ(x, t), φ(x t), φ (x , t) φ (x, t), φ (x , t) 0 , , t) π(x, π(x, t), π(x t), π (x , t) π (x, t), π (x , t) 0 und
(8.54)
, t) 0 , φ(x, t), π (x , t) φ (x, t), π(x , t) φ (x, t), π (x , t) i h δ3 (x x) . φ(x, t), π(x
(8.55)
Der Hamilton-Operator ist durch (8.8) gegeben, wobei die aus (7.58) folgende Operatordichte 2m 0 c2 h 2 m 0 c2 φ π) (φ, π π φ φ φ (8.56) 2m 0 2 h 2 einzusetzen ist, d. h. 2m 0 c2 H π π h 2 IR3 2m 0 c2 s.u. π π h 2 IR3
h 2 φ φ 2m 0
h 2 φ (φ) 2m 0
m 0 c2 φφ 2
m 0 c2 φφ 2
d 3x (8.57)
d x. 3
Die zweite Darstellung geht aus der ersten durch partielle Integration bzw. 3 3 φ d 3x div ( φ) φ d x φ φ d x (φ) 0 IR3
IR3
IR3
hervor. Der Impulsoperator des Feldes ergibt sich aus (7.99) zu p π φ π φ d 3x , IR3
und Gleichung (7.131) erlaubt die Definition eines Ladungsoperators iq Q φ π φ π d 3x . h IR3
(8.58)
(8.59)
204
8 Kanonische Feldquantisierung
Wären die Feldoperatoren φ und π hermitesch, so ergäbe sich hieraus Q 0. Die NichtHermitezität der Feldoperatoren ist daher ein wesentliches Charakteristikum geladener Felder. φ , π und π müssen nach Zur Berechnung der Zeitableitungen der Operatoren φ, (8.10) deren Kommutatoren mit dem Hamilton-Operator auswertet werden, es ergibt sich 2 2m 0 c2 2m 0 c2 h 2 t) m 0c φ(x, t) (8.60) φ π , φ π , π φ(x, 2 2 2m 0 2 h h (Beweis folgt), und durch Zeitableitung der ersten dieser Beziehungen und Einsetzen der dritten folgt m 02 c2 m 02 c2 1 ∂ φ(x, t) φ(x, t) φ(x, t) 0 . (8.61) tt c2 h 2 h 2
t) muß also der Klein-Gordon-Schrödinger-Gleichung Auch der Feldoperator φ(x, t) π(x, genügen. Die Bewegungsgleichung i h π(x, t), H führt mit ähnlicher Rechnung auf die zu (8.61) adjungierte Gleichung. Beweis: Mit der Umbenennung x x lautet (8.57b) etwas ausführlicher 4 3 2m 0 c2 h2 m 0 c2 H π (x , t) π (x , t) φ (x , t)φ (x , t) d 3x , φ (x , t) φ (x , t) 2m 0 2 h2
und damit folgt
φ (x, t), H
$
2m 0 c2
π (x , t) π
2mh φ (x, t) φ (x , t) φ (x , t) φ (x , t) φ (x , t) φ (x, t) % m c 2 φ(x, t) φ(x , t) φ (x , t)φ(x , t) φ (x , t) φ(x, t) d x 3 2mh c φ (x, t), π (x , t) π (x , t) h 2mφ (x , t) φ (x, t), φ (x , t) 4 m c 2 φ(x, t), φ (x , t) φ (x , t) d x i h 2mh c δ (x x) π (x , t) d x i h 2mh c π (x, t) i h φ . h2
IR3
φ (x, t) π (x , t) π (x , t)
(x , t) φ (x, t)
2
0
0
(8.54) (8.55)
2
0 2
2
2
0
0
(8.54) (8.55)
3
0 2
2
3
2
3
3
0 2
2
(8.10)
(8.60b) ergibt sich analog, und (8.60c) ergibt sich aus der Rechnung $ 2m 0 c2 π (x, t), H π (x, t) π (x , t) π (x , t) π (x , t) π (x , t) π (x, t) h2 IR3 h2 π (x, t) φ (x , t) φ (x , t) φ (x , t) φ (x , t) π (x, t) 2m 0
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
(8.54) (8.55)
(8.54) (8.55)
3
205
% m 0 c2 π (x, t) φ(x , t) φ (x , t)φ(x , t) φ (x , t) π (x, t) d 3x 2
2m 0 c2 h 2 φ(x , t) π (x, t), π (x , t) π (x , t) π (x, t), φ (x , t) 2m 0 h 2 4 m 0 c2 φ(x , t) π (x, t), φ (x , t) d 3x 2 3 4 h 2 m 0 c2 3 i h δ (x x) φ(x , t) φ(x , t) d 3x 2m 0 2 IR3 3 4 h 2 m 0 c2 i h φ(x, t) φ(x, t) i h π (x, t) . 2m 0 2
Wir suchen jetzt die allgemeine Lösung von Gleichung (8.61) und superponieren dazu ebene Wellen, die wir nach (4.29) in der Form u(x, t) ei ( px Et )/h anset2 2 2 2 zen. Mit ∂t t u (E /h )u sowie u ( p /h )u ergibt sich für diese aus (8.61) ( E 2 /c2 p2 m 02 c2 ) u 0 oder E Ep mit Ep (m 0 c2 )2 p2 c2 , (8.62) d. h. zu jedem p gibt es zwei Lösungen, eine Lösung positiver und eine Lösung negativer Energie. Die allgemeine Lösung positiver Energie ergibt sich durch Superposition sämtlicher Ebene-Welle-Lösungen positiver Energie zu i ( px Ep t )/h 3 s.u. φ () (x, t) s.u. N p a p ei px/h d 3 p , N p a p e d p (8.63) wobei die Entwicklungskoeffizienten a p nur von p abhängige Operatoren und N p Normierungskonstanten sind, deren – reell wählbare Werte – wir später bestimmen werden. Im letzten Schritt der obigen Beziehung wurde x 0 ct, pλ Ep /c, p und die relativistische Notation p x pλ x λ Ep t p x (8.64) benutzt. Die allgemeine Lösung negativer Energie ergibt sich durch Superposition sämtlicher Ebene-Welle-Lösungen negativer Energie zu i ( p x Ep t )/h 3 s.u. φ () (x, t) s.u. N p c p e d p (8.65) N p b p ei px/h d 3 p . Da in c p ein beliebiger Faktor frei ist, konnte dieselbe Normierungskonstante N p wie in (8.63) angesetzt werden. Im letzten Schritt wurde Ep E p E p und p p i ( px E p t )/h 3 c p e d p c p ei ( p x E p¼ t )/h (d 3 p ) ¼
¼
¼
p¼ p
c p ei ( px Ep t )/h d 3p
206
8 Kanonische Feldquantisierung
benutzt, c p b p definiert und wie bei den Lösungen positiver Energie p x als Abkürzung für Ep t p x gesetzt. Letzteres bedeutet, daß bei den Wellen negativer Energie nicht wie sonst üblich px pλ x λ mit p0 E/c gilt. Da wir jedoch gleich Lösungen positiver und negativer Energie zusammenfassen wollen, benötigen wir für den Ausdruck p x eine einheitliche Bedeutung. Die aus Lösungen positiver und negativer Energie zusammengesetzte allgemeinste t) φ ( ) (x, t)φ () (x, t). Mit der Definition Lösung ist φ(x, N p ei px/h
u p (x, t)
(8.66)
können wir sie in der Form
t) φ(x,
a p u p b p u p d 3 p
φ
(x, t)
a p u p b p u p d 3 p
(8.67)
schreiben. Aus (8.60b) folgt mit ∂t u p
i hEp u p ,
∂t u p
i Ep up h
(8.68)
t) und φ (x, t) konjugierten Operatoren π(x, für die zu φ(x, t) und π (x, t) die Entwicklung i h π(x, t) 2m c2 a p u p b p u p Ep d 3p , 0 (8.69) i h Ep d 3 p . π (x, t) a u b u p p p p 2m 0 c2 Die Beziehungen (8.67) lassen sich nach a p und b p invertieren. Die Inversion wird besonders einfach, wenn wir für zwei Klein-Gordon-Schrödinger-Felder φ und ζ ein Skalarprodukt (φ, ζ ) einführen, aus dem sich für φ ζ die (4.49) mit (4.15)–(4.16) entsprechende Normierung 4 3 1 φ i h ∂t φ/(m 0 c2 ) 3 (φ, φ) Ψ σ3 Ψ d x mit Ψ 2 φ i h ∂t φ/(m 0 c2 ) IR3 bzw. nach (4.40a) mit (4.16) (φ, φ)
i h 2m 0 c2
IR3
φ ∂t φ φ∂t φ d 3x
ergibt. Die geforderte Entsprechung wird mit dem Skalarprodukt (φ, ζ )
i h 2m 0 c2
IR3
φ ∂t ζ
ζ ∂t φ
d 3x
(8.70)
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
207
erreicht. Mit der Definition (8.70) ergibt sich E u u E u u p p p p p p ih 3 (8.68) ∂ u u ∂ u x d 3x (u p , u p ) u d t p t p p p 2 2 3 2m 0 c IR3 2m c 0 IR (8.66) N p N p (Ep Ep ) ei ( p p )¡x/hÆ d 3x 2m 0 c2 IR3 N p N p (Ep Ep ) ei (Ep Ep )t /hÆ e i ( p p )¡x/hÆ d 3x . 2m 0 c2 IR3 ¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
Aus (2.90b) folgt ck 1/(2π)3/2 für f (x)δ 3 (x), und aus (2.90a) ergibt sich damit 1 ei k ¡x d 3 k . (8.71) δ 3 (x) (2π)3 Für x ( p¼ p) und k x/h folgt daraus e i ( p p )¡x/hÆ d 3x ¼
IR3
(2π h)3 δ 3 ( p¼ p) ,
und aus dem zuletzt erhaltenen Ergebnis wird mit Ep (u p , u p ) ¼
(8.62)
(8.72)
Ep für p p¼ ¼
N p N p (Ep Ep ) ei (Ep Ep )t /hÆ (2π h)3 δ 3 ( p¼ p) N 2p Ep (2π h)3 3 ¼ δ ( p p). 2m 0 c2 m 0 c2 ¼
¼
¼
Den Normierungsfaktor N p wählen wir jetzt gemäß 1 m 0 c2 , Np 3/2 Ep (2π h)
(8.73)
so daß die ebenen Wellen (8.66) die Form u p (x, t)
1 (2π h)3/2
m 0 c2 i p¡x/hÆ e Ep
(8.74)
annehmen und der Normierung (u p , u p ) δ 3 ( p¼ p)
(8.75)
¼
genügen. (Bei der Lagrange-Dichte (7.52) ergäben sich ebene Wellen u ¼ u/ 2m 0 .) Mit ähnlicher Rechnung wie eben erhält man auch noch
(u £p , u £p ) δ 3 ( p¼ p) , ¼
(u p , u £p ) (u £p , u p ) 0 . ¼
¼
(8.76)
(Bei der Ableitung der letzten zwei Normierungsbedingungen wird E p E p sowie (E p E p )δ 3 ( p p¼ )(E p E p )δ 3 ( p p¼ )(E p E p )δ 3 ( p p¼ ) 0 benutzt.) ¼
208
8 Kanonische Feldquantisierung
Mit (8.75)–(8.76) können wir jetzt die Beziehungen (8.67) nach a p und b p auflösen. Indem wir das Skalarprodukt (8.70) dahingehend erweitern, daß ζ auch ein von x und t abhängiger Operator sein darf, erhalten wir 3 (8.67a) (u p , φ) u p , a p u p b p u p d p a p u p , u p b p u p , u p d 3 p ¼
¼
¼
¼
a p δ 3 ( p p) d 3 p
¼
¼
¼
¼
a p ,
¼
und analog ergibt sich b p aus (u p , φ ), zusammengefaßt gilt a p
, (u p , φ)
b p
(u p , φ ) .
(8.77)
Mit Hilfe dieser Ergebnisse lassen sich die aus a p , a p , b p und b p gebildeten Kommutatoren berechnen, es gilt a p , a p b p , b p s.u. δ3 ( p p ) , a p , a p b p , b p a p , b p a p , b p ¼
¼
¼
¼
¼
¼
(8.78)
0.
Zu jeder dieser Beziehungen gibt es noch eine, die aus ihr durch Übergang zum Adjun gierten hervorgeht, z. B. a p , a p 0. Der Beweis der Beziehungen (8.78) folgt am Ende des Abschnitts. Dort wird auch gezeigt, daß das Einsetzen der Entwicklungen (8.67) und (8.69) in die durch (8.57)–(8.59) gegebenen Operatoren H , p und Q zu H 1 a p a p a p a p b p b p bp b p Ep d 3p , (8.79) 2 1 3 p a p a a a b b b b (8.80) p p p p p p p pd p, 2 q 3 Q a p a (8.81) p a pa p b pb p b p b p d p 2 führt. Wie beim Schrödinger-Feld gibt es natürlich auch beim Klein-Gordon-SchrödingerFeld einen Hilbertraum mit Zuständen φ , auf welche die Operatoren H etc. einwirken. Ähnlich wie in Abschn. 8.1 kann dabei folgendes gezeigt werden: a p und b p sind voneinander unabhängige Erzeugungsoperatoren, a p und b p voneinander unabhängige Vernichtungsoperatoren, und ¼
n (a) p
a p a p ,
n (b) p
b p b p
(8.82)
sind Besetzungszahloperatoren mit ganzzahligen Eigenwerten n p 0 und n p 0 zu (a) (b) Eigenzuständen φ p und φ p . Es gibt also zwei Teilchensorten a und b, die durch a p bzw. a p und b p bzw. b p erzeugt bzw. vernichtet werden. Bei der Auswertung der (a)
(a)
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
209
Mittelwerte von H , p usw. in einem Zustand φ können dann die Beiträge von a p a p (a)
(a)
(a)
(a)
und b p b p unter Ausnutzung z. B. von n p φ p n p φ p mit Hilfe einer Zerlegung 2 (a) 3 φ c(a) p φ p d p unmittelbar berechnet werden. Zur Berechnung der Beiträge von a p a p und b p b p müssen die Vertauschungsrelationen (8.78) herangezogen werden, mit denen sich z. B. (a) Ep 3 3 E H n p n (b) d p 2 δ (0) d 3 p p p 2 ergibt. Das erste Integral besitzt einen endlichen Wert, das zweite ist jedoch unendlich. Wäre das Feld in ein Gebiet mit endlichem Volumen eingesperrt, so ergäbe sich statt des kontinuierlichen ein diskretes Spektrum, und der Kommutator a p , a p hätte für p p den Wert 1 statt δ 3 (0). In diesem Fall ergäbe sich mit ω p Ep /h für das zweite Integral ¼
H 0
2
hω p p
2
.
Auch diese Summe ist unendlich groß, aber sie läßt sich einfach physikalisch interpretieren: Befinden sich im Zustand mit dem Impuls p insgesamt n (a) p Teilchen der (b) Sorte a und n p Teilchen der Sorte b, so liefert jedes Teilchen über das erste Integral zur Gesamtenergie den Beitrag Ep , außerdem kommt über das zweite Integral von jedem Zustand für jede der beiden Teilchensorten noch ein Beitrag hω p /2. Bei einem harmonischen Oszillator der Frequenz ω ist die kleinste quantenmechanische Energie nicht null sondern gleich der Nullpunktsenergie hω/2. Der unendliche Beitrag von H 0 läßt sich daher als Summe der Nullpunktsenergien unendlich vieler Oszillatoren interpretieren, d. h. die ebenen Wellen u p und u p , nach denen der Feldoperator φ zerlegt wurde, sind im Vakuumzustand jeweils mit einer kleinsten Amplitude angeregt, die der Nullpunktsenergie des harmonischen Oszillators entspricht. Bei der Messung von Energien werden im allgemeinen nur Differenzen gemessen, und bei diesen hebt sich der unendliche Beitrag heraus. Aus diesem Grund kann man den Operator H gleich so definieren, daß dieser Beitrag entfällt, d. h. man kann H 0 2 (a) (b)
einfach weglassen und H n p n p Ep d 3 p definieren, eine Vorgehensweise, die als Renormierung bezeichnet wird. Formal erhält man den um die Nullpunktsenergie bereinigten Hamilton-Operator auch dadurch, daß man in H alle Operatorprodukte so umordnet, daß die Erzeugungsoperatoren immer links stehen. Diese modifizierte Operatoranordnung wird als Normalordnung bezeichnet und symbolisch durch Doppelpunkte vor und hinter dem normal zu ordnenden Operator gekennzeichnet, z. B. :(b b c c ): b b c c . Damit erhalten wir
H
3 b :H : a p b pa p p Ep d p .
(8.83)
Im folgenden lassen wir die Tilde bei H weg und definieren als neuen Hamilton-
210
8 Kanonische Feldquantisierung
Operator gleich den normalgeordneten, der dann mit (8.82) die Form H
n (a) (b) Ep d 3 p p n p
(8.84)
erhält. Das Weglassen der Nullpunktsenergie ist nicht generell gerechtfertigt, es gibt Situationen, in denen diese von Bedeutung ist. Ein Beispiel liefert die Kosmologie. Dank der Äquivalenz von Energie und Masse muß der Nullpunktsenergie eine gravitationserzeugende Wirkung zugeschrieben werden, diese liefert einen Beitrag zu der sogenannten Vakuumenergie. In diesem Fall wirkt sich ihre Divergenz allerdings störend aus. Man geht jedoch davon aus, daß die Quantentheorie für Längen unterhalb der Planck-Länge ungültig wird, und schneidet daher mit p h k und ω p ωk in E 0 ωk )/2 die k (h Summe bei einem Maximalwert von k ab, so daß 1/ k für alle Summenterme oberhalb einer geeigneten Abschneidelänge liegt. Leider stellt sich heraus, daß der dadurch erhaltene endliche Wert immer noch viel zu groß ist. Da es zur Vakuumenergie noch andere Beiträge als die Nullpunktsenergien sämtlicher Teilchenfelder gibt, könnte die geschilderte Diskrepanz durch solche Beiträge kompensatorisch behoben werden. Das Problem der Vakuumenergie ist allerdings bislang nicht vollständig verstanden und wird gegenwärtig als eines der wichtigsten ungelösten Probleme der Physik angesehen. Daß die Nullpunktsenergie tatsächlich physikalische Relevanz besitzt, wurde experimentell durch ein Differenzexperiment nachgewiesen. Bringt man im Vakuum zwei elektrisch leitfähige ebene Platten, die parallel zueinander angeordnet sind, sehr eng zusammen, so verändert sich in dem Vakuumgebiet zwischen den Platten durch die veränderten Randbedingungen die Nullpunktsenergie von ihrem Wert E 0 vor Einbringen zu dem Wert E 1 nach Einbringen der Platten. Wird bei der Berechnung der Summen für E 0 und E 1 wieder bei einem Maximalwert von k abgeschnitten, so ergibt sich für die Differenz E 1 E 0 ein endlicher negativer Wert, der mit abnehmendem Plattenabstand a dem Betrage nach wie 1/a 3 zunimmt.3 Da die Energie mit abnehmendem Plattenabstand demnach immer negativer wird, wirkt zwischen den Platten eine anziehende Kraft. Deren Stärke konnte gemessen werden und befindet sich in guter Übereinstimmung mit dem von der Theorie berechneten Wert. Die durch die Nullpunktsenergie hervorgerufene Anziehung der Platten wird als Casimir-Effekt bezeichnet. Für den Impulsoperator p ergibt sich durch Überführen von a p a p und b p b p in a p a p bzw. b p b p (a) p : p : n p n (b) (8.85) p d 3p , p 2 weil wegen der p-Antisymmetrie des Integranden δ 3 (0) p d 3 p 0 gilt. (Beim Impuls gäbe es keine physikalische Rechtfertigung für das Weglassen eines unendlichen Beitrags.) Bei Q führt die entsprechende Umordnung der Erzeugungs- und Vernichtungs3 Die einschlägigen Rechnungen findet man z. B. in Abschn. 3-2-4 des Buches [8] der Literaturliste.
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
211
operatoren ebenfalls ohne Renormierung zu Q
: Q:
q
3 (b) n (a) d p, p n p
(8.86)
weil sich ein unendlicher Beitrag der a-Teilchen gegen den der b-Teilchen weghebt. Die Feldoperatoren φ und φ für a- und b-Teilchen genügen Gleichung (8.61) mit demselben Masseparameter m 0 . a- und b-Teilchen haben daher die gleiche Ruhemasse m 0 , außerdem handelt es sich bei beiden um Spin-0-Teilchen, nach Gleichung (8.86) haben sie jedoch entgegengesetzte Ladung. Die b-Teilchen können daher als Antiteilchen der a-Teilchen aufgefaßt werden, und umgekehrt. Das quantisierte komplexe Klein-Gordon-Schrödinger-Feld beschreibt also zugleich Teilchen und Antiteilchen. Ein Beispiel für derartige Antiteilchenpaare sind die geladenen Pi-Mesonen π und π mit der Ladung e und e. In Gleichung (8.86) wurde durch die Multiplikation mit q hineingesteckt, daß der Ladungsoperator Q eine elektrische Ladung beschreibt. Es gibt jedoch auch elektrisch neutrale Teilchen, die durch ein komplexes Feld φ beschrieben werden müssen und 2 3 0 n (b) für die n (a) p p d p von null verschieden ist. Neutrale K -Mesonen z. B. besitzen einen als Hyperladung Y bezeichneten inneren Freiheitsgrad: Das K 0 -Meson besitzt Y 1. die Hyperladung Y 1 und sein Antiteilchen, das K 0 -Meson, die Hyperladung 2 (a) (b) 3 Der mit der Hyperladung Y 1 multiplizierte Ladungsoperator n p n p d p kann in diesem Fall zur Beschreibung der gesamten Hyperladung der Teilchen in einem Zustand φ benutzt werden. Zum Abschluß folgt noch der Beweis der Gleichungen (8.78a) und (8.79). Der Beweis der übrigen Gleichungen (8.78) sowie von (8.80) und (8.81) verläuft analog und bleibt dem Leser überlassen (Aufgabe 8.5 und 8.6). Beweis: 1. Beweis von (8.78a). a p
2
h 3 u p ∂t φ φ ∂t u p d x, u p ∂t φ φ ∂t u p d 3x p 2m 0 c2 2 h u p (x, t) ∂t φ(x, t)φ(x, t) ∂t u p (x, t), 2m 0 c2 u p (x , t) ∂t φ (x , t)φ (x , t) ∂t u p (x , t) d 3x d 3x (8.60) 1 , t) d 3x d 3x u p (x, t) u p (x , t) π (x, t), π(x 2 h 1 u p (x, t) ∂t u p (x , t) π (x, t), φ (x , t) 2 2m 0 c , t) d 3x d 3x u (x , t) ∂t u p (x, t) φ(x, t), π(x p
, a ¼
(8.77a) (8.70)
¼
¼
¼
¼
¼
¼
¼
2 h (x, t) ∂t u (x , t) φ(x, (x , t) d 3x d 3x ∂ u t), φ t p p 2m 0 c2 ¼
212
8 Kanonische Feldquantisierung u p (x, t) ∂t u p (x ¼, t) u p (x ¼, t) ∂t u p (x, t) δ 3 (x x ) d 3x d 3x u p (x, t) ∂t u p (x, t) u p (x, t) ∂t u p (x, t) d 3x 2mi hc2 0 (8.70) u p , u p (8.75) δ3 ( p p) . (8.54) (8.55)
i h 2m 0 c2
¼
¼
¼
¼
¼
2. Beweis von (8.79). Mit
(8.66) A u p u p d 3x N p N p ei( p p )x/h d 3x N p N p ei(Ep Ep )t /h ei( p p )x/h d 3x ¼
¼
¼
(8.72)
2 (8.73) m 0 c 3 N p N p ei (Ep Ep )t /h (2π h )3 δ 3 ( p p ) N 2p (2π h )3 δ 3( p p ) δ ( p p) Ep ¼
¼
und den ähnlich abzuleitenden Beziehungen B u p u p d 3x u p u p d 3x C D u p u p d 3x ¼
¼
¼
ergibt sich (8.69) π π d 3x
und
u p
2
φ φ d 3x
δ 3 ( p p ) e2i Ep t /h , δ 3 ( p p ) e2i Ep t /h , δ 3 ( p p )
¼
φ φ d 3x (8.67) m 02c h
m 0 c2 Ep m 0 c2 Ep m 0 c2 Ep
h 2 a A b B b a C b b D E E d 3 p d 3 p a a p p p p p p p p p p 4m 02 c4 h 2 2i Ep t /h b p a p e2i Ep t /h Ep d 3p. a p a p b p b p a p b p e 2 4m 0 c
Mit u p i ( p/h )u p ,
¼
¼
¼
1
¼
¼
i ( p/h )u p und p p δ 3 ( p p ) p2 δ 3 ( p p ) ist
h2
p p a p a p D a p b p C
a p a p bp bp
¼
¼
a p b p e2i Ep t /h bp a p e2i Ep t /h
a p a p D a p b p C ¼
3 3 b p a p B b p b p A d p d p
¼
¼
a p a p bp bp
(8.67)
¼
¼
¼
bp a p B bp b p A ¼
a p b p e2i Ep t /h bp a p e2i Ep t /h
¼
p2 d 3p Ep
d 3 p d 3 p
m c2 0 d 3p . Ep
Aus (8.57a) ergibt sich mit diesen drei Ergebnissen und der aus (8.62) folgenden Beziehung (m 02 c4 p2 c2 )/(2Ep ) Ep /2 1 a p b p e2i Ept /h H a p a p a p a p b p b p b p b p b p a p 2 a p b p b p a p e2i Ep t /h Ep d 3p .
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
213
Nun gilt p p a p b p Ep e 2i Ep t /h d 3 p a p b p E p e2i E p t /h d 3 p (8.78) a p b p Ep e2i Ep t /h d 3 p b p a p Ep e2i Ep t /h d 3 p , so daß der Beitrag des mit e2i Ep t /h und analog des mit e2i Ep t /h multiplizierten Terms zu H verschwindet. Gleichung (8.79) ist damit bewiesen. Die übrigen Beziehungen werden ähnlich bewiesen.
Reelles Feld Im Spezialfall eines reellen Klein-Gordon-Schrödinger-Feldes, das nach Abschn. 4.2 ungeladene Spin-0-Teilchen beschreibt, ergibt sich aus der Realitätsforderung φ φ für das Feld die Forderung φ φ für den Feldoperator. Aus (8.67) folgt in diesem Fall 3 3 a u b u p a u b u d p p p p p p p p d p. Hieraus ergeben sich die miteinander verträglichen Bedingungen ap
bp ,
a p
b p ,
und für φ folgt die Entwicklung 3 φ a p u p a p up d p.
(8.87)
In den im letzten Abschnitt abgeleiteten Beziehungen kann jedoch nicht einfach überall a p b p gesetzt werden, weil die Zahl der Freiheitsgrade reduziert wurde und einige Formeln daher mit dem Faktor 1/2 bzw. 2 multipliziert werden müssen. Aus (7.56) bzw. h 2 h 2 m 0 c2 2 2 2 φ ( φ) φ 2m 0 2 2m 0 c2 folgt z. B. ∂ h 2 π φ m 0 c2 ∂ φ und m 0 c2 2 h 2 m 0 c2 2 2 πφ π ( φ) φ , 2m 0 2 2h 2
statt (7.99) gilt p
IR3
π φ d 3x
und (7.131) führt zu Q 0. Statt (8.69a) ergibt sich für π die Entwicklung i h 3 π(x, t) a p u p a p u p Ep d p . 2 m 0c
214
8 Kanonische Feldquantisierung
Dem einen Freiheitsgrad weniger entsprechend ergibt sich statt (8.84) und (8.85) 3 H n p Ep d p , p n p p d 3 p (8.88) mit n p a p a p , und die „klassische“ Feldbeziehung Q 0 geht in Q 0 über. Q 0 bedeutet nicht nur, daß die durch ein reelles Klein-Gordon-Schrödinger-Feld beschriebenen Teilchen elektrisch neutral sind, sondern auch, daß sie keine andere Art von Ladung wie z. B. eine Hyperladung tragen, weshalb sie auch als streng neutral bezeichnet werden.
8.2.2 Lorentz-invariante Vertauschungsrelationen Die Vertauschungsrelationen (8.54)–(8.55) betreffen Feldoperatoren an zwei verschiedenen Raumpunkten, jedoch zu gleichen Zeitpunkten, weshalb sie auch als gleichzeitige Vertauschungsrelationen bezeichnet werden. Offensichtlich sind sie nicht Lorentz-invariant, denn die Gleichzeitigkeit von Ereignissen an verschiedenen Raumpunkten wird von verschiedenen Inertialsystemen aus unterschiedlich beurteilt. Für manche Zwecke ist es jedoch nützlich, Lorentz-invariante Vertauschungsrelationen zur Verfügung zu haben. Solche werden in diesem Abschnitt für den Fall des komplexen Klein-Gordon-Schrödinger-Feldes abgeleitet. Für die auf voneinander verschiedene Zeitpunkte erweiterten Kommutatoren (8.54) ergibt sich mit x ct x , x und y ct y , y φ(y) φ(x),
s.u.
π(x), π(y)
0.
(8.89)
Man erhält dieses Ergebnis durch Einsetzen der Entwicklungen (8.67) und (8.69) sowie Bennutzung der Vertauschungsrelationen (8.78) (Aufgabe 8.7). Die durch den Kommutator φ (y) i (x y) φ(x), (8.90) definierte Funktion (x y) wird als Pauli-Jordan-Funktion, gelegentlich auch als Schwinger-Funktion bezeichnet. (Daß der Kommutator nur von der Differenz x y abhängt, folgt aus der Homogenität der Raum-Zeit und wird auch aus dem später abgeleiteten Ergebnis ersichtlich.) Einsetzen der Entwicklungen (8.67) liefert (8.78c,..) 3 3 i (x y) u p (x) u p (y) a p , a p u p (x) u p (y) b p , b p d p d p ¼
(8.78a,b)
(8.74)
¼
¼
¼
u p (x) u p (y) u p (x) u p (y) d 3 p
m 0 c2 (2π h )3
d 3p ei p(x y)/h ei p(x y)/h . Ep
Mit z x y , der Umformung
2
ei p z/h /Ep d 3p
p p
(8.91)
2 i p z/h 3 /E e p d p beim
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
215
zweiten Integral, unter Benutzung der Vorzeichenfunktion *
p0 < 0 p0 > 0
1 für 1 für
ε( p0 )
(8.92)
und mit Ep >0 ergibt sich e
i p z/h
ei p z/h d 3p Ep d 3p Ep
d 3p
ei
Ep
Ep d p0 δ( p0 Ep /c)
c z0 p z
&
h
ei
Ep
c z0 p z
& 3 h d p Ep
δ( p0 Ep /c) ei ( p0 z 0 p z)/h
d p0 ε( p0 ) δ( p0 Ep /c) δ( p0 Ep /c) ei ( p z)/h .
Wird dies in das für i (x y) eingesetzt, wird die nach (E2.43) gültige letzte Ergebnis Umformung δ f (x) i δ(x x i )/ f (x i ) mit f (x i )0 benutzt, die hier zu δ( p p m 02 c2 )
(8.62b)
δ( p0 Ep /c) δ p02 Ep2 /c2 2Ep /c
0 Ep /c) δ( p2E /c
(8.93)
p
führt, und wird außerdem noch d 3 p d p0d 4 p gesetzt, so erhalten wir schließlich 2m 0 c i (x y) ε( p0) δ p p m 02 c2 ei p (x y)/h d 4 p . (8.94) 3 (2π h ) Diesem Ergebnis ist die Lorentz-Invarianz direkt anzusehen: d 4 p ist wie d 4 x invariant und auch die Deltafunktion sowie ihr Argument sind invariant. Die Invarianz der Vorzeichenfunktion ε( p0 ) folgt schließlich daraus, daß bei eigentlichen LorentzTransformationen alle zeitartigen Impulsvektoren ( p0 >0) zeitartig und alle raumartigen ( p0 <0) raumartig bleiben. Natürlich folgen aus (8.90) mit (8.91) wieder die gleichzeitigen Vertauschungsrelationen: Aus (8.91) ergibt sich (x y) 2m 0 c2 /(2π h )3 sin p (x y)/h /Ep d 3 p , und für t x t y folgt hieraus mit der ausführlicheren Notation (z)(z 0 , z) (0, z)
1 2m 0 c2 φ(x, t), φ (x z, t) i (2π h )3
sin( p z/h )
d 3p Ep
0,
(8.95)
also (8.54b), weil der Integrand in p antisymmetrisch ist. Durch Ableitung nach z 0 x 0 y0 folgt aus (8.90) einerseits ' ∂(z 0 , z) '' m0c (8.91) (8.71) 2m 0 c 3 i p z/h i p z/h δ (z) d 3p e e (8.96) ' 3 ∂z 0 h (2π h ) h z 0 0
216
8 Kanonische Feldquantisierung
und andererseits mit x ¼ x z sowie ∂ φ /∂z 0 (∂ φ /∂t y )(∂t y /∂z 0 ) (∂ φ /∂t y )/c ' ∂(z 0 , z) '' 1 2m 0 c (8.90) t), φ (x z, t) (8.60b) t), π(x , t) . φ(x, φ(x, ' 2 ∂z 0 ic i h z 0 0 Der Vergleich der beiden Ergebnisse führt mit δ 3 (z)δ 3 (x x ) zu (8.55c). Nach (8.90) gilt 1 φ (0) . φ(x), (x) i Aus dieser Beziehung und (8.61) folgt unmittelbar
m 02 c2 h 2
(x) 0 ,
(8.97)
d. h. (x) ist eine Lösung der Klein-Gordon-Schrödinger-Gleichung. Jede von deren Lösungen wird durch die Vorgabe einer Anfangsbedingung für (x) und ∂t (x) eindeutig festgelegt. Die (x) festlegenden Anfangsbedingungen sind (8.95) und (8.96), also 2m 0 c2 3 ∂(x) (x) 0 , für t 0. δ (x) ∂t h Jeder raumartige Punkt x der Raum-Zeit (x x < 0) kann durch eine eigentliche Lorentz-Transformation in den – ebenfalls raumartigen – Punkt 0, x transformiert werden. Aus (8.95) bzw. (0, x)0 und der Lorentz-Invarianz von (x) folgt daher (x) 0
für
x x < 0 .
(8.98)
8.2.3 Mikrokausalität Die Voraussetzung dafür, daß man eine lokale Observable (x) an zwei kausal unverbundenen Punkten x und y der Raum-Zeit (raumartiger Abstand, (x y)(x y)<0) unabhängig voneinander, also ohne Einflußnahme des einen auf den anderen Punkt, messen kann, ist das Verschwinden des Kommutators, (x), (y) 0 für (x y)(x y) < 0 . (8.99)
Das Erfülltsein dieser Bedingung wird als Mikrokausalität bezeichnet. Die Kausalitätsforderung der Relativitätstheorie, nach der sich Signale oder gegenseitige Einwirkungen nicht von einem Raumpunkt zu einem anderen mit Überlichtgeschwindigkeit ausbreiten dürfen, führt in der relativistischen Quantenfeldtheorie zu der Forderung nach Mikrokausalität. Im folgenden überzeugen wir uns davon, daß diese bei einem Klein-Gordon-Schrödinger-Feld mit bosonischer Quantisierung erfüllt ist. Nach (8.57)–(8.59) mit (8.60) sind globale physikalische Observablen wie H etc. räumliche Integrale über lokale Observablen (Operatordichten) der Form
(x) x φ
, (x) x φ(x)
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
217
wobei x und x entweder von x abhängige Funktionen oder auf x einwirkende Differentialoperatoren sind. Für die lokalen Observablen gilt
(x), (y) s.u.
(8.90)
i
i
x φ(x) y φ (y) y φ(y) y φ (y) y φ(y) x φ (x)x φ(x) φ (y) y φ(y) φ (x)x φ(x) x φ (x) x y φ(x) y φ (y) y x φ(y) y φ(y) x φ (x) x y (x y) y φ(y) x φ (x) y φ (y) x φ(x) x φ(x) y φ (y) y x (y x)x φ(x) y φ (y) x φ (x) y φ(y) i , x φ (x) x y (x y) y φ(y) y φ (y) y x (y x) x φ(x)
x φ
i
(x)
wobei im letzten Schritt x φ
(x)
y φ
(y)
x φ(x) y φ(y)
(8.89)
y φ x φ
(y) (x)
x φ y φ
(x)
y φ(y) x φ(x)
(y)x y φ(x), φ(y)
(8.89)
0
benutzt wurde. Mit (8.98) folgt daraus, daß (8.99) erfüllt ist. Wir wollen jetzt untersuchen, welche Konsequenzen eine fermionische Quantisierung des Klein-Gordon-Schrödinger-Feldes für dessen mikrokausales Verhalten haben würde. Mit der Definition φ (y) (8.100) i 1 (x y) φ(x), ergäbe sich statt (8.91) 3 3 i 1 (x y) u p (x) u p (y) a p , a p u p (x) u p (y) b p , b p d p d p , ¼
¼
¼
¼
und mit Hilfe der an die Stelle von (8.78a) tretenden Vertauschungsrelationen a p , a p ¼
b p , b p ¼
δ 3 ( p p ) ,
für die b p , b p b p , b p statt b p , b p b p , b p gilt, würde daraus ¼
¼
¼
i 1 (x y)
m 0 c2 3 (2π h)
¼
d 3p ei p(x y)/h ei p(x y)/h Ep
statt (8.91) und 1 (0, z)
(8.62b),s.u.
d 3p 1 2m 0 c2 φ(x, t), φ (x z, t) z/h) cos( p 3 i i (2π h) Ep p z cos ϑ 2π π p2 cos 2m 0 c2 h dϕ dϑ sin ϑ d p 0 3 i (2π h) (m 0 c2 )2 p 2 c2 0 0
statt (8.95) folgen. (Im letzten Schritt wurde im p-Raum zu Polarkoordinaten p, ϑ und ϕ mit Polarachse in Richtung z übergegangen.)
218
8 Kanonische Feldquantisierung
Aus dem letzten Ergebnis folgt 1 (x y) 0 für (x y) (x y)< 0,und hieraus mit ähnlicher Rechnung wie oben für raumartige Abstände (x), (y) 0. Da hiermit keine Mikrokausalität vorliegen würde, kann für das Klein-Gordon-SchrödingerFeld die fermionische Quantisierung ausgeschlossen werden. Für den Spezialfall dieses Spin-0-Feldes ist damit das Spin-Statistik-Theorem von Abschn. Q9.2.6 im Sinne von Abschn. 8.1.3 bewiesen.
8.3
Quantisierung des Maxwellschen Vakuumfeldes
In diesem Abschnitt wird die Quantisierung elektromagnetischer Vakuumfelder durchgeführt. Dabei treten Schwierigkeiten auf, die daher rühren, daß zur Lorentz-invarianten Feldbeschreibung alle vier Komponenten des Vektorpotentials Aα benötigt werden, während nur zwei von ihnen unabhängig sind. Das Maxwellsche Vakuumfeld enthält nämlich nur zwei Freiheitsgrade, die in zwei möglichen Polarisationsrichtungen ebener elektromagnetischer Wellen zum Ausdruck kommen. Wir überzeugen uns als erstes von diesem Umstand.
8.3.1 Zahl der Freiheitsgrade des freien Feldes Ausgedrückt durch das Vektorpotential A α lauten die Maxwell-Gleichungen (7.61) im Vakuum ( j α 0) Aα ∂ α ∂ σ Aσ 0 . (8.101) Bei der Eichtransformation A¼α
Φ ¼ /c, A¼ (Φ ∂t Λ)/c, A Λ A α ∂α Λ
(8.102)
bleiben die Felder E und B unverändert (Elektrodynamik, Gleichung (7.6) ff.), B
rot A rot A , ¼
E
Φ
∂t A
Φ
¼
∂t A¼ .
Λ kann so gewählt werden, daß die Bedingung ∂ αA ¼α 0 erfüllt wird. Hierzu muß Λ für gegebenes Aα (x) nur als Lösung der Wellengleichung Λ
∂ αA α
bestimmt werden. Die von A¼α Aα erfüllte Eichbedingung ∂ αA α
0
(8.103)
ist die aus der Speziellen Relativitätstheorie vertraute Lorenz-Eichung. Auch die Lorenz-Eichung macht das Vektorpotential Aα nicht eindeutig, denn mit A α erfüllt auch jedes Vektorpotential A ¼α A α ∂α Λ¼ , für das mit Λ¼ Λ Λ 0
(8.104)
8.3 Quantisierung des Maxwellschen Vakuumfeldes
219
gilt, die Eichbedingung (8.103). Von den Lösungen der Gleichung (8.104) wählen wir diejenige, die zusätzlich auch noch die Gleichung A¼0 A0 ∂0 Λ 0 bzw. ∂t Λ Φ
(8.105)
erfüllt. Eine derartige Lösung gibt es, denn Φ erfüllt nach (8.101) mit (8.103) die Gleichung Φ 0 , und aus (8.105) folgt damit
∂t Λ 0 .
Es genügt daher, Gleichung (8.104) nur zu einem Zeitpunkt t0 zu befriedigen, damit sie immer erfüllt ist. Zu diesem Zweck müssen wir nach (8.104) mit (8.105) Λ(x, t0 ) aus ' ' 1 2 '' 1 Λ(x, t0 ) 2 ∂t Λ t 2 ∂t Φ '' 0 c c t0 bestimmen, was immer möglich ist. Das hiermit festgelegte Λ(x, t0 ) wählen wir dann als Anfangswert zur Lösung von Gleichung (8.105). Deren entsprechende Lösung ist t Λ(x, t) Φ(x, t ¼ ) dt ¼ Λ(x, t0 ) , t0
sie erfüllt (8.104) und (8.105). Das damit ausgewählte Vektorpotential A¼α erfüllt (8.103) und A¼0 0, also Φ ¼ 0 und div A¼ 0. Die letzte Eichbedingung ist die aus der Elektrodynamik bekannte Coulomb-Eichung. Die beiden Eichbedingungen Φ
0,
div A 0
(8.106)
werden zusammen als Strahlungseichung bezeichnet. An dieser erkennt man, daß das freie elektromagnetische Feld nur zwei Freiheitsgrade besitzt: Nur drei Komponenten von Aα sind von null verschieden, und aus (8.106b) folgt, daß A A0 ei (k x ωt ) nur zwei senkrecht zur Ausbreitungsrichtung k stehende Komponenten besitzt, div A i k A 0 . Auf den ersten Blick erscheint die Feldquantisierung in der Strahlungseichung einfacher. Bei der Behandlung von Problemen mit Wechselwirkung ( jα 0) muß A0 jedoch mitgenommen werden, die Strahlungseichung ist dann nicht möglich. Wir beschränken uns im folgenden daher auf die kovariante Quantisierung in Lorenz-Eichung.
8.3.2 Vertauschungsrelationen und Bewegungsgleichung Die Hamilton-Dichte des Maxwell-Feldes in Lorenz-Eichung ist in Gleichung (7.68) angegeben. Sie enthält die vier reellen Felder Aα und vier zu diesen kanonischkonjugierte Impulse π α A α /(μ0 c2 ), die ebenfalls reell sind. Wir ordnen diesen
220
8 Kanonische Feldquantisierung
jetzt Feldoperatoren zu, und eine mögliche Übertragung der Vertauschungsrelationen (8.6)–(8.7), die sich für eine Lorentz-invariante Theorie eignet, ist A α (x, t), A β (x ¼, t) α A (x, t), π β (x ¼, t)
α π (x, t), π β (x ¼, t)
0,
0, (8.107)
i h g αβ δ 3 (x x ¼ ) .
Diese gleichzeitigen Vertauschungsrelationen sind allerdings noch nicht Lorentzinvariant, denn zum einen transformiert sich die dreidimensionale Deltafunktion nicht wie ein Skalar, zum anderen geht die Gleichzeitigkeit der Felder A α (x, t) und Aα (x ¼, t) beim Übergang zu anderen Inertialsystemen verloren. Es gelingt jedoch, Lorentzinvariante Vertauschungsrelationen zu finden, die in dem System, in welchem bei x ¼ gerade t ¼ t wird, in (8.107) übergehen. Da wir diese aber nicht benötigen, wird hier auf ihre Ableitung verzichtet.4 Da der metrische Tensor g αβ Komponenten zweierlei Vorzeichens enthält, hat die rechte Seite von (8.107c) für α β 1, 2 und 3 nicht das übliche Vorzeichen. Dies führt dazu, daß der Hilbert-Raum der Zustände, auf welche die Operatoren wirken, eine indefinite Metrik besitzt, bei der Zustände mit negativer Norm auftreten (siehe Abschn. 8.3.5). Dieses Problem wurde zwangsläufig mit der Forderung nach LorentzInvarianz erkauft, läßt sich aber, wie wir in Abschn. 8.3.6 sehen werden, ausräumen. (Da der Ansatz (8.107c) nicht für alle α und β zu den üblichen Vertauschungsrelationen führt, wäre genausogut auch ein Ansatz möglich gewesen, bei dem auf der rechten Seite ein Minuszeichen eingefügt ist.) Aus (7.35b) ergibt sich mit (7.68) und ∂ l glm ∂m ∂l für j α 0 der HamiltonOperator H 1 μ0c2 π α¼ π ¼ α 1 ¼A ¼α ¼A ¼α d 3x ¼ , (8.108) 2 μ0 und aus (8.10) folgen mit
π β π β A α (8.107c) A α π β π β π β A α π β i h g αβ δ3 (x x ) (8.107c) i h g αβ π β g αβ π β δ 3 (x x ) 2i h π α δ 3 (x x ) , π α A β A β A β A β π α π α A β A β A β A β π α π α A β A β A β π α A β i h g αβ δ 3 (x x ) i h gαβ A β gαβ A β δ3(x x ) 2i h ( A α ) δ3(x x ) A α π ¼β π ¼β
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
( A α ) δ 3 (x x ) d 3x ¼
¼
¼
¼
¼
¼
(¼ A ¼α ) δ 3 (x x ¼ ) d 3x ¼
4 Eine Ableitung findet sich z. B. in Kap. 6 des Buches [3] der Litertaturliste.
¼
¼
¼
sowie
¼
A α
¼
8.3 Quantisierung des Maxwellschen Vakuumfeldes
221
die Bewegungsgleichungen i h A α
α, H i h A
μ0 c2 π α ,
i h π α
π
α
, H
ih A α . μ0
(8.109)
Die erste bedeutet, daß sich der klassische Zusammenhang (7.67) auf die Operatoren überträgt, 1 α 1 π α A (8.110) ∂0 A α . 2 μ0 c μ0 c Wenn man dies in die zweite Bewegungsgleichung einsetzt, folgt 1 α A A α c2
A α
0,
(8.111)
also das Analogon der klassischen Bewegungsgleichung (8.101) in der Lorenz-Eichung. Die letztere ist nicht automatisch erfüllt und muß weiterhin als Nebenbedingung gestellt werden. Hier entsteht allerdings ein Problem: Die Lorenz-Eichung läßt sich nicht als Operatorbedingung stellen, die Forderung ∂α A α 0 stünde im Widerspruch zu den Vertauschungsrelationen (8.107), denn α, A ¼β ∂α A
l ¼β 0, A ¼β ∂ A ∂0 A l ,A
(8.107c)
(8.107a) (8.110)
μ0 c π
0 ¼β ,A
i h μ0 c g 0β δ 3 (x x ¼ ) 0 .
Ohne Lorenz-Eichung würde andererseits nach (7.69a,b) π 0
1 ∂l A l , μ0 c
π l
1 l A μ0 c 2
gelten, und aus (8.107c) ergäbe sich damit für α β 0 i hδ(x ¼ x) A 0 , π ¼ 0
1 0 ¼ ¼l 1 ¼ 0 ¼l A , ∂l A ∂ A , A , μ0 c μ0 c l
was im Widerspruch zu (8.107a) stünde. Ohne Lorenz-Eichung hätte man also ein ähnliches Problem. Der von S. N. Gupta und K. Bleuler vorgeschlagene Ausweg aus diesem Dilemma besteht darin, die Lorenz-Eichung nicht als Operatorbedingung zu stellen, sondern stattdessen zu fordern, daß der Erwartungswert des offensichtlich von null verschiedenen Operators ∂α A α für alle physikalischen Zustände verschwindet, α
ψ ψ ∂α A
0.
(8.112)
Wir werden diese Idee in Abschn. 8.3.6 aufgreifen. Die Vorgehensweise ist demnach folgende: In der zu quantisierenden klassischen Theorie wird die Lorenz-Eichung zugrunde gelegt. Dies führt zu den kanonischen Impulsen (7.67) statt (7.69) und zu der Hamilton-Dichte (7.68) statt (7.70). Die im Fall
222
8 Kanonische Feldquantisierung
der Lorenz-Eichung gültige Zuordnung (8.110) zwischen Impuls- und Feldoperatoren ist im Gegensatz zu der ohne Lorenz-Eichung gültigen Zuordnung (7.69) mit den Vertauschungsrelationen (8.107) verträglich (Aufgabe 8.8). Die Lorenz-Eichung, die aus Konsistenzgründen in der klassischen Theorie an die Felder gestellt werden muß, wird in der Quantentheorie nicht an die diesen zugeordneten Operatoren gestellt, sondern an deren Erwartungswert, also gewissermaßen ebenfalls an die Felder.
8.3.3 Entwicklung der Feldoperatoren nach Erzeugungs- und Vernichtungsoperatoren Gleichung (8.111) kann durch den Ansatz A α
b Aα (x)
Aα (x)
mit
εα e
i k x
kμ
,
gelöst werden. Dessen Einsetzen in sie liefert kμ k μ b εα ωk2 /c2 k2
kμ k μ
ωk /c, k
(8.113)
0 bzw.
0.
(8.114)
Dabei bleibt der Operator b εα unbestimmt, und da er vier unabhängig voneinander vorgebbare Komponenten besitzt, gibt es zu jedem k vier linear unabhängige Operatoren b (λ)(k) εα(λ)(k), λ 0, 1, 2, 3. Über die vier raum-zeitlich konstanten Vierervektoren εα(λ)(k) verfügen wir willkürlich derart, daß die Orthogonalitätsrelationen g αβ εα(λ)(k) εβ(λ )(k)
εα(λ)(k) ε(λ )α(k)
¼
¼
g λλ
¼
(8.115)
erfüllt werden und daß in dem System, in welchem der Wellenausbreitungsvektor k α bzw. kα die (Gleichung (8.114)) erfüllenden) Komponenten
k, 0, 0, k
kα
bzw.
k, 0, 0, k
kα
(8.116)
besitzt (Wellenausbreitung in Richtung der z-Achse), ε(0)α
1, 0, 0, 0 ,
ε (1)α
0, 1, 0, 0 ,
ε (2)α
0, 0, 1, 0 ,
ε (3)α
0, 0, 0, 1
(8.117) gilt. Durch diese Wahl werden die Vektoren εα (λ) in sämtlichen Koordinatensystemen reell und erfüllen in ihnen wegen der Lorentz-Invarianz des Skalarproduktes kα ε(1)α
kα ε(2)α
0,
kα ε(0)α
kα ε(3)α k
0,
(8.118)
d. h. die Vektoren ε (1)α und ε(2)α liegen transversal zum Wellenausbreitungsvektor k α . Wir werden später feststellen, daß sie die Polarisation von Photonen beschreiben. Die durch ε (0)α beschriebenen Photonen werden als zeitartig oder skalar bezeichnet (für sie ist das skalare Potential Φ 0), die durch ε(3)α beschriebenen als longitudinal (die räumliche Komponente liegt in Richtung des Wellenausbreitungsvektors k). Die experimentelle Erfahrung zeigt, daß es nur das durch die Amplituden ε(1)α und ε(2)α beschriebene transversal polarisierte Licht gibt. Die hier zusätzlich auftretenden Polarisationen
8.3 Quantisierung des Maxwellschen Vakuumfeldes
223
müssen wir jedoch mitnehmen, da es keine theoretischen Gründe gibt, sie einfach unter den Tisch fallen zu lassen. (In Abschn. 8.3.6 wird sich allerdings zeigen, daß sie energetisch keine Rolle spielen.) Die vier Vierervektoren εα(λ)(k) erfüllen die Vollständigkeitsrelation 3
gλλ εα(λ) (k) εβ(λ)(k)
gαβ .
(8.119)
λ 0
Beweis: Weil Tαβ
3
gλλ εα(λ) εβ(λ)
εα(0) εβ(0) εα(1) εβ(1) εα(2) εβ(2) εα(3) εβ(3)
λ 0
und gαβ Tensoren sind, gilt Gleichung (8.119) in allen Inertialsystemen, wenn sie in einem gilt. Es genügt daher, sie in dem System zu beweisen, in welchem die εα(λ) die Form (8.117) annehmen. In diesem gilt z. B. εα(0) εβ(0)
1, 0, 0, 0α 1, 0, 0, 0β
δα0 δβ0
und ähnlich εα(l) εβ(l) δαβ δαl für l 1. Damit ergibt sich ⎧ ⎨ 1 für α β ⎪ Tαβ δαβ δα0 δα1 δα2 δα3 1 für α β ⎪ ⎩ 0 sonst
δαβ δα0
⎫ ⎪ 0, ⎬ gαβ . 1, 2, 3 , ⎪ ⎭
Die allgemeine Lösung von Gleichung (8.111) zum Wellenvektor k μ ergibt sich durch Superposition der vier zu k μ gehörigen Lösungen (8.113), 3 2 hμ 0c s.u. Aα (k, x) b (λ)(k)Aα(λ)(k, x) mit Aα(λ) (k, x) εα (λ)(k) e i k x . 2ωk λ 0 (8.120) Da (8.111) eine homogene lineare Gleichung ist, bleibt in ihrer Lösung ein Faktor frei. 2 Daher konnte in Aα (k, x) der Faktor hμ 0 c /(2ωk ) hinzugefügt werden, was geschah, um später einfache Vertauschungsrelationen für die Operatoren b (λ)(k) zu erhalten. Die allgemeinste Lösung von (8.111) ergibt sich durch Superposition von Wellenlösungen (8.120), d3k s.u. Aα (x) A α (k, x) A (k, x) α (2π)3 3 d3k 2 hμ 0c (λ) (λ) (λ) (λ) b (k)A (k, x) b (k)A (k, x) α α (2π)3 2ωk λ 0 3 d3k 2 hμ 0c (λ) (λ) i k x (λ) i k x ε (k) b (k) e b (k) e . (8.121) α (2π)3 2ωk λ 0
224
8 Kanonische Feldquantisierung
Dabei wurden zur Superposition außer den Operatoren (8.120) auch noch die dazu adjungierten benutzt. Das ist möglich, weil mit A α (k, x) auch A α (k, x) eine Lösung von (8.111) ist, und es ist notwendig, damit die Operatoren A α (x) hermitesch werden, A α (x) .
A α (x)
(8.122)
Letzteres muß gefordert werden, damit der Erwartungswert von A α (x) das reelle Vektorpotential Aα (x) beschreibt. Zur Vollständigkeit der Darstellung (8.121) muß garantiert sein, daß bei der k-Integration sowohl in Richtung von k als auch von k laufende Wellen erfaßt werden. Dies wird dadurch erreicht, daß bei der Auflösung von Gleichung (8.114b) für ωk die positive Wurzel gewählt wird, ω
c k
ωk
k
bzw.
k .
k0
(8.123)
(Hieraus ergibtsich als Phasengeschwindigkeit der Welle Ú k (ωk / k)k/ k ck/ k.) Der Faktor 1/ 2(2π)3 ωk in (8.121) wurde eingefügt, damit die Kommutatoren der b (λ)(k) möglichst einfach werden. Aus (8.110) folgt mit (8.121) und ∂t ei k x i k0 cei k x i ωk ei k x für die Impulsoperatoren 3 h ω ε (λ)(k) b (λ)(k) e i kx b(λ)(k) ei kx d 3 k . π α (x) i k α 2(2π)3 μ0 c2 λ 0 (8.124) Durch Inversion der Fourier-Reihen (8.121) und (8.124) sowie mit (8.110a) erhalten wir i g λλ d 3x b (λ)(k) A α (x) i ωk A α (x) εα(λ)(k) ei k x , (2π)3/2 2μ0 c2 h ωk (8.125) λλ 3x i g d b (λ)(k) A α (x) i ωk A α (x) εα(λ)(k) e i k x . (2π)3/2 2μ0 c2 h ωk (In g λλ keine Summation über λ!) Beweis: Zum Beweis nehmen wir in (8.121) und (8.124) die Ersetzungen k k und λ multiplizieren beide Gleichungen mit ei k x/(2π)3 und integrieren über d 3x. Mit 1 1 i (k k )x d 3x δ3 (k k ) , e ei (k k ) x d 3x δ 3 (k k ) , (2π)3 (2π)3
(8.110a) und k k ω /c für k k ergibt sich ω h μ c A (x) e d x b (k)ε (2π) 2(2π) ¼
0
k 3
und i (2π)3
α
0
ik x
¼
λ vor,
(8.126)
k
Aα (x) i k x 3 e d x ωk
3
h μ c 2(2π) 0
(λ¼ ) α (k)
b
b(λ )(k)εα (λ )(k)
b
2
0
3
(λ¼ )
λ¼
2 3
λ¼
¼
¼
(λ¼ ) ( k)ε (λ¼ )( k) e2iωk t α
(λ¼ ) ( k)ε (λ¼ ) ( k) e2iωk t . α
8.3 Quantisierung des Maxwellschen Vakuumfeldes
225
Die Addition der beiden Gleichungen liefert
i b(λ )(k)εα (λ )(k) μ0 c2 hω λ k ¼
¼
¼
d 3x Aα (x) i ωk Aα (x) ei k x . 2(2π)3
Die Multiplikation dieser Gleichung mit ε (λ)α(k) (dabei wird über α summiert) führt mit den Orthogonalitätsrelationen (8.115), g λλ 0 für λλ und 1/g λλ g λλ schließlich zu (8.125a). b(λ) (k) kann auf analoge Weise berechnet werden und ist natürlich zu b(λ) (k) adjungiert. ¼
Formal hängen die durch (8.125a) gegebenen Operatoren b (λ)(k) noch von der Zeit ab, da über x 0 nicht integriert wird. Da sie aber als zeitunabhängig definiert wurden und die zu (8.125) führende Rechnung korrekt ist, muß sich die Zeitabhängigkeit der Integranden herausintegrieren. Das läßt sich auch explizit beweisen (Aufgabe 8.9). Aus (8.125) ergeben sich mit (8.107) die Kommutationsrelationen (λ) (λ) b (k), b (λ ) (k ) 0, b (k), b (λ ) (k ) (λ) b (k), b (λ ) (k ) gλλ δ3(k k ). ¼
¼
¼
0, (8.127)
¼
Beweis: Aus (8.125) folgt mit (8.110a) sowie der Hermitezität von A α und π α beispielsweise b(λ)(k), b(λ ) (k ) ¼
3 3 d xd x g λλ g λ λ ε (λ)(k) εβ (λ )(k ) ei k x ei k x 3 α 2(2π) 2 μ0 c h ωk ω k α 2 α β (x ) μ c2 π β (x ) iω k A (x) μ0 c π (x), iω k A 0 ¼
¼
¼
¼
¼
¼
(8.107a,b) (8.122))
3 3 d xd x g λλ g λ λ εα (λ)(k) εβ (λ )(k ) ei (ωk t ωk t ) ei (k x k x) (2π)3 2h ωk ω k α β β α iω k A (x), π (x ) iω k A (x ), π (x) ¼
¼
¼
¼
¼
¼
¼
¼
(8.107c)
h (ωk ω k ) λλ λ λ g g 2h ωk ωk ¼
(8.115),s.u. h (8.126a)
¼
¼
d 3x αβ (λ) g εα (k) εβ (λ )(k ) ei (ωk t ωk t ) ei (k k) x (2π)3 ¼
¼
¼
¼
(ω k ωk ) λλ λ λ i (ωk ω ) t (λ) k g g e εα (k) ε(λ )α(k ) δ 3 (k k) . /, 2h ωk ωk g λλ δ 3 (k k) ¼
¼
¼
¼
¼
¼
g
λλ δ 3 (k k) . ¼
Hier wurde zuletzt beim Koeffizienten der δ 3 -Funktion k k mit der aus (8.123) folgenden Konsequenz ωk ωk benutzt, da dieser nur für k k von null verschieden ist, außerdem die aus (g λλ )2 1 folgende Beziehung g λλ g λ λ g λλ (g λλ )2 g λλ g λλ . Bei der vorletzten Umformung wurde t t gesetzt, was möglich ist, weil der berechnete Kommutator zeitunabhängig ist und daher für beliebige Zeiten t und t dasselbe Ergebnis liefern muß. ¼
¼
¼
¼
¼
¼
226
8 Kanonische Feldquantisierung
Aufgrund unserer Erfahrungen bei der Quantisierung des Schrödinger-Feldes erwarten wir, daß es sich bei den Operatoren b (λ) (k) und b (λ)(k) um Erzeugungs- bzw. Vernichtungsoperatoren handelt. Diese Erwartung wird durch die Rechnungen des nächsten Abschnitts bestätigt, wo die Energie und der Impuls der Photonen durch diese Operatoren ausgedrückt werden.
8.3.4 Energie und Impuls der Photonen Jetzt berechnen wir den Hamilton-Operator (8.108) in der Darstellung (8.121). Unter Benutzung von ei k x ei (ωk t k x) ikei k x und (8.124) ergibt sich mit x x zunächst d 3 k d 3 k ωk ωk h c2 k k H d 3x εα (λ)(k) ε (λ )α(k ) 2 ωk ωk 2(2π)3 c2 λ,λ b (λ)(k) b(λ ) (k ) ei (k k) x b (λ)(k) b(λ ) (k ) ei (k k) x
(λ) (λ ) i (k k) x (λ) (λ ) i (k k) x
b (k) b (k ) e b (k) b (k ) e . ¼
¼
¼
¼
¼
¼
¼
Mit (8.126) bzw. d 3x ei (k k) x (2π)3 d 3x ei (k k) x (2π)3
¼
ei (ωk ωk )t
¼
ei (ωk ωk )t
¼
ei (k k) x
d 3x (2π)3
ei (ωk ωk )t δ 3 (k k) ,
ei (k k) x
d 3x (2π)3
ei (ωk ωk )t δ 3 (k k)
¼
¼
¼
¼
¼
¼
¼
¼
¼
(8.128) ¼
folgt hieraus H
ωk ωk h c2 k k (λ) 3 3 (λ )α d k d k εα (k) ε (k ) ω ω 4 c2 k k λ,λ b(λ)(k) b (λ ) (k ) ei (ωk ωk )t b (λ)(k) b (λ ) (k ) ei (ωk ωk )t δ3(k k)
(λ) (λ ) i (ωk ωk )t (λ) (λ ) i (ωk ωk )t 3 δ (k k) .
b (k) b (k ) e b (k) b (k ) e ¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
Für k k 0 wird k k k2 , ωk ωk ωk , und nach (8.114) verschwindet der Vorfaktor ( ωk ωk /c2 k k / ωk ωk ). Für k k 0 wird er gleich 2ωk /c2 , und mit ωk ωk 0, den Orthogonalitätsrelationen (8.115) und g λλ 0 für λ λ erhalten wir schließlich h H g λλ b (λ)(k) b (λ)(k) b (λ)(k) b (λ)(k) ωk d 3 k
2 λ h ωk 3 (8.127c) λλ (λ) (λ) 3 δ (0) d 3 k . g b (g λλ )2
(k) b (k) h ωk d k 2 ¼
¼
¼
¼
¼
λ
λ
8.3 Quantisierung des Maxwellschen Vakuumfeldes
227
Das zweite Integral liefert in jedem Zustand einen unendlichen Beitrag zur Energie, wobei jeder Polarisationszustand λ wegen (g λλ )2 1 dazu mit 12 hωk beiträgt. Wie beim Klein-Gordon-Schrödinger-Feld läßt sich das zweite Integral als Nullpunktsenergie unendlich vieler Oszillatoren deuten. Um zu einer physikalisch sinnvollen Theorie zu kommen, ziehen wir diese unendliche Energie wieder ab und erhalten H
b
(0)
(k) b (0)(k)
3
b (λ) (k) b (λ)(k) hωk d 3 k .
(8.129)
λ 1
(Der renormierte Hamilton-Operator ist normalgeordnet.) Von der zu Aα kanonisch-konjugierten Impulsdichte kann nicht erwartet werden, daß sie mit der physikalischen Impulsdichte übereinstimmt. Die letztere ergibt sich vielmehr nach (7.95) aus den Komponenten des Energie-Impuls-Tensors (7.92), 1 0 Θl c
1 ∂ A α,l c ∂ A α,0
∂ Aα,l ∂ A α
(7.66)
1 α A A α,l μ0 c 2
ε 0 A
α
A α,l .
2 Mit (7.95) bzw. (1/c) Θ 0α d 3x E/c, p folgt hieraus der Gesamtimpuls pε0
A 0
A0
l A
Al
3
d x ε0
A 0
A 0
3
A l Al d 3x .
l 1
Dementsprechend definieren wir als Impulsoperator p ε0
0 A A 0
3
A l A l d 3x.
(8.130)
l 1
Eine ähnliche Rechnung wie die, die zu (8.129) führte (Aufgabe 8.10), liefert in der Darstellung (8.121) den normalgeordneten Impulsoperator p
b
(0)
(k) b (0)(k)
3
b (λ)(k) b (λ)(k) h k d 3 k .
(8.131)
λ 1
8.3.5 Teilchenzahloperatoren und Metrik des Photonen-Hilbert-Raums Der Vergleich der Vertauschungsrelationen (8.127) und des Hamilton-Operators (8.129) mit den entsprechenden Größen (8.24) und (8.27) des Schrödinger-Feldes legt es nahe, die Größen b (λ)(k) und b (λ)(k) als Erzeugungs- bzw. Vernichtungsoperatoren für Photonen und n (λ)(k) g λλ b (λ)(k) b (λ)(k)
(8.132)
228
8 Kanonische Feldquantisierung
als Operator der Teilchenzahldichte im k-Raum aufzufassen. Der Operator der Gesamtteilchenzahl ist dann 3
N
λ 0
n (λ)(k) d 3 k .
(8.133)
Der Hamilton-Operator (8.129) und der Impulsoperator (8.131) können mit (8.132) in der Form 3
H
λ 0
n (k) h ωk d k , (λ)
p
3
3 λ 0
n (λ)(k) h k d 3 k
(8.134)
geschrieben werden. Die Gesamtteilchenzahl in dem durch Einwirkung des Erzeugungsoperators b (λ) (k) auf den Vakuumzustand 0 hervorgerufenen Zustand ergibt sich aus 3 ' 1 ' 1 N b (λ) (k)''0 gλ λ d 3 k b(λ ) (k ) b(λ ) (k ) b (λ) (k) ''0 ¼
3
(8.127c)
3 s.u. λ ¼ 0
λ¼ 0
¼
¼
¼
λ¼ 0
' 1 ' g λ λ d 3 k b (λ ) (k ) b (λ) (k) b (λ ) (k ) g λ λ δ 3 (k k ) '0 ¼
¼
¼
¼
¼
' 1 ' 1 ' 1 2 ' ' ' g λλ b (λ) (k) '0 b (λ) (k) '0 . g λ λ g λ λ d 3 k δ 3 (k k ) b (λ ) (k ) '0 ¼
¼
¼
¼
s.u.
markierten Schritt wurde benutzt, daß die Einwirkung des Vernich(Bei dem mit tungsoperators b (λ ) (k ) auf den Vakuumzustand 0 null erzeugt.) b (λ) (k)0 ist demnach ein Eigenzustand von N zum Eigenwert 1, in ihm befindet sich also ein Teilchen, und wir bezeichnen ihn mit ' 1 1 b (λ) (k)''0 . (8.135) ¼
Dieses Ergebnis rechtfertigt im Nachhinein die Definitionen von n λ und N . Analog ergibt sich durch Anwendung des Hamiltonoperators (8.134a) auf den Zustand 1 H 1
h ωk 1 .
Für den Erwartungswert von N im Zustand 1 ergibt sich mit N 1 1 ' ' ' ' ' (λ) 1' N '1 1'1 0'b (k) b (λ) (k)'0 ' (8.37a) (8.127c) '' (λ) 0 b (k) b (λ)(k) g λλ δ 3 (0)'0 gλλδ3(0) ,
und für den von H analog
' ' 1' H '1
gλλh ωk δ3(0) .
8.3 Quantisierung des Maxwellschen Vakuumfeldes
229
Für λ 0, also zeitartige (skalare) Photonen, ist also sowohl der Erwartungswert der Teilchenzahl als auch der der Energie negativ. Das ist darauf zurückzuführen, daß in diesem Fall die Norm des Zustands, 11g 00 δ 3 (0), ebenfalls negativ wird: Der HilbertRaum für Photonen hat wie die Raum-Zeit eine indefinite Metrik. Die Unendlichkeit der Norm muß uns dabei nicht weiter stören, da wir in einem unendlich ausgedehnten Gebiet nach einem Kontinuum ebener Wellen entwickelt haben. Der negative Erwartungswert der Energie zeitartiger Photonen verschärft das Problem mit den in der Realität nicht beobachteten skalaren Photonen. In einer nicht Lorentz-invarianten Theorie mit der Coulomb-Eichung scheint dieses umgangen zu sein, denn in ihr treten nur transversale Photonen auf. Wir werden im folgenden Abschnitt jedoch sehen, daß alle Schwierigkeiten durch die bisher noch nicht berücksichtigte Bedingung (8.112) zur Erfüllung der Lorenz-Eichung (8.103) behoben werden können, ohne daß dazu die longitudinalen und skalaren Photonen aus der Theorie verbannt werden müssen.
8.3.6 Berücksichtigung der Lorenz-Eichung An die zulässigen Zustände ψ kann statt (8.112) sogar die etwas schwächere Eichbedingung ∂ α A α( ) (x)ψ 0
(8.136)
gestellt werden, wobei A α( ) (x) bzw. A (α) (x) den Anteil der Zerlegung (8.121) mit den Erzeugungs- bzw. Vernichtungsoperatoren meint, 3 2 hμ 0c A α() (x) b (λ)(k) εα (λ)(k) e i k x d 3 k , (8.137) 2(2π)3 ωk λ 0 3 2 hμ 0c A α( ) (x) b (λ)(k) εα (λ)(k) ei k x d 3 k . (8.138) 2(2π)3 ωk λ 0
(Zur Begründung der Notation siehe nach Gleichung (9.44).) Offensichtlich gilt A (α ) (x) A (α) (x) . Hiermit, mit ψ L ψ (ψ , L ψ ) (L ψ , ψ ) (ψ , L ψ ) ψ L ψ () ( ) und A α A α A α folgt dann nämlich ψ ∂ α A α ψ
(8.136)
ψ ∂ α A (α
)
ψ
ψ ∂ α A (α ) ψ
ψ ∂ α A (α) ψ
(8.136)
0.
Wird (8.137) in (8.136) eingesetzt, so ergibt sich nach Herauskürzen konstanter Faktoren 3 d3k e i k x k α εα(λ)(k) b (λ)(k)ψ 0 . ωk λ 0
230
8 Kanonische Feldquantisierung
Multipliziert man diese Gleichung mit ei k x /(2π)3 und integriert sie dann über d 3x, so entsteht dabei nach (8.126) die Funktion δ 3 (k k ), und die anschließende Ausführung der d 3 k-Integration liefert nach Herauskürzen weiterer Faktoren und der Umbenennung k k in dem durch (8.116)–(8.117) definierten Koordinatensystem die Bedingung ¼
0
3
λ 0
(8.118)
k α εα (λ)(k) b (λ)(k)ψ
3 λ 0
kα ε(λ)α(k) b (λ)(k)ψ
' 1 ' 1 ' ' kα ε(0)α(k) b (0)(k)kα ε(3)α(k) b (3)(k) 'ψ k b (0)(k) b (3)(k) 'ψ ,
die
b (0)(k)ψ
b (3)(k)ψ
zur Folge hat. Bilden wir das Skalarprodukt jeder Seite mit sich selbst, so folgt ' ' ' ' (0) ψ 'b (k) b (0)(k)'ψ ψ 'b (3) (k) b (3)(k)'ψ und daraus mit (8.132) ' ' ' ' (0) n (k) n (3)(k) ψ 'n (0)(k)'ψ ψ 'n (3)(k)'ψ 0 ,
(8.139)
d. h. in jedem physikalischen Zustand muß der (negative) Erwartungswert der Zahl skalarer Photonen den (positiven) der Zahl longitudinaler Photonen kompensieren. Für den Erwartungswert der Energie ergibt sich hiermit aus (8.134)
H
3 λ0
ψ n(λ)(k)ψ h ωk d 3 k
2 λ 1
ψ n(λ)(k)ψ h ωk d 3 k .
(8.140)
Die Beiträge der skalaren und longitudinalen Photonen heben sich gegenseitig weg, energetisch spielen nur die transversalen Photonen eine Rolle. Dieselbe Aussage gilt offensichtlich auch für den Impuls und – wie gezeigt werden kann – noch für andere Observablen wie den Drehimpuls. Dies bedeutet allerdings nicht, daß die skalaren und longitudinalen „Pseudophotonen“ nur die Rolle lästiger Anhängsel spielen, die praktisch überflüssig sind und nur aus formalen Gründen mitgeschleppt werden müssen. Wenn sie auch nicht als freie Teilchen meßbar sind, beeinflussen sie doch die – bisher nicht behandelten – Wechselwirkungsprozesse mit anderen Feldern. Wenn man sie – verbotenerweise – wegließe, erhielte man für diese Prozesse andere Ergebnisse. Da sie hierbei nur indirekt in Erscheinung treten – was übrigens auch auf transversale Photonen zutreffen kann – spricht man auch von virtuellen Photonen. Die physikalische Rolle der Pseudophotonen bei Wechselwirkungsprozessen steht nicht im Widerspruch zur Quantisierung des elektromagnetischen Feldes in der Strahlungseichung, bei der nur transversale Photonen auftreten. Bei der Behandlung von Wechselwirkungen muß natürlich auch das beim freien Feld auf null gesetzte skalare Potential Φ mit berücksichtigt werden, und in der dann vorliegenden Coulomb-Eichung ergibt sich über dieses Potential auf anderem Wege dieselbe Beeinflussung der Wechselwirkung.
8.3 Quantisierung des Maxwellschen Vakuumfeldes
231
8.3.7 Photonenspin Den klassischen Spin des elektromagnetischen Feldes erhält man durch Berechnung der räumlichen Komponenten Slm des in (7.118b) angegebenen Tensors S αβ für das Maxwell-Feld. Mit ηr,0 Aρ /c, ηs A σ und ∂ /∂ A ρ π ρ ergibt sich zunächst
S
lm
μ 1c
(7.67b)
lm σ 3 A dx π ρ Iρσ
0
2
A I
ρ lm σ ρσ A
d 3x .
(8.141)
βγ
Im Fall des Vektorpotentials Aα sind die Koeffizienten Iρσ nach (7.110) durch
12 I
d Aρ
βγ ρσ dϕβγ
Aσ
(8.142)
definiert. Zu ihrer Berechnung benutzen wir, daß sich d A ρ bei den raum-zeitlichen Drehungen (7.108)–(7.109), die Lorentz-Transformationen repräsentieren, wie d x α transformiert, also gemäß d Aρ
dϕ
ρσ
Aσ
δ δ 12 δ
β γ ρ σ
dϕβγ A σ
β γ ρδ σ
δ
γ
ρ
δ
γ
δ βσ dϕγ β A σ
ρ
δ
(7.109)
δ βσ dϕβγ A σ .
γ
ρ
δ βσ dϕβγ Aσ
Durch Vergleich mit (8.142) ergibt sich hieraus βγ Iρσ
δ
β γ ρδ σ
δ
γ
ρ
δ βσ
I
γβ ρσ
.
(8.143)
Damit erhalten wir aus (8.141) schließlich das Ergebnis
S
lm
A ρ δlρ δ mσ δ mρ δlσ Aσ 3 dx μ0 c 2
das sich für Φ
μ 1c 0
2
AlA m AmAl d 3x,
(8.144)
0 mit E ∂ A in t
S
1 μ0 c 2
(E
A) d x 3
(8.145)
umschreiben läßt, wenn die Komponenten von S durch Sn
S
lm
,
l, m, n zyklisch
(8.146)
definiert werden. Der Spinoperator des Photonenfeldes ergibt sich, indem man in (8.144) die Felder A α und A α durch die Operatoren Aα und Aα ersetzt. In der Darstellung (8.121) und
232
8 Kanonische Feldquantisierung
(8.124) erhält man auf diese Weise mit (8.120b) und (8.110a) durch ähnliche Rechnungen wie für H l m S lm μ 1c2 A l A m A m A l d 3x π A π m A l d 3x 0 3 3 ¼ 3 5 d k d k d x ωk (λ)l i h (λ )m ¼ (λ)m (λ )l ¼ (k) ε (k ) ε (k) ε (k ) ε 2 (2π)3 ωk λ,λ (λ) i k x (λ) i k x b (k) e b (k) e b (λ )(k ) e i k x b (λ ) (k ) ei k x (8.123) d 3 k ε(λ)l(k) ε(λ )m (k) ε(λ)m(k) ε(λ )l (k) (8.128) i h 2 λ,λ b(λ)(k) b(λ ) (k) e 2iωk t b (λ)(k) b(λ ) (k) e2iωkt i2h d 3 k ε(λ)l(k) ε(λ )m(k) ε(λ)m(k) ε(λ )l(k) λ,λ b (λ)(k) b(λ ) (k) b (λ)(k) b(λ )(k) . ¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
Im letzten Ergebnis verschwindet das erste Integral, weil die erste eckige Klammer für λλ und k k bei in sich selbst übergehender zweiter Klammer das Vorzeichen wechselt, so daß sich bei der Summation und Integration je zwei Terme gegenseitig wegheben. Definiert man analog zu (8.146) einen vektoriellen Spinoperator S mit den Komponenten Sn S lm , l, m, n zyklisch, (8.147) so kann der verbliebene Beitrag zu i h 3 (λ) S (k) (λ )(k) b (λ)(k) b (λ ) (k)b (λ)(k) b (λ )(k) d k 2 ¼
¼
¼
λ,λ¼
zusammengefaßt werden, wobei der Dreiervektor (λ)(k) als Komponenten die drei räumlichen Komponenten des Vierervektors ε(λ)α(k) besitzt. Da das Kreuzprodukt der Polarisationsvektoren für λ λ verschwindet, erstreckt sich die Summe nur über Terme mit λ λ . Dann können die Operatoren b (λ)(k) und b (λ ) (k) nach (8.127c) wegen g λλ 0 vertauscht werden, und wir erhalten schließlich (mit k k und λ λ ) den Spinoperator ¼
S
i h 2
¼
d 3 k
(k )
(λ¼¼ )
(k )
(λ¼ )
b (λ ) (k ) b (λ )(k ) b (λ ) (k ) b (λ )(k ) . ¼
¼¼
¼¼
¼
λ¼ ,λ¼¼
(8.148) Dieser ist ohne Abzug eines divergenten Terms von Haus aus normalgeordnet. Die drei Komponenten des Spinoperators vertauschen nicht miteinander, daher kann der Spin nicht vollständig scharf gemessen werden. Von den – einzeln scharf meßbaren – Spinkomponenten interessiert in Fällen, in denen eine eindeutige Richtung der Wellenausbreitung definiert ist, besonders die in diese Richtung fallende Komponente,
8.3 Quantisierung des Maxwellschen Vakuumfeldes
233
die sogenannte Helizität. Eine eindeutige Richtung gibt es z. B. bei den Ein-PhotonenZuständen b (λ) (k) 0, für die wir jetzt die Wirkung des Helizitätsoperators S k S k/ k
(8.149)
berechnen wollen. Dabei benutzen wir die Vertauschungsrelationen (8.127) und berücksichtigen, daß die in S k auftretenden Vernichtungsoperatoren nach der Vertauschung auf den Vakuumzustand 0 wirken und dann den Beitrag 0 liefern, k i h (λ ) d3k S k b (λ) (k) 0 (k ) (λ )(k ) δ 3 (k k ) 2 k ' 1 λ ,λ ' λ λ (λ ) g b (k )g λ λ b (λ ) (k ) '0 i h k (λ) (k) (λ )(k) g λλ b (λ ) (k) 0 2 k λ i h k (λ ) (k) (λ)(k) g λλ b (λ ) (k) 0 2 k ¼¼
¼
¼
¼¼
¼¼
¼
¼
¼¼
¼
¼
¼
¼¼
¼¼
λ¼¼
oder mit der Umbenennung λ
λ
S k b (λ)(k) 0 i h g λλ
k k
(λ)
(k)
(k) b (λ ) (k) 0.
(λ¼ )
¼
(8.150)
λ¼
Aus den für k μ k , 0, 0, k gültigen Relationen (8.117) folgt k/ k
0, 0, 1 ,
(1)
1, 0, 0 ,
(2)
0, 1, 0 ,
(3)
0, 0, 1
und (0) 0. Hiermit ergibt sich aus (8.150) zum einen, daß skalare Photonen (λ 0) keinen Spin besitzen. (Man erhält für diesen auch schon ohne Projektion auf die k-Richtung null.) Zum anderen folgt wegen k (3), daß die Spinkomponente longitudinaler Photonen (λ 3) in Ausbreitungsrichtung null ist. Für die transversalen Photonen verschwindet der Summenbeitrag von λ 0 und λ 3, so daß wir für sie mit g λλ 1 und * k (λ) 1 für λ 1, λ 2 (λ ) (k) (k) k 1 für λ 2, λ 1 schließlich ¼
S k b (1) (k) 0 i h b (2) (k) 0,
S k b (2) (k) 0 i h b (1) (k) 0
(8.151)
erhalten. Offensichtlich sind die transversalen Ein-Photonen-Zustände keine Eigenzustände von S k . Es ist jedoch einfach, durch lineare Superposition von Ein-Photonen-Zuständen Eigenzustände von S k zu erzeugen. Definiert man neue Erzeugungsoperatoren 1 1 bR (k) b (1) (k) i b (2) (k) , bL (k) b (1) (k) i b (2) (k) , 2 2 (8.152)
234
8 Kanonische Feldquantisierung
so folgt aus (8.151) sofort S k bR (k) 0 h bR (k) 0,
S k bL (k) 0 h bL (k) 0 ,
(8.153)
d. h. bR (k) 0 und bL (k) 0 sind Eigenzustände des Helizitätsoperators S k zu den Eigenwerten h und h. Klassisch entsprechen die durch Anwendung der Operatoren (8.152) auf den Vakuumzustand 0 hervorgehenden Quantenzustände rechts- und linkshändig zirkular polarisierten Lichtwellen, so daß man sie als Eigenzustände rechtsbzw. linkshändig zirkular polarisierter Photonen auffassen kann. Deren Spinkomponenten in Ausbreitungsrichtung betragen h, was nach der üblichen Nomenklatur – als Spin bezeichnet man die kleinste positive Spinkomponente geteilt durch h – bedeutet, daß Photonen den Spin 1 besitzen. Nach der allgemeinen Quantenmechanik des Drehimpulses hätte man erwarten können, daß die Spinkomponente eines Spin-1-Teilchens die Werte h, 0 und h annimmt. Wir finden jedoch nur h, da den longitudinalen Photonen keine reale Bedeutung zukommt. Das hat mit der verschwindenden Photonenmasse und der daraus folgenden Ausbreitung mit Lichtgeschwindigkeit zu tun. Unsere früheren Rechnungen zum Drehimpulsoperator waren nicht-relativistisch und bezogen sich auf ein ruhendes Drehzentrum. Für Photonen gibt es jedoch prinzipiell keinen nicht-relativistischen Grenzfall. Massive Spin-1-Teilchen können bei Lorenz-Eichung durch die Proca-Gleichungen Aα
m 02 c2 h 2
A α μ0 j α
0
(8.154)
beschrieben werden. Diese geht aus den Maxwell-Gleichungen der Form (7.61) in Lorenz-Eichung durch Hinzufügen eines Masseterms ähnlich hervor wie die KleinGordon-Schrödinger-Gleichung (4.6) aus der entsprechenden Gleichung für masselose Teilchen. Ihre Quantisierung kann ähnlich wie die des Maxwell-Feldes erfolgen, wobei den longitudinalen Feldquanten allerdings reale Bedeutung zukommt. Dies führt dazu, daß in Übereinstimmung mit den gewöhnlichen Drehimpulsregeln drei Spinkomponenten auftreten. Wegen der endlichen Ruhemasse existiert hier allerdings auch ein nicht-relativistischer Grenzfall.
8.3.8 Vakuumfluktuationen Wie wir am Anfang dieses Kapitels gesehen haben, spielt das Vektorpotential Aα in der Quantentheorie des elektromagnetischen Feldes dieselbe Rolle wie der Teilchenort in der gewöhnlichen Quantenmechanik. Vom letzteren wissen wir, daß er nicht permanent einen scharfen Wert beibehalten kann, sondern eine durch die Unschärferelation x i pi > vorgegebene Unschärfe aufweist. Das steht jedoch nicht im Widerspruch
h zu einer festen mittleren Lage, z. B. x 0. Da die Quantentheorie des elektromagnetischen Feldes in völliger Analogie zur Quantenmechanik entwickelt wurde, können wir ein analoges Verhalten des Operators A α und und seines Erwartungswerts ψ A α ψ erwarten. Im Vakuumzustand, der 0 ∂ αA α 0 0 erfüllt und daher mit zu den physikalischen Zuständen zählt, ergibt sich für den Erwartungswert des Feldes mit b (λ)(k) 0 0
8.3 Quantisierung des Maxwellschen Vakuumfeldes
235
und 0b (λ) (k) 0 0 A α 0 2 hμ 0c
3 (8.121) λ 0
A α(λ) (k, x) 0b (λ)(k)0 A α(λ) (k, x) 0b (λ)(k)0 3 d k (2π)3 2ωk
0.
Ein Maß für die mittlere quadratische Abweichung vom Mittelwert null bildet die Größe (x) A α (x)0. Wir berechnen zuerst mit (8.121) 0 A α ' 1 0 ' d 3 k d 3 k ' ' 2 0 ' A α (x) A α (x )' 0 hμ c εα (λ)(k) ε(λ )α(k ) 0 3 2(2π) ωk ωk λ,λ 0 ' ' 1 ' (λ) i k x b (λ)(k) ei k x b (λ )(k ) ei k x b (λ ) (k ) ei k x '' 0 .
0 ' b (k) e ¼
¼
¼
¼
¼
¼
¼
¼
¼
Mit ' 1 0 ' ' 1 0 ' ' 1 0 ' ' ' ' ' ' ' 0 'b (λ)(k) b (λ )(k )' 0 0 'b (λ)(k) b (λ ) (k )' 0 0 'b (λ)(k) b (λ )(k )' 0 0 ¼
¼
¼
(in jedem der drei Fälle wirkt ein Vernichtungsoperator auf den Vakuumzustand) und b (λ)(k) b (λ ) (k ) ¼
(8.127c) (λ¼ ) b (k ) b (λ)(k)
g λλ δ 3 (k k ) ¼
sowie mit der Normierung 00 1 erhalten wir ' 1 0 ' ' ' 0 ' A α (x) A α (x )' 0 hμ 0c
¼
hμ 0c
λ,λ¼ (g
¼
¼
¼
λ,λ¼
d3k εα (λ)(k) ε (λ )α(k) g λλ ei k (x x) 3 2(2π) ωk ¼
2
(8.115b) 2 hμ 0c
und mit
d 3 k d 3 k εα (λ)(k) ε (λ )α(k ) g λλ δ 3 (k k ) ei (k x k x) 2(2π)3 ωk ωk ¼
2
¼
¼
λ,λ¼
d3k 2(2π)3 ω
λλ¼ )2 4
(g λλ )2 ei k (x x) ¼
k
¼
λ,λ¼
schließlich
' ' 2 0' A α (x) A α (x )'0 2hμ 0c
d3k ei k (x x) . (2π)3 ωk ¼
(8.155)
Für x x folgt daraus mit Aα Aα Φ 2/c2 A2 , ωk c k und d 3 k 4π 2 k2 d k d3k hμ 0c 2 2 2 2 0 A Φ /c 0 2hμ k d k , 0c (2π)3 ωk π 0 d. h. die durch 0 A α A α 0 beschriebenen Vakuumfluktuationen werden sogar unendlich stark. Diese Divergenz kann nicht durch Subtraktion eliminiert werden, da der Mittelwert des Feldes im Vakuumzustand verschwindet. Daraus kann geschlossen werden,
236
8 Kanonische Feldquantisierung
daß der Erwartungswert der berechneten Größe nicht an einem isolierten Raum-ZeitPunkt meßbar ist. Offenbar kann man die Divergenz jedoch beheben, indem man Gleichung (8.155) über x μ und x ¼μ mittelt. Der Erwartungswert des Produktes von Mittelwerten der Feldoperatoren über endliche Raum-Zeit-Gebiete wird damit zu einer meßbaren Größe. Das kann damit verglichen werden, daß in der gewöhnlichen Quantenmechanik nur Wellenpakte physikalisch sinnvoll sind, nicht jedoch die diese konstituierenden ebenen Einzelwellen. Als Resümee halten wir fest, daß der Vakuumzustand nicht feldfrei ist. Die in ihm auftretenden Fluktuationen können indirekt gemessen werden. Sie führen z. B. zu Fluktuationen des Elektronenorts im Atom, die sich ähnlich wie die Zitterbewegung des Elektrons auswirken und zu einer (schwachen) Verschiebung der Energieniveaus führen, die als Lamb-Shift bezeichnet wird.
8.4
Quantisierung des freien Dirac-Feldes
Bei der Quantisierung des Dirac-Feldes treten Besonderheiten auf, die dazu führen werden, daß wir bei ihm teilweise anders als beim Schrödinger-Feld vorgehen müssen. Als erstes wird der Spinor ψ mit den vier Komponenten ψα , α 1, . . . , 4, zu einem Spinoroperator ψ mit Komponenten ψα gemacht, desgleichen der durch (7.75) π π i h definierte Impuls, i hψ ψ . Da das Dirac-Feld Fermionen beschreibt, können wir aufgrund unserer Erfahrungen bei der Jordan-Wigner-Quantisierung des Schrödinger-Feldes fordern, daß zwischen den Operatoren Antikommutationsregeln gelten. In Abschn. 8.4.2 wird sich zeigen, daß diese aus physikalischen Gründen erzwungen werden. In Analogie zu (8.107) lauten sie
ψα (x, t), ψβ (x , t) 1 ψα (x, t), πβ (x , t) i h
πα (x, t), πβ (x , t) 0, 3 ψα (x, t), ψβ (x , t) δαβ δ (x x ) .
0,
(8.156)
(Gegenüber (8.107) ist g αβ durch δαβ ersetzt, weil sich die Indizes auf gleichberechtigte Spinor- und nicht Vektorkomponenten mit indefiniter Metrik beziehen.) Wie im nächsten Abschnitt gezeigt wird, erfüllt der Operator ψ(x, t) unabhängig davon, ob die Vertauschungsrelationen mit Kommutatoren oder Antikommutatoren gebildet werden, wie das Feld ψ(x, t) die Dirac-Gleichung. Aus (7.79) mit (7.78) ergibt sich der Hamilton-Operator H ψ (x, t) HD (x)ψ(x, t) d 3x
α,β
ψα (x, t) HD αβ (x) ψβ (x, t) d 3x , (8.157)
wobei HD αβ (x) als Differentialopertor aufzufassen ist, der auf die Ortsabhängigkeit in ψβ (x, t) einwirkt. Nach Abschn. 7.5.4 ist die durch (7.133) gegebene Ladung Q eine
8.4 Quantisierung des freien Dirac-Feldes
237
Erhaltungsgröße der klassischen Feldtheorie. Ihr ist der Ladungsoperator Q q ψ ψ d 3x zugeordnet. Dem Impuls (7.100) des Dirac-Feldes ist der Impulsoperator h p ψ ψ d 3x i zugeordnet.
8.4.1 Bewegungsgleichung für den Feldoperator
(8.158)
(8.159)
x t
Aus (8.10) folgt mit (8.157) für ψ σ (x, t) die Bewegungsgleichung ψ σ (x, t), ψ α (x , t) H D αβ (x ) ψ β (x , t) d 3x . i h ∂t ψσ (x, t) ψσ (x, t), H α,β
Wenn die Art der Vertauschungsrelationen zwischen Spinoren offengelassen wird, folgt hieraus mit
ϕ, χ ψ
ϕ χ ψ
χ ψ ϕ
ϕ χ ψ
χ ϕ ψ χ ϕ ψ χ ψ ϕ ϕ, χ ψ χ ϕ, ψ
die Beziehung i h ∂t ψ σ (x, t)
α,β
α,β
ψ σ (x, t), ψ α (x , t)
H D αβ (x ) ψ β (x , t) d 3x
ψ α (x , t) H D αβ (x ) ψ σ (x, t), ψ β (x , t) d 3x .
Der zweite Term der rechten Seite verschwindet für beide Arten von Vertauschungsrelationen, und mit (8.156d) oder der entsprechenden Vertauschungsrelation mit dem Minus-Kommutator ergibt sich δσ α δ 3 (x x ) H D αβ (x ) ψ β (x , t) d 3x i h ∂t ψσ (x, t) H D σβ (x) ψ β (x, t) α,β
bzw. in Spinornotation
β
i h ∂t ψ
H D (x) ψ .
t) also Unabhängig von der Art der Vertauschungsrelationen erfüllt der Operator ψ(x, wie das Spinorfeld ψ(x, t) die Dirac-Gleichung, in invarianter Schreibweise h α γ ∂α ψ m 0 cψ i
0.
(8.160)
238
8 Kanonische Feldquantisierung
8.4.2 Entwicklung nach ebenen Wellen Die physikalischen Konsequenzen der Feldquantisierung lassen sich am besten durch die Entwicklung von ψ und ψ nach Erzeugungs- und Vernichtungsoperatoren erkennen. Wie in Abschn. 2.4 entwickeln wir nach ebenen Wellen, wobei wir für eine Einzelwelle zunächst analog zu (2.69) mit k μ p μ /h U e
ψ
i p x/h
ansetzen. Wird dies in die Bewegungsgleichung (8.160) eingesetzt, so ergibt sich für U die Gleichung (γ α pα m 0 c) U (/ p m 0 c) U 0. (8.161) Die Lösbarkeitsbedingung für diese Gleichung (Verschwinden der Determinante) liefert wie in Abschn. 2.4 die Dispersionsrelation (2.78), p0 c Ep mit Ep c (m 0 c)2 p2 > 0 , (8.162) E die mit p p p α pα Ep2 /c2 p2 auch in der Form p p
m 02 c2
(8.163)
geschrieben werden kann. Statt für p0 E/c positive und negative Werte zuzulassen, beschränken wir p0 ähnlich wie k 0 im Fall des Maxwell-Feldes auf positive Werte und betrachten zum Ausgleich die Wellen U ()( p) e
ψ () ψ (
U ( )( p) e
)
i p x/h i p x/h
U ()( p) e( U ( )( p) e
i Ep t i px)/h (i Ep t i px)/h
, ,
wobei ψ () für Wellen positiver und ψ ( ) für Wellen negativer Energie steht. Dies hat zur Folge, daß (8.161) durch die Gleichungen (/ p m 0 c) U ()
0,
(/ p m 0 c) U (
)
0
(8.164)
ersetzt werden muß. Aus (8.164) ergeben sich analog zu Abschn. 2.4 für U ()( p) und U ( )( p) je zwei Lösungen. Die vier Wellenlösungen, die damit zu jeder Ausbreitungsrichtung p gehören, können in der Form U l p mit
1 (2π h )3/2
ψl p (x, t) a (l, p) ,
m 0 c2 u(l, p) e Ep
εl i p x/h
l
1, . . . , 4 *
(8.165)
1, 2 3, 4 (8.166) geschrieben werden, wobei pα Ep /c, p für alle l gilt und der Spinor-Charakter von U l p in ψl p bzw. u(l, p) enthalten ist, während es sich bei den a (l, p) um vier einkomponentige Operatoren handelt. ψl p ist für l 1, 2 eine (Spinor-)Welle positiver und für ψl p (x, t)
,
εl
1
1
für für
l l
8.4 Quantisierung des freien Dirac-Feldes
239
l 3, 4 eine Welle negativer Energie. Einsetzen von (8.165)–(8.166) in (8.164) liefert für die Spinoren u(l, p) die Bestimmungsgleichungen p/ m 0 c u(l, p) p/ m 0 c u(l, p)
0 0
für für
1, 2 , 3, 4 .
l l
(8.167)
Da diese mit Gleichung (2.72) identisch und ihre Lösungen nur bis auf einen freien Faktor festgelegt sind, können die letzteren so gewählt werden, daß sie statt (2.83) (mit λμ) die Orthonormierungsbedingung Ep δl l l , εl p u (l, εl p) m 0 c2
u
¼
(8.168)
¼
erfüllen. (Der Grund für die unterschiedliche Normierung ist, daß bei den Rechnungen des Abschnitts 2.4 die nicht Lorentz-invariante Größe u u möglichst einfach sein sollte, während jetzt ein möglichst einfacher Ausdruck für die Lorentz-invariante Größe uu angestrebt wird.) Dabei ist zu beachten, daß sich die Bedingungen (2.83) auf denselben Impuls p beziehen, während p hier mit εl bzw. εl multipliziert ist. Der Grund dafür findet sich in dem folgenden Beweis. ¼
Beweis: Zwischen den Lösungen (2.84) aus Abschn. 2.4 und den Lösungen (8.166) besteht die Zuordnung ()
Ui
ei (E
()
Ui
( ) t p x)/h
() (i Ep t i px)/h e
() t p x)/h i (E
e
Ui
() ( i Ep t i px)/h
Ui
e
ψl p (x, t)
für l
1, 2 ,
ψl p (x, t)
für l
3, 4 .
Der Vergleich zeigt, daß für l 3, 4 in (2.83) p durch p ersetzt werden muß. Auf diese Weise kommt bis auf den frei wählbaren Faktor (8.168) zustande.
Aus Gleichung (8.166) folgt ψl p (x, t) ψl p (x, t) d 3x
m 0 c2 u (l , p ) u(l, p) ei (εl Ep εl Ep ) t /h Ep Ep 2
mE0 cE u
(l , p ) u(l, p) ei (εl Ep εl Ep ) t /h δ 3 (εl p
ei (εl p εl p)x/h 3 dx (2π h )3 εl p) .
p p
Wegen der δ 3 -Funktion ist die rechte Seite nur für εl p εl p oder p εl εl p von null verschieden, außerdem gilt nach (8.162) Ep Ep für p p, weshalb wir auch ψl p (x, t)ψl p (x, t) d 3x
mE0c p
2
u (l , εl εl p) u(l, p) ei (εl Ep εl Ep ) t /h δ 3( p
εl εl p)
schreiben können. Die Orthonormalitätsrelationen (8.168) gelten für beliebige Vektoren p. Insbesondere dürfen wir in ihnen auch pεl p mit der Folge εl p p setzen,
240
8 Kanonische Feldquantisierung
womit sie in u
l , εl εl p u l, p ¼
¼
¼
ψlp (x, t) ψl p (x, t) d 3x ¼
δl l
¼
(8.169)
¼
εl εl p)δl l δ 3 ( p
übergehen. Hiermit und mit δl l δ 3 ( p aus dem letzten Ergebnis schließlich
¼
Ep δl l m 0 c2
¼
δ3 ( p
εl2 p)δl l δ 3 ( p
p) wird
¼
p) .
(8.170)
Die Entwicklung der Operatoren ψ und ψ nach ebenen Wellen (8.165) lautet
t) ψ(x,
4
ψ (x, t)
a (l, p) ψl p (x, t) d 3p ,
4
l 1
a (l, p) ψlp (x, t) d 3 p .
l 1
(8.171)
Ihre Auflösung nach den Entwicklungskoeffizienten a (l, p) ergibt sich aus
t) d 3x ψl p (x, t) ψ(x,
4 l
(8.170)
und liefert mit (8.166) a (l, p) a (l, p)
¼
¼
p¼ (x, t) d
3
x d 3p
a (l , p ) δl l δ 3 ( p p ) d 3p ¼
a (l, p)
l ¼ 1
t) d 3x ψl p (x, t) ψ(x,
(x, t) ψl p (x, t) d 3x
a (l , p ) ψl p (x, t) ψl
1
4
ψ
m 0 c2 (2π h )3 Ep
m 0 c2 (2π h )3 Ep
t) eεl i px/h d 3x , u (l, p) ψ(x,
(8.172) ψ (x, t) u(l, p) e
εl i p x/h
d 3x .
Hieraus ergeben sich für die Operatoren a(l, p) mit (8.156) die Vertauschungsrelationen a(l, p), a (l , p ) δl l δ 3 ( p p ) , a (l, p), a (l , p ) a (l, p), a (l , p ) ¼
0.
(8.173)
Beweis: (8.172a) ψlp (x, t) ψ(x, t), ψ (x , t) ψl p (x , t) d 3x d 3x a(l, p), a (l , p ) ψlp (x, t) ψl p (x , t) ψα (x, t), ψβ(x , t) d 3x d 3x ¼
αβ
α
¼
¼
β
¼
8.4 Quantisierung des freien Dirac-Feldes (8.156c)
ψl p (x, t)
αβ
α
(8.170)
ψlp (x, t)
δl l δ 3 ( p
241
ψl p (x , t) δαβ δ 3 (x x ) d 3x d 3x α β ¼
¼
ψl p (x, t) d 3x α α ¼
¼
ψlp (x, t) ψl p (x, t) d 3x ¼
¼
p)
¼
Die übrigen Beziehungen (8.173) beweist man analog.
Werden die Entwicklungen (8.171) in den Hamilton-Operator (8.157) eingesetzt, so ergibt sich zunächst 4
H
3
dx
d 3 p d 3 p a (l , p ) ψlp (x, t) a (l, p) H D ψl p (x, t) . ¼
¼
l,l ¼ 1
Da die ebenen Wellen ψl p (x, t) Lösungen der Dirac-Gleichung sind, erfüllen sie H D ψl p (x, t)
i h ∂t ψl p (x, t)
(8.166)
εl p0 c ψl p (x, t)
εl Ep ψl p (x, t) ,
und damit folgt weiterhin 4
H (8.170)
l,l ¼ 1 4
d 3 p d 3p a (l , p ) a (l, p) εl Ep
ψlp (x, t) ψl p (x, t) d 3x ¼
¼
d 3p d 3 p a (l , p ) a (l, p) εl Ep δl l δ 3 ( p p ) ¼
l,l
¼
1
4
a (l, p) a (l, p) εl Ep d 3 p
l 1
oder ausführlicher mit (8.166b) 4 3 2 4 H a (l, p) a (l, p) a (l, p) a (l, p) Ep d 3 p . l 1
l 3
Für den Ladungsoperator (8.158) ergibt sich analog (man muß dazu nur in der Rechnung für H den Differentialoperator H D bzw. später εl Ep durch 1 ersetzen) Q
4
a (l, p) a (l, p) d 3 p .
l 1
Jetzt kommen wir zur physikalischen Deutung. Für die Lösungen positiver Energie (l 1, 2) ergibt sich kein Problem, wir können n l ( p) (a)
a (l, p) a (l, p)
(8.174)
242
8 Kanonische Feldquantisierung
als Operator der Teilchenzahldichte im p-Raum auffassen und haben damit 2
H (a)
Q (a)
n l ( p) Ep d 3 p , (a)
q
l 1
2
n l ( p) d 3 p . (a)
(8.175)
l 1
wurden ohne Benutzung von VertauDie Ausdrücke für n l(a) ( p), H (a) und N (a) Q/q schungsrelationen abgeleitet und stimmen sowohl mit den bei der bosonischen Quantisierung der Schrödinger-Gleichung erhaltenen Beziehungen (8.28), (8.30) und (8.26) als auch den bei deren fermionischer Quantisierung erhaltenen Beziehungen (8.46), (8.53) und (8.47) überein. Es können dieselben Schlüsse wie dort gezogen werden, und in beiden Fällen erhält man physikalisch sinnvolle Ergebnisse. Dies bedeutet, daß bei den Lösungen positiver Energie sowohl die bosonische als auch die fermionische Quantisierung möglich wäre. Wenn man zum Ausdruck bringen will, daß es sich bei den durch (8.174)–(8.175) beschriebenen Teilchen um Elektronen handelt, muß man q e setzen. Für die Lösungen negativer Energie (l 3, 4) haben wir H (b)
4
Q (b)
a (l, p) a (l, p) Ep d 3p ,
q
l 3
4 l 3
a (l, p) a (l, p) d 3 p .
Würden wir a (l, p) für l 3, 4 als Erzeugungsoperatoren auffassen, so wäre die Energie unabhängig von der Art der Vertauschungsrelationen negativ, was unphysikalisch ist. Wenn wir jedoch b (l 2, p)
a (l, p)
für
l
3, 4
(8.176)
als Vernichtungsoperatoren und dementsprechend b (l 2, p) a (l, p) für l 3, 4 als Erzeugungsoperatoren auffassen, wird 2 2 H (b) b (l, p) b (l, p) Ep d 3p , Q (b) q b (l, p) b (l, p) d 3 p . l 1
l 1
Aus (8.173) und (8.176) folgen mit δl 2, l 2 δl l unter Berücksichtigung von a, a a , a für l 1, 2 die fermionischen Vertauschungsrelationen ¼
b (l, p), b (l , p ) , p ) b (l, p), b(l
¼
a (l 2, p), a (l 2, p ) b (l, p), b (l , p ) 0
δl l δ 3 ( p p ) ¼
(8.177)
sowie das Verschwinden sämtlicher Antikommutatoren zwischen a und b . Mit b (l, p) b (l, p) b (l, p) b (l, p)δ 3 (0) ergibt sich nach Abzug negativ unendlicher konstanter Beträge H (b)
2 l 1
n l(b) ( p) Ep d 3 p ,
Q (b)
q
2 l 1
n l(b) ( p) d 3p
(8.178)
8.4 Quantisierung des freien Dirac-Feldes
mit
243
b (l, p) b (l, p) .
(b)
n l ( p)
(8.179)
(Die Konsequenzen bosonischer Vertauschungsrelationen werden weiter unten besprochen.) Die Energie ist jetzt wie gefordert positiv. Da auch die Ladung das Vorzeichen gewechselt hat, kann es sich bei den durch die Operatoren b (l, p) erzeugten Teilchen allerdings nicht wie bei den durch a (l, p) erzeugten um Elektronen handeln, es sind vielmehr deren Antiteilchen, die Positronen. Damit die Ladung bei beiden Teilchensorten das richtige Vorzeichen hat, muß dabei sowohl für Elektronen als auch für Positronen q e (8.180) gesetzt werden. Die Erzeuger- und Vernichtereigenschaften von a (l, p) und b (l, p) bzw. a (l, p) 2 2 (a) 3 und b (l, p) sowie die Ganzzahligkeit der Eigenwerte von N (a) l 1 n l ( p) d p 2 2 (b) (b) 3 und N l 1 n l ( p) d p können wie in Abschn. 8.1.2 nachgewiesen werden. Dabei kann wieder ein Vakuumzustand 0 eingeführt werden, der durch a (l, p)0
0,
b (l, p)0
0a (l, p)
0,
0,
0b (l, p)
0
(8.181)
charakterisiert ist. Wären statt (8.156) bosonische Vertauschungsrelationen angesetzt worden, so p)δ3 (0) ergeben, und mit hätte sich statt (8.177a) b (l, p) b (l, p) b (l, p) b(l, (b) n l ( p) b (l, p) bl ( p) wäre 2 2 H (b) n l(b)( p) Ep d 3p Ep δ3 (0) d 3p , Q
l 1
(b)
2
n l ( p) d p
l 1
3
2
l 1
δ (0) d 3 p . 3
l 1
Nach Addition eines konstanten unendlichen Beitrags käme man selbst dann, wenn H durch 2 H (b) H0 n l ( p) Ep d 3p l 1
mit H0>0 definiert würde, durch hinreichend häufige Teilchenerzeugung auf jeden Fall zu negativen Energien. Da dies jedoch ausgeschlossen werden muß, kommen für das Dirac-Feld nur fermionische Vertauschungsrelationen in Frage. Da das Dirac-Feld Spin1/2-Teilchen beschreibt, ist hiermit das Spin-Statistik-Theorem von Abschn. Q9.2.6 auch für Elektronen und Positronen bewiesen. Das Elektronen und Positronen umfassende Gesamtergebnis für H H (a) H (b) und Q Q (a) Q (b) lautet mit (8.180) H
2 n l(a) ( p) n l(b) ( p) Ep d 3p , l 1
(8.182)
244
8 Kanonische Feldquantisierung
e
Q
2
(a) (b) n l ( p) n l ( p) d 3 p .
(8.183)
l 1
Für den Impulsoperator (8.159) ergibt sich durch Einsetzen der Entwicklungen (8.171) mit der Umbenennung (8.176) p
2 a (l, p) a (l, p) b (l, p) b (l, p) p d 3 p , l 1
wobei der Faktor p und der Vorzeichenunterschied der a und b -Terme durch die Ortsableitung von ei px /h zustandekommt. Durch Benutzung der Vertauschungsrelation (8.177a) wird dieses Ergebnis mit (8.174) und (8.179) in p
2 l 1
n l(a) ( p) n l(b) ( p)
p d 3p
(8.184)
2 überführt, wobei wieder δ 3 (0) p d 3 p 0 benutzt wurde. t) Abschließend wird noch angegeben, wie die Entwicklung des Feldoperators ψ(x, nach ebenen Wellen mit der Umdefinition (8.176) lautet. Aus (8.171a) mit (8.166) folgt zunächst 2 m 0 c2 i px/h a (l 2, p) u(l 2, p) ei px/h d 3 p. t) ψ(x, a (l, p) u(l, p) e (2π h )3 Ep l 1
Mit (8.176) bzw. b (l, p) a (l 2, p) und der Umbenennung v(l, p) u(l 2, p)
(8.185)
wird daraus
2
m 0 c2 i px/h b (l, p) v(l, p) ei px/h d 3 p , a (l, p) u(l, p) e (2π h )3 Ep l 1 (8.186) 2 2 m0c t) ψ(x, a (l, p) u(l, p) ei px/h b (l, p) v(l, p) ei px/h d 3 p , (2π h )3 Ep
t) ψ(x,
l 1
wobei (8.186b) eine unmittelbare Folge von (8.186a) ist. Die Bedeutung der in ψ und ψ stehenden Erzeugungs- und Vernichtungsoperatoren wurde in Anschluß an Gleichung (8.179b) angegeben und ist nochmals in Tabelle 8.1 zusammengefaßt.
Erzeuger Vernichter
Elektronen a (l, p) a (l, p)
Positronen b (l, p) b (l, p)
Tabelle 8.1: Bedeutung der Erzeuger und Vernichter in ψ und ψ.
8.4 Quantisierung des freien Dirac-Feldes
245
8.4.3 Eigenschaften der Spinoren u l p und l p Für spätere Zwecke erweist es sich als nützlich, im Raum der zu fest vorgegebenem Impuls p gehörigen vier Spinoren u(l, p) und v(l, p), l 1, 2, die Projektionsoperatoren p/ m 0 c 2m 0 c
Π
(8.187)
einzuführen. (Zwischen diesen und den in Abschn. 2.7 eingeführten Projektionsoperatoren Π besteht eine gewisse Verwandtschaft. Hier handelt es sich jedoch um Matrixoperatoren, während die Π Differentialoperatoren sind.) Die durch (8.187) eingeführten Matrizen Π erfüllen die Gleichungen Π
Π 1 ,
Π2
Π ,
Π Π
Π Π 0
(8.188)
und besitzen die Projektionseigenschaften
0, u(l, p) u(l, p) ,
Π u(l, p)
Π v(l, p)
Π
u(l, p)Π
v(l, p) , u(l, p) ,
v(l, p) , v(l, p) 0 .
v(l, p)Π
(8.189)
Π
(8.190)
Beweis: (8.188a) folgt direkt aus den Definitionen (8.187). (8.188b) und (c) folgen mit γ α γ β pα pβ
p/2
1 α β γ γ 2
γ β γ α pβ pα
(2.204) γ β γ α pα pβ g αβ pα pβ
p p (8.163) m 02 c2 Π Π p/4m 2mc02 c 0
gemäß und 2 Π
2 2
2
Π Π
0
2 2 2 p/ 2m 0 c p2/ 2 m 0 c 2m 0 c (p/2
4m 0 c
4m 0
m 0 c) c2
Π .
Die Gültigkeit der Beziehungen (8.189a) und (8.190c) folgt unmittelbar aus (8.167a) bzw. (8.167b) mit (8.185). (8.190a) folgt mit (8.188a) gemäß u(l, p) (Π
Π )u(l, p)
(8.189a)
Π u(l, p) ,
und hiermit folgt (8.190b) gemäß u(l, p)
u (l, p) γ 0
u (l, p)
u(l, p)
(8.187)
Π u(l, p)
γ0
u
(l, p) Π γ 0
γ α (γ 0 )2 pα (γ α ) γ 0 pα γ 0 m 0 c (2.202) u (l, p) γ 0 2m 0 c 2m 0 c
γ α pα m 0 c 2m 0 c
u(l, p) Π
(8.189b) und (c) werden genauso bewiesen.
m0c
.
246
8 Kanonische Feldquantisierung
Aus den Orthonormierungsbedingungen (8.169) wird mit der Umbenennung (8.185) Ep u l , p u l, p δl l , u l , p v l, p 0 2 m0c (8.191) Ep v l , p v l, p δl l . v l , p u l, p 0 , m 0 c2 ¼
¼
Alternativ gelten die mit u statt u etc. gebildeten Orthonormierungsbedingungen u l , p u l, p δl l , u l , p v l, p 0 (8.192) v l , p u l, p 0 , v l , p v l, p δl l . ¼
¼
Beweis: (8.192b) folgt mit (8.189b), (8.190b) und (8.188c) gemäß u(l , p) v(l, p)
u(l , p)Π Π v(l, p)
0,
und (8.192c) beweist man analog. (8.192a) beweisen wir zunächst für den Fall p 0. In diesem reduziert sich die Bestimmungsgleichung (8.167a) für u mit p/ γ α pα γ 0 p0 sowie p0 Ep p0 /cm 0 c und γ 0 β auf (βm 0 c m 0 c)u 0 bzw. (8.193) βu u und hat nach (2.80) die zwei Lösungen χl u(l, 0) , l 1, 2 0
χ1
mit
1 , 0
χ2
0 . 1
Dabei wurde der Normierungsfaktor N schon so gewählt, daß die in diesem Abschnitt gewählte Normierungsbedingung (8.169) bzw. (8.191a), die für p0 wegen Ep p0 m 0 c2 u (l , 0) u(l, 0) χl χl ¼
δll
(8.194)
¼
lautet, erfüllt ist. Für die angegebenen Lösungen gilt u(l , 0) u(l, 0) u (l , 0) γ 0 u(l, 0) u (l , 0) β u(l, 0)
(8.193)
u (l , 0) u(l, 0)
(8.194)
δll , ¼
also (8.192a). Analog beweist man für p0 auch die Gültigkeit von (8.192d), wobei die statt (8.193) gültige, aus (8.167b) folgende Beziehung βv v zu dem Minuszeichen vor δl l führt. Die Lösungen der – Lorentz-invarianten – Gleichungen (8.167a) und (8.167b) für p 0 könnenaus denen für p0 durch eine Lorentz-Transformation zu einem System der Geschwindigkeit Ú 1v 2 /c2 p/m 0 gewonnen werden. Bei dieser gehen die Spinoren u(l, 0) und v(l, 0) nach (2.180) in S(Ú )u(l, 0) bzw. S(Ú )v(l, 0) über. Da die Skalarprodukte uu und vv dabei nach (2.217) invariant sind, gelten (8.192a) und (8.192d) auch für beliebiges p 0. ¼
Nach (2.40) ist uu eine 44-Matrix, und dasselbe gilt für uu bzw. vv. Nach (8.192) gilt für die Summen dieser Matrizen 2 2 u(k, p) u(k, p) u(l, p) u(k, p) δkl k 1
k 1
u(l, p) ,
2 u(k, p) u(k, p)v(l, p) 0 k 1
Aufgaben
247
und 2
2
v(k, p) v(k, p) u(l, p) 0 ,
k 1
v(k, p) v(k, p)v(l, p)
v(l, p) ,
k 1
2 u(k, p) u(k, p) besitzt dieselben Projektionseigenschaften wie Π d. h. 2 k 1 k 1 v(k, p) v(k, p) dieselben wie Π (siehe (8.189)–(8.190)), was Π
2 k 1
u(k, p) u(k, p) u(l, p) 0 ,
Π
2 k 1
und
u(k, p) u(k, p) v(l, p) 0
und analoge Beziehungen für Π 2k 1 v(k, p) v(k, p) zur Folge hat. Da die vier Spinoren u(l, p) und v(l, p), l 1, 2 den Raum, auf den Projektionsoperatoren zu gegebenem Impuls p wirken können, voll aufspannen, folgt aus den zuletzt erhaltenen Gleichungen, daß die auf u(l, p) bzw. v(l, p) wirkende Matrix die Nullmatrix sein muß. Hiermit und mit (8.187) erhalten wir die später benötigten Beziehungen 2 p/ m 0 c u(k, p) u(k, p) , 2m 0 c k 1
2 p/ v(k, p) v(k, p) k 1
m 0c . 2m 0 c
(8.195)
Aufgaben 8.1 8.2 8.3 8.4
Zeigen Sie, daß n i im allgemeinen zeitabhängig ist. Wann gilt n i 0?
Zeigen Sie, daß im allgemeinen n (x, t), H 0 gilt. Beweisen Sie, daß N i n i auch für durch die Schrödinger-Gleichung beschriebene Fermionen zeitunabhängig ist. Beweisen Sie für Ni k
( a i N . . . , n i , . . . (
1) Ni δn i ,0 N 1 . . . , n i 1, . . .
1) Ni δn i ,1 N 1 . . . , n i 1, . . . .
8.5
Beweisen Sie weitere der Vertauschungsrelationen (8.78).
8.6
Beweisen Sie die Beziehungen (8.80)–(8.81), 1 p a p a p a p a p b p b p 2 Q q a pa p a p a p b pb p 2
b p b p
p d 3p ,
b p b p d 3 p .
248
8.7
8.8
8 Kanonische Feldquantisierung
Beweisen Sie die relativistischen Vertauschungsrelationen φ(x), φ(y) π (x), π(y) 0. Anleitung: Benutzen Sie die Entwicklungen (8.67) und die Vertauschungsrelationen (8.78). & Zeigen Sie, daß die bei Lorenz-Eichung gültige Zuordnung π α A α (μ0 c2 ) verträglich ist mit den Vertauschungsrelationen A α (x, t), A β (x ¼ , t) 0 und A α (x, t), π β (x ¼ , t) i h g αβ δ 3 (x x ¼ ) . Anleitung: Untersuchen Sie die Zeitableitung der zwei Vertauschungsrelationen.
8.9
Beweisen Sie explizit die Zeitunabhängigkeit der Operatoren b (λ)(k)
8.10
i g λλ μ0 c2 h ωk
Zeigen Sie, daß dem durch p
ε0
d 3x α A (x) i ωk A α (x) εα(λ) (k) ei k x . 2(2π)3
IR3
A 0 A 0
3
A l A l d 3x
l 1
definierten Impulsoperator in der Darstellung (8.121) der normalgeordnete Impulsoperator 3 k (0) p b (k) b (0) (k) b (λ) (k) b (λ)(k) d 3 k ωk λ1
zugeordnet ist.
Lösungen 8.6
Mit den Definitionen für A, B, C und D im Beweis gegen Ende von Abschn. 8.2.1 ist 1 p π φ π φ d 3x a p a p Ab p a p C a p b p B b p b p D 2m 0 c2 a p a p D a p b p C bp a p B bp b p A Ep p d 3p d 3p 1 3 a p a p a p a p b p b p b p b p p d p 2 12 (a p b p b p a p ) e2i Ep t /h (a p b p bp a p ) e2i Ep t /h p d 3p . ¼
¼
¼
Mit
b p a p p e2i Ep t /h d 3 p
p p
¼
¼
¼
¼
b p a p p e a p b p p e
¼
p t /h
2i E
d 3p
2i E p t /h d 3 p
und einer entsprechenden Umformung des Terms mit e2i Ep t /h folgt das Ergebnis für p .
Aufgaben
249
Q
q 2m 0 c2
a p a p A a p b p B b p a p C b p b p D a p a p Da p b p C b p a p B b p b p A Ep ¼
¼
¼
¼
¼
¼
¼
¼
¼
d 3p d 3p
q 3 a p a p a p a p b p b p b p b p d p 2 q2 (b p a p a p b p ) e2i Ep t /h (a p b p bp a p ) e2i Ept /h d 3p . Mit
b p a p e2i Ep t /h d 3 p
b p a p e2i E
p t /h
d 3p
a p b p e2i E Ep p t /h d 3 p
und einer entsprechenden Umformung des Terms mit e2i Ep t /h folgt das Ergebnis für Q. 8.8
Aus der ersten Vertauschungsrelation folgt durch Zeitableitung ∂t A α (x, t), A β (x , t) ∂t A α (x, t), A β (x , t) A α (x, t), ∂t A β (x , t)
0.
Mit A μ0 c2 π α folgt daraus nach Kürzen durch μ0 c2 und unter Benutzung der zweiten Vertauschungsrelation π α (x, t), A β (x , t) A α (x, t), π β (x , t) 0 A β (x , t), π α (x, t) A α (x, t), π β (x , t) α
i h gβα δ3 (x x) i h gαβ δ3 (x x ) . Aus der zweiten Vertauschungsrelation folgt durch Zeitableitung α (x, t), π β (x , t) A α (x, t), π β (x , t) 0 A (8.109b)
μ0 c2 π α (x, t), π β (x , t) μ1 A α (x, t), A α (x , t) μ1 A α (x, t), A α (x , t) 0
0
0.
9
Wechselwirkende Felder
Wir untersuchen in diesem Abschnitt die allgemeine Wechselwirkung von Feldern bzw. der durch diese beschriebenen Teilchen. Bei konkreten Anwendungen werden wir uns in diesem Teil des Buches auf Wechselwirkungen zwischen dem Dirac- und dem MaxwellFeld beschränken, die den Inhalt der im nächsten Kapitel behandelten Quantenelektrodynamik, kurz QED, bilden. Aus diesem Grund werden sich die meisten der in diesem Kapitel herangezogenen Beispiele auch schon auf diese Felder beziehen. In den die Maxwell-Gleichungen zusammenfassenden Gleichungen (7.61) beschreibt der Term μ0 j α , wie das durch Aα (x) repräsentierte elektromagnetische Feld von Ladungen und Strömen beeinflußt wird. Werden diese von Elektronen getragen, dann ist j α durch (7.82b) gegeben, wobei der die Ladungsträger beschreibende Spinor ψ(x) der Dirac-Gleichung (2.55) bzw. (2.173) genügen muß. Die Felder ψ(x) und Aα (x) können sich dann nicht mehr unabhängig voneinander entwickeln, sondern müssen gemeinsam das System der gekoppelten Differentialgleichungen h /ψ ∂/ ψ m 0 cψ q A i A α μ0 cqψγ α ψ
0,
0
(9.1)
erfüllen. Durch die Wechselwirkungsterme q A / ψ und μ0 cqψγ α ψ werden aus den linearen, ungekoppelten Gleichungen für freie Teilchen nichtlineare gekoppelte Gleichungen. Zur feldtheoretischen Behandlung der beiden gekoppelten Felder wird eine gemeinsame Lagrange-Dichte benötigt, aus der die Gleichungen (9.1) folgen. Aus den Lagrange-Dichten (7.62) und (7.80) läßt sich für die Form
D M W
mit
D
hc ψγ α ∂α ψ i
(9.2)
m 0 c2 ψψ ,
(9.3)
M 2μ1 (∂α Aβ )(∂ α Aβ ) , W cqψγ α ψ Aα (9.4) 0 erraten, wobei D die Lagrange-Dichte (7.73) des Dirac-Feldes für freie Spin-1/2Teilchen, M die aus (7.80) für j α 0 und ∂ β Aβ 0 hervorgehende Lagrange-Dichte des Maxwell-Feldes für freie Photonen und W der den beiden Dichten (7.80) und (7.62) gemeinsame Wechselwirkungsterm ist. Dieser tritt in allerdings nur einfach auf, so daß nicht durch Addition der Dichten (7.62) und (7.80) entsteht. Mit ∂ hc α ∂ γ ∂ ψ m c2 ψ cqγ α A ψ , 0 ∂ψ
i
α
0
α
∂ψ ,α
251
und
∂ ∂ Aβ
∂ ∂ Aβ,α
ψγ β ψ ,
1 α β ∂ A μ0
ergeben sich aus (7.18) bzw. ∂α
∂ , ∂ψ ∂ψ ∂
,α
∂α
∂ ∂A
∂ ∂ Aβ,α
β
die Lagrange-Gleichungen (9.1). Für die kanonischen Impulse erhalten wir π
∂∂ ih ψ ψ
,
π
∂ 0 ,
πβ
∂ψ
∂∂A β
1 Aβ μ0 c2
und damit für die Hamilton-Dichte
π ψ πβ A β mit D
m 0 c2 ψψ , 1 β A A M 2 β
i h c ψ γ l ∂l ψ
2μ0 c
D
W
M
W
W
(9.5)
cqψγ α ψ Aα ,
(9.6)
1 (∂l Aβ )(∂ lA β ) , 2μ0
(9.7)
wobei D die Hamilton-Dichte (7.76) des freien Dirac-Feldes und M die aus (7.68) mit (7.67b) für j β 0 erhaltene Hamilton-Dichte des freien Maxwell-Feldes ist. Die Wechselwirkung zweier Felder wie die durch das System (9.1) beschriebene Wechselwirkung von ψ und Aα ist naturgemäß nichtlinear. Umgekehrt lassen sich nichtlineare Terme in einer Feldgleichung als Wechselwirkungsterme deuten. Ein besonders einfaches Feld mit Nichtlinearitäten ist ein reelles skalares Feld, dessen LagrangeDichte in Anlehnung an (9.2) durch
2mh 0 gαβ (∂α φ)(∂β φ) 2
m 0 c2 2 φ 2
g 4 φ 4
(9.8)
gegeben ist und das als 4 -Feld bezeichnet wird. Hier führt der nichtlineare φ 4 -Term zu Selbstwechselwirkungsphänomenen. Dieses Feld wird gerne als Modellfeld benutzt, weil es besonders einfach ist und viele Effekte in besonders übersichtlicher Weise zu studieren erlaubt. Wir hatten gesehen, daß sich in der Quantentheorie freier Felder keine neuen Erkenntnisse gegenüber der gewöhnlichen Quantenmechanik von Systemen identischer Teilchen in der Fock-Darstellung ergeben. Anders wird die Situation bei der Quantisierung wechselwirkender Felder. Neue Quantenphänomene kommen hier durch die die Wechselwirkung beschreibenden Kopplungsterme zustande, im Fall der gekoppelten Dirac-Maxwell-Felder also durch W bzw. W . (Siehe dazu aber die Ausführungen in Abschn. 10.13, wo kritisch durchleuchtet wird, was durch die Quantenfeldtheorie gegenüber der gewöhnlichen Quantenmechanik hinzugewonnen wird.) Quantenphysikalisch beschreibt W die Wechselwirkung zwischen Elektronen und Photonen. Dabei handelt es sich um Teilchenbegegnungen mit Ablenkung, direkte Stöße haben
252
9 Wechselwirkende Felder
bei Punktteilchen die Wahrscheinlichkeit null, sind damit nach der Wahrscheinlichkeitstheorie aber nicht ausgeschlossen (siehe Thermodynamik und Statistik). Bei den Wechselwirkungen können auch neue Teilchen erzeugt oder vorhandene Teilchen vernichtet werden. Man interessiert sich hauptsächlich dafür, wie die Teilchenzustände, die vor dem Wechselwirkungsprozeß bestanden haben, durch diesen verändert werden. Für diesen auch als Streuung bezeichneten Prozeß berechnet man die Übergangswahrscheinlichkeit zwischen Zuständen vor und nach der Wechselwirkung. Wegen der Nichtlinearität der Wechselwirkung kann diese im allgemeinen nicht exakt berechnet werden – eine Ausnahme bilden einfache Spezialfälle. Man ist daher im allgemeinen auf Näherungsmethoden angewiesen, wie sie in der Quantenmechanik, Kap. Q8, behandelt wurden. Diese Methoden sind besonders erfolgreich, wenn der Hamiltonoperator gemäß H H 0 H 1 (9.9) in einen zeitunabhängigen Anteil H 0 , für den die Lösung des dynamischen Problems bekannt ist, und einen im allgemeinen zeitabhängigen Anteil H 1 zerlegt werden kann, dessen Amplitude gegenüber der von H 0 hinreichend klein ist. Das ist bei der Wechselwirkung der von uns ins Auge gefaßten Felder oft der Fall, wenn 3 H 0 H 1 ( D M ) d 3x , Wd x
gesetzt wird. H 0 ist der Hamilton-Operator für freie, entkoppelte Felder. In den Abschnitten 8.3.3 und 8.4.2 konnte H 0 sowohl für Dirac-Teilchen als auch Photonen nach Ebene-Welle-Lösungen entwickelt werden. Für die hier angetroffene Situation empfiehlt sich eine Störungsrechnung im Wechselwirkungsbild, bei dem die Zeitabhängigkeit der Operatoren dieselbe wie im Heisenberg-Bild des ungestörten Problems ist und durch H 0 bestimmt wird, während die – schwache – Zeitabhängigkeit der Zustände allein von dem die Wechselwirkung beschreibenden Störoperator H 1 festgelegt wird. Das Wechselwirkungsbild wurde ausführlich in Abschnitt Q8.4.2 der Quantenmechanik abgehandelt. Dem Leser wird empfohlen, diesen Abschnitt vor dem Weiterlesen zu rekapitulieren, außerdem den dazu vorausgesetzten Abschnitt Q6.2.5 über unitäre Transformationen sowie die Ausführungen in Abschnitt Q6.3.1 und Q6.3.6 zum Zeitverschiebungsoperator. Im folgenden Exkurs werden die wesentlichen Ergebnisse, die für das weitere benötigt werden, nochmals kurz zusammengefaßt.
Exkurs 9.1: Erinnerung an das Wechselwirkungsbild Das Wechselwirkungsbild entsteht durch eine unitäre Transformation aus dem Schrödinger-Bild. Unitäre Transformationen werden durch einen unitären Operator U (U ) 1 vermittelt, wobei die Zustände ψ und Operatoren L gemäß ψ U ψ ,
L
U LU
(9.10)
transformiert werden. Dabei bleiben folgende Größen invariant: Skalarprodukte, Eigenwerte, algebraische Operatorgleichungen und Operatoreigenschaften wie Hermitezität.
253
Ein spezieller unitärer Operator, der für den Übergang zum Wechselwirkungsbild benötigt wird, ist der Zeitverschiebungsoperator T (t, t0 ), der im Schrödingerbild die zeitliche Entwicklung der Zustände gemäß ψ, t S T (t, t0 ) ψ, t0 S (9.11) beschreibt und T (t0 , t0 )1 erfüllt. Aus der Schrödinger-Gleichung ih∂ t ψ, t S
H ψ, t S
(9.12)
ergibt sich mit (9.11) für T (t, t0 ) die Gleichung ih∂ t T (t, t0 ) H T (t, t0 ) ,
(9.13)
wobei H der Hamilton-Operator im Schrödinger-Bild ist. Bei Zeitunabhängigkeit des HamiltonOperators besitzt (9.13) zur Anfangsbedingung T (t0 , t0 )1 die Lösung T e iH (t t0 )/h .
(9.14)
Der Zusammenhang zwischen Schrödinger- und Heisenberg-Bild besteht in den Relationen ψ H
T 1 ψ, t S
LH
TLT
eiH (t t0 )/h ψ, t S
ψ, t0 ,
eiH (t t0)/h L eiH (t t0 )/h
(9.15) L H (t0 ) L(t0) .
(9.16)
Die Heisenberg-Operatoren L H erfüllen die Bewegungsgleichung d LH dt
∂ LH 1 . L , H ih H ∂t
(9.17)
Im Wechselwirkungsbild wird die Zerlegung (9.9) mit ∂t H 0 0 vorausgesetzt, und man benutzt den (unitären) Zeitverschiebungsoperator T 0 des ungestörten Problems zu einer vom Schrödinger-Bild ausgehenden unitären Transformation, ψ, t W LW
(T 0 ) ψ, t S (T 0 ) L T 0
e
0 eiH (t t0 )/h ψ, t S
iH 0 (t t
0 )/h L
e
ψ, t0 W
0 iH (t t
0 )/h
ψ, t0 S ,
L W (t0 ) L(t0 ) .
(9.18) (9.19)
0 ergibt sich aus (9.19a) Für den ungestörten Hamilton-Operator HW 0 HW
0 0 eiH (t t0 )/h H 0 eiH (t t0 )/h
H 0.
(9.20)
0 ψ, t eiH (t t0 )/h
ψ, t W in (9.12) eingesetzt, so ergibt sich mit der ZerWird (9.18a) bzw. S legung (9.9) und der Definition (9.19a) im Wechselwirkungsbild die Bewegungsgleichung ih∂ t ψ, t W
1 HW ψ, t W
mit
1 HW
0 0 eiH (t t0 )/h H 1 eiH (t t0 )/h .
(9.21)
Die entsprechende Bewegungsgleichung für Operatoren L W ergibt sich durch Zeitableitung von (9.19a) zu d LW dt
∂ LW 1 L , H 0 W ih ∂t
mit
∂ LW ∂t
T 0
∂L 0 T . ∂t
(9.22)
1 bestimmt (9.21) bedeutet, daß die Dynamik der Zustände ψ, t W nur vom Störungsoperator HW wird, die Bewegung der Operatoren L W gemäß (9.22) ist dagegen dieselbe wie die der Operatoren des ungestörten Problems im Heisenbergbild.
254
9 Wechselwirkende Felder
Wird die Lösung der Bewegungsgleichung (9.21a) für ψ, t W mit Hilfe eines Zeitverschiebungsoperators U (t, t0 ) dargestellt, ψ, t W
U (t, t0 ) ψ, t0 W ,
(9.23)
so ist dieser wie der Zeitverschiebungsoperator T (t, t0 ) des Schrödingerbildes unitär und erfüllt als Folge von (9.21) die Gleichung ∂U 1 H U . (9.24) ih W ∂t Aus U ψ, t0 W
ψ, t W
(9.18a)
T0
ψ, t S
(9.18b)
T 0 T ψ, t0 S
T 0 T ψ, t0 W
folgt der Zusammenhang T 0 T U bzw. T
T 0U
(9.25)
zwischen U und T . Unter Berücksichtigung der Anfangsbedingung U (t0 , t0 ) 1 kann die Differentialgleichung (9.24) in die Integralgleichung 1 t 1 H (τ )U (τ, t0 ) dτ (9.26) U (t, t0 ) 1 ih t0 W 1 (τ )λ H 1 (τ ) und Reihenentwicklung nach λ überführt werden. Durch Iteration oder mit HW W findet man für diese die Lösung U (t, t0 ) U n (t, t0 ) (9.27)
n 0
mit
τ2 t τn 1 1 (τ )H 1 (τ 1 dτ dτ ... dτ1 HW n n W n 1 )...HW (τ1 ) , n 1 n (ih) t0 t0 t0
U n (t, t0 )
(9.28)
und mit (9.27) ergibt sich aus (9.23) ψ, t W
U n (t, t0 ) ψ, t0 W .
n 0
Wir nehmen jetzt an, daß die Störung erst zur Zeit t 0 eingeschaltet wird und daß sich das System bis zu diesem Zeitpunkt in einem Eigenzustand m des Operators H 0 befunden hat, d. h. ψ, t S
0 m e iE m t /h
für
t
0
0 m . Die Wahrscheinlichkeit für einen Übergang vom Anfangszustand m in mit H 0 m E m einen anderen Eigenzustand n von H 0 ist
wmn
' 1' ' '2 ' '2 (9.14) '0 ' ' ' ' ' (9.25) ' ' iH 0 t /h ' '2 U 'm ' 'n ψ, t S ' 'n T ψ, 0S ' ' n 'e ' '2 '2 ' 0 ' i E n0 t /h ' ' ' n , U m ' 'e i E n t /h n U m ' , ' e
0 wegen e iEn t /h
' 0 '2 ' ' iH t /h n , U m ' ' e
1 also wmn
n U m 2 .
(9.29)
9.1 Zeitgeordnete Produkte
255
Bei den ins Auge gefaßten Streuprozessen soll die Übergangswahrscheinlichkeit wea zwischen Anfangs- und Endzuständen a bzw. e bestimmt werden, die wir später noch genauer festlegen werden. Dazu muß die Streumatrix Sea
e U a
(9.30)
(9.18b)
berechnet werden. Der Zustand, in den a ψ, 0S ψ, 0W durch die Wechselwirkung überführt wird, ist nach (9.23) a ¼ W U a . Wird dieser nach einem vollständigen System für die Messung geeigneter Endzustände e entwickelt, z. B. nach Eigenzustän0 den des Operators H 0 HW , so folgt mit a ¼ W e ee a ¼ W a ¼ W
ee U a ,
e
d. h. die Übergangsamplituden (9.30) sind die Entwicklungskoeffizienten des Zustands a ¼ W nach den Zuständen e. Aus W a ¼ a ¼ W 1 folgt
e¼ ee U a e¼ U a £
δee e U a e¼ U a £ ¼
e,e¼
e
e,e¼
e U a e U a £
Sea
2
1,
e
die Summe der Übergangswahrscheinlichkeiten vom Anfangszustand zu allen möglichen Endzuständen ist wie zu erwarten gleich eins. In (9.30) ist für U die Reihenentwicklung (9.27) einzusetzen ist. Bei der Auswertung der durch (9.28) gegebenen Terme U n (t, t0 ) bereitet die Berechnung der Vielfachintegrale allerdings wegen der variablen Integrationsgrenzen erhebliche mathematische Schwierigkeiten. Der nächste Abschnitt befaßt sich mit deren Behebung.
9.1
Zeitgeordnete Produkte
Nach einer Idee von F. Dyson können die in (9.28) auftretenden Integrale mit variablen oberen Integrationsgrenzen, über die im jeweils davor stehenden Integral integriert wird, alle in Integrale über dasselbe feste Intervall t0 bis t umgewandelt werden, wenn 1 (τ ) in geeigneter Weise umgeordnet wird. Um das zu das Produkt der Operatoren HW i erkennen, betrachten wir zuerst den einfachen Fall des zweifachen Integrals I
t
τ2
dτ1 H (τ2 ) H (τ1) .
dτ2
t0
(9.31)
t0
Nach Abb. 9.1 wird in der τ1 , τ2 -Ebene über eine Dreiecksfläche integriert, wobei sich die Integration in dem zuerst auszuführenden Integral über τ1 von τ1 t0 bis zu der
256
9 Wechselwirkende Felder
τ2
τ1
τ2
t
t0 τ1 t0
Abb. 9.1: Integrationsgebiet des Integrals (9.31)(schattiert).
t
Geraden τ1 τ2 erstreckt. Man kann stattdessen auch zuerst über τ2 von τ2 τ1 bis τ2 t integrieren und anschließend über τ1 von t0 bis t, d.h. es gilt auch t t I dτ1 dτ2 H (τ2 )H (τ1 ) . t0
τ1
t0
τ2
Mit der Umbenennung τ1 τ2 wird daraus t t dτ2 dτ1 H (τ1 )H (τ2 ) . I
(9.32)
Durch Addition von (9.31) und (9.32) ergibt sich τ2
t t dτ2 dτ1 H (τ2 ) H (τ1 ) dτ1 H (τ1)H (τ2 ) . 2I t0
τ2
t0
Im ersten Integral ist τ2 τ1 , weil τ1 im Intervall t0 , τ2 liegt, im zweiten τ1 τ2 , weil τ2 die untere Grenze für τ1 bildet. In beiden Integralen steht also links der Term mit der größeren, rechts der mit der kleineren Zeit. Mit Hilfe eines mit T bezeichneten Zeitordnungsoperators1 definiert man nun als zeitgeordnetes Produkt oder Dyson-Produkt (1) p H (τα1 )H (τα2 ) . . . H (ταn ) (9.33) T H (τ1 )H (τ2 ) H (τn ) mit τα1
τα τα 2
n
,
wobei p die Anzahl der für die Zeitordnung benötigten Vertauschungen benachbarter Operatoren H (τi ) angibt und in (1) p das Pluszeichen gilt, wenn diese kommutieren, das Minuszeichen, wenn sie antikommutieren. Hiermit und aufgrund der Vertauschbarkeit von H (τ1) mit H (τ2 ) – der Faktor (1) p in der Definition des Dyson-Produkts wird erst später bei der Zerlegung der H (τi ) wichtig werden – kann I in der Form
τ2 t 1 t dτ2 dτ1 T H (τ1 )H (τ2) dτ1 T H (τ1 )H (τ2 ) I 2 t0 τ2 t0 t t 1 dτ2 dτ1 T H (τ1 )H (τ2) (9.34) 2 t0 t0 1 Der Zeitordnungsoperator wird leider mit dem gleichen Symbol wie der Zeitentwicklungsoperator bezeichnet und sollte nicht mit diesem verwechselt werden
9.1 Zeitgeordnete Produkte
257
geschrieben werden. Das gesetzte Ziel ist damit für zwei geschachtelte Integrale erreicht. Wir werden bei den Anwendungen nicht über den Störungsterm zweiter Ordnung mit zwei geschachtelten Integralen hinausgehen. Dennoch soll das Ergebnis auch für das allgemeine, in (9.28) auftretende Integral mit n Integrationen und einem Produkt aus n Operatoren angegeben werden. Es gilt t τn τ2 1 1 dτn dτn 1 dτ1 HW (τn ) HW (τ1 ) (9.35) t0 t0 t0 t t 1 1 1 dτ1 dτn T HW (τ1 ) HW (τn ) n t0 t0 t t 1 1 1 T dτ1 HW (τ1 ) dτn HW (τn ) . n t0 t0 Der Beweis kann mit Hilfe vollständiger Induktion geführt werden (Aufgabe 9.1). Wird (9.35) in (9.28) und (9.28) in (9.27) eingesetzt, so kann U in der Form i 2t 1 (τ ) s.u. dτ HW (9.36) U (t, t0 ) T e h t0 geschrieben werden. Die Bedeutung der Exponentialfunktion mit einem Operator als Argument liegt dabei in deren Reihenentwicklung, so daß (9.36) nur eine kompakte Schreibweise für diese darstellt. 1 In der Feldtheorie ist HW ein Feldoperator, 1 3 HW Wd x, und mit c dτ d 3x d 4x ¼ erhalten wir in diesem Fall i 2 U (t, t0 ) T e ch
Ç
W (x) d
4x
.
(9.37)
Bei der Berechnung der Matrixelemente (9.30) im Rahmen einer Quantenfeldtheorie werden der Anfangszustand a und der Endzustand e als Zustände dargestellt, die durch Einwirkung von Erzeugungsoperatoren freier Felder aus dem Vakuum hervorgehen. Wenn z.B. die Streuung zweier Teilchen betrachtet wird, denen vor der Wechselwirkung die Wellenzahlen k1 bzw. k2 und nach dieser die Wellenzahlen k1¼ bzw. k2¼ zugeordnet werden können, wenn also a a (k1 ) a (k2 ) 0 ,
e a (k1 ) a (k2 ) 0
(9.38)
gilt – inwieweit diese Annahme gerechtfertigt ist bzw. welche Näherungen mit ihr verbunden sind, wird in Abschn. 9.4 diskutiert –, erhält Sea die Form ' ' (k2 )'0 . Sea 0'a(k 1 ) a(k 2 ) U a (k1 ) a Werden die in bzw. U auftretenden Feldoperatoren nach den gleichen Erzeugern und Vernichtern wie die freien Felder bzw. die Feldoperatoren des Anfangs- und Endzustandes entwickelt, so besteht auch U aus einer Summe von Produkten der Erzeuger und
258
9 Wechselwirkende Felder
Vernichter a (k) bzw. a(k). Zur Berechnung von Sea geht man dann zweckmäßigerweise so vor, daß man in jedem Summanden von U durch Kommutation der Operatoren unter Berücksichtigung der Kommutationsreste alle Vernichtungsoperatoren nach rechts und alle Erzeugungsoperatoren nach links bringt, also U in Normalordnung überführt. Alle Terme, die auf diese Weise die Struktur a (k1 ) a (k2 )
a(k 2 ) a(k 1)
erhalten (also die zu den Zuständen a und e gehörigen Vernichter bzw. deren Adjungiertes enthalten), tragen zu Sea bei, da die weitere Vertauschung der Vernichter a(k 1) und a(k 2 ) mit den Erzeugern des Zustands a und die Vertauschung der nach links als Vernichter wirkenden Erzeuger a (k1 ) und a (k2 ) mit den Erzeugern des Zustands e einen nicht-verschwindenden Kommutator produziert, bevor die Vernichter auf den Vakuumzustand treffen und dann null ergeben. Bei allen anderen Termen können die Vernichter ohne Kommutationsrest bis zum Zustand 0 durchgeschoben werden, diese liefern daher keinen Beitrag zu Sea . Um nicht in jedem Einzelfall von Hand die Umordnung von der zeit- in die normalgeordnete Form durchführen zu müssen, wird im folgenden Abschnitt abgeleitet, welcher Zusammenhang zwischen zeit- und normalgeordneten Operatorprodukten besteht.
9.2
Wicksches Theorem
Im Wickschen Theorem wird das zeitgeordnete Produkt von Operatoren durch normalgeordnete Produkte ausgedrückt, da diese rechnerisch einfacher zu handhaben sind. Wir leiten diesen Zusammenhang zuerst für das Produkt zweier Feldoperatoren A und B ab, die vom Ort und von der Zeit abhängen können, in relativistischer Kurznotation also A A(x) und B B(x ). Zur Erinnerung wird für diesen Fall nochmals die Definition des zeitgeordneten Produkts angegeben, es gilt * A B für t A > t B T A B (9.39) εBF B A für t B > t A und
T B A
*
B A εBF A B
für für
tB > t A t A > tB ,
wobei t A die zu A(x) gehörige Zeit angibt etc. und * 1 für bosonische Kommutation εBF für fermionische Kommutation 1
(9.40)
(9.41)
2 1 unmittelbar gesetzt wurde. Aus dem Vergleich von (9.39) und (9.40) folgt mit εBF ε T ( A B) BF T ( B A) .
(9.42)
9.2 Wicksches Theorem
259
(9.39) hat entweder oder
T ( A B) T ( A B)
s.u.
A B A A B B,
B (9.43)
A B A εBF B A benutzt.) zur Folge. (Dabei wurde A B B, zweier beliebiger Operatoren Zur Berechnung des normalgeordneten Produkts : A B: A und B zerlegen wir diese gemäß A
B
A () A () ,
B () B ()
(9.44)
in ihren Erzeugeranteil A () bzw. B () und ihren Vernichteranteil A () bzw. B () . (Die Bezeichnung knüpft an die in (2.100) mit (2.101) durchgeführte Zerlegung von Spinoren in Anteile zu positiver und negativer Energie an: Zu positiver Energie gehört bei der Zerlegung nach ebenen Wellen der Zeitfaktor ei Ep t /h , der beim Übergang zu Feldoperatoren in (8.186) mit den Vernichtungsoperatoren a (l, p) verbunden ist. A () meint daher einen zu positiver Energie gehörigen Vernichtungsoperator, A () einen zu negativer Energie gehörigen Erzeugungsoperator.) Mit (9.44) ergibt sich A B
: A B: und
: B A:
A () B () A () B () A () B () A () B () ,
A () B () εBF B () A () A () B () A () B () B () A () εBF A () B () B () A () B () A () εBF A () B () A () B () A () B () B () A () .
(9.45) (9.46)
(9.47)
Aus (9.45)–(9.46) folgt
: A B:
A B εBF B () A () A () B ()
A B B () , A ()
(9.48)
und aus (9.46)–(9.47) folgt
: A B:
. εBF : B A:
Die Beziehungen (9.43) und (9.48) haben * entweder : A B: T ( A B) oder
(9.49)
B (), A () A B (), A () B,
zur Folge. Weil der Kommutator oder Antikommutator freier Felder eine mit einer physikalischen Dimension multiplizierte (komplexe) Zahl ist, ist die als Kontraktion bezeichnete Größe : A B: A B T ( A B) (9.50) daher kein Operator, sondern eine Zahlengröße, woraus
0 A B 0
A B 00
A B
260
9 Wechselwirkende Felder
folgt. Da die Einwirkung des Vernichteranteils eines Operators auf den Vakuumzustand null liefert, ergibt sich für den Vakuumerwartungswert des normalgeordneten Produktes nach (9.46) wegen A ( ) 00, B ( ) 00 und 0 A ( ) 0 : A B: 0 0 . 0 : A B:
Aus Gleichung (9.50) folgt mit diesen beiden Ergebnissen A B
0 0 T ( A B)
(9.42)
εBF B A .
(9.51)
0 kann in konkreten Fällen berechnet werden (siehe Abschnitt 9.3) und wird 0 T ( A B) im weiteren als gegeben angesehen. Der am Ende des letzten Abschnitts gesuchte Zusammenhang zwischen zeit- und normalgeordneten Operatorprodukten ist für den Fall zweier Operatoren durch (9.50) bzw. B :A B: A T ( A B) (9.52)
gegeben. Seine Verallgemeinerung auf n-fache Produkte lautet T ( A 1 A 2 A 3 .. A n ) : A 1 A 2 A 3 .. A n : A .. A A .. A .. A : A 1 2 A 3 n: : A 1 2 A 3 n : .. : A 1 n : A 1 A 2 A 3 A 4 .. A n : .. : A 1 .. A n
: 1A n
: 3A n 2A n 1A n
(9.53)
................................................
und wird als Wicksche Theorem bezeichnet (Beweis folgt). In der zweiten Zeile enthält jeder Term eine Kontraktion von zwei Operatoren, wobei jede mögliche Kontraktion einmal vertreten ist; in der dritten Zeile treten in jedem Term zwei Kontraktionen auf, wobei sämtliche Paarkontraktionen vorkommen, usw. Normalprodukte mit Kontraktionen werden dabei als verallgemeinerte Normalprodukte bezeichnet. Bei Gültigkeit gewöhnlicher Kommutationsregeln (Minus-Kommutatoren) können die zu kontrahierenden Operatoren durch Vertauschen nebeneinander gebracht und aus dem normalgeordneten Produkt als Faktor herausgezogen werden, bei Antikommutationsregeln kommt bei jeder Permutation ein Minuszeichen ins Spiel, so daß z.B. : A 1 A 2 A 3 . . . A n
: 1A n
(1) p A 1 A 3 A n
:A ... 1A n 2 A 4
A n
2:
gilt. Beweis: Wir führen den Beweis des Wickschen Theorems zunächst unter der Annahme, daß die Operatoren in dem Produkt A 1 A 2 A 3 .. A n schon zeitgeordnet sind, d. h. t1 > t2 > t3 > . . . > tn .
(9.54)
9.2 Wicksches Theorem
261
Mit der Zerlegung (9.44) gilt dann T ( A 1 A 2 A 3 . . . A n )
A (1 ) A (2) A (2 ) . . . A n() A (n ) ( ) ( ) () ( ) () ( ) ( ) ( ) () A 1 A 2 . . . A n A 1 A 2 . . . A n A 1 A 2 . . . A n . . . A (1 ) A (2 ) . . . A (n ) . (9.55) A 1 A 2 A 3 . . . A n
A 1
( )
Einige Summanden auf der rechten Seite, z. B. der erste, zweite und letzte, sind normalgeordnet, andere jedoch nicht. Greifen wir einen der letzteren heraus. Diesen überführen wir in Normalordnung, indem wir von den noch nicht am richtigen Platz befindlichen Erzeugern der Reihe nach jeweils den am weitesten links stehenden unter Beachtung der Kommutationsregeln (Vertauschung oder Antivertauschung) so lange mit Vernichtern links von ihm vertauschen, bis alle ( ) Vernichter rechts von ihm stehen. Ist A l ein derart zu verschiebender Erzeuger, so steht links ()
von ihm ein Vernichter A k , und aufgrund der Voraussetzung (9.54) ergibt sich () ( ) () ( ) (9.52) () ( ) () ( ) s.u. ( ) () A k A l T A k A l : Ak Al : A k A l εBF A l A k A k A l , ( )
weil mit A l
0 und 0 A k
0
( )
0 '
(9.56)
0 0 '
' 1
' 1
() ( ) (9.51a) ' () ( ) ' (9.56a) ' () ( ) ' Al 0'T Ak Al 0' A k Al '0 '0
A k
0 ' ' 1 ' ( ) ( ) ( ) ( ) ' Al Al 0' A k A k '0
' 1 0 ' ' ' 0' A k A l '0
0 ' ' 1 ' ' 0'T A k A l '0
A k A l
gilt. Beim Durchschieben von A l nach links tritt daher bei jeder Vertauschung zum einen ein Vorzeichenfaktor εBF auf und zum anderen ein Term mit einer Kontraktion hinzu. Nachdem alle für die Normalordnung notwendigen Vertauschungen durchgeführt wurden, ist der herausgegriffene Summenterm in eine Summe von n-fachen Operatorprodukten mit keiner, einer, zwei usw. Kontraktionen überführt. Jedes von diesen ist dabei normalgeordnet und mit einem der Anzahl vorausgegangener Vertauschungen entsprechenden Produkt von Vorzeichenfaktoren versehen. Die Produkte der Vorzeichenfaktoren kann man loswerden, indem man die Operatoren nicht in der normalgeordneten, sondern der ursprünglichen Reihenfolge anschreibt und die Normal( ) ( ) ordnung durch die :-Symbole vorschreibt, indem man also z. B. wie in (9.56) : A k A l : statt ( )
( ) ( ) A k schreibt. Für drei Terme erhält man entsprechend z. B.
εBF A l
() () ( ) (9.56) ( ) ( ) ( ) A k Al εBF A j Al Ak
A j
A (j) A k A l ( ) ( ) () ( ) εBF εBF A l A j A j A l A k A j A k A l
( ) () () A j Ak
εBF A j A l A (k) A (j) A k A l ( ) ( ) ( ) ( ) ( ) : A j A k A l : : A j A k A l : : A j A k A l : . 2 A εBF l
Nachdem jeder Summenterm aus (9.55) derart umgeordnet wurde, ist T ( A 1 A 2 A 3 . . . A n ) in eine Summe von Termen überführt, von denen jeder in der rechten Seite von (9.53) enthalten ist. (Man denke sich auf dieser alle nicht kontrahierten Operatoren gemäß (9.44) zerlegt und alle Produkte ähnlich wie in (9.55) ausmultipliziert.)
262
9 Wechselwirkende Felder
Umgekehrt enthält die aus (9.55) durch die geschilderte Umordnung erhaltene Summe alle Terme der rechten Seite von (9.53): (9.55) enthält auf der rechten Seite 2n Terme. Jeder von diesen steuert entweder direkt oder nach dem Umordnen genau einen normalgeordneten Term ohne Kontraktion bei; alle auf diese Weise entstandenen Terme sind voneinander verschieden, weil sie durch reines Umordnen von Produkten entstehen, die sich paarweise in mindestens einem Faktor unterscheiden. Dies liefert gerade die 2n Terme von : A 1 A 2 A 3 . . . A n :. Die umgeordnete Summe enthält auch sämtliche verallgemeinerten Normalprodukte der rechten Seite von (9.53), denn in (9.55) bzw. A 1 . . . A n gibt es zu jeder dort angegebenen Kontraktion bzw. Kombination mehrfacher Kontraktionen einen Summanden mit den entsprechenden, nicht normalgeordneten Operatoranteilen, z. B. ( ) ( ) A2 A 3 . . . A n
zu
: A 1 A 2 A 3 . . . A n :
() ( ) () ( ) A2 A3 A4 A 5 . . . A n
zu
: A 1 A 2 A 3 A 4 A 5 . . . A n : .
A 1 oder
A 1
Die zu einer, zwei, drei etc. Kontraktionen gehörige Teilsumme enthält S1 K 1 (n)2n 2 , S2 K 2 (n)2n 4 , S3 K 3 (n)2n 6 etc. Summanden, wobei K 1 (n) n(n 1)/2 die Gesamtzahl der voneinander verschiedenen Einfachkontraktionen, K 2 (n) K 1 (n) K 1 (n 2) die der Zweifachund K 3 (n) K 1 (n) K 1 (n 2) K 1 (n 4) die der Dreifachkontraktionen ist etc. Jeder dieser Summanden führt nach dem geschilderten Umordnen u.a. zu einem normalgeordneten Term mit der angegebenen Zahl von Kontraktionen, und alle auf diese Weise erhaltenen Terme sind voneinander verschieden. Die nach dem Umordnen erhaltene Summe enthält daher alle S1 , S2 , S3 etc. Terme des normalgeordneten Produkts mit den entsprechenden ein, zwei, drei etc. Kontraktionen. Wenn eine Menge A in der Menge B enthalten ist und diese ihrerseits in A, muß A B gelten. Mit A T ( A 1 A 2 A 3 . . . A n ) und B rechte Seite von Gleichung (9.53) ist die letztere unter der Voraussetzung (9.54) bewiesen. Bei beliebiger Reihenfolge der Zeiten t1 , t2 , . . . , tn folgt mit (9.42) T ( A 1 A 2 A 3 . . . A n )
(εBF ) p P( A 1 A 2 A 3 . . . A n ) ,
(9.57)
wobei P( A 1 A 2 A 3 . . . A n ) die Permutation des Produktes A 1 A 2 A 3 . . . A n ist, welche die Faktoren in die zeitgeordnete Reihenfolge bringt und p die Anzahl der Zwei-OperatorenVertauschungen angibt, durch die diese herbeigeführt wurde. Aus (9.49) und (9.51) folgt für diese Permutation (εBF ) p :P( A 1 A 2 A 3 . . . A n ): (9.58) : A 1 A 2 A 3 . . . A n : : A 1 A 2 A 3 . . . A n : (εBF ) p :P( A 1 A 2 A 3 . . . A n ): (9.59) ...............
........................... ,
(9.60)
wobei p derselbe Exponent wie in (9.57) ist und (9.60) für die noch fehlenden verallgemeinerten Normalprodukte mit einer sowie alle mit mehr als einer Kontraktion steht. Außer im ersten Schritt von Gleichung (9.55) wurde die Zeitordnung der Operatoren an keiner weiteren Stelle des bisherigen Beweises benutzt. Daher gilt die Beziehung (9.53) bei beliebiger Zeitordnung der Operatoren, wenn man auf der linken Seite T ( A 1 A 2 A 3 . . . A n ) durch A 1 A 2 A 3 . . . A n ersetzt. Läßt man auf die derart erhaltene Gleichung den Permutationsoperator P einwirken, multipliziert sie anschließend mit (εBF ) p und benutzt dann (9.57)–(9.60), so folgt wieder Gleichung (9.53). (Dem Leser wird empfohlen, sich die einzelnen Schritte des Beweises nochmals am Fall n 3 klar zu machen, siehe Aufgabe 9.2.)
Wird in (9.53) über zwei miteinander vertauschbare Operatoren kontrahiert, dann verschwindet der zugehörige Summand, denn aus der Gültigkeit einer der beiden
9.2 Wicksches Theorem
263
Vertauschungsrelationen
A(x), B(y)
folgt
A(x) B(y)
s.u.
0,
(9.61)
0.
(9.62)
Für den gleich folgenden Beweis wird folgendes benötigt: Gilt für zwei Feldoperatoren ( ) (x) A () (x) und B(y) ( ) (y) B () (y) eine der beiden Vertauschungs A(x) A B relationen (9.61), so folgt daraus A ( ) (x), B ( )(y)
A ( )(x), B () (y) A ()(x), B () (y)
A () (x), B ( )(y) 0
(9.63)
und B(y) kön(entweder Plus- oder Minuskommutator), denn die Feldoperatoren A(x) nen beliebige Superpositionen von Erzeugern und Vernichtern des zugehörigen Feldes sein, und Gleichung (9.61) ist so zu verstehen, daß sie für jede dieser Superpositionen ( ) (x), B(y) ( ) (y) oder gilt, insbesondere also auch für die Spezialfälle A(x) A B ( ) B(y) B (y) etc. Beweis: Aus (9.43) folgt entweder T ( A B) A B
T ( A B)
A A B B,
(9.61)
A B
. . . oder
A ( ) B ( ) A ( ) B () A () B ( ) A () B () .
Hiermit und mit (9.46) ergibt sich aus (9.50) A B
A ( ) B () εBF B () A (
)
A (
)
, B ()
(9.63)
0.
Durch Zeitordnen wird ein Produkt, das schon zeitgeordnet ist, nicht mehr verändert, d. h. es gilt T T ( A B C . . .) T ( A B C . . .) und T ( A B)
0 0 T ( A B) 0 A . B T 0T ( A B)
Aus (9.52) folgt damit B A : A B:
B T T (A B) B:) B) T (: A B:) T ( A B) T (: A T (A A
: A B: . Aus (9.53) ergibt sich damit durch vollständige Induktion oder T (: A B:)
T : A 1 A 2 A 3 . . . A n : : A 1 A 2 A 3 . . . A n : .
(9.64)
Bei der Auswertung von Streumatrizen treten auch gemischte zeitgeordnete Produkte wie T (: A 1 A 2 A 3 : : A 4 A 5 A 6 :) mit t1 t2 t3 t4 t5 t6 auf. Werden diese nach dem im Beweis zum Wickschen Theorem angegebenen Schema umgeordnet, so kommt es zwischen den gleichzeitigen Operatoren wegen ihrer schon bestehenden Normalordnung zu keinen Vertauschungen und damit auch zu keinen Kontraktionen, ansonsten entstehen jedoch dieselben Terme wie beim Wickschen Theorem. Für gemischte
264
9 Wechselwirkende Felder
T -Produkte der beschriebenen Art gilt daher das Wicksche Theorem mit der Maßgabe, daß alle verallgemeinerten Normalprodukte mit Kontraktionen zwischen gleichzeitigen Operatoren, also Operatoren, die im gleichen normalgeordneten Teilprodukt stehen, entfallen.
9.3
Propagatoren
Ein einfaches Beispiel eines Ausdrucks der Form (9.51), das sich im weiteren Verlauf als fundamental erweisen wird, ist der mit dem Feldoperator φ(x) des Klein-Gordon Schrödinger-Feldes gebildete Erwartungswert 0 T (φ(x) φ (y))0. Nach (8.39) und (8.41) ist y, t y φ ( y, t y )0 ein Zustand mit einem durch das Feld φ beschriebenen Teilchen, das zur Zeit t y am Ort y lokalisiert ist. ' ' ' x, tx y, t y '2
' '2 ' 0φ(x, tx )φ ( y, t y )0'
ist daher nach (Q6.89) die Wahrscheinlichkeit dafür, ein durch das Feld φ(x) beschriebenes Teilchen, das sich zur Zeit t y am Ort y befand, zur Zeit tx am Ort x anzutreffen, bzw. dafür, daß es durch das Feld vom Punkt y der Raum-Zeit zum Punkt x „propagiert“ wurde (von engl. propagate im Sinne von transmittieren, übertragen). Die Größe F (x y)
' 1 1 '' φ (y) '0 φ(x) φ (y) 0 T φ(x) i i
(9.65)
wird daher als Propagator bzw. Feynman-Propagator bezeichnet. (Daß F nur von der Differenz x y abhängt, wird sich im nächsten Teilabschnitt zeigen.)
9.3.1 Feynman-Propagator des Klein-Gordon-Schrödinger-Feldes Im Fall eines komplexen Klein-Gordon-Schrödinger-Feldes erhält man durch Einsetzen der Entwicklungen (8.67) in die rechte Seite von Gleichung (9.65) ⎧ i p ¡(x y)/hÆ e d 3p ⎪ ⎪ m c ⎪ 0 ⎨ 3 Ep /c (2π h) s.u. i F (x y) i p ¡(x y)/hÆ ⎪ e d 3p ⎪ ⎪ ⎩ m0c 3 Ep /c (2π h)
für
x 0 >y0 (9.66)
für
x 0
Die beiden Ergebnisse können auch in die einheitliche Form i F (x y) m 0 c
Ep ' x y ' p¡(x y) i c ' 0h 0 ' i Æ e hÆ e
Ep /c
d 3p 3 (2π h)
gebracht werden. (Mit der Lagrange-Dichte (7.52) ergäbe sich ¼F F /(2m 0 ).)
(9.67)
9.3 Propagatoren
265
φ (y), und Einsetzen von (8.67) sowie Benutzung Beweis: Für x0 >y0 ist T φ(x) φ (y) φ(x) von b p 0 0 und 0b p ¼
φ 0φ(x)
(y)0
0 etc. liefert 0 ' ' 1 ' ' 3 3 0' a p u p (x)b p u p (x) a p u p (y)b p u p (y) '0 d p d p 0 ' ' 0' u p (x) u p (y) a p a p u p (x) u p (y) a p b p ¼
¼
¼
¼
¼
¼
¼
¼
u p (x) u p (y) bp a p u p (x)u p (y) bp b p ¼
¼
¼
¼
' 1 ' '0 d 3 p d 3 p
0 ' ' 1 ' ' d 3 p d 3 p 0' u p (x) u p (y) a p a p '0 ¼
¼
0 ' ' 1 (8.78a) ' 3 ' 3 3 0' u p (x) u p (y) a p a p δ ( p p ) '0 d p d p ¼
¼
u p (x) u p (y) 00 d 3 p
(6.6) (8.74)
m0c (2π h )3
ei p (x y)/h 3 d p. Ep /c
φ (y) φ (y)φ(x), und Einsetzen von (8.67) liefert analog Für y0 >x0 ist T φ(x)
0 0φ (y)φ(x)
m0c (2π h )3
u p (y) u p (x) d 3 p
ei p (x y)/h 3 d p. Ep /c
Für x0 >y0 folgt die Darstellung (9.67) aus (9.66a) mit
i p (x y) i (Ep /c)(x0 y0) i p (x y) i (Ep /c)x0 y0 i p (x y) , für x0
i (Ep /c)(x0 y0 ) i p (x y) '
'
Ep ' x 0 y0 ' i ' h ' i p(x y) h e e c
Ep /c
d 3p
p p
i (Ep /c)x0 y0i p (x y)
'
'
Ep ' x 0 y0 ' i ' h ' i p(x y) h e e c
Ep /c
d 3p .
Durch zusätzliche Integration über p0 längs einer Kontur, die sich in die komplexe Zahlenebene erstreckt, läßt sich das Ergebnis (9.67) in eine besonders nützliche Form bringen. Das wird in dem folgenden Exkurs zur Funktionentheorie vorbereitet.
Exkurs 9.2: Hilfsmittel aus der Funktionentheorie Wir betrachten zunächst das Integral I
1 2πi
ei αz dz (z a)(z a)
mit reellen Zahlen α und a>0 über eine Kontur in der Ebene der komplexen Zahlen z. Der Integrand besitzt zwei Pole an den Punkten z a und z a der reellen Achse und ist ansonsten
266
9 Wechselwirkende Felder
in der ganzen komplexen Zahlenebene regulär. Die Residuen des Integranden sind ⎧ e i αz e i αa ⎪ ⎪ ⎪ bei z a ⎨ z a 2a I ⎪ ⎪ e i αz e i αa ⎪ ⎩ bei z a , za 2a
(9.68)
wobei sich das zu ihrer Berechnung benutzte Integral über kleine Kreise vom Radius ρ 0 um die Polstellen herum mit der in Abb. 9.2 (a) eingezeichneten Integrationsrichtung erstreckt. Die Integrationskonturen können beliebig ausgeweitet und verschoben werden, sofern dabei keine Pole überschritten werden. Auf diese Weise kann erreicht werden, daß sich das Integral zur Berechnung des Residuums bei z a über die ganze x-Achse so von x bis x erstreckt, daß es um die Polstelle z a oben und die Polstelle z a unten herum führt und bei x durch um den Punkt z 0 in der unteren Halbebene der komplexen Zahlenebene einen Halbkreis geschlossen wird (Abb. 9.2 (b)). Für das Residuum bei z a wird die Integration längs desselben Wegs, aber von x bis x die x-Achse entlang geführt und durch einen Halbkreis um den Punkt z 0 in der oberen Halbebene geschlossen. zum Gesamtintegral I läßt sich leicht abschätzen. Für die Der Beitrag des Halbkreises Zerlegung z r ei ϕ r cos ϕ i r sin ϕ gilt auf dem Halbkreis r const und dz i r ei ϕ dϕ. Unter Benutzung von (z a)(z a)z 2 a 2 ergibt sich damit für r >a ' ' ' ' ' ' ' ' e i αz i r ei ϕ eαr sin ϕ e i αr cos ϕ r eαr sin ϕ ' ' ' ' dϕ ' dϕ dz ' ' ' ' ' (z a)(z a) ' ' r 2 e2i ϕ a 2 r 2 e2i ϕ a2 2 r 2 eαr sin ϕ dϕ 22πr 2 eαr sin ϕ , r a r a wobei ϕ ein Zwischenwert von ϕ auf ist. Wegen sin ϕ >0 für 0< ϕ < π (obere Halbebene) zu I für r gegen und sin ϕ < 0 für π< ϕ < 2π (untere Halbebene) geht der Beitrag von null, wenn der Halbkreis für α>0 in der unteren Halbebene und für α< 0 in der oberen Halbebene liegt. Das Gesamtintegral I für das Residuum bei z a reduziert sich daher für α>0 auf das Integral über den Weg in Abb. 9.2 (b) längs der x-Achse von x bis x ohne den Halbkreis und hat den Wert des Residuums. Wird bei gleicher Wegform von x bis x integriert, so wechselt bei unverändertem Absolutwert das Vorzeichen, und es gilt 1 2πi
ei αz dz (z a)(z a)
e 2a
i αa
ei αz dz (z a)(z a)
e2a
für
α > 0,
wobei den in Abb. 9.2 (c) dargestellten Weg längs der x-Achse von x bis x bezeichnet. Das Gesamtintegral I für das Residuum bei z a reduziert sich für α< 0 ebenfalls auf das Integral längs , und es gilt 1 2πi
i αa
für
Die beiden Ergebnisse können zu 1 2πi zusammengefaßt werden.
ei αz dz (z a)(z a)
i α a
e 2a
α < 0.
9.3 Propagatoren
267 y
y
z a
z a
z a
x
(a)
z a
x
(c) y
y
z a
z a
z a1
x
x z a2
(b)
(d)
Abb. 9.2: Integrationskonturen.
Nach (9.68) hängt der Wert von I stetig von der Lage der Pole ab. I ändert sich daher nur wenig, wenn wir diese etwas verschieben. Wird der Pol z a für ε> 0 nach z a2 a i ε/(2a) und der Pol z a nach z a1 a i ε/(2a) verschoben, und wird jetzt überall längs der x-Achse integriert (Abb. 9.2 (d)), so verläuft der Integrationsweg wie vorher unterhalb des linken und oberhalb des rechten Pols, und im Limes ε 0 erhält I denselben Wert wie oben. Hiermit, mit ε2 ε 0 (z a2 )(z a1 ) z a i ε/(2a) z a i ε/(2a) z 2 a 2 i ε 2 z 2 a 2 i ε 4a
und z x auf der x-Achse erhalten wir für das letzte Ergebnis schließlich die Form 1 e i αx e i αa d x mit ε > 0. lim 2a ε 0 2πi x 2 a2 i ε
(9.69)
Wir wollen jetzt das Ergebnis (9.69) auf Gleichung (9.67) anwenden, setzen dazu α(x 0 y0 )/h , a Ep /c , x p0 und erhalten Ep '' x 0 y0 '' i h e i αa e c 1 e i p0 (x0 y0 )/h (9.69) lim d p0 ε 0 2πi 2a 2Ep /c p02 Ep2 /c2 i ε
s.u.
ε
0
lim
1 2πi
ei p (x y )/h 0
p p
0
0
m 0 2 c2 i ε
d p0 ,
wobei zuletzt mit (8.62) die Umformung p02 Ep2 /c2 p02 p2 m 0 2 c2 p p m 0 2 c2 vorgenommen wurde. Für F (x y) ergibt sich hiermit 2m 0 c i F (x y) 3 2πi (2π h)
y)/h d p0 d 3p
e i p0 (x0 y0 )/h ei p (x p p m 0 2 c2 i ε
268
9 Wechselwirkende Felder
oder (mit (9.65))
φ (y) i F (x y) φ(x)
i 2h m 0c
s.u.
e p p
i p (x y)/h
d 4p . m 0 2 c2 i ε (2π h )4
(9.70)
Der Limes ε 0 ist dabei in der Notation wie üblich unterdrückt und muß hinzugedacht werden. Für F (x) können wir mit diesem Ergebnis die Gültigkeit der Gleichung e i px/h m 0 2 c2 m 0 2 c2 d 4p (x) lim 2 h m c F 0 2 2 2 2 ε 0 p p m 0 c i ε (2π h )4 h h 2 2 i p x/h d 4p 2h m 0c ( p p2 m 0 c ) 2e 2 (2π h )4 h ( p p m 0 c ) 4 2m 0 c h e i px/h (2πd hp)4 ableiten. Mit der Übertragung
ei px/h
d 4p (2π h )4
δ4 (x)
(9.71)
der für die dreidimensionale Deltafunktion gültigen Beziehung (8.71) auf vier Dimensionen erhalten wir dafür die Form m 0 2 c2 2m 0 c 4 F (x) (9.72) δ (x) . h h 2 Der Vergleich von (9.65) mit (8.90) oder (9.66) mit (8.91) zeigt, daß die Funktion F (x y) ähnlich wie die Pauli-Jordan-Funktion (x y) definiert ist. (x y) ist nach (8.97) eine Lösung der homogenen, F (x y) dagegen die Lösung der inhomogenen Klein-Gordon-Schrödinger-Gleichung (9.72). Bis auf einen konstanten Faktor ist F (x y) eine Greensche Funktion von dieser, denn G(x x )
h F (x y) 2m 0 c
erfüllt nach (9.72) die Gleichung m 0 2 c2 G(x x ) δ 4 (x x ) . h 2
(9.73)
(9.74)
Die Klein-Gordon-Schrödinger-Gleichung für ein komplexes Feld φ mit geladenen Teilchen, die mit einem durch Aα (x) beschriebenen elektromagnetischen Feld in Wechselwirkung stehen, ist nach (4.5) m 02 c2 1 α α α 2 α φ I φ, A mit I φ, A h q A ∂ φ q A A φ . 2 i α α h 2 h 2 (9.75)
9.3 Propagatoren
269
Mit Hilfe der Greenschen Funktion erhält man als “Lösung“ dieser Gleichung φ(x) G(x x ¼ )I φ(x ¼ ), Aα (x ¼ ) d 4x ¼ , denn es gilt m 0 2 c2 φ(x) h 2
(9.74)
m 0 2 c2
h 2
G(x x ¼ ) I φ(x ¼ ), A α (x ¼ ) d 4x ¼
δ 4 (x x ¼ ) I φ(x ¼ ), Aα (x ¼ ) d 4x ¼
I φ(x), Aα (x) .
Dies ist allerdings nur eine formale Lösung, weil die rechte Seite unter dem Integral die gesuchte Lösung φ(x) enthält, handelt es sich um eine Integralgleichung. Diese kann jedoch, wie im Exkurs 9.1 gezeigt, iterativ oder durch Reihenentwicklung gelöst werden, was viel einfacher ist, als die direkte Lösung der Differentialgleichung (9.75).
9.3.2 Feynman-Propagator des Dirac-Feldes In Analogie zu (9.65) wird der Feynman-Propagator des Dirac-Feldes mit Hilfe der Komponenten ψ α des Spinoroperators ψ als Matrix mit den Komponenten SF αβ (x y)
' 1 1 ' ψ α (x) ψ β (y) 0'T ψ α (x)ψ β (y) '0 i i
definiert. Wegen der fermionischen Vertauschungsrelationen gilt * ψ α (x)ψ β (y) für x 0 >y0 , T ψ α (x)ψ β (y) ψ β (y)ψ α (x) für x 0
(9.76)
(9.77)
Einsetzen der Entwicklungen (8.186) liefert für x 0 >y0 2
i SF αβ
2 0 ' ' 0' a (l, p) u α (l, p) ei px/h b (l, p) v α (l, p) ei px/h
m0c (2π h )3 l,l
¼
1
a (l , p ) uβ (l , p ) ei p y/h b(l , p ) v β (l , p ) ei p y/h ¼
¼
' 1 d 3 p d 3p ' '0 Ep Ep ¼
' 1 3 3 m 0 c2 0 '' (l , p ) u α (l, p) u β (l , p ) ei ( px p y)/h ''0 d p d p 0 a (l, p) a ' (2π h )3 Ep Ep l,l ' 1 d 3 p d 3 p 0 ' 2 (8.181) m 0 c ' ' 0' a (l, p), a (l , p ) u α (l, p)u β (l , p )ei ( p x p y)/h '0 (2π h )3 Ep Ep l,l 2 d 3p (8.173a) m 0 c '' (2π h )3 0 0 u α (l, p) u β (l, p) ei p(x y)/h Ep /c l 1 3 (8.195a) (2π1h )3 p/m 0 c αβ ei p(x y)/h 2Ed p/c . p
(8.181)
¼
¼
¼
¼
¼
¼
270
9 Wechselwirkende Felder
Mit i h ∂/ e
i p (x y)/h
i hγ α ∂α ei p (x y)/h
γ αpα ei p (x y)/h
kann dies schließlich in der Form i p (x y)/h e d 3p i SF αβ i h ∂/ m 0 c αβ 2Ep /c (2π h)3
für
p /e
i p (x y)/h
x 0 > y0
(9.78)
geschrieben Das im vorletzten Schritt der obigen Rechnung erzielte Ergebnis ' werden. kann mit 0'0 1 und (8.166) in die später benötigte Form i SF (x x )
2
ψl p (x, t) ψ l p (x , t ) d 3 p
für
t > t
(9.79)
l 1
gebracht werden. Für x 0
x 0 > y0 .
(9.80)
t < t .
(9.81)
Das (9.79) analoge Ergebnis lautet mit (8.185) i SF (x x )
4
ψl p (x, t) ψ l p (x , t ) d 3 p
für
l 3
Durch Einsetzen von (9.66) in (9.78) und (9.80) ergibt sich die einheitliche Darstellung i i h ∂/ m 0 c αβ F (x y) , i SF αβ (x y) (9.82) 2m 0 c durch welche der Propagator des Dirac-Feldes auf den des Klein-Gordon-SchrödingerFeldes zurückgeführt wird. (Wie nach (9.67) bemerkt wurde, würde bei Verwendung der Lagrange-Dichte (7.52) F F /(2m 0 ) gelten. Damit ergäbe sich statt der letzten Gleichung mit h 1 und c1 der Zusammenhang i SF αβ (i ∂/ m 0 )αβ F mit der Folge, daß SF und F verschiedene Dimensionen hätten.) Wird jetzt noch die Beziehung (9.70) benutzt, so ergibt sich aus (9.82) mit i hγ α ∂α ei p (x y)/h d 4p γ α pα ei p (x y)/h d 4p i h ∂/ F (x y) 2hm 0 c p p m 0 2 c2 i ε (2π h)4 p p m 0 2 c2 i ε (2π h)4
9.3 Propagatoren
271
für den Feynman-Propagator des Dirac-Feldes die vierdimensionale Darstellung
ψ (y) i i SF (x y) ψ(x) wobei die durch
SF ( p) e
i p (x y)/h
d 4p , (2π h )4
h (/ p m 0 c) p p m 0 2 c2 i ε
SF ( p)
(9.83)
(9.84)
mit ε>0 definierte Matrix SF ( p) (Komponenten SF αβ ) bis auf einen Faktor die FourierTransformierte der Matrix SF αβ (x) ist. SF (x)/h ist eine Greensche Funktion der DiracGleichung, sie erfüllt (Aufgabe 9.3) (i h ∂/ m 0 c) SF (x)/h
δ4 (x) .
(9.85)
9.3.3 Feynman-Propagator des Maxwell-Feldes Beim Maxwell-Feld ist der Feynman-Propagator durch ' 1 1 ' Aα (x) A β (y) 0'T A α (x) A β (y) '0 i i
DF αβ (x y)
(9.86)
definiert. Durch Einsetzen der Entwicklung (8.121) von A α (x) nach ebenen Wellen ergibt sich i DF αβ (x y) A α (x) A β (y) i
D F αβ (k) ei k (x y)
d 4k , (2π)4
(9.87)
wobei D F αβ (k) durch D F αβ (k)
h μ0 c gαβ , k k i ε
ε>0
(9.88)
gegeben und bis auf eine Faktor die Fourier-Transformierte von DF αβ (x) ist. Beweis: Für x0 >y0 ergibt sich mit T A α (x) A β (y) A α (x) A β (y) i DF αβ
3 0 ' h μ0 c2 ' (λ) (λ) (k, x) b (λ) (k)A (λ) (k, x) 0 b (k)A ' α α 2(2π)3 λ,λ¼ 0
b(λ ) (k )Aβ(λ ) (k , y) b(λ ) ¼
¼
¼
' 1 d 3 k d 3 k ' (k )Aβ(λ ) (k , y) '0 ωk ω k ¼
¼
272
9 Wechselwirkende Felder 3 0 ' ' 1 d 3 k d 3 k hμ0 c2 ' ' 0'b(λ) (k) b(λ ) (k )'0 A α(λ) (k, x)Aβ(λ ) (k , y) ωk ωk 2(2π)3 ¼
¼
¼
λ,λ¼ 0
(8.127c)
3 3 3 hμ0 c2 λλ δ 3 (k k )A (λ) (k, x)A (λ ) (k , y) d k d k 00 g α β ωk ω k 2(2π)3 ¼
¼
λ,λ¼ 0
¼
3 d3k hμ0 c2 g λλ Aα(λ) (k, x)Aβ(λ) (k, y) 3 ωk 2(2π)
λ 0 3 (8.120b) hμ0 c2 λλ (λ) g εα (k) εβ(λ) (k) (2π)3 λ 0 i k (x y) hμ0 c2 e (8.119) g d3 k αβ 3 2ω k (2π)
ei k (x y) 3 d k 2ω k
Analog ergibt sich für x0
i DF αβ
hμ0 c2 gαβ (2π)3
ei k (x y) 3 d k. 2ω k
Durch Vergleich von (9.66) und (9.70) folgt mit den Substitutionen phk, Ep hωk , pα hk α , der Umformung p pm 0 2 c2 p02 Ep2 /c2 h 2 (k02 ω2k /c2 ) sowie mit ε h 2 ε und der anschließenden Umbenennung ε ε der mathematische Zusammenhang ⎧ ⎪ ei k (x y) 3 ⎪ ⎪ d k ⎪ ⎨ i k (x y) 2ω k /c i e 4 d k ⎪ 2π k02 ω2k /c2 i ε ⎪ ei k (x y) 3 ⎪ ⎪ d k ⎩ 2ω k /c
für
x0 >y0
für
x0
Mit diesem ergibt sich für DF αβ die einheitliche Darstellung DF αβ
hμ0 c
gαβ
ei k (x y)
d 4k . k02 ω2k /c2 i ε (2π)4
Wird jetzt noch die für ebene Wellen des Maxwell-Feldes gültige Beziehung (8.123) bzw. ω2k /c2 k 2 sowie k k kα k α k02 k 2 benutzt, so ergibt sich schließlich (9.87).
Die Matrix
G αβ (x y)
DF αβ (x y) h μ0 c
(9.89)
ist eine Greensche Funktion der inhomogenen Maxwell-Gleichungen, sie erfüllt (Aufgabe 9.4) G αβ (x y) gαβ δ 4 (x y) .
(9.90)
9.4 Anwendung der Störungstheorie auf Streuprozesse
9.4
273
Anwendung der Störungstheorie auf Streuprozesse
Jetzt sind alle mathematischen Hilfsmittel bereitgestellt, um die ins Auge gefaßten Streuprozesse behandeln zu können. Aus physikalischer Sicht betrachten wir als Anfangszustand einen Zustand mit aufeinander zufliegenden Teilchen, die soweit voneinander entfernt sind, daß sie praktisch als wechselwirkungsfrei angesehen werden können. Wenn es sich um geladene Teilchen handelt, treten sie mit dem Vakuum in Wechselwirkung. Nach dem ursprünglichen Bild von Dirac ist dieses mit Elektronen und Positronen negativer Energie besetzt. Dieses Bild konnte zwar nicht aufrecht erhalten werden, dennoch kommt es auch in der Quantenelektrodynamik aufgrund von Vakuumfluktuationen zu Wechselwirkungen mit dem Vakuum, die sich allerdings als Prozesse höherer Ordnung herausstellen werden. Wir behandeln ein Modell, bei dem die Teilchen nur während einer endlichen Zeitspanne miteinander wechselwirken. Vor der Wechselwirkung können die Teilchen dann als freie Teilchen betrachtet werden. Nach der Wechselwirkung verlassen die die Wechselwirkung überlebenden sowie neue, bei der Wechselwirkung entstandene Teilchen das Wechselwirkungsgebiet (Abb. 9.3) und können dann ebenfalls als freie Teilchen aufgefaßt werden. Die Zustände ein- und auslaufender Teilchen sind dann Lösungszustände2 des freien Feldes, wie sie im vorigen Kapitel mit Hilfe des Hamilton-Operators 3 H 0 ( D M ) d x für freie Teilchen behandelt wurden, und können daher durch Einwirkung der dortigen Erzeugungsoperatoren a (l, p) und b (l, p) für Elektronen bzw. Positronen sowie b (λ) (k) für Photonen auf das Vakuum 0 dargestellt werden. Die Erzeuger a (l, p), b (l, p) und b (λ) (k) sind Ebene-Welle-Lösungen zugeordnet, und ebene Wellen sind räumlich sowie zeitlich unendlich ausgedehnt. Dies bedeutet, daß sie sich auch in das Innere des in Abb. 9.3 durch einen Kreis abgegrenzten Wechselwirkungsgebiets erstrecken, wo der Wechselwirkungsterm wirksam wird, die Teilchen also aufgrund ihrer Wechselwirkung nicht frei sind. Die Annahme von Anfangs- und Endzuständen der Form (9.38) ist also bei kritischer Betrachtung nicht mit der Annahme vereinbar, daß es sich um freie Teilchen handelt, es kommt zu einem Widerspruch. Zu dessen Beseitigung gibt es zwei Möglichkeiten. Die adäquate, aber wesentlich mühsamere bestünde darin, Anfangs- und Endzustände durch Wellenpakete endlicher Ausdehnung zu beschreiben, die aus Ebene-Welle-Lösungen für freie Teilchen superponiert sind. Da man jedoch deren viel einfachere Beschreibung durch ebene Wellen beibehalten möchte, hat man sich als Alternative das im folgenden benutzte Modell ausgedacht: Es wird angenommen, daß die Wechselwirkung auf ein Zeitintervall τ t τ beschränkt ist, zu dessen Beginn die Wechselwirkung sehr langsam ein- und gegen dessen Ende sie sehr langsam ausgeschaltet wird, eine Annahme, die als Adiabatizitätshypothese bezeichnet wird. (Diese entspricht der Tatsache, daß die Stärke der Wechselwirkung bei Annäherung der Teilchen zu- und bei deren Auseinanderlaufen wieder abnimmt.) Vor dem Ein- und nach dem Ausschalten der Wechselwirkung sind dann freie Teilchenzustände möglich. Das Ein- und Ausschalten der Wechselwirkungspotentiale muß sehr langsam erfolgen, weil diese sonst durch Ein- oder Ausschwingvorgängen zu Emissionsquellen oder Absorptionssenken für Energie werden. Es ist klar, daß die mit der Adiabatizitätshypothese erreichte Vereinfachung ihren Preis
274
9 Wechselwirkende Felder
auslaufende Teilchen
— Wechselwirkungsgebiet
Abb. 9.3: Streuprozeß mit Erzeugung eines Teilchens.
einlaufende Teilchen
hat: Die mit ihr erzielten Lösungen stellen eine Näherung dar. Dieser Preis ist jedoch gut zu verkraften, weil weitere Näherungen ohnehin unumgänglich sind. Wenn der Zustand des Systems wechselwirkender Teilchen durch ψ, t beschrieben wird, gilt nach der Adiabatizitätshypothese für hinreichend großes τ ψ, τ W
a ,
ψ, τ W
e ,
und nach (9.30) ist die Streumatrix für den Übergang a e Sea
e U (τ, τ ) a .
Es ist zweckmäßig, τ gehen zu lassen. Mit der Bezeichnung i 2½ 4 (9.37) S lim U (t, t0 ) T e ch ½ W (x) d x t0 t
(9.91)
haben wir dann die Streumatrix Sea
e S a .
Aufgaben 9.1
Beweisen Sie durch vollständige Induktion die Gültigkeit der Beziehung t τn τ2 1 1 dτn dτn 1 dτ1 HW (τn ) H W (τ1 ) t0
t0
t0
9.2
1 n
t
t
dτ1 t0
t0
1 1 dτn T HW (τ1 ) HW (τn ) .
Beweisen Sie das Wicksche Theorem für den Fall n 3, indem sie in ( ) ( ) ( ) ( ) ( ) ( ) A 1 A 2 A 3 A 1 A 1 A 2 A 2 A3 A 3
Aufgaben
275
explizit alle Summanden mit Hilfe der Beziehung ( )
εB F A l
( )
A k
()
( )
A k A l
A k A l
in Normalordnung überführen. 9.3
Beweisen Sie für die Matrix G(x) SF (x)/h die Gültigkeit der Gleichung (i h ∂/ m 0 c)G(x)
9.4
Beweisen Sie für die Matrix G αβ (x) D F αβ (x)/(h μ0 c) die Gültigkeit von G αβ (x)
9.5
δ 4 (x) .
gαβ δ 4 (x) .
Zeigen Sie: Die Proca-Gleichungen Aα (m 02 c2 /h 2 ) Aα μ0 j α 0 haben den Feynman-Propagator h 3 μ0 c gαβ . D F αβ ( p) p p m 20 c2 i ε
Lösungen 9.3
Im Limes ε
0 gilt
(i h ∂/ m 0 c) G(x)
(9.83)
(/ p
m c)(i h ∂/m c) e p p m c i ε 0
0 2 2 0
m c)( p/m c) e d p (2π h ) p p m c i ε ( pppp m mc c) e i ε (2πd hp) e
( p/
0
0 2 2 0
i p x/h
Im Limes ε
4
4
4
i p x/h
d 4p (9.71) 4 δ (x) . (2π h )4
0 gilt d k g k ke iε (2π) d k g kkkke i ε (2π) g
G αβ (x)
(9.87)
ik x
4
αβ
ik x
αβ
9.5
d 4p (2π h )4
4
2 2 i p x/h 0 2 2 0
9.4
i p x/h
4
4
αβ
4
d 4k e i k x (2π)4
g
4 αβ δ (x) .
DF αβ (x) muß in Analogie zu (9.89) mit (9.90) die Gleichung
h μ c g δ (x) erfüllen. Unter Benutzung von (9.71) und (9.87) mit k p/h ergibt sich daraus p p mh c D ( p) h μ c g e (2πd hp) 0 . DF αβ
(m
2 2 0 2
2 2 2 0 c /h ) DF αβ
F αβ
0
0
αβ
αβ
4
i p x/h
4
4
Aus dem Verschwinden der eckigen Klammer folgt die behauptete Beziehung.
10
Quantenelektrodynamik
Wir untersuchen in diesem Kapitel die Wechselwirkung von Teilchen, die durch das Dirac- und das Maxwell-Feld beschrieben werden, also die Wechselwirkung von Elektronen, Positronen und Photonen. Der (normalgeordnete) Hamilton-Operator für die Wechselwirkung von Elektronen und Photonen ist nach (9.6b) mit q e H W
α ψ A α : . ce:ψγ
(10.1)
Die Begründung für die Benutzung der Normalordnung ist dabei dieselbe wie in den Abschnitten 8.3.4 und 8.4.2. Nach Gleichung (9.16a) und (9.19a) sind die Operatoren im Wechselwirkungsbild die gleichen wie im Heisenberg-Bild des ungestörten Problems. 1 H 1 setzen und für ψ bzw. A α die OperatoIn Gleichung (9.36) können wir daher H W ren für freie Teilchen einsetzen, nach (8.186) und (8.121) also 2 3 m 0c23 a (l, p)u(l, p) e i px/h b (l, p)v(l, p) ei px/h d p , (10.2) ψ(x) (2π h ) Ep l 1 2 ψ(x) m 0c2 a (l, p) u(l, p) ei px/h b (l, p) v(l, p) e i px/h d 3p , (10.3) (2π h )3 Ep l 1 3 d3k h μ0 c2 A α (x) (10.4) εα (λ)(k) b (λ)(k) e i k x b (λ)(k) ei k x . 3 ωk 2(2π) λ0
Im folgenden wird es sich verschiedentlich als nützlich erweisen, wenn wir in Einklang mit der Adiabatizitätshypothese annehmen, daß die Wechselwirkung der Teilchen auf ein endliches Gebiet beschränkt ist. Nach Auswertung der Übergangsamplituden kann man dann immer noch die Ausdehnung des Gebiets gegen unendlich gehen lassen. Der Einfachheit halber nehmen wir an, das Wechselwirkungsgebiet sei ein Würfel der Kantenlänge L und der Ursprung des gewählten Koordinatensystems befinde sich und A α (x) außerhalb die ψ(x) im Zentrum des Würfels. Damit die Operatoren ψ(x), ses würfelförmigen Gebiets verschwinden, müssen alle Wellen, aus denen sie aufgebaut sind, am Rand des Würfels die Amplitude null besitzen. Dies hat zur Folge, daß nur eine diskrete Menge ebener Wellen möglich ist, für die mit ganzzahligem n pi L h
2πn
bzw.
ki L
2πn ,
i
1, 2, 3
(10.5)
gilt. Hieraus ergibt sich pi 2π h n/L 2π h /L bzw. ki 2π/L, und mit der Ersetzung d 3 pp x p y pz (2π h /L)3 gehen die Integrale auf den rechten Seiten der
277
Gleichungen (10.2)–(10.4) gemäß 2π h 3 3 d p... ... L p
3
d k...
bzw.
L
k
in Summen über. Werden außerdem die Umdefinitionen L 3/2 L 3/2 a (l, p) a l, p , b(l, p) b l, p , 2π h 2π h
2π 3
b (λ)(k)
L 2π
3/2 b (λ) k
vorgenommen, so ergeben sich aus (8.173a) und (8.177a) bzw. (8.127c) die Vertauschungsrelationen a l, p , al , p δl l δ p, p , b l, p , bl , p δl l δ p, p (10.6)
¼
¼
bzw.
b , b g δ ¼
(λ) k
¼
(λ¼ ) k¼
λλ¼
¼
¼
¼
¼
k,k ¼ ,
(10.7)
die übrigen Vertauschungsrelationen mit einer Null als Kommutationsrest übertragen sich analog. Beweis: Zur Ableitung z. B. von (8.173a) wurde (8.170) benutzt, und die hierin auftretende 2 δ 3 -Funktion stammt von dem Integral e i (εl p εl p)x/h d 3x. Bei endlichem Integrationsgebiet führt dieses im Endergebnis bis auf einen Faktor zu δ p, p statt δ 3 ( p p). Der Faktor kann aus der Bedingung 2 2 (8.173a) 1 δll a (l, p), a (l , p ) d 3 p δ 3 ( p p) d 3 p ¼
¼
¼
¼
l ¼ 1 2 l ¼ 1 p
l ¼ 1
2π h 3 L 3 a l, p , a l, p L 2π h ¼
¼
2 a l, p , a l, p
l ¼ 1 p
¼
¼
bestimmt werden, und der Faktor beim Übergang von a (l, p) zu a l, p wurde gerade so gewählt, daß diese erfüllt ist, aus (10.6a) folgt 2 a l, p , , al, p ¼
l ¼ 1 p
¼
2 l ¼ 1 p
δl l δ p, p ¼
¼
1.
Mit der angegebenen Ersetzung von Integralen durch Summen und Umdefinition von Operatoren sowie mit V L 3 wird aus (10.2)–(10.4) 2 m 0 c 2 1 ψ(x) a l, p u(l, p) e i px/h bl,p v(l, p) ei px/h , (10.8) V Ep l 1 p 2 m 0 c 2 1 ψ(x) a l, p u(l, p) ei px/h bl, p v(l, p) e i px/h , (10.9) V Ep l 1 p 3 h μ0 c2 1 (λ) (λ) (10.10) Aα (x) εα (λ)(k) b k e i k x b k ei k x . 2V ωk
λ 0 k
278
10 Quantenelektrodynamik
Für den in (9.91) definierten Streuoperator S ergibt sich mit (10.1) durch Reihenentwicklung ie 2 ½ α 4 S T e h ½ :ψγ ψ Aα : d x 1 S (1) S (2) . . . (10.11) mit α ψ(x) S(1) i e T :ψ(x)γ A α (x): d 4x , (10.12) 1 h 2 1)γ α ψ(x 2)γ β ψ(x S(2) e 2 T :ψ(x 1) A α (x1): :ψ(x 2 ) A β (x2): d 4x1 d 4x2.(10.13) 2 h Hierin sind die Entwicklungen (10.2)–(10.4) bzw. (10.8)–(10.10) einzusetzen. Mit den letzteren, c2 1/(ε0 μ0 ) und der von Sommerfeld eingeführten Feinstrukturkonstanten α e2 /(4πε0 h c) ergibt sich in grober Näherung α . e d 4x α ψ A α : d 4x α m 0c2 :ψγ h Ep V V ωk /c
Die Reihenentwicklung (10.11) ist mit S (n) α n/2 daher zugleich eine Entwicklung nach der kleinen Größe (α)1/2 1/12. Bei der Berechnung von Übergangsamplituden wird daraus in vielen Fällen effektiv sogar eine Entwicklung nach α 1/137, da sich nur in jeder zweiten Ordnung von null verschiedene Beiträge zu den Übergangsamplituden ergeben (Aufgabe 10.12). Das ist der Grund dafür, warum die Quantenelektrodynamik schon bei Berücksichtigung nur weniger der niedrigsten Entwicklungsordnungen Ergebnisse liefert, die in außergewöhnlich guter Übereinstimmung mit experimentellen Befunden stehen.
10.1 Alphabet der Feynman-Diagramme R. Feynman hat eine sehr einfache und anschauliche graphische Darstellung von Wechselwirkungsprozessen in Raum-Zeit-Diagrammen vorgeschlagen, mit der diese in übersichtlicher Weise geordnet und berechnet werden können. Die Grundelemente dieser Feynman-Diagramme, sozusagen ihr Alphabet, sind Linien für ein- und auslaufende sowie vorübergehend erzeugte und dann wieder vernichtete virtuelle Teilchen sowie Punkte, welche die Absorption und Emission von Teilchen charakterisieren. Aus den Feynman-Diagrammen kann mit Hilfe geeigneter Regeln, die in Abschn. 10.6 besprochen werden, sogar die zugehörige mathematische Formel für den Beitrag zur Streumatrix rekonstruiert werden. Ein Elektron wird in einem Ort/Zeit-Diagramm mit vertikaler Zeitachse durch eine nach oben laufende durchgezogene Linie mit Pfeil in positiver Zeitrichtung (Abb. 10.1 (a)), ein Positron der Feynman-Stückelberg-Interpretation entsprechend durch eine nach unten laufende durchgezogene Linie mit Pfeil in negativer Zeitrichtung (Abb. 10.1 (b)) dargestellt, – die Pfeile können als Richtungsangabe für den Ladungsfluß interpretiert werden. Ein Photon wird durch eine gewellte Linie (Abb. 10.1 (c)) repräsentiert; da das Photon sein eigenes Antiteilchen ist, unterbleibt die Angabe einer
10.1 Alphabet der Feynman-Diagramme
oder
oder
(a) Elektron
oder
279
oder
(b) Positron
oder
oder
(c) Photon
oder (d) externes Feld
(e) Vertex
(f) Kontraktion
Abb. 10.1: Grundelemente von Feynman-Diagrammen der QED. Die Elektron-, Positron- oder Photonlinien der oberen Reihe beginnen oder enden bei einem (nicht dargestellten) Vertex. Bei den in (f) dargestellten Kontraktionen sind die Vertizes, an denen die inneren Linien enden, nicht ausgefüllt. Dies soll sie als Anschlußelemente charakterisieren, die bei der in Abschn. 10.6.1 besprochenen Zuordnung mathematischer Ausdrücke zu den Elementen der Feynman-Diagramme nicht zu den Kontraktionen zählen, sondern separat berücksichtigt werden.
Zeitrichtung. Um die Diagramme fließender in den Text einbinden zu können, läßt man die Zeitachse häufig auch horizontal von links nach rechts laufen, was später zum Teil auch in diesem Buch geschehen wird. Ein statisches externes elektromagnetisches Feld wird bei vertikaler Zeitachse durch eine horizontale Photonlinie dargestellt, die in einem die Anschlußstelle an die Außenwelt symbolisierenden Kreuz endet (Abb. 10.1 (d)). Raumpunkte, an denen Teilchen erzeugt oder vernichtet werden, bezeichnet man als Vertizes (Plural von Vertex, engl. für Ecke, Spitze, Scheitelpunkt). Sie werden als Punkte dargestellt (Abb. 10.1 (e)). Kontraktionen treten nach (9.62) nur zwischen nicht-vertauschbaren Operatoren auf. Da Photonenoperatoren im Zustandsraum der Photonen und Fermionenoperatoren im Zustandsraum der Fermionen wirken, sind Photonen- und Fermionenoperatoren miteinander vertauschbar. Infolgedessen treten nur Fermion-Fermion- und PhotonPhoton-Kontraktionen auf. Im Zusammenhang mit Gleichung (9.65) wurde dargelegt, daß die Kontraktion ein Maß für die Wahrscheinlichkeit des Übergangs eines Teilchens von einem Punkt der Raum-Zeit zu einem anderen darstellt. In den FeynmanDiagrammen wird dafür eine etwas erweiterte Interpretation benutzt: Im Fall der Kon φ (y) 0 z. B. für T φ(x) φ (y) φ(x) φ (y), daß traktion (9.65) bedeutet 0 T φ(x) bei y die Erzeugung eines Teilchens stattfindet und anschließend bei x seine Vernichtung. Kontraktionen können daher als Übergänge aufgefaßt werden, bei denen Teilchen an einem Punkt der Raum-Zeit erzeugt und anschließend an einem anderen vernichtet werden. Eine Kontraktion wird dementsprechend durch zwei Vertizes dargestellt, die im Fall der Kontraktion von Fermionenoperatoren durch eine gerichtete Fermionlinie (Abb. 10.1 (f) oben) und im Fall der Kontraktion von Photonenoperatoren durch eine ungerichtete Photonlinie verbunden sind (Abb. 10.1 (f) unten). Linien, die nicht beidseitig durch Vertizes begrenzt sind, charakterisieren ein- oder auslaufende Teilchen und werden als äußere Linien bezeichnet. Linien, die beidseitig durch Vertizes begrenzt
280
10 Quantenelektrodynamik
sind, charakterisieren intermediäre Wechselwirkungsprozesse und werden als innere Linien bezeichnet. Da die bei den intermediären Prozessen auftretenden Teilchen nicht nach außen in Erscheinung treten, werden sie als virtuelle Teilchen bezeichnet. (Weitere Gründe für ihre Benennung werden in Abschn. 10.3.1 angegeben.) Wie die Elemente der Feynman-Diagramme zu Diagrammen zusammengesetzt werden und wie die letzteren zu interpretieren sind, wird in den folgenden Abschnitten anhand konkreter Wechselwirkungsprozesse erläutert.
10.2 Streuprozesse erster Ordnung 10.2.1 Streuprozesse freier Teilchen Da in den Operatoren, aus denen S (1) nach Gleichung (10.12) aufgebaut ist, nur eine Zeit auftaucht, kann der Zeitordnungsoperator T weggelassen werden. Mit der Zer ψ(x) und A α (x) in je einen Erzeuger- und Vernichteranteil legung (9.44) für ψ(x), ergibt sich h (1) S : ψ ( ) ψ ( ) γ α ψ () ψ ( ) A α() A α( ) : d 4x (10.14) ie ψ () γ α ψ () A (α):ψ () γ α ψ ( ) : A (α)ψ ( )γ α ψ () A (α)ψ ( )γ α ψ ( ) A (α) A α( )ψ ()γ α ψ () A (α ):ψ () γ α ψ ( ) : A (α )ψ ( ) γ α ψ () A (α )ψ ( )γ α ψ ( ) d 4x. Dabei wurde benutzt, daß der Operator A α mit den Operatoren ψ und ψ vertauscht. Bei der Untersuchung der Übergangsamplituden gibt es zwei Möglichkeiten: •
•
Man gibt den Anfangszustand a und den Endzustand e vor und berechnet die Übergangsamplitude. Dann besteht die Aufgabe darin, in S nach der Zerlegung mit Hilfe des Wickschen Theorems diejenigen Terme herauszusuchen, die nichtverschwindende Beiträge zu Sea liefern. Bei unglücklicher Wahl der Zustände a und e kann sich dabei Sea 0 ergeben. Dennoch besteht das physikalische Problem oft gerade darin, die Wahrscheinlichkeit vorgegebener Übergänge zu bestimmen. Man wählt die Zustände a und e so, daß sie zu S in dem Sinn passen, daß sich eine von null verschiedene Übergangsamplitude ergibt.
Um einen allgemeinen Überblick zu gewinnen, werden wir im folgenden den zweiten Weg beschreiten. Durch das Wicksche Theorem und die Entwicklung der Feldoperatoren nach Erzeugern und Vernichtern wird S in eine Summe von Termen zerlegt, welche die Struktur S(i)
fi e1e2 . . . em a 1a 2 . . . a n (10.15) mit Erzeugern ei , Vernichtern a i und einem Zahlenfaktor f i besitzen. Der Anfangszustand a und der Endzustand e sind Zustände, die aus dem Vakuumzustand 0 durch
10.2 Streuprozesse erster Ordnung
281
die Einwirkung von Erzeugungsoperatoren für die ein- bzw. auslaufenden Teilchen hervorgehen. Wählt man für sie a a n a n
so gilt
0 ,
e eem m
1 ...a 1
0 ,
1 . . . e1
(10.16)
a 1 a 2 . . . a n a a 1 a 2 . . . a n a n a n 1 . . . a 1 0 0 ,
weil a 1 a 2 . . . a n die Teilchen wieder vernichtet, die durch a n a n 1 . . . a 1 erzeugt wurden, analog gilt e1 e2 . . . em e 0, und es folgt a 1 a 2 . . . a n a fi e1 e2 . . . em e, a 1 a 2 . . . a n a Sea e S(i) a f i e e1 e2 . . . em (6.6) fi 0, 0 fi 0 0 fi . Sea ist also von null verschieden, wenn der Anfangszustand aus dem Vakuumzustand durch Einwirkung derjenigen Erzeuger hervorgeht, deren zugehörige Vernichter die in S enthaltenen Vernichter sind, wenn der Endzustand durch Einwirkung der in S enthaltenen Erzeuger aus dem Vakuum hervorgeht und wenn schließlich f i 0 gilt. In Elementen Sea 0 wirken also im Operator S enthaltene Vernichter auf den Anfangszustand und vernichten die einlaufenden Teilchen, während die in S enthaltenen Erzeuger so interpretiert werden können, daß sie die auslaufenden Teilchen erzeugen. Nach (8.42) erzeugt ein Erzeugungsoperator ψ (x, t) zur Zeit t ein Teilchen am Ort x, während ein Vernichtungsoperator ψ(x, t) ein dort befindliches Teilchen vernichtet. In Anwendung auf die Feldoperatoren A (α) (x, t) bedeutet dies die Erzeugung eines Photons durch A (α ) (x, t) und Vernichtung eines Photons durch A (α) (x, t) am Ort x zur Zeit t. Bei den Dirac-Operatoren ψ und ψ ist die Situation aufgrund der in (8.186) zu treffenden Zuordnung der Erzeuger und Vernichter zu verschiedenartigen Teilchen etwas komplizierter. Die Zerlegung (9.44) bedeutet gemäß den im Anschluß an ihre Einführung gegebenen Erläuterungen p x d 3 p s.u. px m 0 c2 m 0 c2 i ( ) ψ (x) b (l, p)v(l, p) e h bl, p v(l, p) ei h , 3 (2π h) V Ep Ep ()
ψ
(x)
ψ
( )
(x)
l, p
m 0 c2 a(l, p)u(l, p) e 3 (2π h)
ψ ( )(x)
c2
m0 3 (2π h)
i
a (l, p) u(l, p) ei
px h
px h
m 0 c2 b(l, p) v(l, p) e 3 (2π h)
i
p x h
d 3p Ep
s.u.
m 0 c2 a u(l, p) e V Ep l, p
px h
i
,
l, p
(10.17) 2 px m0c s.u. a l, p u(l, p) ei h , V E Ep p l, p d 3p
d 3p Ep
s.u.
m 0 c2 b v(l, p) e V Ep l, p
i
px h
,
l, p
wobei für jeden Operator zwei Ausdrücke angegeben sind, die alternativ gelten: der erste bei unendlichem und der zweite bei endlichem Wechselwirkungsvolumen. Aufgrund der in Tabelle 8.1 angegebenen Zuordnung ergibt sich hieraus die Erzeugung
282
10 Quantenelektrodynamik
Elektron Positron Photon
Erzeugung
Vernichtung
ψ ( ) (x, t)
ψ ( ) (x, t)
ψ () (x, t) ( ) A α (x, t)
ψ ( ) (x, t) ( ) A α (x, t)
Tabelle 10.1: Erzeugung bzw. Vernichtung eines Teilchens zur Zeit t am Ort x.
bzw. Vernichtung eines Elektrons durch ψ () bzw. ψ ( ) und die Erzeugung bzw. Vernichtung eines Positrons durch ψ () bzw. ψ ( ) . Die gefundenen Zuordnungen sind nochmals übersichtlich in Tabelle 10.1 zusammengestellt. Enthält ein Term von S keine Erzeuger, so kann der zugehörige Beitrag zu Sea nur für e0 ungleich null werden, der Endzustand ist dann der Vakuumzustand. Enthält ein Term von S dagegen keine Vernichter, so ist der Anfangszustand der Vakuumzustand. Im ersten Fall gibt es keine auslaufenden, im zweiten keine einlaufenden Teilchen. Betrachten wir als erstes den ersten Beitrag zu S (1) in (10.14), ie (1) S(a) ψ ( ) γ α ψ ( ) A (α ) d 4x . h (1) S(a) enthält nur Vernichter, und daher kann die zugehörige Übergangsamplitude nur (1)
dann von null verschieden sein, wenn e der Vakuumzustand ist. In S(a) vernichtet ( )
A α (x) bei x ein Quant des Maxwell-Feldes (in Abb. 10.2 als γ -Quant bezeichnet), ( ) ψ ( )(x) vernichtet ein Elektron und ψ ( ) (x) ein Positron. Der durch ψ ( ) γ α ψ ( ) A α (1) beschriebene Beitrag zu S(a) beschreibt also die gleichzeitige Vernichtung eines bei x einlaufenden Elektrons, Positrons und Photons, und da der Endzustand das Vakuum ist, gibt es keine auslaufenden Teilchen. Abb. 10.2 (a) enthält das zu diesem Prozeß gehörige Feynman-Diagramm. Im zweiten Beitrag zu S (1) , ie (1) S(b) :ψ ( ) γ α ψ () : A (α ) d 4x , h ( )
wird bei x durch A α (x) ein γ -Quant und durch ψ ( ) (x) ein Positron vernichtet, während der Erzeugungsoperator ψ ()(x) nach Tabelle 10.1 ein auslaufendes Positron erzeugt. Dieser im Diagramm (b) der Abb. 10.2 dargestellte Prozeß kann als Absorption eines Photons durch ein Positron interpretiert werden. Die übrigen sechs Beiträge zu S können in ähnlicher Weise diskutiert werden. Die zugehörigen Feynman-Diagramme sind (c)–(h) in Abb. 10.2, ihre Interpretation ist im Text zur Abbildung angegeben. Soweit wurde nur eine der Bedingungen für Sea 0 untersucht, nicht jedoch, ob auch der nach (10.15) dazugehörige numerische Faktor f i von null verschieden ist. Dieser Frage gilt die folgende Untersuchung. Zwei der acht in Abb. 10.2 dargestellten Prozesse müssen offensichtlich aus energetischen Gründen verboten sein, d. h. für sie muß fi 0 gelten, was bedeutet, daß ihre Wahrscheinlichkeit gleich null ist: In dem durch das Diagramm 10.2 (a) dargestellten
10.2 Streuprozesse erster Ordnung
283
e
(a) e
(b)
(c)
e γ
γ
e
e
(d)
e γ
e
(e)
γ
(f)
e
e
γ
e (g)
e
γ
e
( ) ( ) ( ) ψ ( ) γ α ψ ( ) A α :ψ ( ) γ α ψ ( ) : A α ψ ( ) γ α ψ () A α
γ
e
( ) ψ ( ) γ α ψ ( ) A α
e
γ
e
(h) e
( ) ( ) ( ) ( ) A α ψ () γ α ψ () A α :ψ () γ α ψ ( ): A α ψ ( ) γ α ψ () A α ψ ( ) γ α ψ ( )
Abb. 10.2: Feynman-Diagramme der Streuprozesse erster Ordnung, in der oberen Reihe unter Absorption und in der unteren unter Emission eines Photons. (a) Gegenseitige Vernichtung eines Elektrons, Positrons und Photons, (b) Absorption eines Photons durch ein Positron, (c) Absorption eines Photons durch ein Elektron, (d) Zerfall eines Photons in ein Elektron-Positron-Paar, (e) Elektron-Positron-Paarvernichtung unter Emission eines Photons, (f) Emission eines Photons durch ein Positron, (g) Emission eines Photons durch ein Elektron, (h) gemeinsame Entstehung eines Elektrons, Positrons und Photons.
Prozeß werden drei Teilchen vernichtet, ohne daß dabei ein neues Teilchen entsteht, welches deren Energie übernehmen könnte, und in dem durch das Diagramm 10.2 (h) dargestellten Prozeß entstehen drei Teilchen aus dem Nichts. Die Unmöglichkeit dieser Prozesse folgt natürlich auch aus der expliziten Berechnung der zugehörigen Übergangsamplitude. Wir werden diese Rechnung allerdings nicht für alle acht Prozesse durchführen, sondern nur exemplarisch für einen. Hierzu wählen wir den in Abb. 10.2 (d) dargestellten Prozeß der Paarerzeugung durch ein γ -Quant aus, dessen (Nicht-) Realisierbarkeit nicht offensichtlich ist. Sein Beitrag zu S (1) ist ie (1) S(d) ψ ( ) γ α ψ ( ) A α() d 4x . (10.18) h Die dazu passenden Zustände a und e für ein- und auslaufende Teilchen sind nach (10.15) sowie (8.137) und (10.17)
a b (λ)(k)0 ,
e a (l , p ) b(l , p )0 .
(10.19)
Hiermit ergibt sich für die Übergangsamplitude (1) S(d) ea
ihe
' ' 0' b (l , p ) a (l , p ) ψ ( )(x)γ α ψ ( )(x) A (α)(x) b (λ)(k) '0 d 4x
284
10 Quantenelektrodynamik (8.137) (10.17a,c)
i em 0 c3 μ0 (2π h )3 2(2π)3 h
γ
α
0 ' d 3p ' d x 0' a (l ¼ , p¼ ) a (l, p) u(l, p) ei px/h Ep l 4
d 3p b (l , p ) b (l, p)v(l, p) ei px/h Ep
l
Mit
λ
d 3 k '' 1 εα (λ )(k ) b (λ ) (k ) b (λ) (k) ei k x '0 . ωk
' 0'a (l , p ) a (l, p)
' 0' a (l , p ), a (l, p)
' 0'b (l , p ) b (l, p)
' 0' b (l , p ), b (l, p)
' b (λ ) (k )b (λ) (k)'0
b(λ ) (k ), b(λ)
£
£
und 00 1 wird daraus (1) S(d) ea p°x
s.u.
in (9.71)
ie
(8.173a)
' (k) '0
' δl l δ 3 ( p p) 0' , ¼
δl
' g λ λ δ 3 (k k)'0
(8.127c)
¼¼
h μ m c3u(l , p )γ α v(l , p ) gλλ ε (λ)(k) 0 0 α ei ( p 4π Ep Ep ωk ¼
l £
¼
p¼¼ h k) x/h
¼¼
i e m 0 c3 h μ0 u(l , p )γ α v(l , p ) g λλ εα (λ)(k) 4π Ep Ep ωk ¼
' δ 3 ( p p) 0' ,
(8.177a)
¼¼
δ 4 ( p p h k) ,
d 4x (2π h )4
(10.20)
wobei die für ein auslaufendes (reelles) Elektron gültige Umformung δ 3 ( p p) ei px/h
δ 3 ( p (8.162) 3 δ (p
p) ei (E p t p x)/h p) ei (E p
¼
δ 3 ( p t p x)/h δ 3 ( p ¼
p) ei (E p t p x)/h ¼
p) ei p x/h ¼
und entsprechende Umformungen für die anderen Teilchen benutzt wurden. Wegen der (1) δ 4 -Funktion wird S(d) ea nur für pα pα
bzw. Ep
¼
Ep h ωk , ¼¼
h k α
0
p p
h k
(10.21)
von null verschieden. Mit (8.114b) und (8.162b) folgt aus dem Quadrat der Gleichung (10.21a) 2m 20 c2 p 2 p 2 2 (m 20 c2 p 2 )(m 20 c2 p 2 ) h 2 k2 ,
und mit dem Quadrat von Gleichung (10.21b) wird daraus nach Division durch zwei m 20 c2 p p (1 m 20 c2 / p 2 )(1 m 20 c2 / p 2 )) p p cos ϑ , wobei ϑ der Winkel zwischen den Richtungen der Vektoren p und p ist. Offensichtlich ist die linke Seite größer als die rechte, was bedeutet, daß die Gleichungen
10.2 Streuprozesse erster Ordnung
285
(1) (10.21) nicht gleichzeitig erfüllt werden können. S(d) ea ist daher gleich null, der Prozeß der Paarerzeugung durch ein γ -Quant ist nicht möglich. Angemerkt sei, daß die Paarerzeugung durch ein zusätzliches externes Feld ermöglicht wird. Auch bei den übrigen Prozessen erster Ordnung führt die Auswertung der Übergangsamplitude zum Auftreten einer δ 4 -Funktion, die nur dann nicht verschwindet, wenn zwischen ein- und auslaufenden Teilchen Energie- und Impulserhaltung besteht, und die Erhaltungssätze können in keinem Fall gleichzeitig erfüllt werden. Dies bedeutet, daß alle in Abb. 10.2 aufgeführten Prozesse die Wahrscheinlichkeit null besitzen.
10.2.2 Elektronenstreuung an festem Kern Ein Prozeß erster Ordnung mit nicht-verschwindender Übergangswahrscheinlichkeit ist die durch das Feynman-Diagramm der Abb. 10.3 dargestellte und als Mott-Streuung bezeichnete Streuung eines Elektrons an einem Atomkern. Da der Kern viel schwerer als das Elektron ist, kann seine Position näherungsweise als fixiert aufgefaßt werden. Das von ihm erzeugte elektromagnetische Feld ist bei Vernachlässigung des durch seinen Spin hervorgerufenen Magnetfelds ein statisches elektrisches Feld, das in guter Näherung als klassisches externes Feld aufgefaßt werden darf. Der Wechselwirkungsterm ist auch hier durch Gleichung (10.1) gegeben, wobei nur der Operator A α (x) durch das klassische Feld Aα (x) φ(x)/c, 0, 0, 0 (φ(x)=Coulomb-Potential des Kerns) ersetzt werden muß. In niedrigster Ordnung wird die Streumatrix mit dem Operator (10.12) gebildet, wobei der Zeitordnungsoperator T wieder weggelassen werden kann. Für den Prozeß mit einem ein- und einem auslaufenden Elektron ergibt sich nach Tabelle 10.15 S(1) i e ψ ( ) γ α Aα ψ ( ) d 4x . h Unser Ziel ist es, für die Streuung des Elektrons ähnlich wie im Abschn. Q4.2.6 und Beispiel Q8.3 der gewöhnlichen Quantenmechanik einen differentiellen Wirkungsquer(1) und aus schnitt zu berechnen. Dazu müssen zunächst die Übergangsamplituden Sea diesen Übergangsraten berechnet werden.
e φ(x) e
ψ () γ 0 ψ ( ) φ/c
Abb. 10.3: Mott-Streuung.
286
10 Quantenelektrodynamik
Übergangsamplituden Für die Feldoperatoren ψ(x) und ψ(x) wählen wir diesmal die Zerlegung nach diskreten ebenen Wellen. (Eine Begründung dafür wird später gegeben.) Analog zu (10.19b) sind der Anfangs- und Endzustand dann durch
a a l, p 0 ,
e a l , p 0 ¼
(10.22)
¼
(1) gegeben. Ähnlich wie die Übergangsamplitude S(d) ea im letzten Abschnitt erhält man α 0 mit γ Aα γ φ(x)/c ' 4 i e '' γ 0 φ(x) () (1) '0 d x 0 a l , p ψ ( )(x) Sea ψ (x) a l, p h c 2 0 ' ei px/h γ 0 φ(x) (10.17b,c) i e m 0 c ' a l , p a 0' l, p u(l, p) h V c Ep l, p £ e i p x/h '' 1 4 a l £, p£ a l,p u(l , p ) '0 d x Ep £ l £ , p£ ¼
¼
¼
u(l , p ) ei p x/h γ 0 φ(x) u(l, p) e i px/h 4 dx c Ep ¼ Ep 0 0 3 u(l , p ) γ u(l, p) i ( p0¼ p0 )x 0 /h d x i em 0 c h φ(x) ei ( p e h V Ep ¼ Ep
(10.6a)
¼
i e m 0 c2 h V
¼
p¼ ) x/h d
3x
h 3
.
Aus der eindimensionalen Version von Gleichung (8.71) ergibt sich für das erste Integral Ep Ep¼ s.u. dx0 ¼ ei ( p0 p0 )x 0 /h 2π δ( p0 p ) 2π δ 2πc δ(Ep Ep ¼ ) , 0 h c (10.23) wobei p0 Ep /c und zuletzt Gleichung (E2.41) benutzt wurde. Das zweite Integral ist bis auf einen Faktor die Fourier-Transformierte des Coulomb-Potentials φ(x), mit φ Z e/(4πε0 x ) ergibt sich für dieses i ( p p¼ ) x/h 3 3 Ze d x s.u. Ze e i ( p p¼ ) x/h d x . (10.24) φ(x) e 3 3 4πε0 x ε0 h p p 2 h h (1)
(Beweis folgt.) Für Sea folgt damit schließlich (1) Sea
2πi Z e2 m 0 h 2 c2 Mea δ(Ep Ep ¼ ) ε0 V Ep ¼ Ep p p 2
mit
Mea
u(l , p ) γ 0 u(l, p) . (10.25)
Beweis: Mit x/h x x und q ( p p ) haben wir bis auf einen Faktor das Integral e i qx 3 J d x. x
10.2 Streuprozesse erster Ordnung
287
In Kugelkoordinaten, deren Polarachse in Richtung von q weist, ist x d 3x r 2 sin ϑ dr dϑ dϕ und
r , q x qr cos ϑ,
½π
1 2π i qr cos ϑ e s.u. 2 r ei qrα dr dα , r sin ϑ dr dϑ dϕ 2π r r 0 ϑ 0 ϕ 0 r 0 α 1
J
wobei die Substitution α cos ϑ vorgenommen wurde. Die Integration nach α läßt sich zwar formal ausführen, doch die Weiterintegration nach r führt zu einem unbestimmten Ausdruck, was bedeutet, daß das Nacheinander-Ausführen der Integrale wegen der Divergenz des Integranden für r nicht möglich ist. Wir umgehen diese Schwierigkeit, indem wir vorübergehend statt φ 1/r ein Potential φ eμr /r betrachten und dann μ0 gehen lassen. Für dieses Hilfspotential erhalten wir statt des letzten Doppelintegrals
J(μ) 2π
r eμr ei qαr dr dα ,
1
1
r 0 α
und die Integration nach α führt zu J (μ)
2π
μr re
r 0
2π iq
3
e(i q μ)r i q μ
'1 ei qαr '' ' dr i qr '
2π (i q μ)r (i q μ)r e e dr iq r 0 1 4' 1 e(i q μ)r '' 2π 1 4π . ' ' i q μ i q i q μ i q μ q 2 μ2
0
Hieraus folgt J
lim J(μ)
μ 0
4π . q2
Übergangsrate zu festem Endzustand Zur Berechnung der Übergangsrate zu einem Ebene-Welle-Endzustand mit fest vorgegebenem Impuls p benötigen wir die Übergangswahrscheinlichkeit. Da in dieser das Quadrat der δ-Funktion auftritt, ist sie nicht wohldefiniert. Anders ist das bei der durch die Dauer τ des Übergangs geteilten Übergangswahrscheinlichkeit, der Übergangsrate wea
(1) 2
Sea
lim
τ
τ
(1) Wird in limτ Sea /τ das Zeitintegral
δ(Ep Ep ) ¼
1 2π h
(1) lim Sea lim
τ
τ
½ i (E e ½
p
(1)
Sea
τ
Ep¼ )t /h
.
(10.26)
dt ,
durch das die δ-Funktion nach (10.23) dargestellt werden kann, mit endlichen Integrationsgrenzen eingesetzt, so ergibt sich mit (10.25) wea
2πc4 Z 2 e4 m 20 h 3 Mea 2 δ(Ep Ep ) lim Ep Ep p p 4 τ ε02 V 2 ¼
¼
2 τ/2 τ/2
ei (Ep τ
Ep¼ )t /h
dt
.
288
10 Quantenelektrodynamik
Wegen der Multiplikation mit δ(Ep Ep ) kann im Integral unter dem Limes Ep Ep 0 2 τ/2 gesetzt werden, was mit τ/2 dt τ schließlich zu ¼
¼
Mea 2 δ(Ep Ep ) (10.27) Ep Ep p p 4 führt, einer Größe mit einfacher δ-Funktion. Wegen dieser ist w ea nur für Ep Ep von null verschieden, was nach (8.162b) p2 p 2 zur Folge hat. Damit ergibt sich w ea
2πc
4 Z 2 e4 m 2 h 3 0 ε02 V 2
¼
¼
¼
( p p )2
p2
2 p p
p 2 2 p2(1
cos ϑ) 4 p2 sin2 (ϑ/2) ,
wobei ϑ der Winkel zwischen p und p ist, sowie
πc
w ea
Mea 2 δ(Ep
4 Z 2 e4 m 2 h 3 0 2 2 8ε0 V
Ep2
Ep ¼ ) 4 4 p sin (ϑ/2)
.
(10.28)
Ableitungsgemäß bezieht sich die Übergangsrate w ea aufgrund unserer Wahl (10.22) auf einen Anfangszustand mit der durch l beschriebenen Polarisation und auf einen Endzustand mit der durch l beschriebenen Polarisation. Bei gegebener Anfangspolarisation l sind Übergänge l l l und l l l möglich. Wir nehmen an, daß bei der Messung des Wirkungsquerschnitts nicht bezüglich der Polarisation des gestreuten Elektrons gefiltert wird. Die von der Polarisation des gestreuten Elektrons unabhängige Übergangsrate ist einfach die Summe (über l von 1 bis 2) der polarisationsabhängigen Übergangsraten. Bezüglich des Anfangszustands nehmen wir an, daß keine bestimmte Polarisation präpariert wurde. Wir betrachten stattdessen einen gemischten Anfangszustand, in dem jede Polarisation mit dem statistischen Gewicht 1/2 vertreten ist. Die gesamte Übergangsrate setzt sich dann aus der Summe der Übergangsraten für alle Übergangsmöglichkeiten zwischen verschiedenen Polarisationsrichtungen zusammen und ist unter Berücksichtigung des statistischen Gewichtsfaktors 1/2 für die Anfangszustände 2 2 δ(E p Ep ) l,l 1 Mea πc 4 Z 2 e4 m 20 h 3 w p p . (10.29) 16 ε02 V 2 Ep2 p4 sin4 (ϑ/2) ¼
¼
¼
Jetzt berechnen wir Mit
uγ u 0
l,l ¼
Mea 2 und setzen dazu kurz u(l, p)u und u(l , p )u .
u (γ ) u u (γ 0)2 u uγ 0u
0 2
(2.205)
u u
4 α 1
u α uα
4 α 1
u α u
α
u
u
'2 und u γ 0 u ' (u γ 0 u)(u γ 0 u) erhalten wir zunächst 2 l,l ¼ 1
Mea 2 (10.25b)
' ' 'u γ 0 u '2 l,l ¼
l,l ¼
(u γ 0 u)(uγ 0 u )
αβλμ l,l ¼
0 0 u α γαβ u β u λ γλμ uμ
10.2 Streuprozesse erster Ordnung αβλμ (8.195)
2
0 γαβ
289
2 0 u β (l, p)u λ (l, p) γλμ u μ (l , p )u α (l , p )
l 1
αβλμ
0 γαβ
Weiterhin ist p m 0 c)γ 0 (/ p Sp γ 0 (/
l¼ 1
p/ m c / m c 0 0 0 p γλμ 2m 0 c βλ 2m 0 c μα
Sp γ 0 (/ p m 0 c)γ 0 (/ p 4m 20 c2
m 0 c)
.
Sp γ 0p/γ 0p/ m 0 c Sp γ 0p/γ 0 (γ 0 )2p/ m 20 c2 Sp(γ 0 )2 s.u. Sp γ 0p/γ 0p/ 4m 20c2 , wobei zuletzt (γ 0 )2 E, Sp E 4, Sp γ α 0 als Folge von (2.172), Sp p/ pα Sp γ α 0 und
m 0 c)
Sp γ 0p/γ 0 pα Sp γ 0 γ α γ 0
(2.204)
pα 2g 0α Sp γ 0 Sp γ α 0
benutzt wurde. Mit Sp(AB) Sp(B A) und daraus folgend 1 Sp γ α γ β Sp γ α γ β γ β γ α 2
(2.204)
g αβ Sp E
4gαβ
ergibt sich schließlich Sp γ 0p/γ 0p/ pα pβ Sp γ 0 γ α γ 0 γ β pα pβ Sp 2g α0 γ 0 γ β γ α γ β 2 p0 pβ Sp γ 0 γ β pα pβ Sp γ α γ β 8 p0 pβ g0β 4gαβ pα pβ Ep Ep 0 0 0 8 p p 4 p p0 4 p p 4 c2 p p sowie 2 2 2 2 Mea 2 m 0 c Ep E2p 2/c p p . m0c l,l 1 ¼
¼
¼
Beim Einsetzen dieses Ergebnisses in die Übergangsrate (10.29) können wir wegen der δ 3 -Funktion Ep Ep und p p p2 cos ϑ setzen, was mit m 20 c2 Ep2 /c2 p2 zu ¼
m 20 c2
Ep Ep c2
¼
p p
2Ep2 c2
p2 (1 cos ϑ)
2Ep2 c2
2 p2 sin2 (ϑ/2)
führt. Mit pm Ú (Ep /c2 )Ú erhalten wir schließlich 2 l,l ¼ 1
Mea 2
2Ep2 Ú2 2 sin (ϑ/2) , 1 c2 m 20 c4
und aus der Übergangsrate (10.29) wird damit π Z 2 e4 h 3 1(Ú 2 /c2 ) sin2 (ϑ/2) δ(Ep Ep ) w p p . 8 ε02 V 2 p4 sin4 (ϑ/2) ¼
¼
(10.30)
290
10 Quantenelektrodynamik
Übergangsrate zu Intervall von Endzuständen w p p ist die Übergangsrate von einer ebenen Welle mit dem Impuls p als Anfangszustand zu einer ebenen Welle mit dem Impuls p als Endzustand. In der Praxis interessiert man sich jedoch für die Streuung zu all denjenigen Ebene-Welle-Endzuständen, deren Impulse p mit dem Impuls p der einfallenden ebenen Welle einen Winkel aus dem Intervall ϑ, ϑ dϑ einschließen. Das entspricht dem Streufluß durch die Fläche eines Ringgebiets, das durch einen Kegel mit den Öffnungswinkeln ϑ und ϑ dϑ aus einer Kugelfläche ausgeschnitten wird (siehe Mechanik, Abb. M4.19). Hierzu muß über alle Übergangsraten w p p , die in die entsprechenden Elemente
¼
¼
d 3p
p 2 sin ϑ d p dϑ dϕ
des Impulsraums führen, summiert werden. Aus (8.162) folgt d Ep c2 p d p/Ep , womit die Impulsraumelemente die Form d 3p
p Ep d Ep sin ϑ dϑ dϕ/c2 ¼
¼
annehmen. Wegen (10.5a) liegen im Intervall 0, P gleichmäßig verteilt Ni P L/(2π h) verschiedene Werte der Impulskomponente pi . Da dies für jede Impulsrichtung gilt, ist die Anzahl möglicher Impulswerte im Volumen P 3 des Impulsraums durch 3 N N1 N2 N3 P 3 L 3 /(2π h) und ihre Dichte in diesem mit V L 3 durch np
N P3
V 3 (2π h)
(10.31)
gegeben. Die Zahl von Wellen mit Impulswerten im Element d 3 p des Impulsraums ist daher V p Ep d Ep sin ϑ dϑ dϕ . (10.32) d N( p ) n p d 3 p 3 2 (2π h) c
¼
¼
Für die gesamte Übergangsrate zu Ebene-Welle-Zuständen mit Streuwinkeln im Intervall ϑ, ϑ dϑ ergibt sich damit dWp
d 3 p¼
wp
ϕ,Ep¼
p
¼
2π
d N( p ) sin ϑ dϑ
dϕ 0
Ep¼
Ep 1(Ú 2 /c2 ) sin2 (ϑ/2) Z 2 e4 dΩ , 4 64π 2 c2 ε02 V p3 sin (ϑ/2)
(10.30)
V p Ep w p 3 2 (2π h) c ¼
p¼
d Ep
¼
(10.33)
wobei zuletzt das Raumwinkelelement dΩ 2π sin ϑ dϑ eingeführt wurde. Die Tatsache, daß d W p d 3 p 0 für V gilt, ist der Grund dafür, warum die Feldoperatoren nach diskreten ebenen Wellen entwickelt wurden. Bei der Berechnung des Wirkungsquerschnitts im nächsten Abschnitt wird der Faktor 1/V durch einen weiteren Faktor V kompensiert, sodaß der Übergang V möglich wird. (Die Entwicklung nach einem Kontinuum ebener Wellen hätte zu einem nicht wohldefinierten Produkt 0 geführt.) ¼
10.2 Streuprozesse erster Ordnung
291
Differentieller Wirkungsquerschnitt Die Berechnung eines differentiellen Wirkungsquerschnitts für die Streuung des Elektrons am Kern erfolgt im Prinzip wie im Abschn. Q4.2.6 oder Beispiel Q8.3. (Dem Leser wird daher empfohlen, sich die entsprechenden Abschnitte nochmals anzusehen.) Der differentielle Wirkungsquerschnitt dσ ist die Fläche, die senkrecht vom Wahrscheinlichkeitsstrom jeinf des einfallenden Teilchens durchsetzt werden muß, um dieselbe Wahrscheinlichkeit pro Zeiteinheit für den Durchgang des Elektrons zu besitzen wie dessen Streuung in das Raumwinkelelement dΩ, d. h. jeinf dσ
d W p
d 3 p¼
.
Hieraus ergibt sich als differentieller Wirkungsquerschnitt dσ dΩ
d W p
1
jeinf
d 3 p¼
dΩ
.
(10.34)
Anschaulich ist der Vierervektor des einfallenden Wahrscheinlichkeitsstroms durch α nv α gegeben, was mit der Teilchendichte n 1/V (ein Teilchen im Volumen V ), jeinf der (bewegten) Masse m Ep /c2 und v α p α /m zu α jeinf
c2 pα V Ep
jeinf
c2 p V Ep
(10.35)
führt. Korrekter wird dieses Ergebnis auf folgende Weise bewiesen. Beweis: Nach (7.132) ist der Teilchenstrom eines Elektrons j α cψγ α ψ. In der Quantenfeldtheorie ist diesem der Feldoperator j α c:ψγ α ψ: (10.36) zugeordnet. Sein Erwartungswert in dem durch (10.22a) gegebenen Zustand a des einlaufenden Elektrons ist ' 1 ' 1 0 ' 0 ' ' ' ' ' j α j α c 0' a l, p :ψγ α ψ: a l, p '0 c 0' a l, p ψ ( ) γ α ψ ( ) a l, p '0 ,
denn der Beitrag von ψ ( ) γ α ψ ( ) bzw. ψ ( ) γ α ψ ( ) zu j α könnte nur dann von null verschieden sein, wenn a bzw. e der Vakuumzustand wäre, und für einen nicht-verschwindenden Beitrag von :ψ ( ) γ α ψ ( ) : müßte nach Tabelle 10.1 ein Positron ein- und auslaufen. Mit (10.17) ergibt sich weiterhin
jα
¼ £ m 0 c3 0 '' ei p x/h α e i p x/h '' 1 a l, p a l ¼ , p¼ u(l , p ) γ a l £ ,p£ al, p u(l , p ) 0' '0 V Ep ¼ Ep £ £ £ ¼ l,¼ p,l ,p
3 (10.6a) m 0 c
V Ep
u(l, p)γ α u(l, p) .
Mit der gleich zu beweisenden Beziehung u(l, p)γ α u(l, p)
pα m0c
(10.37)
292
10 Quantenelektrodynamik
führt das zu (10.35). Aus (8.190a) und (b) folgt u(l, p)γ α u(l, p)
u(l, p)Π γ α Π u(l, p) .
Mit 4m 20 c2 Π γ α Π
(8.187)
(γ μ pμ m 0 c)γ α (γ ν pν m 0 c)
pμ pν γ μ γ α γ ν
pμ pν (2g μα γ α γ μ )γ ν
2 pα pν γ ν
2m 0 cpα 1
(2.204)
und (8.163) wird
m 0 c( pμ γ μ γ α pν γ α γ ν )
α
γ2
Π γ αΠ
m 0 cpμ (γ μ γ α γ α γ μ )
pμ pν (γ μ γ ν γ ν γ μ )
p//(m 0 c) pα 1
m 20 c2 γ α
2m 0 cpα
m 20 c2 γ α m 20 c2 γ α
(m 20 c2 pμ pμ )γ α
p//(m 0 c) , 2m 0 c
und aus (8.190a) mit (8.187) ergibt sich (/ p
m 0 c) u(l, p) 2m 0 c u(l, p)
p/ u(l, p) u(l, p) . m0c
Zusammenfassen der letzten Ergebnissen führt zu pα u(l, p) 1 p//(m 0 c) u(l, p) u(l, p)γ α u(l, p) 2m 0 c
pα u(l, p) u(l, p) , m0c
und mit (8.192a) ergibt sich daraus (10.37).
Aus (10.34) folgt mit (10.33), (10.35b) und der Sommerfeldschen Feinstrukturkonstanten α e2 /(4πε0 hc) nach Herauskürzen eines Faktors V im Zähler und im Nenner dσ dΩ
Z α h Ep 2c p2
2
1(Ú
2 /c2 ) sin2 (ϑ/2)
sin4 (ϑ/2)
.
(10.38)
Für v/c0 und Z 1 ergibt sich hieraus mit Ep / p2 m 0 c2 /(m 0 v)2 c2 /(m 0 v 2 ) das Ergebnis (Q4.176) der Schrödingerschen Wellenmechanik. (10.38) ist also dessen relativistische Verallgemeinerung, was bedeutet, daß es in der hier behandelten niedrigsten Ordnung keine Effekte der Feldquantisierung gibt.
10.3 Streuprozesse zweiter Ordnung Bei der Zerlegung des Integranden von S (2) , Gleichung (10.13), mit Hilfe des Wickschen Theorems (9.53) treten nach den am Ende von Abschnitt 9.2 gegebenen Erläuterungen nur Kontraktionen zwischen Operatoren auf, von denen einer im ersten und einer
10.3 Streuprozesse zweiter Ordnung
293
im zweiten Normalprodukt steht, und dabei nach (9.61)–(9.62) nur Photon-Photon oder Fermion-Fermion-Kontraktionen bzw. -Propagatoren. Unter den letzteren sind wegen des Verschwindens der Kommutatoren ψ(x), ψ(y) und ψ(x), ψ(y) wiederum nur die von null verschieden, bei denen ψ und ψ kontrahiert werden. (In (8.156) wurde das Verschwinden nur für tx t y gefordert, aus den gleichzeitigen Vertauschungsrelationen mit verschwindendem Kommutationsrest folgt dieses jedoch wie im Fall des Klein-Gordon-Schrödinger-Feldes – siehe (8.89) – auch für die entsprechenden nichtgleichzeitigen Vertauschungsrelationen.) Auf diese Weise erhält S (2) einen Term ohne Kontraktionen, drei Terme mit einer Kontraktion, drei Terme mit zwei Kontraktionen und einen Term mit drei Kontraktionen,
S (2)
e2 2h 2 e2 2h 2 e2 2h 2 e2 2h 2 e2
2h 2 e2
2h 2 e2
2h 2 e2 2h 2
α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 )ψ(x 2) : d x1 d x2 α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ(x 2) : d x1 d x2
α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ(x 2) : d x1 d x2
α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ(x 2) : d x1 d x2
(10.39) β : ψ(x 1 ) γ α A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ
(x 2 ) : d x 1 d x 2 4
4
α β (x ) : d 4x d 4x : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ 2 1 2
α β (x 2 ) : d 4x 1 d 4x 2 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ
α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ(x 2) : d x1 d x2 .
Würde man jeden nicht kontrahierten Operator gemäß (9.44) in seinen Erzeugerund Vernichteranteil zerlegen, so erhielte man durch Ausmultiplizieren und Normalordnen beim ersten Summanden 26 64 verschiedene Terme, beim zweiten bis vierten je 24 16 und beim fünften bis siebten je 22 4 Terme, beim letzten Summanden bliebe es bei einem Term. Jeder auf diese Weise erhaltene Term hat seine eigene physikalische Bedeutung, wobei jedoch zwischen vielen Termen Ähnlichkeiten bestehen. Auf die Zerlegung in Erzeuger und Vernichter wird wegen dieser Vielfalt verzichtet, die Bedeutung der acht Summanden wird jedoch anhand repräsentativer Beispiele erläutert.
294
10 Quantenelektrodynamik
Erster Summand. Von den 64 Termen, in die der erste Summand bei der Zerlegung der Operatoren zerfällt, greifen wir den heraus, der bei x 1 und x 2 jeweils denselben (1) , Gleichung (10.18), liefert, Beitrag wie in S(d) (2) S
(dd)
e2
2h 2 e2
2h
2
:ψ ( )(x 1 )γ α ψ ( )(x 1 ) A α( )(x 1 )ψ ()(x 2 )γ β ψ ()(x 2 ) A (β )(x 2 ): d 4x 1 d 4x 2 ψ ()(x 1 )γ α ψ ()(x 1 ) ψ ()(x 2 )γ β ψ ()(x 2 ) A (α )(x 1 ) A β (x 2 ) d 4x 1 d 4x 2 . ( )
Die hierzu passenden Anfangs- und Endzustände für ein- und auslaufende Teilchen sind in Analogie zu (10.19)
a b (λ ) 1
(k1 ) b (λ2) (k2 )0 ,
e a
(l1 , p1 ) b (l1 , p1 ) a (l2 , p2 ) b (l2 , p2 )0 .
Sie entsprechen zwei einlaufenden Photonen, und zu jedem von diesen gehört ein auslaufendes Elektron-Positron-Paar. Abb. 10.4 enthält das zugehörige FeynmanDiagramm: Es besteht aus zwei Diagrammen 10.2 (d), die beiden Photonen zerfallen unabhängig voneinander jeweils in ein Elektron-Positron-Paar. Da jeder der Einzelprozesse unmöglich ist, gilt das natürlich auch für ihre Kombination, und die Auswertung (2) der zu S(dd) gehörigen Übergangsamplitude zwischen den angegebenen Zuständen (1) a und e liefert wie die für S(d) durchgeführte null, weil die zugehörigen Energie-
und Impulserhaltungssätze nicht gleichzeitig erfüllt werden können. Offensichtlich bestehen die Feynman-Diagramme der übrigen 63 Terme des ersten Summanden aus allen möglichen Paarkombinationen der Diagramme aus Abb. 10.2, d. h. sämtliche Prozesse erster Ordnung können in zweiter Ordnung unabhängig voneinander paarweise auftreten. Alle 64 Prozesse sind jedoch aus Gründen der Energie- und Impulserhaltung verboten, sie haben also die Übergangswahrscheinlichkeit null. Abb. 10.4: Feynman-Diagramm für einen Term des ersten Summanden. Zwei Photonen zerfallen unabhängig voneinander jeweils in ein ElektronPositron-Paar.
Zweiter und vierter Summand. Wir bringen im zweiten und vierten Summanden erst das Produkt A α (x 1 ) A β (x 2 ) ganz nach rechts. Da in jedem Summanden über x1 und x 2 integriert sowie über α und β summiert wird, können die Umbenennungen x 1 x 2 und α β vorgenommen werden. Wird dies beim vierten Summanden durchgeführt und 1), 2) mit ψ(x werden anschließend folgende Vertauschungen vorgenommen: 1. γ β ψ(x 1) mit ψ(x 2 ), 4. γ α ψ(x 2 ) und schließlich 1) mit γ β ψ(x 2), 3. ψ(x 1 ) mit ψ(x 2. γ α ψ(x 5. Aβ (x 2 ) mit Aα (x 1 ), dann geht der vierte in den zweiten Summanden über. Wegen der geraden Anzahl dazu benötigter Fermionenvertauschungen und der Normalordnung des Integranden bleibt das ohne Konsequenzen für den Wert des Summanden, daher stellen der zweite und vierte Summand dieselben Prozesse dar.
10.3 Streuprozesse zweiter Ordnung
x1
x2 (a)
x2 x1
(b)
295
Abb. 10.5: Bedeutung der Kontraktion des zweiten Summanden: entweder virtuelles Positron, (a), oder virtuelles Elektron, (b).
Bei den 16 durch den zweiten bzw. vierten Summanden beschriebenen Prozessen gibt es ein durch die Kontraktion ψ(x 1 )ψ(x 2 ) bzw. ψ(x 1 )ψ(x 2 ) beschriebenes virtuelles Fermion, das an einem Vertex bei x 1 oder x 2 erzeugt und bei x2 oder x 1 vernichtet wird, außerdem zwei Photonen und zwei Fermionen, von denen bei x 1 und x 2 je eines etc. erzeugt und vernichtet wird. Im folgenden wird für ψ(x 1 ) etc. zur Abkürzung ψ 1 geschrieben. Durch Zerlegung der Operatoren in Erzeugungs- und Vernichtungsanteil ergibt sich mit 0 A( ) B ( ) 0 0 A ( ) B ( ) 00 für die Kontraktion des zweiten Summanden * ' ' ' () ( ) ( ) () ' für t1 > t2 0'ψ (1) ψ 2( ) '0 (9.51) ' ' ψ 1 ψ 2 0 T ψ 1 ψ2 ψ 1 ψ2 0 ' ( ) ( ) ' '0 0 'ψ für t2 > t1 . 2 ψ1 Im ersten Fall beschreibt die Kontraktion nach Tabelle 10.1 die Emission eines Positrons bei x 2 und dessen Absorption bei x 1 (Abb. 10.5 (a)), im zweiten Fall die Emission eines Elektrons bei x 1 und dessen Absorption bei x 2 (Abb. 10.5 (b)). Da in (10.39) über x 1 und x 2 integriert wird, treten immer beide Möglichkeiten auf, t1 >t2 und t2 > t1 . Die Zerlegung des Terms ψ 1 ψ 2 im zweiten Summanden liefert ( )
( )
ψ 1 ψ 2
( ) ( ) ψ ψ 1 2 ( ) ( )ψ ψ 1 2 ( ) ( )ψ ψ 1 2
(Absorption eines Elektrons bei x 1 und eines Positrons bei x 2 ) (Absorption eines Elektrons bei x 1 , Emission eines Elektrons bei x 2 ) (Emission eines Positrons bei x 1 , Absorption eines Positrons bei x 2 ) (Emission eines Positrons bei x 1 und eines Elektrons bei x 2 ) . ( )
()
Wegen der Multiplikation mit A 1α A 2β A 1α A 2β
( ) A ( ) ( ) ( ) ( ) ( ) A 1α 2β A 1α A 2β A 1α A 2β
(1) (2) (3) (4) (5) (6) (7) (8) ein e γ eγ e γ e e eγ e e e γ γ e γ e γ e aus γ γ γ γ e e γ γ e γ e γ (9) (10) (11) (12) (13) ein γ e γ γ e e γ e γ γ aus e e γ e γ e γ γ e e
(14) (15) (16) γ γ e e γ e γ e eγ e γ
Tabelle 10.2: Mögliche Kombinationen von Absorption und Emission beim zweiten Summanden von (10.39). “ein“ bedeutet einlaufende Teilchen, die absorbiert und “aus“ auslaufende Teilchen, die emittiert werden. Bei jedem der 16 aufgeführten Prozesse stehen links (ein oder zwei Einträge) die bei x1 und rechts (ein oder zwei Einträge) die bei x2 absorbierten und emittierten Teilchen. Der ( ) ( )
( ) ( ) ( ) ( ) ( ) ( ) ψ 2 in (5) – (8), ψ 1 ψ 2 in (9) – (12) und ψ 1 ψ 2
Prozeß ψ 1 ψ 2 ist in (1) – (4), ψ 1 in (13) – (16) enthalten.
296
10 Quantenelektrodynamik
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
Abb. 10.6: Feynman-Diagramme der durch den zweiten Summanden dargestellten Prozesse, darunter die Vernichtung eines eines Elektron-Positron-Paares zu Gammaquanten (4), die ElektronPhoton-Streuung (6) und (7) sowie die Positron-Photon-Streuung (10) und (11).
kann jede dieser Möglichkeiten in Kombination mit der Absorption von zwei Photonen (eines bei x 1 , das andere bei x 2 ), der Absorption eines Photons bei x 1 oder x 2 und Emission eines Photons bei x 2 oder x 1 sowie der Emission von zwei Photonen (eines bei x 1 , das andere bei x 2 ) auftreten. Insgesamt ergeben sich dadurch die Möglichkeiten der Tabelle 10.2. Die zugehörigen Feynman-Diagramme sind mit der gleichen Numerierung in Abb. 10.6 aufgeführt. Die den Kontraktionen zugeordneten inneren Fermionlinien sind dabei horizontal eingezeichnet, um anzudeuten, daß bei jeder die beiden Möglichkeiten (b) und (c) der Abb. 10.7 bestehen. (Diese illustriert den mit (7) numerierten Fall der Streuung eines Photons an einem Elektron.) Einige der Prozesse, z. B. (1) und (16),
10.3 Streuprozesse zweiter Ordnung
(a)
(b)
297
(c)
Abb. 10.7: Streuung eines Photons an einem Elektron, (a) Darstellung in Abb. 10.6, (b) Alternative mit virtuellem Elektron und (c) Alternative mit virtuellem Positron.
sind offensichtlich aus rein energetischen Gründen nicht möglich und haben daher die Wahrscheinlichkeit null, bei anderen können wieder Energie- und Impulserhaltungssatz nicht gleichzeitig erfüllt werden. Unter den 16 angegebenen Prozessen befinden sich diesmal jedoch auch solche mit von null verschiedener Wahrscheinlichkeit. Einer von diesen, die durch die Diagramme (6) und (7) repräsentierte Compton-Streuung eines Photons an einem Elektron, wird repräsentativ in Abschn. 10.3.1 behandelt. Man beachte, daß beim Zusammentreffen äußerer und innerer Fermionlinien in Vertizes immer die Richtung fortgesetzt wird, entgegengesetzte Richtungen treffen in einem Vertex nie aufeinander. Letzteres würde in den Übergangsamplituden Kombinationen wie ψ ( ) (x 1 )ψ ( ) (x 1 ) ψ ( ) (x 2 ) oder ψ () (x 1 ) ψ ( ) (x 2 ) ψ ( ) (x 2 ) (Zusammentreffen von ψ () (x 1 ) und ψ () (x 1 ) bzw. von ψ ( ) (x 2 ) und ψ ( ) (x 2 )) erfordern, die in α (x ): nicht vorkommen und daher auch in keinem der Entwicklungs:ψ(x i )γ ψ(x i )A α i terme von (10.11). Das bedeutet jedoch keineswegs die Unmöglichkeit der Kollision von Fermionen, diese ist vielmehr mit dem Austausch eines virtuellen Photons verbunden (Abb. 10.8). Dritter Summand. Bei den 16 durch den dritten Summanden von (10.39) repräsentierten Prozessen gibt es insgesamt vier ein- und/oder auslaufende Fermionen, wobei die Zahl der ein- bzw. auslaufenden Fermionen zwischen null und vier variieren kann. Die beiden Vertizes bei x 1 und x 2 sind durch eine innere Photonlinie verbunden, welche die Kontraktion * ' ( ) ( ) ' ' für t1 > t2 0' A A 2β '0 (9.51) '' () ( ) ( ) ( ) ' 1α 0 T A 1α A 2β A 1α A 2β '0 A 1α A 2β ) A ( ) ''0 für t > t 0' A (2β 2 1 1α
(1) (2) (3) ein e e e e e e e e e e aus e e
ein e aus e
(4) (5) e e e e e e e e
(6) e e e e
(7) (8) e e e e e e e e
(9) (10) (11) (12) (13) (14) (15) e e e e e e e e e e e e e e e e e e e e e e e e e e
(16) e e e e
Tabelle 10.3: Mögliche Kombinationen von Absorption und Emission beim dritten Summanden.
298
10 Quantenelektrodynamik
(4)
(6)
(7)
(11)
Abb. 10.8: Feynman-Diagramme der vier wesentlich voneinander verschiedenen Prozesse des dritten Summanden mit zwei ein- und zwei auslaufenden Fermionen: (4) und (7) beschreibt die Streuung eines Elektrons an einem Positron, (6) die eines Positrons an einem Positron und (11) die eines Elektrons an einem Elektron (Numerierung wie in Tabelle 10.3).
repräsentiert. (Für t1 >t2 z. B. gilt
( )
()
( )
( )
0T ( A 1α A 2β )0 0 A 1α A 2β 00 wegen
( ) A 2β 00.) Sie kann von links nach rechts ansteigen (Fall t2 >t1 ) oder abfallen (Fall t2
Fünfter und siebter Summand. Der siebte Summand kann wieder durch die Umbenennungen x 1 x 2 und α β sowie anschließendes Vertauschen in die Form des fünften gebracht werden und beschreibt daher dieselben Prozesse wie dieser. Es gibt zwei innere Linien, eine für ein Photon und eine für ein Fermion, sowie zwei äußere Fermionlinien. Beim fünften Summanden stammen die letzteren von ψ 1 ψ 2
( ) ( ) ( ) ( ) ( )ψ ( )ψ ( )ψ ( )ψ ψ ψ ψ ψ 2 2 2 2 1 1 1 1
und führen zu den in Tabelle 10.4 angegebenen Möglichkeiten für ein- und auslaufende Teilchen. Die zugehörigen Feynman-Diagramme finden sich mit gleicher Numerierung in Abb. 10.9. Daß die Photonlinie als Bogen gezeichnet ist, hat keine tiefere Bedeutung, damit wird nur vermieden, daß zwei innere Linien übereinander liegen. Energetisch möglich sind nur die Prozesse (2) und (3).
ein aus
(1) e e
(2) e
(3) e e
(4) e e
e
Tabelle 10.4: Mögliche Kombinationen von Absorption und Emission beim fünften Summanden.
10.3 Streuprozesse zweiter Ordnung
(1)
299
(2)
(3)
(4)
Abb. 10.9: Feynman-Diagramme der durch den fünften Summanden beschriebenen Prozesse.
Sechster Summand. Bei diesem treten als ein- und auslaufende Teilchen nur zwei Photonen auf, und es gibt zwei innere Fermionlinien. Abb. 10.10 enthält die FeynmanDiagramme der vier möglichen Kombinationen von ein- und auslaufenden Photonen. Energetisch möglich sind nur die Fälle (2) und (3). Der durch sie beschriebene Prozeß ist der als Vakuumpolarisation bezeichnete Prozeß der Erzeugung eines virtuellen Elektron-Positron-Paares. (1)
(2)
(3)
(4) Abb. 10.10: Feynman-Diagramme der durch den sechsten Summanden beschriebenen Prozesse.
Achter Summand. Da der achte Summand keine unkontrahierten Operatoren enthält, sind der passende Anfangs- und Endzustand der Vakuumzustand. Das Betragsquadrat der zugehörigen Übergangsamplitude gibt daher die Wahrscheinlichkeit dafür an, daß Vakuum in Vakuum übergeht, und diese muß gleich 1 sein. Da der Integrand jedoch wegen der drei Kontraktionen konstant ist, divergiert das Integral. Um ein physikalisch sinnvolles Ergebnis zu erhalten, müssen der achte Summand und entsprechende Terme höherer Ordnung weggelassen werden. Abb. 10.11 enthält das zugehörige FeynmanDiagramm, eine geschlossene Blase oder Vakuumblase.
Abb. 10.11: Feynman-Diagramm der durch den achten Summanden beschriebenen Vakuumblase.
10.3.1 Übergangsamplituden Die Berechnung der Übergangsamplitude kann für jeden der in den acht Summanden enthaltenen Elementarprozesse ähnlich wie bei den Streuprozessen erster Ordnung durchgeführt werden. Die entsprechende Rechnung wird im folgenden exemplarisch bei zwei ausgewählten Prozessen durchgeführt.
300
10 Quantenelektrodynamik
Elektron-Elektron-Streuung Bei der Streuwechselwirkung zweier Elektronen gibt es zwei ein- und zwei auslaufende Elektronen. Das zugehörige Feynman-Diagramm, Nummer (11) in Abb. 10.8, entspricht dem Term (2) S(ee)
2
e2 2h
:ψ ( )(x 1 ) γ α A α (x 1 ) ψ ( )(x 1 )ψ ()(x 2 ) γ β A β (x 2 )ψ ( )(x 2 ): d 4x 1 d 4x 2
(10.40) im dritten Summanden der rechten Seite von Gleichung (10.39). Dazu passende Anfangs- und Endzustände sind a al1 , p1 al2 , p2 0 , e a l , p al , p 0 . (10.41)
2 i em 0 c2 2 hV
' 0'a l
k1 ,..,k4 q1 ,..,q4
u(k1 ,q1
)γ αu(k
2 ,q2 ) u(k 3 ,q3 )γ
¼
¼
¼
1
2
2
' (2) ' e' S(ee) 'a zwischen diesen Zuständen ergibt sich
(2) Für die Übergangsamplitude Sea mit (9.87) und (10.17) (2) Sea
¼
1
1 , p1 ¼
βu(k
¼
a l
' : a k1 ,q1 a k2 ,q2 a k3 ,q3 a k4 ,q4 : a l1 , p1 a l2 , p2 '0
2 , p2 ¼
¼
4 ,q4 )
Eq1 Eq2 Eq3 Eq4
DFαβ (x 1 x 2 ) ei
(q1 q2 )x 1 (q3 q4 )x 2 h
d 4x 1 d 4x 2 .
Es gilt : a k1 ,q1 a k2 ,q2 a k3 ,q3 a k4 ,q4 : a k1 ,q1 a k3 ,q3 a k2 ,q2 a k4 ,q4 , da die Fermionenoperatoren Antivertauschungsrelationen genügen, und damit ' ' 0'a l1 , p1 a l2 , p2 : a k1 ,q1 a k2 ,q2 a k3 ,q3 a k4 ,q4 : a l1 , p1 a l2 , p2 '0 ' ' 0'al , p al , p a k1 ,q1 a k3,q3 a k2 ,q2 a k4 ,q4 al1 , p1 al2 , p2 '0 . 1
1
2
2
Zur weiteren Auswertung dieses Vakuumerwartungswertes werden alle Erzeugungsoperatoren nach links durchgetauscht. Zunächst ergibt sich mit Hilfe der Vertauschungsrelationen (10.6a) a k2 ,q2 a k4 ,q4 a l1 , p1 a l2 , p2 a k2 ,q2 δl1 k4 δ p1 q4 al1 , p1 a k4 ,q4 a l2 , p2 δl1 k4 δp1 q4 δl2 k2 δ p2 q2 al2 , p2 a k2 ,q2 δl1 k2 δ p1 q2 al1 , p1 a k2 ,q2 δl2 k4 δ p2 q4 al2 , p2 a k4 ,q4 δl1 k4 δp1 q4 δl2 k2 δ p2 q2 δl1 k2 δ p1 q2 δl2 k4 δ p2 q4 δl1 k4 δp1 q4 a l2 , p2 a k2 ,q2 δl1 k2 δ p1 q2 a l2 , p2 a k4 ,q4
δl k δ p q al , p a k ,q δl k δ p q al , p ak ,q al , p al , p a k ,q a k ,q 2 4
2 4
1
1
2
2 2
2
2 2
1
4
1
4
1
1
2
2
2
2
4
4
und analog a l1 , p1 a l2 , p2 a k1 ,q1 a k3 ,q3
δk1 l2 δq1 p2 δk3 l1 δq3 p1 δk1 l1 δq1 p1 δk3 l2 δq3 p2
δk l δq p a k ,q al , p δk l δq p a k ,q a l , p δk l δq p ak ,q al , p δk l δq p a k ,q al , p a k ,q a k ,q al , p a l , p . 1 2
1 2
3
3
1
1
1 1
3 1
3 1
1
1
2
2
1
1 1
3
3
2
2
1
3
1
1
2
3
3 2
2
3 2
1
1
1
1
10.3 Streuprozesse zweiter Ordnung
301
Zur Berechnung des Vakuumerwartungswertes müssen die letzten beiden Ergebnisse miteinander multipliziert werden. Bei allen Produkttermen außer denen ohne Erzeugungs- oder Vernichtungsoperatoren trifft entweder links ein Erzeuger oder rechts ein Vernichter auf den Vakuumzustand und führt zum Verschwinden des entsprechenden Beitrags. Daher erhalten wir schließlich (mit 001) ' ' 0'a l1 , p1 a l2 , p2 : a k1 ,q1 a k2 ,q2 a k3 ,q3 a k4 ,q4 : a l1 , p1 a l2 , p2 '0 δk l δq p δk l δq p δl1 k4 δp1 q4 δl2 k2 δ p2 q2 δk l δq p δk l δq p δl1 k2 δ p1 q2 δl2 k4 δ p2 q4 1 1 3 3 1 1 3 3 ¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
2
2
1
1
1
1
2
2
δk1 l ¼ δq1 p¼ δk3 l ¼ δq3 p¼ δl1 k2 δ p1 q2 δl2 k4 δ p2 q4 δk1 l ¼ δq1 p¼ δk3 l ¼ δq3 p¼ δl1 k4 δp1 q4 δl2 k2 δ p2 q2 2 2 1 1 1 1 2 2
.
(2) ergibt sich Durch Einsetzen dieses Ergebnisses in Sea (2) s.u. Sea
2 DFαβ (x 1 x 2 ) em 0 c2 d 4x 1 d 4x 2 i hV Ep1 Ep Ep2 Ep 1 2 (p i 1 ¼ ¼ α ¼ ¼ β u(l 1 , p1 )γ u(l 1 , p1 ) u(l2 , p2 )γ u(l 2 , p2 ) e ¼
¼
u(l 1 , p1 )γ ¼
¼
(2)
α
(10.42)
¼
u(l2 , p2 ) u(l2¼ , p2¼ )γ βu(l1 , p1 ) ei
p1 )x 1 ( p p2 )x 2 2 h
( p p2 )x 1 ( p p1 )x 2 1 2 h
.
Dabei wurden nach der in Sea vorzunehmenden Summation über die ki und qi beim ersten und dritten Term die Umbenennungen x 1 x 2 und α β vorgenommen, die aus (9.87) für k k und x y y x folgende Eigenschaft DF βα (y x) DF αβ (x y) des Photonenpropagators sowie u 2 γ β u 2 u 1 γ α u 1 u 1 γ α u 1 u 2 γ β u 2 benutzt und damit der erste in den dritten und der zweite in den vierten Term überführt. Das letzte Ergeb(2) nis für Sea enthält daher nur noch zwei Summanden, und der von der Verdopplung der verbliebenen Summanden herrührende Faktor 2 hat sich gegen den Entwicklungskoeffizienten 1/2 herausgekürzt. (Ähnlich hebt sich bei den Übergangsamplituden n-ter Ordnung ein von gleichen Summanden herrührender Faktor n , welcher der Permutation von n Vertizes entspricht, gegen einen Entwicklungskoeffizienten 1/n weg.) (2) Die zwei in Sea verbliebenen Terme können wie folgt interpretiert werden: Im ersten beschreibt u(l1¼ , p1¼ )γ α u(l1 , p1 ) ei ( p1 p1 )¡x1 /hÆ die Vernichtung und anschließende Erzeugung des mit 1 indizierten Elektrons bei x 1 und u(l2¼ , p2¼ )γ β u(l2 , p2 ) ei ( p2 p2 )¡x2 /hÆ die Vernichtung und anschließende Erzeugung des mit 2 indizierten Elektrons bei x 2 . (2) Der entsprechende Beitrag zur Streuung Sea wird daher als direkte Streuung bezeichnet. Im zweiten Term beschreibt u(l1¼ , p1¼ )γ α u(l2 , p2 ) ei ( p1 p2 )¡x1 /hÆ die Vernichtung des mit 2 und Erzeugung des mit 1 indizierten Elektrons beim Vertex x 1 , u(l2¼ , p2¼ )γ β u(l1 , p1 ) ei ( p2 p1 )¡x2 /hÆ beschreibt die Vernichtung des mit 1 und die Erzeugung des mit 2 indizierten Elektrons beim Vertex x 2 . Dieser Beitrag zur Streuung wird als bezeichnet. Wenn man auf das Zusammenfassen der vier in ' ' Austauschstreuung 0'a l , p . . . '0 enthaltenen Terme verzichtet, läßt sich das Feynman-Diagramm (11) 1 1 der Abb. 10.8 wie in Abb. 10.12 dargestellt in vier differenziertere Diagramme zerlegen, von denen die zwei ersten die direkte und die zwei letzten die Austauschstreuung
302
10 Quantenelektrodynamik
p1¼
p2¼ p2 p2¼
=
p1¼ p1
p1
p2¼
p1¼ p2 p2¼
+
+
p1¼ p1
p2 p2
p2¼
p1¼ p1 p2¼ p1¼ p2
p1 p1
p1¼
p2¼ p1 p2¼
+
p1¼ p2
p2 p2
p1
Abb. 10.12: Zerlegung des Feynman-Diagramms für die Elektron-Elektron-Streuung in zwei Diagramme der Direktstreuung (erstes und zweites der rechten Seite) und zwei der Austauschstreu(2) ung (drittes und viertes). In Sea ist der Beitrag der direkten Streuung mit einem Pluszeichen, der der indirekten Streuung mit einem Minuszeichen versehen. Die Photonlinien sind so mit Richtungspfeilen versehen, daß an jedem Vertex Impulserhaltung gilt.
repräsentieren. Der Beitrag der direkten Streuung in (10.42) ist mit einem Pluszeichen, der der Austauschstreuung mit einem Minuszeichen versehen. Durch Benutzung der Darstellung (9.87) mit (9.88) des Photonenpropagators läßt (2) sich das für Sea erhaltene Ergebnis noch weiter vereinfachen. Mit DFαβ (x 1 x 2 ) ei
( p1¼ p1 )x 1 ( p2 p2 )x 2 h
(9.71)
d 4x 1 d 4x 2
D Fαβ (k) ei
( p p1 h k)x 1 1 h
D Fαβ (k) ei
( p1 p1 h k) x 1 h
ei
D Fαβ
p
( p ¼ p1 p p2 ) x 1 1 2 h
¼
2
d 4x 2
d 4k 4 d x1 (2π)4
δ 4 ( p2¼ p2 h k) h 4 d 4 k d 4x 1
p2 ei h (2π h )4 D Fαβ p2h p2 δ4( p1
( p p2 h k) x 2 2 h
¼
¼
d 4x 1
p2¼ p1 p2 )
für den direkten Term und dem analogen Ergebnis
DFαβ (x 1 x 2 ) ei
( p p2 )x 1 ( p p1 )x 2 1 2 h
(2π h )4 D Fαβ
d 4x 1 d 4x 2
p
1
p2 δ4 ( p 1 h ¼
¼
p2¼ p1 p2 )
für den Austauschterm ergibt sich unter Weglassen des Superskripts (2) für die zweite Ordnung
i (2π h )4 δ (2p1 4
Sea
4V
¼
p2¼ p1 p2 ) Ep1 Ep1 Ep2 Ep2
Mea
mit
Mea
M1
M2
(10.43)
10.3 Streuprozesse zweiter Ordnung
303
und M1 M2
2em c2 2 p p¼ 2 0 2 u(l1¼ , p1¼ )γ α u(l1 , p1 ) u(l2¼ , p2¼ )γ β u(l2 , p2 ) D Fαβ , h h 2em c2 2 p1 p ¼ 0 2 u(l1¼ , p1¼ )γ α u(l2 , p2 ) u(l2¼ , p2¼ )γ β u(l1 , p1 ) D Fαβ . h h
Das Auftreten der δ 4 -Funktion sorgt dafür, daß zwischen ein- und auslaufenden Teilchen Erhaltung des Viererimpulses bzw. Energie- und Impulserhaltung gilt, p1α p2α
p ¼ α1 p ¼ α2 .
(10.44)
Der Photonenpropagator D Fαβ hat bei direkter Streuung das Argument ( p2 p2¼ )/h, das wegen der δ 4 -Funktion dem Photonenimpuls hk p2 p2¼ p1¼ p1 entspricht, bei indirekter Streuung ist das Argument ( p1 p2¼ )/h und entspricht dem Impuls hk p1 p2¼ p1¼ p2 . Werden den Photonlinien der Feynman-Diagramme in Abb. 10.12 die dort eingetragenen Richtungen zugewiesen, so gilt an jedem Vertex Impulserhaltung: Im ersten Diagramm auf der rechten Seite der Graphengleichung z. B. gilt dann unter Berücksichtigung der Pfeilrichtungen (zum Vertex hinweisender Pfeil für einlaufende und vom Vertex wegweisender Pfeil für auslaufende Teilchen) p1 hk
p1 p1¼ p1
p1¼
bei x 1 ,
p2
p2¼ p2 p2¼
p2¼ hk
bei x 2 .
Bei den anderen Diagrammen ergibt sich die Erhaltung des Viererimpulses analog. Im ersten Diagramm transportiert das vom Vertex x 2 zum Vertex x 1 laufende virtuelle Photon den Impuls hk p2 p2¼ p1¼ p1 , der dem Elektron 2 während des Streuprozesses am Vertex x 2 verloren geht, und überträgt ihn am Vertex x 1 auf das Elektron 1. Da es sich hierbei um die Differenz p von zwei Elektronenimpulsen handelt, für die (p)(p) jeden beliebigen positiven oder negativen Wert annehmen kann (Aufgabe 10.2), ist für das virtuelle Photon der für reelle Photonen gültige Zusammenhang ω2 h 2 k k h 2 2k k2 0 E hωk h kc pc c zwischen Energie und Impuls im allgemeinen nicht erfüllt – daher der Name virtuelles Photon. Elektron-Photon-Streuung Bei der Streuwechselwirkung eines Elektrons mit einem Photon gibt es als ein- und auslaufende Teilchen je ein Elektron und ein Photon. Der Prozeß wird durch die FeynmanDiagramme (6) und (7) der Abb. 10.6 dargestellt. Diese entsprechen den Termen e2 ( ) ( ) α ( ) 4 4 ( ) (x 2 ) γ β A β (x 2 )ψ(x :ψ(x 1) γ A 2 ): d x 1 d x 2 α (x 1 ) ψ (x 1 )ψ 2 2h e2 ( ) ( ) α () 4 4 ( ) :ψ(x (x 2 ) γ β A β (x 2 )ψ(x 1) γ A 2 ): d x 1 d x 2 α (x 1 ) ψ (x 1 )ψ 2 2h
304
10 Quantenelektrodynamik
des zweiten Summanden der rechten Seite von (10.39) und zwei analogen Termen des vierten Summanden, bei denen gegenüber dem zweiten Summanden x 1 und x 2 vertauscht sind und die durch die Umbenennung x 1 x 2 in dieselbe Form gebracht werden können. In den Normalprodukten können die Fermionen- und Photonenoperatoren wegen ihrer Vertauschbarkeit voneinander getrennt werden, d. h. mit den Abkürzungen ψ(x 1 ) ψ1 etc. gilt z. B.
:ψ γ A ψ ψ 1
α
( ) 1α
( ) 1
:ψ γ ψ ψ
( ) β ( ) 2 γ A 2β ψ 2 :
α
1
( ) 1
( ) β ( ) ( ) 2 γ ψ 2 : : A 1α A 2β : .
Weiterhin gilt (mit 1V = eine Vertauschung, 2V = zwei Vertauschungen)
:ψ ψ γ ψ γ ψ : ψ ψ γ ψ γ ψ ψ γ ψ ψ γ ψ .
:ψ 1 γ α ψ1() ψ 2( ) γ β ψ 2 :
( ) 2
2V
1
( ) β 2
1V
( ) β 1
α
2
β
1
2
α
( ) 1
( ) 1
α
1
( ) 2
1V
2
Hiermit, mit den zur Elektron-Photon-Streuung passenden Anfangs- und Endzuständen
a a b 0 ,
e a b 0
(λ) l, p k
l ¼ , p¼
(λ¼ ) k¼
sowie mit (9.83), (10.10) und (10.17) ergibt sich für die Übergangsamplitude (2) Sea
22eh
s.u.
2
2
i e 2mh Vμ c 2
' ( ) β ( ) () ) ''a d 4x d 4x e'ψ 2 γ ψ2 ψ 1 γ α ψ1() A2β A1α A (1α ) A(2β 1 2
0 0 2
4
d 4x 1 d 4x 2
λ1 ,λ2 k1 ,k2 l1 ,l2 p1 , p2
0''b a a a b b a b ''0ε
u(l2 , p2 )γ β SF (x 2 x 1 )γ α u(l1 , p1 ) ωk1 ωk2 Ep1 Ep2
' ( p2 h k2 )x 2 ( p1 h k1 )x 1 (λ ) (λ ) (λ ) (λ)' (λ ) h 0'bk al , p al2 , p2al1 , p1 bk22 bk1 1 al,p b k '0 εβ 2 (k2 )εα(λ1 )(k1 ) ei ¼
¼
¼
(λ ) l,p k
¼
(λ1) l2 , p2 l1 , p1 k1
(λ2) (λ) l, p k k2
(λ2 ) i (λ1 ) α (k1 )εβ (k2 ) e
( p2 h k2 )x 2 ( p1 h k1 )x 1 h
.
Dabei wurden gleiche Beiträge vom vierten Summanden durch einen Faktor 2 berücksichtigt. Mit al , p al2 , p2 al1 , p1 al,p δl2 l δ p2 , p δl1 l δ p1 , p . . . ,
b b b b g b b g b b (λ ) (λ2) k2 k
(λ1 ) (λ) k1 k
λ2 λ
(λ ) (λ1) k1 k
(λ2 ) (λ) k k2
λ1 λ
... , ... ,
δ k2 ,k g λ1 λ δ k1 ,k δ k1 ,k g λ2 λ δ k2 ,k
wobei die Punkte für Terme stehen, deren Vakuumerwartungswert null ist, ergibt sich
' (λ) (λ ) (λ ) (λ)' 0'bk al , p al2 , p2al1 , p1 b k2 2 bk11 al,p b k '0 ' (λ) (λ ) (λ ) (λ)' 0'bk al , p al2 , p2al1 , p1 b k1 1 bk22 al,p b k '0
δ δ
l2 l δ p2 , p δl1 l δ p1 , p g l2 l δ p2 , p δl1 l δ p1 , p g
λ2 λ λ1 λ
δk2 ,k g λ1 λ δk1,k , δk1 ,k g λ2 λ δk2,k
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
305
(2) und durch Ausführen der Summationen in Sea u(l ¼ , p¼ )γ β SF (x 2 x 1 )γ α u(l, p) i e 2 m 0 μ0 c 4 (2) 4 4 d Sea x d x 1 2 2h V 2 ωk ωk Ep Ep ( p h k )x 2 ( p h k)x 1 ( p h k)x 2 ( ph k)x 1 h h gλ λεα(λ)(k¼ )gλλεβ(λ)(k) ei . gλ λ εβ(λ )(k¼ )gλλεα(λ)(k)ei ¼
¼
¼
¼
¼
¼
Unter Benutzung der Darstellung (9.83) mit (9.84) der Matrix SF erhalten wir daraus mit ähnlicher Rechnung wie die, welche zu (10.43) geführt hatte, (2) Sea
i
(2π)4 h 3 e2 m 0 μ0 c4 g λλ g λ λ 4 δ ( ph k p ¼ h k ¼ ) (10.45) 2V 2 ωk ωk Ep Ep u(l ¼ , p¼ )γ β SF ( p¼ h k ¼)γ α u(l, p) εβ(λ)(k¼ ) εα(λ)(k) u(l ¼ , p¼ )γ β SF ( p¼ h k)γ α u(l, p) εα(λ )(k¼ ) εβ(λ)(k) .
Weitere Prozesse Weitere wichtige Prozesse erster und zweiter Ordnung, die hier nur erwähnt seien, jedoch nicht diskutiert werden können, sind: Bremsstrahlung, Paarerzeugung im Feld eines Atomkerns, Teilchen-Antiteilchen-Zerstrahlung, Streuung eines Elektrons an einem freien Proton und Streuung von Positronen.
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen Das Ziel dieses Abschnitts ist es, eine allgemeine Formel für den differentiellen Wirkungsquerschnitt von Zwei-Teilchen-Stößen abzuleiten, womit Wechselwirkungsprozesse mit zwei freien einlaufenden Teilchen gemeint sind. Die Formel soll sich auf die im letzten Abschnitt untersuchten Streuprozesse zweiter Ordnung zwischen zwei anfangs freien Teilchen anwenden lassen, darüber hinaus jedoch auch dann gelten, wenn einige oder alle Terme höherer Ordnung oder auch andere als elektromagnetische Wechselwirkungen mit einbezogen werden. Bei den Wechselwirkungsprozessen zweiter Ordnung der QED ist bei zwei einlaufenden Teilchen die Zahl auslaufender Teilchen immer ebenfalls gleich zwei. Werden Terme höherer Ordnung und/oder außer dem Dirac- und Maxwell-Feld noch andere Felder mit einbezogen, so kann sich die Zahl auslaufender Teilchen von der der einlaufenden Teilchen unterscheiden. Dabei können die einlaufenden Teilchen den Stoß überleben, also unter den auslaufenden Teilchen enthalten sein. Sie können beim Stoßprozeß jedoch auch vernichtet werden, so daß es sich bei den auslaufenden um ganz andere Teilchen handelt. Die ins Auge gefaßten Stoßprozesse lassen sich in Form einer chemischen Gleichung a 1 a2
F n 1
en
(10.46)
306
10 Quantenelektrodynamik
darstellen, wobei der Fall des Überlebens der einfallenden Teilchen z. B. mit e1 a1 und e2 a2 eingeschlossen ist. Wir haben bei sämtlichen Streuprozessen der QED sowohl in erster als auch in zweiter Ordnung die Erhaltung des Viererimpulses festgestellt. Sie kam dadurch zustande, daß die Streuamplitude als Faktor eine δ 4 -Funktion mit der Differenz der Gesamtimpulse ein- und auslaufender Teilchen als Funktionsargument enthält. Man kann sich überlegen, daß auch in sämtlichen Termen höherer Ordnung eine entsprechende δ 4 -Funktion auftreten muß. Die Erhaltung des Viererimpulses läßt sich jedoch auch einsehen, ohne in die Details der Störungsrechnung zu gehen. Die Hamilton-Dichte (9.5) der QED ist für Stoßprozesse der betrachteten Art, an denen keine externen Felder beteiligt sind, raumzeitlich translationsinvariant. Für diesen Fall wurde in (7.97) ein Energie- und Impulserhaltungssatz abgeleitet. Dieser gilt zunächst nur für die noch nicht quantisierte Feldtheorie. In der Quantenfeldtheorie läßt sich daraus ein Erhaltungssatz für die Mittelwerte der entsprechenden Operatoren ableiten. Etwas einfacher läßt sich dieses Ergebnis auch durch2Betrachten der Energie allein d 3x , und H ist mit bei erzielen. Aus (7.96a) ergibt sich der Energieoperator H den betrachteten Stoßprozessen nicht explizit zeitabhängig. Damit folgt nach (Q3.120) dH dt
0∂H 1
∂t
0
und
H
const .
(10.47)
ψ, τ haben wir einen Zustand a betrachtet, in dem Als Anfangszustand limτ die beiden einlaufenden Teilchen durch Ebene-Welle-Lösungen beschrieben werden. Es handelt sich dabei um einen Eigenzustand des Operators H , in dem sowohl die Einzelenergien und Einzelimpulse der beiden einlaufenden Teilchen als auch deren Gesamtenergie E a und Gesamtimpuls Pa scharfe Werte besitzen, in ihm gilt H E a . Der ψ, τ , in den der Anfangszustand a durch die WechselwirZustand ψe limτ kung überführt wird, hängt mit dem Anfangszustand a nach (9.23) und (9.91a) gemäß
ψe
ψ, τ Sa
S lim τ
zusammen. Er kann nach Ebene-Welle-Zuständen e für F auslaufende Teilchen entwickelt werden, d. h. ψe e e ψe e e S a . e
e
Aus (10.47) folgt Ea
a H a ψe H ψe .
(10.48)
Da ψe im Gegensatz zum Anfangszustand im allgemeinen aus vielen Ebene-WelleLösungen superponiert ist, folgt hieraus noch nicht die bei der Störungsrechnung in erster und zweiter Ordnung gefundene Energieerhaltung E a E e bei den Einzelübergängen e S a . Mit ∂ H /∂t 0 und d H /dt 0 folgt jedoch 2 d ( H H )2 d H2 d H2 d H 2 ∂H2 H , H 0, dt dt dt dt ∂t
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
307
d. h. auch die Streuung der Energie bleibt bei der Wechselwirkung unverändert. Da sie im Anfangszustand a verschwindet, muß sie das auch in dem aus Wellenlösungen e mit scharfen Energiewerten E e superponierten Endzustand ψe tun, d. h. die Energien E e der verschiedenen Realisierungen des Endzustands müssen übereinstimmen und wegen (10.48) gleich der Anfangsenergie E a sein, Ea
Ee .
Jetzt betrachten wir die Differenz P α Peα Paα der Vierervektoren des Gesamtimpulses der Ebene-Wellenlösungen a und e, Paα
2
α pa,n ,
Peα
n 1
F
α pe,n .
(10.49)
n 1
Aus P 0 (E e E a )/c und E a E e folgt P 0 0. Wegen der vorausgesetzten raumzeitlichen Translationsinvarianz gilt das in jedem beliebigen Inertialsystem, aus dem der Stoßprozeß beobachtet wird. Als Differenz zweier Vierervektoren ist auch P α ein Vierervektor, dessen Nullkomponente in jedem beliebigen Inertialsystem verschwindet. In der Speziellen Relativitätstheorie, Abschn. „Sätze über Tensoren und LorentzTransformation“, Satz 4 wurde gezeigt, daß ein Vektor der Nullvektor ist, wenn eine seiner Komponenten in allen Inertialsystemen verschwindet. Aus P 0 0 folgt also P α 0 bzw. Peα
Paα .
(10.50)
Wir nehmen im folgenden für alle ins Auge gefaßten und durch die Reaktionsgleichung (10.46) beschriebenen Streuprozesse die für die Gültigkeit von (10.50) vorausgesetzte raum-zeitliche Translationsinvarianz als gegeben an. Übergangsamplituden. Die Entwicklung (10.11) legt es nahe, die Zerlegung S 1V vorzunehmen, womit die Übergangsamplituden mit e a δea in Sea δea e V a aufspalten. Der erste Term δea liefert nur einen Beitrag zur Amplitude des Übergangs a a , bei dem die Erhaltung des Viererimpulses automatisch garantiert ist. Bei den Übergängen a e a können diese durch einen in e V a enthaltenen Faktor δ 4 (Pe Pa ) wie in (10.20), (10.43) und (10.45) erzwungen werden. Es ist für die weitere Rechnung bequem, in Analogie zu diesen Gleichungen auch noch weitere Faktoren herauszuziehen und für e a Sea
4 4 i (2π h) δ (Pe Pa ) Mea
2 +
F + 1 2V E n
n 1
n
¼
1
1 2V E ¼ n
(10.51) ¼
anzusetzen. (Die Produktfaktoren sind so gewählt, daß sie die V -Abhängigkeit der Reihenentwicklungen für ein- und auslaufende Teilchen erfassen, vgl. (10.8)–(10.10). Damit Sea wie zu fordern dimensionslos wird, muß Mea eine entsprechende, von F abhängige Dimension besitzen.)
308
10 Quantenelektrodynamik
Für die Übergangsrate wea w P P (mit Paα E a /c, P und Peα E e /c, P ) erhalten wir mit der Darstellung (9.71) der δ 4 -Funktion ähnlich wie in Abschn. 10.2.2 ¼
wP
P¼
lim τ
2
τ
V
(10.51)
Sea
lim Sea τlim
τ V
V
(2π h) Mea δ (Pe Pa )
8
2 4
2 +
n 1 s.u.
4 2 4 (2π h) cV Mea δ (Pe Pa )
Sea
τ
τ/2 2 τ/2 V ei ( P P )x/h (2πd xh )
2
F 1 + 1 lim 2V E n 2V E n Vτ n
2 +
n 1
1
e
4
a
4
τ
F + 1 1 , 2V E n 2V E n n
1
wobei die V -Terme trotz V stehen gelassen wurden – sie werden später gegen andere V -Terme weggekürzt. Die gesamte Übergangsrate zu Ebene-Welle-Zuständen 8 im Element d 3F P n d 3 pn des Impulsraums für F Teilchen ist
dWP
d 3F P
P
wP
F +
d N( pn )
(10.31),(10.32a)
wP
P
n 1
F + V d 3 pn 3 (2π h)
n 1
oder nach Einsetzen des letzten Ergebnisses dWP
d 3F P
(2π h) cV Mea δ (Pe Pa ) 4
2
4
2 +
n 1
F + d 3 pn 1 . (10.52) 3 2V E n (2π h) 2E n n
1
Als differentieller Wirkungsquerschnitt folgt aus ihr analog zu (10.34) dσ
d W P d 3F P j einf
4 2 (2π h) cV Mea
F 2 + d 3 pn δ 4 (Pe Pa ) + 1 . 3 j 2V E n (2π h) 2E n einf
n 1
n
1
Im Ruhesystem des zweiten Teilchens ist der Fluß der einfallenden Teilchen mit n 1/V durch Ú1 jeinf n Ú1 V gegeben. Mit p1α E 1 /c, p1 und p2α m 02c, 0 gilt in diesem System ( p1 p2 )2 m 201 c2 m 202 c2
m 201 c2 m 202 c2
m 201 c2 m 202 c2 v 12 /c2
und hieraus folgt v1
E 12 c2
1 v 12 /c2
m 201 c2 1 v 12 /c2
E 12 m 202 v 12 , c2
( p1 p2 )2 m 201 c2 m 202 c2 E 1 m 02
c.
m 201 c2 m 202 c2
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
309
Dieses mit klassischer Rechnung erhaltene Ergebnis kann ähnlich wie (10.35) auch quantentheoretisch abgeleitet werden. Für den differentiellen Wirkungsquerschnitt ergibt sich mit ihm F 4 2 4 d 3 pn¼ s.u. (2π h) Mea δ (Pe Pa ) + dσ . (10.53) 3 ¼ 4c2 ( p1 p2 )2 m 201 c2 m 202 c2 n 1 (2π h) 2E n Dabei wurde zuletzt noch die im Ruhesystem des zweiten Teilchens gültige Beziehung E 2 m 02 c2 benutzt. Dieses zunächst nur für das Ruhesystem des zweiten Teilchens abgeleitete Ergebnis ist allgemein gültig, da es Lorentz-invariant ist. Beweis: Daß die δ 4 -Funktion Lorentz-invariant ist, folgt aus ihrer Darstellung (9.71), für Mea folgt die Lorentz-Invarianz aus der Ableitung aus Lorentz-invarianten Ausdrücken (z. B. (10.25b,c) und (10.43b)), und die Lorentz-Invarianz des Nenners von dσ ist offensichtlich. Mit der Definition * Θ( p0 )
0
für
p0 < 0
1
für
p0 > 0
(10.54)
für die Sprungfunktion Θ( p0 ) folgt die Lorentz-Invarianz der Faktoren d 3 pn /(2E n ) aus der Umrechnung d 3p 2E
d 3 p d p0 d 4p δ( p0 E/c) δ( p0 E/c) Θ( p0 ) δ( p0 E/c) 2cp0 2cp0
4 d 4p δ( p0 E/c) δ( p0 E/c) (8.93) d p Θ( p0 ) δ p pm 20 c2 Θ( p0 ) . c 2E/c 2E/c c
d 4 p, p p und δ( p pm 20 c2 ) sind offensichtlich Lorentz-invariant, und für Θ( p0 ) gilt das ebenfalls mit folgender Begründung: Weil die Energie in allen Inertialsystemen positiv ist, folgt für alle Systeme p0¼ >0 aus p0 >0 und damit Θ( p0¼ )Θ( p0 ) .
Das Ergebnis (10.53) kann noch vereinfacht werden, wenn man in das Schwerpunktsystem der Teilchen geht, in dem p1 p2 Pa Pe 0 gilt. Mit p1 p2 p und m 20i c2 E i2 /c2 pi2 E i2 /c2 p2 für i 1, 2 ergibt sich in diesem ( p1 p2 )2 m 201 c2 m 202 c2
E1 E2 c2
2
p1 p2
m 201 c2 m 202 c2
E 12 E 22 E 12 E 22 2E 1 E 2 2 4 p p c4 c2 c4 2 E1 E2 p , c
E 12 E 22 2 p p4 c2
und Einsetzen dieser Beziehung in Gleichung (10.53) liefert schließlich als differenti-
310
10 Quantenelektrodynamik
ellen Streuquerschnitt im Schwerpunktsystem
dσ
F (2π h)4 Mea 2 δ 4 (Pe Pa ) + d 3 pn¼ . 4c (E 1 E 2 ) p (2π h)3 2E n¼
(10.55)
n 1
Für den Spezialfall von nur zwei auslaufenden Teilchen folgt daraus mit Pe p1¼ p2¼ , Pa 0 und δ 4 (Pe Pa )δ 3 ( Pe Pa )δ(E e /c E a /c)cδ 3 ( p1¼ p2¼ ) δ(E 1¼ E 2¼ E 1 E 2 ) dσ
Mea
2 δ 3 ( p¼ p¼ )δ(E ¼ E ¼ E E ) 1 2 1 2 1 2 16 (2π h)2 (E 1 E 2 ) p
d 3 p1¼ d 3 p2¼ . E 1¼ E 2¼
Die Deltafunktionen bringen zum Ausdruck, daß p1¼ und p2¼ bzw. E 1¼ und E 2¼ nicht unabhängig voneinander gewählt werden können. Wir führen daher die zu deren Auswertung notwendigen Integrationen aus, was durch Integration über p2¼ und E 1¼ E 2¼ geschehen kann. Nach der Integration über p2¼ muß p2¼ p1¼ gesetzt werden, mit der Umbenennung p1¼ p¼ haben wir d 3 p1¼
d 3 p¼
2
¼
p
d p¼ dΩ ¼ ,
(10.56)
aus 2 4 2 4 c p¼ 2 c2 m ¼01 c , E 1¼ 2 p1¼ 2 c2 m ¼01
folgt ¼
¼
p d p
und hieraus
d(E 1¼ E 2¼ )
1 1 E 1¼ E 2¼
2 4 2 4 E 2¼ 2 p2¼ 2 c2 m ¼02 c p¼ 2 c2 m ¼02 c
E 1¼ d E 1¼ c2
E 2¼ d E 2¼ c2
c 2 p¼ d p¼
E 1¼ E 2¼ 2 ¼ c p d p¼ . E 1¼ E 2¼
Damit ergibt sich aus (10.56) ¼
d 3 p1¼
d 3 p¼
¼
¼
p E 1 E2
c2 (E 1 E 2¼ ) ¼
dΩ ¼ d(E 1¼ E 2¼ ) .
(10.57)
Durch Einsetzen dieses Ergebnisses in den durch Integration von dσ über p2¼ erhaltenen Ausdruck und Integration über E 1¼ E 2¼ bekommen wir den Wirkungsquerschnitt d σ dΩ
¼
2 δ(E ¼ E ¼ E E ) p¼ 1 2 1 2 16 (2π h)2 c2 (E 1 E 2 ) p
Mea
2 ¼ ¼ d(E 1¼ E 2¼ ) Mea p dΩ . ¼ ¼ (E 1 E 2 ) 16 (2π h)2 c2 (E 1 E 2 )2 p
Mit der Umbenennung d σ dσ und nach Teilen durch dΩ ¼ wird daraus schließlich dσ dΩ ¼
2
¼
Mea p
(8π hc)2 (E 1 E 2 )2 p
.
(10.58)
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
311
Beispiel 10.1: Elektron-Elektron-Streuung Wir wollen Gleichung (10.58) auf die Elektron-Elektron-Streuung anwenden und bestimmen dazu als erstes die Winkelabhängigkeit der in (10.43) angegebenen Übergangsmatrix Mea . Zunächst gilt Mea 2 M1 2 M2 2 2 Re (M1 M2 ) . Wie in Abschn. 10.2.2 nehmen wir an, daß die einfallenden Elektronenstrahlen unpolarisiert sind, so daß jede der beiden Polarisationsrichtungen mit dem statistischen Gewicht 1/2 vertreten ist. Außerdem soll bei der Messung des Wirkungsquerschnitts keine spezielle Polarisationsrichtung herausgefiltert werden, so daß die Übergangswahrscheinlichkeiten zu Endzuständen verschiedener Polarisationsrichtung summiert werden müssen. Die gesamte Übergangsrate ist dann die Summe der Übergangsraten zwischen allen Polarisationen der Anfangs- und Endzustände, versehen mit dem Gewichtsfaktor 1/2 für jeden der beiden einfallenden Elektronenstrahlen, Mea 2
2
1 4
M1 2 M2 2 2 Re (M1 M2
M1 2 M2 2 2 Re (M1 M2 ) .
l1 ,l2 ,l1 ,l2 1 ¼
¼
(10.59) Zur Berechnung von M1 2 M1 M1 benutzen wir (9.88), (10.43), γα gαβ γ β , bei der Auswertung von M1 die Tatsache, daß u γ β u ein Skalar ist, und die Beziehung u γ β u
u γ β u ,
(10.60)
die in Aufgabe 10.3 bewiesen wird. Indem wir vorerst die Abkürzung k ( p2 p2 )/h beibehalten, bekommen wir M1 2
1 4
2em 0 c2 h
4
hμ 0c k k i ε
2
u(l1 , p1 )γ α u(l1 , p1 ) u(l2 , p2 )γα u(l2 , p2 )
l1 ,l2 ,l1¼ ,l2¼
u(l1 , p1 )γ β u(l1 , p1 ) u(l2 , p2 )γβ u(l2 , p2 )
s.u. 1.
em 0 c2 4 h
4
hμ 0c k k i ε
2
u(l1 , p1)γ β u(l1 , p1 ) u(l1 , p1 )γ α u(l1 , p1 )
l1 ,l2 ,l1 ,l2 ¼
¼
s.u. 2.
em 0 c2 4 h
4
hμ 0c k k i ε
2 Sp
γ β u(l1 , p1 ) u(l1 , p1 )γ α u(l1 , p1 ) u(l1 , p1 )
l1 ,l ¼
Sp
u(l2 , p2 )γβ u(l2 , p2 ) u(l2 , p2 )γα u(l2 , p2 )
1
γβ u(l2 , p2 ) u(l2 , p2 )γα u(l2 , p2 ) u(l2 , p2 ) .
l2 ,l2¼
Dabei wurden in dem mit 1. bezeichneten Schritt die Skalare u(l1 , p1)γ β u(l1 , p1 ) und u(l2 , p2 )γβ u(l2 , p2 ) verschoben, und in dem mit 2. bezeichneten Schritt wurde u Nv
4
ij 1
u i Ni j v j
4
ij 1
Ni j v j u i
Sp(Nvu)
312
10 Quantenelektrodynamik
mit v γ α u und N γ β u ¼ u ¼ sowie Sp A Sp B Sp(A B) benutzt. Unter Verwendung der Beziehungen (8.195), k ( p2 p2¼ )/h und Sp A/(2m 0 c)4 )(Sp A)/(2m 0 c)4 ergibt sich daraus schließlich M1 2 Sp γ β (/p1¼ m 0 c) γ α (/p1 m 0 c) Sp γβ (/p2¼ m 0 c) γα (/p2 m 0 c) , (10.61) 2 2 4 ( p2 p2¼ )( p2 p2¼ ) h e2 μ0 c3 wobei im Nenner i ε h 2 weggelassen wurde, weil herleitungsgemäß der Limes ε 0 zu nehmen ist und dieser bereits hier ausgeführt werden kann. Nach (10.43) geht M2 aus M1 durch die Vertauschungen p1 p2 und l 1 l 2 hervor, und weil die li aus dem zuletzt erhaltenen Ergebnis aufgrund der erfolgten Summationen herausgefallen sind, haben wir ' M2 2 M1 2 '' . (10.62) Mit
p1
°p
2
¼ ¼
¼ ¼ ¼ ¼ ¼ ¼ u(l2, p2) γ β u(l1¼ , p1¼ ) u(l1¼ , p1¼ ) γ α u(l1 , p1) u(l1, p1) γβ u(l2¼ , p2¼ ) u(l2¼ , p2¼ ) γα u(l2, p2) Sp γ β u(l1¼ , p1¼ ) u(l1¼ , p1¼ ) γ α u(l1 , p1) u(l1, p1) γβ u(l2¼ , p2¼ ) u(l2¼ , p2¼ ) γα u(l2 , p2) u(l2, p2)
u(l1 , p1 ) γ α u(l1 , p1 ) u(l2 , p2 ) γα u(l2 , p2 ) u(l2 , p2 ) γ β u(l1 , p1 ) u(l1 , p1 ) γβ u(l2 , p2 )
ergibt sich analog
£
Re(M1 M2 ) 2 h e2 μ0 c3
£
Sp γ β (/ p1 m 0 c) γ α (/ p1 m 0 c) γβ (/ p2 m 0 c) γα (/ p2 m 0 c) . 4 ( p2 p2 )( p2 p2 ) ( p1 p2 )( p1 p2 )
¼
¼
¼
¼
¼
¼
(10.63)
(M2 enthält ein Minuszeichen.) Zur weiteren Auswertung benutzen wir die Beziehungen β p1 m 0 c) γ α (/ p1 m 0 c) 4 gαβ m 20 c2 p1α p1 β p1 p1 α g αβ p1 p1 Sp γ β (/
¼
¼
¼
¼
und p1 m 0 c) γ α (/ p1 m 0 c) γβ (/ p2 m 0 c) γα (/ p2 m 0 c) Sp γ β (/ 16 2m 40 c4 m 20 c2 p1 p1 m 20 c2 ( p1 p1 )( p2 p2 ) m 20 c2 p2 p2 2 p1 p2 p1 p2 ,
¼
¼
¼
¼
¼
¼
¼ ¼
die in den Aufgaben 10.4–10.7 bewiesen werden. Mit diesen ergibt sich zunächst αβ m 2 c2 pα p β pβ p α g αβ p p g m 2 c2 p p 4 g p p g p p 2 αβ αβ 1 1 M1 1 1 1 1 1 1α 1β 1β 1α 1 0 0 2 2 2 3 ( p p ) ( p p ) h e μ0 c 2 2 2 2 8 2m 40 c4 m 20 c2 ( p1 p1 p2 p2 ) p1 p2 p1 p2 p1 p2 p1 p2 , 2 ( p2 p2 )( p2 p2 )
¼
¼
¼
¼
¼
¼
¼
¼ ¼ ¼
¼
¼
¼
¼
¼ ¼
woraus nach (10.62)
M2 2
(h e2μ0 c3 )2
8 2m 40 c4 m 20 c2 ( p1 p2 p1 p2 ) p1 p2 p1 p2 p1 p1 p2 p2 2 ( p1 p2 )( p1 p2 )
¼
¼
¼
¼
¼ ¼
¼
¼
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
folgt, sowie 4 Re(M1 M2 ) 2 he2μ0 c3
2m
313
4 c4m 2 c2p p m 2 c2 ( p p )( p p )m 2 c2p p 2 p p p p 1 1 1 2 2 2 1 2 1 2 1 2 0 0 0 0
( p2 p2 )( p2 p2 ) ( p1 p2 )( p1 p2 )
.
Zur weiteren Rechnung gehen wir ins Schwerpunktsystem. In diesem gilt p, p1 p2 p , m 20 c4 p12 c2 m 20 c4 p2 c2 E 2 E , m 20 c4 p1 2 c2 m 20 c4 p 2 c2 E 2 E ,
p1
p2
E1
E1
und wegen der Energieerhaltung, die aus dem Auftreten der δ 4 -Funktion in (10.43) folgt, ergibt sich hieraus 2E E 1 E 2 E 1 E 2 2E mit der Folge E1
E2
E1
E2
E,
p p .
(10.64)
Mit diesen Ergebnissen und p p
p p cos ϑ
(10.64)
p2 cos ϑ ,
(10.65)
wobei ϑ den von p und p eingeschlossenen Winkel bezeichnet, erhalten wir p1 p1
E 2 /c2 p1 p1
m 20 c2 p2 (1 cos ϑ) p2 p2 ,
p1 p2
E 2 /c2 p1 p2
m 20 c2 2 p2
p1 p2
E 2 /c2 p1 p2
m 20 c2 p2 (1 cos ϑ) p1 p2 ,
( p1 p2 )( p1 p2 )
( p1 p
2)
2
( p1 p
( p2 p2 )( p2 p2 )
( p2 p2 )
2
2 p
1)
2
p1 p2 ,
2 p
2 (1 cos ϑ) ,
2 (1 cos ϑ) .
Einsetzen dieser Beziehungen in die zuletzt erhaltenen Ausdrücke für M2 2 , M2 2 und Re(M1 M2 ) liefert mit p p p1 p p2 p p1 p p p für p1 p2 M1 2
M2 2
2 2 (m 2 c2 p2 )2 3 p4 2 p2 (2m 2 c2 p2 ) cos ϑ p4 cos2 ϑ 0 0 2 he2μ0 c3 , p4 (1 cos ϑ)2 ' 2 m 4 c 4 4 p 4 ' 0 M1 2 ' und Re(M1 M2 ) 2 he2μ0 c3 . cos ϑ cos ϑ p4 sin2 ϑ
Mit diesen Ergebnissen folgt aus (10.59) nach Umwandlung von cos ϑ in sin ϑ 4 3 2 3m 40 c4 12m 20 c2 p2 8 p4 4(m 20 c2 2 p2 )2 2 3 Mea 2 4 he μ0 c . 1 p4 sin2 ϑ p4 sin4 ϑ Wird dies in Gleichung (10.58) eingesetzt, so ergibt sich schließlich mit (10.64) als differentieller Wirkungsquerschnitt der Elektron-Elektron-Streuung dσ dΩ ¼
3 3m 40 c4 12m 20 c2 p2 8 p4 α hc 2 1 2E p4 sin2 ϑ
4(m 20 c2 2 p2 )2 p4 sin4 ϑ
4 .
(10.66)
314
10 Quantenelektrodynamik
Er wurde zuerst von C. Møller abgeleitet, weshalb die durch ihn beschriebene Streuung oft als Møller-Streuung bezeichnet wird. Im nicht-relativistischen Grenzfall gilt p2 m 20 c2 sowie E m 0 c2 , und das Ergebnis reduziert sich auf α 2 h 2 m 20 c2 3 4 dσ dΩ ¼ 4 p4 sin4 ϑ sin2 ϑ α 2 h 2 m 20 c2 1 1 1 . (10.67) 16 p4 sin4 ϑ/2 cos4 ϑ/2 sin2 ϑ/2 cos2 ϑ/2
Die zwei ersten Terme der letzten Klammer entsprechen dem Ergebnis (Q4.176) für die Streuung eines Elektrons an einem festen Coulomb-Potential, dσ/dΩ sin 4 ϑ/2: Im Schwerpunktsystem fällt das erste Elektron unter einem Winkel ein, der gegenüber dem Einfallswinkel des zweiten um π gedreht ist, weshalb in der Streuformel ein Beitrag sin 4 ϑ/2 für das eine und ein Beitrag sin 4 (π ϑ)/2 cos 4 ϑ/2 für das andere Elektron auftritt. Der letzte Klammerterm ist ein Interferenzterm. Im ultra-relativistischen Grenzfall gilt p2 m 20 c2 sowie E p c, und aus (10.66) ergibt sich dσ α2h 2 1 2 4 α2h 2 1 1 1 . (10.68) dΩ ¼ 4 sin2 ϑ p2 4 p2 sin4 ϑ sin4 ϑ/2 cos4 ϑ/2
Da Positronen bis auf die Ladung die gleichen Eigenschaften wie Elektronen besitzen und sich wie diese paarweise abstoßen, gelten die abgeleiteten Formeln auch für die Streuung zweier Positronen.
Beispiel 10.2: Elektron-Photon-Streuung Die Rechnungen, die von der Übergangsamplitude (10.45) der Elektron-Photon-Streuung zum zugehörigen differentiellen Wirkungsquerschnitt führen, sind ebenso aufwendig, jedoch ähnlich wie bei der Elektron-Elektron-Streuung und werden aus Platzgründen nicht vorgeführt. Unter der Annahme, daß der einfallende Elektronen- und Photonenstrahl unpolarisiert sind und daß bei der Streumessung keine spezielle Polarisationsrichtung herausgefiltert wird, ergibt sich als differentieller Wirkungsquerschnitt der auch als Compton-Streuung bezeichneten Streuung des Photons an einem Elektron im Ruhesystem des Elektrons k 2 (10.69) k¼ sin ϑ . Dabei ist ϑ der Ablenkungswinkel des Photons, d. h. k k ¼ k k ¼ cos ϑ, und als Folge der durch 4 dσ dΩ ¼
1 2
αh c 2 k¼ 2 k¼ k k m 0 c2
die δ -Funktion in (10.45) zum Ausdruck kommenden Energie-Impuls-Erhaltung gilt k k¼ 1h k(1cos ϑ)/(m 0 c)
(10.70)
als relativistische Verallgemeinerung der klassischen Beziehung (Q2.25) (Aufgabe 10.8). Im Grenzfall kleiner Photonenenergien bzw. -impulse, h ω m 0 c2 bzw. h k m 0 c, folgt aus (10.70) k ¼ k , und aus (10.69) wird damit dσ 1 αhc 2 2ϑ . sin (10.71) 2 dΩ ¼ 2 m 0 c2
10.5 Teilchenzerfälle
315
Die Integration über den Raumwinkel dΩ ¼ sin ϑ dϑ dϕ, π 1 α hc 2 2π 2 dϕ sin ϑ sin ϑ dϑ , 2 σ 2 m 0 c2 0 0 liefert den sogenannten Thomson-Streuquerschnitt σ
8π 3
α hc 2 . m 0 c2
(10.72)
Für sehr hohe Photonenenergien, h k m 0 c, gilt zunächst exakt ¼
k k
1 1(1 cos ϑ)/ε
ε 1ε cos ϑ
ε
mit
m0c h k
1.
sin2 ϑ und k ¼ / k können dann gegen k / k ¼ vernachlässigt werden, und es ergibt sich genähert dσ 1 α hc 2 k ¼ 1 α hc 2 ε (10.73) dΩ ¼ 2 m 0 c2 k 2 m 0 c2 1ε cos ϑ sowie σ
πε
sin ϑ α hc 2 π z cos ϑ dϑ m 0 c2 0 1ε cos ϑ
oder σ
1 πα 2 h dz m 0 c k 1 1εz
πα 2 h 2 ln m 0 c k ε
πα 2 h 2h k . ln m 0 c k m0c
(10.74)
10.5 Teilchenzerfälle Die Überlegungen des letzten Abschnitts gelten auch für den Zerfall eines Teilchens. Als einlaufende Teilchen hat man in diesem Fall nur ein einziges, und wir betrachten im folgenden nur den durch die chemische Gleichung e1
a
e
(10.75)
2
beschriebenen Spezialfall, daß ein Teilchen in8zwei zerfällt. Aus Gleichung (10.52) ergibt sich in diesem mit P p1 p, E 1 E, n (2V E n )1 1/(2V E) und einer wie im letzten Abschnitt vorgenommenen Zerlegung der δ 4 -Funktion im Schwerpunktsystem des zerfallenden Teilchens ( p 0 und E m 0 c2 )
d W pd 3F P
p p) δ(E E E) d p d p M c δ ( p8(2π E E h ) E p ) δ(E E m c ) d p d p M δ ( p 8(2π . E E h ) m ea
¼
2 2
3
1
2
1
3
2
2
ea
2
1
3
1
2
1
2
3
1
0
2
0
2
3
2
3
1
1
2
2
2
316
10 Quantenelektrodynamik
Die durch die Deltafunktionen bewirkten Einschränkungen können wie im letzten Abschnitt durch Integration über p2¼ und E 1¼ E 2¼ explizit berücksichtigt werden und
p führen mit (10.56), (10.57), p¼ p1¼ p2¼ und der Bezeichnung dΓ d W dΓ
2 Mea2 2 p2 4 dΩ . 32π h m 0 c
d 3F P ¼
zu
(10.76)
Dabei ist p als Lösung der Gleichung E 1 E 2 m 0 c2 bzw. m01 2 c2
p 2
p 2 m 0 c
m02 2 c2
(10.77)
zu bestimmen und durch
p m20c
1
m 01 2 m 02 2 m 02 m 02
2
2
m 01 2 m02
m 02 2 m 02
(10.78)
gegeben. Mea kann bei spinbehafteten Teilchen winkelabhängig sein. Im allgemeinen wird man diese Winkelabhängigkeit jedoch durch Mittelung über alle Spinrichtungen des zerfallenden und Summation über alle Spinrichtungen der beim Zerfall entstehenden Teilchen eliminieren. Der in (10.78) angegebene Wert von p ist ebenfalls winkel2unabhängig. Das spingemittelte dΓ kann daher über dΩ integriert werden und ist mit dΩ 4π durch
Γ
2 Mea2 2p 4 8π h m 0 c
(10.79)
gegeben, wobei für p die rechte Seite von (10.78) einzusetzen ist. Γ wird als Zerfallsbreite bezeichnet, manchmal stattdessen auch G h Γ (Folge: statt (10.80) gilt dann 2 τ h /G). Γ d W p d 3F ist die Gesamtwahrscheinlichkeit pro Zeitintervall dt für den Übergang des Teilchens a in die Zerfallsprodukte e1 und e2 und ist zeitunabhängig. Nach der Zeit t ist die Wahrscheinlichkeit für den Übergang daher W (t)Γ t, und für t τ mit τ
1 Γ
(10.80)
wird W 1. (Da der Ausgangszustand als nicht normierbare Welle angesetzt wurde, beschreibt er nicht ein Teilchen, sondern einen Teilchenstrom, also viele Teilchen. Aus vielen anfänglichen Teilchen können durch Zerfall daher viele Teilchenpaare entstehen, und daher kann W (t) größer als eins werden.) τ ist die Zeit, nach der die Wahrscheinlichkeit für die Erzeugung eines Teilchenpaares und damit den Zerfall eines Ausgangsteilchens gleich eins wird und kann daher als statistische Lebensdauer des zerfallenden Teilchens angesehen werden.
10.6 Feynman-Regeln
317
10.6 Feynman-Regeln Meßbare Konsequenzen der Quantenfeldtheorie von Teilchenwechselwirkungen ergeben sich bei Teilchenstößen aus dem durch (10.55) bzw. (10.58) gegebenen differentiellen Wirkungsquerschnitt und bei Teilchenzerfällen aus der mittleren Lebensdauer bzw. der durch (10.79) gegebenen Zerfallsbreite. In beiden Fällen benötigt man das Übergangselement Mea bzw. die mit diesem gemäß (10.51) zusammenhängende Übergangsamplitude Sea . Für deren Berechnung erwiesen sich die zugehörigen FeynmanDiagramme in allen bislang betrachteten Fällen als außerordentlich nützlich, weil sie in übersichtlicher Weise graphisch darstellen, welche ein- und auslaufenden Teilchen beteiligt sind und welche virtuellen Teilchen bei internen Wechselwirkungen auftreten. R. Feynman hat herausgefunden, daß sich aus den Diagrammen mit Hilfe von heute nach ihm benannten Feynman-Regeln, welche den einzelnen Diagrammelementen bestimmte mathematische Ausdrücke zuordnen, die Formeln zur Berechnung von Sea ablesen lassen. Die meisten dieser Regeln können für den uns hier ausschließlich interessierenden Fall der Quantenelektrodynamik aus den bisher betrachteten Beispielen abgeleitet werden. Im folgenden werden sie jedoch gleich systematisch zusammengestellt, und ihre Richtigkeit wird anschließend anhand früher behandelter Beispiele überprüft. Regeln, die nicht aus dem Vorangegangenen folgen, werden im Nachhinein bewiesen. Wir sind bei konkreten Beispielen so vorgegangen, daß wir zuerst Sea durch die Zustände ein- und auslaufender Teilchen sowie orts- und zeitabhängige Operatoren ausgedrückt haben. Für diese Ortsdarstellung gibt es Feynman-Regeln im Ortsraum. Werden die Operatoren nach ebenen Wellen entwickelt, wie wir es später getan haben, so gibt es für die dabei erzielten Ausdrücke Feynman-Regeln im Impulsraum. Hier hängen die Regeln noch davon ab, ob nach einem Kontinuum oder nach einem vollständigen Satz diskreter ebener Wellen entwickelt wird. Die im folgenden angegebenen Regeln beziehen sich auf den zuletzt genannten Fall.
10.6.1 Feynman-Regeln der QED im Impulsraum •
Ein Streu- oder Zerfallsprozeß wird eindeutig durch Anzahl und Art der ein- und auslaufenden Teilchen festgelegt. Die zugehörige Übergangsamplitude ist eine Reihe ½ (n) Sea δea Sea . n 1
•
Zur Amplitude der n-ten Ordnung tragen alle Feynman-Diagramme bei, deren einund auslaufende Linien die ein- und auslaufenden Teilchen des betrachteten Prozesses beschreiben können. Berücksichtigt werden alle topologisch voneinander verschiedenen Feynman-Diagramme n-ter Ordnung. Zu jedem von diesen gehört eine (mn) (n) Teilamplitude Sea , deren Summe Sea ergibt, (n) Sea Sea(mn) . m
318
10 Quantenelektrodynamik einlaufend m 0 c2 u(l, p) V Ep m 0 c2 v(l, p) V Ep
Elektron Äußere Linien
Positron Photon
i (2π h)
4
Vertex
Innere Linien
hμ0 c2 λλ (λ) g εα (k) 2V ωk
auslaufend m 0 c2 u(l ¼ , p¼ ) V Ep m 0 c2 v(l ¼ , p¼ ) V Ep ¼
¼
hμ0 c2 λ λ (λ ) ¼ g εα (k ) 2V ωk ¼
¼
¼
¼
e α 4 ¼ γ δ p p q h
Fermion i
d 4q d 4q h( q/ m 0 c) S (q).. i .. F 4 4 (2π h) (2π h) q q m 20 c2 i ε 4 d 4q hμ0 c d k D (k).. i gαβ .. Photon i Fαβ 4 (2π) (2π h)4 q q/h 2 i ε
Tabelle 10.5: Die Impulse ein- und auslaufender Teilchen sind mit p bzw. p¼ , die virtueller Teilchen mit q bezeichnet. Auf einen Vertex zugerichtete Impulse werden negativ, von ihm weggerichtete Impulse positiv gezählt. Daher geht der Impuls q virtueller Teilchen am einen Vertex mit q und an dem zugehörigen Nachbarvertex mit q ein. Der obere Index der dem Vertex zugeordneten Matrix γ .. wird mit einem der Indizes des Faktors gαβ der am Vertex einmündenden Photonlinie verjüngt. Der Faktor g λλ bei den äußeren Photonlinien ist auf die Normierung (8.115) der (reellen) Wellenamplituden εα (λ) zurückzuführen. (Es gibt auch Darstellungen mit anderer Normierung, bei denen dieser Faktor entfällt.) Die Pünktchen am Ende der Integrale für die inneren Linien sollen andeuten, daß noch Terme folgen können, über die integriert wird.
•
• •
Zur Übergangsamplitude eines Feynman-Diagramms tragen dessen einzelne Elemente je einen multiplikativen Faktor bei, der Tabelle 10.5 zu entnehmen ist. Die Anordnung der fermionischen Faktoren – Spinor, γ -Matrix oder Propagator einer inneren Fermionlinie – ist dabei in der Reihenfolge zu treffen, wie sie beim Durchlaufen der Fermionlinien entgegen der Pfeilrichtung und über die Vertizes hinweg im Diagramm auftritt. (mn) Für jede geschlossene Fermionenschleife ist in Sea ein Faktor 1 einzufügen. Ein Faktor 1 ist auch einzufügen, wenn eine ungerade Anzahl von Transpositionen notwendig ist, um die Fermion-Operatoren in Normalform zu bringen.
Erläuterungen und Beweise. Nach (10.11)–(10.13) enthält der Operator S (n) , aus dem (mn) gebildet werden, unter dem Integral n mal das Produkt die Übergangsamplituden Sea α ψ(x) A α (x): mit n verschiedenen Argumenten x 1 bis x n . Hieraus folgt: Jedes :ψ(x)γ
10.6 Feynman-Regeln
319
Diagramm n-ter Ordnung enthält n verschiedene Vertizes, an denen je zwei durch ψ und ψ beschriebene Fermionen- und eine durch A α beschriebene Photonlinie aufeinandertreffen. (Durch letzteres wird garantiert, daß an jedem Vertex Ladungserhaltung gilt.) Aus der Struktur von S (n) und dem Wickschen Theorem folgt: Jedes FeynmanDiagramm mit einer beliebigen Anzahl von Vertizes, bei dem an jedem Vertex zwei Fermionlinien durchgängiger Richtung und eine Photonlinie münden, stellt einen möglichen Prozeß dar. Alle Linien, die zwei Vertizes verbinden, sind dabei innere, alle anderen äußere Linien. (mn) nach Nach Tabelle 10.5 bringen n Vertizes den Faktor (e/h)n mit sich, den Sea (n) (10.11)–(10.13) enthalten muß. Der in S auftretende Vorfaktor 1/n kommt dagegen (mn) in den Regeln zur Berechnung von Sea nicht vor, weil die Zuordnung der RaumZeit-Punkte x 1 , . . . , x n zu den Vertizes beliebig ist und es daher n topologisch äquivalente Diagramme gibt, die durch Permutation der x 1 , . . . , x n auseinander hervorgehen. (Beispiel: Von den vier in Abb. 10.12 dargestellten detaillierten Diagrammen zweiter Ordnung für die Elektron-Elektron-Streuung gehen die zwei ersten auseinander durch Vertauschen der beiden Vertizes hervor und sind daher topologisch äquivalent. Dasselbe gilt für die zwei letzten, die jedoch von den beiden ersten topologisch verschieden sind. In (10.43) gibt es daher nur zwei Summanden ohne den Faktor 1/2 von S (2) .) Eine geschlossene Fermionenschleife wird z. B. durch den achten Summanden von Gleichung (10.39) beschrieben und ist in Abb. 10.11 dargestellt. Nach (9.83) gilt ψ(x 1 ) ψ(x 2 ) i SF (x 1 x 2 )
ψ(x 1 ) ψ(x 2 ) i SF (x 1 x 2 ) ,
weil die Vertauschung von ψ und ψ zu einem Minuszeichen führt. Eine der beiden Kontraktionen der Schleife führt daher zu einem Minuszeichen. Das gilt in jedem beliebigen Diagramm mit einer geschlossenen Fermionenschleife, da in diesem stets beide Kombinationen ψ(x i ) ψ(x j ) und ψ(x j ) ψ(x i ) auftreten. Die Gültigkeit der letzten Regel (Faktor 1 bei ungerader Anzahl fermionischer Transpositionen zur Normalform) ist offensichtlich. Bei den Diagrammen zur ElektronElektron-Streuung in Abb. 10.12 führt sie zu einem Faktor 1 bei der direkten Streu(2) ung, weil in S(ee) beim Übergang zur Normalform nach (10.40) ψ ( )(x 1 ) und ψ ( )(x 2 ) vertauscht werden müssen. (Das Matrixelement für die Austauschstreuung geht nach Abb. 10.12 aus dem für die direkte Streuung hervor, indem man in dem durch (10.41) gegebenen Endzustand e die Vertauschung a l, p a l, p vornimmt. Wegen der dabei 1 1 2 2 anzuwendenden Antivertauschungsrelationen führt dies gegenüber dem Matrixelement für die direkte Streuung zu einem weiteren Minuszeichen.) Die in Tab. 10.5 angegebenen Faktoren für die inneren Linien sind nach ihrer ursprünglichen Definition (9.76) bzw. (9.86) quadratisch in den Amplituden u(l, p) und v(l, p) bzw. εα(λ) (k), während die Faktoren für die äußeren Linien in diesen nur linear sind. Es macht daher Sinn, wenn man sich die inneren Linien im Gegensatz zu den äußeren als doppelte Linien vorstellt, von denen eine die Propagation vom ersten zum zweiten der durch sie verbundenen Vertizes beschreibt, die andere die Propagation vom zweiten zum ersten. Nutzanwendungen dieser Vorstellung werden sich in Abschn. 10.10.2 ergeben. ¼
¼
¼
¼
320
10 Quantenelektrodynamik
Beispiel 10.3: Paarerzeugung durch ein Gammaquant Das Feynmandiagramm für diesen Vorgang ist das Diagramm (d) aus Abb. 10.2. Das Anschreiben der zugehörigen Faktoren in der Reihenfolge auslaufendes Elektron, Vertex, auslaufendes Positron und einlaufendes Photon unter Voranstellen aller skalaren Faktoren liefert i (2π h )4 em 0 c2 h μ0 c2 u(l ¼ , p¼ )γ α v(l ¼¼ , p¼¼ )g λλ εα (λ)(k) 4 ¼ ¼¼ (1) Sea δ p p h k . 3/2 h V 2ωk Ep Ep ¼
¼¼
Nimmt man hierin die Ersetzung V 1/2 (2π h )3/2 für die beiden Fermionen und V 1/2 (2π)3/2 für das Photon vor, die nach (10.17) bzw. (10.4) und (10.10) mit dem Übergang von diskreten zu kontinuierlichen Wellen verbunden sind, setzt man insgesamt also V 3/2 (2π h )3 (2π)3/2 , so wird daraus das früher abgeleitete Ergebnis (10.20), (1)
Sea
i em 0 c3 h μ0 u(l ¼ , p¼ )γ α v(l ¼¼ , p¼¼ )g λλ εα (λ)(k) 4 ¼ ¼¼ δ p p h k . 4πωk Ep Ep ¼
¼¼
Beispiel 10.4: Elektron-Elektron-Streuung Wir berechnen den Beitrag der direkten Streuung mit Hilfe des ersten Diagramms der rechten Seite in Abb. 10.12, schreiben die Terme in der Reihenfolge innere Photonlinie, linkes auslaufendes Elektron, linker Vertex, linkes einlaufendes Elektron, rechtes auslaufendes Elektron, rechter Vertex und rechtes einlaufendes Elektron an und erhalten unter Voranstellen aller skalaren Faktoren und Berücksichtigung eines Faktors 1 nach der letzten Feynman-Regel d 4q δ 4 p2¼ p2 q 4 ¼ e2 (2π h )8 (m 0 c2 )2 μ0 c (2) Sea ( 1)( i)( i)2 δ p1 p1 q (2π h )4 q q/h 2 i ε h V 2 Ep1 Ep Ep2 Ep ¼
¼
1
2
gαβ u(l1 , p1) γ α u(l1 , p1) u(l2, p2)γ β u(l2 , p2) ¼
¼
¼
¼
i e2 (2π h )4 m 20 c4 h μ0 c δ 4 p1¼ p2¼ p1 p2 gαβ u(l1¼ , p1¼ )γ α u(l1 , p1 )u(l2¼ , p2¼ )γ β u(l2 , p2 ) . V 2 Ep1 Ep Ep2 Ep ( p2 p2¼ )( p2 p2¼ ) ¼
¼
1
2
Das ist gerade der M1 enthaltende Teil des Ergebnisses (10.43). Der Beitrag der indirekten Streuung ergibt sich analog.
Dem Leser wird empfohlen, die Gültigkeit der Feynman-Regeln noch an weiteren der früher berechneten oder an neu zu berechnenden Amplituden zu überprüfen (Aufgaben 10.9 und 10.10).
10.7 Korrekturen vierter Ordnung Zu allen in zweiter Ordnung der Störungsrechnung erhaltenen Prozessen gibt es in höheren Ordnungen Korrekturen. Weil die Störungsrechnung bei den Übergangsamplituden auf eine Entwicklung nach der kleinen Größe α 1/137 hinausläuft (Aufgabe 10.12),
10.7 Korrekturen vierter Ordnung
321
sollte es sich dabei im allgemeinen nur noch um sehr kleine Korrekturen handeln, es sei denn, die Koeffizienten der α-Entwicklung werden sehr groß. Häufig ist das nicht der Fall. Es gibt jedoch wichtige Ausnahmen hiervon, die zudem sehr wichtig sind und bei denen die Koeffizienten sogar unendlich werden. Das ist der Grund dafür, warum wir uns im folgenden kurz mit einem Beispiel für Korrekturen höherer Ordnung befassen. Mit dem Problem divergenter Terme höherer Ordnung werden wir uns dann ausführlich im nächsten Abschnitt befassen. Beispiel 10.5: Elektron-Positron-Streuung Die Elektron-Positron-Streuung wird wie die Elektron-Elektron-Streuung von der Störungsreihe (10.11) schon in zweiter Ordnung erfaßt und durch das Feynman-Diagramm (7) der Abb. 10.8 beschrieben. (Ähnlich wie das Diagramm (11) der Elektron-Elektron-Streuung die vier detaillierteren Diagramme der Abb. 10.12 zusammenfaßt, gibt es auch zum Diagramm (7) vier detailliertere Diagramme.) Wir betrachten in diesem Abschnitt Korrekturen höherer Ordnung zur ElektronPositron-Streuung, weil unter diesen Beiträge enthalten sind, die auch bei vielen anderen Prozessen auftreten und die Besonderheit aufweisen, zu divergieren. Bei der Elektron-Positron-Streuung muß es in jeder Ordnung ein ein- und ein auslaufendes Elektron sowie ein ein- und ein auslaufendes Positron geben, d. h. die zugehörigen FeynmanDiagramme haben vier externe Fermionlinien. Weil S (3) drei Photonenoperatoren A α enthält, von denen nur zwei kontrahiert werden können, ist an allen Prozessen mit nicht-verschwindenden Korrekturen dritter Ordnung ein externes Photon beteiligt. Korrekturen zur Elektron-PositronStreuung sind daher mindestens vierter Ordnung. S (4) enthält vier Photonen- und acht Fermionenoperatoren. Bei vier externen Fermionlinien müssen daher alle Photonen- und vier Fermionenoperatoren kontrahiert sein, was zu je zwei inneren Photon- und Fermionlinien führt. Zugehörige Feynman-Diagramme sind in Abb. 10.13 präsentiert. Außer diesen gibt es noch acht weitere, topologisch verschiedene Diagramme, die ähnlich den vier ersten der zweiten Zeile sind und sich von diesen durch die Plazierung einer inneren Photonlinie unterscheiden. Außer den verbundenen Graphen der Abb. 10.13, bei denen von allen inneren Linien eine Verbindung zu den äußeren Linien besteht, gibt es noch weiter Graphen vierter Ordnung, für die das nicht gilt. Diese zerfallen entweder in unverbundene Teilgraphen, wie das bei dem in Abb. 10.4 dargestellten Diagramm zweiter Ordnung der Fall ist, oder sie enthalten einen verbundenen und einen unverbundenen Anteil. Ein Beispiel für das Letztere bildet eine Kombination des Diagramms (7) aus Abb. 10.8 mit dem Diagramm der Abb.10.11. Der verbundene Anteil erhöht die Amplitude zweiter Ordnung um eine Korrektur der Ordnung α 2 . Die Vakuumblase beschreibt
Abb. 10.13: Korrekturen vierter Ordnung zur Elektron-Positron-Streuung.
322
10 Quantenelektrodynamik
dagegen eine Vakuumfluktuation (Bildung und Vernichtung eines virtuellen Elektron-PositronPaares) und liefert nur einen physikalisch irrelevanten Phasenfaktor (Abschn. 10.8.2). Wie schon eingangs erwähnt gibt es in den Diagrammen der Abb. 10.13 Teile, deren Beitrag zur Amplitude vierter Ordnung divergiert. Diese Teildiagramme finden sich in Abb. 10.16. Teildiagramm (a) ist im letzten Diagramm der ersten und der zweiten Zeile von Abb. 10.13, (b) im zweiten und vierten und (c) im dritten Diagramm der zweiten Zeile enthalten. Die Divergenzen dieser Teildiagramme und ihre Behebung werden in den nächsten Abschnitten besprochen.
10.8 Strahlungskorrekturen Wir befassen uns in diesem Abschnitt zunächst systematisch damit, welche Übergangsamplituden möglicherweise divergieren, und werden dabei unter anderen auch auf die Teildiagramme stoßen, denen im letzten Abschnitt divergente Übergangsamplituden zugesprochen wurden. Bei der im Anschluß durchgeführten Untersuchung aller Graphen mit potentieller Divergenz wird sich zeigen, daß diese sogar die einzigen mit echten Divergenzen sind, die nicht auf einfache Weise beseitigt werden können. Divergente Korrekturen höherer Ordnung werden oft als Strahlungskorrekturen bezeichnet.
10.8.1 Primitiv divergente Feynman-Graphen In den Übergangsamplituden sämtlicher Ordnungen treten Impulsintegrationen auf, die sich von bis erstrecken und inneren Linien zugeordnet sind. Durch Abzählen der zur Berechnung einer Übergangsamplitude insgesamt erforderlichen Einfachintegrationen läßt sich erkennen, welche Übergangsamplituden möglicherweise divergieren. Tabelle 10.5 ist zu entnehmen, daß jeder inneren Fermionlinie für q q q 1/2 ein Integrand 1/q und jeder Photonlinie ein Integrand 1/q 2 zugeordnet ist. Von jedem Vertex kommt ein Integrand δ 4 (q), und in n-ter Ordnung gibt es n solche Beiträge. Mit Fi Anzahl innerer Fermionlinien ,
Pi Anzahl innerer Photonlinien
verhält sich jede Übergangsamplitude n-ter Ordnung daher wie
P
P
lim
P
n δ 4 (q) d 4Fiq d 4 Piq F 2P P q i q i
P
δ4 (Pe
Pa ) lim P D , P
(10.81)
wobei D den gleich zu berechnenden potentiellen Divergenzgrad angibt. Durch n 1 der n im Zähler auftretenden δ 4 -Funktionen wird die Divergenz von 4(n 1) Impulsintegrationen aufgefangen, weil nach (10.51) eine δ 4 -Funktion übrig bleiben muß, welche die Erhaltung des gesamten Viererimpulses bewirkt. Aus der Anzahl verbliebener q-Integrationen ergibt sich unter Berücksichtigung der q -Potenzen im Nenner D
4(Fi Pi
n 1)
Fi
2Pi
3Fi 2Pi 4
4n .
(10.82)
10.8 Strahlungskorrekturen
323
D
Fa
Pa
Bezeichnung
Graph
4
0
0
Vakuumblase
3
0
1
Fermionenring mit einem Vertex
2
0
2
Selbstenergie des Photons
1
0
3
Fermionenring mit drei Vertizes
1
2
0
Selbstenergie des Elektrons (Positrons)
0
0
4
Photon-Photon-Streuung
0
2
1
Vertexkorrektur
Abb. 10.14: Primitiv divergente Feynman-Graphen. Die Vakuumblase geht nach Zerschneiden der Photonlinie in den Selbstenergie-Graphen des Photons und nach Zerschneiden einer Fermionlinie in den Selbstenergie-Graphen des Elektrons (Positrons) über.
In diesem Ergebnis können n, Fi und Pi noch durch Fa Anzahl äußerer Fermionlinien ,
Pa Anzahl äußerer Photonlinien
ausgedrückt werden, wodurch das Ergebnis von der betrachteten Ordnung der Störungsrechnung unabhängig wird. Jede äußere Linie hängt nur an einem Vertex, jede innere dagegen an zwei Vertizes, und auf jeden Vertex laufen zwei Fermionen- sowie eine Photonlinien zu. Daher gilt 1 (10.83) Pa 2Pi n (Fa 2Fi ) , 2 und für D ergibt sich damit bzw. mit Pi (n Pa )/2 sowie Fi n Fa /2 aus (10.82) D
4 3Fa /2 Pa .
(10.84)
Für D 0 divergiert die Übergangsamplitude im allgemeinen, es sei denn, die Divergenz wird durch besondere Symmetrien vermieden. (Ein Beispiel hierfür liefert die in Abschn. 10.8.3 behandelte Photon-Photon-Streuung.) Für D>0 ist die potentielle Divergenz wie die von P D für P , für D 0 ist sie logarithmisch wie 2P bei 1 d p/ p ln P. Eine Übergangsamplitude kann auch für D<0 divergieren, wenn bereits eine in ihm enthaltene Teilintegration divergiert. Dieser Teilintegration entspricht in dem zugehörigen Feynman-Diagramm ein divergenter Teilgraph. Ein divergenter Graph (oder Teilgraph), der keine kleineren divergenten Bestandteile enthält, heißt primitiv divergent.
324
10 Quantenelektrodynamik
Nach (10.84) ist der potentielle Divergenzgrad D von der betrachteten Ordnung der Störungsrechnung unabhängig und hängt allein von der Zahl einlaufender und auslaufender Teilchen ab. Offensichtlich gilt D 4, was dazu führt, daß es in der QED nur eine kleine Anzahl primitiv divergenter Graphen bzw. Teilgraphen gibt. Diese sind in Abb. 10.14 aufgeführt. Die den primitiv divergenten Graphen entsprechenden Prozesse werden in den nächsten Abschnitten besprochen. Am wichtigsten sind dabei die Selbstenergie des Photons und des Elektrons bzw. Positrons sowie die Vertexkorrektur. Für diese werden die Übergangsamplituden explizit berechnet, und es wird gezeigt, wie die auftretenden Divergenzen durch eine physikalische Reinterpretation behoben werden können. Zur Bedeutung der übrigen primitiv divergenten Graphen wird in den nächsten zwei Teilabschnitten kurz das nötigste gesagt.
10.8.2 Vakuumgraphen und Fermionenringe Vakuumgraphen. Die schon in zweiter Ordnung auftretende Vakuumblase und alle zusätzlich in höheren Ordnungen auftretenden Vakuumgraphen (Feynman-Graphen ohne äußere Linien) treten außer bei Wechselwirkungsprozessen zwischen Teilchen auch im reinen Vakuum auf. Ihre Summe liefert die gesamte Übergangsamplitude für den Übergang von Vakuum zu Vakuum, und die Wahrscheinlichkeit dafür muß eins betragen, ' ' '0 S V G 0'2 1 Sea 0 S V G 0 ei α . Die Divergenz äußert sich hier in einer Divergenz des Phasenfaktors α. Bei Wechselwirkungsprozessen sind die Vakuumgraphen nicht mit den Linien für ein- und auslaufende Teilchen verbunden, es handelt sich um unverbundene Teilgraphen (siehe dazu auch Abschn. 10.7). In der Übergangsamplitude äußert sich diese Unverbundenheit darin, daß die entsprechenden Integrationen von denen für die verbundenen Anteile des entsprechenden Prozesses separieren, d. h.
. . . S . . . . . . S . . .0 SV G 0 . . . S . . .ei α . ¼
¼
Auch bei Wechselwirkungsprozessen liefern die Vakuumgraphen also nur einen physikalisch irrelevanten Phasenfaktor. Fermionenringe mit einem oder drei Vertizes. Die divergenten Fermionenringe aus Abb. 10.14 mit einem bzw. drei Vertizes bilden einen Spezialfall von Fermionenringen mit einer ungeraden Anzahl von Vertizes. Zu jedem Ring, der von der Ladung im Uhrzeigersinn durchlaufen wird, gibt es einen zweiten, der entgegen dem Uhrzeigersinn durchlaufen wird. Für den Fall einer ungeraden Anzahl von Vertizes gilt das Theorem von Furry, nach dem sich die zugehörigen Übergangsamplituden gegenseitig kompensieren. Daher spielt die bei ein oder drei Vertizes auftretende Divergenz keine Rolle. Auf den (nicht besonders schwierigen) Beweis des Furry-Theorems wird hier verzichtet.
10.8 Strahlungskorrekturen
325
1’
2’ 2’
1’ 1’
2’ 1’
2’ 2’
1’ 1’
2’
1
2
2
2
2
2
2
1
1
1
1
1
Abb. 10.15: Die topologisch verschiedenen Feynman-Diagramme der Photon-Photon-Streuung.
10.8.3 Photon-Photon-Streuung Bei der Photon-Photon-Streuung gibt es vier äußere Photonlinien, zwei für einlaufende und zwei für auslaufende Photonen. Für eine nicht-verschwindende Übergangsamplitude muß in S (n) zu jedem Photon ein Photonenoperator A α enthalten sein. Die niedrigste Übergangsamplitude ist daher vierter Ordnung und lautet 4 0 ' ' 1)γ α ψ(x 2 )γ α ψ(x (4) 1) A α (x1): :ψ(x 2) A α (x2): Sea e'T :ψ(x e4 4 h ' 1 3)γ α ψ(x 4 )γ α ψ(x 3) A α (x3)::ψ(x 4) A α (x4): ''a d 4x1 d 4x2 d 4x3 d 4x4 :ψ(x mit a b (λk11) b(λk22) 0 , e b (λk 1) b(λk 2) 0 . ¼
¼
¼
¼
1
2
Da es keine äußeren Fermionlinien gibt, müssen alle Fermionenoperatoren kontrahiert sein, was bei acht Fermionenoperatoren zu vier Kontraktionen bzw. vier inneren Fermionlinien führt. Hierzu gibt sechs topologisch verschiedene Feynman-Diagramme, die in Abb. 10.15 dargestellt sind. Die zugehörigen Übergangsamplituden können mit Hilfe der im letzten Abschnitt aufgestellten Feynman-Regeln berechnet werden. Nach Tabelle 10.14 könnten sie im Prinzip divergieren, was jedoch nicht der Fall ist, weil sich Teilintegrale aufgrund von Antisymmetrien der Integranden, die mit der Eichinvarianz der Maxwell- und DiracGleichung zu tun haben, gegenseitig kompensieren. Das Ergebnis sind endliche, von null verschiedene Übergangsamplituden, die zur Folge haben, daß Photonen aneinander gestreut werden können. Die Voraussetzung dazu ist allerdings, daß die Energie der einlaufenden Photonen ausreicht, um ein virtuelles Elektron-Positron-Paar zu erzeugen. Die Streuung von Licht an Licht ist ein wichtiges Ergebnis der Quantenfeldtheorie, das es in der zugehörigen klassischen Theorie, also der Maxwell-Theorie, nicht gibt. Die letztere ist eine lineare Theorie, in der das Superpositionsprinzip gilt. Aus ihr folgt, daß zwei sich gegenseitig durchdringende Lichtstrahlen zwar im Überlappungsbereich Interferenzerscheinungen zeigen, aber aus diesem ohne jede Beeinflussung durch den jeweils anderen austreten. Aus den Feynman-Diagrammen läßt sich ablesen, wie es in der Quantenfeldtheorie zu einer gegenseitigen Beeinflussung kommt: Durch die Wechselwirkung der beiden Photonenstrahlen wird vorübergehend ein Elektron-PositronPaar erzeugt, und bei dessen anschließender Vernichtung entstehen zwei neue Photonen, die zusammen denselben Impuls und dieselbe Energie wie die einfallenden Photonen aufweisen. Wenn man in die klassische Theorie diesen Paarerzeugungsprozeß heuristisch mit einbezieht, erhält man auch in dieser eine Streuung von Licht an Licht.
326
10 Quantenelektrodynamik
q¼
k¼ γ
q1
γβ
ν
q2
γμ
q ¼ γ α k2
k
q2
q1 γα q
k (a)
(b)
γβ q
γ μ q1
k1 (c)
Abb. 10.16: Strahlungskorrekturen: (a) Selbstenergie des Photons (Vakuumpolarisation), (b) Selbstenergie des Elektrons und (c) Vertexkorrektur. Bei den mit k und k ¼ bzw. q und q ¼ bezeichneten Linien in (a) bzw. (b) handelt es sich um innere Linien, die gestrichelten Linien in (c) sind Anschlußlinien.
10.8.4 Selbstenergien, Vertexkorrektur und Ward-Identität Selbstenergie des Photons. Wir berechnen als erstes den Beitrag des FeynmanGraphen der Vakuumpolarisation zur Übergangsamplitude. Nach den Feynman-Regeln des Abschnitts 10.6.1, mit den Bezeichnungen der Abb. 10.16 (a) und unter Einbeziehung des Faktors 1 für die geschlossene Fermionenschleife ist er in der Reihenfolge untere (innere) Photonlinie, unterer Vertex, innere Elektronlinie, oberer Vertex, innere Positronlinie und obere (innere) Photonlinie durch
(2) s.u. SVP
e2
h 2 2
q e2 h
q1
d 4 k d 4k ¼ 4 d q1 d 4q2 δ 4 (q1 q2 h k) δ 4 h k ¼ q2 q1 (2π)4 (2π)4 D Fαμ (k) Sp γ μ SF (q1 )γ ν SF (q2) D Fνβ (k ¼ )
d 4 k d 4 k d 4q 4 δ h k (2π)8
oder unter Benutzung von δ 4 (h k (2)
SVP
e2
(2π)4 h 6
h k D Fαμ (k) Sp γ μ SF(q)γ ν SF (q h k) D Fνβ (k )
h k) δ4 (k
k)/h 4 durch
d 4k i D (k) Sp γ μ SF (q)γ ν SF (q h k) d 4q i D Fνβ (k) Fαμ 4 (2π)
gegeben. Die Spurbildung des der Fermionenschleife zugeordneten Matrizenproduktes γ μ SF (q1 )γ ν SF (q2 ) kommt dadurch zustande, daß die Matrizen der in der Schleife aufeinander folgenden Elemente der Reihe nach miteinander multipliziert werden müssen. Dies bedeutet, daß jeweils der zweite Index der vorangehenden Matrix dem ersten der darauf folgenden Matrix gleichgesetzt und daß über die gleichgesetzten Indizes summiert wird. Da in der Fermionenschleife auf die letzte Matrix wieder die erste folgt, führt diese Prozedur zur Spurbildung. (2) SVP ist die Strahlungskorrektur einer inneren Photonlinie und muß daher zu deren Beitrag zur Übergangsamplitude addiert werden, was in der Sprache der Feynman-
10.8 Strahlungskorrekturen
327
Graphen die Ersetzung + bedeutet. Formelmäßig entspricht das unter Benutzung des obigen Ergebnisses der Ersetzung 4 4 d k d k (2) i D (k).. i D ¼ Fαβ (k).. (10.85) Fαβ (2π)4 (2π)4 mit (2) i D ¼ Fαβ (k) i DFαβ (k) i DFαμ (k) i Π(2)μν i DFνβ (k) (10.86)
und dem Polarisationstensor Π(2)μν (k)
i he
2 2
Sp γ μ SF (q)γ ν SF (q h k)
d 4q . (2π h )4
(10.87)
In Π(2)μν wird über alle möglichen Vierervektoren q α integriert. Für große Werte von q q q gilt SF (q) SF (q h k) 1/ q , und da über d 4q integriert wird, divergiert (2)μν Π in Übereinstimmung mit dem in der Tabelle von2Abb. 10.14 für die Selbstenergie des Photons angegebenen Verhalten quadratisch. ( d 4 k DFαμ (k).. DFνβ (k) liefert wegen D
Fαμ (k)
1/k
2
keinen Beitrag zum Divergenzverhalten.)
Selbstenergie des Elektrons. Der Feynman-Graph für die Selbstenergie eines Elektrons ist in Abb. 10.16 (b) angegeben, der für die Selbstenergie eines Positrons geht daraus durch Umdrehen der Pfeilrichtungen hervor. Durch Anwendung der FeynmanRegeln aus Tab. 10.5 in der Reihenfolge untere (innere) Elektronlinie, unterer Vertex, innere Elektronlinie, oberer Vertex, obere (innere) Elektronlinie und innere Photonlinie ergibt sich für die Übergangsamplitude e2 h 2 (2) d 4q d 4q1 d 4q ¼ d 4 k δ 4 (q1 h k q) δ 4 q ¼ h k q1 SSE 8 (2π h ) SF (q)γ α SF (q1 )γ β SF (q ¼ ) DFαβ (k) e2 h 2 d 4q d 4 k SF (q)γ α SF (q h k)γ β SF (q) DFαβ (k) . (2π h )8
(2) So wie SVP zum Amplitudenbeitrag einer inneren Photonlinie addiert werden mußte, (2) muß SSE zum Beitrag einer inneren Elektronlinie addiert werden. Die Berücksichtigung der Selbstenergie des Elektrons führt also zu der Ersetzung d 4q d 4q (2) i S (q) . . . i S ¼ (q) . . . (2π h )4 F (2π h )4 F
mit
S (q) S (q) S (q)Σ (q) S (q) e D (k) γ S (q h k)γ Σ (q) i h ¼
und
(2) F
(2)
F
F
2
2
Fαβ
(2)
α
(10.88)
F
F
β
d 4k . (2π)4
(10.89)
328
10 Quantenelektrodynamik
Vertexkorrektur. Der Feynman-Graph für die Vertexkorrektur ist in Abb. 10.16 (c) angegeben. Durch Anwendung der Feynman-Regeln in der Reihenfolge linker oberer Vertex, innere Elektronlinie, unterer Vertex, innere Positronlinie, rechter oberer Vertex und innere Photonlinie ergibt sich für die Übergangsamplitude 3 e (3) SV d 4q2 d 4q1 h 4 d 4 k2 δ 4 q ¼ hk2 q2 δ 4 (q2 q1 hk1 ) δ 4 (q1 hk2 q) h α μ β γ S F (q2 )γ SF (q1 )γ DFαβ (k 2 ) 3 e h d 4q1 d 4k2 δ 4 q ¼ q1 hk1 hk2 δ 4 (q1 hk2 q) γ
k2
k
e3 h δ 4 q
q hk1
e3 h δ 4 q
q hk1
α SF (q1 hk1 )γ μ SF (q1 )γ β D Fαβ
(k2 )
d 4k D Fαβ (k) γ α SF (q hk1 hk)γ μ SF (q hk)γ β d 4 k D Fαβ (k) γ α SF (q
hk)γ μ SF (q hk)γ β .
SV(3) muß zu dem Ausdruck für einen Vertex addiert werden, der den Photonenimpuls hk1 mit den Fermionenimpulsen q und q verbindet, d. h. für einen Vertex muß bei Berücksichtigung der Strahlungskorrekturen niedrigster Ordnung die Ersetzung 4 e μ 4 4 e (2)μ 4 i (2π h) i (2π h) δ q q hk1 γ δ q q hk1 Γ h h mit (10.90) Γ (2)μ (q , q) γ μ Λ(2)μ (q , q)
und (2)μ
Λ
e2 (q , q) i
h2
D Fαβ (k) γ α SF (q
hk)γ μ SF(q hk) γ β
d 4k (2π)4
(10.91)
vorgenommen werden. Ward-Identität. Zwischen den durch (10.89) und (10.91) definierten Größen Σ (2) (q) und Λ(2)μ (q , q) besteht ein wichtiger Zusammenhang. Um ihn abzuleiten, schreiben wir für den Propagator (9.84) zunächst unter Benutzung der ähnlich wie (8.188b) q m 0 c)q q m 20 c2 und Unterdrückung des ε-Terms beweisbaren Identität (/ q m 0 c)(/ im Nenner h(/ q m 0 c) h SF (q) (10.92) (/ q m 0 c)(/ q m 0 c) q/ m 0 c
– unter dem letzten Ausdruck ist die Inverse der Matrix (/ q m 0 c)/h zu verstehen – und erhalten daraus durch Ableiten nach q α
∂ SF 1 (q) ∂q α
∂(/ q m 0 c)/h ∂q α
∂(γα q α m 0 c)/h ∂q α
∂ SF1 (q)
γα . h
Durch Ableiten der Identität 1 SF (q) SF 1 (q) nach q α ergibt sich damit 0
∂ SF (q) 1 SF (q) SF (q) ∂q α
∂q α
∂ SF (q) 1 SF (q) γα . S (q) F ∂q α h
10.9 Dimensionsmäßige Regularisierung
329
Die Rechtsmultiplikation dieser Gleichung mit SF (q) liefert schließlich ∂ SF (q) ∂q α
SF (q) γα SF (q) . h
(10.93)
Wenn wir jetzt Σ (2) (q) nach q μ differenzieren und das letzte Ergebnis benutzen, erhalten wir 4 e2 ∂Σ (2) (q) (10.89) α β d k i D (k) γ S (q hk) γ S (q hk)γ . μ Fαβ F F ∂q μ (2π)4 h 3 Der Vergleich mit (10.91) liefert die Ward-Identität Λ(2) μ (q, q) h
∂Σ (2) (q) . ∂q μ
(10.94)
10.9 Dimensionsmäßige Regularisierung Die Divergenz der im letzten Abschnitt für Π(2)μν (k), Σ (2) (q) und Γ μ (q ¼ , q) abgeleiteten Integrale kommt von den unendlichen Integrationsgrenzen k bzw. q . Diese entsprechen unendlich kleinen (de-Broglie-) Wellenlängen der durch die QED beschriebenen Teilchen (Elektronen, Positronen und Photonen), und man spricht daher von Ultraviolett-Divergenzen. Man kann die Frage stellen, ob die QED bis zu derart kleinen Längen überhaupt anwendbar ist. Das würde jedenfalls voraussetzen, daß es sich bei den Teilchen der QED um Punktteilchen handelt. In Hinblick auf mögliche Zweifel daran wäre es sinnvoll, die Integrationen bei einem endlichen Impuls q P< bzw. einer endlichen Wellenzahl k K < abzuschneiden und zu sehen, wie das die Ergebnisse der Theorie beeinflußt. Sollten diese auch noch für sehr große Werte von dem Abschneideparameter P bzw. K abhängen, so würde das nach dem vorher Gesagten auf eine innere Struktur der Teilchen hinweisen, und die Folge davon wäre die Unzulässigkeit des Grenzübergangs P bzw. K . Wir werden jedoch feststellen, daß die QED nicht von dieser Art ist, vielmehr wird sich der Grenzübergangs P bzw. K als möglich erweisen, was bedeutet, daß die QED keine Hinweise auf eine innere Struktur der durch sie beschriebenen Teilchen liefert. Der oben geschilderte Weg der Regularisierung durch Abschneiden der Integrale bei endlichen Integrationsgrenzen ist zwar konzeptionell sehr einfach, aber nicht besonders zweckmäßig, weil er nicht relativistisch invariant ist. Eine Alternative dazu besteht darin, vom Integranden des divergenten Integrals eine von einem Parameter K oder P abhängige Funktion mit gleichem asymptotischem Verhalten bzgl. k bzw. q abzuziehen, die das Integral für endliche Parameterwerte konvergieren läßt und für K bzw. P verschwindet. Ein Beispiel dafür bietet die Ersetzung des Photonenpropagators (9.88) durch 1 1 . hμ 0 cgαβ k k i ε k k K K i ε
330
10 Quantenelektrodynamik
Ein elegantes und relativistisch invariantes Verfahren dieser Art ist die Pauli-VillarsRegularisierung. Die entsprechenden Rechnungen sind allerdings sehr umfangreich, weshalb hier ein noch andersartiger Weg eingeschlagen wird, der zu wesentlich kürzeren Rechnungen führt und zudem über die QED hinausgehend weiter anwendbar als die Pauli-Villars-Regularisierung ist. Die Rede ist von der – ebenfalls Lorentz-invarianten – dimensionsmäßigen Regularisierung, die im folgenden besprochen wird. Bei der dimensionsmäßigen Regularisierung werden die divergenten Integrale auf eine d-dimensionale Raum-Zeit mit zunächst ganzzahligem d verallgemeinert, wobei sich herausstellt, daß sie für hinreichend kleine d 4 konvergieren und explizit berechnet werden können. (Der Frage nach oberen Grenzen von d wird im folgenden nicht nachgegangen, da sie für den später benutzten Wert d 4 nicht relevant ist.) Die Rechnungen liefern für die Integrale Ausdrücke, die von d abhängen und zwar zunächst nur für ganzzahlige Werte d definiert sind, sich jedoch analytisch zu beliebigen reellen Werten von d fortsetzen lassen. Man setzt dann d 4δ und betrachtet die Integrale zunächst für 0<δ 1. Dabei stellt sich heraus, daß alle Integrale in einen divergenten Anteil 1/δ (einfacher Pol bei d 4) und einen von δ unabhängigen, aber von den physikalischen Parametern des Problems abhängigen regulären Anteil zerfallen. Nach dieser Zerlegung ist es möglich, δ 0 gehen zu lassen. Der divergente Anteil kann dann durch eine Uminterpretation physikalischer Größen wie der Elektronenmasse und -ladung eliminiert werden. Diese als Renormierung bezeichnete Reinterpretation wird im Anschluß an die Regularisierung behandelt. In dem folgenden Exkurs werden zunächst einige mathematische Formeln abgeleitet, die zur dimensionsmäßigen Regularisierung benötigt werden.
Exkurs 10.1: Mathematische Hilfsmittel zur Regularisierung Feynmansche Rechentricks. a, b und c seien komplexe Zahlen. Aus b 1 1 1 1 1 b a dx x2 ab b a a b a
ergibt sich mit der Substitution x az b(1 z), die d x (a b) dz zur Folge hat, 1 dz 1 . ab 0 az b(1 z)2 Weiterhin gilt 1 abc
2
1
1 x dx
0
0
a(1
dy , x y)bx cy 3
(10.95)
(10.96)
was man am einfachsten durch nacheinander Ausführen der Integrationen überprüft, 1 x 1 x dy dy a(1 x y)bx cy 3 0 a(b a)x (c a)y 3 0 '1 x
' 1 1 1 1 ' . 2(c a) bx a(1 x)2 bx c(1 x)2 2(c a) a (b a)x (c a)y 2 '0 Die Weiterintegration nach x führt mit (10.95) zu (10.96).
10.9 Dimensionsmäßige Regularisierung
331
y0
Pol
x0 Pol
Abb. 10.17: Wick-Rotation. Integrale in d Dimensionen. Wir legen eine d-dimensionale Raum-Zeit mit einer Zeit- und d 1 Raumdimensionen der Metrik g00 1, g11 . . . gd 1,d 1 1 und gαβ 0 für α β zugrunde. Als erstes berechnen wir für 1ε>0, >0 und ganzzahlige n Integrale der Form d dx . (10.97) Id () (x x i ε)n d 1 2 d d 1x d x und x x x 2 x 2 können wir dafür Mit x 2 0 0 l 1 xl , d x d d x0 Id () d d 1x (x02 x 2 i ε)n IRd 1 schreiben. Bei iε z 0 x0 i y0 x 2 i ε x 2 2 x 2
liegen die Pole des Integranden. Da dieser für z 0 hinreichend schnell verschwindet, kann der Integrationsweg x0 durch einen Halbkreis im Unendlichen mit Zentrum bei z0 0 zu einer geschlossenen Integrationskontur ergänzt werden, ohne daß sich dadurch etwas am Wert des Integrals ändert. Wenn wir uns für einen Halbkreis in der oberen Hälfte der z 0 -Ebene entscheiden, wird dabei der linke Pol umschlossen (Abb. 10.17, gestrichelter Halbkreis). Nach der Funktionentheorie kann die Integrationskontur beliebig verformt werden, solange dabei keiner der beiden Pole überschritten wird. Insbesondere können wir eine Integrationskontur wählen, die entlang der y0 -Achse von nach führt und durch einen Halbkreis in der linken Halbebene geschlossen wird (Abb. 10.17, durchgezogener Halbkreis). Weil jedoch auch dessen Beitrag zum Integral verschwindet, kann die Integration auf die y0 -Achse beschränkt werden. Dies bedeutet, daß der ursprüngliche Integrationsweg in der z 0 -Ebene um 90° gegen den Uhrzeigersinn gedreht werden kann, was als Wick-Rotation bezeichnet wird. Längs der y0 -Achse gilt z 02 (i y0 )2 y02 und dz 0 i d y0 , so daß wir für den Wick-rotierten Integrationsweg i d y0 i d dxe d d 1x Id () (1)n IRd (xe2 )n ( y02 x 2 )n IRd 1
erhalten, xe der Ortsvektor in einem d-dimensionalen euklidischen Raum ist, d. h. d wobei 1 2 xe2 α 0 x eα mit x e0 y0 und xel xl . (Man beachte, daß jetzt im Nenner der Term iε entfallen kann, weil auf der y0 -Achse keine Nullstelle liegt.) Weil der Integrand des Integrals Id () nur vom radialen Abstand r (xe2 )1/2 abhängt, können alle Winkelintegrationen ausgeführt werden, womit sich i Ωd r d 1 dr Id () (1)n 0 (r 2 )n
332
10 Quantenelektrodynamik
ergibt. Dabei2 ist Ωd die Oberfläche einer d-dimensionalen Einheitskugel des euklidischen Raums und V Ωd r d 1 dr ihr Volumen. Aus
π
d
s.u.
2 e x dx
d
d Ωd 2 r2 2 0
1 er dr 2 Ωd 2
und wir erhalten Id () Mit der Substitution t /(r 2 sich r d 1 dr 1 2 0 0 (r 2 )n
2
d xd Ωd
e x d x
2
dx1
2 r d 1 e r dr
0
d s.u. Ωd z 2 1 e z dz Γ (d/2) 2
0
2
Ωd
d 2 n 1 xn
2
– dabei wurde die bekannte Formel benutzt – folgt
e
π und die Definition der Gamma-Funktion
d/2
Γ2π(d/2) , d/2
(1)i 2π n Γ (d/2)
r d 1 dr . (r 2 )n
0
(10.98)
) bzw. r 2/t und deren Folge dr 2 dt/t 2 ergibt
r d 2 dr 2 1 0 t n d/2 1 1 t d/2 1 dt 2 1 t (r 2 )n t2 1 1 t n 1 d/2 (1 t)d/2 1 dt . n d/2
0
Das letzte Integral kann durch die Eulersche Betafunktion 1 Γ (x) Γ (y) B(x, y) t x 1 (1 t) y 1 dt Γ (x y) 0
ausgedrückt werden, deren Zusammenhang mit der Gammafunktion gleich mit angegeben wurde, so daß wir r d 1 dr B(n d/2, d/2) Γ (n d/2)Γ (d/2) 2 )n 2n d/2 2Γ (n)n d/2 0 (r
erhalten. Einsetzen in den zuletzt für Id () erhaltenen Ausdruck liefert mit (10.97) schließlich als erstes Ergebnis i π d/2 Γ (n d/2) d dx . (10.99) n (x x i ε) ( 1)n Γ (n)n d/2
Weil über alle x μ von bis integriert wird, ändert sich an diesem Ergebnis nichts, wenn auf der linken Seite x durch x q mit konstantem q ersetzt wird. Da die rechte Seite von q unabhängig ist, ergibt sich durch Ableiten beider Seiten nach q μ (man beachte dabei ∂(q q)/∂q μ ∂(gαβ q α q β )/∂q μ 2qμ ) nach Herauskürzen des Faktors 2n (xμ qμ ) d dx (x q)(x q)i εn1 0 oder
xμ d dx (x q) (x q) i ε n 1
d
d
qμ d x qμ d x n 1 (x q)(x q)i ε x x i εn1 .
10.9 Dimensionsmäßige Regularisierung
333
Erneute Ableitung dieses Ergebnisses nach q ν führt mit ∂qμ /∂q ν ∂(gμλ q λ )/∂q ν gμλ δνλ gμν zu 2xμ (xν qν ) d dx d dx (n 1) g (10.100) μν n 2 (x q)(x q) i ε x x i εn 1 . Hieraus ergibt sich für q 0, n 2n, unter Benutzung des Ergebnisses (10.99) für die rechte Seite und mit (n 1)Γ (n 1)Γ (n) schließlich
xμ xν d x x i εn d x
iπ
d/2 Γ (n 1 d/2) gμν . ( 1)n 1 2Γ (n) n 1 d/2
(10.101)
Entwicklung der Gammafunktion. Die Gammafunktion ist die analytische Fortsetzung der für ganze Zahlen n definierten Funktion n in die komplexe Zahlenebene und erfüllt wie diese die Funktionalgleichung Γ (z 1)zΓ (z). Nach Weierstrass besitzt ihr Inverses die Darstellung
z + 1 e z/n 1 z eC z Γ (z) n n 1
(C
mit C lim
n
1
1 2
...
1 ln n 0.5772156649 . . . n
Euler-Konstante). Aus dieser Darstellung folgt ln Γ (z) ln z Γ (1)Γ (1)
und damit
Cz
$ 1 C
n 1
z z n , ln 1 n
1 1 n
n 1
Γ (1 z) Γ (1)
1 n
%
Γ (1)
Γ (1)z
(z) ΓΓ (z) 1z $ 1 C
1 n
n 2
1 z n
C
n 1
n1 n 1
%
n1
,
Γ (1)1
C
(z 2 ) 1Cz (z 2 ) .
Mit Γ (z 1)zΓ (z) ergibt sich hieraus Γ (z)
1 z
C (z) .
(10.102)
Selbstenergie des Elektrons. Einsetzen von (9.84) und (9.88) in (10.89) liefert h μ0 c gαβ γ α h ( q/ h k/m 0 c)γ β d 4k (2) 2 Σ (q) ie . (h 2 k k i ε) (q h k)(q h k) m 20 c2 i ε (2π)4 Die Verallgemeinerung von 4 auf d Dimensionen lautet ddk μ0 c γ α ( q/ h k/m 0 c)γα s.u. . Σ (2) (q) i e2 h 2 μ4 d (h 2 k k i ε) (q h k)(q h k) m 20 c2 i ε (2π)d Dabei wurde der Faktor μ4 d eingefügt, damit Σ (2) (q) für alle d die gleiche physikalische Dimension besitzt, wozu Dim(μ/k)1 gewählt werden muß. Zur
334
10 Quantenelektrodynamik
Auswertung des Integrals benutzen wir die Feynman-Formel (10.95), in der wir a (q h k)(q h k) m 20 c2 i ε sowie b h 2 k k i ε setzen, und erhalten Σ
(2)
e2 h 2 μ4 i (2π)d
(q)
d 1
Mit der Substitution h k
dz 0
h k
μ0 c γ α ( q/ h k/m 0 c)γα
(q h k)(q h k)z m 20 c2 z h 2 k k(1 z)i ε
d 2 d k .
qz wird daraus γ α q/ (1 z) h k/ m 0 c γα e2 μ0 c h 2 μ4d 1 (2) d dz Σ (q) i 2 d k 2 2 2 (2π)d 0 h k k m 0 c z q q z(1 z)i ε 2 1 d d (h k ) 2 μ4d dz s.u. 0 ch α i e μ(2π γ q / (1 z) m c γ 0 α 2 h )d 0 h 2 k k m 20 c2 z q q z(1 z)i ε d/2 Γ (2 d/2) e2 μ c h 2 μ4d 1 γ α q / (1 z)m 0 c γα (10.99) π 0 2 2d/2 dz . 2 Γ (2)(2π h )d 0 m c z q q z(1 z) 0 Dabei hat sich beim zweiten Schritt der in k/ γ α kα lineare Term wegen der Antisymmetrie des Integranden herausintegriert, und beim letzten Schritt waren die Voraussetzungen zur Anwendbarkeit von (10.99) mit ε > 0 sowie m 20 c2 z q q z(1 z) (m 20 c2 q q)z q qz 2
(8.163)
q qz 2
(8.163)
0
erfüllt. Zur weiteren Auswertung benötigen wir eine Folge der Relationen (2.204) zwischen den γ -Matrizen,
γ α , γ β 2gαβ
gαβ (γ α γ β γ β γ α ) 2γα γ α
bzw. deren Verallgemeinerung
γα γ α
2gαβ gαβ 2δαα 8 ,
d
(10.103)
auf d Dimensionen, mit deren Hilfe sich γ α q/ (1 z)m 0 cγα
ergibt. Hiermit, mit Γ (2)1 und mit Γ (2 dem letzten Ergebnis Σ
(2)
γ α γ β qβ γα (1 (1 z) 2gαβ
z)m 0 cγ α γα γ β γ α qβ γα m 0 cd
4 d/2)Γ (δ/2)2/δ d
(2
d)(1 z) q/ dm 0 c
δ,
(10.104)
C (δ) nach (10.102) erhalten wir aus
2/δ C (δ) e2 μ0 c 1(4 δ)m 0 c (2 δ)(1 z) q/ (q) dz . 16π 2 h 2 (4πμ2 h 2 ) δ/2 0 m 2 c2 z q q z(1 z) δ/2 0
Unter Benutzung der Entwicklung 1 eln N N δ/2
δ/2
e
(δ/2) ln N
1
δ ln N 2
(10.105)
10.9 Dimensionsmäßige Regularisierung δ/2
für den mit (4πμ2 h 2 ) Σ (2) (q)
335
multiplizierten Nenner des Integranden ergibt sich daraus 1 e2 μ0 c 2 C (δ) 4m 0 c2(1z) q/ δ( q/ q/ z m 0 c) 2 2 δ 16π h 0 3 4 δ m 20 c2 z q q z(1z) 2 1 ln (δ ) dz . 2 4πμ2 h 2
Ausführen der einfacheren Integrationen, 1 4m 0 c2(1z) q/ δ( q/ q/ z m 0 c) dz 0
δ 4m 0 c q/ ( q/ 2m 0 c) , 2
führt schließlich zu Σ (2) (q) mit
e 2 μ0 c
8π 2 h 2
(1C) q/ RΣ (q) (12C) m 0 c 2
4m 0 c q/ δ
z
RΣ (q) (δ)
(1z) q/ 2m 0 c ln
0
3
(10.106)
m 20 c2 z q q z(1z)
4
4πμ2 h 2
dz .
Selbstenergie des Photons. Einsetzen von (9.84) in (10.87) liefert gleich in d-dimensionaler Verallgemeinerung μ4 d e 2 k m 0 c) Sp γ μ ( q/ m 0 c)γ ν ( q/ h/ (2)μν d dq . i Π 2 2 (2π h)d q q m 0 c i ε (q hk)(q hk)m 20 c2 i ε Mit der Feynman-Formel (10.95), in der wir a (q hk)(q hk)m 20 c2 i ε und bq q m 20 c2 i ε setzen, sowie mit der Substitution q ¼ q hkz ergibt sich hieraus k (1z)m 0 c) d ¼ Sp γ μ ( q/ ¼ h k/z m 0 c)γ ν ( q/ ¼ h/ μ4 d e2 1 (2)μν Π i dz dq . 2 (2π h)d 0 q ¼ q ¼ m 2 c2 z(1z) h 2 k k i ε 0
. . . des Integranden gilt (qα¼ hkα z)qβ¼ hkβ (1z) Sp γ μ γ α γ ν γ β m 20 c2 Sp γ μ γ ν μ α ν μ ν β ¼ ¼ m 0 c(qα hk α z) Sp γ γ γ m 0 c qβ hk β (z 1) Sp γ γ γ .
Für den Zähler Z
Z Sp γ μ
Mit der Erweiterung der Ergebnisse von Aufgabe 10.4 auf d Dimensionen, Sp E
Sp(γ α γ β )
Sp(γ κ γ λ γ μ γ ν )
d,
dg αβ , Sp(γ λ γ μ γ ν ) 0 , κλ μν κν λμ κμ λν , d g g g g g g
ergibt sich hieraus Z d qα¼ qβ¼ z(1z)h 2 kα kβ hkα zqβ¼ qα¼ hkβ (1z) g μα g νβ g μβ g αν g μν g αβ d
m 20 c2 g μν .
336
10 Quantenelektrodynamik
Bei der Integration über d dq ¼ liefern die in q ¼ linearen Terme des Zählers den Beitrag null, womit sich der Zähler des Integranden nach Ausführung der Summation über doppelt auftretende Indizes und Zusammenfassen von Termen auf Z¼
d 2q ¼ μ q ¼ ν 2z(1 z)h 2 k μ k ν g μν q ¼ q ¼ m 20 c2 z(1 z)h 2 k k d 2q ¼ μ q ¼ ν g μν q ¼ q ¼ m 20 c2 z(1 z)h 2 k k 2z(1 z)h 2 (k μ k ν g μν k k)
reduziert. Für Π(2)μν ergibt sich damit (2)μν
Π
2q ¼ μ q ¼ ν g μν q ¼ q ¼ m 20 c2 z(1 z)h 2 k k d ¼ dz dq 2 0 q ¼ q ¼ m 20 c2 z(1 z) h 2 k k i ε d μ4 d e 2 1 2z(1 z)h 2 (k μ k ν g μν k k) d ¼ i dz 2 d q d 2 2 (2π h ) ¼ ¼ 2 0 q q m 0 c z(1 z) h k k i ε de2 μ4 d 1 2z(1 z)h 2 (k μ k ν g μν k k) d ¼ i dz 2 d q d 2 2 (2π h ) ¼ ¼ 2 0 q q m 0 c z(1 z) h k k i ε
s.u.
d μ 4 d e 2 i (2π h )d
(10.99)
1
2h 2 e2 μ4 d π d/2 d Γ (2 d/2) (k μ k ν g μν k k) (2π h )d Γ (2) 1 2 2 z(1 z) dz2 2 d/2 . 0 m 0 c z(1 z) h k k
Dabei wurde in dem mit gekennzeichneten Schritt (10.100) mit n 0 und q 0 benutzt, was zum Wegfall des ersten Integrals führte. Für d 4 δ folgt daraus mit dΓ (2 d/2)(4 δ)Γ (δ/2)4 2/δ C 1/2 (δ) und Γ (2)1 sowie der Abkürzung N(k, z)m 20 c2 z(1 z) h 2 k k /(4π h 2 μ2 ) s.u.
Π(2)μν
(10.105)
– dabei wurde
1 e2 (k μ k ν g μν k k) 2 1 C (δ) δ 2 2π 2 h 2 0 2 μ ν μν e (k k g k k) 2 1 C (δ) 16 δ 2 2π 2 h 2
2z 0
δ 2
1
z(1 z) ln N(k, z) dz 0
z(1 z) dz 1/6 benutzt –, woraus sich schließlich
Π(2)μν (k)
RΠ ( k )
mit
ergibt.
z(1 z) dz
N(k, z)δ/2
e2
6π 2 h 2
(k μ k ν g μν k k)
C 1/2 2
3
1
RΠ ( k ) (δ) δ
1
z(1 z) ln 0
m 2 c2 z(1 z) h 2 k k 0 4π h 2 μ2
(10.107)
dz
10.9 Dimensionsmäßige Regularisierung
337
Vertexkorrektur. Einsetzen von (9.84) und (9.88) in (10.91) liefert unter dem später kommentierten Weglassen der ε-Terme in d-dimensionaler Verallgemeinerung mit Dim(μ/k) 1 d
e 2 μ0 c h 3 μ4 i (2π)d
(2)μ
Λ
gαβ γ α (/ q ¼ h k/m 0 c)γ μ (/ q h k/m 0 c)γ β d d k . h 2 k k (q ¼ h k)(q ¼ h k) m 20 c2 (q h k)(q h k) m 20 c2
Unter Benutzung der Feynman-Formel (10.96) mit a h 2 kk, b(q h k)(q h k) m 20 c2 und c(q ¼ h k)(q ¼ h k) m 20 c2 wird daraus Λ(2)μ i
2e2μ0 ch 3μ4 d 1 1 x γ α ( q/ ¼ h k/m 0 c)γ μ ( q/ h k/m 0 c)γα d d k dx dy 3 . d (2π) 0 0 h 2 k k m 2 c2 (x y) 2h k (q x q ¼ y)q q x q ¼q ¼ y 0
Mit der Substitution h k ¼ h k q x q ¼ y geht dies in Λ(2)μ
1 x 2e 2 μ0 c h 3 μ4 d 1 d x dy (2π)d 0 0 α ¼ γ q/ (1 y) h k/¼ q/ x m 0 c γ μ q/ (1 x) h k/¼ q/ ¼ y m 0 c γα d ¼ 2¼ ¼ 22 3 d k h k k m 0 c (x y)q q x(1 x)q ¼ q ¼ y(1 y) 2q q ¼ x y i
über. Bei der Integration über d d k ¼ liefern die in k ¼ linearen Terme des Zählers den Beitrag null, und das verbleibende Integral zerlegen wir gemäß Λ(2)μ
Λ(2)μ Λ(2)μ 1 2
mit (2)μ
(2)μ
Λ1
Λ2
(10.108)
1 x 2e2 μ0 c h 3 μ4 d 1 d x d y γ α q/ ¼ (1 y) q/ x m 0 c d (2π) 0 0 d ¼ μ ¼ γ q/ (1 x) q/ y m 0c γα N(kd¼ , x,k y)3 , 1 x α ¼ μ ¼ 2e2 μ0 c h 5 μ4 d 1 γ k/ γ k/ γα d ¼ i dx dy d k d (2π) N(k ¼ , x, y)3 0 0 i
und N(k ¼ , x, y)
h 2k k ¼
¼
m 20 c2 (x y)q q x(1 x)q ¼ q ¼ y(1 y) 2q q ¼ x y .
Die Berücksichtigung der ε-Terme hätte in N den zusätzlichen Faktor i ε mit ε>0 gebracht, womit bezüglich der Polstellen genau die Voraussetzungen erfüllt sind, die uns zur Anwendung der im Exkurs 10.1 abgeleiteten Formeln berechtigen und aus denen ε aufgrund der Wick-Rotation herausfällt. Auch die Voraussetzung >0 ist erfüllt, wir werden in Abschn. 10.11.2 sehen, daß in dem von uns benötigten Kontext durch die rechte Seite von Gleichung (10.158) gegeben ist. (2)μ In Λ1 ist das Integral über d d k ¼ auch für d 4 konvergent, da der Integrand für k ¼ wie 1/k ¼ 6 gegen null geht. Wir können daher d 4 setzen und erhalten unter
338
10 Quantenelektrodynamik
Benutzung von Gleichung (10.99) für x hk ¼ , d 4x h 4 d 4 k ¼ und n 3 2 i π Γ (1) d 4k¼ . N(k ¼ , x, y)3 h 4 Γ (3) m 20 c2 (x y)q q x(1x)q ¼ q ¼ y(1 y)2q q ¼ x y Damit sowie mit Γ (1)1 und Γ (3)2 wird schließlich e2 μ0 c 1 1 x γ α q/ (1 y) q/ x m 0 c γ μ q/ (1x) q/ y m 0 c γα (2)μ dy . dx Λ1 16 π 2 h 0 m 20 c2 (x y)q q x(1x)q q y(1 y)2q q x y 0 (10.109) (2) Zur Berechnung von Γμ benutzen wir α kρ kσ γ k/ γμ k/ γα d α ρ σ γ γ γμ γ γα d k d d k N(k , x, y)3 N(k , x, y)3 (10.101)
i π d/2 Γ (2d/2) γ α γ ρ γμ γ σ γα gρσ 2 2Γ (3) h d 2 m 20 c2 (x y)q q x(1x)q q y(1 y)2q q x y
d/2
und γ α γ ρ γμ γ σ γα gρσ
(10.103)
γ α γ ρ γμ γρ γα
(2.204)
(2d)γ α γμ γα
γ α γ ρ (2gμρ γρ γμ )γα
(2d)γ α (2gμα γα γμ ) (2d)2 γμ ,
setzen wieder d 4δ und erhalten α i π 2 π δ/2 1δ (δ 2 ) Γ (δ/2) γμ γ k/ γμ k/ γα d d k δ/2 N(k , x, y)3 h 6 h δ m 2 c2 (x y)q q x(1x)q q y(1 y)2q q x y 0
sowie
1δ (δ 2 ) Γ (δ/2)e2 μ0 cγμ 1 dx 8π 2 h 0 δ/2 1 x 4π h 2 μ2 δ/2 d y . 2 0 m 0 c2 (x y)q q x(1x)q q y(1 y)2q q x y Mit 1δ (δ 2 ) Γ (δ/2)2/δ C 2 (δ), der (10.105) entsprechenden Entwicklung des Integranden und mit 1 1 x 1 1 dx dy (1x) d x 2 0 0 0 (2)μ Λ2
(2)μ
erhalten wir schließlich nach Berechnen von Λ2 als Endergebnis für Λ(2)μ e 2 μ0 c 1 (2)μ (2)μ μ Λ (q , q) RΛ (q , q) γ Λ (10.110) 1 (q , q) (δ) 8π 2 h δ mit 4 1 1 x 3 2 2 m 0 c (x y)q q x(1x)q q y(1 y)2q q x y C 2 RΛ d y, dx ln 2 4π h 2 μ2 0 0 (2)μ
wobei Λ1
durch (10.109) gegeben ist.
10.10 Renormierung
339
10.10 Renormierung Durch die im letzten Abschnitt vorgenommene Regularisierung konnten die für die primitiv divergenten Graphen der Selbstenergie und der Vertexkorrektur abgeleiteten Integrale in einen divergenten und einen regulären Anteil zerlegt werden. In diesem Abschnitt werden in einer als Renormierung bezeichneten Prozedur physikalische Parameter wie die Ruhemasse und die elektrische Ladung der Elektronen durch Unterscheidung zwischen ihren in die Rechnung eingegangenen Werten und ihren bei einer Wechselwirkung wirksam werdenden Bestandteilen so umdefiniert, daß wir es am Ende nur noch mit endlichen Größen zu tun haben. Die Vorgehensweise ist also anders als bei der in Kapitel. 8 bei Einzelteilchenzuständen vorgenommenen Renormierung, wo divergente Integrale einfach als physikalisch irrelevant weggelassen wurden. Zur Vorbereitung nehmen wir im folgenden zuerst noch einige Umformungen vor.
10.10.1 Vorbereitung Als erstes befassen wir uns mit dem durch die Selbstenergie des Elektrons modifizierten Propagator des Dirac-Feldes (10.88), SF¼ (2) (q) SF (q) SF (q)Σ (2) (q) SF (q) .
(10.111)
Nach Art der Herleitung wurde der Korrekturterm SF (q)Σ (2)(q) SF (q) dabei trotz seiner (2) Divergenz als kleine Größe behandelt, was wegen Σdiv e2 μ0 /δ α/δ (nach (10.106)) zulässig ist, wenn wir uns vorerst auf δ-Werte im Bereich 1δ α 1/137 beschränken. Statt (10.111) können wir dann auch 1 SF¼ (2)(q) 1 SF (q)Σ (2) (q)
(10.112)
schreiben, was sich durch Betrachten der Reihe SF¼ (2)
SF SF Σ (2) SF SF Σ (2) SF Σ (2) SF SF Σ (2) SF Σ (2) SF Σ (2) SF . . .
(10.113)
erkennen läßt: Für diese gilt SF¼ (2)
SF SF Σ (2) SF SF Σ (2) SF . . . SF SF Σ (2) SF¼ (2) ,
und Linksmultiplikation dieser Beziehung mit SF 1 liefert ( SF 1 Σ (2) ) SF¼ (2)1 oder (10.112). Der Vergleich der (10.112) äquivalenten Reihe (10.113) mit (10.111) zeigt, daß bis auf Terme der Ordnung (Σ (2) )2 Übereinstimmung besteht. Tatsächlich ist (10.112) sogar mehr als eine (10.111) gleichwertige Näherung, denn diagrammatisch entspricht die Reihe (10.113) der Summe der Feynman-Diagramme +
+
+ ...
340
10 Quantenelektrodynamik
– man beachte, daß gegenüber dem Diagramm der Abb. 10.16 (b) die analytisch durch SF beschriebene Fortsetzung der Fermionlinie über die Vertizes hinaus fehlen muß, weil hier Σ (2) und dort SF Σ (2) SF dargestellt wird –, und die zusätzlich auftretenden Teildiagramme sind Beiträge, die in höheren Ordnungen als weitere Korrekturterme hinzutreten. Aus (10.112) ergibt sich mit (10.92b) SF¼ (2) (q)
h (2) (q) q/ m 0 chΣ
(10.114)
bzw. nach Einsetzen des Ergebnisses (10.106) für Σ (2) (q) und mit der Definition (Q2.39) bzw. αe2 μ0 c/(4π h) SF¼ (2)(q)
α q/ m 0 c 2π
α 1 2πδ
h
4m 0 c q/ δ
RΣ
h RΣ α α 4 q/ 1 2πδ m 0 c 1 2π δ m 0 c
h C . R α 4 α q/ m 0 c 1 2π 1 Σ δ m0c 2πδ
Durch Entwicklung der eckigen Klammern des Zählers nach α bis zu linearen Termen ergibt sich hieraus schließlich α h 1 2πδ ¼ (2) . (10.115) SF (q) 3α α RΣ (q) q/ m 0 c 1 2πδ 2π m 0 c Zu den inneren Fermionlinien gibt es weitere Korrekturen höherer Ordnung, die in der Reihe (10.113) noch nicht enthalten sind. Diejenigen Diagramme höherer Ordnung, die den in dieser Reihe bereits enthaltenen Korrekturen zugeordnet sind, zerfallen nach der obigen Feynman-Darstellung durch Zerschneiden der Elektronlinie zwischen zwei nicht durch innere Photonlinien verbundenen Vertizes in Diagramme für Korrekturen niedrigerer Ordnung und werden daher als reduzibel bezeichnet. Alle Korrekturdiagramme, bei denen das nicht möglich ist, heißen irreduzibel. Durch die Summe der letzteren definieren wir eine Matrix Σ(q), für die in der diagrammatischen Formel Σ(q)
+
+
+ ... =
1I
einige irreduzible Teildiagramme angegeben sind. Für die Summe aller irreduziblen Teildiagramme wird das nach dem letzten Gleichheitszeichen angegebene Diagramm benutzt. Mit dem auf diese Weise definierten Σ läßt sich eine (10.113) entsprechende Reihe bilden, die sich analog zu (10.112) zu 1 SF¼ (q) 1 SF (q)Σ(q)
(10.116)
10.10 Renormierung
341
summieren läßt und die graphische Darstellung =
1I
+
1I
1I
+
1I
1I
1I
+ ...
besitzt. Der auf diese Weise erhaltene Propagator würde alle möglichen divergenten Korrekturen innerer Fermionlinien enthalten und wäre daher vollständig – die Berechnung von Σ würde allerdings die Auswertung unendlich vieler Diagramme erfordern. Das in (10.114) bzw. (10.115) angegebene Ergebnis stellt eine bis auf Terme der Ordnung Σ 2 korrekte Näherung an diesen Propagator dar, weil in niedrigster Ordnung Σ Σ (2) gilt. Ganz ähnlich behandeln wir den durch die Vakuumpolarisation modifizierten Photonenpropagator (10.86) bzw. gleich dessen Verallgemeinerung ¼ (k) i DFαβ (k) i DFαμ (k) i Π μν i DFνβ (k) . i DFαβ
(10.117)
Darin ist Π μν ein Polarisationstensor, der durch Summation aller irreduziblen Teildiagramme für die Selbstenergie des Photons entsteht und in niedrigster Ordnung mit dem in (10.87) angegebenen Polarisationstensor Π(2)μν übereinstimmt. Man kann zeigen, daß Π μν die gleiche Struktur wie Π(2)μν besitzt, sich also (10.107) entsprechend in der Form Π μν (k) R(k ) k μ k ν
Π(k ) g μν
mit
R(k )
Π(k ) k k
(10.118)
schreiben läßt, wobei in der später benötigten niedrigsten Ordnung Π (2) (k )
e 2 k k 1 RΠ (k ) 6π 2 h 2 δ
(10.119)
gilt. Die in (10.118) angegebene Form von Π μν (k) ist übrigens notwendig dafür, daß die Eichinvarianz der Maxwell-Theorie auch in deren quantisierter Form erhalten bleibt. Beweis: Um das einzusehen, betrachten wir die Wechselwirkung eines Elektrons mit einem äußeren Potential A μ (x), also einen Prozeß, der als Verallgemeinerung der in Abschn. 10.2.2 untersuchten Mott-Streuung aufgefaßt werden kann. (Das zugehörige Feynman-Diagramm ergibt sich, wenn man in Abb. 10.3 Φ(x) durch A μ (x) ersetzt.) Aus Gleichung (10.25) läßt sich schließen, daß die Übergangsamplitude hier den Faktor u(l ¼ , p¼ ) γ α u(l, p) A α (k)
mit
¼ hk p p
enthält, wobei Aα (k) die Fourier-Transformierte von Aμ (x) ist. Durch die Selbstenergie des Photons ergibt sich in Analogie zu (10.117) das strahlungskorrigierte Feld (10.140) (Beweis dort), das in u ¼ γ α u Aα zu einem Korrekturterm
u(l ¼ , p¼ ) γ α u(l, p)gαμΠ μν A ν (k) u(l ¼ , p¼ ) γ α u(l, p)Παν Aν (k)
(10.120)
führt. Bei Eichinvarianz darf sich dieser Ausdruck nicht verändern, wenn Aν (x) durch A ν (x)∂ν Λ(x) ersetzt wird bzw. Aν (k) durch Aν (k)i kν Λ(k) nach Fourier-Transformation. Das ist jedoch nur der Fall, wenn Παν k ν 0 gilt, und aus (10.118) folgt gerade die Gültigkeit dieser Gleichung.
342
10 Quantenelektrodynamik
Außer der durch i DFαμ i Π μν i DFνβ beschriebenen Korrektur zu i DFαβ gibt es auch hier noch weitere Korrekturen, die der Graphengleichung =
1I
+
1I
1I
+
1I
1I
1I
+ ...
entsprechen, wobei das erste Element der rechten Seite Π μν darstellt. In Matrixnotation für DFαβ und Π μν lautet die entsprechende analytische Gleichung i D¼F
i DF i DF i Π i DF i DF i Π i DF i Π i DF . . . ,
und in Analogie zu (10.112) liefert die Summe mit identischem Beweisgang i D¼F
1 (i DF )
1 i Π
.
(10.121)
In dem folgenden Beweis wird gezeigt, daß der Term R(k ) k μ k ν in Π μν weggelassen werden darf, da er bei der Berechnung von Matrixelementen keinen Beitrag liefert. Beweis: Auch äußere Photonlinien werden durch die Selbstenergie des Photons modifiziert, d. h. =
+
+ ... .
In diesem Fall wird statt des Faktors Aν (k) wie in Gleichung (10.120) der in Tabelle 10.5 angegebene Faktor für eine äußere Photonlinie mit Π αν multipliziert. Dabei entsteht bezüglich des (λ¼ )
k μ k ν -Terms das Produkt εα k α k ν R(k ), und dieses ist nach (8.118a,b) gleich null, da ein- und auslaufende Photonen als reelle Teilchen nur transversal polarisiert sein können. Ist die durch die Selbstenergie modifizierte Photonlinie eine innere Linie, so grenzt sie an zwei Vertizes, an denen je zwei Fermionlinien münden. Wenn wir uns auf Strahlungskorrekturen von Prozessen zweiter Ordnung beschränken, muß es sich dabei um ein- und auslaufende Fermionlinien handeln. In dem Beitrag, der von dem einen Vertex und den bei diesem einmündenden Linien zur Übergangsamplitude herrührt, also z. B. dem Teildiagramm p¼ hk p entspricht, tritt nach Tabelle 10.5 ein Teilbeitrag auf, der unter Berücksichtigung der Strahlungs(2) korrekturen zweiter Ordnung den Faktor u(l ¼ , p¼ )γ α u(l, p) D ¼ Fαβ (k) enthält. Der k μ k ν -Term liefert dazu nach (10.117)–(10.118) mit DFαμ (k)... DFνβ (k)gαμ ...gνβ /(k k)2 einen Beitrag gαμ R(k )k μ k ν gνβ 4 ¼ δ p phk (k k)2 R(k )kα kβ d 4x (9.71) u(l ¼ , p¼ ) γ α u(l, p) ei ( p p h k) x/h 2 (k k) (2π)4 4 R(k )kβ s.u. α ψ (x) ∂ e i k x d x . ψ (x) γ α l p l p i (k k)2 (2π)4
u(l ¼ , p¼ ) γ α u(l, p)
½ ½
½ ½
¼
¼
¼
¦Æ ¡ Æ
¦ ¡
10.10 Renormierung
343 ¼
Dabei wurde im letzten Schritt ψl p (x) u(l, p) e i p ¡x/hÆ und ψ l p (x) u(l ¼ , p¼ ) ei p ¡x/hÆ gesetzt, was die ein- und auslaufende ebene Elektronenwelle darstellt, außerdem wurde ∂α e¦i k ¡x i kα e¦i k ¡x benutzt. Durch partielle Integration ergibt sich ¼
½
d 4x ψ l ¼ p¼ (x) γ α ψl p (x) ∂α e¦i k ¡x 4 (2π)
½
¼
d 4x s.u. e¦i k ¡x ∂α ψ l p (x) γ α ψl p (x) 0, (2π)4 ½ ½
¼
¼
weil nach (8.189a) und (8.190b) mit (8.187) p/u
m 0 cu
p/ψl p
m 0 cψl p ,
u p/ m 0 cu
ψ l p p/ m 0 cψ l p ¼
¼
¼
¼
und damit ∂α ψ l p γ α ψl p ¼
¼
i ¼ ∂α ψ l p γ α ψl p ψ l p γ α ∂α ψl p pα ψ l p γ α ψl p ψ l p γ α pα ψl p h
im c i ψ l p p/¼ ψl p ψ l p p/ψl p 0 ψ l p ψl p ψ l p ψl p 0 h h
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
gilt.
Unter Berücksichtigung der eben bewiesenen Tatsache ergibt sich aus (10.121) mit (9.88) und (10.118) bei Unterdrückung des ε-Terms ¼ i DFαβ
s.u.
1 1 i hμ i Π(k ) g αβ 0 c gαβ /k k
s.u.
1 αβ g αβ k k/(i hμ c) 0 i Π(k ) g
i hμ 0 c gαβ . k k hμ 0 cΠ(k ) β
(Dabei wurde zweimal benutzt, daß g αβ wegen gαμ g μβ δα die zu gαβ inverse Matrix ist.) Hieraus folgt nach Herauskürzen des Faktors i mit (10.119) in zweiter Ordnung (2)
D ¼ Fαβ (k)
hμ hμ (Q2.39) 0 c gαβ 0 c gαβ 2α 1 1 k k 1 3π δ RΠ (k ) k k δ RΠ (k ) hμ 2α 2α 0 c gαβ 1 RΠ (k ) , 3πδ 3π k k
s.u.
2 1 e6πμ20hc Æ
wobei im letzten Schritt nach α entwickelt wurde. Für das letzte Ergebnis können wir auch hμ 2α 2α 0 c gαβ (2) D ¼ Fαβ (k) 1 1 RΠ (k ) (10.122) 3πδ 3π k k schreiben, da in α nur bis zu linearen Termen entwickelt wurde und der Unterschied von (α2 ) ist. Auch zur Vertexkorrektur kommen noch Korrekturen höherer Ordnung, durch die in Analogie zu (10.90) ein allgemeiner Vertexfaktor Γμ
γ μ Λμ
γ μ Λ(2)μ Λ(4) μ . . .
(10.123)
344
10 Quantenelektrodynamik
mit der graphischen Darstellung =
+
+
+ ... (2)μ
α gilt, definiert wird. Unter Berücksichtigung der Tatsache, daß nach (10.109) Λ1 ergibt sich aus (10.90) mit (10.110) und (Q2.39) die bis zu linearen Termen in α korrekte Beziehung
α α RΛ μ α α RΛ μ (2)μ (2)μ (2)μ 1 2πδ 2π γ Λ1 1 2πδ 1 2π γ Λ1 (α2 ) . Γ Mit 1α/(2πδ)1α/(2πδ) Γ
(2)μ
(q , q) ¼
1
(α2 ) schreiben wir dafür
(2)μ 1α RΛ (q ¼ , q)/(2π) γ μ Λ1 (q ¼ , q) . 1α/(2πδ)
(10.124)
10.10.2 Renormierung in niedrigster Ordnung Wenn δ wie zu fordern gegen null geht, entstehen in den für SF¼ (2) (q), D ¼ Fαβ (k) und Γ (2)μ (q ¼ , q) erhaltenen Ausdrücke nach (10.115), (10.122) und (10.124) Singularitäten. Der Vergleich des ursprünglichen Fermionenpropagators (10.92b) mit seiner durch Berücksichtigung der Selbstenergie erhaltenen Modifikation (10.115) gibt einen Hinweis darauf, wie diese Singularitäten behoben werden können. Der Nenner hat in beiden Ausdrücken dieselbe Struktur, nur daß in (10.115) die Ruhemasse m 0 mit einem divergenten Faktor versehen ist. Das Feynman-Diagramm für die Selbstenergie des Elektrons, Abb. 10.16 (b), läßt den Grund dafür erkennen: Das Elektron tritt mit dem von ihm selbst erzeugten elektrischen Feld in Wechselwirkung. Dasselbe Phänomen ist uns schon in der klassischen Theorie des Elektrons bei der Diracschen Ableitung der Lorentz-Dirac-Gleichung begegnet (Spezielle Relativitätstheorie, Exkurs „Skizze der Diracschen Ableitung“). Dort wurde die beobachtete Ruhemasse m 0 gemäß m 0 m £0 m em in eine „nackte Ruhemasse“ m £0 und einen elektromagnetischen (a) Masseanteil m em zerlegt, der nach der Beziehung m em e2 /(8πε0 ac2 ) (siehe Abschn. „Elektromagnetische Theorie des Elektrons“ der Speziellen Relativitätstheorie) unendlich wird, wenn der Elektronenradius a 0 geht. Von dort greifen wir die Möglichkeit auf, die Ruhemasse in verschiedene Bestandteile zu zerlegen, und wählen einen von diesen so groß, daß er eine der Divergenzen kompensiert. Bevor wir uns näher mit dieser Aufgabe befassen, soll noch geklärt werden, welche weiteren Größen durch eine Reinterpretation zur Renormierung herangezogen werden können. Außer der Ruhemasse bietet sich natürlich auch die elektrische Elektronenladung e an, ansonsten kommen von den zur Berechnung von Übergangsamplituden benutzten Faktoren aus Tabelle 10.5 nur solche Größen in Frage, die nicht variabel sind, und da auch allgemeine Naturkonstanten wie h und c ausscheiden, verbleiben nur noch die Amplituden externer Fermionen und Photonen. (2)
10.10 Renormierung
345
Wir werden in diesem Abschnitt die in (10.115), (10.122) und (10.124) enthalte(2)μ nen regulären Strahlungskorrekturen RΣ (q), RΠ ( k ), RΛ (q ¼ , q) und Λ1 (q ¼ , q), die ja Korrekturen der (α) sind, der besseren Übersichtlichkeit halber vernachlässigen. Welche physikalischen Konsequenzen ihre Berücksichtigung nach sich zieht, wird für einige von ihnen in Abschn. 10.11 nachgeholt. Renormierung des Fermionenpropagators. Als erstes wenden wir uns der Divergenz des Fermionenpropagators zu und stellen uns dazu auf den Standpunkt, daß die in die Formeln (10.115), (10.122) und (10.124) eingegange Masse m 0 nicht die beobachtete Ruhemasse ist, sondern gemäß m0
m 0r
m 0
(10.125)
aus der beobachteten bzw. renormierten Ruhemasse m 0r und einem Korrekturanteil m 0 zusammengesetzt ist. Den letzteren wählen wir so, daß er einen der von den Strahlungskorrekturen herrührenden divergenten Bestandteile von SF¼ (2) (q) gerade kompensiert. Bevor wir δ 0 gehen lassen, fassen wir den zu kompensierenden Term jedoch als Entwicklungsterm erster Ordnung in der Entwicklung nach α auf und nehmen daher an, daß auch m 0 (α) gilt. Mit der Zerlegung (10.125) und unter Vernachlässigung des RΣ -Terms lautet der Nenner von SF¼ (2)(q) nach (10.115) 3α 3α s.u. q / m 0r cm 0 cm 0r c N S q/ (m 0r m 0 )c 1 . 2πδ 2πδ ¼
Dabei wurde im letzten Rechenschritt ein Term α m 0 als Term zweiter Ordnung in α vernachlässigt. Wenn wir jetzt 3α (10.126) m 0r m 0 2πδ setzen, wird N S
¼
q/ m 0r c, und aus (10.115) folgt SF¼ (2) (q)
h Z 2 q/ m 0r c
mit
Mit der Definition SFr (2) (q)
Z2
h q/ m 0r c
1
α . 2πδ
(10.127)
(10.128)
eines renormierten Fermionenpropagators SFr (2) (q), der regulär ist, erhalten wir schließlich SF¼ (2) (q) Z 2 SFr (2) (q) . (10.129) Nunmehr können wir δ 0 und damit Z 2 gehen lassen. Nach (10.126) wird dann m 0 , was nach (10.125) zur Folge hat, daß auch die Ruhemasse m 0 , mit der die Rechnung begonnen wurde, unendlich wird. Bei der weiter unten besprochenen Renormierung der Vertexkorrektur werden wir sehen, daß trotz der mit Z 2 verbundenen Divergenz von SF¼ (2)(q) endliche Übergangsamplituden erhalten werden, weil in diese nach allen Renormierungen nur SFr (2) (q) eingeht.
346
10 Quantenelektrodynamik
Renormierung des Photonenpropagators. Nach (10.122) mit (Q2.39) gilt unter Vernachlässigung des RΠ -Terms (2)
D ¼ Fαβ (k) Z 3
hμ 0 c gαβ k k
mit
Z3
1
2α . 3πδ
(10.130)
In Analogie zu (10.128) definieren wir durch (2) DFr αβ (k)
hμ 0 c gαβ k k
(9.88)
DF αβ (k)
(10.131)
(2)
einen renormierten Photonenpropagator DFr αβ (k) und erhalten damit (2) D ¼ Fαβ (k) Z 3 DF αβ (k) .
(10.132)
(2)
Auch die Beseitigung der durch D ¼ F αβ (k) über Z 3 hervorgerufenen Singularität wird im Zusammenhang mit der Vertexkorrektur besprochen. Glücklicherweise ergibt sich keine Notwendigkeit zu einer Renormierung der – verschwindenden – Ruhemasse der Photonen. Renormierung äußerer Linien. Wie schon im letzten Abschnitt festgestellt gibt es bei den äußeren Linien die gleichen Strahlungskorrekturen wie bei den inneren, was diagrammatisch durch den Übergang von einer Linie ohne zu einer mit Strahlungskorrekturen gemäß
=
+
+ ... ,
=
+
+ ...
zum Ausdruck gebracht wird. Unter Einbeziehung der Massenrenormierung bei den Fermionen entsprechen die Diagramme nach Tab. 10.5 den Ersetzungen
m 0 u(l, p)
m 0r u ¼ (l, p) , εα(λ)(k)
m 0 v(l, p)
m 0r v ¼ (l, p) ,
εα¼ (λ)(k) ,
wobei die Amplituden u ¼ (l, p) und v ¼ (l, p) von Fermionen bzw. εα¼ (λ)(k) von Photonen aufgrund der Strahlungskorrekturen in Analogie zu den entsprechenden Ausdrücken für (2) (k) bei Photonen, divergent sind. die inneren Linien, SF¼ (2)(q) bei Fermionen und D ¼ Fαβ Die Zuordnung mathematischer Faktoren zu den Elementen von Feynman-Graphen ist zwar nach Tab. 10.5 bei inneren und äußeren Linien verschieden, die Divergenz erzeugenden Faktoren sind jedoch bei beiden für jede Teilchensorte die gleichen; dabei ist allerdings zu beachten, daß sie nach den in Abschn. 10.6.1 zur Tabelle 10.5 gegebenen Erläuterungen bei den inneren Linien doppelt auftreten. (Die inneren Linien zugeordneten Faktoren sind quadratisch, die äußeren Linien zugeordneten Faktoren linear in den Feldamplituden.) Da SF¼ (2) (q) nach (10.129) wie Z 2 divergiert, muß daher
10.10 Renormierung
347
u ¼ (l, p) (Z 2 )1/2 sowie v ¼ (l, p) (Z 2 )1/2 gelten, und entsprechend folgt aus (10.132) εα¼ (λ) (k) (Z 3 )1/2 . Wir können daher durch u ¼ (l, p) Z 2 u r (l, p) , v ¼ (l, p) Z 2 vr (l, p) , εα¼ (λ)(k) Z 3 εr(λ) α(k) (10.133) (λ) renormierte Feldamplituden u r (l, p), v r (l, p) und εr α(k) einführen, die regulär sind und den Orthonormierungsbedingungen (8.191) mit m 0 m 0r oder (8.192) bzw. (8.119) genügen. Bei der gleich folgenden Beseitigung der durch die Vertexkorrektur hervorgerufenen Divergenz wird sich zeigen, daß durch die Anwendung von (10.133) auf alle äußeren Linien in Kombination mit den anderen Renormierungsvorschriften sämtliche Divergenzen beseitigt werden. Beseitigung der Divergenz der Vertexkorrektur. Bei den an einem Vertex einmündenden drei Linien handelt es sich um zwei Fermion- und eine Photonlinie, unter denen sich keine, eine, zwei oder drei externe Linien befinden können. Da sich unter ein oder zwei am gleichen Vertex einmündenden externen Linien jeweils eine oder keine Photonlinie befinden kann, gibt es insgesamt 12 216 verschiedene Möglichkeiten (22 kommt von den Fällen ein bzw. zwei externe Linien mit je zwei Möglichkeiten bezüglich der Photonlinien), von denen in Abb. 10.18 repräsentativ drei dargestellt sind. Wir wollen durch eine weitere Renormierung erreichen, daß alle derartigen Teildiagramme, die alle möglichen Strahlungskorrekturen enthalten, endlich werden. Da es nur auf die divergenten und die renormierbaren Faktoren ankommt, kann man sich auf diese konzentrieren und es sich ersparen, für alle sechs möglichen Fälle die Übergangsamplitude zu berechnen. (2)μ α Nach (10.124) gilt unter Vernachlässigung der regulären Terme RΛ α und Λ1 Γ (2)μ
μ
γZ
mit
Z1
1
α 1 2πδ .
(10.134)
Vom Vertex erhalten wir daher nach Tab. 10.5 den divergenten Faktor FV e/Z 1 , wobei e die einzig verbliebene renormierbare Größe ist. Von jeder am Vertex einmündenden Fermionlinie stammt unter Berücksichtigung der Selbstenergie der Faktor FF (Z 2 )1/2 (da zwei Fermionlinien einmünden, insgesamt zweimal) und von jeder Photonlinie der Faktor FPh (Z 3 )1/2 (einmal), in beiden Fällen unabhängig davon, ob es sich um eine innere oder äußere Linie handelt. (Bei den inneren Linien liefert zwar SF¼ (2)(q) den (2) Faktor Z 2 und D ¼ Fαβ (k) den Faktor Z 3 , dieser verteilt sich jedoch jeweils auf zwei Vertizes, weshalb zu einem Vertex jeweils nur die Wurzel davon beiträgt.) Insgesamt tritt in jedem der sechs möglichen Diagramme am Vertex der gleiche Faktor F
FV (FF )
2
FPh
eZ 2 Z 3 Z1
e
s.u.
Z3
(10.135)
auf, wobei zuletzt benutzt wurde, daß sich nach (10.127b) und (10.134b) Z 1 gegen Z 2 wegkürzt. Damit die betrachteten Beiträge zur Übergangsamplitude endlich bleiben, führen wir eine Renormierung der Ladung durch, d. h. wir zerlegen die Elektronenladung gemäß e er e (10.136)
348
10 Quantenelektrodynamik
int
ext
int int
int
int int
(a)
ext
(b)
(c)
ext
Abb. 10.18: Drei von sechs Möglichkeiten für die an einem Vertex einmündenden Linien mit sämtlichen Strahlungskorrekturen. Innere Linien sind mit „int“, äußere mit „ext“ gekennzeichnet.
in eine renormierte Ladung er und eine Korrektur e (α). Aus (10.135) ergibt sich damit 2α 1/2 α F e Z 3 (er e) 1 er e 3πδ er (α2 ) . 3πδ Wählen wir jetzt e so, daß e
α er 3πδ
(α2 )
(10.137)
gilt, so ergibt sich für den Faktor F der endliche Wert F
er .
(10.138)
Für δ 0 geht e, was bedeutet, daß die Ladung e, mit der die Rechnung begonnen wurde, unendlich sein muß. Durch die Ladungsrenormierung ist erreicht, daß in der betrachteten Ordnung der Störungsrechnung alle Übergangsamplituden endlich bleiben. F er ist der Faktor, der bei deren Berechnung den ursprünglichen Vertexfaktor e ersetzen muß, wenn unter Berücksichtung der Selbstenergie aller einlaufenden (inneren und äußeren) Linien die divergenten Propagatoren bzw. Amplituden durch renormierte ersetzt werden. Wir können uns jetzt überlegen, welchen Einfluß die Strahlungskorrekturen auf die in Tab. 10.5 angegebenen Feynman-Regeln zur Berechnung von Übergangsamplituden unter Berücksichtigung der Renormierung haben. Werden in der Tabelle die (λ) Ersetzungen m 0 m 0r , eer , u u r , v vr und εα(λ) εrα vorgenommen, so gilt nach (10.128) auch SF (q) SFr (2)(q), und nach (10.131) ist schon von Hause aus (2) D Fr αβ (k) D F αβ (k). Mit e er ist auch die an den Vertizes vorzunehmende Korrektur erledigt. Damit läuft die Berechnung von Übergangsamplituden unter Berücksichtigung sämtlicher divergenten, aber Vernachlässigung aller endlichen Strahlungskorrekturen nach der Renormierung darauf hinaus, daß nur Umbenennungen vorgenommen werden müssen. Alle weiteren Rechnungen verlaufen so, als wären die divergenten Strahlungskorrekturen nicht vorhanden, da sie durch die Benutzung renormierter Größen schon berücksichtigt sind. Auf die Umbenennungen kann dann schließlich auch verzichtet werden.
10.11 Auswirkungen regulärer Strahlungskorrekturen
349
10.11 Auswirkungen regulärer Strahlungskorrekturen In diesem Abschnitt untersuchen wir einige Auswirkungen der bei der Renormierung bislang ignorierten regulären Strahlungskorrekturen. Führt man unter deren Einbeziehung die gleichen Rechnungen wie im letzten Abschnitt durch, so erhält man aus (10.115), (10.122) und (10.124) mit (10.125)–(10.126) (2) SF¼ (2) (q) Z 2 S Fr (q) ,
(2) (2) D ¼ Fαβ (k) Z 3 D Fr αβ (k) ,
Γ (2)μ (q ¼ , q)
(2)μ
Γr
(q ¼ , q) Z1 (10.139)
mit (2)
S Fr (q)
2α hμ c g h 0 αβ (2) , D Fr αβ (k) 1 RΠ (k ) q/ m 0r cα RΣ (q)/(2π) 3π k k (2)μ Γr(2)μ (q ¼ , q) 1α RΛ (q ¼ , q)/(2π) γ μ Λ1 (q ¼ , q)
und den früheren Werten der Z i . Die divergenten Faktoren Z 1 Z 2 und Z 3 können wie gehabt in einer Redefinition der Ladung und der strahlungskorrigierten Feldamplituden absorbiert werden. Die Feynman-Regeln der Tabelle 10.5 sind jetzt dahin(2) (2) gehend abzuändern, daß die Ersetzungen SF (q) S Fr (q), DFαβ (k) D Fr αβ (k) und (2)μ
γ μ Γr (q ¼ , q) vorgenommen und dann keinerlei Strahlungsterme zweiter Ordnung mehr berücksichtigt werden müssen.
10.11.1 Uehling-Potential Ein besonders einfaches Beispiel für eine physikalische Auswirkung des regulären Beitrags RΠ (k ) zur Selbstenergie des Photons bietet ein externes Potential A0 Φ/c, das wie innere und äußere Photonlinien durch die Photonenselbstenergie beeinflußt wird. Das zugehörige Feynman-Diagramm entspricht dem linken, horizontal verlaufenden Teil der Abb. 10.19. Wie A0 modifiziert werden muß, können wir der Ersetzung (10.85) mit (10.86) für eine innere Photonlinie entnehmen, wenn wir in dieser 2 d 4k i DFαβ (k) unter Ignorieren des Index β durch A α (k) ersetzen und anschließend (2π)4 Al 0 setzen. Auf diese Weise erhalten wir mit Unterdrückung des ε-Terms in DFαμ (k) Aα
A¼α
A α i DFαμ (k) i Π(2)μν A ν
(9.88)
Aα
hμ 0c gαμ Π(2)μν Aν . (10.140) k k
Mit (10.107), unter Berücksichtigung der in Abschn. 10.10.1 bewiesenen Tatsache, daß der zu k μ k ν proportionale Anteil von Π(2)μν keine physikalischen Auswirkungen hat und daher weggelassen werden darf, sowie unter Weglassen des in die Renormierung aufgegangenen 1/δ-Terms erhalten wir daraus ¼
Aα
Aα
e2 μ0 c gαμ g μν RΠ (k ) Aν 6π 2 h
1
e 2 μ0 c RΠ (k ) A α 6π 2 h
350
10 Quantenelektrodynamik
oder mit (Q2.39) und unter Einschränkung auf A0 Φ/c 2α ¼ Φ (k) 1 (10.141) RΠ (k ) Φ(k) . 3π Mit m 0 2 c2 m 0 2 c2 z(1z)h 2 k k z(1z)h 2 k k ln ln 1 ln m 0 2 c2 4π h 2 μ2 4π h 2 μ2 21 und 0 z(1z)dz 1/6 ergibt sich aus der im Anschluß an (10.107) getroffenen Definition von RΠ (k ) 1 C 1/2 1 z(1z)h 2 k k m 0 2 c2 3 z(1 z) ln 1 ln dz . RΠ (k ) 2 2 4π h 2 μ2 m 0 2 c2 0 Da 1/δ const1/δ für δ 0 gilt, können wir uns vorstellen, daß die konstanten Beiträge zu Π(2)μν in der Renormierung aufgehen, und diese daher in Gleichung (10.141) weglassen. Aus der letzteren wird damit
2α 1 z(1z)h 2 k k Φ ¼ (k) 1 z(1z) ln 1 dz Φ(k) . π 0 m 0 2 c2 Mit der Substitution z (u 1)/2 vereinfachen wir das Integral gemäß 1 1 z(1z)h 2 k k 1 (1u 2 )h 2 k k 2 dz du z(1z) ln 1 (1 u ) ln 1 8 1 m 0 2 c2 4m 0 2 c2 0 1 2 2 2 1 1d(u u 3 /3) (1u 2 )h 2 k k u (u /31) du k k s.u. h du , ln 1 2 2 k k 2 2 8 1 du 4m 0 2 c2 2 4m 0 0 c (1u )h wobei durch eine partielle Integration der Logarithmus beseitigt und aufgrund der Sym21 21 metrie des zuletzt erhaltenen Integranden 1 du . . . 2 0 du . . . gesetzt wurde, und
erhalten α h 2 k k 1 u 2 (u 2 /31) du Φ (k) 1 Φ(k) . 2 2 2 2 k k π 0 4m 0 c (1u )h Für die Fourier-Transformierte des statischen Potentials Φ(x) gilt Φ(k)
Φ(x) ei k x
2
d 4x (2π)2
eik0 x0
Ze 4πε0 x
d x0 (2π)1/2
Φ(x) ei k x
d 3x (2π)3/2
δ(k0 )Z e , 2πε0 k2
wobei eik0 x0 d x 0 2πδ(k0 ) und (10.24) mit p0 und p /h k benutzt wurde. Setzen wir dies in unser letztes Ergebnis für Φ (k) ein und berücksichtigen, daß wegen des Faktors δ(k0 ) in der Klammer vor Φ(k) nur der Wert k0 0 in Frage kommt, so erhalten wir mit k k k02 k2 k2 schließlich Z eα h 2 1 u 2 (1u 2 /3) Ze Φ (k) δ(k0 ) du . 2πε0 k2 2π 2 ε0 0 4m 0 2 c2 (1u 2 )h 2 k2
10.11 Auswirkungen regulärer Strahlungskorrekturen
351
Dieses Ergebnis soll nun durch Fourier-Rücktransformation in den Ortsraum übersetzt werden, wobei klar ist, daß der erste Term wieder das Coulomb-Potential liefert. 2 Damit und mit δ(k0 ) ei k0 x0 dk0 1 ergibt sich $ % 4 4 e i k x d 3 k Z e 1 α h 2 1 i k x d k 2 u Φ (x) Φ (k) e du u (2π)2 4πε0 x 2π 3 0 3 4m 0 2 c2 (1u 2 )h 2 k2 s.u.
$ Ze 1 4πε0 x
α π
1 0
2m 0 c
u 2 )1/2 (u 2 u 4 /3) e h(1 (1u 2 ) x
x
% du ,
wobei zuletzt die in Büchern über die Fourier-Transformation nachschlagbare Formel ei k x d 3 k ea x 4π x k2 a 2 (2π)3
benutzt wurde. Mit der weiteren Substitution v 1/ 1u 2 , die das Integrationsintervall 1 v und in diesem 2 v 2 1 1 u 2 u 4 /3 1 2 dv du 1u 2 3v 2 2v zur Folge hat, ergibt sich schließlich nach Herausziehen des gemeinsamen Faktors 1/ x % $ Ze 2α v 2 1 1 2m 0 cv x /h Φ (x) dv . (10.142) 1 1 2 e 4πε0 x 3π 1 v2 2v Dieses erstmals 1935 von E. Uehling berechnete und als Uehling-Potential bezeichnete Potential enthält die durch die Vakuumpolarisation hervorgerufene Strahlungskorrektur des Coulomb-Potentials. Wir wollen das allgemein nicht weiter vereinfachbare Ergebnis (10.142) für den Fall „großer“ x -Werte, d. h. Werte, für die X 2m 0 c x /h 1 gilt, noch näherungsweise auswerten. Dazu setzen wir v 1ε und erhalten damit für das Integral in (10.142) zunächst allgemein ε(2ε) 1 J e X 1 e X ε dε . (1ε)2 2(1ε)2 0
Da e X ε wegen des großen Wertes von X mit zunehmendem ε>0 extrem schnell nach null abfällt, gibt es zum Integral nur für sehr kleine Werte von ε wesentliche Beiträge. Wir 2 können daher nach ε entwickeln underhalten in niedrigster Ordnung mit Γ (x) 0 et t x 1 dt und Γ (3/2)Γ (1/2)/2 π/2 J
3 e X
2
X t X ε 3 e ε e X ε dε
0
3 e X Γ (3/2)
2 X 3/2
3 π e X
2 X 3/2
2 2 X 3/2
.
t 0
1/2
3 e X et dt
2 X 3/2
0
t 3/21 et dt
352
10 Quantenelektrodynamik
Einsetzen in (10.142) liefert mit X 2m 0 c x /h Φ (x) ¼
Ze 4πε0 x
1
e 2m 0 c x /h 3/2 4 π (m 0 c x /h) α
.
(10.143)
Man erkennt, daß der das Coulomb-Potential korrigierende Klammerausdruck mit wachsenden x wegen des schnellen Abfalls der Exponentialfunktion sehr schnell 13 m gibt es gegen 1 geht. Nur in dem Intervall 0 x < 0 c)λCompt 410 h/(m 3 daher eine merkliche Korrektur, die sich grob gesehen wie δ ( x ) verhält. Sehr nahe bei x 0 verhält sich das Potential so, als wäre die das Feld erzeugende Ladung größer als e. Der Grund, warum sie nach außen abgeschwächt wird, ist die durch Elektron-Positron-Paarbildung hervorgerufene Polarisation des Vakuums, die zu einer Abschirmung der nackten Ladung in größerem Abstand führt. Wir sind einer deltaförmigen Korrektur des Coulomb-Potentials schon in der relativistischen Quantenmechanik, Gleichung (3.50), begegnet, wo auch diskutiert wurde, wie durch sie im Wasserstoffatom die Energieniveaus der Drehimpulsquantenzahl l 0 verschoben werden. Hier sei nur noch darauf hingewiesen, daß eine durch das UehlingPotential hervorgerufene Verschiebung der Energieniveaus einen Beitrag zur LambShift liefert, zu dem aufgrund anderer Strahlungskorrekturen noch weitere und zum Teil deutlich größere Beiträge hinzutreten.
10.11.2 Anomales magnetisches Moment des Elektrons Der nicht zu γ μ proportionale Anteil der Vertexkorrektur, der nach Gleichung (10.110) (2)μ in Λ1 (q , q) enthalten ist, führt zu einer Korrektur des magnetischen Moments des Elektrons bzw. Positrons. Um diese abzuleiten, betrachten wir die Wechselwirkung eines Elektrons mit einem statischen Magnetfeld. Dabei handelt es sich um eine Wechselwirkung, bei der sich wie bei der in Abschn. 10.2.2 behandelten Mott-Streuung schon in erster Ordnung der Störungsrechnung eine von null verschiedene Übergangsamplitude ergibt. Das zugehörige Feynman-Diagramm entspricht dem Diagramm der Abb. 10.3, nur daß γ 0 durch γ α und φ/c durch Aα ersetzt werden muß. Es ist unter Einschluß der Diagramme für die Strahlungskorrekturen in Abb. 10.19 wiedergegeben. (Der Vergleich mit der um 90 Grad im Uhrzeigersinn gedrehten Abb. 10.16 (c) zeigt, daß bei der Vertexkorrektur q mit p und q mit p identifiziert werden muß.) Die Berechnung der Übergangsamplitude erfolgt wie bei der Mott-Streuung, d. h. wir können das Ergebnis (10.25) übertragen, indem wir die Ersetzungen γ 0 γ α
und
Ze (2π)3/2 ε0 h p p
2
c A α ( p p)
vornehmen, wobei A α ( p p) die Fourier-Transformierte des Vektorpotentials Aα (x) ist. Auf diese Weise erhalten wir (1) Sea
(2π)5/2 i m 0 h 3 c2 Mea A α ( p p) δ(Ep Ep ) , V Ep Ep ¼
¼
Mea ec u(l , p ) γ α u(l, p) .
10.11 Auswirkungen regulärer Strahlungskorrekturen
353
p¼
Aα
p Abb. 10.19: Ablenkung eines Elektrons an einem externen Magnetfeld.
Mea j α ist die Fourier-Transformierte der Elektronenstromdichte und j α A α die der Wechselwirkungsenergiedichte zwischen Elektronen und Magnetfeld. Jetzt berücksichtigen wir die Vertexkorrektur, indem wir γ α gemäß den Gleichungen (10.90) und (10.139) durch Γr(2)α ersetzen. Aus der Elektronenstromdichte wird dann j ¼ α ecu(l ¼ , p¼ )Γr(2)α u(l, p), und aus deren Lorentz-Transformationseigenschaften kann für sie die Struktur iΣ αβ qβ j ¼ α ec u(l ¼ , p¼ ) F1 (q 2 )γ α F2 (q 2 ) u(l, p) (10.144) 2m 0 c i α β mit (10.145) qβ pβ¼ pβ , Σ αβ γ γ γ β γ α 2 abgeleitet werden. q p¼ p ist der vom Elektron abgegebene bzw. auf das Magnetfeld übertragene Viererimpuls. Im Argument der Funktionen Fi wurde für q q der Einfachheit halber q 2 geschrieben, und es gilt q2
0.
(10.146)
Beweis: Mit p p p¼ p¼ m 20 c2 und p¼ pm ¼ c mc p¼ pmm ¼ c2 mv m ¼ v ¼ cos α ergibt sich q2 2m 20 c2
( p¼ p)2 2m 20 c2
1
p¼ p m 20 c2
1
mm ¼ m 20
1
vv ¼ cos α 1 vv ¼ /c2 1 2 c (1v 2 /c2 ) (1v ¼2 /c2 )
wegen 1 vv ¼ /c2
(1v 2 /c2 ) (1v ¼2 /c2 )
(v ¼ v)2
0.
0
Auf den allgemeinen Beweis von Gleichung (10.144) kann verzichtet werden, weil sich die angegebene Struktur von j ¼ α in der von uns benötigten Näherung weiter unten (nach dem Beweis der Beziehung (10.154)) von selbst ergeben wird. Ohne Strahlungskorrekturen gilt offensichtlich F1 (q 2 )1 und F2 (q 2 )0. Der Matrixtensor Σ αβ enthält als räumliche Komponenten die Komponenten der Spinmatrix und kann daher als Tensor für den Spin aufgefaßt werden, denn nach (2.206) gilt für zyklische l, m, n der Zusammenhang Σn
i γ lγ m
(2.204)
i l m (10.145b) (γ γ γ m γ l ) Σ lm , 2
354
10 Quantenelektrodynamik
der auch in der Form Σkl
εklm Σ m
(10.147)
geschrieben werden kann. Bevor wir uns der Bestimmung der Funktionen F1 (q 2 ) und F2 (q 2 ) zuwenden, wollen wir erst untersuchen, wie das magnetische Moment des Elektrons von diesen abhängt, weil sich daraus die für sie erforderliche Genauigkeit ergeben wird. Zu dieser Untersuchung benötigen wir die Gordon-Identität 1 u(l ¼ , p¼ ) p¼ α p α i Σ αβ qβ u(l, p) , 2m 0
c u(l ¼ , p¼ ) γ α u(l, p)
(10.148)
die wie folgt bewiesen wird. Beweis: Zum Beweis benötigen wir die Gleichungen (8.190a) und (8.190b), die von den Spinoren u(l, p) und u(l ¼ , p¼ ) erfüllt werden und mit (8.187) die Form p/ u(l, p) γ α pα u(l, p) m 0 c u(l, p) ,
u(l ¼ , p¼ ) p/¼ u(l ¼ , p ¼ ) γ α pα¼ m 0 c u(l ¼ , p¼ )
(10.149)
annehmen. Aus der ersten von diesen folgt u(l, p) γ β pβ u(l, p)/(m 0 c) und daraus 1 γ α γ β pβ u(l, p) . m0 c
γ α u(l, p)
Addition der mit 2/i multiplizierten Gleichung (10.145b) zu (2.204) liefert γ α γ β g αβ i Σ αβ , womit das zuletzt erhaltene Ergebnis in γ α u(l, p)
1 α p m0c
i Σ αβ pβ u(l, p)
überführt wird. Analog folgt aus Gleichung (10.149b) u(l ¼ , p¼ ) γ α
m1 c u(l , p ) ¼
¼
0
p¼ α i Σ αβ pβ¼ .
Mit diesen Ausdrücken für γ α u(l, p) und u(l ¼ , p¼ ) γ α ergibt sich u(l ¼ , p¼ ) γ α u(l, p)
1 ¼ ¼ α 1 u(l ¼ , p¼ ) γ α u(l, p) u(l , p )γ u(l, p) 2 2 1 u(l ¼ , p¼ ) pα i Σ αβ pβ p¼ α i Σ αβ pβ¼ u(l, p) 2m 0 c
Durch Anwenden der Gordon-Identität auf den γ α -Term von j¼ α ergibt sich aus (10.144) j¼ α
2me
0
u(l ¼ , p¼ ) F1 (q 2 ) p ¼ α p α
F1 (q 2 ) F2 (q 2 ) iΣ αβ qβ u(l, p) .
Im Fall eines statischen Magnetfelds mit dem Vektorpotential Aα 0, A wird hiermit aus der Wechselwirkungsenergie j¼ α A α
2me
0
u(l ¼ , p¼ )
F1 (q 2) ( p
¼
p) A
F1 (q 2 ) F2 (q 2 ) iΣ kβ qβ A k u(l, p) .
10.11 Auswirkungen regulärer Strahlungskorrekturen
355
Jetzt beschränken wir uns auf den Fall schwacher Wechselwirkung, bei dem p nur wenig und die Spinorquantenzahl l überhaupt nicht verändert wird, so daß wir l ¼ l haben und in q p ¼ p höchstens bis zu linearen Termen gehen müssen. Insbesondere dürfen wir dann später (10.150) ( p¼ p)( p¼ p) q q 0 setzen. Für den ersten Klammerterm von j¼ α A α erhalten wir unter dieser Annahme F1 (q 2 ) ( p¼ p) A 2F1 (0) p A . Auch im zweiten können wir q 2 0 setzen, mit q0 p0¼ p0 m 0 c m 0 c0 ergibt sich Σ kβ qβ A k
Σkl q l A k (10.147) εklm q l Σ m A k (q )k A k (q ) A (q A) , außerdem können wir in dieser Näherung noch u(l , p )u(l, p) setzen. Insgesamt ¼
erhalten wir damit j¼ α A α
2me
0
¼
2F1 (0) p A F1 (0) F2 (0) i (q A)u(l, p) u(l, p) ,
wobei für den ersten Term in eckigen Klammern die Normierungsbedingung (8.192a) benutzt worden ist. Wir wollen das letzte Ergebnis in den Ortsraum zurück übersetzen. A( p¼ p) A(q) ist die Fourier-Transformierte des Vektorpotentials A(x) und i q A(q)/h die des Magnetfelds B(x), denn es gilt iq x iq x iq x iq x e h B(x) d 3x e h rot A(x) d 3x rot (e h A) d 3x e h A d 3x
s.u.
iq x e h
A d x 3
iq h
e
i q x h
A(x) d 3x
(2π h )3/2 ihq A(q) ,
wobei im dritten Schritt unter Benutzung der in der Elektrodynamik abgeleiteten Variiq x iq x 2 D ante (E2.29) des Gaußschen Integralsatzes rot(e h A) d 3x ½ ne h A) d f 0 gesetzt wurde. Damit ergibt sich im Ortsraum die Wechselwirkungsenergie e 2F1 (0) p A(x) F1 (0) F2 (0) h B(x)u u . E ww 2m 0
Jetzt spezialisieren wir das Ergebnis noch auf nicht-relativistische Verhältnisse. Der Spinor u(l, p) besitzt dann nach Abschn. 2.8 nur zwei obere Komponenten, und mit (2.155) gilt uu ϕ ϕ , wobei ϕ ein Zweierspinor und der Erwartungswert von im Zustand ϕ ist. Unter Benutzung von Gleichung (Q7.38), 2S/h , erhalten wir schließlich E ww
eF1 (0) pm A 2me 0
0
F1 (0) F2 (0) 2 S B .
(10.151)
356
10 Quantenelektrodynamik
Nach der klassischen nicht-relativistischen Mechanik ist die Hamilton-Funktion für ein Teilchen der Ladung q in einem Magnetfeld mit dem Vektorpotential A ohne Berücksichtigung eines eventuellen Spins durch H
( p q A)2 2m 0
2
2mp
0
q p A m0
2
2
q2mA
0
gegeben. Für ein Elektron (Ladung q e) ergibt sich daraus die Wechselwirkungsenergie e p A/m 0 zwischen Ladung und Magnetfeld. In Anschluß an Gleichung (10.144) wurde festgestellt, daß ohne Strahlungskorrekturen F1 (q 2 ) F1 (0)1 und F2 (q 2 ) F2 (0)0 gilt. Dies zeigt, daß der erste Term in unserem Ergebnis für E ww die Wechselwirkungsenergie zwischen Ladung und Magnetfeld ist. Ohne Strahlungskorrekturen ist der zweite Term gleich B mit gs e S/(2m 0 ) und gs 2, nach (Q7.23) und (Q7.24) also die Wechselwirkungsenergie eines Spin-1/2-Teilchens der Ladung e mit dem gyromagnetischen Verhältnis 2. Bei Berücksichtigung der Strahlungskorrekturen können alle Ultraviolettdivergenzen in renormierten Größen absorbiert werden. Wenn wir dann annehmen, daß unser Ausdruck für E ww schon ausschließlich mit renormierten Größen gebildet ist, wobei wir den Index für renormierte Größen verabredungsgemäß weglassen, muß erneut F1 (0) 1
(10.152)
gelten, damit der erste Term mit der Ladungswechselwirkung des Elektrons identifiziert werden kann. Für die Wechselwirkung des Spins mit dem Magnetfeld ergibt sich damit aus dem zweiten Term das gyromagnetische Verhältnis gs
2 1 F2 (0)
.
(10.153)
Um die Auswirkungen der Strahlungskorrekturen auf das gyromagnetische Verhältnis (2)μ zu bestimmen, genügt es also, aus dem für Γr ( p¼ , p) abgeleiteten Ergebnis den Wert von F2 (0) abzuleiten. Zuvor jedoch noch eine kurze Anmerkung zu den Funktionen F1 (q 2 ) und F2 (q 2 ). Die Beziehung (10.151) läßt erwarten, daß die Wechselwirkung des Elektrons mit dem Magnetfeld oder allgemeiner mit einem elektromagnetischen Feld für q q>0 von q q abhängt. Dabei erscheint es so, als würden die Ladung und der Spin, also innere Teilcheneigenschaften, durch F1 (q 2) und F2 (q 2 ) modifiziert. Dies hat dazu geführt, die Funktionen F1 (q 2 ) und F2 (q 2 ) als Formfaktoren des Elektrons zu bezeichnen. Der physikalische Grund für die scheinbare Modifikation der inneren Struktur des Elektrons ist, daß das Elektron permanent von einem Strahlungsfeld virtueller Photonen umgeben ist, das durch die Strahlungskorrekturen berücksichtigt wird. Jetzt kommen wir zur Berechnung von F2 º0» mit Strahlungskorrektur. Dazu benötigen wir von der in Gleichung (10.144) angegebenen Zerlegung der Größe j¼ α ec u(l ¼ , p¼ ) Γr(2)α u(l, p) diejenigen Anteile von Γr(2)α , die nicht zu γ α proportio(2)μ nal sind. Nach (10.90) und (10.110) müssen diese in Λ1 (q ¼ , q) enthalten sein. Da wir nur F2 (0) bestimmen wollen, können wir uns auf den Fall schwacher Wechselwirkung beschränken, in dem die Näherung (10.150) gilt. Die etwas mühsame Auswertung
10.11 Auswirkungen regulärer Strahlungskorrekturen
357
der Beziehung (10.109), die in dem nachfolgenden Beweis durchgeführt wird, liefert in diesem Fall α ( p¼ α p α ) α J3 α 2π γ 4πm 0 c
¼ Λ(2)α 1 ( p , p)
mit J3
2
1
dx 0
(10.154)
1 x 2 4(x y)(x y)2 dy , (x y)2 0
wobei ausgenutzt ist, daß Λ1 in jα A α zwischen den Spinoren u(l ¼ , p¼ ) (linker Hand) und u(l, p) (rechter Hand) steht – viele der im folgenden abgeleiteten Formeln gelten nur unter dieser Voraussetzung, d. h. sie sind so zu verstehen, daß man sich rechts u(l, p) und links u(l ¼ , p¼ ) als zusätzliche Faktoren hinzudenken muß. (2)α
Beweis: In u(l ¼ , p¼ ) Λ1
(2)α
( p¼ , p) u(l, p) können die beiden Spinoren unter die beiden Integrale (2)α
gezogen werden, aus denen Λ1 gemäß (10.109) berechnet werden muß. Um dann die Beziehungen (10.149) ausnutzen zu können, bringen wir mit Hilfe der Vertauschungen (2.204) 2g αβ γ β γ α pβ¼ 2 p¼α p/¼ γ α, p/ γ α 2 pα γ α p/ (10.155) γ α p/¼ γ α γ β pβ¼ p/ ganz nach rechts und p/¼ ganz nach links. Auf diese Weise erhalten wir für den (gedanklich) (2)α zwischen u(l ¼ , p¼ ) und u(l, p) gestellten Zähler Z des Integranden von Λ1 ( p¼ , p) Z (1 y)(2 p¼α p/¼ γ α ) xγ αp/m 0 cγ α γ μ (1 x) (2 pα γα p/) y p/¼ γα m 0 cγα (10.149) (1 y)(2 p¼α m 0 cγ α ) xγ αp/m 0 cγ α γ μ (1 x) (2 pα γα m 0 c) y p/¼ γα m 0 cγα 2(1 y) p¼α ym 0 cγ α xγ αp/ γ μ 2(1 x) pα xm 0 cγα y p/¼ γα 4(1 x)(1 y) p¼α γ μ pα 2x(1 y)m 0 cγ μ p/¼ 2y(1 y)γ μp/¼ p/¼
2(1
x)ym 0 c p/ γ μ x ym 20 c2 γ α γ μ γα y 2 m 0 cγ α γ μp/¼ γα
2x(1 x)/ p p/ γ μ x 2 m 0 cγ αp/ γ μ γα x yγ αp/ γ μp/¼ γα .
Unter Benutzung der Relationen (10.149) und (10.155) sowie unter Berücksichtigung der Anwendung auf u(l, p) bzw. u(l ¼ , p¼ ) findet man (Aufgabe 10.14) γ μp/¼p/¼
m 20 c2 γ μ , p/ p/ γ μ m 20 c2 γ μ ,
2γ μ , γ αp/γ μ γα 4 pμ , γ α γ μ γα
γ α γ μp/¼ γα
4 p¼ μ , γ αp/γ μp/¼ γα 2m 20 c2 γ μ ,
und durch Einsetzen in den zuletzt für Z erhaltenen Ausdruck ergibt sich Z
4(1 x)(1 y) p p¼ γ μ2x(1 y)m 0 c(2 p¼ μ m 0 cγ μ ) 2y(1 2(1 x)ym 0 c(2 pμ m 0 cγ μ ) 2x ym 20 c2 γ μ 4y 2 m 0 cp¼ μ 2x(1 x)m 20 c2 γ μ 4x 2 m 0 cpμ 2x ym 20 c2 γ μ
4m 0 c(y x y 4(1 x)(1
x 2 ) p μ 4m 0 c(x x y y 2 ) p¼ μ y) p p¼ γ μ 2 2x 2y x 2 y 2 m 20 c2 γ μ .
y)m 20 c2 γ μ
358
10 Quantenelektrodynamik
Aus der Annahme (10.150) folgt noch 2 p p¼
p p p¼ p ¼
p/ p/ p/¼ p/¼
(10.156)
sowie unter Berücksichtigung der Einwirkung auf u(l, p) bzw. u(l ¼ , p¼ ) und mit Hilfe einiger der in Aufgabe 10.14 abgeleiteten Beziehungen 2 p p¼ γ μ
p/ p/γ μ p/¼ p/¼ γ μ
2m 20 c2 γ μ .
Damit erhalten wir schließlich
Z 4m 0 c(y x y x 2 ) pμ 4m 0 c(x x y y 2 ) p¼ μ 2 24(x y) (x y)2 m 20 c2 γ μ . (10.157) (2)α
Zur Umformung des Nenners des Integranden von Λ1 ( p¼ , p) benutzen wir die Näherung (10.156a) und erhalten mit p pp/ p/ unter Hinzudenken der Spinoren u(l, p) bzw. u(l ¼ , p¼ ) auf der rechten bzw. linken Seite Z m 20 c2 (x y)(x 2 x y x) p p(y 2 x y y) p¼ p¼
Z N
Z/ p p/ N p p
Zm 20 c2
N p p
Z p p(x y)(x 2 x y x)( p p)2 /m 20 c2 (y 2 x y y) p p p¼ p¼ /m 20 c2
Z N p p/m 20 c2
.
Der erste und der letzte Ausdruck müssen für alle x und y übereinstimmen, was nur für p pm 20 c2 der Fall ist, d. h. im Nenner darf p p durch m 20 c2 ersetzt werden, und das Gleiche kann analog für p¼ p¼ gezeigt werden. Aus dem Nenner wird damit N
m 20 c2 (x y)2 .
(10.158)
(In dem Integral, dessen Auswertung mit Hilfe der Beziehung (10.99) zu (10.109) geführt hat, gilt N und damit wie gefordert 0.) Einsetzen von (10.157) und (10.158) in (10.109) liefert mit e2 μ0 c/(8π 2 h) α/(2π) (2)μ
Λ1 mit J1
α α J1 pμ J2 p¼ μ J γμ π m0c 2π 3
1 1 x 1 1 x y x y x 2 x x y y2 dx d y , J dx dy , 2 2 (x y) (x y)2 0 0 0 0 1 1 x 24(x y)(x y)2 J3 d x dy . (x y)2 0 0
Unter Benutzung von x x y y 2 x x(x y)(x y)2 ergibt sich 1 x 1 x 1 x 1 x x x y y2 dy dy d y x x dy xy (x y)2 0 0 (x y)2 0 0 und mit d(x 2 ln x))/d x 2x ln x x folgt hieraus 1 '1 1 1 1 ' J2 x ln x d x (x 2 ln x)' x dx 0 2 2 0 0
x ln x ,
1 . 4
Analog findet man J1 1/4. Das Integral J3 müssen wir nicht berechnen, da es mit γ μ multipliziert wird und daher nicht zu dem von uns gesuchten Wert F2 (0) beiträgt. Auf ein mit ihm verbundenes Problem wird kurz im nächsten Teilabschnitt eingegangen.
10.11 Auswirkungen regulärer Strahlungskorrekturen
359
Um j ¼ α ec u(l ¼ , p¼ ) Γr(2)α u(l, p) in die Form (10.144) zu überführen, belassen wir alle zu γ α proportionalen Anteile einschließlich des entsprechenden, in (10.154) ¼ ¼α α angegebenen Anteils von Λ(2)α 1 ( p , p) so, wie sie sind. Den zu p p proportionalen (2)α ¼ ¼ ¼ Anteil von u(l , p ) Λ1 ( p , p) u(l, p) überführen wir dagegen mit Hilfe der GordonIdentität (10.148) bzw. u(l ¼ , p¼ ) p ¼ α pα u(l, p) u(l ¼ , p¼ ) 2m 0 cγ α i Σ αβ qβ u(l, p) in
α u(l ¼ , p¼ ) p ¼ α p α u(l, p) u(l ¼ , p¼ ) 4πm 0 c
α α α γ i Σ αβ qβ u(l, p) . 2π 4πm 0 c
Der zweite Klammerterm der rechten Seite ist der einzige nicht zu γ α proportionale Anteil von Γr(2)α und liefert zu j ¼ α ec u(l ¼ , p¼ ) Γr(2)α u(l, p) den Beitrag α i Σ αβ qβ ¼ ¼ ec u(l , p ) u(l, p) . 2π 2m 0 c Durch den Vergleich mit (10.144) ergibt sich aufgrund unserer Vernachlässigung von Termen (q q) sofort α F2 (0) , (10.159) 2π und aus (10.153) folgt hiermit für das gyromagnetische Verhältnis des Elektrons der korrigierte Wert α , (10.160) gs 2 1 2π der erstmals 1948 von J. Schwinger gefunden wurde. Heute ist gs unter Berücksichtigung von Korrekturen höherer Ordnung und der damit verbundenen Renormierungen bis zu Termen der Ordnung α3 bekannt, und für die relative Abweichung vom gyromagnetischen Verhältnis gs 2 der Dirac-Theorie ergibt sich der theoretische Wert ath
g s 2 2
0, 5
α π
0, 32848
α 2 π
1, 49
α 3 π
0, 0011596524()4 .
Der experimentell gefundene Wert liegt mitsamt seiner Fehlergrenzen innerhalb der theoretischen Fehlergrenzen, d. h. die Theorie wird in beeindruckender Weise durch das Experiment bestätigt. Daß der Wert des gyromagnetischen Verhältnisses durch die Strahlungskorrekturen erhöht wird, läßt sich qualitativ verstehen: Das Elektron emittiert und absorbiert laufend Photonen und ist damit permanent von virtuellen Photonen umgeben, deren Energie dem Energieäquivalent seiner Ruhemasse entzogen wird. Damit ist das Verhältnis e/m 0 effektiv etwas erhöht, was in gs e S/(2m 0 ) durch einen Faktor gs >2 zum Ausdruck kommt.
Infrarotkatastrophe In diesem Abschnitt soll noch kurz auf eine Schwierigkeit hingewiesen werden, die bei der Berechnung des magnetischen Moments zwar angedeutet, jedoch übergangen
360
10 Quantenelektrodynamik
wurde. Die Berechnung des Integrals J3 führt mit 1 x 2 4(x y)(x y)2 2 dy 4 ln x 1 x 2 x (x y) 0 zu 1 2 4 ln x 1 x d x 5, 5 2 lim ln ε . J3 ε 0 x 0 J3 enthält also eine logarithmische Singularität, und diese überträgt sich auf den Faktor F1 (0), von dem wir im letzten Abschnitt angenommen haben, er würde nach der Renormierung den Wert eins annehmen. Man könnte daran denken, diese neue Divergenz einfach in den bisherigen Renormierungsprozeß mit einzubeziehen. Nur ein Problem unter anderen wäre dabei jedoch, daß die Größe, mit der die Singularität regularisiert wird – oben ε und bei einer gleich zu erwähnenden relativistisch invarianten Regularisierung eine andere Größe – nichts mit dem zur Regularisierung der Ultraviolettdivergenzen benutzten Parameter δ zu tun hat. Die genauere Untersuchung hat gezeigt, daß diese Vorgehensweise auch nicht nötig ist, vielmehr wird die mit J3 verbundene Singularität auf physikalische Weise behoben. Im folgenden soll nur skizziert werden, wie es dazu kommt, für eine ausführliche Diskussion wird auf die Spezialliteratur verwiesen.1 (2)μ Das Integral J3 ist ein Bestandteil der Größe Λ1 , von der wir sichergestellt hatten, daß sie keine Ultraviolettdivergenz aufweist. Der Nenner ihres Integranden ist der (2)μ gleiche wie der des Integranden von Λ2 bzw. Λ(2)μ und enthält nach (10.91) wie D Fαβ (k) den Faktor k k i ε, verschwindet also für k k 0 und ε0. Es sieht zwar so aus, als wäre diese Singularität nur scheinbar, weil in Λ(2)μ über d 4 k integriert wird, tatsächlich tritt sie sich jedoch in J3 echt zum Vorschein. Am einfachsten erkennt man sie bei ihrer invarianten Regularisierung: Bei dieser ersetzt man im Nenner h 2 k k durch h 2 k k μ20 c2 und läßt später μ0 0 gehen. Das kann so interpretiert werden, als erhielte das Photon vorübergehend eine kleine Ruhemasse μ0 . (Diese müßte dann zwar auch im Zähler berücksichtigt werden, da sie jedoch als sehr klein angenommen wird, kann sie überall vernachlässigt werden, wo dadurch keine Divergenz entsteht.) Ihr wesentlicher Effekt besteht darin, daß im Nenner von J3 zu (x y)2 der Term μ20 c2 addiert wird, wodurch der divergente Teil von J3 in 2 ln(μ0 c) überführt wird. Da die Divergenz von J3 demnach auf kleine Werte von k k bzw. große Wellenlängen zurückzuführen ist, wird sie als Infrarotdivergenz bezeichnet und ihr Auftreten als Infrarotkatastrophe. (Die Ward-Identität (10.94) läßt übrigens erkennen, daß auch Σ (2) (q) von einer Infrarotdivergenz betroffen ist, weil sich die Singularität von J3 nach (10.154) auf Λ(2)α 1 (q, q) überträgt.) Um qualitativ zu verstehen, wie die Infrarotdivergenzen physikalisch behoben werden, sehen wir uns noch einmal den Prozeß an, bei dem wir auf sie gestoßen sind, die Streuung eines Elektrons an einem externen Magnetfeld (Abb. 10.19). Da bei dem von uns behandelten Prozeß alle vom Elektron abgestrahlten Photonen wieder von diesem absorbiert werden, also weder zur Quelle des Magnetfelds noch woandershin laufen – das einzige auslaufende Teilchen ist das Elektron –, handelt es sich um eine elasti1 Eine ausführliche Behandlung der Infrarotkatastrophe findet sich in den Büchern [1] und [2] der Literaturliste.
10.12 Strahlungskorrekturen höherer Ordnung und Renormierbarkeit
361
sche Streuung des Elektrons. Dieses kann jedoch auch unter Abstrahlung von Photonen inelastisch gestreut werden, – unter Emission von Zyklotronstrahlung bei der Wechselwirkung mit einem homogenen Magnetfeld, von Bremsstrahlung bei der Wechselwirkung mit dem elektrischen Feld eines Kerns oder allgemeiner einer Kombination von beidem. Bei einer inelastischen Streuung ist die experimentelle Anordnung genau die gleiche wie bei der elastischen. Nun kann bei einem Streuprozeß nie vorhergesagt werden, ob eine elastische oder inelastische Streuung stattfinden wird, das läßt sich allenfalls im Nachhinein anhand gestreuter Photonen feststellen. Allerdings besitzt jedes Meßgerät eine endliche – eventuell vom Gerät abhängige – Energieschwelle E S für die Detektion von Photonen derart, daß jedes Photon unbemerkt bleibt, dessen Energie hωk unterhalb dieser Schwelle liegt. Daher kann in einem Elektronen-Streuexperiment nach Herausrechnen aller detektierbaren Photonen immer nur der kombinierte Wirkungsquerschnitt für die elastische Streuung und alle nicht detektierbaren inelastischen Streuprozesse bestimmt werden, also der Wirkungsquerschnitt für die Summe der Diagramme, bei denen ein Elektron und kein oder ein oder zwei oder drei usw. Photonen mit Energien 0hωk E S auslaufen. Es stellt sich heraus, daß alle Diagramme mit auslaufenden Photonen für hωk 0 ebenfalls Infrarotdivergenzen aufweisen. Diese können wie die Divergenz von J3 regularisiert werden. Werden ihre Amplituden zur Amplitude des elastischen Streuprozesses addiert, so heben sich die Singularitäten insgesamt für jede endliche Schwelle E S >0 gegenseitig weg. Die bei rein elastischer Streuung erhaltene Singularität von F1 (0) wird also durch Einbeziehen unvermeidbarer physikalischer Begleitprozesse durch deren Singularitäten kompensiert, und für das effektive F1 (q 2 ) all dieser Prozesse ergibt sich F1 (0)1.
10.12 Strahlungskorrekturen höherer Ordnung und Renormierbarkeit Wir haben bisher nur die Strahlungskorrekturen niedrigster Ordnung behandelt und deren Divergenzen durch Renormierung behoben. Wie wir schon gesehen haben, treten auch in allen höheren Ordnungen der Störungsrechnung Divergenzen auf, und es fragt sich, ob auch diese alle durch Renormierung behoben werden können. Die Antwort auf diese Frage ist positiv, allerdings muß auf den Beweis dafür aus Platzgründen verzichtet werden. Der interessierte Leser wird auf die Literatur verwiesen, insbesondere auf die Bücher [11] und [14] des Literaturverzeichnisses oder auf eine besonders kompakte Darstellung in [12]. Der wesentliche Gedankengang soll jedoch wenigstens skizziert werden. Ausgangspunkt sind die Gleichungen (10.116), (10.121) und (10.123) bzw. S ¼F 1 (q) SF 1 (q) Σ(q) , Γ μ (q ¼ , q)
1 1 D ¼ F (k) DF (k) Π(k) , (10.161)
γ μ Λμ (q ¼ , q)
(10.162)
für die alle Strahlungskorrekturen umfassenden Propagatoren SF¼ (q) und D F¼ (k) bzw. Vertexfunktion Γ μ (q ¼ , q). Diese enthalten die unbekannten Größen Σ(q), Π(k) und
362
10 Quantenelektrodynamik
Λμ (q ¼ , q), die wir in niedrigster Ordnung ausgewertet haben, und sind natürlich divergent. Weiterhin wird die allgemeine Ward-Identität h
Λμ (q, q)
∂Σ(q) ∂q μ
(10.163)
benutzt, die nur in niedrigster Ordnung bewiesen wurde und allgemein bewiesen werden muß. Unter Ausnutzung der Gleichungen (10.161)–(10.163) kann gezeigt werden, daß alle Divergenzen wie bei den in niedrigster Ordnung erhaltenen Ergebnissen (10.139) in multiplikativen Faktoren Z 1 , Z 2 und Z 3 enthalten sind, so daß SF¼ (q) Z 2 SFr (q) ,
D F¼ (k) Z 3 DFr (k) ,
Γ μ (q ¼ , q)
μ
Γr (q ¼ , q) Z1
μ
mit regulären Größen SFr (q), DFr (k) und Γr (q ¼ , q) gilt. Die divergenten Faktoren Z 1 , Z 2 und Z 3 können wie in der niedrigsten Ordnung in (divergenten) Korrekturen der Ruhemasse und der Ladung absorbiert werden, womit man zu einer Theorie gelangt, die nur endliche Meßgrößen enthält. Quantenfelder wie die Felder der QED, bei denen alle Divergenzen durch Renormierung beseitigt werden können, heißen renormierbar. Da die Frage der Renormierbarkeit bei der Entwicklung der Quantentheorie anderer Felder eine wichtige Rolle gespielt hat, folgen hier noch einige Anmerkungen zu diesem Thema. Zu deren Verständnis ist es nützlich, wenn wir die Beziehung (10.82) für den potentiellen Divergenzgrad von Übergangsamplituden auf den Fall einer QED in d Dimensionen verallgemeinern. Statt aus (10.81) muß dieser dann aus P P d n d Fi d Pi d qδ Fi(q) PD q 2 Pi d q d q δ (Pe Pa ) Plim P P abgelesen werden und ist D
d(Fi Pi
n 1)
Fi
2Pi
(d
1)Fi
(d
2)Pi
(n 1)d .
Die Beziehungen (10.83) gelten wie früher und können wieder zur Elimination von Pi und Fi benutzt werden, was zu
d d24 n
d 1 d 2 Fa Pa 2 2 führt. (Für d 4 folgt daraus natürlich (10.84).) Das Interessante an diesem Ergebnis ist, daß die Ordnung n der Störungsrechnung, die mit der Zahl der Vertizes in Diagrammen der entsprechenden Ordnung übereinstimmt, nur für d 4 herausfällt. Bei allen anderen Dimensionen spielt sie jedoch eine wichtige Rolle. Für d 3 wird der n-Term gleich n/2 und damit negativ. Dies hat zur Folge, daß D bei gegebener Anzahl Fa und Pa externer Linie für alle n>n (Fa , Pa ) negativ wird, d. h. ab einer gewissen Ordnung n sind keine Divergenzen mehr zu erwarten. Es gibt Felder, die dasselbe Verhalten in der vierdimensionalen Raum-Zeit aufweisen. Alle derartigen Felder werden als superrenormierbar bezeichnet. Für d 5 ist der n-Term gleich n/2, d. h. der Divergenzgrad D
10.12 Strahlungskorrekturen höherer Ordnung und Renormierbarkeit
363
wird mit zunehmender Ordnung immer größer. Dies bedeutet, daß immer mehr divergente Graphen auftauchen, bis ab einer gewissen Ordnung alle Diagramme potentiell divergent sind. Eine Theorie mit diesen Eigenschaften heißt nicht-renormierbar. Auch hier gibt es wieder Felder mit derselben Eigenschaft in vier Dimensionen, z. B. ein Skalarfeld, dessen Lagrange-Dichte durch
h 2 αβ m 0 c2 2 g g (∂α φ)(∂β φ) φ φn 2m 0 2 n
mit n
5
statt (9.8) gegeben ist. Für dieses gilt D 4(n 4)V N, wenn N die Anzahl äußerer Linien und V die mit zunehmender Ordnung anwachsende Zahl von Vertizes ist (Aufgabe 10.15). Bezüglich der Renormierbarkeit gibt es also drei verschiedene Möglichkeiten: 1. Superrenormierbarkeit: Es gibt nur eine endliche Anzahl potentiell divergenter Diagramme, ab einer gewissen endlichen Ordnung gibt es keine potentiellen Divergenzen mehr. 2. Renormierbarkeit: Es gibt nur endlich viele primitiv divergente Diagramme, aber in jeder Ordnung der Störungsrechnung treten Divergenzen auf (Beispiel QED). 3. Nicht-Renormierbarkeit: Ab einer gewissen Ordnung der Störungsrechnung sind alle Diagramme divergent. Man hat lange geglaubt, daß Renormierbarkeit eine unabdingbare Eigenschaft einer physikalisch sinnvollen Feldtheorie sei. Da bislang jedoch keine renormierbare Feldtheorie der Gravitation gefunden wurde, sich andererseits aber gezeigt hat, daß in nichtrenormierbaren Theorien zumindest eine Teilrenormierung möglich ist, hat sich diese Sichtweise mittlerweile gewandelt. Näheres dazu findet der interessierte Leser im Kapitel 12 des Buches [14], Band I aus dem Literaturverzeichnis. Zum Schluß dieses Abschnitts sei noch auf ein im Zusammenhang mit der Renormierung stehendes mathematisches Problem hingewiesen. Wir sind relativ sorglos mit zwei kombinierten Grenzübergängen umgegangen, zum einen δ 0 und zum anderen dem mit der Reihenentwicklung nach α verbundenen Grenzübergang n bei der Störungsordnung n. Bei Unterdrückung der involvierten physikalischen Parameter haben wir es mit Ausdrücken der Form f (α, δ) lim N
f N (α, δ)
N
gn α n
n 0
zu tun, wobei f N (α, δ) für δ 0 gilt und die gn von δ unabhängig sind. Unser Ziel wäre es im Prinzip gewesen, zunächst für endliche Werte von δ, bei denen die f N (α, δ) noch hinreichend klein sind, die Funktion f (α, δ) zu berechnen und dann δ 0 gehen zu lassen. Stattdessen haben wir die Reihe mit N 1 abgebrochen und schon dann δ 0 gehen lassen. Hier wäre nachzuweisen, daß dies eine gute Näherung an das zuerst genannte eigentliche Ziel darstellt. Außerdem treten bei dieser Vorgehensweise Mehrdeutigkeiten auf, über die wir einfach hinweggegangen sind. Die bei der Ableitung von Gleichung (10.124) vorgenommene Umrechnung Z 1 1/ 1α/(2πδ) 1α/(2πδ) (α2 ) ist nur für α/δ 1 zulässig. Läßt
364
10 Quantenelektrodynamik
man jedoch δ 0 gehen, so liefert der erste Ausdruck Z 1 0, der zweite hingegen Z1 . Daß der zweite Ausdruck, für den wir uns entschieden haben, der richtige ist, läßt sich zwar mit Hilfe von Gleichung (10.106) und der Ward-Identität (10.94) rechtfertigen, denn die letztere verknüpft gerade die beiden Größen miteinander, deren Singularitäten sich bei der Renormierung in (10.135) gegenseitig wegheben. Außerdem kommt es bei den physikalisch relevanten Konsequenzen der Theorie hauptsächlich n darstellt. Dennoch bleibt nur darauf an, daß g1 α eine gute Näherung an ½ g α n 1 n ein gewisses Unbehagen, und dem Autor ist nicht bekannt, ob diese mathematische Problematik untersucht wurde und geklärt ist. Die hervorragende Übereinstimmung der berechneten mit experimentellen Ergebnissen ist allerdings ein weiterer Beleg dafür, daß alles seine Richtigkeit hat.
10.13 Quantentheorie versus Quantenfeldtheorie Wir sind im Rahmen der relativistischen Quantenmechanik des Elektrons verschiedentlich an Grenzen der Theorie gestoßen, die mit der Existenz des Positrons als Antiteilchen des Elektrons zu tun haben und darauf hinwiesen, daß die Dirac-Theorie nur in begrenztem Umfang als Ein-Teilchen-Theorie zu gebrauchen ist. Um so erstaunlicher mag es erscheinen, daß die in diesem Kapitel behandelten Streuprozesse trotz der involvierten Teilchenerzeugungs- und Vernichtungsprozesse auch ohne den von uns bemühten Formalismus der Feldquantisierung aus der relativistischen Quantenmechanik und der unquantisierten Maxwell-Theorie abgeleitet werden können. Die einzige über den Rahmen der Dirac-Theorie hinausgehende Voraussetzung ist dabei die Feynman-Stückelberg-Interpretation des Positrons als eines in der Zeit rückwärts laufenden Elektrons. Der aufwendige Weg der Feldquantisierung wurde in diesem Buch beschritten, um den Leser mit dieser wichtigen Methode vertraut zu machen, und weil die Präsentation beider Methoden zu viel Platz in Anspruch genommen hätte. Der interessierte Leser sei hier auf die noch immer sehr empfehlenswerten Bücher [1] und [2] der Literaturliste von J. D. Bjorken und S. D. Drell hingewiesen, wo er alle von uns abgeleiteten Ergebnisse einschließlich der Renormierung im Rahmen der relativistischen Quantenmechanik abgehandelt findet. Im folgenden soll wenigstens kurz skizziert werden, wie das möglich ist. Dabei wird für den Fall der Elektron-Elektron-Streuung sogar eine Übergangsamplitude berechnet. Wir schreiben die Dirac-Gleichung (2.173) in der Form
(i h ∂/ m 0 c)ψ(x)
e A/ (x)ψ(x) .
(10.164)
Ihre formale Lösung ist ψ(x)
ψ (x)
e h
h
SF (x x ) A / (x )ψ(x ) d 4x ,
(10.165)
wobei ψh (x) eine beliebige Lösung der „homogenen“ Dirac-Gleichung (Gleichung (10.164) mit A / (x) 0) und SF (x x ) der durch (9.83) definierte Feynman-Propagator
10.13 Quantentheorie versus Quantenfeldtheorie
365
des Dirac-Feldes ist, denn mit (i h ∂/ m 0 c)ψh (x)0 gilt 1 / (x ¼ )ψ(x ¼ ) d 4x ¼ (i h ∂/ m 0 c)ψ(x) e (i h ∂/ m 0 c) SF (x x ¼ ) A h (9.85) 4 ¼ e δ (x x ) A / (x ¼) ψ(x ¼ ) d 4x ¼ e A / (x)ψ(x) . Da (10.165) die gesuchte Funktion ψ(x) auch auf der rechten Seite unter dem Integral enthält, handelt es sich um eine Integralgleichung. Wird der Wechselwirkungsterm eA / (x)ψ(x) als kleine Störung aufgefaßt, so kann die Lösung iterativ oder durch Reihenentwicklung gewonnen werden, e / (x ¼ )ψh (x ¼ ) d 4x ¼ SF (x x ¼ ) A ψ(x) ψh (x) h (10.166) e2 ¼ ¼ ¼ ¼¼ ¼¼ ¼¼ 4 ¼ 4 ¼¼ SF (x x ) A / (x )SF (x x ) A / (x )ψh (x ) d x d x .. . h2 Nun treffen wir bezüglich der Wechselwirkung die gleichen Annahmen über adiabatisches Ein- und Ausschalten wie in Abschn. 9.4. Da aus (10.165) bei verschwindender Wechselwirkung ψ(x)ψh (x) folgt, könne wir ψh (x) mit dem wechselwirkungsfreien Anfangszustand ψa (x) des Systems identifizieren, und wir nehmen an, daß es sich dabei um einen Ebene-Welle-Zustand (8.166) handelt, d. h. ψh (x)ψa (x)ψl p (x, t). Damit ergibt sich aus (10.166) für den Übergang zu einem Ebene-Welle-Zustand ψe (x)ψl p (x, t) ¼
¼
Sea
ψe (x 2 ) ψ(x 2 ) d x2 3
(8.170)
ψl
¼
p¼ (x2 , t2 ) ψl p (x2 , t2 ) d
(1) (2) x2 Sea Sea
3
(1) (2) δl l δ 3 ( p p) Sea Sea ¼
mit (1) Sea (2) Sea
e h e2
/ (x ) ψl p (x , t ) d 3x2 , d x ψl p (x2 , t2 ) SF (x 2 x ) A 4
¼
h2
¼
/ (x )SF (x x ) A / (x )ψl p (x , t ) d 3x2 . d x d 4x ψl p (x2 , t2 ) SF (x 2 x ) A 4
¼
¼
Dabei ist t2 die Zeit der Bestimmung der Übergangsamplitude. Mit der Darstellung (9.79) bzw. (9.81) von SF (x 2 x ) ergibt sich für t2 >t
1 3 ψl p (x2 , t2 ) SF (x 2 x ) d 3x2 d p ψl p (x2 , t2 ) ψl p (x2 , t2 ) d 3x2 ψ l p (x , t ) i l 1 2
¼
¼
¼
(8.170)
¼
2 1 δl l δ 3 ( p p) ψ l p (x , t ) d 3 p i ¼
l 1
1 δl l ψ l p (x , t ) i 2
¼
l 1
¼
366
10 Quantenelektrodynamik
und analog für t2
¼
3 p (x2 , t2 ) SF (x 2 x ) d x2 ¼
1 δl l ψ l p (x , t ) . i 4
¼
l 3
¼
Ausführen der verbliebenen Summation und Zusammenfassen der beiden Ergebnisse * ⎧ liefert ⎪ l 1, 2 und t2 >t , ⎨ i ε ψ (x , t ) für l l p 3 ψl p (x2 , t2 ) SF (x 2 x ) d x2 l 3, 4 und t2
¼
¼
¼
¼
wobei wie früher εl 1 für l 1, 2 und εl 1 für l 3, 4 definiert ist. Hiermit ergibt sich (1) i εl he ψ l p (x , t ) A/ (x ) ψl p (x , t ) d 4x (10.167) Sea ¼
und (2) Sea
i εl
¼
e2
¼
h 2
¼
ψl
¼
p¼ (x
, t ) A/ (x )S (x x ) A/ (x ) ψ (x , t ) d 4x d 4x . (10.168) F lp
Wie in der Feldtheorie enthalten die Übergangsamplituden den Anfangs- und Endzustand, nur werden diese Zustände nicht durch die Einwirkung von Erzeugungsoperatoren auf den Vakuumzustand dargestellt, sondern als Spinoren im Ortsraum. Geht die Zeit t2 der Bestimmung der Übergangsamplitude , so gelten die Ergebnisse (10.167)– (10.168) nur für l 1, 2, für l 3, 4 ergeben sich dagegen wegen der For(1) derung t >t2 für von null verschiedene Integranden die Übergangsamplituden Sea 0 (2) und Sea 0. Wenn wir jedoch nach Feynman und Stückelberg ein in der Zeit rückwärts laufendes Elektron negativer Energie als Positron interpretieren, müssen wir als Zeit der Bestimmung der Übergangsamplitude t2 wählen und erhalten dann für l 3, 4 von null verschiedenen Amplituden. Als konkretes Anwendungsbeispiel untersuchen wir die Elektron-ElektronStreuung. In diesem Fall sind in den Gleichungen (10.167)–(10.168) l und l entweder gleich eins oder gleich zwei, und es gilt εl 1 . Die unter den Integralen stehenden Spinoren ψ sollen das erste Elektron beschreiben, während A α (x) das von der Stromdichte j2 α (x) des zweiten Elektrons erzeugte Feld sein soll und der Gleichung D (x y) F αβ β j2 (y) d 4y A α (x) (10.169) h c ¼
genügt, weil aus dieser D (x y) F αβ β j2 (y) d 4y Aα (x) μ0 h μ0 c
(9.89) (9.90)
μ0
β
gαβ δ 4 (x y) j2 (y) d 4y
μ0 j2 α (x)
folgt. Durch Einsetzen von (10.169) wird aus (10.167) i (1) , t ) γ α ψ (x , t ) D (x x ) j β (x ) d 4x d 4x . eψ (x Sea l p l p F αβ 2 1 1 1 1 h 2 c ¼
¼
10.13 Quantentheorie versus Quantenfeldtheorie
367
Paarervernichtung
Paarerzeugung (a)
(b)
Abb. 10.20: Elektron-ElektronStreuung (a) ohne sowie (b) mit Paarerzeugung und -vernichtung. Der Kreis markiert das Wechselwirkungsgebiet.
Der in eckige Klammern gesetzte Ausdruck ist offensichtlich der Beitrag der Stromdichte des ersten Elektrons zur Übergangsamplitude. Aus Symmetriegründen muß der β Beitrag j2 (x ¼¼ ) des zweiten Elektrons die gleiche Form haben, so daß wir schließlich i e2 (1) ψ l p (x ¼ , t ¼ )γ α ψl1 p1 (x ¼ , t ¼ )DFαβ (x ¼ x ¼¼ ) Sea 1 1 h 2 c ψ l p (x ¼¼, t ¼¼ )γ β ψl2 p2 (x ¼¼, t ¼¼ ) d 4x ¼ d 4x ¼¼ ¼
¼
¼
¼
2 2
erhalten. Wird hierin (8.166) eingesetzt, so ergibt sich bis auf einen Faktor der erste Term der in der Quantenfeldtheorie berechneten Übergangsamplitude (10.42). Der unterschiedliche Faktor ist zum Teil dadurch begründet, daß zur Ableitung von (10.42) im Gegensatz zu hier diskrete Wellen benutzt wurden. Außerdem haben wir bei der jetzigen Ableitung nicht die für zwei Elektronen zu fordernde Antisymmetrie der Gesamtwellenfunktion berücksichtigt, sondern die beiden Elektronen wie unterscheidbare Teilchen behandelt. Wird das nachgeholt, so erhält man auch noch den zweiten Term von (10.42) und den korrekten Vorfaktor. Es kann als einer der Vorteile der Quantenfeldtheorie angesehen werden, daß die Symmetrieeigenschaften identischer Teilchen ohne weiteres Zutun automatisch berücksichtigt werden. In der Übergangsamplitude zweiter Ordnung (10.168) werden auch Prozesse der Elektron-Positron-Paarerzeugung und -vernichtung mit erfaßt: Da über x ¼ und x ¼¼ integriert wird, gibt es zu den Integralen Beiträge des Elektronenpropagators mit t ¼¼ >t ¼ und t ¼¼
¼
368
10 Quantenelektrodynamik
Aufgaben 10.1
Vergleichen Sie die Dimension der Übergangsamplitude (10.20) für die Paarerzeugung durch ein Gammaquant und (10.43) für die Elektron-ElektronStreuung. Wie ist der Unterschied zu erklären?
10.2
Zeigen Sie, daß bei der Elektron-Elektron-Streuung für den vom virtuellen Photon übertragenen Impuls p pi pk¼ (mit Teilchennummern i und k ) jeder beliebige Wert von (p) (p) möglich ist.
10.3
Beweisen Sie die Beziehung (u ¼ γ β u)£ uγ β u ¼ .
10.4
Zur Lösung der Aufgaben 10.5–10.7 werden die Beziehungen
0, γ αγα 4 ,
Sp γ α
Sp(γ α γ β )4g αβ ,
Sp(γ λ γ μ γ ν )0 ,
γ βγ α γβ 2γ α, Sp(γ κγ λγ μγ ν )4(g κλg μν g κνg λμ g κμg λν )
benötigt. Beweisen Sie diese. 10.5
Beweisen Sie die Beziehung β p1¼ m 0 c) γ α (/ p1 m 0 c) 4 g αβ m 20 c2 p1α p1¼ β p1 p1¼ α g αβ p1 p1¼ . Sp γ β (/
10.6
Zur Lösung von Aufgabe 10.7 wird die Beziehung γ β (/ p1¼ m 0 c) γ α (/ p1 m 0 c) γβ
10.7
2m 20 c2 γ α 4m 0 c( p1α p1¼ α ) 2/ p1 γ αp/1¼
benötigt. Beweisen Sie diese. Beweisen Sie für Aγ β p/1¼ m 0 c γ α p/1 m 0 c γβ p/2¼ m 0 c γα p/2 m 0 c die Beziehung Sp A 16 2m 40 c4 m 20 c2 p1 p1¼ m 20 c2 ( p1 p1¼ )( p2 p2¼ ) m 20 c2 p2 p2¼ 2 p1 p2 p1¼ p2¼ .
10.8
Zeigen Sie: Bei der Elektron-Photon-Streuung folgt aus der Energie- und Impulserhaltung im Ruhsystem des Elektrons die Beziehung k k¼ 1h k(1 cos . ϑ)/(m 0 c)
10.9
Berechnen Sie mit Hilfe der Feynman-Regeln die Übergangsamplitude der Elektron-Photon-Streuung und vergleichen Sie das Ergebnis mit (10.45).
10.10 Berechnen Sie die Übergangsamplitude der Elektron-Positron-Streuung mit Hilfe der entsprechenden Anteile des dritten Summanden in Gleichung (10.39) und überprüfen Sie das Ergebnis mit Hilfe der Feynman-Regeln. 10.11 Wieviele Diagramme gibt es in n-ter Ordnung zu einem Prozeß, bei dem n Ph Photonen und n F Fermionen einlaufen sowie n ¼Ph Photonen und n ¼F Fermionen auslaufen?
Aufgaben
369
10.12 Zeigen Sie: Wenn es zu einem gegebenen QED-Prozeß n-ter Ordnung zusammenhängende Graphen mit von null verschiedener Amplitude gibt, können erst in n 2-ter Ordnung wieder Graphen mit von null verschiedener Amplitude auftreten. 10.13 Berechnen Sie die Übergangsamplitude der Mott-Streuung mit Hilfe der Beziehung (10.167). 10.14 Beweisen Sie die Beziehungen
m 20 c2γ μ , p/ p/ γ μ m 20 c2 γ μ ,
γ μp/¼p/¼
2γ μ , γ αp/γ μ γα 4 pμ ,
4p μ , γ αp/γ μp/ γα 2m 20 c2 γ μ .
γ α γ μ γα
γ α γ μp/¼ γα
¼
¼
10.15 Beweisen Sie, daß das Feld φ mit der Lagrange-Dichte h 2 2m
0
g αβ (∂α φ)(∂β φ)
m 0 c2 2 g φ φn 2 n
den potentiellen Divergenzgrad D 4 (n 4)V N besitzt.
Lösungen 10.1
(1)
In (10.20) ist u(l ¼ , p ¼ )γ α v(l ¼¼ , p¼¼ ) g λλ εα (λ)(k) dimensionslos, so daß S(d) ea die Dimension von e h μ0 m 0 c3 δ 4 ( p ¼ . . .)/ Ep Ep ωk besitzt. Die δ 4 -Funktion hat die Dimension von 1/ p4 . Mit μ0 c2 1/ε0 und der dimensionslosen Feinstrukturkonstanten α e2 /(ε0 h c) läßt sich sehr einfach die Dimension von μ0 berücksichtigen. Insgesamt ergibt sich auf diese Weise 4 3 3 3 4 4 e h μ0 m 0 c3 e2 h αh2c (1) Dim Dim Dim Dim S(d)ea p 8 ε0 ω p8 ω p4 E 2 ω 1 Dim 3 3/2 . p k Ähnlich findet man für (10.43) 3 4 h 4 e2 m 20 c4 h μ0 c 1. Dim (Sea ) Dim p4 V 2 E 2 h 2 k 2
¼
¼¼
Der Unterschied erklärt sich auf folgende Weise: In beiden Fällen hat S mit der Wahrscheinlichkeit des Übergangs vom Zustand a zum Zustand e zu tun. Im ersten Fall wurden hierfür nicht-normierbare Wellen aus einem Kontinuum benutzt, im zweiten diskrete Wellen. In S e S a ist der Operator S dimensionslos, was z. B. aus (10.11) ersichtlich wird, so daß S die Dimension von e a erhält. Im ersten Fall ist diese nach (10.19) bezüglich a gleich der von b(λ) und bezüglich e gleich der von a b , nach (8.127c) und (8.177a,b) also gleich Dim(1/k 3/2 ) bzw. Dim(1/ p3 ). Im zweiten Fall ergibt sich für Anfangs- und Endzustand aus (10.6) und (10.41) die Dimension eins. Im ersten Fall ist S 2 daher eine Wahrscheinlichkeitsdichte, im zweiten eine Wahrscheinlichkeit für den Übergang.
370
10 Quantenelektrodynamik
10.2
Für jedes ein- bzw. auslaufende Elektron gilt Gleichung (8.163), p p m 20 c2 , so daß jedes von ihnen 3 Freiheitsgrade besitzt. Durch den Erhaltungssatz p1α p2α p¼ α1 p¼ α2 werden insgesamt vier von diesen festgelegt. Die Größe (p)(p) ( piα
p αk )( pi α p k α )
1 oder 2 enthält zwei Impulse und daher nach Berücksichtigung von p pm 20 c2 noch sechs freie ¼
¼
mit i, k
Impulskomponenten. Durch den Impulserhaltungssatz werden von diesen maximal vier festgelegt, so daß (p)(p) noch mindestens zwei freie Parameter enthält. Diese können so gewählt werden, daß (p)(p) jeden beliebigen Wert annimmt.
10.3
Unter Benutzung von (2.212), (2.205) und (2.202) bzw. u ¼ u ¼ γ 0, (γ 0 )2 1, 0 β 0 β 0 0 0 0 0 und γ γ γ γ γ ergibt sich γ γ γ γ β (u γ u) (u γ 0 γ β u) (u γ 0 γ β γ 0 γ 0 u) (u γ β γ 0 u) γ β u ) γ 0 u
s.u.
(γ 0 u) γ β u
γ 0 γ β u
u
u
γ 0γ β u
uγ β u .
Dabei benutzt wurde die für Spinoren ψ und χ gültige Beziehung 4 (ψ χ) (ψl χl ) (χl ψl ) χ ψ . l 1
10.4
l
Sp γ α 0 folgt aus der Darstellung (2.172). Weiterhin gilt mit Sp(A B) Sp(B A) 1 (2.204) gαβ Sp E 4gαβ . Sp γ α γ β Sp γ β γ α Sp γ α γ β γ β γ α 2 Mit (2.209) und Sp(A B) Sp(B A) ergibt sich Sp γ λ γ μ γ ν Sp (γ λ γ μγ ν γ 5) γ 5 Sp γ 5(γ λ γ μγ ν γ 5) (2.208b) Sp γ λ γ 5γ μ γ ν γ 5 . . . Sp γ λ γ μγ ν γ 5γ 5 Sp γ λ γ μγ ν 0 . Den zweiten Satz von Gleichungen erhält man gemäß 1 α β γ α γα gαβ γ α γ β gβα γ β γ α gαβ γ β γ α gαβ (γ α γ β γ β γ α )gαβ g αβ 4, 2 β α αβ α β αβ α γ γ γβ 2g γ γ γβ 2g γβ γ γ β γβ 2γ α 4γ α 2γ α . und mit Sp(γ λ γ μ γ ν γ κ ) Sp(γ κ γ λ γ μ γ ν ) aus Sp(γ κ γ λ γ μ γ ν ) Sp (2gκλ γ λ γ κ )γ μ γ ν 2g κλ Sp(γ μ γ ν ) Sp(γ λ γ κ γ μ γ ν ) 8gκλ gμν Sp γ λ (2gκμ γ μγ κ )γ ν 8gκλ gμν 8gκμ gλν Sp(γ λγ μ γ κ γ ν )
. . . 8gκλ gμν 8gκμ gλν 10.5
8g κν g λμ Sp(γ λ γ μ γ ν γ κ ) .
Mit den Ergebnissen von Aufgabe 10.4 ergibt sich p1μ Sp γ β γ λ γ α γ μ m 2 c2 Sp γ β γ α Sp γ β (/ p1 m 0 c) γ α (/ p1 m 0 c) p1λ 0 Sp γ β γ λ γ α m 0 c p1λ p1μ Sp γ β γ α γ μ p1μ Sp γ β γ λ γ α γ μ 4m 20 c2 gαβ p1λ p1μ gβλ gαμ gβμ gλα gβα gλμ , 4m 20 c2 gαβ 4 p1λ
Aufgaben
371
und aus der letzten Zeile folgt unmittelbar die behauptete Beziehung. 10.6
Zunächst gilt B
γ β p/1¼ m 0 c γ α p/1 m 0 c γβ
m 20 c2 γ β γ α γβ γ β p/1¼ γ α p/1 γβ β /¼ γ α γ γ β γ α p/ γ m 0 c γ p β 1 β . 1
Mit dem vorletzten Ergebnis von Aufgabe 10.4 ergibt sich γ β p/1¼ γ α γβ
¼ ¼ 2g βλ γ λ γ β γ α γβ p1λ γ β γ λ γ α γβ p1λ ¼ ¼ 2 p1λ g αλ 4 p1¼ α γ α γ λ γ λ γ α 4 p1λ
und analog γ β γ αp/1 γβ 4 p1 α . Mit der Formel γ αp/1
γ α γ λ p1λ
2g αλ γ λ γ α p1λ
2 p1α
p/1 γ α ,
deren Anwendung durch Überklammerung des entsprechenden Ausdrucks angezeigt wird, ergibt sich weiterhin , -. / γ βp/1¼ γ α p/1 γβ
weil
, -. / , -. / γ βp/1¼ 2 p1α p/1 γ α γβ 2 p1α γ β p/1¼ γβ γ β p/1¼ p/1 γ α γβ ¼ 2 p1α γ β 2 p1β γβ p /1¼ 2 p1¼ β p/1¼ γ β p/1 γ α γβ 4 p1α p/1¼ 8 p1α p/1¼ 2/ p1 γ αp/1¼ p/1¼ γ βp/1 γ α γβ
, -. / p/1¼ γ βp/1 γ α γβ
2/ p1 γ αp/1¼ ,
, -. / p/1 γ β γ α γβ 2/ p1¼ γ αp/1 2/ p1¼ p/1 γ α 2/ p1¼ γ αp/1 2/ p1¼ 2 p1α γ αp/1 4 p1αp/1¼ .
p/1¼ 2 p1 β
Einsetzen der erzielten Teilergebnisse und von γ β γ α γβ 2γ α in B führt zu der angegebenen Umformung. 10.7
Mit
, -. / γ αp/1¼ p/2¼ m 0 c γα
(2 p1¼ α p/1¼ γ α )(/ p2¼ m 0 c)γα , -. / 2/ p2¼ p/1¼ 2m 0 c p/1¼ p/1¼ γ αp/2¼ γα 4m 0 c p/1¼ 2/ p2¼ p/1¼ 2m 0 c p/1¼ p/1¼ 2 p2¼ α p/2¼ γ α γα 4m 0 c p/1¼ 2/ p2¼ p/1¼ 2m 0 c p/1¼ 2/ p1¼ p/2¼
s.u.
4 p1¼ p2¼ 2m 0 c p/1¼ ,
¼ ¼ ¼ ¼ p1μ (γ λ γ μ γ μ γ λ )2 p1λ p1μ g λμ 2 p1¼ p2¼ benutzt wurde, wofür p/1¼ p/2¼ p/2¼ p/1¼ p1λ mit p2¼ m 0 c)γα 2 p2¼ α γα (m 0 cp/2¼ )γ α γα 4m 0 c2/ p2¼ γ α (/
372
10 Quantenelektrodynamik
und mit dem Ergebnis von Aufgabe 10.6 wird A 2m 20 c2 γ α 4m 0 c( p1 p1¼ )α 2 p/1 γ α p/1¼ ( p/2¼ m 0 c)γα ( p/2 m 0 c)
2m 20 c2 (4m 0 c 2 p/2¼ )( p/2 m 0 c)4m 0 c ( p/2¼ m 0 c)( p/1 p/1¼ )( p/2 m 0 c)
8m 30 c3 p/2 8m 40 c4 4m 20 c2 p/2¼ p/2 4m 30 c3 p/2¼ 4m 0 c p/2¼ p/1 p/2 4m 20 c2 p/2¼ p/1
2 p/1 (4 p1¼ p2¼ 2m 0 c p/1¼ )( p/2 m 0 c)
4m 0 c p/2 p/1 p/2 4m 20 c2 p/2 p/1 4m 20 c2 p/1 p/2 4m 30 c3 p/1 4m 20 c2 p/1 p/2 4m 30 c3 p/1 8 p1 p2 p/1 p/2 8m 0 cp1 p2 p/1 4m 0 c p/1 p/1 p/2 4m 20 c2 p/1 p/1 . Mit Sp( Ai ) Sp A i sowie dem ersten und dritten Ergebnis von Aufgabe 10.4 wird ¼
¼
¼
¼
z. B.
Sp p/2
¼
¼
¼
¼
¼
p2λ Sp γ λ 0 ,
¼
¼
¼
¼ Sp(/ p2¼ p/1 p/2 ) p2λ p1μ p2ν Sp(γ λ γ μ γ ν ) 0 .
Hiermit und mit Sp(/ p1p/2 ) p1λ p1μ Sp(γ λ γ μ ) 4g λμ p1λ p1μ
4 p1 p2
etc. ergibt sich schließlich
Sp A 32m 40 c44m 20 c2 Sp p/2¼ p/2 p/2¼ p/1 p/2¼ p/1¼ p/1 p/2 p/1¼ p/2 p/1 p/1¼ 8 p1¼ p2¼ Sp(/ p1 p/2 ) 16 2m 40 c4m 20 c2 ( p2 p2¼ p1 p2¼ p1¼ p2¼ p1 p2 p1¼ p2 p1 p1¼ ) 2 p1¼ p2¼ p1 p2 .
10.8
Energie- und Impulserhaltung bedeuten E h ω E ¼ h ω¼ ,
ph k p¼ h k ¼ .
Im Ruhsystem des einfallenden Elektrons gilt E m 0 c2 und p0. Mit ω k c, ω¼ k ¼ c und k k ¼ k k ¼ cos ϑ sowie E ¼ (m 20 c4 p¼ 2 c2 )1/2 folgt aus dem Energieerhaltungssatz (nach Teilen durch c) m 20 c2 p¼ 2 m 0 c h ( k k ¼ ) und aus dem Impulserhaltungssatz
h 2 (k2k 2 2kk cos ϑ) . Elimination von p 2 und Auflösen nach k führt zu der behaupteten Beziehung. Mit (8.190a) und b) bzw. p/ u m 0 c u und u p/ m 0 c u ergibt sich ,-./ ,-./ u γ αp/ γ μp/ γα u u γ αp/ γ μ 2 pα γα p/ u 2u p/ p/γ μ u u γ αp/ γ μ γα p/ u 2m 0 cu 2 pμ γ μp/ u u 2 pα p/γ α γ μ γα p/ u p¼ 2
h 2 (k
k ¼ )2
¼
¼
10.14
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
,-./ u ¼ 4m 0 cpμ 2m 20 c2 γ μ u u ¼ 2 γ μp/ p/¼ p/γ α γ μ γα p/¼ u s.u. ¼ u 4m 0 cpμ 2m 20 c2 γ μ u 2u ¼ 2 pμ p/ γ μ p/¼ u 2u ¼p/ γ μp/¼ u u¼ 4m 0 cpμ 2m 20 c2 γ μ 4 pμ m 0 c u 2m 20 c2 u¼ γ μu .
Dabei wurde in dem mit bezeichneten Schritt γ α γ μ γα 2γ μ benutzt. Die übrigen Ergebnisse erhält man auf ähnliche Art und Weise. s.u.
III
Einführung in die Elementarteilchentheorie
11
Einleitung zur Elementarteilchentheorie
Die Elementarteilchenphysik befaßt sich mit den kleinsten Bestandteilen der Materie und deren Wechselwirkungen. Sie bietet den Versuch einer Lösung des berühmten Problems von Goethes Faust: „... daß ich erkenne, was die Welt im Innersten zusammenhält“. In diesem Teil des Buches wird es zunächst darum gehen, die Teilchen kennen zu lernen, die man heute als elementar auffaßt. Dabei benutzen wir die Bezeichnung Elementarteilchen entweder für isolierte Teilchen, die sich nicht weiter zerlegen lassen und nach derzeitiger Kenntnis keine innere Struktur aufweisen (z. B. Elektronen), oder für die kleinsten Elemente der inneren Struktur nicht weiter zerlegbarer, aber strukturierter Teilchen, z. B. Quarks im Neutron. (Diese Verfahrensweise ist nicht durchgängig üblich, es gibt Autoren, die Quarks nicht als Elementarteilchen auffassen, da sie nicht frei auftreten, sondern stattdessen nur die einfachsten, aus diesen zusammengesetzten freien Teilchen.) Als nächstes erhebt sich die Frage, welche Eigenschaften diese „Teilchen“ besitzen – diese äußern sich in den verschiedenen Möglichkeiten der Wechselwirkung. Schließlich möchte man Gesetzmäßigkeiten finden, auf denen diese Eigenschaften beruhen, und diese zu einer möglichst umfassenden Theorie zusammenfassen. Unter den vielen heute bekannten Elementarteilchen treten nur wenige in unserer natürlichen Umgebung auf, die meisten sind unter den hier vorliegenden Bedingungen instabil und deshalb nicht vorzufinden. Zur Beschreibung des Aufbaus von Atomen, Molekülen und der aus diesen zusammengesetzten makroskopischen Materie benötigt man nur Elektronen, Protonen und Neutronen. Die letzteren sind allerdings als freie Teilchen instabil und zerfallen mit einer mittleren Zerfallsdauer von 15 Minuten; im Kern gebunden verhalten sie sich dagegen im wesentlichen wie stabile Teilchen. Ansonsten spielen in unserer Umwelt noch Photonen eine Rolle. In der Frühzeit des Universums, als alle Materie bei extrem hohen Temperaturen extrem dicht zusammengepackt war, bestand eine völlig andere Situation. In dieser fanden Teilchen, die heute nur künstlich erzeugt werden können oder als Boten ganz anderer Umstände aus dem Weltraum zu uns gelangen, die Bedingungen für eine natürliche Existenz vor. Dieser Sachverhalt hat zu einem faszinierenden Zusammenhang der Physik des Weltalls, also des ganz Großen, mit der Physik des Allerkleinsten geführt. Zwei Elementarteilchen derselben Sorte sind identische Kopien desselben Musters, es gibt zwischen ihnen auch nicht den geringsten Unterschied. Dies hat zu so einprägsamen Formulierungen geführt wie: „Ein Elektron ist ein Elektron ist ein Elektron“ oder „Kennt man eines, so kennt man alle“. Warum man das so genau weiß, wurde in der Quantenmechanik dargelegt: Es gibt Bedingungen, unter denen sich ein Ensemble vieler, sehr ähnlicher aber voneinander verschiedener Teilchen ganz anders verhält als ein Ensemble identischer Teilchen. Da Materie Masse besitzt, haben Elementarteilchen als deren kleinste Bausteine natürlich auch eine Masse – Ruhemasse oder bewegte Masse. Nach der Einsteinschen
376
11 Einleitung zur Elementarteilchentheorie
Formel E mc2 ist diese einer Energie äquivalent. Es war eine der großen Überraschungen bei der Erforschung des Aufbaus von Atomen zu Beginn des 20ten Jahrhunderts, daß deren Masse bzw. die dieser entsprechende Energie in einem winzigen Bruchteil des zur Verfügung stehenden Raumes konzentriert ist, so daß die Atome fast nur aus leerem Raum zu bestehen scheinen. Als E. Rutherford bei seinen berühmten Streuversuchen feststellte, wie winzig der Atomkern im Vergleich zum ganzen Atom ist, äußerte er: „Es war fast so, wie wenn jemand eine Granate auf ein Stück Seidenpapier geschossen hätte, diese wäre zurückgeprallt und hätte ihn getroffen.“ Nachdem sich mittlerweile herausgestellt hat, daß die Atomkerne aus Protonen und Neutronen zusammengesetzt sind, die ihrerseits eine Quarkstruktur aufweisen, ist klar, daß die Masse bzw. Energie unter extremer Dichte in den Elementarteilchen konzentriert ist. Es ist bemerkenswert, daß sich diese Konzentration von Masse auf kleine Bereiche eines viel größeren Raumgebiets, das im Prinzip zur Verfügung stehen würde, auf immer größer werdenden Skalen mehrfach wiederholt. Beim Aufbau von Molekülen aus Atomen bleiben zwischen den letzteren größere Lücken, und auch wenn wir von den Dimensionen unseres Alltagslebens in größere Dimensionen schauen, tun sich große Lücken auf: Im Sonnensystem zwischen den Planeten sowie zwischen diesen und der Sonne, in der Milchstraße zwischen den verschiedenen „Sonnensystemen“, in Galaxienhaufen zwischen den verschiedenen Galaxien usw. Die starke Konzentration von Energie in kleinsten Raumdimensionen hat für die Theorie der Elementarteilchen zwei wichtige Konsequenzen: Sowohl relativistische als auch Quanteneffekte spielen eine Rolle, d. h. es handelt sich um eine relativistische Quantentheorie. Da wir uns auch für die Wechselwirkungen der Elementarteilchen interessieren und die Relativitätstheorie bei diesen keine Fernwirkungen, sondern nur Nahewirkungen zuläßt, müssen wir die Wechselwirkungen durch Felder beschreiben. Für diese werden im Bereich der betrachteten Raumdimensionen und Feldstärken ebenfalls Quanteneffekte wichtig, so daß eine vollständige Theorie der Elementarteilchen zwangsläufig eine relativistische Quantenfeldtheorie ist. Viele Fragen lassen sich allerdings auch schon mit einer relativistischen Quantentheorie beantworten, ohne dabei die komplizierten Schritte einer Feldquantisierung nachvollziehen zu müssen. Wie in den meisten Gebieten der Physik kommt auch in der Elementarteilchenphysik ausgeklügelten Experimenten eine ebenso große Bedeutung zu wie klug erdachten theoretischen Gedankengebäuden. In diesem Buch wird es im wesentlichen um die letzteren gehen. Eine sehr wichtige Frage ist natürlich, wie man zu Informationen über Elementarteilchen gelangt. Das geschieht durch Streuexperimente, die Untersuchung des Zerfalls instabiler Teilchen oder das Studium gebundener Zustände von mehreren Elementarteilchen. Aus Platzgründen muß dieser Aspekt der Elementarteilchentheorie jedoch in dieser Einführung ausgespart werden. Die für einen einzelnen Streuprozeß benötigte Energie ist nicht sehr hoch. Man gibt sie üblicherweise in eV, MeV oder GeV an, und wenn man bedenkt, daß eine 100 W-Lampe in einer Stunde 0,1 kWh 21015 GeV verbraucht, erkennt man, daß selbst 1 GeV eine kleine Energiemenge darstellt. Die für Streuprozesse benötigte Energie muß allerdings wegen der Kleinheit des Targets außerordentlich konzentriert sein. Dies gelingt nur, indem man sehr kleinen Teilchen, im allgemeinen also Elementarteilchen wie Elektronen, oder aber Protonen und allenfalls größeren Kernen diese Energie gibt und sie auf das zu untersuchende Targetteilchen schießt. Damit man dann aber eine
377 Teilchen Moleküle Atome Kerne Nukleonen
Aufbau Atome Kern + Elektronen Nukleonen Quarks
B/(m K c2 ) 10 10 10 4 10 3 0 10 10 2
Tabelle 11.1: Bindungshärte der Konstituenten zusammengesetzter Teilchen, gemessen in Bindungsenergie B geteilt durch die der Konstituentenmasse m K entsprechenden Energie m K c2 .
hinreichend große Trefferwahrscheinlichkeit erhält, muß man das Target mit sehr vielen Teilchen beschießen, die alle auf dieselbe Energie gebracht wurden, und dann kommt man in der Summe doch auf ganz beachtliche Energien. Dies wird in den großen Teilchenbeschleunigern bewerkstelligt, die deshalb für die Elementarteilchenphysik von überragender Bedeutung sind. Streuexperimente führt man nicht nur an separaten Elementarteilchen durch, sondern an größeren Teilchen, die aus Elementarteilchen zusammengesetzt sind, entweder, weil die elementaren Bausteine gar nicht isolierbar sind – dies gilt, wie wir später noch sehen werden, für die Quarks –, oder weil sie in gebundenen Zuständen stabiler sind. Es hat sich herausgestellt, daß die Kräfte, durch die zusammengesetzte Teilchen zusammengehalten werden, mit abnehmender Größe der Teilchen immer stärker werden, die Teilchen werden immer „härter“ (Tabelle 11.1). Daher benötigt man zu ihrer Untersuchung oder Zerlegung auch immer höhere Energien. Bei den Streuprozessen können jedoch auch Teilchen erzeugt werden, die vorher in keinem der Stoßpartner enthalten waren. Aus Gründen der Energieerhaltung muß bei ihrer Erzeugung mindestens die in ihrer Ruhemasse enthaltene Energie zur Verfügung gestellt werden. Sie ist von dem stoßenden Teilchen aufzubringen, dessen kinetische Energie daher mit zunehmender Masse der Teilchen, die man erzeugen möchte, größer werden muß. Dies zeigt, daß der Trend zu immer größeren Beschleunigern nicht von Rekordsucht diktiert wird, sondern mit den Teilchen zu tun hat, die es zu untersuchen bzw. zu erzeugen gilt. Eigentlich sollte man erwarten, daß es sich bei den elementaren Bestandteilen der Materie um etwas Einfaches und Überschaubares handelt, das sich am einfachsten in einer übersichtlichen Tabelle präsentieren oder durch ein einfaches Modell darstellen läßt. So etwas gibt es bei den Atomen. Auf deren Theorie kam man durch das Studium einer zunächst als unüberschaubar erscheinenden Fülle von Spektrallinien angeregter Atome, indem man dessen Erkenntnisse mit dem Wissen über die Eigenschaften des Elektrons und die Existenz von Kernen in Atomen aufgrund von Streuversuchen verband. Leider ist die Situation bei den Elementarteilchen nicht ganz so einfach: Es gibt davon zu viele verschiedene, und diese weisen in ihren Eigenschaften eine relativ große Vielfalt auf. Man hat für sie allerdings heute ein Standardmodell, das sich, wenn es auch in mancherlei Hinsicht noch unvollständig ist, für viele Zwecke als äußerst brauchbar erwiesen hat und letztlich einen hervorragenden Überblick ermöglicht. Die hier präsentierte Einführung in die Elementarteilchentheorie soll tatsächlich nur eine Einführung sein: Sie soll das Interesse für eines der spannendsten Kapitel der Physik wecken, aber den Leser nicht durch ellenlange Rechnungen abschrecken. Es ist erstaunlich, daß man schon auf einem quasi klassischen Niveau, auf dem die
378
11 Einleitung zur Elementarteilchentheorie
die Teilchen beschreibenden Felder ähnlich wie das Maxwell- oder Schrödinger-Feld behandelt und nicht quantisiert werden, wesentliche Strukturen der Theorie erkennen kann, insbesondere die Gruppierung der Teilchen in Familien. Das macht sich diese Einführung zunutze, indem sie durchwegs auf diesem Niveau verbleibt. Für quantitative Fragen wie die Berechnung von Wirkungsquerschnitten, Lebensdauern oder Zerfallsraten, aber auch für einige wichtige Fragen qualitativer Natur wie die der großen Vereinheitlichung muß man die sehr viel schwierigere Quantenfeldtheorie heranziehen. Dies involviert dann Techniken, die teilweise in der Quantenfeldtheorie dieses Bandes behandelt wurden und deren Anwendung sich hier noch aufwendiger als dort gestalten würde. Aus Platzgründen muß darauf leider vollständig verzichtet werden. Wenn der Leser jedoch dazu angeregt wird, mehr erfahren zu wollen und Lücken zu schließen, die hier offen bleiben müssen, hat die hier dargebotene Einführung schon einen wichtigen Zweck erfüllt.
11.1
Historischer Rückblick auf die Entdeckung der Elementarteilchen
Das Standardmodell der Elementarteilchen ist zwar nicht so einfach wie das Bohrsche Atommodell, doch es hat eine beeindruckende Ordnung in eine große Vielfalt unterschiedlichster Phänomene gebracht. Sicher würde etwas von seiner Faszination verloren gehen, wenn man gleich mit ihm beginnen würde, ohne deutlich zu machen, in welchen „Wirrwarr“ scheinbar nicht zusammengehöriger Erfahrungen es Ordnung gebracht hat. Außerdem läßt sich viel dabei lernen, wenn man sich den historischen Ablauf der für die Elementarteilchenphysik wichtigen Entdeckungen vor Augen führt. Dies soll nachfolgend in kurzen Zügen geschehen, d. h. wir lassen die Akteure in der Reihenfolge ihrer Entdeckung die Bühne betreten, wobei dort, wo weitere Kommentare unnötig erscheinen, im wesentlichen nur Datum und Ereignis angegeben werden. Antike: Die Idee einer atomistischen Struktur der Materie geht auf die Griechen der Antike zurück. Nachdem Vorgänger wie Thales von Milet über einen Urstoff der Materie spekuliert hatten, brachte Demokrit das Konzept von Atomen auf, unter denen er kleine, unteilbare materielle Körper verstand, die alle aus derselben Substanz bestehen und sich nur durch ihre geometrische Form (rund, oval, eckig usw.) unterscheiden. Platon, für den „Ideen“ die eigentliche Wirklichkeit bildeten, hielt immaterielle symmetrische Gebilde wie Tetraeder, Würfel, Oktaeder usw. für die eigentlichen Grundelemente. Demgegenüber hielt Aristoteles eine Diskretisierung der Materie nicht für möglich, da er nicht einsehen mochte, warum man beim immer weiteren Zerteilen der Materie zu einem Ende kommen sollte. Derartige Gedanken aus dem Altertum haben zwar deutliche Parallelen in der moderneren Physik, wo z. B. Symmetrien für die Theorie der Elementarteilchen eine bedeutende Rolle spielen. Dennoch handelte es sich bei ihnen aber nicht um Erkenntnisse im Sinne einer modernen Wissenschaft, sondern eher um Spekulationen, die sich auch als völlig falsch herausgestellt haben könnten. Jedenfalls ging die spätere Weiterentwicklung von gänzlich neuen, auf empirischen Fakten beruhenden Erkenntnissen aus, wenn es auch sicher eine gewisse Erleichterung darstellte,
11.1 Historischer Rückblick auf die Entdeckung der Elementarteilchen
379
auf die alten Vorstellungen zurückgreifen zu können. Ihren Ursprung hatten die Überlegungen der Antike wohl in der Erkenntnis, daß in der Natur trotz aller Vielfalt Gesetzmäßigkeiten bestehen, die dafür sorgen, daß sich unter ähnlichen Umständen ähnliche Vorgänge abspielen, aber auch, daß unter relativ verschiedenen Umständen dieselben Stoffe wie Wasser, Metalle usw. anzutreffen sind. Ähnliche Überlegungen haben Jahrhunderte später auch I. Newton zu der Annahme geführt, daß „Gott am Anfang die Materie in festen, massiven, harten, undurchdringlichen, beweglichen Teilchen“ geschaffen habe „und daß die Natur aus diesem Grunde dauerhaft sei, wobei die Veränderungen der körperlichen Dinge nur den verschiedenen Trennungen und erneuten Zusammenfügungen dieser dauerhaften Teilchen zuzuschreiben seien.“ Moderne: Um die Wende vom 17. zum 18. Jahrhundert erfuhr die Atomtheorie eine Renaissance, die durch Gesetzmäßigkeiten inspiriert wurde, welche bei chemischen Reaktionen entdeckt wurden. 1794 stellte der französische Chemiker J.L. Proust sein Gesetz der konstanten Proportionen auf, nach dem zwei chemisch miteinander reagierende Substanzen bei der Reaktion nur dann völlig aufgebraucht werden, wenn ihre Massen in einem bestimmten, festen Verhältnis zueinander stehen. 1804 erweiterte der englische Physiker und Chemiker J. Dalton dieses zu einem Gesetz der multiplen Proportionen, nach dem für zwei Substanzen auch mehrere feste Massenverhältnisse möglich sind. 1803 postulierte Dalton die Existenz von Atomen. Alle Atome reiner Substanzen sind nach ihm chemisch und physikalisch identisch. Chemische Verbindungen werden in ganzzahligen Verhältnissen aus Atomen aufgebaut. Eine erste Tabelle Daltons mit Atomgewichten enthielt 6 Elemente und 13 Verbindungen. 1811 formulierte der Physiker A. Avogadro seine Atomhypothese: Gleiche Volumina idealer Gase enthalten bei gleichem Druck und gleicher Temperatur die gleiche Anzahl von Atomen bzw. Molekülen. Diese sind sehr klein und befinden sich andauernd in Bewegung. 1860 wird auf dem ersten internationalen Chemikerkongreß in Karlsruhe endgültig die Existenz von Atomen akzeptiert. 1869 ordnete D.I. Mendelejew die Elemente nach ihrer atomaren Massenzahl und ihren chemischen Ähnlichkeiten im Periodensystem der Elemente an. 1897 brachte J. J. Thomson den endgültigen Nachweis dafür, daß die schon länger bekannten Kathodenstrahlen, wie bereits vorher von anderen vermutet, aus elementaren Teilchen bestehen, nachdem G.J. Stoney 1874 für die kleinste Ladungseinheit den Namen Elektron eingeführt hatte. Erst im 20ten Jahrhundert wurde dieser auch auf das Teilchen übertragen. 1897/98 gelang W. Wien der Nachweis, daß Kanalstrahlen aus positiv geladenen Ionen bestehen. 1898 wies E. Rutherford nach, daß beim Zerfall von Uran zwei verschiedene Sorten von Strahlen emittiert werden, die er Alpha- und Betastrahlen nannte. Wenige Jahre später wurde man sich klar darüber, daß es sich bei den Betastrahlen um Elektronen handelt. 1900 hat M. Planck bei seinen Versuchen, das Spektrum der Hohlraumstrahlung zu erklären, die Idee der Quantisierung eingeführt. Er quantelte jedoch nur die Ener-
380
11 Einleitung zur Elementarteilchentheorie
giemenge, die von den in der Wand des Hohlraums befindlichen Oszillatoren in Licht überführt wird, also weder die Oszillatoren noch das Licht. 1905 stellte A. Einstein die Quantenhypothese für Licht auf, was jedoch lange nicht akzeptiert wurde. (Schon früher, z. B. zur Zeit Newtons, hatte man für Licht eine Korpuskulartheorie. Diese schien jedoch durch die Beobachtung von Wellenphänomenen, z. B. der Beugung, endgültig widerlegt.) 1913 entdeckte E. Rutherford bei seinen Streuversuchen (Beschuß von Atomen mit Alphastrahlen), daß die Atome einen sehr kleinen Kern besitzen, in dem im wesentlichen die ganze Ruhemasse und auch die positiven Ladungen des Atoms konzentriert sind. Außerdem erkannte er, daß es sich bei den Alphastrahlen um Kerne von Heliumatomen handelt. Den Kern von Wasserstoffatomen nannte er Proton. Im selben Jahr konstruierte N. Bohr sein berühmtes Atommodell. 1923 lieferte die Erklärung der Compton-Streuung durch A.H. Compton die endgültige Bestätigung von Einsteins Quantenhypothese für Licht. 1925 wurde von W. Heisenberg die Matrizenmechanik eingeführt. 1926 folgte E. Schrödinger mit der Wellenmechanik, die sich später als eine der Matrizenmechanik äquivalente Darstellung derselben Physik herausstellte. In diesem Jahr wurde auch von dem Chemiker G. Lewis für die Lichtquanten der Name Photonen eingeführt. 1927 stellte P. M. Dirac eine relativistische Wellengleichung auf, die heute als Dirac-Gleichung bezeichnet wird. Die Existenz von Lösungen negativer Energie und die damit verbundene Problematik der Instabilität von Zuständen positiver Energie inspirierte Dirac 1929 zu der Idee, daß die Zustände negativer Energie schon alle besetzt sind, und daß Löcher in der von den Elektronen negativer Energie gebildeten „Dirac-See“ positiv geladene Teilchen positiver Energie repräsentieren. Dies bedeutete im Grunde die theoretische Vorhersage des Positrons und von Antiteilchen. Allerdings wagte es Dirac zunächst nicht, die Existenz eines neuen Teilchens zu postulieren, und stellte die Löcher in seiner Publikation als Protonen vor, obwohl ihm klar war, daß deren Ruhemasse dafür zu groß ist. Erst in seiner 1931 erschienenen Arbeit über magnetische Monopole stellte er klar, daß es sich sich um Antielektronen handeln müsse. 1930 Vorhersage des Neutrinos durch W. Pauli, um beim Betazerfall von Atomen, A... B ... e , das Problem zu lösen, daß der Energie- und Impulssatz nicht gleichzeitig erfüllt werden können, wenn man den Zerfall in nur zwei Teilchen annimmt (Aufgabe Q2.2). Nach Pauli werden Teile des Impulses von einem ungeladenen Teilchen, dem Neutrino, übernommen. Erst 1955 gelang ein direkter Nachweis der Neutrinos durch C.L. Cowan und F. Reines mit dem inversen Betazerfall p n e . 1932 entdeckte C.D. Anderson das von Dirac postulierte Antielektron, das Positron. 1932 entdeckte J. Chadwick beim Beschuß von Kernen mit Alphateilchen (Heliumkernen) das Neutron. Mit diesem konnte erklärt werden, warum das Atomgewicht vom Wasserstoff zum Helium von 1 auf 4 und nicht nur auf 2 anwächst. Heisenberg brachte die Idee auf, Neutron und Proton wegen ihrer fast gleichen Ruhemassen als zwei Zustände ein und desselben Teilchens aufzufassen. 1933 entwickelte E. Fermi eine Theorie des Betazerfalls. Diese lieferte eine Bestätigung der Existenz des Neutrinos, wobei das beim Betazerfall entstehende Neutrino heute aus systematischen Gründen als Antineutrino bezeichnet wird. 1934 entwickelte H. Yukawa eine Theorie der Kernkraft, also der Kraft, die Proto-
11.1 Historischer Rückblick auf die Entdeckung der Elementarteilchen
381
nen und Neutronen im Kern zusammenhält. Für die Quanten des Feldes dieser Kraft berechnete er eine Ruhemasse von etwa 300 Elektronenmassen. Weil diese zwischen der des Elektrons und des Protons liegt, wurde dafür der Name Meson (von griech. mesos = mittel) eingeführt, während Elektronen zur Klasse der Leptonen gehören (von griech. leptos = leicht) und Protonen sowie Neutronen zur Klasse der Baryonen (von griech. barys = schwer). Später wurden die Namen dieser Klassen beibehalten, obwohl man längst andere Ordnungskriterien als leicht, mittel und schwer gefunden hatte, so daß sich heute in diesen Klassen auch Teilchen befinden, zu denen der Name nicht paßt. 1938 führte E.C.G. Stückelberg eine Baryonenzahl ein, die bei Zerfallsprozessen erhalten bleiben soll. Hierdurch wollte er die Stabilität des Protons erklären, das ohne diese Forderung gemäß p e zerfallen könnte. 1947 wurden in der Höhenstrahlung die Myonen entdeckt, welche die gleiche Ladung wie das Elektron tragen. Ihre Ruhemasse von etwa 207 Elektronenmassen legte zunächst die Vermutung nahe, es könne sich um die von Yukawa postulierten Quanten des Feldes der starken Wechselwirkung handeln, weshalb sie auch mit dem nach heutigen Maßstäben irreführenden Namen -Mesonen belegt wurden. Da sie jedoch nur sehr schwach mit gewöhnlicher Materie wechselwirken, mußte diese Idee aufgegeben werden. Bei ihnen traf man zum ersten Mal auf Teilchen, die nicht zur Erklärung des Aufbaus oder Zerfalls gewöhnlicher Materie benötigt werden. Da sie sich in allen ihren Eigenschaften bis auf das Gewicht wie Elektronen verhalten, werden sie zur Klasse der Leptonen gezählt. Außerdem wurde entdeckt, daß sich neben ihnen in der Höhenstrahlung auch andere, mittelgewichtige Teilchen befinden, mit denen sie gelegentlich verwechselt worden waren. Diese werden heute als -Mesonen bezeichnet, und bei ihnen handelt es sich um die von Yukawa postulierten Vermittler der starken Kraft in den Kernen. 1947–1960 Entdeckung der seltsamen Teilchen (Kaonen, die zur Familie der Mesonen gehören, weitere Mesonen, zu den Baryonen gehörige -Teilchen, -Teilchen usw.) Der Name „seltsame Teilchen“ rührt daher, daß diese in modernerer Nomenklatur unter der „starken Wechselwirkung“ erzeugt werden, aber unter der „schwachen Wechselwirkung“ zerfallen. 1953 führten M. Gell-Mann und K. Nishijima in Weiterführung einer Idee von A. Pais eine neue Erhaltungszahl Strangeness ein, die bei starken Wechselwirkungsprozessen erhalten bleibt, nicht jedoch bei schwachen. Im selben Jahr konnten Cowan und Reines mit Hilfe der Reaktion p n e die Existenz von Neutrinos nachweisen, die in hoher Intensität aus einem Kernreaktor kamen. 1955 Entdeckung des Antiprotrons, p, am Berkeley-Bevatron. 1956 Entdeckung des Antineutrons, n, am Berkeley-Bevatron. 1961 führte M. Gell-Mann ein Schema zur Klassifizierung von Baryonen und Mesonen ein, das als Achtfacher Weg bezeichnet wird und unabhängig davon auch von Y. Ne’eman gefunden wurde (Abb. 11.1). Dieses Schema erwies sich als außerordentlich fruchtbar, weil der Versuch zu seiner Erklärung nur wenig später zum Konzept der Quarks führte. Von dem in Abb. 11.2 dargestellten Baryonen-Dekuplett waren 1961 alle Teilchen bis auf das bekannt. Gell-Mann forderte die Existenz des letzteren aus systematischen Gründen, ja, er hatte sogar eine einfache Formel zur Berechnung seiner Ruhemasse aus den Ruhemassen der übrigen Mitglieder des Dekupletts, und tatsächlich
382
11 Einleitung zur Elementarteilchentheorie n0 Σ0
Σ
0
Σ
Λ (a)
Ξ
Ξ0
K
K0
p
(b)
K
0 K
Abb. 11.1: (a) Baryonen-Oktett. Auf Geraden, die schräg von links oben nach rechts unten verlaufen, befinden sich Teilchen gleicher Ladung, auf horizontal verlaufenden Geraden Teilchen gleicher Strangeness. (b) Mesonen-Nonett. Teilchen gleicher Ladung bzw. Seltsamkeit sind wie im Baryonen-Oktett angeordnet.
wurde seine Vorhersage wenig später bestätigt. Im gleichen Jahr wurde von L. Lederman, M. Schwartz und J. Steinberger ein neuartiges Neutrino entdeckt, das sich trotz fehlender Ladung in einer anderen Quantenzahl vom Elektron-Neutrino e unterscheidet. Es wurde dem Myon zugeordnet und wird als Myon-Neutrino bezeichnet. (Zu beiden gibt es ein dazugehöriges Antineutrino.) 1964 wurde von M. Gell-Mann und G. Zweig die Hypothese der Existenz von Quarks aufgestellt. Nach dieser sollen Mesonen und die gemeinsam als Nukleonen bezeichneten Kernbausteine Proton und Neutron eine Substruktur aus viel kleineren, Quarks genannten Teilchen besitzen. Dabei handelt es sich um Fermionen mit dem Spin 1/2, die in drei verschiedenen „Geschmacksrichtungen“ bzw. Flavors auftreten (eine Eigenschaft, die auch Leptonen besitzen), d. h. es gibt drei verschiedene Sorten, u, d und s für up, down bzw. strange, und zu jedem Quark gibt es natürlich ein entsprechendes Antiquark. Außerdem besitzen Quarks keine ganzen Elementarladungen, sondern die Ladungen (1/3)e oder (2/3)e (Tabelle 11.2; ob das obere oder untere Vorzeichen gilt, hängt davon ab, ob man es mit dem Quark oder seinem Antiteilchen zu tun hat.) Schließlich wurde ihnen außer dem Flavor noch die Quantenzahl Strangeness zugewiesen. Nach dem Quarkmodell besteht jedes Baryon aus drei Quarks, jedes Antibaryon aus drei Antiquarks, jedes Meson dagegen aus einem Quark und einem Antiquark. Wir werden im nächsten Abschnitt sehen, wie man mit dem Quarkmodell zu einer einfachen Erklärung des Achtfachen Weges kommt. Bei der Namengebung der Quarks war Gell-Mann zuerst der Klang des Wortes in den Sinn gekommen. Als er später bei einem „seiner gelegentlichen Streifzüge durch Finnegans Wake von James Joice“ in dem Satz „Three quarks for Muster Mark“ auf das Wort „quark“ stieß, fand er, daß „die Zahl drei perfekt mit der Art und Weise übereinstimmte, in der Quarks in der Natur vorkommen“, und entschied sich für die Schreibweise Quark. Noch in gleichen Jahr wurde von J.D. Bjorken und S. Glashow die Idee der Existenz eines vierten Quarks aufgebracht, das später den Namen Charm-Quark erhielt. Außerdem wurde auch das von Gell-Mann vorausgesagte -Teilchen entdeckt. Im selben Jahr wurde von O.W. Greenberg eine als Farbe bezeichnete Art von Ladung der Quarks eingeführt. Es gibt also nicht nur drei verschiedene Quarks, sondern jedes von diesen tritt in drei verschiedenen Farben auf, den Farben rot, grün oder blau,
11.1 Historischer Rückblick auf die Entdeckung der Elementarteilchen
383
0
0
0
Abb. 11.2: Baryonen-Dekuplett. Eigenschaften wie in Abb. 11.1.
zu denen es beim Antiteilchen die entsprechenden Antifarben gibt. Die Einführung der Farbe wurde notwendig, damit durch das Quarkmodell nicht das Pauli-Prinzip verletzt wird: So besteht nach dem Quarkmodell z. B. das Teilchen aus drei u-Quarks im gleichen Zustand, und wenn diese sich nicht durch ihre Farbe unterschieden, würde das Pauli-Prinzip verletzt. Die etwas verspielte Verwendung des Begriffes Farbe hat natürlich nichts mit dessen üblicher Wortbedeutung zu tun, vielmehr muß man sich Farbe als eine Eigenschaft wie Ladung oder Ruhemasse vorstellen, weshalb man manchmal auch von Farbladung spricht. Dabei gibt es Felder, die auf alle Teilchen mit Farbladung einwirken. Der Begriff der Quarkfarbe macht sich allerdings eine wichtige Eigenschaft unserer physiologischen Farbwahrnehmung zunutze: Eine Mischung der Spektralfarben rot, grün und blau sehen wir als weiß (farblos), und es ist natürlich, Antifarben so zu definieren, daß sich Farbe und Antifarbe zu weiß (farblos) ergänzen. Damit läßt sich jedoch ein wichtiger Befund über die in der Natur auftretenden Teilchen, die aus Quarks zusammengesetzt sind, sehr einfach ausdrücken: Alle natürlich auftretenden Teilchen sind farblos, und zwar in dem Sinne, daß entweder jede Farbe durch ihre Antifarbe neutralisiert wird, oder aber, daß von allen drei Farben gleich viele Quarks beteiligt sind. (Diese Aussage umfaßt auch alle Teilchen, die keine Quarks enthalten, da diese ebenfalls farblos sind.) Hierdurch wird auch der Tatsache Rechnung getragen, daß es keine freien Quarks gibt, denn jedes von diesen wäre farbig. Freie Teilchen, die aus zwei Quarks bestehen, müssen demnach aus einem Quark und einem Antiquark bestehen; diese Eigenschaft besitzen sämtliche Mesonen. Baryonen bestehen aus drei Quarks und werden durch die Formel qqq beschrieben, wobei q für einen der Flavors u, d oder s steht. Natürlich kann es auch Teilchen geben, die aus mehr als drei Quarks bestehen. Diese können jedoch in Teilchen aus zwei bzw. drei Quarks zerlegt werden. 1967/68 wurde, auf früheren Ideen von A. Salam basierend, die heutige Form einer Theorie der schwachen Wechselwirkung aufgestellt, zunächst von S. Weinberg und davon unabhängig etwas später von S. Glashow. Diese Theorie wird heute als Quantenflavordynamik (QFD) oder Glashow-Weinberg-Salam-Theorie (kürzer GWS-Theorie) bezeichnet. In ihr werden die schwache Wechselwirkung und die durch die Quantenelektrodynamik (QED) beschriebene elektromagnetische Wechselwirkung als verschiedene Erscheinungsformen einer einzigen Kraft, der elektroschwachen Kraft, behandelt. Als andere Erscheinungsform dieser Kraft wurde eine Flavorkraft vorhergesagt, welche die Streuung von Elektronneutrinos an Protonen und Neutronen beschreibt, ohne daß dabei eine Änderung der Quantenzahl Flavor eintritt. Die Quanten des zu dieser Kraft gehörigen Feldes sind die geladenen Teilchen W , W
384
11 Einleitung zur Elementarteilchentheorie
und das ungeladene Z0 -Teilchen. Vorläufer dieser Theorie waren die schon genannten Untersuchungen Fermis im Jahre 1933 sowie Arbeiten von R. Feynman, M. Gell-Mann und vielen anderen. 1970 wurde das Quarkmodell von S. Glashow, J. Iliopoulos und L. Maiani um ein weiteres Quark, das c-Quark, erweitert, das wegen einiger als zauberisch angesehener Auswirkungen auf die Theorie den Namen Charm (engl. für Zauber) erhielt. 1972 wurde erstmals eine umfassende Quantentheorie der Quarks und deren Wechselwirkungen aufgestellt, für die der an ihr beteiligte Gell-Mann den Namen Quantenchromodynamik, kurz QCD, einführte. Die starke Wechselwirkung ist nach ihr nicht, wie einst von Yukawa vermutet, eine von Pionen vermittelte Kraft zwischen den Nukleonen des Kerns, sondern eine durch Gluonen (von engl. glue = Leim, weil sie die Kerne „zusammenleimen“) vermittelte Kraft zwischen Quarks, die auf deren „Farbladung“ einwirkt und alle Teilchen mit Farbladung beeinflußt. Dabei verlangt die Theorie die Existenz von acht Gluonen, die selbst eine Farbladung tragen. 1974. In dieses Jahr fällt die als „Novemberrevolution“ bezeichnete Entdeckung des J-Teilchens durch C. C. Ting und etwas später unabhängig davon durch B. Richter, der es -Teilchen nannte. (Da man sich nicht auf einen Namen einigen konnte, blieben beide Namen bestehen, und man benutzt manchmal auch die Bezeichnung J/-Teilchen.) Dabei handelt es sich um ein elektrisch neutrales, schweres Meson, dessen Entdeckung deshalb als sensationell empfunden wurde, weil seine Lebensdauer, obwohl nur 10 20 s, um den Faktor 103 höher ist als die anderer instabiler Elementarteilchen. Dies wurde als Indiz für eine völlig neue Physik angesehen. cc stellte sich als ein gebundener Zustand des Charm-Quarks heraus. In der Folge wurden viele weitere Teilchen mit Charm (d. h. mit einem Charm-Quark) gefunden. 1975 wurde von M. Perl ein neues Lepton, das Tau-Teilchen, entdeckt. Dieses ist 3491mal so schwer wie das Elektron, und zu ihm sollte ein eigenes Neutrino existieren, das erst im Jahr 2000 entdeckt wurde. Damit kannte man zu dieser Zeit sechs Leptonen, jedoch nur vier Quarks. 1977 Entdeckung des Y-Mesons Ybb. Dieses enthält ein neues Quark, das zuerst „Beauty“ genannt wurde. Heute wird es jedoch aus systematischen Gründen als Bottom-Quark bezeichnet und mit b abgekürzt, weil es in der unteren Reihe der in Tabelle 11.2 aufgeführten Quarksystematik stehen muß. Eine zwischen Quarks und Leptonen festgestellte Symmetrie, die durch den Vergleich der Tabelleneinträge der beiden Teilchensorten erkennbar wird, ließ die Existenz eines weiteren, als Top-Quark bezeichneten Quarks erwarten. Zum Nachweis von dessen Existenz mußte allerdings bis 1996 gewartet werden. 1978 kann als das Jahr bezeichnet werden, ab dem das aus der Theorie der schwachen Wechselwirkung und der Quantenchromodynamik bestehende Standardmodell allgemein als Grundlage der Elementarteilchentheorie anerkannt ist. Nach ihm gibt es zwei Sorten von Elementarteilchen, Leptonen und Quarks, zwischen denen eine enge Parallelität besteht. Wechselwirkungen innerhalb dieser und zwischen diesen Sorten kommen durch Austauschteilchen, die Quanten der Wechselwirkungsfelder, zustande (Tabelle 11.2). Die starke Wechselwirkung wirkt nur zwischen Quarks, die schwache zwischen Quarks, zwischen Leptonen sowie zwischen Quarks und Leptonen, die elektromagnetische schließlich zwischen allen elektrisch geladenen Teilchen. Im Rahmen des Stan-
11.2 Erster Überblick
Fermionen Austauschteilchen (Bosonen)
385
Leptonen e , , e,
,
Q 0
Quarks u , c , t rot, grün, blau
Q 2/3
1
d , s , brot, grün, blau
1/3
schwache WW: W , Z0 z.T. el. magn. WW: Photon
starke WW: schwache WW: el. magn. WW:
8 Gluonen W , Z0 Photon
Tabelle 11.2: „Periodensystem“ der Elementarteilchen. Es gibt 6 Leptonen (links oben), 6 Quarks (rechts oben) und die deren Wechselwirkungen vermittelnden Austauschteilchen (unten): 8 Gluonen für die starke Wechselwirkung, 3 Vektorbosonen W , W und Z0 für die schwache Wechselwirkung und das Photon für die elektromagnetische Wechselwirkung. Leptonen und Quarks lassen sich in drei Familien einordnen derart, daß jeweils die Leptonen und Quarks der ersten, zweiten bzw. dritten Spalte zusammengehören, also e , e, u, d usw. Die Ladung Q ist in Vielfachen der Elementarladung e angegeben.
dardmodells wird zusätzlich auch noch die Existenz eines Higgs-Bosons gefordert, das von P.W. Higgs eingeführt wurde, um die Ruhemassen der Elementarteilchen erklären zu können. Einen experimentellen Nachweis von dessen Existenz gibt es bis heute nicht. 1979 gelang der Nachweis der Existenz der vom Standardmodell geforderten Gluonen im Speicherring PETRA am DESY (Hamburg). 1980. Um diese Zeit gelang mit Streuexperimenten der experimentelle Nachweis der Quarkstruktur von Nukleonen. 1981 Entdeckung des ersten Beauty-Baryons b udb. 1983 Entdeckung der Beauty-Mesonen B0 bd und B bu. Nachweis der Vektorbosonen W , W und Z0 durch C. Rubia und Mitarbeiter am CERN (Genf). 1996 Entdeckung des Top-Quarks (t), das auch „Truth“ genannt wird. Damit war die Symmetrie zwischen der Zahl der Leptonen und Quarks wiederhergestellt. 2000 Entdeckung des Tauneutrinos ντ am Fermi-Laboratorium. 2002 T. Nakano entdeckt ein aus fünf Quarks bestehendes Pentaquark (uudds).
11.2
Erster Überblick
In diesem Abschnitt wird zusammengefaßt, welche vorläufigen Erkenntnisse wir in dem historischen Abschnitt gewonnen haben und welche Schlüsse sich daraus im Moment ziehen lassen. Dabei sollen einige Befunde noch etwas ausführlicher erläutert werden. Schließlich können wir uns auch schon überlegen, welche Aufgaben bei einer theoretischen Beschreibung auf uns zukommen werden. Viele der Teilchen, die zuerst als elementar angesehen wurden, haben sich als zusammengesetzte Teilchen entpuppt. Wir wollen jedoch, wie schon im letzten Abschnitt gesagt, nur diejenigen Teilchen oder Strukturen als elementar ansehen, die nach gegenwärtiger Kenntnis keine innere Struktur aufweisen. Die Gesamtheit der in diesem Sinne elementaren Teilchen ist in Tabelle 11.2 zusammengefaßt. Es
386
11 Einleitung zur Elementarteilchentheorie ' ' '
Leptonen Teilchen Elektron Myon Tau Elektronneutr. Myonneutr. Tauneutrino
e
e μ τ
Quarks
Massec2
Mittl. Lebensd. [s]
Teilchen
0,51 MeV 106 MeV 1777 MeV < 5 10 6 MeV < 0,17 MeV < 24 MeV
2, 2 10 6 (291 1, 5) 10 15 ? ? ?
Up Down Charme Strange Top Bottom
¡
½ ¡ ¦ ¡ ½ ½ ½
Massec2 u d c s t b
1,5-5 MeV 5-17 MeV 1,1-1,4 GeV 60-170 MeV 165-180 GeV 4,1-4,4 GeV
½?“ bedeutet, daß auch ein Zerfall nach sehr langer
Tabelle 11.3: Leptonen und Quarks. „ Lebensdauer für möglich gehalten wird.
handelt sich dabei einerseits um die zur Klasse der Fermionen gehörigen Leptonen und Quarks, die alle den Spin 1/2 haben, und andererseits um Teilchen, welche die Wechselwirkungen zwischen diesen vermitteln: W¦ und Z0 , acht Gluonen und das Photon, die alle zur Klasse der Bosonen gehörigen und Spin 1 haben. „Keine innere Struktur“ bedeutet bei der heutigen Meßgenauigkeit, daß eventuelle Substrukturen auf Abstände beschränkt sein müssen, die kleiner als 10 18 m sind. Theoretisch werden wir alle Elementarteilchen als Punktteilchen auffassen. Es ist unbekannt, warum es gerade sechs Leptonen und sechs Quarks bzw. drei Lepton/Quark-Familien gibt, und desgleichen, warum die Ladungen der Leptonen ganzzahlige Vielfache der Elementarladung sind und die der Quarks ein oder zwei Drittel von dieser betragen. Auch die Ruhemassen der Elementarteilchen (Tab. 11.3 und 11.5) sind weitgehend unverstanden. Wir werden später sehen, wie man mit Hilfe des HiggsFeldes zu einem gewissen Verständnis der Ruhemassen gelangen kann. Die einfachsten, aus Quarks zusammengesetzten Teilchen sind die Mesonen (Quark und Antiquark) und Baryonen (aus drei Quarks bestehend), die zusammen als Hadronen bezeichnet werden. Tab. 11.4 ist zu entnehmen, wie sich die Teilchen des in Abb. 11.1 dargestellten Baryonen-Oktetts und Mesonen-Nonetts sowie des in Abb. 11.2 dargestellten Baryonen-Dekupletts mit den angegebenen Werten von Ladung und Strangeness in einfacher Weise als aus Quarks zusammengesetzte Teilchen deuten lassen. Dabei ist außer den in Tab. 11.2 angegebenen Eigenschaften nur benutzt, daß die Quarks u und d die Strangeness s 0 besitzen, während das s-Quark s 1 besitzt. Auch die Anzahl der Teilchen einer Gruppe ergibt sich in natürlicher Weise: Beim Baryonen-Dekuplett handelt es sich um die Gesamtheit aller möglichen, voneinander verschiedenen Drei-Teilchen-Kombinationen der drei Quarks u, d und s, beim MesonenNonett um die Gesamtheit der entsprechenden Zwei-Teilchen-Kombinationen q q . Das letztere enthält sämtliche Teilchen eines ursprünglich postulierten Mesonen-Oktetts und dazu noch ein neuntes Teilchen, η¼ ss, das beim Achtfachen Weg als separates Singulett gezählt wird. Die Teilchen 0 , und ¼ des Mesonen-Nonetts haben die gleichen Quantenzahlen Q und s und sind diesbezüglich ununterscheidbar. Daher läßt sich für sie an dieser Stelle auch keine genaue Zuordnung zwischen Quarkzusammensetzung und Teilchen angeben, vielmehr stellt sich heraus, daß alle drei gemischte Zustände der Quarkkombinationen u u , d d und s s sind (siehe Abschn. 13.5). Die meisten Elementarteilchen sind extrem kurzlebig. Eine Aufgabe der Theorie,
11.2 Erster Überblick
387
Baryonen-Dekuplett qqq
Q
s
uuu uud udd
2 1 0
0 0 0
ddd uus uds dds uss dss sss
1 1 0 1 0 1 1
0 1 1 1 2 2 3
Symbol 0
0 0
Baryonen-Oktett
pseudoskalar. Mesonen-Nonett
qqq
Q
s
Symbol
q q
Q
s
uud udd uus
1 0 1
0 0 1
p n0
uu ) ud du
0 1 1
0 0 0
uds uds dds uss dss
0 0 1 0 1
1 1 1 2 2
0 1 0 1 0 0
0 1 1 1 1 0
0 0
)
dd us ds su sd ss )
Symbol
0
K K0 K 0 K
Tabelle 11.4: Quarkzusammensetzung der Teilchen des Baryonen-Oktetts und Baryonen-Dekupletts sowie des pseudoskalaren Mesonen-Nonetts. Die Zahl der Teilchen des Baryonen-Dekupletts und Mesonen-Nonetts ist gleich der Anzahl voneinander verschiedener Kombinationen von drei Quarks bzw. eines Quarks und Antiquarks. Beim Baryonen-Dekuplett sind die Flavorzustände vollständig symmetrisch, die Teilchen des Baryonen-Oktetts haben Quarkzusammensetzungen, die auch im Dekuplett vorkommen, jedoch andere Flavorsymmetrie. In dieser Hinsicht unterscheiden sich auch die Teilchen 0 und des Baryonen-Oktetts. (Zur Symmetrie der Quarkzustände siehe Abschn. 13.4.) Die Gesamtladungszahl Q bzw. die Strangeness s eines Teilchens ergeben sich durch Summieren der Beiträge der konstituierenden Quarks. Die Teilchen 0 , und des Mesonen-Nonetts sind in Q und s ununterscheidbar und werden durch Zustandsmischungen der mit ) markierten Quarkkombinationen beschrieben.
der wir in dieser Einführung allerdings nicht nachgehen werden können, besteht darin, die Lebensdauern der verschiedenen Teilchen zu berechnen. Zu den wichtigen Eigenschaften der Elementarteilchen zählen Symmetrien, denen Quantenzahlen zugeordnet sind. Zu den bei unserem historischen Streifzug aufgeführten Quantenzahlen wie Flavor, Strangeness und Spin werden noch eine Reihe weiterer hinzutreten wie Parität, Isospin und andere. Für jedes Teilchen haben diese Quantenzahlen bestimmte Werte, die bei allen identischen Teilchen natürlich gleich sind. Die Bedeutung der Quantenzahlen liegt darin, daß für sie (oder ihre Summe bei mehreren Teilchen) bei Prozessen wie Streuung, Umwandlung, Spaltung, Fusion, Erzeugung oder Vernichtung Erhaltungssätze gelten. Diese können mehr oder weniger strikt gelten. Bei Prozessen, für die sie nicht mehr gelten, spricht man von Symmetriebrechung. Bei der Erzeugung von Elementarteilchen hat man festgestellt, daß sich alle Fermionen nur in Teilchen/Antiteilchenpaaren erzeugen lassen. Für Bosonen gilt diese Einschränkung nicht. Aus Tab. 11.2 ergibt sich als Gesamtzahl elementarer Teilchen 12 36 12 60
Leptonen (6 Teilchen + 6 Antiteilchen) Quarks (6 3 Quarks + 6 3 Antiquarks) Austauschteilchen Elementarteilchen.
388
11 Einleitung zur Elementarteilchentheorie
Dazu kommt noch mindestens ein Higgs-Teilchen und das Graviton als Quant des Gravitationsfeldes, wobei anzumerken ist, daß von beiden die Existenz noch nicht nachgewiesen ist. Da es noch nicht gelungen ist, bei den Wechselwirkungen die Gravitation in eine allgemein akzeptierte Theorie mit einzubeziehen, werden wir das Graviton nicht mit berücksichtigen. Es war ein großer Erfolg des Quarkkonzepts, daß es hunderte von Teilchen als Verbindungen von Quarks, Antiquarks und Gluonen oder als Anregungszustände solcher Verbindungen erklären konnte. Dadurch wurde in einen nahezu unüberschaubaren Elementarteilchenzoo eine überschaubare Ordnung gebracht, und man spricht heute von einem „Periodensystem“ der Elementarteilchen. Dennoch wird die große Zahl von 61 elementaren Teilchen (ohne das Graviton) von manchen Physikern als Indiz dafür angesehen, daß man mit diesen noch nicht auf der untersten Stufe der Einfachheit angelangt ist. Möglicherweise besitzen auch diese Teilchen noch eine Substruktur, die eine einfachere Beschreibung gestattet. Als in dieselbe Richtung weisend werden auch die beiden folgenden Tatsachen interpretiert: 1. Im Standardmodell treten 26 freie Parameter auf, deren Werte nicht aus der Theorie abgeleitet werden können und den experimentellen Befunden angepaßt werden müssen (Aufgabe 17.5), 2. Man kann eine Unterteilung der Leptonen und Quarks in verschiedene Familien oder Generationen finden, in denen sich gewisse Eigenschaften wiederholen (Tab. 11.2). Es hat auch Versuche gegeben, eine Theorie möglicher Substrukturen zu entwickeln. So wurden als Haplonen, Rishonen oder hebräisch als Tohu (wüst) und Bohu (leer) bezeichnete Substrukturen in Erwägung gezogen. Am aussichtsreichsten erscheint zur Zeit die Superstringtheorie, nach der die elementaren Bausteine der Materie extrem kurze, offene oder geschlossene Fäden oder Membranen in höherdimesionalen Räumen sind, deren über die vierdimensionale Raum-Zeit hinausgehende Dimensionen wir wegen der extrem kleinen räumlichen Ausdehnung der Fäden bzw. Membranen nicht bemerken. Diese Theorie steht ihrem Anfang allerdings noch näher als ihrem Abschluß und kann noch nicht als gesicherte Theorie aufgefaßt werden. Wenden wir uns jetzt den Wechselwirkungen zu. Diese werden durch Felder vermittelt, die wie die den Leptonen und Quarks zugeordneten Felder quantisiert sind. (Da die als punktförmig aufgefaßten Elementarteilchen die Feldquanten sind, wird manchmal gesagt, daß quantisierte Felder eine „körnige“ Struktur besitzen. Solche Veranschaulichungen dürfen allerdings nicht allzu wörtlich genommen werden.) Die Wechselwirkungsfelder greifen an Ladungen an, d. h. zu jeder Wechselwirkung gehört eine Ladung (Tabelle 11.5), die einerseits das Wechselwirkungsfeld erzeugt und an der dieses andererseits angreift. Ein Teilchen unterliegt einer Wechselwirkung nur, wenn es die entsprechende Ladung trägt. Auf der Ebene der Quantenfeldtheorie stellt man sich vor, die Wechselwirkung zwischen zwei Teilchen komme dadurch zustande, daß diese untereinander Quanten des zugehörigen Wechselwirkungsfeldes austauschen. Für die Wechselwirkung zweier Elektronen bedeutet das beispielsweise, daß eines ein Photon emittiert, welches vom zweiten absorbiert wird. Es ist üblich, diesen Vorgang in einem Feynman-Diagramm darzustellen (Abb. 10.8, Diagramm (11) der Quantenfeldtheorie). Es ist jedoch ein Leichtes, nachzurechnen, daß ein derartiger Prozeß klassisch nicht möglich ist, weil dabei nicht gleichzeitig der Energie- und Impulssatz erfüllt werden können (Aufgabe 11.3). In der Quantentheorie müssen diese Sätze aber nicht permanent erfüllt sein, es genügt, wenn sie es im zeitlichen Mittel sind. Während
11.2 Erster Überblick
389
Art der WW.
stark
elektromagn.
schwach
Gravitation
Feldquanten
8 Gluonen (farbig, m 0 0) Farbe (rot, grün, blau) (antirot, . . . ) Meson, Baryon, Atomkerne 1 QCD
Photon (ungel., m 0 0) elektrisch (positiv/negativ) (negativ/positiv) Atom, Molekül, makroskopisch 10 3 QED
W , W , Z0 (el. un-/gel., massiv) schwache Ladung
Graviton (ungel., m 0 0) Masse
antischw. Ladung radioakt. Zerfall, Fusion 10 14 QFD
Masse
Ladungsart Antiladung Vorkommen relat. Stärke Theorie
makroskop. 10 43 Geometrodynamik
Tabelle 11.5: Wechselwirkungen der Elementarteilchen, zugehörige Feldquanten und einige Eigenschaften von diesen. m 0 = Ruhemasse.
einer Zeit t < h/(2E), die kürzer als die durch die Energie-Zeit-Unschärferelation tE h/2 der Quantenmechanik erlaubten Zeiten ist, darf z. B. der Energieerhaltungssatz verletzt sein. Dies hat zur Folge, daß das aus den beiden Elektronen und dem Photon bestehende System vorübergehend Energie als Darlehen aufnehmen darf, um dem ersten Elektron die Emission des Photons zu erlauben, wenn nur dafür gesorgt ist, daß das Photon diese bei der Absorption durch das zweite Elektron zurückzahlt. Dieser Prozeß wird als virtueller Austausch eines Photons zwischen zwei Elektronen bezeichnet. Obwohl sie einigermaßen überzeugend klingt, darf man diese Darstellung nicht allzu wörtlich nehmen, denn durch den übertragenen Impuls kann man sich wohl nur das Zustandekommen einer Abstoßung vorstellen, nicht jedoch einer Anziehung, die ja ebenfalls möglich ist. Die eben gegebene anschauliche Darstellung besitzt daher eher symbolischen Charakter mit einem unbestreitbaren mnemotechnischen Wert. Man stellt sich jedoch besser nur vor, daß durch das Photon eine Art Informationsübertragung stattfindet. Die genauere, aber auch kompliziertere Interpretation von Feynman-Diagrammen wurde im Teil Quantenfeldtheorie dieses Bandes dargestellt. Die Kernkraft hat sich nicht als fundamental herausgestellt, vielmehr basiert sie auf der starken Wechselwirkung zwischen den die Nukleonen konstituierenden Quarks: Sie bildet einen nur wenig über die Nukleonen hinausragenden Rest der starken Wechselwirkungskräfte, die sich in der farblosen Kombination, in der Quarks bei isolierten zusammengesetzten Teilchen auftreten müssen, im wesentlichen neutralisieren. Man kann sich das ähnlich vorstellen wie bei den molekularen Bindungskräften in homöopolaren Molekülen: Auch diese kommen nur dadurch zustande, daß sich die Felder der Elektronen und des Kerns in einem neutralen Atom im wesentlichen neutralisieren, so daß sie nach außen nur noch mit einem Dipolmoment oder Moment höherer Ordnung wirken. Auf dieser Basis muß sich die Kernkraft aus der Wechselwirkung zwischen Quarks berechnen lassen. Dies wäre eine wichtige Aufgabe der Elementarteilchentheorie, die allerdings aufgrund der großen mathematischen Schwierigkeiten bisher noch nicht befriedigend gelöst wurde. Die Kernkraft ist weniger weitreichend als die elektromagnetische Kraft oder die Gravitation. Was damit gemeint ist, läßt sich anhand einer Formel zeigen, die Yukawa
390
11 Einleitung zur Elementarteilchentheorie
für derartige Kräfte aufgestellt hat. Deren Potential dachte er sich durch V (r )
e
r/a
r
(11.1)
gegeben. Als Reichweite der Kraft bezeichnet man die Strecke a, über die der Exponentialfaktor auf 1/e abgesunken ist. Für die elektromagnetische und die Gravitationskraft ist a , d. h. beide Kräfte haben unendliche Reichweite. (Diese wird allerdings bei der elektromagnetischen Kraft wegen der Existenz positiver und negativer Ladungen nicht realisiert, weil Materie makroskopisch die Tendenz zu elektrischer Neutralität aufweist und deshalb alle Ladungen im Großen abgeschirmt werden. Bei der Gravitation ist das anders, weil es keine negativen Massen gibt.) Bei Potentialfeldern der Form (11.1) besteht der Zusammenhang h a (11.2) mc zwischen der Reichweite a und der Ruhemasse der Feldquanten. (Er folgt aus einer statischen Lösung der dynamischen Gleichung für das Feld V (r ).) Dies bedeutet: Je kleiner die Reichweite, um so schwerer die Feldquanten. (Damit kann man als Erinnerungsstütze die Vorstellung verbinden, daß schwere Quanten in der kurzen, für die Wechselwirkung zur Verfügung stehenden Zeit nicht so weit kommen wie leichte Quanten.) Auf das Gluonenfeld ist diese Aussage allerdings nicht anwendbar, weil es keine freien Gluonen gibt und das Feld nur in farbneutralen Teilchenkombinationen auftritt, in denen es nach außen hin im wesentlichen neutralisiert ist. (Das Gluonenfeld läßt sich auch nicht näherungsweise wie z. B. das Gravitationsfeld in das durch Gleichung (11.1) vorgegebene Schema einordnen.)
Aufgaben 11.1 11.2 11.3
Zeigen Sie, daß beim Zerfall eines Teilchens in zwei Bruchstücke der Energieund Impulssatz nicht gleichzeitig erfüllt werden können. Berechnen Sie aus der bekannten Reichweite der Kernkräfte (ca. 1.4 10 die Ruhemasse des Pi-Mesons.
15
m)
Zeigen Sie, daß ein Elektron nicht ein Photon abgeben kann, indem es seine Energie und seinen Impuls ändert.
Lösungen 11.1
Lösung ähnlich wie bei Aufgabe 2.8 der Relativistischen Quantenmechanik, nur daß hier das zerfallende Teilchen nicht-verschwindende Ruhemasse besitzt und die Bruchstücke verschiedene Massen haben können.
11.3
Inverses Problem zur Aufgabe Q2.2 der Quantenmechanik. Lösung wie dort.
12
Elemente der Gruppentheorie
Schon in dem einleitenden Kapitel 11 wurde klar, daß Symmetrien eine wichtige Rolle in der Elementarteilchenphysik spielen. Sie äußern sich im Transformationsverhalten von Teilchenzuständen und können wichtige Erhaltungssätze zur Folge haben, wie ausführlich z. B. in der Mechanik oder im Abschnitt 7.5 dieses Bandes dargelegt wurde. Eine systematische Untersuchung der mit Symmetrien verbundenen Eigenschaften eines Systems wird durch die Gruppentheorie ermöglicht. In dieser geht es allerdings nicht nur um Symmetrien und die mögliche Existenz von Erhaltungssätzen, sondern viel allgemeiner um ein tieferes Verständnis der Struktur spezieller strukturierter Mengen. Bei der Behandlung von Symmetrien käme man in vielen Fällen auch ohne den Rückgriff auf die Gruppentheorie und deren Methoden zum Ziel. Durch diese erhält man jedoch einerseits einen systematischeren Zugang und andererseits eine klarere Ein- und Übersicht. Dieses Kapitel behandelt im wesentlichen nur mathematische Aspekte der Gruppentheorie. Da es jedoch auf Anwendungen in der Elementarteilchentheorie abgestellt ist, beschränkt es sich auf die allerwichtigsten für diese relevanten Begriffe und Ergebnisse.
12.1
Definitionen
Wir betrachten eine Menge M von endlich vielen bzw. abzählbar oder nicht abzählbar unendlich vielen Elementen a, b, c, . . . , zwischen denen eine Verknüpfung Æ definiert ist, die jedem geordneten Elementpaar a, b ein eindeutig bestimmtes drittes Element d a Æ b von M zuordnet. Durch die Verknüpfung ihrer Elemente erhält die Menge eine Struktur. Die Verknüpfung Æ wird häufig auch als Multiplikation bezeichnet, selbst wenn sie nichts mit einer der üblichen Multiplikationen zu tun hat. Für das „Produkt“ a Æ b sind auch die kürzeren Schreibweisen a b und ab üblich, und wir werden im folgenden die Notation ab benutzen. Da die Definition geordnete Paare betrifft, kann ab ba gelten. Bei den Elementen kann es sich um physikalische Objekte (z. B. Größen, die durch Vektoren eines Vektorraums dargestellt werden, siehe unten Beispiel 12.5) oder mathematische Objekte bzw. Zuordnungen wie Matrizen, Operatoren oder Transformationen handeln. Eine Transformation ist die bijektive (eineindeutige) Abbildung f (x) einer Menge W auf sich, W wird als Wirkungsmenge der Transformation bezeichnet. Definition. Eine durch eine Verknüpfung strukturierte Menge ist eine Gruppe G, wenn die folgenden Gruppenaxiome erfüllt sind.1 1 Man könnte auch sagen: Das aus einer Menge M und einer Verknüpfung Æ bestehende Paar G ist eine Gruppe, wenn . . . .
(M, Æ)
392
12 Elemente der Gruppentheorie
1. Abgeschlossenheit. Das Produkt zweier beliebiger Elemente von G liegt wieder in G, d. h. a G , b G ab G . 2. Assoziativität. Die Verknüpfung ist assoziativ, d. h. es gilt (ab)c a(bc) abc
für alle a, b, c
G.
3. Einselement. Es gibt ein neutrales Element e, das auch als Identität oder Einselement bezeichnet wird und für alle a G die Beziehungen ea
ae a
für alle a
G
erfüllt. 4. Umkehrbarkeit. Zu jedem a G existiert ein inverses Element a aa
1
a
1
a
e
für alle a
1
G, für das
G
gilt. Aus der Existenz eines rechtsinversen folgt die eines linksinversen Elements und umgekehrt (Aufgabe 12.1). Ist die Verknüpfung zwischen den Elementen einer Gruppe kommutativ, gilt also ab ba für alle a, b G , so heißt die Gruppe kommutativ oder Abelsch. Diskrete Gruppen. Enthält eine Gruppe nur eine endliche Anzahl n von Elementen, so wird sie als endliche Gruppe der Ordnung n bezeichnet. Endliche und abzählbar unendliche Gruppen werden auch als diskrete Gruppen bezeichnet. Kontinuierliche Gruppen. Besitzt eine Gruppe nicht-abzählbar unendlich viele Elemente g(a), die von einem (oder mehreren) kontinuierlichen Parametern a abhängen, d. h. a a1 , a2 , . . . , a p , und ist in der g1 g2 g3 entsprechenden Beziehung g(a) g(b) g(c)
(12.1)
c eine stetige Funktion von a und b, c
f (a, b)
stetig
(12.2)
(d. h. c ändert sich nur wenig, wenn a und b wenig verändert werden), so wird sie als kontinuierliche Gruppe bezeichnet, manchmal auch als endliche kontinuierliche Gruppe, sofern die Anzahl der Parameter endlich ist. Ist p die Anzahl der Parameter, so spricht man von einer p-Parameter Gruppe. Dabei beschränken wir uns auf wesentliche Gruppenparameter. Beispiel 12.8 der gleich folgenden Beispiele zeigt, was ein unwesentlicher Parameter ist.
12.1 Definitionen
a1 a2
393 a1 a1 a1 a2 a1
a2 a 1 a2 a 2 a2
ai
aj
ai
an
ai a j
aj
a j ai
an Tabelle 12.1: Multiplikationstafel einer endlichen Gruppe. Wo hier Produkte ai a j eingetragen sind, muß man sich die diesen Produkten zugeordneten Elemente a.. ai a j der Gruppe vorstellen.
Untergruppe. Eine Gruppe U bildet eine Untergruppe der Gruppe G, wenn sie bezüglich derselben Verknüpfung wie G definiert ist und alle ihre Elemente auch zu G gehören. Triviale Untergruppen jeder Gruppe G sind die Gruppe G selbst und die nur aus dem Einselement bestehende Menge e. Eine echte Untergruppe von G ist eine Gruppe, die weder mit G übereinstimmt noch alleine aus dem Einselement besteht. Multiplikationstafel. Bei endlichen Gruppen kann die Wirkung der Gruppenmultiplikation in einer Multiplikationstafel angegeben werden. Bei einer Gruppe der Ordnung n mit den Elementen a1 , . . . , an enthält diese in Zeile i und Spalte j das dem Produkt ai a j zugeordnete Element a.. der Gruppe (Tab. 12.1). Direktes Produkt von Gruppen. Als direktes Produkt G 1 G 2 zweier Gruppen G 1 und G 2 (Elemente g1 und g2 ) definiert man die Menge aller geordneten Paare (g1 , g2 ), G1 G2
(g1 , g2 )g1
G 1 und g2
G2
mit der Verknüpfung (g1 , g2 )(g1¼ , g2¼ ) (g1 g1¼ , g2 g2¼ ) . (Dabei gilt g1 G 1 , g1¼ G 1 und g1 g1¼ G 1 sowie g2 G 2 , g2¼ G 2 und g2 g2¼ G 2 .) Aus den Gruppeneigenschaften von G 1 und G 2 sowie der angegebenen Definition für die Verknüpfung von Paaren (g1 , g2 ) folgt, daß auch G 1 G 2 eine Gruppe ist (Aufgabe 12.2). Die Elemente (g1, e2 ) mit g1 G 1 und e2 = Einselement von G 2 bilden eine Untergruppe von G 1 G 2 , die zur Gruppe G 1 isomorph ist. (Was isomorph bedeuten soll, wird in Abschn. 12.2 definiert.) Die Elemente (e1 , g2 , ) mit e1 = Einselement von G 1 und g2 G 2 bilden eine Untergruppe von G 1 G 2 , die zur Gruppe G 2 isomorph ist.
394
12 Elemente der Gruppentheorie
Beispiel 12.1: Die einfachste Gruppe ist eine endliche Abelsche Gruppe der Ordnung 1, die als einziges Element das Einselement e enthält. Es gilt ee e e 1 , und alle Gruppenaxiome sind erfüllt.
Beispiel 12.2: Nicht viel komplizierter ist eine endliche Abelsche Gruppe der Ordnung 2 mit Elementen e und s, welche die Beziehungen ee e , ss e , se es s erfüllen. Man erhält diese Gruppe zum Beispiel, wenn e mit der Zahl 1, s mit der Zahl 1 identifiziert wird und die Gruppenverknüpfung in der gewöhnlichen Multiplikation besteht. Man kann aber auch e mit der Einheitstransformation, s mit der Spiegelung am Koordinatenursprung identifizieren und als Verknüpfung die Ausführung dieser Transformationen nacheinander ansehen. Die Multiplikationstafel dieser Gruppe ist e s e s
e s s e
Beispiel 12.3: Ein Beispiel für die kleinste nicht-Abelsche Gruppe liefert die Gruppe der Permutationen von drei mit 1, 2 und 3 bezeichneten Objekten. Sie wird als symmetrische Gruppe der Ordnung 3, kurz S3 , bezeichnet. Kennzeichnen wir eine Permutation dadurch, daß wir die Elemente in der ursprünglichen Reihenfolge in die erste Zeile und in ihrer permutierten Reihenfolge in die zweite Zeile einer Matrix schreiben, so erhalten wir als Gruppenelemente 3 4 3 4 3 4 123 123 123 e , a1 , a2 , 123 231 312 3 4 3 4 3 4 123 123 123 a3 , a4 , a5 . 321 213 132 Die Gruppenverknüpfung bestehe im Hintereinander-Ausführen von Permutationen. 3 43 4 123 123 a5 a1 132 231 bedeutet dann z. B., daß 1 zuerst in 1 und dann in 2, 2 zuerst in 3 und dann in 1 überführt wird usw., wenn zuerst a5 und dann a1 ausgeführt wird. Eine einfache Methode zur Berechnung der Produkte erhält man, indem man ausnutzt, daß sich dieselbe Permutation in unterschiedlichen Formen schreiben läßt, bei denen die Spalten der Matrix permutiert sind, z. B. 3 4 3 4 3 4 12 3 2 31 312 jki ki j . i j k (Jede der Formen besagt, daß durch die Permutation 1 in i, 2 in j und 3 in k überführt wird.) Für die zweite, im Produkt rechts stehende Permutation benutzt man die Version, bei der in der oberen
12.1 Definitionen
395
Zeile diejenige Permutation von (1, 2, 3) steht, die durch die erste Permutation bewirkt wurde und in deren unterer Zeile steht. Dann gibt die untere Zeile der zweiten Permutation gerade die durch das Hintereinander-Ausführen beider Permutationen bewirkte Permutation an, z. B. 3 43 4 3 43 4 3 4 123 123 123 132 123 a5 a1 a4 . 132 231 132 213 213 Analog ergibt sich a1 a5
a3
a5 a1 . Man sieht leicht, daß alle Gruppenaxiome erfüllt sind.
Beispiel 12.4: Die Menge aller ganzen Zahlen bildet bezüglich der gewöhnlichen Addition als Verknüpfung eine Abelsche Gruppe. Die geraden Zahlen sind eine Untergruppe von dieser, die ungeraden nicht.
Beispiel 12.5: Die Menge sämtlicher Vektoren eines linearen Vektorraums bildet bezüglich der Vektoraddition eine kontinuierliche Abelsche Gruppe. Bezüglich der Verknüpfung durch das Kreuzprodukt bildet sie keine Gruppe, weil dieses nicht assoziativ ist, a (b c) a c b a b c a c b b c a
(a b) c .
Beispiel 12.6: Die Gesamtheit der räumlichen Drehungen im IR3 um beliebig orientierte Achsen durch den Koordinatenursprung bilden eine kontinuierliche (nicht-Abelsche) Gruppe, wobei die Verknüpfung zweier Drehungen darin besteht, daß diese hintereinander ausgeführt werden.
Beispiel 12.7: Die Drehungen um die x-Achse bilden eine Untergruppe der Gesamtheit sämtlicher Drehungen im IR3 .
Beispiel 12.8: Die Menge der Transformationen y
x ab
bildet eine zweiparametrige kontinuierliche Gruppe. Nur einer der beiden Parameter ist wesentlich, denn die Transformationen lassen sich auch in der folgenden Form schreiben. y
x c
mit
c
a b.
Beispiel 12.9: Reguläre n n-Matrizen2 mit reellen (oder komplexen) Matrixelementen bilden bezüglich der gewöhnlichen Matrizenmultiplikation eine Gruppe, denn: Das Produkt zweier n n-Matrizen ist wieder eine n n-Matrix. Aus det M1 0 und det M2 0 folgt det(M1 M2 )(det M1 )(det M2 )0. Die Multiplikation von n n-Matrizen ist assoziativ. Die Einheitsmatrix bildet das Einselement, und zu jeder Matrix mit det M 0 existiert eine inverse Matrix. 2 Eine Matrix M heißt regulär, wenn ihre Determinante det(M) 0 erfüllt.
396
12 Elemente der Gruppentheorie
Das Produkt a1 a2 a3 . . . ak von endlich vielen Elementen einer Gruppe ist dadurch erklärt, daß solange schrittweise Nachbarelemente miteinander verknüpft werden, bis nur noch ein einziges Element übrig bleibt. Wegen des Assoziativgesetzes ist dieses Vorgehen eindeutig. Man bezeichnet einen Satz von endlich vielen Elementen einer Gruppe als endliches Erzeugendensystem, wenn jedes beliebige Element der Gruppe als endliches Produkt von Elementen dieses Systems oder von deren Inversen dargestellt werden kann. Bilden die Elemente a1 , a2 , a3 , . . . , ak ein Erzeugendensystem einer Abelschen Gruppe, so α α α α kann jedes Element in der Form a1 1 a2 2 a3 3 . . . ak k dargestellt werden.
12.2
Morphismen, Wirkung und Darstellung von Gruppen
Für viele Zwecke erweisen sich Abbildungen von Gruppen aufeinander als wichtig. Allgemeiner betrachten wir zunächst strukturverträgliche Abbildungen strukturierter Mengen aufeinander. (Andere strukturierte Mengen als Gruppen sind z. B. Körper, Vektorräume oder topologische Räume.) Definition. Eine Abbildung M M ¼ zweier strukturierter Mengen aufeinander, bei der die Struktur erhalten bleibt, wird als Morphismus bezeichnet. Für die Abbildung zweier Gruppen aufeinander bedeutet das: Läßt sich jedem Element a einer Gruppe G ein Element a ¼ einer Gruppe G ¼ derart zuordnen, daß (ab)¼
ab ¼
¼
(12.3)
gilt, d. h. läßt sich G so auf G ¼ abbilden, daß die Multiplikation von Gruppenelementen erhalten bleibt, so bezeichnet man die Abbildung G G ¼ als Homomorphismus. (Man beachte, daß die Verknüpfung der Gruppenelemente von G eine andere sein kann als die der Elemente von G ¼ , d. h. ausführlicher würde (12.3)
a Æb
(a b)¼
¼
¼
Æ
lauten, wobei die Verknüpfung der Elemente von G und die der Elemente von G ¼ ist. Strukturerhaltung bedeutet also nicht, daß die Verknüpfung in beiden Gruppen dieselbe sein muß, sondern nur, daß sie denselben Gruppenaxiomen genügen muß.) Ist die Abbildung auch noch bijektiv, so bezeichnet man sie als Isomorphismus und die beiden Gruppen als isomorph. Eine isomorphe Abbildung einer Gruppe auf sich selbst ist ein Automorphismus. Zur Definition der Gruppenwirkung betrachten wir Abbildungen einer Menge M auf sich selbst, M M. Wenn x M und x ¼ M gilt, schreiben wir für die Abbildung f x x¼ x¼ fx.
12.2 Morphismen, Wirkung und Darstellung von Gruppen
397
Die Verknüpfung f 1 f 2 zweier Abbildungen f 1 und f 2 ist definiert durch x¼
f2 x ,
x ¼¼
f1 x ¼
f 1 ( f 2 x)
f 1 f2 x .
Verschiedene Abbildungen fi können zu einer Menge zusammengefaßt werden, und ihre Verknüpfung macht sie zu einer strukturierten Menge. Definition. Existiert auf der Menge M eine durch ihre Verknüpfung strukturierte Gruppe von Abbildungen M M, die durch einen Homomorphismus aus der Gruppe G hervorgeht, so wird dieser Homomorphismus als Wirkung der Gruppe G auf die Menge M bezeichnet. Beispiel 12.10: O seien Matrizen der in Abschn. 12.8 behandelten Gruppe S O(3). Dort wird gezeigt, daß r ¼ O r eine Drehung des Ortsvektors r im IR3 darstellt. Unter der Gesamtheit r r ¼ aller möglichen Abbildungen von Punkten des IR3 auf sich selbst bewirken die Matrizen O also Drehungen. Die Menge M bilden in diesem Beispiel die Punkte des IR3 , die Gruppe G ist die Matrixgruppe S O(3) mit Elementen O, und die Wirkung der Gruppe S O(3) auf den IR3 besteht in Drehungen r ¼ O r.
Besonders wichtig für physikalische Anwendungen sind die Darstellungen einer Gruppe. Bei diesen handelt es sich um die Wirkung der Gruppe auf Vektorräume. Definition. V sei ein Vektorraum über dem Körper der reellen oder komplexen Zahlen. Die Wirkung einer Gruppe G auf V , den sogenannten Darstellungsraum, wird als lineare Darstellung der Gruppe bezeichnet. Ist der Vektorraum n-dimensional, so spricht man von einer n-dimensionalen Darstellung der Gruppe. Die Darstellung heißt treu, wenn G und die Gruppe G ¼ der Abbildungen auf V isomorph sind, die Abbildung G G ¼ also bijektiv ist. Beispiel 12.11: V kann z. B. der IR3 sein, bei den Abbildungen IR3 IR3 kann es sich um Drehungen handeln. Diese bilden eine Gruppe und sind ihre eigene Darstellung auf dem IR3 .
Beispiel 12.12: V kann ein Hilbert-Raum sein, die Abbildungen können durch lineare Operatoren wirkende Operatoren und ist ψ , so gilt auch bewirkt werden. Sind L und M zwei auf χ Lψ , und die Verknüpfung der Operatoren ist durch (M L)ψ
M(Lψ) Mχ
(12.4)
erklärt. Wenn sich in der Menge der auf wirkenden Operatoren mit der oben erklärten Verknüpfung eine Gruppe befindet, die aus einer Gruppe G durch einen Homomorphismus hervorgeht, so wird diese Gruppe von Operatoren als eine Darstellung der Gruppe G bezeichnet.
398
12 Elemente der Gruppentheorie
In der Quantenmechanik kann man von einer abstrakten Hilbert-Raum-Darstellung zu einer Matrixdarstellung übergehen, wenn die Basis des Hilbert-Raums aus endlich oder abzählbar unendlich vielen Elementen besteht. Dabei geht die Verknüpfung (12.4) zwischen Operatoren in das Matrizenprodukt der diesen Operatoren zugeordneten Matrizen über. Dasselbe, d. h. der Übergang zu einer Matrixdarstellung ist auch bei Gruppen möglich, da die Menge aller regulären n n-Matrizen mit der üblichen Matrizenmultiplikation als Gruppenverknüpfung eine Gruppe bildet (Beispiel 12.9). Die Matrixelemente können reell oder komplexwertig sein, und Regularität der Matrizen bedeutet det Mik 0. Matrixdarstellung. Eine Gruppe regulärer n n-Matrizen mit der üblichen Matrizenmultiplikation als Gruppenverknüpfung, die aus einer Gruppe G durch einen Homomorphismus hervorgeht, bildet eine Matrixdarstellung von dieser. Wir werden uns bei der Darstellung von Gruppen im folgenden überwiegend auf Matrixdarstellungen konzentrieren. Allen Elementen gi der Gruppe G sind dann Matrizen3 M(gi ) zugeordnet, die wegen des geforderten Homomorphismus nach (12.3) M(gi )M(g j )
M(gi g j )
(12.5)
erfüllen müssen. (Wenn der Homomorphismus kein Isomorphismus ist, kann dabei M(gi ) M(g j ) für gi g j gelten.) Wenn G eine kontinuierliche Gruppe ist, muß zusätzlich gefordert werden, daß sich die Matrixelemente bei einer kontinuierlichen Veränderung der Gruppenparameter stetig verändern. Aus (12.5) folgt mit M(a) M(ae) M(a)M(e) und M(e) M(s 1 s) M(s 1 )M(s) insbesondere M(e)
E,
M(s
1
)M
1
(s) ,
wobei E die Einheitsmatrix ist. Zwei n-dimensionale Matrixdarstellungen M(g) und M ¼ (g) einer Gruppe werden als äquivalent bezeichnet, wenn sie durch eine Ähnlichkeitstransformation der Form M ¼ (g) T M(g)T 1 für alle g G mit einer festen regulären n n-Matrix T ineinander überführt werden können. Eine Gruppe besitzt im allgemeinen viele verschiedene Matrixdarstellungen. Die einfachste davon ist die triviale oder Eins-Darstellung, bei der jedes Element durch die 11-Einheitsmatrix dargestellt wird. (Diese ist natürlich nicht treu.) Außer dieser gibt es im allgemeinen noch viele andere Darstellungen höherer Dimensionen, unter denen sich auch verschiedene nicht-äquivalente Darstellungen derselben Dimension befinden können. Aus zwei Darstellungen M 1 (g) und M 2 (g), die gleich oder äquivalent, jedoch 3 Wir werden im folgenden für Matrizen meist M statt M schreiben und auch das Produkt zweier Matrizen nicht eigens kennzeichnen, also M1 M2 statt M1 M2 schreiben. Die letzte Schreibweise werden wir nur ausnahmsweise dann benutzen, wenn Matrizen verschiedenen Typs miteinander multipliziert werden, z. B. Matrizen mit Vektoren.
12.2 Morphismen, Wirkung und Darstellung von Gruppen
399
auch verschieden sein und verschiedene Dimensionen besitzen dürfen, und aus NullMatrizen 0 läßt sich durch 4 3 0 M 1 (g) M(g) für alle g G 0 M 2 (g) immer eine neue Darstellung höherer Dimension konstruieren (Aufgabe 12.3). Beispiel 12.13: Als Beispiel betrachten wir verschiedene Darstellungen der in Beispiel 12.2 betrachteten Gruppe mit zwei Elementen e und s. Für die triviale Darstellung gilt M (1) (e) M (1) (s) 1. Diese Darstellung ist nur homomorph, nicht isomorph. Eine weitere, isomorphe Darstellung mit 1 1-Matrizen erhält man mit M (2) (e) 1 , M (2) (s) 1 . Isomorph ist auch die Darstellung 3 1 (3) M (e) 0 aus der M (3) (e)2 M (3) (s)2 E und desgleichen 3 1 (4) M (e) 0
0 1
4 ,
M (3) (s)
3
1 0
0 1
4 ,
sowie M (3) (e) M (3) (s) M (3) (s) M (3) (e) M (3) (s) folgt, 0 1
4
3
,
M (4)
1 (s) 0
0 1
4 .
Eine Matrixdarstellung heißt reduzibel, wenn sich alle ihre Matrizen durch ein und dieselbe Ähnlichkeitstransformation T für alle g G in die Form 3 4 M 1 (g) X (g) M(g) 0 M 2 (g) bringen lassen, wobei M 1 eine m m , M 2 eine (n m)(n m), X (g) eine m (n m) und 0 eine (n m)m-Matrix ist; andernfalls heißt sie irreduzibel. Falls X (g) 0 gilt, heißt die Darstellung voll reduzibel oder zerlegbar. Daraus, daß Matrizen auch blockweise multipliziert werden können, und aus der Gültigkeit von Gleichung (12.5) für M folgt, daß dann auch M 1 (g) und M 2 (g) Darstellungen der Gruppe sind (Aufgabe 12.3). Diese können wiederum (voll) reduzibel oder irreduzibel sein. Eine wichtige Aufgabe der Gruppentheorie besteht darin, sämtliche irreduziblen Darstellungen einer Gruppe zu finden. Dieser werden wir hier allerdings nicht weiter nachgehen. Die Darstellung einer Gruppe durch unitäre Matrizen, also Matrizen, die UU
E
U
U
1
U U
E
(12.6)
erfüllen, wird als unitäre Darstellung bezeichnet. Mit U T transponierte und U konjugiert komplexe Matrix gilt dabei U (U T ).
400
12.3
12 Elemente der Gruppentheorie
Matrixgruppen
Definition. Eine kontinuierliche Matrixgruppe G wird als zusammenhängend bezeichnet, wenn es zu jeder Matrix M0 G eine einparametrige Matrixschar M(t) G (jedes Matrixelement hängt stetig von t ab, Mik Mik (t)) mit 0 t 1 gibt derart, daß M(0) E
und
M(1) M0
(12.7)
gilt. Unitäre Gruppen. Die Menge aller unitären n n-Matrizen U , also aller Matrizen, die U U E erfüllen, bildet unter der Matrizenmultiplikation eine Gruppe, die als unitäre Gruppe der Ordnung n, kürzer U ºn», bezeichnet wird. Werden für die Matrixelemente kontinuierliche Werte zugelassen, so handelt es sich um eine kontinuierliche Gruppe, deren Gruppenparameter die Matrixelemente sind. Wegen der Komplexwertigkeit entsprechen den n 2 Matrixelementen zunächst 2n 2 Parameter. Von diesen werden jedoch durch die Forderung der Unitarität (nur n 2 unabhängige Gleichungen, da aus U U E auch UU E folgt) n 2 Elemente durch die übrigen festgelegt, so daß nur n 2 freie Parameter übrig bleiben. Stellt man zusätzlich noch die Forderung det U 1, so reduziert sich die Zahl freier Parameter auf n 2 1, und man bezeichnet die Gruppe als spezielle unitäre Gruppe SU ºn». Es kann gezeigt werden, daß eine Darstellung durch unitäre Matrizen voll reduzibel ist, wenn sie reduzibel ist. Orthogonale Gruppen. Die Menge aller orthogonalen reellen n n-Matrizen O, also aller Matrizen, die (12.8) O OT OTO E erfüllen, bildet eine Gruppe, die als orthogonale Gruppe O ºn» bezeichnet wird. Von den n 2 reellen Matrixelementen Oik sind die Gleichungen n k 1
Oik OklT
n
Oik Olk
δil
k 1
zu erfüllen, wobei δil das Kronecker-Symbol ist. Wegen δil δli fallen die Gleichungen für i > l mit denen für i < l zusammen, so daß sich nur (n 2 n)/2n Gleichungen für n 2 Größen ergeben. Daher gibt es (n 2 n)/2 freie Parameter. Wenn zusätzlich zu den Orthogonalitätsbedingungen auch noch det O 1 gilt, wird die Gruppe als spezielle orthogonale Gruppe S O ºn» bezeichnet. Aus dem Produktsatz für Determinanten, (det A)(det B) det(AB), und aus der für alle Matrizen gültigen Beziehung det M T det M folgt mit (12.8) und det E 1 die Gültigkeit von (det O)(det O T )(det O)2 1 bzw. det O 1. Durch die Einschränkung det O 1 wird die Zahl der kontinuierlichen Parameter von Matrizen der Gruppe S O(n) daher gegenüber denen von Matrizen der Gruppe O(n) nicht weiter erniedrigt. Unitäre und orthogonale Matrixgruppen sind besonders wichtig für die Elementarteilchentheorie. In Tab. 12.2 sind deren wichtigste Eigenschaften daher noch einmal zusammengestellt.
12.3 Matrixgruppen Gruppe U (n) SU (n) O(n) S O(n)
401 Matrizen komplex, unitär (U U UU E) komplex, unitär und det U 1 reell, orthogonal (O O T O T O E) reell, orthogonal und det O 1
freie Parameter n2 2 n 1 n(n 1)/2 n(n 1)/2
Tabelle 12.2: Liste der für die Elementarteilchenphysik wichtigsten Gruppen in der Darstellung durch n n-Matrizen.
Beispiel 12.14: Gruppen U (1) und SU (1) Als einfachstes Beispiel betrachten wir die Gruppe U (1), deren Darstellungsmatrizen als 1 1-Matrizen einfach komplexe Zahlen sind. Diese müssen die Bedingung UU 1 erfüllen und haben daher die Form U
ei Λ .
(12.9)
(Jede komplexe Zahl U kann in der Form U Aei Λ dargestellt werden, und aus UU 1 folgt A 2 1 bzw. A 1. Das Vorzeichen von A kann in der Phase Λ mit erfaßt werden.) Offensichtlich gilt det U U ei Λ , und die zusätzliche Forderung det U 1 für die Elemente der Gruppe SU (1) führt zu U 1. Dies bedeutet, daß die Gruppe SU (1) als einziges Element das Einselement besitzt.
Beispiel 12.15: Gruppen U (2) und SU (2) Für die Matrizen der Gruppe U (2) setzen wir zunächst ganz allgemein 3 4 3 4 a b a c U U b d c d an. Die definierende Bedingung UU E liefert die Gleichungen aa
bb 1 ,
ac
bd 0 ,
ca
db 0 ,
cc
dd 1 ,
von denen die zweite aus der dritten folgt und daher nicht berücksichtigt werden muß. Aus der letzteren ergibt sich a a d c , (12.10) d c, b b und aus der vierten folgt damit unter Benutzung der ersten aa cc bb cc 1 1. bb Hiermit erhalten wir
(12.10) und dd aa . bb Setzen wir jetzt a Aeiα und b Beiβ , so hat die Forderung aa bb 1 die Folge A 2 B 2 1 und wird mit A cos θ, B sin θ erfüllt. (Auch A cos θ, B sin θ usw. wären Lösungen, aber
cc
dieselben Vorzeichenkombinationen lassen sich durch Verschiebungen der Winkel α und β auch mit der oben gewählten Lösung erreichen.) Nach dem letzten Ergebnis hat c denselben Betrag wie
402
12 Elemente der Gruppentheorie
b, daher können wir c sin θ eiγ setzen. Berücksichtigen wir auch noch das Ergebnis (12.10), so erhalten wir für die Matrizen der Gruppe U (2) die allgemeine Gestalt 3 4 sin θ eiβ cos θ eiα U . (12.11) sin θ eiγ cos θ ei (β γ α) Für die zugehörige Determinante ergibt sich det U
ei (β γ ) .
(12.12)
Die Matrizen der Gruppe SU (2) müssen alle Forderungen der Gruppe U (2) erfüllen, außerdem noch det U 1. Dies bedeutet, daß sie die Struktur (12.11) besitzen, für die (12.12) gilt, und die Forderung an ihre Determinante führt zu γ β. Damit erhalten wir für sie die Form 3 4 sin θ eiβ cos θ eiα U (12.13) sin θ e iβ cos θ e iα mit drei freien Parametern θ, α und β. Es sei darauf hingewiesen, daß die Gruppe SU (2) noch andere Darstellungen mit höherdimensionalen Matrizen besitzt.
Beispiel 12.16: Gruppen O(2) und S O(2) Für die Matrizen der Gruppe O(2) wählen wir den Ansatz 3 4 a b O OT c d
3
a c b d
4
E liefert die Gleichungen ac bd 0 , c2 d 2 1 . a 2 b2 1 , Die erste und dritte Gleichung lösen wir mit den Ansätzen a cos θ, b sin θ und c sin ϕ, d cos ϕ, mit denen die mittlere cos θ sin ϕ sin θ cos ϕ sin(θ ϕ)0 bzw. ϕ θ oder ϕ θ π liefert. Damit ergeben sich für die Gruppe O(2) die beiden Lösungen
mit reellen a, b, c und d. Die Bedingung O O T
O
3
cos θ sin θ
sin θ cos θ
4
und
O
3
cos θ sin θ
sin θ cos θ
4
.
(12.14)
Die erste Lösung hat det O 1 und ist daher auch die Lösung für die Gruppe S O(2), sie beschreibt eine Drehung. Die zweite hat det O 1 und beschreibt eine Drehspiegelung. Offensichtlich sind die durch (12.14a) gegebenen Matrizen der Gruppe S O(2) zusammenhängend (wir können direkt θ t wählen), die Gesamtheit der Matrizen der Gruppe O(2) dagegen nicht, da Matrizen mit det O 1 nicht kontinuierlich in Matrizen mit det O 1 überführt werden können.
Beispiel 12.17: Gruppen U (n) und SU (n) Nach Abschnitt 12.13.3 des Anhangs über Matrizen können die Matrizen dieser Gruppen durch eine Ähnlichkeitstransformation U T 1 U T in Diagonalform mit Uii
ei δi ,
det U
ei ,
n i 1
δi
(12.15)
12.4 Lie-Gruppen und Generatoren
403
überführt und nach (12.76) in der Form U
ei /n U
mit
det U
1
(12.16)
geschrieben werden, wobei U ebenfalls eine unitäre Matrix ist. Sei nun U0 eine beliebige Matrix der Gruppe U (n) oder SU (n), und sei T die Matrix, mit der U0 in Diagonalform gebracht wird, so daß ei δi (T 1 U0 T )ii gilt. Für die Schar U ¼ (t) von Diagonalmatrizen mit den Diagonalelementen ei t δi ist dann U ¼ (0) E und U ¼ (1)U0¼ T 1 U0 T . Daraus folgt, daß die Schar U (t)T U ¼ (t)T 1 die Bedingungen U (0) T U ¼ (0)T 1 T E T 1 E und U (1) T U ¼ (1)T 1 T U0¼ T 1 U0 erfüllt. Damit ist gezeigt, daß die Gruppen U (n) bzw. SU (n) zusammenhängend sind.
12.4
Lie-Gruppen und Generatoren
Wir knüpfen an unsere Definition kontinuierlicher Gruppen bei den Gleichungen (12.1)–(12.2) an und betrachten eine kontinuierliche p-Parameter Gruppe. Das Einselement der Gruppe, das nach den Gruppenaxiomen stets existieren muß, bezeichnen wir mit g(a0) und das zu jedem g(a) existierende inverse Element mit g(a), d. h. g(a0 )g(a)
g(a)g(a0 )
g(a) ,
g(a)g(a)
g(a)g(a)
g(a0 ) .
(12.17)
Wenn nun in der für kontinuierliche Gruppen gültigen Beziehung (12.2) die Funktion f (a, b) nicht nur stetig, sondern sogar analytisch ist (aus (12.17b) folgt a0 f (a, a), und daraus folgt, daß dann auch a eine analytische Funktion von a ist), dann wird die Gruppe als Lie-Gruppe bezeichnet. (Für die Gruppenelemente g(a) wird oft die Kurznotation a benutzt.) Die angegebene Definition erweitern wir gleich dahingehend, daß eine Gruppe auch dann als Lie-Gruppe bezeichnet wird, wenn sie aus mehreren analytischen Teilgruppen besteht, die nicht stetig zusammenhängen. (Das ist z. B. bei den 1 zerfalMatrixgruppen O(n) der Fall, die in Teilgruppen mit det O 1 und det O len.) Beispiel 12.18: Die Menge der affinen Transformationen x¼
ax
b
bildet eine zweiparametrige Lie-Gruppe. Führt man nämlich die Transformationen x ¼ a1 x b1 und x ¼¼ a2 x ¼ b2 hintereinander aus, so erhält man x ¼¼ a3 x b3 mit a3 a1 a2 und b3 a2 b1 b2 , also einen analytischen Zusammenhang zwischen den Parametern. Die identische Abbildung erhält man für a1, b0 und die inverse für x ax ¼ b mit a 1/a und bb/a.
In einer zusammenhängenden Lieschen Matrixgruppe betrachten wir jetzt eine einparametrige Schar M(t), von der wir annehmen, daß die Matrixelemente Mik (t) differenzierbare Funktionen des Scharparameters t sind und daß M(0) E gilt. Es wird sich
404
12 Elemente der Gruppentheorie
zeigen, daß die Elemente der ganzen Gruppe aus den in infinitesimaler Nachbarschaft der Einheitsmatrix befindlichen Elementen abgeleitet werden können. Zur Untersuchung dieser Nachbarschaft entwickeln wir die Matrizen der Schar in eine Taylor-Reihe M(t)
E
Jt
' 1 d 2 M '' 2 dt 2 't
t
2
...
mit
J
0
' d M '' dt 't
.
(12.18)
0
Die Größe J wird als ein Erzeuger oder Generator der Gruppe bezeichnet. Zu einer mehrparametrigen zusammenhängenden Lie-Gruppe gibt es verschiedene, voneinander unabhängige Ein-Parameter-Scharen und daher mehrere Generatoren. Ihre besondere Bedeutung liegt darin, daß aus ihnen alle mit M(0) E zusammenhängenden Elemente der Gruppe konstruiert werden können, also auch solche, die nicht nahe der Einheitsmatrix liegen. Der Beweis dafür folgt im nächsten Abschnitt – allerdings nur für den uns besonders interessierenden Spezialfall linearer Lie-Gruppen. Zunächst konstruieren wir zu einem Generator J die einparametrige Matrizenschar
et J M(t)
tl
l 0
l
Jl .
(12.19)
Ist j der Betrag des betragsmäßig größten Elements der Matrix J , so ist der Betrag 2 2 des Elements nbetragsmäßiggrößten nder 2Matrix 2J nicht größer als nl j – es gilt n j 1 Ji j J j k j 1 Ji j J j k 1 j n j – und der Matrix J nicht größer als (n j )l /n. Da aber die Reihe 0 x l /l mit x t j n konvergiert, tut das auch die definierende Reihe, d. h. die Matrix et J ist wohldefiniert. M(t) Ist K ein zweiter Generator der Gruppe und et K eine mit diesem gebildete zweite Schar, so ergibt sich durch Ausmultiplizieren der entsprechenden Reihen e t J et K
E
t (J K )
t2 2 (J 2 J K K 2 ) 2
t3 3 (J 3 J 2 K 3 J K 2 K 3 ) 6
... .
Definieren wir als Kommutator zweier Matrizen
J, K J K K J K , J ,
(12.20)
so gilt
(J K )(J K ) J 2 J K K J K 2 J 2 2 J K K 2 K , J , K J K J K 2 K , J K J K J J 2 K J K , J , K 2 J J K 2 K , J K K K , J , K J 2 J 2 K J K , J K , J J , (J K )3 J 3 J 2 K J K J J K 2 K J 2 K J K K 2 J K 3 J 3 3 J 2 K 3 J K 2 K 3 32 (J K ) J, K 32 J, K (J K )
12 J, J, K 12 J, K , K ,
(J K )2
12.5 Lineare Lie-Gruppen
405
und wir erhalten et J et K
E
t2 (J K )2 2
t3 (J K )3 6 ) J, K (J K )
t (J K ) 3t 3 (
(J K ) J, K 12 t2 t3 J, K J, J, K 2 12
J, K , K
...
... .
Dieses Ergebnis verifiziert bis zu Termen dritter Ordnung in t die Gültigkeit der BakerCampbell-Hausdorff-Formel, kürzer BCH-Formel et J et K
et H ( J,K t )
mit H (J, K t) (J K )
t2 J, J, K 12
t J, K 2
(12.21)
J, K , K
... ,
in der außer dem ersten sämtliche Koeffizienten der Reihe H (J, K t) aus dem Kommutator J, K sowie Kommutatoren von diesem gebildet werden und mit diesem verschwinden. (Auf den umfangreichen Beweis dieser Formel wird hier verzichtet.4 ) Aus (12.21) folgt J, K 0 . (12.22) et J e t K e t ( J K )
12.5
Lineare Lie-Gruppen
Für physikalische Anwendungen interessieren unter den Lie-Gruppen besonders die linearen Lie-Gruppen. Diese sind dadurch definiert, daß für sie mindestens eine endlichdimensionale Matrixdarstellung (= lineare Darstellung, daher der Name) existiert. Da zu jeder abstrakten linearen Lie-Gruppe eine isomorphe Matrixgruppe existiert, können wir uns gleich auf die Betrachtung von Matrixgruppen beschränken. Für diese erbringen wir jetzt den Beweis, daß man aus den Erzeugern der Gruppe durch die Konstruktion (12.19) einparametrige Scharen der jeweiligen Gruppe erhält. Dabei interessieren wir uns insbesondere für die Gruppen U (n), O(n), SU (n) und S O(n) . Für eine einparametrige Schar der Gruppe U (n) folgt durch Ableitung der Beziehung (12.6) nach t mit (12.7a) und (12.18b) ' ' dU '' dU '' U' U J J 0 , ' dt dt t 0 t 0 d. h. die Erzeuger der Gruppe U (n) sind schiefhermitesch, J
J.
(12.23)
4 Siehe z. B. U. Kirchgraber und E. Stiefel, Methoden der analytischen Störungstheorie, Abschn. 10.2, Teubner, Stuttgart, 1978.
406
12 Elemente der Gruppentheorie
(Die Bezeichnung „schiefhermitesch“ ist an den Begriff hermitescher Matrizen angelehnt, die J J erfüllen.) Ist nun J eine beliebige schiefhermitesche Matrix, dann gilt mit (J 2 ) J J (J )2 etc., und weil J und J vertauschen, (et J ) et J
(12.19)
et J e t J
(12.23)
e
t J t J (12.22)
e
e
t(J
J)
e0 E .
Dies bedeutet, daß die Matrizen et J unitär sind, wenn der Generator J schiefhermitesch ist. M(t)et J ist daher eine einparametrige Schar in der zusammenhängenden Gruppe U (n). Für eine einparametrige Schar der Gruppe O(n) folgt durch Ableitung der Beziehung (12.8) nach t ' ' ' d O T '' ' d O '' d O T '' T dO ' ' OT O O JT J 0, O' ' ' dt dt dt dt ' t 0
t 0
t 0
t 0
d. h. die Erzeuger der Gruppe O(n) sind schiefsymmetrisch, JT
J,
(12.24)
und mit O(t) reell. Ist J eine beliebige schiefsymmetrische Matrix, dann ergibt sich mit (J l )T (J T )l (et J )T et J
(12.19)
(12.24)
T
et J e t J
e
tJ tJ
e
e
t(J
J)
E,
d. h. die Matrizen et J sind orthogonal und bilden eine einparametrige Schar in der Gruppe O(n). Jetzt wenden wir uns den Gruppen SU (n) und S O(n) zu, deren Matrizen auch noch die Bedingung det M 1 erfüllen. Zu deren Auswertung benutzen wir die im Anhang, Abschn. 12.13, abgeleitete Beziehung (12.73), mit der für J die Bedingung Sp J
0
(12.25)
folgt. Aus dieser geht hervor, daß jede schiefhermitesche n n-Matrix mit Spur null ein Erzeuger der Gruppe SU (n) ist, und daß für jede von diesen et J eine einparametrige Schar dieser Gruppe bildet. Aus (12.24) folgt, daß die Diagonalelemente aller schiefsymmetrischen Matrizen verschwinden, so daß die Bedingung (12.25) automatisch erfüllt wird. Dies bedeutet, daß alle schiefsymmetrischen n n-Matrizen J zugleich Erzeuger der Gruppen O(n) und S O(n) sind und daß et J für diese eine einparametrige Schar beider Gruppen ist. Allerdings werden dadurch keine Elemente der Gruppe O(n) mit det O 1 erfaßt. Dies kommt daher, daß der Ansatz (12.18) nur mit der Einheitsmatrix zusammenhängende Gruppenelemente darzustellen erlaubt, und da für diese det E 1 gilt, führt er zur Einschränkung auf die Untergruppe orthogonaler Matrizen mit der Eigenschaft det O 1. Jede einparametrige Schar et J einer Gruppe G bildet übrigens eine Abelsche Untergruppe von dieser, denn es gilt (et J )
1
e
tJ
,
et1 J et2 J
e(t t ) J , 1
2
d. h. zu jedem Element der Untergruppe existiert ein inverses, und die – kommutative – Addition der t-Werte spielt die Rolle der Gruppenmultiplikation.
12.6 Lie-Algebra der Generatoren
12.6
407
Lie-Algebra der Generatoren
Besitzt eine Liesche Matrixgruppe zwei Erzeuger J und K , so ist auch a J bK mit konstanten a und b ein Erzeuger der Gruppe: Mit et J und et K bilden dann auch eat J eτ J und ebt K eσ K Scharen der Gruppe, daraus folgend auch die Schar der Produktmatrizen eat J ebt K E t (a J bK ) . . . (man beachte: hier wird nicht verlangt, daß das Produkt gleich eat J bt K ist), und diese besitzt nach (12.18b) den Erzeuger a J bK . Hieraus folgt: Die Erzeuger der Gruppe bilden einen Vektorraum. Wie wir weiter unten sehen werden, ist dessen Dimension gleich der Anzahl freier reeller Parameter der Matrizen der zugehörigen Gruppe . In dem von den Erzeugern einer Gruppe aufgespannten Vektorraum liegen außer den Linearkombinationen von Erzeugern auch deren Kommutatoren J, K .
Beweis: Zum Beweis dieser Behauptung betrachten wir die einparametrige Schar der Matrizen (12.21) E et J et K e t J e t K E in der zuletzt τ Matrizen der Gruppe
t2 (J 2 2 t (J K ) t2 (J E τ J, K . . . , t (J
K)
K )2 K )2
t2 J, K 2 2 t J, K 2
... ...
t 2 als Scharparameter eingeführt wurde. Diese gehört als vierfaches Produkt von
ebenfalls zu dieser und besitzt den Erzeuger J, K .
Jetzt betrachten wir drei Erzeuger J , K und L der Gruppe . Aus der Definition (12.20) der Kommutatoren folgt, daß diese die folgenden Eigenschaften besitzen.
a J bK , L a J, L b K , L a, b IR K , L L, K J, K , L K , L , J L, J , K 0
(Linearität)
(12.26)
(Schiefsymmetrie)
(12.27)
(Jacobi-Identität) .
(12.28)
Eine Verknüpfung von Elementen eines Vektorraums, die den Regeln (12.26)–(12.28) genügt, wird als Lie-Algebra bezeichnet, d. h. die Generatoren der Lie-Gruppe gehorchen bzgl. der durch ihren Kommutator gegebenen Verknüpfung einer LieAlgebra. Ist J1 , J2 , . . . , J f eine Basis des durch die Generatoren aufgespannten Raumes, dann müssen die ebenfalls in diesem Raum liegenden Kommutatoren Ji , Jk in der Form f Ji , J j cikj Jk (12.29)
k 1
dargestellt werden können, wobei die Koeffizienten cikj Konstanten sind, die allerdings von der gewählten Basis abhängen können. Diese werden als Strukturkonstanten bezeichnet. Wenn die betrachtete Lie-Gruppe Abelsch ist, gilt et J , et K 0, und mit (12.21) folgt daraus J, K 0, d. h. die Strukturkonstanten einer Abelschen LieGruppe sind alle gleich null. Eine Lie-Algebra wird daher als Abelsch bezeichnet, wenn die Kommutatoren sämtlicher Erzeuger verschwinden.
408
12 Elemente der Gruppentheorie
Jedes mit dem Einselement E stetig verbundene Element M der zu der Basis J1 , J2 , . . . , J f eines vollständigen Erzeugersystems gehörigen Gruppe läßt sich in der Form f f M exp ti Ji E ti Ji . . . (12.30) i 1
i 1
schreiben. Dabei sind t1 , . . . , t f die Parameter der Gruppe, und da die Ji eine Basis bilden – kein Ji läßt sich durch eine Linearkombination der anderen Jk ausdrücken –, sind sie alle wesentlich. Hieraus folgt, daß die Zahl unabhängiger Erzeuger einer Gruppe, also die Dimension der Gruppe gleich der Zahl ihrer wesentlichen Parameter ist. Setzen wir ti nti mit hinreichend großem n, so sind alle ti für gegebene ti sehr klein, und M läßt sich in der Form f n f s.u. (12.31) M en i 1 ti Ji e i 1 ti Ji f
schreiben, also als Potenz eines Gruppenelements e i 1 ti Ji aus der unmittelbaren Nachbarschaft der Einheitsmatrix. Der letzte Schritt in (12.31) war möglich, weil α ti Ji mit sich selbst vertauscht und nach (12.22) daher eα eα e2α , eα e2α e3α etc. gilt. Das Ergebnis (12.31) verifiziert unsere frühere Behauptung, daß die Struktur einer Lie-Gruppe durch die Gruppenelemente in der unmittelbaren Umgebung der Einheitsmatrix festgelegt wird. Indem wir die Parameter und Erzeuger der Gruppe zu Vektoren t t1 , . . . , t f bzw. J J1 , . . . , J f mit dem Skalarprodukt t J
f
ti Ji
(12.32)
i 1
zusammenfassen, können wir für die Gruppenelemente (12.30) kürzer
et J (12.33) schreiben. Da mit den Matrizen M1 exp(t1 J ) und M2 exp(t2 J ) auch deren ProM
dukt zur Gruppe gehört und daher eine Darstellung der Form (12.33) besitzt, muß die Gleichung e t1 J e t2 J e t3 J (12.34)
zu gegebenen Vektoren t1 und t2 eine Lösung t3 besitzen. Beweis: Daß dies tatsächlich der Fall ist, läßt sich erkennen, indem man für i 1, 2 jeweils ti J t K i mit K i (ti /t) J schreibt. Die K i sind als Linearkombinationen von Erzeugern selbst wieder Erzeuger der Gruppe. Nach (12.21) gilt e t1 J e t2 J
et K 1 et K 2
et H (K 1 ,K 2 t ) ,
wobei die Reihe H (K 1 , K 2 t) eine Linearkombination der Erzeuger K 1 und K 2 sowie mehrfacher Kommutatoren von diesen ist. Sie muß daher für festes t selbst ein Erzeuger der Gruppe sein, der sich in der Form n(t) J darstellen läßt, d. h. H (K 1 , K 2 t)n(t) J. Wird das in in die zuletzt abgeleitete Beziehung eingesetzt und mit (12.34) verglichen, so folgt schließlich t3 t n(t).
12.7 Erzeuger der Gruppe SU (2)
409
Bei verschiedendimensionalen Darstellungen derselben Gruppe hat man zwei Sätze J (n) und J (n ¼ ) gleich vieler Erzeuger, von denen die ersten n n-Matrizen und die zweiten n ¼ n ¼ -Matrizen sind. Es besteht die Zuordnung
e t J (n)
e t J (n ) . ¼
zwischen den Matrizen und nach (12.3) die Zuordnung e t1 J (n) e t2 J (n)
et
3 J (n)
e t1 J (n ) e t2 J (m) ¼
et
3 J (n
¼
)
zwischen den Produkten von Matrizen. In beiden Gruppen muß sich zu gegebenen t1 und t2 der gleiche Vektor t3 ergeben. Dafür ist nach den obigen Ausführungen notwendig und hinreichend, daß sich für beide Sätze von Erzeugern dieselben Funktionen H (Ji , Jk t) ergeben, was zur Folge hat, daß beide die gleichen Strukturkonstanten besitzen.
Erzeuger der Gruppe SU º2»
12.7
In diesem Abschnitt sollen die Generatoren der Gruppe SU (2) berechnet werden. Die Gesamtheit der in dieser Gruppe enthaltenen Matrizen ist durch (12.13) gegeben, und ihre Generatoren erhalten wir durch Untersuchung der Nachbarschaft der Einheitsmatrix. Die Werte der Parameter α, β und θ , für welche die Einheitsmatrix erhalten wird, ergeben sich aus den Gleichungen cos θ eiα
1,
0,
sin θ eiβ
sin θ e
iβ
0,
cos θ e
iα
1
und sind α θ 0 bei beliebigem β. Die Entwicklung der Matrix U um diese Werte bis zu Termen erster Ordnung in α und θ liefert U
3 3
1iα θ e 1 0
0 1
iβ
4
θ eiβ 1iα
4
iθ sin β
3
3
1 0
0 1
1 0
4
3
θiα(cos β i sin β) θ (cos β i sinβ) iα 3 3 4 4 0 i 1 0 iθ cos β i 0 iα 0 1 .
0 1 4
4
Definieren wir die Parameter t1
θ sin β ,
und führen die Pauli-Matrizen 3 4 0 1 σ1 , σ2 1 0
t2 3
0 i
θ cos β ,
i 0
4 ,
σ3
t3
α 3
1 0
0 1
4 (12.35)
410
12 Elemente der Gruppentheorie
ein, für die auch die Bezeichnungen σx σ1 , σ y σ2 und σz σ3 üblich sind, so haben wir U E t1 i σ1 t2 i σ2 t3 i σ3 . . .. Der Vergleich mit (12.30) zeigt, daß die Erzeuger der Gruppe SU (2) bis auf den Faktor i durch die Pauli-Matrizen gegeben sind, d. h. Jl
i σl ,
l
1, 2, 3 .
(12.36)
(Man überzeugt sich leicht davon, daß die Matrizen Jl schiefhermitesch und spurfrei sind.) Die Strukturkonstanten der zugehörigen Lie-Algebra ergeben sich aus den Relationen (Q7.42), σi , σ j 2 i σk für i, j, k zyklisch . (12.37) Für die Erzeuger folgt daraus J
x
2
,
Jy Jz 2 2
und zykl. Permutationen .
(12.38)
Aus (12.33) und (12.36) folgt für die Matrizen der Gruppe SU 2 schließlich mit t die Darstellung U
12.8
ei
¡
.
(12.39)
Gruppe SO º3»
Die Gruppe S O(3) untersuchen wir am besten, indem wir uns zunutze machen, daß ihre Matrizen Rotationen im IR3 vermitteln. Um das zu erkennen, betrachten wir die Transformation x ¼ Rx , (12.40) bei der R eine reelle 33-Matrix und x der zum Zeilenvektor x T x 1 , x 2 , x 3 gehörige Spaltenvektor ist. Bei der Transformation x x ¼ handelt es sich um eine Drehung, wenn die Länge des Vektors x erhalten bleibt, also x 1¼2 x 2¼2 x 3¼2 x 12 x 22 x 32 oder xT x
x T x (Rx)T Rx x T R T R x ¼
¼
mit der Folge R T R E gilt. Nach (12.8) ist das gerade die Bedingung dafür, daß R S O(3) gilt. Zur Berechnung der Erzeuger der Gruppe S O(3) könnte man ähnlich wie bei der Gruppe SU (2) vorgehen, d. h. eine Matrix O mit 9 reellen Elementen ansetzen, deren Anzahl durch Lösung der Gleichungen O T O E auf 3 reduzieren, suchen, für welche Parameterwerte die Einheitsmatrix entsteht, und um diese entwickeln. Wir kommen einfacher zum Ziel, wenn wir ausnutzen, daß Gleichung (12.40) für R S O(3) Drehungen darstellt. Drehungen um die x-Achse mit dem Drehwinkel ϕ, um die y-Achse mit dem Drehwinkel ψ und um die z-Achse mit dem Drehwinkel ϑ werden in bekannter Weise
12.8 Gruppe S O(3)
411
durch die Matrizen ⎛ ⎞ 1 0 0 ⎜ ⎟ Rx ⎝ 0 cos ϕ sin ϕ ⎠ , R y 0 sin ϕ cos ϕ
⎛
⎞ cos ψ 0 sin ψ ⎟ ⎜ 1 0 ⎠ , Rz ⎝ 0 sin ψ 0 cos ψ
⎛
⎞ cos ϑ sin ϑ 0 ⎟ ⎜ ⎝ sin ϑ cos ϑ 0 ⎠ 0 0 1 (12.41) vermittelt. Alle drei hängen kontinuierlich mit der Einheitsmatrix zusammen, denn es gilt Rx (ϕ 0) R y (ψ 0) Rz (ϑ 0) E. Als Erzeuger ergeben sich aus den Definitionen Jx d Rx (ϕ)/dϕ ϕ 0 , Jy d R y (ψ)/dψ ψ 0 und Jz d Rz (ϑ)/dϑ ϑ 0 sofort ⎞ ⎞ ⎛ ⎛ ⎛ ⎞ 0 0 0 0 0 1 0 1 0 ⎟ ⎟ ⎜ ⎜ ⎜ ⎟ (12.42) Jx ⎝ 0 0 1 ⎠ , Jy ⎝ 0 0 0 ⎠ , Jz ⎝ 1 0 0 ⎠ . 0 1 0 1 0 0 0 0 0 Wie man leicht nachrechnet, genügen sie den Vertauschungsrelationen
Jx , Jy
und zykl. Permutationen .
Jz
(12.43)
Mit den Erzeugern (12.42) erhält man für die Gruppe S O(3) die Darstellung R
eθ J
x x
θ y J y θz Jz
e J .
(12.44)
Da diese drei wesentliche freie Parameter besitzt, ist sie auch vollständig. Schreibt man in der Form θ n mit n1, so erhält man für eine Drehung um die Achse n mit Winkel θ die Matrix Rn (θ ) eθ n J
(12.45)
(Beweis in Aufgabe 12.6). Die Vertauschungsrelationen (12.43) stimmen bis auf den Faktor i h mit denen für die Komponenten des quantenmechanischen Drehimpulsoperators überein. Das ist kein Zufall, vielmehr kann die Gruppe S O(3) auch durch eine Gruppe unitärer Operatoren U dargestellt werden, welche die Komponenten L i des Drehimpulsoperators als Generatoren besitzt. Das soll im folgenden gezeigt werden. Wird ein quantenmechanisches System einer Drehung x x Rx unterworfen, so wird hierdurch eine Transformation ψ(x)ψ (x ) der Wellenfunktion induziert, für die ψ (Rx) ψ (x )
ψ(x)
s.u.
(12.46)
gilt, weil der jedem festen Raumpunkt zugeordnete Wert der Wellenfunktion unabhängig vom Koordinatensystem ist. Im folgenden wird gezeigt, daß ψ (x) aus ψ(x) durch eine unitäre Transformation ψ (x) U R ψ(x) (12.47) hervorgeht. Mit x R 1 x und x x gehen (12.46) und (12.47) in die äquivalenten Gleichungen ψ(R 1 x) ψ (x) U R ψ(x) (12.48)
412
12 Elemente der Gruppentheorie
über. Zunächst betrachten wir – jetzt in Vektornotation – die infinitesimale Drehung r¼
r
dr
mit
dr
d r,
deren Inverse r ¼ r d r ist. Hiermit ergibt sich aus (12.48a) ψ ¼ (r)
ψ(r d r) ψ(r) d r ψ(r) ψ(r) (d r)ψ(r) ψ(r) d (r )ψ(r)
oder ψ ¼ (r) ψ(r)
i i d Lψ(r) 1 d L ψ(r) h h
mit
L
hi r .
Der Vergleich mit (12.48b) liefert U R (d ) 1
i d L , h
wobei U R (d ) den der Drehung um d zugeordneten Operator U R darstellt. Speziell für eine Drehung um die x i -Achse ergibt sich daraus U R (dθi )1(i/h )dθi L i . Aus der Gruppeneigenschaft von Drehungen um dieselbe Achse folgt U R (θi
dθi ) U R (θi )U R (dθi ) U R (θi )(1
oder mit U R¼ (θ )dU R /dθ U R¼ (θi )dθi
U R (θi
i dθi L i ) h
i dθi ) U R (θi ) L i U R (θi )dθi . h
Die Integration der hieraus folgenden Gleichung U R¼ (θi )i (L i /h )U R (θi ) nach θi liefert mit U R (0)1 i U R (θi ) e h θi L i . Für die Drehung um eine beliebig orientierte Achse, die mit der x i -Achse identifiziert werden kann, folgt hieraus UR ( ) e
i h
L .
(12.49)
i Da eine Drehung durch die Drehung rückgängig gemacht wird, gilt U R 1 ( )e h L, außerdem gilt wegen L L i e hi L e hi L U R 1 ( ) . U R ( ) e h L
Damit ist gezeigt, daß U R ( ) ein unitärer Operator ist. Aus der Entwicklung UR ( ) 1
i h
L
...
folgt, daß die Komponenten des Drehimpulsoperators bis auf den Faktor i (der Faktor 1/h kann in die Definition der Gruppenparameter hineingezogen werden) die Generatoren der zur Gruppe S O(3) isomorphen Gruppe U R ( ) sind.
12.9 Lokale Äquivalenz der Gruppen SU (2) und S O(3)
12.9
413
Lokale Äquivalenz der Gruppen SU º2» und SO º3»
Die Gruppen SU (2) und S O(3) besitzen je drei freie Parameter. Außerdem stimmen die Vertauschungsrelationen (12.38) für die halben Erzeuger, Ji /2, der Gruppe SU (2) mit den Vertauschungsrelationen (12.43) für die Erzeuger Ji der Gruppe S O(3) überein. Dies deutet auf eine Verwandtschaft der beiden Gruppen hin, die jetzt näher untersucht werden soll. Zur Untersuchung dieser Verwandtschaft vergleichen wir bezüglich der Matrix 3 r
σx x
σ y y σz z
z x iy x iy z
4 (12.50)
die beiden Transformationen, die erhalten werden, enthaltenen Matrizen σx , σ y und σz gemeinsam einer unitären 1. wenn die in Transformation mit einer Matrix U der Gruppe SU (2) unterworfen werden, ¼ U U (diese Transformationen bilden eine zur Matrixgruppe SU (2) isomorphe Gruppe), 2. wenn der Ortsvektor r einer Drehung r R r unterworfen wird, wobei R eine Matrix der Matrixgruppe S O(3) ist. (Diese Transformationen sind isomorph zur Matrixgruppe S O(3).) Durch die unitäre Transformation U werden die Matrizen σx , σ y und σz „im Spinraum gedreht“. Dasselbe kann aber auch dadurch erreicht werden, daß die Pauli-Matrizen unverändert gelassen werden und der Vektor r in r gedreht wird, d. h. die Transformationen r ( r) r (U U ) r
r ( r) r (O r) (12.51)
und
bewirken dasselbe, es gilt
r (U U ) r U ( r)U
(O r)
r .
(12.52)
Beweis: Zum Beweis berechnen wir zuerst mit (12.13) und (12.50) die Komponenten der Matrix 3 H
U ( r)U
cos θ eiα iβ sin θ e
sin θ eiβ cos θ eiα
43
z x iy x iy z
43
cos θ eiα sin θ eiβ
sin θ eiβ cos θ eiα
zu H11
H12
2x sin θ cos θ cos(β α) 2y sin θ cos θ sin(β α) z (cos2 θ
sin2 θ) H22
x (cos2 θ cos 2α sin2 θ cos 2β) y (cos2 θ sin 2α sin2 θ sin 2β) 2 2 2z sin θ cos θ cos(α β) i x (cos θ sin 2α sin θ sin 2β) 2 2 y (cos θ cos 2α sin θ cos 2β) 2z sin θ cos θ sin(α β) H 21 .
4
414
12 Elemente der Gruppentheorie
Da r ¼ gleich der Matrix (12.50) mit x x ¼ etc. ist, wird (12.52) erfüllt, wenn z ¼ H11 und x ¼ i y ¼ H12 gilt (womit auch die übrigen Gleichungen erfüllt werden) oder
x (cos θ cos 2α sin θ cos 2β) y (cos θ sin 2α sin θ sin 2β) 2z sin θ cos θ cos(αβ) (12.53) y x (sin θ sin 2β cos θ sin 2α) y (cos θ cos 2α sin θ cos 2β) 2z sin θ cos θ sin(αβ) (12.54) z 2x sin θ cos θ cos(β α) 2y sin θ cos θ sin(β α) z (cos θ sin θ) . (12.55) Dies sind die Gleichungen für eine allgemeine Rotation des Vektors r. Für θ 0 erhalten wir aus ihnen x x cos 2α y sin 2α , y x sin 2α y cos 2α , z z , x¼
¼
2
2
2
2
2
2
2
2
¼
2
2
¼
¼
¼
also eine Rotation um die z-Achse mit dem Winkel 2α, die nach (12.45) durch die Matrix Rz e2 Jz α vermittelt wird. Die zugehörige Matrix U für die unitäre Transformation im Spinraum ist nach (12.13) mit θ 0 3 4 0 eiα U eiσz α , 0 e iα
U e
wobei sich das letzte Gleichheitszeichen aus der im Anhang, Abschn. 12.13, bewiesenen Beziehung (12.82) für n x n y 0, n z 1 und θ α ergibt. Damit erhalten wir die Zuordnung
R e . Setzen wir in (12.53)–(12.55) dagegen α β 0, so erhalten wir die Drehung x ¼ x cos 2θ z sin 2θ , y ¼ y , z ¼ x sin 2θ z cos 2θ i σz α
z
2 Jz α
(12.56)
mit Winkel 2θ um die y-Achse. Die zugehörige Transformation im Spinraum wird nach (12.13) durch die Matrix 4 3 cos θ sin θ (12.82) iσ y θ U e sin θ cos θ
vermittelt, und wir erhalten mit (12.45) die Zuordnung
U
e
i σy θ
Ry
e
2 Jy θ .
(12.57)
Für α 0 und β π/2 ergibt sich aus (12.53)–(12.55) schließlich die Rotation x¼
x,
y¼
y cos 2θ z sin 2θ , z¼ y sin 2θ z cos 2θ
mit Winkel 2θ um die x-Achse, die unitäre Matrix 3 4 cos θ i sin θ (12.82) iσx θ e U i sin θ cos θ
und die Zuordnung U
e
i σx θ
Rx
e
2 Jx θ .
(12.58)
12.10 Gruppe SU (3)
415
Die Zuordnungen (12.56)–(12.58) lassen sich in kompakter Form zu U
(12.80)
ei
E cos θ
i
n sin θ
R
e2 J
(12.59)
mit θ und n /θ zusammenfassen. Sie bedeuten, daß die Drehung x e2 J x im Ortsraum die „Drehung“ ψ ei ψ (12.60) der Spinoren im Spinraum induziert. (Nach den Regeln der Quantenmechanik ist die Transformation ψ U ψ der Spinoren mit einer Transformation M U MU der im Raum der Zweierspinoren wirkenden Matrixoperatoren verbunden.) Wir werden auf den Zusammenhang (12.59) als lokale Äquivalenz der Gruppen SU (2) und O(3) zurückverweisen, womit folgendes gemeint ist: Zu jeder „Drehung“ der Spinmatrizen im Spinraum (bzw. Transformationsmatrix der Matrixgruppe SU (2)) existiert eine Drehung des Ortsvektors im Ortsraum (Matrix der Gruppe O(3)), welche die gleiche Transformation von r bewirkt, und umgekehrt. Dabei handelt es sich allerdings um keinen Isomorphismus, wegen des Unterschieds im Drehwinkel besteht ein globaler Unterschied der beiden Gruppen: Dreht man z. B. in (12.58) den Winkel θ um π, so gilt U U , aber R x Rx , d. h. in (12.58) z. B. gilt U (θ π)U (θ ), aber J (θ π) J (θ ). Das hat insbesondere zur Folge, daß zwischen den Einheitsmatrizen der Gruppen SU (2) und S O(3) die Zuordnung E
SU (2)
und
E
SU (2)
E
S O(3)
besteht.
12.10 Gruppe SU º3» Die Gruppe SU (3) besitzt nach Tab. 12.2 insgesamt 32 18 freie Parameter und dementsprechend 8 Generatoren. Diese müssen nach (12.23) und (12.25) schiefhermitesch und spurfrei sein. Sie können im Prinzip wie bei der Gruppe SU (2) berechnet werden, was hier jedoch nicht durchgeführt werden soll. Schreibt man sie in der Form Ji i λi , so findet man für λi die Gell-Mann-Matrizen ⎞ ⎞ ⎛ ⎛ ⎛ ⎞ 0 1 0 0 i 0 1 0 0 ⎟ ⎟ ⎜ ⎜ ⎜ ⎟ λ1 ⎝ 1 0 0 ⎠ , λ2 ⎝ i 0 0 ⎠ , λ3 ⎝ 0 1 0 ⎠ , 0 0 0 0 0 0 0 0 0 ⎞ ⎞ ⎞ ⎛ ⎛ ⎛ 0 0 1 0 0 i 0 0 0 ⎟ ⎟ ⎟ ⎜ ⎜ ⎜ λ4 ⎝ 0 0 0 ⎠ , λ5 ⎝ 0 0 0 ⎠ , λ6 ⎝ 0 0 1 ⎠ , 1 0 0 0 1 0 i 0 0 ⎛ ⎞ ⎞ ⎛ 1 0 0 0 0 0 1 ⎜ ⎟ ⎟ ⎜ (12.61) λ7 ⎝ 0 0 i ⎠ , λ8 ⎝ 0 1 0⎠. 3 0 0 2 0 i 0
416
12 Elemente der Gruppentheorie
Man verifiziert leicht, daß diese voneinander unabhängig, schiefhermitesch und spurfrei sind. Die Vertauschungsrelationen (12.29) schreiben wir hier in der Form λi , λ j 2i
8
fi j k λk .
(12.62)
k 1
Man findet, daß die meisten der 83 512 Strukturkonstanten gleich null sind, mit Ausnahme von f123
1,
f147
f 246
f 257
f345
f 516
1 , 2
f 637
f458
f 678
3 2
und den aus diesen mit den Antisymmetrierelationen fi j k
f j ki fki j fikj fkj i f j ik
hervorgehenden Konstanten. Die Elemente der Gruppe SU º3» sind durch U
exp(i 81 λk ϕk )
gegeben, wobei ϕk die Gruppenparameter sind. Ersichtlich gilt 4 4 3 3 σ1 0 σ2 0 , λ2 , λ1 0 0 0 0
(12.63)
λ3
3
σ3 0 0 0
4 ,
d. h. SU (2) ist eine Untergruppe von SU (3) (siehe Abschn. 12.11 und Aufgabe 12.7). Die beiden Diagonalmatrizen λ3 und λ8 sind miteinander vertauschbar und haben den Satz gemeinsamer Eigenvektoren ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 1 0 0 ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ r ⎝0⎠ , g ⎝1⎠ , b ⎝0⎠ . (12.64) 0 0 1
12.11 Höherdimensionale Darstellungen der Gruppe SU º2» Die Erzeuger der Gruppe SU (2) sind im wesentlichen die Pauli-Matrizen σi . Nach den Ausführungen am Ende von Abschn. 12.6 bilden die Matrizen U
ei
L
(12.65)
eine höherdimensionale Darstellung der Gruppe, wenn L i höherdimensionale Matrizen sind, welche die gleichen Vertauschungsrelationen wie die σi erfüllen.
12.11 Höherdimensionale Darstellungen der Gruppe SU (2)
417
Die Komponenten des quantenmechanischen Drehimpulsoperators L erfüllen die Vertauschungsrelationen
L i , L j
i h L k
für i, j, k
i h r
zyklische Permut. von 1, 2, 3 .
(12.66)
Hieraus folgt in einer mit Basiszuständen m gebildeten Matrixdarstellung der Quantenmechanik
m L i , L j n
i h m L k n
für i, j, k
zyklische Permut. von 1, 2, 3 .
Schiebt man zwischen die Produkte L i L j den Einheitsoperator 1
k k , so erhält man daraus m L i k k L j n m L j k k L i n i h m L k n , (12.67) k
k
d. h. auch die Matrizen L i mit Komponenten L i,mn m L i n erfüllen die Vertauschungsrelationen (12.66). In einer Ortsdarstellung erhalten wir derartige Matrizen z. B., indem wir das vollständige System Ylm (ϕ, ϑ) gemeinsamer Eigenfunktionen der Operatoren L 2 und L z zugrundelegen. Für dieses gilt L 2 Ylm
h 2 l(l 1)Ylm ,
L z Ylm
h mYlm ,
wobei die Werte l 0, 1, 2, . . . und m l, l 1, . . . , l 1, l für festes l möglich sind. Auf diese Weise erhalten wir für festes l die Matrizen L i Yln dΩ mit dΩ sin2 ϑ dϑdϕ . (12.68) Ylm L i,mn Im Fall l 1 kann m ⎛
Lx h
0 1 ⎜ ⎝1 2 0
1 0 1
1, 0, 1 sein, und mit (Q4.94b) erhält man die 33-Matrizen ⎞ 0 ⎟ 1⎠, 0
⎛
Ly h
0 1 ⎜ ⎝i 2 0
i 0 i
⎞ 0 i ⎟ ⎠, 0
⎛ Lz h
1 ⎜ ⎝0 0
0 0 0
⎞ 0 ⎟ 0 ⎠. 1
Der Vergleich der durch h 2 geteilten Gleichung (12.67) mit der durch vier geteilten Gleichung (12.37) zeigt, daß die Matrizen L i /h den gleichen Vertauschungsrelationen wie die Matrizen σi /2 genügen. Dies bedeutet, daß (12.65) mit den Matrizen L i eine dreidimensionale Darstellung der Gruppe SU (2) bildet. Offensichtlich gilt Lx h
1 2
(λ1 λ6 ) ,
Ly h
1 2
(λ2 λ7 ) ,
Lz h
1 3 λ3 λ8 , 2 2
d. h. die L i lassen sich durch Elemente der Gruppe SU (3) darstellen und bilden daher eine Untergruppe von dieser.
418
12 Elemente der Gruppentheorie
12.12 Gruppen und Symmetrien Transformationen bilden häufig Gruppen. Umgekehrt ist die zu einer Gruppe gehörige Gruppenwirkung als Transformation auf einer Menge M definiert. In der Physik gibt es (aktive und passive) Transformationen, durch die der Ausgang eines Experiments nicht verändert wird. Dies gilt z. B. für Lorentz-Transformationen, unter denen auch Translationen und Rotationen enthalten sind. Bei derartigen Transformationen geht der quantenmechanische Zustand ψ in einen neuen Zustand über, ψ ψ ¼ U ψ .
(12.69)
Durch den Übergang werden die Wahrscheinlichkeiten von Meßergebnissen nicht verändert, mit U U 1 gilt z. B. ψ ψ U ψ U ψ
ψ U U ψ ψ ψ
oder
L ψ L ψ U ψ U LU
U ψ ψ U U LU U ψ ψ L ψ
L .
Die Symmetrie besteht hier in der Invarianz der Skalarprodukte ψ ψ bzw. der Mittelwerte L gegenüber den unitären Transformationen (12.69). Eine allgemeine Definition der mit einer Gruppe verbundenen Symmetrie liefert die folgende Definition einer Symmetriegruppe. Definition. Eine Gruppe G mit Gruppenelementen g wirke auf die Menge M mit den Elementen m. Die Untergruppe U g G ga a heißt Fixpunktgruppe oder Symmetriegruppe zum Element a. Die mit den Elementen g der Untergruppe gebildeten Produktelemente ga G haben alle die gleiche Wirkung auf die Menge M wie das – nicht notwendig zur Untergruppe gehörige – Element a der Gruppe. Etwas anders läßt sich der Sachverhalt auch so ausdrücken: Eine Symmetriegruppe ist eine Untergruppe, deren Elemente alle die gleiche Wirkung auf die Menge M haben. Das oben angeführte physikalische Beispiel ist in dieser Definition mit enthalten: Die unitären Transformationen bilden eine Gruppe. Ihre Wirkung auf die Menge der Skalarprodukte ψ ψ bzw. Mittelwerte L besteht in der Abbildung ψ ψ ψ ψ bzw. L L . Da diese Größen bei allen unitären Transformationen invariant sind, bildet die ganze Gruppe eine Symmetriegruppe.
12.13 Anhang: Ergebnisse aus der Matrizentheorie 12.13.1 Invarianten äquivalenter Matrizen Zwei n n-Matrizen M und M werden als äquivalent bezeichnet, wenn sie durch eine Ähnlichkeitstransformation der Form M
T 1 M T
M
T M T 1
(12.70)
12.13 Anhang: Ergebnisse aus der Matrizentheorie
419
mit einer festen, regulären n n-Matrix T ineinander überführt werden können. Bei der Transformation M M ¼ bzw. M ¼ M gibt es unter anderen die folgenden Invarianten. det M ,
Sp M ,
Eigenwerte λi ,
wobei die Eigenwerte aus der Gleichung det(M λE)0 folgen. Eine Matrix M läßt sich mit einer geeignet gewählten Transformationsmatrix T in Diagonalform überführen, wenn sie • •
entweder lauter verschiedene Eigenwerte besitzt oder aber normal (M M M M), hermitesch (M symmetrisch (Mik Mki ) ist.
M), unitär (M M 1 ) oder
Die Spur einer Matrix ist gleich der Summe ihrer Eigenwerte,
Sp M
n i 1
Mii
n i 1
λi ,
(12.71)
und ihre Determinante ist gleich deren Produkt, det M
n + i 1
λi .
(12.72)
12.13.2 Determinante der Matrix e J Besitzt die n n-Matrix J die Eigenwerte λi zu den Eigenvektoren x i (i 1, . . . , n), so sind die letzteren auch Eigenvektoren der Matrix MN zu den Eigenwerten
E J 21 J 2 . . . N1 J N
1 λi
denn aus J x i λi x i folgt MN xi
21 λ2i . . . N1 λiN ,
E xi J xi 21 J J xi . . . N1 J (N 1) J xi xi λi xi λ2i J xi . . . Nλi J (N 2) J xi ... (1 λi 21 λ2i . . . N1 λiN ) xi .
Im Limes N folgt aus der letzten Beziehung mit der Definition (12.19b), daß exp(λi ), i 1, . . . , n, die Eigenwerte der Matrix exp(J ) sind. Hiermit folgt aus (12.72) det e
J
n + i 1
e
λi
exp
n i 1
λi .
420
12 Elemente der Gruppentheorie
Mit (12.71) ergibt sich daraus eSp J .
det e J
(12.73)
12.13.3 Determinante unitärer Matrizen Da unitäre Matrizen U durch Ähnlichkeitstransformationen (12.70) in Diagonalgestalt überführt werden können und ihre Determinante dabei invariant ist, kann die letztere aus der Diagonalform berechnet werden. U hat dann die Elemente Uii δik , U die Elemente Uii δik , und aus U U E folgt k Uii δik Ukk δkl Uii Ull δil δil oder Uii Uii Uii 2 1, d.h. die Diagonalelemente haben die Form Uii
ei δi .
Hieraus folgt det U
n +
i δi
e
n exp i δi e i
i 1
mit
i 1
n
δi .
(12.74)
i 1
Die Determinante unitärer Matrizen ist also eine komplexe Zahl vom Betrag eins. Ist c irgendeine komplexe Zahl, so hat die n n-Matrix cM die Elemente cMik und die Determinante det(cM) cn det M . Hieraus folgt det(cM) 1
für
c (det M)1/n ,
(12.75)
und daher kann M in M
c 1 P
(det M)1/n P
mit
det P
1
zerlegt werden. Im Fall unitärer Matrizen bedeutet das mit (12.74) und P U , daß die Zerlegung U ei /n U mit det U 1 (12.76) möglich ist, wobei U wegen UU U U 1 wie U unitär ist.
12.13.4 Eigenschaften der Pauli-Matrizen Durch einfaches Nachrechnen findet man, daß die in (12.35) definierten Pauli-Matrizen die Vertauschungsrelationen5 σi , σ j 2 i εi j k σk
(12.77)
5 εi j k ist der ε-Tensor, definiert durch ⎧ ⎪ ⎨ 1 für i, j, k εi j k 1 für i, j, k ⎪ ⎩ 0 sonst .
gerade Permutation von ungerade Permutation von
1, 2, 3 1, 2, 3
Aufgaben
421
und σi , σ j
σi σ j
σ j σi
2Eδi j
(12.78)
erfüllen. Gleichung (12.78) beinhaltet insbesondere σx2 σ y2 σz2 E. Ist n ein beliebig gerichteter Einheitsvektor, so folgt damit ( n)2
(σx n x
(n 2x
n 2y
σy n y
σz n z )2
n 2z )E
σx2 n 2x
σ y2 n 2y
σz2 n 2z n x n y σx , σ y
...
E.
Hieraus ergibt sich * ( n)
α
für α für α
E n
gerade ungerade
(12.79)
und damit i ( ¡n)θ
e
E
1
θ2 2
θ4 4
...
i ( n)
θ
θ3 3
θ5 5
...
oder ei (
n)θ
¡
E cos θ
Mit
i ( n) sin θ . 3
n
σx n x
ergibt sich daraus
3 i ( ¡n) θ
e
σy n y
σz n z
cos θ i n z sin θ (i n x n y ) sin θ
nz nx
nx
i ny
(12.80)
i ny n z
(i n x n y ) sin θ cos θ i n z sin θ
4 (12.81)
4 .
(12.82)
Aufgaben 12.1
Zeigen Sie: Aus der Existenz eines rechtsinversen Gruppenelements folgt die eines linksinversen und umgekehrt.
12.2
Zeigen Sie, daß aus den Gruppeneigenschaften von G 1 und G 2 sowie der Definition (g1 , g2 )(g1¼ , g2¼ )(g1 g1¼ , g2 g2¼ ) für die Verknüpfung der Gruppenelemente (g1 , g2 ) von G 1 G 2 folgt, daß G 1 G 2 eine Gruppe ist. Anleitung: Zu zeigen ist, daß G 1 G 2 alle vier Gruppenaxiome erfüllt.
12.3
Beweisen Sie: 1. Aus zwei Darstellungen M 1 (g) und M 2 (g) einer Gruppe G mit den Elementen g, die gleich oder äquivalent, jedoch auch verschieden sein
422
12 Elemente der Gruppentheorie
und verschiedene Dimensionen besitzen dürfen, und aus Null-Matrizen 0 läßt sich durch 3 4 0 M 1 (g) M(g) für alle g G 0 M 2 (g) immer eine neue Darstellung höherer Dimension konstruieren. 2. Bei einer durch 3 4 M 1 (g) X (g) M(g) 0 M 2 (g) dargestellten Gruppe sind auch Gruppe.
M 1 (g)
und
M 2 (g)
Darstellungen der
12.4
Unter welcher Bedingung bilden hermitesche Matrizen eine Gruppe ?
12.5
Sind A und B Untergruppen der Gruppe G, so ist auch die Schnittmenge A B eine Untergruppe von dieser. Beweisen Sie diese Aussage.
12.6
Zeigen Sie, daß x ¼ Rx mit R eθ n J eine Drehung um die Achse n mit Drehwinkel θ darstellt, wenn J J1 , J2 , J3 die Erzeuger der Gruppe S O(3) sind. Anleitung: Der einfachste Beweis besteht darin, daß man z. B. die x-Achse in Richtung von n legt, wodurch R in Rx übergeht. Dieser Weg soll hier jedoch nicht beschritten werden, sondern der folgende: 1. Zeigen Sie, daß R für differentielle d n dθ die Drehung d r d r bewirkt. 2. Zeigen Sie, daß Drehungen um eine feste Achse eine Abelsche Untergruppe der Drehgruppe darstellen. 3. Gehen Sie von infinitesimalen zu endlichen Drehungen über.
12.7
Zeigen Sie, daß die Gruppe SU (2) eine Untergruppe der Gruppe SU (3) ist. Anleitung: Untersuchen Sie dazu die Lie-Algebra der Erzeuger λ1 , λ2 und λ3 .
12.8
Zeigen Sie, daß das Produkt zweier Matrizen der Form ei (
n)θ
E
cos θ
i ( n) sin θ
wieder eine Matrix dieser Form ergibt. 12.9
Welches ist die Bedingung dafür, daß die einparametrigen Abbildungen x f (x, a) eines Raumes auf sich selbst eine Lie-Gruppe bilden?
Lösungen 12.4
Mit U
U und V
V muß auch U V zur Gruppe gehören, d. h. es muß (U V )
V U
VU
UV
gelten. Notwendige und hinreichende Bedingung ist also die Vertauschbarkeit sämtlicher Matrizen der Gruppe.
13
Gruppierung von Teilchenzuständen
In der Elementarteilchenphysik werden voneinander verschiedene Teilchen, die dafür geeignet sind, zu Teilchengruppen zusammengefaßt und als verschiedene Zustände ein und desselben Teilchens aufgefaßt. Die Teilchenzustände werden durch spinorartige Zustandsvektoren beschrieben, die soviele Komponenten besitzen, wie Teilchen zur jeweiligen Teilchengruppe gehören. Auf diese Zustandsvektoren werden die üblichen Regeln der Quantenmechanik angewandt. Aufgrund des Superpositionsprinzips werden dabei Überlagerungszustände möglich, von denen man nicht mehr sagen kann, daß sie ein bestimmtes Elementarteilchen beschreiben. Außerdem können reine Teilchenzustände, die unterschiedliche Teilchen beschreiben, ineinander durch unitäre Transformationen überführt werden. Physikalisch bedeutet dies, daß jedes Teilchen der Gruppe in ein anderes Teilchen der Gruppe umgewandelt werden kann. Da die unitären Transformationen eine Gruppe bilden, kann man sagen, daß die Teilchen durch diese miteinander verknüpft werden, oder auch, daß zwischen ihnen eine durch die Gruppe beschriebene Verwandtschaft besteht. (Gemeint ist damit, daß sie gemischte Zustände bilden und ineinander umgewandelt werden können.) Im Raum der Zustandsvektoren für die Teilchenzustände lassen sich neue Operatoren definieren. Deren Mittel- und Eigenwerte bilden Transformationsinvarianten, so daß mit der Gruppenverknüpfung von Teilchen auch Gruppensymmetrien im Sinne der im letzten Abschnitt gegebenen Definition verbunden sind. Solange die Ruhemasse der Teilchen nicht als Zustandsvariable eingeführt wird, die mit den Methoden der Quantenmechanik bestimmt werden kann, ist sie ein vorgegebener Parameter. Bei gleicher Zustandsenergie sollte dieser bei Teilchen, die als unterschiedliche Zustände ein und desselben Teilchens aufgefaßt werden können, übereinstimmen. Gleiche (oder beinahe gleiche – siehe unten) Ruhemasse voneinander verschiedener Teilchen liefert daher einen möglichen Gesichtspunkt, unter dem diese zu einer Teilchengruppe zusammengefaßt werden können. Die Ruhemasse bildet dann bei Transformationen eine Invariante und entspricht einer Teilchensymmetrie. In einigen Fällen erweist sich diese Symmetrie bzw. die dazugehörige Gruppenverwandtschaft der Teilchen als nicht perfekt, d. h. die zu einer Gruppe zusammengefaßten Teilchen haben nicht exakt die gleiche Ruhemasse. Dennoch erweist sich die Zusammenfassung der Teilchen auch in diesen Fällen meist bezüglich vieler anderer Aspekte als nützlich. Damit verbindet man die Vorstellung, daß eine Symmetrie zugrunde liegt, die gebrochen werden kann. Eine andere Erklärungsmöglichkeit besteht darin, daß die Beschreibung der Teilchen durch ihre Zugehörigkeit zu einer Gruppe nicht vollständig ist. In diesem Kapitel wird das geschilderte Konzept der Teilchengruppierung an einigen Beispielen demonstriert. Dabei betrachten wir zunächst zusammengesetzte Teilchen, die eine Gruppenverwandtschaft aufweisen, und leiten aus dieser Konsequenzen ab. Unser erstes Ziel ist es, die Teilchenverwandtschaft zwischen Proton und Neutron zu untersuchen und dabei das Konzept einer neuen quantenmechanischen Observablen,
424
13 Gruppierung von Teilchenzuständen
des Isospins, kennen zu lernen. Dieses übertragen wir sodann auf die Teilchen des in Kapitel 11 eingeführten Baryonen-Dekupletts. Dessen Struktur läßt sich allerdings viel besser verstehen, wenn das Konzept des Isospins auf einige der Quarks, aus denen seine Teilchen zusammengesetzt sind, angewandt wird. Damit gelangen wir schließlich zum Konzept einer paarweisen Verwandtschaft von Quarks, die sich für alles weitere als äußerst fruchtbar erweisen wird. Da der zur Beschreibung des Isospins benutzte Formalismus praktisch identisch ist mit dem zur Beschreibung des Spins 1/2, werden im ersten Abschnitt dieses Kapitels zunächst die hierfür wesentlichen Gesichtspunkte über den Spin aus Kapitel Q7 der Quantenmechanik zusammengefaßt. Dabei wird hier als neuer Gesichtspunkt eine besondere Betonung auf den Zusammenhang mit den Eigenschaften der Gruppe SU (2) gelegt.
13.1
Spin 1 2 und Gruppe SU 2
Im Teil Relativistische Quantenmechanik, Kapitel 2, ergab sich der Spin des Elektrons aus einer relativistischen Theorie, in der Elektronenzustände durch Viererspinoren dargestellt werden. Im nicht-relativistische Grenzfall zerfiel jeder Vierer- in zwei Zweierspinoren, von denen einer Lösungen positiver und der andere Lösungen negativer Energie zugeordnet werden konnte. Spinbehaftete Teilchen besitzen daher zwei Freiheitsgrade. Dasselbe ergab sich dort auch für Neutrinos der Ruhemasse null. Weil sich diese unter der Annahme verschwindender Ruhemasse mit Lichtgeschwindigkeit ausbreiten, existiert für sie zwar kein nicht-relativistischer Grenzfall. Dafür konnte der sie beschreibende Viererspinor jedoch in zwei Zweierspinoren mit je zwei Freiheitsgraden zerlegt werden, die Neutrinos positiver bzw. negativer Helizität beschreiben. Die wesentlichen Eigenschaften des Spins können daher der nicht-relativistischen PauliTheorie des Spins entnommen werden, die zwei Freiheitsgrade berücksichtigt und im Kapitel Q7 der Quantenmechanik behandelt wurde. Alle Elementarteilchen, die nicht Quanten eines der vier die Wechselwirkungen vermittelnden Felder sind, also Leptonen und Quarks, sind Fermionen mit Spin 1/2. In einer Ortsdarstellung werden alle derartigen Teilchen nicht-relativistisch durch Zweierspinoren ψ1 (r, t) ψ(r, t) (13.1) ψ2 (r, t) beschrieben, der Spin selbst durch den vektoriellen Matrixoperator S
h . 2
(13.2)
Die Komponenten von S bzw. sind 22 Matrizen. Die nicht-relativistische Bewegungsgleichung für Spinoren ist die Pauli-Gleichung ih∂t ψ
H0 ψ
gs
qh B ψ . 2m
(13.3)
13.1 Spin 1/2 und Gruppe SU (2)
425
In dieser ist H0 der Hamilton-Operator des Systems ohne Magnetfeld B. In der Ortsdarstellung ist er eine unitäre 2 2 Matrix mit vier hermiteschen Operatoren als Elementen. Der vektorielle Operator besitzt zwar Komponenten, die von dem gewählten Koordinatensystem abhängen, ist aber als Ganzes koordinatenunabhängig. Wir untersuchen im folgenden die Veränderungen, die bei einer Drehung des Koordinatensystems auftreten. Durch diese wird das Magnetfeld B in B ¼ O B überführt, der Spinor ψ in ψ ¼ Mψ , (13.4) wobei zunächst offen gelassen wurde, welcher Art die Transformationsmatrix M sein soll. Die Wahrscheinlichkeitsdichte dafür, das Teilchen zur Zeit t am Ort r anzutreffen, ist ψ ψ. Es ist zu verlangen, daß diese von der Orientierung des gewählten Koordinatensystems unabhängig ist, d. h. für alle ψ muß
(Mψ) Mψ ψ M Mψ ψ ψ (13.5) M E, die Matrix M in der Transformationsgleichung (13.4)
ψ ψ
gelten. Hieraus folgt M für Spinoren muß also unitär sein. Nach (12.16) kann sie in der Form ψ
ei/2U ψ
(13.6)
geschrieben werden, wobei die Matrix U unitär ist und det U 1 erfüllt, also zur Gruppe SU (2) gehört. Da der Phasenfaktor exp(i/2) bei der Berechnung von Wahrscheinlichkeiten und Mittelwerten – die letzteren werden mit ψ ψ gebildet – herausfällt, spielt er für die Physik keine Rolle. Die Spinortransformation (13.6) kann daher auf Matrizen der Gruppe SU (2) eingeschränkt werden, für die er gleich eins ist. Weiterhin muß verlangt werden, daß sich bei Koordinatentransformationen der Erwartungswert des Hamilton-Operators nicht ändert, d. h. für alle Zustände ψ muß
ψ H ψ U ψ H U ψ ψ U gelten, woraus
U H U
H
bzw.
H U ψ ψ H ψ
H
U HU
folgt. Im Sytem S muß statt (13.3) die Gleichung ih ∂t ψ
q h B H0 ψ gs 2m
ψ
gelten, und es ist zu verlangen, daß diese aus (13.3) durch die Transformationen ψ ψ und B B hervorgeht. (Aufgrund der in Anschluß an (13.3) gemachten Bemerkung gilt dabei .) Diese Forderung wird mit (13.6) für 0 tatsächlich erfüllt, denn unter Benutzung von U U E und des Ergebnisses (12.52) (lokale Äquivalenz der Gruppen S O(3) und SU (2)) ergibt sich aus der letzten Gleichung U ih ∂t ψ
q h (O B) gs 2m q h U H0 ψ g s B ψ .
U H0 U
Uψ
2m
Uψ
s.u.
U H0 ψ
q h B U gs 2m
U Uψ
426
13 Gruppierung von Teilchenzuständen
(Statt (12.52) wurde hier B ¼ B ¼ benutzt, was genauso bewiesen wird, weil sich B wie r transformiert.) Hieraus folgt unmittelbar, daß die Gültigkeit der Pauli-Gleichung in S auch deren Gültigkeit in S ¼ impliziert, und umgekehrt. Der Hilbert-Raum der Zweierspinoren (13.1) kann lokal (d. h. bei festem r und t) durch die gemeinsamen Eigenvektoren 1 0 , ψ (13.7) ψ 0 1 der Operatoren σz und
2
aufgespannt werden. (Es gilt σz ψ
(12.78) (σx2 σ y2 σz2 )ψ 3ψ .)
2ψ
Beliebige Spinoren erhält man aus diesen durch
Superposition,
ψ
ψ1 (r, t)ψ
Aus S2 ψ
(13.2)
ψ , σz ψ ψ und
ψ2 (r, t)ψ h 2 4
2
ψ
ψ1 (r, t) ψ2 (r, t)
3h 2 ψ 4
.
(13.8)
(13.9)
ergibt sich unter Anwendung der Formel L 2 ψ h 2l(l 1)ψ für den quantenmechanischen Drehimpuls mit l s der Gesamtspin s 1/2, d. h. S 2 ψ h 2 s(s 1)ψ mit s 1/2. In Diracscher Ket-Notation schreiben wir für die Basiszustände (13.7) '1 1 '1 1 ψ ' , ψ ' , (13.10) 2 2 , 2 2 , wobei die erste Zahl den Gesamtspin s und die zweite die z-Komponente des Spins in Einheiten h angibt. Ein allgemeiner Zustand entsteht aus diesen durch die Superposition ' ' ψ(r, t) ψ1 (r, t) ' 12 , 12 ψ2 (r, t)β ' 12 , 12 . (13.11) Zusammengesetzte Teilchen. Kombiniert man zwei Teilchen mit Spin 1/2, so kann das aus diesen zusammengesetzte System nach den quantenmechanischen Additionsregeln für den Drehimpuls (siehe Quantenmechanik, Abschn. Q7.5) den Gesamtspin 1 oder 0 haben. Für Spin 1 gibt es die drei symmetrischen Zustände '1 1 '1 1 '1 ' 1 '1 1 ' 1 , 1 ' , 1 , 1 ' , 2 2 2,2 , 2 2 2 , 2 , ' (13.12) ' ' ' 1 '1 , 1 '1 , 1 '1 , 1 '1 , 1 , 1 , 0 2 2 2 2 2 2 2 2 2
' ' in denen ' 12 , 12 ' 12 , 12 etc. direkte Produkte (siehe Quantenmechanik, Abschn. Q7.2.1) sind und die erste Ziffer von α, β den Gesamtspin, die zweite den Wert der z-Komponente des Spins angibt. Für Spin 0 gibt es den einen antisymmetrischen Zustand ' ' ' ' 1 '1 , 1 '1 , 1 '1 , 1 '1 , 1 . (13.13) 0 , 0 2 2 2 2 2 2 2 2 2
Werden mehr als zwei Spin-1/2-Teilchen zusammengesetzt, so kann der Gesamtspin die Werte 0, 1/2, 1, 3/2, . . . annehmen, seine z-Komponente bei gegebenem Gesamtspin s die 2s 1 Werte s, s 1, . . . , s 1, s.
13.2 Isospin
13.2
427
Isospin
Die Ruhemasse des Protons beträgt 938,3 MeV/c2 , die des Neutrons 939,6 MeV/c2 , d. h. beide Teilchen sind beinahe gleich schwer, ihr Massenunterschied beträgt nur etwa 0,1 Prozent. Außerdem haben beide Teilchen den Spin 1/2, ihr wesentlicher Unterschied besteht nur in der unterschiedlichen elektrischen Ladung. Dies führte schon im Jahre 1932 Heisenberg zu dem Vorschlag, beide Teilchen als zwei verschiedene Zustände eines einzigen, als Nukleon bezeichneten Teilchens aufzufassen. Zur theoretischen Umsetzung dieses Konzepts beschreiben wir die Zustände dieses hypothetischen Teilchens in Anlehnung an die Beschreibung (13.8) von Spinzuständen durch zweizeilige Spaltenvektoren p , (13.14) ψ n die wir aus unten ersichtlich werdenden Gründen als Isospinoren bezeichnen. (Dabei sind p und n komplexe Zahlen, die für Proton bzw. Neutron stehen und von r und t abhängen können.) Als (lokale) Basis eines Isospin-Raums wählen wir in Analogie zu (13.7) die Zustände 1 0 ψp , ψn , (13.15) 0 1 so daß p 1 0 p n pψ p nψn (13.16) ψ n 0 1 gilt. ψ p soll den reinen Protonzustand und ψn den reinen Neutronzustand darstellen. (Daß die Eins beim Proton oben und beim Neutron unten steht, ist eine willkürliche Festlegung.) Zu jedem Zustand ψ wird wie bei den Zweierspinoren ein adjungierter Zustand ψ (p , n ) (13.17) definiert, das (lokale) Skalarprodukt von zwei Zuständen ψ1 und ψ2 ist ψ1 ψ2
( p1 p2
n1 n2) ,
(13.18)
die Zustände ψ p und ψn sind mit diesem auf 1 normiert. (Die räumliche Normierung von ortsabhängigen Zuständen (13.16) muß über die Koeffizientenfunktionen p und n vorgenommen werden.) Mit dieser Definition ergibt sich, daß2 die Zustände ψ p und 3 ψn orthogonal zueinander gewählt sind, es gilt ψ p ψn 0 und IR3 ψ p ψn d x 0. Wie üblich ist ψ ψ die Wahrscheinlichkeitsdichte dafür, das Teilchen zur Zeit t am Ort r anzutreffen. Wie bei den Spinzuständen nehmen wir nun an, daß man aus einem Zustand ψ durch die Transformation ψ ψ U ψ (13.19) mit einer unitären 22 Matrix U der Gruppe SU (2) wieder einen möglichen Zustand des Systems erhält. Nach der Einleitung zu diesem Kapitel und nach Abschn. 12.12
428
13 Gruppierung von Teilchenzuständen
impliziert diese Annahme, daß bei diesen Transformationen eine Reihe von Symmetrien bestehen. Aus (13.19) folgt mit (12.39) und (12.82) 3 4 ¼ i n sin θ ) n (i n n ) sin θ p (cos θ p p z x y ei ( n) θ . (13.20) n n¼ p (i n x n y ) sin θ n (cos θ i n z sin θ ) Man überzeugt sich leicht davon, daß z. B. eiπσ2 /2 die Transformation vermittelt, durch die ein Proton in ein Neutron überführt wird (Aufgabe 13.2). Der durch die Basiszustände (13.15) aufgespannte Hilbert-Raum wird als Isospinraum bezeichnet, bei Transformationen (13.19) in diesem Raum werden wir von Drehungen im Isospinraum sprechen. In Analogie zu den Spinmatrizen können auch hier Matrizen eingeführt werden, die eine dem Spin entsprechende Größe definieren. Man wählt dafür I1
12 σx ,
I2
12 σy ,
I3
12 σz
bzw.
I
12
(13.21)
und bezeichnet sie als starken Isospin. (Man beachte, daß der Isospin wegen des Fehlens des Faktors h dimensionslos ist.) Das Wort stammt von der Bezeichnung „isotopischer Spin“, die allerdings unzutreffend ist, da Isotope unterschiedlich viele Nukleonen besitzen. Besser ist die in der Kernphysik gebräuchliche Bezeichnung isobarer Spin. Der Zusatz „stark“ rührt daher, daß der starke Isospin eine Invariante der starken Wechselwirkung ist (siehe unten). Durch die Ziffernindizes 1, 2 und 3 für die Komponenten von I soll angedeutet werden, daß der Isospin eine innere Teilcheneigenschaft beschreibt, die nichts mit einer Orientierung des Teilchens gegenüber dem IR3 zu tun hat, wie das beim Spin der Fall ist. Aus (12.35), (13.15) und (13.21) folgt p 3 p I3 ψn 12 ψn , I2 I3 ψ p 12 ψ p , (13.22) 4 n . n Entsprechend den durch (13.9) beschriebenen Verhältnissen beim Spin haben beide Nukleonen den Gesamtisospin I 1/2, das Proton I3 1/2 und das Neutron I3 1/2. Die für I3 erhaltenen Werte ergeben sich aus der willkürlichen Wahl (13.15) der Basiszustände, bei vertauschten Basiszuständen würden auch die Werte von I3 ausgetauscht. Die durch (13.15) getroffene übliche Festlegung hat die Eigenschaft, daß das Teilchen höherer elektrischer Ladung (Proton) auch die höhere Isospinkomponente I3 besitzt. Allgemein besteht für den Isospin die Ladungskonvention, daß der höchste Eigenwert von I3 stets dem Teilchen mit der höchsten Ladung zugewiesen wird. In der Diracschen Ket-Notation erhalten wir für die Basiszustände (13.15) nach (13.22) in Analogie zu (13.10) mit ψ p p und ψn n ' ' p ' 12 , 12 , n ' 12 , 12 . (13.23) In Atomkernen werden Protonen und Neutronen durch Kräfte der starken Wechselwirkung gebunden. Diese Kräfte wirken zwischen Protonen und Protonen, Neutronen und Neutronen sowie zwischen Protonen und Neutronen. Es wird nun gefordert, daß diese Kräfte gegenüber Drehungen im Isospinraum invariant sind. Durch diese Forderung erhält der Isospin eine über die Möglichkeit zur Klassifizierung hinausgehende
13.2 Isospin
429
physikalische Bedeutung: Da die Eigenwerte von I 2 gegenüber Drehungen im Isospinraum invariant sind, muß der Gesamtisospin I bei Prozessen der starken Wechselwirkung eine Erhaltungsgröße sein. Da unter den Drehungen im Isospinraum der Spezialfall enthalten ist, daß Protonen in Neutronen und Neutronen in Protonen überführt werden, sollte die Kraft der starken Wechselwirkung auf Neutronen und Protonen gleich stark sein. Das setzt allerdings voraus, daß die zugrundeliegende SU (2)-Symmetrie (Invarianz der Kräfte gegenüber Drehungen im Isospinraum) perfekt ist, was nicht ganz der Fall ist: Eine Brechung dieser Symmetrie ist möglich, wenn auch unwahrscheinlich. Infolgedessen ist die Kraft der starken Wechselwirkung auf Protonen und Neutronen nur im wesentlichen gleich. (Das Phänomen, daß Größen, die beim Bestehen von Symmetrien invariant sein sollten, als Folge einer Symmetriebrechung nur im wesentlichen invariant sind, wird uns noch öfter begegnen.) Zum Proton und Neutron gehören als Antiteilchen das Antiproton p und das Antineutron n. Antiteilchen unterscheiden sich hinsichtlich aller inneren Teilchenparameter, für die positive und negative Werte möglich sind (z. B. Ladung, Spinkomponente Sz , Isospinkomponente I3 ), von dem zugehörigen Teilchen durch das Vorzeichen, hinsichtlich aller übrigen inneren Teilchenparameter (z. B. Ruhemasse) stimmen sie mit diesen überein. Antiproton und Antineutron müssen daher zueinander in derselben Beziehung wie Proton und Neutron stehen, d. h. auch sie müssen sich durch Isospinoren des Isospinraums darstellen lassen, für die das Transformationsgesetz (13.20) gilt. Die (13.23) entsprechende Notation für Antiteilchen ist '1 1 '1 1 n ' , p ' , (13.24) 2 2 , 2 2 . Daß in der Definition von n auf der rechten Seite ein Minuszeichen steht, hat mit dem Transformationsverhalten des aus Antineutron und Antiproton gebildeten Isospinors zu tun und wird in dem folgenden Beweis abgeleitet. Für alles weitere bleibt das jedoch ohne Bedeutung. Beweis: Im Abschnitt 2.13.2 der Relativistischen Quantenmechanik wurde gezeigt, daß der mit der 4 4-Dirac-Matrix γ 2 aus dem Viererspinor ψ gebildete Spinor ψc iγ 2 ψ eine Lösung der Dirac-Gleichung für das Positron ist, wenn ψ eine Elektron-Lösung ist. Wenn wir auch das Neutron und Proton als Spin-1/2-Teilchen durch Diracsche Viererspinoren beschreiben, können wir für die Antiteilchenzustände n iγ 2 n , p iγ 2 p (13.25) schreiben. Weiterhin benutzen wir die in Aufgabe 13.1 (folgt kurz nach dem Beweis) bewiesene Tatsache, daß sich der aus dem Isospinor ψ mit der 2 2-Pauli-Matrix gebildete Isospinor χ für ψ ϕ (13.26) ψc i σ2 ψ ϕ χ wie ψ, also gemäß (13.20) transformiert. Dann transformiert sich aber auch der Zweier-Isospinor iγ 2n n , (13.27) ψ iγ 2 p p dessen Komponenten Viererspinoren sind, wie der mit Dirac-Spinoren p und n gebildete Isospinor (13.14), weil die Multiplikation der Viererspinoren n und p mit iγ 2 keinen Einfluß auf das Transformationsverhalten der Zweierspinoren im Isospinraum hat.
430
13 Gruppierung von Teilchenzuständen
Die aus der Isospinordarstellung (13.14) für Proton und Neutron folgende Isospinordarstellung (13.27) für Antineutron und Antiproton besitzt übrigens die Eigenschaft, daß die oben getroffene Ladungskonvention für den Isospin erfüllt ist: Das ungeladene Antineutron steht in der oberen Zeile des Isospinors und hat damit I3 1/2, das Antiproton ist negativ geladen und hat I3 1/2. Es sei hier nur darauf hingewiesen, daß es z. B. bei einer Teilchengruppierung, deren Eigenschaften und Symmetrien durch die Gruppe SU (3) beschrieben werden, nicht mehr möglich ist, die Isospinoren der Antiteilchen den Ladungen entsprechend umzuordnen und gleichzeitig zu erreichen, daß die Transformation zu den umgeordneten Isospinoren wieder durch Matrizen der Gruppe SU (3) beschrieben wird. Aufgabe 13.1: Beweisen Sie die in (13.26) angegebene Darstellung des Isospinors ψc ponenten des Isospinors ψ und zeigen Sie ψ¼ Lösung: Mit ψ
ϕ χ
ei
¡
,
ψc
ψ
folgt aus der Definition von ψc ϕc 10 χc
ϕc χc
1 0
ψc¼
ei
,
i σ2
ϕ£ χ£
d. h. wir haben ϕc χ £ und χc ϕ £ . Mit n /θ bzw. und dem Transformationsgesetz (13.28a)
i σ2 ψ durch die Kom-
ψc .
¡
χ£ ϕ£
(13.28)
0 1
1 0
,
ϕ(cos θ i n z sin θ) χ(i n x n y ) sin θ χ ϕ(i n x n y ) sin θ χ(cos θ i n z sin θ) . Hieraus ergibt sich mit ϕc χ und χc ϕ für die Transformation von ψc ϕc χ ϕ (i n x n y ) sin θ χ (cos θ i n z sin θ) ϕc (cos θ i n z sin θ) χc (i n x n y ) sin θ ¼
¼
und χc¼
(13.31) (13.32)
£
¼£
£
ϕ ϕ (cos θ ϕc (i n x ¼£
(13.30)
nθ folgt aus der Beziehung (12.82)
ϕ¼
£
(13.29)
£
£
i n z sin θ) χ £ ( i n x n y ) sin θ
χc (cos θ
n y ) sin θ i n z sin θ) .
Der Vergleich mit (13.31)–(13.32) zeigt, daß sich ψc wie ψ transformiert.
Zusammengesetzte Teilchen. Der Deuteriumkern besteht aus einem Proton und einem Neutron. Für dieses zusammengesetzte Teilchen müssen bezüglich des Isospins dieselben Zusammensetzungsregeln gelten, die für den Spin am Ende von Abschn. 13.1 angegeben wurden. Der Gesamtisospin eines aus zwei Nukleonen zusammengesetzten
13.2 Isospin
431 Q
I I I I
1
Q0 0 ( 12 ) 0 (0) 0 ( 1 ) 2
3/2 ( 1 ( 1) 1/2 ( 12 ) 0 (0) 3 2)
Q
1
Q
( 12 )
(1)
2
( 32 )
mc2 /MeV 1232 1384 1533 1672
Tabelle 13.1: Klassifizierung des Baryonen-Dekupletts. Die in Klammern stehende Zahl ist I3 .
Teilchens kann dementsprechend 1 oder 0 sein, und analog zu (13.12)–(13.13) ergeben sich mit (13.23) die Isospinzustände 1 , 1 p p , 1 , 0 1 pn n p , 1 , 1 nn 2
mit Gesamtisospin 1 und
0 , 0 12 pn n p
mit Gesamtisospin 0. Nun ist bekannt, daß es keine Bindungszustände zwischen zwei Neutronen bzw. zwei Protonen gibt, d. h. zwei der drei Zustände mit Isospin 1 müssen ausgeschieden werden. Dann darf es aber auch den dritten Zustand des Tripletts nicht geben, da er aus den zwei anderen durch eine Drehung im Isospinraum hervorgeht. Man nimmt an, daß die Triplettzustände mit Isospin 1 deshalb nicht angetroffen werden, weil die Bindungsenergie von den Isospins der Nukleonen abhängt und für einen festen und stabilen Zusammenhalt zu klein ist. Dementsprechend muß der Bindungszustand des Protons und Neutrons im Deuteron durch den Zustand mit Isospin 0 beschrieben werden. Die dem Isospin zugrundeliegenden Teilcheneigenschaften und Symmetrien werden definitionsgemäß durch die Gruppe SU (2) beschrieben. Diese besitzt ein-, zwei-, drei-, vierdimensionale Darstellungen usw. Da für den Isospin die gleichen Gesetzmäßigkeiten wie für den Spin gelten und für den letzteren die gleichen wie für den quantenmechanischen Drehimpuls, können wir beim Übergang von der zweidimensionalen Darstellung zu solchen anderer Dimension die Regeln für den Drehimpuls übernehmen. Daraus ergibt sich insbesondere, daß I die Werte 0, 1/2, 1, 3/2, 2, . . . und I3 bei gegebenem I die 2I 1 Werte I , I 1, . . . , I 1, I annehmen kann. In Tabelle 13.1 sind für die Teilchen des Baryonen-Dekupletts Ladung und Ruhemasse angegeben. Ähnlich wie Proton und Neutron haben hier jeweils alle Teilchen einer ganzen Gruppe die gleiche Ruhemasse. Weist man diesen den gleichen Gesamtisospin zu, so ergeben sich vier Gruppen: eine mit vier, eine mit drei, eine mit zwei und eine mit nur einem Teilchen. Diese vier Gruppen können verschiedendimensionalen Darstellungen der Gruppe SU (2) zugewiesen werden. Bedenken wir, daß 2I 1 die Multiplizität der Eigenwerte von I3 ist, so ergeben sich vier Eigenwerte für I 3/2, drei für I 1, zwei für I 1/2 und einer für I 0. Berücksichtigen wir noch die für den Isospin getroffene Ladungskonvention, so ergibt sich für das Dekuplett die in Tabelle 13.1 angegebene Klassifizierung. Der Notation (13.23) entsprechend läßt sich schreiben ' ' ' ' ' 32 , 32 , 0 ' 32 , 12 , ' 32 , 12 , ' 32 , 32 usw.
432
13 Gruppierung von Teilchenzuständen
SU º2»-Verknüpfung der Quarks u und d. Wenn man sich in Tabelle 11.4 die QuarkZusammensetzung der in Tabelle 13.1 klassifizierten Teilchen ansieht, fällt auf, daß die -Teilchen mit Isospin 3/2 drei Quarks der Menge u, d enthalten, die -Teilchen mit Isospin 1 zwei von diesen, die -Teilchen eines und das -Teilchen keines. Nimmt man an, daß u- und d-Quark zwei verschiedene Zustände ein und desselben Teilchens mit gleicher Energie sind und daher die gleiche Ruhemasse besitzen, so ist erklärt, warum die Vier -, die drei Σ - und die zwei Ξ -Teilchen jeweils gleich schwer sind. Es ist dann naheliegend, den Isospin der Teilchen des Baryon-Dekupletts auf die Quarks u und d zurückzuführen, I3 3/2 bei drei Quarks, I3 1 bei zwei Quarks und I3 1/2 bei einem Quark der Menge u, d. Dazu führen wir Isospin-Basiszustände 1 0 ψu , ψd 0 1
für das reine Up- bzw. Downquark ein, beschreiben allgemeine Zustände durch die Superpositionen u uψu dψd ψ d und nehmen wieder an, daß alle Zustände möglich sind, die aus einem Zustand ψ durch eine unitäre Transformation mit einer unitären Matrix U der Gruppe SU (2) hervorgehen. Wie für Proton und Neutron gilt I 1/2, außerdem I3 ψu
1 2 ψu
,
I3 ψd
1 2 ψd
.
(Die Basisvektoren wurden wieder in Übereinstimmung mit der Ladungskonvention für den Isospin gewählt: Das Upquark besitzt die Ladung 2e/3, das Downquark die Ladung e/3.) In der (13.23) und (13.24) entsprechenden Notation erhalten wir '1 1 '1 1 ' , , (13.33) u d ' 2 , 2 , 2 2 '1 1 '1 1 d ' 2 , 2 , u ' 2 , 2 . (13.34) Es hat sich herausgestellt, daß es sich bei den Familieneigenschaften der beiden Quarks u und d nicht um eine Symmetrie der starken Wechselwirkung wie bei Proton und Neutron, sondern um eine Symmetrie der später zu besprechenden schwachen Wechselwirkung handelt. Daher spricht man hier vom schwachen Isospin. Um auch Teilchen, die wie die Quarks der anderen Familien nicht der schwachen Wechselwirkung unterliegen, mit in das durch den Isospin gegebene Klassifikationsschema einbeziehen zu können, weist man ihnen den Isospin null zu. Aus den drei Quarks u, d und s lassen sich unter Berücksichtigung der Farbladung noch mehr zusammengesetzte Zustände konstruieren, als es in Tabelle 11.4 Teilchenkombinationen gibt. Dies werden wir im übernächsten Abschnitt näher untersuchen. Dabei werden wir die Annahme machen, daß die drei Quarks u, d und s eine Familie bilden und durch die Gruppe SU (3) miteinander verknüpft werden. Die damit verbundene Symmetrie stellt sich allerdings als nicht so gut heraus wie die durch den Isospin beschriebene Symmetrie der Quarks u und d, die deshalb innerhalb der Quarks zu einer Familie zusammengefaßt werden. Bevor wir uns diesem Problem zuwenden, beschäftigen wir uns jedoch erst noch etwas ausführlicher mit der Farbladung.
13.3 Farbladung und Gruppe SU (3)
13.3
433
Farbladung und Gruppe SU º3»
Die Annahme ist naheliegend, daß ein in drei verschiedenen Farbladungen vorliegendes Quark derselben Sorte drei verschiedene Zustände ein und desselben Teilchens darstellt. Zur theoretischen Umsetzung dieser Hypothese beschreibt man die Farbzustände der Quarks durch dreikomponentige Spaltenvektoren und weist den reinen Zuständen rot, grün und blau in der angegebenen Reihenfolge (willkürlich) die in (12.64) angegebenen Zustandsvektoren r , g und b zu. Diese spannen einen Hilbert-Raum von Farbzuständen auf. Ein allgemeiner Zustand ist dann durch eine beliebige Linearkombination 3 4 3 4 3 4 3 4 r 1 0 0 r 0 g 1 b 0 . (13.35) g b 0 0 1 gegeben. Wie bei Spinoren und Isospinoren gilt, daß Transformationen in diesem Raum, für welche die üblichen Erhaltungssätze der Quantenmechanik gelten, durch unitäre Matrizen der Gruppe SU (3) vermittelt werden. Transformationen im Raum dieser Zustände, dem Farbraum, haben nach (12.63) die Form 3 ¼4 3 4 8 r r ¼ λk ϕk (13.36) g exp i g . b¼ b k 1 Die Matrizen eiπλ2 /2 , eiπλ7 /2 und eiπλ5 /2 beschreiben in der angegebenen Reihenfolge bei geeigneter Wahl des Vorzeichens (z. B. eiπλ2 /2 für rot grün und eiπλ2 /2 für grün rot) die Übergänge rot grün, grün blau und blau rot (Aufgabe 13.6). Im nächsten Abschnitt sollen die aus drei Quarks zusammengesetzten Baryonen untersucht werden. Der Anteil der Zustandsfunktion, der sich auf die Farbe bezieht, hat dann die Form eines direkten Produkts
ψ(Farbe) 123 oder einer Linearkombination solcher Produkte. Dabei sind für jedes Quark im Prinzip zunächst alle drei Quarkfarben möglich. Hierdurch ergeben sich insgesamt 33 27 verschiedene Produkte, die eine Basis des Farbraums für Baryonen definieren. Durch geeignete Linearkombination lassen sich aus diesen zehn vollständig symmetrische, ein vollständig antisymmetrischer und sechzehn Zustände, die bezüglich der Vertauschung von zwei Teilchen antisymmetrisch sind, konstruieren. Wie diese Zustände aussehen, wird im nächsten Abschnitt am Beispiel des dazu analogen Falls dreier Quark-Flavors u, d und s gezeigt. (Man erhält die entsprechenden Farbzustände, indem man dort z. B. die Ersetzungen u r , d g, s b vornimmt.) Zu der schon früher angegebenen empirischen Regel, nach der die verschiedenen Farbladungen nur so kombiniert werden dürfen, daß sich als Gesamtfarbe weiß ergibt, kommt bei den Baryonen eine weitere, ebenfalls auf Empirie basierende Forderung hinzu: Nur der vollständig antisymmetrische Farbzustand ψ(Farbe) 16 r gb gbr br gr bgbgr gr b (13.37)
434
13 Gruppierung von Teilchenzuständen
ist möglich. Durch diese Forderung wird die vollständig symmetrische Farbkombination 1 r g b g b r b r g r b g b g r g r b , ψ(Farbe) 6
die ebenfalls weiß ergeben würde, ausgeschlossen.
13.4
Baryonen aus u, d und s
In diesem Abschnitt bemühen wir uns um eine vollständige Klassifizierung aller Teilchen, die aus drei Quarks zusammengesetzt sind, welche der aus u, d und s gebildeten Gruppe entstammen. (Dabei handelt es sich um die leichten Quarks,1 von den aus schweren Quarks zusammengesetzten Baryonen sind bisher erst sehr wenige gefunden worden.) Wir verallgemeinern dazu die Hypothese des letzten Abschnitts, nach der u und d zwei verschiedene Zustände ein und desselben Teilchens sind, die durch Transformationen der Gruppe SU (2) miteinander verknüpft werden, dahingehend, daß wir in die Möglichkeit der Teilchenzustände auch noch das s-Quark mit einbeziehen. Dementsprechend wird ein Flavor-Raum mit dreikomponentigen Zustandsvektoren eingeführt, dessen Basis die Zustände 3 4 3 4 3 4 1 0 0 ψu 0 , ψd 1 , ψs 0 (13.38) 0 0 1 für ein reines Up-, Down- bzw. Strangequark bilden und in dem beliebige Zustände wieder durch Linearkombination aus diesen entstehen. Der Übergang zwischen verschiedenen Zuständen wird durch eine Matrix der Gruppe SU (3) vermittelt. Die Erweiterung zu einer Gruppe von drei Quarks erweist sich als sehr nützlich für die Klassifizierung der Teilchen. Physikalisch entspricht ihr aber keine perfekte Teilchenverwandtschaft bzw. Symmetrie, denn die hiermit erfaßten Teilchen weisen zum Teil doch recht unterschiedliche Ruhemassen auf, was bei einer perfekten Gruppensymmetrie nicht der Fall sein dürfte. (Demgegenüber ist die SU (3)-Symmetrie der Farbzustände perfekt.) Bei der vollständigen Zustandsbeschreibung eines Quarks müssen wir seine räumliche Position, seinen Spin, seinen Flavor und seine Farbe berücksichtigen. Der Isospin ist keine zusätzliche Variable, er beschreibt nur eine Symmetrie, die unter den betrachteten drei Quarks das u- und d-Quark in besonderer Weise miteinander verbindet. Der Gesamtzustand eines Quarks wird demnach durch das äußere Produkt
mit
ψ
R
ψ(R) ψ(S) ψ(Fl) ψ(F) Raum ,
S
Spin ,
Fl
Flavor ,
(13.39) F
Farbe
1 Der Begriff der Ruhemasse eines Quarks ist schwierig und kann erst später genauer untersucht werden. Wir geben uns im Moment damit zufrieden, daß es sich bei u, d und s um die in einem noch zu spezifizierenden Sinn leichteren Quarks handelt.
13.4 Baryonen aus u, d und s
435
von Zuständen beschrieben, die in separaten Hilbert-Räumen der einzelnen Teilcheneigenschaften definiert sind, und ist in deren direktem Produktraum erklärt. Ein beliebiger allgemeiner Quarkzustand besteht aus einer Linearkombination derartiger Produktzustände (siehe Quantenmechanik, Kapitel Q7). Analoges gilt für einen aus drei Quarks gebildeten Bindungszustand, wobei der Zustand jeder Teilcheneigenschaft in drei direkte Produkte von Zuständen für jedes Einzelquark oder eine Linearkombination solcher Produkte zerfällt. Aus der Hypothese, daß die Quarks u, d und s verschiedene Zustände ein und desselben Teilchens sind, folgt, daß wir sie als identische Teilchen in verschiedenen Zuständen auffassen, auf welche die Regeln für die Zustände identischer Teilchen angewandt werden müssen (siehe dazu Quantenmechanik, Kapitel Q9). Quarks besitzen Spin 1/2 und sind daher Fermionen. Infolgedessen muß der Gesamtzustand dreier gebundener Quarks vollständig antisymmetrisch sein. Wenn wir uns bei unserer Untersuchung auf Bindungszustände beschränken, bei denen der Bahndrehimpuls der drei Quarks verschwindet (Grundzustand), ist die räumliche Wellenfunktion winkelunabhängig und daher gegenüber einer Vertauschung der Quarks vollständig symmetrisch. Weiterhin wissen wir aus dem letzten Abschnitt, daß die Farbwellenfunktion vollständig antisymmetrisch ist. Dies hat zur Folge, daß das Produkt ψ(S) ψ(Fl) vollständig symmetrisch sein muß, damit ein vollständig antisymmetrischer Gesamtzustand entsteht. Der Gesamtspin zweier Quarks kann nach der Dreiecksregel für die Addition von Drehimpulsen (Quantenmechanik, Abschn. Q7.5 die Werte 1 oder 0 haben. Fügt man ein drittes Quark hinzu, so ergeben sich für den Gesamtspin des Drei-Quark-Systems im ersten Fall die Möglichkeiten 11/23/2 und 11/21/2, im zweiten 01/21/2. Indem wir bei dem direkten Produkt der Spinfunktionen von Einzelquarks die Information über den Gesamtspin unterdrücken, auf die Produktdarstellung verzichten und die Richtung der z-Komponente ' ' Spins der ' durch aufwärts und abwärts gerichtete Pfeile ausdrücken, also z. B. für ' 12 , 12 ' 12 , 12 ' 12 , 12 einfach schreiben, erhalten wir zum Gesamtspin 3/2 des Drei-Quark-Systems für ψ(S) S, Sz mit S Gesamtspin und Sz z-Komponente des Spins die vollständig symmetrischen Zustände '3 1 '3 3 1 ' , ' , , , 2 2 2 2 3 (13.40) '3 '3 ' , 1 1 , ' , 3 2 2 2 2 3
und zum Gesamtspin 1/2 die Zustände '1 1 1 ' , () () , 2 2 12
'1 ' , 1
() () , (13.41) die wir mit ψ 12 bezeichnen, weil sie bei Vertauschung der Teilchen 1 und 2 antisymmetrisch sind, sowie die Zustände '1 '1 1 1 ' , 1 1 () () , ' , 2 2 23 2 () () , 2 2 23 2 (13.42) die wir wegen ihrer Antisymmetrie bei der Vertauschung der Teilchen 2 und 3 mit ψ 23 bezeichnen. (Es gibt auch Zustände ψ 13 , die gegenüber der Vertauschung der Teilchen 1 und 3 antisymmetrisch sind; diese können jedoch durch Linearkombination der Zustände ψ 12 und ψ 23 erhalten werden. Die Klammern in der Notation für die 2
2
2 12
1 2
436
13 Gruppierung von Teilchenzuständen
gegenüber Zwei-Teilchen-Vertauschungen antisymmetrischen Drei-Teilchen-Zustände, z. B. in () , markieren die Teilchen, in Bezug auf welche die Antisymmetrie besteht, und haben ansonsten keine Bedeutung.) Wenden wir uns jetzt dem Anteil ψ(Fl) des Zustands zu. Es gibt insgesamt 33 27 verschiedene Produkte ψ(Fl) 1 2 3, wenn man für jedes der drei Teilchen die Zustände u , d und s zuläßt. Unter deren Linearkombinationen befinden sich 10 vollständig symmetrische, welche die Teilchen des Baryonen-Dekupletts liefern und in der folgenden Liste angegeben sind.
0
d d d , 1 u d d d u d d d u , 3 1 u u d u d u d u u , 3
u u u , 1 d d s d s d s d d , 3 1 u d s d s u s u d 6 u s d s d u d u s , 1 u u s u s u s u u , 3 1 d s s s d s s s d , 3 1 u s s s u s s s u ,
s s s .
0
0
3
Sie müssen mit einem der vollständig symmetrischen Spinzustände (13.40) kombiniert werden, damit sich ein vollständig antisymmetrischer Gesamtzustand ergibt. Dieser nimmt damit für die Teilchen des Dekupletts die Form ψ
ψ(R)
ψ(S)
ψ(Fl)
ψ(F)
an, in der Indizes und für vollständig symmetrisch bzw. vollständig antisymmetrisch stehen. Alle -Teilchen haben in etwa die gleiche Ruhemasse, weil sie durch Drehungen im Isospinraum der Teilchen u und d auseinander hervorgehen, bei denen die durch die starke Wechselwirkung verursachten Bindungsenergien unverändert bleiben. Ihre Gruppenverwandtschaft wird wie schon oben besprochen den vier Teilchen entsprechend durch eine vierdimensionale Darstellung der Gruppe SU (2) beschrieben, die den vier Eigenzuständen der vierdimensionalen Matrix I3 zugeordnet werden können. Entsprechend wird die Symmetrie der - und -Teilchen bzw. des -Teilchens durch drei-, zwei- und eindimensionale Darstellungen der Gruppe SU (2) beschrieben. Für einen vollständig antisymmetrischen Zustand ψ(Fl) gibt es nur die eine Mög-
13.4 Baryonen aus u, d und s
437
lichkeit
1
6
u d s d s u s u d u s d s d u d u s .
Für einen brauchbaren Gesamt-Teilchenzustand müßte dieser mit einem vollständig antisymmetrischen Zustand ψ(S) kombiniert werden, den es jedoch in der Gesamtheit der Spinzustände (13.40)–(13.42) nicht gibt. Dies bedeutet, daß es kein Teilchen im Grundzustand mit einer vollständig antisymmetrischen Flavorfunktion gibt. (Die Möglichkeit hierzu existiert jedoch bei nicht-verschwindendem Bahndrehimpuls.) Ähnlich wie beim Spin gibt es noch Zustände ψ 12 , ψ 23 und ψ 13 , die gegenüber den Vertauschungen 12 bzw. 23 bzw. 13 antisymmetrisch sind. Die Zustände ψ 12 werden in den Teilchen des Baryonen-Oktetts realisiert und sind n012
p 12
0
12
12
12
12
12 0 12
1 u d d u d , 2 1 u d d u u , 2 1 d s s d d , 2 1 2 u d d u s u s s u d 12 1 u s s u d d s s d u , 4 1 u s s u u , 2 1 d s s d s , 2 1 u s s u s . 2
d s s d u ,
Die Zustände ψ 23 gehen aus den Zuständen ψ 12 durch Umnumerierung der Teil chen hervor, z. B. u d d u d / 2 d u d d u / 2, und beschreiben daher dieselben Teilchen. Die zehn Zustände des Baryonen-Dekupletts, der eine – im Grundzustand nicht realisierbare – vollständig antisymmetrische Zustand des Singuletts und die 2 8 Zustände der Baryonen-Oktetts ψ 12 und ψ 23 ergeben zusammen 1018827 Zustände. Damit ist der Raum von 3 327 Flavor-Produktzuständen ausgeschöpft, die Zustände ψ 13 sind abhängig und lassen sich aus ψ 12 und ψ 23 linear kombinieren. Die teilweise antisymmetrischen Flavorzustände des Baryonen-Oktetts müssen so mit Spinzuständen kombiniert werden, daß sich für das Produkt ψ(S) ψ(Fl) ein vollständig symmetrischer Zustand ergibt. Aufgrund dieser Forderung erhalten die Gesamtzustände des Baryonenoktetts die Form ψ(R) ψ(S)12 ψ(Fl)12 ψ(S)23 ψ(Fl)23 ψ(S)13 ψ(Fl13 ψ(F) , (13.43) die so gewählt ist, daß alle drei Quarks gleichberechtigt behandelt werden. (Zur Normierung siehe Aufgabe 13.3) ψ
2 3
438
13 Gruppierung von Teilchenzuständen
13.5
Mesonen aus u, d und s
Abschließend betrachten wir noch die Isospin-Klassifizierung der aus einem Quark und einem Antiquark zusammengesetzten Mesonen. In Tabelle 11.4 ist die Gesamtheit aller Möglichkeiten angegeben, die bestehen, wenn man für die Zusammensetzung nur die leichten Quarks u, d und s heranzieht. Für die aus einem u und einem d-Quark bzw. -Antiquark bestehenden Mesonen ergeben sich in Analogie zu (13.12)–(13.13) mit (13.33)–(13.34) die Flavorkombinationen ' ' d u ' 12 , 12 ' 12 , 12 1 , 1 , ' ' ' ' 1 u u d d 1 ' 12 , 12 ' 12 , 12 ' 12 , 12 ' 12 , 12 1 , 0 , (13.44) 2 2 '1 1 '1 1 ' u d ' , 2 2 2 , 2 1 , 1 mit I 1, von denen nach Tab. 11.2 die erste die Ladung 1, die zweite die Ladung 0 und die dritte die Ladung 1 trägt, sowie die Kombination ' ' ' ' 1 u u d d 1 ' 12 , 12 ' 12 , 12 ' 12 , 12 ' 12 , 12 0 , 0 (13.45) 2
2
mit I 0 und Ladung 0. Durch Kombination eines s-Quarks (wie nach (13.34) gesagt hat dieses den Gesamtisospin null) und einem Quark der Familie u, d ergeben sich die Mesonzustände ' ' ' ' d s ' 1 , 1 0, 0 ' 1 , 1 , u s ' 1 , 1 0, 0 ' 1 , 1 , 2
2
2
2
2
2
2
2
die beide den Isospin 1/2 besitzen, und die dazugehörigen Antiteilchenzustände ' '1 1 '1 1 ' ' s u 0, 0 ' 12 , 12 ' 12 , 12 , s d 0, 0 ' , 2 2 2 , 2 . (13.46) Schließlich gibt es noch die eine Kombination s s ohne Quarks der Familie u, d mit Isospin null. Da die Zustände (13.45) und s s beide die gleichen Quantenzahlen I 0 und I3 0 haben, treten sie als Mischungen auf, und zwar aufgrund empirischer Befunde entweder als 1 u u d d2 s s bzw. 1 u u d d s s (13.47) 6
3
bei dem in Tabelle 11.4 angegebenen pseudoskalaren Nonett oder als 1
2
u u d d
bzw.
s s
(13.48)
beim Vektornonett (siehe unten). Die Namen der durch die Zustände (13.44)-(13.48) beschriebenen Teilchen und ihre Isospin-Klassifizierung sind Tabelle 13.2 zu entnehmen. Soweit wurde nur die Flavor-Zusammensetzung betrachtet und die Symmetrie gegenüber Teilchenvertauschungen außer acht gelassen. Zu jeder der angegebenen Zusammensetzungen läßt sich ein vollständig symmetrischer Flavorzustand wie z. B. 1 1 u u u u d d d d (13.49) u d d u , 2
2
13.5 Mesonen aus u, d und s
439
Pseudoskalares Nonett Name
Vektornonett
Zustandsbestandteile
Name
0
u d
1 ( u u d d ) 2
0
K
d u
0 K K
1 ( u u d d2 s s ) 6 1 ( u u d d s s ) 3
I
I3
Q
1 1
1 0
1 0
d u
1
-1
-1
u s d s s d s u
1 2 1 2 1 2 1 2
1 2 - 12 1 2 1 -2
1 0 0 -1
0
0
0
0
0
0
u d
1 ( u u d d ) 2
K K0 0 K K
u s d s s d s u
K0
Zustandsbestandteile
1 ( u u d d ) 2
s s
Tabelle 13.2: Bestandteile der Flavor-Zustände von Mesonen ohne Berücksichtigung der Symmetrieforderungen für identische Teilchen. Unter deren Berücksichtigung ergeben sich für das pseudoskalares Nonett Gesamtzustände der Form (13.54)) und für das Vektornonett Gesamtzustände der Form (13.55).
und ein vollständig antisymmetrischen Flavorzustand wie z. B. 1 1 u d d u , u u u u d d d d 2
2
(13.50)
konstruieren. (In den angeführten Beispielen entsteht jeweils der erste aus den in Tabelle 13.2 für bzw. und jeweils der zweite aus den für 0 bzw. 0 angegebenen Zustandsbestandteilen.) Bezüglich des quantenmechanischen Gesamtzustands beschränken wir uns beim räumlichen Anteil wieder auf den Grundzustand. Dieser hat die Drehimpulsquantenzahl l 0, ist räumlich symmetrisch und daher symmetrisch gegenüber Teilchenvertau g r, schung. Bezüglich der Farbe gibt es im Prinzip die neun Mischungen r r , r g, r b, br, Diese lassen sich in eine Gruppe von acht Linearkombinationen, die g g, g b, b g, b b. durch unitäre Transformationen im Farbraum wechselseitig ineinander überführt werden können, und die ein Singulett bildende Farbkombination r r g g bb
(13.51)
zerlegen. Die letztere ist als einzige gegenüber unitären Transformationen invariant. Realisiert wird in der Natur wie im Fall der Baryonen nur das Singulett. Dieses erlaubt die zwei Quantenzustände ψ(Farbe) 1 r r r r g g g g b b b b , (13.52) 12 ψ(Farbe) 1 r r r r g g g g b b b b , (13.53) 12
von denen der erste vollständig symmetrisch und der zweite vollständig antisymmetrisch ist.
440
13 Gruppierung von Teilchenzuständen
Die beiden Spins können antiparallel sein und befinden sich dann im vollständig antisymmetrischen Zustand des Singuletts (13.13) mit Gesamtspin 0. Dieser muß mit vollständig symmetrischen Flavorzuständen der Art (13.49) und dem vollständig symmetrischen Farbzustand (13.52) oder mit vollständig antisymmetrischen Flavorzuständen der Art (13.50) und dem vollständig antisymmetrischen Farbzustand (13.53) kombiniert werden und liefert die Teilchen des pseudoskalaren Nonetts (Tabelle 13.2, links), deren Gesamtzustände die Form ψ ψ(R)
ψ(S)
ψ(Fl) ψ(F)
(13.54)
annehmen. Wenn die Spins parallel sind, werden die drei vollständig symmetrischen Zustände des Tripletts (13.12) mit Gesamtspin 1 möglich, und die zugehörigen Teilchen sind die des Vektornonetts (Tabelle 13.2, rechts) mit Gesamtzuständen der Form ψ ψ(R) ψ(S) ψ(Fl) ψ(F) .
(13.55)
Aufgaben 13.2
Zeigen Sie, daß eiπσ2 /2 im Isospinraum die Transformation vermittelt, die den Zweier-Isospinor eines Protons in den eines Neutrons überführt.
13.3
Zeigen Sie, daß die Norm der Zustände
0
ψ
1 ( u u d d2 s s ) , 6
1 2 u d d u s u s s u d d s s d u , 12 2 ψ(R) ψ(S)12 ψ(Fl)12 ψ(S)23 ψ(Fl)23 3
ψ(S)13 ψ(Fl)13 ψ(F)
gleich eins ist. Anleitung: Berücksichtigen Sie bei der letzten Beziehung, daß ψ 13 eine Linearkombination von ψ 12 und ψ 23 ist.
13.4
Geben Sie den vollständigen Zustand 1. des -Mesons und 2. des Protons an.
13.5
Bestimmen Sie die Quantenzahlen I und I3 der Teilchen des Baryonen-Oktetts.
13.6
Zeigen Sie, daß die Matrizen eiπλ2 /2 , eiπλ7 /2 und eiπλ5 /2 zwischen den in (12.64) angegebenen Zuständen r, g und b bei geeigneter Wahl des Vorzeichens in der angegebenen Reihenfolge die Übergänge r g, g b und b r bewirken. Anleitung: Vergleichen Sie die Erzeuger λi der Gruppe SU (3) mit den Erzeugern Ji der Gruppe S O(3) und benutzen Sie (12.45).
14
Teilchen, Felder und Lagrange-Funktion
In der Quantenfeldtheorie sind Teilchen die Quanten von Feldern. Die klassische Beschreibung der Felder läßt sich durch ein Hamiltonsches Variationsprinzip darstellen, dessen Euler-Gleichungen die Feldgleichungen sind. Durch den Übergang zu einer Hamilton-Formulierung und deren Quantisierung kommt man zu einer Quantenfeldtheorie. Die ganze Information über das Feld und dessen Quanten ist bei gegebenen Regeln der Feldquantisierung schon in der Lagrange-Funktion des klassischen Feldes enthalten. Die entsprechenden Zusammenhänge werden im folgenden zunächst für diejenigen Felder in Erinnerung gerufen, die wir schon in der Quantenfeldtheorie kennen gelernt haben. Später werden daraus für die Elementarteilchentheorie geeignete Erweiterungen abgeleitet.
14.1
Lagrange-Funktion und Hamiltonsches Variationsprinzip für Felder
Wir betrachten mit x als Abkürzung für x α ein Feld ηr
ηr (x) ,
(14.1)
das gegebenen Differentialgleichungen genügen soll. ηr , r 1, .., n, sind die Feldkomponenten, die Koordinaten x 0 ct, x 1 x, x 2 y und x 3 z beschreiben in relativistischer Notation die Zeit- und Ortsabhängigkeit des Feldes. Die Ableitungen von ηr nach den x α werden durch ηr,α
∂ηr ∂xα
abgekürzt. Die Feldgleichungen ergeben sich aus dem Hamiltonschen Variationsproblem ' ∂ ∂ ∂ ' d 4x mit δηr ' 0 , (14.2) δ δηr d 4 x 0 α ∂G ∂η ∂ x ∂η r r,α G G
in dem die Lagrange-Dichte die Abhängigkeiten
(ηr , ηr,α , x)
(14.3)
besitzt. Die Euler-Gleichungen des Variationsproblems lauten
∂ . ∂η
∂ ∂ ∂ x α ∂ηr,α
r
(14.4)
442
14 Teilchen, Felder und Lagrange-Funktion
Wir benötigen im folgenden einen Spezialfall des in der2 Quantenfeldtheorie abgeleiteten Noether-Theorems (7.89): Wenn die Wirkung S d 4 x bei unveränderten x α gegenüber der infinitesimalen Feldänderung
ηr¼
ηr
η dη r
(14.5)
r
invariant ist, gilt der Erhaltungssatz ∂ ∂xα
14.2
∂ dηr ∂ηr,α
0.
(14.6)
Klein-Gordon-Schrödinger-Gleichung
In der SRT ist der Zusammenhang zwischen der Energie E und dem Impuls p eines Teilchens der Ruhemasse m 0 durch E2 c2
p m c 2
2 2 0
(14.7)
gegeben. Wendet man hierauf die quantenmechanischen Übersetzungsregeln E i h ∂t , p i h an und läßt die Operatoren auf eine komplexe Wellenfunktion φ einwirken, so erhält man die Klein-Gordon-Schrödinger-Gleichung
( h 2 ∂α ∂ α
m c )φ 0. 2 2 0
(14.8)
Da die Energiegleichung (14.7) für alle Teilchen gilt, muß die Klein-Gordon-Schrödinger-Gleichung – unabhängig vom Spin der zugeordneten Teilchen – von jedem freien relativistischen Feld (genauer: von dessen Komponenten) erfüllt werden. Man erhält sie aus dem Hamiltonschen Variationsprinzip mit der Lagrange-Dichte h 2m
2 0
(∂α φ) ∂ α φ £
m 2c φφ 0
2
£
,
(14.9)
aus dem außer (14.8) auch noch die konjugiert komplexe Gleichung
( h 2 ∂α ∂ α
m c )φ 0 2 2 0
£
(14.10)
folgt. Offensichtlich ist und damit die Klein-Gordon-Schrödinger-Gleichung gegenüber der Transformation φ ¼ e i Λ φ mit konstantem Λ invariant, der für Λ dΛ die infinitesimalen Feldänderungen φ ¼ φ dφ i φ dΛ und dφ £ i φ £ dΛ entsprechen. (Real- und Imaginärteil von φ sind als unabhängige Felder η1 und η2 aufzufassen; wie in Abschn. 7.4.1 der Quantenfeldtheorie gezeigt wurde, ist dem gleichbedeutend, wenn man φ und φ £ als unabhängig ansieht.) Aus (14.6) folgt damit 2
∂ ∂ ∂ ∂ i h dΛ £ α £ (14.9) ∂ α £ dφ dφ (φ ∂ φ φ∂ φ ) 0 £ ∂ x α ∂φ,α ∂ x α ∂φ,α ∂xα 2m 0
14.3 Maxwell- und Proca-Gleichungen
(bei der Ableitung von
443
nach φ,α wurde (∂α φ) (∂ α φ)
∂α J α
0
ih (φ ∂ α φ φ∂ α φ ) , 2m 0
Jα
mit
(∂ α φ) (∂α φ ) benutzt) oder (14.11)
also ein Erhaltungssatz für die Teilchenflußdichte J α (siehe Relativistische Quantenmechanik, (4.35)).
14.3
Maxwell- und Proca-Gleichungen
Für das Viererpotential Aα Φ/c, A des elektromagnetischen Feldes ist die Lagrange-Dichte nach Gleichung (7.65) der Quantenfeldtheorie
4μ1
0
Fαβ F αβ
Aα j α
mit
Fαβ
∂α A β
∂β A α
,
(14.12)
wobei die Stromdichte j α λc, j als vorgegebenes Feld aufgefaßt und nicht variiert wird. Die Feldgleichungen für den Feldstärketensor Fαβ lauten ∂α F αβ
∂α ∂ α A β
∂ β (∂αA α ) μ0 j β .
(14.13)
Der Term W A β j β beschreibt die Wechselwirkung des elektromagnetischen Feldes mit dessen Quellen, W ist der Anteil der Lagrange-Dichte, der das freie Feld beschreibt. Aus der Eigenschaft, daß das die Photonen beschreibende Feld Aα ein relativistischer Vierervektor ist, wurde im Abschnitt 8.3.7 der Quantenfeldtheorie für Photonen der Spin 1 abgeleitet. Für massive Spin-1-Teilchen wurde von A. Proca die Lagrange-Dichte
4μ1
0
Fαβ F αβ
Aα j α
m 2A c2 2μ0 h 2
Aα A α
(14.14)
vorgeschlagen, in welcher der zusätzliche Masseterm m 2A so gewählt ist, daß jede Komponente von Aα für j α 0 die Klein-Gordon-Schrödinger-Gleichung erfüllt (siehe unten). Mit m 2A c2 β 1 αβ ∂ ∂ β F , j A ∂(∂α A β ) μ0 ∂ Aβ μ0 h 2
liefern die Euler-Gleichungen des Variationsproblems die Proca-Gleichungen ∂α F αβ
m 2A c2 h2
Aβ
μ0
jβ .
(14.15)
Nun gilt ∂α ∂β F αβ
α
β
∂β ∂α F βα
F βα
F
αβ
∂β ∂α F
αβ
∂α ∂β F
αβ
∂α ∂β F αβ
0.
444
14 Teilchen, Felder und Lagrange-Funktion
Weiterhin muß die Erhaltungsgleichung ∂β j β 0 gelten, damit die elektrische Ladung erhalten bleibt. Damit folgt aus (14.15) durch Ableitung nach x β (m 2A c2 /h 2 ) ∂β Aβ
0.
Für m A 0 ergibt sich daraus, daß die Lorentz-Eichbedingung ∂β Aβ 0 zwingend erfüllt sein muß. (Damit besteht keine Eichfreiheit mehr, die Proca-Gleichungen sind nicht eichinvariant.) Hiermit und mit (14.12b) ergibt sich aus (14.15) h 2 ∂α ∂ α A β
m 2A c2 Aβ
μ0 h
2 β
j .
(14.16)
Für j β 0 erfüllt Aβ wie oben behauptet die Klein-Gordon-Schrödinger-Gleichung.
14.4
Lorentz-Invarianz und Dirac-Gleichung
Die Dirac-Gleichung wurde schon im Kapitel 2 der Relativistischen Quantenmechanik eingeführt. Hier soll noch ein völlig anderer Zugang zu ihr vorgestellt werden, der von den Transformationen ausgeht, welche die Gruppe der Lorentz-Transformationen in einem Raum von Zweierspinoren induziert. Wir betrachten dazu als erstes die speziellen Lorentz-Transformationen x ¼0
γ (x 0 βx 1 ) ,
x ¼1
γ (x 1 βx 0 ) ,
mit β
v/c ,
γ
x ¼2
x2 ,
x ¼3
x 3 (14.17)
(1 v 2 /c2 ) 1/2 ,
(14.18)
die „Boosts“ in Richtung der x 1 -Achse darstellen. Wegen γ 2 γ 2 β 2 1 kann γβ
sinh φ ,
γ
cosh φ
gesetzt werden. Damit lassen sich die Transformationen (14.17) in mit ⎛ 0⎞ ⎛ x cosh φ sinh φ 0 1 cosh φ 0 ⎜x ⎟ ⎜ sinh φ Λ1 ⎝ x ⎝ 2⎠ , 0 0 1 x 0 0 0 x3
(14.19) der Form x ¼ Λ1 x ⎞ 0 0⎟ ⎠ 0 1
schreiben. Der zugehörige Gruppengenerator K 1 ergibt sich aus (12.18) mit M Λ1 und t φ, und analog erhält man Generatoren für Boosts in Richtung der x 2 - und x 3 -Achse. Insgesamt ergibt sich auf diese Weise ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 1 0 0 0 0 1 0 0 0 0 1 ⎜1 0 0 0⎟ ⎜0 0 0 0⎟ ⎜0 0 0 0⎟ K1 ⎝ ⎠ , K2 ⎝ ⎠ , K3 ⎝ ⎠. 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 Zur Klasse der Lorentz-Transformationen gehören auch rein räumliche Drehungen. Aus (12.42) ergeben sich die zu Transformationen in der vierdimensionalen Raum-Zeit gehörigen Generatoren räumlicher Drehungen (44-Matrizen) zu
14.4 Lorentz-Invarianz und Dirac-Gleichung ⎛ J1
0 ⎜0 ⎜ ⎜ ⎝0 0
0 0 0 0
0 0 0 1
⎞ 0 0⎟ ⎟ ⎟, 1⎠ 0
⎛
0 ⎜0 ⎜ J2 ⎜ ⎝0 0
0 0 0 1
0 0 0 0
445 ⎞ 0 1⎟ ⎟ ⎟, 0⎠ 0
⎛
0 ⎜0 ⎜ J3 ⎜ ⎝0 0
0 0 1 0
0 1 0 0
⎞ 0 0⎟ ⎟ ⎟. 0⎠
(14.20)
0
Wie man durch Nachrechnen verifiziert, gelten die folgenden Vertauschungsrelationen.
K 1 , K 2 J3 und zykl. Permutationen , J1 , J2 J3 und zykl. Permutationen , J1, K 2 K 1, J2 K 3 und zykl. Permutationen , J1, K 1 J2, K 2 J3, K 3 0 . Aus der ersten von ihnen folgt, daß Boosts anders als Drehungen keine Untergruppe der Lorentz-Gruppe bilden, da der Kommutator von zwei ihrer Generatoren zu einem Generator der Drehgruppe führt. (Dies bedeutet, daß die Hintereinanderschaltung von zwei Boosts in verschiedenen Richtungen eine Drehung induziert.) Die Lie-Algebra der Kommutatoren für Boosts und Drehungen zusammengenommen ist jedoch abgeschlossen, was bedeutet, daß Drehungen und Boosts zusammen eine Gruppe bilden. Von den räumlichen Drehungen wissen wir aus Abschn. 12.9, daß sie im Raum komplexer Zweierspinoren „Drehungen“ induzieren, die gemäß (12.60) durch die PauliMatrizen vermittelt werden. Zwischen den jeweiligen Generatoren besteht die Zuordnung J i /2. Diese ergibt sich auch durch den Vergleich der für die Ji gültigen Kommutatorbeziehungen mit denen für die Pauli-Matrizen, (12.37). Vergleicht man die letzteren mit den oben angegebenen Kommutatorbeziehungen für die K i , so ergibt sich mit J i /2 die Zuordnung K /2 . (14.21)
(Aus K 1 , K 2 J3 folgt mit K 1,2 σ1,2 /2 und J3 i σ3 /2 Gleichung (12.37) und umgekehrt.) Aus (14.21) folgt, daß den Boosts zwei verschiedene Transformationsgesetze für Spinoren zugeordnet werden können, eines für das Plus- und eines für das Minuszeichen. Dementsprechend gehen aus einem gemeinsamen Referenzzustand ϕ0 zwei Klassen von Spinoren mit unterschiedlichem Transformationsverhalten hervor. (Dies hat damit zu tun, daß unter den Lorentz-Transformationen auch Spiegelungen am Koordinatenursprung enthalten sind. In Aufgabe 14.3 soll nachgewiesen werden, daß bei Spiegelungen die Generatoren K i in K i übergehen, während die Generatoren Ji unverändert bleiben.) Aus später ersichtlichen Gründen werden diese mit ϕ R und ϕ L bezeichnet, wobei auch ϕ R ϕ L möglich ist, d. h. der Unterschied besteht nur im Transformationsverhalten. Eine aus Drehung und Boost zusammengesetzte LorentzTransformation induziert bei ihnen nach (12.59) die Transformationen ϕ ¼L
ei
(
i )/2
ϕL ,
ϕ R
ei (
i )/2
ϕR ,
(14.22)
wobei die drei Gruppenparameter für die Drehungen und die drei Gruppenparameter für die Boosts zusammenfaßt. Die Matrizen exp(i ( i )/2) und exp(i ( i )/2) bilden zwei nicht-äquivalente Darstellungen der Lorentz-Gruppe, da sie sich nicht durch eine Ähnlichkeitstransformation ineinander überführen lassen (Aufgabe 14.4).
446
14 Teilchen, Felder und Lagrange-Funktion
Die zugehörigen Transformationsgesetze lassen sich jedoch zu einem zusammenfassen, wenn anstelle von zwei Zweierspinoren ein Viererspinor benutzt wird, und lauten dann i ( i )/2 ϕR ¼ e ϕR 0 . (14.23) i ( i )/2 ϕL ϕL 0 e Betrachten wir jetzt die Zustände ϕ R und ϕ L , in welche der Referenzzustand ϕ0 ϕ(0) eines in Ruhe befindlichen Teilchens (gemeinsamer Eigenzustand des Energie- und Impulsoperators zur Energie E m 0 c und zum Impuls p 0) durch die reinen Boost-Transformationen e /2 bzw. e /2 überführt wird, ϕ R ( p)
ϕ R
e
/2
ϕ(0)
bzw.
ϕ L ( p)
ϕ L
e
/2
ϕ(0) .
(14.24)
(Jeder von diesen ist ein gemeinsamer Eigenzustand des Energie- und Impulsoperators zur Energie E mc und zum Impuls p.) Der Boost muß in Richtung des Impulses p erfolgen, d. h. es muß φn mit n p/ p gelten. Ähnlich wie (12.80) erhält man (Aufgabe 14.5) e nφ/2 cosh(φ/2) n sinh(φ/2) . (14.25) (In diesem Abschnitt wird die – hier z. B. neben cosh(φ/2) stehende – Einheitsmatrix nicht mit E bezeichnet, sondern weggelassen, oder, wo das nicht möglich ist, mit 1 bezeichnet, um Verwechslungen mit der Energie E zu vermeiden. ) Aus (14.19) folgt eφ γ (1β) , φ/2 ln γ (1β) ln(1v/c)1/4 (1v/c)1/4 und daraus $ % 1v/c 1/4 1v/c 1/4 1 cosh(φ/2) 2 1v/c 1v/c
1/2 (1v/c)1/2 (1v/c)1/2 1 (1v 2 /c2 )1/2 2(1v 2 /c2 )1/4 2(1v 2 /c2 )1/2 – den letzten Schritt beweist man am besten durch Quadrieren – bzw.
sinh(φ/2) (γ 1)/2 . cosh(φ/2) (γ 1)/2 Hiermit erhalten wir aus (14.24) schließlich die Beziehungen % % $5 $5 5 5 γ 1 γ 1 p γ 1 γ 1 p ϕ R ( p) ϕ(0) , ϕ L ( p) ϕ(0) . 2 2 p 2 2 p Mit γ m/m 0 p0 /(m 0 c) und p mv ( p0 )2 m 20 c2 ( p0 m 0 c)1/2( p0 m 0 c)1/2 lassen sich diese in die Form p0 m 0 c p ϕ R ( p) ϕ(0) , 2m 0 c( p 0 m 0 c)
p0 m 0c p ϕ L ( p) ϕ(0) 2m 0 c( p 0 m 0 c)
bringen. Eliminieren wir aus der ersten der beiden Gleichungen den gemeinsamen Ausgangszustand ϕ(0) mit Hilfe der zweiten, so erhalten wir unter Weglassen des Arguments der Spinoren ϕL
p0 m 0 c p0 m 0 c
p ϕR p
( p0 p) 1 (m 0 c)/( p 0 p) ϕR . 0 m 0c 1 ( p p)/(m 0 c)
14.4 Lorentz-Invarianz und Dirac-Gleichung
447 (12.79)
Wegen ( p0 p)( p 0 p)( p0 )2 ( p)2 ( p0 )2 p 2 m 20 c2 ist der zweite Bruch gleich eins (am besten zu beweisen, indem man den Bruch gleich eins setzt), und durch Ableitung eines entsprechenden Ergebnisses für ϕ R aus der zweiten Gleichung erhalten wir insgesamt die Beziehungen ϕL
p0 p ϕR , m 0c
ϕR
p0 p ϕL m 0c
(im Grenzfall p0 folgt hieraus mit p 0 mcm 0 c wie zu erwarten ϕ R ϕ L ) oder in Matrixnotation m 0 c p0 p ϕR 0. (14.26) 0 p p m 0 c ϕL Definieren wir jetzt ϕR 0 1 0 σl , γ0 , γl (14.27) ψ 1 0 ϕL σl 0 und beachten pα p0 , p, so erhalten wir dafür die kürzere Form (γ α pα m 0 c)ψ
0.
(14.28)
Mit der Quantisierungsvorschrift p0 c E i h∂ t und pi h oder zusammengefaßt pα p0 , pih ∂0 , ih∂ α wird daraus die Dirac-Gleichung h (14.29) γ α ∂α m 0 c ψ 0 . i Dies ist allerdings nicht die im Abschn. 2.2.2 der Relativistischen Quantenmechanik abgeleitete Standarddarstellung (auch Pauli-Dirac-Darstellung genannt), die eine andere Darstellung der Diracschen Gammamatrizen benutzt. Vielmehr handelt es sich um die chirale Darstellung – die Begründung für diesen Begriff wird sich später ergeben –, bei der wir im weiteren Verlauf bleiben werden. Aufgabe 14.1: Zeigen Sie, daß die unitäre Transformation 1 ϕR ϕL , γ Sα Sγ α S 1 ψ S Sψ 2 ϕR ϕL
mit
S
1 2
1 1
1 1
. (14.30)
von der hier angegebenen Darstellung der Dirac-Gleichung zu deren Standarddarstellung führt.
Lösung: Multipliziert man (14.29) von links mit S und fügt 1 S 1 S nach γ α ein, so ergibt sich h h γ Sα ∂α m 0 c ψ S 0 , Sγ α S 1 ∂α m 0 c Sψ i i
d.h. ψ S erfüllt die Dirac-Gleichung mit den Matrizen γ Sα . Für die letzteren erhält man mit S S (S T ) S S 2 1 bzw. S S 1 durch einfaches Ausrechnen die Standarddarstellung (2.172), 1 0 0 σl γ S0 , γ Sl . 1 σl 0 0
448
14 Teilchen, Felder und Lagrange-Funktion
Im Abschn. 2.4 der Relativistischen Quantenmechanik wurde gezeigt, daß die DiracGleichung Lösungen positiver und negativer Energie besitzt, von denen in dem hier betrachteten Fall der Kräftefreiheit die ersteren Spin-1/2-Teilchen und die letzteren den zugehörigen Antiteilchen zugeordnet werden können. Die zwei oberen Komponenten des Spinors beschreiben das Teilchen, die zwei unteren das Antiteilchen. Für m 0 0 handelt es sich dabei um Elektronen und Positronen, für m 0 0 um Neutrinos und Antineutrinos. (Die Möglichkeit, daß Neutrinos eine, wenn auch sehr kleine, Masse besitzen, wird in Abschn. 17.1 untersucht.) Betrachten wir als erstes Neutrinos. Diese bewegen sich mit Lichtgeschwindigkeit, wenn m 0 0 gilt, und daraus folgt für sie aus (14.7) p2 E 2 /c2 p02 . Aus der für die gemeinsamen Eigenzustände des Impuls- und Energieoperators gültigen Gleichung (14.26) ergeben sich in diesem Fall die entkoppelten Gleichungen
n ϕ L ϕ L ,
n ϕ R ϕ R ,
(14.31)
in denen n p/ p0 p/ p ein Einheitsvektor in der Bewegungsrichtung des Teilchens (Richtung von p) ist. (Wie diese Gleichungen aus (14.29) erhalten werden können, wird in Aufgabe 14.6 untersucht.) ϕ L und ϕ R sind demnach Eigenzustände des Operators n zu den Eigenwerten 1. Die Eigenwerte dieses Operators werden als Helizität bezeichnet. Da der Operator Sh /2 wesentliche Eigenschaften des Spins beschreibt, ist die Helizität (bis auf den Faktor h /2) die Projektion des Spins auf die Richtung von p. Interpretiert man den Spin als Drehimpuls, so bildet er für ϕ R mit der Bewegungsrichtung eine Rechts- und für ϕ L mit dieser eine Linksschraube. Dies liefert die nachträgliche Begründung für die Benennung der Spinorkomponenten ϕ L und ϕ R . Da sich Neutrinos nach unserer gegenwärtigen Interpretation stets mit Lichtgeschwindigkeit bewegen, können sie nicht auf v 0 abgebremst werden und anschließend ihre Geschwindigkeit umkehren. Daher ist ihre Rechts- oder Linkshändigkeit eine mit jedem Neutrino fest verbundene Teilcheneigenschaft. Dabei hat sich als empirischer Befund herausgestellt, daß in der Natur nur linkshändige Neutrinos und rechtshändige Antineutrinos existieren – eine theoretische Begründung hierfür wurde bisher nicht gefunden. Auch für massive Fermionen, die durch die Dirac-Gleichung beschrieben werden, also Elektronen und Positronen, hat sich der Begriff der Helizität im Rahmen der Elementarteilchentheorie als fundamental herausgestellt. Allerdings beschreibt er keine feste Teilcheneigenschaft, da z.B. ein rechtshändiges Elektron, das bei festgehaltenem Spin abgebremst wird und seine Geschwindigkeit umkehrt, in ein linkshändiges übergeht. Es ist daher nützlich, bei den Dirac-Spinoren ganz allgemein die Zerlegung ϕR 0 ϕR (14.32) , ψL ψ ψL ψR mit ψR ϕL ϕL 0 vorzunehmen. Die Zustände ψ L und ψ R können mit Hilfe von Projektionsoperatoren PL und PR , die durch 1γ 5 0 0 1γ 5 1 0 1 0 , PR , γ 5 (14.33) PL 0 1 0 0 0 1 2 2
(die Eins neben γ 5 ist die 4 4-Einheitsmatrix, die Eins als Matrixelement ist die 2 2Einheitsmatrix, zwischen der in (2.207) definierten Matrix γ S5 und der hiesigen besteht
14.4 Lorentz-Invarianz und Dirac-Gleichung der Zusammenhang γ S5 Sγ 5 S
1)
ψL
449
definiert sind, aus ψ herausprojiziert werden, PL ψ ,
ψR
PR ψ .
(14.34)
PL und PR erfüllen die leicht zu verifizierenden Gleichungen PL2 PL γ
α
PL ,
γ
α
PR2
PR ,
PR ,
PL
α
α
PR γ
γ
PR
1,
PL PR
PR PL 0 ,
PL ,
(14.35) (14.36)
und es gilt
ψL , ψ L ψ PR ,
PL ψ L
0, ψ R ψ PL
PL ψ R
PR ψ L
0,
PR ψ R
ψR
(14.37) (14.38)
(Aufgabe 14.7). Mit dem im Abschn. 2.9 der Relativistischen Quantenmechanik eingeführten Operator für den Spin, der in der hier benutzten chiralen Darstellung dieselbe Form (14.39) 0 0 wie in der Standarddarstellung besitzt – dies kann leicht mit Hilfe der Transformation ¼ S S 1 überprüft werden –, ergibt sich für Energie/Impuls-Eigenzustände von Neutrinos aus (14.31) mit einfacher Rechnung
nψ L
ψ L ,
nψ R
ψR ,
d.h. die Viererspinoren ψ L und ψ R sind bei masselosen Neutrinos Eigenzustände des Operators n zu den Eigenwerten 1. Im Fall massiver Teilchen ergibt sich dagegen z.B. für ψ R aus (14.26) die Beziehung ( p 0 p)ϕ R m 0 cϕ L 0, für die wir auch E m 0c ϕ L n ψ R ψR 0 pc p schreiben können, d. h. in diesem Fall sind ψ L und ψ R nicht mehr Eigenzustände von n mit wohldefinierter Helizität. (Dies bedeutet, daß die übliche Bezeichnung als links- und rechtshändige Zustände nicht besonders glücklich gewählt ist.) α ψ liefert die Zerlegung (14.32) Für den Teilchenstrom j α cψγ
αψ ψγ
L PR )γ α (PL PR )ψ ψ(P ψ PL γ α PL ψ ψ PL γ α PR ψ ψ PR γ α PL ψ ψ PR γ α PR ψ (14.34),(14.36),(14.38) α PL PR ψ ψ PL PR γ α ψ ψ R γ α ψ R ψ L γ α ψ L ψγ (14.35d) ψ L γ α ψ L ψ R γ α ψ R , (14.35c)
d.h. dieser läßt sich in einen links- und einen rechtshändigen Anteil zerlegen, jα
jLα
j Rα
mit
j Lα
c ψ L γ α ψL ,
j Rα
c ψ R γ α ψ R .
(14.40)
450
14 Teilchen, Felder und Lagrange-Funktion
Für die Teilchendichte ergibt sich mit ähnlicher Rechnung die Zerlegung ψψ
ψL ψR
ψ R ψL ,
(14.41)
diese zerfällt nicht in einen links- und einen rechtshändigen Anteil. Auch für die Dirac-Gleichung gibt es ein Hamiltonsches Variationsprinzip (14.2), wenn man die Lagrange-Dichte hc ψ γ α ∂α ψ m 0 c2 ψψ mit ψ ψ γ0 (14.42) i
benutzt (siehe Quantenfeldtheorie, Abschn. 7.4.4). Aus der offensichtlichen Invarianz von gegenüber der globalen Eichtransformation ψ ei Λψ bzw. deren infinitesimaler Variante ψ ψ i ψ dΛ folgt aus (14.6) ∂ ∂ i ψ dΛ 0 ∂ x α ∂ ∂α ψ
und damit der Erhaltungssatz ∂α j α
0
jα
mit
cψγ α ψ
(14.43)
für die Teilchenstromdichte j α . (Es sei daran erinnert, daß ψγ α ψ ein Vierervektor ist, ψ γ α ψ dagegen nicht.)
Aufgaben 14.2
Schätzen Sie ab, wie wie groß der relative Massendefekt bei der Bindung zweier Teilchen sein muß, damit eine relativistisch Behandlung des Zwei-TeilchenSystems erforderlich wird.
14.3
Zeigen Sie, daß die Generatoren K i bei Spiegelungen am Koordinatenursprung in K i übergehen, während die Generatoren Ji unverändert bleiben.
14.4
Zeigen Sie, daß die beiden Matrizen U L ei ( i )/2 und U R ei ( i )/2 nicht durch eine Ähnlichkeitstransformation ineinander überführt werden können, d.h. daß die Gleichung U L T 1 U R T keine Lösung besitzt.
14.5
Beweisen Sie die Beziehung e nϕ
14.6
Leiten Sie aus der Dirac-Gleichung (14.29) die Beziehungen (14.31) ab. Anleitung: Lösen Sie die Dirac-Gleichung mit dem Ansatz ψ Aei (Et pr)/h .
14.7
Beweisen Sie die Beziehungen (14.35)–(14.38).
14.8
Welche Projektionsoperatoren projizieren aus einem Spinor ψ der Standarddarstellung der Dirac-Gleichung die Zustände ψ L und ψ R heraus?
cosh ϕ σ n sinh ϕ.
15
Eichinvarianz und Eichfelder
Wir haben festgestellt, daß die Klein-Gordon-Schrödinger-Gleichung gegenüber den – nach (12.9) eine Darstellung der Gruppe U (1) bildenden – Eichtransformationen
e (∂ Φ i Φ ∂ Λ) , (15.1) von Einerspinoren Φ (mit einer Komponente φ Φ) invariant ist, sofern Λ räumlich und zeitlich konstant ist. Λconst bedeutet, daß es sich dabei um globale Transformationen e i Λ Φ
Φ¼
∂α Φ ¼
iΛ
α
α
handelt. Diese werden auch als Eichtransformationen erster Art bezeichnet – besser wäre die Bezeichnung „Phasentransformationen“. Wenn man bei der Wellenfunktion Φ(x) zu einer anderen Phase übergehen möchte, muß das also in allen Raumpunkten gleichzeitig in derselben Weise geschehen. Es hat sich als ein äußerst fruchtbares Konzept erwiesen, die Invarianz gegenüber Phasentransformationen als lokale Eigenschaft zu fordern, also die Invarianz der Theorie gegenüber Transformationen (15.1), bei denen Λ vom Ort und von der Zeit abhängt, Λ Λ(x, t). (Es erscheint plausibel, daß man in Punkten der RaumZeit, die nicht kausal miteinander verknüpft sind, die Phasen unabhängig voneinander wählen darf. Das liefert eine Motivation, wenn auch keine zwingende Begründung für dieses Konzept.) Gegenüber einer derartigen lokalen Transformation, die als Eichtransformation zweiter Art bezeichnet wird, ist die Klein-Gordon-SchrödingerGleichung (14.8) jedoch nicht invariant. Nun wissen wir aus der Quantenmechanik, daß die Schrödinger-Gleichung, die bei Abwesenheit von Feldern nicht gegenüber lokalen Eichtransformationen invariant ist, diese Eigenschaft erwirbt, wenn geladene Teilchen betrachtet werden, die an ein elektromagnetisches Feld gekoppelt sind. Gleichzeitig müssen jedoch die Potentiale des elektromagnetischen Felds gemäß Φel Φel¼ Φel (h /q)∂t Λ und A A¼ A (h /q) Λ oder in relativistischer Schreibweise wegen Aα φ/c, A gemäß A¼α A α (h/q)∂ α Λ umgeeicht werden (siehe Quantenmechanik, Aufgabe Q3.5); dabei ist q die elektrische Ladung der durch Aα beschriebenen Teilchen. Im nächsten Abschnitt werden wir sehen, daß das auch für die Klein-Gordon-Schrödinger-Gleichung gilt. Anders als in der Quantenmechanik werden wir dabei allerdings nicht von einer Gleichung mit Einschluß elektromagnetischer Felder ausgehen, sondern vielmehr die Forderung nach lokaler Eichinvarianz an die Spitze stellen. Es stellt sich heraus, daß das Klein-Gordon-Schrödinger-Feld hierzu an ein Feld gekoppelt werden muß, das die Eigenschaften des elektromagnetischen Feldes besitzt. Außer den durch die Gruppe U (1) vermittelten Eichtransformationen haben wir noch die durch die Gruppe SU (2) vermittelten Transformationen (13.20) im Isospinraum und die durch die Gruppe SU (3) vermittelten Transformationen (13.36) im Farbraum als Transformationen zwischen verschiedenen Ausprägungen gewisser Teilcheneigenschaften kennengelernt. Für die Transformationen (13.20) und (13.36) schreiben
452
15 Eichinvarianz und Eichfelder
wir hier kürzer Φ2¼
ei
¡
Φ2
Φ3¼
bzw.
ei ¡ Φ3
(15.2)
mit Isospin-Dubletts oder Isospinoren Φ2 und dreikomponentigen Farbzuständen bzw. Farbtripletts Φ3 ( ist ein Vektor mit drei und ein Vektor mit acht Komponenten). Motiviert durch den Erfolg bezüglich der Forderung nach lokaler Eichinvarianz bei den durch die Gruppe U (1) beschriebenen Eichtransformationen werden wir auch hier annehmen, daß eine ähnlich wie (14.9) oder (14.12) aufgebaute Lagrange-Dichte gegenüber Transformationen der Form (15.2) mit (x) und (x) invariant ist. Auch die durch die Gruppen SU (2) und SU (3) vermittelten Transformationen werden wir als lokale Eichtransformationen bezeichnen.
15.1
U º1»-Invarianz von Klein-Gordon-Schrödinger- und Dirac-Feld
Klein-Gordon-Schrödinger-Feld. Für Λ len Transformationen
Φ dΦ , dΦ i Φ dΛ , d∂ Φ i dΛ ∂ Φ i Φ ∂ dΛ ,
dΛ erhält man aus (15.1) die infinitesima-
Φ¼
mit
α
α
∂α Φ ¼ dΦ £ d∂α Φ £
α
∂ Φ d∂ Φ α
(15.3)
α
i Φ dΛ , i dΛ ∂ Φ i Φ £
£
α
(15.4) £
∂α dΛ , (15.5)
auf die wir uns bei unseren Betrachtungen beschränken können. Beweis: Für Λ Φ
¼
dΦ
dΛ gilt e i dΛ Φ Φ
¼
(1i dΛ) Φ
Φ i dΛ Φ ,
Φ i dΛ Φ , d∂α Φ
∂α Φ
∂α Φ ¼
¼
∂α Φ i Φ∂α dΛi dΛ ∂α Φ
∂α Φ i dΛ ∂α Φ i Φ∂α dΛ .
Die Invarianz der Feldgleichungen gegenüber allgemeinen Eichtransformationen zweiter Art (15.1) ist gewährleistet, wenn wir eine Lagrangedichte finden, die gegenüber den infinitesimalen Eichtransformationen (15.3) mit dΛ dΛ(x) invariant ist. Um eine derartige Dichte zu finden, berechnen wir zunächst die Änderung, welche die Dichte (14.9) bei den Transformationen (15.3) erfährt. Der Masseterm m 0 c2 ΦΦ £ /2 der Dichte (14.9) ist offensichtlich sogar gegenüber den endlichen lokalen Transformationen (15.1) invariant, denn für diese gilt Φ ¼ Φ ¼£ ΦΦ £ . Wir brauchen uns um ihn daher nicht zu kümmern und erhalten ∂ ∂ d(∂α Φ) d(∂α Φ £ ) d ∂(∂α Φ) ∂(∂α Φ £ ) 2 (14.9),(15.5) ih ∂ α Φ £ (dΛ ∂α Φ Φ ∂α dΛ) ∂ α Φ (dΛ ∂α Φ £ Φ £ ∂α dΛ) 2m 0 ih 2 ∂α dΛ £ α (14.11) (Φ ∂ Φ Φ∂ α Φ £ ) h J α ∂α dΛ . 2m 0
15.1 U (1)-Invarianz von Klein-Gordon-Schrödinger- und Dirac-Feld
453
Für das weitere setzen wir g1 und definieren durch d A α (x)
q/h
(15.6)
1 ∂α dΛ(x) g1
(15.7)
ein neues Feld A α (x). Der (konstante) Vorfaktor 1/g1 ist an sich belanglos, da er in die Definition des Feldes Aα (x) hineingezogen werden könnte ( g1 Aα A ¼α A α ). Er wurde hinzugefügt, um später die physikalische Bedeutung dieses Feldes besser identifizieren zu können. Mit dieser Definition erhalten wir d q J α d Aα q d(J α Aα ) A α d J α .
Mit d Jα
ih α (∂ Φ dΦ Φ d∂ α Φ ∂ α Φ dΦ Φ d∂ α Φ ) 2m 0
(14.11)
(15.4) (15.5)
h ΦΦ ∂ α dΛ m0
(15.7)
q ΦΦ d Aα m0
und d(ΦΦ )0 ergibt sich daraus d
q d(J α Aα ) mq
0
bzw. d
ΦΦ A α d Aα 2
q d 2m
0
q
q d(J α A α ) d(ΦΦ A α Aα ) 2m 0
ΦΦ A α Aα q J α Aα
0.
ist eine neue Lagrange-Dichte, die gegenüber den lokalen Eichtransformationen
(15.1) invariant ist und für die wir mit (14.9) und (14.11b)
m 0 c2 ΦΦ q 2 ΦΦ i hq α Aα A α (Φ ∂ Φ Φ∂ α Φ )A α (∂α Φ) ∂ α Φ 2 2m 2m 0 0 0
1 h h α α 2 2 ∂ Φ q A Φ m 0 c ΦΦ ∂α Φ q Aα Φ 2m 0 i i 2
h 2m
erhalten. Sie geht aus durch die als minimale Kopplung bezeichnete Ersetzung (h/i)∂α (h/i)∂α q Aα hervor und ist gerade die Lagrange-Dichte, die man für die Klein-Gordon-Schrödinger-Gleichung elektrisch geladener Teilchen im elektromagnetischen Feld erhält, wenn das durch (15.7) definierte Hilfsfeld A α (x) mit dem Vektorpotential des elektromagnetischen Feldes identifiziert wird. (Weiter unten wird gezeigt, daß die Klein-Gordon-Schrödinger-Gleichung die zu gehörige Variationsgleichung ist.) Allerdings enthält das elektromagnetische Feld nur in Termen, die an das Teilchenfeld Φ gekoppelt sind. Damit die Einführung des zusätzlichen Feldes Aα physikalisch sinnvoll wird, sollte die neue Lagrange-Dichte für dieses auch noch einen Anteil enthalten, der nicht an Φ gekoppelt ist, also nicht mit Φ verschwindet. Dieser Anteil (bzw. die durch ihn beschriebenen Teilchen) kann also auch unabhängig vom Feld Φ für sich alleine existieren und wird deshalb als „freier Feldanteil“ bezeichnet (siehe
454
15 Eichinvarianz und Eichfelder
unten Anmerkung). Wir werden dafür die Bezeichnung Freifeld-Anteil benutzen. Wir verlangen, daß er wie der Freifeld-Anteil des Feldes Φ(x) eine quadratische Funktion der Feldableitungen und ebenfalls eichinvariant ist. Diese Forderungen werden erfüllt, wenn wir die Lagrange-Dichte zu 1 h h α m 0 c2 1 α ∂ ∂ ΦΦ Φ q A Φ Φ q A Φ Fαβ F αβ tot α α 2m 0 i i 2 4μ0
mit Fαβ
∂α Aβ
∂β A α
(15.8)
erweitern, 2denn die Integration von Gleichung (15.7) führt mit 2 ∂α dΛ d∂α Λ∂α Λ zu A¼α A α (1/g1 )∂α Λ ,
2
d A α A¼α A α sowie (15.9)
und die Ableitungen von Λ heben sich wegen ∂α ∂β Λ∂β ∂α Λ heraus, wenn man in der ¼ Definition (15.8) von ungestrichenen zu gestrichenen Größen übergeht, Fαβ Fαβ . Es ist üblich, die Notation zu vereinfachen, indem man eine kovariante Ableitung1 Dα Φ mit dem Operator Dα
∂α
i g1 A α
(15.10)
einführt, die sich bei den endlichen Eichtransformationen Φ ¼ e Λ Φ wie Φ transformiert, (15.9) (Dα Φ)¼ Dα¼ Φ ¼ (∂α i g1 A ¼α )Φ ¼ ∂α i g1 Aα i (∂α Λ) e i ΛΦ
e
iΛ
(∂α
i g1 A α ) Φ
e
iΛ
Dα Φ .
(15.11)
(Im Exkurs 15.1 wird gezeigt, daß die Einführung der kovarianten Ableitung mehr als eine bequeme Abkürzung bedeutet.) Mit (15.10) und (15.6) erhält die Lagrange-Dichte die Form h 2 tot 2m
0
(Dα Φ)(D α Φ)£
m 0 c2 ΦΦ £ 2
1 Fαβ F αβ , 4μ0
(15.12)
deren Invarianz bezüglich des Φ-abhängigen Anteils gegenüber lokalen Eichtransformationen mit (15.11) unmittelbar evident ist. Man könnte noch daran denken, in tot einen Masseterm für die durch das Feld Aα beschriebenen Teilchen hinzuzufügen, der in Analogie zu (14.14) die Form m 2A c2 Aα A α /(2μ0 h 2 ) besitzen müßte. Dieser wäre jedoch gegenüber den Feldtransformationen (15.9) nicht invariant und muß daher entfallen. Dies hat zur Folge, daß die Quanten des Feldes Fαβ die Ruhemasse null besitzen.
1 Es besteht eine enge Parallelität zwischen der hier definierten kovarianten Ableitung und derjenigen der ART. In der ART ist die kovariante Ableitung Dα V β des Vektors V β dadurch definiert, daß sie sich wie ein Tensor transformiert, hier muß sich die kovariante Ableitung eines – im momentan betrachteten Fall einkomponentigen – Zustands wie der Zustand selbst transformieren. Weitere Verwandtschaften werden wir weiter unten feststellen.
15.1 U (1)-Invarianz von Klein-Gordon-Schrödinger- und Dirac-Feld
455
Ihr Spin ist gleich eins, weil sie durch einen relativistischen Vierervektor beschrieben werden. Die Konstante 1/μ0 im letzten Term der rechten Seite von Gleichung (15.12) wurde hinzugenommen, damit dieser die gleiche Dimension wie die anderen Terme besitzt. Der Zahlenfaktor 1/4 ist dagegen willkürlich und wurde so gewählt, daß sich aus den Variationsgleichungen (14.4) bezüglich Aα genau die Gleichungen für das Vektorpotential der Elektrodynamik ergeben. Mit
∂ tot ∂(∂α A β )
q Jβ ,
∂ tot ∂ Aβ
1 α β β α (∂ A ∂ A ) , μ0
wobei Jα
i h 2m Φ Dα Φ
Φ(D α Φ)
0
(15.13)
einen verallgemeinerten Teilchenstrom darstellt, ergeben diese nämlich gerade die Gleichungen (14.13) mit der Stromdichte j α q J α . (Wäre statt 1/4 ein anderer Faktor gewählt worden, so würde A α nur bis auf einen Faktor mit dem Vektorpotential der Elektrodynamik übereinstimmen.) Die Forderung nach lokaler Eichinvarianz impliziert also nicht nur die Existenz eines Feldes, das an die durch das Klein-GordonSchrödinger-Feld beschriebenen Teilchen ankoppelt, sondern liefert in gewisser Weise sogar eine Ableitung der Maxwell-Gleichungen, wenn man Eichinvarianz und die Forderung, daß das freie Feld ähnlich wie andere Quantenfelder in die Lagrange-Dichte eingeht, als Voraussetzungen akzeptiert. Die Variation von tot nach Φ liefert mit
∂ tot ∂(∂α Φ ) die Gleichung
2 (15.12) h
2m 0
∂ tot ∂Φ
Dα Φ ,
h 2 ∂α D α Φ 2m 0
bzw.
(15.12)
h 2 i q α A Dα Φ 2m 0 h
h 2 2m
(h 2 Dα D α
m 0 c2 Φ 2
m 0 c2 Φ 2
iq α A Dα Φ 0 h
m 20 c2)Φ 0 .
(15.14)
Nach Abschn. 4.1 der Relativistischen Quantenmechanik ist das die Klein-GordonSchrödinger-Gleichung für ein elektrisch geladenes Teilchen im elektromagnetischen Feld. Dirac-Feld. Da jede Komponente einer Lösung ψ der Dirac-Gleichung die KleinGordon-Schrödinger-Gleichung erfüllt, ist auch die Dirac-Gleichung lokal eichinvariant, wenn in ihr ∂α durch Dα aus Gleichung (15.10) ersetzt wird. Das läßt sich auch unmittelbar aus der (14.42) entsprechenden Lagrange-Dichte
h c ψ γ α Dα ψ i
m 0c
2
ψψ
(15.15)
456
15 Eichinvarianz und Eichfelder
ablesen. Daher erhält man die Dirac-Gleichung für ein elektrisch geladenes Teilchen im elektromagnetischen Feld aus der für ein freies Teilchen durch die Ersetzung ∂a Dα , h h Dα m 0 c ψ γ α ∂α q Aα ψ m 0 cψ 0 . γα (15.16) i i
Fügt man in der Erweiterung der Lagrange-Dichte (14.42) wie in (15.12) noch einen Freifeld-Anteil für das elektromagnetische Feld hinzu, so nimmt sie die Form
4μ1 hic ψ γ α ∂α ψ qcψ γ α ψ Aα m 0 c2 ψψ
0
Fαβ F αβ
(15.17)
an, wobei der Faktor vor dem Freifeld-Anteil so gewählt wurde, daß sich durch Variation nach Aα wieder die Maxwell-Gleichungen (14.13) mit j β q J β qc ψγ β ψ ergeben. Der Term qcψ γ α ψ Aα in stellt die Wechselwirkung des durch ψ beschriebenen Teilchens der elektrischen Ladung q mit dem elektromagnetischen Feld dar.
Anmerkung: Daß tot nur dann lokal eichinvariant ist, wenn die Felder Φ und Aα aneinander gekoppelt sind, bedeutet nicht, daß diese nicht frei existieren können. Φ ist dann frei, wenn A α 0 ist, was nach (15.7) Λ const zur Folge hat. Globale Eichtransformationen sind jedoch unter den lokalen mit enthalten. (Durch den Zusammenhang (15.7) werden die Eichtransformationen, denen gegenüber Invarianz besteht, von der Art des betrachteten Feldes Aα (x) abhängig.) A α ist frei, wenn Φ 0 gilt. Auch diese Möglichkeit wird durch die Eichtransformationen (15.1) nicht ausgeschlossen.
15.2
SU º2»-Invarianz und Yang-Mills-Feld
Isospinpaare des Klein-Gordon-Schrödinger-Feldes. Wir betrachten zwei Teilchen, die ein Isospinpaar bilden und durch Isospin-Dubletts Φ(x)
φφ (x) (x) 1
(15.18)
1
(wir schreiben statt Φ2 wie in (15.2) hier und im folgenden einfacher Φ) beschrieben werden, deren Komponenten φi (x) der Klein-Gordon-Schrödinger-Gleichung genügen. Bei der Forderung nach lokaler Invarianz gegenüber den im Raum der Isospin-Dubletts vermittelten Transformationen Φ ¼ ei Φ müßte man im Prinzip wie in Abschn. 15.1 vorgehen. Wir können uns die Arbeit jedoch aufgrund der dort gemachten Erfahrungen erheblich erleichtern, indem wir gleich versuchen, eine geeignete kovariante Ableitung der Isospinoren zu definieren. Wenn sich diese wie der Isospinor selbst transformiert, ergibt sich wieder unmittelbar die Invarianz des Ableitungsterms in der LagrangeDichte. Es ist offensichtlich, daß Invarianz nur dann vorliegen kann, wenn das Isospinorfeld Φ(x) an ein Zusatzfeld gekoppelt ist. Da wir jetzt aber statt der einen Phase Λ
15.2 SU (2)-Invarianz und Yang-Mills-Feld
457
im Vektor drei Phasenfaktoren haben, müssen wir statt der Ankopplung von φ an das eine Feld A α jetzt die Ankopplung von Φ an drei Felder Wkα , k 1, 2, 3, erwarten, die in Analogie zu (15.7) aus θk durch die Ableitungen ∂α θk hervorgehen. (Die Wkα können zu einem räumlichen Dreiervektor Wα zusammengefaßt werden, dessen Komponenten relativistische Vierervektoren sind.) Da in Φ ¼ ei Φ die gleiche Rolle spielt wie Λ in φ ei Λ φ, wählen wir für die kovariante Ableitung in Analogie zu (15.10) den Ansatz Dα ∂α i g2 Wα . (15.19) Das Feld Wα (x) wird als Yang-Mills-Feld bezeichnet. Die Kopplungskonstante g2 ersetzt g1 q/h und wird offen gelassen. (In Bezug auf sie gelten die gleichen Bemerkungen wie zu g1 : Auch g2 könnte in die Definition der Felder Wα hineingezogen werden.) Man beachte, daß (15.19) eine Gleichung zwischen 22-Matrizen ist, die ausführlicher 1 Dα 1 ∂α i g2 Wα (mit 1 Einheitsmatrix) lauten müßte. Das Transformationsgesetz für Wα bestimmen wir aus der (15.11) entsprechenden Forderung (Dα Φ) ei Dα Φ für Φ ei Φ . (15.20) Aus für alle Φ (Dα Φ) Dα Φ Dα U Φ U Dα Φ mit U ei
folgt Dα U U Dα und Dα
U Dα U .
(15.21)
Zur Auswertung dieser Beziehung betrachten wir wieder infinitesimale Transformationen und benutzen ei
d
Hiermit und mit U U 1 1i erster Ordnung in d ∂α i g2
Wα i g2
∂α i g2
d Wα
Wα i
d ,
1i
Dα
(∂α d )i
Wα
Wα d Wα .
(15.22)
d ergibt sich aus (15.19) und (15.21) bis zu Termen
d )(∂α i g2
(1i
d ∂ α g2
Wα )(1i
d i
Wα
d)
d ∂α g2
d
Wα
oder nach paarweise gegenseitigem Wegheben von sechs Termen d Wα
(∂α d )/g2 i( Wα
d
d
Wα ) 0
bzw. in Komponenten 3 k 1
σk d Wkα
(∂α dθk )/g2
i
3
Wiα dθ j (σi σ j σ j σi ) 0 .
i, j 1
Indem wir die Vertauschungsrelation (12.77) benutzen, für die wir wegen εi j k 0 für k i und k j auch 3 σi σ j σ j σi 2i εi j k σk (15.23) k 1
458
15 Eichinvarianz und Eichfelder
schreiben können, erhalten wir daraus 3
σk d Wkα
(∂α dθk )/g2
2
k 1
3
εi j k Wiα dθ j
0.
i, j 1
Diese Gleichung ist erfüllt, wenn die eckige Klammer verschwindet bzw. wenn in Vektornotation (15.24) d Wα ∂α d /g2 2 d Wα 2 2 (hierfür wurde εi j k εki j benutzt) gilt. Durch Integration d Wα Wα¼ Wα , d etc. (Wα ist unabhängig von ) ergibt sich daraus Wα ∂α /g2 2
Wα¼
Wα .
(15.25)
An diesem Ergebnis manifestiert sich ein wesentlicher Unterschied zwischen der nicht-Abelschen Gruppe SU (2) und der Abelschen Gruppe U (1) in dem zu Wα proportionalen letzten Zusatzterm, der in dem für die letztere erhaltenen Ergebnis (15.9) kein Analogon besitzt. Der Term ist darauf zurückzuführen, daß die Erzeuger nichtAbelscher Gruppen nicht kommutieren. Er wird uns gleich dazu zwingen, in einem dem Feld (15.8) entsprechenden Feldtensor einen nichtlinearen Term hinzuzufügen, der zu wesentlichen Unterschieden des physikalischen Verhaltens gegenüber dem Feld Fαβ führt. Wie im Fall der zur Gruppe U (1) gehörigen lokalen Eichtransformation müssen wir jetzt für die Lagrange-Dichte noch einen dem Feld Wα zugeordneten Freifeld-Anteil bestimmen. Es ist naheliegend, hierfür zunächst in Analogie zu (15.8) einen Feldtensor der Form αβ ∂α Wβ ∂β Wα W (15.26)
αβ W αβ /4μ0 liefert. Damit anzusetzen, der in der Lagrange-Dichte den Beitrag W dieser gegenüber den infinitesimalen Eichtransformationen (15.22b) invariant ist, muß αβ d W αβ )(W αβ d W αβ ) W αβ W αβ und daraus folgend (W αβ d W αβ W
0
(15.27)
gelten. Mit dem Ansatz (15.26) und dem Transformationsgesetz (15.24) für Wα ergibt sich
αβ dW
∂α d Wβ ∂β d Wα
∂β ∂α d )/g22∂α (d Wβ )∂β (d Wα ) ) Wβ (∂β d ) Wα .
(∂α ∂β d
2d W αβ 2(∂α d
Nun gilt mit (15.24) g2 d(Wα Wβ )
g2 (d Wα Wβ
(∂α d
Wα d Wβ ) (∂α d )Wβ (∂β d )Wα 2g2 (d Wα )Wβ Wα (d Wβ ) ) Wβ (∂β d )Wα 2g2 d (Wα Wβ ) ,
15.2 SU (2)-Invarianz und Yang-Mills-Feld
459
wobei zuletzt die aus (a b) c(b c) a (c a) b0 (Jacobi-Identität) folgende Beziehung (a b) cb (a c)a (b c) benutzt wurde. Damit können wir unser letztes Ergebnis in
αβ dW
αβ W
2d
2g2 d(Wα
Wβ ) 4g2 d
(Wα Wβ )
umschreiben, und offensichtlich wird damit die Bedingung (15.27) nicht erfüllt. Setzen αβ 2g2 Wα Wβ , ausführlicher wir jedoch Wαβ W Wαβ
∂α Wβ ∂β Wα 2g2 Wα
Wβ ,
(15.28)
so gilt d Wαβ
d W αβ 2g2d(Wα
Wβ ) 2d
αβ (W
2g2 Wα
Wβ ) 2 d
Wαβ ,
und das neue Feld Wαβ erfüllt W αβ d Wαβ 0, denn: Wα und W α sind für festes α αβ zueinander parallele Dreiervektoren, was sich für festes α und β auf die Vektoren W αβ αβ αβ und W bzw. Wαβ und W überträgt. Wαβ W ist also eichinvariant, Wαβ allerdings (anders als Fαβ im Falle der U (1)-Symmetrie) nicht. Damit erhalten wir in h 2 2m
0
(Dα Φ) (D α Φ)
1 Wαβ W αβ 4μ0
(15.29)
bis auf den fehlenden Masseterm eine Lagrange-Dichte mit einem Freifeld-Anteil für das Feld Wα , welche die gleiche Struktur wie die Dichte (15.12) des Klein-GordonSchrödinger-Feldes aufweist und gegenüber den Transformationen (15.20) und (15.25) invariant ist. Durch den Faktor 1/(4μ0 ) im letzten Term erhält das Feld Wα die Dimension des Vektorpotentials Aα . Das ist möglich, weil die Dimensionen der Kopplungskonstanten g2 und des Feldes Wα so bestimmt werden können, daß in den Gleichungen (15.19) und (15.29) alle Terme die gleiche Dimension haben (Aufgabe 15.2). Jetzt untersuchen wir, wie ein Masseterm des Isospinorfeldes Φ(x) aussehen müßte. Wenn wir wie beim Proton und Neutron voraussetzen, daß die beiden zu einem Isospinpaar zusammengefügten Teilchen die gleiche Ruhemasse m 01 m 02 m 0 besitzen, hat ein Masseterm in der Lagrange-Dichte die Form
M m 02c
2
(φ1 φ1 φ2 φ2 )
m 02c
(15.18)
2
Φ Φ
(15.30)
und ist eichinvariant. Die Frage ist, ob auch der Fall m 01 m 02 möglich wäre. In diesem müßte der Masseterm die Form
M m 012 c
2
φ1 φ1
m 02 c2 φ2 φ2 2
haben, die jedoch nicht eichinvariant ist. Nun gilt m 01 m 01 φ1 φ1 m 02 φ2 φ2 (φ1 , φ2 ) 0
0 m 02
(15.31)
φ1 φ2
.
460
15 Eichinvarianz und Eichfelder
Daher liefert
c2 Φ MΦ 2
M
mit einer durch M
m 01 0
0 m 02
(15.32)
(15.33)
definierten Massematrix einen eichinvarianten Masseterm, wenn man verlangt, daß sich M bei den untersuchten SU (2)-Transformationen Φ U Φ mit U ei gemäß M
U MU
(15.34)
transformiert: Nach Konstruktion gilt dann Φ M Φ
Φ
U U MU U Φ
Φ
MΦ .
Die angesetzte Diagonalgestalt der Massematrix liegt aber nur in einer speziellen Eichung vor und geht bei Eichtransformationen verloren. M nimmt also nur für eine ganz bestimmte, durch den Winkel der Transformationsmatrix U definierte Richtung des Isospinraums, die auch noch von dem betrachteten Punkt x der Raumzeit abhängen kann, die Form (15.31) an, für die sich den beiden durch Φ beschriebenen Teilchen wohldefinierte und unterschiedliche Ruhemassen zuordnen lassen. Eine derartige Auszeichnung einer Isospinrichtung erscheint durch die Forderung nach unterschiedlichen Ruhemassen physikalisch nicht gut genug begründet. Falls sie jedoch der Präsenz eines zusätzlichen Feldes zugeschrieben werden könnte, wäre die Situation eine andere. Diese Möglichkeit wird in Abschn. 15.4 weiterverfolgt. Ein Masseterm des Yang-Mills-Feldes sollte die Form m 2W c2 Wα W α /(2μ0 h 2 ) haben, wäre jedoch gegenüber den Transformationen (15.25) nicht invariant und muß daher (vorerst) entfallen. Ließe sich dafür kein Ersatz finden, so würde dies bedeuten, daß die Feldquanten verschwindende Ruhemasse besitzen. Wir werden später allerdings gute Argumente dafür finden, warum sie doch massiv sein sollten. Das in Abschn. 15.4 untersuchte Konzept der Erklärung von Teilchenmassen durch ein Higgs-Feld bringt nicht nur für das eben untersuchte Masseproblem des Φ-Feldes eine befriedigendere Lösung, sondern verschafft gleichzeitig auch den Quanten des Yang-Mills-Feldes eine solche. Deren Spin ist wie der des Photons gleich eins, weil die Felder Wkα (x) , k 1, 2, 3, relativistische Vierervektoren sind. Die Kopplungskonstante g2 geht anders als im Fall des elektromagnetischen Feldes mit in die Definition (15.28) des Feldstärketensors und, wie wir später sehen werden, in die Feldgleichungen ein. Sie kann daher nicht wie im Fall des Elektromagnetismus, wo g1 q/h je nach Teilchensorte unterschiedliche Werte annehmen kann, individuellen Gegebenheiten angepaßt werden, sondern hat universellen Charakter.
Isospinpaare des Dirac-Feldes. Jetzt betrachten wir zwei Teilchen, die ein Isospinpaar bilden und durch Isospin-Dubletts bzw. dazu adjungierte Isospin-Dubletts ψ
ψ1 ψ2
bzw.
ψ
(ψ 1 , ψ 2 )
(15.35)
15.2 SU (2)-Invarianz und Yang-Mills-Feld
461
beschrieben werden, deren Komponenten ψi (x) der Dirac-Gleichung genügende Viererspinoren sind. Auch die Dirac-Gleichung kann durch die Kopplung an ein Yang-Mills-Feld invariant gegenüber lokalen SU (2)-Transformationen gemacht werden. Dazu fassen wir die Lagrange-Dichte der zwei durch ψ1 und ψ2 beschriebenen Teilchen unter vorläufigem Weglassen von Massetermen zunächst zu einer einzigen zusammen,
h c ψ 1 γ α ∂α ψ1 ψ 2 γ α ∂α ψ2 . i
(15.36)
Im folgenden benutzen wir auch für Isospinoren die für Zweierspinoren eingeführte Produktregel ψ 1 ψ1 ψ 2 ψ2 , ψψ außerdem definieren wir zur Vereinfachung der Schreibweise α ψ1 γ ψ1 . γα ψ2 γ α ψ2
(15.37)
Die 44-Matrizen γ α sollen also die Struktur der Isospin-Dubletts unverändert lassen und nur auf die in diesen enthaltenen Viererspinoren einwirken. Damit erhalten wir α ψ1 γ ∂α ψ1 α α ∂α ψ ψ 1 γ α ∂α ψ1 ψ 2 γ α ∂α ψ2 (ψ 1 , ψ2 ) ( ψ , ψ )γ ∂ ψγ 1 2 α γ α ∂α ψ2 ψ2 und
α ∂α ψ . hic ψγ
(15.38)
Die durch unitäre 22-Matrizen U vermittelten unitären Transformationen ¼ ψ1 U11 U12 ψ1 U11 ψ1 U12 ψ2 U ψ ψ¼ ψ2¼ U21 U22 ψ2 U21 ψ1 U22 ψ2 wirken nur im Isospinraum und lassen die Viererspinoren ψ1 bzw. ψ2 unbeeinflußt. Für den adjungierten Isospinor ψ ¼ ergibt sich (15.39) ψ ¼ U ψ U11 ψ1 U12 ψ 2 , U21 ψ1 U22 ψ 2 U , U11 ψ 1 U12ψ 2 , U21 ψ 1 U22 ψ 2 ψ 1 , ψ 2 U11 UU21 ψU 12 22 da die Ui j komplexe Zahlen sind. Die für das Klein-Gordon-Schrödinger-Feld definierte kovariante Ableitung (15.19) ist auch für Isospinpaare des Dirac-Feldes brauchbar, denn aus (15.21) folgt (Dα ψ)
Dα ψ U Dα U U ψ U (Dα ψ)
und es gilt
für
ψ
Uψ ,
, U ψ ψψ ψU α U U Dα ψ ψγ α Dα ψ , γ α U Dα ψ ψγ ψ γ α (Dα ψ) ψU ψψ
462
15 Eichinvarianz und Eichfelder
weil die 2 2-Matrix U und die 4 4-Matrizen γ α miteinander vertauschen. Damit ist die Invarianz der Lagrange-Dichte (15.38) gegenüber den unitären Transformationen U bewiesen, wenn in ihr die Ersetzung ∂α Dα vorgenommen wird. Ein eichinvarianter Masseterm mit gleichen Ruhemassen m 01 m 02 m 0 hätte die Form
. M m 0c2 ψψ
Ein eichinvarianter Masseterm mit voneinander verschiedenen Ruhemassen ließe sich in Analogie zu (15.32) konstruieren, wird jedoch aus den gleichen Gründen wie dort verworfen. Wir fügen der Lagrange-Dichte noch den schon bei der Klein-Gordon-SchrödingerDichte abgeleiteten Freifeldanteil für das Feld Wα hinzu und erhalten damit schließlich als SU (2)-invariante Lagrange-Dichte des Dirac-Feldes (ohne Masseterm)
α Dα ψ 1 hic ψγ 4μ
0
Wαβ W αβ .
(15.40)
15.2.1 Feldgleichungen für das Yang-Mills-Feld Die Feldgleichungen für das Yang-Mills-Feld Wα (x) und das Isospinorfeld Φ(x) bzw. das Spinorfeld ψ(x) sind die zur Lagrange-Dichte (15.29) bzw. (15.40) gehörigen Euler-Gleichungen. Durch die Variation nach Wβ erhält man in Analogie zu den inhomogenen Maxwell-Gleichungen (14.13) die Feldgleichungen ∂α W αβ
2g2 Wα
W αβ
μ0 J β ,
(15.41)
wobei der Strom J β durch β
J1
g2 h i 2m
2
0
Φ D β Φ (D β Φ) β
J2
β g2h cψγ
Φ
ψ
für (15.29) ,
(15.42)
für (15.40)
(15.43)
definiert ist (Aufgabe 15.1). Sie sind im Gegensatz zu den Maxwell-Gleichungen nichtlinear, was dazu führt, daß bei verschwindenden Strömen aus ∂α W αβ 2g2 Wα W αβ immer noch eine Felderregung folgt: Das den Isospin beschreibende Yang-Mills-Feld trägt selbst Isospinladungen und wirkt deshalb als seine eigene Quelle, während das elektromagnetische Feld zwar von Ladungen erzeugt wird, selbst aber ungeladen ist. Diese Eigenschaft entspricht der des – ebenfalls durch nichtlineare Gleichungen beschriebenen – Gravitationsfeldes, dessen Energie Masse besitzt und daher ebenfalls Gravitation erzeugt. Anders als im Fall der Maxwell-Gleichungen ist die Kopplungskonstante g2 des Yang-Mills-Feldes bei den Feldgleichungen (15.41) nicht nur in dem die Ankopplung an Materie beschreibenden Strom (15.42) bzw. (15.43) enthalten, sondern auch in den reinen Feldtermen der linken Seite und im Feld Wαβ (x), (15.28). Dies hat zur Folge, daß
15.2 SU (2)-Invarianz und Yang-Mills-Feld
463
sie durch die (experimentell bestimmbaren) Eigenschaften des Feldes Wαβ (x) selbst ein für allemal festgelegt wird. Sie kann also nicht wie die die Stärke der Kopplung an das Feld Aα beschreibende Kopplungskonstante g1 für jedes ankoppelnde Teilchenfeld anders gewählt werden: Alle Teilchen, die an das Yang-Mills-Feld ankoppeln, tun das in gleicher Stärke. Ähnlich, wie aus der Definition Fαβ ∂α Aβ ∂β A α die homogenen Maxwell-Gleichungen ∂α Fβγ ∂β Fγ α ∂γ Fαβ 0 des elektromagnetischen Feldes folgen, ergibt sich aus der Definition (15.28) des Feldstärketensors für das Yang-Mills-Feld (die doppelten Ableitungen heben sich wie im elektromagnetischen Fall paarweise gegenseitig weg) ∂α Wβγ ∂β Wγ α ∂γ Wαβ 2g2 ∂α (Wβ Wγ ) ∂β (Wγ Wα ) ∂γ (Wα Wβ ) 2g2 (∂α Wβ ∂β Wα )Wγ (∂γ Wα ∂α Wγ )Wβ (∂β Wγ ∂γ Wβ )Wα oder unter Benutzung von Gleichung (15.28) für die rechte Seite ∂α Wβγ
∂β Wγ α ∂γ Wαβ 2g2
Wαβ Wγ
Wγ α Wβ Wβγ Wα
.
(15.44)
(Dabei wurde zuletzt die Jacobi-Identität für doppelte Kreuzprodukte benutzt.) Gleichung (15.44) entspricht einerseits den homogenen Maxwell-Gleichungen und andererseits wie diese den Bianci-Identitäten für den Krümmungstensor der ART. Auch hier gibt es wieder, anders als bei den homogenen Maxwell-Gleichungen, nichtlineare Terme. Diese führen z.B. dazu, daß das dem Magnetfeld B entsprechende Feld nicht divergenzfrei ist, sondern Quellen besitzt, mit anderen Worten: Beim Yang-Mills-Feld gibt es „Monopole“. Durch die Variation der Lagrange-Dichten (15.29) bzw. (15.40) nach Φ bzw. ψ ergeben sich (ohne Masseterm) die Gleichungen h 2 Dα D α Φ
0
bzw.
h γ α Dα ψ i
0,
(15.45)
die in Analogie zur Klein-Gordon-Schrödinger-Gleichung (15.14) bzw. Dirac-Gleichung (15.16) mit elektromagnetischem Feld stehen und beide über Dα an das Feld Wα gekoppelt sind. Aufgabe 15.1: Leiten Sie die Gleichungen (15.41)–(15.45) ab. Lösung: Mit aαβ bαβ a αβ bαβ und ∂β Wα ∂ β W α ∂α Wβ ∂ α W β sowie (Wα Wβ ) (W α W β ) Wα Wβ (W α W β ) Wα W α Wβ W β
Wα W β Wβ W α
ergibt sich aus (15.28) Wαβ W αβ
2(∂α Wβ )(∂ α W β ) 2(∂α Wβ )(∂ β W α ) 4g2 (∂α Wβ ∂β Wα )W α W β 2 4g Wα W α Wβ W β W β Wβ W α . 2
464
15 Eichinvarianz und Eichfelder
Hiermit findet man für (15.29) 1 α β β α 1 αβ ∂ 4(∂ W ∂ W ) 8g2 W α W β W , ∂(∂α Wβ ) 4μ0 μ0 1 ∂ 8g2 (∂ α W β ∂ β W α )Wα 16g22 (W β Wα W α W α Wα W β ) ∂ Wβ 4μ0 h 2 2m i g2 Φ D β Φ (Dβ Φ) i g2 Φ 0 2g2 αβ β 2 W Wα 2g ∂ α W β ∂ β W α 2g2 W α W β Wα J1 μ0 μ0
und analog für (15.40)
∂ ∂(∂α Wβ )
Die Euler-Gleichung
∂ ∂ Wβ
1 αβ W , μ0 ∂ ∂ xα
∂ ∂(∂α Wβ )
liefert schließlich (15.41) mit (15.42). Für die Variation von (15.29) nach Φ
∂ ∂(∂α Φ ) aus der Euler-Gleichung
h 2 2m
0
2g2 αβ β W Wα J2 . μ0
∂∂W
β
ergibt sich mit
h 2 2m
∂ ∂Φ
Dα Φ ,
∂ ∂xα
J1β
∂ ∂(∂α Φ )
0
i g2
Wα D α Φ
∂ ∂Φ
die Gleichung (15.45a). Durch die Variation von (15.40) nach ψ ergibt sich analog (15.45b).
15.3
SU º3»-Invarianz und Gluonenfeld
Im Fall der Gruppe SU (3) betrachten wir Zustände 3 4 φ1 bzw. Φ Φ φ2 φ3
3
ψ1 ψ2 ψ3
4
mit drei komplexen Skalarfunktionen φi (x), die der Klein-Gordon-Schrödinger-Gleichung genügen, oder drei Viererspinoren ψi (x), die der Dirac-Gleichung genügen, als Komponenten. Die Forderung nach SU (3)-Invarianz kann genauso behandelt werden wie die nach SU (2)-Invarianz. Statt (15.19) erhalten wir hier die kovariante Ableitung
Dα
∂α
i g3
8 k 1
λk G kα
(15.46)
15.3 SU (3)-Invarianz und Gluonenfeld
465
mit der Eigenschaft (Dα Φ)¼
8 exp i λk ϕ k Dα Φ
für
Φ
8 exp i λk ϕ k Φ .
k 1
(15.47)
k 1
λk sind die durch (12.61) gegebenen 3 3 Erzeugermatrizen der Gruppe SU (3) und G kα (x) acht Kopplungsfelder, welche die Potentiale der die starke Wechselwirkung zwischen den Quarks beschreibenden Gluonenfelder darstellen. In Analogie zu (15.25) ergibt sich für sie das Transformationsgesetz G αi
G iα
8 ∂α ϕ i /g3 2 f jik G αj ϕ k ,
(15.48)
j,k 1
in welchem f ji k f i j k die hinter (12.62) definierten Strukturkonstanten der Gruppe SU (3) sind. Ein (15.28) entsprechender Feldstärketensor für die Gluonenfelder wird durch G iαβ
∂α G iβ ∂β G iα 2g3
3
f jik G αj G kβ ,
i
1, . . . , 8
(15.49)
j,k 1
definiert. Auf die Ableitung der Feldgleichungen wird hier verzichtet, da diese im weiteren Verlauf nicht benötigt werden. Natürlich kann der dreikomponentige Zustand Φ auch wieder Diracsche Viererspinoren als Komponenten besitzen, wobei ähnliche Rechenregeln einzuhalten sind wie die, die im Fall von Isospin-Dubletts mit DiracSpinoren als Komponenten vereinbart wurden. Hierauf werden wir in Abschn. 16.3.2 zurückkommen.
Exkurs 15.1: Geometrische Interpretation der kovarianten Ableitung Es ist möglich, die durch (15.10), (15.19) und (15.46) definierten kovarianten Ableitungen geometrisch zu interpretieren und sie dadurch anschaulicher zu machen. Die lokalen Transformationen (15.1a), (15.20b) und (15.47b) bedeuten „Drehungen“ der Zustandsvektoren Φ relativ zu einem internen Koordinatensystem im zugehörigen Multiplettraum. Diese Drehungen sind im allgemeinen orts- und zeitabhängig, was darauf hinweist, daß die Orientierung der internen Systeme an den verschiedenen Punkten der Raum-Zeit unterschiedlich sein kann. Es ist möglich, diese Orientierungen so zu wählen, daß die kovarianten Ableitungen als die Änderungen gedeutet werden können, welche der Zustandsvektor gegenüber den internen Koordinatenachsen erfährt, wenn man vom Punkt x zum Punkt x d x geht. Die Drehung der internen Koordinatenachsen bei diesem Übergang wird separat berücksichtigt, d. h. die Gesamtänderung dΦ d x α ∂α Φ von Φ setzt sich zusammen aus einem Anteil δΦ, der durch die Drehung der Koordinatenachsen zustande kommt, ohne daß Φ sich relativ zu diesen verändert, und der kovarianten, d.h. relativen Änderung DΦ d x α Dα Φ von Φ gegenüber diesen, dΦ
δΦ DΦ
466
15 Eichinvarianz und Eichfelder
oder
d x α ∂α Φ
δΦ
d x α Dα Φ .
(15.50)
Um eine einheitliche Schreibweise für die kovarianten Ableitungen von Zuständen mit unterschiedlicher Komponentenzahl zu erhalten, definieren wir im Fall von zwei- bzw. dreikomponentigen Zuständen ein Feld A α durch 8 Aα Wα bzw. Aα λi G iα . (15.51) i 1
Damit können wir die kovarianten Ableitungen (15.10), (15.19) und (15.46) in der einheitlichen Form (15.52) Dα ∂α i g A α schreiben, wobei g gleich g1 , g2 oder g3 zu setzen und (15.52) im Fall von Zweier- bzw. Dreierisospinoren eine Matrixgleichung für 22- bzw. 33-Matrizen ist. Durch Einsetzen von (15.52) in (15.50) ergibt sich (15.53) δΦ (∂α Φ Dα Φ)d x α i g A α Φd x α , wobei wir die Änderung δΦ von Φ verabredungsgemäß auf eine „Drehung“ der internen Koordinatenachsen beim Übergang von x nach x d x zurückführen. Die oben angekündigte Wahl der internen Koordinatenachsen kann daher wie folgt durchgeführt werden: Weist Φ am Punkt x 1 in Richtung einer internen Koordinatenachse, und gehen wir in der RaumZeit längs längs2 einer Kurve C zum 2 Punkt x2 , so ist die dort in Richtung des Zustands Φ(x2 )Φ(x1 ) C δΦ Φ(x1 ) i g C A α (x)Φ(x) d x α weisende Achse aus der bei x 1 durch Drehung hervorgegangen. (Es sei darauf hingewiesen, daß die hierdurch erzielte Orientierung der internen Achsen nicht eindeutig sein muß, sondern vom Weg abhängen kann, auf dem sie definiert wird.) Der Übergang Φ Φ δΦ kann als „Parallelverschiebung“ aufgefaßt werden, da sich die Orientierung von Φ gegenüber dem internen Koordinatensystem nicht ändert. Die Parallelverschiebung ist durch die beiden äquivalenten Beziehungen DΦ
0
bzw.
dΦ
δΦ i g Aα Φd x α
(15.54)
definiert. Der Vergleich von Dα Φ ∂α Φ i g A α Φ mit der kovarianten Ableitung der ART, β Dα V β ∂α V β Γγ α V γ , zeigt, daß das Vektorpotential Aα etwa dieselbe Rolle spielt wie die β
Koeffizienten Γγ α des affinen Zusammenhangs. Aus der Verwandtschaft der Parallelverschiebung (15.54) mit derjenigen der ART kann auch eine Verwandtschaft des in ihr stehenden Kopplungsfeldes (genauer: Ableitungen von diesem) mit dem Gravitationsfeld abgeleitet werden. In der ART ergab sich, daß die Parallelverschiebung eines Vektors auf einer geschlossenen Kurve nicht zum Ausgangsvektor zurückführt, wenn die Raum-Zeit gekrümmt ist. Hierzu gibt es im Fall der Multipletts Φ ein analoges Ergebnis, das wie das entsprechende ART-Ergebnis abgeleitet werden kann. Dazu integriert man (15.54) über eine geschlossene Kurve der Raum-Zeit und erhält E E E E Φ dΦ i g A α Φd x α i g d(A α Φx α ) i g x α d(A α Φ) . Für eine bei X beginnende und endende geschlossene Kurve gilt E E d(A α x α Φ) Aα (X)X α Φ X α d(A α Φ) ,
15.4 Gebrochene Eichsymmetrie und Ruhemassen
und aus unserem letzten Ergebnis folgt damit E E i g (x α X α )d(A α Φ) i g (x α X α )(∂β A α Φ
467
i g Aα Aβ )Φd x β ,
wobei zuletzt d Aα (∂β A α )d x β und (15.54b) benutzt wurde. Jetzt nehmen wir an, daß die Kurve x(s) infinitesimal klein ist und in unmittelbarer Nachbarschaft des Punktes X verläuft, so daß wir den Integranden nach x α X α entwickeln und bei linearen Termen abbrechen können, E ' ' Φ i g(∂β Aα i g Aα A β )' Φ(X) (x α X α )d x β X
X
D D D D wegen 0. Mit x α d x β d(x α x β ) x β d x α x β d x α und der anschließenden Umbenennung α β können wir das Ergebnis auch in der Form E ' ' Φ i g(∂α Aβ i g A β A α )' Φ(X) x α d x β D
Xαdxβ
Xα
D
E ' ' i g(∂β Aα i g Aα A β )' Φ(X) x α d x β
d xβ
X
schreiben. Durch Addition der zwei für Φ erhaltenen Ergebnisse erhalten wir schließlich E ig Φ Hαβ Φ(X) x α d x β mit Hαβ ∂α A β ∂β Aα i g Aα , Aβ . (15.55) 2 ( A α , A β ist der Kommutator der Matrizen Aα und A β .) Offensichtlich entspricht Hαβ dem α Krümmungstensor der ART, denn D dort ergab sich bei einer Parallelverschiebung des Vektors V α V δ x β d x γ . Mit (15.51) ergibt sich aus (15.55) nach einfacher Rechdie Änderung V α Rβγ δ nung (Aufgabe 15.4) ⎧ für das elektromagn. Feld ⎪ ⎨ Fαβ (15.56) Hαβ Wαβ für das Yang-Mills-Feld ⎪ ⎩ 8 i λ G für das Gluonenfeld . i 1 i αβ Dies zeigt, daß die Felder Fαβ , Wαβ und G iαβ eine ähnliche Rolle spielen wie der Krümmungstensor der ART.
15.4
Gebrochene Eichsymmetrie und Ruhemassen
Das Konzept der Einbindung von Massetermen der Form (15.32) in die LagrangeDichte unter Benutzung einer Massematrix erwies sich als unbefriedigend, weil sich dadurch ohne ausreichende physikalische Begründung die Auszeichnung einer Richtung im Isospinraum ergab. Außerdem wird sich im nächsten Kapitel herausstellen, daß empirische Befunde eine Zerlegung der Dirac-Spinoren in links- und rechtshändige Anteile erfordern, welche dieses Konzept völlig zunichte machen. Schließlich werden wir im nächsten Kapitel wichtige Argumente dafür finden, daß die Quanten des YangMills-Feldes Wα eine nicht-verschwindende Ruhemasse besitzen sollten, ein eichinvarianter Masseterm ließ sich dafür jedoch nicht finden.
468
15 Eichinvarianz und Eichfelder
Eine Lösung all dieser Probleme liefert die schon durch unsere Überlegungen zur Massematrix nahegelegte Annahme, daß ein weiteres Feld für die Ruhemassen der Elementarteilchen verantwortlich ist: Die Teilchen erhalten demnach ihre Ruhemasse durch die Wechselwirkung mit diesem Feld. Wir wollen uns im jetzigen Abschnitt anhand einfacher Beispiele mit der Idee dieses Modells vertraut machen, um sie im nächsten Kapitel konkret anzuwenden.
15.4.1 Brechung einer globalen U º1»-Symmetrie Wir betrachten zunächst ein komplexes Modellfeld Φ(x) Φ1 (x) die Lagrange-Dichte h 2 α m 0 c2 2m (∂ Φ ) (∂α Φ) Φ Φ. 2 0
i Φ2 (x), das durch
(15.57)
mit m 0 >0 beschrieben wird. Diese hat die Form der Lagrange-Dichte des KleinGordon-Schrödinger-Feldes, und die daraus resultierende Feldgleichung ist die KleinGordon-Schrödinger-Gleichung, was bedeutet, daß sich m 0 als Ruhemasse der dem Feld zugeordneten Teilchen interpretieren läßt. Wir werden auch später einen m 0 entsprechenden Parameter als Ruhemasse deuten, wenn er bei den in Φ1 bzw. Φ2 quadratischen Termen ähnlich wie in (15.57) erscheint. Er muß das jedoch nicht in exakt der gleichen Weise tun, denn jede Lagrange-Dichte f , die sich von durch einen konstanten Faktor f unterscheidet, würde dieselben Feldgleichungen liefern. Dies bedeutet, daß es nur auf das Verhältnis der neben (∂ α Φ ) (∂α Φ) und Φ Φ stehenden Faktoren ankommt. Enthält eine Lagrange-Dichte daher die Terme
a(∂ α Φ ) (∂α Φ) bΦ Φ
(15.58)
mit a>0 und b>0, so folgt durch den Vergleich mit (15.57), daß die Teilchenmasse 5 durch b/a m 20 c2 /h 2 bzw. b h (15.59) m0 a c gegeben ist. Für räumlich und zeitlich konstantes Φ ist die Hamilton-Dichte des Feldes Φ nach Abschn. 7.4.2 der Quantenfeldtheorie, Gleichung (7.59)
m 02c
2
ΦΦ .
Bei klassischer Interpretation des Feldes ist das eine Energiedichte, die für Φ 0 verschwindet. Der Grundzustand des Feldes (Vakuumzustand) ist daher Φ 0. Die betrachtete Lagrange-Funktion ist invariant gegenüber der globalen Eichtransformation Φ¼
e
iΛ
Φ,
(15.60)
die in der Φ1 , Φ2 -Ebene eine Drehung um den Ursprung Φ1 Φ2 0 bedeutet. Auch im Grundzustand Φ 0 ist diese Symmetrie gewahrt, dieser ist ebenfalls eichinvariant.
15.4 Gebrochene Eichsymmetrie und Ruhemassen
469
V (Φ)
Abb. 15.1: Potential V (Φ) des Higgs-Feldes Φ, aufgetragen über der komplexen Φ-Ebene, manchmal als Sombrero-Potential oder mexikanischer Hut bezeichnet.
Φ2 Φ1
Im Hinblick auf eine Erweiterung unseres bisherigen Massekonzepts ersetzen wir jetzt im zweiten Term der Lagrange-Dichte (15.57) m 0 durch μ mit μ>0, den ersten Term belassen wir, indem wir bei ihm m 0 μ setzen. Für räumlich und zeitlich konstantes Φ ergibt sich (μc2 /2) Φ 2 , d. h. es gibt nur negative Energien, die dem Betrage nach beliebig groß werden können. Um diesen Mangel zu beheben, erweitern wir um zwei weitere Terme und betrachten das durch die Dichte
h 2μ (∂ α Φ ) (∂α Φ) V (Φ) 2
beschriebene Modellfeld mit 2 μc V (Φ) V ( Φ ) 2 λ
λ 2
ΦΦ
2
(15.61)
μ4λc μc2 Φ λ4 Φ . (15.62) 2 4
2
2
4
(Die für die Variation von belanglose Konstante μ2 c4 /(4λ) wurde hinzugefügt, damit V (Φ) 0 und 0 gilt, sie spielt nur für die Interpretation von eine Rolle. Wollte man allgemeinere Potentiale als (15.62) betrachten, so hätte die physikalisch sinnvolle Forderung nach der Existenz eines kleinsten Wertes von V (Φ) zur Folge, daß V keine ungeraden Potenzen von Φ enthalten darf. Terme höherer Ordnung als Φ 4 würden andererseits in einer Quantenfeldtheorie zu nicht renormierbaren Divergenzen führen – siehe Quantenfeldtheorie, Abschn. 10.12 –, so daß unser Ansatz nicht so speziell ist, wie er zunächst aussieht.) Die neue Lagrange-Dichte (15.61) mit (15.62) ist ebenfalls gegenüber den Transformationen (15.60) invariant. Allerdings hat der zu ΦΦ proportionale Term jetzt das falsche Vorzeichen dafür, ihn als Masseterm interpretieren zu können. Für räumlich und zeitlich konstantes Φ gilt jetzt V (Φ). (Wegen der Ortsund Zeitunabhängigkeit von Φ kann V (Φ) klassisch als potentielle Energie aufgefaßt werden.) Ein Zustand niedrigster Energie V (Φ) 0 ist jetzt jeder Zustand Φ0 Φ01 iΦ02 , der die Gleichung
Φ Φ Φ μcλ 0
2
2 01
2 02
2
(15.63)
erfüllt. Das ist ein Kontinuum von Zuständen, die in der komplexen Zahlenebene (Achsen Φ1 und Φ2 ) auf einem Kreis liegen (Abb. 15.1). Diese Grundzustände sind Lösungen der zur Lagrange-Dichte (15.61) gehörigen Variationsgleichungen. Die letzteren
470
15 Eichinvarianz und Eichfelder
sind wie gegenüber den Transformationen (15.60) invariant, die Grundzustände dagegen nicht. Das hier auftretende Phänomen, daß Lösungen nicht die Symmetrie der Gleichungen aufweisen, aus denen sie hervorgehen, wird als spontane Symmetriebrechung bezeichnet. Man sagt auch, die Zustände haben eine versteckte oder gebrochene Symmetrie. (Die zuletzt angegebenen Bezeichnungen treffen den Sachverhalt besser, da es sich nicht um einen Vorgang handelt.) Durch zwei geläufige Beispiele aus der makroskopischen Physik soll illustriert werden, daß Symmetriebrechung ein häufiger auftretendes physikalisches Phänomen ist. Beispiel 15.1: Als erstes betrachten wir einen in einen Schraubstock eingespannten geraden Stab (Abb. 15.2 (a)). Bei kleinem Druck bleibt der Stab gerade, er befindet sich in einem symmetrischen Zustand (metastabile Gleichgewichtslage). Überschreitet der Druck auf die Stabenden jedoch einen gewissen kritischen Wert, so biegt sich der Stab durch, die ursprüngliche Symmetrie geht verloren. Die Seite, nach der er ausweicht, ist willkürlich, er kann sich in jeder beliebigen Richtung durchbiegen, wobei die möglichen Ausweichzustände rotationssymmetrisch um den ursprünglichen Zustand verteilt sind. Dieser Vorgang ist ein Bifurkationsprozeß. Wie die meisten von diesen ist er dadurch gekennzeichnet, daß ein Systemparameter – hier der Druck auf die Stabenden – so weit verändert wird, bis nach Überschreiten eines kritischen Wertes der Übergang von einem symmetrischen in einen Gleichgewichtszustand geringerer Symmetrie erfolgt.
Beispiel 15.2: Als zweites Beispiel betrachten wir das berühmte Bénard-Problem. Zwischen zwei senkrecht zur Schwerkraft verlaufenden (horizontalen) Platten befindet sich eine Flüssigkeit, die von unten beheizt wird. Die das System beschreibenden Gleichungen weisen eine horizontale Translationssymmetrie auf. Das gilt zunächst auch für die Flüssigkeit, diese bleibt im statischen Gleichgewicht, solange der vertikale Temperaturgradient hinreichend klein ist (Grundzustand). Wenn der Temperaturgradient einen kritischen Wert überschreitet, wird die Symmetrie des Zustands gebrochen, es entstehen zylinderförmige Strömungszellen, deren horizontal verlaufende Achse beliebig orientiert sein kann, während die den Zustand beschreibenden Gleichungen weiterhin die ursprüngliche horizontale Translationssymmetrie aufweisen. Ein kleiner Beobachter, der sich im Strömungsfeld befindet, würde nichts mehr von dieser ursprünglichen Symmetrie sehen und hätte die größten Schwierigkeiten, herauszufinden, daß die das System beschreibenden Gleichungen so symmetrisch sind.
Stab | T2 T1 (a)
(b)
Abb. 15.2: (a) Symmetriebrechung durch seitliches Ausweichen eines durch einen Schraubstock gepreßten Stabes. (b) Bénard-Problem: Ausbildung von Strömungswalzen bei Überschreitung eines kritischen vertikalen Temperaturgradienten in einer von unten beheizten Flüssigkeit zwischen zwei horizontalen Platten im (vertikalen) Schwerefeld.
15.4 Gebrochene Eichsymmetrie und Ruhemassen
471
Es ist sinnvoll, Anregungszustände durch ihre Abweichung vom Grundzustand (Vakuum) zu beschreiben, indem man sie gemäß Φ
Φ0
ϕ
(15.64)
zerlegt und ϕ als das der Beobachtung zugängliche Feld auffaßt. Mit (15.64), ∂α Φ ∂α ϕ, Φ Φ Φ0 2 ϕ 2 2 Re(Φ0 ϕ) und V (Φ0 )0 ergibt sich aus (15.61) mit (15.62) und (15.63) 2 h 2 α λ 2μ (∂ ϕ ) (∂α ϕ) ϕ 2 2 Re(Φ0 ϕ) 4 h 2 α 2μ (∂ ϕ ) (∂α ϕ) λ Re(Φ0 ϕ) 2 λ4 ϕ 4 λϕ 2 Re(Φ0 ϕ) . (15.65)
Das Transformationsgesetz (15.60) gilt sowohl für den Grundzustand Φ0 also auch für den Gesamtzustand Φ und damit auch für ϕ, d. h. Φ0¼
e
iΛ
Φ0 ,
ϕ¼
e
iΛ
ϕ.
(15.66)
1. Als erstes untersuchen wir den Spezialfall reeller Φ. (Damit sind auch Φ0 und ϕ reell.) In diesem reduziert sich (15.65) unter Benutzung von (15.63) für den Term ϕ 2 auf h 2 α λ 2μ (15.67) (∂ ϕ) (∂α ϕ) μc2 ϕ 2 λΦ0 ϕ 3 ϕ 4 . 4
Der zweite Term hat jetzt das richtige Vorzeichen, um eine von null verschiedene Ruhemasse zu erklären, diese ist nach (15.58)–(15.59) durch m 0ϕ
2μ
(15.63)
2λ
Φ02 c2
(15.68)
gegeben. Die Terme ϕ 3 und ϕ 4 können als Selbstwechselwirkungsterme interpretiert werden, da sie in der aus (15.67) durch Variation nach ϕ hervorgehenden Gleichung zu nichtlinearen Termen führen und daher die Struktur von Wechselwirkungstermen haben. Im Fall reeller Φ kann der Parameter Λ der Eichtransformationen (15.60) nur die Werte nπ mit ganzzahligem n annehmen, d. h. diese reduzieren sich auf die Spiegelung Φ ¼ Φ. (Außerdem ist natürlich die identische Transformation Φ ¼ Φ möglich.) Die dementsprechende Symmetrie (Φ) (Φ) der Lagrange-Dichte ist daher diskret. Offensichtlich überträgt sie sich nicht auf (ϕ), jedoch besteht weiterhin die ursprüngliche Invarianz gegenüber der Transformation Φ0 ϕ (Φ0 ϕ). Wichtig ist, daß die durch (15.68) definierte Ruhemasse m 0ϕ ebenfalls Spiegelsymmetrie aufweist, sie ändert sich nicht bei dem Übergang Φ0 Φ0 . 2. Jetzt wenden wir uns dem allgemeinen Fall eines komplexen Feldes zu. In (15.65) kann in diesem λ Re(Φ0£ϕ) 2 λ (Φ01 ϕ1 Φ02 ϕ2)2
als Masseterm aufgefaßt werden. Allerdings erscheint es richtiger, die Linearkombination Φ01 ϕ1 Φ02 ϕ2 als das massetragende Relativfeld aufzufassen. Tatsächlich gibt
472
15 Eichinvarianz und Eichfelder
¼ es eine Eichtransformation (15.60), bei der Φ1¼ gerade in Φ01 und einen zu dieser ¼ Linearkombination proportionalen Feldanteil zerfällt, während Φ02 verschwindet (Aufgabe 15.5). Indem wir uns vorstellen, daß diese Transformation schon von vornherein ausgeführt war, können wir in (15.65) Φ02 0 setzen und erhalten mit der Umbenennung Φ01 Φ0 , mit ϕ η i χ, Re(Φ0 ϕ) Φ0 η, ϕ 4 η4 2η2 χ 2 χ 4 und unter Benutzung von (15.63), Φ02 μc2 /λ,
h h 2μ (∂ η)(∂ η) μc η (∂ χ)(∂ χ) 2μ λ Φ η ηχ 14 η 2η χ χ . 2
α
0
2
2 2
α
3
2
α
4
α
2 2
4
(15.69)
Wieder können wir dem Feld η ein Teilchen der Ruhemasse
2 μ 2 λΦ /c (15.70) zuordnen, und da es keinen Term χ gibt, folgt als Ruhemasse der Quanten des Feldes χ m 0. (15.71) Folgendes Bild kann symbolisch zu einer Veranschaulichung davon dienen, wie die Ergebnisse m 0 und m 0 zustandekommen. Die Felder η und χ sind vom Vakum 0η
0
2
2
2
0χ
0η
0χ
umzustand Φ0 (Punkt (Φ0 , 0) der Φ1 , Φ2 -Ebene) aus gerechnete Anregungszustände. Eine Anregung des Feldes η bedeutet den Übergang vom Punkt (Φ0 , 0) zum Punkt (Φ0 η, 0), der auf einer senkrecht zum Kreis Φ12 Φ22 Φ02 verlaufenden Geraden der Φ1 , Φ2 -Ebene liegt. In der Nähe des Vakuumzustandes Φ0 ist das Potential V (Φ) auf dieser Geraden durch V η2 gegeben, es steigt also von diesem aus nach beiden Seiten hin an. Zum Anregen des Feldes η muß daher Energie aufgewandt werden, die einer Ruhemasse des η-Teilchens äquivalent ist. Eine Anregung des Feldes χ bedeutet den Übergang vom Punkt (Φ0 , 0) zum Punkt (Φ0 , χ). Für kleine Werte χ liegt dieser auf dem durch (Φ0 , 0) hindurchführenden Kreis, auf dem das Potential V (Φ) überall den Wert null besitzt. Für diesen Übergang ist keine Energie aufzuwenden, das χ-Teilchen ist daher masselos. Das Auftreten eines masselosen Teilchens ist offensichtlich darauf zurückzuführen, daß es ein Kontinuum von Vakuumzuständen gebrochener Symmetrie gibt, die durch die Transformationen ineinander überführt werden, gegenüber denen die Lagrange-Dichte bzw. das Potential V (Φ) invariant ist. Andererseits beruht die Existenz dieses Kontinuums darauf, daß die Lagrange-Dichte eine kontinuierliche Symmetrie besitzt. Es ist daher nicht verwunderlich, daß eine gebrochene kontinuierliche Symmetrie generell mit dem Auftreten eines als Goldstone-Boson bezeichneten masselosen Teilchens verbunden. Dies ist die Aussage des Goldstone-Theorems, auf dessen Beweis hier verzichtet wird.2 Wie verhält sich die Lagrange-Dichte (15.69) gegenüber globalen Eichtransformationen der Form (15.60)? Am besten erkennt man an der Form (15.65), daß sich die Invarianz von gegenüber diesen nicht von Φ auf ϕ überträgt, denn dabei würden
2 Siehe z. B. Abschn. 8.2 des Buches [12] der Literaturliste.
15.4 Gebrochene Eichsymmetrie und Ruhemassen
473
sich der zweite und letzte Term ändern. Allerdings besitzt nach wie vor die Symmetrie gegenüber der ursprünglichen Transformation Φ0 ϕ e i Λ (Φ0 ϕ), und auch die Massedefinitionen (15.70) und (15.71) sind invariant gegenüber den Transformationen Φ0 e i Λ Φ0 . Die Eichtransformation, die zu der speziellen Form (15.69) der Lagrange-Dichte führte, war zur Identifizierung der Teilchenmassen m 0χ und m 0η nützlich, ist jedoch nicht notwendig, denn die allgemeine Form (15.65) ist ihr äquivalent.
15.4.2 Brechung einer lokalen U º1»-Symmetrie und Higgs-Mechanismus Abschließend wollen wir noch das Phänomen der Symmetriebrechung am Beispiel einer Lagrange-Dichte untersuchen, die nicht nur global, sondern auch lokal eichinvariant ist. Dieser Fall liegt vor, wenn (15.61) durch h 2 α £ 1 2μ (D Φ) (Dα Φ) V (Φ) 4μ mit V (Φ)
μc2
2 λ
λ ΦΦ £ 2
2 ,
0
Fαβ F αβ ,
∂α i g A α ,
Dα
Fαβ
(15.72)
∂α Aβ ∂β Aα
ersetzt wird, wobei gleich ein Freifeld-Anteil für das Eichfeld Aα mit einbezogen wurde. Invarianz besteht hier nach Abschn. 15.1 gegenüber den Transformationen Φ¼
e i Λ(x)Φ ,
A¼α
Aα (1/g)∂α Λ .
(15.73)
Das Potential V (Φ) besitzt die gleichen Eigenschaften wie im letzten Abschnitt. Als Grundzustand wählen wir wieder einen beliebigen Zustand auf dem Kreis (15.63) und setzen Φ Φ0 ϕ. Gegenüber (15.65) kommen außer dem in Fαβ quadratischen Freifeld-Anteil noch einige Terme über die kovariante Ableitung hinzu, mit (D α Φ)£ (Dα Φ) ∂ α ϕ £ i g Aα Φ £ (∂α ϕ i g Aα Φ) (∂ α ϕ £) (∂α ϕ) i g Φ £ Aα ∂α ϕ Φ Aα ∂α ϕ £ g2Φ 2 Aα Aα (∂ α ϕ £) (∂α ϕ) 2 g Im Φ0£ Aα ∂α ϕ ϕ £ Aα ∂α ϕ g 2 Φ0 2 ϕ 2 2 Re(Φ0£ ϕ) Aα Aα erhalten wir h 2 α £ (∂ ϕ )(∂α ϕ) 2μ
g 2 Φ0 2 A α Aα
λ
Re(Φ0£ ϕ)
2
h 2 2 g Im Φ0£ A α ∂α ϕ ϕ £ A α ∂α ϕ g 2 2 Re(Φ0£ ϕ) 2μ λ ϕ 2 Re(Φ0£ϕ) 14 ϕ 4 4μ1 Fαβ F αβ . 0
(15.74)
ϕ 2
Aα Aα
474
15 Eichinvarianz und Eichfelder
2 λ Re(Φ0 ϕ) ist der gleiche Masseterm wie in (15.65). Wie dort könnten wir wieder Re(Φ0 ϕ) als massetragendes Feld auffassen und durch eine globale Eichtransformation zu einer entsprechenden Darstellung übergehen, was gleichwertig damit wäre, Φ02 0 zu setzen. Dabei behielten wir jedoch in der zweiten Zeile von (15.74) einen in den Feldern Aα und χ quadratischen Term Φ0 A α ∂α χ, dessen Interpretation Schwierigkeiten bereitet: Er hat die Struktur eines Wechselwirkungsterms zwischen diesen Feldern; wäre eine derartige Wechselwirkung möglich, so würde diese in einer quantisierten Feldtheorie die Umwandlung von A α -Teilchen (Spin 1) in χ-Teilchen (Spin 0) beschreiben, wodurch die Erhaltung des Gesamtspins verletzt würde. Diese Schwierigkeit weist darauf hin, daß wir im Φ-Raum ein zur Interpretation ungeeignetes Koordinatensystem gewählt haben. Zum Auffinden eines besser geeigneten Systems können wir die Eigenschaft der Lagrange-Dichte (15.72) benutzen, gegenüber lokalen Eichtransformationen ¼ χ ¼ gänzinvariant zu sein: Durch eine solche läßt sich erreichen, daß das Feld Φ2¼ Φ02 lich verschwindet, aus Φ¼
Φ1¼ i Φ2¼
e i ΛΦ
(cos Λ i sin Λ)(Φ1 i Φ2 )
Φ1 cos Λ Φ2 sin Λ i (Φ2 cos Λ Φ1 sin Λ) .
ergibt sich Φ2¼ 0 für Λ(x)
arctan
Φ2 (x) . Φ1 (x)
(Der Fall Φ1 (x) 0 ist möglich und wird durch tan(Φ2 (x)/Φ1 (x)) und Λ(x) π/2 ¼ mit erfaßt.) Damit verschwinden sowohl Φ02 als auch χ ¼ gänzlich aus der transformierten Lagrange-Dichte, in der das Feld Aα natürlich gemäß (15.73b) transformiert werden muß. Unter Weglassen der Striche wird dann aus (15.74) mit Φ Φ1 Φ0 η und (15.63)
h 2 α h 2 g 2 (∂ η)(∂α η) g 2 Φ02 Aα A α μc2 η2 2Φ0 η η2 A α A α 2μ 2μ λ Φ0 η3 14 η4 4μ1 F αβ Fαβ . (15.75) 0
Damit ist eine der ursprünglichen äquivalente Lagrange-Dichte gefunden, in der sich jeder Term auf einfache Weise deuten läßt. Zunächst einmal gibt es wieder den gleichen Masseterm wie in (15.65), der für das durch η beschriebene Higgs-Boson erneut die Ruhemasse (15.70) liefert. Der Vergleich mit der Lagrange-Dichte (14.14) für das Proca-Feld zeigt, daß der Term Φ02 Aα A α als Masseterm für das Eichfeld Aα aufgefaßt werden kann, wobei sich aus der Beziehung h 2 g 2 Φ02 /(2μ) m 2A c2 /(2μ0 h 2 ) für das als Eich-Boson bezeichnete Quant dieses Feldes mit (15.63) die gegenüber den Eichtransformationen (15.73) invariante Ruhemasse 5 h 2 gΦ0 μ0 μ0 2 (15.76) h g m0A c μ λ ergibt. Da das Feld χ, das im Fall der globalen Eichinvarianz zu dem masselosen Goldstone-Boson geführt hat, jetzt völlig aus der Lagrange-Dichte verschwunden ist,
Aufgaben
475
gibt es jetzt auch kein entsprechendes Teilchen mehr. Dessen Verschwinden steht in engem Zusammenhang damit, daß das Eichboson, welches ohne die Symmetriebrechung masselos wäre, durch diese in ein massives Teilchen umgewandelt wurde. (Ohne Symmetriebrechung, d. h. für μ<0, wäre Φ0 0 der Grundzustand und m 0 A würde mit Φ0 verschwinden.) Man sagt daher auch, das Eichboson habe dadurch seine Ruhemasse erhalten, daß es das Goldstone-Boson „aufgefressen“ hat, ein Phänomen, das als HiggsMechanismus bezeichnet wird. Man könnte sich noch darüber wundern, daß durch diesen Mechanismus anscheinend Freiheitsgrade verloren gehen, denn vor der Symmetriebrechung gab es außer dem Vektorfeld A α zwei skalare Felder, nach ihr gibt es nur noch eines. Tatsächlich bleibt die Zahl der Freiheitsgrade jedoch erhalten, denn jedes masselose Vektorfeld hat wie das elektromagnetische Feld und dessen Quant, das Photon, nur zwei Freiheitsgrade der transversalen Polarisation. Das massive Spin-1-Teilchen, zu dem das Vektorboson nach der Symmetriebrechung geworden ist, hat jedoch zu den zwei transversalen Freiheitsgraden der transversalen Polarisation noch einen longitudinalen: Für die z-Komponente des Spins massiver Teilchen gibt es die drei Eigenwerte 1, 0, 1.
Aufgaben 15.2 15.3
Wie müssen die Dimensionen von g2 und Wα gewählt werden, damit in den Gleichungen (15.19) und (15.29) alle Terme die gleiche Dimension haben? Zeigen Sie: Aus ψ ¼ U ψ, Dα ∂α i g Aα und der Forderung (Dα ψ)¼ U (Dα ψ) folgt für A α das Transformationsgesetz A¼α
15.4
U Aα U
1
i (∂α U )U g
1
.
Beweisen Sie für Hαβ ∂α A β ∂β Aα i g Aα , A β mit Aα
*
Wα 8
i i 1 λi G α
für das Yang-Mills-Feld für das Gluonenfeld
die Gültigkeit von Hαβ 15.5
*
Wαβ
8
i i 1 λi G αβ
für das Yang-Mills-Feld für das Gluonenfeld .
Zeigen Sie, daß diejenige Transformation Φ e i Λ Φ, die den Imaginärteil von Φ0 zum Verschwinden bringt, im Realteil von Φ einen zum Feld Φ01 ϕ1 Φ02 ϕ2 proportionalen Anteil erzeugt. 0 wird, Anleitung: Wie transformieren sich mit dem Wert von Λ, für den Φ02 Φ01 , ϕ1 und ϕ2 ?
476
15 Eichinvarianz und Eichfelder
Lösungen 15.4
Für A α
Wα gilt
Aα , Aβ
3
j
Wαi Wβ σi , σ j
(15.23)
i, j 1
∂α A β ∂β A α
2i
3
j
εi j k Wαi Wβ σk
2i
(Wα Wβ ) ,
i, j,k 1
(∂α Wβ ∂β Wα ) ,
und mit der Definition (15.28) folgt die Gültigkeit der Behauptung für das Yang-MillsFeld. Für A α 8i 1 λi G iα ergibt sich 8 8 8 (12.62) j j Aα , Aβ G iα G β λi , λ j 2i λk fikj G iα G β , ∂α Aβ ∂β Aα
i, j 1 8
k 1
λk (∂α G kβ
i, j 1
∂β G iα ) ,
k 1
und mit (15.49) folgt Gültigkeit der Behauptung für das Gluonenfeld. 15.5
Es gilt Φ¼
e i Λ Φ
Φ1¼ i Φ2¼
Φ1 cos Λ Φ2 sin Λ i (Φ2 cos Λ Φ1 sin Λ) .
(cos Λ i sin Λ)(Φ1 i Φ2 )
Diese Gleichung muß von den Bestandteilen Φ0 und ϕ der Zerlegung Φ Φ0 ϕ separat ¼ 0 für erfüllt werden. Daraus ergibt sich Φ02 Φ02 sin Λ , 2 2 Φ01 Φ02
cos Λ
Φ01 2 Φ01
2 Φ02
.
Aus Φ1¼
¼ ¼ Φ01 ϕ Φ01 cos ΛΦ02 sin Λϕ1 cos Λϕ2 sin Λ 1 01 ϕ1 Φ02 ϕ2 2 Φ 2 Φ Φ01 02 2 Φ2 Φ01 02
folgt ¼ Φ01
2 Φ2 , Φ01 02
und analog ergibt sich ϕ2¼
ϕ1¼
Φ01 ϕ1 Φ02 ϕ2 , 2 Φ2 Φ01 02
Φ01 ϕ2 Φ02 ϕ1 . 2 Φ2 Φ01 02
16
Standardmodell
Wir hätten im letzten Abschnitt fortfahren und die Implikationen untersuchen können, welche die Forderung nach Invarianz einer mit SU (4)-Quadrupletts gebildeten Lagrange-Funktion gegenüber den durch die Gruppe SU (4) vermittelten Transformationen nach sich zieht, usw. Für die Zwecke des allgemein akzeptierten Standardmodells zur theoretischen Beschreibung der in Tab. 11.2 aufgeführten Elementarteilchen genügen jedoch die im letzten Kapitel beschriebenen drei Symmetrien, Invarianz der Lagrange-Dichte gegenüber lokalen Eichtransformationen der Gruppen U (1), SU (2) und SU (3). Explizit müssen dabei nur die Fermionen berücksichtigt werden, weil die Bosonen durch die Forderung nach lokaler Eichinvarianz der Lagrange-Dichte über die hierfür benötigten Eichfelder implizit mit einbezogen werden. Schließlich kommt bei dem Bemühen, die Ruhemassen der Teilchen zu erklären, noch ein Higgs-Boson mit ins Spiel. In das Standardmodell geht eine Reihe von Voraussetzungen ein, die mit viel Intuition gefunden wurden. Sie erhalten ihre Rechtfertigung dadurch, daß die aus ihnen folgenden Konsequenzen experimentell überprüfbar sind und sich als richtig herausgestellt haben. Diese Voraussetzungen werden im folgenden Abschnitt zusammengestellt.
16.1
Voraussetzungen des Standardmodells
1. Die Fermionen unter den in Tabelle 11.2 aufgeführten Elementarteilchen können in drei Familien eingeteilt werden, die sich in gleicher Weise verhalten. (Es genügt daher, nur eine dieser Familien ausführlicher zu untersuchen, was wir anhand des Beispiels der ersten Familie durchführen werden.) Jede Familie enthält zwei Leptonen und zwei Quarks, 1. Familie: 2. Familie: 3. Familie:
νe , e, u, d νμ , μ, c, s ντ , τ , t, b .
Hierin sind die bereits bekannten Abkürzungen für das Elektron, das Elektronneutrino, das μ- und τ -Teilchen und die diesen zugeordneten Neutrinos sowie die verschiedenen Quarks benutzt. Da alle Teilchen jeder Familie Fermionen sind, müssen sie durch Dirac-Spinoren beschrieben werden, die wir der Einfachheit halber wie die Teilchen bezeichnen. 2. Von den Verknüpfungen, die durch die Gruppen U (1), SU (2) und SU (3) zwischen den Teilchen einer Familie bewirkt werden, sind die Teilchen in unterschiedlicher Weise betroffen.
478
16 Standardmodell
(a) Die Invarianz der Lagrange-Dichte gegenüber lokalen Eichtransformationen der Gruppe U (1) muß für sämtliche Teilchen jeder Familie bestehen. (b) Von der Forderung nach SU (2)-Invarianz der Lagrange-Dichte sind nur Teilchen negativer Helizität (siehe Abschn. 14.4) betroffen. Um diese Eigenschaft ausdrücken zu können, müssen daher alle Zustände gemäß Gleichung (14.32) in links- und rechtshändige Zustände zerlegt werden, z. B. e e L e R . Dabei wurde schon in Abschn. 14.4 bemerkt, daß die im Standardmodell als masselose Teilchen behandelten Neutrinos nur linkshändige Zustände annehmen. SU (2)Verknüpfungen gibt es nur zwischen Elektronen und Neutrinos sowie zwischen Up- und Downquarks, deren Zustände wir daher zu den beiden Isospin-Dubletts 3 4 3 4 νe uL , Q (16.1) L eL dL zusammenfassen. (Dabei handelt es sich um den schwachen Isospin. Man beachte, daß die angegebenen Isospinoren als Komponenten vierkomponentige Dirac-Spinoren besitzen.) Alle anderen Zustände, also e R , u R und d R ,
(16.2)
bilden Isospin-Singuletts, die von der SU (2)-Transformation nicht betroffen werden. (c) Durch die Gruppe SU (3) werden nur die verschiedenen Farbzustände einzelner Quarks miteinander verknüpft. Deren drei Farbzustände bilden die SU (3)Tripletts 3 4 3 4 3 4 3 4 u Lr u Rr d Lr d Rr (16.3) u Lg , u Rg , d Lg , d Rg . u Lb u Rb d Lb d Rb 3. Von der Wechselwirkung geladener Fermionen mit dem elektromagnetischen Feld wird angenommen, daß sie im Rahmen des Standardmodells die gewohnte Form beibehält, also für ein Teilchen der Ladung q zur Lagrange-Dichte einen Beitrag der Form α (16.4) W W c ψγ ψq A α
liefert. Ungeladene Teilchen sollen keine Wechselwirkung mit dem elektromagnetischen Feld aufweisen. 4. Fermionen mit einer von null verschiedenen Isospin-Ladung q I (diese wird in (16.25) definiert) sollen mit dem in (16.15) definierten Z -Bosonenfeld Z α die gleiche Wechselwirkung wie Elektronen haben, also zur Lagrange-Dichte einen Beitrag der Form α (16.5) W W c ψγ ψq I Z α liefern. 5. Die Ruhemassen der Teilchen werden dadurch erklärt, daß die Existenz eines als Higgs-Feld bezeichneten Hilfsfeldes gebrochener Symmetrie postuliert wird. Dieses wechselwirkt mit den Teilchenfeldern L(x), e R (x) usw. und verleiht hierdurch den diesen zugeordneten Teilchen Ruhemassen.
16.2 Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung
479
Die Familieneinteilung, die geschilderte Aufteilung der Symmetrieeigenschaften sowie die Tatsache, daß nur drei innere Symmetrien und gerade diese von Bedeutung sind, müssen als empirische Befunde akzeptiert werden, für die keine theoretische Begründung bekannt ist. Dadurch wird allerdings nicht ausgeschlossen, daß eine noch zu findende und tiefergehende Theorie für diese Tatsachen oder zumindest einige von ihnen eine Begründung nachliefert. Die Lagrange-Dichte jeder Familie enthält einen Anteil L für die Leptonen, Q für die Quarks, H für ein Higgs-Feld, das die Teilchenmassen erklären soll, einen FreifeldAnteil B für die Bosonenfelder X α und Wα und zwei Anteile LH und QH für die Wechselwirkung zwischen dem Higgs-Feld und den Elektronen bzw. den Quarks,
L Q H LH QH B (X α , Wα ) .
(16.6)
Diese Anteile werden in den nächsten Abschnitten separat untersucht.
16.2
Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung
Wir lassen zunächst die Quarks und deren Wechselwirkungen außer acht und untersuchen nur die Wechselwirkungen zwischen Elektronen und Neutrinos der ersten Familie. Nach (16.1) und (16.2) bedeutet dies, daß wir nur die zwei Zustände νe L (16.7) , eR eL
zu betrachten haben. Die Lagrange-Dichte soll gegenüber lokalen U (1)-Eichtransformationen sämtlicher Leptonenzustände, also von e L , e R und νe , invariant sein. Das Kopplungsfeld, das in der der Gruppe U (1) zugeordneten kovarianten Ableitung auftritt, kann wegen der Beteiligung von Neutrinos nicht mehr mit dem Vektorpotential des elektromagnetischen Feldes identifiziert werden. Wir bezeichnen es daher mit X α . Hinsichtlich des Zustands L soll zusätzlich eine SU (2)-Symmetrie mit dem Kopplungsfeld Wα aufweisen.
16.2.1 Leptonenanteil
L
Da für die Isospinzustände L sowohl eine U (1)- als auch eine SU (2)-Symmetrie zu berücksichtigen ist, müssen für sie die kovarianten Ableitungen (15.10) und (15.19) kombiniert und in die Lagrange-Dichte (15.15) (ohne Masseterm) eingesetzt werden. Für die Zustände e R genügt dagegen die kovariante Ableitung (15.10) alleine. Auf diese Weise ergibt sich h c α L L γ Dα L e R γ α DαR e R (16.8) L i mit DαL ∂α i g1L X α i g2 Wα , DαR ∂α i g1R X α , (16.9)
480
16 Standardmodell
wobei DαL eine 2 2-Matrix ist. Was die Kopplungskonstante g1 angeht, erlaubt uns deren früher festgestellte freie Verfügbarkeit, für die Zustände L und e R unterschiedliche Werte g1L und g1R zuzulassen, was sich später als notwendig erweisen wird. Für das Transformationsverhalten des Kopplungsfeldes X α ergibt sich nach (15.9) X α¼
(16.9a)
Xα
1 ∂α Λ L g1L
(16.9b)
Xα
1 ∂α Λ R . g1R
(16.10)
Dabei mußten für links- und rechtshändige Zustände verschiedene Phasenfunktionen Λ L und Λ R zugelassen werden, damit sich ein eindeutiges Transformationsverhalten (15.1) ergibt. Aus (16.10) folgt durch Vergleich von (b) und (c) die Gleichung 1 ∂α Λ L g1L die durch ΛR
g1
∂α Λ R ,
1R
gg1R Λ L
(16.11)
1L
gelöst wird. (16.11) bedeutet, daß die Zustände L und e R bezüglich der Gruppe U (1) unterschiedliches Transformationsverhalten aufweisen, unter Einschluß der Gruppe SU (2) gilt für dieses L¼
ei (
ΛL
)L ,
e R
e
i ΛR
eR .
(16.12)
Tatsächlich wäre die Lagrange-Dichte (16.8) sogar gegenüber Eichtransformationen invariant, bei denen Λ L und Λ R nicht zueinander proportional, sondern voneinander völlig verschiedene Funktionen von x sind, denn unter Benutzung der Tatsache, daß sich DαL L und DαR e R wie L und e R transformieren, ergibt sich
L ei (Λ eR γ α (DαR e R ) e R ei Λ L γ α (DαL L)
L R
) γ α ei (
γ αe
i ΛR
Λ L )
(DαL L) L γ α L ,
(DαR e R ) e R γ α DαR e R .
Die Gleichungen (16.9) und (16.10) wären noch konsequenter, wenn es auch zwei voneinander verschiedene Kopplungsfelder X αL und X αR gäbe. Im folgenden wird jedoch aus Gründen der Übersichtlichkeit zunächst von der einfacheren und in der Literatur üblichen Annahme X αL X αR X α ausgegangen. Im Exkurs 16.1 wird dann gezeigt, daß der wesentlich allgemeinere Ansatz mit zwei verschiedenen Kopplungsfeldern zum gleichen Ergebnis, X αL X αR X α , führt. Indem wir die Definitionen (16.7) und (16.9) in (16.8) einsetzen, erhalten wir unter Benutzung einer (12.50) entsprechenden Beziehung für die Matrix Wα und mit (15.35b) γ α νe L i (ν e , e L ) ∂α i g1L X α i g2 Wα i e R γ α ∂α e R g1R e R γ α e R X α γ α eL h c i νe γ α ∂α νe e L γ α ∂α e L e R γ α ∂α e R g1R e R γ α e R X α g1L X α g2 Wα3 g2 (Wα1 i Wα2 ) γ α νe (νe , e L ) g (W 1 i W 2 ) g X g W 3 γ α e . L α α 2 1L α 2 α
16.2 Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung
481
Die speziellen Kombinationen, in denen die Felder Wα1 und Wα2 hier auftreten, werden durch die Umrechnungen der Lagrange-Dichte, die wir zu deren physikalischer Interpretation vornehmen werden, nicht beeinflußt. Es ist daher sinnvoll, ihnen durch Einführung der (komplexen) Felder Wα
1
2
Wα1 i Wα2 ,
Wα
1
2
Wα1 i Wα2
(16.13)
eine eigenständige Bedeutung zuzuweisen. (Hierdurch wird nichts präjudiziert, Wα und Wα können als bequeme Abkürzungen aufgefaßt werden.) Führt man in dem für L erhaltenen Ausdruck die Matrizenmultiplikationen aus, so ergibt sich c) i νe γ α ∂α νe e L γ α ∂α e L e R γ α ∂α e R g1R X α e R γ α e R L /(h
(g1L X α g2 Wα3 )νe γ α νe (g1L X α g2 Wα3 )e L γ α e L α 2 g2 Wα νe γ e L Wα e L γ α νe .
(16.14)
Hätten wir X α mit dem elektromagnetischen Feld identifiziert, so würde der Term g1L X α ν e γ α νe eine Wechselwirkung der neutralen Neutrinos mit diesem darstellen, in Analogie zum Wechselwirkungsterm qcψ γ α ψ Aα der Elektronen in (15.17). Dies widerspräche unseren Voraussetzungen über die Wechselwirkungen mit dem elektromagnetischen Feld. Würden wir, um das zu vermeiden, g1L 0 setzen, so entfiele auch der entsprechende Wechselwirkungsterm für e L . Dann müßten wir, um eine Wechselwirkung des linkshändigen Elektrons mit dem elektromagnetischen Feld zu erhalten, Wα3 mit diesem identifizieren. Das hätte erneut dessen Wechselwirkung mit Neutrinos zur Folge, es sei denn wir setzten auch noch g2 0. Dann ergäbe sich jedoch abermals auch keine Wechselwirkung mit e L . Diese Überlegungen führen dazu, die neben dem Neutrino-Teilchenstrom cν e γ α νe stehende Felderkombination als neuartiges Feld aufzufassen. In diesem Sinne definieren wir mit einem zusätzlichen Faktor das Feld
g(g1L X2α g g22)W1/2α X α sin θW Wα3 cos θW 3
Zα
1L
mit sin θW
(16.15)
2
(g 2 g1Lg 2)1/2 , 1L 2
cos θW
(g 2 gg2 2)1/2 , 1L 2
(16.16)
wozu die Dimensionen der Kopplungskonstanten und Felder so gewählt sein müssen, daß g1L und g2 einerseits sowie X α und Wα andererseits dimensionsgleich sind. Nach (16.14) treten auch die Elektronen mit beiden Feldern X α und Wα3 in Wechselwirkung. Allerdings scheint das für Zustände links- und rechtshändiger Helizität in unterschiedlicher Weise zu geschehen, was aller Erfahrung widerspräche. Zur näheren Untersuchung dieser Wechselwirkung betrachten wir eine feste Komponente der beiden unabhängigen Felder X α und Wα3 , z.B. X 1 und W13 , und beschreiben sie für gegebenes α α durch einen Vektor X α , Wα3 in einer Ebene, deren Abszisse bzw. Ordinate das Feld X α bzw. Wα3 angeben. Z α ist dann die Projektion des die beiden Felder beschreibenden Vektors X α , Wα3 auf die Richtung des Einheitsvektors esin θW , cos θW .
482
16 Standardmodell
Um das komplette Feld zu erhalten, muß noch die Projektion auf den zu e senkrechten Einheitsvektor cos θ W , sin θW hinzugenommen werden, was dazu führt, neben Z α als zweites Feld die Projektion g2 X α g1L Wα3 Aα X α cos θ W Wα3 sin θW (16.17) (g1L2 g2 2 )1/2 einzuführen. Dies bedeutet, daß wir in der das Gesamtfeld X α , Wα3 beschreibenden Ebene eine Drehung des Koordinatensystems um den Winkel θ W vorgenommen haben. Damit ist einerseits erreicht, daß das Gesamtfeld vollständig erfaßt wird, andererseits aber auch, daß der mit den Neutrinos wechselwirkende Feldanteil Z α keine Komponente des Feldes Aα enthält, das wir gleich mit dem elektromagnetischen Vektorpotential identifizieren werden. (Die obigen Überlegungen können für jedes feste α durchgeführt werden, so daß der Index α für das weitere wieder freigegeben werden kann.) Die beiden Beziehungen (16.15) und (16.17) lassen sich nach X α und Wα3 auflösen, Xα
Aα
cos θ W
Z α sin θW ,
Wα3
A α sin θW
Z α cos θW ,
(16.18)
und ihr Einsetzen in (16.14) liefert für die Wechselwirkungsterme der beiden Elektronenzustände mit den Feldern X α und Wα3 /(hc) g1R e R γ α e R X α g1L X α g2 Wα3 e L γ α e L eX W 3 (g1L sin θW g2 cos θ W ) e L γ α e L g1R sin θW e R γ α e R Z α α α (g1L cos θ W g2 sin θ W ) e L γ e L g1R cos θ W e R γ e R A α .
Mit g1L cos θW
g2 sin θ W
(16.16)
g1L g2 g2 g1L (g1L2 g2 2 )1/2
g1L sin θ W
g2 cos θ W
(16.16)
g1L 2 g2 2 (g1L2 g2 2 )1/2
(16.16)
2g1L cos θ W
(g1L2 g2 2 )1/2 (sin2 θ W cos2 θ W )
wird daraus
eX W hc
3
(g1L2 g2 2 )1/2 (sin2 θ W cos2 θW ) e L γ α e L
2g1L e L γ α e L
g1R sin θW e R γ α e R Z α
g1R e R γ α e R cos θ W A α .
(16.19)
Wenn wir jetzt g1R 2g1L setzen, ist erreicht, daß die Wechselwirkung der linkshändigen und rechtshändigen Elektronenzustände mit dem Feld Aα gleichartig ist. Dies bildet die notwendige und hinreichende Voraussetzung dafür, daß das Feld Aα mit dem Vektorpotential des elektromagnetischen Feldes identifiziert werden kann, der Wechselwirkungsterm eW W erhält damit die für die Wechselwirkung zwischen Elektronen und dem elektromagnetischen Feld übliche Form. Weiterhin zeigt der Vergleich mit (15.17), daß dazu in eW W auch noch der Faktor neben ce L γ α e L mit der Elektronenladung q e identifiziert werden muß, d.h. es muß 2hg 1L cos θ W e bzw.
g1L
g1R 2
e , 2h cos θ W
g2
s.u.
e 2h sin θ W
(16.20)
16.2 Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung
483
gesetzt werden, wobei (16.20b) aus (16.20a) und der aus (16.16) folgenden Gleichung g1L /g2 tan θ W folgt. Damit sind alle Kopplungskonstanten durch die Elementarladung e und den Winkel θW ausgedrückt. Dieser wird als elektroschwacher Mischungswinkel oder Weinberg-Winkel1 bezeichnet und bleibt theoretisch unbestimmt. Wir werden später sehen, daß er durch Messungen bestimmt werden kann, diese liefern sin2 θ W 0, 23 .
(16.21)
Aus (16.20) folgt g1L2 g2 2
e2
4h 2
1 cos2 θ W
1 sin θW 2
e2
4h 2 sin2 θ
W
cos2 θW
,
außerdem g1L >0 für cos θ W >0 und g1L <0 für cos θ W <0. Damit ergibt sich aus (16.16), daß im ersten Fall sin θ W >0 und im zweiten sin θW <0 ist, d.h. das Produkt sin θ W cos θW ist in jedem Fall positiv. Infolgedessen erhalten wir durch Wurzelziehen aus dem letzten Ergebnis (g1L2 g2 2 )1/2
2h sin θ e cos θ . W W
(16.22)
Weiterhin ergibt sich
(16.20a)
g1R sin θW (g1L2 g2 2 )1/2 (sin2 θ W
cos2 θW )
e
sin2 θW , h sin θW cos θ W 1 e 2 sin2 θW , h sin θW cos θ W
und aus (16.15a) folgt mit (16.22) noch g1L X α
g2 Wα3
2h sin θ e cos θ Z α . W W
Hiermit, mit (16.15) und (16.19)–(16.20) ergibt sich aus (16.14) schließlich
L i h c νe γ α ∂α νe eL γ α ∂α e L 1 2 sin2 θW e L γ α e L ec νe γ α e L Wα 2 sin θ W
e R γ α ∂α e R
e R γ α e R ce A α ceZ α 1 α 2 ν e γ νe sin θ cos θ W W
eL γ α eL
sin2 θW e R γ α e R e L γ α νe Wα .
(16.23) Dieses Ergebnis zeigt: Die Wechselwirkung von links- und rechtshändigen Elektronenzuständen mit dem Feld Z α ist verschieden. Um sie ähnlich wie die Wechselwirkung mit dem elektromagnetischen Feld beschreiben zu können, führen wir in dem Raum der aus den Zuständen νe und e L aufgebauten SU (2)-Dubletts (Isospinoren) den gleichen Isospinoperator I /2 mit der gleichen Ladungsregel ein wie in (13.21) für die 1 Eigentlich wurde der Winkel zuerst von Glashow eingeführt.
484
16 Standardmodell
νe eR eL
I3 1/2 0 1/2
Q 0 1 1
Q sin2 θW 1/2 sin2 θ W 1/2 sin2 θ W
I3
Tabelle 16.1: Zur Berechnung der Isospin-Ladung der Leptonen.
Neutron-Proton-Isospinoren, nur daß es sich beim Elektron und Elektronneutrino um den schwachen Isospin handelt. (Manchmal wird der schwache Isospin auch mit dem Buchstaben T bezeichnet.) Das Neutrino hat dann als das positivere Teilchen die Quane tenzahl I3νe 1/2, das linkshändige Elektron I3 L 1/2 und das rechtshändige Elektron e mit I e R 0 auch I3 R 0. Weiterhin führt man durch Q
qe
(16.24)
eine Ladungszahl Q ein, welche die Ladung in Vielfachen der Elementarladung e angibt, also Q e 1 für das Elektron und Q νe 0 für das Neutrino. Sieht man sich die zweite Zeile von (16.23) daraufhin genauer an (Tabelle 16.1), so erkennt man, daß sich der als Isospin-Ladung bezeichnete Faktor q I , mit dem die Teilchenflüsse ce L γ α e L etc. an das Feld Z α ankoppeln, in der Form qI
sin θ
e I3 Q sin2 θ W W cos θ W
(16.25)
schreiben läßt, so daß der Faktor von Z α im Beitrag zu L die Form
1 e 2 sin2 θW e L γ α e L sin2 θW e R γ α e R 12 νe γ α νe sin θ c cos θW W
q I(eL ) c e L γ α e L
q I(e R ) c e R γ α e R
q I(νe ) c ν e γ α νe (16.26)
erhält. Gleichung (16.25) zeigt, daß alle Teilchen, die entweder elektrisch geladen sind (Q 0) oder schwachen Isospin I3 0 besitzen, mit dem Feld Z α wechselwirken. Da diese Wechselwirkung in enger Analogie zu der durch den elektrischen Strom j α vermittelten Wechselwirkung geladener Teilchen mit dem elektromagnetischen Feld steht und auch für elektrisch ungeladene Teilchen wie Neutrinos möglich ist, spricht man bei ihr von einer Neutralstrom-Wechselwirkung. Der Winkel θ W kann durch den Vergleich theoretischer Ergebnisse für Wechselwirkungsprozesse mit experimentellen Ergebnissen ermittelt werden. (16.23) zeigt, daß dafür viele verschiedenartige Möglichkeiten bestehen. Ist der Winkel θ W durch eine von diesen, z.B. die Wechselwirkung von e L mit Z α , bestimmt worden, so ist er damit für alle anderen festgelegt. Das erstaunliche und für die Theorie erfreuliche Ergebnis solcher Messungen ist, daß die Untersuchung sämtlicher Wechselwirkungen ein und denselben Wert von θW bestätigt hat. Das Feld Z α geht aus den Feldern X α und Wα3 ähnlich wie das Vektorpotential Aα hervor und besitzt ähnliche Eigenschaften wie dieses. Die ihm zugeordneten Teilchen
16.2 Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung
485
sind wie die Aα zugeordneten Teilchen Bosonen und werden als Z-Bosonen bezeichnet. Es zeigt sich, daß sie eine sehr große Ruhemasse besitzen. Das macht ihre Erzeugung schwierig, da für diese viel Energie aufgebracht werden muß. Außerdem ist die durch das Feld Z α vermittelte Wechselwirkung wegen dieser großen Masse nur sehr kurzreichweitig (siehe (11.2)). Beide Gründe sind dafür verantwortlich, daß es ziemlich lange gedauert hat, bis das Z -Boson schließlich 1983 entdeckt wurde. Der Term in der letzten Zeile von (16.23) beschreibt eine Wechselwirkung zwischen Leptonen und dem Feld Wα bzw. Wα . Allerdings muß diese anders als die Leptonenwechselwirkung mit den Feldern Z α und Aα interpretiert werden, an der jeweils nur eine Leptonensorte beteiligt ist. Weil jeder der zwei Wechselwirkungsterme der letzten Zeile sowohl e L als auch νe enthält, findet hier eine durch die Felder Wα vermittelte Wechselwirkung zwischen linkshändigen Elektronen und Neutrinos statt. Die genauere Untersuchung mit den Methoden der Feldquantisierung zeigt, daß bei dieser Elektron und Neutrino ineinander umgewandelt werden können. Weil dabei Ladung verloren gehen kann, insgesamt aber Ladungserhaltung gelten muß, müssen die beiden Felder Wα bzw. die diesen zugeordneten Teilchen elektrisch geladen sein. Dies wurde schon durch die Notation zum Ausdruck gebracht. Im Ruhezustand der elektrisch geladenen W-Bosonen enthält das von deren Ladung erzeugte elektrische Feld eine Energie, der eine nichtverschwindende Ruhemasse entspricht. Tatsächlich haben die W-Bosonen eine so große Ruhemasse, daß sich bezüglich ihres Auffindens dieselben Schwierigkeiten wie beim Z -Boson ergaben. Aus (16.23) ergeben sich für die Kopplungskonstanten der Leptonenankopplung an die Felder Aα , Wα und Z α mit sin2 θW 0, 23 Werte der gleichen Größenordnung. Untersucht man jedoch mit den Methoden der Feldquantisierung vergleichbare Leptonen-Wechselwirkungsprozesse mit den Feldern Wα , Z α einerseits und Aα andererseits, so findet man ein Kräfteverhältnis von etwa 1 10 3 . Diese geringe relative Stärke ist der Grund dafür, warum die Wechselwirkung mit den Feldern Wα und Z α als schwache Wechselwirkung bezeichnet wird und die von diesen vermittelte Kraft als schwache Kraft. Diese wird daher auch meist durch andere Wechselwirkungen überdeckt, sofern sie nicht alleine wirksam ist. Wird auch noch die durch Quarks vermittelte starke Kraft mit in die Betrachtung einbezogen, so findet man schwache Kraft elektromagn. Kraft starke Kraft 10
5
10
2
1.
Der tiefere Grund für die relative Schwäche der schwachen Kraft liegt in der großen Ruhemasse der W - und Z -Bosonen. Er ist auch dafür verantwortlich, daß die Reichweite der schwachen Wechselwirkung nach (11.2) extrem klein ist (ca. 10 18 m). Zwei Teilchen müssen sich daher beinahe in einem Punkt treffen, damit eine meßbare Wechselwirkung zustande kommt. (Die erste Theorie der schwachen Wechselwirkung von E. Fermi ging daher auch von einer exakten Punkt-Wechselwirkung aus.) Die großen Teilchenmassen bilden auch die Ursache dafür, warum auf der schwachen Wechselwirkung beruhende Teilchenzerfälle, z. B. der Betazerfall des Neutrons, um viele Größenordnungen langsamer vonstatten gehen als auf anderen Wechselwirkungen beruhende Zerfälle. Die gemeinsame Herkunft der Felder Aα , Wα und Z α aus den Eichfeldern X α und Wα bedeutet, daß die Felder der schwachen und elektromagnetischen Wechselwirkung verschiedene Komponenten ein und desselben Gesamtfeldes X α , Wα sind,
486
16 Standardmodell
ähnlich wie das elektrische Potential φ und das Vektorpotential A verschiedene Komponenten des Viererpotentials Aα oder wie das elektrische Feld E und das Magnetfeld B Komponenten des elektromagnetischen Feldtensors Fαβ sind. Durch das WeinbergSalam-Modell ist also eine Vereinheitlichung der elektromagnetischen und schwachen Wechselwirkung gelungen, die zusammen genommen daher oft als elektroschwache Wechselwirkung bezeichnet wird.
Exkurs 16.1: Fall unterschiedlicher U º1»-Kopplungsfelder Bei unterschiedlichen U (1)-Kopplungsfeldern haben wir statt (16.8)–(16.9) h c α L α DR e Lγ D L e γ α α L R R i mit DαR ∂α i g1R X αR . DαL ∂α i g1L X αL i g2 Wα ,
Für den Wechselwirkungsanteil in (16.14) enthaltenen Anteils
LX mit den Feldern X αL und X αR ergibt sich damit anstelle des
LX/(h c) g1R X αR e R γ α e R (g1L X αL g2 Wα3 )νe γ α νe (g1L X αL
g2 Wα3 )e L γ α e L .
Mit den (16.15) und (16.17) entsprechenden Definitionen Z αL A αL
Wα3 cos θWL , L W 3 sin θ L , X αL cos θW α W L X αL sin θ W
AαR
Z αR
in denen die Winkel (16.16) entsprechend durch L g1L L g2 R sin θW , cos θ W , sin θ W 2 2 2 2 g1L g2 g1L g2
Wα3 cos θWR , R W 3 sin θ R , X αR cos θW α W R X αR sin θW
g1R
R , cos θW 2 2 g1R g2
g2
2 g 2 g1R 2
erklärt sind, und die in Analogie zu (16.18) in der Form
Wα3 X αL
Z αL sin θWL , X αR AαR cos θWR Z αR sin θWR , L Z L cos θ L A R sin θ R Z R cos θ R AαL sin θ W α α α W W W L AαL cos θW
aufgelöst werden können, ergibt sich daraus die (16.19) entsprechende Beziehung eX W 3 (g 2 g 2 )1/2 sin2 θ L cos2 θ L e γ α e Z L g R α R L α W W 1L 2 1R sin θ W e R γ e R Z α L h c
L e γ αe AL 2g1L cos θW L α L
R e γ αe A R . g1R cos θ W R α R
Da die (ungeladenen) Neutrinos mit dem Feld Z αL wechselwirken, kann dieses nicht mit dem Viererpotential des elektromagnetischen Feldes identifiziert werden. Die elektromagnetische Wechselwirkung kann daher nur von den Feldern A αL und AαR herrühren. Gemäß der in Abschn. 16.1 aufgestellten Forderung 3. verlangen wir jetzt L e γ αe AL 2g1L cos θ W L α L
R e γ αe AR g1R cos θW R α R
1 c(e L e R )γ α (e L e R ) q Aα h c e (14.40) e L γ α eL e R γ α e R Aα . h
16.2 Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung
487
Diese Gleichung muß für beliebige Zustände e L und e R erfüllt sein, daher folgt aus ihr e Aα , h
L AL 2g1L cos θW α
R AR g1R cos θW α
e Aα . h
Hieraus folgt AαL c L A α und AαR c R Aα mit konstanten Faktoren c L und c R . Indem wir ¼ ¼ ¼ ¼ sowie c R g1R g1R setzen und die Umbenennungen g1L g c L g1L g1L 1L sowie g1R g1R vornehmen – die Kopplungskonstanten sind bisher durch nichts festgelegt –, erhalten wir aus den zwei letzten Gleichungen e e L R , g1R cos θW . 2g1L cos θW h h Die Neudefinition der Kopplungskonstanten und deren anschließende Umbenennung, also g1L A αL g1L c L A α g1L Aα und g1R A αR g1R c R A α g1R Aα , sind äquivalent damit, AαL
A αR
Aα
zu setzen. Durch Einsetzen der Definitionen der Felder AαL und AαR in diese Beziehung ergibt sich L L 3 L R R 3 R X α cos θ W Wα sin θ W X α cos θ W Wα sin θ W . Diese Gleichung muß in jedem internen System erfüllt sein, zu dem man durch Eichtransformationen übergehen kann. Da sich die Felder X αL , X αR und Wα3 jedoch völlig verschieden transformieren, müssen die Koeffizienten, die auf der linken und rechten Seite bei Wα3 stehen, übereinstimmen. Hieraus folgt L R sin θW sin θ W sin θ W , und damit folgt aus der verbliebenen Gleichung schließlich X αL
X αR
Xα .
Damit ist im Nachhinein gezeigt, daß die in (16.8)–(16.9) eingegangene Annahme gleicher Kopplungsfelder X α gerechtfertigt war.
16.2.2 Lagrange-Dichte
B für freie Bosonenfelder
Wir müssen jetzt noch den Anteil
B (X α , Wα )
1 X αβ X αβ 4μ0
mit X αβ
∂α X β
1 Wαβ W αβ 4μ0
(16.27)
∂β X α
der Lagrange-Dichte für freie Bosonenfelder X α und Wα durch die physikalischen Felder A α , Z α , Wα und Wα ausdrücken. Nach (16.15) bzw. (16.17) sind A α und Z α aus den Feldern X α und Wα3 zusammengesetzt, die sich unterschiedlich transformieren
488
16 Standardmodell
und sehr unterschiedlichen Feldgleichungen genügen, linearen für X α und nichtlinearen für Wα3 . Der erste Punkt bedeutet, daß das Transformationsverhalten von A α und Z α weder mit dem von X α noch mit dem von Wα3 übereinstimmt, sondern aus der entsprechenden Kombination berechnet werden muß. Der zweite Punkt hat zur Folge, daß die nichtlinearen Terme zu einer Modifikation der Maxwell-Gleichungen führen. Mit den Definitionen ∂α A β ∂β A α , Z αβ ∂α Z β ∂β Z α , (16.28) Fαβ Wαβ
∂ α Wβ
∂ β Wα ,
Wαβ
∂α Wβ
∂ β Wα
(16.29)
ist das Ergebnis der im Anschluß folgenden Umrechnung
B
1 (W ,αβ ) W (W ,αβ ) Z αβ Z αβ Fαβ F αβ Wαβ αβ 4μ0 i g 2 Fαβ sin θW Z αβ cos θ W W ,α W ,β W ,β W ,α μ0 ( ) Wαβ W ,α Aβ W ,β Aα Wαβ W ,α Aβ W ,β Aα sin θW ( ) Wαβ W ,α Z β W ,β Z α Wαβ W ,α Z β W ,β Z α cos θW 2g22 Wα W ,α Aβ Aβ Wα Aα Wβ A β sin2 θ W μ0 2Wα W ,α Aβ Z β Wα Aα Wβ Z β Wα Z α Wβ Aβ sin θW cos θW Wα W ,α Z β Z β Wα Z α Wβ Z β cos2 θW ( ,α 2 ) Wβ W ,β Wα W ,α Wα W . (16.30)
Beweis: Der Übersichtlichkeit halber werden hier nochmals die Zusammenhänge (16.18), Xα
Aα cos θ W
Z α sin θW ,
Wα3
Aα sin θW Z α cos θW ,
angeschrieben, und aus (16.13) errechnet man leicht Wα1
1
2
Wα Wα
,
Aus X αβ ∂α X β ∂β X α ergibt sich damit X αβ Fαβ cos θ W und X αβ X αβ
Wα2
i
2
Wα
Wα
.
(16.31)
Z αβ sin θW
Fαβ F αβ cos2 θW Z αβ Z αβ sin2 θW
2Fαβ Z αβ sin θW cos θ W .
(16.32)
Zur Berechnung des Wα -Anteils zerlegen wir Wα
Wα1 ex Wα2 e y Wα3 ez
(16.33)
und erhalten damit sowie mit den abkürzenden Definitionen W W 3 W W 3 W Aβ W Aα sin θW W Z β W Z α cos θW , (16.34) Pαβ α α β α α β β β Pαβ Wα Wβ3 Wβ Wα3 , Wα A β Wβ Aα sin θW Wα Z β Wβ Z α cos θW (16.35)
16.2 Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung
489
aus (15.28) bzw. Wαβ ∂α Wβ ∂β Wα 2g2 Wα Wβ das Zwischenergebnis Wαβ ∂α Wβ1 ∂β Wα1 2g2 Wα2 Wβ3 Wα3 Wβ2 ex ∂α Wβ2 ∂β Wα2 2g2 Wα3 Wβ1 Wα1 Wβ3 e y ∂α Wβ3 ∂β Wα3 2g2 Wα1 Wβ2 Wα2 Wβ1 ez (16.29) (16.31)
P ) ex 1 (Wαβ Wαβ ) 2i g2 (Pαβ αβ 2 i (Wαβ Wαβ ) 2i g2 (Pαβ Pαβ ) ey 2 Fαβ sin θW Z αβ cos θW 2i g2 Wα Wβ
Wβ Wα
ez .
Mit Abkürzungen der Art L αβ L αβ (L αβ )2 ergibt sich hieraus W 2 4i g W W P 2 2Wαβ W αβ Wαβ P ,αβ P ,αβ 4g22 Pαβ 2 αβ αβ αβ αβ
W 2 4i g W W P ,αβ P ,αβ 4g2 P P 2 Wαβ 2 2 αβ αβ αβ αβ αβ 2 Fαβ F αβ sin2 θW Z αβ Z αβ cos2 θW 2Fαβ Z αβ sin θW cos θW 2 4g22 Wα Wβ Wβ Wα 4i g2 Fαβ sin θW Z αβ cos θW W ,α W ,β W ,β W ,α . Hierin heben sich eine Reihe von Termen gegenseitig weg, und durch Hinzufügen von (16.32) ergibt sich X αβ X αβ
W Wαβ W αβ 2Wαβ
,αβ
P 4g22 Pαβ
,αβ
Fαβ F αβ Z αβ Z αβ
P ,αβ W P ,αβ Wβ Wα )2 4i g2 Wαβ αβ ,α ,β ,β (Fαβ sin θW Z αβ cos θW ) W W W W ,α . (16.36) 4g22 (Wα Wβ
Nun errechnet sich mit (16.34)-(16.35) P ,αβ W Aβ W Aα W ,α Aβ W ,β Aα sin2 θW Pαβ α β Wα Aβ Wβ Aα W ,α Z β W ,β Z α sin θW cos θW Wα Z β Wβ Z α W ,α Aβ W ,β Aα cos θW sin θW Wα Z β Wβ Z α W ,α Z β W ,β Z α cos2 θW 2 Wα W ,α Aβ Aβ Wα Aα Wβ Aβ sin2 θW 2 2Wα W ,α Aβ Z β Wα Aα Wβ Z β Wα Z α Wβ Aβ sin θW cos θW 2 Wα W ,α Z β Z β Wα Z α Wβ Z β cos2 θW
) und weiterhin ergibt sich mit der aus (16.13) und (16.29) folgenden Relation Wαβ (Wαβ W ,αβ 2W W ,αβ 2W W ,αβ W W ,αβ W W ,αβ . 2Wαβ αβ αβ αβ αβ
490
16 Standardmodell
Schließlich haben wir noch 2 Wα Wβ Wβ Wα
2 Wα W ,α Wβ W ,β
2 Wα W ,α
und
P ,αβ Wαβ
Wαβ P ,αβ
W ,α Aβ Wαβ W ,α Z β Wαβ
W W
Wαβ W ,α Aβ W ,β Aα sin θW ,β Z α W ,α Z β W ,β Z α cos θW . αβ W
,β Aα
Einsetzen all dieser Ergebnisse in (16.36) liefert (16.30).
16.2.3 Modifizierte Maxwell-Gleichungen Als Beitrag zu den Gleichungen für das elektromagnetische Feld bzw. Aα ergibt sich aus
(16.30) unter Benutzung von Wαβ
∂ B ∂(∂ α A β )
∂ B ∂ Aβ
1 Fαβ μ0 2i g 2
Wβα
Aβ L α Wαβ Aα L β α β Wβα
2i g2 Wα Wβ μ0
W Wαβ
,α
Wβ Wα
Aβ L α Wαβ
sin θ W
Wαβ W ,α sin θ W
μ0 2g22 2Wα W ,α A β Wα A α Wβ Wα A α Wβ sin2 θW μ 0 2Wα W ,α Z β Wα Z α Wβ Wα Z α Wβ sin θW cos θW .
Hierzu treten aus den übrigen Bestandteilen der Lagrange-Dichte noch elektrische Ströme j β , so daß die Feldgleichungen für Aα die Form ∂ α Fαβ μ0 jβ 2i g2 sin θW ∂ α WαWβ WβWα 2i g2 Wαβ W ,α Wαβ W ,α 2g22 2Wα W ,α Aβ Wα Aα Wβ Wα Aα Wβ sin2 θW 2Wα W ,α Z β Wα Z α Wβ Wα Z α Wβ sin θW cos θW
(16.37)
erhalten. Dies sind modifizierte Maxwell-Gleichungen, bei denen gegenüber den klassischen Maxwell-Gleichungen alle Terme ab der zweiten Zeile neu hinzugetreten sind. Sie sind zwar noch immer in Aα linear. In der dritten Zeile steht jedoch ein zu Aα proportionaler Quellterm, der eine lineare Selbsterregung darstellt. Allerdings ist dieser an die gleichzeitige Anwesenheit von W -Bosonen gekoppelt, so daß man von einer durch diese katalysierten Selbsterregung sprechen kann. Die modifizierten MaxwellGleichungen sind immer dann heranzuziehen, wenn W - und Z -Bosonen eine Rolle spielen.
16.3 Einbeziehung der Quarks
16.3
491
Einbeziehung der Quarks
Die Quarks nehmen als geladene Teilchen an der elektromagnetischen Wechselwirkung und hierdurch zwangsläufig auch an der schwachen Wechselwirkung teil. Dazu kommt bei ihnen aufgrund ihrer Farbladung noch die Wechselwirkung mit dem Gluonenfeld. Diese Wechselwirkungen werden im folgenden separat untersucht.
16.3.1 U º1»- und SU º2»-invarianter
-Anteil der Quarks
Beim Einbeziehen der Quarks in die Weinberg-Salam-Theorie können wir bzgl. des U (1)- und SU (2)-invarianten Anteils von Q wie bei den Leptonen vorgehen. Statt der Zustände (16.7) haben wir 3 4 uL (16.38) , u R , dR , Lu dL
und in Analogie zu (16.8)–(16.9) setzen wir h c α ¼ L L γ Dα L i
1,2 Q mit
∂α DαR ∂α Dα¼ L ¼
u R γ α DαR u R d R γ α Dα R d R ¼
¼ i g1L Xα
i g2
¼ i g1R Xα ,
¼¼
Wα , Dα R ∂α
(16.39)
(16.40)
¼¼ i g1R Xα ,
¼¼
wobei X α und Wα die schon für die Leptonen benutzten Kopplungsfelder sind. 1,2 Q wäre auch dann gegenüber Eichtransformationen der Gruppen U (1) und SU (2) invariant, wenn die drei kovarianten Ableitungen (16.40) mit drei voneinander verschiedenen Feldern X α gebildet würden, und diese sowie Wα könnten sogar von den für die Leptonen benutzten Eichfeldern verschieden sein. Ähnlich, wie das im Exkurs 16.1 für die Leptonen geschehen ist, kann jedoch gezeigt werden, daß diese viel allgemeinere Möglichkeit durch die Forderungen 3. und 4. aus Abschn. 16.1 auf den Ansatz (16.39)–(16.40) reduziert wird (Aufgabe 16.2). In (16.40) sind für die Ankopplung der beiden rechtshändigen Quarks wegen deren unterschiedlicher Ladung verschiedene Kopplungskonstanten angesetzt, und es muß ¼ zugelassen werden, daß diese und g1L andere Werte als die leptonischen Kopplungskonstanten g1L und g1R besitzen. An dem früheren Wert von g2 muß nach Abschn. 15.2.1 dagegen festgehalten werden. Aus dem Transformationsgesetz (15.9) bzw. (16.10),
X α¼
Xα
folgt
1 ∂α Λ L g1L
Xα
1 ∂α Λ¼ L ¼ g1L
¼
Λ¼ L
gg1L Λ L , 1L
Xα
1 ∂α Λ¼ R ¼ g1R
¼
Λ¼ R
gg1R Λ L , 1L
Xα
1 ∂α Λ¼¼ R ¼¼ g1R
¼¼
Λ¼¼ R
gg1R Λ L ,
(16.41)
1L
und die Quarkzustände transformieren sich in Analogie zu (16.12) gemäß L ¼u
ei (
Λ¼ L
) Lu ,
u R
e
i Λ¼ R
uR ,
d R
e
i Λ¼¼ R
dR .
(16.42)
492
16 Standardmodell
Aus (16.39) ergibt sich in Analogie zu (16.14)
1,2 Q hc
u R γ α ∂α u R d R γ α ∂α d R ¼ ¼ α ¼¼ α 3 α g1R X α u R γ u R g1R X α d R γ d R g1L X α g2 Wα u L γ u L ¼ 3 α α α g1L X α g2 Wα d L γ d L 2 g2 Wα u L γ d L Wα d L γ u L . (16.43)
i
u L γ α ∂α u L
d L γ α ∂α d L
Mit (16.18) vollziehen wir den Übergang von X α und Wα3 zu Aα bzw. Z α und erhalten für den die Wechselwirkung mit diesen Feldern betreffenden Anteil von 1,2 Q
1,2 QWW hc
sin θW g cos θW u γ α u g1L L 2 L
g1L sin θW g2 cos θ W d L γ α d L
sin θW u γ α u g sin θW d γ α d Z α R 1R R R R
g1R
g1L cos θ W g2 sin θW d L γ α d L α α g1R cos θ W u R γ u R g1R cos θ W d R γ d R A α .
cos θW g sin θW u γ α u g1L L 2 L
Aufgrund der 3. Voraussetzung von Abschn. 16.1 müssen wir wieder die Forderung stellen, daß die Wechselwirkung von u L und u R bzw. von d L und d R mit Aα gleichartig ist, was zu den Gleichungen
cos θW g1L
g2 sin θW
cos θW , g1R
cos θW g1L
g2 sin θW
cos θW g1R
führt. Durch Elimination von g2 ergibt sich aus diesen
2g1L
g . g1R 1R
(16.44)
Da die im Aα -Term von 1,2 QWW neben den Teilchenströmen stehenden Faktoren die Ladungen angeben, muß der Faktor neben cu R γ α u R mit der Ladung 2e/3 des Upquarks und der neben cd R γ α d R mit der Ladung e/3 des Downquarks übereinstimmen. Dies führt mit (16.44) zu
g1R
g1R
2e , 3h cos θW
e , 3h cos θ W
g1L
e . 6h cos θ W
Benutzt man noch (16.20b) und setzt die erhaltenen Ergebnisse in
1,2 QWW ein, so folgt
e Aα 2 u L γ α u L u R γ α u R d L γ α d L d R γ α d R 3 2 α 2 α c 2 3/4 sin θ W u L γ u L 3/2 sin θ W d L γ d L
1,2 QWW c
sin
2
θW
2u R γ
α
u R d R γ α d R
(16.45)
eZ α . 3 sin θ W cos θ W
16.3 Einbeziehung der Quarks
uL uR dL dR
I3 1/2 0 1/2 0
493 I3 Q sin2 θ W 1/2 (2/3) sin2 θ W (2/3) sin2 θ W 1/2 (1/3) sin2 θ W (1/3) sin2 θ W
Q 2/3 2/3 1/3 1/3
Tabelle 16.2: Zur Isospin-Ladung der Quarkzustände.
Im Wechselwirkungsterm mit dem Feld Z α kann noch die in (16.25) definierte IsospinLadung eingeführt werden, deren wesentlicher Bestandteil in Tabelle 16.2 für die verschiedenen Quarkzustände ausgerechnet ist. Insgesamt erhalten wir damit schließlich
u L γ α ∂α u L d L γ α ∂α d L u R γ α ∂α u R d R γ α ∂α d R ec Wα u L γ α d L Wα d L γ α u L 22esin θ W e c u Lγ αu L u Rγ αu R d L γ α d L d R γ α d R Aα 3 3 α c qI u L u L γ u L qI dL dL γ α dL qI u R u R γ α u R qI dR dR γ α dR Zα .
1,2 c Q ih
(16.46)
16.3.2
SU º3»-invarianter -Anteil der Quarks: Quantenchromodynamik
In diesem Abschnitt sollen auch noch die Farbzustände der Quarks berücksichtigt werden. Dazu muß eine Lagrange-Dichte konstruiert werden, die gegenüber SU (3)Transformationen der Farbzustände invariant ist, gleichzeitig aber auch gegenüber SU (2)-Transformationen der Isospinzustände und U (1)-Transformationen sämtlicher Teilchenzustände. Dies kann geschehen, indem wir die Lagrange-Dichte (16.39) benutzen, die Zustände u L , d L , u R und d R in (16.38) jedoch durch SU (3)-Tripletts ersetzen, also 3 4 3 4 u Lr u Rr u L u Lg , u R u Rg etc. , (16.47) u Lb u Rb und die kovarianten Ableitungen (16.40) durch Dα L Dα R
X α i g Wα i g3 ∂α i g1L 2 X α i g3 ∂α i g1R
8 k 1
λk G kα ,
8 k 1
λk G kα , (16.48) Dα R
X α i g3 ∂α i g1R
8 k 1
λk G kα ,
wobei λk die Gell-Mann-Matrizen (12.61) und G kα die in (15.46) eingeführten Kopplungsfelder sind. Dabei verabreden wir, daß die Triplettstruktur der Farbzustände nur
494
16 Standardmodell
für die G kα -Terme der Ableitungen eine Rolle spielt, also durch die 2 2 Matrizen Wα nicht beeinflußt wird. Bei der Auswertung der Lagrange-Dichte (16.39) erhalten wir dann gegenüber (16.43) zusätzlich Terme der Form 3 4 α λ Gk u γ k α k α L L γ λk G α L (u L , d L ) u L γ α λk G kα u L d L γ α λk G kα d L γ α λk G kα d L bzw. u R γ α λk G kα u R d R γ α λk G kα d R . In der Summe ergibt sich damit
Q 1,2 Q
3 Q
mit
g3h c 3 Q
8 q u,d j L,R
q j λk γ α q j G kα .
(16.49)
k 1
3Q beschreibt ausschließlich Wechselwirkungen und Übergänge zwischen den ver-
schiedenen Farbzuständen ein und desselben Quarks, d. h. Farbwechselwirkungen lassen den Flavor unverändert. Weil auch keine Veränderungen der elektrischen Ladungen auftreten, sind die Gluonenfelder G kα elektrisch ungeladen. Wie steht es mit der Ruhemasse der Gluonen? Einerseits ist keine SU (3)-invariante Form eines Ruhemasseterms für die Gluonen bekannt. Andererseits gibt es anders als bei den W -und Z -Bosonen auch keine plausiblen Argumente für die Annahme, daß die Gluonen eine nicht-verschwindende Ruhemasse besitzen sollten. Um das besser zu verstehen, führen wir uns nochmals vor Augen, warum W - und Z -Bosonen Ruhemasse besitzen: Bei geladenen Teilchen wie dem Elektron, den Quarks oder den W -Bosonen enthält das elektrische Feld eine Energie, der eine nichtverschwindende Ruhemasse entspricht. Um für diese Teilchen einen Ruhemasseterm in das Standardmodell integrieren zu können, wurde das Higgs-Feld eingeführt. Durch die unvermeidbare Wechselwirkung mit diesem erhielt auch das ungeladene Z -Boson eine Ruhemasse. Zwischen den Gluonen (Quanten der Gluonenfelder G kα ) und dem Higgs-Feld gibt es keine Wechselwirkung, weil die 3 3-Matrizen λk nicht auf den das Higgs-Feld repräsentierenden zweikomponentigen Zustand Φ einwirken. Eine solche könnte es allenfalls mit einem neuen Hilfsfeld der mathematischen Struktur eines SU (3)-Tripletts geben. Es gibt jedoch keinen vernünftigen Grund dafür, ein derartiges Feld einzuführen.
16.4
Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
16.4.1 Bosonenmassen Ruhemasseterme m 0W c2 (W α ) Wα , die massive W -Bosonen repräsentieren könnten, wären für sich alleine genommen nicht invariant gegenüber den Transformationen (15.25) der Gruppe SU (2). Bei einem Ruhemasseterm m 0Z c2 Z α Z α für massive Z -Bosonen ergäbe sich zusätzlich das Problem, daß das Feld Z α eine Mischung der
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
495
Felder X α und Wα3 ist, die unterschiedlich transformiert werden müssen. Nachdem wir jedoch im letzten Kapitel anhand einfacher Beispiele gesehen haben, wie man mit Hilfe eines Feldes gebrochener Symmetrie unter Wahrung der geforderten Invarianzeigenschaften Ruhemasseterme erhält, soll jetzt versucht werden, die fraglichen Bosonenmassen auf diese Weise zu erklären. Zu diesem Zweck führen wir zusätzlich zu den Leptonenfeldern sowie den Kopplungsfeldern X α und Wα ein Hilfsfeld ein, das an beide Felder X α und Wα ankoppelt. Um das zu erreichen, nehmen wir für dieses die Form ρ(x) Φ1 (x) i Φ2 (x) Φ(x) (16.50) τ (x) Φ3 (x) i Φ4 (x) eines SU (2)-Dubletts an. Dieses Hilfsfeld wird als Higgs-Feld bezeichnet. Die Lagrange-Dichte h 2 α μc 2 λ (D Φ) (Dα Φ) Φ Φ (Φ Φ)2 (16.51) H 2μ 2 4 mit (16.52) Dα ∂α i g1 X α i g2 Wα
ist invariant gegenüber den lokalen U (1) SU (2)-Eichtransformationen i ΛΦ (x) ρ ρ i ΛΦ (x) (x) i (x) e . Φ bzw. e Φ e Φ i Λ (x) τ τ e
(16.53)
(Man beachte, daß als Kopplungsfelder bewußt die gleichen Felder X α und Wα wie für die Leptonen benutzt werden, weil es darum geht, durch ihre Wechselwirkung mit dem Feld Φ die Ruhemassen der ihnen zugeordneten Teilchen zu erklären.) Die Kopplungsstärke g1 des Higgs-Feldes an das Feld X α , die von der der Fermionenfelder verschieden sein kann, lassen wir im Moment noch offen, nur g2 muß aus den in Abschn. 15.2.1 genannten Gründen mit dem in (16.20b) gewählten Wert übereinstimmen. Aus dem Transformationsgesetz (16.10) und dem aus (16.52) folgenden Transformationsgesetz für X α folgt in Analogie zu (16.11) g ΛΦ 1 Λ L . (16.54) g1L Das Potential der Lagarange-Dichte (16.51) ist V (Φ) mit Φ Φ ρ 2 gelfläche
τ 2 Φ12
ρ 2 τ 2 Φ12
μc2 Φ Φ 2
λ 2 (Φ Φ) , 4
(16.55)
Φ22 Φ32 Φ42 besitzt es sein Minimum auf der HyperkuΦ22
Φ32
Φ42
μcλ Φ0 Φ0 Φ0 2 , 2
(16.56)
und wir zerlegen Φ wieder gemäß Φ Φ0 ϕ. Es wäre instruktiv, diese Zerlegung in (16.51) einzusetzen und bei einigen Termen auftretende Interpretationsschwierigkeiten
496
16 Standardmodell
durch eine Eichtransformation zu einem für die Interpretation geeigneten internen Koordinatensystem auszuräumen. (Dies wird dem Leser zur Übung empfohlen.) Die Ergebnisse von Abschn. 15.4 weisen jedoch schon darauf hin, daß es empfehlenswert ist, möglichst viele der Felder Φ1 , Φ2 , Φ3 , Φ4 zum Verschwinden zu bringen. Der SU (2)Anteil der Transformation (16.53) enthält drei Funktionen θi (x), und nach Aufgabe 16.3 können diese so gewählt werden, daß in jedem Punkt Φ1¼ Φ2¼ Φ4¼ 0 gilt. Dies bedeutet nach (16.50), daß ρ ¼ identisch verschwindet und τ ¼ reell wird. Als Grundzustand erhalten wir damit aus (16.56) mit der Umbenennung τ ¼ τ 5 μ . (16.57) τ0 c λ
Mit der Zerlegung τ τ0 η in Grund- und Anregungszustand erhalten wir dann 0 0 0 0 Φ Φ0 ϕ bzw. Φ0 , ϕ . (16.58) τ τ0 η τ0 η
Damit wird es einfach, die Lagrange-Dichte (16.51) auf das Anregungsfeld η umzuschreiben. Zunächst gilt noch ganz allgemein α ∂ ϕ i ψ ,α (∂α ϕ i ψα ) (16.59) (Dα Φ) (Dα Φ) ,α α α ,α (∂ ϕ )(∂α ϕ) i ψ ∂α ϕ (∂ ϕ )ψα ψ ψα mit ψα
g X g W Φ . α
1
2
α
(16.60)
Unter Benutzung einer (12.50) entsprechenden Beziehung für die Matrix Wα ergibt sich g2 (Wα1 i Wα2 ) g1 X α g2 Wα3 g2 (Wα1 i Wα2 ) ρ ρ 0 τ , (16.61) ψα τ g2 (Wα1 i Wα2 ) g1 X α g2 Wα3 g1 X α g2 Wα3
und mit (16.13) wird daraus 2g W τ 2g (W ) , g X g W , ψ ψ τ . g X g W (16.62) Wird dies in (16.59) eingesetzt und ρ 0 sowie τ τ benutzt, so fällt dort der Imagi
α
2
α
1
α
2
,α
3 α
,α
2
1
α
3,α
2
närteil heraus, und aus (16.51) ergibt sich h H 2μ
2g (W ) W τ (g X g W )(g X g W )τ μc2 τ λ4 τ wobei noch τ τ η einzusetzen ist. 2
(∂ α η)(∂α η)
1
α
2
3 α
2 2
1
α
,α
2
α
3,α
2
2
2
0
2
(16.63) 4
,
Um den Term mit den Feldern X α und Wα3 besser interpretieren zu können, schreiben wir für ihn α g1 g2 g12 X g1 X α g2 Wα3 g1 X α g2 W 3,α ) (X α , Wα3 ) . g 1 g2 g22 W 3,α
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
497
Da sich hieraus die Ruhemassen der Eichfeldquanten ergeben müssen – multipliziert mit h 2 τ02 /(2μ) handelt es sich um den in X α und Wα3 quadratischen Anteil von H –, läßt sich g g g1 2 1 2 M g1 g 2 g2 2
bis auf einen konstanten Faktor als eine Art Massematrix interpretieren. Man findet für diese leicht die Eigenwerte 0 und g1 2 g2 2 , die zugehörigen und auf eins normierten Eigenvektoren sind g2 , g1 /(g12 g22 )1/2 bzw. g1 , g2 /(g12 g22 )1/2 . Da
g2 X α g1 Wα3
g1 X α
und
(g12 g22 )1/2
g2 Wα3
(g12 g22 )1/2
in der angegebenen Reihenfolge die Projektionen des Vektors X α , Wα3 auf die Eigenvektoren zu den Eigenwerten 0 bzw. g12 g22 sind, erhalten wir für den in X α und Wα3 quadratischen Anteil von H
s.u. h 2 τ02 g X α g W 3 g2 X α g1 W 3,α g1 X α g2 Wα3 g1 X α g2 W 3,α 0 2 2 2 1 α 2μ (g1 g2 )1/2 (g12 g22 )1/2 h 2 (g1 2 g2 2 )τ02 g1 X α g2 Wα3 g1 X α g2 W 3,α . 2μ (g12 g22 )1/2 (g12 g22 )1/2 (Mit X α , Wα3 ψ entspricht dies der Zerlegung ψ M ψ
i, j
i, j
ψ ψi ψi M ψ j ψ j ψ
ψ ψi M j δi j ψ j ψ
Mi ψi ψ 2,
i
wobei ψi Eigenzuständen des Operators M mit Eigenwerten Mi sind.) Es gibt also eine Feldkombination, der Teilchen der Ruhemasse null, und eine, der Teilchen mit nicht verschwindender Ruhemasse zugeordnet sind. Nun erwarten wir für die aus X α und Wα3 zusammengesetzten Felder A α und Z α die Ruhemasseterme m 20Z c2
m 20 A c2
4μ0 h
4μ0 h 2
Z Zα 2 α
Aα Aα .
Der Vergleich mit dem zuletzt erhaltenen Ergebnis zeigt, daß die Quanten eines der beiden Felder die Ruhemasse null besitzen müssen, und es ist klar, daß der richtige Kandidat hierfür A α ist. Dies führt uns dazu, die Zuordnungen Aα
g2 X α
g1 Wα3
(g12 g22 )1/2
,
Zα
g1 X α
g2 Wα3
(g12 g22 )1/2
(16.64)
zu treffen, und der Vergleich mit (16.15) bzw. (16.17) zeigt, daß das möglich ist, wenn wir e (16.10) (16.65) g1 g1L 2h cos θ W
498
16 Standardmodell
setzen. Um die endgültige Form von (W
,α
) Wα
(16.13)
H zu erhalten, benutzen wir 1 ,α (W ) Wα 2
(W ,α ) (Wα )
(W ,α ) Wα ,
τ τ0 η mit τ0 c μ/λ sowie (16.22) und erhalten aus (16.63) schließlich h 2 α H 2μ (∂ η)(∂α η) μc2 η2 e2 c2
8λ sin2 θW e2 8μ sin2 θ W
Z α Zα (W ,α ) Wα (W ,α ) Wα cos2 θ W
Z α Zα λ (W ,α ) Wα (W ,α ) Wα 2τ0 η η2 λτ0 η3 η4 . 4 cos2 θW
(16.66) (Dabei haben sich in η lineare Terme wegen τ0 c μ/λ gegenseitig weggehoben, außerdem wurden konstante Terme weggelassen, weil sie für die Variation keine Rolle spielen.) Diese Lagrange-Dichte enthält wieder nur ein einziges Feld η, dessen Quant ein massives Higgs-Boson H der Ruhemasse 2μ ist. Alle Goldstone-Bosonen wurden von den Eichfeldern Wα (x) und Z α (x) „aufgefressen“, wodurch diese Ruhemassen erhalten haben. Da die bosonischen Felder Wα die gleiche mathematische Struktur und dieselbe Dimension wie A α besitzen, erwarten wir für sie in Analogie zu (14.14) Masseterme der Form m 20 c2 W α Wα /(2μ0 h 2 ). Damit erhalten wir zur Bestimmung der Ruhemassen aus (16.66) die Beziehungen e2 c2 8λ sin2 θW
2
2
m 0W c2 , 2μ0 h
2
e2 c2 8λ sin2 θ W cos2 θ W
2
m 0Z c2 2μ0 h
(16.67)
und insgesamt das Ergebnis m 0W m 0γ
2 sinehθ 0,
5 W
μ0 , λ
m 0H
m 0Z
2 sin θ ehcos θ W
2μ .
5 W
μ0 , λ
(16.68) (16.69)
Da die errechneten Ruhemassen m 0W und m 0Z noch den unbestimmten Faktor λ enthalten, kann man nicht behaupten, sie seien wirklich theoretisch bestimmt worden, vielmehr kann eine von ihnen nach ihrer experimentellen Ermittlung zur Bestimmung von λ benutzt werden. Das Massenverhältnis m 0W cos θW (16.70) m 0Z ist allerdings eine echte und überprüfbare Voraussage der Theorie, und sein theoretischer Wert (mit (16.21) gleich 0, 88) wurde durch das Experiment voll bestätigt. Weiterhin kann als experimentell bestätigtes theoretisches Ergebnis gewertet werden, daß positiv und negativ geladene W -Bosonen die gleiche Ruhemasse besitzen. Schließlich ergab sich auch der korrekte Wert m 0γ 0, nachdem wir nur m 0Z 0 festgelegt hatten. Da das Higgs-Boson nicht mit dem Feld Aα wechselwirkt, ist es elektrisch neutral.
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
499
Auch jetzt ist die Zahl der Freiheitsgrade bei der Symmetriebrechung wieder erhalten geblieben. Vor der Symmetriebrechung gibt es in den vier ruhemasselosen HiggsFeldern Φ1 , .., Φ4 (4 Freiheitsgrade) sowie den vier ruhemasselosen Eichfeldern X α und Wα mit je zwei Freiheitsgraden (8 Freiheitsgrade) insgesamt 12 Freiheitsgrade, nach ihr die gleiche Anzahl in einem massiven Higgs-Feld η (1 Freiheitsgrad), dem elektromagnetischen Feld A α mit dem ruhemasselosen Photon (2 Freiheitsgrade) und in drei massiven Eichfeldern, Wα , Wα und Z α , mit je drei Freiheitsgraden (zusammen 9 Freiheitsgrade). Die Felder Φ1 , Φ2 und Φ4 sind zwar in den zuletzt gewählten Koordinaten aus der Lagrange-Dichte verschwunden. Für gewisse Untersuchungen kann es jedoch nützlich sein, auf die allgemeinere Darstellung zurückzugehen, in der diese noch enthalten sind. Die ihnen formal zugeordneten Quanten spielen dabei die imaginäre Rolle nicht real existenter Geisterteilchen. Die in (16.60) eingeführte Hilfsgröße ψα erhält in diesem Fall nach (16.61) unter Benutzung von (16.64) die Form (g1 X α g2 Wα3 )ρ 2g2 Wα τ ψα 2g2 Wα ρ (g12 g22)1/2 Z α τ , und mit der aus (16.18), (16.20) und (16.65) folgenden Beziehung 1 e g1 X α g2 Wα3 sin2 θ W Z α h sin θW cos θ W 2
e Aα h
wird daraus 4 3 ( 12 sin2 θ W )eZ α /(h sin θW cos θW ) e Aα /h ρ 2eWα τ/(2h sin θW ) ψα . 2eWα ρ/(2h sin θW )eZ α τ/(2h sin θW cos θW )
Nach (16.52) und (16.60) ist ψα durch Dα Φ ∂α Φ i ψα definiert. Der Vergleich mit der durch (15.6) und (15.10) gegebenen Ankopplung eines Bosons oder Fermions der elektrischen Ladung q an das elektromagnetische Feld mit dem Term (e/h )A α ρ in ψα , der die Ankopplung des durch das Feld ρ beschriebenen Teilchens an das elektromagnetische Feld repräsentiert, zeigt folgendes: Das zum Feld ρ gehörige Teilchen ist wegen der Ankopplung an Aα elektrisch geladen und trägt die Ladung q e, was der Ladungszahl Q 1 entspricht. Auf der anderen Seite gibt es keinen entsprechenden Kopplungsterm des durch τ beschriebenen Teilchens, was zeigt, daß dieses elektrisch neutral ist. Mit den Umbenennungen ρ Φ für das positiv geladene und τ Φ 0 für das neutrale Boson schreiben wir das SU (2)-Dublett (16.50) für das Higgs-Feld jetzt in Φ (16.71) Φ Φ0 um und werden damit der in Abschn. 13.2 getroffenen Konvention über den Zusammenhang von Ladung und Isospin gerecht, das positiver geladene Teilchen in die obere Zeile des Dubletts zu setzen und ihm damit die Isospinquantenzahl I3 1/2 zu geben. (Hiermit stellt sich die oben getroffene spezielle Koordinatenwahl, durch welche die obere Komponente des Higgs-Feld-Dubletts zum Verschwinden gebracht und dem elektrisch neutralen, durch η beschriebenen Higgs-Boson als unterer Komponente der Isospin 1/2 zugewiesen wurde, im Nachhinein als richtig heraus.)
500
16 Standardmodell
I3 Y Q
eL 1/2 1 1
eR 0 2 1
νe 1/2 1 0
Φ 1/2 1 1
Φ0 1/2 1 0
Tabelle 16.3: Quantenzahlen I3 , Y und Q für die Teilchen e L , e R , νe , Φ
und Φ 0
Es erweist sich als nützlich, das Verhältnis Y
gg1
(16.72)
1L
der Kopplungskonstanten g1 eines Teilchens zu g1L als neue Quantenzahl einzuführen. Diese wird üblicherweise als U º1»-Hyperladung bezeichnet. In Tab. 16.3 sind der Isospin I3 , die Hyperladung Y und die Ladungsquantenzahl Q für alle Teilchen angegeben, die wir gegenwärtig im Zusammenhang mit dem Standardmodell betrachten. Man überzeugt sich leicht davon, daß zwischen ihnen die ursprünglich in anderem Zusammenhang von Gell-Mann und Nishijima aufgestellte Relation Q
I3
Y 2
(16.73)
gilt. Z. B. ergibt sich aus ihr Q 1/21/2 1 für e L und Q 1/21/2 0 für Φ 0 . Bezüglich der U (1)- und SU (2)-Invarianz der Lagrange-Dichte (16.51) gilt Ähnliches wie früher. Invarianz besteht nicht bezüglich der Anregungsfelder, sondern nur bezüglich der vollen Felder, die das Vakuumfeld Φ0 mit einschließen. Bei Eichtransformationen der Form (16.53), die Drehungen in der ρ , τ -Ebene bewirken (Aufgabe 16.4), entsteht zwar ein Term ρ0¼ 0. Wegen der Invarianz der Größe (16.56) bleiben dabei jedoch die Ruhemassen (16.68) unverändert. Nicht erklärt wurden durch unser Vorgehen die Ruhemassen des Elektrons und des Neutrinos, denn die Forderung nach U (1)- und SU (2)-Invarianz an das Higgs-Feld hat zwar dessen Kopplung an die Felder A α , Wα¦ und Z α bewirkt, nicht jedoch an die das Elektron und Neutrino beschreibenden Felder. Hierzu müssen in der Lagrange-Dichte noch andere Zusatzterme eingeführt werden. Wie das geschehen kann, wird im nächsten Abschnitt untersucht.
16.4.2 Leptonenmassen Es hängt von dem benutzten Inertialsystem ab, ob sich ein Elektron im Zustand e L oder e R befindet. In Wechselwirkungsprozessen können Elektronen außerdem abgebremst werden und ihre Bewegungsrichtung umkehren, ohne daß sich dabei ihr Spin verändert, d.h. sie können Übergänge e L e R vollziehen. Ein Masseterm für Elektronen, der diesem Umstand Rechnung trägt, darf daher nicht nur links- oder rechtshändige Terme alleine enthalten, aus (15.15) mit (14.41) erhalten wir für ihn vielmehr
m 0e c2(e L e R e R e L ) . m 0e c2 ψψ
(16.74)
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
501
Die Zerlegung ψ e L e R würde zwar die Konstruktion einer Massematrix unmöglich machen, bereitet aber im Rahmen des Higgs-Modells keine Schwierigkeiten. Um einen Term der gewünschten Form (16.74) durch eine Wechselwirkung mit dem Higgs-Feld zu erhalten, benötigen wir in der Lagrange-Dichte noch einen Zusatzterm, der diese Wechselwirkung beschreibt. Für ein SU (2)-Dublett (16.50) des Higgs-Feldes mit ρ0 0 können wir e L e R e R e L in der Form eL eR
e R eL
τ1 (νe e R , e L e R )
0
ρ0 τ0
1 ρ (ν e , e L ) 0 e R τ0 τ0
1 e ν (ρ0 , τ0 ) R e e R eL τ0 1 ν e R (ρ0 , τ0 ) e eL τ0
schreiben, wobei die letzte Zeile eine bequeme Schreibweise der Zeile darüber darstellt, die unserer früheren Konvention (15.37) entspricht. Damit erweist sich der Masseterm (16.74) als der in den Anregungsfeldern L und e R quadratische Anteil der LagrangeDichte LH mΦ0e c L Φe R 2
0
eR Φ L ,
(16.75)
(man beachte Φ Φ0 ϕ) wobei wir die Definition (16.1a) eingesetzt haben und τ0 wegen ρ0 0 und (16.56) durch Φ0 ersetzen konnten. Die Invarianz der Dichte LH gegenüber den Eichtransformationen (16.12) und (16.53) der Zustände L, e R und Φ ergibt sich aus
L Φ eR
(16.11),(16.54)
L ei (Λ L e
g i 1 g 1
1L
) i ΛΦ
e
g 1R g1L
ΛL
ei (Λ Λ (16.20),(16.65) L Φe R .
Φei Λ R e R
L Φe R
L
Φ Λ
R)
R LΦe
In LH ist nicht nur der die Elektronenmasse repräsentierende Anteil (16.74) enthalten, sondern wegen Φ Φ0 ϕ auch noch ein Term höherer Ordnung, der eine über die Ruhemassenerzeugung hinausgehende Wechselwirkung zwischen Elektronen, Neutrinos und Higgs-Bosonen repräsentiert. Für eine eventuelle Ruhemasse des Neutrinos ist die Konstruktion einer (16.75) entsprechenden Wechselwirkungs-Lagrange-Dichte nicht möglich, da es keine rechtshändigen Neutrinos gibt. Dies steht in Übereinstimmung mit der Annahme, daß die Ruhemasse der Neutrinos verschwindet und zeigt eine enge Verknüpfung dieser beiden Gegebenheiten. Wir werden allerdings später in einer über das Standardmodell hinausgehenden Theorie Argumente für eine nichtverschwindende Ruhemasse der Neutrinos kennenlernen.
502
16 Standardmodell
16.4.3 Ruhemassen freier Quarks Der Ansatz in Analogie zu (16.75) gebildeter Wechselwirkungsterme mit dem HiggsFeld liefert für das Down- und Upquark (mit (16.38) und ρ 0) bis auf einen Faktor L u Φd R d R Φ L u
L u Φu R u R Φ L u
(u L , d L )
0
d R d R (0, τ0 η)
uL dL
τ0 η (d L d R d R d L )(τ0 η) dd(τ0 η) , 0 u (u L , d L ) u R u R (0, τ0 η) L dL τ0 η (d L u R u R d L )(τ0 η) uu(τ0 η) .
Das für das Downquark erhaltene erste Ergebnis ist brauchbar, nicht jedoch das für das Upquark erhaltene zweite. Für das letztere wird offensichtlich ein Grundzustand des Higgs-Feldes benötigt, bei dem der obere Zustand des SU (2)-Dubletts Φ besetzt ist. Dafür ist es jedoch nicht nötig, ein neues Higgs-Feld einzuführen, denn nach (13.26) hat der aus Φ abgeleitete Isospinor Φc i σ2 Φ , der nach (13.28) bzgl. der Gruppe SU (2) die gleichen Transformationseigenschaften wie Φ aufweist, in der zu (16.58) führenden Darstellung die Komponenten τ0 η Φc , 0 und damit ergibt sich τ0 η u u R u R (0, τ0 η) L L u Φc u R u R Φc L u (u L , d L ) 0 dL (u L u R u R u L )(τ0 η) u u(τ0 η) . Dies ermöglicht es, als Wechselwirkungsterm mit dem Higgs-Feld, der die Existenz von Ruhemassen m 0u und m 0d des Up- und Downquarks erklären kann, mit τ0 Φ0
QH mΦ0u c L u Φc u R u R Φc L u
m 0d c2 L u Φd R d R Φ L u Φ0
2
0
(16.76)
anzusetzen. Den in den Feldern u L , u R , d L und d R quadratischen Anteil von QH , der sich beim Übergang Φ (0, τ0 η) ergibt und die Quarkmassen erkennen läßt, bezeichnen wir mit Qm . Für (16.76) ist er
Qm
m 0u c2 u L u R
uRuL
m 0d c2 d L d R
dR dL
.
(16.77)
Die Isospinorprodukte L u Φc etc. in (16.76) sind SU (2)-invariant, und weil u R von den SU (2)-Transformationen nicht erfaßt wird, gilt das auch für die Produkte L u Φc u R etc. Für ihre U (1)-Invarianz ist wichtig, daß sich Φc anders als Φ gemäß Φc¼
eΛ
Φ
Φ
(16.78)
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
503
transformiert. (Dies wird in der auf den Abschnitt folgenden Aufgabe 16.1 gezeigt.) Die U (1)-Invarianz ergibt sich aus der Rechnung L ¼u Φc¼ u ¼R L u Φ d R
(16.42) (16.78) (16.42) (16.53)
ei(Λ
¼
L
ΛΦ Λ¼ R )
L u Φc u R
(16.41) (16.54)
¼ g1 g1R )Λ L /g1L
¼
ei(g1L
(16.41)
L u Φc u R
(16.45) (16.65a)
L u Φc u R
(16.45)
L Φ R (16.54) i(g g g )Λ L /g (16.65a) 1L L u Φd ei(Λ Λ Λ ) L u Φd R e 1L 1 1R L u Φd R . R ¼
¼¼
¼
¼¼
Wie bei der durch (16.75) dargestellten Elektronenmasse handelt es sich in (16.76) um die Ruhemassen, welche die Quarks als freie Teilchen haben würden. Wie im Exkurs 16.2 erläuterte wird, existieren die Quarks jedoch nicht als freie Teilchen, sondern nur in extrem stark gebundenen Hadron-Zuständen. Die Ruhemasse eines Hadrons ist allerdings nicht gleich der Summe der durch die Wechselwirkung mit dem Higgs-Feld erklärbaren nackten Ruhemassen seiner konstituierenden Quarks, vielmehr tragen zusätzlich zu dieser noch bei: 1. Die der Bindungsenergie entsprechende Masse, und da die Bindung durch Gluonen vermittelt wird, sind daran Massen beteiligt, die den kinetischen Energien von Gluonen entsprechen. 2. Die den kinetischen Energien der Quarks entsprechenden Massen. 3. Durch die Wechselwirkung der Quarks mit virtuellen Teilchen-Antiteilchen-Paaren ergeben sich Strahlungskorrektur-Beiträge (siehe Quantenfeldtheorie, Kapitel 10.8, insbesondere Ende von Abschn. 10.11.2), die der Energie von Quark-Feldern entsprechen. Aufgrund der Unschärferelation gilt p p h /(2d) mit d=Hadrondurchmesser, und da d extrem klein ist, sind die auf der kinetischen Energie von Quarks und Gluonen basierenden Beiträge zur Ruhemasse eines Hadrons relativ groß. Teilt man die experimentell bestimmbare Hadronenmasse auf die konstituierenden Quarks auf, so erhält man nur eine effektive Masse der Quarks. Könnte man deren Zusammensetzung mit der gleichen Präzision berechnen, die in der QED möglich ist, so ließen sich daraus die Ruhemassen der freien Quarks recht genau berechnen. In dem folgenden Exkurs werden unter anderem die Gründe dafür angegeben, warum das nicht möglich ist. Dementsprechend sind auch die in Tabelle 11.3 angegebenen Ruhemassen der Quarks mit großen Unsicherheiten behaftet. In (16.76) sind die Ruhemassen unbestimmte Parameter, für welche die mit den genannten Unsicherheiten behafteten, aus experimentellen Messungen abgeleiteten Werte eingesetzt werden müssen. Aufgabe 16.1: Beweisen Sie
Φ
Lösung:
ei Λ Φ ϕ Φ χ
Φc
ei Λ
ei ΛΦc . ϕ χ
bedeutet ϕ ei Λ ϕ und χ ei Λ χ. Damit ergibt sich iΛ (13.26) χ e χ χ iΛ Φc e ϕ ei Λ ϕ ϕ
ei ΛΦc .
504
16 Standardmodell
Exkurs 16.2: Quarkeinschluß und Gluonen Quarks sind elektrisch geladen und üben daher aufeinander je nach Ladungsvorzeichen elektromagnetische Anziehungs- oder Abstoßungskräfte aus, die quantenfeldtheoretisch durch Photonen vermittelt werden. Weiterhin nehmen sie, durch die Eichbosonen W und Z 0 vermittelt, an der schwachen Wechselwirkung teil. Schließlich tragen die Quarks auch eine Farbladung und üben über diese aufeinander Kräfte der starken Wechselwirkung aus, die durch Gluonen vermittelt werden. Anders als Photonen, die zwar elektrische Kräfte vermitteln, aber selbst elektrisch ungeladen sind, tragen die Gluonen Farbladungen. Dies äußert sich darin, daß es in den Feldgleichungen für das Gluonenfeld G kα (x) ähnlich wie beim Yang-Mills-Feld nichtlineare Terme gibt, die eine Selbstwechselwirkung zum Ausdruck bringen. Es kann aber auch aus Umwandlungsprozessen s.u. wie u b u r gbr abgelesen werden, deren Existenz aus dem in (16.49) angegebenen Anteil 3 der Lagrange-Dichte folgt: In q λ γ α q G k sind q und λ γ α q im allgemeinen verschiej k j α j k j Q denfarbige Zustände desselben Quarks, der Term beschreibt also den durch Gluonen vermittelten Übergang von einer zu einer anderen Farbe. Da auch für Farbladungen ein Erhaltungssatz gilt, muß das Gluon die ursprüngliche Farbe (blau im obigen Beispiel) des Quarks wegtragen, und auch die neue Farbe (rot) muß vom Gluon (Zustand gbr ) kommen, das daher die entsprechende Antifarbe (antirot) erhält. Dies bedeutet, daß Gluonen zweifarbig sind, wobei sie stets eine Farbund eine Antifarbladung tragen. Da es drei Farben und drei Antifarben gibt, würde man erwarten daß es neun Gluonen mit den Farben r r , r g , r b , gr , g g , g b , br , b g und bb gibt – das Standardmodell enthält jedoch nur acht Gluonenfelder, denen je ein Gluon zugeordnet werden kann. Diese Diskrepanz findet ihre Erklärung darin, daß die Kombination r r g g bb im Farbraum drehungsinvariant und daher farblos ist, was bedeutet, daß zwischen den neun angegebenen Farbkombinationen eine lineare Abhängigkeit besteht. Die Kräfte zwischen den verschiedenen Farbladungen müssen anziehend sein, weil in den aus drei Quarks des gleichen Flavors bestehenden Baryonen und Ω (siehe Tabelle 11.4) drei verschiedenfarbige Quarks gebunden sind, obwohl zwischen ihnen elektrische Abstoßungskräfte wirken. Auch Farbe und Antifarbe müssen sich gegenseitig anziehen, weil in Mesonen, die nach (13.52)–(13.53) farblos sind, ein Quark und ein Antiquark gebunden sind, die elektrischen Kräfte bei allen geladenen Mesonen jedoch abstoßend wirken. Selbst bei anziehenden elektromagnetischen Kräften ist die Bindung in Baryonen und Mesonen überwiegend auf die Farbkräfte zurückzuführen, weil ihre Festigkeit elektromagnetisch nicht zu erklären wäre. Für die acht verschiedenen Gluonenfelder gibt es nur eine Kopplungskonstante g3 , die experimentell bestimmt werden kann. Die mit dieser berechnete Kopplungsstärke in einem Wechselwirkungsprozeß, bei dem gleichzeitig eine elektromagnetische Wechselwirkung stattfindet, stellt sich als die weitaus größere heraus. Das hat für die Theorie ganz wesentliche Konsequenzen: In der QED wurde die Kopplungsstärke als Entwicklungsparameter benutzt, und schon mit wenigen Termen der Entwicklung wurden sehr genaue Ergebnisse erzielt. Bei den Farbwechselwirkungen ist die Kopplungsstärke dagegen im allgemeinen so groß, daß bei einer Entwicklung Terme zunehmender Ordnungszahl immer wichtiger werden – eine Ausnahme davon wird im Anschluß besprochen. Dies bedeutet, daß Reihenentwicklungen im allgemeinen keine brauchbaren Ergebnisse liefern. Dementsprechend gibt es im Zusammenhang mit der starken Kraft viele Phänomene, die man zwar qualitativ verstanden zu haben glaubt, die aber nicht rigoros bewiesen sind. Durch den Beschuß von Hadronen mit hochenergetischen Teilchen, z. B. γ -Quanten oder Elektronen, kann deren innere Struktur erforscht werden. Die Sondierungsteilchen sind so schnell, daß ihre Nahewechselwirkung mit einem Parton (Teilelement des Hadrons, also ein konstituierendes Quark oder Antiquark, aber auch Quarkwechselwirkungen vermittelnde Gluonen oder
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
qeff
505
Farbladung Abb. 16.1: Effektive elektrische Ladung und Farbladung als Funktion des Abstands r . Die gestrichelte Linie gibt die elektrische Ladung an, gegen welche die effektive elektrische konvergiert. Ladung für r
elektrische Ladung r
virtuelle Teilchen-Antiteilchenpaare zählen zu den Partonen) schon abgeschlossen ist, bevor sich dieses über innere Wechselwirkungsprozesse mit anderen Partonen ausgetauscht hat, um eine kollektive Wechselwirkung mit dem Sondierungsteilchen zu organisieren. Daher erfährt man aus der Ablenkung der Sondierungsteilchen Details über den Zustand der Partonen, wie er auch ohne Sondierung vorgelegen hätte. Bei derartigen Strukturuntersuchungen wurde herausgefunden, daß sich die Quarks in Hadronen bei sehr nahen wechselseitigen Begegnungen fast wie freie Teilchen verhalten, ein Phänomen, das als asymptotische Freiheit bezeichnet wird. Dies ist ein Glücksfall für die Theorie, denn es bedeutet, daß bei kleinen Quarkabständen stattfindende Prozesse der starken Wechselwirkung einer sinnvollen Störungsrechnung zugänglich werden. Dagegen macht sich die gegenseitige Bindung der Quarks mit zunehmendem Abstand immer stärker bemerkbar. Im folgenden wird eine qualitative Erklärung für diese Phänomene gegeben. Das von einem Elektron ( Ladung e) erzeugte elektrische Feld, das die Stärke der Wechselwirkung mit einer zweiten Ladung festlegt, ist dem Betrage nach E e/(4πε0 r 2 ). Bei sehr kleinen Abständen r kommen Effekte der QED zur Auswirkung. Am wichtigsten ist dabei die Bildung virtueller Elektron-Positron-Paare. Das betrachtete Elektron zieht von diesen die Positronen an und stößt die Elektronen ab. Dieses Phänomen ist die in Abschn. 2.15.2 der Relativistischen Quantenmechanik sowie Abschn. 10.8.4 und 10.10 der Quantenfeldtheorie besprochene Polarisation des Vakuums. Durch sie wird die viel größere – tatsächlich sogar unendlich große – nackte Ladung des Elektrons nach außen hin abgeschirmt. In weitem Abstand vom Elektron mißt man daher eine viel kleinere effektive Ladung des Elektrons als in dessen unmittelbarer Nähe, man findet für sie qualitativ den in Abb. 16.1 dargestellten Verlauf qeff (r ). Für das von der Farbladung eines Quarks ausgehende Feld können ähnliche Überlegungen angestellt werden. In ihrer Nachbarschaft entstehen virtuelle Quark-Antiquark-Paare und außerdem Gluonen, die zu einer Farbladungs-Polarisation führen (Abb. 16.2). Die starke Wechselwirkung unterscheidet nicht zwischen Quarks und Antiquarks, aber da das Quark auch elektrisch geladen ist, werden die virtuellen Antiquarks elektrisch angezogen. Durch die Wirkung seiner Farbladung umgibt sich das betrachtete Quark daher mit einer Wolke von Antifarbladungen. Von entscheidender Bedeutung ist nun die Rolle der Gluonen. Weil diese elektrisch ungeladen sind und zwei Farbladungen tragen, ist qualitativ nicht erkennbar, wie sie die Farbladungspolarisation des Vakuums beeinflussen. Ihr Effekt kann durch die Auswertung von Feynman-Diagrammen für Gluonen der Art
ermittelt werden, die den Diagrammen der Selbstenergie von Photonen (Abb. 10.16 (a) in Abschn. 10.8.4) verwandt sind, und man findet, daß er der Wirkung der Quark-Antiquark-Paare entgegengesetzt ist und diese dominiert. Anders als die effektive elektrische Ladung wird daher die effektive Farbladung bei Annäherung an das betrachtete Quark immer kleiner. Dies bedeutet, daß für kleine Abstände eine Störungsrechnung durchgeführt werden kann, und liefert eine nachträgliche Rechtfertigung für die auf Methoden der Störungsrechnung beruhende Auswertung von
506
16 Standardmodell
q g
q q q g q Abb. 16.2: Virtuelle Quark-AntiquarkPaare (q q) und Gluonen (g) in der Umgebung eines Quarks q (im Zentrum).
Feynman-Diagrammen. Ein Abnehmen der Farbladung mit abnehmendem r bedeutet umgekehrt, daß die effektive Farbladung eines Quarks mit zunehmendem r immer größer wird. Wie verhält sie sich für r ? Hier versagt jede Störungsrechnung, und man weiß nicht, ob sie unendlich wird, gegen einen endlichen Grenzwert strebt oder gar nach Überschreiten eines Maximums gegen null geht. Um den Quarkeinschluß zu verstehen – man benutzt häufig auch den englischen Ausdruck Confinement –, wurde folgende Vorstellung entwickelt: Zieht man zwei entgegengesetzte elektrische Ladungen auseinader, so bleibt sich das Feldlinienbild ähnlich (Abb. 16.3 oben). Zieht man dagegen zwei Quarks bzw. Farbladungen auseinander, so ziehen sich die Feldlinien des Gluonenfeldes gegenseitig an. Die Feldlinien werden daher nicht wie bei den elektrischen Ladungen weiter aufgefächert, sondern drängen sich in einer engen Flußröhre zusammen (Abb. 16.3 unten), was bedeutet, daß die Feldstärke beim Auseinanderziehen der Farbladungen immer größer wird. Bis zu welchem Abstand das gilt, weiß man nicht, zum Erklären eines Confinements muß die Wechselwirkungsenergie V (r ) der beiden Quarks jedenfalls mit deren Abstand r gegen unendlich gehen. Dafür könnte V (r )r 2 oder ln(r/r0 ) sein, aber auch schon V (r )r würde genügen, eine Annahme, die heute favorisiert wird. Im zuletzt genannten Fall würde die Anziehungskraft bei großem Abstand gegen einen konstanten Sättigungswert gehen. Nur wenn V (r ) für r nicht nach unendlich, sondern gegen einen endlichen Grenzwert strebt, könnte es ungebundene, also freie Quarks geben, aber bisher ist noch nie ein solches oder ein freies Gluon beobachtet worden. Die Existenz freier Quarks kann allerdings nicht ausgeschlossen werden, denn es könnte sein, daß zur Trennung gebundener Quarks mehr Energie aufgewandt werden muß, als derzeit von Beschleunigern geliefert werden kann. Experimentell beobachtet man bei derartigen Trennungsversuchen allerdings oberhalb eines gewissen V (r ) die Bildung von Quark-Antiquarkpaaren, wodurch die zu einer eventuellen Trennung erforderliche Energiezufuhr verhindert wird.
(a)
(b)
Abb. 16.3: Feldlinienbilder von zwei sich anziehenden elektrischen Ladungen (oben) und zwei Farbladungen (unten), (a) bei kleinerem und (b) bei größerem Abstand.
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
507
16.4.4 Quarkmischung In einer vollständigen Theorie muß für jede der drei zu Beginn dieses Kapitels angegebenen Familien eine Lagrange-Dichte aufgestellt werden, und die auf diese Weise erhaltenen Dichten müssen addiert werden, um eine für die Gesamtheit aller Teilchen des Standardmodells gültige Gesamt-Lagrange-Dichte zu erhalten. Durch diese Aufsummierung ist allerdings zunächst nicht viel gewonnen, denn die aus der Gesamtdichte abgeleiteten Feldgleichungen unterscheiden sich in Hinblick auf die einzelnen Familien nicht von denen, die man aus den separaten Lagrange-Dichten erhält, da die Summe keine gegenseitigen Kopplungsterme enthält. Nur in den Feldgleichungen für die Bosonenfelder erhält man als Quellterme Beiträge aller Familien. Bei den Leptonen gibt es keine experimentellen Anhaltspunkte für eine Kopplung zwischen den verschiedenen Familien (siehe unten, Ende des Abschnitts). Anders ist das jedoch bei den Quarks, bei denen Zerfallsreaktionen wie
e ν π μ ν
Σ
oder
n
0
K
F F
e
μ
(s u )
(sdd)
e ν (u u ) μ ν (udd)
e
μ
zeigen, daß die Umwandlung eines Quarks der einen in ein Quark der anderen Familie (in den angeführten Beispielen s in u) möglich ist. Dies sind Prozesse der schwachen Wechselwirkung, die allerdings im Vergleich zu den im Rahmen unserer bisherigen Theorie möglichen Umwandlungen u d oder s c erfahrungsgemäß um einen Faktor 1/5 weniger wahrscheinlich sind. Wir wollen die Theorie jetzt so erweitern, daß sie auch derartige Prozesse beschreiben kann. Hierzu führen wir zunächst die folgenden Notationen ein.
u1
u,
c,
u2
t, ud
u3
und Li
d, d s, , i 1, 2, 3 . d1
iL
iL
d3
2
b
(16.79) (16.80)
In diesen lautet das auf alle drei Familien erweiterte Ergebnis (16.76)
QH Φc 2
3
0
m u0i L i Φc u i R u i R Φc L i m d0i L i Φdi R di R Φ L i .
i 1
(16.81)
Der zugehörige Ruhemasseterm ist (16.77) entsprechend
Qm c2
3
m u0i u i L u i R
i 1
Φc C
u
i R ui L
m
d 0i
di L d i R
d
i R di L
.
(16.82)
Jetzt nutzen wir aus, daß es für QH noch einen viel allgemeineren Ansatz gibt, der U (1) SU (2)-invariant ist. Dieser lautet
QH
2
0
3
i, j 1
u i j L i Φc u j R
C u u ij
j R Φc L i
C
d i j L i Φd j R
C d d ij
Li , Φ jR (16.83)
508
16 Standardmodell
wobei Ciuj und Cidj beliebige komplexe Koeffizienten sind. (Der zweite bzw. vierte Summenterm muß zum ersten bzw. dritten konjugiert komplex sein, damit QH reell ist.) Die U (1) SU (2)-Invarianz ist evident, weil sich alle L i und alle u j R bzw. d j R in gleicher Weise transformieren, während die Koeffizienten Ciuj und Cidj von den Eichtransformationen nicht betroffen sind. Der Beweis für die Invarianz der einzelnen Summenterme in (16.83) ist daher derselbe wie der zu (16.76). Der zu (16.83) gehörige Masseanteil ist
Qm c2
3 Ciuj u i L u j R
Ciuj u j R u i L Cidj di L d j R Cidj d j R di L
. (16.84)
i, j 1
Jetzt wenden wir das im Anhang dieses Kapitels (Abschn. 16.8) bewiesene Ergebnis (16.106) der Matrizentheorie bzw. M U1 M U2 U1 M U2 (Umbenennung U1 U1 ) auf die 33-Matrizen C u und C d (Komponenten Ciuj und Cidj ) an. Nach diesem existieren für αu, d unitäre Matrizen U1α und U2α derart, daß Cu
U1u M u U2u ,
Cd
U1d M d U2d
mit
Miuj
m u0i δi j ,
Midj
m d0i δi j
und m u0i 0 bzw. m d0i 0 gilt. In Komponenten bedeutet das Ciuj
U1uik m u0k δkl U2ul j
k,l
U1uik m u0k U2ukj ,
Cidj
k
U1dik m d0k U2dkj .
k
Durch Einsetzen dieser Ausdrücke in (16.84) ergibt sich mit den aus der Unitarität der Matrizen U1α und U2α folgenden Beziehungen U1uik U1uki , U1u ik U1uki etc.
Qm c2
U1uki u i L m u0k U2ukj u j R U2ukj u j R m u0k U1uki u i L i, j,k
U1dki di L m d0k U2dkj d j R U2dkj d j R m d0k U1dki di L
Führt man jetzt die Quarkzustände U1uki u i L , u k L dk L
i
U1dki di L ,
i
ein, so ergibt sich schließlich 2 m u0k (u k L u k R Qm c
u k R dk R
.
U2ukj u j R
(16.85)
U2dkj d j R
(16.86)
j
j
u k R u k L ) m d0k (dk L dk R dk R u dk )
.
k
(16.87) Das ist wieder die richtige Form (16.82) für Quarkmassen, weshalb man die durch (16.85)–(16.86) definierten gestrichenen Zustände, die aus einer Mischung von Quarkzuständen verschiedener Familien bestehen, als Ruhemasse-Eigenzustände der Quarks bezeichnen kann.
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
509
Wir gehen davon aus, daß die Ruhemasse-Eigenzustände die richtigen Zustände zur Beschreibung der Quarks sind, und lassen daher bei ihrer Notation den Strich wegfallen, nehmen also für alles weitere die Umbenennungen ui L
u ¼i L
etc.
und
U1u
U1¼u
etc.
(16.88)
vor. Dann muß auch in allen anderen Termen der Lagrange-Dichte der Übergang zu Ruhemasse-Eigenzuständen vollzogen werden, nach den Umbenennungen (16.88) also von gestrichenen zu ungestrichenen Zuständen. Dazu müssen die Gleichungen (16.85)–(16.86) (nach den Umbenennungen) nach den Zuständen u ¼i L etc. aufgelöst werden. Der Einfachheit halber beschränken wir uns dabei vorübergehend auf den Fall von zwei Familien und benutzen statt u 1 und u 2 bzw. d1 und d2 wieder die ursprünglichen Bezeichnungen u und c bzw. d und s. Da die Transformationen (16.85)–(16.86) unitär sind, gilt das auch für die Umkehrtransformationen, d. h. wir haben ¼ ¼ uL dL dL uL Uu Ud , (16.89) ¼ ¼ cL cL sL sL
mit unitären 2 2-Matrizen U u und U d . (Dabei sind jetzt u L , c L usw. die RuhemasseEigenzustände.) Jetzt wollen wir untersuchen, welche Konsequenzen der Übergang zu RuhemasseEigenzuständen für die anderen Terme der Lagrange-Dichte (16.46) hat und betrachten zu diesem Zweck zuerst den die Wechselwirkung mit den W-Bosonen beschreibenden Term, der bei Erweiterung auf die ersten zwei Familien e c u ¼L γ α d L¼ c c¼L γ α s L¼ Wα k.k. (16.90) 2 sin θ W
lautet. (Dabei wurde ein mit Wα (Wα ) gebildeter Term mit „k.k.“ für konjugiert komplex abgekürzt. Man beachte, daß c die Lichtgeschwindigkeit und nicht den Zustand des Charmquarks bedeutet. Da wir im folgenden von diesem nur die Zustände c L und c R benötigen, ist eine Verwechslung ausgeschlossen.) Dieser beschreibt die durch die schwache Wechselwirkung bewirkten Umwandlungen u d und c s. Für die in Klammern stehenden schwachen Teilchenströme benutzen wir die Notation d c (u L , cL )γ α L . sL Die mit u L und cL bzw. d L und s L gebildeten Zeilen und Spalten sind dabei keine Isospinoren, sondern einfach Zeilen- und Spaltenvektoren, für die das übliche Skalarprodukt erklärt sein soll. Gehen wir mit (16.89) zu Ruhemasse-Eigenzuständen über, so erhalten wir d dL dL (16.91) c (u L , cL )γ α L c (u L , c L )U u γ α U d c (u L , c L )γ α U sL sL sL
mit U U u U d , wobei die Matrix U als Produkt zweier unitärer Matrizen selbst eine unitäre Matrix ist. Diesem Ergebnis zufolge genügt es, nur Mischungen der beiden unteren Quarks zu betrachten, denn wir hätten es auch mit U u E und U d U erhalten.
510
16 Standardmodell
Indem wir hiervon Gebrauch machen und für U die Darstellung (12.11), also cos θ eiα sin θ eiβ U iγ i (β γ α) sin θ e cos θ e benutzen, erhalten wir aus (16.89) die Transformationsgleichungen u L
u L , cL c L , iα d L d L cos θ ei(β α)s L sin θ ,
e
e
iγ
s L
d L sin θ
ei(β
α)
s L cos θ .
Da reine Phasenfaktoren wie e iα an den beobachtbaren Quarkeigenschaften nichts ändern, können wir diese in die Definitionen der Quarkzustände hineinziehen, also e iα d L d L usw. setzen, und erhalten damit die einfachere Matrix U
cos θ sin θ
sin θ cos θ
(16.92)
und die einfacheren Transformationsgleichungen u L
cL
uL ,
cL ,
d L
d L cos θ sL sin θ ,
s L
d L sin θ
sL cos θ .
(16.93) Nehmen wir diese Transformationen jetzt in dem Wechselwirkungsterm (16.90) vor, so erhalten wir für ihn
ec 2 sin θW
u L γ α d L cos θ u L γ α s L sin θ c L γ α d L sin θ c L γ α s L cos θ Wα
k.k.
(16.94) Hierin beschreiben der erste und letzte Term wie vorher Übergänge u d bzw. s c, wobei diese für θ > 0 wegen der gegenüber dem Fall ohne Mischung schwächer gewordenen Kopplung (cos θ <1) etwas weniger wahrscheinlich geworden sind. Die beiden neu hinzugekommenen Terme beschreiben dagegen die erwarteten Umwandlungsprozesse u s und cd, an denen zur Ladungserhaltung wie bei den zuerst genannten Prozessen geladene W -Bosonen beteiligt sind. Aus der relativen Häufigkeit dieser Umwandlungsprozesse kann der Wert des Winkels θ erschlossen werden. Dieser wird nach N. Cabibbo, der die entsprechende Mischung im Jahre 1963 vorschlug, als Cabibbo-Winkel (Notation θC ) bezeichnet. Genauere Messungen ergeben θC
13Æ .
(16.95)
Als nächstes betrachten wir den Einfluß, den die Quarkmischungen (16.93) auf die Wechselwirkung mit dem Feld Z« haben. Dazu greifen wir aus (16.46) den um die Quarks der zweiten Familie erweiterten Term heraus, bei dem die Wechselwirkung mit dem aus linkshändigen Zuständen gebildeten Teilchenstrom (16.96) c q I(u L ) u L γ α u L q I(d L ) d L γ α d L q I(cL ) cL γ α cL q I(s L ) s L γ α s L stattfindet. Beim ersten und dritten Term ergibt sich durch die Transformation keine Veränderung. Für den zweiten und vierten erhalten wir mit Q(d ) Q(s ), I3 (d L ) I3 (s L )
16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes
511
und q I(d L¼ ) q I(s L¼ ) q I(d L ) q I(s L ) (nach (16.25), Tabelle 11.2 und 16.2) q I(d L¼ ) d L¼ γ α d L¼ q I(s L¼ ) s L¼ γ α s L¼ q I(d L ) (d L cos θ s L sin θ )γ α (d L cos θ s L sin θ ) (d L sin θ s L cos θ )γ α (d L sin θ s L cos θ )
q I(d L ) (d L γ α d L q I(d L ) d L γ α d L
s L γ α s L )(sin2 θ
cos2 θ )
q I(s L ) s L γ α s L .
Dies bedeutet, daß sich durch die Quarkmischung keine Änderung der neutralen Ströme ergibt, und ein analoges Resultat erhält man für die mit den rechtshändigen Zuständen gebildeten Terme. Dieses Ergebnis ist sehr wichtig: Weil die Z -Bosonen ungeladen sind, dürfen sie im Gegensatz zu den W -Bosonen keine Übergänge zwischen Quarks verschiedener Ladung vermitteln. Insbesondere folgt auch: Bei der Wechselwirkung des neutralen Stroms mit dem Feld Z α bleibt die Seltsamkeit, also die Anzahl der s-Quarks, unverändert. Von den Ableitungstermen in (16.46) greifen wir exemplarisch die linkshändigen heraus. Wegen (16.93a-b) bleiben die mit u ¼L und c¼L gebildeten Terme unverändert, für die mit d L¼ und s L¼ gebildeten Terme ergibt sich d L¼ γ α ∂α d L¼
s L¼ γ α ∂α s L¼
(d L cos θ
α
(d L sin θ d L γ ∂α d L
s L sin θ )γ α ∂α (d L cos θ
s L sin θ )
s L cos θ )γ α ∂α (d L sin θ
s L cos θ )
α
s L γ ∂α s L .
Durch die Quarkmischung ergeben sich also keine Änderungen, und dasselbe findet man für die aus rechtshändigen Termen gebildeten Zustände. Bei dem die Wechselwirkung mit dem elektromagnetischen Feld bzw. mit Aα beschreibenden Term von 1,2 Q könnte im Beitrag der linkshändigen Zustände nur d L γ α d L¼ ¼
s L γ α s L¼ ¼
beeinflußt werden. Daß dieser Term jedoch unverändert bleibt, ergibt sich, wenn man in der vorangegangenen Rechnung für die Ableitungsterme γ α ∂α 1 setzt. Auch dieses Ergebnis ist wichtig, weil die die elektromagnetische Wechselwirkung vermittelnden γ -Quanten keine Ladung aufnehmen und daher keine mit Ladungsveränderung einhergehenden Umwandlungsprozesse vermitteln könnten. Außerdem bleibt auch hier die Seltsamkeit der Quarks unverändert. Der einzige 1,2 Q -Term, bei dem die Quarkmischungen eine Veränderung bewirkt haben, ist der die schwache Wechselwirkung mit den W-Bosonen beschreibende Term (16.90). Bei ihm tritt in den gestrichenen Zuständen keine Familienmischung auf, weshalb diese auch als Eigenzustände der schwachen Wechselwirkung bezeichnet werden. Für die schwache Wechselwirkung spielen die Ruhemassen der Teilchen keine Rolle. Die oben dargelegte Möglichkeit zur Beschreibung von Übergängen zwischen den verschiedenen Familien kann daher einfach dahingehend interpretiert werden, daß sich die Teilchen bei der schwachen Wechselwirkung nicht in RuhemasseEigenzuständen befinden müssen, sondern in Linearkombination von diesen, die sich als Isospin-Eigenzustände interpretieren lassen. Dieser Gesichtspunkt wird noch dadurch unterstützt, daß auch eine Drehung im Isospinraum Zustände von Teilchen verschiedener Ruhemassen mischt, wobei die unterschiedliche Ladung der oberen und unteren
512
16 Standardmodell
Spinorkomponenten durch die Beteiligung geladener Bosonenfelder kompensiert wird. Bei einer nicht durch die schwache Wechselwirkung bewirkten Mischung sind im Gegensatz dazu nur Linearkombinationen von Teilchen gleicher Ladung möglich, was die Ursache dafür ist, warum sich bei allen anderen Termen keine Änderung ergab. Historische Notiz: Als Cabibbo 1963 die Quarkmischung einführte, kannte man nur die drei Quarks u, d und s. Cabibbo berücksichtigte daher nur den aus u ¼ und d ¼ gebildeten Isospinor. Für den neutralen Strom entfallen damit die beiden letzten Terme in (16.96), der erste bleibt beim Übergang zu Quarkmischungen wieder unverändert, und aus dem zweiten wird q I(d L¼ )d L¼ γ α d L¼
q I(d L )(d L cos θ s L sin θ )γ α (d L cos θ s L sin θ ) q I(d L ) d L γ α d L cos2 θ s L γ α s L sin2 θ (d L s L s L d L ) sin θ cos θ .
Damit kommt es jedoch zu Umwandlungsprozessen s d, welche die Seltsamkeit verändern. Erst 1970 wurde in einer Arbeit von S. Glashow, J. Iliopoulos und L. Maiani das Charmquark c als viertes Quark in die Theorie integriert. Wie unsere obige Rechnung zeigt, werden hierdurch die die Seltsamkeit verändernden Anteile der neutralen Ströme „weggezaubert“, was zu der Namensgebung „Charm“ (engl. für Zauber) für das vierte Quark führte und einen der wesentlichen Gründe für dessen Einführung bildete. (Von der experimentellen Seite her gab es dazu damals noch keine Veranlassung.) Das gegenseitige Wegheben der störenden Terme wird nach den Initialen der oben angegebenen Forscher heute als GIM-Mechanismus bezeichnet. Auch im Fall von drei Familien kann man sich wie bei zwei Familien auf eine Mischung der unteren Quarks beschränken. Die Mischung wird wieder durch eine unitäre Matrix U bewirkt, und in Komponenten gilt für die unteren Isospinorzustände di¼ L di¼ L
3
Uikd dk L .
(16.97)
k 1
Aus jedem der sechs Quarkzustände diL und di L (i 1, 2, 3) läßt sich ein nicht meßbarer Phasenfaktor herausziehen, di L
ei α diL , ¼
i
dk L
ei α dk L , k
und aus (16.97) ergibt sich damit di L
3
U ikd dk L
mit
U ik
Uik ei (α α ) aik ei (α ¼
k
i
αk αi ) ¼
ik
k 1
mit reellen aik . Mit der Matrix U , die nach Tab. 12.2 insgesamt 32 9 freie reelle Parameter enthält, ist auch die Matrix U unitär (Aufgabe 16.5). Die in der letzteren enthaltenen Differenzen der sechs frei wählbaren Phasenfaktoren αi und αk bilden nur fünf unabhängige Größen, da sie alle als Summe einer Relativphase und einer sich aus allen Differenzen heraushebenden gemeinsamen Phase (z.B. α1 ) geschrieben werden können. Diese fünf unabhängigen Differenzen können so gewählt werden, daß sie fünf der
16.5 Gesamt-Lagrange-Dichte
513
Phasen αik von U d kompensieren. U besitzt dann nur noch vier unabhängige Parameter. Eine unitäre 33-Matrix mit vier freien Parametern ist die durch U
Rx (θ1 )R y (θ2 )Rz (θ3 )P(δ)
(16.98)
definierte Kobayashi-Maskawa-Matrix, in der Rx (θ1 ), R y (θ2 ) und Rz (θ3 ) die in (12.41) definierten Drehungsmatrizen mit Drehungen um die Winkel θ1 , θ2 und θ3 sind und 3 4 1 0 0 P(δ) 0 1 0 0 0 ei δ gesetzt ist. Die Matrix U ist so gewählt, daß sie für θ2 θ3 δ 0 den vorher betrachteten Fall (16.93) der Mischung von d L und s L liefert. Messungen haben für θ2 und θ3 kleinere Werte als für θ1 θC (siehe (16.95)) ergeben. Konsequenterweise muß auch bei den Leptonen darüber nachgedacht werden, ob nicht ebenfalls zwischen Ruhemasse-Eigenzuständen und Eigenzuständen der schwachen Wechselwirkung unterschieden werden sollte. Wie bei den Quarks wäre dabei der Effekt auf die schwache Wechselwirkung unabhängig davon, ob man die unteren Isospinorzustände e, μ und τ , die oberen νe , νμ und ντ oder beide mischt. Wir können uns daher auf den zweiten Fall beschränken, bei dem nur die Neutrinozustände gemischt werden. Nun werden die Neutrinos im Rahmen des Standardmodells als masselos angesehen, d.h. sie haben alle die gleiche Ruhemasse m 0 0 und können daher nicht durch ihre Ruhemassen unterschieden werden. Die schwache Wechselwirkung bietet daher die einzige Möglichkeit zu ihrer Unterscheidung. Deshalb macht es keinen Sinn, die hierzu benötigten Isospinzustände aus Massezuständen zu superponieren, die nicht unterscheidbar wären. Dies kann detailliert in Abschn. 17.1.2 nachvollzogen werden, wo wir die Konsequenzen von null verschiedener Neutrinomassen und von Neutrinomischungen untersuchen werden.
16.5
Gesamt-Lagrange-Dichte
Für Referenzzwecke und der Übersichtlichkeit halber wird im folgenden nocheinmal im Kontext die gesamte Lagrange-Dichte des Standardmodells ohne Berücksichtigung von Quarkmischungen angegeben. Nach (16.6), (16.23), (16.46), (16.49b), (16.66)–(16.67), (16.75), (16.76) und (16.30) gilt
L Q H LH QH B mit
L i hc c
ν e γ α ∂α νe e L γ α ∂α e L
2 1 2 sin θ W
ec
2 sin θ W
eL γ α eL
ν e γ α e L Wα
e R γ α ∂α e R
c eL γ α eL
sin2 θ W e R γ α e R
e L γ α νe Wα
,
(16.99)
e R γ α e R e Aα
α 1 2 ν e γ νe
eZ α sin θ W cos θ W
514
Q
16 Standardmodell i hc(u L γ α ∂α u L d L γ α ∂α d L u R γ α ∂α u R d R γ α ∂α d R ) ec Wα u L γ α d L Wα d L γ α u L 2 sin θ W e Aα α α α α c 2 u L γ u L u R γ u R (d L γ d L d R γ d R ) 3 2 α 2 α c 2 3/4 sin θ W u L γ u L 3/2 sin θ W d L γ d L eZ α 2 α α sin θ W (2u R γ u R d R γ d R 3 sin θ W cos θW 8 g3 hc q j λk γ α q j G kα , q u,d j L,R
H
k 1
h2 α (∂ η)(∂α η) μc2 η2 2μ
m 20W c2 Z α Zα ,α ,α (W ) Wα (W ) Wα 2 cos θ W 2μ0 h 2
2 λ 4 c Z α Z α 2τ0 ηη2 3 λτ0 η η , (W ,α ) Wα (W ,α ) Wα 2 4 8μ cos θ W sin2 θ W 2
LH mΦ0ec 0
c2
QH mΦ0u 0
B 4μ1
0
LΦe R
L u Φc u R Fαβ F αβ
eR Φ L ,
m 0d c2 L u Φd R d R Φ L u , Φ0 (W ,αβ ) Z αβ Z αβ ,αβ Wαβ (W ) Wαβ
u R Φc L u
i g 2 Fαβ sin θW Z αβ cos θ W W ,α W ,β W ,β W ,α μ0 ( ,α β W ,α Aβ W ,β Aα ) sin θ W Wαβ W A W ,β Aα Wαβ ( ,α β W ,α Z β W ,β Z α ) cos θW Wαβ W Z W ,β Z α Wαβ
2g22 Wα W ,α A β A β Wα A α Wβ A β sin2 θ W μ0 ,α Aβ Z β W Aα W Z β W Z α W Aβ sin θ W cos θW 2Wα W α α β β ,α β α β 2 Wα W Z β Z Wα Z Wβ Z cos θ W ( ,α ,β ,α 2 ) Wα W Wβ W Wα W
16.6 Kosmologische Implikationen des Higgs-Feldes
mit
5
μ , λ
e2 h 2 μ0
515
m 0H
e . 2h sin θ W sin θ W 2 (16.100) Für die zweite und dritte Familie ist eine analoge Lagrange-Dichte anzuschreiben, und analoge Dichten müssen auch für die Antiteilchen jeder Familie angegeben werden. Dabei sind Mischungen zwischen den Familien der Übersichtlichkeit halber nicht mit erfaßt, weshalb es auch nicht nötig ist, die Dichten der verschiedenen Familien zu addieren. Wie Familien- und Quarkmischungen zu behandeln sind, wurde in Abschn. 16.4.4 untersucht. Produktterme wie ce L γ α e L e Aα oder ecν e γ α e L Wα /( 2 sin θ W ), in denen die Felder verschiedener Teilchen miteinander multipliziert sind, liefern wie in der QED die Vertizes für mögliche Teilchenumwandlungen. Miteinander wechselwirken können auch Teilchen, deren Zustände nicht gemeinsam in Produkten stehen, zur Wechselwirkung genügt es, daß sie an die gleichen Felder ankoppeln. Da z. B. jedes Quark über g3 h c 8k 1 q j λk γ α q j G kα an alle Gluonenfelder G kα ankoppelt, kann jedes Quark mit jedem anderen Quark oder Antiquark unabhängig vom Flavor über Gluonen in Wechselwirkung treten. Beschrieben werden derartige Prozesse durch Feynman-Diagramme der Art von Abb. 10.12 der Quantenfeldtheorie. Allgemeiner wechselwirken auf diese Weise miteinander alle Teilchen, welche die gleiche Art von Ladung tragen. Φ0
16.6
τ0
c
λ
4m 20W
2
,
μ
,
g2
Kosmologische Implikationen des Higgs-Feldes
Wenn das Higgs-Feld allen Teilchen des Universums in gleicher Weise Ruhemasse verleihen soll, muß es sich im wesentlichen um ein räumlich homogenes Feld handeln. Auf kosmischen Skalen homogene Felder erzeugen im Universum negativen Druck und führen zu einer der Gravitation entgegenwirkenden Expansion des Universums. (Ihre Energie wird in der Kosmologie als dunkle Energie bezeichnet.) Das Higgs-Feld könnte daher einen Beitrag zu einer dynamischen kosmologischen „Konstanten“ Λ(t) liefern. Für diese wird in der Frühphase des Universums ein sehr großer Wert benötigt, damit die inflationäre Expansion zustandekommt, die zur Erklärung der heute auf großen Skalen beobachteten Homogenität – insbesondere der kosmischen Hintergrundstrahlung – benötigt wird. Dementsprechen könnte auch der zu V (Φ) proportionale Beitrag des Higgs-Feldes zu Λ(t) während der Inflation besonders groß gewesen sein. Zu dessen Zeitabhängigkeit wurden verschiedene Ideen entwickelt. Die einfachste Idee ist folgende. Zwischen dem Higgs-Feld und dem Gravitationsfeld besteht eine Wechselwirkung. Diese beeinflußt das Potential V (Φ) derart, daß dieses zeitabhängig wird und im zeitlichen Nacheinander die in Abb. 16.4 dargestellten Formen 1. bis 4. annimmt. Das Feld Φ versucht sich so einzustellen, daß V (Φ) möglichst klein wird. Solange V (Φ) sein Minimum bei Φ 0 hat, also z. B. in den mit 1. und 2. bezeichneten Phasen, solange ist Φ 0 und solange hat V (Φ) den relativ großen Wert V (0). Sobald V (Φ) sich nach unten zu krümmen beginnt, „rollt“ das Feld Φ den Berg hinab auf das neu entstandene Minimum zu. Wenn das Potential seine endgültige
516
16 Standardmodell
V
1. 2. 3. V (Φ)
4. Φ
0
Φ0
Abb. 16.4: Dynamische Entwicklung des Higgs-Feld-Potentials V (Φ).
Form 4. angenommen hat, führt das Feld um das Minimum herum noch Oszillationen aus, die mit der Zeit abklingen. Bei dem Übergang von von Φ 0 nach Φ0 wird die potentielle Energie in „kinetische“ Energie des Feldes Φ überführt. Dies entspricht einer Umwandlung in Feldquanten und in thermische Energie von diesen. Außerdem kommt es durch die Oszillationen um die neue Ruhelage durch Wechselwirkung mit anderer Materie, die währen der Inflation extrem abgekühlt wurde, zu deren Wiederaufheizung. V (Φ0 ) muß mit dem heute beobachteten, sehr kleinen Wert der kosmologischen Konstanten verträglich sein. Ein kleiner Restwert von Λ bleibt dadurch möglich, daß sich V (Φ) aufgrund von Quantenfluktuationen etwas über dem möglichen Minimalwert null befindet. Bei einem anderen Szenario wird V (Φ) aufgrund thermischer Effekte zeitabhängig und durchläuft im wesentlichen die gleichen Phasen wie bei dem eben geschilderten Szenario. Eine Folge des oben geschilderten Szenarios besteht darin, daß das Higgs-Feld in der Frühzeit des Universums noch nicht die zum Verleihen von Ruhemassen benötigte Symmetriebrechung aufweist. Demnach hatten alle Elementarteilchen anfänglich die Ruhemasse null und mußten sich dementsprechend mit Lichtgeschwindigkeit bewegen. Sie erhielten ihre endgültige Ruhemasse erst, nachdem das Potential des Higgs-Feldes sich so verändert hatte, daß sein Minimum bei einem von null verschiedenen Wert des Feldes lag. Außer dem Higgs-Feld tragen nach Abschn. 8.2.1 der Quantenfeldtheorie auch Vakuumfluktuationen zu einer dynamischen kosmologischen Konstanten bei. (Da an das zur kosmischen Inflation benötigte Feld andere Anforderungen als an das zur Erklärung der Teilchenmassen benötigte Higgs-Feld zu stellen sind, führt man in der Kosmologie zur Beschreibung der Inflation zusätzlich ein Higgs-Feld-artiges Inflaton-Feld ein.) Außerdem könnten auch noch andere Felder ähnliche Beiträge wie das Higgs-Feld liefern. Um den sehr kleinen heutigen Wert der kosmologischen Konstanten zu verstehen, kann man annehmen, daß auch die ursprünglich von Einstein eingeführte (echte) kosmologische Konstante auftritt und einen extrem großen negativen Wert besitzt, um die viel zu großen anderen Beiträge zu kompensieren. Hierzu wird jedoch eine Feinabstimmung benötigt, die derart präzise sein muß, daß man sie für unwahrscheinlich hält. Das Problem der effektiven kosmologischen Konstanten wird daher als ungelöst angesehen. Einige betrachten es sogar als eines der größten ungelösten Probleme der heutigen Physik.2 2 Siehe dazu Weinberg, S., Rev. Mod. Phys., 61, 1 (1989)
16.7 Experimentelle Tests des Standardmodells
16.7
517
Experimentelle Tests des Standardmodells
16.7.1 Nachweis der Eichbosonen Seine deutlichste Bestätigung fand das Standardmodell der Elementarteilchen 1983 durch den experimentellen Nachweis der Existenz der Eichbosonen W und Z 0 am CERN. Die Parameter λ und θW , von denen deren Ruhemassen nach (16.68) abhängen, waren schon vorher aus Streu- und Zerfallsprozessen der schwachen Wechselwirkung bestimmt worden, so daß auch die Ruhemassen bekannt waren. Da alle Eichbosonen instabil sind, müssen sie zu ihrem Nachweis erzeugt werden. Dazu muß mindestens die ihrer Ruhemasse entsprechende Energie m 0 c2 aufgewandt werden, was sehr viel ist. Aufgrund der Kenntnis der Ruhemassen wußte man, in welchem Energiebereich man zu suchen hatte. Zur Erzeugung der Eichbosonen sind nach Kap. 10 der Quantenfeldtheorie alle Reaktionen zwischen Teilchen geeignet, deren Zustände in der Lagrange-Dichte (16.99) mit W oder Z ein Pro 1 2 α dukt bilden. Den Termen c 2 sin θ W e L γ e L eZ α /(sin θ W cos θ W ) aus L bzw. 2c 3/4 sin2 θ W u L γ α u L eZ α /(3 sin θ W cos θ W ) aus Q läßt sich z. B. entnehmen, daß sich das Z -Boson durch eine Elektron-Positron bzw. Quark-Antiquark-Kollision erzeugen läßt. (e L repräsentiert als einlaufendes Teilchen ein Positron, u L ein einlaufendes Antiquark.) Am durchsichtigsten (siehe unten) ist die Elektron-Positron-Kollision, die am CERN auch als erstes versucht wurde. Später stellte sich jedoch heraus, daß die QuarkAntiquark-Kollision einfacher und auch billiger ist. Deren Interpretation wird allerdings dadurch erschwert, daß es keine einzelnen Quarks gibt (siehe Exkurs 16.2), so daß man aus mehreren Quarks zusammengesetzte Teilchen wie Proton und Antiproton benutzen muß. Bei der 1983 am CERN eingesetzten Proton-Antiproton-Kollision treffen die Quarks uud des Protons auf die Quarks u u d des Antiprotons. Dies bedeutet, daß z. B. das u-Quark des Protons mit einem u - oder d-Quark des Antiprotons reagieren kann. Im ersten Fallwürde ein Z -Boson entstehen, im zweiten entsprechend dem Term ec Wα d L γ α u L /( 2 sin θW ) aus (16.99) ein W -Boson. Es werden daher gleichzeitig mehrere voneinander verschiedene Teilchen erzeugt. Das Auftreten von Teilchen, die durch Reaktionen der begleitenden Quarks (engl. spectator quarks) erzeugt werden, bedeutet eine beträchtliche Erschwernis, die bei der Elektron-Positron-Reaktion entfallen würde. Ein weiteres Problem ist, daß in der Natur nur Protonen vorkommen, während Antiprotonen erst mühsam erzeugt und dann in einem Speicherring gespeichert werden müssen. Die Eichbosonen sind viel zu kurzlebig, um direkt nachgewiesen werden zu können. Ihr Nachweis kann daher nur indirekt über die Teilchen geführt werden, in die sie zerfallen. (Alle möglichen Zerfallsreaktionen können wie die Erzeugungsreaktionen aus der Lagrange-Dichte (16.99) abgelesen werden. Während jedoch für die Erzeugung gezielt eine einzige Reaktion ausgesucht werden kann, müssen beim Zerfall alle nur möglichen Reaktionen, die allerdings mit unterschiedlichen und theoretisch zu bestimmenden Wahrscheinlichkeiten auftreten, berücksichtigt werden.) Für eine schlüssige Auswertung müssen die Energien und Impulse aller auslaufenden Teilchen bestimmt und mit den theoretischen Vorhersagen verglichen werden. Nachdem auf diese Weise 1983 der Existenznachweis für alle Eichbosonen über die
518
16 Standardmodell
Proton-Antiproton-Reaktion geführt worden war, gelang 1989 schließlich auch deren Nachweis über die Elektron-Positron-Reaktion.
16.7.2 Zahl der Familien Man kennt keinen theoretischen Grund dafür, warum es nur drei Lepton-QuarkFamilien gibt. Durch das Experiment wird diese Tatsache jedoch auf eindrucksvolle Weise belegt. Betrachten wir den Zerfall des Z -Bosons. Aus der Lagrange-Dichte entnimmt man, daß dieses auf drei verschiedene Weisen in Neutrinos zerfallen kann, nach (16.99) in νe und ν e und nach analog gebildeten Lagrange-Dichten für die beiden anderen Familien noch in νμ und ν μ sowie in ντ und ν τ . Für den als Zerfallsbreite bezeichneten, mit h multiplizierten Kehrwert der mittleren Lebensdauer (siehe Abschn. 10.5 der Quantenfeldtheorie, dort mit G bezeichnet) ergibt sich unter der Annahme, daß alle Neutrinomassen gemäß dem Standardmodell gleich null sind, der gleiche Wert Γ (Z
Γ (Z
Γ (Z
νe νe )
νμ νμ )
Γ 165, 9 MeV .
ντ ντ )
ν ν
(16.101)
(Man geht heute von nicht-verschwindenden Ruhemassen der Neutrinos aus, die voraussichtlich auch voneinander verschieden sind. Ihre Berücksichtigung würde zu drei verschiedenen Zerfallsbreiten führen, die aber wegen der Kleinheit der Ruhemassen nur wenig von dem hier angegebenen einheitlichen Wert abweichen. Für die folgenden Überlegungen spielt das jedoch keine Rolle.) Wir nehmen nun an, es gäbe unter Einschluß weiterer unbekannter insgesamt N Neutrinosorten, in die das Z -Boson mit der gleichen Zerfallsbreite Γν ν zerfallen kann. Dann erhielte man für die gesamte Zerfallsbreite des Z -Bosons ΓZ
Γ Γ Γ Γ Nγ μμ
ee
τ τ
Hadr
ν ν
,
(16.102)
wobei Γee die Zerfallsbreite für den Zerfall des Z -Bosons in ein Elektron und ein Antielektron ist etc., während ΓHadr die Zerfallsbreite für alle Zerfälle in Quarks zusammenfaßt. (Die letzteren müssen so stattfinden, daß farbneutrale Zustände entstehen, in denen mehrere Quarks gebunden sind.) Γ Z kann experimentell aus der mittleren Lebensdauer des Z -Bosons bestimmt werden, es ergibt sich (ohne Angabe von Fehlergrenzen) ΓZ
2490 MeV .
(16.103)
Da Z -Bosonen extrem schnell zerfallen, müssen die zu einer Messung von Γ Z herangezogenen Teilchen unmittelbar vorher erzeugt werden, was mit Hilfe des Prozesses e e Z möglich ist. Effektiv wird damit also die Zerfallsbreite der über den Zwischenschritt e e Z erfolgenden Reaktion e e e e μ μ . . . bestimmt. Für die Lepton-Zerfälle des Z -Bosons liefert das Standardmodell
Γee
Γ
μμ
Γ Γ 84 MeV , τ τ
Lept
(16.104)
was in guter Übereinstimmung mit experimentellen Meßwerten steht. Die Zerfallsbreite der hadronischen Zerfälle ist
ΓHadr 1740 MeV .
(16.105)
16.7 Experimentelle Tests des Standardmodells
519
Leptonen und Hadronen können bei einem Zerfallsprozeß aufgrund ihrer elektrischen Ladung oder Farbladung gut durch ihre Wechselwirkungen nachgewiesen werden. Insbesondere kann bei ihnen direkt festgestellt werden, daß es keine Mitglieder weiterer, im Standardmodell nicht berücksichtigter Familien gibt, so daß hier keine unbekannte Familienanzahl angesetzt werden muß. Die Neutrinos sind dagegen so schwer nachweisbar, daß sie beim Z -Zerfall „ungesehen“ entkommen. Dies bedeutet, daß es in der Zerfallsbreite des Z -Bosons einen „unsichtbaren“ Anteil Γuns
ΓZ
3ΓLept
ΓHadr
(16.101) (16.103)
(2490 384 1740) MeV 498 MeV
gibt, der von den Neutrinos stammen muß und nach (16.102) durch NΓν ν gegeben ist. Für N ergibt sich damit Γ 498 (16.101) N uns 3, 002 , Γν ν 165, 9 also gerade die im Standardmodell benutzt Zahl von drei Familien.
16.7.3 Weitere Tests Das Standardmodell macht eine Reihe weiterer Aussagen, die experimentell überprüft werden können und auch überprüft worden sind. Dazu gehören z. B. die Existenz der Gluonen oder der Farbladung und die Quarkstruktur zusammengesetzter Teilchen wie Baryonen und Mesonen. Für die letzteren lassen sich Zerfallszeiten berechnen, und bei Teilchenstößen gibt es experimentell überprüfbare Aussagen über Umwandlungsprozesse und Wirkungsquerschnitte. Die entsprechenden Berechnungen sind im allgemeinen sehr aufwendig und in der einschlägigen Spezialliteratur zu finden. Hier soll dazu nur bemerkt werden, daß sich bei all diesen Problemen das Standardmodell hervorragend bewährt hat, so daß es heute allgemein anerkannt ist.
16.7.4 Zum Nachweis des Higgs-Bosons Ein experimenteller Nachweis der Existenz des Higgs-Bosons H ist bisher nicht gelungen. Es gibt eine Reihe theoretischer Gründe dafür, warum dieser ein sehr schwieriges Unterfangen darstellt. Nach (16.69b) ist m 0H proportional zu dem unbestimmten Faktor μ und damit unbekannt, was zur Folge hat, daß nicht klar ist, in welchem Energiebereich sich H erzeugen ließe. Dies hat zur Folge, daß hierfür große Energiebereiche abgesucht werden müssen. Indirekt ließe sich das Higgs-Boson über Wechselwirkungen nachweisen, was jedoch dadurch erschwert wird, daß es als ungeladenes und farbloses Teilchen nur an der schwachen Wechselwirkung teilnimmt. Seine Ankopplung (bzw. die des Feldes Φ) an das Elektron ist nach (16.75) proportional zu dessen Ruhemasse, und Entsprechendes gilt für seine Ankopplung an Quarks. Daher ist es an die leichter zu erzeugenden leichten Teilchen wie das Elektron und die Quarks der ersten Familie nur sehr schwach gekoppelt, während die Teilchen, an die es stärker gekoppelt ist, selbst schwer zu erzeugen sind. Letzteres gilt auch für die W - und Z -Bosonen, für
520
16 Standardmodell
welche die Ankopplung des Higgs-Bosons mit der aus (16.100) folgenden Beziehung τ0 c(μ/λ)1/2 m 0W m 0H aus der letzten Zeile von (16.66) zu entnehmen ist. Man erwartet, daß die Ruhemasse des Higgs-Bosons mit der Ruhemasse der W -Bosonen vergleichbar ist. Es wird aber auch für möglich gehalten, daß das ganze Konzept des Higgs-Feldes und des mit ihm verbundenen Mechanismus der Masseerzeugung trotz der damit erzielten Erfolge – als ein solcher kann z. B. der Zusammenhang (16.70) angesehen werden – durch ein tieferliegendes Konzept ersetzt werden muß, von dem es selbst nur oberflächliche Eigenschaften widerspiegelt.
16.8
Anhang zur Diagonalisierung von Matrizen
Jede komplexe n n-Matrix M kann mit Hilfe zweier unitärer Matrizen U1 und U2 durch die Transformation M ¼ U1 MU2 M D (16.106) in eine Diagonalmatrix M D mit reellen nicht-negativen Diagonalelementen überführt werden. Beweis: Die Matrix M M ist hermitesch, denn (M M ) M M M M . Jetzt benutzen wir die bekannte Tatsache, daß jede hermitesche Matrix A mit Hilfe einer unitären Matrix U durch die Transformation A U AU in Diagonalform überführt werden kann. Infolgedessen gibt es eine Matrix U1 , für die U1 M M U1 D (16.107) gilt, wobei D eine Diagonalmatrix ist. Aus der letzten Gleichung folgt mit U1 U1 E U1 MU1 U1 M U1
U1 MU1 (U1 MU1 )
D
oder D A A mit A U1 MU1 . Hieraus folgt Di δik
Ai j A j k
j
A i j A kj
und
Di
j
A i j Ai j
j
Ai j 2
0.
j
Nun definieren wir eine Diagonalmatrix M D durch (M D )i j Di δi j .
(16.108)
2 bzw. nach (16.107) Dann gilt D M D
U1 M M U1
2 . MD
Durch Multiplikation dieser Gleichung von rechts mit U1 und links mit U1 folgt hieraus MM
2U U1 M D 1
U1 M D U1 U1 M D U1
mit H
U1 M D U1
s.u.
H ,
H2
s.u.
HH
(16.109) (16.110)
Aufgaben
521
wobei zuletzt M D M D benutzt worden ist. Damit sowie mit den Definitionen V U2 U1 V gilt (16.110) M H H 1M HV U1 M D U1 V U1 M D U2 .
H 1 M und (16.111)
V ist eine unitäre Matrix, denn aus (16.109) folgt durch Multiplikation mit H 1 von links H 1 M M
V M
H
(V M )
MV
H
H 1MV
VV
E.
Auch U2 U1 V ist unitär, denn U2 U2
V U1 U1 V
V V
E.
Aus (16.111) folgt (16.106) durch Multiplikation mit U2 von rechts und U1 von links.
Aufgaben 16.2
Die Lagrange-Dichte (16.39) ist auch gegenüber Eichtransformationen der Gruppen U (1) und SU (2) invariant, wenn die kovarianten Ableitungen (16.40) mit Kopplungsfeldern gebildet werden, die voneinander und von den für die Leptonen benutzten Feldern X α und Wα verschieden sind, Dα L
Wα , X R , X R . Dα R ∂α i g1R Dα R ∂α i g1R α α Zeigen Sie, daß X α L X α R X α R X α und Wα Wα gelten muß, damit die Vor∂α
X L i g1L α
i g2
aussetzungen 3. und 4. des Standardmodells erfüllt werden. Anleitung: 1. Wie lautet das zu den kovarianten Ableitungen gehörige Transformationsgesetz für die Zustände L u , u R und d R ? 2. Es müssen zunächst Hilfsfelder A L , A R und A R sowie Z L , Z R und Z R eingeführt werden. Dabei sind L , θ R und θ R zu benutzen. 3. Sowohl auch voneinander verschiedene Winkel θ W W W ν ν die Felder Aα als auch die Felder Z α könnten für die elektromagnetische Wechselwirkung herangezogen werden, da ihre Koeffizienten durch eine Umdefiniν ineinander überführt werden können. Man entscheidet sich tion der Winkel θ W am besten für die Felder Aαν . 4. Die Wechselwirkung links- und rechtshändiger Quarkzustände mit dem elektromagnetischen Feld muß gleichartig sein. 5. Die Isospin-Ladungen q I der Quarks sind von null verschieden. Daher muß es auch eine Wechselwirkung der Quarkzustände mit dem für Leptonen eingeführten Feld Z α geben, die der 4. Voraussetzung des Standardmodells genügen muß. 6. Aus 4. und 5. kann X α L X α R X α R X α und Wα3 Wα3 geschlossen werden. 7. Zu zeigen ist noch Wα Wα . Dies gelingt durch eine geeignete Wahl des räumlichen Koordinatensystems. 16.3
Zeigen Sie, daß durch die Transformation Φ ei n θ Φ erreicht werden kann, daß Φ1 Φ2 Φ4 0 wird.
522
16.4
16 Standardmodell
Zeigen Sie, daß die Transformationen Φ ¼ ei
ΛΦ (x)
(x)
Φ mit Φ
der ρ , τ -Ebene Drehungen bewirken. 16.5
ρ in τ
Zeigen Sie, daß mit der Matrix U auch die Matrix U mit den Komponenten U ik Uik ei (αk αi ) unitär ist. ¼
16.6
Zeigen Sie, daß Festlegung des Vakuumzustands durch die Wahl ρ0 0, τ0 0 gleichwertig ist mit der zur Ableitung von (16.75) bzw.(16.76) getroffenen Wahl ρ0 0, τ0 0.
16.7
Zeigen Sie, daß die von Gell-Mann und Nishijima aufgestellte Beziehung Q I3 Y/2 mit der Hyperladung Y g1 /g1L auch von den Quarks erfüllt wird.
Lösungen 16.3
Mit (12.82) ergibt sich Φ1 i Φ2 Φ i Φ 3
4
Die Forderung Φ1
(cos θ i n z sin θ)(Φ1 i Φ2 )(i n x n y ) sin θ(Φ3 i Φ4 ) , (i n x n y ) sin θ(Φ1 i Φ2 )(cos θ i n z sin θ)(Φ3 i Φ4 ) . Φ2
Φ4
0 führt zu den drei Gleichungen
n x Φ4 n y Φ3 n z Φ2 n x Φ3 n y Φ4 n z Φ1 n x Φ1 n y Φ2 n z Φ3
Φ1 cot θ Φ2 cot θ Φ4 cot θ
für die Unbekannten n x , n y und n z . Die Determinante dieses Gleichungssystems ist Φ42 Φ3 Φ12 Φ3 Φ22 Φ3 Φ33 Φ1 Φ2 Φ4 Φ1 Φ2 Φ4
Φ3 (Φ12 Φ22 Φ32 Φ42 ) .
Sie ist von null verschieden, was bedeutet, daß das Gleichungssystem auf jeden Fall eine Lösung für n x , n y und n z besitzt. Zur Lösung machen wir den Ansatz n x X cot θ, n y Y cot θ, n z Z cot θ. Dann kann der Faktor cot θ aus allen Gleichungen herausgekürzt werden, und man erhält für X, Y und Z ein Gleichungssystem mit derselben Determinante, das ebenfalls eine Lösung besitzt. Damit ergibt sich n 2x
n 2y n2z
(X 2 Y 2 Z 2 ) cot2 θ
und die Forderung n2 1 kann durch θ
arccot
erfüllt werden. 16.4
ρ 2 τ 2
Φ Φ
1
X2
Y 2 Z2
Φ U UΦ
Φ Φ
ρ 2 τ 2 .
17
Über das Standardmodell hinausführende Entwicklungen
In diesem Kapitel werfen wir einen Blick auf über das Standardmodell hinausführende Entwicklungen in der Elementarteilchentheorie. Es handelt sich dabei um Versuche, im Standardmodell offen gebliebene Probleme zu klären, um die Frage, ob in der Natur noch andere als die im Standardmodell integrierten Symmetrien realisiert werden und auch darum, ob es möglicherweise eine umfassendere Theorie gibt, welche die in das Standardmodell eingegangenen freien Parameter erklären kann. Viele der entsprechenden Ansätze sind vielversprechend, aber noch nicht zu einer abgeschlossenen Theorie ausgebaut, und manche Ergebnisse befinden sich noch weit von der Möglichkeit einer experimentellen Überprüfung entfernt. Außer bezüglich der in Abschn. 17.1 untersuchten Neutrinooszillationen muß es in diesem Kapitel aus Platzgründen bei einer flüchtigen Skizzierung von Ideen bleiben.
17.1
Neutrinomassen und Neutrinooszillationen
Im Standardmodell werden die Neutrinos der verschiedenen Familien als masselos behandelt, was dazu führt, daß eine Mischung unterscheidbarer RuhemasseEigenzustände zu Eigenzuständen des schwachen Isospins nicht möglich ist. Die Gründe für die Annahme der Masselosigkeit von Neutrinos sind allerdings keineswegs so stichhaltig wie bei den Gammaquanten, Gluonen oder Goldstone-Bosonen, bei denen das Vorhandensein einer Ruhemasse zu intolerablen Symmetrieverletzungen geführt hätte. Daß wir den Neutrinos nicht wie den zugehörigen Isospinpartnern (Elektron usw.) durch die Wechselwirkung mit dem Higgsfeld eine Ruhemasse zuordnen konnten, hing mit dem empirischen Befund zusammen, daß es anscheinend keine rechtshändigen Neutrinos gibt. Andererseits muß gesagt werden, daß die Existenz eines rechtshändigen Neutrinos auch extrem schwierig nachweisbar wäre, denn als ungeladenes und farbloses Teilchen hat es keine Wechselwirkungen mit dem elektromagnetischen Feld und dem Gluonenfeld, und ein Blick auf die Lagrange-Dichte (16.23) zeigt, daß es wie bei e R zu keiner Wechselwirkung mit den Feldern Wα kommt. Da für rechtshändige Zustände außerdem I3 0 gilt, folgt aus (16.25) die Isospin-Ladung q I 0, so daß es auch keine Wechselwirkungen mit dem Feld Z α gibt. Theoretischen Gründe dafür, warum es keine rechtshändigen Neutrinos geben sollte, sind nicht bekannt, es erscheint im Gegenteil sogar als etwas merkwürdig, daß Neutrinos die einzigen Fermionen mit dieser Besonderheit sein sollten. Aus all diesen Gründen kann die Existenz rechtshändiger Neutrinozustände nicht mit absoluter Sicherheit ausgeschlossen werde. Aber selbst, wenn dem so wäre, gibt es noch eine andere Möglichkeit dafür, wie Neutrinos zu einer Ruhemasse kommen könnten. Dies soll im folgenden untersucht werden.
524
17 Über das Standardmodell hinausführende Entwicklungen
17.1.1 Neutrinos als massive Majorana-Teilchen Zunächst sei daran erinnert, daß sich für Fermionen, die links- und rechtshändige Zustände annehmen können, ein Ruhemasseterm m 0 c2 ψψ m 0 c2 (ψ L ψ R ψ R ψ L ) der Lagrange-Dichte durch die Ankopplung an ein Higgs-Feld in die invariante Form m 0c2(ψL Φψ R ψ R Φ ψ L )/Φ0 bringen läßt. Eine auf diese Weise erklärte Ruhemasse bezeichnet man als Dirac-Masse. Für Neutrinos erweist es sich nun als möglich, über den Anteil ψ L allein eine Ruhemasse zu erklären, wenn man gewisse Symmetrieforderungen aufgibt. Hierzu benutzt man den zu ψ ladungskonjugierten Dirac-Spinor ψc i γ 2 ψ £ , der sich nach Abschn. 2.13.2 der Relativistischen Quantenmechanik bei Lorentz-Transformationen wie der Spinor ψ transformiert, und konstruiert mit ihm aus ψ L den Zustand χ
ψL
(ψL )c .
(17.1)
Aus der leicht zu beweisenden Beziehung (ψc )c ψ folgt für ihn χ.
χc
(17.2)
Fermionen, deren Zustand dieser Gleichung genügt, werden als Majorana-Teilchen bezeichnet. Da χc das Antiteilchen des durch χ beschriebenen Teilchen darstellt, müssen Majorana-Teilchen zwangsläufig ungeladen sein, was auf das Neutrino zutrifft. Natürlich bedeutet die Erfüllung der Beziehung (17.2) eine Einschränkung an die Spinorkomponenten – wie ψ L besitzt χ nur zwei unabhängige Komponenten – es wäre jedoch durchaus möglich, daß Neutrinos Majorana-Teilchen sind. Um nun aus χ einen Masseterm zu konstruieren, benötigen wir die Eigenschaft (ψ L )c
i γ 2 ψ L£
(14.33) (14.34)
i 2 γ (1γ 5£ )ψ £ 2
s.u.
1 (1 γ 5 ) i γ 2 ψ £ 2
(14.33) (14.34)
(ψc ) R , (17.3)
zu deren Ableitung im vorletzten Schritt benutzt wurde, daß die Matrix γ 5 nach (2.208) reell ist und die Beziehung γ 2 γ 5 γ 5 γ 2 erfüllt. Außerdem benötigen wir ψL ψL
(14.38a)
ψ PR ψ L
ψ PR PL ψ
(14.38c)
0
und die analoge Beziehung ψ R ψ R 0 in Anwendung auf den Spinor (ψ L )c (ψc ) R . Mit diesen Eigenschaften erhalten wir χ
ψL
(ψc ) R
und χχ
ψ L (ψc ) R
(17.4)
(ψc ) R ψ L .
(17.5)
Ein Masseterm m 0 c2 χχ wäre nun zum einen Lorentz-invariant, zum anderen ließe er sich auch noch zusätzlich durch Ankopplung des Neutrinos an ein Higgs-Feld in einen SU (2)-invarianten Term der Form einbetten, wie er in (16.76) für das Upquark abgeleitet wurde (Aufgabe 17.1). Da jedoch offensichtlich ψ¼
e i Λ ψ
ψ L¼
ei Λψ L
17.1 Neutrinomassen und Neutrinooszillationen
und (ψc¼ ) R
(17.3)
(ψ L¼ )c
525
i γ 2 (ei Λ ψ L )
i γ 2 (ψ L¼ )
ei Λ i γ 2 ψ L
ei Λ (ψ L )c
gilt, geht die U (1)-Invarianz von χχ mit ψ L (ψc ) R ei 2Λ ψ L (ψc ) R verloren. Dies ist im Standardmodell nicht tolerierbar. Es gibt allerdings neuere Theorien, die SU (n)-Symmetrien höherer Ordnung als im Standardmodell benutzen, und in diesen kann der letzte Umstand akzeptiert werden. Aufgabe 17.1: Zeigen Sie, daß sich durch Ankopplung an das Higgs-Feld ein SU (2)-invarianter Ruhemasseterm für das Majorana-Neutrino konstruieren läßt. Lösung: Man schreibt χ ν L (νc ) R , setzt ν L zusammen mit einem zugehörigen Isospinpartner f L (z. B. dem Elektron) in ein Isospin-Dublett und nimmt in Analogie zu (16.76) m 0ν c2 Φ0 LΦc (νc ) R
(νc ) R Φc L
mit
L
νL fL
als Masseterm. Die Produkte LΦc und Φc L von Zweierspinoren sind SU (2)-invariant, weil in sie nur die von der Ladungskonjugation nicht betroffenen Anteile des Neutrinozustandes χ eingehen. Am Verlust der U (1)-Invarianz hat sich durch den Ansatz allerdings nichts geändert.
17.1.2 Neutrinooszillationen Wir nehmen jetzt an, daß Neutrinos eine irgendwie beschreibbare Ruhemasse besitzen, und untersuchen beobachtbare Konsequenzen, die sich infolgedessen aus Familienmischungen ergeben würden. Der Einfachheit halber beschränken wir uns dabei auf die Mischung der beiden ersten Familien, aus der die wichtigsten Konsequenzen schon sichtbar werden. Korrekter wäre es allerdings, alle drei Familien zu beteiligen. Da die Neutrinos die oberen Komponenten von Isospin-Dubletts besetzen, mischen wir jetzt allerdings nicht, wie bei den Quarks, die unteren, sondern die oberen Komponenten. Das ist natürlich ohne weiteres möglich, da wir in (16.91) auch U u U und U d E setzen können, was die gewünschte Mischung der oberen Komponenten bewirkt. Nun betrachten wir neben Ruhemasse-Eigenzuständen ν1 für das Elektron- und ν2 für das Myon-Neutrino wieder schwache Isospin-Eigenzustände νe und ν . Zu ihrem Nachweis, der nur über Prozesse der schwachen Wechselwirkung möglich ist, müssen sich Neutrinos in Zuständen der letztgenannten Art befinden. In Analogie zu (16.93c,d) erhalten wir zwischen Ruhemasse- und Isospin-Eigenzuständen den Zusammenhang νe
ν1 cos θ
ν2 sin θ ,
ν
ν1 sin θ
ν2 cos θ .
(17.6)
Da in der auch für Neutrinos gültigen Dirac-Gleichung (14.29) explizit die Ruhemasse steht, liefert deren Lösung die Zustände der Massedarstellung. Im Abschnitt 2.4
526
17 Über das Standardmodell hinausführende Entwicklungen
der Relativistischen Quantenmechanik wurde für freie Dirac-Teilchen mit der Ruhemasse m 0 , der positiven Energie E und dem Impuls p die Lösung ψ0 ei ϕ/h
ψ(x, t)
mit ϕ
p x Et ,
E
m 20 c4 c2 p2
(17.7)
abgeleitet. Dabei handelt es sich um gemeinsame Eigenzustände des Energie- und Impulsoperators, und es gilt ψ0 ψ(0, 0). Für Neutrinos erhalten wir analog ν1 (x, t)
ν10 ei ϕ1 /h,
pi x E i t ,
ν2 (x, t) ν20 ei ϕ2 /h
und ϕi
Ei
νi0
mit
νi (0, 0)
m 20i c4 c2 pi2 ,
(17.8) (17.9)
wobei wir verschiedene Ruhemassen m 01 m 02 zulassen. ν1 (x, t) und ν2 (x, t) sind nicht-normierbare stationäre Wellenlösungen, die zur Untersuchung der Mischung räumlich und zeitlich lokalisierter Teilchen nicht geeignet wären. Sie lassen sich allerdings in sinnvoller Weise z. B. auf den kontinuierlichen Neutrinostrom, der von der Sonne kommt oder in Kernkraftwerken erzeugt wird, anwenden. Die Spinoren repräsentieren dann nicht mehr Einzelteilchen, sondern einen gleichmäßigen Strom vieler Teilchen. (17.6) bedeutet daher auch nicht die Zerlegung nach einer Orthonormalbasis, vielmehr nehmen wir anstelle von Orthonormierungsbedingungen zweckmäßigerweise ν 1 ν2
ν 2 ν1
ν1 2
0,
ν 1 ν1
ν2 2
ν 2 ν2
w
(17.10)
an, wobei w die Wahrscheinlichkeitsdichte dafür angibt, ein Neutrino im Massezustand ν1 bzw. ν2 anzutreffen. (Wegen der räumlichen Konstanz von ν 1 ν2 bzw. νi 2 sind in diesen Forderungen die sonst üblichen Raumintegrale überflüssig.) Aus (17.6) ergibt sich mit (17.8) νe (x, t) ν (x, t)
ν10 ei ϕ1 /h cos θ
i ϕ1 /h
ν10 e
sin θ
ν20 ei ϕ2 /h sin θ , ν20 e
i ϕ2 /h
cos θ .
(17.11) (17.12)
Aufgrund der Überlagerung sind die Zustände νe (x, t) und ν (x, t) im allgemeinen weder Energie- noch Impulseigenzustände. Da wir für die beiden Neutrinos verschiedene Ruhemassen vorausgesetzt haben, läßt es sich wegen des in (17.9b) angegebenen Zusammenhangs zwischen Energie und Impuls auch nicht einrichten, daß sie das, wie die Massezustände, gleichzeitig werden. Um es mit möglichst einfachen Zuständen zu tun zu haben, setzen wir E 1 E 2 E, wodurch sie proportional zu ei Et /h und damit zu Energieeigenzuständen werden. Außerdem nehmen wir für ν1 und ν2 (und damit auch für νe und ν ) die gleiche Ausbreitungsrichtung e x an, indem wir pi pi ex setzen. Jetzt drücken wir die Referenzwerte ν10 und ν20 durch entsprechende Referenzwerte νe0 νe (0, 0) und ν0 ν (0, 0) aus. Dazu setzen wir in den Gleichungen (17.11) und (17.12) x und t gleich null bzw. ϕ1 ϕ2 0 und erhalten aus ihnen durch Auflösung nach ν10 und ν20 ν10
νe0 cos θ
ν0 sin θ ,
ν20
νe0 sin θ
ν0 cos θ .
17.1 Neutrinomassen und Neutrinooszillationen
527
Setzen wir dies z. B. in (17.11) ein, so erhalten wir νe (x, t) νe0 cos θ ν0 sin θ cos θ ei ϕ1 /h νe0 sin θ ν0 cos θ sin θ ei ϕ2 /h ei ϕ1/h cos2θ ei ϕ2/h sin2 θ νe0 sin θ cos θ ei ϕ2/h ei ϕ1/h ν0 . Nun nehmen wir an, daß es am Ort x 0 zur Zeit t 0 keine Elektron-Neutrinos gibt, d. h. wir setzen νe0 0. Aus der zuletzt erhaltenen Beziehung für νe (x, t) folgt hierfür νe (0, t)0, d. h. νe verschwindet dort dann permanent. Die Wahrscheinlichkeitsdichte dafür, am Ort x zur Zeit t ein Elektron-Neutrino zu finden – es muß aus einem MyonNeutrino hervorgegangen sein –, ist durch w(νe )νe (x, t)2 gegeben, ausführlicher also durch ' '2 w(νe ) w(ν νe ) sin2 θ cos2 θ 'ei ϕ2 /h ei ϕ1 /h ' ν0 ν0 . Mit sin θ cos θ (1/2) sin(2θ ), ν0 ν0 ν0 2 w0 , ' ' i ϕ /h 'e 2 ei ϕ1 /h '2 2 1 cos ϕ2 ϕ1 , h
den Voraussetzungen E 1 E 2 E sowie pi pi ex und deren Folge ϕ2 ϕ1 ( p2 p1 )x wird daraus
w0 ( p2 p 1 ) x 2 w(ν νe ) sin (2θ ) 1 cos . (17.13) 2 h Diese Wahrscheinlichkeit ändert sich periodisch mit dem Ort. Obwohl der Neutrinostrahl bei x 0 keine Elektronneutrinos enthält, finden sich solche bei x>0. Die entsprechende Rechnung für Myonneutrinos zeigt, daß diese im gleichen Umfang abnehmen, wie die Elektronneutrinos zunehmen, und umgekehrt (Aufgabe 17.2). Da diese Umwandlung von Neutrinos der einen in die andere Sorte (räumlich) periodisch ist, spricht man von Neutrinooszillationen. Eine Voraussetzung für diese ist ein von null verschiedener Wert des Mischungswinkels θ . Aber auch unter dieser Voraussetzung ergäbe sich kein Effekt, wenn die beiden Neutrinomassen gleich wären, weil die durch Auflösung von (17.9b) nach pi erhaltene Beziehung pi (E i /c2 m 20i c2 )1/2 (E/c2 m 20i c2 )1/2 für m 01 m 02 zu p2 p1 0 führt. Kein Effekt ergäbe sich auch, wenn beide Neutrinomassen verschwinden. Unter der Annahme m 20i c2 E 2 /c2 erhalten wir näherungsweise E 2 /c2 m 201 c2 p2 p1 E 2 /c2 m 202 c2 2 4 m 201 c4 (m 201 m 202 )c3 02 c Ec 1 m2E 1 2 2E 2E 2 und 4% $ 3 (m 202 m 201 )c3 x w0 2 sin (2θ ) 1 cos . (17.14) w(ν νe ) 2 2h E Die Periodenlänge der räumlichen Neutrinooszillationen beträgt also näherungsweise L
(m
02
4π h cE . (m 01 c2 )2
c2 )2
(17.15)
528
17 Über das Standardmodell hinausführende Entwicklungen
Um die Oszillationen nachweisen zu können, muß man Messungen über eine Distanz der Größenordnung L vornehmen. In Kernreaktoren werden Anti-Elektronneutrinos νe erzeugt, deren Energie etwa 4 MeV beträgt. Für (m 02 c2 )2 (m 01 c2 )2 1 (eV)2 ergibt sich aus (17.18), daß dafür eine Meßstrecke von etwa 10 m benötigt wird. Hätten wir p1 p1 p statt E 1 E 2 E angenommen, so hätten sich statt der räumlichen zeitliche Oszillationen mit der Periode T c/L ergeben (Aufgabe 17.3). Auch bei den Kernfusionsreaktionen im Zentrum der Sonne werden ElektronNeutrinos erzeugt, mit einer Erzeugungsrate von insgesamt etwa 21038 Neutrinos pro Sekunde. Wegen ihrer schwachen Wechselwirkung können diese fast ungehindert der Sonne entweichen und sich im Weltall ausbeiten. Auch die Erde wird von dem permanenten Strom der Sonnenneutrinos durchdrungen. Die energiereichsten unter ihnen, die aus einer Nebenreaktion (Verschmelzung von Protonen und Beryllium-7 zu Beryllium-8) stammen und nur den Bruchteil 10 4 der gesamten Neutrinoproduktion der Sonne ausmachen, sind am leichtesten nachzuweisen, was schon ca. 1960 durch R. Davis geschehen ist. Dabei wurde allerdings nur etwa ein Drittel des erwarteten Neutrinostroms gefunden. Eine Möglichkeit zur Erklärung der fehlenden Neutrinos liefern die Neutrinooszillationen, an denen dann allerdings auch noch das Tau-Neutrino beteiligt sein muß. Da zum Nachweis der Sonnenneutrinos Reaktionen benutzt werden, die nur das Elektron-Neutrino betreffen, würde im Detektor nur ein Drittel der Neutrinos erfaßt, sofern erstens dessen Durchmesser größer als die Länge einer Oszillationsperiode wäre, so daß die Neutrinos ihn teilweise als ν und ν durchqueren, und zweitens fast vollständige Mischung vorläge. Mittlerweile wurden auch die aus der Hauptreaktion stammenden, viel zahlreicher produzierten, jedoch energieärmeren Neutrinos in einem Experiment (GALLEX) nachgewiesen, und hier fand man etwa sechzig Prozent des erwarteten Flusses. Die verschiedenen Prozentsätze müssen nicht unbedingt einen Widerspruch darstellen, denn auf ihrem Weg durch die Sonne könnten νe und ν auf unterschiedliche Weise mit Elektronen wechselwirken, wodurch die Oszillationen auch bei schwacher Mischung verstärkt würden. Dabei könnte es zu Unterschieden zwischen Neutrinos verschiedener Energie kommen. Der Stand der Forschung im Jahr 2004 ist, daß nicht-verschwindende NeutrinoRuhemassen als erwiesen gelten. Sie sind allerdings im Vergleich zur Ruhemasse anderer leichter Elementarteilchen extrem klein (m ν /m e 210 10 ) und tragen aus kosmologischer Sicht trotz der hohen Teilchenzahldichte von etwa 110 Neutrinos pro cm3 nur unwesentlich zur Massendichte des Weltalls bei. Die hohe Dichte der sogenannten dunklen Materie muß also auf andere Weise erklärt werden (siehe Abschn. 17.3).
17.2
Große Vereinheitlichungstheorien
Die Annahmen und Konsequenzen des Standardmodells haben fast ausnahmslos der experimentellen Überprüfung standgehalten – eine der wenigen Ausnahmen bilden die Neutrinoruhemassen. Dennoch enthält das Standardmodell auch unbefriedigende Elemente wie die große Zahl von 26 unbestimmten Fitparametern (Aufgabe 17.5), und vieles kann das Standardmodell nicht erklären, z. B. die Anzahl der Familien, warum es ganzzahlige und drittel Elementarladungen gibt oder warum so große Unterschiede zwischen den Ruhemassen bestehen.
17.2 Große Vereinheitlichungstheorien
529
Trotz eklatanter Unterschiede weisen Leptonen und Quarks auch große Ähnlichkeiten auf: Beide tauchen in drei Generationen auf, und die elektroschwache Wechselwirkung macht keinen Unterschied zwischen ihnen, sondern behandelt sie in völlig gleicher Weise. Weiterhin deutet das Verhalten der verschiedenen Wechselwirkungen bei höheren Energien auf eine Vereinheitlichung der Kräfte hin, was im folgenden qualitativ besprochen werden soll. Wir betrachten zunächst die elektromagnetische Wechselwirkung eines Elektrons mit einem anderen geladenen Teilchen oder, wie bei der Berechnung seines anomalen magnetischen Moments in Abschn. 10.11.2 der Quantenelektrodynamik geschehen, mit einem externen elektromagnetischen Feld. Bei der Renormierung der Ladung erhielten wir nach Gleichung (10.135) und (10.138) für den Faktor, mit dem jeder Vertex zur Divergenz beiträgt, 2α (10.130b) F e Z 3 er mit Z 3 1 . 3πδ Bei diesem Ergebnis ist als Strahlungskorrektur nur der divergente Anteil der Selbstenergie des Photons in niedrigster Ordnung berücksichtigt, nicht jedoch der reguläre Anteil. Wird dieser mit einbezogen, so zeigt sich, daß sich wie in Gleichung (10.144) ein von q 2 abhängiger Korrekturfaktor ergibt, wobei q p¼ p der Impulsübertrag des Elektrons ist und nach (10.146) q 2 0 gilt. Die ähnlich wie die Rechnungen des Abschnitts 10.11.2 verlaufende Bestimmung dieses Korrekturfaktors liefert in niedrigster Ordnung als Quadrat der effektiven Ladung 2 eeff
α q 2 er2 1 3π ln 2 2 . m c e
Durch die Berücksichtigung aller Strahlungskorrekturen höherer Ordnung erhalten wir aus dem letzten Ergebnis in Analogie dazu, wie sich (10.112) aus (10.111) ergab, 2 eeff
er2
C 1
α q 2 ln 2 2 . 3π m e c
Hiermit wird aus dem Kopplungsparameter α e2 /(4πε0 h c) 1/137 der Quantenelektrodynamik ein effektiver bzw. laufender Kopplungsparameter αem (q 2 ) α
C 1
α q 2 ln 2 2 , 3π m e c
(17.16)
dessen Abhängigkeit von c(q 2 )1/2 in Abb. 17.1 eingetragen ist. Daß αem (q 2 ) mit zunehmendem Energieübertrag c(q 2)1/2 immer größer wird, läßt sich als Folge der in Abb. 16.1 dargestellten Zunahme der Ladung des Elektrons bei kleinen Abständen verstehen. Nach der Energie-Zeit-Unschärferelation dauert die Wechselwirkung umso kürzer, je größer die bei der Wechselwirkung übertragene Energie ist, und wie im Exkurs 16.2 bezüglich der Sondierung des Inneren von Hadronen ausgeführt wurde, ist die Wechselwirkung umso stärker auf das Elektron und seinen allernächsten Stoßpartner allein konzentriert, je kürzer die Wechselwirkung dauert. Daher macht sich die hohe unabgeschirmte Ladung des Elektrons umso stärker bemerkbar und führt zu einer
530
α
17 Über das Standardmodell hinausführende Entwicklungen
1
50
αem1 1 αschw
30 10
αst1 104
108
1012
1016
c
q2 GeV
Abb. 17.1: Inverses der laufenden Kopplungskonstanten αem ( q 2 ), αschw ( q 2 ) und αst ( q 2 ) der elektromagnetischen, schwachen bzw. starken Wechselwirkung, logarithmisch aufgetragen.
umso stärkeren effektiven Wechselwirkung, je größer q 2 ist. Wenn q 2 so groß ist, daß auch virtuelle Teilchen-Antiteilchen-Paare und oder und bzw. q und q erzeugt werden können, müssen auch diese noch in die Formel für αem (q 2 ) einbezogen werden, wodurch diese nochmals modifiziert wird. Es bleibt aber dabei, daß αem (q 2 ) mit lnq 2 /(m 2e c2 ) zunimmt. Ähnlich muß auch bei der schwachen Wechselwirkung vorgegangen werden. Vergleicht man in (16.23), wie ein Elektron an die Felder Aα , Z α und Wα ankoppelt, so findet man bis auf einen Zahlenfaktor die gleiche Kopplungskonstante g e. Für die schwache Wechselwirkung ergibt sich daher ebenfalls ein Kopplungsparameter αschw e2 /(4πε0 hc), der unter Berücksichtigung des genannten Zahlenfaktors sogar etwas größer als der elektromagnetische ist. Auch er muß aufgrund von Strahlungskorrekturen renormiert werden und erhält einen vom Energieübertrag c(q 2 )1/2 abhängigen regulären Beitrag. Dabei ergeben sich jedoch wesentliche Unterschiede gegenüber dem Fall der QED. Zum einen sind die die schwache Wechselwirkung übertragenden Eichbosonen im Gegensatz zum Photon massiv, was zur Folge hat, daß der unrenormierte Propagator für diese masseabhängig wird. Nach Aufgabe 9.5 der Quantenfeldtheorie ist er durch D F αβ ( p)
h 3 μ0 c gαβ q q M02 c2
D F αβ ( p)
h 3 μ0 c gαβ M02 c2
für q q
M02 c2
gegeben, wobei M0 die Ruhemasse des betrachteten Eichbosons ist. Bei kleinem Energieübertrag kann q q gegenüber M02 c2 vernachlässigt werden. Bei der Berechnung der Übergangsamplituden von Wechselwirkungsprozessen wird der schwache Kopplungsparameter mit diesem Propagator multipliziert, und es ist der große Wert seines Nenners, der die Wechselwirkung bei kleinen Energienüberträgen c(q 2 )1/2 schwach werden läßt, nicht etwa ein kleiner Wert des Kopplungsparameters. Erst wenn 2 2 2 4 q deutlich größer als M c wird, was für Energien oberhalb von etwa 10 GeV 0 2 der Fall ist – die betrachteten Eichbosonen der Ruhemasseenergie 10 GeV können dann als freie Teilchen existieren –, kann M02 c2 vernachlässigt werden, und der Propagator verhält sich dann wie der Photonenpropagator. Außer der Benutzung eines anderen Propagators muß bei den Strahlungskorrekturen die Erzeugung anderer virtueller Teilchen-Antiteilchenpaare berücksichtigt werden, solcher, in die das betrachtete Eichboson gemäß der zweiten und dritten Zeile der Lagrange-Dichte (16.23) zerfallen kann. Für die laufende Kopplungskonstante ergibt sich dann ein mit zunehmendem ln(q 2 /q02 ) abnehmender Wert von αschw (q 2 ) (Abb. 17.1). Bei der durch die masselosen Gluonen übertragenen starken Wechselwirkung ergibt sich nach der Renormierung und Berücksichtigung regulärer Strahlungskorrektu-
17.2 Große Vereinheitlichungstheorien
531
ren, für die nicht nur virtuelle Quark-Antiquark-Paare, sondern in entscheidender Weise auch virtuelle Gluonen eine Rolle spielen (dargestellt durch das im Exkurs 16.2 angegebene Diagramm mit einer inneren Gluonenschleife), aus αst g3 /(4πε0 c) die durch die obere Kurve der Abb. 17.1 dargestellte laufende Kopplungskonstante αst ( q 2 ). Ihr Abnehmen mit zunehmendem q 2 kommt durch die im Exkurs 16.2 diskutierte Abnahme der Farbladung mit abnehmendem Abstand bzw. zunehmendem Energieübertrag und die damit verbundene asymptotische Freiheit zustande. Die drei laufenden Kopplungsparameter der elektromagnetischen, schwachen und starken Wechselwirkung schneiden sich bei einem Energieübertrag von rund 1015 GeV, der Teilchenabständen von etwa 10 31 m entspricht, beinahe in einem Punkt (Abb. 17.1). Da bei derart hohen Energien Unterschiede in den Ruhemassen der verschiedenen Eichbosonen keine Rolle mehr spielen, bedeutet das, daß die verschiedenen Wechselwirkungskräfte gleich stark und damit ununterscheidbar werden. Die angeführten Gemeinsamkeiten von Quarks und Leptonen bzw. der zwischen diesen wirkenden Wechselwirkungskräfte bei hohen Energien deuten darauf hin: Es sollte möglich sein, die zugrundeliegenden Symmetrien durch eine Gruppe höherer Ordnung zu beschreiben, welche die Symmetriegruppen U (1) SU (2) und SU (3) des Standardmodells als Untergruppen enthält. Da Leptonen im Rahmen der schwachen Wechselwirkung durch Isospin-Dubletts und Quarks im Rahmen der Farbwechselwirkung durch SU (3)-Tripletts beschrieben werden, bietet es sich an, Leptonen und Quarks gemeinsam durch SU (5)-Quintetts wie ⎛ ⎞ νe ⎜ e L⎟ ⎜3 4 ⎟ ⎜ dr ⎟ (17.17) ⎟ ⎜ ⎝ dg ⎠ db L darzustellen, zwischen denen Gruppenübergänge durch Matrizen der Gruppe SU (5) vermittelt werden. In Großen Vereinheitlichungstheorien, die nach der englischen Bezeichnung Grand Unified Theories mit GUTs abgekürzt werden, wird die dem Standardmodell zugrunde liegende U (1) SU (2) SU (3)-Symmetrie nach diesem Muster in eine Symmetrie höherer Ordnung eingebettet, z. B. in die der Gruppe SU (5), welche die Gruppen U (1) SU (2) und SU (3) wie gefordert als Untergruppen enthält und wieder als Eichgruppe aufgefaßt wird. (Die linkshändigen Komponenten der nicht durch (17.17) erfaßten Teilchen der ersten Familie müssen dabei in – zehnkomponentige – SU (5)-Dekupletts gepackt werden, bei den übrigen Familien wird in gleicher Weise verfahren.) Hierdurch wird erreicht, daß nur noch eine Kopplungskonstante auftritt, und außer zur Vereinigung von Quarks und Leptonen kommt es auch zu einer Vereinigung der schon im Standardmodell vereinheitlichten Felder des Elektromagnetismus und der schwachen Wechselwirkung mit dem Eichfeld der Gluonen zu einer einheitlichen Wechselwirkung. Nach (15.10), (15.19) und (15.46) ist die Zahl der Eichfelder, die zur Invarianz der Lagrange-Funktion gegenüber den durch Matrizen der Gruppe SU (n) vermittelten Eichtransformationen benötigt wird, gleich der Zahl freier Gruppenparameter der zugehörigen n n-Matrizen, nach Tabelle 12.2 also gleich n 2 1. In der SU (5)-GUT treten demnach 24 Eichfelder bzw. 24 Eichbosonen auf. 12 davon sind die Eichbosonen
532
17 Über das Standardmodell hinausführende Entwicklungen
γ , W , Z 0 und 8 Gluonen der U (1) SU (2) SU (3)-Eichtheorie. Die 12 neu hinzugekommenen Eichbosonen werden als X-Bosonen bezeichnet und haben die Ladungen 4e/3 und e/3. Eine aus SU (5)-Quintetts und -Dekupletts aufgebaute Lagrange-Dichte, die gegenüber den durch die 55-Matrizen der Gruppe SU (5) vermittelten Transformationen invariant ist, enthält Wechselwirkungsterme, welche die wechselseitige Umwandlung der durch die Zustände des SU (5)-Quintetts (17.17) repräsentierten Teilchen erlauben. Insbesondere wird auch die Umwandlung von Quarks in Leptonen und umgekehrt möglich, und da diese nicht durch die Eichbosonen des Standardmodells vermittelt wird, muß das durch die X -Bosonen geschehen. Bisher wurden allerdings noch nie derartige Umwandlungen beobachtet. Dies führt man auf Symmetriebrechungen zurück, die durch Higgs-Felder bewirkt werden und in mehreren Etappen bei Wechselwirkungsenergien unterhalb einer geeignet gewählten Schwellenenergie stattfinden. Diese Symmetriebrechungen führen auch dazu, daß die eine Kopplungskonstante der SU (5)-Eichtheorie in die drei Kopplungskonstanten des Standardmodells zerfällt. Werden die Symmetriebrechungen so eingerichtet, daß die W -Bosonen und das Z 0 -Boson ihre festgestellten Ruhemassen bzw. die Kopplungsparameter ihre experimentell beobachteten Werte annehmen, dann erhält man für die X -Bosonen Ruhemassen, die einer Energie M0X c2 von etwa 1015 GeV entsprechen. Derart hohe Energien werden in einem irdischen Teilchenbeschleuniger nie realisiert werden, weshalb keine Hoffnung darauf besteht, je X-Bosonen im Labor erzeugen zu können. Es kann sie jedoch in der Frühphase des Universums gegeben haben, als die Temperatur noch oberhalb von 1028 K lag. Bei Wechselwirkungsenergien, die deutlich über den Ruhemasseenergien aller Eichbosonen liegen, spielen deren Ruhemassen keine Rolle, alle Eichbosonen können als reale Teilchen existieren und spielen für die Wechselwirkung vergleichbare Rollen. Daher gibt es nur eine Kopplungskonstante und eine einheitliche Wechselwirkung. Sobald die Wechselwirkungsenergien die zur Erzeugung einer Sorte von Eichbosonen notwendige Energie M0 c2 unterschreiten, wird die durch diese vermittelte Wechselwirkungskraft der Gleichung (11.2) entsprechend kurzreichweitig, und die entsprechende Wechselwirkung koppelt sich von den übrigen Wechselwirkungen ab. Dies geschieht bei etwa 1015 GeV bezüglich der X-Bosonen und bei etwa 102 GeV bezüglich der W Bosonen und des Z 0 -Bosons. Im folgenden werden noch einige wenige Konsequenzen der SU (5)-GUT plausibel gemacht. Drittelladungen und Zahl der Quarkfarben Es kann gezeigt werden, daß sich die Ladungen der in SU (5)-Quintetts bzw. SU (5)Dekupletts vereinigten Teilchen zu null addieren müssen. Dies hat damit zu tun, daß aus den Gruppengeneratoren der Gruppe SU (5) ein Ladungsoperator konstruiert werden kann, und daß die Spur der Gruppengeneratoren nach (12.25) verschwindet. Aus dem Zustand (17.17) folgt auf diese Weise für die Ladungszahl Q die Forderung
0 1 3Q(d) 0 Q(νe ) Q(e ) 3Q(d)
1/3 . Q(d)
Ähnlich ergibt sich aus dem SU (5)-Dekuplett Q(u)2/3. Daß Quarks Drittelladungen besitzen ist demnach eine Folge davon, daß es drei verschiedene Farbladungen gibt.
17.2 Große Vereinheitlichungstheorien
533
Bei der durch die X -Bosonen vermittelten Umwandlung von Quarks in Leptonen und umgekehrt bleiben immer Vielfache von Drittelladungen übrig, die keine ganzen Zahlen sind. Damit insgesamt Ladungserhaltung gilt, muß der Ladungsüberschuß entweder von Eichbosonen herangebracht oder weggetragen werden. Dies erklärt die Ladungen 4/3 und 1/3 der X -Bosonen. Protonzerfall Wenn sich Quarks in Leptonen umwandeln können, wird der Zerfall des aus Quarks zusammengesetzte Protons p uud gemäß der Reaktionsgleichung p
e 0
möglich. Das entsprechende Feynman-Diagramm ist u e X d p u
0 , d d und man überzeugt sich leicht davon, daß insgesamt die Erhaltung sowohl der elektrischen als auch der Farbladung gilt. (Aus dem zuletzt angeführten Grund müssen die daran beteiligten X -Bosonen ebenfalls Farbe tragen.) Nicht erhalten bleibt allerdings die sogenannte Baryonenzahl B, die für jedes Quark 1/3, jedes Antiquark 1/3 beträgt und additiv ist. Bei dem oben angegebenen Protonenzerfall geht sie von eins in null über. Da das beim Protonenzerfall gebildete Pion π 0 d d instabil ist und in zwei Photonen zerfällt, während sich das Positron ein Elektron sucht, um mit diesem zusammen ebenfalls in Photonen zu zerstrahlen, bedeutet der Protonenzerfall letztlich die Zerstrahlung aller Materie in Licht, denn das Proton ist nach dem Standardmodell das einzige stabile Baryon. Glücklicherweise liefern entsprechende Rechnungen schon beim einfachsten Modell eine mittlere Zerfallszeit des Protons von etwa 1031 Jahren, eine Zeitspanne, die etwa dem 1021 -Fachen der bisherigen Lebensdauer des Universums entspricht. Dies macht den Protonenzerfall zu einem extrem seltenen Ereignis, das entsprechend schwer nachzuweisen ist. Möglich ist das dennoch, denn die angegebene Zerfallszeit würde dazu führen, daß von 1031 Protonen, die in 30 Tonnen Wasser enthalten sind, eines pro Jahr zerfällt. Bisher wurde weltweit eine Reihe von Experimenten an hinreichend großen Materiemengen durchgeführt, alle tief unter der Erdoberfläche in ehemaligen Bergwerkschächten, um den störenden Einfluß der kosmischen Strahlung abzuschirmen. Alle einschlägigen Experimente verliefen jedoch negativ, und die letzten Messungen an dem auch zur Neutrinodetektion herangezogenen Super-KamiokandeDetektor in Japan mit einer Wassermenge von 50 000 t in 1000 m Tiefe führten für die mittlere Lebensdauer des Protons zu einer Untergrenze von 1, 61033 Jahren. Ein Nachweis des Protonzerfalls würde nicht nur eine wichtige Bestätigung für eine der GUTs darstellen, sondern auch noch ein anderes wichtiges Problem der Elementarteilchenphysik lösen, das der Baryonen-Asymmetrie. Im Universum gibt es im wesentlichen nur Materie und keine Antimaterie. Dies hat zur Folge, daß die Gesamtbaryonenzahl einen recht hohen positiven Wert besitzt, und wenn die Baryonenzahl erhalten
534
17 Über das Standardmodell hinausführende Entwicklungen
bleibt, hat sie diesen Wert schon immer besessen. Das erscheint sehr wenig plausibel, denn es würde eine schon immer vorhandene Bevorzugung von Materie gegenüber Antimaterie bedeuten. Viel plausibler wäre eine anfängliche Gesamtbaryonenzahl null, die durch eine Art Symmetriebrechung zu ihrem heutigen Wert gelangt ist. Der Protonenzerfall und die mit ihm verbundene Nicht-Erhaltung der Baryonenzahl würde ein derartiges Szenario möglich machen.
17.3
Supersymmetrie, Einbindung der Gravitation und Superstringtheorien
Das Standardmodell benutzt keine Zustandsmultipletts, in denen Fermionen und Eichbosonen gemeinsam auftreten, unterscheidet in dieser Hinsicht also strikt zwischen diesen. Zählt man die mit den zugehörigen Feldern verbundenen Freiheitsgrade ab, so stellt man fest, daß diese unsymmetrisch verteilt sind. Fermionen: In der ersten Familie gibt es 4 Freiheitsgrade für das Elektron (je zwei Spinorkomponenten für e L und e R ), 2 für das Neutrino (zwei Spinorkomponenten für ν L ), 4 für jedes der beiden Quarks (je zwei Spinorkomponenten für q L und q R ), das sind 14 für jede Familie und daher 42 für die Gesamtheit der Fermionen. Bosonen: 1 Freiheitsgrad für das Higgs-Boson (eine Feldkomponente η), 2 Freiheitsgrade für das Photon (zwei Polarisationen), je 3 für die massiven Eichbosonen Z, W und W (je drei Polarisationen), und 2 für jedes der 8 Gluonen (je zwei Polarisationen wie das Photon), insgesamt also 28. In (bislang unbestätigten) Supersymmetrie-Theorien wird durch die Einführung zusätzlicher Felder Symmetrie zwischen Fermionen und Bosonen hergestellt. Außerdem wird über die Forderung nach Invarianz gegenüber lokalen Eichtransformationen hinausgehend auch Invarianz gegenüber Transformationen verlangt, bei denen Bosonenfelder direkt mit Spinorfeldern verknüpft sind. Hierdurch werden Prozesse möglich, die zur Umwandlung von Fermionen in Bosonen oder Bosonen in Fermionen führen. Formal kann man diese Umwandlungen durch einen Supersymmetrie-Operator Q mit der Eigenschaft Q 1 B F B (17.18) Q F B F , beschreiben, wobei B einen Boson- und F einen Fermionzustand darstellt. Dieser läßt alle Quantenzahlen bis auf den Spin unverändert und ändert nur den Spin um 1/2. Es ist nicht möglich, die bekannten Teilchen des Standardmodells gemäß (17.18) supersymmetrisch miteinander zu verknüpfen, also Zusammenhänge wie Q νe γ oder Q e W in eine konsistente Erweiterung des Standardmodells zu integrieren. Daher kommt es in Supersymmetrie-Theorien zu einer Flut neuer Elementarteilchen, die den Teilchen des Standardmodells supersymmetrisch zugeordnet werden müssen. (Einige von diesen werden als Kandidaten für die dunkle Materie angesehen, die in der Kosmologie benötigt wird, um die beobachteten Rotationsstrukturen von Galaxien und die angenommene Raum-Zeit-Struktur des ganzen Universums – keine Krümmung, wozu die sichtbare Materie nicht ausreicht – erklären zu können.) Im einfachsten
17.3 Supersymmetrie, Einbindung der Gravitation und Superstringtheorien
535
Fall führt das zu einer Verdopplung der Teilchenzahl gegenüber dem Standardmodell. Die Supersymmetriepartner der bekannten Bosonen werden dabei durch Anhängen der Silbe -ino, die der Fermionen durch Voranstellen des Buchstabens S bezeichnet, wie der folgenden Tabelle anhand einiger Beispiele zu entnehmen ist. Teilchen Bosonen Photon Gluon Graviton Fermionen Elektron Quark
Spin 1 1 2 1/2 1/2
SUSY-Partner Bosinos Photino Gluino Gravitino Sfermionen Selektron Squark
Spin 1/2 1/2 3/2 0 0
Wäre die Supersymmetrie (SUSY) in der Natur als exakte Symmetrie realisiert, so müßte es eine Reihe von Phänomenen geben, die nicht beobachtet werden. Z.B. müßte es ein Super-Wasserstoffatom geben, bei dem ein Selektron an ein Proton gebunden ist. Außerdem müßten die SUSY-Partner leichter Teilchen die gleiche Ruhemasse wie diese besitzen und sollten daher längst gefunden sein. Da das nicht der Fall ist, kann die Supersymmetrie allenfalls als gebrochene Symmetrie realisiert sein. (Eine gebrochene Supersymmetrie würde weitaus höhere Ruhemassen der SUSY-Partner zulassen und daher erklären, warum diese bisher noch nicht entdeckt wurden.) Warum hätte man trotz der angeführten Nachteile (Erhöhung der Teilchenzahl, Symmetriebrechung und mangelnde experimentelle Evidenz) die Supersymmetrie so gerne mit in der Theorie? Außer dem bereits angeführten Argument, daß die Freiheitsgrade von Fermionen und Bosonen einander angeglichen werden, gibt es dafür eine Reihe weiterer Motive. 1. Supersymmetrie könnte das sogenannte Hierarchie-Problem lösen, das darin besteht, zu verstehen, warum zwischen den Ruhemassen der die schwache Wechselwirkung vermittelnden Eichbosonen W und Z 0 einerseits (m 0W c2 80 GeV und m 0Z 0 c2 91 GeV) und den Ruhemassen der in den GUTs auftretenden X-Bosonen (m 0X c2 1015 GeV) andererseits der gewaltige Unterschied von dreizehn Größenordnungen besteht. In Supersymmetrie-Theorien tauchen auf natürliche Weise Differenzterme auf, die den Unterschied erklären können. 2. Wird die Supersymmetrie als lokale Eichsymmetrie eingeführt, so folgen aus ihr die Einsteinschen Feldgleichungen der Gravitation auf ähnliche Weise, wie sich in Abschn. 15.1 die Maxwell-Gleichungen aus der Forderung nach lokaler U (1)-Invarianz ergaben. Ein ungelöstes Problem der Elementarteilchen-Quantenfeldtheorie ist die Einbeziehung des Gravitationsfeldes. Zunächst einmal stellt sich die Frage, ob diese überhaupt nötig ist. Die Antwort auf diese Frage ist ein klares Ja. Im Abschn. „Auswirkung von Quanteneffekten“ der Kosmologie wurde festgestellt, daß Quanteneffekte und ARTEffekte gleichermaßen wichtig werden, wenn die Dichte von Materie die Größenordnung der Planck-Dichte $ P 51096 kg/m3 erreicht, was in der Frühzeit des Universums der Fall war. Eine andere Situation, auf die das zutrifft, entsteht, wenn sich ein Punktteilchen einem anderen soweit nähert, daß der Abstand d von der Größenordnung des Schwarzschild-Radius eines der beiden Teilchen wird, was für d l P 10 35 m der
536
17 Über das Standardmodell hinausführende Entwicklungen
Fall ist. Dadurch, daß die Gravitation sämtliche Elementarteilchen erfaßt, das Gravitationsfeld also an alle Elementarteilchen mit Einschluß der eigenen Feldquanten (Gravitonen) ankoppelt – dies folgt aus der Nichtlinearität der Einsteinschen Feldgleichungen –, können sich Quanteneffekte außerdem im Prinzip auch auf größeren Längenskalen bemerkbar machen. Leider gibt es bislang noch keine vollständige Quantentheorie der Gravitation. Eine erste Annäherung an eine solche erhält man aus den linearisierten Gravitationsfeldgleichungen. Diese sind bezüglich der von einer pseudoeuklidischen Metrik abweichenden Bestandteile der Metrik linearisiert, haben damit eine ähnliche Form wie die in einer pseudoeuklidischen Metrik formulierten Feldgleichungen üblicher Felder (siehe Allgemeine Relativitätstheorie, Abschn. „Linearisierte Feldgleichungen“ sowie Abschn. „Ebene Gravitationswellen“) und lassen sich daher mit den üblichen Methoden der Feldquantisierung behandeln. Gravitonen, die Quanten des symmetrischen Tensorfeldes der Gravitation, haben den Spin 2, und Gravitationswechselwirkungen kommen durch den Austausch von Gravitonen zustande. Werden bei derartigen Wechselwirkungen wie in der QED Korrekturen höherer Ordnung mit einbezogen, so stößt man allerdings auf Divergenzen. Diese können nicht durch Renormierung behoben werden, d. h. der geschilderte Zugang zu einer Quantentheorie der Gravitation, in den im Prinzip auch vernachlässigte Gravitationsterme höherer Ordnung einbezogen werden können, führen zu einer nicht-renormierbaren Theorie. Wie oben dargelegt liefert eine Supersymmetrie-Theorie als lokale Eichtheorie die Einsteinschen Feldgleichungen, weshalb lokale Supersymmetrie auch als Supergravitation bezeichnet wird und die Supersymmetrie-Theorie als Supergravitationstheorie. Das Supergravitationsfeld, das zur Gewährleistung der Invarianz gegenüber lokalen Eichtransformationen eingeführt werden muß, besitzt als Feldquanten außer Gravitonen auch noch Gravitinos (Spin 3/2). Gravitationswechselwirkungen werden demnach nicht nur von Gravitonen, sondern auch von Gravitinos vermittelt. Durch Gravitinos vermittelte Wechselwirkungen entsprechen einer neuen, nicht in der ART enthaltenen Kraft und würden das Aus der Supergravitationstheorie bedeuten, wenn sich ergäbe, daß diese Kraft makroskopisch wirksam ist, denn nichts dergleichen wurde je beobachtet. Im Abschn. 8.1.3 der Quantenfeldtheorie wurde allerdings gezeigt, daß Fermionenfelder makroskopisch nicht in Erscheinung treten, weil das Pauli-Prinzip die dazu erforderliche Konzentration vieler Fermionen in einem engen Raumgebiet verbietet. Gravitinos können sich also nur in Quanteneffekten bemerkbar machen, und diese haben sogar theoretisch sehr erfreuliche Konsequenzen: In vielen Fällen kompensieren Gravitinos exakt die von Gravitonen hervorgerufenen Divergenzen bei der Störungstheorie höherer Ordnung, wenngleich sich auf diese Weise nicht alle Divergenzen vermeiden lassen. Alles in allem ist man mit der Supergravitationstheorie dem Ziel einer renormierbaren Quantentheorie der Gravitation jedoch einen wichtigen Schritt näher gekommen. Eine (renormierbare) Theorie, die zu einer vereinheitlichten Beschreibung aller vier fundamentalen Wechselwirkungen (einschließlich der Gravitation) führen könnte, sehen viele in einer Vereinigung der Supersymmetrie-Theorie mit der sogenannten Stringtheorie. Die letztere entwickelte sich daraus, daß der Physiker G. Veneziano 1968 eine Reihe scheinbar zusammenhangloser Phänomene der starken Wechselwirkung bei Hadronen mit der von dem Mathematiker L. Euler eingeführten Betafunktion beschreiben konnte. Später stellte man fest, daß die gleiche Funktion auch Saiten-
17.3 Supersymmetrie, Einbindung der Gravitation und Superstringtheorien
537
schwingungen beschreiben kann. Die von Veneziano mit der Betafunktion beschriebenen Phänomene konnte man in etwa verstehen, wenn man annahm, daß die konstituierenden Quarks der Hadronen miteinander durch schwingende Saiten verbunden sind. Dies führte dazu, daß einige Physiker (Y. Nambu, H. Nielsen und L. Susskind) versuchten, Elementarteilchen nicht als Punktteilchen, sondern als extrem kurze eindimensionale Linien von der Größenordnung einer Planck-Länge aufzufassen, die wie gespannte Saiten (engl. string = Saite) schwingen. (Wegen der geringen Längenausdehnung sind diese experimentell nicht von Punktteilchen zu unterscheiden.) Voneinander verschiedene Elementarteilchen entsprechen verschiedenen Schwingungsformen und Spannungszuständen dieser Strings, die offen oder geschlossen sein können. Die Saitenbzw. Stringverbindungen der Quarks in Hadronen erwiesen sich dabei als Spin 1 Teilchen wie die Gluonen, und bald (1971) konnte die Stringtheorie so erweitert werden, daß sie auch Fermionen umfaßte. Um Verträglichkeit der Theorie mit der Quantenmechanik zu erreichen, mußten dabei die Dimensionen der Raum-Zeit im Fall der Bosonen auf mindestens 26 und im Fall der Fermionen auf mindestens 10 erweitert werden. (Daß die überzähligen von diesen nicht bemerkbar sind, erklärte man durch die Annahme, sie seien kugelähnlich geschlossen mit Radien von der Größenordnung der Planck-Länge. Man sagt, sie seien kompaktifiziert oder kompakt.) Sehr schnell stieß man jedoch auf Konsequenzen der Theorie, die im Widerspruch zu Beobachtungen standen, so daß man diese beinahe wieder aufgab. Einer der Widersprüche bestand im Auftreten von Tachyonen, also Teilchen, die mit Überlichtgeschwindigkeit laufen, ein anderer im Auftreten (nie beobachteter) masseloser Spin-2-Hadronen. 1974 bemerkten J. Schwarz und J. Scherk, daß die Stringtheorie für mehr als die starke Wechselwirkung gut sein könnte und schlugen vor, die nicht in das Konzept der starken Wechselwirkung einzuordnenden masselosen Spin-2-Hadronen mit dem Graviton zu identifizieren. Der zuletzt genannte Umstand führte 1976 dazu, daß die fermionische StringTheorie in zehn Raum-Zeit-Dimensionen mit der Supersymmetrie-Theorie zu einer Superstringtheorie kombiniert wurde. Ein erster Erfolg dieser Kombination bestand darin, daß die Tachyonen als reelle Teilchen aus der Theorie verschwanden, weil ihnen kein Supersymmetriepartner zugeordnet werden kann. Um außer Fermionen auch Bosonen darstellen zu können, benutzt man geschlossenen Strings. Dabei wurden im Uhrzeigersinn umlaufenden Stringwellen fermionische und gegen den Uhrzeigersinn umlaufenden Wellen bosonische Eigenschaften zugeordnet, weshalb die Theorie als heterotisch (griech. heteros = anders, verschiedenartig) bezeichnet wird. Um auf die für Bosonen benötigten 26 Dimensionen zu kommen, gelang es, den bosonischen Wellen statt der dafür benötigten raum-zeitlichen Zusatzdimensionen 16 innere Freiheitsgrade zuzuordnen. Im Raum dieser 16 inneren Freiheitsgrade können lokale Eichtransformationen durchgeführt werden, mit denen sich Teilchensymmetrien darstellen lassen. An die sechs kompaktifizierten Raum-Zeit-Dimensionen der raum-zeitlich zehndimensionalen heterotischen Superstrings sind strenge Forderungen zu stellen, damit eine widerspruchsfreie Wechselwirkung mit dem Vakuumzustand möglich wird. Nur Räume ganz spezieller Topologie sind möglich, die als Calabi-Yau-Räume bezeichnet werden. Obwohl sie sich der Beobachtung entziehen, haben ihre topologischen Eigenschaften wichtige Auswirkungen auf die Eigenschaften der durch heterotische Strings beschriebenen Teilchen. Eine wichtige davon ist, daß die Topologie des an einen Punkt der vierdimensionalen Raum-Zeit „angehefteten“ Calabi-Yau-Raums die Anzahl der Ele-
538
17 Über das Standardmodell hinausführende Entwicklungen
mentarteilchenfamilien festlegt, und bisher wurde nur eine einzige Topologie gefunden, die zu drei Familien führt. Außer der oben genannten kennt man noch eine zweite heterotische und drei weitere Stringtheorien, die anhand ihrer Superladungen und Symmetriestrukturen als Typ I, Typ IIA, Typ IIB, SO(32) heterotisch und E 8 E 8 heterotisch klassifiziert werden und zwischen denen das Bestehen wichtiger Dualitätsbeziehungen nachgewiesen wurde. Man nimmt an, daß diese und eine elfdimensionale Theorie der Supergravitation unterschiedliche Manifestationen einer fundamentaleren sogenannten M-Theorie (nach Mother of all theories) in bestimmten Regionen von deren Parameterraum darstellen. Außer durch Strings werden Teilchen in dieser allgemeiner durch p-dimensionale Membranen dargestellt, und 11 Raum-Zeit-Dimensionen erweisen sich als optimal. Leider ist die Superstringtheorie noch komplizierter als die Theorie des Standardmodells, von der wir ja nur den klassischen Teil der Feldtheorie ohne Feldquantisierung kennengelernt haben, und mit Feldquantisierung ist schon diese sehr kompliziert. Es gibt daher keine konkreten Fälle, die sich soweit durchrechnen lassen, daß sie die Möglichkeit zu einer Bestätigung oder Widerlegung der Stringtheorie bieten – es fehlt ein experimentum crucis. Am weiteren Ausbau der Theorie wird jedoch intensiv gearbeitet, und es wäre verwunderlich, wenn eine Theorie mit so vielen attraktiven Eigenschaften eines Tages von der Bildfläche verschwinden würde, ohne Spuren zu hinterlassen.
Aufgaben 17.2
Zeigen Sie, daß bei den Neutrinooszillationen die Myon-Neutrinos im gleichen Maße abnehmen, wie die Elektron-Neutrinos zunehmen, und umgekehrt.
17.3
Untersuchen Sie Neutrinooszillationen unter der Annahme, daß die schwachen Isospinzustände der Neutrinos Impulseigenzustände sind.
17.4
Zeigen Sie, daß die Neutrinooszillationen sich ausbreitende Wellen sind, wenn die schwachen Isospin-Eigenzustände νe und ν weder Impuls- noch EnergieEigenzustände sind. Wie groß ist die Ausbreitungsgeschwindigkeit v dieser Wellen? Welche Bedingung muß p2 p1 erfüllen, damit v c gilt?
17.5
Geben Sie die 26 freien Parameter des Standardmodells an. Hinweis: 11 Mischungsparameter, 12 Ruhemassen und 3 Kopplungskonstanten.
Lösungen 17.4
Statt (17.13) gilt allgemein νe ) 2 w0 sin (2θ)
2w(ν
1 cos
ϕ 2 ϕ1 h
1 cos
( p2 p1 ) x
(E 2 E 1 ) t . h
Die Phasengeschwindigkeit ergibt sich aus (ϕ2 ϕ1 )/h const durch Zeitableitung zu v x (E 2 E 1 )( p2 p1 ) . Es gilt v c für E 2 E 1 bzw. für m 202 c2 p22
oder
m 201 c2 p12
p22 p12
p2 p1
( p2 p1 )( p2 p1 ) (m 201 m 202 )c2
m 201 m 202 c2 . p1 p2
Literaturverzeichnis
Bücher zur Quantenfeldtheorie und Elementarteilchentheorie [1] J. D. Bjorken und S. D. Drell, Relativistische Quantenmechanik, B. I. Hochschultaschenbücher, Bd. 98, Bibliogr. Institut Mannheim (1966) [2] J. D. Bjorken und S. D. Drell, Relativistische Quantenfeldtheorie, B. I. Hochschultaschenbücher, Bd. 101, Bibliogr. Institut Mannheim (1967) [3] W. Greiner und J. Reinhardt, Field Quantization, Springer-Verlag, Berlin (1999) [4] W. Greiner und J. Reinhardt, Quantum Chromodynamics, Springer-Verlag, Berlin (2001) [5] W. Greiner und J. Reinhardt, Quantum Electrodynamics, Springer-Verlag, Berlin (2002) [6] D. Griffiths, Introduction to Elementary Particles, John Wiley & Sons, New York (1987) [7] K. Gottfried und V. F. Weisskopf, Concepts of Particle Physics, Band I–II, Oxford University Press, New York (1986) [8] C. Itzykson und J.-B. Zuber, Quantum Field Theory, Mc Graw-Hill, New York (1985) [9] G. Kane, Modern Elementary Particle Physics, Addison-Wesley, Reading Mass. (1993) [10] D. H. Perkins, Introduction to High Energy Physics, Cambridge University Press, Cambridge UK (2000) [11] M. E. Peskin und D. V. Schroeder, An Introduction to Quantum Field Theory, AddisonWesley, Reading Mass. (1995) [12] L. H. Ryder, Quantum Field Theory, Cambridge University Press, Cambridge .. (1996) [13] P. Schmüser, Feynman-Graphen und Eichtheorien für Experimentalphysiker, Springer, Berlin (1995) [14] S. Weinberg, Quantum Theory of Fields, Band I–III, Cambridge University Press, Cambridge UK (1998)
Abkürzungen SRT = Spezielle Relativitätstheorie ART = Allgemeine Relativitätstheorie
Zitate aus anderen Bänden dieses Lehrbuchs Formeln aus der Mechanik, Elektrodyynamik oder Quantenmechanik wird ein M, E oder Q vorangestellt, z. B. Gleichung (Q3.1). Kapitel oder Abschnitte werden analog zitiert, z. B. Abschn. E5.5.
Sachregister
achtfacher Weg, 381 Adiabatizitätshypothese, 273 Anti-Elektronneutrino, 528 Antikommutator, 144 antilinearer Operator, 71 Antineutrino, rechtshändiges, 448 Antiteilchen, 3, 59, 124, 129, 211, 243, 305, 380 antiunitärer Operator, 92 Äquivalenz von Gruppen, 398 asymptotische – Freiheit, 505 äußere Linie, 279 Austausch – -streuung, 301 – -teilchen, 384 Automorphismus, 396 Baker-Campbell-Hausdorff-Formel (BCH-Formel), 405 Baker-Hausdorff-Identität, 96 Baryon, 381–383, 386, 433–437, 504, 519 Baryon-Asymmetrie, 533 Baryonen – -Dekuplett, 381, 424, 431, 436, 437 – -Oktett, 386, 387, 437 – -zahl, 381 Bénard-Problem, 470 Besetzungs – -darstellung, 137 – -zahl, 137 – -operator, 145, 195 Bewegungsgleichung – für Feldoperatoren, 190 Bifurkationsprozeß, 470 Bosonen, 137 – Feldquantisierung, 192–198 Bottom-Quark, 384
Cabibbo-Winkel, 510 Calabi-Yau-Raum, 537 Casimir-Effekt, 210 Charakteristiken, 28 Charm-Quark, 382 chirale Darstellung, Dirac-Gleichung, 447 Compton – -Streuung, 297, 314 – -Wellenlänge, 81 Confinement, Quark-, 506 Coulomb – -Eichung, 219 CPT-Symmetrie, 72–74 Darstellung – von Gruppen, 396 Darwin-Term, 102 Deltafunktion – δ 3 (x), 207 – δ 4 (x), 268 Dimension, kompakte, 537 Dirac – -Gleichung – adjungierte, 55 – für freie Teilchen, 10–14 – für geladene Teilchen im elektromagnetischen Feld, 16–17 – für Neutrinos, 74–76 – kovariante Form, 45 – -Masse, 524 – -Spinor, 12, 48 – adjungierter, 55 – große Komponenten, 37 – kleine Komponenten, 37 direkte Streuung, 301 Divergenzgrad, potentieller, 322, 362 Down-Quark, 382 dunkle Energie, 515 Dyson-Produkt, 256
Sachregister
541
Ebene-Welle-Lösungen, 20–23, 123, 205, 273, 290, 306, 308 Ehrenfest-Theorem, 17–19 Eich – -Boson, 474 – -felder, 451–475 – -invarianz, 184–185, 451–475 – -transformation, 184, 451 elektromagnetische Stromdichte, 174 Elektron, 4, 375, 379, 381, 386, 500 – linkshändiges, 448, 478 – negativer Energie, 57–62, 74, 380 – rechtshändiges, 448, 478 Elektron-Elektron-Streuung, 311–314, 366 – differentieller Wirkungsquerschnitt, 313 Elektronenspin, 37, 42 Elektronneutrino, 383, 477, 484, 527 Elektron-Photon-Streuung, 314–315 elektroschwache – Kraft, 383 – Wechselwirkung, 479–490 elektroschwacher Mischungswinkel, 483 Elementarteilchen-Familien, 477 Energie, dunkle, 515 Energieoperator, 19 Erhaltungssätze, 174–185 Erzeugungsoperator, 139–144, 196 Eulersche Betafunktion, 332
– des Maxwell-Feldes, 218–236 – des Schrödinger-Feldes, 191–202 – für Bosonen, 192–198 – für Fermionen, 199–200 – physikalische Bedeutung, 201–202 Fermionen, 138 – Feldquantisierung, 199–200 Fermi-See, 59 Feynman – -Diagramme, 278–280 – unverbundene Graphen, 321 – verbundene Graphen, 321 – -Propagator, 264 – des Dirac-Feldes, 269–271 – des Klein-Gordon-SchrödingerFeldes, 264 – des Maxwell-Feldes, 271–272 – -Regeln, 317–320, 348 – -Stückelberg-Interpretation, 74, 202 Fixpunktgruppe, 418 Flavor, 382 – -Raum, 434 Fock-Darstellung, 137 Foldy-Wouthuysen-Transformation, 90 Formfaktoren des Elektrons, 356 Fourier – -Transformierte des (Coulomb-) Potentials, 286 Freifeld-Anteil der Lagrange-Dichte, 454
Familien, Elementarteilchen-, 477 Farb – -ladung, 383, 433–434 – -raum, 433 – -triplett, 452 Farbe, 382 Feinstruktur, des Wasserstoffatoms, 101–103 Feldoperator, 151 Feldquantisierung – des Dirac-Feldes, 236–247 – des Klein-Gordon-SchrödingerFeldes , 202–218
Geisterteilchen, 499 Gell-Mann-Matrizen, 415 gemischtes zeitgeordnetes Produkt, 263 Generator einer Gruppe, 403 gerade Matrix, 91 gerader Operator, 31 GIM-Mechanismus, 512 Glashow-Weinberg-Salam-Theorie (GWS-Theorie), 383 Gluino, 535 Gluon, 384, 494, 503–507, 519, 530 Gluonenfeld, 465, 491, 515 Goldstone-Boson, 472 Goldstone-Theorem, 472
542
Gordon-Identität, 354 Grand Unified Theory (GUT), 528 Gravitino, 535 Graviton, 536 Greensche Funktion – der Dirac-Gleichung, 271 – der Klein-Gordon-SchrödingerGleichung, 268 – der Maxwell-Gleichungen, 272 große Vereinheitlichungstheorien (GUTs), 528 Gruppe, 391 – Abelsche, 392 – diskrete , 392 – kommutative, 392 – kontinuierliche, 392 – S O(3), 410–412 – SU (2), 409–410, 424–426, 456–464, 477 – SU (3), 415–417, 433–434, 464–465, 477 – SU (5), 531 – SU (n), 400 – U (1), 401, 452–456, 477 Gruppen – -axiome, 391 – -element, 391 – -generator, 403 – -parameter – wesentlicher, 392 – -produkt, 393 – -verknüpfung, 391 – -wirkung, 396 Gruppengeschwindigkeit, 25 GUT, 528 gyromagnetischer Faktor, 37 gyromagnetisches Verhältnis, 359 Hadron, 386 Hamilton – -Dichte, 162 – des Dirac-Feldes, 173 – des Klein-Gordon-SchrödingerFeldes, 169
Sachregister
– des Maxwell-Feldes, 171 – des Schrödinger-Feldes, 166 Hamiltonsche Bewegungsgleichungen – für Felder, 163 Helizität, 75, 233, 448 Helizitätsoperator, 233 Hierarchie-Problem, 535 Higgs-Mechanismus, 475 Homomorphismus, 396 Hyperfeinstruktur des Wasserstoffatoms, 112 Hyperladung, 211 – U (1)-, 500 Inflaton-Feld, 516 Infrarot – -divergenz, 360 – -katastrophe, 359–361 innere Linie, 280 irreduzible – Gruppe, 399 – Korrekturen, 340 Isomorphismus, 396 Isospin, 424, 427–432 – -Dublett, 452 – -Ladung, 484 – -Raum, 427 – schwacher, 432, 478, 484 – starker, 428 Isospinor, 427, 452 Janus-Operator, 186 Jordan-Wigner-Quantisierung, 199–200 J/-Teilchen, 384 kanonische – Feldquantisierung, 136 – Impulsdichte, 161 Klein-Gordon-Schrödinger-Gleichung – Greensche Funktion, 268 Kobayashi-Maskawa-Matrix, 513 Kontaktwechselwirkungsterm, 102 Kontraktion, 259 Kopplung, minimale, 40 Kopplungsparameter, laufender, 529
Sachregister
Korrekturen – irreduzible, 340 – reduzible, 340 kosmologische Konstante, 516 kovariante Ableitung, 454 Kraft – schwache, 485 – starke, 485 Ladung, 184 – nackte, 79, 505 Ladungs – -erhaltung, 184–185 – -konjugation, 62, 124 – -konvention – beim Isospin, 428 – -operator, 203, 237 – -renormierung, 347–348 – -zahl, 484 Ladungskonjugation, 130 Lagrange-Dichte, 159 – des Dirac-Feldes, 172 – des Klein-Gordon-SchrödingerFeldes, 167 – des Maxwell-Feldes, 170 – des Schrödinger-Feldes, 165 Lagrangesche Bewegungsgleichungen für Felder, 161 Lamb-Shift, 80, 236, 352 Lebensdauer, statistische beim Teilchenzerfall, 316 Lepton, 381 Lepton-Quark-Familien, 388 Lie – -Algebra, 407 – -Gruppe, 403 Linie – äußere, 279 – innere, 280 Löchertheorie, 57–62, 76 lokale – Observable, 216 Lorentz – -Transformation – uneigentliche, 66
543
Lorenz – -Eichung, 218 magnetisches Moment – anomales, 352–359 Majorana-Teilchen, 524–525 Massematrix, 460 Masseoperator, 19 Masserenormierung, 345 Matrix – -gruppe, 400 – gerade, 91 – ungerade, 91 Meson, 381, 438–440, 519 Mesonen – -Nonett, 386 – pseudoskalares, 387 – -Oktett, 386 Mikrokausalität, 216 minimale Kopplung, 40, 453 Mischungswinkel, elektroschwacher, 483 Møller-Streuung, 314 Morphismus, 396 Mott-Streuung, 285 M-Theorie, 538 Multiplikationstafel einer Gruppe, 393 Myon, 381 Myonneutrino, 382, 477 nackte – Ladung, 79, 505 – Ruhemasse, 503 Neutralstrom-Wechselwirkung, 484 Neutrino, 74–76 – Elektron-, 383, 477, 484, 527 – linkshändiges, 448 – Myon-, 382, 477 – Tau-, 385, 477 Neutrinooszillationen, 525–528 Neutron, 375 nicht-renormierbar, 363 Nicht-Renormierbarkeit, 363 Noether-Theorem, 174–185 Nonett, pseudoskalares, 438, 440 normalgeordnetes Produkt, 259
544
Normalordnung, 209 Normalprodukt, verallgemeinertes, 260 Novemberrevolution, 384 Nukleon, 427 Nullpunktsenergie, 209 Observablen – lokale, 216 Operator – der Besetzungszahl, 195 – der Ladung, 203, 237 – der Teilchengeschwindigkeit, 18 – der Teilchenzahl, 194, 228 – des kinetischen Impulses, 19 – gerader, 31 – ungerader, 31 orthogonale Gruppe, 400 Paar – -erzeugung, 60, 61, 80–81, 201 – -vernichtung, 61 Paritätsoperator, 67 Parton, 504 Pauli – -Gleichung, 37 – -Jordan-Wigner-Funktion, 214 – -Matrizen, 420 – -Villars-Regularisierung, 330 Pentaquark, 385 φ 4 -Feld, 251 Photino, 535 Photon – longitudinales, 222 – skalares, 222 – Spin, 231–234 – virtuelles, 230 – zeitartiges, 222 Poisson-Klammern, 163 Polarisation – des Vakuums, 352, 505 Polarisationstensor, 327 Positron, 57–74, 380 primitiv divergent, 323 Proca-Gleichungen, 234, 443 Propagator, 264 Proton, 375
Sachregister
Pseudovektor, 68 QED, 250, 276 Quanten – -chromodynamik (QCD), 384 – -elektrodynamik (QED), 250, 276, 383 – -flavordynamik (QFD), 383 Quantisierung – des Dirac-Feldes, 236–247 – des Klein-Gordon-SchrödingerFeldes, 202–218 – des Maxwell-Feldes, 218–236 – des Schrödinger-Feldes, 191–202 – zweite, 135, 191, 201 Quark, 376, 382 – -mischung, 507–513 – Bottom-, 384 – Charm-, 382 – Down-, 382 – Strange-, 382 – Top-, 384 – Up-, 382 Quarkeinschluß, 506 Raumspiegelung am Koordinatenursprung, 66, 130 reduzible – Gruppe, 399 – Korrekturen, 340 Regularisierung, 329 – dimensionsmäßige, 329–338 renormierbar, 362 Renormierbarkeit, 362, 363 renormierte – Ladung, 348 – Ruhemasse, 345 renormierter Fermionenpropagator, 345 Renormierung, 59, 209, 330 – der Energie, 61 Ruhemasse, nackte, 503 Ruhemasse-Eigenzustand, 508 schief – -hermitesch, 405
Sachregister
– -symmetrisch, 406 schwache – Kraft, 485 – Wechselwirkung, 485 – Eigenzustände der, 511 schwacher Isospin, 484 Schwinger-Funktion, 214 Selektron, 535 seltsame Teilchen, 381 spezielle – orthogonale Gruppe, 400 – unitäre Gruppe, 400 Spin – Elektronen-, 37, 42 – relativistischer Operator für den, 42 Spin-Bahn – -Wechselwirkung, 102 Spinoperator, 232 Spinoperator des Photonenfeldes, 231 Spinor, 12, 48 – Dirac-, 12, 48 Spin-Spin-Wechselwirkung, 112 Spin-Statistik-Theorem, 201, 218, 243 Spiralität, 75 spontane – Symmetriebrechung, 470 Sprungfunktion Θ, 309 Squark, 535 Standardmodell der Elementarteilchen, 377, 477–521 starke – Kraft, 485 – Wechselwirkung, 465, 504, 505 statistische Lebensdauer beim Teilchenzerfall, 316 Strahlungs – -eichung, 219 – -korrekturen, 322–348 Strange-Quark, 382 Strangeness, 381 streng neutral, 214 Streumatrix, 255 Stringtheorie, 136, 536 Stromdichte – elektromagnetische, 174 Struktur einer Menge, 391
545
Strukturkonstanten, 407 Super – -gravitation, 536 – -gravitationsfeld, 536 – -gravitationstheorie, 536 – -Kamiokande-Detektor, 533 – -stringtheorie, 388, 537 – -symmetrie (SUSY), 534 – lokale, 536 – -symmetrie-Operator, 534 superrenormierbar, 362 Superrenormierbarkeit, 363 Symmetrie – -gruppe, 418 – gebrochene, 423 Symmetriebrechung, 387 Tauneutrino, 385, 477 Teilchen – -stromdichte, 125, 126, 174 – -zahloperator, 145, 194, 228 – -zerfall, 316 – virtuelles, 280 Theorem von Furry, 324 Top-Quark, 384 Transformationsgesetz – für adjungierte Spinoren, 55 – für Spinoren, 46, 48 Übergangs – -rate, 287 Übergangs– amplitude, 255 Uehling-Potential, 349–352 Ultraviolett – -Divergenzen, 329 ungerade Matrix, 91 ungerader Operator, 31 unitäre – Darstellung, 399 – Gruppe, 400 Unschärferelation, 80–81 Untergruppe, 392 unverbundene – Graphen, 321 – Teilgraphen, 324
546
Up-Quark, 382 Vakuum – -blase, 299 – -energie, 210 – -fluktuationen, 234–236 – -polarisation, 299 – -zustand, 139, 197 Variationsableitung, 162 Vektornonett, 438, 440 verallgemeinertes Normalprodukt, 260 verbundene Graphen, 321 Vereinheitlichungstheorien, große (GUTs), 528 Vernichtungsoperator, 139–144, 196 Vertauschungsrelationen – für Feldoperatoren, 191 – gleichzeitige, 214, 220 Vertex, 279 virtuelles – Photon, 230, 303 – Teilchen, 280 Vorzeichenfunktion, 215 Vorzeichenoperator, 30 Ward-Identität, 329, 362
Sachregister
Wechselwirkung – elektroschwache, 479–490 – schwache, 383, 432, 485 – starke, 465, 504, 505 Wechselwirkungsbild, 252–255 Weinberg-Winkel, 483 Wellenpaket, 24–26 Wick-Rotation, 331 Wicksches Theorem, 258–264 Wirkungs – -menge, 391 X-Boson, 532 Yang-Mills-Feld, 457 zeitgeordnetes Produkt, 256 Zeitordnungsoperator, 256 Zeitumkehr, 68, 71, 72, 130 – -transformation, 68 Zerfalls – -breite, 316, 518 Z-Teilchen, 384 Zitterbewegung, 86–89, 122 – des Elektrons, 102 Zustandsraum der Feldoperatoren, 191 zweite – Quantisierung, 135, 191, 201
SI-Basiseinheiten Basisgröße Name
Basiseinheit Definition Zeichen
Länge
Meter
m
Masse
Kilogramm kg
Zeit
Sekunde
s
elektrische Stromstärke
Ampere
A
Tempera- Kelvin tur
K
Stoffmenge
Mol
mol
Lichtstärke
Candela
cd
Das Meter ist die Länge der Strecke, die Licht im Vakuum während der Dauer von (1/299792458) Sekunden durchläuft. Das Kilogramm ist die Einheit der Masse; es ist gleich der Masse des Internationalen Kilogrammprototyps. Die Sekunde ist das 9192631770-fache der Periodendauer der dem Übergang zwischen den beiden Hyperfeinstrukturniveaus des Grundzustandes von Atomen des Nuklids 133 Cs entsprechenden Strahlung. Das Ampere ist die Stärke eines konstanten elektrischen Stromes, der, durch zwei parallele, geradlinige, unendlich lange und im Vakuum im Abstand von einem Meter voneinander angeordnete Leiter von vernachlässigbar kleinem, kreisförmigem Querschnitt fließend, zwischen diesen Leitern je einem Meter Leiterlänge die Kraft 2 10 7 Newton hervorrufen würde. Das Kelvin, die Einheit der thermodynamischen Temperatur, ist der 273,16te Teil der thermodynamischen Temperatur des Tripelpunktes des Wassers. Das Mol ist die Stoffmenge eines Systems, das aus ebensoviel Einzelteilchen besteht, wie Atome in 0,012 Kilogramm des Kohlenstoffnuklids 12 C enthalten sind. Bei Benutzung des Mol müssen die Einzelteilchen spezifiziert sein und können Atome, Moleküle, Ionen, Elektronen sowie andere Teilchen oder Gruppen solcher Teilchen genau angegebener Zusammensetzung sein. Die Candela ist die Lichtstärke in einer bestimmten Richtung einer Strahlungsquelle, die monochromatische Strahlung der Frequenz 540 1012 Hertz aussendet und deren Strahlstärke in dieser Richtung (1/683) Watt durch Steradiant beträgt.
SI-Vorsätze Potenz
Name
Zeichen
1024 1021 1018 1015 1012 109 106 103 102 101
Yotta Zetta Exa Peta Tera Giga Mega Kilo Hekto Deka
Y Z E P T G M k h da
Potenz 10 10 10 10 10 10 10 10 10 10
1 2 3 6 9 12 15 18 21 24
Name
Zeichen
Dezi Zenti Milli Mikro Nano Piko Femto Atto Zepto Yocto
d c m μ n p f a z y
Naturkonstanten Konstante
Symbol/Definition Wert
Einheit
Bohrscher Radius Bohrsches Magneton Boltzmann-Konstante Cabibbo-Winkel Compton-Wellenlänge des Elektrons Dielektrizitätskonstante des Vakuums Elektronenradius, klassischer Elementarladung Elektronenruhemasse Inverse Feinstrukturkonstante g-Faktor des freien Elektrons g-Faktor des Protons Gravitationskonstante gyromagnetisches Verhältnis des Elektrons Kernmagneton Lichtgeschwindigkeit magnetisches Moment des Elektrons magnetisches Moment des Protons Neutronenruhemasse Permeabilität des Vakuums Plancksches Wirkungsquantum Plancksches Wirkungsquantum/(2π) Protonenruhemasse Weinberg-Winkel
a0 μB kB θC λC h/(m e c) ε0 1/μ0 c2 re e me 1/α 4πε0 h c/e2 ge gp G
5, 291772083(19) 10 11 9, 27400899(37) 10 24 1, 3806503(24) 10 23 13 2, 426310215(18) 1012 8, 854187817 . . . 1012 2, 817940285(31) 1015 1, 602176462(63) 1019 9, 10938188(72) 1031 137, 03599976(50) 2, 0023193043737(82) 5, 585694675(57) 6, 673(10) 1011
m JT JK
γe 2μe /h μN eh /2m p c μe μp mn Vs μ0 4π 107 Am h h mp θW
1, 760859794(71) 1011 5, 05078317(20) 1027 299792458 9, 28476362(37) 1024 1, 410606633(58) 1026 1, 67492716(13) 1027 12, 566370614 . . . 107 6, 62606876(52) 1034 1, 054571596(82) 1034 1, 67262158(13) 1027 28, 7
s1 T1 J T 1 m s1 J T 1 J T 1 kg N A 2 Js Js kg
Pauli-Matrizen
σx
0 1 , 1 0
σy
i ,
0 i
σz
0
1 0
0
1
Dirac-Matrizen in Standarddarstellung γ0
1 0
0 1
,
γl
0 σl
σl 0
,
γ5
i γ 0 γ 1 γ 2γ 3
0 1 1 0
Æ
1 1
m F m 1 m C kg
m3 kg1 s2
Æ
Abgeleitete Einheiten Größe
Einheitenname
Länge ebener Winkel
Ångström Radiant Grad Minute Sekunde Gramm Tonne atomare Masseneinheit Hertz Newton Dyn Pond Joule Elektronvolt Erg Watt Volt Coulomb
Masse
Frequenz Kraft
Energie, Arbeit
Zeichen Beziehungen und Bemerkungen Å rad Æ
g t u Hz N dyn p J eV erg W V C V/m Wb T H A/m
Leistung elektr. Spannung elektr. Ladung elektr. Feldstärke magn. Fluß Weber magn. Flußdichte Tesla Induktivität Henry magn. Feldstärke
1 Å 10 10 m 1 rad 1 m/m 1Æ (π/180) rad 1 1Æ /60 1 1 /60 1Æ /3600 1 g 103 kg 1 t 103 kg 1 u m 0 (12 C)/12 1, 66053873(13) 1027 kg 1 Hz s1 1 N 1 kg m s2 1 dyn 105 N 1 p 9, 80665 103 N 1 J 1 N m 1 W s 1 kg m2 s2 1 eV 1, 6021892 1019 J 1 erg 107 J 1 W 1 J s1 1 N m s1 1 kg m2 s3 1 V 1 W A1 1 kg m2 A1 s3 1C 1As 1 V m1 1 kg m A1 s3 1 Wb 1 V s 1 T m2 1 A H 1 kg m2 A1 s2 1 T 1 Wb m2 1 V s m2 1 kg A1 s2 1 H 1 Wb A1 1 V s A1 1 kg m2 A2 s2
„Periodensystem“ der Elementarteilchen Fermionen Austauschteilchen (Bosonen)
Leptonen e , , e, ,
Ladungszahl Q 0
1
schwache WW: W , Z0 z.T. el. magn. WW: Photon
Quarks Ladungszahl Q u , c , t rot, grün, blau 2/3
d , s , brot, grün, blau 1/3 starke WW: 8 Gluonen schwache WW: W , Z0 el. magn. WW: Photon