Theoretische Physik: Relativistische Quantenmechanik, Quantenfeldtheorie und Elementarteilchentheorie
Eckhard Rebhan
Theoretische Physik: Relativistische Quantenmechanik, Quantenfeldtheorie und Elementarteilchentheorie
Autor Prof. Dr. Eckhard Rebhan Institut für Theoretische Physik Universität Düsseldorf e-mail:
[email protected]
Wichtiger Hinweis für den Benutzer Der Verlag und der Autor haben alle Sorgfalt walten lassen, um vollständige und akkurate Informationen in diesem Buch zu publizieren. Der Verlag übernimmt weder Garantie noch die juristische Verantwortung oder irgendeine Haftung für die Nutzung dieser Informationen, für deren Wirtschaftlichkeit oder fehlerfreie Funktion für einen bestimmten Zweck. Der Verlag übernimmt keine Gewähr dafür, dass die beschriebenen Verfahren, Programme usw. frei von Schutzrechten Dritter sind. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Buch berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Der Verlag hat sich bemüht, sämtliche Rechteinhaber von Abbildungen zu ermitteln. Sollte dem Verlag gegenüber dennoch der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar gezahlt. Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer ist ein Unternehmen der Springer Science+BusinessMedia Springer.de © Springer-Verlag Berlin Heidelberg 2010 Spektrum Akademischer Verlag ist ein Imprint von Springer 10 11 12 13 14
5 4 3 2 1
Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Planung und Lektorat: Dr. Andreas Rüdinger, Bianca Alton Satz: Autorensatz Umschlaggestaltung: SpieszDesign, Neu-Ulm ISBN 978-3-8274-2602-4
Vorwort Nach der Mechanik, der Elektrodynamik und der Quantenmechanik werden hiermit drei weitere Teilgebiete meines zweibändigen Lehrbuchs Theoretische Physik in einem dünneren Einzelband vorgelegt, die Relativistische Quantenmechanik, die Quantenfeldtheorie und die Einführung in die Elementarteilchentheorie. Nachdem mittlerweile beide Bände des ursprünglichen Lehrbuchs vergriffen sind, sollen die noch nicht in dünneren Einzelbänden erschienen Teilgebiete möglichst bald wieder verfügbar gemacht werden. Aus diesem Grund und auch, weil sich in der relativ kurzen Zeit seit dem ersten Erscheinen keine Notwendigkeit für eine Überarbeitung ergeben hat, wurden die im vorliegenden Band aufgenommenen Teilgebiete weitgehend unverändert aus Band II des zweibändigen Lehrbuchs übernommen; im Wesentlichen wurden nur die Nummerierungen, das Inhaltsverzeichnis und das Sachregister angepasst. Das meiste, was in den Vorworten zu dem ursprünglichen Lehrbuch und den bereits erschienenen Einzelbänden steht, gilt auch für diesen Band und wird hier nicht wiederholt. Wie dort wird als Maßsystem durchgängig das SI-System benutzt. Im Teil Quantenfeldtheorie weicht das von der üblichen Vorgehensweise ab; im allgemeinen werden in dieser sogenannte natürliche Einheiten bevorzugt, in denen h c1 gesetzt ist und bezüglich der Dimensionen [Länge]=[Zeit]=1/[Energie] =1/[Masse] gilt. Der Leser wird feststellen, dass die Formeln in SI-Einheiten kaum unübersichtlicher werden, hat jedoch den Vorteil, dass die Kontrolle von Rechenergebnissen durch Überprüfen der Dimensionen erheblich wirkungsvoller wird. Zum Gebrauch des Buches sei Folgendes bemerkt: In Formelzeilen mit mehreren Formeln, aber nur einer Formelnummer werden die Formeln gedanklich von links nach rechts oder von oben nach unten mit a, b, c usw. durchnummeriert und später in diesem Sinne zitiert. Rückverweise auf Formeln erfolgen entweder im Text oder innerhalb einer Formel über einem Verbindungszeichen wie = oder > an der Stelle, wo sie benötigt werden. Manchmal ergibt es sich aus sprachlichen Gründen, dass Teile der Erklärungen zu einer Formel erst in den auf diese folgenden Sätzen gegeben werden können. Diesem mitunter zu unnötigen Verständnisschwierigkeiten führenden Umstand wird in diesem Lehrbuch durch Vorverweise vorzubeugen versucht: Wo zu einer Formel s.u. nach ihrer Ableitung noch erklärende Kommentare kommen, wird das z. B. durch gekennzeichnet, wobei „s. u.“ als Abkürzung für „siehe unten“ steht. Rückverweise auf Formeln oder Kapitel bzw. Abschnitte anderer Einzelbände werden durch Voranstellen eines Buchstabens gekennzeichnet, z. B. Kapitel Q3.1 oder Gleichung (E5.21), wobei M für die Mechanik, E für die Elektrodynamik und Q für die Quantenmechanik steht. Ich hoffe, dass dieses Buch das Studium der in ihm dargebotenen, als schwierig geltenden Teilgebiete der theoretischen Physik etwas erleichtert und zu deren Verständnis beiträgt. Einen wichtigen Zweck würde es erfüllen, wenn sein Durcharbeiten oder das Arbeiten mit ihm nicht nur Mühe bereiten, sondern auch ein Stück Erkenntnisfreude bescheren würde. Düsseldorf, im Oktober 2009
Eckhard Rebhan
Kurzinhaltsverzeichnis
I
Relativistische Quantenmechanik
1
1
Einleitung zur Relativistischen Quantenmechanik
3
2
Dirac-Theorie des Elektrons und des Neutrinos
4
3
Anwendungen der Dirac-Theorie
4
Klein-Gordon-Theorie
116
II
Quantenfeldtheorie
133
5
Einleitung zur Quantenfeldtheorie
135
6
Fock-Darstellung von Viel-Teilchen-Zuständen
137
7
Klassische relativistische Feldtheorie
156
8
Kanonische Feldquantisierung
189
9
Wechselwirkende Felder
250
10
Quantenelektrodynamik
276
III
Einführung in die Elementarteilchentheorie
373
11
Einleitung zur Elementarteilchentheorie
375
12
Elemente der Gruppentheorie
391
13
Gruppierung von Teilchenzuständen
423
14
Teilchen, Felder und Lagrange-Funktion
441
15
Eichinvarianz und Eichfelder
451
16
Standardmodell
477
17
Über das Standardmodell hinausführende Entwicklungen
523
Literaturverzeichnis
86
539
Inhaltsverzeichnis
I
Relativistische Quantenmechanik
1
1
Einleitung zur Relativistischen Quantenmechanik
3
2 2.1 2.2
Dirac-Theorie des Elektrons und des Neutrinos Ergebnisse der klassischen relativistischen Mechanik . . . . . . . Aufstellung der Dirac-Gleichung . . . . . . . . . . . . . . . . . . 2.2.1 Dirac-Gleichung im kräftefreien Fall . . . . . . . . . . . 2.2.2 Bestimmung der Dirac-Matrizen αl und β . . . . . . . . 2.2.3 Dirac-Gleichung mit elektromagnetischem Feld . . . . . 2.3 Operatoren, Mittelwerte und Ehrenfestsches Theorem . . . . . . . 2.4 Ebene-Welle-Lösungen für freie Teilchen . . . . . . . . . . . . . 2.5 Wellenpakete und Gruppengeschwindigkeit . . . . . . . . . . . . 2.6 Frontgeschwindigkeit von Wellenpaketen . . . . . . . . . . . . . 2.7 Mischung positiver und negativer Energien . . . . . . . . . . . . . 2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung . . . . . . . . 2.8.1 Zeitunabhängige Felder A und Φ . . . . . . . . . . . . . 2.8.2 Zeitabhängige Felder A und Φ . . . . . . . . . . . . . . Exkurs 2.1: Ableitungs-Linearisierung der Schrödinger-Gleichung 2.9 Spinoperator . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.10 Kovarianz der Dirac-Gleichung . . . . . . . . . . . . . . . . . . . Exkurs 2.2:Allgemeines Transformationsgesetz für Dirac-Spinoren 2.11 Eigenschaften der Dirac-Matrizen γ α . . . . . . . . . . . . . . . 2.12 Kovariante Kontinuitätsgleichung . . . . . . . . . . . . . . . . . . 2.13 Diracs Löchertheorie und Theorie des Positrons . . . . . . . . . . 2.13.1 Lösungen negativer Energie und Löchertheorie . . . . . . 2.13.2 Positronlösungen durch Ladungskonjugation . . . . . . . 2.13.3 P-Invarianz, T-Invarianz und CPT-Symmetrie . . . . . . . 2.14 Dirac-Gleichung für Neutrinos . . . . . . . . . . . . . . . . . . . 2.15 Viel-Teilchen-Phänomene in der Dirac-Theorie . . . . . . . . . . 2.15.1 Kleinsches Paradoxon . . . . . . . . . . . . . . . . . . . 2.15.2 Polarisation des Vakuums . . . . . . . . . . . . . . . . . 2.15.3 Orts-Impuls-Unschärferelation und Paarerzeugung . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3.1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 4 7 10 14 16 17 20 24 26 29 33 34 39 40 42 45 49 53 55 57 57 62 66 74 76 76 79 80 81
Anwendungen der Dirac-Theorie Zitterbewegung des Elektrons . . . . . . . . . . . . . . . . . . . . . . .
86 86
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
viii
Inhaltsverzeichnis
3.2
Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen 3.2.1 Freie Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Teilchen mit elektromagnetischer Wechselwirkung . . . . . . . 3.3 Zur Feinstruktur des Wasserstoffatoms . . . . . . . . . . . . . . . . . . 3.4 Relativistisches Wasserstoffatom bei ruhendem Kern . . . . . . . . . . 3.4.1 Einführen von Polarkoordinaten und Variablenseparation . . . 3.4.2 Lösung für die winkelabhängigen Funktionen . . . . . . . . . 3.4.3 Lösung der Radialgleichungen, Energieeigenwerte und Eigenzustände . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.4 Diskussion der Energieniveaus . . . . . . . . . . . . . . . . . 3.5 Zur Hyperfeinstruktur des Wasserstoffatoms . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89 90 96 101 103 104 107
4 4.1 4.2 4.3 4.4 4.5 4.6 4.7
116 116 119 120 122 123 124 125 125 126 129 130
Klein-Gordon-Theorie Klein-Gordon-Schrödinger-Gleichung . . . . . . . . . . . . . . . Nicht-relativistischer Grenzfall . . . . . . . . . . . . . . . . . . . Schrödinger-Form der Klein-Gordon-Schrödinger-Gleichung . . . Geschwindigkeitsoperator . . . . . . . . . . . . . . . . . . . . . . Ebene-Welle-Lösungen für freie Teilchen . . . . . . . . . . . . . Ladungskonjugation . . . . . . . . . . . . . . . . . . . . . . . . . Reinterpretation der Klein-Gordon-Theorie . . . . . . . . . . . . 4.7.1 Kontinuitätsgleichung, Teilchendichte und Teilchenstrom 4.7.2 Physikalische Interpretation . . . . . . . . . . . . . . . . 4.8 Ladungskonjugation und CPT-Symmetrie . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
108 110 112 113
II
Quantenfeldtheorie
133
5
Einleitung zur Quantenfeldtheorie
135
6 6.1 6.2 6.3 6.4 6.5 6.6
Fock-Darstellung von Viel-Teilchen-Zuständen Darstellung von N-Teilchen-Zuständen . . . . . . . . . . . . . . . . . Erzeugungs- und Vernichtungsoperatoren für Bosonen . . . . . . . . . Erzeugungs- und Vernichtungsoperatoren für Fermionen . . . . . . . . Besetzungszahl- und Teilchenzahloperatoren . . . . . . . . . . . . . . . Darstellung physikalischer Observablen durch Erzeuger und Vernichter Feldoperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.6.1 Unitäre Transformation zu Feldoperatoren . . . . . . . . . . . 6.6.2 Darstellung physikalischer Observablen durch Feldoperatoren . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
137 137 139 142 145 146 150 150 151 153
7 7.1 7.2 7.3
156 157 159 161
Klassische relativistische Feldtheorie Mechanisches Beispiel einer Feldtheorie . . . . . . . . . . . . . . . . . Hamiltonsches Prinzip für Feldtheorien . . . . . . . . . . . . . . . . . Hamiltonsche Bewegungsgleichungen für Feldtheorien . . . . . . . . .
Inhaltsverzeichnis
7.4
Anwendung auf spezielle Felder . . . . . . . . . . . . . . . 7.4.1 Schrödinger-Feld . . . . . . . . . . . . . . . . . . . 7.4.2 Klein-Gordon-Schrödinger-Feld . . . . . . . . . . . 7.4.3 Maxwell-Feld . . . . . . . . . . . . . . . . . . . . 7.4.4 Dirac-Feld . . . . . . . . . . . . . . . . . . . . . . 7.5 Noether-Theorem und Erhaltungssätze . . . . . . . . . . . . 7.5.1 Ableitung des allgemeinen Noether-Theorems . . . 7.5.2 Translationsinvarianz und Energie-Impuls-Erhaltung 7.5.3 Rotationsinvarianz und Drehimpulserhaltung . . . . 7.5.4 Eichinvarianz und Ladungserhaltung . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ix
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
8 8.1
164 164 167 170 172 174 174 177 180 184 185
Kanonische Feldquantisierung Quantisierung des Schrödinger-Feldes . . . . . . . . . . . . . . . . . . 8.1.1 Quantisierung für Bosonen . . . . . . . . . . . . . . . . . . . 8.1.2 Jordan-Wigner-Quantisierung für Fermionen . . . . . . . . . . 8.1.3 Zur physikalischen Bedeutung der Feldquantisierung . . . . . . 8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes . . . . . . . . . . 8.2.1 Bosonische Feldquantisierung . . . . . . . . . . . . . . . . . . 8.2.2 Lorentz-invariante Vertauschungsrelationen . . . . . . . . . . . 8.2.3 Mikrokausalität . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Quantisierung des Maxwellschen Vakuumfeldes . . . . . . . . . . . . . 8.3.1 Zahl der Freiheitsgrade des freien Feldes . . . . . . . . . . . . 8.3.2 Vertauschungsrelationen und Bewegungsgleichung . . . . . . . 8.3.3 Entwicklung nach Erzeugungs- und Vernichtungsoperatoren . . 8.3.4 Energie und Impuls der Photonen . . . . . . . . . . . . . . . . 8.3.5 Teilchenzahloperatoren und Metrik des Photonen-Hilbert-Raums 8.3.6 Berücksichtigung der Lorenz-Eichung . . . . . . . . . . . . . 8.3.7 Photonenspin . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.8 Vakuumfluktuationen . . . . . . . . . . . . . . . . . . . . . . 8.4 Quantisierung des freien Dirac-Feldes . . . . . . . . . . . . . . . . . . 8.4.1 Bewegungsgleichung für den Feldoperator ψ(x, t) . . . . . . . 8.4.2 Entwicklung nach ebenen Wellen . . . . . . . . . . . . . . . . 8.4.3 Eigenschaften der Spinoren u(l, p) und v(l, p) . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
189 191 192 199 201 202 203 214 216 218 218 219 222 226 227 229 231 234 236 237 238 245 247
9
250 252 255 258 264 264 265 269 271 273
9.1 9.2 9.3
9.4
Wechselwirkende Felder Exkurs 9.1: Erinnerung an das Wechselwirkungsbild . . . . . . . . Zeitgeordnete Produkte . . . . . . . . . . . . . . . . . . . . . . . . Wicksches Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . Propagatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3.1 Feynman-Propagator des Klein-Gordon-Schrödinger-Feldes Exkurs 9.2: Hilfsmittel aus der Funktionentheorie . . . . . . . . . . 9.3.2 Feynman-Propagator des Dirac-Feldes . . . . . . . . . . . 9.3.3 Feynman-Propagator des Maxwell-Feldes . . . . . . . . . Anwendung der Störungstheorie auf Streuprozesse . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
x
Inhaltsverzeichnis
Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
274
10 10.1 10.2
276 278 280 280 285 292 299 305 315 317 317 320 322 322 324 325 326 329 330 339 339 344 349 349 352 361 364 368
Quantenelektrodynamik Alphabet der Feynman-Diagramme . . . . . . . . . . . . . . . Streuprozesse erster Ordnung . . . . . . . . . . . . . . . . . . 10.2.1 Streuprozesse freier Teilchen . . . . . . . . . . . . . 10.2.2 Elektronenstreuung an festem Kern . . . . . . . . . . 10.3 Streuprozesse zweiter Ordnung . . . . . . . . . . . . . . . . . 10.3.1 Übergangsamplituden . . . . . . . . . . . . . . . . . 10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen . . . . . . . . 10.5 Teilchenzerfälle . . . . . . . . . . . . . . . . . . . . . . . . . 10.6 Feynman-Regeln . . . . . . . . . . . . . . . . . . . . . . . . 10.6.1 Feynman-Regeln der QED im Impulsraum . . . . . . 10.7 Korrekturen vierter Ordnung . . . . . . . . . . . . . . . . . . 10.8 Strahlungskorrekturen . . . . . . . . . . . . . . . . . . . . . . 10.8.1 Primitiv divergente Feynman-Graphen . . . . . . . . 10.8.2 Vakuumgraphen und Fermionenringe . . . . . . . . . 10.8.3 Photon-Photon-Streuung . . . . . . . . . . . . . . . . 10.8.4 Selbstenergien, Vertexkorrektur und Ward-Identität . . 10.9 Dimensionsmäßige Regularisierung . . . . . . . . . . . . . . Exkurs 10.1: Mathematische Hilfsmittel zur Regularisierung . 10.10 Renormierung . . . . . . . . . . . . . . . . . . . . . . . . . . 10.10.1 Vorbereitung . . . . . . . . . . . . . . . . . . . . . . 10.10.2 Renormierung in niedrigster Ordnung . . . . . . . . . 10.11 Auswirkungen regulärer Strahlungskorrekturen . . . . . . . . 10.11.1 Uehling-Potential . . . . . . . . . . . . . . . . . . . 10.11.2 Anomales magnetisches Moment des Elektrons . . . . 10.12 Strahlungskorrekturen höherer Ordnung und Renormierbarkeit 10.13 Quantentheorie versus Quantenfeldtheorie . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
III
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
Einführung in die Elementarteilchentheorie
373
11 Einleitung zur Elementarteilchentheorie 11.1 Historischer Rückblick auf die Entdeckung der Elementarteilchen . . . 11.2 Erster Überblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
375 378 385 390
12 12.1 12.2 12.3 12.4 12.5 12.6
391 391 396 400 403 405 407
Elemente der Gruppentheorie Definitionen . . . . . . . . . . . . . . . . . . . . . . Morphismen, Wirkung und Darstellung von Gruppen Matrixgruppen . . . . . . . . . . . . . . . . . . . . . Lie-Gruppen und Generatoren . . . . . . . . . . . . Lineare Lie-Gruppen . . . . . . . . . . . . . . . . . Lie-Algebra der Generatoren . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
Inhaltsverzeichnis
xi
Erzeuger der Gruppe SU (2) . . . . . . . . . . . . . Gruppe S O(3) . . . . . . . . . . . . . . . . . . . . . Lokale Äquivalenz der Gruppen SU (2) und S O(3) . Gruppe SU (3) . . . . . . . . . . . . . . . . . . . . . Höherdimensionale Darstellungen der Gruppe SU (2) Gruppen und Symmetrien . . . . . . . . . . . . . . . Anhang: Ergebnisse aus der Matrizentheorie . . . . . 12.13.1 Invarianten äquivalenter Matrizen . . . . . . 12.13.2 Determinante der Matrix e J . . . . . . . . . 12.13.3 Determinante unitärer Matrizen . . . . . . . 12.13.4 Eigenschaften der Pauli-Matrizen . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
409 410 413 415 416 418 418 418 419 420 420 421
13 Gruppierung von Teilchenzuständen 13.1 Spin 1/2 und Gruppe SU (2) . . . . . 13.2 Isospin . . . . . . . . . . . . . . . . . 13.3 Farbladung und Gruppe SU (3) . . . . 13.4 Baryonen aus u, d und s . . . . . . . . 13.5 Mesonen aus u, d und s . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
423 424 427 433 434 438 440
14 Teilchen, Felder und Lagrange-Funktion 14.1 Lagrange-Funktion und Hamiltonsches Variationsprinzip für Felder 14.2 Klein-Gordon-Schrödinger-Gleichung . . . . . . . . . . . . . . . . 14.3 Maxwell- und Proca-Gleichungen . . . . . . . . . . . . . . . . . . 14.4 Lorentz-Invarianz und Dirac-Gleichung . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
441 441 442 443 444 450
12.7 12.8 12.9 12.10 12.11 12.12 12.13
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
15 15.1 15.2
Eichinvarianz und Eichfelder U (1)-Invarianz von Klein-Gordon-Schrödinger- und Dirac-Feld . . . . SU (2)-Invarianz und Yang-Mills-Feld . . . . . . . . . . . . . . . . . . 15.2.1 Feldgleichungen für das Yang-Mills-Feld . . . . . . . . . . . . 15.3 SU (3)-Invarianz und Gluonenfeld . . . . . . . . . . . . . . . . . . . . Exkurs 15.1: Geometrische Interpretation der kovarianten Ableitung . . . . . . . . . . . . . . . . . . . . 15.4 Gebrochene Eichsymmetrie und Ruhemassen . . . . . . . . . . . . . . 15.4.1 Brechung einer globalen U (1)-Symmetrie . . . . . . . . . . . 15.4.2 Brechung einer lokalen U (1)-Symmetrie und Higgs-Mechanismus Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
451 452 456 462 464
16 16.1 16.2
477 477 479 479 486 487
Standardmodell Voraussetzungen des Standardmodells . . . . . . . . . . . . . . Weinberg-Salam-Theorie der elektroschwachen Wechselwirkung 16.2.1 Leptonenanteil L . . . . . . . . . . . . . . . . . . . . Exkurs 16.1: Fall unterschiedlicher U º1»-Kopplungsfelder . . . 16.2.2 Lagrange-Dichte B für freie Bosonenfelder . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
465 467 468 473 475
xii
Inhaltsverzeichnis
16.2.3 Modifizierte Maxwell-Gleichungen . . . . . . . . . . . . . . . Einbeziehung der Quarks . . . . . . . . . . . . . . . . . . . . . . . . . 16.3.1 U (1)- und SU (2)-invarianter -Anteil der Quarks . . . . . . . 16.3.2 SU (3)-invarianter -Anteil der Quarks: Quantenchromodynamik 16.4 Erklärung der Teilchenmassen mit Hilfe eines Higgs-Feldes . . . . . . . 16.4.1 Bosonenmassen . . . . . . . . . . . . . . . . . . . . . . . . . 16.4.2 Leptonenmassen . . . . . . . . . . . . . . . . . . . . . . . . . 16.4.3 Ruhemassen freier Quarks . . . . . . . . . . . . . . . . . . . . Exkurs 16.2: Quarkeinschluß und Gluonen . . . . . . . . . . . . . . . . 16.4.4 Quarkmischung . . . . . . . . . . . . . . . . . . . . . . . . . 16.5 Gesamt-Lagrange-Dichte . . . . . . . . . . . . . . . . . . . . . . . . . 16.6 Kosmologische Implikationen des Higgs-Feldes . . . . . . . . . . . . . 16.7 Experimentelle Tests des Standardmodells . . . . . . . . . . . . . . . . 16.7.1 Nachweis der Eichbosonen . . . . . . . . . . . . . . . . . . . 16.7.2 Zahl der Familien . . . . . . . . . . . . . . . . . . . . . . . . 16.7.3 Weitere Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.7.4 Zum Nachweis des Higgs-Bosons . . . . . . . . . . . . . . . . 16.8 Anhang zur Diagonalisierung von Matrizen . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
490 491 491 493 494 494 500 502 504 507 513 515 517 517 518 519 519 520 521
17 17.1
523 523 524 525 528 534 538
16.3
Über das Standardmodell hinausführende Entwicklungen Neutrinomassen und Neutrinooszillationen . . . . . . . . . . . . . . . 17.1.1 Neutrinos als massive Majorana-Teilchen . . . . . . . . . . . 17.1.2 Neutrinooszillationen . . . . . . . . . . . . . . . . . . . . . 17.2 Große Vereinheitlichungstheorien . . . . . . . . . . . . . . . . . . . 17.3 Supersymmetrie, Einbindung der Gravitation und Superstringtheorien Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
Literaturverzeichnis
539
Sachregister
540
I
Relativistische Quantenmechanik
1
Einleitung zur Relativistischen Quantenmechanik
Aus dem Korrespondenzprinzip folgt, daß es in Analogie zur relativistischen Mechanik auch eine relativistische Quantenmechanik geben muß. Interessanterweise hat E. Schrödinger noch vor der Schrödinger-Gleichung als erstes eine relativistische „Wellengleichung“ aufgestellt. Er publizierte diese jedoch nicht, weil sie nicht die richtige Feinstruktur der Energieniveaus des Wasserstoffatoms lieferte. Erst, nachdem er bemerkt hatte, daß sie einen brauchbaren nicht-relativistischen Limes liefert, wollte er das nachholen, doch da waren ihm bereits O. Klein und W. Gordon zuvorgekommen. Aus diesem Grund wird die auch von ihm entdeckte Gleichung heute meist als KleinGordon-Gleichung bezeichnet. Sie hat sich als korrekte relativistische Gleichung für Spin-0-Teilchen erwiesen und wird daher ausführlich in Kapitel 4 untersucht. Dabei soll der frühere Usus, sie als Klein-Gordon-Schrödinger-Gleichung zu bezeichnen, wieder aufleben. Anders als die Schrödinger-Gleichung enthält die Klein-Gordon-SchrödingerGleichung Zeitableitungen zweiter Ordnung. Sie paßt daher zunächst nicht nicht in das in Kapitel Q6 entwickelte allgemeine Schema der Quantenmechanik, kann jedoch durch eine geeignete Umformulierung in dieses eingepaßt werden. 1928 gelang es P. A. M. Dirac, eine relativistisch invariante Gleichung vom Typ der Schrödinger-Gleichung aufzustellen. Möglich wurde das durch den Übergang von der einkomponentigen komplexen Wellenfunktion der Schrödinger-Gleichung zu einem mehrkomponentigen komplexen Spinor, und als nicht-relativistischer Limes der DiracGleichung ergab sich die Pauli-Gleichung für Spin-1/2-Teilchen. Die Dirac-Gleichung erwies sich dadurch als relativistische Gleichung für spinbehaftete Teilchen, während sich der Spin damit als ein Effekt der Relativitätstheorie herausstellte. Wie bei der KleinGordon-Schrödinger-Gleichung gibt es Lösungen positiver und negativer Energie. Um das Problem zu vermeiden, daß von allen Lösungen positiver Energie der Übergang zu Lösungen negativer Energie erfolgt, erklärte Dirac alle Zustände negativer Energie als bereits besetzt. Die konsequente Fortführung dieser Idee führte ihn schließlich dazu, den durch Anregung bzw. Überführung von besetzten Zuständen negativer in Zustände positiver Energie entstehenden Leerplätzen eine Rolle als Antiteilchen zuzuweisen. Im Teil Quantenmechanik wurden Wellenfunktionen für ein und für mehrere Teilchen eingeführt. Die hier dargebotene relativistische Quantenmechanik beschränkt sich auf eine Ein-Teilchen-Beschreibung. Schon bei dieser treten verschiedentlich Mehr-Teilchen-Effekte auf, wie das angeführte Beispiel der Erzeugung von Antiteilchen durch Löcherbildung demonstriert. Mit derartigen Effekten ist immer dann zu rechnen, wenn die Energie des durch die relativistische Gleichung beschriebenen Einzelteilchens die der Ruhemasse eines geeigneten anderen Teilchens äquivalente Energie übersteigt. Dies zeigt, daß es im Grunde keine konsistente relativistische Ein-Teilchen-Quantenmechanik gibt. Die logische Konsequenz davon besteht im Ausbau der relativistischen Quantenmechanik zu einer systematischen relativistischen Mehr-Teilchen-Theorie, was in der im nächsten Teil des Buches behandelten Quantenfeldtheorie geschehen wird.
2
Dirac-Theorie des Elektrons und des Neutrinos
Die im ersten Teil dieses Buchs behandelte Quantenmechanik ist nicht-relativistisch. Sie steht in Korrespondenz zur Newtonschen Mechanik und ist dementsprechend Galileiinvariant. Wir können nicht erwarten, daß sie auch im relativistischen Regime gültig bleibt. Schon bei der Dynamik eines Elektrons im Atom ergeben sich bei klassischer Rechnung so hohe Geschwindigkeiten, daß meßbare relativistische Korrekturen zu erwarten sind. Das gilt um so mehr z. B. für hochenergetische Stoßprozesse in Teilchenbeschleunigern. Dieses Kapitel ist einer relativistischen Quantenmechanik von Elektronen gewidmet. Es wird sich herausstellen, daß die bisherigen Konzepte der Quantenmechanik auch im relativistischen Regime brauchbar bleiben. Dennoch liefert eine relativistische Quantentheorie wesentlich mehr als nur relativistische Korrekturen zur bisherigen Theorie. So erklärt z. B. die von Dirac entwickelte Quantentheorie geladener Punktteilchen ganz von selbst den Spin 1/2 der Elektronen und Positronen. Nun besitzen aber beileibe nicht alle Teilchen den Spin 1/2. Dies deutet darauf hin, daß mit dem Einbringen relativistischer Konzepte in die Quantenmechanik auch eine stärkere Diversifizierung verbunden ist. Ein generelles Problem der relativistischen Quantenmechanik ist das Auftreten von Zuständen negativer Energie. Wie bereits in der Einleitung gesagt löste Dirac dieses, indem er forderte, daß alle negativen Energiezustände der Elektronen im allgemeinen von Elektronen besetzt sind. Wird eines von diesen durch Energiezufuhr in einen Zustand positiver Energie überführt, so hinterläßt es ein unbesetztes Loch, das Dirac als positiv geladenes Teilchen interpretierte. Mit Hilfe dieser Vorstellung kann nicht nur die Existenz des Positrons gefolgert, sondern auch noch eine Reihe weiterer, bei Elektronen und Positronen auftretender Phänomene gedeutet werden. Wir werden allerdings sehen, daß diese Interpretation nicht in allen Konsequenzen haltbar ist, und werden sie daher später im Rahmen der Quantenfeldtheorie ersetzen.
2.1 Ergebnisse der klassischen relativistischen Mechanik Wir beabsichtigen, eine relativistische Bewegungsgleichung quantenmechanischer Zustände für die Dynamik geladener Punktteilchen in einem elektromagnetischen Feld aufzustellen. Dabei möchten wir uns so eng wie möglich an das erprobte Vorgehen im nicht-relativistischen Fall anlehnen und benötigen die Bewegungsgleichung daher in Hamiltonscher Form.
2.1 Ergebnisse der klassischen relativistischen Mechanik
5
Die relativistische Bewegungsgleichung für die Bewegung eines Punktteilchens im elektromagnetischen Feld lautet in der Newtonschen Form d mÚ dt mit m
q E Ú B
(2.1)
m0 . 1v 2 /c2
(2.2)
Die Felder E und B lassen sich durch E
Φ ∂∂tA ,
B
A
(2.3)
auf die Potentiale A und Φ zurückführen. Die (2.1) äquivalente Hamiltonsche Form der Bewegungsgleichung ist nach der Speziellen Relativitätstheorie, Abschn. „Lagrange und Hamilton-Formulierung der Bewegungsgleichung“ ∂H ∂H , p ∂p ∂x 2 qΦ(x, t) c m 02 c2 p q A(x, t) . x
mit H
(2.4) (2.5)
(Wir benutzen in der relativistischen Quantenmechanik für den Ortsvektor die Bezeichnung x.) Der Zusammenhang zwischen der Geschwindigkeit Ú x und dem Impuls p folgt aus (2.4a) mit (2.5) und lautet p
q A mÚ .
(2.6)
Für spätere Zwecke sei angemerkt, daß sich aus (2.5) mit (2.6) H
qΦ mc2
(2.7)
ergibt. Die Gleichungen (2.4) sind formal identisch mit den kanonischen Bewegungsgleichungen der nicht-relativistischen Mechanik. Daher gelten für sie alle Konsequenzen, die in der klassischen Mechanik aus ihrer kanonischen Form abgeleitet wurden. Insbesondere bedeutet dies, daß sie auch in die Form 2 ∂S ∂S ∂S ∂S 2 2 H x, p ∂ x , t ∂t qΦ c m 0 c ∂ x q A 0 (2.8) ∂t von Hamilton und Jacobi gebracht werden können. Der Zusammenhang zwischen der Wirkungsfunktion S und den mechanischen Größen p bzw. x ist dabei wie in der klassischen Mechanik durch ∂S (2.9) p ∂x und (2.6) mit Ú und es folgt
x gegeben. Im Fall ∂ H /∂t
0 gilt Energieerhaltung, H
E
const,
6
2 Dirac-Theorie des Elektrons und des Neutrinos
∂S ∂t
E.
(2.10)
Wir werden später bei der Quantisierung von Gleichung (2.8) zu deren Quadrat
∂S ∂t
qΦ
2
m 02 c4 c2
∂S ∂x
2
qA
(2.11)
übergehen. Man kann sich schon klassisch einen Teil der Konsequenzen überlegen, die dieses Vorgehen mit sich bringt: Für Φ 0 und A A(x) ist H nicht explizit zeitabhängig, es gilt der Energieerhaltungssatz, und (2.11) ist dann den zwei Gleichungen ∂S ∂t
H E
(2.12)
äquivalent. Dies bedeutet, daß zu jeder Lösung positiver Energie (mit ∂ S/∂t E) auch eine Lösung negativer Energie (mit ∂ S/∂t E) existiert. Beim Aufstellen der Schrödinger-Gleichung in der nicht-relativistischen Quantenmechanik (Abschn. Q3.2.3) wurde neben der Hamilton-Jacobi-Gleichung auch eine Kontinuitätsgleichung benutzt. Wir wollen daher auch eine entsprechende relativistische Kontinuitätsgleichung bereitstellen. n 0 N/V0 sei die Dichte ruhender Teilchen. Mit dem Vierervektor der Geschwindigkeit 1 Uμ c, Ú (2.13) 1 v 2 /c2 und der Summenkonvention ist ∂μ (n 0 U μ ) bzw.
∂ n0 ∂t 1 v 2 /c2
div
0
(2.14)
n0Ú
1 v 2 /c2
0
(2.15)
eine Lorentz-invariante Erhaltungsgleichung, die im Limes v/c 0 in die klassische Kontinuitätsgleichung übergeht. Definieren wir noch durch n N/V (mit N Zahl der Teilchen und V V0 1 v 2 /c2 bewegtes Volumen) bzw. n
n0 1 v 2 /c2
mit
n0
N V0
(2.16)
eine Dichte der bewegten Teilchen, so erhalten wir aus (2.15) schließlich die Kontinuitätsgleichung ∂n div(nÚ) 0 . (2.17) ∂t Dabei ist Ú aus (2.4)–(2.6) zu entnehmen.
2.2 Aufstellung der Dirac-Gleichung
7
2.2 Aufstellung der Dirac-Gleichung In der nicht-relativistischen Quantenmechanik hatte sich als allgemeines Schema zur Aufstellung einer „Wellengleichung“ ergeben, daß man für diese ih ∂t ψ
ψ H
ansetzt und in ihr den Hamilton-Operator H aus der Hamilton-Funktion H (q, p, t) gemäß h H H q, p p , t i berechnet. Eine äquivalente Korrespondenzregel, die Ort und Zeit symmetrisch behandelt, wäre: In der klassischen Definitionsgleichung H H (q, p, t) der HamiltonFunktion, die auf der rechten Seite eine dem speziellen Problem angepaßte Funktion von q, p und t enthält, ersetzt man h (2.18) i und erhält dadurch eine Operatorgleichung. Wird diese von rechts mit ψ multipliziert, so daß die Operatoren auf die Wellenfunktion ψ einwirken, so erhält man die quantenmechanische Bewegungsgleichung. Wird nach diesem Schema auch der relativistische Fall behandelt, so ergibt sich aus (2.5) 2 h ih ∂t ψ qΦ ψ c m 02 c2 q A ψ. (2.19) i H
ih ∂t ,
p p
Da der Operator unter der Wurzel erscheint, wäre die rechte Seite zunächst nicht definiert. Hier könnte man sich damit behelfen, die rechte Seite durch eine geeignete Potenzreihenentwicklung zu erklären. Dann treten auf dieser aber sämtliche Ortsableitungen von ψ auf, die symmetrische Behandlung von Raum und Zeit in der Korrespondenzregel schlagen sich also im relativistischen Fall nicht in der mit dieser abgeleiteten Bewegungsgleichung nieder. Physikalisch würde die Abhängigkeit der Zeitableitung ∂t ψ von allen Ortsableitungen (also von sämtlichen Koeffizienten einer Taylor-Entwicklung von ψ) bedeuten, daß wir es mit einer nicht-lokalen Theorie zu tun haben, weil die zeitliche Veränderung von ψ an einem Raumpunkt durch alle räumlichen Werte, die ψ zum selben Zeitpunkt annimmt, beeinflußt würde. Ein derartiges Verhalten ist nicht, was wir von einer relativistischen Theorie erwarten. Wir müssen uns daher nach anderen Wegen umsehen, zu einer relativistischen quantenmechanischen Bewegungsgleichung zu gelangen.1 Wie im nicht-relativistischen Fall suchen wir nach einer Bewegungsgleichung, die eine Reihe physikalisch motivierter Forderungen erfüllt. Dabei können die meisten Forderungen des nicht-relativistischen Falls mit unveränderter Begründung direkt übernommen werden. (Es empfiehlt sich also, noch einmal einen Blick auf Abschn. Q3.2.3 1 Schon hier sei darauf hingewiesen, daß wir im Rahmen der Theorie der im folgenden aufgestellten DiracGleichung bei einer speziellen Fragestellung dennoch auf Gleichung (2.19) zurückgeführt werden (siehe Abschn. 3.2.1).
8
2 Dirac-Theorie des Elektrons und des Neutrinos
der Quantenmechanik zu werfen.) Wo unsere Forderungen von dem früher betrachteten Fall abweichen müssen, ist unmittelbar evident, so daß sie hier ohne weitere Begründung aufgeführt werden können. 1. Die Gleichung ist linear und homogen im Zustand ψ. Zur besseren Vergleichbarkeit mit der klassischen relativistischen Mechanik wird für diesen die Ortsdarstellung benutzt. 2. Die Gleichung enthält nur Zeitableitungen erster Ordnung. Wegen der Gleichberechtigung von Raum und Zeit in der Relativitätstheorie wird zusätzlich gefordert, daß sie auch nur Ortsableitungen erster Ordnung enthält. 3. Die im quasiklassischen Grenzfall in die Teilchendichte übergehende Wahrscheinlichkeitsdichte n ist eine quadratische Funktion der Wellenamplitude. 4. Die Forderungen des Korrespondenzprinzips sollen erfüllt sein, d. h. die Bewegungsgleichung soll im quasiklassischen Grenzfall zu Gleichung (2.8) bzw. (2.11) und der zugehörigen Kontinuitätsgleichung (2.17) führen. 5. Die Bewegungsgleichung soll die einfachste aller möglichen Gleichungen sein, welche die Forderungen 1–4 erfüllen. Forderung 2 ist im Grunde sogar überflüssig, denn die Bewegungsgleichung wird sicher am einfachsten (Forderung 5), wenn sie nur Ableitungen erster Ordnung enthält, und es stellt sich heraus, daß damit alle anderen Forderungen erfüllt werden können. Der einfachste Ansatz für eine mit den gestellten Forderungen verträgliche Bewegungsgleichung ist ∂t ψ
aψ
al ∂l ψ
(2.20)
mit komplexen Koeffizienten a und al . Dabei wird die Summenkonvention in der Form benutzt, daß bei doppeltem Auftreten lateinischer Indizes nur über die räumlichen Komponenten 1, 2 und 3 summiert wird. Daß der Zeitableitungsterm nicht mit einem Koeffizienten behaftet ist, bedeutet keine Einschränkung, denn man kann sich vorstellen, daß ein etwaiger Koeffizient herausgekürzt wurde. (Diese Möglichkeit besteht auch für den sich später als notwendig herausstellenden Fall, daß ψ ein Spaltenvektor ist und a sowie al dementsprechend Matrizen repräsentieren. Man müßte in diesem Fall einfach mit einer inversen Matrix multiplizieren.) Jetzt zerlegen wir ψ mit dem Ansatz ψ
A eiS/h
(2.21)
in einen Amplitudenfaktor A und einen (skalaren) Phasenfaktor eiS/h mit reellem S. Im nicht-relativistischen Fall hatten wir verlangt, daß auch A ein reeller Skalar ist. Da wir mit dieser Forderung im relativistischen Fall nicht durchkommen werden, lassen wir sie fallen. Im nicht-relativistischen Fall hatten wir außerdem den Phasenfaktor in der Form eiG angesetzt und für den quasiklassischen Grenzfall nur G S/h verlangt, der Proportionalitätsfaktor ergab sich im Nachhinein aus den de Broglie-Relationen zu eins. Wir ersparen uns diesmal das Mitschleppen eines Proportionalitätsfaktors, indem wir mit dem Ansatz (2.21) gleich dessen richtigen Wert einführen. Allerdings werden wir das der Ordnung halber nachträglich überprüfen.
2.2 Aufstellung der Dirac-Gleichung
9
ψ
Abb. 2.1: Lokalisiertes Wellenpaket im quasiklassischen Grenzfall.
d
Mit dem Ansatz (2.21) ergibt sich aus (2.20) nach Herauskürzen des Phasenfaktors
i i A ∂t S a A al ∂l A A ∂l S . (2.22) ∂t A h h Nun wenden wir uns dem quasiklassischen Grenzfall dieser Gleichung zu. In diesem wird sich das das Teilchen repräsentierende Wellenpaket auf eine kleine Umgebung des klassischen Teilchenorts konzentrieren (Abb. 2.1), während S direkt mit der klassischen Wirkungsfunktion übereinstimmen muß. Größenordnungsmäßig gilt ∂t A A/t, wobei t d/v die Zeit ist, die das Wellenpaket zum Durchlaufen eines Gebietes der Ausdehnung d benötigt. Mit (2.10) ergibt sich dann
∂t A h . A ∂t S Et i h
(2.23)
Analog ist ∂l A A/d, und mit (2.9) ergibt sich
∂l A h . A ∂l S pl d i h
(2.24)
Es wird sich herausstellen, daß A ein Spaltenvektor sein muß. Die Abschätzungen (2.23)–(2.24) sind dann so zu verstehen, daß sie für dessen Komponenten gelten. Etwas vage ausgedrückt steht zu erwarten, daß die Quantenmechanik für große Energien und Impulse in die klassische Mechanik übergeht. Präziser definieren wir als quasiklassischen Grenzfall, daß die Bedingungen Et
h ,
pl d h
(2.25)
erfüllt sind. Aufgrund der Abschätzungen (2.23)–(2.24) können wir dann in Gleichung (2.22) zwei Terme, ∂t A und al ∂l A, vernachlässigen und erhalten als deren quasiklassischen Grenzfall h (2.26) ∂t S a al ∂l S . i Offensichtlich läßt sich durch keine Wahl der Koeffizienten a und al erreichen, daß (2.26) die Form von Gleichung (2.8) annimmt, ja das wäre selbst dann nicht möglich, wenn wir in den Ansatz (2.22) Terme mit höheren Ableitungen von S aufgenommen hätten. Das unser Vorhaben störende Element ist die in (2.8) auftretende Wurzel. Diese
10
2 Dirac-Theorie des Elektrons und des Neutrinos
können wir beseitigen, indem wir Gleichung (2.8) quadrieren. Die entstehende Gleichung (2.11) vergleichen wir mit dem Quadrat von Gleichung (2.26) in der symmetrisierten Form2 h 1 a al al a ∂l S al am am al (∂l S)∂m S . (∂t S)2 h 2 a 2 (2.27) i 2 Es wurde schon darauf hingewiesen, daß (2.11) eine größere Lösungsmannigfaltigkeit als (2.8) besitzt. Dementsprechend steht zu erwarten, daß auch die Bewegungsgleichung für ψ eine größere Lösungsmannigfaltigkeit aufweisen wird, als ursprünglich beabsichtigt wurde: Wir müssen darauf gefaßt sein, auch quantenmechanische Lösungen mit negativer Energie zu erhalten. Da die Bewegungsgleichung (2.26) alle Lösungen generieren wird, die mit den Lösungen von (2.8) in Korrespondenz stehen, bedeutet unser Verfahren jedenfalls keine Einschränkung. Es erhebt sich nur die Frage, wie die zusätzlichen Lösungen zu deuten sind. Diesem Problem werden wir uns später ausführlich zuwenden.
2.2.1 Dirac-Gleichung im kräftefreien Fall Jetzt wenden wir uns der Bestimmung der Koeffizienten a und al zu. Der besseren Übersichtlichkeit halber behandeln wir zunächst den einfachen Fall, in dem die Felder Φ und A verschwinden. Gleichung (2.11) reduziert sich in diesem auf
∂S ∂t
2
m 02 c4 c2
∂S ∂x
2 .
(2.28)
Der Koeffizientenvergleich zwischen (2.27) und (2.28) liefert die Bedingungen a2
m 0 c2 h
2 ,
a al
al a
0,
al am
am al
2δlm c2 .
(2.29)
Wieder geht es nicht so glatt wie im nicht-relativistischen Fall, denn wir müssen feststellen, daß die Gleichungen (2.29) nicht mit skalaren Koeffizienten a und al befriedigt werden können: Aus der ersten Gleichung folgt a 0, die zweite ist dann nur mit al 0 erfüllbar, und das steht im Widerspruch zur dritten Gleichung. Die Situation ist jedoch nicht so gravierend, wie es zunächst erscheint: Das Feld ψ(x, t) muß nicht notwendig 2
Es gilt (∂t S)2
h a al ∂l S i
h a al ∂l S i
h 2 a2 hi
a al
al a
∂l S (al ∂l S)2 .
Die Symmetrisierung des Terms (al ∂l S)2 ergibt sich gemäß (al ∂l S)2
al (∂l S) am (∂m S) am (∂m S) al (∂l S) 1 al (∂l S) am (∂m S) am (∂m S) al (∂l S) 2
1 (al am 2
am al ) (∂l S)(∂m S) .
Sie ist nur von Belang, wenn das Produkt al am nicht vertauschbar ist, was der Fall ist, wenn es sich bei den al um Matrizen handelt.
2.2 Aufstellung der Dirac-Gleichung
11
ein Skalarfeld wie das Schrödinger-Feld sein. Wir kennen anderes aus der Elektrodynamik, und im Rahmen der Quantenmechanik hat uns schon die Pauli-Gleichung mit Alternativen vertraut gemacht. Setzen wir ψ als mehrkomponentige Wellenfunktion ⎛ ⎞ ⎛ ⎞ ψ1 A1 . ψ ⎝ ... ⎠ ⎝ .. ⎠ eiS/h (2.30) An ψn
an, so müssen die Koeffizienten a und al in Gleichung (2.20) n n–Matrizen sein, damit diese einen Sinn ergibt. Die linke Seite von Gleichung (2.26) ist entsprechend so zu interpretieren, daß ∂t S mit der n n–Einheitsmatrix multipliziert ist, ∂t S E ∂t S .3 Die Größe S bleibt dabei wie vorausgesetzt ein reeller Skalar. Man prüft leicht nach, daß alle zwischen (2.20) und (2.29) ausgeführten Schritte mit unserer jetzigen Interpretation der Größen ψ, a und al verträglich sind. Auch der Übergang von der Matrixgleichung (2.27) zu der skalaren Gleichung (2.28) bereitet keine weiteren Interpretationsschwierigkeiten: Unter den Bedingungen (2.29) enthält jeder Term in (2.27) die Einheitsmatrix; kürzt man diese heraus, so ergibt sich für die quantenmechanische Phase S die skalare Gleichung (2.28). Wir haben noch eine weitere Forderung des Korrespondenzprinzips zu erfüllen: Die quantenmechanische Wahrscheinlichkeitsdichte n muß im quasiklassischen Grenzfall der Kontinuitätsgleichung (2.17) genügen. Für die Zustände (2.30) ist die sinnvollste Definition einer mit der Forderung 3 des letzten Abschnitts verträglichen Wahrscheinlichkeitsdichte n ψi ψi . Definieren wir als zu ψ adjungierten Zustand den Zeilenvektor bzw. die Zeilenmatrix ψ ψ1 , . . . , ψn , (2.31) n so läßt sich dafür n ψψ ψi ψi (2.32) i 1
schreiben. (Wir werden später zu einer etwas anderen Dichte ψψ mit einer noch zu definierenden Größe ψ übergehen.) n ist positiv definit, wie zu fordern ist, wenn n als Wahrscheinlichkeitsdichte interpretiert werden soll. Die Zeitableitung von n erhalten wir mit Hilfe der auch bei Anwesenheit von Feldern Φ und A gültigen Bewegungsgleichung (2.20) und der zu dieser adjungierten Gleichung (∂t ψ)
ψ a (∂l ψ) al ,
(2.33)
indem wir (2.20) von links mit ψ , (2.33) von rechts mit ψ multiplizieren und die erhaltenen Gleichungen addieren. Mit (∂t ψ) ∂t ψ und (∂l ψ) ∂l ψ erhalten wir auf diese Weise ∂t n ψ (a a ) ψ ψ al ∂l ψ (∂l ψ ) al ψ . (2.34) Für den quasiklassischen Grenzfall ergibt sich keine Vereinfachung der Struktur dieser Gleichung. Wenn sie also im quasiklassischen Grenzfall die Form einer Kontinuitätsgleichung annehmen soll, muß das ganz allgemein gelten. Dazu muß der erste Term der 3 Man beachte den Unterschied zwischen der Einheitsmatrix E und der Energie E.
12
2 Dirac-Theorie des Elektrons und des Neutrinos
rechten Seite verschwinden und die beiden letzten müssen zusammen eine Divergenz ergeben, d. h. wir erhalten die Forderungen a
a
0,
al
al
,
(2.35)
die aufgrund der Allgemeingültigkeit des Ansatzes (2.26) auch für Φ 0 und A0 gelten. Mit (2.35) vereinfacht sich (2.34) zu ∂t n ∂l (ψ al ψ) 0 .
(2.36)
Wir werden sehen, daß diese Gleichung im quasiklassischen Grenzfall (2.17) liefert, ohne daß weitere Forderungen gestellt werden müssen. Im nächsten Abschnitt wird sich herausstellen, daß die Matrizen a und al mindestens 4 4–Matrizen sein müssen, damit alle Gleichungen (2.29) und (2.35) erfüllt werden können. Sie werden bis auf eine unitäre Transformation eindeutig festgelegt (siehe nächster Abschnitt), wenn es sich um 4 4–Matrizen handelt, bei höherer Dimension der Matrizen geht diese Art der Eindeutigkeit verloren. Im Sinne unserer Forderung nach maximaler Einfachheit der Bewegungsgleichung werden wir uns für 4 4–Matrizen entscheiden. Die Wellenfunktion wird damit zu einem vierkomponen⎛ ⎞ tigen Spaltenvektor ψ1 ⎜ ψ2 ⎟ ψ ⎝ ⎠, (2.37) ψ3 ψ4 für den sich aus später ersichtlichen Gründen (siehe Exkurs 2.1) der Name Spinor oder Dirac-Spinor eingebürgert hat. Der zu ψ adjungierte Spinor ist nach (2.31) ψ
(ψ1 , ψ2 , ψ3 , ψ4 ) ,
(2.38)
es handelt sich bei ihm um eine Zeilenmatrix. Nach den Regeln der Matrizenmultiplikation, Multiplikation der Zeilen der linken mit den Spalten der rechten Matrix, gibt es zwischen zwei Rechtecksmatrizen ψ und ϕ mit einer Zeile bzw. einer Spalte zum einen das Produkt ⎛ ⎞ ϕ1 ϕ ⎜ ⎟ (2.39) ψ ϕ (ψ1 , ψ2 , ψ3 , ψ4 ) ⎝ 2 ⎠ ψ1 ϕ1 ψ2 ϕ2 ψ3 ϕ3 ψ4 ϕ4 , ϕ3 ϕ4 das zu einer 1 1-Matrix mit dem Element 4i 1 ψi ϕi Produkt ⎛ ⎞ ⎛ ϕ1 ϕ1 ψ1 ϕ1 ψ2 ⎜ϕ ⎟ ⎜ ϕ ψ ϕ2 ψ2 ϕψ ⎝ 2 ⎠ (ψ1 , ψ2 , ψ3 , ψ4 ) ⎝ 2 1 ϕ3 ϕ3 ψ1 ϕ3 ψ2 ϕ4 ϕ4 ψ1 ϕ4 ψ2 das zu einer 4 4-Matrix mit den Elementen ϕi ψk führt.
führt, und zum anderen das ϕ1 ψ3 ϕ2 ψ3 ϕ3 ψ3 ϕ4 ψ3
⎞ ϕ1 ψ4 ϕ2 ψ4 ⎟ ⎠, ϕ3 ψ4 ϕ4 ψ4
(2.40)
2.2 Aufstellung der Dirac-Gleichung
13
Es erweist sich als zweckmäßig, mit den Definitionen m 0 c2 β, ih
a
al
cαl
(2.41)
von a und al zu neuen Matrizen β und αl überzugehen. Die Forderungen (2.29) und (2.35) transformieren sich dabei in4 β2
1,
β, αl
0,
αl , αm
2δlm
(2.42)
und β
β ,
αl
αl .
(2.43)
(Wir lassen die Einheitsmatrix weg, wenn wie in der Gleichung β 2 1 klar ist, was gemeint ist.) Aus (2.20) wird damit die von P. A. M. Dirac entdeckte Dirac-Gleichung für freie Teilchen h m 0 c2 β cαl ∂l ψ. ih ∂t ψ (2.44) i Die Mehrkomponentigkeit der Wellenfunktion bedeutet, daß gegenüber der Schrödingerschen Wellenmechanik weitere Freiheitsgrade hinzugekommen sind. Welche Bedeutung diese haben, werden wir später sehen. Hier sei nur darauf hingewiesen, daß sich das Auftreten mehrerer Freiheitsgrade zwangsläufig aus den Forderungen (2.29) ergab. Für ebene Wellen ψ ψ0 ei(k x ωt ) liefert (2.44) die Matrix-Gleichung h ω
m 0 c2 β c h kl αl .
Durch Quadrieren folgt hieraus unter Benutzung der Gleichungen (2.42) und nach Herauskürzen der Einheitsmatrix die Dispersionsrelation (h ω)2
(m 0 c2 )2 c2 (h k)2 .
(2.45)
Genau dasselbe ergibt sich, wenn wir den im kräftefreien Fall ( A0 und Φ 0) gültigen, aus (2.8) mit (2.9) und (2.10) folgenden Energiesatz H E c m 02 c2 p2 quadrieren und in ihm die – auch relativistisch gültigen – de Broglie-Relationen E h ω und p h k einsetzen. Damit ist im Nachhinein gezeigt, daß der in (2.21) gewählte Ansatz G S/h mit S = Wirkungsfunktion berechtigt war. 4 In der Relativistischen Quantenmechanik und der Quantenfeldtheorie treten sowohl Kommutatoren a, b als auch Antikommutatoren a, b auf. Die letzteren werden in diesem Buch generell durch ein tief gestelltes markiert. Für Minus-Kommutatoren werden die Notationen a, b und a, b benutzt, die letztere überwiegend dann, wenn es um die deutliche Absetzung von Antikommutatoren geht oder wenn eine Verwechslung droht.
14
2 Dirac-Theorie des Elektrons und des Neutrinos
Mit den Definitionen (2.41) wird aus der Kontinuitätsgleichung (2.36) ∂t n
div j
0
mit
jl
cψ
αl ψ .
(2.46)
(Später werden wir zu einem Teilchenstrom übergehen, bei dem ψ durch ψ ersetzt ist.) Im quasiklassischen Grenzfall ist sowohl n ψ ψ als auch jl nur in der unmittelbaren Nachbarschaft des klassischen Teilchenorts von Null verschieden. Wir dürfen dann näherungsweise n
δ3(x x(t)) ,
jl
Jl δ3(x x(t)) n Jl
setzen und erhalten aus (2.47b) für Jl die Beziehung (2.46b) Jl jl d 3x cαl ,
(2.47)
(2.48)
wobei in (2.56)–(2.57) definiert ist, wie der Mittelwert cαl gebildet werden muß. Unter Vorgriff auf das Ergebnis (2.61) erhalten wir mit d x /dt Úkl aus den Gleichungen (2.47)–(2.48) schließlich j n Úkl . Damit ist gezeigt, daß auch die Kontinuitätsgleichung (2.46) die Forderungen des Korrespondenzprinzips erfüllt.
2.2.2 Bestimmung der Dirac-Matrizen «l und ¬ Die Matrizen αl und β sind nach (2.43) hermitesch und erfüllen nach (2.42) die Beziehungen (2.49) αx2 α y2 αz2 β 2 1 .
Hieraus folgt, daß sie als Eigenwerte nur 1 oder 1 besitzen können. (Jede hermitesche Matrix kann durch eine unitäre Transformation auf Diagonalform gebracht werden, in der ihre Eigenwerte auf der Diagonalen stehen, und nach (2.49) sind deren Quadrate gleich eins.) Weiterhin folgt aus (2.42b) β β, αl
β 2αl
βαl β
(2.42a)
αl
βαl β
0.
Hieraus folgt unter Benutzung der allgemeingültigen Beziehung Sp(AB) Sp(B A) für die Spur des Produktes zweier Matrizen A und B
Sp(βαl β) Sp β Sp(αl β) Sp(αl β 2 ) Sp αl mit der Konsequenz Sp αl 0, und analog folgt aus αl β, αl αl βαl αl2 β αl βαl β 0 das Ergebnis Sp β 0. Die Spur ist bei unitären Transformationen, durch die hermiSp αl
tesche Matrizen auf Diagonalform gebracht werden können, eine Invariante. Daher ist die Spur hermitescher Matrizen gleich der Summe ihrer Eigenwerte. Da die letzteren bei den hermiteschen Matrizen αl und β jedoch gleich 1 oder 1 sind, kann Sp αl bzw. Sp β nur bei geradzahliger Dimension verschwinden. Weiterhin müssen die fünf Matrizen αx , α y , αz , β und E linear unabhängig sein, denn die Einheitsmatrix läßt sich nicht als Linearkombination der Matrizen αl und β darstellen.
2.2 Aufstellung der Dirac-Gleichung
15
Beweis: Aus der Gleichung 3
cl αl
bβ
E
(2.50)
l 1
folgt durch Antikommutation mit αm bzw. β unter Ausnutzung der Beziehungen (2.42) sowie von αm E E αm αm und β E Eβ β cm E αm ,
bE β .
Durch nochmalige Antikommutation mit αl αm folgt aus diesen Gleichungen cm αl
0,
b αl
0
und damit c1 c2 c3 b 0. Mit diesen Koeffizienten läßt sich (2.50) nicht erfüllen.
Dieses Ergebnis bedeutet, daß der Matrizenraum, in welchem αl und β erklärt sind, mindestens fünf linear unabhängige Matrizen enthalten muß. Da es insgesamt nur vier linear unabhängige hermitesche 2 2–Matrizen gibt, existiert in deren Raum keine Lösung der Gleichungen (2.42)–(2.43). Nach zwei ist die nächste geradzahlige Dimension vier. Im Raum der 4 4–Matrizen ist das Gleichungssystem (2.42)–(2.43) tatsächlich lösbar, und es bereitet keine weiteren Schwierigkeiten, sich eine explizite Lösung zu verschaffen. Wir begnügen uns damit, uns davon zu überzeugen, daß 0 σl 1 0 αl (2.51) , β σl 0 0 1 eine Lösung ist, wobei 0, 1 und σl die zweidimensionale Nullmatrix, Einheitsmatrix bzw. die Pauli-Matrizen sind. Beweis: Da die 2 2–Matrizen 0, 1 und σl hermitesch sind, gilt das auch für die 4 4–Matrizen αl und β. In Aufgabe 2.4 wird gezeigt, daß mit den Blockmatrizen αl und β so gerechnet werden kann, als wären die 2 2–Matrizen 0, 1 und σl gewöhnliche Matrixelemente. Die Gültigkeit von β 2 1 ist offensichtlich. Mit den üblichen Regeln der Multiplikation und Addition von Matrizen erhalten wir außerdem 0 σl 0 σl β αl αl β 0 σl 0 σl 0 sowie 0 0 σl , σm 0 σl σm σm σl αl αm αm αl 0 σl σm 0 σm σl 0 σl , σm , und mit den Vertauschungsrelationen (Q7.43), σl , σm 2δlm , folgt daraus (2.42c).
(2.51) ist eine spezielle Lösung der Gleichungen (2.42)–(2.43). Man erhält aus ihr die weiteren Lösungen β
U β U,
αl
U αl U ,
wenn man für U eine beliebige unitäre Matrix wählt, denn beispielsweise gilt (β )2
U β UU β U U β 2U U U 1
(2.52)
16
2 Dirac-Theorie des Elektrons und des Neutrinos
die übrigen Relationen (2.42)–(2.43) beweist man analog. Ob man in der DiracGleichung die Matrizen αl und β oder αl und β einsetzt, ist irrelevant, die physikalischen Ergebnisse bleiben davon unberührt: Ist ψ eine Lösung der Dirac-Gleichung (2.44) mit den Matrizen αl und β, und setzt man ψ U ψ bzw. ψ U ψ , so ergibt sich aus (2.44) durch Multiplikation mit U von links h m 0 c2 β cαl ∂l ψ . ih ∂t ψ i ψ ist demnach eine Lösung der Dirac-Gleichung mit den Matrizen αl und β , und die physikalische Äquivalenz der Lösungen ψ und ψ ergibt sich aus ψ ψ ψ ψ . Im folgenden bedeutet es oft eine nützliche Abkürzung, wenn wir die drei Matrizen α1 αx , α2 α y und α3 αz durch die Definition
« α x e x α y e y αz e z
(2.53)
zu einem Vektor « zusammenfassen, dessen Komponenten Matrizen sind.
2.2.3 Dirac-Gleichung mit elektromagnetischem Feld Der allgemeine Ansatz (2.20) gilt auch für den Fall, daß die Teilchendynamik in einem beliebigen elektromagnetischen Feld erfolgt. Die Koeffizienten a und al müssen nur so bestimmt werden, daß ein Quadrat der im quasiklassischen Grenzfall gültigen Beziehung (2.26) mit (2.11) übereinstimmt. Statt mit (2.41) gehen wir jetzt mit m 0 c2 i β al cαl qΦ cαl q Al , (2.54) a ih h von al und a zu den Matrizen αl und β über und erhalten damit aus (2.26) ∂t SqΦ m 0 c2β cαl ∂l Sq Al bzw. das symmetrisierte Quadrat5 davon,
∂t S qΦ
2
m 02 c4 β 2
c2 αl , αm (∂l Sq Al ) (∂m Sq Am ) 2
m 0 c3 β, αl
(∂l S q Al ) .
Der Koeffizientenvergleich mit (2.11) zeigt, daß αl und β wieder die Gleichungen (2.42) erfüllen müssen, und aus den Forderungen (2.35) ergeben sich wieder die Bedingungen (2.43). Dies bedeutet, daß für die Matrizen αl und β die schon bekannten Lösungen (2.51) herangezogen werden dürfen. Mit den Ansätzen (2.54) und der Notation (2.53) lautet die Bewegungsgleichung (2.20) jetzt ih ∂t ψ
h qΦ m 0 c2 β c« qA ψ . i
5 Vergleiche Fußnote 2 von Seite 12.
(2.55)
2.3 Operatoren, Mittelwerte und Ehrenfestsches Theorem
17
Dies ist die Dirac-Gleichung für die Dynamik eines Teilchens der Ladung q im elektromagnetischen Feld. Die zugehörige Kontinuitätsgleichung ist identisch mit der des kräftefreien Falls, d. h. es gilt wieder (2.46). Mit ψ U ψ, αl U αl U und β U βU ist auch hier wieder der Übergang zu einer anderen Darstellung der DiracMatrizen möglich.
2.3 Operatoren, Mittelwerte und Ehrenfestsches Theorem Durch die Einwirkung eines Operators L auf einen Dirac-Spinor (2.37) wird diesem ein – im allgemeinen von ihm verschiedener – Spinor ϕ aus dem Hilbert-Raum der Dirac-Spinoren zugeordnet, L ψ ϕ L ψ . In Komponenten bedeutet dies ψi
L ϕi
4
L ik ψk ,
k 1
wobei L eine Matrix ist, deren Komponenten L ik Operatoren sind. Als Spezialfall ist darunter der Fall enthalten, bei dem der Operator L nur gleiche Diagonalelemente enthält, L l E. (Dabei werden wir im allgemeinen die Matrix E nicht eigens anschreiben.) Wie in der bisherigen Quantenmechanik werden wir nur lineare Operatoren L betrachten. Um zu L einen adjungierten Operator definieren zu können, wird ein Skalarprodukt von Dirac-Spinoren benötigt, das wir durch (ϕ, χ) ϕ χ d 3x (2.56) definieren. Der zu L adjungierte Operator L ist dadurch definiert, daß für beliebige Elemente ϕ und χ des Hilbert-Raums der Dirac-Spinoren (ϕ, L χ)
( L ϕ, χ)
gilt. Ein Operator L heißt hermitesch, wenn wie üblich L L oder (ϕ, L χ) gilt. Der durch L (ψ, Lψ)
χ) ( Lϕ, (2.57)
definierte Erwartungswert eines hermiteschen Operators ist reell. Schreiben wir die Dirac-Gleichung (2.55) mit der Definition H
qΦ m 0 c2 β c«
h qA i
(2.58)
18
2 Dirac-Theorie des Elektrons und des Neutrinos
in der Form ih ∂t ψ
H ψ ,
(2.59)
so folgt aus ihr genau wie aus der nicht-relativistischen Schrödinger-Gleichung (siehe Quantenmechanik, Gleichung (Q3.118) für einen beliebigen linearen hermiteschen Operator L 1 d ∂L . (2.60) L L, H dt ih ∂t Für L x und mit x m , H
cαl
h h (∂l x m ) cαm i i
sowie (2.53) folgt daraus insbesondere d x dt
«
c .
(2.61)
c« ist demnach der Operator der Teilchengeschwindigkeit. Er ergibt sich auch aus der Rückübersetzung (Q6.117) der Heisenbergschen Bewegungsgleichung (Q6.114) für Operatoren ins Schrödinger-Bild, angewandt auf den Ortsoperator x, denn dx dt
1 x, c « x , H ih
c(« x) c« .
Für L (h/i) erhalten wir mit
h h ∂m , H q (∂m Φ) c(∂m αl Al ) i i und der Definition
aus (2.60)
d p dt
q
p
h i
Φ
qc (« A) .
(2.62)
(2.63)
Unter Benutzung von c«
∂ H , ∂ p
q
∂Φ ∂x
∂ H c (« A) ∂x
lassen sich die Gleichungen (2.61) und (2.63) auch in die Form d p d x ∂H ∂H ,
dt ∂ p dt ∂x
(2.64)
bringen. Dies ist das Ehrenfest-Theorem in derselben Form, wie es im nicht-relativistischen Fall erhalten wurde. (Wie dort handelt es sich um rein formale Beziehungen, aus denen keine Lösungen für x und p als Funktionen von t gewonnen werden
2.3 Operatoren, Mittelwerte und Ehrenfestsches Theorem
19
können.) Es erlaubt, p auch im relativistischen Regime als kanonischen Impulsoperator aufzufassen. Die klassische Beziehung (2.6) läßt erwarten, daß der Operator h qA i
(2.65)
dem klassischen kinetischen Impuls m zugeordnet werden kann. wird dementsprechend als Operator des kinetischen Impulses bezeichnet. Aufgrund des Korrespondenzprinzips ist es sinnvoll, H als Energieoperator zu bezeichnen. Ist H nicht explizit zeitabhängig, was nach (2.58) für ∂t Φ 0 und ∂t A 0 der Fall ist, so folgt aus (2.60) 1 H , H ih
d H dt
0,
und es gilt der Energieerhaltungssatz H const. In derrelativistischen Mechanik ist wegen ihrer Abhängigkeit von v auch die Masse m m 0 / 1v 2 /c2 eine dynamische Variable. Nach (2.5)–(2.6) gilt 1 H c2
qΦ
1 2 2 m0 c m2v 2 c
m0
m.
1v 2 /c2
Das Korrespondenzprinzip führt uns dazu, m
(2.58) 1 1 H qΦ m 0β
2 c c
(2.66)
als quantenmechanischen Masseoperator zu definieren. Multipliziert man Gleichung (2.66) einmal von links, einmal von rechts mit dem Operator und addiert die erhaltenen Gleichungen, so ergibt sich
m m
m0
β β
1c
.
Aus den Vertauschungsrelationen (2.42b) folgt, daß der erste Term der rechten Seite verschwindet. In Komponenten gilt weiterhin (mit Summenkonvention)
αl αm
αm αl π m (2.42c) 2δlm π m
2π l ,
womit schließlich der Zusammenhang
1 c m mc 2
(2.67)
folgt. Da c der Geschwindigkeitsoperator ist, entspricht Gleichung (2.67), deren rechte symmetrisiert ist, zusammen mit (2.65) wie erwartet Seite in den Operatoren c und m der klassischen Beziehung p q A m (siehe dazu aber Abschn. 3.1). Für freie Teilchen gilt nach (2.66) m
H . c2
(2.68)
20
2 Dirac-Theorie des Elektrons und des Neutrinos
Wir werden im nächsten Abschnitt sehen, daß der Hamilton-Operator freier Teilchen positive und negative Energieeigenwerte besitzt. Da der Masseoperator mit dem Hamilton-Operator bis auf einen konstanten Faktor übereinstimmt, hat auch der Masseoperator positive und negative Eigenwerte, wobei positive Massen mit positiven Energien und negative Massen mit negativen Energien verbunden sind.
2.4 Ebene-Welle-Lösungen für freie Teilchen Die Dynamik freier Teilchen wird durch Gleichung (2.44) beschrieben. Mit dem Ansatz ωt )
U ei(k x
ψ
,
(2.69)
in dem U ein orts- und zeitunabhängiger Viererspinor ist, suchen wir Lösungen für ebene Wellen der Frequenz ω, die sich in Richtung des Vektors k ausbreiten. Die durch (2.69) gegebenen Spinoren ψ sind Eigenspinoren des Operators p , es gilt h ψ i
p ψ
pψ
mit
h k .
p
(2.70)
Durch Einsetzen von (2.69) und (2.70) in (2.44) ergibt sich, daß sie auch Eigenspinoren des Hamilton-Operators H m 0 c2 β c« p sind, H ψ
Eψ
mit
h ω ,
E
(2.71)
wenn der Spinor U die Gleichung (m 0 c2 β c« p) U
EU
(2.72)
erfüllt. Im folgenden geht es nur noch darum, die Lösungen dieser Gleichung zu finden. Werden diese in (2.69) eingesetzt, so sind die Wellenlösungen festgelegt. Die Tatsache, daß die in H enthaltenen Matrizen « und β mit Hilfe von 2 2-Matrizen dargestellt werden können, legt es nahe, auch für die Viererspinoren eine Zerlegung in zwei Zweierspinoren vorzunehmen, d. h. wir wählen den Ansatz ψ
ϕ χ
Mit (2.51) und U
ϕ
mit ϕ0 χ0
ϕ1 ϕ2
ψ1 ψ2
,
χ
χ1 χ2
ψ3 ψ4
.
(2.73)
wird aus Gleichung (2.72a) m 0 c2 c p
c p m 0c2
ϕ0 χ0
E
ϕ0 χ0
,
nach Ausführen der Matrizenmultiplikation zerfällt sie in die zwei Gleichungen (m 0 c2 E) ϕ0 c
p χ0
0,
c
p ϕ0 (m 0 c2 E) χ0
0.
(2.74)
2.4 Ebene-Welle-Lösungen für freie Teilchen
21
E m 0 c2 0 m0
Abb. 2.2: Die positiven und negativen Energieeigenwerte zu einem gegebenen Impuls liegen in den sich bis E bzw. erstreckenden schattierten Bereichen.
c2
Aus der zweiten dieser Gleichungen ergibt sich χ0
m cc2p E ϕ0 ,
(2.75)
0
und die Elimination von χ0 aus der ersten Gleichung mit Hilfe dieses Ergebnisses führt zu c2 p p (m 0 c2 E) ϕ0 ϕ0 0 . m 0 c2 E Zur Weiterbehandlung dieser Gleichung benutzen wir die für beliebige Vektoren oder Vektoroperatoren a und b (die jedoch keine Matrizen als Komponenten haben sollen) gültige und am Ende dieses Abschnitts bewiesene Identität
a b a b i (a b ) ,
(2.76)
p p p2
(2.77)
setzen in dieser a b p und erhalten mit die Gleichung
m 0 c2
E
c 2 p2 m 0 c2 E
ϕ0
0.
Die Lösbarkeitsbedingung für diese Gleichung, das Verschwinden der Klammer, führt zu den beiden Energieeigenwerten mit Ep (m 0 c2 )2 c2 p2 . (2.78) E Ep Zu jeder Lösung E Ep positiver Energie existiert auch eine Lösung E Ep negativer Energie, und es gilt Ep m 0 c2 (Abb. 2.2). Gleichung (2.78) ist natürlich der Dispersionsbeziehung (2.45) äquivalent. Wenn sie erfüllt ist, kann ϕ0 beliebig gewählt werden. Jetzt wenden wir uns der Bestimmung der Vierer-Eigenspinoren U zu, die wir bei den Lösungen positiver Energie mit U ( ) und bei denen negativer Energie mit U ( ) bezeichnen. Wie bereits gesagt kann der Zweierspinor ϕ0 beliebig gewählt werden. Die beiden Zweierspinoren 1 0 , χ , (2.79) χ 0 1
22
2 Dirac-Theorie des Elektrons und des Neutrinos
die nach Gleichung (Q7.73) der Quantenmechanik Eigenspinoren der Matrix σz zu den Eigenwerten 1 sind, bilden eine orthonormierte Basis, und ϕ0 kann eine beliebige Linearkombination der beiden Basisspinoren (2.79) sein. Dies bedeutet, daß es auch für U ( ) und U ( ) eine Basis von je zwei Viererspinoren gibt, aus denen sich die allgemeine Lösung durch Linearkombination ergibt. Die zwei (2.79) entsprechenden Basisspinoren haben nach (2.73) und (2.75) mit E Ep die Form ⎛ ⎞ χi ⎜ ⎟ ( ) Ui N ⎝ c p χi ⎠ (2.80) für i . m 0 c2 Ep N sind Konstanten, die durch die Normierungsforderung () () c2 ( pχi ) pχi 2 Ui N χi χi (m c2 E )2 Ui 0 p 2 c χi p pχi (2.77) c 2 p2 (Q7.47) 2 2 N 1 (m c2 E )2 N 1 (m c2 E )2 0 p 0 p
N 2
(m 0 c2 )2 2m 0 c2 Ep Ep2 c2 p2 (m 0
c2
bei der χi χi 1 benutzt wurde, zu N
Ep
N 2 E
2Ep 2 p m0c
(2.78)
)2
Ep m 0 c2 2Ep
(2.81)
festgelegt werden können. Damit ergibt sich schließlich ⎛ ⎞ χi 2 Ep λm 0 c ⎜ ⎟ (λ) Ui für i ⎝ c p χi ⎠ 2Ep m 0 c2 λEp (Als Index ist λ , als Faktor 1.) Die Ui
(λ)
(λ) (μ) Ui Uj
1,
, λ
s.u.
(1) .
(2.82)
erfüllen die Normierungsbedingungen
δλμδi j .
(2.83)
Für i j und λμ ergibt sich das aus der vorangegangenen Berechnung der Normierungskonstanten Nλ . Für i j folgt es aus χi χ j 0, und für λμ, aber i j aus ( )
Ui
( )
Ui
χi χi cm( c 2pχEi ) 0 p
c p χi m 0 c2 Ep
1 (m
c 2 p2 2 2 2 0 c ) Ep
0.
Mit (2.82) ergeben sich aus (2.69)–(2.71) die auf eins normierten Wellenlösungen ⎛ ⎞ χ i Ep m 0 c2 ⎜ ⎟ i( px Ep t )/h für i , (2.84) ψi() ⎝ c p χi ⎠ e 2Ep 2 m 0 c Ep ( )
wobei ψi
( )
Lösungen positiver und ψi
Lösungen negativer Energie sind.
2.4 Ebene-Welle-Lösungen für freie Teilchen
23
Für manche Zwecke ist es günstiger, wenn man bei den zu negativer Energie E Ep gehörigen Eigenspinoren aus den zwei Gleichungen (2.74) ϕ0 statt χ0 eliminiert. Man erhält dann aus der ersten von diesen
mc c 2pχE0 , 0
ϕ0
c p χi ⎝ m c2 E ⎛
und der Ansatz ( )
Ui
N
0
p
χi
(2.85)
⎞ ⎠
für
i
,
in dem benutzt ist, daß auch der beliebig wählbare Zweierspinor χ0 aus den Basisspinoren (2.79) superponiert werden kann, führt mit der Normierungsforderung ( ) () Ui 1 zu den alternativen Eigenlösungen negativer Energie Ui ⎛ c pχ ⎞ i Ep m 0 c2 () 2 E ⎠ ⎝ m c 0 p Ui . (2.86) 2Ep χ i
Im nicht-relativistischen Grenzfall werden die gefundenen Wellenlösungen besonders einfach. Nicht-relativistische Verhältnisse liegen vor, wenn Ep von der Größenordnung der Ruheenergie ist, Ep m 0 c2 bzw. nach (2.78b) p/(m 0 c)1 und Ep m 0 c2 p2 /(2m 0 ). Dann gilt nach (2.81) p N 1, N 1, 2m 0 c und aus (2.80) folgt ⎞ ⎞ ⎛ ⎛ ⎞ ⎛ ⎞ ⎛ χi 0 χi χ i p ⎜ ⎟ ⎟ ⎜ Ui( ) ⎝ pχi ⎠ ⎝ ⎠ , Ui() ⎝ 2m 0 c pχi ⎠ ⎝ pχi ⎠ . 2m c 0 p2 0 p 2m 0 c Für die Lösungen positiver Energie sind also im nicht-relativistischen Grenzfall nur die zwei oberen Spinorkomponenten u 1 und u 2 von Bedeutung, für die Lösungen negativer Energie nur die zwei unteren Komponenten u 3 und u 4 . Zum Abschluß soll noch der Beweis der Beziehung (2.76) nachgeholt werden. Beweis: Bilden i, k und l eine zyklische Permutation der Zahlen 1,2 und 3, so gilt nach (Q7.45) σi σk
(Q7.43)
σk σi i σl , (2.87) 2 k gilt nach (Q7.44) σi 1. Diese Ergebnisse lassen sich unter Benutzung des Tensors
und für i εikl zu der Formel
σi σk δik i εikl σl (2.88) zusammenfassen. Sind a i und bk die Komponenten zweier beliebiger Vektoren oder Vektoroperatoren a und b , so ergibt sich hieraus durch Multiplikation mit a i und bk sowie Summation über die doppelt auftretenden Indizes
σi a i σk bk
δik a i bk
i εikl a i bk σl .
Mit εikl a i bk σl σl εlik a i bk und ( a b )l εlik a i bk ergibt sich die behauptete Beziehung.
24
2 Dirac-Theorie des Elektrons und des Neutrinos
2.5 Wellenpakete und Gruppengeschwindigkeit Aus den ebenen Wellen (2.84) ergeben sich durch Superposition Wellenpakete. Das allgemeinste Wellenpaket hat die Form ( ) 1 () 3 i p x/h Ci ( p)Ui ( p) ei Ep t /h d p e (2.89) ψ(x, t) (2π h 2 )3/2 i Ci()( p)Ui()( p) ei Ep t /h . Die Wellenlösungen negativer Energie müssen dabei mit berücksichtigt werden, denn zu jedem Impuls p existieren vier voneinander unabhängige Eigenspinoren, und nur unter Einbeziehung der zwei zu negativen Energien gehörigen Spinoren bilden die ebenen Wellen (2.84) ein vollständiges Spinorsystem. Ist zur Zeit t 0 der Spinor ψ(x, 0) vorgegeben, so können die Koeffizienten () ( ) Ci ( p) und Ci ( p) aus Gleichung (2.89) durch Fourier-Transformation berechnet werden. Die Grundlage dafür bildet die dreidimensionale Verallgemeinerung der Gleichungen (E2.50), 1 1 ik x 3 f (x) ck e f (x) ei k x d 3x . d k, ck (2.90) (2π)3/2 (2π)3/2 Aus dem Vergleich von (2.90a) mit der für t 0 angeschriebenen Gleichung (2.89) ergibt sich mit f (x) ψ(x, 0) und k p/h () Ci ( p)Ui()( p) Ci()( p)Ui()( p) . ck i
Aus (2.89b) folgt daher ( ) ( ) Ci Ui Ci()Ui() i
1 (2π)3/2
ψ(x, 0) ei p x/h d 3x
w( p) .
w( p) ist ein Viererspinor, der durch ψ(x, 0) festgelegt wird. In Analogie zu ψ, Gleichung (2.73), zerlegen wir ihn in der Form u w v mit zwei Zweierspinoren u und v. Multiplizieren wir die zuletzt erhaltene Gleichung () mit Ui , so ergibt sich mit Hilfe der Orthogonalitätsrelationen (2.83) c ( pχi ) v (2.80) Ci()( p) , Ui() w( p) N χi u m 0 c2 Ep ⎡
und hieraus folgt ()
Ci ( p)
Ci()( p)
N N
c ( pχi ) v ⎢ χi u E m c2 p 0 ⎢ ⎢ ⎣ c ( pχi ) v χi u Ep m 0 c2
⎤ ⎥ ⎥ ⎥. ⎦
2.5 Wellenpakete und Gruppengeschwindigkeit
25
Unter nicht-relativistischen Verhältnissen, also für p m 0 c, ist nach (2.78b) Ep m 0 c2 p2 /(2m 0 ) , Ep m 0 c2 2m 0 c2 und damit p N (2.81) Ep m 0 c2 1. N Ep m 0 c2 2m 0 c
()
( )
Dies bedeutet, daß dann im allgemeinen Ci ( p) Ci ( p) gilt, es sei denn, der Anfangszustand ψ(x, 0) ist so konstruiert, daß der Nenner in der eckigen Klammer ebenso klein wie N /N ist. Dies würde bedeuten, daß der zweite Term des Nenners dieselbe Größenordnung wie der erste besitzen und diesen im wesentlichen kompensieren müßte. Da er den sehr kleinen Faktor c p/(m 0 c) enthält, müßte v dazu wesentlich größer als u sein. Solange diese künstliche Situation nicht gegeben ist, gilt Ci() Ci( ) und der Anfangszustand enthält überwiegend Wellen positiver Energie. Unter relativistischen Verhältnissen, also für p m 0 c ist Ep m 0 c2 ( 2 1)m 0 c2, Ep m 0 c2 ( 2 1)m 0 c2 und 2 1 N (1) . N 2 1
Der Anteil von Wellen negativer Energie am Anfangszustand ist dann im allgemeinen derselbe wie der von Wellen positiver Energie, es sei denn, es wurde wieder durch eine besondere Präparierung des Anfangszustands für das Gegenteil gesorgt. Betrachten wir jetzt einen Anfangszustand, in dem ein Wellenpaket auf ein sehr enges Gebiet mit dem Durchmesser d h /(2m 0 c) lokalisiert ist. Aufgrund der Unschärferelation muß z. B.
p h /(2x) gelten. Wegen x d h /(2m c) gilt dann p m c und infolgedessen auch pm c. x
0
x
0
0
Sehr starke Lokalisierung des Wellenpakets führt also zu relativistischen Verhältnissen, und nach den vorangegangenen Überlegungen sind dann am Zustand ψ im allgemeinen Wellen positiver und negativer Energie in etwa gleichem Maße beteiligt. Bei sehr eng lokalisierten Zuständen wie z. B. Bindungszuständen des Elektrons im Atom spielen daher Zustände negativer Energie eine wesentliche Rolle. Bei ausgedehnten Zuständen mit einem Wellenpaketdurchmesser d h /(m 0 c) spielen Wellen negativer Energie dagegen keine wesentliche Rolle, wenn nicht durch eine spezielle Präparation des Anfangszustands dafür gesorgt wurde. Für ein nur aus Wellen positiver Energie aufgebautes Wellenpaket folgt aus (2.78b) mit E Ep h ω und p h k die Dispersionsrelation c m 02 c2 h 2 k 2 . (2.91) ω h
Mit der bekannten Beziehung Ú ∂ω/∂ k ergibt sich daraus als Gruppengeschwindigkeit des Wellenpakets Ú m cc h k h k cE p . (2.92) g
( ) g
2
2 2 0
2 2
p
26
2 Dirac-Theorie des Elektrons und des Neutrinos
Der daraus folgende Zusammenhang Ep ( Ú c2 g
p
)
(2.93)
zwischen Impuls und Gruppengeschwindigkeit entspricht der klassischen Beziehung p m Ú mit m E/c2 . Die Dispersionsrelation für ein nur aus Wellen negativer Energie aufgebautes Wellenpaket stimmt bis auf das Vorzeichen der Wurzel mit (2.91) überein, daher erhalten wir als Gruppengeschwindigkeit Úg(
)
2
cE p .
(2.94)
p
In diesem Fall haben wir das merkwürdige Ergebnis, daß die Gruppengeschwindigkeit des Wellenpakets dem Impuls entgegengerichtet ist. Es ist darauf zurückzuführen, daß die Masse m E/c2 von Teilchen negativer Energie ebenfalls negativ ist (siehe Abschn. 2.3), so daß sich aus der Beziehung p m Ú entgegengesetzte Vorzeichen von p und Ú ergeben. Dieser ungewohnte Zusammenhang führt zu großen Schwierigkeiten bei der physikalischen Interpretation der Wellen negativer Energie. Zunächst sieht es allerdings so aus, als könnte man die letzteren einfach als unphysikalisch erklären und ignorieren: Die Wellen positiver und negativer Energie entwickeln sich nach dem allgemeinen Ergebnis (2.89) zeitlich völlig unabhängig voneinander, d. h. die kräftefreie Dirac-Gleichung separiert bezüglich der Zustände positiver und negativer Energie. Zustände negativer Energie können sich demnach nicht von sich aus entwickeln, wenn sie nicht anfänglich angeregt worden sind. Wie im nächsten Abschnitt gezeigt wird, geschieht das jedoch, sobald elektromagnetische Kräfte im Spiel sind. Wir werden uns daher mit den Wellen negativer Energie noch verschiedentlich auseinandersetzen müssen. Aus (2.78), (2.92) und (2.94) folgt übrigens Úg c/ 1 (m 0 c)2/ p 2 c, d. h. relativistische Wellenpakete breiten sich höchstens mit Lichtgeschwindigkeit aus. Dieses Ergebnis betrifft auch das Auseinanderfließen von Wellenpaketen (siehe Abschn. 2.6), so daß das relativistische Kausalitätsprinzip bei diesen Prozessen gewahrt bleibt.
2.6 Frontgeschwindigkeit von Wellenpaketen In der nicht-relativistischen Quantenmechanik können sich Teilchen mit Überlichtgeschwindigkeit bewegen, die Gruppengeschwindigkeit eines ein Teilchen repräsentierenden Wellenpakets ist Úg h k/m p/m, und p kann beliebige Werte annehmen. In Aufgabe Q3.2–3.3 der Quantenmechanik wurde gezeigt, daß sich die Front eines nichtrelativistischen Wellenpakets mit unendlicher Geschwindigkeit ausbreitet, selbst wenn das Wellenpaket ruht, seine Gruppengeschwindigkeit also verschwindet. Daraus, daß die Gruppengeschwindigkeit der Dirac-Gleichung genügender Wellenpakete nach dem letzten Abschnitt auf Werte Úg c eingeschränkt ist, kann also nicht geschlossen werden,
2.6 Frontgeschwindigkeit von Wellenpaketen
27
daß ihre Frontgeschwindigkeit derselben Einschränkung unterliegt. Die Frontgeschwindigkeit relativistischer Wellenpakete zu berechnen ist das Ziel dieses Abschnitts. Hierzu benutzen wir, daß aus der Dirac-Gleichung (2.44) für freie Teilchen die Gleichung 1 m 02 c2 ∂t t ψ ψ 0 (2.95) 2 c h 2 folgt, d. h. jede Komponente des Dirac-Spinors ψ genügt bei freien Teilchen der im nächsten Kapitel behandelten Klein-Gordon-Schrödinger-Gleichung (4.6). Beweis: Zum Beweis dieser Tatsache multiplizieren wir Gleichung (2.44) mit β, benutzen (2.42a), β 2 1, und schreiben sie in der Form
h (2.96) β(∂t c« ) m 0 c2 ψ 0 . i
c« ) folgt hieraus h 2 β(∂t c« )β(∂t c« )ψ m 0 c2 hi β(∂t c« )ψ
Durch Multiplikation mit dem Operator (h /i)β(∂t 0 (2.96)
h 2
∂t t
cβ « β∂t c« ∂t c2 β « β «
ψ
m 02 c4 ψ .
Wegen (2.42b) bzw. β « « β hebt sich im letzten Ausdruck der zweite gegen den dritten Klammerterm weg, und unter erneuter Benutzung von β 2 1 ergibt sich nach Multiplikation mit 1 h 2 ∂t t c2 « « ψ m 02 c4 ψ 0 . Unter Vorgriff auf die (2.76) entsprechende Beziehung (2.168), in der wir a b ten wir « « i τ .
setzen, erhal
Wird dies in das letzte Ergebnis eingesetzt, so folgt unmittelbar (2.95).
Im weiteren Verlauf betrachten wir nur noch eine Komponente des Spinors ψ, bezeichnen diese mit ϕ und untersuchen die Ausbreitung eines Wellenpakets in x-Richtung. Dieser Prozeß wird durch die Gleichung 1 ∂ 2ϕ c2 ∂t 2
∂ 2ϕ ∂x2
α2 ϕ 0
mit
α2
m 02 c2 h 2
(2.97)
beschrieben. Bezüglich des Wellenpakets machen wir die Annahme, daß sich seine Front zur Zeit t 0 bei x x 0 befindet, und daß ϕ zu dieser Zeit für alle x x 0 verschwindet. ϕ soll an der Wellenfront mitsamt seinen ersten Ableitungen stetig sein. (Die Stetigkeit der ersten Ableitungen muß gefordert werden, damit die in (2.97) stehenden zweiten Ableitungen überall definiert sind.) Für die zweiten Ableitungen können Unstetigkeiten zugelassen werden, und wir nehmen an, daß solche existieren. Die Wellenfront hat dann das in Abb. 2.3 (a) dargestellte Aussehen. Ist x(t) die Position der Wellenfront zu beliebigen Zeiten t (Abb. 2.3 (b)), so gilt x(0)x 0 . Jetzt nehmen wir an, daß x(t) eine Lösung der Gleichung C(x, t)0 ist. Die
28
2 Dirac-Theorie des Elektrons und des Neutrinos t ϕ
2
et ex
C (x , t )
0
1 x0
(a)
x
x (b)
Abb. 2.3: (a) Wellenpaket mit Front bei x x0 , wo die Krümmung und damit ϕ x x eine Unstetigkeit besitzt. (b) Position x(t) der Wellenfront in der x, t-Ebene. Das Wellenpaket befindet sich in dem mit 1 bezeichneten schattierten Gebiet, Gebiet 2 liegt vor der Wellenfront.
Ableitungen von ϕ x ∂x ϕ und ϕt ∂t ϕ tangential zur Kurve C(x, t) 0 müssen über diese hinweg an allen Kurvenpunkten stetig sein, weil ϕt und ϕ x sonst nicht überall über die Kurve hinweg, also zu allen Zeiten über die Wellenfront hinweg, stetig sein könnten. Wir fordern also die Stetigkeit von
C ϕx und
(C x ex
Ct et ) (ϕx x ex ϕxt et )
C ϕt
(C x ϕt t
(C x ϕ xt
C t ϕ x x ) e x et
C t ϕ t x ) e x et .
Bezeichnet der Index 1 den Grenzwert, den eine Funktion vom Inneren des Wellenpakets her auf der Kurve x(t) annimmt, und der Index 2 den Grenzwert auf dieser von vor der Front her (Abb. 2.3 (b)), so folgen aus den zwei gestellten Stetigkeitsforderungen mit f f2 f1 die zwei Gleichungen C x ϕ xt
Ct ϕ x x ,
C x ϕt t
Ct ϕt x ,
(2.98)
da C x und Ct stetig sind. Aus der beiderseits der Kurve x(t) gültigen Differentialgleichung (2.97) ergibt sich andererseits 1 ϕt t c2
ϕx x .
Werden ϕ x x und ϕt t mit Hilfe von (2.98) durch ϕ xt hieraus Cx 1 Ct ϕxt 0 . c2 C x Ct
ϕt x ausgedrückt, so folgt (2.99)
Kurven, auf denen sich Unstetigkeiten der zweiten Ableitungen ausbreiten können, werden als Charakteristiken bezeichnet. Auch die Wellenfront x(t) bewegt sich demnach auf einer Charakteristik. Da C(x, t) 0 eine implizite Darstellung der Kurve x(t) ist, gilt C(x(t), t) 0 .
2.7 Mischung positiver und negativer Energien
29
Aus dieser Identität folgt C x x(t) Ct
0
und
x(t)
Ct . Cx
Wird das letzte Ergebnis in Gleichung (2.99) eingesetzt, so ergibt sich aus dieser nach Herauskürzen von ϕ xt x 1 0 oder x c . 2 x c Damit ist gezeigt, daß sich die Front x(t) des Wellenpakets mit Lichtgeschwindigkeit ausbreitet, unabhängig davon, welche Gruppengeschwindigkeit es besitzt. Dies zeigt, daß Wellenpakete auch in der relativistischen Quantenmechanik zerfließen. Anders als in der nicht-relativistischen Quantenmechanik wird dabei allerdings die Lichtgeschwindigkeit nicht überschritten.
2.7 Mischung positiver und negativer Energien In diesem Abschnitt wird gezeigt, daß die Dirac-Gleichung bei Anwesenheit eines Vektorpotentials A 0 nicht mehr bezüglich der Zustände positiver und negativer Energie separiert. Auch bei Einwirkung äußerer Kräfte kann ein beliebiger Teilchenzustand in eine Fourier-Reihe (2.89) zerlegt werden. Wir schreiben diese in der Form ψ(x, t)
mit ψ (λ) (x, t)
1
ψ ( ) (x, t) ψ ( ) (x, t)
(2π h 2 )3/2 i
d 3p Ci(λ)( p)Ui(λ)( p) ei ( px
(2.100) λEp t )/h
.
(2.101)
Für den Hamilton-Operator (2.58) schreiben wir H
H f
qΦ cq « A
mit
H f
m 0 c2 β c« p ,
wobei H f der Hamilton-Operator für freie Teilchen ist. Es gilt 1 (λ) (λ) d 3 p Ci ( p) H f Ui ( p) ei ( px H f ψ (λ) (2π h 2 )3/2 i (2.71) λ (2.78) d 3p Ci(λ)( p) Ep Ui(λ)( p) ei ( px (2π h 2 )3/2 i (2.101)
(2.102)
λEp t )/h
λEp t )/h
(λ) i h∂ ,
tψ
womit die separate Entwicklung von Zuständen positiver und negativer Energie bei freien Teilchen nochmals formal bewiesen ist.
30
2 Dirac-Theorie des Elektrons und des Neutrinos
Für gewisse Zwecke ist es nützlich, einen Operator zu definieren, dessen Anwendung auf Zustände rein positiver bzw. rein negativer Energie das Vorzeichen der Energie erkennen läßt. Zu dessen Konstruktion berechnen wir aus (2.102b) unter Vorgriff auf die Beziehung (2.168), aus der sich für a b p die Identität « p « p p 2 ergibt, zunächst H 2f
(m 0 c2 β c« p )(m 0 c2 β c« p ) m 02 c4 β 2 m 0 c3 (β « p « p β) c2 « p « p
(2.42a,b),(2.168)
m 02 c4 c2 p 2 .
Der hiermit gebildete und durch Reihenentwicklung nach p erklärte Vorzeichenoperator H f m 0 c2 β c« p Λ (2.103) m 02 c4 c2 p 2 H f 2 besitzt die gewünschte Eigenschaft: Mit der aus der Reihenentwicklung eines Operators f ( p ) folgenden Beziehung f ( p )ψ f ( p)ψ für p ψ pψ ergibt sich durch Anwendung von Λ auf die gemeinsamen Eigenzustände (2.84) der Operatoren p und H f mit den zur Abkürzung benutzten Beziehungen (2.80)–(2.81) Λ Ui(λ)( p) ei ( p x λEp t )/h
(2.71)a (2.78)
(2.78b)
λEp
m 02 c4 c2 p2
Ui(λ)( p) ei ( p x λEp t )/h
(λ)
λ Ui ( p) ei ( p x λEp t )/h ,
und durch ähnliche Rechnung wie bei der oben durchgeführten Berechnung von H f ψ (λ) ergibt sich hiermit (λ) λψ (λ) . Λψ (2.104)
Der Operator Λ ist hermitesch und unitär, Λ Λ Λ 1 . Mit Hilfe von Λ können Projektionsoperatoren Π konstruiert werden, die aus einem allgemeinen Zustand, der bei seiner Zerlegung (2.89) bzw. (2.100) im allgemeinen Energieeigenzustände positiver und negativer Energie enthält, die Zustände positiver bzw. negativer Energie herausprojizieren. Wir definieren Π
1 , (1 Λ) 2
Π
1 (1 Λ) 2
(2.105)
und erhalten mit (2.104) zunächst die Eigenschaften Π ψ () Π ψ ()
ψ ( ) , 0,
Π ψ ()
Π ψ ()
0,
(2.106)
ψ ( ) .
(2.107)
Die Anwendung auf einen allgemeinen Zustand (2.100), ψ ψ () ψ () , liefert hiermit Π ψ
ψ () ,
Π ψ
ψ () .
Aus (2.106)–(2.108) ergibt sich für beliebige Zustände ψ Π 2 ψ
Π ψ ()
ψ ()
Π ψ .
(2.108)
2.7 Mischung positiver und negativer Energien
Dies hat
31
Π
Π 2
(2.109)
zur Folge. Jetzt wollen wir untersuchen, wie die Einwirkung von Operatoren auf einen Spinor ψ die Zerlegung in Anteile positiver und negativer Energie beeinflußt. Dabei lassen wir alle möglichen Operatoren zu, also Matrizen wie « und β, welche die Anordnung der Spinorkomponenten verändern, und Differentialoperatoren wie p oder Multiplikationsoperatoren, welche diese unverändert lassen. Ein Operator, der aus jedem Zustand positiver (bzw. negativer) Energie wieder einen Zustand positiver (bzw. negativer) Energie erzeugt, wird als gerader Operator bezeichnet und zwischen eckige Klammern gestellt, L ψ () ψ () , L ψ () ψ () . (2.110) Ein Operator, der aus jedem Zustand positiver Energie einen Zustand negativer Energie und aus jedem Zustand negativer Energie einen Zustand positiver Energie erzeugt, wird als ungerader Operator bezeichnet und zwischen geschweifte Klammern gestellt,
L ψ () ψ () , L ψ () ψ () . (2.111) Der Hamilton-Operator H f für freie Teilchen und der Impulsoperator p sind offensichtlich gerade Operatoren, d. h. es gilt
H f ,
H f
p
p .
(2.112)
Jeder Operator L kann in einen geraden und einen ungeraden Anteil zerlegt werden, L
L L ,
(2.113)
wobei L oder L natürlich auch verschwinden kann. Den Beweis erbringen wir durch explizite Berechnung von L und L . Zunächst gilt Λ L Λ ψ Λ L Λ ψ () ψ () (2.104) (2.113)
(2.104)
Λ L L ψ () ψ () ψ () ψ () ψ () ψ ()
(2.110) (2.111)
(2.110) (2.111)
Λ ψ () ψ () ψ () ψ ()
L ψ () L ψ () L ψ () L ψ ()
L ψ L ψ . Wird dieses Ergebnis zu der aus (2.113) folgenden Gleichung L ψ
L ψ L ψ
addiert bzw. von ihr subtrahiert, so ergibt sich
L ψ
1 L Λ L Λ ψ , 2
L ψ
1 L Λ L Λ ψ , 2
32
2 Dirac-Theorie des Elektrons und des Neutrinos
und weil diese Beziehungen für beliebige Spinoren ψ gelten, erhalten wir schließlich L
1 L Λ L Λ , 2
L
1 L Λ L Λ . 2
(2.114)
Die Anwendung dieser Formeln auf die Operatoren « und x liefert c p Λ
«
i hc «Λ x x 2 H f 2
,
H f 2
2p i hc
2 H f 2
,
(2.115)
die ungeraden Anteile ergeben sich gemäß (2.113) aus « « « bzw. x x x und sind wie die geraden Anteile beide ungleich null. Beweis: 1. Λ «Λ
2 (2.103) m 0 c β c« p 2 m 0 c4 c2 p 2
m c2 β c« p
« 0
m 02 c4 c2 p2
(m 0 c2 β « c« p « )(m 0 c2 β c« p) . m 02 c4 c2 p2
Mit (m 0 c2 β « c« p « )(m 0 c2 β c« p) m 02 c4 β « β m 0 c3 (β « « p« p « β) c2 « p « « p (2.42b)
2 c4 « m c3 β(α α α α ) p e 0 k l l k l k
(2.42c)
2 c4 « m c3 β2δ p e 0 kl l k
(2.168)
2 2 2 c4 « 2m c3 β pc2 « p2 2c2 p « p (2.102b) 2 4 « (m 0 c c p )2c H f p 0
m 0
m 0
c2 αl pl αk αm pm ek
c2 αk αl pl αm pm ek
2c2 δkl pl αm pm ek
m 0
ergibt sich daraus Λ « Λ «
2c Hf p
und
Hf 2
«
cH p 1 « Λ « Λ f 2 2 Hf
c pΛ . Hf 2
2. In Kapitel Q3.6 der Quantenmechanik wurde aus dem Ansatz H f (x, p) Gleichung H /∂ p abgeleitet. Aus Λg( Hf ) und Hf f ( p) folgt Λ g( f ( p))g( p), (Q3.128), x, H (h/i)∂ und daher ergibt sich mit dem gleichen Beweisgang wie für Gleichung (Q3.128) x, Λ
Aus (2.103) folgt ∂Λ ∂p
c« 2 m 0 c4 c2 p 2
h ∂ Λ . i ∂p
c2 H f p 3/2 m 02 c4 c2 p2
c« Hf 2
und durch Kombination mit der Formel für x, Λ ergibt sich Λx
c« x Λ i h Hf 2
c2 Λ p Hf 2
.
c2 Λ p Hf 2
,
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
33
Damit und mit Λ2 Hf2 / Hf2 1 erhalten wir Λx Λ x Λ2
c« Λ i h Hf 2
c2 Λ2 p Hf 2
c« Λ x i h Hf 2
c2 p Hf 2
Hieraus folgt mit (2.114a) unmittelbar (2.115b).
.
Mit x hat auch jede Potenz und allgemeiner jede Funktion von x einen geraden und einen ungeraden Anteil, d. h. Φ(x), Φ(x), A(x) und A(x) sind alle von null verschieden. Durch Einwirken des Operators « A(x) wird das Energievorzeichen von ψ ( ) zweimal verändert und bleibt daher insgesamt unverändert, d. h. « A(x) ist ein gerader Operator. « A(x) und « A(x) ändern das Vorzeichen von ψ ( ) nur einmal und sind daher ungerade Operatoren. Damit und mit (2.112a) erhalten wir für den Hamilton-Operator (2.102) H
H
mit H
H H
(2.116)
q Φ(x) cq « A(x)« A(x) , q Φ(x) cq « A(x) « A(x) . H f
(2.117) (2.118)
Ist nun ψ(x, 0)ψ () (x, 0) ein Anfangszustand positiver Energie, so entwickeln sich aufgrund der Bewegungsgleichung i h∂
tψ
H ψ H ψ H ψ
aus diesem zwangsläufig auch ψ-Anteile negativer Energie, weil () i h∂
tψ
H ψ () H ψ ()
gilt und H ψ () (x, 0) von null verschieden ist.
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung Es ist interessant, den nicht-relativistischen Grenzfall der Dirac-Gleichung allgemein zu untersuchen. Bei den Ebene-Welle-Lösungen positiver Energie waren in diesem nur die zwei oberen Spinorkomponenten von Bedeutung, bei denen negativer Energie nur die zwei unteren. Dieser Sachverhalt motiviert dazu, auch bei Teilchen in äußeren Feldern im nicht-relativistischen Grenzfall die Zerlegung (2.73) des Viererspinors ψ in zwei Zweierspinoren ϕ und χ vorzunehmen. Für jeden beliebigen Zustand ψ(x, t) ist eine Fourier-Zerlegung (2.89) möglich, und ϕ wird dann im wesentlichen die Lösungsanteile positiver enthalten, χ die Lösungsanteile negativer Energie. Mit (2.51b) 1 ϕ χ 0 ϕ 0 ϕ « ψ , βψ 0 1 χ χ χ ϕ 0
34
2 Dirac-Theorie des Elektrons und des Neutrinos
und (2.65) zerfällt die Dirac-Gleichung (2.55) dann in die zwei Gleichungen ih ∂t ϕ ih ∂t χ
(m 0 c2 qΦ) ϕ c χ , (m 0 c2 qΦ) χ c ϕ .
(2.119)
2.8.1 Zeitunabhängige Felder A und Wir behandeln zuerst den einfacheren Fall, daß die Felder A und Φ nicht von t abhängen. In diesem kann die allgemeine Lösung ψ(x, t) nach den Eigenfunktionen des Hamilton-Operators entwickelt werden, der ebenfalls zeitunabhängig ist. Mit dem Ansatz ϕ ϕα e iEα t /h , χ χα eiEα t /h (2.120) erhalten wir die letzteren nach (2.119) aus den Gleichungen E α ϕα
(m 0 c2 qΦ) ϕα cσl π l χα ,
E α χα
2
(m 0 c qΦ) χα cσl π l ϕα
. (2.121)
(Dabei wird die Summenkonvention benutzt, wobei über unterstrichene Indizes nicht summiert wird.) Indem wir (2.121b) nach χα auflösen, χα
c σm π m ϕα , (E α m 0 c2 qΦ)
und das Ergebnis in (2.121a) einsetzen, erhalten wir h 1 ∂l σm π m ϕα E α ϕα (m 0 c2 qΦ) ϕα c2 σl i E α m 0 c2 qΦ Hierin gilt
σl σm π l π m
(2.122)
c2 σl σm π l π m ϕα . E α m 0 c2 qΦ (2.123)
2 h q A q h B . i
Beweis: Für die linke Seite von (2.124) folgt zunächst σm σl πm πl σl σm πl πm σl σm πm πl πl , πm 12 σl , σm πm πl (Q7.43)
2
(2.124)
1 σ σ π , π 2 l m l m
1 σ σ π , π , 2 l m l m
wobei die vierte Form des Ausdrucks durch Kombination der ersten und dritten entstanden ist. Im zweiten Term des zuletzt erhaltenen Ergebnisses liefern alle Summanden mit l m keinen Beitrag, es verbleibt die Summe über die drei zyklischen Kombinationen 12, 23 und 31 sowie die drei antizyklischen Kombinationen 21, 32 und 13 von l und m. Mit πl , πm πm , πl , (Q7.45)–(7.46) und h h h h ∂l q Al ∂m q A m ∂m q A m ∂l q Al πl , πm i i i i h q h (∂l A m ) (∂m Al ) q für l, m, n zyklisch Bn i i
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
35
folgt daher (ohne Summenkonvention)
1 σ σ π , π 2 l m l m
l,m l m
σl σm π l , π m
(Q7.45)
q h
l,m zykl
3
σn B n .
n 1
Setzt man dies und die Definition (2.65) in die beim ersten Beweisschritt abgeleitete Formel ein, so erhält man (2.124).
Mit (2.124) und
h 1 ∂l i E α m 0 c2 qΦ
q h(∂l Φ) i (E α m 0 c2 qΦ)2
lautet (2.123) E α ϕα
q hc2 σl (∂l Φ) σm π m ϕα i (E α m 0 c2 qΦ)2 % $ 2 2m 0 c2 h qh 1 q A 2m B ϕα . E α m 0 c2 qΦ 2m 0 i 0
(m 0 c2 qΦ) ϕα
(2.125)
Dies ist eine lineare Eigenwertgleichung zweiter Ordnung für ϕα alleine, die den Eigenwert E α allerdings in nichtlinearer Weise enthält. Ist aus ihr ϕα bestimmt, so erhält man aus (2.122) auch unmittelbar χα . Wir suchen jetzt den nicht-relativistischen Grenzfall der Gleichung (2.125) für Zustände positiver Energie E α . Im quasiklassischen Grenzfall ergibt sich aus (2.5) mit (2.6) für positive Energien H E m 0 c2 1 v2 2 1 m 0c . E qΦ c m 02 c2 m 2 v 2 2 c2 1v 2 /c2 Bei nicht-relativistischen Geschwindigkeiten v/c 1 ist demnach & 1 v2 (E m 0 c2 qΦ) (m 0 c2 ) 2 c2
1.
In Analogie dazu definieren wir den nicht-relativistischen Grenzfall für die quantenmechanischen Lösungen positiver Energie durch ' '& ' E α m 0 c2 qΦ ' (m 0 c2 ) 1 . (2.126) Diese Bedingung wird erfüllt, wenn sich E α nur wenig von der Ruheenergie m 0 c2 unterscheidet und qΦ m 0 c2 gilt. Häufig hat man es allerdings mit Problemen zu tun, bei denen qΦ divergiert. (Das tut z. B. das Potential des Atomkerns.) In der klassischen Mechanik entsteht hierdurch kein Problem, weil die Bedingung nur dort erfüllt sein muß, wohin das Teilchen wirklich gelangt. Quantenmechanisch muß die Bedingung überall dort erfüllt sein, wo die Wellenfunktion ϕ wesentlich von Null verschieden ist. Wir überzeugen uns anhand eines Beispiels davon, daß hierdurch im allgemeinen kein
36
2 Dirac-Theorie des Elektrons und des Neutrinos
Problem entsteht. Dazu betrachten wir den Grundzustand des Wasserstoffatoms. In ihm ist die Wellenfunktion nur in der unmittelbaren Umgebung einer Kugelschale, die vom Kern den Abstand rB h /(αm 0 c) (Bohrscher Radius) besitzt, wesentlich von Null verschieden. In dieser Zone ergibt sich aber
qΦ m 0 c2
e2 α 4πε0 h c
e2 4πε0rB m 0 c2
5 10 5 1 ,
(2.127)
E α m 0 c2 qΦ m 0 c2 2 2m 0c2 , m 0 c2
(2.128)
s.u.
α2
wobei α e2 /(4πε0 h c) 1/137 benutzt wurde. Ist die Bedingung (2.126) erfüllt, so gilt E α m 0 c2 qΦ
und der letzte Term der rechten Seite von (2.125) vereinfacht sich zu
1 2m 0
2 h q h q A 2m B ϕα . i 0
Von dem Ausdruck π m ϕα im zweiten Term der rechten Seite von (2.125) erhalten wir die Größenordnung, indem wir ihn für die Wellenlösung (2.69) der kräftefreien DiracGleichung ( (h /i) ) abschätzen: Da die Elemente der Matrizen σi die Größenordnung eins besitzen, gilt im nicht-relativistischen Grenzfall ' ' ' ϕα ' pϕα m 0 v ϕα . (2.129) ∂l Φ hat z. B. im Wasserstoffatom die Größenordnung Φ/rB . Damit erhalten wir für das Verhältnis des zweiten Terms der rechten Seite von (2.125) zum Anteil qΦϕα des ersten Terms ' ' ' q h c2 σl (∂l Φ)σm π m ϕα ' (2.128) q h c2 (Φ/rB )m 0 v ϕα ' ' m hcv2r αvc 1 , ' i (E m c2 qΦ)2 qΦϕ ' m 02 c4 qΦϕα α 0 α 0 B d. h. der zweite Term kann vernachlässigt werden. Insgesamt ergibt sich damit für den nicht-relativistischen Grenzfall von Gleichung (2.125) E α ϕα
(m 0 c2 qΦ) ϕα
1 2m 0
2 h q h qA B ϕα , i 2m 0
(2.130)
und Gleichung (2.122) führt näherungsweise zu χα
1 σl π l ϕα . 2m 0 c
(2.131)
Mit der Abschätzung (2.129) ergibt sich hieraus im nicht-relativistischen Grenzfall χα
vc ϕα .
(2.132)
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
37
Wegen v/c 1 können daher die Komponenten χα gegen die Komponenten ϕα vernachlässigt werden – oft werden deshalb die zwei oberen Komponenten des DiracSpinors ψ als große Komponenten und die zwei unteren als kleine Komponenten bezeichnet. Dieses Ergebnis bedeutet, daß der Viererspinor ψ der Dirac-Theorie im nicht-relativistischen Grenzfall effektiv zu einem Zweierspinor zusammenschrumpft. Nach (2.120) und wegen der Linearität der Dirac-Gleichung ist ϕ cα ϕα e iEα t /h (2.133)
α
eine Lösung des zeitabhängigen Problems. Da die Eigenfunktionen ϕα wie in der nichtrelativistischen Quantentheorie ein vollständiges Funktionensystem bilden, kann die Lösung (2.133) jeder beliebigen Anfangsbedingung angepaßt werden und ist daher die allgemeinste zeitabhängige Lösung. Die Anfangsbedingung kann insbesondere so gestellt werden, daß nur Eigenzustände ϕα zu positiven Eigenwerten E α angeregt sind, welche die Bedingung (2.126) erfüllen. Dann gilt jedoch Gleichung (2.130), und wir erhalten mit dieser aus (2.133) ih ∂t ϕ cα E α ϕα eiEα t /h
α
(m 0 c2 qΦ)
α
(m 0 c2 qΦ)
2 h qh 1 qA B 2m 0 i 2m 0
2 h 1 qA 2m 0 i
Nun gehen wir noch mit der Transformation 2 im 0 c t /h ∂t Ψ ∂t ϕ ϕ Ψe
2mq h B
cα ϕα eiEα t /h
ϕ.
0
i m 0 c2 Ψ h
eim 0 c
(2.134)
2 t /h
(2.135)
von ϕ zu einem Spinor Ψ über, der wegen ϕϕ
Ψ
Ψ
dieselben physikalischen Eigenschaften wie ϕ besitzt. Gleichung (2.134) wird durch die Transformation in
ih ∂t Ψ
$ qΦ
1 2m 0
2 % h qA Ψ i
2mq h B 0
Ψ
(2.136)
überführt. Das ist gerade die Pauli-Gleichung (Q7.41) für die Quantendynamik eines geladenen Spin-1/2-Teilchens mit dem gyromagnetischen Verhältnis gs 2 im elektromagnetischen Feld. Wir dürfen die Dirac-Gleichung daher als relativistische Verallgemeinerung der Pauli-Gleichung für Elektronen interpretieren.
38
2 Dirac-Theorie des Elektrons und des Neutrinos
Dieses Ergebnis ist einerseits höchst erfreulich, bedeutet andererseits aber eine erhebliche Einschränkung: Die unter ganz allgemeinen Gesichtspunkten aufgestellte relativistische „Wellengleichung“ (2.55) ist in ihrer Gültigkeit auf Teilchen eingeschränkt, die den Spin 1/2 und das gyromagnetische Verhältnis gs 2 besitzen. Wir können mit ihr zwar Elektronen und Positronen beschreiben, und für m 0 0 sowie q 0 auch noch Neutrinos, worauf wir in Abschn. 2.14 zurückkommen werden. Für Teilchen mit anderen Eigenschaften wie z. B. Protonen ist sie jedoch ungeeignet. Es sei ausdrücklich darauf hingewiesen, daß bei unserer Ableitung des nichtrelativistischen Grenzfalls als wesentlicher Faktor einging, daß wir es mit Lösungen positiver Energie zu tun haben. Analog läßt sich auch ein nicht-relativistischer Grenzfall für Lösungen negativer Energie herleiten. Für diesen müßte E α in der Nähe von m 0 c2 liegen, und wir hätten anstelle der Bedingung (2.126) E α m 0 c2 qΦ /(m 0 c2 ) 1 zu fordern. Es zeigt sich, daß in diesem Fall die zwei unteren Komponenten von ψ die großen Komponenten sind, gegenüber denen die zwei oberen Komponenten vernachlässigt werden können (Aufgabe 2.5). Anmerkungen: 1. Im Spezialfall Φ 0 entfällt in Gleichung (2.125) der zweite Term der rechten Seite. Wird m 0 c2 ϕα auf die linke Seite gebracht und die Gleichung anschließend mit E α m 0 c2 multipliziert, so erhält sie die Form E α2 ϕα
m 02 c4 ϕα
c
$ 2
% 2 h q A q h B ϕα , i
(2.137)
in die keine Näherung eingegangen ist. Man erkennt an dieser unmittelbar, daß zu jeder Eigenlösung ϕα zum Eigenwert E α > 0 auch E α ein möglicher Eigenwert ist, d. h. zu jedem positiven existiert ein negativer Eigenwert der Energie. 2. Aus dem Ansatz (2.133) folgt durch zweimalige Zeitableitung h 2 ∂t t ϕ
cα E α2 ϕα e
iE α t /h
.
Setzen wir hier auf der rechten Seite (2.137) ein und benutzen nochmals (2.133), so erhalten wir
h
2
∂t t ϕ
m 02 c4 ϕ
c
$ 2
% 2 h q A q h B ϕ . i
(2.138)
Man erhält diese Gleichung auch direkt, indem man (2.119a) für Φ 0 einmal nach t differenziert und in der dabei erhaltenen Gleichung ∂t ϕ und ∂t χ durch die Gleichungen (2.119) ausdrückt. (Man beachte dabei unsere Voraussetzung ∂t A 0.) Im Fall Φ 0 können die für ϕ und χ erhaltenen Gleichungen also exakt separiert werden, was eine erhebliche Vereinfachung bei der Lösung der Dirac-Gleichung darstellt.
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
2.8.2 Zeitabhängige Felder A und
39
Bei zeitabhängigen Feldern A und Φ wird der Hamilton-Operator (2.58) zeitabhängig. Der in Abschn. 2.8.1 durchgeführte Grenzübergang zum nicht-relativistischen Fall über das Eigenwertproblem ist dann nicht mehr möglich. Wir machen stattdessen den zu (2.135a) analogen Ansatz 2 ϕ ϕ (2.139) e im 0 c t /h χ χ und erhalten mit ihm aus dem Gleichungssystem (2.119) ih ∂t ϕ
qΦ ϕ cσl π l χ ,
ih ∂t χ
qΦ χ
2m 0c2χ cσl π l ϕ .
(2.140)
Bei zeitunabhängigen Potentialen Φ und A gilt für die stationären Eigenlösungen (2.120) positiver Energie χ oder
χα e χ α
iE α t /h (2.139)
χα e
χ α e
im 0 c2 t /h
i(E α m 0 c2 )t /h
.
Im nicht-relativistischen Grenzfall E α m 0 c2 ergibt sich hieraus
h ∂t χα (Eα m 0c2)χα 2m 0c2χα . Analog dazu definieren wir den nicht-relativistischen Grenzfall bei zeitabhängigen Feldern unter zusätzlicher Benutzung der Abschätzung (2.127) durch die Forderungen
qΦ m 0 c2,
h ∂t χ 2m 0c2 χ .
(2.141)
Sind diese erfüllt (der Ansatz (2.139) ermöglicht das nur für Lösungen positiver Energie, denn für E α m 0 c2 gilt ih ∂t χ α 2m 0 c2 χ α ), so folgt aus (2.140b) χ
1 σm π m ϕ . 2m 0 c
(2.142)
Setzen wir dies in (2.140a) ein, so erhalten wir wieder die Pauli-Gleichung (2.136). Für die Erfüllbarkeit der Bedingungen (2.141) ist sicher notwendig, daß sich die Felder A und Φ hinreichend langsam verändern und daß H m 0 c2 gilt. Ob (2.141) von einer Lösung der Pauli-Gleichung tatsächlich erfüllt wird, überprüft man an der Bedingung ' ' ' 2 ' ' '' 2mh0c '' ϕ '' , (2.143) '∂t ( ϕ) die sich durch Einsetzen von (2.142) in (2.141b) ergibt.
40
2 Dirac-Theorie des Elektrons und des Neutrinos
Exkurs 2.1: Ableitungs-Linearisierung der Schrödinger-Gleichung Die Quantisierung der relativistischen Mechanik liefert auch unter nicht-relativistischen Verhältnissen nicht die Schrödinger-Gleichung. Andererseits ist die klassische relativistische Mechanik bei nicht-relativistischen Geschwindigkeiten praktisch der klassischen nicht-relativistischen Mechanik äquivalent. Letzteres läßt vermuten, daß es möglich sein sollte, die Pauli-Gleichung auch direkt aus der Schrödinger-Gleichung abzuleiten. In diesem Abschnitt wird gezeigt, daß dies tatsächlich gelingt. Dabei werden zum Teil dieselben Ideen benutzt, die Dirac zur Ableitung der Dirac-Gleichung führten. Unter Benutzung der Definition (2.65) schreiben wir die Schrödinger-Gleichung (Q3.46) in der Form (2.144) 2m (ih ∂t qΦ) 2 ψ 0 und merken an, daß der Übergang vom kräftefreien Fall (Φ 0, A 0) zum allgemeinen Fall durch die Ersetzungen h h p q A (2.145) ih ∂t ih ∂t qΦ , i i bewirkt wird. Die damit verbundene Kopplung der Felder Φ und A an geladene Teilchen wird als minimale Kopplung bezeichnet. Als erstes betrachten wir den kräftefreien Fall mit der Schrödinger-Gleichung
Ëψ
2m ih ∂t
h 2 ψ
0.
(2.146)
In Analogie zum Diracschen Ansatz (2.20) suchen wir eine lineare und homogene „Wellengleichung“ Lψ 0, (2.147) der die gestellten die in den Zeit- und Ortsableitungen linear ist. Der allgemeinste Ansatz für L, Forderungen erfüllt, ist L a ∂t b c . (2.148)
Um den Zusammenhang mit der Schrödinger-Gleichung herzustellen, verlangen wir, daß sämtliche Lösungen der „Wellengleichung“ (2.147) auch die Schrödinger-Gleichung (2.146) erfüllen. Das ist sicher dann der Fall, wenn ein Operator M
a ¼ ∂t
b¼ c¼
(2.149)
existiert, mit dem die Beziehung M L
Ë
(2.150)
0.) erfüllt werden kann. (Aus L 0 folgt dann Ëψ M Lψ Operatoren M und L, die alle gestellten Forderungen erfüllen, sind
h m (β 1) , i (2.151) wobei β und « die vertrauten Dirac-Matrizen sind. (Es kann gezeigt werden, daß L und M MatrixOperatoren sein müssen, die mindestens die Dimension 4 4 besitzen.) Aus den Gleichungen L
1 (β 1) ih ∂t 2
i «
h m (β 1) , i
M
1 (β 1) ih ∂t 2
i «
2.8 Nicht-relativistischer Grenzfall der Dirac-Gleichung
41
(2.151) ergibt sich nämlich ML
h 2 2 (β 1) ∂t t 4
h
2α α ∂ ∂ l m l m
ih 2 β, « 2
h
m « , β
∂t
m2
(β 1)2 (β 1)2 ih ∂t
m 2 (β 2 1).
(2.42c)
Mit (2.42) und αl αm ∂l ∂m αm αl ∂m ∂l 12 αl , αm ∂l ∂m δlm ∂l ∂m folgt hieraus sofort die Gültigkeit von (2.150). Aus (2.147) mit (2.151a) läßt sich auch eine Kontinuitätsgleichung für ψ ψ ableiten, die gelten muß, damit ψ ψ als Wahrscheinlichkeitsdichte interpretiert werden kann. (Wir hätten das gleich zu Beginn durch entsprechende Forderungen an die Koeffizienten a, b und c verlangen können.) Den Übergang zum Fall mit elektromagnetischem Feld vollziehen wir jetzt in (2.147) wie bei der Schrödinger-Gleichung, d. h. wir nehmen in dem durch (2.151) gegebenen Operator L die Ersetzungen (2.145) vor und erhalten die Gleichung 1 (2.152) (β 1) (ih ∂t qΦ) ψ i « ψ m (β 1) ψ 0 . 2 Zerlegen wir ψ wie bei der Dirac-Gleichung gemäß (2.73) in Zweierspinoren und benutzen die Darstellung (2.51) der Dirac-Matrizen, so ergibt sich aus (2.152) ϕ 0 i 1 0 ϕ 0 0 ϕ (ih ∂t qΦ) 2m 0 i 0 χ 0 0 χ 0 1 χ oder
(ih ∂t qΦ) ϕ i χ
0,
i ϕ 2m χ
0.
(2.153)
Setzen wir die aus (2.153b) folgende Beziehung χ
i 2m
ϕ
(2.154)
in (2.153a) ein, so ergibt sich mit (2.124) (ih ∂t
qΦ) ϕ
1 2m
2 h q h qA ϕ B ϕ , i 2m
also wieder die Pauli-Gleichung (Q7.41). Die Mehrkomponentigkeit der Wellenfunktion und das damit verbundene Auftreten der Spinfreiheitsgrade – daher der Name Spinor für ψ – kommt von der Forderung, daß die Bewe nur linear sein soll. Diese Forderung kann im gungsgleichung (2.147) im Impulsoperator (h/i) Grunde nur durch die Relativitätstheorie begründet werden, und insofern ist der Spin des Elektrons ein relativistischer Effekt. Sobald diese Forderung akzeptiert ist, kann die Pauli-Gleichung jedoch aus der Schrödinger-Gleichung deduziert werden, wodurch der nicht-relativistische Grenzwert des gyromagnetischen Verhältnisses erhalten wird. Man könnte also sagen: Der Spin ist ein relativistischer Effekt, die Stärke seiner Wechselwirkung mit dem Magnetfeld ist jedoch nicht-relativistisch determiniert. Führt man die Ersetzungen (2.145) in den Gleichungen (2.151) auch beim Operator M durch, so führt der Operator M L im Fall zeitunabhängiger Vektorpotentiale A ebenfalls zur PauliGleichung, es ergibt sich (Aufgabe 2.6) 2 h 0 . M L 2m(ih ∂t qΦ) q A qh B mit 0 i
42
2 Dirac-Theorie des Elektrons und des Neutrinos
2.9 Spinoperator
Wir benötigen im weiteren Verlauf einen Operator, der im Raum der Dirac-Spinoren den Spin repräsentieren kann, und wählen hierfür den Operator, dessen Mittelwert im nicht-relativistischen Grenzfall den Mittelwert des Spinoperators der Pauli-Gleichung liefert. Der Operator 0 0 , (2.155) bei dem die Komponenten σl von die Pauli-Matrizen sind, erfüllt diesen Zweck. Wegen der Hermitezität der 2 2-Matrizen σl sind auch die Komponenten Σl von hermitesche Matrizen. Mit der Zerlegung (2.73) erhalten wir
ψ
0
0
ϕ χ
ϕ χ
und der gemäß (2.57) gebildete Mittelwert ist somit 3 3 (2.135a) Ψ ϕ ϕ d x χ χ d x
,
Ψd x
χ
3
χ d 3x .
Im nicht-relativistischen Grenzfall ist der letzte Term nach (2.132) im Verhältnis v 2/c2 kleiner als der vorletzte, und wir erhalten Ψ Ψ d 3x . Rechts steht – bis auf den Faktor h /2 – der Erwartungswert des Spins nach der PauliTheorie. Daher ist S
h 2
(2.156)
ein für viele Zwecke geeigneter relativistischer Operator für den Spin. Aus der Darstellung (2.155) von ergibt sich fast unmittelbar, daß sich die Beziehungen (Q7.43), (2.87), (2.88) und (2.76) von auf übertragen lassen, d. h. es gilt
Σl , Σm 2δlm , Σl Σm a b a b i ( a b ) . Beweis: Aus
Σl Σm
σl 0
0 σl
σm 0
0 σm
δlm
i εlmn Σn
(2.157) (2.158)
σl σm 0
0 σl σm
folgt, daß alle Produkte von -Komponenten zu Matrizen führen, deren Elemente die entsprechenden Produkte von -Komponenten enthalten und die gleiche Diagonalstruktur wie die Matrix aufweisen.
2.9 Spinoperator
43
Eine unmittelbare Folge von (2.157a) bzw. Σx2 Σ y2 Σz2 1 ist S2
h 2 2 Σx Σ y2 Σz2 4
3 2 h , 4
(2.159)
d. h. die Matrix S2 ist proportional zur Einheitsmatrix. Hieraus folgt, daß jeder beliebige Viererspinor ein Eigenzustand von S2 zu dem einzigen Eigenwert 3h 2 /4 ist. Der durch beschriebene Spin hat gemäß der Formel S2 ψ h 2 s(s 1)ψ die Spinquantenzahl s 1/2. Wir berechnen auch noch die Eigenwerte sz und Eigenzustände des Operators ⎛ ⎞ 1 0 1 σz 0 ⎜ ⎟ (2.160) Σz ⎝ ⎠. 0 σz 1 0 1 sz bzw. Aus der Eigenwertgleichung Σz ⎛ ⎞ ⎛ ⎞⎛ 1 0 1 1 ⎜ ⎟⎜ 2⎟ ⎜ ⎝ ⎠ ⎝ ⎠⎝ 1 3 1 0 4
1
⎞
2⎟ 3 4
⎠
⎛
sz ⎜ sz ⎝ sz sz
1
⎞
2⎟ 3
⎠
4
ergeben sich die Gleichungen (1 sz )
1
0,
(1 sz )
0,
2
(1 sz )
3
0,
aus denen entweder sz 1 und 2 4 0 oder sz 1 und 1 erhalten wir die auf eins normierten Eigenzustände ⎛ ⎞ ⎛ ⎞ 1 0 1 ⎜0⎟ 1 ⎜1⎟ ⎝ 1 ⎠ zu sz 1 , ⎝ 0 ⎠ zu 2 2 0 1 die Σz
(1 sz ) 3
sz
4
0,
0 folgt. Daraus
1 ,
(2.161)
(2.162)
erfüllen. Um einen Zusammenhang zwischen den Operatoren « und ¦ herzustellen, führen wir eine weitere Matrix (2.163) τ i αx α y αz ein. Diese hat die Darstellung τ
0 1 1 0
(2.164)
und besitzt die Eigenschaften τ
τ,
τ2
1.
(2.165)
44
2 Dirac-Theorie des Elektrons und des Neutrinos
Der Zusammenhang zwischen « und
«
τ¦
¦τ
¦ ist
¦
bzw.
τ«
«τ ,
(2.166)
es gelten die Vertauschungsrelationen
«, τ
β, τ
0,
¦ , τ
0,
¦ , β
0,
0,
(2.167)
und aus (2.158) folgt
« a « b a b i τ « (a b ) .
(2.168)
Beweis: Durch Einsetzen von (2.51a) in (2.163) ergibt sich 0 σ x σ y σz i . τ σ x σ y σz 0 Für die Darstellung (Q7.39) der Pauli-Matrizen gilt i 1 0 1 0 σ x σ y σz i 0 0 1 0 Damit ist τ
i
0 iE
iE 0
0 1
0 1 1 0
i 0 0 i
iE.
.
(2.165) folgt gemäß τ
i αz α y α x
τ2
(2.43b)
α x α y αz α x α y αz
i αz α y α x
(2.42c)
(2.42c)
α x2 α 2y αz2
i α y αz α x
(2.42c)
Für zyklische l, m und n gilt 0 σm 0 σl σl 0σm αl αm σl 0 σm 0
i α y α x αz
i α x α y αz
τ,
1.
0 σl σm
i
σn 0
0 σn
(2.155)
i Σn .
(2.169)
Unter Benutzung von α x2 1 ergibt sich damit z. B. Σx
i α y αz
i α x2 α y αz
αx τ
i α y α x2 αz
(2.42c)
i α x α y αz α x
τ αx ,
und analog findet man Σ y α y τ τ α y sowie Σz αz τ τ αz , insgesamt also (2.166b). (2.166a) ergibt sich aus (2.166b) durch Links- oder Rechtsmultiplikation mit τ und Benutzung von (2.165b). Die Vertauschungsrelationen (2.167a) und (2.167c) folgen unmittelbar aus den verschiedenen Darstellungen von « bzw. ¦ in (2.166). (2.167b) und (2.167d) folgen gemäß βτ
¦ , β
(2.166b)
i βα x α y αz
«τβ
β «τ
i α x α y αz β
«βτ
(2.42b) (2.167b)
β «τ
τβ ,
(2.42b)
β «τ
β «τ
0.
Der Beweis von (2.168) ergibt sich aus (2.158) mit (2.166b) gemäß a b i τ « ( a b )
a b i ¦ (a b ) ¦ a ¦ b τ « a τ « b (2.167a) 2 τ « a « b (2.165b) « a « b .
2.10 Kovarianz der Dirac-Gleichung
45
Ableitungsgemäß stellt S h /2 für hinreichend kleine Teilchenenergien eine gute Näherung an den Spinoperator dar, die im (mittleren) Ruhesystem des Teilchens sogar exakt wird. Gleichung (2.156) mit (2.155) definiert allerdings nur einen Dreiervektor und liefert daher keine relativistisch invariante Darstellung des Spins. Die Ableitung eines relativistisch invarianten Spinoperators ist ziemlich kompliziert und wird hier nicht weiter verfolgt.6
2.10 Kovarianz der Dirac-Gleichung In diesem Abschnitt werden die Transformationseigenschaften der Dirac-Gleichung untersucht, die als relativistische Gleichung natürlich Lorentz-invariant sein muß. Dabei muß auch die Frage geklärt werden, wie die Spinoren ψ zu transformieren sind. Als erstes bemühen wir uns um eine in der Zeit- und den Ortskoordinaten symmetrische Schreibweise der Dirac-Gleichung (2.55). Dazu multiplizieren wir diese mit β/c und erhalten mit x 0 ct, x 1 x, x 2 y und x 3 z ih (β∂0 βαl ∂l ) ψ
(2.42a)
m 0c ψ
q (βΦ/cβαl Al ) ψ .
(2.170)
Die Gleichung ist wie bisher gewohnt so zu verstehen, daß lateinische Indizes die drei Werte 1, 2 und 3 annehmen können und daß über doppelt auftretende Indizes summiert wird. Nun führen wir durch γ0 neue Matrizen γ α (α
β,
γl
βαl (l
1, 2, 3)
0, 1, 2, 3) ein, die nach (2.51) durch 1 0 0 σl γ0 , γl 0 1 σl 0
(2.171)
(2.172)
gegeben sind. Nach der Speziellen Relativitätstheorie, Kapitel „Relativistische Formulierung der Elektrodynamik“ ist ( ) Aα Φ/c, A ein kovarianter Vierervektor. Hiermit, mit den Definitionen (2.171) und der Elektronenladung q e läßt sich Gleichung (2.170) in die symmetrische Form γ
α
h ∂α e Aα ψ i
m 0c ψ
0
(2.173)
bringen. Dies ist die kovariante Form der Dirac-Gleichung. (Griechische Indizes können die vier Werte 0, 1, 2 und 3 annehmen. Bei doppeltem Auftreten griechischer Indizes wird dementsprechend über vier Terme summiert, wobei jetzt die Konvention der 6 Für nähere Einzelheiten siehe z. B. S. 57 ff. des Buchs [12] der Literaturliste und die dort angegebene Literatur.
46
2 Dirac-Theorie des Elektrons und des Neutrinos
Relativitätstheorie benutzt wird, nach der von doppelt auftretenden Summationsindizes einer unten und einer oben stehen muß.) Für die Kombination γ α Aα hat R. Feynman die als Feynman-Dolch oder (englisch) als Feynman-Dagger bezeichnete Kurznotation γ α Aα
A /
(2.174)
eingeführt, mit der die Dirac-Gleichung die Form h ∂/ ψ i
e/Aψ m 0 c ψ
0
(2.175)
erhält. Jetzt wenden wir uns den Transformationseigenschaften der Gleichung (2.173) zu. Bei der Lorentz-Transformation d x ¼α Λαβ d x β transformieren sich die kovarianten Vektorgrößen ∂α und Aα nach der Speziellen Relativitätstheorie, Abschn. „Vektoren und Tensoren der vierdimensionalen Raum-Zeit“ gemäß ∂α
Λβα ∂ ¼β
Aα
Λβα A¼β .
Wird dies in (2.173) eingesetzt, so erhalten wir h ¼ ∂ β e A¼β ψ m 0 c ψ Λβα γ α i
(2.176)
0.
(2.177)
Weiter unten wird bewiesen, daß eine – nicht notwendig unitäre und nur von Λαβ abhängige – 4 4-Matrix S existiert, die für alle Indizes β die Gleichung S 1 γ β S
Λβα γ α
(2.178)
erfüllt. Setzen wir dies in Gleichung (2.177) ein und multiplizieren diese noch von links mit S, so erhalten wir schließlich β h ¼ ¼ γ ∂ β e A β ψ ¼ m 0 c ψ ¼ 0 , (2.179) i sofern ψ ¼ (x ¼ ) Sψ x(x ¼ ) (2.180) gesetzt wird. (Man beachte, daß die Dirac-Matrizen untransformiert bleiben!) Die Ruhemasse m 0 , die Elementarladung e und die Lichtgeschwindigkeit c sind LorentzInvarianten. Der Vergleich mit (2.173) zeigt: Die Dirac-Gleichung ist dann Lorentzinvariant, wenn auch noch h als Lorentz-Invariante definiert wird, wenn angenommen wird, daß die Dirac-Matrizen γ α in allen Inertialsystemen dieselbe Form besitzen, und wenn (2.180) das Transformationsgesetz für Spinoren ist. Wir überzeugen uns jetzt davon, daß Gleichung (2.178) eine Lösung besitzt. Dabei beschränken wir unsere Betrachtung zunächst auf den Fall einer LorentzTransformation zwischen Systemen in Standardkonfiguration. (Das System S ¼ bewegt
2.10 Kovarianz der Dirac-Gleichung
47
sich relativ zu S mit der Geschwindigkeit Ú v ex , zur Zeit t 0 sind S und S ¼ deckungsgleich.) Die Transformationsgleichungen lauten in diesem Fall t¼
t vx/c2 1 v 2 /c2
x¼
vt 1 v 2 /c2 x
y¼
z¼
y,
z
und können mit ϕ bzw.
sinh ϕ in die Form x ¼ α
artanh(v/c)
v/c
1
v 2 /c2
,
Λαβ x β mit ⎛
cosh ϕ ⎜ sinh ϕ ⎝ 0 0
Λαβ
1 1 v 2 /c2
cosh ϕ
sinh ϕ
⎞ 0 0⎟ ⎠ 0 1
0 0 1 0
cosh ϕ 0 0
(2.181)
gebracht werden. Für diese Transformationsmatrix erhält die rechte Seite von Gleichung (2.178) die Komponenten Λ0α γ α
γ 0 γ 0 (cosh ϕ 1) γ 1 sinh ϕ ,
Λ1α γ α
γ 1 γ 1 (cosh ϕ 1) γ 0 sinh ϕ ,
Λ2α γ α
γ2 ,
Λ3α γ α
γ3 ,
zusammengefaßt γ 0 (cosh ϕ 1)γ 1 sinh ϕ δ β0 γ 1 (cosh ϕ 1)γ 0 sinh ϕ δ β1 . (2.182) Wir verifizieren nun einfach durch Einsetzen, daß (2.178) die Lösung Λβα γ α
γβ
S
e
α1 ϕ/2
(2.183)
besitzt, wobei α1 die erste der in (2.51) definierten Matrizen ist. Die rechte Seite der Gleichung ist durch die Potenzreihenentwicklung der Exponentialfunktion erklärt, ϕ 2 ϕ 1 1 3 ϕ 3 S 1 α1 α12 α1 . (2.184) 2 2 2 3 2 Beweis: Mit α12
1,
folgt aus (2.184) 1 ϕ 2 S 1 2 2 ϕ cosh 2 α1 sinh
α13
1 ϕ 4 4 2 ϕ . 2
α1
α14
1,
ϕ . . . α1 2
α15
α1 ,
1 ϕ 3 3 2
... 1 ϕ 5 5 2
... (2.185)
48
2 Dirac-Theorie des Elektrons und des Neutrinos
Die Darstellung (2.183) ermöglicht in besonders einfacher Weise die Berechnung der inversen Matrix S 1 , es ergibt sich ϕ ϕ α1 sinh . S 1 eα1 ϕ/2 cosh (2.186) 2 2 Hieraus folgt sofort S 1γ β
γ β cosh ϕ2
α1 γ β sinh
ϕ 2
γβS
ϕ α1 , γ β sinh 2
1
und mit sinh(ϕ/2) cosh(ϕ/2) (1/2) sinh ϕ sowie sinh2 (ϕ/2) (1/2)(cosh ϕ 1) (2.185) S 1γ β S γ β
γβ
ϕ ϕ ϕ α1 , γ β sinh cosh α1 , γ β α1 sinh2 2 2 2 1 1 α1 , γ β sinh ϕ α1 , γ β α1 cosh ϕ 1 . 2 2
(2.187)
Nun gilt
α1 , γ l
(2.171b)
α1 βαl
βαl α1 (2.42b) β α1, αl
(2.171a) α1 , γ 0 α1β βα1 (2.42b)
2βα1
(2.42c) (2.171a)
2 γ 0δ1l ,
2γ 1 ,
(2.171b)
zusammengefaßt also α1 , γ β 2 γ 0 δ β1 Mit (2.171) und α12 1 folgt hieraus α1 , γ β α1 2 βα1 δ β1
βα12 δ β0
γ 1 δ β0 .
2
γ 0 δ β0
(2.188)
γ 1 δ β1 .
(2.189)
Setzen wir (2.188)–(2.189) in (2.187) ein und vergleichen das Ergebnis mit (2.182), so finden wir (2.178) bestätigt.
Ein systematischer Weg zur allgemeinen Lösung von (2.178) wird im Exkurs 2.2 aufgezeigt. Für Systeme in Standardkonfiguration ergibt sich aus (2.180) mit (2.185) das Spinor-Transformationsgesetz ψ
ψ cosh
ϕ 2
α1 ψ sinh ϕ2 .
(2.190)
Offensichtlich unterscheidet sich dieses von dem Transformationsgesetz für Vierervektoren. Alle vierkomponentigen Größen, die sich wie ψ transformieren, werden als Dirac-Spinoren oder kurz Spinoren bezeichnet.
2.10 Kovarianz der Dirac-Gleichung
49
Exkurs 2.2: Allgemeines Transformationsgesetz für Dirac-Spinoren Die Transformationsmatrix S im Transformationsgesetz ψ ¼ Sψ für Spinoren ist eine Lösung der Gleichung (2.178), in (2.183) ist deren durch Einsetzen verifizierte Lösung für einen Spezialfall angegeben. Im folgenden wird systematisch die allgemeine Lösung abgeleitet. Wir führen zunächst eine für diesen Zweck besonders geeignete Darstellung der LorentzTransformation ein. Die allgemeinste affine Transformation eines Koordinatensystems setzt sich aus einer Translation, einer Streckung in Richtung jeder Koordinatenachse und einer Drehung zusammen. (Dabei sind unter den Streckungen auch Spiegelungen enthalten, wenn man diese als Streckungen um den Faktor 1 auffaßt.) Das gilt auch im vierdimensionalen Raum der Koordinaten x 0 , ..., x 3 . Lorentz-Transformationen sind spezielle affine Transformationen, sie setzen sich aus einer Translation, einer Drehung7 bezüglich der pseudoeuklidischen Metrik gμν und im Fall uneigentlicher Lorentz-Transformationen zusätzlich aus einer Spiegelung am Koordinatenursprung zusammen, es gilt x ¼ ν a ν Λνμ x μ . Durch geeignete Wahl des Koordinatenursprungs kann erreicht werden, daß sie nur aus einer Drehung und gegebenenfalls einer Spiegelung bestehen, so daß ν x ¼ Λνμ x μ mit Λνμ Λ μρ δ νρ
gilt, wobei Λ μρ die Transformationsmatrix für die inverse Lorentz-Transformation ist. (Siehe Spezielle Relativitätstheorie, Abschn. „Vektoren und Tensoren der vierdimensionalen RaumZeit“.) Die in Abschn. 2.10 untersuchte Transformation mit der Matrix (2.181) bildet ein spezielles Beispiel, der bei ihr aufgetretene Winkel ϕ kann als Drehwinkel aufgefaßt werden. In diesem Exkurs betrachten wir nur eigentliche Lorentz-Transformationen und ordnen jeder von diesen einen Drehwinkel um eine geeignet gewählte Achse zu, bei gegebener Drehachse schreiben wir Λνμ Λνμ (ϕ).
(Uneigentliche Lorentz-Transformationen werden später in Abschn. 2.13.3 betrachtet.) Außerdem benutzen wir im folgenden für (eigentliche) Lorentz-Transformationen zum Teil die Kurznotation x ¼ Λ(ϕ) x , bei der x und x ¼ Spaltenvektoren sind und Λ die Matrix mit den Komponenten Λνμ . Das Hintereinanderschalten zweier Lorentz-Transformationen ergibt wieder eine LorentzTransformation. Bewirkt die erste Transformation eine Drehung des Systems um den Winkel ϕ und die zweite bei gleicher Drehachse eine Drehung um dϕ, so ist das Ergebnis beider Transformationen zusammen dasselbe wie das einer einzigen Transformation, die auf dieselbe Drehachse bezogen um ϕ dϕ dreht, (2.191) Λ(ϕ dϕ) Λ(dϕ) Λ(ϕ). Nun gilt
Λ(dϕ) Λ(0) ω dϕ
1 ω dϕ,
(2.192)
da die Transformation Λ(0) das System unverändert läßt. Dabei ist ' dΛ(ϕ) '' ω . dϕ 'ϕ 0 7 Unter Drehung bezüglich der pseudoeuklidischen Metrik wird eine Bewegung verstanden, welche ds 2 gμν d x μ d x ν invariant läßt.
50
2 Dirac-Theorie des Elektrons und des Neutrinos
Gehen wir mit (2.192) in (2.191), so folgt Λ(ϕ dϕ) Λ(ϕ) ωΛ(ϕ) dϕ oder
dΛ dϕ
Diese Gleichung hat die Lösung
ωΛ .
Λ eωϕ ,
wobei die rechte Seite durch die Reihenentwicklung der Exponentialfunktion erklärt ist. Damit kann jede (eigentliche) Lorentz-Transformation in der Form ν μ x ¼ eωϕ μ x μ geschrieben werden. Aus der Bestimmungsgleichung (2.178) für S folgt, daß auch S eine Funktion des Drehwinkels ϕ wird. Wird das System erst um den Winkel ϕ gedreht, so wird der Spinor ψ in S(ϕ) ψ transformiert. Wird anschließend um den Winkel dϕ weitergedreht, so wirkt auf diesen Spinor die Transformation S(dϕ), und wir erhalten ψ¼
S(dϕ)S(ϕ) ψ .
Dasselbe Ergebnis wird erhalten, wenn gleich um den Winkel ϕ wieder S(ϕ dϕ) S(dϕ)S(ϕ) . Mit
S(dϕ) S(0)
erhalten wir analog
s dϕ
1
dϕ gedreht wird, d. h. es gilt
s dϕ
S(ϕ) esϕ ,
(2.193)
wobei die rechte Seite wieder durch die Reihenentwicklung erklärt ist. Ergebnis: Zur Lorentz-Transformation eωϕ gehört die Spinortransformation S esϕ , wobei ω und s durch die infinitesimale Transformation erklärt sind. Es genügt also, den Zusammenhang zwischen s und ω zu bestimmen, d. h. S für eine infinitesimale Transformation zu berechnen.
Infinitesimale Transformationen Für die infinitesimale Drehung um dϕ hatten wir S
1
s dϕ.
Wir setzen S 1 1 s dϕ und erhalten aus der Forderung S S 1 1 die Beziehung s S 1 Setzen wir dies und Λνμ
s 0 bzw.
1 s dϕ .
(2.192) ν δμ
ωνμ dϕ
(2.194)
2.10 Kovarianz der Dirac-Gleichung
51
in der Bestimmungsgleichung (2.178) für S ein, s dϕ) γ ν (1 s dϕ) (δ νμ ωνμ dϕ) γ μ ,
(1
so folgt durch Vergleich des in dϕ linearen Terms γ νs
s γν
ωνμ γ μ .
(2.195)
Multiplizieren wir diese Gleichung für ν 0 von links mit γ 0 β und berücksichtigen β 2 1, so folgt s γ 0 s γ 0 ω0μ γ 0 γ μ . Diese Form legt es nahe, s als Bilinearform in den γ ν bzw. γν gνμ γ μ anzusetzen,
cρσ γρ γσ .
s
(2.196)
Einsetzen dieses Ansatzes in (2.195) liefert γρ γσ γ ν ) ωνμ γ μ .
cρσ (γ ν γρ γσ
Aus den Vertauschungsrelationen (2.204) der γ ν wird nach Multiplikation mit gρα und mit β ν γρ γ ν
γ ν γρ 2 δνρ .
Hiermit folgt γ ν γρ γσ und
γρ γσ γ ν
2 δνρ γσ
γρ γ ν γσ
2 γρ δσ ν
γρ γ ν γσ 2 (δνρ γσ
γρ δσ ν )
ωνμ gμλ γλ ωνλ γλ . Nach Umbenennung der Summationsindizes ergibt sich daraus 2 (cνλ cλν ) γλ ωνλ γλ bzw. cρσ (γ ν γρ γσ
γρ γσ γ ν ) 2 (cνσ γσ cρν γρ ) ωνμ γ μ
cνλ
cλν
12 ωνλ .
(2.197)
Hieraus folgt ωνλ ωλν , und nur, wenn die Koeffizienten ωνλ der infinitesimalen LorentzTransformation diese Bedingung erfüllen, hat Gleichung (2.197) eine Lösung für cνλ . Daß ωνλ ωλν tatsächlich erfüllt ist, folgt aus der Lorentz-Invarianz von ds 2 gμν d x μ d x ν . Beweis: In der Spezielle Relativitätstheorie, Abschn. „Metrik, Skalarprodukt, Heben und Senken von Indizes“ wurde aus der Invarianz von ds 2 die Gleichung gαβ Λμα Λνβ gμν abgeleitet. Durch Multiplikation mit g αλ folgt daraus Λμλ Λμβ
gαλ gαβ δλβ .
(2.198)
Aus (2.192) bzw. in Komponenten Λμν
δμν ωμν dϕ
folgt Λμλ
Λμν gνλ gμλ ωμλ dϕ
und analog
Λμβ
gμβ ωμβ dϕ.
Einsetzen in (2.198) liefert (g μλ ωμλ dϕ)(gμβ
ωμβ dϕ) δλβ (gμλ ωμβ ωμλ gμβ ) dϕ (dϕ 2) δλβ .
52
2 Dirac-Theorie des Elektrons und des Neutrinos
Der lineare Term in dϕ muß verschwinden, d. h. ωλβ
ωβλ
0.
Durch Heraufziehen des Index β folgt die Behauptung.
Setzen wir cνλ csνλ caνλ mit csνλ (cνλ cλν )/2 und caνλ (cνλ cλν )/2, so gilt cνλ cλν 2caνλ , d. h. in Gleichung (2.197) geht nur der antisymmetrische Anteil caνλ caλν von cνλ ein. Zu deren Lösung können wir daher cνλ cλν annehmen und erhalten aus ihr damit cνλ Hiermit und mit ωρσ s
14 ωνλ .
ωσρ ergibt sich aus (2.196) schließlich
14 ωρσ γρ γσ ρ σ
1 σρ ω γσ γρ 4
14 ωρσ γσ γρ 18 ωρσ γρ , γσ .
Herauf- und Herunterziehen von Indizes führt zu dem gleichwertigen Ergebnis s
18 ωρσ γ ρ , γ σ .
(2.199)
Endliche Transformationen Für eine endliche Lorentz-Transformation mit Λνμ (eωϕ )νμ erhalten wir damit nach (2.193) eine Spinortransformation mit 1 S exp (2.200) ωρσ γ ρ , γ σ ϕ . 8 Es soll noch gezeigt werden, wie hieraus der in Abschn. 2.10 betrachtete Spezialfall folgt. Mit cosh ϕ
1
,
ϕ 2/2
sinh ϕ
ϕ
ϕ 3/3
ergibt sich für die infinitesimale Transformation Λνμ aus (2.181) die Drehmatrix
δν μ
⎛ 0 ⎜ 1 ωνμ ⎝ 0 0
ωνμ dϕ
1 0 0 0
0 0 0 0
0⎞ 0⎟ ⎠, 0 0
d. h. ω01 ω10 1 und ωμν 0 sonst. Damit und mit ωρσ gρλ ωλ σ erhalten wir ωρσ γ ρ , γ σ
gρ0 ω0 1 γ ρ , γ 1 gρ1 ω1 0 γ ρ , γ 0 g00γ 0, γ 1 g11γ 1, γ 0 γ 0, γ 1 γ 1, γ 0 2 γ 0, γ 1 2 (ββα1 βα1 β) 4 α1
und nach (2.200) in Übereinstimmung mit (2.183) S
e
α1 ϕ/2 .
2.11 Eigenschaften der Dirac-Matrizen γ α
53
2.11 Eigenschaften der Dirac-Matrizen « Wir werden im weiteren Verlauf viele Rechnungen durchführen, bei denen die in (2.171) definierten Matrizen γ α involviert sind. Daher sollen hier deren wichtigste Eigenschaften und einige nützliche Rechenregeln zusammengestellt werden. Die Matrizen γ α besitzen die Eigenschaften 0 0 1 l γ γ γ0 , γ (2.201) γ l bzw.
sowie
γ
α
*
γα
γα γ α
γ 0γ α γ 0
(2.202)
für α für α
(2.203)
0, 1 und 3 2,
und sie erfüllen die Vertauschungsrelationen α β γ , γ γ αγ β γ β γ α
2g αβ
(2.204)
mit der unmittelbaren Folge γ αγ α
g αα .
(2.205)
(g αβ ist der metrische Fundamentaltensor der speziellen Relativitätstheorie – in der Speziellen Relativitätstheorie wurde er mit ηαβ bezeichnet; da der Index α zweimal oben steht, wird nicht über ihn summiert.) Die Komponenten Σn des Spin-Operators können durch die γ -Matrizen in der Form Σn i γ l γ m für l, m, n zyklisch (2.206) dargestellt werden. Beweis: 1. Für beliebige Indizes l und m, die die Werte 1, 2 und 3 annehmen können, gilt γ lγ m und
γ mγ l
(2.171b)
γ 0γ l
außerdem
βαl βαm
γ lγ 0
(2.171)
γ 0γ 0
βαm βαl ββαl γ 0γ 0
β 2 (αl αm
(2.42b)
βαl β
β2
(2.42b)
β2
β 2 (αl
αm αl )
2δlm
(2.42a,c)
αl ) 0 ,
2.
Zusammengefaßt folgen daraus die Vertauschungsrelationen (2.204). 2. (2.201a) folgt direkt aus (2.171a), (2.42a) und (2.43a), (2.201b) folgt gemäß (2.171b) γl βαl αl β (2.43) αl β (2.42b) βαl (2.171b)
γ l .
2 Durch Rechtsmultiplikation von (2.201) mit γ 0 1 und mit der aus (2.204) folgenden
Vertauschung γ 0 γ l
γ l γ 0 ergibt sich (2.202).
54
2 Dirac-Theorie des Elektrons und des Neutrinos
3. Die Beziehungen (2.203) folgen aus den Definitionen (2.171) und der Tatsache, daß nach (2.51) und (Q7.39) die Matrizen β, α1 und α3 reell sind, während α2 rein imaginär ist und α2 erfüllt. daher (α2 ) 4. Für zyklische l, m und n ergibt sich aus (2.169) und (2.171) γ lγ m
βαl βαm (2.42b)
(2.42a)
β 2 αl αm
αl αm
(2.169)
i Σn .
Durch Multiplikation mit i folgt daraus (2.206).
Die durch (2.163) definierte Matrix τ wird bei der kovarianten Formulierung der Dirac-Theorie mit γ 5 bezeichnet und läßt sich durch τ
γ5
i γ 0γ 1γ 2γ 3
(2.207)
auf die Matrizen γ 0 bis γ 3 zurückführen, denn i γ 0γ 1γ 2γ 3
(2.171)
i β 2 αx βα y βαz
(2.42a,b)
i αx β 2αy αz i αx αy αz
τ.
Sie erfüllt die Beziehungen
γ5
sowie
γ α γ 5 γ 5γ α
γ5 ,
γ5
γ5
γ 5γ 5
1
0
(2.208) (2.209)
und läßt sich nach (2.164) in der Form γ5
0 1
1 0
(2.210)
aus den 2 2-Matrizen 0 und 1 darstellen. Beweis: (2.208b) folgt unter Benutzung von (2.204) daraus, daß zum Verschieben von γ α nach ganz links in γ 5 γ α i γ 0 γ 1 γ 2 γ 3 γ α eine ungerade Anzahl von Vertauschungen ungleicher γ -Matrizen notwendig ist, z. B. γ 5 γ 1 i γ 0 γ 1 γ 2 γ 3 γ 1 i γ 0 γ 1 γ 2 γ 1 γ 3 i γ 0 γ 1 γ 1 γ 2 γ 3 γ 1 i γ 1 γ 0 γ 1 γ 2 γ 3 γ 1 γ 1 γ 5 . (2.209a) folgt mit (2.207) gemäß
γ5
γ5
(2.205)
(2.201) i γ3 γ 3γ 2γ 1γ 0γ 0γ 1γ 2γ 3 γ2 γ1 γ 0 i γ 0γ 1γ 2γ 3 3 + α 0
g αα
1.
Ähnlich beweist man γ 5 γ 5 1 , womit aus (2.209a) durch Rechtsmultiplikation mit γ 5 (2.208a) folgt.
2.12 Kovariante Kontinuitätsgleichung
55
2.12 Kovariante Kontinuitätsgleichung Natürlich kann auch die Kontinuitätsgleichung (2.46) in eine Lorentz-invariante Form gebracht werden. Zu diesem Zweck benötigen wir die aus (2.173) durch Übergang zu adjungierten Spinoren hervorgehende Gleichung h ∂α e Aα ψ γ α m 0 c ψ 0 . (2.211) i Würde diese Gleichung von rechts mit ψ multipliziert und von der von links mit ψ multiplizierten Dirac-Gleichung, (2.173), abgezogen, so ließen sich die Ableitungsterme wegen (2.201) nicht zur Ableitung eines Viererstroms zusammenfassen. Das Letztere gelingt, wenn wir noch eine andere Art von Adjunktion einführen. Hierzu multiplizieren wir Gleichung (2.211) von rechts mit γ 0 und nehmen mit Hilfe 2 der Gleichungen (2.202) und (2.205) die Umrechnung γ α γ 0 γ 0 γ α γ 0 γ 0 γ α vor. Damit und mit der Definition ψ
ψ
γ0
(2.212)
eines adjungierten Dirac-Spinors ψ erhalten wir die adjungierte Dirac-Gleichung h ∂α e Aα ψ γ α m 0 c ψ 0 . (2.213) i Mit den Transformationsformeln ∂α Λβα ∂ β , Aα Λβα A β und (2.178) ergibt sich hieraus nach Rechtsmultiplikation mit S 1 h ∂ β e A β ψ γ β m 0c ψ 0 , i wenn ψ
ψS
1
(2.214)
gesetzt wird. Gleichung (2.213) ist also Lorentz-invariant, wobei (2.214) das Transformationsgesetz für adjungierte Spinoren ψ ist. Die Operationen Adjunktion und Lorentz-Transformation sind übrigens vertauschbar, es gilt ψ ψ . (2.215) 2 Beweis: Mit γ 0 ψ
(2.180) s.u.
Sψ
1 folgt aus (2.180) und (2.212)
(2.212)
ψ S 1
(Sψ) γ 0
(2.214)
ψ Sγ 0
(2.205)
ψ γ 0 γ 0 S γ 0
(2.212)
ψ γ 0 Sγ 0
ψ .
Die dabei benutzte Identität γ 0 Sγ 0
S 1
(2.216)
56
2 Dirac-Theorie des Elektrons und des Neutrinos
folgt für die Transformation zwischen Systemen in Standardkonfiguration aus (2.185)–(2.186) gemäß γ 0S γ 0
(2.185) (2.43b)
(2.42b)
γ 0 Sγ 0
γ0
γ0
2
2 ϕ cosh 2
cosh
ϕ 2
γ 0 α1 γ 0 sinh
α1 sinh ϕ2
(2.42a)
ϕ 2
cosh
ϕ 2
α1 sinh ϕ2 (2.186) S
1.
Für allgemeine Lorentz-Transformationen folgt sie aus den Beziehungen (2.193) und (2.199) des Exkurses 2.2. Mit 2 2 (2.199) 1 (2.202) 1 ωρσ γ 0 γ σ , γ ρ γ 0 ωρσ γ 0 γ σ , γ ρ γ 0 γ 0sγ 0 8 8 1 1 (2.199) 8 ωρσ γ σ , γ ρ 8 ωρσ γ ρ , γ σ s ergibt sich durch mehrfaches Zwischenschieben von γ 0 γ 0 1
(2.193) 1 0 ν 0 γ (s ϕ) γ γ 0 Sγ 0
ν 1
ν 1
ν
1 ( s)ν ϕ ν ν
e
1
2
ν
1 , -. / , -. / , -. / γ 0 (s γ 0 γ 0 s γ 0 . . . γ 0 s )γ 0 ϕ ν ν
ν 1
sϕ (2.193) S 1 .
Aus (2.180) und (2.214) folgt sofort die Lorentz-Invarianz des Skalarprodukts,
ψ χ
ψS
1
Sχ
ψχ .
(2.217)
Dabei sei darauf hingewiesen, daß die skalare Größe ψ χ nicht Lorentz-invariant ist, vielmehr gilt
ψ χ
(Sψ) Sχ
ψ S Sψ
ψ S2ψ ,
weil S nach (2.43b) und (2.185) ein hermitescher Operator ist. Für die durch (2.212) definierte Operation der Adjunktion wollen wir erreichen, daß sie ψ ψ (2.218) erfüllt. Dabei ist jedoch zu beachten, daß sie für Zeilenspinoren ψ noch nicht erklärt ist. Zunächst gilt (2.51b) ψ γ 0 γ 0 ψ (2.201a) γ 0 ψ (2.171a) 1 0 ϕ ϕ ψ χ . 0 1 χ Definieren wir jetzt ψ
γ 0ψ
,
(2.219)
dann ergibt sich mit dem vorherigen Ergebnis gerade (2.218). Um nun die Lorentz-invariante Form der Kontinuitätsgleichung (2.46) abzuleiten, multiplizieren wir die Dirac-Gleichung (2.173) von links mit cψ, die adjungierte
2.13 Diracs Löchertheorie und Theorie des Positrons
57
Gleichung (2.213) von rechts mit cψ und addieren die sich ergebenden Gleichungen. Da sich die undifferenzierten Terme gegenseitig wegheben, erhalten wir ∂α j α
0
jα
mit
cψ γ α ψ .
(2.220)
Diese Gleichung ist eine Folge der Lorentz-invarianten Dirac-Gleichung und muß daher ebenfalls Lorentz-invariant sein. Das ist auch unmittelbar einsichtig, da sich der Viererstrom j α gemäß j ¼β
ψ γ βψ¼ ¼
(2.180) (2.214)
ψS
1 β
γ Sψ
(2.178)
Λβα ψ γ α ψ
Λβα j α
(2.221)
wie ein Vierervektor transformiert. (Man beachte, daß ψ γ α ψ dagegen kein Vierervektor ist.) Die Nullkomponente des Viererstroms ist wegen j0
cψ γ 0 ψ
2 cψ γ 0 ψ
cψ ψ
(2.222)
identisch mit der Teilchendichte mal Lichtgeschwindigkeit und reell. Auch der Dreierstrom j mit den Komponenten cψ γ l ψ ist eine reelle Größe: Aus dem Transformationsgesetz für Systeme in Standardkonfiguration folgt j 0
Λ0 0 j 0 Λ0 1 j 1
(2.181)
j 0 cosh ϕ j 1 sinh ϕ ,
j 0 ist nach (2.222) reell, und j 0 kann nur reell sein, wenn das auch für j 1 gilt. (Bei Relativbewegungen in Richtung der Koordinatenachsen x 2 bzw. x 3 erhält man entsprechende Reellwertigkeits-Forderungen für j 2 und j 3.)
2.13 Diracs Löchertheorie und Theorie des Positrons 2.13.1 Lösungen negativer Energie und Löchertheorie Schon bei der Behandlung von Wellenpaketen für freie Teilchen ergaben sich Schwierigkeiten mit den Lösungen negativer Energie (siehe Abschn. 2.4). Auch die in Abschn. 3.1 untersuchte Zitterbewegung des Elektrons paßt nicht zu unseren bisherigen Erfahrungen über die mittlere Dynamik von Punktteilchen. Am bequemsten wäre es, wenn Lösungen negativer Energie als unphysikalisch ausgeschlossen werden könnten. Bei der Behandlung zeitunabhängiger Eigenwertprobleme wäre das unter gewissen Einschränkungen möglich. Sobald jedoch zeitabhängige Felder vorliegen, gibt es Übergänge zwischen Zuständen positiver und negativer Energie. Das gleiche Problem tritt bei der Behandlung der Stabilität stationärer Zustände positiver Energie auf. Wir betrachten das am Beispiel der stationären Energieniveaus eines Elektrons, das sich im Feld eines Atomkerns befindet. Die Lösung der Dirac-Gleichung liefert qualitativ das Energiespektrum von Abb. 2.4. Über einem diskreten Spektrum positiver Energiewerte beginnt bei E m 0 c2 ein Kontinuum. Außerdem gibt es jedoch noch ein
58
2 Dirac-Theorie des Elektrons und des Neutrinos
E m 0 c2 0
.. . E2 E1
m 0 c2 Abb. 2.4: Energieniveaus eines Ein-Elektronen-Atoms.
kontinuierliches Spektrum negativer Energiewerte, das bei E m 0 c2 beginnt. Befindet sich das Elektron in einem angeregten Zustand positiver Energie, so kann es unter Abstrahlung von Licht in einen Zustand niedrigerer Energie übergehen. Dieses Ergebnis ist anschaulich plausibel. Zu seiner quantitativen Verifizierung betrachtet man eine kleine Störung eines stationären Zustands. Da der gestörte Zustand instationär ist, wird das Elektron in ihm zu einer Quelle eines zeitabhängigen elektromagnetischen Feldes, das es abstrahlt. Dieses Feld wird durch die Maxwell-Gleichungen beschrieben und muß mit in die Betrachtung einbezogen werden. Ein instationäres Elektron als Quelle eines von ihm erzeugten elektromagnetischen Feldes und dessen Ankopplung an das Elektron wurde in der bis hier behandelten Quantentheorie noch nicht erörtert. Die exakte Lösung dieses Problems zwingt zu einer Quantisierung des elektromagnetischen Strahlungsfeldes und muß im Rahmen einer Quantenfeldtheorie, genauer der Quantenelektrodynamik, erfolgen, die in Kapitel 10 vorgestellt wird. In der Schrödinger-Theorie ist der dem niedrigsten Eigenwert positiver Energie entsprechende Energieeigenwert des H-Atoms stabil, weil es unterhalb von diesem keine weiteren Eigenwerte mehr gibt. Nach der Dirac-Theorie liegt unter diesem jedoch noch ein ganzes Kontinuum negativer Energiewerte. Das Elektron könnte nach den Gesetzen der bisher betrachteten Quantentheorie aus dem niedrigsten Zustand positiver Energie (Grundzustand) unter Abstrahlung erheblicher Strahlungsenergie in diese Zustände negativer Energie übergehen. Da diese bis E reichen, wäre diesem Prozeß kein Ende gesetzt, und es könnte ein unerschöpflicher Vorrat an Strahlungsenergie abgegeben werden. Eine quantitative Berechnung in der geschilderten Weise würde für diese Übergänge eine erhebliche Wahrscheinlichkeit liefern. Der Grundzustand des Wasserstoffatoms besäße danach nur eine Lebensdauer von etwa 10 9 s. Dies widerspricht jeglicher Erfahrung und bedeutet einen gravierenden Mißerfolg der Dirac-Theorie, wenn man an ihrer konventionellen Interpretation à la Schrödinger festhält. Demgegenüber stehen jedoch überzeugende Erfolge der Dirac-Theorie, z. B. die theoretische Begründung des Spins, die richtige Vorhersage des gyromagnetischen Faktors und sehr genaue relativistische Korrekturen zum Termschema des Wasserstoffatoms. Um seine Theorie zu retten, fand Dirac einen genialen Ausweg. Nach dem PauliPrinzip kann jeder Ein-Teilchen-Zustand des Elektrons nur von einem einzigen Elektron eingenommen werden. Dirac postulierte nun, daß alle Zustände negativer Energie schon von Elektronen besetzt sind. Wegen des Pauli-Prinzips kann damit der Übergang von Zuständen positiver zu Zuständen negativer Energie nicht mehr stattfinden,
2.13 Diracs Löchertheorie und Theorie des Positrons
59
E m 0 c2 0
hν
m 0 c2
Elektronenloch Abb. 2.5: Anregung eines Elektrons negativer Energie.
und die oben geschilderte Strahlungskatastrophe ist aus der Welt geschafft. Wir werden allerdings sehen, daß es noch andere Probleme gibt, die nicht überwunden werden können. Dies bedeutet, daß die Löchertheorie letzten Endes ein Provisorium darstellt, das wir später aufgeben müssen. Wenn wir uns im folgenden dennoch etwas näher mit ihr beschäftigen, geschieht das deshalb, weil sie für eine Reihe wichtiger Phänomene eine sehr anschauliche Erklärung liefert und in vielen Fällen auch zu quantitativ brauchbaren Ergebnissen führt. In der Quantenfeldtheorie wird sie allerdings durch eine Theorie anderer Art ersetzt. Da die Zustände negativer Energie ein Kontinuum bilden, ist die Welt nach Dirac unendlich dicht vollgepackt mit Elektronen negativer Energie. Das Vakuum ist nicht mehr leer, es ist eine „Fermi-See“ aus Elektronen negativer Energie, nur gibt es in ihm keine Elektronen positiver Energie. Diese Fermi-See hat die unschöne Eigenschaft, unendlich große Ladung und Masse zu besitzen. Von der ersten Eigenschaft können wir uns (siehe unten) durch eine geringfügige Modifizierung des Dirac-Modells freimachen. Die unendliche Masse ( Energie) kann durch eine Verschiebung des Energienullpunkts (Renormierung) beseitigt werden. Wenn alle Zustände negativer Energie besetzt sind, kann das oben betrachtete, vom Absturz zu negativen Energiewerten bedrohte Elektron nur noch positive Energiewerte annehmen. Die Besetzung der negativen Energieniveaus verbietet zwar den Übergang eines Elektrons positiver Energie zu negativen Energien. Umgekehrt kann aber sehr wohl ein Elektron negativer Energie z. B. durch Lichteinwirkung in einen „angeregten“ Zustand positiver Energie überführt werden. Beim Fehlen äußerer Felder ist hierzu mindestens die Energie 2m 0 c2 erforderlich (Abb. 2.5). Wir denken uns jetzt das Elektron, dem vor seiner Anregung im Zustand des Vakuums keine reale Existenz zukommt, vom Ort seiner Anregung entfernt. Wie muß das Loch, das es in der Fermi-See zurückläßt, physikalisch beurteilt werden? Da das Vakuum bei Anwesenheit des Elektrons negativer Energie als elektrisch neutral beurteilt wird, muß das Fehlen der negativen Ladung q e als positive Ladung q e aufgefaßt werden. Hat das Vakuum, wie vereinbart, die Gesamtenergie null, so besitzt es nach Entfernen der Energie E die Energie E mit der zugehörigen Masse E/c2 . Wir haben somit das Ergebnis: Ein Loch in der Fermi-See verhält sich wie ein Teilchen positiver Masse und positiver Energie mit der Ladung q e. Wir werden gleich sehen, daß dieses neue Teilchen bis auf die Ladung alle Eigenschaften eines Elektrons besitzt. Es wird daher als Antiteilchen des Elektrons bezeichnet und hat den Namen Positron erhalten. Dirac hat seine Löchertheorie im Jahre 1929 aufgestellt und die Löcher richtig als positiv geladene Teilchen gedeutet; zunächst allerdings als Protonen, obwohl diese dafür viel zu schwer sind, weil er die
60
2 Dirac-Theorie des Elektrons und des Neutrinos
Existenz eines neuen Teilchens nicht zu postulieren wagte. Erst in einer 1931 erschienenen Arbeit über magnetische Monopole stellte er klar, daß es sich sich um Antielektronen handeln müsse. Kurze Zeit später (1932) wurde das Positron experimentell von C. D. Anderson nachgewiesen. Seine Entdeckung lieferte somit eine weitere Bestätigung der um die Löchertheorie erweiterten Dirac-Theorie. Der in Abb. 2.5 dargestellte Vorgang wird als Paarerzeugung bezeichnet. Der Ort, an dem das Photon absorbiert wird, ist der Ausgangspunkt der Trajektorien eines Elektrons und eines Positrons. Nach (2.5) (für Φ 0 und A 0) ist die quasiklassische Energiebilanz der dabei involvierten Vorgänge 2 2 2 2 2 2 , h ω c m 0 c p c m 0 c p wobei p der Impuls des Elektrons im Zustand positiver und p der im Zustand negativer Energie ist. Schreiben wir h ω
mit E e
Ee Ep
(2.223)
Energie des Elektrons und E p Energie des Positrons, so muß E p c m 0 2 c2 p 2
(2.224)
gelten. Hieraus folgen als Ruheenergie bzw. Ruhemasse des Positrons m 0 c2 bzw. m 0 , also dieselben Werte wie beim Elektron. Impuls- und Spinbilanz liefern in analoger Weise s.u. h k p p pe pp (2.225) und
SPhoton S S
s.u.
Se Sp ,
(2.226)
denn: Das Vakuum hat Impuls und Spin null; daher besitzt das Elektronenloch, das durch Entfernen eines Elektrons negativer Energie mit dem Impuls p und Spin S entsteht, den Impuls p ( p), den Spin S ( S), und hieraus folgen die Beziehungen pp p und Sp S . (2.227) Eine Folge der Gleichung (2.227b) ist, daß das Positron denselben Spin 1/2 wie das Elektron besitzt, und Gleichung (2.226) wird dadurch erfüllt, daß sich die Spins von Elektron und Positron zum Spin 1 des Photons addieren. Damit ist – vorerst allerdings nur mit Hilfe quasiklassischer Beziehungen – plausibel gemacht, daß das Positron dieselbe Ruhemasse und denselben Spin wie ein Elektron besitzt. Eine genauere Analyse, die für den Impuls die Beziehung p m 0 Ú / 1v 2 /c2 benutzt, zeigt, daß die Gleichungen (2.223) und (2.225) keine gemeinsame Lösung besitzen: Impuls- und Energiesatz können nicht gleichzeitig erfüllt werden, Elektron und Positron können nicht den gesamten Impuls des Photons aufnehmen (Aufgabe 2.8). Hierzu bedarf es noch eines weiteren Partners, z. B. eines Atomkerns, der den überschüssigen Impuls aufnimmt. Dies bedeutet, daß der Prozeß der Paarerzeugung nur in einem externen Potential – z. B. dem eines Atomkerns – stattfinden kann.
2.13 Diracs Löchertheorie und Theorie des Positrons E m 0 c2 0 m 0 c2 Positronen
Elektronen
61
Abb. 2.6: Symmetrischer ladungsfreier Vakuumzustand. Die Abbildung ist symbolisch aufzufassen, Elektronen und Positronen befinden sich nicht in räumlich voneinander abgegrenzten Gebieten.
Etwas anders lassen sich die gewonnenen Ergebnisse auch in folgender Weise zusammenfassen: In den Eigenschaften Ladung, Energie, Masse, Impuls und Spin verhält sich ein Elektronenloch gerade umgekehrt wie ein Elektron negativer Energie p p, S S). Dies läßt die Vermutung ( e e, E E, m 0 m 0 , aufkommen, daß sich die Dynamik des Positrons auch durch Elektronenlösungen negativer Energie ausdrücken läßt. Schon hier sei darauf hingewiesen, daß dies der Weg ist, auf dem wir zu einer korrekten Begründung der Zusammenhänge (2.224)–(2.227) gelangen werden. Neben dem Vorgang der Paarerzeugung erlaubt die Löchertheorie auch den Vorgang der Paarvernichtung: Bei diesem springt ein „angeregtes“ Elektron positiver Energie in ein freies Loch der Fermi-See, wobei ein Photon emittiert wird. Das Verschmelzen des Elektrons mit einem Elektronenloch ist seinem Zusammenstoß mit einem Positron unter anschließender Teilchenvernichtung bzw. Umwandlung in ein Photon äquivalent. Wegen der großen Symmetrie zwischen dem Ein-Teilchen-Verhalten von Positronen und Elektronen ist es nützlich, auch eine Ein-Teilchen-Theorie für Positronen aufzustellen. Wir müssen hierzu nur in der Dirac-Gleichung (2.173) die Ladung q e durch q e ersetzen, und erhalten als Dirac-Gleichung für Positronen γα
h ∂α i
e Aα ψ
m0c ψ 0 .
(2.228)
Die durch diese Gleichung beschriebenen Teilchen haben sämtliche dem Positron zugeschriebenen Eigenschaften. Wie bei der Dirac-Gleichung für Elektronen gibt es Zustände positiver und negativer Energie. Es ist daher auch möglich, Elektronen als Löcher in einer Fermi-See aus Positronen zu deuten. Diese Deutung erlaubt es, einen bezüglich der beiden Teilchenarten symmetrischen Vakuumzustand einzuführen. In diesem gibt es sowohl ein Kontinuum von Elektronenzuständen als auch von Positronenzuständen negativer Energie. Beide Kontinua sind gemäß dem Pauli-Prinzip vollständig besetzt (Abb. 2.6). Als Gesamtladung des Vakuums ergibt sich null, da sich positive und negative Ladungen gegenseitig kompensieren. Die Gesamtenergie ist allerdings wie früher unendlich und muß auf null renormiert werden. Abschließend sei bemerkt, daß äußere Felder die im Vakuum befindlichen Ladungen räumlich verschieben und deren Energieniveaus (für Elektronen und Positronen unterschiedlich) verbiegen. Eine hieraus entstehende Konsequenz – die Polarisation des Vakuums – wird in Abschn. 2.15.2 besprochen.
62
2 Dirac-Theorie des Elektrons und des Neutrinos
Die Möglichkeiten der Paarerzeugung und Paarvernichtung zeigen, daß die Interpretation der Dirac-Theorie als Ein-Teilchen-Theorie des Elektrons nicht haltbar ist, und entsprechend müßte auch das Positron als Loch in einer Fermi-See unendlich vieler Elektronen im Rahmen einer Viel-Teilchen-Theorie behandelt werden können. Die hier geschilderte Löchertheorie kann nur als grobe Vorstufe zu einer derartigen Theorie aufgefaßt werden, denn sie erfaßt nicht die Wechselwirkung zwischen den an diesem Bild beteiligten Teilchen. Dementsprechend findet man, daß sie bei einer präziseren Untersuchung von Vorgängen zu Fehlern und Widersprüchen führt. Diese können erst in einer Quantenfeldtheorie der Dirac-Gleichung bereinigt werden. Im Rahmen dieser Theorie müssen dann auch gewisse Aussagen der bisherigen Ein-Teilchen-Theorie revidiert werden. Beschränkt man sich jedoch auf Wechselwirkungsprozesse hinreichend niedriger Energie, so hat sich die um das Konzept der Fermi-See erweiterte Dirac-Gleichung bei der Behandlung von Ein-Teilchen-Problemen als außerordentlich nützlich erwiesen.
2.13.2 Positronlösungen durch Ladungskonjugation Aus der Existenz von Elektronenlösungen negativer Energie konnten sowohl die Existenz als auch verschiedene Eigenschaften von Positronen abgeleitet werden. Den Ausgangspunkt bildeten dabei zunächst qualitative Vorstellungen, die sich jedoch soweit präzisieren ließen, daß schließlich mit (2.228) sogar eine „Wellengleichung“ für Positronen aufgestellt werden konnte. Jetzt soll ein Weg aufgezeigt werden, auf dem die Zustände von Positronen direkt aus Elektronenzuständen negativer Energie abgeleitet werden können. Hierzu schreiben wir zunächst die Gleichung an, die durch komplexe Konjugation aus der DiracGleichung (2.173) entsteht, (γ α )
h ∂α i
e Aα ψ m 0 c ψ
0.
(2.229)
Nun existiert eine nicht-singuläre Matrix U , die für alle Indizes α die Gleichung U (γ α ) U
1
γα
(2.230)
erfüllt (Beweis folgt weiter unten). Multiplizieren wir Gleichung (2.229) von links mit U , definieren ψC U ψ Cψ (2.231) und benutzen die Identität ψ U 1 U ψ sowie (2.230), so erhalten wir α h ∂α e Aα ψC m 0 c ψC 0 . γ i
(2.232)
Dies ist die Positronengleichung (2.228), d. h. die gemäß (2.231) durch die Ladungskonjugation Cψ aus Elektronenlösungen ψ erhaltenen Spinoren ψC sind Positronenlösungen.
2.13 Diracs Löchertheorie und Theorie des Positrons
63
Den Beweis dafür, daß Gleichung (2.230) tatsächlich eine Lösung besitzt, erbringen wir für den Spezialfall der Darstellung (2.172) für die Matrizen γ α . In diesem ist iγ2
U
(2.233)
eine mögliche Lösung mit den Eigenschaften UU
UU
1,
i γ 2γ 2
1.
(2.234)
Beweis: Es gilt U γ2
(2.203b)
Uγ 2
(2.203a)
U (γ α )
Uγ α
(2.233)
(2.233)
zusammengefaßt für alle α
(2.233)
(2.204)
i γ 2γ α
U (γ α )
γ 2U ,
i γ αγ 2
γ αU
für
γ αU ,
α 2 , (2.235)
und hieraus folgt durch Rechtsmultiplikation mit U 1 Gleichung (2.230). Die Beziehungen (2.234) folgen gemäß UU UU
(i γ 2)(i γ 2 ) γ 2 (i γ 2)(i γ 2 ) γ 2
(2.201b) γ2
γ
γ 2γ 2
(2.203b) 2
γ 2γ 2
(2.205)
(2.205)
1,
1.
Die Operation der Ladungskonjugation ist reziprok, d. h. die Ladungskonjugation einer Positronlösung ψC führt zurück auf die Elektronlösung, (ψC )C
ψ,
(2.236)
denn es gilt (ψC )C
U ψC
U (U ψ )
UU ψ
(2.234a)
ψ.
Außerdem genügen die Spinoren ψC demselben Transformationsgesetz wie die Spinoren ψ, (2.180) mit (2.183), denn ψC
(2.231)
U ψ
(2.180) (2.233)
i γ 2 (Sψ)
s.u.
i γ 2 Sψ
s.u.
i Sγ 2 ψ
(2.233)
SU ψ
SψC .
Dabei wurde benutzt, daß S cosh(ϕ/2) α1 sinh(ϕ/2) (nach (2.185)) mit α1 reell ist (siehe (2.51a) und (Q7.39a)) und mit γ 2 vertauscht, γ 2S
γ 2 cosh
ϕ 2
γ 2 α1 sinh ϕ2
(2.188)
γ 2 cosh
ϕ 2
α1 γ 2 sinh ϕ2
Sγ 2 .
Jetzt vergleichen wir die physikalischen Eigenschaften der ladungskonjugierten Lösung ψC mit denen der Elektronenlösung ψ. Der Teilchen-Viererstrom ist für beide Lösungen identisch, j αC jα , (2.237)
64
2 Dirac-Theorie des Elektrons und des Neutrinos
denn es gilt j αC c
ψC γ α ψC
(2.212)
(ψ ) U γ 0 γ α U ψ (2.235)
(2.235)
(ψ ) U U (γ 0 ) (γ α ) ψ ( j α) c
(2.231)
(ψC ) γ 0 γ α ψC
(U ψ ) γ 0 γ α U ψ
(ψ ) U γ 0U (γ α ) ψ (2.234b)
(2.212)
(ψ γ 0 γ α ψ)
(ψ γ α ψ)
jα . c
Dabei wurde zuletzt benutzt, daß j α nach Abschnitt 2.12 reell ist. Für den Mittelwert L C eines Operators L im Zustand ψC erhalten wir
L C Mit
(ψC ) U L U
L ψC d 3x
(ψ ) U
(2.233)
(2.203b)
γ 2 L
γ2
folgt daraus
L γ 2
ψ LU
(2.201b)
3
dx
γ 2 L γ 2
ψ d 3x ψ U LU
γ 2 L
.
2 γ
γ2
L C γ 2 L
γ2 .
(2.238)
Die Spezialisierung dieses Ergebnisses auf die in Abschnitt 2.3 und 2.9 eingeführten Observablen liefert
x C x , c«C c« , p C p , C .
(2.239)
Beweis: 1. (2.239a) folgt mit x
x gemäß 0
x C
γ 2x γ 2
1
0
γ 2 xγ 2
1
0
γ 2γ 2 x
1 (2.205)
x
x .
2. (2.239b) ergibt sich mit αl β 2 αl γ 0 γ l nach (2.171) gemäß αl C
0
γ 0γ l
1 (2.238) C
0
1 (2.203) 0 1 2 0 γl γ2 γ γ γ 2 γ 0γ l γ 2
0 1 0 1 (2.204) s.u. γ 0γ 2 γ l γ 2 γ 0γ l
αl
(2.61)
αl ,
denn (2.233) (2.201b) l U (2.234b) l U 1 , U γ U γ γ2 γ 2 γ l γ 2 γ 2 γ l und daraus folgt mit (2.230)
γ2 γl γ2
γl .
(2.240)
2.13 Diracs Löchertheorie und Theorie des Positrons
65
3. (2.239c) folgt mit p p und p p gemäß 1 0 1 0 1 0 2 2 γ 2 pγ 2 γ 2 γ 2 p (2.205) p C γ p γ p
p .
4. Mit (2.206) und ergibt sich für die Komponenten von (für zyklische l, m, n) 1 0 1 (2.238) 0 Σn C i γ lγ m γ2 i γl γm γ2 (2.205)
0
C
1 (2.240) 0 1 l m iγ γ i γ 2 γ l γ 2γ 2 γ m γ 2
Σn
Σn .
Fassen wir diese wieder zu einem Vektor zusammen, so ergibt sich (2.239d).
Die Beziehungen (2.239) liefern die exakte quantenmechanische Bestätigung der quasiklassisch „abgeleiteten“ Relationen (2.227). Als letztes vergleichen wir die Erwartungswerte der Energie. Der HamiltonOperator (2.58) der Dirac-Gleichung lautet in der Notation von Gleichung (2.173) mit (2.42a) und (2.171)
h ∂l q Al m 0 c , H (q) qΦ cγ 0 γ l (2.241) i wobei das Argument q von H (q) die Ladung des betrachteten Teilchens angibt. Der Hamilton-Operator des Elektrons ist H (e) und der zur ladungskonjugierten Gleichung (2.232) gehörige Hamilton-Operator ist H (e), wofür man H C (e) H (e) oder allgemeiner H C (q) H (q) schreiben kann. Aus (2.238) ergibt sich der Zusammenhang
H (e) C
H (e) .
(2.242)
Beweis: Setzen wir (2.241) mit q e in (2.238) ein, so ergibt sich mit γ 0 γ 0 0
H (e)
1
h γ 2 eΦ cγ 0 γ l ∂l e Al m 0 c γ2 C i
2 h (2.204) 2 2 0 2 l 2 2 γ γ eΦ γ γ cγ γ ∂l e Al γ γ m 0 c i
(2.205) 1 1 0 0 (2.240) 0 γ l h ∂ e A m c eΦ cγ H (e) H (e) . l l 0 i
Erfolgt die Mittelung mit Lösungen der Bewegungsgleichung ih ∂t ψ Hψ, so ergibt sich der Beweis viel einfacher aus der in diesem Unterraum gültigen Identität H ih ∂t gemäß ih
(2.205) ∂t C γ 2 (ih ∂t ) γ 2 γ 2 ih ∂t γ 2 γ 2 γ 2 ih ∂t ih ∂t ih ∂t .
Die Wahrscheinlichkeitsdichte n C j 0C des durch ψC beschriebenen Positrons ist nach (2.237) identisch mit der eines Elektrons im Zustand ψ, das nach (2.242) negative Energie besitzt. Demnach kann die Quantendynamik eines Positrons nicht von der eines Elektrons negativer Energie unterschieden werden. Mit anderen Worten: Ein Positron
66
2 Dirac-Theorie des Elektrons und des Neutrinos
bzw. ein Elektronenloch verhält sich wie ein Elektron negativer Energie. Dem entspricht, daß der Erwartungswert für den Geschwindigkeitsoperator nach (2.239b) im Zustand ψ und ψC derselbe ist. Der Spin des Lochs ist allerdings dem Spin des Elektrons entgegengesetzt. Dieselbe Aussage gilt auch für den Impuls, was dadurch zustande kommt, daß mit den Energien (siehe (2.242)) auch die Massen entgegengesetztes Vorzeichen haben. Im folgenden Abschnitt werden wir eine noch weitergehende Symmetrie bzw. Antisymmetrie zwischen dem Zustand eines Positrons und dem eines Elektrons negativer Energie aufdecken, die sogenannte CPT-Symmetrie.
2.13.3 P-Invarianz, T-Invarianz und CPT-Symmetrie Für die Eigenschaften von Elementarteilchen spielen Symmetrien eine ausschlaggebende Rolle. In diesem Abschnitt werden wir feststellen, daß die Dirac-Gleichungen für Elektron und Positron eine Reihe von Symmetrien aufweisen. In der Elementarteilchentheorie ist die Vorgehensweise umgekehrt oft so, daß gewisse Symmetrien gefordert werden und eine Gleichung so gesucht wird, daß die durch sie beschriebenen Teilchen diese aufweisen. P-Invarianz. Die Raumspiegelung am Koordinatenursprung t¼
x¼
t,
x
(2.243)
ist eine spezielle Lorentz-Transformation. (Es handelt sich um eine uneigentliche Lorentz-Transformation, da sie nicht kontinuierlich in die identische Transformation überführt werden kann.) Da die Dirac-Gleichung gegenüber sämtlichen LorentzTransformationen invariant ist, muß sie auch gegenüber der Transformation (2.243) invariant sein. Für die Dirac-Spinoren muß dabei Gleichung (2.180) gelten, wobei S eine Lösung von (2.178) ist. S kann allerdings nicht durch Spezialisierung von Gleichung (2.185) gewonnen werden, da (2.243) keine Transformation zwischen Systemen in Standardkonfiguration ist. Die Lösung von (2.178) für die spezielle Transformation (2.243) bezeichnen wir mit P. Selbst für die spezielle Standarddarstellung (2.172) der Dirac-Matrizen gibt es mehrere Lösungen P. Die einfachste von diesen ist P Wegen γ 0
(γ 0 )
1
γ0 .
(2.244)
(γ 0 ) nach (2.201) ist P ein unitärer hermitescher Operator.
Beweis: In der allgemeinen Lorentz-Transformation d x α Λαβ d x β ist die Transformationsmatrix für den Fall (2.243) mit ⎛1 0 ⎞ 1 ⎟ ⎜ (2.245) Λαβ ⎝ ⎠ 1 0 1 enthalten. Mit S P γ 0 haben wir nach (2.178) also P 1γ 0 P
γ0
und
P 1γ l P
γl
2.13 Diracs Löchertheorie und Theorie des Positrons
zu beweisen. Wegen (γ 0 )2 P 1γ 0 P
γ 0γ 0γ 0
1 und P 1 γ0
und
(γ 0 ) 1
67
γ 0 gilt tatsächlich
P 1γ l P
γ 0γ l γ 0
(2.204)
γ l γ 0γ 0
γl .
Das Transformationsgesetz (2.180) lautet in dem betrachteten Spezialfall ausführlicher (2.246) ψ (x , t ) ψ ( x, t) Pψ(x, t) . Für die Potentiale Φ und A des elektromagnetischen Feldes gilt bei der Raumspiegelung (2.243) Φ (x , t ) Φ(x, t), A (x , t ) A(x, t) , (2.247) da sich die Komponenten des Vierervektors Aα transformieren. In der Schrödinger-Theorie wurde der durch
Φ/c, A wie d x α c dt, d x
ψ(x, t) ψ( x, t)
(2.248)
definierte Operator als Paritätsoperator bezeichnet, und bei gleichzeitiger Berücksichtigung der Transformationsformeln (2.247) ist die Schrödinger-Gleichung gegenüber der Transformation ψ ψ invariant. Wenn die Definition (2.248) auf DiracSpinoren erweitert wird, gilt ψ(x, t)
(2.243)
ψ( x , t )
ψ(x , t ) ,
und damit läßt sich das Transformationsgesetz (2.246) für Spinoren auch in die Form
ψ (x , t ) P ψ(x , t ) (2.249) bringen. Die Invarianz der Dirac-Gleichung gegenüber der Transformation (2.243) kann physikalisch so interpretiert werden: Zu jeder Zeitfolge ψ(x, t) physikalischer Zustände existiert eine zweite Folge physikalischer Zustände, die aus der ersten durch räumliche Spiegelung am Koordinatenursprung hervorgeht. Dabei ist prinzipiell nicht feststellbar, welcher Vorgang das Bild und welcher das Spiegelbild ist, beide sind gleichermaßen physikalisch. Für den Erwartungswert L der Observablen L , die aus einer Observablen L durch Spiegelung am Koordinatenursprung hervorgeht, im gespiegelten Zustand ψ gilt L γ 0 L γ 0 , (2.250) denn (2.180) (2.244),s.u. 3 0 0 3 (ψ ) L ψ d x ψ (γ ) L γ ψ d x ψ γ 0 L γ 0 ψ d 3x . L Dabei wurde benutzt, daß zwar d x l d xl gilt, daß sich bei der Raumspiegelung 21 2 1 20 jedoch auch die Integrationsgrenzen umkehren, also z. B. 0 d x 0 d x 1 d x, 2 2 3 so daß d 3x d x gilt. Mit (2.250) sowie x
x ,
H
qΦ
p
h
i
h i p ,
m 0c2β c« ( p q A )
qΦ m 0 c2 β c« ( p q A)
68
2 Dirac-Theorie des Elektrons und des Neutrinos
nach (2.243b), (2.247) und (2.58) folgen die Beziehungen x ¼ ¼ Beweis:
x , 0
x ¼ ¼
p ¼ ¼
p ,
p ¼ ¼
H .
(2.251)
1 (γ 0 )2 x ¼ x ¼ x , 0 1 0 1 γ 0 p ¼ γ 0 (γ 0 )2 p ¼ p ¼ p γ 0 x¼ γ 0
1
H ¼ ¼
0
und 0
H ¼ ¼
1 γ 0 qΦ m 0 c2 β c« ( p q A) γ 0
(2.42b)
0 (γ 0 )2 qΦ
(2.42a)
0 1 qΦ m 0 c2 β c« ( p q A) H .
m 0 c2 β c« ( p q A)
1
Der vektorielle Matrixoperator wurde in (2.155) als Dreiervektor mit drei räumlichen Komponenten eingeführt. Wir wissen daher nicht, ob es sich dabei um die räumlichen Komponenten eines Vierervektors (im nicht-relativistischen Grenzfall) handelt oder z. B. um drei Komponenten eines Tensors, wie das beim Magnetfeld B der Fall ist. Dieses ist in dem Tensor ∂α Aβ ∂β Aα enthalten, und aus B j ∂k Al ∂l Ak für zyklische j, k, l folgt bei der Spiegelung am Ursprung B ¼j ∂k¼ Al¼ ∂l¼ A¼k ∂k Al ∂l Ak B j , denn ∂α und Aβ sind Vierervektoren, für die ∂k¼ ∂k und Al¼ Al gilt. Die B j transformieren sich also nicht wie die Komponenten eines echten Vierervektors, sondern wie die eines Pseudovektors, also gemäß V ¼α
α
Λ β V
β
.
(2.252)
Da der Spin geladener Teilchen mit einem magnetischen Moment verbunden ist, muß er sich bei einer Raumspiegelung wie das Magnetfeld verhalten. Dies bedeutet, daß der Spin ein Pseudovektor ist, so daß
¼
(2.253)
gilt. Damit erhalten wir
¼
¼
,
(2.254)
denn aus (2.250) folgt Σn¼ ¼
(2.205)
(2.253) (2.206) γ 0 Σn¼ γ 0 γ 0 Σn γ 0 γ 0 i γ l γ m γ 0 l m (2.206) Σn . iγ γ
(2.204)
i γ l γ 0γ 0γ m
T-Invarianz. Auch die Zeitumkehrtransformation t¼
t
,
x¼
x
(2.255)
2.13 Diracs Löchertheorie und Theorie des Positrons
69
ist eine spezielle Lorentz-Transformation mit der Transformationsmatrix ⎞ ⎛ 1 0 1 ⎟ ⎜ Λαβ ⎝ ⎠. 1 0 1
(2.256)
Der Vierervektor ∂α transformiert sich bei dieser nach (2.176) gemäß ∂ ¼0
∂0,
∂ ¼l
∂l ,
(2.257)
womit aus der komplex-konjugierten Dirac-Gleichung (2.229) l h 0 h ∂ 0 e A0 ψ γ ∂ l e Al ψ m 0 c ψ γ i i
0
(2.258)
folgt. A0 und Al wurden dabei vorerst noch bewußt untransformiert gelassen. Nun existiert eine Matrix T0 , welche die Beziehungen T0 γ l T01 γ l (2.259) T0 γ 0 T01 γ 0 , erfüllt. In der Standarddarstellung (2.171) ist eine mögliche Lösung für T0 durch T0
i γ 1γ 3
(2.260)
mit den Eigenschaften T0
T0
T01
(2.261)
gegeben. Beweis: Aus T0 T0 und T0 T0
γ 1γ 3γ 1γ 3
(2.204)
γ 1γ 3γ 3γ 1
(2.205)
1
(2.262)
(2.201b) (2.205) γ 1 i γ 1γ 3 γ 3γ 1γ 1γ 3 1 i γ3
folgen unmittelbar die Beziehungen (2.261). Mit (2.203) und (2.204) ergibt sich T0 γ 0 T0 γ 0 i γ 1 γ 3 γ 0 i γ 1 γ 0 γ 3 i γ 0 γ 1 γ 3 γ 0 T0 , T0 γ 1 T0 γ 1 i γ 1 γ 3 γ 1 i γ 1 γ 1 γ 3 γ 1 T0 , T0 γ 2 T0 γ 2 i γ 1 γ 3 γ 2 i γ 1 γ 2 γ 3 i γ 2 γ 1 γ 3 γ 2 T0 , T0 γ 3 T0 γ 3 i γ 1 γ 3 γ 3 i γ 3 γ 1 γ 3 γ 3 T0 , was mit den Beziehungen (2.259) übereinstimmt.
Multiplizieren wir jetzt (2.258) von links mit T0 , so erhalten wir mit der Identität ψ T01 T0 ψ und den Beziehungen (2.259) 0 h l h ∂ 0 e A0 ψ γ ∂ l e Al ψ m 0 c ψ 0 γ (2.263) i i
70
2 Dirac-Theorie des Elektrons und des Neutrinos
mit ψ ¼ (x ¼ , t ¼ )
T0 ψ £
Tψ .
(2.264)
Würde Aα als echter Vierervektor transformiert, so erhielten wir für die Zeitspiegelungstransformation (2.255) nach (2.257) A¼0 A0 , Al¼ Al , und die Gleichung für ψ ¼ ginge in die Dirac-Gleichung (2.228) für Positronen über. Aus den im folgenden geschilderten Gründen ist das jedoch nicht richtig. Für den Vierervektor Uα
d Xα dτ
d X α dt dt dτ
der Geschwindigkeit ergäbe sich bei der Zeitumkehrtransformation (2.255) aus der Transformationsformel U ¼ α Λαβ U β für die räumlichen Komponenten U ¼l U l . Mit U ¼l d X ¼l /dτ ¼ , U l d X l /dτ und d X ¼l d X l ergäbe sich daraus dτ ¼ dτ , und damit würde d X ¼l d X ¼l d X ¼l dt ¼ d X ¼l dt 1 d X ¼l U ¼l . dτ ¼ dτ dt ¼ dτ dt ¼ dτ 1 u 2 /c2 dt ¼ folgen, die räumlichen Komponenten U ¼l der vektoriellen Geschwindigkeit im System S ¼ wären der Bewegung d X ¼ l /dt ¼ entgegen gerichtet. Dieses unsinnige Ergebnis ist darauf zurückzuführen, daß die Eigenzeit bei der Zeitspiegelung nicht ebenfalls umgekehrt wurde. Kehren wir jedoch mit der Zeit t auch die Eigenzeit τ um, so erhalten wir für die Geschwindigkeit das Transformationsgesetz d X ¼α dτ ¼
U ¼α
Λαβ d X β dτ ¼
β
Λαβ ddτX
Λαβ U β
bzw. U ¼0
U0 ,
U ¼l
U l
eines Pseudovektors, und die Geschwindigkeit weist sowohl in S als auch in S ¼ in die Bewegungsrichtung. Wegen der für die elektrische Stromdichte J α gültigen Beziehung J α qU α δ 4 X X (t) erhält man dann aufgrund der Maxwell-Gleichungen bzw. Aα das Transformationsgesetz eines Pseudovektors, also A0 A¼ 0 ,
Al
A¼ l
bzw.
A0 A¼0 ,
Al
μ0 J α auch für Aα A¼l .
(2.265)
Anschaulich bedeutet das: Bei Zeitumkehr laufen die Ladungen rückwärts, und mit dem Strom dreht auch das durch Al beschriebene Magnetfeld sein Vorzeichen um, während das Potential Φ c A0 unverändert bleibt. Mit (2.265) nimmt Gleichung (2.263) die Form α h ¼ ¼ ∂ α e A α ψ ¼ m 0 c ψ ¼ 0 γ i
2.13 Diracs Löchertheorie und Theorie des Positrons
71
der Dirac-Gleichung (2.173) an. Diese ist also bei Zeitumkehr invariant, wobei das Potential A¼α gemäß (2.265) als Pseudovektor transformiert wird. Das Transformationsgesetz für den Spinor ψ ist (2.264) mit (2.260). Man kann T
T0 K
schreiben. Nach (2.261) gilt T0 T0 Operator K erfüllt K (λ1 ψ1 λ2 ψ2 )
Kψ
mit T01 T01
ψ
(2.266)
1, d. h. der Operator T0 ist unitär. Der
(λ1 ψ1 λ2 ψ2 )
λ1 K ψ1 λ2 K ψ2 ,
eine Eigenschaft, für die er als antilinear bezeichnet wird; außerdem erfüllt er (K ϕ, K ψ)
(ϕ , ψ )
(ϕ, ψ) ,
weshalb er auch noch als antihermitesch bezeichnet wird. Auch der Operator T ist als Produkt eines unitären und eines antilinearen sowie antihermiteschen Operators antilinear und antihermitesch, es gilt T (λ1 ψ1 λ2 ψ2 )
T0 (λ1 ψ1
λ2 ψ2 )
λ1 T0 ψ1
λ2 T0ψ2
λ1 T ψ1 λ2 T ψ2
sowie (T ϕ, T ψ)
(ϕ , T0 T0 ψ )
(T0 ϕ , T0 ψ )
(ϕ , ψ )
(ϕ, ψ) .
Bei Angabe der Lösung (2.260) der Gleichungen (2.259) wurde schon darauf hingewiesen, daß es mehrere mögliche Lösungen gibt. Die Lösung (2.260) wurde so gewählt, daß die Spinor-Transformation (2.264) die Eigenschaften besitzt, die man physikalisch bei Zeitumkehr erwartet: Während die Energie unverändert bleibt, wird der Teilchenimpuls umgekehrt (siehe unten). Für den Erwartungswert einer Observablen L gilt 3 (2.264) (ψ ) L ψ d x (ψ ) T0 L T0 ψ d 3x L ψ T0 L T0 ψ d 3x T0 L T0 . 1 3 Mit T0 iγ γ wird daraus
i
1 3 γ γ
i γ 1 γ 3 T0 T0 L T0 .
(2.203)
L
und T0
(2.261)
T0
T0
(2.267)
Mit Hilfe dieser Formel können die Beziehungen
H H , (2.268) abgeleitet werden (Aufgabe 2.9), wobei wie A transformiert werden muß, nach x x ,
(2.265d) also gemäß
p p ,
.
(2.269)
72
2 Dirac-Theorie des Elektrons und des Neutrinos
CPT-Symmetrie Da die Operationen der Raumspiegelung am Koordinatenursprung und der Zeitumkehr die Dirac-Gleichung invariant lassen, können sie bei der Konstruktion ladungskonjugierter Positronlösungen mit einbezogen werden. Dementsprechend erwarten wir, daß ψC PT (x ¼ , t ¼ )
C PT ψ(x, t)
t¼
mit
t,
x¼
x
(2.270)
eine Lösung der Dirac-Gleichung für Positronen ist, wenn ψ(x, t) eine Elektronenlösung ist. Dabei ist (2.271) A¼α Aα zu fordern, da die sich gegenseitig kompensierenden Transformationen (2.247b) und (2.265b) hintereinander ausgeführt werden. Zunächst folgt aus den Definitionen (2.231) mit (2.233), (2.244) und (2.264) mit (2.260), also C i γ 2 (...) , P γ 0 und i γ 1 γ 3 (...) ψC PT (x , t ) i γ 2 γ 0 i γ 1 γ 3 ψ oder mit (2.207)
ψC PT (x , t )
(2.203)
γ 2γ 0γ 1γ 3ψ
γ 0γ 1γ 2γ 3ψ
i γ 5 ψ(x, t) .
(2.272)
Jetzt multiplizieren wir die Dirac-Gleichung (2.173) von links mit i γ 5 und erhalten mit (2.208b) α h ∂α e Aα γ i γ 5 ψ m0c i γ 5 ψ 0. i Indem wir zur Abkürzung ψ ψC PT schreiben, erhalten wir mit ∂α (2.270b,c)), (2.271) und (2.272) h γα ∂ α e Aα ψ m 0 c ψ 0 , i
∂α (nach
also die Positronengleichung (2.232). Der Zusammenhang zwischen transformierten und untransformierten Erwartungswerten kann durch die Kombination ihres Verhaltens bei den Einzeltransformationen C, P und T erschlossen werden. x bleibt z. B. bei den Transformationen C und T erhalten und wird durch P im Vorzeichen umgekehrt, d. h. wir erwarten x x . Analog kann bei allen anderen Erwartungswerten vorgegangen werden. Es ist jedoch auch nützlich, ihr Verhalten in einem Schritt aus der Transformationsgleichung (2.272) abzuleiten. Für einen beliebigen Operator L gilt L (ψ ) L ψ d 3x ψ γ 5 L γ 5ψ d 3x γ 5 L γ 5 . (2.273) Dabei wurde beachtet, daß wie bei der Paritätstransformation alleine der Vorzeichenwechsel d 3x d 3x durch einen Vorzeichenwechsel beim Vertauschen der oberen und
2.13 Diracs Löchertheorie und Theorie des Positrons
73
unteren Integralgrenzen kompensiert wird. Operatoren L ¼ , die keine Matrizen sind, vertauschen mit γ 5 , so daß man für sie mit (2.209) noch einfacher L ¼ ¼
L ¼
erhält. Durch Anwendung auf x ¼ x, ¼ bzw. p ¼ p erhalten wir auf diese Weise unmittelbar x ¼ ¼ x , p ¼ ¼ p . (2.274) Mit q ¼ q, (2.270c) und (2.271) ergibt sich aus (2.241) ¼ ¼ 0 l h ∂l q Al m 0 c2 γ 0 , H (q ) qΦ cγ γ i und die Anwendung von (2.273) liefert 5 0 l h ∂l q Al m 0 c2 γ 0 γ 5 γ H ¼ (q ¼ )¼ qΦ cγ γ i (2.208b) 5 5 0 l h 2 0 ∂l q Al m 0 c γ γ γ qΦ cγ γ i (2.209) 0 l h 2 0 ∂l q Al m 0 c γ qΦ cγ γ i oder mit (2.241)
H (q )
H (q) .
(2.275)
Für den Spinoperator gilt bei der Zeitspiegelung nach (2.269) , bei der Raumspiegelung nach (2.253) und bei der Ladungskonjugation , letzteres, weil bei dieser alle Operatoren unverändert gelassen werden und nur deren Mittelwerte mit ladungskonjugierten Zuständen berechnet werden (siehe vor Gleichung (2.238)). Bei der CPT-Transformation gilt also insgesamt
.
(2.276)
Aus (2.273) ergibt sich damit für zyklische Indizes l, m, n Σn
(2.208b)
5 (2.206) 5 γ Σn γ 5 γ 5 Σn γ 5 γ i γ lγ mγ 5 5 5 l m (2.209a) l m γ γ iγ γ iγ γ Σn ,
in Vektornotation also
.
(2.277)
Für die Teilchendichte gilt n ( x, t) n (x , t ) (ψ ) ψ
ψ
5 5 γ γ ψ
(2.209a)
ψ ψ
n(x, t) ,
74
ct
2 Dirac-Theorie des Elektrons und des Neutrinos
e
Paarvernichtung
Abb. 2.7: Ein Elektron negativer Energie, das in der Zeit rückwärts läuft, ist nicht unterscheidbar von einem Positron positiver Energie, das in der Zeit vorwärts läuft. Die Vorgänge der Paarerzeugung und Paarvernichtung können als Richtungswechsel des Elektrons in der Zeit betrachtet werden.
e e Paarerzeugung
x
was im quasiklassischen Grenzfall bedeutet, daß die (raumgespiegelten) Bahnen rückwärts durchlaufen werden. Ein Elektron mit negativer Energie und negativem Impuls, das rückwärts in der Zeit läuft, ist also nicht unterscheidbar von einem Positron mit positiver Energie und positivem Impuls, das vorwärts in der Zeit läuft (Abb. 2.7). Dies ist die Feynman-Stückelberg-Interpretation des Antiteilchens.
2.14 Dirac-Gleichung für Neutrinos Wird in der Dirac-Gleichung (2.55) m 0 0 und q 0 gesetzt, so ergibt sich aus ihr ih ∂t ψ
c« p ψ
(2.278)
als Gleichung für neutrale Teilchen verschwindender Ruhemasse. Wie wir feststellen werden, handelt es sich bei den Teilchen um Neutrinos. Mit dem Ansatz ψ e i Et /h folgt aus (2.278) Eψ
c« p ψ ,
(2.279)
und der Zusammenhang (2.78) vereinfacht sich zu E
cp .
(2.280)
Die de Broglie-Relationen E hω, p hk und die Definition Úg ∂ω/∂ k führen hiermit zu der Ausbreitungsgeschwindigkeit p (2.281) Úg c p von Wellenpaketen. Teilchen der Ruhemasse null können sich also nur mit Lichtgeschwindigkeit ausbreiten. Dies hat zur Folge, daß es keinen nicht-relativistischen Grenzfall gibt, bei dem man zwischen großen und kleinen Komponenten des Spinors ψ unterscheiden könnte. Wird die Zerlegung (2.73) in die Energieeigenwertgleichung (2.279) mit (2.280) eingesetzt, so geht diese mit der Definition n
p p
(2.282)
2.14 Dirac-Gleichung für Neutrinos
in
« n ψ
(2.51)
n 0
0 n
75
ϕ χ
nχ nϕ
ψ
ϕ χ
bzw. in die beiden Gleichungen ϕ
n χ ,
χ
n ϕ
(2.283)
über. Indem wir aus diesen χ oder ϕ eliminieren, erhalten wir ϕ n χ n n χ und daraus mit (2.282), (2.76) und p (h/i) h 2 ϕ
p2 ϕ ,
h 2 χ
p2 χ .
n ϕ oder (2.284)
Die in den zwei Komponenten von ϕ enthaltenen zwei Freiheitsgrade – χ wird nach (2.283b) durch ϕ festgelegt – bedeuten, daß wir es wie beim Elektron mit Spin-1/2Teilchen zu tun haben. Präziser käme diese Eigenschaft bei Wechselwirkungen mit anderen Teilchen zum Ausdruck, bei denen Drehimpuls übertragen wird. Die durch (2.278) beschriebenen Teilchen sind masselos, elektrisch neutral, breiten sich mit Lichtgeschwindigkeit aus und haben den Spin 1/2. Hieraus folgt, daß es sich um Neutrinos handelt. ϕ und χ erfüllen nach (2.284) dieselbe Gleichung, was zur Folge hat, daß zusammen mit einer Lösung ϕ der Gleichung (2.284a) nach (2.283b) auch χ n ϕ eine Lösung ist. Da die Gleichung (2.284a) linear ist, sind dann auch die beiden Linearkombinationen 1 1 ϕ, G (1 n) ϕ (2.285) F (1 n) 2 2 Lösungen. Durch Anwendung des Operators n F
1 ( n n 2 1 h 2 ϕ
2
p2
n) ϕ
(2.76)
n ϕ
n auf F ergibt sich
1 n 2
(2.284a)
n2 ϕ
1 (1 2
n) ϕ
1 p 2 2 p2
n ϕ
F.
Eine entsprechende Rechnung kann für G durchgeführt werden, und die Zusammenfassung beider Ergebnisse führt zu n F
F,
n G
G.
(2.286)
p projiziert – bis auf den Faktor h/2 – den Spin des TeilDer Operator n p/ chens auf seine Bewegungsrichtung. Die beiden Gleichungen (2.286) besagen daher, bzw. h/2 daß im Zustand F bzw. G die Spinkomponente in Bewegungsrichtung h/2 beträgt. Die Eigenwerte 1 des Operators n werden als Spiralität oder Helizität des Neutrinos bezeichnet. Die Erfahrung zeigt, daß Neutrinos in Zuständen wohldefinierter Helizität, also entweder im Zustand F oder G angetroffen werden. Wegen v c kann ein Neutrino nicht abgebremst werden und seine Geschwindigkeit umkehren. Daraus folgt, daß die Helizität eine feste Teilcheneigenschaft der Neutrinos ist.
76
2 Dirac-Theorie des Elektrons und des Neutrinos
Trotz fehlender Ladung ist auch bei Neutrinos die Operation (2.231) der Ladungskonjugation möglich. Aus dem Spinor ψ entsteht dabei der Spinor ψC
i γ 2ψ ,
der nach (2.232) (mit e 0 und m 0 0) wieder die Neutrinogleichung (2.278) erfüllt. Offensichtlich gelten auch jetzt die Relationen (2.239). Da bei der Ladungskonjugation Impuls und Spin beide das Vorzeichen wechseln, bleibt das Vorzeichen der Helizität erhalten. Experimentell hat man festgestellt, daß Neutrino und Antineutrino verschiedene Teilchen sind: Das Neutrino hat negative und das Antineutrino positive Helizität. Dies bedeutet, daß die Ladungskonjugation nicht den Übergang vom Neutrino zum Antineutrino darstellen kann.
2.15 Viel-Teilchen-Phänomene in der Dirac-Theorie Daß das Vakuum nach der Diracschen Löchertheorie mit Elektronen und Positronen negativer Energie besetzt ist, muß sich irgendwie bemerkbar machen. Mit Auswirkungen davon wird man insbesondere dort rechnen, wo starke elektromagnetische Felder auftreten. Das Pauli-Prinzip wird zwar dafür sorgen, daß nicht zwei Teilchen den gleichen Teilchenzustand einnehmen, aber es kann nicht verhindern, daß die geladenen Teilchen im Vakuumuntergrund durch starke elektromagnetische Felder verschoben werden. Eine Theorie, die derartige Situationen korrekt beschreibt, müßte im Prinzip eine Viel-Teilchen-Theorie sein. Wir werden im folgenden jedoch zwei Beispiele im Rahmen der für Einzelteilchen abgeleiteten Dirac-Theorie untersuchen. Beim ersten liefert schon diese quantitative Aussagen, die allerdings einer Viel-Teilchen-Interpretation bedürfen. Beim zweiten werden wir nur zu qualitativen Aussagen gelangen. Eine den Viel-Teilchen-Phänomenen angemessene Theorie ist die Quantenfeldtheorie. Ihre Anfangsgründe werden im nächsten Teil des Buches behandelt.
2.15.1 Kleinsches Paradoxon Sehr starke elektrische Felder sind mit starken Änderungen des elektrischen Potentials über kurze Distanzen verknüpft. Das theoretische Konzept eines Potentialsprungs an einer Potentialschwelle impliziert sogar eine unendlich große elektrische Feldstärke. Nach den vorangegangenen Überlegungen müssen wir daher mit Viel-TeilchenAspekten der Dirac-Theorie rechnen, wenn ein Elektron auf eine Potentialschwelle auftrifft. Diese Situation wird im folgenden zunächst anhand der Ein-Teilchen-Theorie untersucht und anschließend unter Benutzung von Viel-Teilchen-Aspekten interpretiert. Zur Vorbereitung betrachten wir die stationäre Dynamik eines Elektrons in einem räumlich und zeitlich konstanten Potential V0 . Die Dirac-Gleichung dafür lautet
(V m c β c« p ) ψ .
ih ∂t ψ
0
0
2
2.15 Viel-Teilchen-Phänomene in der Dirac-Theorie
77
E V0 m 0 c2 V0 0 V0 m 0 c2
Abb. 2.8: Energiespektrum eines Elektrons im konstanten Potential V0 . Gegenüber dem freien Elektron sind die Energiekontinua um V0 nach oben verschoben.
Zu ihrer Lösung wählen wir den Ansatz ψ
U ei ( p x
Et )/h
,
(2.287)
der mit p ψ pψ und ih ∂t ψ Eψ die Beziehung (E
V0)ψ (m 0c2 β
c« p)ψ
zur Folge hat. Das ist dieselbe Gleichung, die wir bei freien Elektronen erhalten hatten, nur daß E durch E V0 ersetzt ist. Daher erhalten wir statt der Dispersionsrelation (2.78) jetzt E V0 Ep mit Ep (m 0 c2 )2 c2 p2 . (2.288) Wieder haben wir zwei Energiekontinua, die jedoch gegenüber denen bei freien Teilchen um V0 verschoben sind, statt Abb. 2.2 erhalten wir nun Abb. 2.8. Nun betrachten wir den Fall, daß ein stationärer Elektronenstrahl von links aus dem Gebiet x < 0 nach rechts auf eine Potentialschwelle * 0 für x < 0 V (x) V0 für x 0 bei x 0 zuläuft. Solange die kinetische Energie E kin E m 0 c2 größer als V0 ist, erwarten wir neben der von links einfallenden Welle eine durchlaufende und eine reflektierte Welle. Für V0 > E m 0 c2 sollte dagegen Totalreflexion auftreten und bei x > 0 nur noch eine gedämpfte Welle existieren. Nach (2.78) und (2.288) gilt für x < 0 (vor der Schwelle) E 2 /c2 p2 m 02 c2 und für x 0 (hinter der Schwelle) (E
V0 )2 p 2 c2
bzw.
p
(E
m 02 c2
V0)2 m 2c2 . c2
0
(2.289)
(2.290)
Der Ansatz (2.287) gilt vor und hinter der Schwelle. Die über die Schwelle nach x 0 eindringende Welle wird gedämpft, sobald p 2 < 0 und damit p imaginär wird. (Neben
78
2 Dirac-Theorie des Elektrons und des Neutrinos
E V0 m 0 c2 V0 m 0 c2
V0 m 0 c2
E
Abb. 2.9: Übergang der von links einlaufenden Elektronen positiver Energie in ein Band negativer Energie rechts der Potentialschwelle für den Fall V0 > E m 0 c2 .
0 m 0 c2
der gedämpften liefert (2.290) auch eine angefachte Welle, die jedoch aus physikalischen Gründen ausgeschlossen werden muß.) Das ist für E V0 < m 0 c2 bzw. E
m 0 c2 < V0 < E
m 0 c2
der Fall. Daß p imaginär wird, wenn V0 den Wert E m 0 c2 überschreitet, entspricht der Erwartung. Überraschenderweise wird p jedoch reell, wenn V0 über den Wert E m 0 c2 hinauswächst (Abb. 2.9). Es gibt dann wieder eine durchlaufende Welle, und nur ein Teil der einfallenden Welle wird reflektiert. Für ein durchlaufendes Elektron folgt aus V0 >E m 0 c2 allerdings E kin
E
m 0 c2
V0 <
2m 0c2 ,
die kinetische Energie ist negativ, und aus (2.289) ergibt sich in diesem Fall bzw. für E V0 < m 0 c2 E V0 c p 2 m 02 c2 .
Setzt man hierin die de Broglie-Relationen E h ω sowie p h k ein, so erhält man die Gruppengeschwindigkeit dω ch k c2 p . vg E V0 d k p 2 m 02 c2
Da die Elektronen im Einfallbereich x 0 von links nach rechts laufen, müssen sie das auch im Bereich x > 0 tun, d. h. v g 0. Wegen E V0 < 0 ist das nur für p 0 möglich. Das Kleinsche Paradoxon besteht darin, daß die Potentialschwelle für V0 > E m 0 c2 Teilchen durchläßt. Es kommt dadurch zustande, daß einige Elektronen nach deren Durchdringen mit negativer kinetischer Energie nach rechts weiterlaufen können. Eine Viel-Teilchen-Theorie mit einem Kontinuum von Zuständen negativer Energie liefert die Möglichkeit zu einer physikalischeren Deutung: Für V0 m 0 c2 > E > m 0 c2 können die von links auf die Potentialschwelle auftreffenden Elektronen aus dem Vakuum des Gebiets rechts der Schwelle Elektronen herausschlagen, die nach links laufen. Der Reflexionskoeffizient wird hierdurch – anders als bei der zuerst besprochenen Ein-Teilchen-Interpretation – größer als eins. Die dabei entstehenden Löcher laufen als Positronen mit positivem Impuls ( p > 0) nach rechts. Mit anderen Worten bedeutet das, daß es beim Aufprall der Elektronen auf die Potentialschwelle zur Paarerzeugung kommt. Die vollständige Durchrechnung des Reflexionsproblems wird zur Übung empfohlen (Aufgabe 2.10).
2.15 Viel-Teilchen-Phänomene in der Dirac-Theorie
79
2.15.2 Polarisation des Vakuums In der Nachbarschaft geladener Punktteilchen treten sehr starke Felder auf. Wir erwarten, daß z. B. ein im Vakuum befindliches Elektron positiver Energie die ihm benachbarten Vakuumelektronen negativer Energie abstößt, während es die benachbarten Vakuumpositronen anzieht (Abb. 2.10 (a)). Dies bedeutet, daß das Vakuum als ein polarisierbares Medium aufgefaßt werden kann, dessen Polarisation aus Elektron-PositronPaaren gebildete Dipole hervorrufen. Für das elektrische Feld in einem polarisierbaren Medium (siehe Elektrodynamik, Abschn. E4.8.4) gilt div(ε0 E
P) λ
oder
div ε0 E
λ div P λ
λP ,
wobei λ P div P als Polarisationsladungsdichte bezeichnet wird. Die eigentliche Ladung des Elektrons, die auch den Namen nackte Ladung trägt, wird demnach durch die Polarisationsladungen des Vakuums abgeändert. Da die aus Elektron-PositronPaaren gebildeten Dipole ein elektrisches Feld erzeugen, das dem des Elektrons entgegengerichtet ist, wird dessen Feld abgeschwächt. Die Polarisationsladung hat daher das entgegengesetzte Vorzeichen wie die Ladung des Elektrons. Der qualitative Verlauf der Ladungsdichte in der Umgebung des Elektrons ist in Abb. 2.10 (b) dargestellt. In größerem Abstand vom Elektron mißt man die Ladung e (λ λ P ) d 3x . Rückt man dem Elektron sehr nahe, so mißt man dagegen die nackte Ladung en λ d 3x , U
wobei das Integrationsgebiet U nur die unmittelbare Nachbarschaft des Elektrons erfaßt und en >e gilt. Die Polarisation des Vakuums macht sich im Wasserstoffatom bei den l 0 -Zuständen des Elektrons bemerkbar, deren Aufenthaltswahrscheinlichkeit ψψ auch noch λ
λP λ λP r λ
(a)
(b)
Abb. 2.10: (a) Polarisierende Wirkung eines Elektrons auf seine Umgebung. (b) Qualitativer Verlauf der Ladungsdichte λ, der Polarisationsladungsdichte λ P und der Gesamtladungsdichte λ λ P in der Umgebung eines Elektrons.
80
2 Dirac-Theorie des Elektrons und des Neutrinos
sehr nahe dem Kern wesentlich von null verschieden ist: Dort macht sich die höhere nackte Ladung des Elektrons bemerkbar und bewirkt eine stärkere Anziehung durch den Kern, was zu einer Erniedrigung der Energie der l 0 -Niveaus führt. Allerdings wird diese zum Teil durch die Lamb-Shift (siehe Abschn. 8.3.8) der Elektronen kompensiert, die durch fluktuierende elektromagnetische Felder hervorgerufen wird. Dabei handelt es sich um zeitabhängige Felder, die durch statistische Fluktuationen im Zustand des Vakuums auftreten. Deren zeitliche Mittelwerte verschwinden zwar, ihre quadratischen Mittelwerte sind aber von null verschieden und beeinflussen die Elektronenbahnen.
2.15.3 Orts-Impuls-Unschärferelation und Paarerzeugung Je genauer der Ort eines Teilchens gegeben ist, desto größer wird nach der Orts-ImpulsUnschärferelation h (2.291) x p 2 seine Impulsunschärfe p, und desto größer werden damit auch die möglichen Werte seines Impulses. Mit einem hohen Impuls des Teilchens ist gleichzeitig eine hohe kinetische Energie verbunden. Wenn diese den Wert 2m 0 c2 überschreitet, wobei m 0 die Ruhemasse eines Elektrons bzw. Positrons ist, kann sie von dem betrachteten Teilchen auf ein Elektron (oder Positron) negativer Energie übertragen werden und dieses aus der DiracSee heraus in einen Zustand positiver Energie E m 0 c2 überführen. Bei hinreichend starker Lokalisierung kann das Teilchen also im Vakuum die Erzeugung eines ElektronPositron-Paares herbeiführen. Im Anschluß an diesen Prozeß hat man es mit drei Teilchen zu tun, dem ursprünglichen Teilchen und dem Elektron-Positron-Paar. Dies zeigt erneut, daß die relativistische Quantenmechanik keine genuine Ein-Teilchen-Theorie ist, sondern unter gegebenen Umständen zwangsläufig zu Viel-Teilchen-Phänomenen führt. Durch die Paarerzeugung werden der Impuls und die Impulsunschärfe des ursprünglichen Teilchens kleiner, was zur Folge hat, daß nach (2.291) die Ortsunschärfe wieder größer wird. Dies bedeutet, daß in der relativistischen Quantenmechanik anders als in der nicht-relativistischen Quantenmechanik der Ort eines Teilchens nicht beliebig scharf werden kann. Die Ortsunschärfe besitzt vielmehr eine untere Grenze, die im folgenden berechnet werden soll. Da es uns nur auf deren ungefähren Wert ankommt, werden wir in der folgenden Rechnung zum Teil klassische Elemente benutzen. Wir nehmen an, daß das Teilchen, dessen minimale Ortsunschärfe berechnet werden soll, ebenfalls ein Elektron oder Positron ist, so daß seine Ruhemasse m 0 die gleiche wie die der bei der Paarerzeugung entstehenden Teilchen ist. Die kinetische Energie des Teilchens ist 1 1 m 0 c2 . E kin mc2 m 0 c2 1v 2 /c2 Für
1
1v 2 /c
1 2
m 0 c2
2m 0 c2
Aufgaben
81
oder
1 1 v 2 /c2
3
reicht diese zur Paarerzeugung aus. Die Auflösung der letzten Ungleichung nach v/c liefert v 2 2 c 3 und m0v p mv 3m 0v 2 2 m 0 c . (2.292) 2 2 1 v /c Gleichung (2.291) entnehmen wir für die Unschärfe des Teilchenorts die Abschätzung x
h . p
(2.293)
< p < p annehmen, für p 0 Für p 0 kann der Impuls Werte im Bereich p
sind noch größere Impulswerte möglich. Demnach wird gemäß (2.292) für p 2m 0 c
(2.294)
(wegen des Überschlagscharakters unserer Rechnung konnte der Faktor 2 weggelassen werden) die Paarerzeugung möglich. Nach (2.293) mit (2.294) geschieht das für x <
h 2m 0 c
(Q2.26)
λCompt .
(2.295)
Die untere Grenze der Ortsunschärfe eines relativistischen Teilchens ist also in etwa die Compton-Wellenlänge. Versucht man, das Teilchen in ein Gebiet kleinerer Ausdehnung zu zwängen, so kommt es zur Paarerzeugung.
Aufgaben 2.1
Ehrenfestsche Theoreme. Beweisen Sie für die Dirac-Gleichung mit Magnetfeld die Gültigkeit der Ehrenfestschen Theoreme d x dt
0 ∂ H 1 ∂ p
,
d p dt
0 ∂ H 1 ∂x
Hinweis: p kann durch p q A ausgedrückt werden.
2.2
.
Welcher Zusammenhang besteht im Fall Φ 0 zwischen den Eigenfunktionen bzw. Eigenwerten des zur Dirac-Gleichung gehörigen Hamilton-Operators H und denen des Masseoperators m ?
82
2 Dirac-Theorie des Elektrons und des Neutrinos
2.3
1. Welche Näherung muß gelten, damit der Mittelwert m des Masseoperators im quasiklassischen Grenzfall in die klassische relativistische Masse übergeht? 2. Berechnen Sie die Zeitableitung des Mittelwerts m des Masseoperators in einem elektrischen Feld und zeigen Sie, daß sie im quasiklassischen Grenzfall in die klassische zeitliche Massenänderung übergeht. Hinweis: Man beachte, daß der quasiklassische und der nicht-relativistische Grenzfall nicht dasselbe sind. Der quasiklassische Grenzfall der relativistischen Quantenmechanik ist relativistisch!
2.4
Beweisen Sie für 44–Matrizen die Multiplikationsregel
A11 A21
A12 A22
B11 B21
B12 B22
A11 B11 A12 B21 A21 B11 A22 B21
A11 B12 A12 B22 , A21 B12 A22 B22
wobei Ai j und Bi j (i 1, 2, j 1, 2) 22–Blockmatrizen sind. 2.5
Lösungen negativer Energie im nicht-relativistischen Grenzfall. Berechnen Sie den nicht-relativistischen Grenzfall der Dirac-Gleichung mit zeitlich veränderlichen Feldern für Lösungen negativer Energie. Gehen Sie analog zum Fall der Lösungen positiver Energie vor.
2.6
Zur Ableitungslinearisierung der Schrödinger-Gleichung. 1. Berechnen Sie den Operator M L für den Fall minimaler Kopplung zeitabhängiger Felder Φ und A. 0 im Spezialfall E (∂t A Φ)0 2. Zeigen Sie, daß die Gleichung M Lψ wieder zur Pauli-Gleichung führt. Anleitung: Es vereinfacht die Rechnung, wenn man die Operatoren τ ih ∂t qΦ und (h/i) q A benutzt. Behandeln Sie den Ausdruck αl αm π l π m genauso wie den Ausdruck σl σm π l π m in Abschn. 2.8.1.
2.7
Geschwindigkeitsoperator in der Dirac-Theorie. Wie ist es möglich, daß in der Dirac-Theorie der Mittelwert cαi
ψ αi ψ d 3 τ
der konstanten Matrizen cαi die – beliebig vorgebbare – Teilchengeschwindigkeit d x i /dt ergibt, obwohl sich bei der Mittelung die Phasen von ψ U eiS/h herausheben? Anleitung: 1. Berechnen Sie zunächst, was sich bei den in Abschn. 2.4 abgeleiteten Ebene-Welle-Lösungen bei in z-Richtung laufenden Wellen für cαz und cαx ergibt. 2. Konstruieren Sie dann in x-Richtung laufende ebene Wellen positiver Energie derart, daß sich cαx u x ergibt. Was ist der Unterschied gegenüber den in z-Richtung laufenden Wellen? Welcher Unterschied besteht gegenüber den Ebene-Welle-Lösungen der Schrödinger-Theorie? 2.8
1. Zeigen Sie, daß beim Zerfall eines Photons in ein Elektron-Positron-Paar die Erhaltungsgleichungen für Energie und Impuls nicht gleichzeitig erfüllt werden können. 2. Durch Betrachten des Verhältnisses aus Energie und Impuls kann qualitativ gezeigt werden, daß der Impuls des Photons zu groß ist, um vom Elektron-Positron-Paar aufgenommen zu werden.
Aufgaben
83
2.9
Transformationsverhalten bei Zeitumkehr. Wie hängen bei der Zeitspiegelung x ¼ x, t ¼ t die Mittelwerte x ¼ ¼ , p ¼ ¼ , H ¼ ¼ und ¼ ¼ mit den Mittelwerten x , p , H und zusammen?
2.10
Kleinsches Paradoxon: Untersuchen Sie die Streuung von relativistischen Elektronen der Energie E und des Impulses p p ex an der Potentialschwelle * 0 für x < 0, V (x) V0 > 0 für x 0. Berechnen Sie den Reflexionskoeffizienten R jr /je und den Durchlaßkoeffizienten D jd /je, wenn je der einfallende, jd der durchgehende und jr der an der Potentialschwelle reflektierte Teilchenstrom ist. Wie verhalten sich diese Koeffizienten, wenn V0 die Grenzen E m 0 c2 bzw. E m 0 c2 überschreitet? Was passiert für V0 ?
Lösungen 2.2
Für Φ 0 gilt m H /c2 . Aus H ψ Eψ folgt E m ψ 2 ψ m ψ . c Die Eigenzustände sind die gleichen, zwischen den Eigenwerten besteht der Zusammenhang m E/c2 .
2.6
1. Mit « τ τ « , β β und τ τ i h q (∂t AΦ) ergibt sich
1 1 M L (β 1)τ i m(β 1) (β 1)τ i m(β 1) 2 2
1 2 i m (β 1) τ 2 (β 1) τ (β 1)2 τ 4 2 2 i 2 (β 1) τ i m (β 1) m2 (β 1)2 τ i m(β 1) m 2 (β 2 1) 2i β τ β τ ( τ τ ) m2 (β 1)2 (β 1)2 τ i m(β β ) 2i (β 1) (τ τ ) (β β ) τ 2m τ 2m τ h2q (β 1) (∂t AΦ) . 2. Für ∂t AΦ 0 folgt daraus M L
2m τ .
84
2 Dirac-Theorie des Elektrons und des Neutrinos
Ähnlich wie in Abschn. 2.8.1 ergibt sich
«
αl αm π l π m
2
αl αm π l , π m .
l,m zykl
Aus σl σm i σ n für zyklische l, m, n und (2.51) folgt 0 σm 0 σl σl σm 0 σn αl αm i σl 0 σm 0 0 σl σm 0
0 σn
.
Mit π l , π m (q h/i)B n für zyklische l, m, n folgt schließlich
2
q h B
und
ML
2m τ
2
q h B
Σl
mit
σl 0
0 σl
.
Für die zwei oberen Komponenten des Viererspinors ψ folgt damit aus der Gleichung M Lψ 0 die Pauli-Gleichung. 2.8
1. Mit E
c m 20 c2 p2
mc2
m 0 c2 1v 2 /c2
,
m p 0 1v 2 /c2
und der Abkürzung γ 1/ 1v 2 /c2 sind die Erhaltungsgleichungen hω
m 0 c2 (γ1 γ2 ) ,
hk
m 0 (γ1 1 γ2 2 )
unter der Bedingung ω/k c zu lösen. Werden die beiden Gleichungen erst quadriert und dann durcheinander dividiert, so ergibt sich c4 γ12 γ22 2γ1 γ2 ω2 2 c , k2 γ12 12 γ22 22 2γ1 γ2 1 2 daraus folgend 2 2 γ12 1 12 γ22 1 22 2γ1 γ2 1 1 2 2 1 1 2γ1 γ2 1 1 2 2 0 c c c c und schließlich
γ 1 γ 2 1 1 2 2 1 . c
Es gilt γ1 >0, γ2 >0, 11 2 /c2 >0, und daher ist die linke Seite positiv. Da die rechte Seite negativ ist, kann die Gleichung nicht erfüllt werden. 2. Das Verhältnis Impuls/Energie beim Elektron und Positron bzw. Photon ist p '' mv v hk k 1 p '' , . ' ' E E γ hω ω c mc2 c2 Hieraus folgt pγ
Eγ , c
p
v E , c2
Aufgaben
85
und bei Energieerhaltung gilt E E γ /2. Hiermit folgt v Eγ
p
v pγ . 2c
2 c2
Der mit der Energie des Photons aufgenommene Impuls ist also viel zu klein zur Impulspγ /2 gelten müßte. erhaltung, für die p
2.9
Mit x ¼ x und p ¼ (h /i) ∂ x
¼
(h /i) ∂x p sowie p p ergibt sich £
x (2.267) T0 (x ) T0 (T0 )2 x (2.261) x x , 2 p T0 ( p ) T0 T0 ( p ) p p . ¼ ¼
¼ £
£
£
£
¼ ¼
¼ £
£
£ £
£
Es gilt H ¼ £
qΦ m 0 c2 β c« ( p q A) qΦ m 0 c2 β c« ( p q A ) (2.265) qΦ m 0 c2 β c« ( p q A) (2.203) qΦ m 0 c2 β cα1 ( p1 q A1 ) cα2 ( p2 q A2 ) cα3 ( p3 q A3 ) , ¼
¼
£
£
£
¼
£
£
und damit wird
H
¼ ¼
(2.260)
0
T02 qΦ
1£
0
1£
0
m 0 c2 γ 1γ 3 βγ 1γ 3 c ( p1 q A1 )γ 1γ 3α1 γ 1γ 3 1£
0
0
c ( p2 q A2)γ 1γ 3 α2γ 1γ 3 c ( p3 q A3 )γ 1γ 3α3 γ 1γ 3
1£
1£
.
Mit α1 β 1 γ 1 βγ 1 γ 0 γ 1 , α2 γ 0 γ 2 und α3 γ 0 γ 3 ergibt sich
γ 1γ 3γ 0γ 1γ 3 γ 1 γ 0γ 1 γ 0 β , γ 1 γ 3 α 1 γ 1 γ 3 γ 1 γ 3 γ 0 γ 1 γ 1 γ 3 γ 1 γ 3 γ 0 γ 3 γ 0 γ 1 β 2 α 1 α 1 γ 1 γ 3 α2 γ 1 γ 3 γ 1 γ 3 γ 0 γ 2 γ 1 γ 3 γ 1 γ 0 γ 2 γ 1 γ 0 γ 2 α2 γ 1 γ 3 α3 γ 1 γ 3 γ 1 γ 3 γ 0 γ 3 γ 1 γ 3 γ 1 γ 0 γ 1 γ 3 γ 0 γ 3 α3 , und aus H wird schließlich 0 1 H qΦ m 0 c2 β cα1 ( p1 q A1 ) cα2 ( p2 q A2 ) cα3 ( p3 q A3 ) γ 1 γ 3 βγ 1 γ 3
¼ ¼
¼ ¼
0 qΦ
1£
£
m 0 c2 β c« ( p q A) H H . £
Bezüglich ¼ ¼ ergibt sich z. B. für die 3-Komponente 0 £ 1£ Σ3¼ ¼ T0 (Σ3¼ )£ T0 £ T0 Σ3£ T0 £ i γ 1γ 3 i γ 1γ 2 i γ 1γ 3 0
0
1£
i γ 1γ 3
γ1
£
i γ 2γ 1
0
γ2
£
i γ 1γ 2
γ 1γ 3
1£
1£
0 1£ i γ 1γ 3γ 1γ 2γ 1γ 3
Σ 3 Σ 3 . £
Der Beweis für die 1- und 2-Komponente erfolgt analog.
0
i γ 3γ 2γ 1γ 3
1£
3
Anwendungen der Dirac-Theorie
3.1
Zitterbewegung des Elektrons
Für die mittlere Geschwindigkeit eines freien Elektrons fanden wir das Ergebnis (2.61). Wenn wir danach fragen, welchen Wert der Geschwindigkeit eine einzelne Messung liefert, stoßen wir auf ein merkwürdiges Resultat: Als Folge der Beziehungen (2.49) besitzt jede Komponente von c« nur die Eigenwerte c, d. h. bei der Messung einer Geschwindigkeitskomponente findet man nach den üblichen Regeln der Quantenmechanik nur entweder c oder c. (Wie das mit den Ergebnissen praktischer Messungen zu vereinbaren ist, wird am Ende dieses Abschnitts diskutiert.) Das ist ganz anders als in der Schrödingerschen Wellenmechanik, in der sich für den Geschwindigkeitsoperator p /m das kontinuierliche Spektrum der Eigenwerte p/m ergibt. Von ausschlaggebender Bedeutung für dieses Ergebnis ist, daß in den Eigenzuständen des Geschwindigkeitsoperators c neben Wellen positiver auch Wellen negativer Energie enthalten sind: In Aufgabe 3.1 wird gezeigt, daß ⎞ ⎛ ϕ ⎟ ⎜ (3.1) ψ ⎝ p ⎠ ei px/h ϕ p für beliebige Zweierspinoren ϕ die gemeinsamen Eigenzustände der Operatoren c p und p zu den Eigenwerten cp und p sind. Andererseits sind nach (2.69), (2.73), (2.75) und (2.78) die gemeinsamen Eigenzustände von p und H für freie Teilchen ⎞ ⎛ ϕ ⎟ i ( px Et )/h ⎜ (3.2) ψ ( ) ⎝ c p ⎠e ϕ 2 m 0 c Ep mit beliebigem ϕ, wobei das obere Vorzeichen für Zustände positiver und das untere Vorzeichen für Zustände negativer Energie gilt. Zur Überlagerung der Zustände (3.1) aus ebenen Wellen (3.2) werden immer Lösungen sowohl positiver als auch negativer Energie benötigt (Aufgabe 3.2). Die in Richtung des Impulses p liegende Komponente c p/ p des Geschwindigkeitsoperators besitzt daher keine Eigenzustände rein positiver Energie, vielmehr sind an ihr auch negative Energien beteiligt. Für i k folgt aus (2.42c) αi , αk 2αi αk 0, d. h. verschiedene Komponenten der Geschwindigkeit lassen sich nicht gleichzeitig scharf messen. Auch dieses Ergebnis ist sehr merkwürdig, denn der Impulsoperator p (h /i) verhält sich ganz anders: Seine Komponenten vertauschen miteinander, und er besitzt beliebige Vektoren p als Eigenwerte. Dieses unterschiedliche Verhalten hat zur Folge, daß zwischen den Eigenwerten des Impuls- und Geschwindigkeitsoperators im allgemeinen nicht der klassische
3.1 Zitterbewegung des Elektrons
87
Zusammenhang p m Ú m 0 Ú /(1 v 2 /c2 )1/2 gelten kann, was auch daraus hervorgeht, daß für A0 nach (2.66) mit (2.65) mc « p gilt. Die mittlere Geschwindigkeit c« kann dagegen dem Betrage nach jeden beliebigen Wert zwischen den scharfen Meßwerten c annehmen. Für das mittlere Schwankungsquadrat der Geschwindigkeitskomponenten finden wir (2.42c) v i 2 c2 αi 2 cαi 2 c2 v i 2 , es ist um so größer, je kleiner die Geschwindigkeit v i ist. Dies bedeutet, daß die Bewegung eines Elektrons bei kleiner mittlerer Geschwindigkeit mit großen Schwankungen um diese herum erfolgt. Alle diese merkwürdigen Ergebnisse finden ihre Erklärung darin, daß der mittleren Bewegung x (t) des Elektrons eine hochfrequente Oszillation überlagert ist. Einen deutlichen Hinweis auf diese liefern schon die großen Schwankungen um die mittlere Geschwindigkeit. Genaueres erfahren wir durch die Untersuchung der Bahndynamik im Heisenberg-Bild. Der Hamilton-Operator eines freien Teilchens ist nach (2.58) H f
m 0c2 β c« p .
(3.3)
Für die zeitliche Änderung des die Geschwindigkeit beschreibenden HeisenbergOperators «H T (t, 0) « T (t, 0) erhalten wir nach (Q6.114) (mit H H H H f gemäß (Q6.120)) d «H dt
i1h «H, H f i1h «H , H f i2h «H H f s.u. 2hi c p H
«H H f ,
(3.4)
wobei zuletzt (mit Summenkonvention)
(αH )i , H f
(αH)i , H H (3.3) m 0c2 (αH)i , βH (αH )i , (αH )k m 0c2αi , β αi , αk (2.42c) 2δik c( p H)k 2c( p H)i s.u.
c( p H )k
αi , αk
(2.42b)
c( p H)k
c( p H)k
benutzt wurde. (Beim Schritt von der ersten zur zweiten Zeile ging die Invarianz komplexwertiger Kommutatoren gegenüber unitären Transformationen nach (Q6.88) ein.) Wegen d p H /dt p H , H H /(ih )T p , H f T /(ih )0 mit der Folge p H (t) p H (0) p (nach (Q6.110) für t0 0) und d H f /dt 0 kann (3.4) sofort integriert werden. Ableitungen von Operatoren sind wie die von gewöhnlichen Funktionen erklärt. Daher dürfen wir genau wie bei diesen integrieren, indem wir zur Lösung «H exp( 2i H f t/h ) der homogenen Gleichung die spezielle Lösung «H c p / H f der inhomogenen Gleichung addieren und die Integrationskonstante der Anfangsbedingung anpassen, c p 2i H f t /h «H (t) «H (0) cp . (3.5) Hf e Hf (Der Operator 1/ H f H f d xH dt
1
ist der zu H f inverse Operator.) Setzen wir dies in
i1h xH, H f i1h c αk pk T xi T ei cT αi T ei c «H
88
3 Anwendungen der Dirac-Theorie
ein (xH ist der Ortsoperator im Heisenberg-Bild) und integrieren über t, so erhalten wir xH (t)
xH (0)
c2 p H f
t
c p e 2i Hf t /h ih c «H (0) . H f 2 H f
(3.6)
Hieraus folgt aufgrund der Invarianz von Mittelwerten gegenüber der unitären Transformation, die vom Heisenberg-Bild zurück zum Schrödinger-Bild führt, und mit «H (0)« (nach (Q6.110) für t0 0) 2 ' ' c p e2i Hf t /h c p ' ' t ih c « . (3.7) x t x 0 H f H f 2 H f Dieses Ergebnis vergleichen wir mit dem klassischen Ergebnis x(t) x0
c2 p t, H
das sich durch Integration der aus (2.6) und (2.7) für Φ 0 und A 0 folgenden Gleichung x p/m c2 p/H ergibt. Die mittlere Bewegung (3.7) enthält zwei Terme, die der klassischen Bewegung entsprechen, unterscheidet sich von dieser allerdings in markanter Weise durch den letzten Term. Dieser beschreibt eine als Zitterbewegung bezeichnete Oszillation mit einer (sehr kleinen) Amplitude der Größenordnung h c/2E h /(2m 0 c) und einer (sehr großen) Frequenz der Größenordnung 2E/h (2m 0 c2 )/h . Das Elektron verhält sich demnach im zeitlichen Mittel ähnlich wie ein klassisches Elektron, führt jedoch um die quasi klassische mittlere Bewegung herum hochfrequente Oszillationen aus. Die Zitterbewegung tritt allerdings nur bei Wellenpaketen auf, die eine Mischung aus Wellen positiver und negativer Energie enthalten. Für Zustände ausschließlich positiver oder negativer Energie verschwindet sie (siehe dazu auch (2.93) und Abschn. 3.2.1), in diesen gilt c p e2i Hf t /h Z « 0. H f 2 H f Beweis: Nach (2.104) und (2.106) gilt z. B. für beliebige Zustände positiver Energie ψ () Π ψ () ΛΠ ψ () und damit (unter Benutzung von Π (Π ) und ΛΛ ) Z
s.u.
' ' ' ' 2i Hf t /h ' ' ' ( ) c p e2i Hf t /h '' () () 'Π Λ « c p e 'ψ ψ ψ () '' « ψ Π ' ' ' Hf 2 Hf Hf 2 Hf ' ' ' cp e2i Hf t /h '' () ( ) ' Π ψ 'Π Λ « . 'ψ Hf 2 Hf
Der Operator Π 1 Hf /( Hf2 )1/2 /2 konnte nach links durchgeschoben werden, weil der Term, an dem er vorbeigeschoben wurde, wie Π nur von Hf abhängt und daher mit ihm
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
89
vertauscht. Mit H f , «
(3.3)
m 0 c2 β, « c « p, «
(2.42b,c)
c p 2m 0 c2 β « 2c« p « 2c p 2 H f « H f
ergibt sich Π , «
(2.105a) 1
2
« Λ,
(2.103)
H f , « c p (2.103) Λ « . H f 2 m 02 c4 c2 p 2
Damit erhalten wir 3 Π
Λ
«
c p H f
4 Π
(2.109)
Π
Π , « Π
Π « Π
Π
2 Π
« Π
« Π
Π
« Π 2
0
mit der unmittelbaren Folge Z 0. Zum Beweis für Zustände negativer Energie muß nur Π durch Π ersetzt werden.
Anteile negativer Energie sind unvermeidbar, sobald sich das Elektron in einem Kraftfeld bewegt, so daß die Zitterbewegung bei allen Teilchenwechselwirkungen eine Rolle spielt. Ein Beispiel hierfür werden wir in Abschn. 3.3 bei der Dynamik des Elektrons im Wasserstoffatom kennenlernen. Wir kommen auf das Problem der Meßwerte für die Geschwindigkeit zurück. In der Praxis beobachtet man bei Elektronen alle möglichen Geschwindigkeiten v
3.2
Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
Bei dem in Abschn. 2.8 untersuchten Übergang zum nicht-relativistischen Grenzfall schrumpfte der Dirac-Spinor ψ für Lösungen positiver Energie nach einer geeigneten Phasentransformation zu einem Spinor mit nur zwei oberen Komponenten zusammen, die der Pauli-Gleichung genügen. Für Lösungen negativer Energie schrumpft er, ebenfalls nach einer geeigneten Phasentransformation, zu einem Spinor mit nur zwei unteren Komponenten zusammen, die einer modifizierten Pauli-Gleichung genügen. Bei Vernachlässigung von Termen der Größenordnung v 2 /c2 , also ohne die Berücksichtigung relativistischer Effekte, folgen demnach aus der Dirac-Gleichung für die in dem
90
3 Anwendungen der Dirac-Theorie
Zweierspinor ϕ enthaltenen oberen zwei Komponenten und die in dem Zweierspinor χ enthaltenen unteren zwei Komponenten von ψ nach einer geeigneten Transformation entkoppelte Gleichungen, die unabhängig voneinander gelöst werden können. Durch eine unitäre Transformation, die auf L.L. Foldy und S.A. Wouthuysen zurückgeht und als Foldy-Wouthuysen-Transformation bezeichnet wird, kann die Dirac-Gleichung im kräftefreien Fall auch unter Einschluß sämtlicher relativistischer Effekte in zwei entkoppelte Gleichungen für zwei Zweierspinoren zerlegt werden (nächster Abschnitt). Aus diesen ergeben sich interessante Einsichten in die Ursachen der Zitterbewegung des Elektrons. Bei dem im anschließenden Abschnitt unternommenen Versuch, eine derartige Zerlegung auch für den Fall eines Elektrons in elektromagnetischen Feldern vorzunehmen, werden wir auf eine Reihenentwicklung nach einem Parameter v 2 /c2 stoßen, die einer unendlichen Folge unitärer Transformationen ψ ψ ¼ ψ ¼¼ . . . des Spinors ψ entspricht. Bei jedem Schritt kommt man dabei dem Ziel der gewünschten Zerlegung in dem Sinne näher, daß man entkoppelte Näherungsgleichungen für die oberen und unteren Komponenten des transformierten Spinors erhält, bei denen die vernachlässigten Terme von immer höherer Ordnung in v 2 /c2 werden. Wir werden diese Prozedur bis zu Gleichungen, die einschließlich der Terme (v 2 /c2 ) korrekt sind, verfolgen. Leider muß jede Ordnung für sich behandelt werden, eine alle Ordnungen umfassende geschlossene Lösung des allgemeinen relativistischen Falls ist nicht bekannt. Bei freien Teilchen besitzt die eine der bei der Zerlegung erhaltenen Gleichungen nur Lösungen positiver Energie, die andere nur Lösungen negativer Energie. Bei den bis zu relativistischen Termen der Ordnung v 2 /c2 korrekten zwei Gleichungen für die Dynamik eines Elektrons in elektromagnetischen Feldern führt die Separation bezüglich der oberen und unteren Komponenten nicht mehr gleichzeitig zu einer Separation bezüglich positiver und negativer Energien: Es wird sich zeigen, daß die für die zwei oberen Komponenten erhaltene Gleichung Terme enthält, die auf die Zitterbewegung des Elektrons zurückzuführen sind, und wir wissen aus dem letzten Abschnitt, daß für diese Lösungen negativer und positiver Energie zusammenwirken müssen.
3.2.1 Freie Teilchen Für ebene Wellen mit dem Impuls p0 gilt nach (2.72) die Gleichung i h ∂t ψ
Eψ m 0 c2βψ .
Der Ansatz (2.73) führt zu den entkoppelten Gleichungen
m 0 c2ϕ , Eχ m 0c2χ . (3.8) Bei nicht-verschwindendem Impuls, p0, ergeben sich die nicht entkoppelten Gleichungen (2.74). Den Grund für die Kopplung liefert die Matrix « τ , die obere und Eϕ
untere Komponenten vertauscht. Die Einheitsmatrix sowie die Matrizen β und Σi sind nur auf der Diagonalen mit 22-Matrizen besetzt, d. h. sie haben die Struktur g1 0 G . (3.9) 0 g2
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
91
Bei der Einwirkung auf Dirac-Spinoren lassen sie die oberen Komponenten oben und die unteren unten, ϕ g1 0 ϕ g1 ϕ G , χ 0 g2 g2 χ χ weshalb wir sie als gerade Matrizen bezeichnen.1 Die Matrizen αi und τ sind nur außerhalb der Diagonalen mit 2 2-Matrizen besetzt, sie haben die Struktur 0 u1 U , (3.10) u2 0 und bei ihrer Einwirkung auf Dirac-Spinoren werden obere und untere Komponenten vertauscht, 0 u1 u1 χ ϕ ϕ . U u2 0 u2 ϕ χ χ Wegen dieser Eigenschaft bezeichnen wir sie als ungerade Matrizen. Wir suchen jetzt eine unitäre Transformation2 ¼ ϕ ϕ ψ¼ T Tψ , H¼ T HT , χ χ¼ welche die Dirac-Gleichung für freie Teilchen, 2 i h∂ t ψ H ψ m 0 c β c« p ψ ,
(3.11)
(3.12)
so transformiert, daß der neue Hamilton-Operator H nur noch gerade Matrizen enthält. Wegen der Unitarität der Transformation, T T 1, können wir T
eS
1 Sν ν
(3.13)
ν 0
ansetzen, außerdem nehmen wir an, daß der Matrixoperator S zeitunabhängig ist. e S wird dabei durch die Potenzreihe definiert, in der nur wohldefinierte Produkte von Matrizen auftreten. Es gilt T
1 Sν ν ν 0
1 ν S ν ν 0
eS ,
1 In manchen Büchern findet sich für sie die Bezeichnung „gerade Operatoren“. Der Begriff gerader und ungerader Operatoren wurde jedoch schon in Abschn. 2.7 eingeführt und hat eine andere Bedeutung. Da Matrizen auch als Operatoren aufgefaßt werden können, muß sorgfältig zwischen ihrer hier betrachteten Wirkung auf die Anordnung der Komponenten von ψ und ihrer in Abschn. 2.7 betrachteten „Operatorwirkung“ auf die Zerlegung von ψ in Anteile positiver und negativer Energie unterschieden werden. So ist z. B. β als Matrix gerade, als Operator enthält β jedoch gerade und ungerade Anteile, es gilt β β β mit β 0. 2 Auch in der relativistischen Quantenmechanik ist der Übergang zwischen verschiedenen Darstellungen mit Hilfe unitärer Transformationen möglich, in den Ausführungen von Abschn. Q6.2.5 über unitäre Transformationen gab es keinerlei Einschränkung auf nicht-relativistische Verhältnisse. Der HilbertRaum relativistischer Elektronenzustände wird durch Vektoren ψ aufgespannt, deren Ortsdarstellung zu Dirac-Spinoren führt.
92
3 Anwendungen der Dirac-Theorie
und die Unitaritätsforderung T T
eS eS
eSS
S
S ,
1 führt zu der Bedingung (3.14)
S muß antiunitär sein. Aus (3.12) ergibt sich durch Linksmultiplikation mit e S und mit der aus (3.11a) folgenden Beziehung ψ T ψ e S ψ i h ∂t ψ
e S H e S ψ
H ψ .
Um einen Matrixoperator S zu bestimmen, der H die gewünschte Struktur verleiht, empfiehlt es sich, in e S m 0 c2 β c« p e S
H
(2.42a)
e S β m 0 c2 cβ « p e S
den Term e S mit dem Term e S zusammenzubringen. e S vertauscht mit dem Klammerausdruck, wenn S die Form 1 β « p θ ( p ) S (3.15) 2 besitzt, wobei θ eine skalare Funktion des Operators p , aber kein Matrixoperator ist. Der Faktor 1/2 wurde aus Gründen späterer Bequemlichkeit eingeführt. Die Vertauschbarkeit mit m 0 c2 wäre für jedes S gegeben, und die Vertauschbarkeit mit cβ « p besteht deshalb, weil jeder Operator mit sich und jeder Funktion von sich selbst vertauscht. Mit θ ( p ) θ ( p ) θ ( p ) sowie « « und β β nach (2.43) gilt S
1 (« p ) β θ ( p ) 2
1 (« p ) β θ ( p ) 2
(2.42b)
12 β (« p ) θ ( p ) ,
d. h. S erfüllt auch die Bedingung (3.14). Damit haben wir H
e S βe S m 0 c2 cβ « p .
Unter Benutzung der Beziehungen β (β « p )
(β « p ) β ,
β (β « p )2 (β « p )2 β , ... , β (β « p )ν (1)ν (β « p )ν β
und deren Folge βe S
(3.15)
β
(1)ν β « p ν
ν 0
ν
1 β « p ν
ν 0
ν
2
2 θνβ
(1)2ν β « p ν
θν
ν 0
ν
2
eS β
ergibt sich daraus H
e2 S β m 0 c2 cβ « p
e2 S m 0 c2 β c « p .
θνβ
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
93
Mit der Definition p p 2 (Folge: p 2 p 2 ) und den Beziehungen (2.42b)
2 (β « p)
β « p β « p
3 (β « p)
2 β « p(β « p)
2 β 2 (« p)
β « p p 2 ,
(2.42a)
2 (« p)
4 (β « p)
p4 ,
(2.168)
p2 ,
5 (β « p)
β « p p 4
usw. gilt Ç
e2 S
Ç eβ « ¡ pθ
( p θ )2 2
1
cos( p θ )
Ersetzt man θ durch
( p θ )4 4
...
β « p p θ p
( p θ )3 3
( p θ )5 5
β « p sin( p θ ) . p
...
(3.16)
θ , so folgt daraus
Ç
e 2 S
cos( p θ )
β « p sin( p θ ) . p
(3.17)
Einsetzen von (3.16) in das zuletzt für H ¼ erhaltene Ergebnis liefert
β « p sin( p θ ) m 0 c2 β c « p p m c2 β « pβ 2 c(« p) 0 2 sin( p θ ) sin( p θ )c« p cos( p θ ) β m 0 c cos( p θ ) p p m0c (2.168) sin( p θ ) . β m 0 c2 cos( p θ ) c p sin( p θ ) c« p cos( p θ ) p
H ¼
cos( p θ )
Der erste Term in H ¼ enthält die gerade Matrix β und liefert daher einen Beitrag, der wie bei einem ruhenden Teilchen (siehe (3.8)) zu einer Separation oberer und unterer ψ-Komponenten führen würde. Der zweite Term enthält die ungerade Matrix « und würde zu einer Mischung oberer und unterer ψ-Komponenten führen. Durch die mit der Identität sin2 ( p θ ) cos2 ( p θ )1 verträgliche Festlegung der bisher noch frei verfügbaren Funktion θ ( p) gemäß sin( p θ )
p m 02 c2
p 2
cos( p θ )
,
m0c m 02 c2
p2
(3.18)
bringen wir ihn zum Verschwinden und erhalten auf diese Weise den transformierten Hamilton-Operator H ¼ cβ m 02 c2 p 2 . Da der Operator p mit sich selbst vertauscht, Ç Ç p gilt S, β « p θ ( p), p /20 und daraus folgend e S p p e S sowie p ¼
Ç
Ç
e S p e S
womit wir schließlich
Ç
Ç
p eS S
p,
(3.19)
H ¼
cβ
m 02 c2 p ¼ 2
(3.20)
94
3 Anwendungen der Dirac-Theorie
erhalten. Zerlegen wir den Spinor ψ ¼ gemäß (2.73), so führt i h∂t ψ ¼ H ¼ψ ¼ zu den entkoppelten Gleichungen i h∂t ϕ ¼ c
m 02 c2 p ¼ 2 ϕ ¼ ,
i h∂t χ ¼ c
m 02 c2 p ¼ 2 χ ¼ .
Der Ansatz ϕ ¼ , χ ¼ ei ( p x Et )/h) zeigt, daß ϕ zu Lösungen positiver und χ zu Lösungen negativer Energie führt. Der Operator (3.20) entspricht der klassischen Beziehung (2.5) für Φ 0, A0. Die zu ihm gehörige Bewegungsgleichung i h∂t ψ H ψ führt bei positiven Energien gerade zu der Gleichung (2.19) mit Φ 0 und A0, die wir früher wegen ihrer NichtLokalität abgelehnt hatten. Jetzt werden wir durch die Suche nach Lösungen, die entweder zu nur positiver oder nur negativer Energie gehören, zu dieser zurückgeführt. Wir werden weiter unten sehen, daß die früher festgestellte Nicht-Lokalität von H bei geeigneter physikalischer Interpretation akzeptabel ist. Um das zu erkennen, untersuchen wir zunächst den zum Hamilton-Operator H gehörigen Operator Ú der Geschwindigkeit. Für diesen ergibt sich nach (Q6.117) ¼
Ú
d x (Q6.116) d x H T T dt dt
¼
1 (Q6.155) ∂ H (3.20) cβ p x , H , (3.21) ih ∂ p m 02 c2 p 2
wobei T der Operator für die unitäre Transformation vom Schrödinger- zum Heisen bergbild ist und nichts mit T e S zu tun hat. Anders als beim Geschwindigkeitsoperator Ú c« aus Abschn. 2.3 sind die Komponenten des Operators Ú wie die von p miteinander vertauschbar. Für die oberen Komponenten des Spinors ψ ergibt sich bei ebenen Wellen positiver Energie, ϕ ei ( p x Et )/h und χ 0 , ¼
Ú
ϕ 0
cβ p m 02 c2 p 2
ϕ 0
⎛
⎝
c p m 02 c2 p 2 0
ϕ
⎞
⎠ cp m 02 c2 p 2
ϕ 0
,
wobei p ϕ p ϕ und f ( p )ϕ f ( p )ϕ benutzt wurde. Die Eigenwerte Ú von Ú zu Zuständen positiver Energie können demnach mit p beliebige Werte annehmen, die im 2 2 Bereich 0 Ú c liegen, und aus Ú c p / m 0 c p 2 folgt durch Auflösung nach p der klassische Zusammenhang m 0 Ú p . 1v 2 /c2 Aus d p /dt p , H /(i h)0 folgt weiterhin d Ú /dt 0, d. h. der Operator Ú führt auch nicht zu einer Zitterbewegung des Elektrons. Der Geschwindigkeitsoperator c« wurde aus H in der gleichen Weise wie Ú aus H abgeleitet. Es mag daher verwundern, daß c« und Ú so unterschiedliche physikalische Eigenschaften aufweisen. Die Erklärung dafür ist, daß Ú nicht durch eine unitäre Transformation mit e S aus c« hervorgeht. Um das zu erkennen, müssen wir erst aus (3.16) und (3.17) mit (3.18) die Transformationsmatrizen e S und e S berechnen. Wie
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
95
man leicht durch Quadrieren verifiziert, gilt e S Ç
m 0 c h( p ¼ ) β « p ¼ 2h( p ¼ )(m 0 c h( p ¼ ))
mit
h( p ¼ )
m 02 c2 p ¼ 2 ,
(3.22)
wobei p gemäß (3.19) durch p ¼ ersetzt wurde. Hiermit ergibt sich m 0 c h( p ¼ ) β « p ¼ c« m 0 c h( p ¼ )β « p ¼ Ç SÇ ¼ S c« e c« e 2h( p ¼ ) m 0 c h( p ¼ )
Ú
(3.21)
¼
c«
c« p ¼ p ¼ . h( p ) m 0 c h( p ¼ ) ¼
(3.23)
(Der Schritt von der ersten zur zweiten Zeile wird in Aufgabe 3.3 vollzogen.) Anmerkung: Es gilt zwar c« ∂ H /∂ p und Ú ¼ ∂ H ¼/∂ p ¼ . Aus der nach Abschn. Q6.2.5 gültigen Invarianz von Operatorbeziehungen folgt jedoch nicht Ú ¼ (c« )¼ , denn dazu müßte ∂ H ¼/∂ p ¼ (∂ H /∂ p )¼ gelten, was, wie wir gesehen haben, nicht der Fall ist. c« ¼ unterscheidet sich von Ú ¼ durch zwei Zusatzterme, welche die ungerade Matrix « enthalten und daher Zustände positiver und negativer Energie mischen. Anders als der Operator Ú ¼ besitzt der Operator c« ¼ daher keine Eigenwerte, die zu Zuständen nur positiver oder nur negativer Energie gehören, in den Eigenzuständen von c« ¼ sind immer Zustände positiver und negativer Energie gemischt. Diese Mischung muß auch die Ursache für die Zitterbewegung des Elektrons sein, da der Operator Ú ¼ zu keiner Zitterbewegung führt. Um zu einer physikalischen Interpretation der zwei physikalisch so unterschiedlichen Geschwindigkeiten c« ¼ und Ú ¼ zu gelangen, rufen wir uns einige Erkenntnisse über die klassische Bewegung des Elektrons in Erinnerung. Nach dem Exkurs „Skizze der Diracschen Ableitung“ im Abschn. „Lorentz-Dirac-Gleichung“ der Speziellen Relativitätstheorie ist die Masse des Elektrons nicht in einem Punkt konzentriert, vielmehr ist ein wesentlicher Teil von ihr in dem von der Ladung des Elektrons erzeugten elektromagnetischen Feld enthalten und wie dieses im Raum verteilt; die Ladung wird dagegen als punktförmig lokalisiert angenommen. Wenn das Elektron beschleunigt wird, verhält sich die Punktladung daher anders als die Masse, sie kann den einwirkenden Kräften instantan folgen (siehe unten), während die nicht am Ort der Ladung sitzenden Massenanteile, durch die Laufzeit des Lichts bedingt, nur verzögert folgen. Dies hat die Konsequenz, daß der Massenschwerpunkt des Elektrons und der Ort seiner Punktladung im allgemeinen nicht zusammenfallen. Der Zusammenhang (3.21) verknüpft Ú ¼ mit dem Impuls und infolgedessen mit der Massenbewegung des Elektrons; der c« ¼ entsprechende Operator c« ist in der DiracGleichung bei Anwesenheit elektromagnetischer Felder dagegen direkt an das Vektorpotential A gekoppelt. Dies legt die Annahme nahe, daß Ú ¼ die Bewegung des Massenschwerpunkts und c« bzw. c« ¼ die Bewegung der Ladung beschreibt. Für diese Interpretation sprechen auch noch folgende Umstände: 1. Der Operator Ú ¼ hat nach (3.20) und (3.21) eine ähnliche Struktur wie der Operator H ¼, von der wir früher (Abschn. 2.2) festgestellt hatten, daß sie nicht-lokaler Natur ist. Das paßt zu einer nicht-lokalisierten Mas-
96
3 Anwendungen der Dirac-Theorie
senverteilung, obwohl dazu folgendes anzumerken ist: In dem zitierten Abschnitt der Speziellen Relativitätstheorie wurde für das Elektron eine nackte Ruhemasse m 0 angesetzt und der elektromagnetische Anteil der Masse durch das von der Ladung erzeugte elektromagnetische Feld beschrieben. Da diese Zerlegung nicht in die Dirac-Gleichung eingegangen ist, kann hier eine nicht-lokale Beschreibung der Massenbewegung nicht zwingend gefolgert werden; daher wurde auch nur gesagt, daß sie „gut paßt“. (Eine entsprechende Zerlegung wird in der Quantenelektrodynamik vorgenommen, in der das Feld der Ladung mit berücksichtigt und zusammen mit dem Dirac-Feld ψ quantisiert wird.) 2. Die Zitterbewegung paßt – im gleichen Sinne wie oben – zu der Bewegung der Punktladung, da diese den äußeren Feldern ohne die Verzögerung durch Laufzeiteffekte und nur von der Trägheit der reduzierten Masse m 0 behindert leicht folgen kann.
3.2.2 Teilchen mit elektromagnetischer Wechselwirkung Wir wenden uns jetzt der Foldy-Wouthuysen-Transformation der Dirac-Gleichung mit elektromagnetischen Feldern (Gleichung (2.55)) zu, die wir in der Form ih ∂t ψ
ψ H
H
mit
m 0 c2 β
qΦ c«
,
h q A i
(3.24)
schreiben. Wie im letzten Abschnitt können wir ψ¼
Ç
eS ψ ,
ψ
Ç
e S ψ ¼
ansetzen, wobei S wieder die Bedingung (3.14) erfüllen muß und jetzt als zeitabhängig angenommen wird. Wenn hiermit in Gleichung (3.24a) ψ durch ψ ¼ ausgedrückt wird, Ç lautet diese nach Linksmultiplikation mit eS ih ∂t ψ ¼
¼ψ ¼ H
,
H ¼
Ç Ç Ç Ç Ç Ç e S H e S e S ih ∂t e S e S H ih ∂t e S .
(3.25)
Die Notation ∂t soll dabei bedeuten, daß die Zeitableitung nur auf e S und nicht auf ψ ¼ wirkt. Ç Der Ansatz (3.15) führt jetzt nicht mehr dazu, daß e S wie im kräftefreien Fall nach Ç links bis auf ein dazwischen stehendes β zu e S durchgezogen werden kann, denn p Ç Ç vertauscht nicht mit Φ und A. Werden e S und e S durch Vertauschen von H ih ∂t und Ç e S zusammengebracht, so treten Kommutatoren auf, die der für beliebige Operatoren S und O gültigen Baker-Hausdorff-Identität Ç
1 1 1 O .. S, S, O S, S, S, O .. S, S, .. S, 2
3
n
(3.26) entnommen werden können. (Mit den Kommutatoren sind Minus-Kommutatoren gemeint. Weil in diesem Abschnitt nur diese benutzt werden, wird auf ihre besondere Kennzeichnung verzichtet.) Ç
Ç
e S O e S
S, O O
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
97
Beweis: Der von dem Parameter λ abhängige Operator F(λ) eλ S O eλ S
(3.27)
besitzt um λ0 die Potenzreihenentwicklung
' λn ∂ n F '' . n ∂λn 'λ0
F(λ)
(3.28)
n 0
Aus (3.27) folgt ∂F ∂λ hieraus durch erneute Ableitung nach λ ∂2 F ∂λ2
eλ S S, O eλ S ,
eλ S S, S, O eλ S
usw. Wertet man F(λ) und die erhaltenen Ableitungen bei λ0 aus und setzt sie in (3.28) ein, so ergibt sich (3.26).
S kann nicht so bestimmt werden, daß die im Operator H ih ∂t enthaltenen Anteile mit ungeraden Matrizen verschwinden. Wir versuchen daher, diese durch geeignete Wahl von S möglichst klein zu machen. Da sie im nicht-relativistischen Grenzfall auch bei Anwesenheit elektromagnetischer Felder zum Verschwinden gebracht werden können, empfiehlt sich eine Entwicklung nach v 2 /c2 m 0 v 2 /(m 0 c2 ). Die Größe m 0 v 2 tritt in einer quantenmechanischen Gleichung natürlich nicht auf. Wir erreichen jedoch dasselbe, wenn wir statt der Entwicklung nach der dimensionslosen Größe m 0 v 2 /(m 0 c2 )< 1 eine Entwicklung nach der dimensionsbehafteten Größe ε
m 1c2
(3.29)
0
vornehmen. (Sauberer wäre es, einen Parameter E<m 0 c2 einzuführen und nach E/m 0 c2 zu entwickeln. Da E aus den Endformeln herausfallen würde, läuft unsere Vorgehensweise auf dasselbe hinaus.) Hiermit haben wir nach (3.24b)
βε G U mit G qΦ ih ∂t , U c « , (3.30) wobei G alle geraden und U alle ungeraden Matrizen des Operators H ih ∂t enthält. Den Operator S entwickeln wir ebenfalls nach ε, S ε S1 ε2 S2 ε3 S3 . . . , (3.31) ψ . . . eε S (eε S ψ) ergibt, d. h. wir haben es mit einer womit sich ψ eε S ε S Folge von Transformationen, ψ eε S ψ, ψ eε S ψ etc. zu tun. Mit (3.26) und H ih ∂t
1
2
2
2
1
2
1
2
2
(3.30)–(3.31) ergibt sich aus (3.25b) bis zu Termen der Ordnung ε2 β β H G U ε S1 ε2 S2 ε3 S3 , G U ε ε β 1 2 ε S1 ε2 S2 , ε S1 ε2 S2 , ε G U 31 ε S1 , ε S1 , ε S1 , βε G U .
98
3 Anwendungen der Dirac-Theorie
Hieraus folgt
β ε
H ¼ mit
H 0 ε H 1 ε2 H 2 . . . ¼
¼
¼
(3.32)
H 0¼
S1 , β G U , H 1 S2 , β S1 , G U 12 S1, S1 , β ,
(3.33)
H 2¼
S3 , β S2 , G U 12 S2, S1 , β 12 S1 , S2 , β
(3.34)
¼
12 S1 , S1 , G U 16 S1 , S1 , S1 , β . Jetzt bestimmen wir die Operatoren Sn 1 so, daß in allen Entwicklungstermen H n der ungerade Anteil, den wir mit U n bezeichnen, verschwindet, d. h. wir verlangen
Sn
1, β
U n
0.
(3.35)
Bezeichnen wir den – an dieser Stelle noch unbestimmten – Kommutator Sn so genügt Sn 1 den zwei Gleichungen mit X,
β Sn 1 X , (3.36) durch Subtraktion der ersten von der zweiten ergibt sich 2β Sn 1 U n X , und hieraus Sn
β Sn
1β
U n ,
1, β
1
Sn
1β
folgt durch Multiplikation mit β unter Benutzung von β 2 1 Sn
β(U n
1
X )/2 .
Da X nicht weiter festgelegt ist, setzen wir X 0 und erhalten Sn
1
β U n , 2
(3.37)
während sich aus aus (3.36b) die Forderung Sn
1β
β Sn
1
0
(3.38)
ergibt. Mit β U n
(3.10)
1 0
0 1 0 u n2
0 u n1 0 u n1 u n2 0 u n2 0 u n1 0 u n1 1 0 0 u n2 0 0 1
(3.39)
U n β ,
β und der aus H H bzw. H n H n folgenden Beziehung U n U n , in die β eingeht, daß mit G n (bzw. Un ) auch G n (bzw. Un ) gerade (bzw. ungerade) ist, erhalten wir aus (3.37) U n β U n β β U n Sn 1 Sn 1 2 2 2 ¼
¼
¼
¼
¼
¼
3.2 Zerlegung der Dirac-Gleichung in zwei zweikomponentige Gleichungen
und Sn
1β
β Sn
β U2n β ¼
1
β 2U n¼ 2
(3.39)
β2
U2n ¼
99
U n¼ 0. 2
Damit werden von der Lösung (3.37) die Forderungen (3.14) und (3.38) erfüllt. Nach (3.33a) ist U 0¼ U , und aus (3.35) bzw. (3.37) folgt damit
S1 , β U ,
S1
β2U .
(3.40)
Da der ungerade Anteil von H 0¼ mit S1 zum Verschwinden gebracht wurde, gilt nach (3.33a) H 0¼ G . (3.41) Für H 1¼ ergibt sich aus (3.33b) mit (3.40) H 1¼
S2 , β S1 , G
U
1 S1 , U S2, β 2
1 G β U, 2
1 β U , U . 4
U /4 ist gerade, β U, G /2 ungerade, und daher gilt U 1β U, G /2. Nach (3.35) β U, bzw. (3.37) wird S2 so bestimmt, daß (3.42) S2 , β β U,2 G ¼
bzw. S2
G β 2U G β Gβ U s.u. U , G β U2 1 β β U, 4 4 4 ¼
gilt – dabei wurde β G
benutzt –, und für H 1 ergibt sich damit Gβ 2 1 (3.39) β U . H 1 (β U 2 U β U ) 4 2
(3.9)
(3.43)
¼
¼
(3.44)
Durch Einsetzen von (3.40), (3.42) und (3.43) ergibt sich aus (3.34) H 2¼
S3 , β
1 G , U 1 U, G , U 1 β U , β U, G U , G , G 14 U, 4 8 8 1 β U , U 1 β U, β U , U β U, β U , G 18 β U, 8 24 G , U 1 β U, β U , U . S3 , β 14 U , G , G 18 U, 12
Der zweite und vierte Term von H 2¼ sind ungerade und werden mit dem ersten Term zum Verschwinden gebracht, so daß wir mit (3.37) S3
G , G β8 U,
1 β U, β U , U 3
100
3 Anwendungen der Dirac-Theorie
und H 2¼
1 U , G , U 8
(3.45)
erhalten. Nach (3.32) gilt mit (3.29), (3.41), (3.44) und (3.45) bis zu Termen der Ordnung ε2 m 0 c2 β G
H ¼
1 1 β U 2 U , G , U . 2m 0 c2 8m 02 c4
Mit
U , G
(3.24c) (3.30)
c « ( p q A)qΦ (qΦ ih ∂ t ) c « ( p q A)
cq « p Φ cq 2 « AΦ cqΦ « p cq 2 Φ « A i h cq « (∂t A) i h cq « ( Φ)(∂t A) i h cq « E
(der Term mit ∂ t verschwindet, wenn rechts von ihm keine zeitabhängige Funktion steht, und es wurde E ( Φ)(∂t A) nach Gleichung (E7.3) benutzt) und mit
« E, U /c
(3.30) (2.166b)
« E «
E (2.168) E Ei τ E E i h div E i 2 E p 2q E A i h rot E
ergibt sich
G , U U,
i h cq E, U h c2q h div E 2 (E p q E A) i h 2 c2qΣ rot E .
Weiterhin gilt U 2
c2
(2.168)
c2
2 i τ ( )
c2
2 i ( )
,
mit rot A B gilt
und damit
p p q p A q A p U 2
q( p A)
i q h rot A
i q h B
c2 ( p q A)2 q h B .
Mit diesen Ergebnissen und (3.30b) ergibt sich schließlich H ¼
1 q h β m 0 c2 ( p q A)2 B qΦ (3.46) 2m 0 2m 0 4mq h2 c2 h2 div E i2h rot E (E p ) q (E A) . 0
3.3 Zur Feinstruktur des Wasserstoffatoms
101
Hiermit und mit der Zerlegung (2.73) sowie ϕ ¼ zu der Gleichung
∂ϕ∂t
ih
ϕ bzw. χ ¼
χ führt i h ∂t ψ ¼ H ¼ ψ ¼
2m1 ( p q A) 2mq h B qΦ (3.47) 4mq h c h2 div E i2h rot E (E p ) q (E A) ϕ
m 0 c2
2
0
0
2 2 0
für die zwei oberen Komponenten und die von dieser entkoppelte Gleichung
(3.48) ∂χ∂t m c 2m1 ( p q A) 2mq h B qΦ 4mq h c h2 div E i2h rot E (E p ) q (E A) χ
ih
0
2
2
0
0
2 2 0
für die zwei unteren Komponenten von ψ. Gleichung (3.47) stimmt bis auf die in der zweiten Zeile stehenden relativistischen Korrekturen mit der Pauli-Gleichung (2.136) überein, in der allerdings der Beitrag der Ruheenergie wegtransformiert ist.
3.3
Zur Feinstruktur des Wasserstoffatoms
Aus Gleichung (3.47) ergibt sich im Fall zeitunabhängiger Felder mit dem Ansatz ϕ Ψ (x)e Et /hÆ eine Eigenwertgleichung für die Energie. Diese kann auf das Wasserstoffatom angewandt werden, wenn die Näherungsannahme gemacht wird, daß dessen Kern ruht. Wenn auch noch das magnetische Moment des Kerns vernachlässigt wird, erzeugt dieser nur ein zeitlich konstantes elektrisches Feld, d. h.
Φ , qΦ αrh c V (r ) , A 0 , B 0 . (3.49) Dann ist q E (qΦ) V (r )V ¼ (r ) x/r , und mit L x p sowie S(h /2) ergibt sich q h (E p )2S L V ¼ (r )/r . Mit (E2.56) bzw. (1/r ) 4πδ(x) folgt q div E (qΦ)α h c(1/r ) 4π α h cδ(x) . Wegen des Verschwindens von A und B ergibt sich damit und mit dem Ansatz ϕ Ψ (x) e Æ aus (3.47) die E
Et /h
Eigenwertgleichung
p2 V (r ) 2m 0
πα h δ(x) Ψ (E m c )Ψ . 2m c
V ¼ (r ) S L 2m 02 c2r
3
2 0
0
2
(3.50)
Werden die relativistischen Korrekturterme vernachlässigt (dritter und vierter Term der linken Seite) und wird E m 0 c2 E ¼ gesetzt, so geht (3.50) in die aus der SchrödingerGleichung erhaltene Energieeigenwertgleichung für das Wasserstoffatom über. Deren diskrete Energieeigenwerte E ¼ sind zwar negativ, aber E E ¼ m 0 c2 wird positiv. Da sich die Eigenwerte E der vollen Gleichung (3.50) von diesen nur durch kleine
102
3 Anwendungen der Dirac-Theorie
relativistische Korrekturen unterscheiden, führt auch die volle Gleichung zu positiven Energien. Der dritte Term der Klammer linkerhand beschreibt die Wechselwirkung des Elektronenspins mit dem Magnetfeld, das durch die Bahndynamik des Elektrons im elektrischen Feld des Kerns induziert wird, und wird als Operator der Spin-BahnWechselwirkung bezeichnet. Der letzte Term der linken Seite wird als Darwin-Term bezeichnet. Er wirkt nur am Ort r 0 der Kernladung und ist auf die Zitterbewegung δx δx(t) des Elektrons zurückzuführen: Für deren Amplitude ergibt sich aus (3.7) die Größenordnung δr h c/H h /(m 0 c), so daß das Elektron in dem durch Überstreichen gekennzeichneten zeitlichen Mittel statt V (r ) das Potential V (x δx)
V (x) δx V 12 δxi δx j ∂i j V 2 2 V (x) (δr ) V V (x) h 6
6m 02 c
V 2
h δ(x) V (x) 2πα 2 3m c 3
0
sieht, wenn angenommen wird, daß δx(t) statistisch gleichmäßig über alle Raumrichtungen verteilt ist, was δx i 0, δx i δx j 0 für i j und δx 2 δy 2 δz 2 (δr )2/3 zur Folge hat. Das ist in guter, wenn auch nicht exakter Übereinstimmung mit dem Ergebnis (3.50). Da der Darwin-Term außer für r 0 verschwindet, kommt er nur zur Auswirkung, wenn das Elektron mit einiger Wahrscheinlichkeit nach r 0 gelangt, was nur für Zustände mit der Drehimpulsquantenzahl l 0 der Fall ist. Weil das Elektron den Kern dann aus klassischer Sicht „berührt“, wird der Darwin-Term auch als Kontaktwechselwirkungsterm bezeichnet. Da die Zitterbewegung des Elektrons nach Abschn. 3.1 auf die Wechselwirkung von freien Wellen negativer und positiver Energie zurückzuführen ist, muß eine Fourier-Zerlegung (2.100)–(2.101) derjenigen Eigenzustände, für welche die Zitterbewegung eine Rolle spielt, zu Wellenanteilen beider Energievorzeichen führen, wobei die Anteile negativer Energie allerdings wesentlich kleiner als die positiver Energie sind. (Erst die Einbeziehung sämtlicher ε-Potenzen der Entwicklung (3.32) würde zu Lösungen ϕ Ψ (x) e Et /h der Energie-Eigenwertgleichung führen, an denen insgesamt keine negativen Energien mehr beteiligt sind. Dies bedeutet, daß die in unserem Ergebnis der Ordnung ε2 erhaltenen Beiträge negativer Energie durch die Summe von aus höheren Ordnungen stammenenden Beiträgen negativer Energie kompensiert werden. Daraus darf allerdings nicht geschlossen werden, daß der Darwin-Term physikalisch unwirksam wäre, vielmehr treten in höheren Ordnungen weitere Korrekturterme auf, in denen das Zusammenspiel positiver und negativer Energien zu unerwarteten physikalischen Wirkungen führt.) Der auf die rechte Seite von Gleichung (3.50) gebrachte Term mit der Ruhemasse und der Operator p 2 /(2m 0 ) für die nicht-relativistische kinetische Energie repräsentieren Anteile der relativistischen Energie, die mit dem ersten und zweiten Term der Entwicklung p2 p2 p4 2 qΦ c m 02 c2 p2 qΦ m 0 c 1 2 2 qΦ m 0 c2 ... 2m 0 m0 c 8m 03 c2 der klassischen relativistischen Energie (Gleichung (2.5) mit A 0) korrespondieren. Dieser kann entnommen werden, daß in der Ordnung ε3 der ε-Entwicklung des letzten
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
103
Abschnitts für die kinetische Energie in H ¼ ein Korrekturterm p 4 8m 03 c3 zu erwarten ist. Die relativistischen Korrekturterme führen zu schwachen Verschiebungen der Energieniveaus, die mit den Methoden der Störungsrechnung bestimmt werden können, und dabei zum Teil auch zur Aufhebung der Entartung nicht-relativistischer Zustände. Die hierdurch erhaltene Struktur der Energieniveaus wird als Feinstruktur bezeichnet. Ihre Berechnung aus den Näherungsgleichungen dieses Abschnitts werden wir jedoch nicht weiter verfolgen, weil sich unter der Annahme eines ruhenden Kerns auch das volle relativistische Problem lösen läßt. (Das wird im folgenden Abschnitt geschehen.) Wir sehen uns noch die aus (3.48) mit dem Ansatz χ (x) e i Et /hÆ folgende Eigenwertgleichung
p 2 2 m 0c qΦ(r ) E 2m 0 ohne relativistische Korrekturterme für die zwei unteren Komponenten des Spinors ψ an. Diese kann auch in der Form 2 p qΦ(r ) E¼ mit E ¼ (E m 0 c2 ) 2m 0 geschrieben werden. Im Fall des Wasserstoffatoms gilt q e< 0, d. h. wir haben die Energieeigenwertgleichung für die Dynamik eines Teilchens in einem abstoßenden Zentralfeld. Für diese gibt es keine gebundenen Zustände mit einem diskreten Spektrum wie beim Wasserstoffatom, sondern nur ein kontinuierliches Spektrum mit Energien E ¼ 0 bzw. E m 0 c2 . Die Gleichung für die unteren Komponenten von ψ hat also nur Lösungen zu negativen Energien E m 0 c2 , und dasselbe gilt für die um die relativistischen Korrekturterme erweiterte Gleichung. Ein qualitatives Bild des Spektrums positiver und negativer Energieeigenwerte liefert Abb. 2.4 in Abschn. 2.13.
3.4
Relativistisches Wasserstoffatom bei ruhendem Kern
Wenn die Bewegung und das magnetische Moment des Atomkerns vernachlässigt werden, lassen sich die Eigenwerte und Eigenzustände des Hamilton-Operators für die relativistische Dynamik des Elektrons im Coulomb-Feld des Wasserstoffkerns exakt berechnen. Das Proton erzeugt dann nur das in (3.49a,b) angegebene zeitlich konstante elektrische Feld, d. h. A0, und aus (2.55) ergibt sich mit dem Ansatz ψ Ψ e iEt /hÆ sowie mit (2.166a), « τ , die Eigenwertgleichung H Ψ
EΨ
mit
H
V (r ) m 0c2β cτ p .
(3.51)
104
3 Anwendungen der Dirac-Theorie
3.4.1 Einführen von Polarkoordinaten und Variablenseparation Um im Hamilton-Operator H Polarkoordinaten einzuführen, benutzen wir die für die Radialkomponente von , Σr
er (2.155)
gültige Beziehung
Σr2
σr 0
0 σr
σr2 0
0 σr2
er ,
σr
mit
er er
(2.158)
x , r
er
er er
1
(3.52)
(3.53)
zur Umformung von p ,
p
Σr2 p
Σr (2.158) Σr x p i (x p ) x p r r
Mit den Definitionen
h i
p r
∂r
1 r
,
K
1
L h
Σr
h L ∂r i . i r
(3.54)
(der Operator p r wurde auch in der nicht-relativistischen Theorie des Wasserstoffatoms benutzt) ergibt sich daraus h p Σr pr K , (3.55) ir und der Hamilton-Operator (3.51b) erhält damit die Form H
V (r ) m 0 c2 β cτ Σr p r
ihr K .
Mit Hilfe der Beziehungen
Σr , K
Σr , pr
0,
0,
(3.56)
die am Ende dieses Teilabschnitts bewiesen werden (Schritte 1 und 2 des Beweises), kann noch der Operator Σr nach rechts durchgeschoben werden – der Term mit K erleidet dabei einen Vorzeichenwechsel –, so daß sich schließlich H
V (r ) m 0 c2 β cτ pr
ihr K Σr
(3.57)
ergibt. Nun zerlegen wir die Eigenwertgleichung (3.51) für den Viererspinor ψ in zwei Gleichungen für Zweierspinoren. Unter Benutzung der aus (3.54b) mit (2.155) folgenden Beziehungen K
k 0 0 k
mit
k
1
L h
(3.58)
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
und
p r
h K Σr ir
⎛
⎝
pr
h k σr ir 0
105
p r
⎞ 0 ⎠ h k σr ir
sowie mit (2.51b) und (2.164) ergibt sich ⎛ h ⎞ c pr k σr V m 0 c2 ir ⎠. H ⎝ h c pr k σr V m 0 c2 ir Für ψ wählen wir den Separationsansatz 1 f (r )φ(ϑ, ϕ) , ψ r i g(r )χ(ϑ, ϕ)
(3.59)
(3.60)
bei dem φ und χ nur von den Polarwinkeln ϑ und ϕ abhängige Zweierspinoren sind, f (r ) und g(r ) dagegen skalare Funktionen. (Die Faktoren 1/r und i sind zwar nicht notwendig, werden aber zu einer bequemen Vereinfachung führen.) Mit (3.59), (3.60) und f (r ) i p r r
h
(3.54a)
∂r
f (r ) r
f ¼ (r ) f (r ) h r r2
f (r ) r2
f (r ) h f ¼ (r ) r r2
sowie einer entsprechenden Beziehung für g(r ) zerfällt die Eigenwertgleichung (3.51) in die zwei Gleichungen g(r ) (V m 0 c2 E) f (r ) φ(ϑ, ϕ) h c g ¼ (r ) k σr χ(ϑ, ϕ) 0 , (3.61) r f (r ) k σr φ(ϑ, ϕ) 0 . (3.62) (V m 0 c2 E) g(r ) χ(ϑ, ϕ) h c f ¼ (r ) r Beim nicht-relativistischen Wasserstoffatom konnte der winkelabhängige Faktor der Eigenfunktionen von H durch die Kugelfunktionen ausgedrückt werden, die gemeinsame Eigenfunktionen der Operatoren L 2 und L z sind. Das ist jetzt nicht mehr möglich, weil L nicht mit H vertauscht und daher nach (Q6.117) im Sinne der durch (Q6.116) definierten totalen Zeitableitung auch nicht zeitlich konstant ist, vielmehr gilt nach Schritt 3 des unten folgenden Beweises i h
d L dt
L , H hi cτ p ,
Für den Gesamtdrehimpuls J folgt hieraus allerdings i h
d J dt
i h L
d dt
, H
h 2
J, H
2 cτ p . i
(3.63) 0.
J ist also eine Erhaltungsgröße und vertauscht mit H , und dasselbe gilt insbesondere für Jz . Es bietet sich daher an, die Eigenwerte von H als gemeinsame Eigenwerte von
106
3 Anwendungen der Dirac-Theorie
H , J 2 und Jz aufzusuchen. Dies bedeutet, daß sich die winkelabhängigen Faktoren der Eigenfunktionen, also die Spinoren φ(ϑ, ϕ) und χ(ϑ, ϕ), mit den Eigenzuständen der Operatoren J 2 und Jz in Zusammenhang bringen lassen, was im nächsten Abschnitt geschehen wird. Hier folgt noch der Beweis der oben unbewiesen gebliebenen Beziehungen. Beweis: 1. Aus der Definition (3.54b) von K ergibt sich Σr ,
K
Σr , 1
L h
2Σr
1 Σr , L . h
Setzt man in (2.158) a gleich er bzw. gleich L und b gleich L bzw. gleich er , so ergibt sich Σr , L er , L er L L er i er L L er . Unter Benutzung des ε-Tensors gilt (mit er x 0) er L L er
2(er x) p p (er x)
x h xj 1 δi j h j ∂ εi j k xk ∂i εi j k x k i i r i r r r2
εi j k x j x k h εiik xk 1 h x x 1 εiik 0 ∂ 0 i i r r i r2 r r2
er (x p) (x p) er
(die Differentiation wirkt nur auf die durch gekennzeichnete Größe) und er L L er
h h er (x ) (x )er (x ) er i i
3 x h h r ( er er ) x x er x div i r i r
h r 2 2h ( er er ) x er . i 2 r i
Damit ergibt sich Σr ,
L 2hΣ r
und
Σr ,
K
x
1 r
0.
2. Es gilt Σr ,
pr
h i
er , ∂r hi (∂r er ) 0 .
3. Für die totale Zeitableitung der nicht explizit von der Zeit abhängigen Operatoren L und ergibt sich nach (Q6.117) mit h h L, V x , V (r ) x V (r ) 0 , i i unter Benutzung der Summenkonvention für doppelt auftretende Indizes und mit x x j e j i h L
(3.51b)
L, cτ
p cτ Σi x p, pi hcτ Σi (∂i x) p i
hcτ hcτ hcτ p Σi (∂i x j e j ) p Σi δi j e j p i i i
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
107
sowie i h Σx
cτ Σ x , p
(2.157a)
cτ Σ x , Σi p i
2cτ (Σ x Σ y p y Σz Σ x p z )
cτ (Σ x Σ y Σ y Σ x ) p y
(2.157b)
cτ (Σ x Σz Σz Σ x ) p z
2cτ i (Σ y p z Σ z p y ) 2cτ i (
p) x .
Der Beweis für Σy und Σ z verläuft analog.
3.4.2 Lösung für die winkelabhängigen Funktionen Nach (Q7.129) und den auf (Q7.139) folgenden Gleichungen in Abschn. Q7.5.4 der Quantenmechanik sind die gemeinsamen Eigenzustände j, m der Operatoren J 2 und Jz zugleich Eigenzustände des Operators k zum Eigenwert k, wobei k für gegebenes j die Werte ( j 12 ) annehmen kann. Bezeichnen wir diese Eigenzustände, die in der Orts- und Zweierspinor-Darstellung durch (Q7.137) gegeben sind, hier mit φk,m , so gilt nach (Q7.129) also * j 12 l 1 . (3.64) k φk,m k φk,m mit k 1 ( j ) l 2 Nun folgt aus (3.56a) mit (3.58) kσ r
σr k .
Durch Anwendung des Operators σr auf Gleichung (3.64) ergibt sich daher kσ r φk,m
σr kφ k,m
kσr φk,m ,
d. h. die Anwendung des Operators σr auf den Eigenzustand φk,m zum Eigenwert k erzeugt aus diesem den wegen (σr φk,m ) σr φk,m
φk,m σr σr φk,m
φk,m σr2 φk,m
(3.53)
φk,m φk,m
1
schon richtig normierten Eigenzustand zum Eigenwert k, σr φk,m
(3.53)
φk,m
φk,m
σr φk,m .
(3.65)
Setzen wir in den Gleichungen (3.61)–(3.62) φ
φk,m ,
χ
φk,m ,
(3.66)
so können die winkelabhängigen Funktionen wegen σr χ
σr φk,m
φk,m ,
σr φ
σr φk,m
φk,m
und (3.64) bzw. kφ k,m kφk,m herausgekürzt werden. Zur Lösung verbleibt das System kg kf (V m 0 c2 E) f hc g 0, (V m 0 c2 E) g hc f 0 (3.67) r r
gekoppelter gewöhnlicher Differentialgleichungen zur Bestimmung der Funktionen f (r ) und g(r ).
108
3 Anwendungen der Dirac-Theorie
3.4.3 Lösung der Radialgleichungen, Energieeigenwerte und Eigenzustände α h c/r und den Abkürzungen
Mit V (r )
a lauten die Gleichungen (3.67) 1 α kg f g a r r
m ch2c E 0 1 a
0,
(3.68)
αr
kf g f r
0.
(3.69)
Für große r folgt aus der ersten Gleichung f a g und damit aus der zweiten g a f a a g . Dies zeigt, daß sich f und g für r wie e r/ a a verhalten müssen. (Die Möglichkeit eines Verhaltens e r/ a a kann ausgeschlossen werden.) Dieses asymptotische Verhalten führt dazu, zur Lösung der Gleichungen den Ansatz f (r ) e
r/a s
r
ν 0
fν r ν ,
g(r ) e
r/a s
r
ν 0
gν r ν
mit a
a a
(3.70)
zu wählen. Unter Benutzung von f (r ) e
r/a s
r
daraus folgend
ν 1
f e
r/a r s
f e
r/a r s
fν
1r
ν 1
s f0 r
ν 1
fν
f (r )
,
1r
ν 1
ν 1
f a
f /r
,
e fν a
1
r/a r s
srf e
f0 r
(s ν) fν
r/a s
r
ν 1
rν
fν r ν
ν 1 1
ν fν r ν
1
,
,
1
und entsprechenden Formeln für g(r ) führt das Einsetzen des Ansatzes in (3.69) zu
α f 0 kg0 sg0 f ν 1 gν 1 α fν (s ν k) gν r ν 1 0 , r a a ν 1
αg0 k f 0 s f 0 gν 1 fν 1 αgν a (s ν k) fν r ν 1 0 . r a ν 1
Der Koeffizientenvergleich der 1/r -Terme liefert die Gleichungen α f0 (k s)g0 für die r ν 1 -Terme führt er
0,
αg0 (s
k) f 0
0,
(3.71)
nach Multiplikation mit a bei den Koeffizienten der ersten
und mit a a a bei denen der zweiten Gleichung zu den Rekursionsformeln 5 a gν 1 (s ν k) a gν 0 , (3.72) f ν 1 αa f ν a 5 a gν 1 αagν f ν 1 (s ν k) a f ν 0 . (3.73) a
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
109
Die Lösbarkeitsbedingung α 2 (s k)(s k)α 2 s 2 k 2 0 für die Gleichungen (3.71) liefert die Bedingung s.u. s k 2 α2 . (3.74) (Die Alternative mit dem Minuszeichen vor der Wurzel würde zu Lösungen führen, die für r 0 divergieren.) Durch Addition der Rekursionsformeln (3.72)–(3.73) ergibt sich der Zusammenhang αa (s ν k) a gν fν (3.75) αa (s ν k) a zwischen den Koeffizienten f ν und gν . Für ν folgt aus der letzten Beziehung näherungsweise a fν , (3.76) gν a und aus (3.72) ergibt sich damit die Näherung 5 a a fν 1 νa fν f ν 1 αa f ν a a die mit (3.70c) und (3.76) fν
f ν 1 , 2 aν
gν
0,
2gaνν 1
zur Folge hat. Drückt man mit Hilfe der ersten Iterationsformel f ν 1 durch f ν 2 , f ν 2 durch f ν 3 aus usw., so ergibt sich aus (3.70a) für f (r ) das asymptotische Verhalten f (r ) er/a r s
1 2r ν ν a ν 0
er/a r s e2r/a ,
und für g(r ) erhält man ein analoges Verhalten, beide Funktionen divergieren. Konvergente Lösungen ergeben sich daher nur, wenn die Reihen (3.70) bei einem endlichen ν N abbrechen, wenn also f N 1 g N 1 0 gilt. Aus den zwei Gleichungen (3.72) und (3.73) ergibt sich für ν N 1 daraus die gleiche Bedingung 5 a fN gN . a Wird dies in die für ν N angeschriebene Beziehung (3.75) eingesetzt, so folgt 5 αa (s N k) a a 1, αa (s N k) a a was unter Benutzung von (3.70c) in 2(s
N) α
aaaa
(3.68)
2E
(m 0 c2 )2 E 2
umgeformt werden kann. Durch Quadrieren ergibt sich hieraus eine quadratische Gleichung für E, deren Lösung wegen 2(s N)/α 0 positiv sein muß und nach Ersetzung
110
3 Anwendungen der Dirac-Theorie
von s durch (3.74) E
1
α2 /
m 0 c2 N
k2
2 α2
(3.77)
lautet. (Dieses Ergebnis für das diskrete Energiespektrum des relativistischen Wasserstoffatoms wurde erstmalig von A. Sommerfeld mit Hilfe des Bohrschen Atommodells abgeleitet.) k kann nach (3.64) die Werte l 1 und l annehmen und ist mit l ganzzahlig. Damit k 2 α 2 und E reell sind, muß der Wert k 0 ausgeschlossen werden, so daß k die Werte 1, 2 etc. annehmen kann. Die möglichen Werte von N sind 0, 1, 2 etc. Die zu den Eigenwerten (3.77) gehörigen Eigenzustände sind nach (3.60) und (3.66) ψ
4 3 1 f (r ) φk,m , r i g(r ) φ k,m
(3.78)
wobei die Zweierspinoren φk,m durch (Q7.137) mit j k, die Funktionen f (r ) und g(r ) durch (3.70) gegeben sind. Mit Hilfe der Rekursionsformel (3.72) und des Zusammenhangs (3.75) können alle Entwicklungskoeffizienten f ν und gν der Reihenentwicklungen (3.70) auf 2 f0 zurückgeführt werden, f 0 wiederum kann mit Hilfe der Normierungsbedingung ψ ψ d 3x 1 bestimmt werden. Einige der Eigenzustände haben bei r 0 eine schwache Singularität. Für r 0 gilt nach (3.70) f (r ) f 0 r s sowie g(r ) g0 r s , und nach (3.78) folgt daraus mit (3.74) 2 2 f 0 φk,m ψ r k α 1 . i g0 φk,m Für k 2 verhalten sich alle Zustände regulär, für k 1 gilt jedoch k 2 α 2 1 1α 2 1 α 2 /2 0, 000027 .
Nach (3.64) wird k 1 für l 0 und l 1, d. h. alle s- und p-Zustände divergieren für r 0 wie r 0,000027. Diese Singularität stellt allerdings kein echtes Problem dar: Sie ist darauf zurückzuführen, daß wir für den Wasserstoffkern das divergente Potential V (r )α h c/r benutzt haben, während der reale Wasserstoffkern wegen seiner endlichen Ausdehnung kein divergentes Potential besitzt. Im übrigen sorgt die endliche Kernausdehnung auch dafür, daß das Elektron gar nicht bis nach r 0 gelangen kann.
3.4.4 Diskussion der Energieniveaus Die durch (3.77) gegebenen Energieeigenwerte hängen nur von der radialen Quantenzahl N und dem Betrag der Spin-Bahn-Quantenzahl k ab. Wegen α 1/137 ist α 2 k 2 , die Energieeigenwerte werden daher näherungsweise durch die Hauptquantenzahl n
N k
(3.79)
allein festgelegt. Zur besseren Vergleichbarkeit mit dem nicht-relativistischen Ergebnis führen wir die letztere in (3.77) ein und erhalten
3.4 Relativistisches Wasserstoffatom bei ruhendem Kern
E
m 0 c2
1
α2
& n
k 2 α 2 k
111
2 .
(3.80)
Durch Entwicklung nach dem kleinen Parameter α 2 und mit k j 1/2 nach (3.64b) erhalten wir hieraus für die um die Ruheenergie reduzierten Energieniveaus E ¼ E m 0 c2 die Reihe m 0 c2 α2 m 0 c2 α4 3 1 ¼ 2n3 j 1/2 4n . . . . (3.81) E 2n 2 In niedrigster Ordnung ist dies das Ergebnis (Q4.144) der nicht-relativistischen Quantenmechanik. Der Term α 4 enthält die in der Näherung (3.50) durch zwei Zusatzterme beschriebenen relativistischen Korrekturen. Durch ihn wird die l-Entartung der Energieniveaus aufgehoben, weil j 1/2 von l abhängt. (Nach (3.64) kann k j 1/2 bei gegebenem l die Werte l und l 1 annehmen.) Weil der zu α 4 proportionale Korrekturterm jedoch wesentlich kleiner als der zu α 2 proportionale Term niedrigster Ordnung ist, ergibt sich eine Aufspaltung in sehr nahe beisammen gelegene Energieniveaus, die sehr nahe bei den entarteten Niveaus der nicht-relativistischen Theorie liegen. Die Breite des Energieintervalls, in das bei gegebenem n die Aufspaltung der Energieniveaus erfolgt, errechnet sich wegen j 1/2 l 1 n und damit 1/2 j n 1/2 aus der Differenz der Energien E ¼ (n, j 1/2) und E ¼ (n, j n 1/2) zu E ¼
n2n41 m 0 c2α4 ,
(3.82)
sie wird mit zunehmendem n sehr schnell sehr klein. Wie in der nicht-relativistischen Theorie hängt E ¼ nicht von der in den Eigenzuständen auftretenden Quantenzahl m ab. Diese beschreibt ja die Projektion des Gesamtdrehimpulses auf die z-Richtung, die wegen der Rotationsinvarianz des Problems durch nichts ausgezeichnet ist und daher willkürlich gewählt werden kann, und E ¼ darf davon nicht abhängen. Die m-Entartung bleibt also weiter bestehen, und weil m die Werte j, ( j 1), . . . , 1/2 oder (l 1/2), (l 1/2), . . . , 1/2 annehmen kann (nach (3.64b) gilt j l 1/2), ist sie 2(l 1)-fach. Zu gegebener Bahndrehimpulsquantenzahl l gibt es wegen j l 1/2 zwei mögliche Quantenzahlen j des Gesamtdrehimpulses, die zwei Orientierungsmöglichkeiten des Elektronenspins entsprechen. Die Zahl möglicher Elektronenzustände zu gegebener Hauptquantenzahl n, die nach der Schrödinger-Theorie n 2 beträgt, erhöht sich dadurch auf 2n 2 . Die in der nicht-relativistischen Theorie durch das Quantenzahlenpaar n l als 1s, 2s, 2 p, 3s, 3 p, 3d etc. gekennzeichneten Energieniveaus werden in der relativistischen Theorie unter Hinzufügen der Quantenzahl j für den Gesamtdrehimpuls durch n lj mit tiefgestelltem j charakterisiert. Auf diese Weise erhält man die Energieniveaus , , -. / -. / , -. / 1s1/2 , 2s1/2 , 2 p1/2, 2 p3/2, 3s1/2 , 3 p1/2, 3 p3/2, 3d3/2, 3d5/2, . . . . Weil einerseits die Energiewerte (3.80) nach (3.64b) bei gegebenem j nicht zusätzlich von l abhängen, andererseits jedoch nach (3.64b) zwischen l und j der Zusammenhang l j 1/2 besteht, ergeben sich bei gegebenem n dieselben Energiewerte für
112
3 Anwendungen der Dirac-Theorie
E¼ n 3 n 2
n 1
3s, 3 p, 3d 2s, 2 p
1s
0 3d5/2 3s1/2, 3 p1/2 2 p3/2 2s1/2, 2 p1/2
k 3 k 1 k 2 1 k
3 p3/2, 3d3/2
k 2
1s1/2
k 1
Abb. 3.1: Termschema des Wasserstoffatoms von n 1 bis n 3 nach der nicht-relativistischen Theorie (links) und der relativistischen Theorie (rechts). Die relativistischen Energieniveaus liegen etwas tiefer als die nicht-relativistischen. Ihre Absenkung ist allerdings wesentlich geringer als eingezeichnet, Aufspaltung und Absenkung wurden zur Sichtbarmachung stark übertrieben.
l j 1/2 und l j 1/2. Alle dieserart gleichen Energieniveaus sind in der obigen Aufzählung miteinander durch eine geschweifte Klammer verbunden. Zu gegebenem n finden sich in der obigen Aufstellung 2(n 1)12n 1 Energieniveaus, von denen sich (n 1)1n unterscheiden. In Abb. 3.1 ist das Termschema des Wasserstoffatoms von n 1 bis n 3 nach der nicht-relativistischen Theorie (links) und nach der relativistischen Theorie (rechts) wiedergegeben. Die k-Werte müssen sich dabei sowohl durch j als auch durch l gemäß (3.64b) ausdrücken lassen. Für den l 2 und j 5/2 Zustand 3d5/2 z. B. kommt daher nur k j 1/23 in Frage, weil k ( j 1/2)3 nur mit l 3 verträglich wäre.
3.5
Zur Hyperfeinstruktur des Wasserstoffatoms
Mit dem Spin des Atomkerns ist ein im Vergleich zum Moment des Elektrons sehr schwaches magnetisches Moment gs (e/2mp ) S verbunden, in dessen Magnetfeld B μ0 /(4π) rot( x/r 3) sich der Spin des Elektrons einstellt, es kommt zu einer Spin-Spin-Wechselwirkung. Die hieraus folgenden Korrekturen sind noch kleiner als die Feinstrukturkorrekturen und führen zu einer Struktur der Energieniveaus, die als Hyperfeinstruktur bezeichnet wird. Eine weitere, sehr schwache Korrektur ergibt sich, wenn man die Bewegung des Kerns mitberücksichtigt. Deren Berücksichtigung führt dazu, daß die Masse des Elektrons durch die reduzierte Masse ersetzt werden muß. Außerdem wird durch die Bewegung der Kernladung ein schwaches Magnetfeld hervorgerufen, das sowohl die Bahndynamik des Elektrons beeinflußt als auch auf den Elektronenspin einwirkt. Das sich hierdurch ergebende relativistische Zwei-Körper-Problem ist jedoch viel schwieriger als das nicht-relativistische und kann nur noch mit Näherungsmethoden behandelt werden. Nochmals weitere Korrekturen ergeben sich durch eine elektrische Polarisation des Vakuums, die wir in Abschn. 2.15.2 besprechen werden, und dadurch, daß im Vakuum fluktuierende elektromagnetische Felder auftreten (siehe Abschn. 8.3.8).
Aufgaben
113
Aufgaben 3.1
3.2
Zeigen Sie: Die gemeinsamen Eigenzustände der Operatoren p und c« p zu den ϕ Eigenwerten p und cp sind ψ e i p x/h . ( p/ p) ϕ Beweisen Sie: Zur Superposition der in Aufgabe 3.1 berechneten Eigenzustände der p-Komponente des Geschwindigkeitsoperators aus den ebenen Wellen 4 3 ϕ () e i ( p x ωt )/h ψ p ϕ m c2 E 0
p
positiver und negativer Energie werden beide benötigt. Hinweis: Es genügt der Beweis für t 0. 3.3
Beweisen Sie die Transformationsgleichung (3.23), (c )
3.4
cβ p p h( )
c
c p p . p p h( ) m 0 c h( )
h die Gültigkeit der Beziehung Beweisen Sie für den Operator K 1 L/ K 2 J 2 /h 2 1/4 mit J L h /2. Welche Eigenwerte folgen daraus für K ?
3.5
Der bei der Berechnung der Energieniveaus des Wasserstoffatoms benutzte Ope h, der in der Näherung (3.50) für den Hamilton-Operator rator K 1 L/ (genauer im Beitrag H 2 zu H ) die Spin-Bahn-Kopplung repräsentiert, vertauscht nur mit den zwei ersten Termen von H , anti-vertauscht jedoch mit dem dritten Term und vertauscht daher nicht mit H . Beweisen Sie die behauptete AntiVertauschung K , τ p 0.
3.6
Zeigen Sie, daß der aus K hervorgehende Operator β K mit dem HamiltonOperator (3.51b) des Wasserstoffatoms, H V (r )m 0 c2 β cτ p, vertauscht. Anmerkung: β K ist infolgedessen zeitlich konstant und daher der relativistisch korrekte Operator für die Spin-Bahn-Kopplung.
Lösungen 3.1
Der Spinor ψ U e i p x/h ist für beliebige U ein Eigenzustand des Operators p. Einsetzen in die Eigenwertgleichung c« p ψ αψ führt zu c« p U αU oder mit dem Ansatz ϕ zu U χ p pχ 0 ϕ ϕ c« pU c c α χ p 0 χ pϕ bzw. zu den Einzelgleichungen pχ
(α/c) ϕ ,
pϕ
(α/c) χ .
Aus diesen folgt χ
(c/α)
pϕ
und
p
pϕ
(α/c)2 ϕ .
114
3 Anwendungen der Dirac-Theorie
Mit (2.76) folgt aus der letzten Gleichung p2 ϕ
(α/c)2 ϕ
pp ϕ .
und damit aus der vorletzten χ Für ψ ergibt sich wie behauptet
3
ψ 3.2
α
pc ,
4
ϕ
e i p x/h .
pϕ p
Wir beschränken uns auf den Fall positiver Geschwindigkeit, pψ pψ, betrachten den Zeitpunkt t 0 (für andere Zeitpunkte müßte in die Eigenlösungen von c p eine den ebenen Wellen entsprechende Zeitabhängigkeit aufgenommen werden) und haben das Superpositionsproblem 3 4 4 3 4 3 ϕ1 ϕ2 ϕ , c p c p p ϕ1 ϕ2 p ϕ m c2 E m c2 E
ϕ2 ϕ ,
p
0
in Komponenten also ϕ1
p
0
p
c
pϕ . ϕ2 2 p m0c Ep
ϕ1 m 0 c2 Ep
Unter Benutzung der ersten Gleichung ergibt sich aus der zweiten ϕ2 ϕ1 ϕ2 m0c2 Ep cp
ϕ1 m 0 c2 Ep oder
1
m 0 c2 Ep
1 cp
ϕ1
m0c2 Ep
1 cp
1
ϕ2 .
ϕ1 repräsentiert eine Lösung positiver, ϕ2 eine Lösung negativer Energie. Da ϕ1 und ϕ2 zueinander proportional sind, müssen beide von null verschieden sein. Nur für m 0 0 und daraus folgend Ep cp wäre ϕ1 0 und ϕ2 0 möglich.
(m 0 ch β p ) (m 0 ch β p ) (2h )(m 0 ch ) p β p . m02chh 21h (β p β p ) (2βh )(m 0 ch ) Mit zweimaliger Vertauschung von β mit sowie mit p p 2 p im letzten Term, mit β p β p β( p p )2β p (folgt aus der letzten Gleichung) im zweiten Term und mit p p p 2 ergibt sich daraus m ch β p β 2 ( p 2 p ) p 0 2h h (2h )(m 0 ch ) 2 p p 0 ch ) p . βhp (m0c(2hh)(m )(m 0 ch ) h (m 0 ch )
3.3
Wegen (3.22) verschwindet der dritte Term, und damit ist die Beziehung bewiesen.
Aufgaben
3.4
115
Setzt man in der Identität (2.158) a b L, so folgt aus dieser ( L)2
L 2 i ( L L) .
Mit der Beziehung L L i h L , die gleich im Anschluß abgeleitet wird, sowie mit J 2 L 2 h L h 2 2 /4 und 2 Σ x2 Σ y2 Σz2 3 läßt sich diese in 3 ( L)2 L 2 h L J 2 2h L h 2 4 überführen, woraus wie behauptet K2
1
2 L h
( L)2 h2
1
2 L h
J2 h2
2 L h
3 4
J2
h 2
1 4
folgt. Der Operator L L ist nicht der Nulloperator, weil die im ersten L enthaltene Ableitung auf den Ortsvektor x im zweiten L wirkt, LL
(x p)(x p) h 2 (x )(x ) h 2 (x )( x
) .
Der letzte Ausdruck ist dabei so zu verstehen, daß der vor x stehende Nablaoperator nur noch auf x wirkt. Mit div( x (x )( x
)( x)0 ergibt sich weiterhin
) x (x ) x div(x )x (x ) ∂i (xk εklm x l ∂m ) x k εklm δil ∂m x k εkim ∂m εikm x k ∂m x und damit L L h 2 ( x )i hx pi h L. 3.5
Mit L p
p L
h 2
und L p p L
(x )
h 2
x () 0 , i i h 2 h 2 rot x x () 0 (x ) i i
(x p) p p(x p) p( x
p( p x) ( p x) p
p)
h 3h 2h pi (∂i x j e j ) p p i i i
ergibt sich aus (2.158), a b ab i ( a b),
L p i ( L p) , p L i ( p L) , L p p L i ( L p p L) 2h p
und
L h, p L p p L 2h p 0 .
Wird diese Gleichung mit τ/h multipliziert, so folgt aus ihr mit (2.167c), τ τ , daß der Operator K mit dem Operator τ p anti-kommutiert.
3.6
β K β β L/h kommutiert mit den zwei ersten Termen des Hamilton-Operators, H V (r )m 0 c2 β cτ p, weil β und L mit V (r ) und β kommutieren, L dabei nach (2.167d) und wegen (x )V (r )0. Bezüglich des dritten Terms gilt β K , τ
p β K τ p τ p β K
β K , τ p
Aufg. 3.6
(2.167b,d)
0.
β K τ p βτ p K
4
Klein-Gordon-Theorie
1926, schon zwei Jahre, bevor Dirac die Dirac-Gleichung aufstellte, wurde von O. Klein und W. Gordon eine Gleichung für die relativistische Quantendynamik von Teilchen angegeben.1 Aufgrund von Schwierigkeiten, die wir erörtern werden, wurde sie jedoch vorübergehend aufgegeben. Einige dieser Schwierigkeiten lassen sich auf einfache Weise beseitigen, andere, denen man in ähnlicher Weise auch bei der Dirac-Gleichung begegnet, können erst im Rahmen einer Quantenfeldtheorie, dort aber vollständig, behoben werden. Der letzte Umstand macht die Klein-Gordon-Schrödinger-Gleichung zu einer nützlichen relativistischen „Wellengleichung“, deren Untersuchung sich lohnt. Wie schon bemerkt wurde, beschreibt die Dirac-Gleichung nur spezielle Spin-1/2Teilchen. Die Klein-Gordon-Schrödinger-Gleichung wird sich als adäquate Gleichung zur Beschreibung von Teilchen mit Spin 0 herausstellen (siehe Abschn. 4.2).
4.1
Klein-Gordon-Schrödinger-Gleichung
Die Anwendung der Korrespondenzregeln (2.18) auf die klassische relativistische Gleichung (2.5) hat uns in Abschn. 2.2 zu der quantenmechanischen Bewegungsgleichung (2.19) geführt. Diese erschien uns aus mehreren Gründen als ungeeignet: Zum einen, weil in ihr Raum und Zeit nicht gleichberechtigt behandelt werden, und zum anderen, weil sie zu einer nicht-lokalen Theorie führt. Als Alternative zur Vorgehensweise von Dirac bietet sich an, in einer gewissen Analogie zu dieser in Gleichung (2.5) die Wurzel durch Quadrieren zu beseitigen, (H qΦ)2
m 02c4 c2 ( p
q A)2 ,
(4.1)
und dann die Korrespondenzregeln (2.18) anzuwenden. Auf diese Weise ergibt sich mit V qΦ die Klein-Gordon-Schrödinger-Gleichung2 (ih ∂t V )2 φ
c2
2 h qA φ i
m 02 c4 φ
0.
(4.2)
1 Wie in der Einleitung zur Relativistischen Quantenmechanik dargelegt hatte auch schon Schrödinger diese Gleichung gefunden. 2 Es ist üblich, die skalare Wellenfunktion der Klein-Gordon-Theorie mit φ zu bezeichnen, um sie von den Spinoren ψ der Dirac-Theorie abzuheben. Beim gleichzeitigen Auftreten des hier mit Φ bezeichneten elektrischen Potentials kann das leicht zu Verwechslungen führen, weshalb im folgenden qΦ V gesetzt wird.
4.1 Klein-Gordon-Schrödinger-Gleichung
117
Dabei sei angemerkt, daß (4.1) nicht der Gleichung (2.5), sondern den Gleichungen 2 H V c m 02 c2 pq A äquivalent ist. Wie bei der Dirac-Theorie erwarten wir daher, daß Gleichung (4.2) auch Lösungen negativer Energie besitzt. Gleichung (4.2) läßt sich sofort in eine Form bringen, die ihre Kovarianz erkennen läßt. Wir teilen sie zu diesem Zweck durch c2 , führen den Vierervektor Aα Φ/c, A ein, und erhalten 3 3 2 2 2 2 h i ∂0 q A0 φ hi ∂l q Al φ hi ∂0 q A0 φ hi ∂l q Al φ m 02c2 φ l 1
l 1
bzw. in relativistischer Schreibweise unter Benutzung kovarianter und kontravarianter Vektoren h ∂ α q Aα h ∂α q Aα φ m 02c2φ . (4.3) i i Diese Gleichung ist offensichtlich Lorentz-invariant, wenn sich φ wie ein Skalar transformiert, d. h. gemäß φ ¼ (x ¼ ) φ x(x ¼ ) . (4.4) φ kann dabei komplexwertig sein. Durch Ausmultiplizieren der in Klammern stehenden Operatoren in (4.3) ergibt sich für den Fall der Lorenz-Eichung ∂ αAα 0 die (4.2) und (4.3) äquivalente Form
h 2φ 2 ih q Aα ∂α φ q 2AαAα φ m 02 c2φ
(4.5)
der Klein-Gordon-Schrödinger-Gleichung, wobei die Definition ∂ α ∂α und die Identität Aα ∂ α φ Aα ∂α φ benutzt wurden. Der Spezialfall der Klein-Gordon-Schrödinger-Gleichung für freie Teilchen ( Aα 0) ist φ
m 02 c2 h 2
φ
0.
(4.6)
Ein anderer Zugang zur Klein-Gordon-Schrödinger-Gleichung ist auch mit unserer bewährten Methode möglich, einen allgemeinen Ansatz mit zunächst offen gelassenen Koeffizienten zu wählen und diese über das Korrespondenzprinzip zu bestimmen. Dabei muß nur die – bei der Dirac-Gleichung mit Kausalitätsargumenten begründete – Forderung aufgegeben werden, daß die „Wellengleichung“ nur Zeitableitungen erster Ordnung enthalten soll. Das im Detail auszuführen bleibt dem Leser überlassen (Aufgabe 4.1). Hier wird nur gezeigt, daß Gleichung (4.5) im quasiklassischen Grenzfall auf die Gleichungen (2.11) und (2.14) zurückführt. Beweis: Wir setzen φ
A eiS/hÆ
118
4 Klein-Gordon-Theorie
und nehmen an, daß sowohl A als auch S reell sind. (Man beachte, daß die Amplitude A nichts mit dem Vektorpotential A α zu tun hat.) Mit 6 7 i (∂α A) ∂α φ A(∂α S) eiS/h , h 6 7 1 i α φ A 2 A(∂ α S)(∂α S) 2(∂ A)(∂α S) AS eiS/h h h folgt aus (4.5) für den Realteil h
2 A
A
(∂ α S)(∂α S) 2q A α (∂α S) q 2A αA α
m 02 c2
(4.7)
und für den Imaginärteil 2(∂ αA)(∂α S) AS 2q A α (∂α A) 0 .
(4.8)
Im quasiklassischen Grenzfall kann der erste Term in (4.7) vernachlässigt werden (es gelten zu (2.23)–(2.24) analoge Abschätzungen). Der Rest von Gleichung (4.7) kann in der Form (∂ α S q A α )(∂α S q A α ) m 02 c2 geschrieben werden und ist identisch mit (2.11). Gleichung (4.8) multiplizieren wir mit A, setzen n 0 A 2 (A ist wie φ nach (4.4) ein Skalar) und erhalten unter Benutzung von ∂ α A α 0 (4.9) ∂ α n 0 (∂α S q A α ) 0 . Mit m 0 Uα m c, Ú können die Gleichungen (2.6) mit (2.9) sowie (2.7) mit (2.10) und H E zu (4.10) ∂α S q A α m 0 Uα zusammengefaßt werden, Gleichung (4.9) und (4.10) ergeben zusammen (2.14).
In Abschn. 2.6 wurde gezeigt, daß jede Komponente eines Dirac-Spinors, welcher der Dirac-Gleichung für freie Teilchen genügt, auch eine Lösung der Klein-GordonSchrödinger-Gleichung (4.6) für freie Teilchen ist. Bei freien Teilchen besteht daher kein wesentlicher Unterschied zwischen diesen beiden Gleichungen, ein solcher ergibt sich erst im Fall nicht-verschwindender Felder. In Aufgabe 4.3 wird gezeigt, daß die Dirac-Spinoren in diesem Fall die Gleichung « E Gψ h q i B ψ (4.11) c mit
G
h 2 2 ih q Aα ∂α q 2AαAα m 02 c2
erfüllen. Diese unterscheidet sich von der Klein-Gordon-Schrödinger-Gleichung (4.5) durch die Terme der rechten Seite. Elektronen und Positronen verhalten sich demnach nicht nur in Magnetfeldern aufgrund ihres Spins anders als geladene Spin-0-Teilchen, sondern auch bei Abwesenheit eines Magnetfelds in rein elektrischen Feldern.
4.2 Nicht-relativistischer Grenzfall
4.2
119
Nicht-relativistischer Grenzfall
Die Klein-Gordon-Schrödinger-Gleichung (4.2) lautet ausführlicher h 2 ∂t t φ
2 ih V ∂t φ
ih φ ∂t V
Mit dem Ansatz φ
V 2 φ c2 hi
ψe
2 q A φ m 02 c4 φ .
im 0 c2 t /h
(4.12)
transformieren wir zunächst wie bei der Dirac-Gleichung (siehe (2.139)) den Ruheenergieterm m 02 c4 φ weg und erhalten für ψ die Gleichung c2 hi
2 q A ψ. (4.13) Mit den gleichen Argumenten, die zu den Ungleichungen (2.141) geführt haben, erklären wir den nicht-relativistischen Grenzfall dadurch, daß überall, wo ψ merklich von null verschieden ist, die Forderungen h 2 ∂t t ψ 2m 0 c2 ih ∂t ψ 2 ih V ∂t ψ 2V m 0 c2 ψ ih ψ ∂t V V 2
V m 0 c2 ,
' ' ' ' 'ih ∂t f ' 'm 0 c2 f '
(4.14)
erfüllt sein sollen, wobei f entweder für ψ, eine Ableitung von ψ oder das Potential V steht. (Wir erwarten, daß sich ∂t ψ und ψ so schnell wie V ändern.) Auf der linken Seite von (4.13) kann damit eine Reihe von Termen vernachlässigt werden: Wegen (4.14a) der letzte gegen den vierten, wegen (4.14b) mit f ∂t ψ der erste gegen den zweiten und mit f ψ der dritte gegen den vierten sowie mit f V der fünfte gegen den vierten. Aus (4.13) folgt dann nach Division durch 2m 0 c2 ih ∂t ψ
V ψ 2m1
0
2 h qA ψ . i
Das ist die Schrödinger-Gleichung für ein geladenes Teilchen ohne Spin in elektromagnetischen Feldern. Da die Eigenschaft der Spinlosigkeit nicht vom Bewegungszustand des Teilchens abhängt, erweist sich die Klein-Gordon-Schrödinger-Gleichung damit als Gleichung für Teilchen mit Spin 0. Anmerkung: Die Schrödinger-Gleichung besitzt nur stationäre Zustände positiver Energie. Daß die Klein-Gordon-Schrödinger-Gleichung auf sie führte, darf nicht zu dem Schluß verleiten, daß auch diese nur positive Energien zuließe. Mit dem Ansatz (4.12) wird ψ nur dann langsam zeitveränderlich und damit (4.14b) nur dann gültig, wenn φ ein Zustand positiver Energie ist (siehe Abschn. 4.5). Für Lösungen 2 negativer Energie müßte man stattdessen φ ψ ei m 0 c t /h ansetzen und bekäme im nicht-relativistischen Grenzfall für ψ eine Schrödinger-Gleichung zu negativen Energien (ih ∂t ψ ih ∂t ψ , siehe Aufgabe 4.4).
120
4.3
4 Klein-Gordon-Theorie
Schrödinger-Form der Klein-Gordon-Schrödinger-Gleichung
Es verstößt gegen eines unserer Grundprinzipien bei der Aufstellung quantenmechanischer Bewegungsgleichungen, daß die Klein-Gordon-Schrödinger-Gleichung zweite Zeitableitungen enthält: Die zeitliche Weiterentwicklung der Wellenfunktion φ ist dann nicht durch den momentanen Zustand determiniert, vielmehr muß auch noch ∂t φ vorgegeben werden. Dies ist ein Mangel, der sich auf einfache Weise beheben läßt: Man muß dazu nur die Wellengleichung zweiter Ordnung hinsichtlich der Zeitableitung in ein System von zwei Gleichungen erster Ordnung zerlegen, indem man z. B. φ und (ih/m 0 c2 ) ∂t φ zu Komponenten eines Zweierspinors erklärt. (Dies entspricht in der Mechanik dem Übergang von den Lagrange-Gleichungen, die doppelte Zeitableitungen enthalten, zu den Hamilton-Gleichungen, die nur einfache Zeitableitungen enthalten, wobei in ähnlicher Weise die Ortsvariablen qi durch jeweils zwei Variablen, qi und pi , ersetzt werden. Allerdings ergeben sich trotz dieses Tricks Schwierigkeiten bei der physikalischen Interpretation der Klein-Gordon-Schrödinger-Gleichung, die in Abschn. 4.5 untersucht werden.) Dem äquivalent, aber noch symmetrischer und übersichtlicher ist die Einführung des Spinors ϕ Ψ (4.15) χ mit den Komponenten 1 ih 1 ih φ φ ϕ ∂t φ , χ ∂t φ . (4.16) 2 m 0 c2 2 m 0 c2 (Auch in der Mechanik wird als zweite Variable nicht qi , sondern pi m i qi q Ai benutzt.) Zur Ableitung der Bewegungsgleichung für den Spinor Ψ lösen wir diese Beziehungen nach φ und ∂t φ auf, φ
ϕ χ,
ih ∂t φ m 0 c2
ϕ χ,
(4.17)
und setzen dies in die Klein-Gordon-Schrödinger-Gleichung ein. Dabei beschränken wir unsere Betrachtung auf den kräftefreien Fall. (Der Fall Aα 0 wird in Aufgabe 4.5 untersucht.) Aus (4.2) folgt mit V 0, A 0 und dem Ansatz (4.17) ih ∂t (ϕ χ)
h2 (ϕ χ) m 0 c2 (ϕ χ) . m0
(4.18)
Einsetzen von (4.17a) in (4.17b) liefert als zweite Differentialgleichung ih ∂t (ϕ χ) m 0 c2 (ϕ χ) .
(4.19)
Addition und Subtraktion der Gleichungen (4.18)–(4.19) führt schließlich zu dem Gleichungssystem h2 ih ∂t ϕ (ϕ χ) m 0 c2 ϕ , 2m 0 (4.20) h2 2 (ϕ χ) m 0 c χ . ih ∂t χ 2m 0
4.3 Schrödinger-Form der Klein-Gordon-Schrödinger-Gleichung
121
Unter Benutzungen der Pauli-Matrizen (Q7.39) kann dieses mit 0 (i σ2 σ3 ) Ψ i i
i
0
und σ3 Ψ
1 0
0 1
ϕ χ
1 0
0 1
H
11 11 ϕ χ
χϕ
ϕ χ
ϕϕ χχ
(4.21)
in die kompakte Form ih ∂t Ψ
H Ψ
mit
i σ2
σ3
h2 2m 0
m 0 c2 σ3
(4.22)
überführt werden, wobei der Hamilton-Operator H offensichtlich nicht-hermitesch ist. (4.22) ist die Schrödinger-Form der Klein-Gordon-Schrödinger-Gleichung. In Aufgabe 4.6 wird gezeigt, daß jeder Lösungsspinor Ψ dieser Gleichung (und damit jede seiner Komponenten ϕ und χ) auch die Klein-Gordon-Schrödinger-Gleichung erfüllt. Den nicht-relativistischen Grenzfall für Lösungen positiver Energie untersuchen wir 2 mit Hilfe des zu (4.12) analogen Ansatzes Ψ Ψ e im 0 c t /h . Statt der Gleichungen (4.20) erhalten wir mit diesem ih ∂t ϕ
h 2 2m
0
(ϕ
χ) ,
ih ∂t χ
h 2 (ϕ 2m 0
χ) 2m 0c2χ .
(4.23)
Die Anwendung der den nicht-relativistischen Grenzfall charakterisierenden Forderung (4.14b) auf χ reduziert die zweite Gleichung (4.23) auf χ
2 4mh 2c2 (ϕ χ) . 0
Mit (4.23a) und Anwendung der Forderung (4.14b) auf ϕ erhalten wir hieraus ' ' ' ' ' χ '
h 2m 0 c2
' ' ' ' ' ' ' ' ' ∂t ϕ ' ' ϕ ' .
(4.24)
Dies bedeutet, daß die untere Komponente des Spinors Ψ im nicht-relativistischen Grenzfall gegen die obere vernachlässigt werden kann, Ψ
ϕ0 ,
so daß sich für ϕ aus (4.23a) mit (4.24) schließlich, wie zu erwarten, die SchrödingerGleichung h 2 ih ∂t ϕ ϕ 2m 0 ergibt.
122
4 Klein-Gordon-Theorie
4.4
Geschwindigkeitsoperator
Der Geschwindigkeitsoperator Ú der durch die Klein-Gordon-Schrödinger-Gleichung beschriebenen Spin-0-Teilchen ist nach (Q6.117) durch Ú
dx dt
1 p (4.22b) x, H (i σ2 σ3 ) . i h m0
(4.25)
definiert. Beweis: Wir führen den Beweis für die x-Komponente. Es gilt ih
dx dt
x, (i σ2
σ3 )
h2 h2 x, m 0 c2 σ3 (i σ2 σ3 ) (∂x x x 2m 0 2m 0
x ∂x x ) .
Mit ∂x x x
∂x (1 x ∂x ) (∂x 1) 1 ∂x
(∂x x) ∂x
x ∂x x
2∂x
x ∂x x
wird daraus ih
dx dt
(i σ2 σ3 )
h2 2 ∂x 2m 0
i h (i σ2 σ3 )
h ∂x m0 i
Der Beweis für die übrigen Komponenten verläuft analog.
i h (i σ2 σ3 )
p x . m0
Die Eigenwerte λ der in (4.21) berechneten Matrix i σ2 σ3 ergeben sich aus der Gleichung (1λ)(1λ)1 0 zu null. Hieraus folgt, daß auch die Eigenwerte des Geschwindigkeitsoperators Ú gleich null sind, was bedeutet, daß auch die theoretischen Meßwerte der Geschwindigkeit verschwinden. Es stellt sich also ein ähnliches Problem wie beim Geschwindigkeitsoperator c« der Dirac-Theorie. Für die Zeitableitung des Geschwindigkeitsoperators ergibt sich
d Ú p p 2 p i h (i σ2 σ3 ) (i σ2 σ3 ) Ú , H , (i σ2 σ3 ) , m 0 c2 σ3 dt m0 2m 0 m0
p (2.87) i σ2 , m 0 c2 σ3 i p c2 σ2 , σ3 σ1 c2 p m0 (4.25)
m 0c2σ1 (i σ2 σ3 ) 1 Ú .
Obwohl wir es mit kräftefreien Teilchen zu tun haben, ist die Zeitableitung des Geschwindigkeitsoperators von null verschieden. Der Grund dafür ist, daß es auch bei den durch die Klein-Gordon-Schrödinger-Gleichung beschriebenen Spin-0-Teilchen als Folge der Existenz von Lösungen positiver und negativer Energie eine Zitterbewegung gibt. Allerdings ist die Lösung für diese nicht so einfach wie bei den Dirac-Teilchen zu erhalten.
4.5 Ebene-Welle-Lösungen für freie Teilchen
4.5
123
Ebene-Welle-Lösungen für freie Teilchen
Mit dem Ansatz
Ψ0 ei( p x Et )/h
Ψ
(4.26)
für ebene Wellen führt Gleichung (4.22a) zu dem Eigenwertproblem HΨ
EΨ ,
(4.27)
und das Gleichungssystem (4.20) für die Komponenten des Spinors Ψ reduziert sich auf die algebraischen Gleichungen p2 p2 p2 p2 2 2 E ϕ0 χ0 0 . m 0 c χ0 0 , ϕ0 E m 0 c 2m 0 2m 0 2m 0 2m 0 Die Lösbarkeitsbedingung für diese ist E
2
oder E
Ep
p2 2m 0
2
m0c
mit
2
Ep
p2 2m 0
2
0
(m 0 c2 )2 c2 p2 .
(4.28)
Lösungen zum positiven bzw. negativen Eigenwert bezeichnen wir mit Ψ () bzw. Ψ () . Man überprüft durch Einsetzen, daß (mit willkürlicher Normierung) 3 4 3 E m c2 4 1 p 0 2 () i ( p x Ep t )/h () E m c 2 p 0 e ei ( p x Ep t )/h , Ψ Ψ E m p 0c 2 1 Ep m 0 c (4.29) die zu Ep bzw. Ep gehörige Lösung ist. Im nicht-relativistischen Grenzfall, Ep m 0 c2, geht Ψ () gegen einen Spinor mit verschwindender unterer und Ψ () gegen einen Spinor mit verschwindender oberer Komponente. Der Ansatz (4.26) für den Zweierspinor Ψ überträgt sich nach (4.15) und (4.17a) auf die Wellenfunktion φ, φ φ0 ei( p x Et )/h . (4.30) Durch Vergleich mit der Zerlegung φ A eiS/h erhalten wir den Zusammenhang S
p x Et .
Im quasiklassischen Grenzfall dürfen wir daher nach (2.9) und (2.10) p mit dem Impuls und E mit der Energie identifizieren. Übertragen wir diese Interpretation auf das Quantenregime, so ist (4.27) die Eigenwertgleichung für die Energie. Dementsprechend ist der Impulsopeder in (4.22b) definierte Operator H der Energieoperator und (h/i) rator. Überträgt man die Orts- und Zeitabhängigkeit (4.30) mit (4.12) von φ auf ψ, so 2 ergibt sich ψ φ0 ei p x (E m 0 c )t /h . Dies läßt erkennen, daß ψ wie in Abschn. 4.2 behauptet nur für Zustände positiver Energie langsam zeitveränderlich wird.
124
4.6
4 Klein-Gordon-Theorie
Ladungskonjugation
Die Eigenwerte (4.28) des in Gleichung (4.22b) definierten Operators H konnten als Energien interpretiert werden. Neben den freien Teilchen positiver Energie gibt es auch freie Teilchen negativer Energie, es besteht also dieselbe Situation wie bei der Dirac-Gleichung. Wie dort könnte man versucht sein, den fortwährenden Übergang zu Zuständen immer tieferer negativer Energie durch die Annahme zu vermeiden, daß alle Zustände negativer Energie bereits besetzt sind. Das würde wieder zu der Forderung führen, daß zu jedem durch die Klein-Gordon-Schrödinger-Gleichung beschriebenen Teilchen auch ein Antiteilchen existiert. Allerdings handelt es sich sowohl bei den Teilchen als auch bei den Antiteilchen um Spin-0-Teilchen, und für diese gilt kein Pauli-Prinzip, durch das sich der Übergang zu bereits besetzten Zuständen verbieten ließe. Auf der gegenwärtigen Betrachtungsstufe läßt sich daher die Annahme, die KleinGordon-Schrödinger-Gleichung könne zu einer durchgängig sinnvollen Beschreibung von Teilchen herangezogen werden, nicht rechtfertigen, und dasselbe gilt für die aus ihr abgeleitete Existenz von Antiteilchen. Dennoch werden wir sie in diesem Abschnitt weiterhin als brauchbare Gleichung für Spin-0-Teilchen benutzen und die mit dem Auftreten negativer Energien verbundenen und auf der gegenwärtigen Stufe nicht mehr lösbaren Probleme einfach ignorieren. Der Grund dafür ist, daß sich die angeführten Probleme im Rahmen einer Quantenfeldtheorie von selbst auflösen werden (siehe auch Abschn. 4.7.2). Wenn man akzeptiert, daß es positiv (oder negativ) geladene Teilchen gibt, die durch die Klein-Gordon-Schrödinger-Gleichung beschrieben werden, läßt sich noch viel direkter als bei der Dirac-Gleichung auf die Existenz dazugehöriger negativ (oder positiv) geladener Antiteilchen schließen. Zu diesem Zweck stellen wir die zur KleinGordon-Schrödinger-Gleichung (4.3) konjugiert-komplexe Gleichung auf,
h α ∂ i
q Aα
h ∂α i
q Aα φ
m 02 c2 φ .
(4.31)
Durch Vergleich mit (4.3) erkennt man sofort: Ist φ eine Lösung positiver Ladung, so ist φ eine Lösung negativer Ladung, d. h. es besteht die Ladungskonjugation φC
Cφ
φ .
(4.32)
Anmerkung: Es sei darauf hingewiesen, daß diese einfache Möglichkeit der Ladungskonjugation durch die Transformation (4.12) zerstört wird, ψC erfüllt keine ladungskonjugierte Gleichung. Während in (4.31) alle beim Übergang zum Konjugiert-Komplexen aufgetretenen Vorzeichenwechsel durch q q kompensiert werden können, wird dies in (4.13) durch den zweiten Term der linken Seite verhindert, und der vierte Term wechselt mit q q sein Vorzeichen. Dementsprechend besteht diese Möglichkeit auch nicht bei der Schrödinger-Gleichung. Die Ursache dafür ist die mit der Transformation (4.12) verbundene Verschiebung des Energienullpunkts.
4.7 Reinterpretation der Klein-Gordon-Theorie
4.7
125
Reinterpretation der Klein-Gordon-Theorie
4.7.1 Kontinuitätsgleichung, Teilchendichte und Teilchenstrom Die konjugiert-komplexe Klein-Gordon-Schrödinger-Gleichung (4.31) lautet für den Fall der Lorenz-Eichung nach (4.5) ausführlicher 2 ih q Aα ∂α φ q 2AαAα φ
h 2 φ
m 02c2 φ .
(4.33)
Um aus ihr eine Kontinuitätsgleichung abzuleiten, multiplizieren wir sie mit φ und ziehen von ihr die mit φ multiplizierte Gleichung (4.5) ab. Mit ∂ α φ ∂α φ φ∂α φ (∂ α φ )(∂α φ) (∂ α φ)(∂α φ ) φ φ φφ
φ φ
φφ
und nochmaliger Benutzung der Lorenz-Eichung ∂ αAα 0 erhalten wir ∂ α h 2 φ ∂α φ φ∂α φ 2 ih q Aα φφ 0 . Nach Multiplikation mit i/(2m 0 h ) ergibt sich daraus die Lorentz-invariante Kontinuitätsgleichung ∂ α jα
0
(4.34)
mit der Vierer-Teilchenstromdichte jα
2mih
0
φ ∂α φ
φ∂α φ
mq
0
Aα φφ .
(4.35)
Im quasiklassischen Grenzfall stimmt diese mit der aus (4.10) folgenden Teilchenstromdichte n 0 Uα φφ (q Aα ∂α S)/m 0 überein (Aufgabe 4.7). Wird in Gleichung (4.31) φ φC gesetzt, so ist Gleichung (4.3) mit φ φC zu dieser komplex-konjugiert, und man erhält wie eben die Gültigkeit der Kontinuitätsgleichung (4.34) für die Teilchendichte jC α
ih 2m
0
φC ∂α φC
φC ∂α φC
q Aα φC φC m0
jα .
(4.36)
Mit jα erfüllt auch a jα die Kontinuitätsgleichung, wobei a eine beliebige Konstante ist, die auch negativ und insbesondere gleich 1 sein kann. In der Definitionsgleichung (4.35) wurde über diesen freien Faktor so verfügt, daß j0 /c im nicht-relativistischen Grenzfall für positive Energien gerade die Teilchendichte ψψ ergibt (Beweis folgt). Wir können daher die Identifikation n j0/c vornehmen. Aus (4.35) ergibt sich damit zunächst allgemein n
2mih c2 0
φ ∂t φ
φ∂t φ
V φφ . m 0 c2
(4.37)
126
4 Klein-Gordon-Theorie
Mit (4.12) folgt hieraus im nicht-relativistischen Grenzfall wie behauptet
2 ih i m 0 c2 V i m 0c ψ ψ ψ ∂ n ψ ψ ∂ ψ ψψ t t 2m 0 c2 h h m 0 c2
ψψ .
Dabei wurde V m 0 c2 benutzt, außerdem wurden die Zeitableitungen von ψ aufgrund der Bedingung (4.14b) vernachlässigt, was allerdings nur möglich ist, wenn der Zustand φ keine Anteile negativer Energie enthält. Setzen wir jα nc, jT , j α nc, jT , so ergibt sich aus (4.35) mit Aα Φ/c, A und ∂α ∂0 , die Teilchenstromdichte ih q φ φ φ φ A φφ . (4.38) jT 2m 0 m0 Für kräftefreie Teilchen vereinfachen sich die Ergebnisse (4.37) und (4.38) zu n
ih φ , ∂ φ φ∂t φ t 2m 0 c2
jT
ih φ φ φ φ . 2m 0
(4.39)
Es ist nützlich, n und jT auch durch die in (4.15)–(4.16) definierten Spinoren auszudrücken. Mit (4.17) ergibt sich für den kräftefreien Fall n
1 (ϕ χ )(ϕ χ) (ϕ χ)(ϕ χ ) ϕ ϕ χ χ . 2
Wie man leicht verifiziert, kann dafür n
ϕ ϕ χ χ
Ψ σ3 Ψ
(4.40)
geschrieben werden. Ebenso leicht überzeugt man sich von jT
ih Ψ (1σ1 ) Ψ 2m 0
Ψ
(1σ1 )Ψ .
(4.41)
4.7.2 Physikalische Interpretation Wir kommen jetzt zur physikalischen Interpretation der erzielten Ergebnisse. Für n gilt zwar ein Erhaltungssatz, n ist jedoch nicht positiv definit, wie das bei der Identifizierung mit einer Wahrscheinlichkeitsdichte zu fordern wäre. Bei den Ebene-Welle-Lösungen (4.30) erhalten wir aus (4.39) mit i ∂t φ Eφ , φ hi p φ h als Teilchendichte und Teilchenstromdichte n
E φφ , m 0 c2
jT
p φφ . m0
(4.42)
4.7 Reinterpretation der Klein-Gordon-Theorie
127
Für Lösungen positiver Energie ist n positiv, für Lösungen negativer Energie dagegen negativ. Da bei freien Teilchen die Lösungen positiver und negativer Energie separieren, wäre das noch tolerierbar. Bei Anwesenheit elektromagnetischer Felder ist jedoch keine Separation mehr möglich. Um das zu erkennen, betrachten wir die Teilchendichte eines stationären Zustand in einem Coulomb-Feld. Mit dem Ansatz φ(x, t)
φ(x) e
i Et /h
(4.43)
folgt aus (4.37) n
E V φ(x) φ (x) . m 0 c2
(4.44)
Zunächst ist festzuhalten, daß auch die ungewohnte Definition (4.37) eine stationäre Dichte liefert. Beschreibt diese zum Beispiel ein positiv geladenes Teilchen im Feld eines positiv geladenen Kerns, so ist V positiv. Bei positiver Teilchenenergie wird dann n<0
für
V > E,
n>0
für
V < E,
d. h. nahe dem Kern, und
d. h. weiter weg vom Kern. Dieser Befund kann auf keine Weise mit einer Ein-TeilchenTheorie in Einklang gebracht werden. Schon die Existenz von Lösungen negativer Energie hat uns dazu geführt, das EinTeilchen-Konzept aufzugeben. Wir sollten daher gar nicht versuchen, n als Wahrscheinlichkeitsdichte für ein Teilchen zu aufzufassen. Stattdessen führen wir die Größen λ qn,
j
q jT
(4.45)
als elektrische Ladungs- und Stromdichte ein. Aus (4.34) folgt dann sofort der Ladungserhaltungssatz ∂t λ div j 0 . (4.46) Das Auftreten positiver und negativer Ladungen, das sich aus (4.44) und (4.45a) im Feld eines Kerns ergibt, kann im Rahmen einer Mehrteilchentheorie ganz zwanglos gedeutet werden: Die stationäre Lösung sieht so aus, daß sich nahe dem Kern überwiegend Teilchen negativer und fern dem Kern überwiegend Teilchen positiver Ladung aufhalten. Die Wellenlösungen für freie Teilchen lassen sich nach unserer Reinterpretation so deuten, daß die durch sie beschriebenen Teilchen bei negativer Energie die entgegengesetzte Ladung wie bei positiver Energie tragen. Für freie Teilchen folgt aus (4.42) und (4.45a) mit (4.28) λ()
mq Ec2 φφ mq Ecp2 φφ
0
0
,
(4.47)
wobei sich der obere Index (() oder ( )) auf Lösungen positiver bzw. negativer Energie bezieht. Es ist zweckmäßig, q>0 zu setzen, weil sich damit folgende Zuordnung ergibt: Positives E bedeutet positive und negatives E negative Teilchenladung.
128
4 Klein-Gordon-Theorie
Wegen des Erhaltungssatzes für die Ladung kann die Gesamtladung normiert werden. Wie bei der Dirac-Theorie läßt sich erwarten, daß die Klein-Gordon-SchrödingerGleichung unter gewissen eingeschränkten Bedingungen eine einigermaßen brauchbare Ein-Teilchen-Theorie zuläßt. In diesem Fall ist λ() d 3x q n () d 3x q bzw. 2 (4.47) m 0 c () 3 oder φ () φ () d 3x (4.48) n dx 1 Ep zu fordern. In der Spinorformulierung bedeutet dies mit (4.40) ( ) Ψ σ3 Ψ () d 3x 1 .
(4.49)
Durch die obige Uminterpretation erhält auch das Ergebnis (4.28) eine andere Bedeutung: E Ep ist als Parameter aufzufassen, der gemäß (4.43) das Zeitverhalten von φ bestimmt, jedoch nicht mehr als physikalische Energie. In der im nächsten Teil des Buches behandelten Quantenfeldtheorie des Klein-Gordon-Schrödinger-Feldes erhalten wir als Mittelwert der physikalischen Energie Gleichung (7.60), H Ψ () σ3 H Ψ () d 3x . In Eigenzuständen von H ist der Mittelwert gleich dem Eigenwert. Mit (4.27) und (4.28) ergibt sich daher () (4.49) ( ) 3 E phys H Ψ σ3 H Ψ d x Ep Ψ () σ3 Ψ () d 3x Ep > 0 . Die physikalische Energie ist also immer positiv, auch dann, wenn der Zeitentwicklungsparameter E negativ wird. Das zu Beginn des Abschnitts 4.6 besprochene Problem der Klein-Gordon-Schrödinger-Theorie, daß der Übergang zu negativen Energien nicht wie bei der Dirac-Theorie durch deren Besetzung mit Teilchen verhindert werden kann, wird mithin durch unsere Reinterpretation behoben. Bei der Dirac-Theorie gab es keine vergleichbare Reinterpretation der Zustände negativer Energie, und daher steht zu erwarten, daß bei dieser auch die Feldtheorie zu Zuständen positiver und negativer Energie führen wird. Diese Vermutung wird sich in Abschn. 7.4.4 als richtig erweisen. Weil φC φ aus einer Lösung eines Ladungsvorzeichens eine Lösung des anderen Vorzeichens macht, kann die Klein-Gordon-Schrödinger-Gleichung (4.5) für reelle φ φ auch ungeladene Teilchen beschreiben. Real- und Imaginärteil müssen jeweils für sich die Gleichung erfüllen, daher folgt in diesem Fall 2q h Aα ∂α φ
0.
Diese Gleichung hat entweder die – nicht weiter interessierende – triviale Lösung φ const, oder aber es muß q 0 gelten. Im dem uns hier interessierenden zweiten Fall reduziert sich (4.5) auf die Gleichung (4.6) für freie Teilchen. Aus (4.45) folgt
4.8 Ladungskonjugation und CPT-Symmetrie
129
mit q 0 sinnvollerweise λ 0 und j 0. Aus den Definitionsgleichungen (4.39) für die Teilchendichte und den Teilchenstrom folgt jedoch mit φ φ auch n 0 und jT 0, d. h. diese Definitionen sind für ungeladene Teilchen nicht brauchbar. Eine brauchbare Teilchendichte wäre z. B. n Ψ Ψ ϕϕ χχ . Für reelle φ folgt aus (4.16) χ ϕ , was zu h 2 (4.16) 1 φ 2 2 (∂t φ)2 n 2ϕϕ 2 m 0 c4 führt. Für diese Dichte gilt allerdings kein Erhaltungssatz, vielmehr ist ∂t n
∂t φ
h 2 φ 2 ∂t t φ m 0 c4
2 h (∂t2φ)φ , 2
(4.6)
m0c
und die rechte Seite läßt sich nicht in eine Divergenz umformen. Zum Schluß dieses Abschnitts gehen wir der Frage nach, welche Teilchen durch die Klein-Gordon-Schrödinger-Gleichung beschrieben werden. Wie schon festgestellt wurde, muß es sich um Spin-0-Teilchen endlicher Masse handeln. Stabile Teilchen mit diesen Eigenschaften sind nicht bekannt. Relativ langlebige Teilchen mit diesen Eigenschaften sind das π -, das π - und das π 0 -Meson. Das π - und das π -Meson tragen entgegengesetzte Ladung und sind Teilchen und Antiteilchen. Das π 0 -Meson ist sein eigenes Antiteilchen.
4.8
Ladungskonjugation und CPT-Symmetrie
Die zu φ konjugiert-komplexe Wellenfunktion φC beschreibt ein Teilchen der umgekehrten Ladung wie φ. Am Beispiel der freien Wellenlösung (4.30) erkennen wir, daß das durch φC φ φ0 ei ( px Et )/h beschriebene Antiteilchen auch umgekehrten Impuls und eine Energie umgekehrten Vorzeichens besitzt wie das durch φ beschriebene Teilchen. Die Situation ist also völlig analog zum Fall der Dirac-Gleichung (siehe (2.239) und (2.242)). Es ist nützlich, die Transformation der Ladungskonjugation auf die Spinordarstellung zu übertragen. Aus den Gleichungen (4.16)–(4.17) ergibt sich mit φC φ ϕC χC
12
φC
1 φC 2
mihc2 ∂t φC 12 0
ih ∂t φC m 0 c2
oder ΨC
12
ϕ χ ϕ χ χ , ϕ χ ϕ χ ϕ
χ σ1 Ψ . ϕ
(4.50)
130
4 Klein-Gordon-Theorie
Aus (4.40b) folgt, wie zu erwarten, nC
(Q7.43) (Q7.47)
ΨC σ3 ΨC
(4.50)
(Ψ ) σ3 Ψ
(Ψ ) σ1 σ3 σ1 Ψ
(Q7.39c)
(Q7.43)
(Ψ σ3 Ψ )
n
(Ψ ) σ1 σ1 σ3 Ψ
n.
Kombiniert man die Transformation der Ladungskonjugation mit der Raumspiegelung am Koordinatenursprung und der Zeitumkehr, so erhält man mit ∂ α ∂ α und Aα Aα (wie bei der Dirac-Gleichung) aus (4.31) die Gleichung
h α ∂ q Aα i
h ∂α i
q A α φC
m 02 c2φC .
Diese Gleichung ist identisch mit der Klein-Gordon-Schrödinger-Gleichung für φ, was bedeutet: Ein Teilchen, das am Ursprung gespiegelt zeitlich rückwärts läuft, ist nicht zu unterscheiden von einem Teilchen umgekehrter Ladung, das räumlich ungespiegelt in der Zeit vorwärts läuft.
Aufgaben 4.1
Die Ableitung der Klein-Gordon-Schrödinger-Gleichung ist auch möglich, indem man einen allgemeinen Ansatz für eine lineare partielle Differentialgleichung zweiter Ordnung mit zunächst offengelassenen Koeffizienten wählt und diese über das Korrespondenzprinzip bestimmt.
4.2
Beweisen Sie in relativistischer Notation, daß jede Komponente eines die Dirac-Gleichung freier Teilchen erfüllenden Dirac-Spinors auch der KleinGordon-Schrödinger-Gleichung genügt. (Der Beweis wird viel einfacher als in Abschn. 2.6.)
4.3
Welche Differentialgleichung zweiter Ordnung anstelle der Klein-GordonSchrödinger-Gleichung erfüllen die Komponenten eines Dirac-Spinors bei Anwesenheit elektromagnetischer Felder ?
4.4
Leiten Sie den nicht-relativistischen Grenzfall der Klein-Gordon-SchrödingerGleichung für negative Energien ab.
4.5
Bestimmen Sie die Schrödinger-Darstellung der Klein-Gordon-SchrödingerGleichung mit elektromagnetischem Feld Aα Φ/c, A. Anleitung: Führen Sie die Felder über die minimale Kopplung in die SpinorGleichung ein und zeigen Sie, daß daraus die skalare Klein-Gordon-SchrödingerGleichung für Teilchen in elektromagnetischen Feldern folgt.
4.6
Zeigen Sie, daß jeder Lösungsspinor Ψ der Schrödinger-Form i h ∂t Ψ H Ψ der Klein-Gordon-Schrödinger-Gleichung diese auch in ihrer ursprünglichen Form erfüllt.
Aufgaben
4.7
131
Zeigen Sie, daß die Stromdichte jα
ih q φ ∂α φ φ∂α φ Aα φφ 2m 0 m0
im quasiklassischen Grenzfall – auch relativistisch – mit der Stromdichte jα φφ Uα übereinstimmt. Besteht diese Übereinstimmung auch im Quantenregime? Anleitung: Setzen Sie für den quasiklassischen Grenzfall φ A eiS/h an. 4.8
4.9
Leiten Sie eine Formel für d L /dt ab, wenn L durch Ψ σ3 LΨ L d 3x definiert wird. Setzen Sie insbesondere L x und bestimmen Sie den Geschwindigkeitsoperator Ú aus der Definitionsgleichung Ú d x /dt. ϕ L sei ein Operator im Raum der Klein-Gordon-Spinoren Ψ χ . 1. Welche Bedingung muß L erfüllen, damit der durch Ψ σ3 LΨ L d 3x definierte verallgemeinerte Mittelwert reell ist? (Beweis!) 2. Wird diese Bedingung vom Hamilton-Operator p 2 2 H i σ2 σ3 m 0 c σ3 2m 0 des kräftefreien Falls erfüllt? 3. In der Literatur findet sich die Behauptung, der Operator ih ∂t erfülle diese Bedingung. Ist das richtig? Gehen Sie zur Diskussion dieser Frage zur Definition des adjungierten Operators zurück.
Lösungen 4.2
Wird auf die Dirac-Gleichung für freie Teilchen, (h/i)γ α ∂α ψ m 0 c ψ 0 , der Operator γ β (h/i) ∂β angewandt, so folgt mit γ β γ α ∂β ∂α h
2γ β γ α ∂ ∂ ψ β α
m 0 cγ β (h/i)∂β ψ
α β α β 1 α β β α γ γ ∂α ∂β (γ γ γ γ )∂α ∂β 2 h 2 γ α , γ β ∂ ∂ ψ α β 2
m 02 c2 ψ (2.204) 2 αβ ∂ ∂ ψ m 2 c2 ψ h 2 ψ m 2 c2 ψ 0 . h g α β 0 0
(Im zweiten Schritt wurde die Vertauschbarkeit der Ableitungen ∂α und ∂β benutzt.) 4.3
Läßt man auf die Dirac-Gleichung h γ α ∂α i
q Aα ψ
m0c ψ
0
132
4 Klein-Gordon-Theorie den Operator γ β (h/i)∂β q A β einwirken, so ergibt sich unter erneuter Benutzung der Dirac-Gleichung für den letzten Term der linken Seite γ β γ α L βα m 20 c2 ψ i hqγ β γ α ∂β A α ψ mit L βα h 2 ∂α ∂β i hq(A α ∂β A β ∂α ) q 2 A α A β L αβ . Unter Benutzung von γ α γ β L αβ γ β γ α ∂β A α
1 α β (2.204) γ γ γ β γ α L αβ g αβ L αβ , γ β γ α L βα γ β γ α L αβ 2 γ α γ β ∂α A β γ α , γ β γ β γ α ∂α A β
∂ β Aβ 0 β α ∂ A 2g αβ ∂α A β γ β γ α ∂α A β γ γ α β α β 1 α β 1 β α ∂β A α ∂α A β ∂α A β ∂β A α γ γ γ γ 2 2 ergibt sich die Differentialgleichung
Gψ
i hq α β ∂α A β ∂β A α γ γ 2
mit G h 2 2 ih q A α ∂α q 2A αA α m 02 c2 . Nun ist γ α γ β ∂α A β ∂β A α γ 0 γ l (∂0 Al ) (∂l A 0 ) γ l γ 0 (∂l A 0 ) (∂0 Al ) γ l γ m (∂l A m ) (∂m Al ) l,m zykl l,m antizykl
2γ 0 γ l (∂0 Al ) (∂l A 0 ) 2
γ l γ m (∂l A m ) (∂m Al )
l,m zykl (2.206) 2
c
« (∂t A Φ)
2 n Σ (rot A)n i n
2
« E c
i ¦B ,
wobei zuletzt E ∂t AΦ und B rot A benutzt wurde. Damit ergibt sich schließlich die Gleichung « E ¦ B . Gψ hq i c 4.6
Läßt man auf die Gleichung (ih ∂t H )Ψ 0 den Operator (ih ∂t H ) einwirken, so ergibt sich (h 2 ∂t t H 2 )Ψ 0 . Mit (4.21) 1 1 1 1 0 0 , (i σ2 σ3 )(i σ2 σ3 ) 1 1 1 1 0 0 σ2 σ3 σ3 σ2 0 und σ32 1 folgt aus (4.22b) H 2
(i σ2
σ3 )σ3 σ3 (i σ2 σ3 )
Damit ergibt sich schließlich h2
1 ∂t t c2
h 2 c2 2
Ψ
m 20 c4 σ32
m 20 c2 Ψ
0.
h
2 c2 m 2 c4 . 0
II
Quantenfeldtheorie
5
Einleitung zur Quantenfeldtheorie
In der gewöhnlichen Quantenmechanik mußten wichtige Ingredienzien wie die Normierung der Wellenfunktion auf eins oder ganze Zahlen n>1 und das Spin-StatistikTheorem als nicht aus der Theorie ableitbare Postulate eingeführt werden. Die relativistische Quantenmechanik wiederum erwies sich verschiedentlich unbrauchbar als Theorie für Systeme fester Teilchenzahl. Dies und anderes weist auf die Notwendigkeit eines Überbaus beider Theorien hin, und einen solchen liefert die Quantenfeldtheorie. Im Grunde markiert schon A. Einsteins Lichtquantenhypothese aus dem Jahr 1905 den Beginn einer Quantenfeldtheorie, der Quantentheorie des elektromagnetischen Feldes. (Es sei daran erinnert, daß Planck seine Quantenhypothese auf den Energieaustausch zwischen den atomaren Oszillatoren in den Wänden eines Strahlungshohlraums und der Hohlraumstrahlung beschränkte.) Allerdings war das zu einer Zeit, in der die Quantenmechanik noch in den Kinderschuhen steckte und ihre Grundlagen erst nach und nach gelegt bzw. entdeckt wurden. Erst nach ihrer Ausarbeitung durch M. Born, W. Heisenberg sowie P. Jordan einerseits und E. Schrödinger andererseits war die Zeit reif für den Beginn systematischer Arbeiten in Richtung einer Quantenfeldtheorie. 1926 wandten Born, Heisenberg und Jordan die von ihnen entwickelten Methoden der Quantenmechanik auf ein freies Strahlungsfeld an und stellten fest, daß sich dieses wie eine Ansammlung harmonischer Oszillatoren verhält. Schon kurz darauf wurden die gleichen Methoden auf andere Felder wie das zur Beschreibung der Quantendynamik von Punktteilchen benutzte Schrödinger-Feld ψ(x, t) angewandt, erstmals 1927 von Jordan. Weil es sich dabei um die Quantisierung eines selbst zu Quantisierungszwecken eingeführten Feldes handelt, wurde dafür der Begriff zweite Quantisierung eingeführt. (Heute wird dieser überwiegend als unpassend empfunden, beim elektromagnetischen Feld z. B. gibt es keine vorangegangene Quantisierung.) Durch die Quantisierung werden den Feldern Teilchen zugeordnet. Umgekehrt werden die Quanteneigenschaften aller Teilchen durch Felder beschrieben, so daß heute eine Gleichberechtigung zwischen Feldern und Teilchen besteht. Die Ausarbeitung einer allgemein anwendbaren Quantenfeldtheorie zog sich bis etwa 1950 hin, und an ihr waren außer den bereits genannten unter anderen P. Dirac, F. Dyson, E. Fermi, R. Feynman, V. Fock, W. Furry, H. Kramers, R. Oppenheimer, W. Pauli, J. Schwinger, S.-I. Tomanaga, V. Weisskopf, J. Wheeler, E. Wigner und H. Yukawa beteiligt. 1948-50 publizierte Feynman seine Arbeiten über die heute so berühmten Feynman-Diagramme und die Regeln zu ihrer mathematischen Auswertung. Einen gewissen Abschluß erhielt die Theorie 1949 durch eine Arbeit Dysons über Renormierbarkeit, der damit ein erstmals 1929-30 in Arbeiten von Heisenberg und Pauli aufgezeigtes Divergenzproblem einer breit akzeptierten Lösung zuführte und damit die Basis für das Vertrauen in die allgemeine Anwendbarkeit der Quantenfeldtheorie schuf. Die Quantenfeldtheorie vereint in sich drei Theorien, die Quantentheorie, die Feldtheorie und die Spezielle Relativitätstheorie. Sie ist eine unabdingbare Voraussetzung
136
5 Einleitung zur Quantenfeldtheorie
der Elementarteilchentheorie, auch wenn sich möglicherweise einmal herausstellen könnte, daß auch sie eine nur für hinreichend niedrige Energien gültige Näherung an eine noch fundamentalere Theorie wie z. B. die Stringtheorie darstellt. Ihre Methoden haben sich auch in anderen Gebieten wie der Kernphysik, der Physik der kondensierten Materie oder der Astrophysik bewährt. Viele Physiker werden sie in ihrer beruflichen Tätigkeit kaum je benötigen, aber sie ist eine grandiose Errungenschaft des menschlichen Geistes, von der wenigstens die Anfangsgründe zur Allgemeinbildung jedes interessierten Physikers gehören sollten. Ihre prinzipiellen Ideen sind einleuchtend und nicht schwerer zu verstehen als die Grundlagen anderer Gebiete der Physik. Leider sind jedoch viele Rechnungen sehr aufwendig, und oft werden diese aus Platzgründen so verkürzt dargestellt, daß das Nachvollziehen zu einer mühevollen Angelegenheit wird. Die in diesem Buch angebotene Einführung in die Theorie hat nicht das Ziel, demjenigen, der auf dem Gebiet arbeiten will, das gesamte dafür notwendige Rüstzeug bereitzustellen. Vielmehr wird versucht, unter dem Verzicht auf Vollständigkeit den Leser ohne allzugroße Mühen und daher in großer Ausführlichkeit so weit in die Theorie einzuführen, daß er am Ende in der Lage sein sollte, bei Bedarf ausführlichere Spezialwerke studieren zu können. Der Versuch möglichst hoher Verständlichkeit wird also mit dem Preis hochgradiger Unvollständigkeit bezahlt, das Ziel ist ein pädagogisches und kein enzyklopädisches. Wegen dieser Unvollständigkeiten ist am Ende des Buches auch eine kurze Liste weiterführender Literatur angegeben. Das erste Kapitel dieses Buchteils (Kapitel 6) knüpft direkt an die Ausführungen der Abschnitte Q9.1 und Q9.2 über Vielteilchensysteme an. Durch die Einführung von Erzeugungs- und Vernichtungsoperatoren gelingt der Übergang zu einer Darstellung, bei der auch formal nicht mehr zwischen ununterscheidbaren Teilchen unterschieden werden muß. Die dadurch erhaltene Struktur ist schon die der Quantenfeldtheorie. Von den verschiedenen Wegen, auf denen man zu einer systematischen Quantenfeldtheorie gelangen kann, wird hier nur der Weg der kanonischen Feldquantisierung beschritten, der eine direkte Verallgemeinerung des Quantisierungsverfahrens der gewöhnlichen Quantenmechanik darstellt. Zur seiner Vorbereitung werden zuerst ein Lagrangescher und ein Hamiltonscher Formalismus für „klassische Felder“ entwickelt. Dann werden in Analogie zu dem Übergang von den Variablen qi und pi der klassischen Mechanik zu Operatoren qi und p i Feldern wie den Klein-Gordon-Schrödinger-Feldern t) und π(x, t) zugeordnet. Ein φ(x, t) und h 2 ∂t φ(x, t)/(2m 0 c2 ) Feldoperatoren φ(x, zweiter und ebenso wichtiger Weg, der die Feynmansche Pfadintegralmethode benutzt, bleibt ebenso unbesprochen wie mehr intuitive Methoden der Feldquantisierung, die denen von Born, Heisenberg und Jordan ähneln. Die Methode der kanonischen Feldquantisierung wird zunächst auf freie Felder angewandt. Anschließend werden Wechselwirkungsprozesse untersucht, wobei die in Abschn. Q8.4 entwickelten Methoden der Störungsrechnung im Wechselwirkungsbild zum Einsatz kommen. Ein wichtiges Phänomen ist dabei das Auftreten von Divergenzen. Diese können jedoch durch eine Renormierung beseitigt werden, bei der physikalische Parameter so umdefiniert werden, daß am Schluß nur endliche Größen übrig bleiben. Auch hier können nur die Anfangsgründe besprochen werden. Da im nächsten Teil des Buches eine kurze Einführung in die Elementarteilchentheorie folgt, konzentrieren sich die Anwendungen in diesem Teil im wesentlichen auf die Quantenelektrodynamik.
6
Fock-Darstellung von Viel-Teilchen-Zuständen
Die Konstruktion vollständig symmetrischer bzw. vollständig antisymmetrischer Zustände durch Superposition von Viel-Teilchen-Zuständen, bei denen formal zwischen – an sich ununterscheidbaren – identischen Teilchen unterschieden wird, ist einerseits konzeptionell unbefriedigend und andererseits auch umständlich. Es gibt jedoch auch eine Darstellung ohne dieses Manko. Bei dieser wird das System identischer Teilchen nicht mehr durch Permutationen konkreter, aus Ein-Teilchen-Zuständen aufgebauter Viel-Teilchen-Zustände beschrieben, sondern es wird nur noch angegeben, mit wievielen Teilchen jeder mögliche Ein-Teilchen-Zustand besetzt ist. Es wird sich zeigen, daß die derart charakterisierten Zustände durch die sukzessive Einwirkung von Erzeugungsoperatoren auf einen Vakuumzustand erzeugt werden können. Wir beschränken unsere Beschäftigung mit dieser Darstellung zunächst auf den Fall, daß die Ein-TeilchenZustände der betrachteten identischen Teilchen vollständig durch die Eigenzustände eines Operators mit diskretem Spektrum beschrieben werden können. Wie die dabei erzielten Ergebnisse auf den Fall eines kontinuierlichen Spektrums übertragen werden können, ist evident und wird bei der Einführung von Feldoperatoren demonstriert.
6.1
Darstellung von N-Teilchen-Zuständen
Wir gehen in diesem Abschnitt von den in Abschn. Q9.2.5 eingeführten Basiszuständen α1 . . . ζ N zu einer neuen Darstellung, der Besetzungsdarstellung oder FockDarstellung mit den Basisvektoren N n 1 , n 2 , . . . über. Die durch ein Semikolon abgetrennte erste Zahl N gibt die Gesamtteilchenzahl des Zustands an. An diese anschließend kommt für jeden der nach einem festgelegten Schema angeordneten Ein-Teilchen-Zustände der Reihe nach ein fester Platz; die dem κ-ten Zustand zugeordnete Besetzungszahl n κ gibt an, wieviele Teilchen sich in diesem befinden. Das Subskript oder indiziert wie bisher, ob es sich um einen vollständig symmetrischen oder antisymmetrischen Zustand handelt. Bei Bosonen besteht für die auf eins normierten Zustände neuer Schreibweise der Zusammenhang N 1 (Q9.68) N n 1 , n 2 , . . . α1 . . . ζ N 8 Pρ α1 β2 . . . ζ N (6.1) N κ n κ ρ 1
138
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Teilchennummer Zustandsnummer Besetzungszahl
i κ nκ
1 0
1 2 1
2 3 1
4 0
3 6 1
5 0
7 0
4 8 1
9 0
5 10 1
... ... ...
Tabelle 6.1: Beispiel einer geordneten Besetzung des Basiszustands bei Fermionen.
mit den Ein-Teilchen-Zuständen ακ . Auf der linken Seite können die Zahlen n κ beliebige Werte zwischen 0 und N annehmen und müssen nur κ n κ N erfüllen.1 Auf der rechten Seite treten nur besetzte Ein-Teilchen-Zustände auf. Weil in N n 1 , n 2 , . . . der κ-te Zustand von n κ Teilchen angenommen wird, κ 1, 2, . . . , befinden sich in dem Produktzustand α1 β2 . . . ζ N für jedes n κ 2 jeweils n κ gleiche Ein-Teilchen-Zustände, die gleichzeitig von verschiedenen Teilchen angenommen werden. Die Zuordnung der Teilchennummern i zu den in der neuen Notierung mit Nummern κ versehenen Zuständen im Basiszustand α1 β2 . . . ζ N , aus dem die permutierten Zustände Pρ α1 β2 . . . ζ N hervorgehen, kann willkürlich gewählt werden, beispielsweise kann der von Teilchen 1 besetzte Zustand α in der für N n 1 , n 2 , . . . gewählten Reihenfolge der Zustände an beliebiger Stelle stehen. Bei Fermionen besteht der Zusammenhang N n 1 , n 2 , . . .
α1 . . . ζ N
(Q9.68)
N
1
N
ρ 1
( 1) p(ρ) Pρ α1 β2 . . . ζ N (6.2)
mit den Ein-Teilchen-Zuständen ακ . Durch das Pauli-Verbot ist n κ auf die Werte 0 oder 1 eingeschränkt, alle Zustände sind entweder unbesetzt oder nur einfach besetzt, und wieder muß κ n κ N gelten. Auf der rechten Seite treten wieder nur besetzte Ein-Teilchen-Zustände auf, jeder allerdings nur einmal. Bei den Fermionen erweist sich eine festgelegte Zuordnung i i (κ) der Teilchennummern i zu den Zustandsnummern κ im Basiszustand α1 β2 . . . ζ N als nützlich. Diese wird so gewählt, daß Teilchen 1 in der für N n 1 , n 2 , . . . festgelegten Reihenfolge der Zustände den ersten, Teilchen 2 den zweiten besetzten Zustand einnimmt usw. Weil es im allgemeinen mehr Zustände als Teilchen gibt und daher immer einige Zustände unbesetzt bleiben, ist die Zustandsnummer im Basiszustand mindestens gleich der Teilchennummer. (Tabelle 6.1 gibt dafür ein Beispiel.) Der Zusammenhang zwischen der Teilchennummer i und Zustandsnummer κ ist für das angegebene Ordnungsschema i (κ)
κ
nλ .
(6.3)
λ 1
Der Hilbert-Raum N der N-Teilchen-Besetzungszustände ist gegenüber dem von den Basiszuständen α1 . . . ζ N aufgespannten Hilbert-Raum sowohl für Bosonen als 1 In den Zuständen α1 β2 . . . ζ N werden für allgemeine Teilchennummern lateinische Buchstaben, z. B. i und j, benutzt. Zur besseren Unterscheidung zwischen Teilchen- und Zustandsnummern werden im folgenden für allgemeine Zustandsnummern griechische Indizes benutzt, z. B. n κ und n λ für die Besetzungszahlen des κ-ten bzw. λ-ten Zustands.
6.2 Erzeugungs- und Vernichtungsoperatoren für Bosonen
139
auch Fermionen dahingehend erweitert, daß auch Zustände zugelassen werden, in denen Ein-Teilchen-Zustände unbesetzt bleiben. Im Zustand 0, dem einzigen Zustand des Raums 0 , sind alle Ein-Teilchen-Zustände unbesetzt. Sowohl bei Bosonen als auch bei Fermionen sind zwei Zustände genau dann gleich, wenn sie in allen Besetzungszahlen übereinstimmen. Die Wirkung von Operatoren auf die Zustände N n 1 , n 2 , . . . läßt sich am besten mit Hilfe einer Kombination von Erzeugungs- und Vernichtungsoperatoren darstellen, deren separate Einwirkung die Gesamtteilchenzahl N um eins erhöht bzw. erniedrigt (Abschn. 6.2, 6.3 und 6.5). Es ist daher nützlich, auch einen Hilbert-Raum 9
N
N 0
zuzulassen, der die Zustände aller N-Teilchen-Hilberträume inklusive den Vakuumzustand 0 0 0, 0, . . . , 0 (6.4) enthält. In wird ein Skalarprodukt erklärt, das den üblichen Linearitätseigenschaften genügt. Die Basiszustände (6.1) bzw. (6.2) sollen die Orthonormalitätsrelationen + (6.5) N n1 , . . . N n1 , . . . δ N N δnκ nκ ¼
¼
κ
erfüllen, womit auch das bisher nicht erklärte Skalarprodukt zweier Zustände mit verschiedener Gesamtteilchenzahl (N N ) zu null erklärt wird. Auch der Vakuumzustand ist auf eins normiert, 0 0 1 . (6.6) Die Übertragung der Vollständigkeitsrelationen (Q9.66) auf die jetzige Notation ergibt die für den N gültige Vollständigkeitsrelation N n 1 , . . . N n 1 , . . . 1 . (6.7)
n 1 ,n 2 ,... nκ N
Für N 0 folgt hieraus insbesondere 00
6.2
1.
(6.8)
Erzeugungs- und Vernichtungsoperatoren für Bosonen
Für Bosonen definieren wir jetzt einen Erzeugungsoperator b κ , der einem vorerst noch offen gelassenen Operator bκ adjungiert ist. bκ soll jedem vollständig symmetrischen N-Teilchen-Basiszustand N . . . , n κ , . . . durch die Festlegung bκ N . . . , n κ , . . .
n κ 1 N 1 . . . , n κ 1, . . .
(6.9)
140
6 Fock-Darstellung von Viel-Teilchen-Zuständen
einen vollständig symmetrischen (N 1)-Teilchen-Zustand zuordnen, bei dem sich im κ-ten Zustand ein Teilchen mehr befindet. (Die Erklärung für den Faktor n κ 1 wird in Abschn. 6.5 gegeben.) Insbesondere soll der Operator bκ den Ein-Teilchen-Zustand 1 0, . . . , 1, . . . aus dem Vakuumzustand 00 0, . . . , 0, . . . erzeugen, bκ 0 b κ 0 0, . . . , 0, . . . 1 0, . . . , 1, . . . .
(Die in (Q4.97) eingeführten Leiteroperatoren L mit den Eigenschaften (Q4.106) erhöhen bzw. erniedrigen den Quantenzustand eines Teilchens um ein Quant und sind den hier bzw. weiter unten eingeführten Erzeugungs- und Vernichtungsoperatoren verwandt – durch L wird sozusagen ein Teilchen in einem Quantenniveau vernichtet und eines in dem darunter bzw. darüber gelegenen erzeugt.) Jeder N-Teilchen-Zustand kann durch sukzessive Anwendung von Erzeugungsoperatoren aus dem Vakuumzustand erzeugt werden, denn es gilt
N . . . , nκ , . . . 1n bκ N 1 . . . , nκ 1, . . . κ
n
1 (bκ )2 N 2 . . . , n κ 2, . . . κ (n κ 1)
...
1n (bκ)n N nκ . . . , 0, . . . κ κ
usw., d. h.
N n 1 , n 2 , . . .
$
+ κ 1,2,... nκ N
% ' 1 n n (bκ ) κ '0 0, 0, . . . . κ
(6.10)
Dadurch, daß das Skalarprodukt in (6.5) auch für Zustände verschiedener Gesamtteilchenzahl N erklärt wurde, erhalten wir die Möglichkeit, den zu bκ adjungierten Operator bκ zu berechnen. Aus der üblichen Definition b κ N . . . , N . . . N . . . , bκ N ergibt sich
N . . . , n κ , . . . bκ N . . . , nκ , . . . bκ N . . . , n κ , . . . , N . . . , nκ , . . .
(6.9)
n κ 1 N 1 . . . , n κ 1, . . . N . . . , nκ , . . . (6.5) nκ 1 δ N 1,N δn1 ,n1 . . . δnκ 1,nκ . . . nκ δ N,N 1 δn1 ,n1 . . . δnκ ,nκ 1 . . .
(6.5)
nκ N . . . , n κ , . . . N 1 . . . , nκ 1, . . . ,
wobei δκλ δκ 1,λ1 und zuletzt die Orthonormalitätsrelation (6.5) (von rechts nach links gelesen) benutzt wurde. Die abgeleitete Gleichung gilt für sämtliche Basiszu-
6.2 Erzeugungs- und Vernichtungsoperatoren für Bosonen
141
N . . . , n κ , . . . und kann nur zutreffen, wenn
stände
bκ N . . . , n κ , . . .
n κ N 1 . . . , n κ 1, . . .
(6.11)
gilt. (Die gestrichenen Größen, für die sie abgeleitet wurde, haben wir dabei in ungestrichene umbenannt.) Die Wirkung des Operators bκ auf einen Zustand N . . . , n κ , . . . besteht also darin, daß im κ-ten Ein-Teilchen-Zustand ein Teilchen weggenommen wird – daher der Name Vernichtungsoperator. Aus (6.11) folgt insbesondere bκ N . . . , 0, . . . 0 ,
bκ 0 0 .
Die Erzeugungs- und Vernichtungsoperatoren erfüllen die Vertauschungsrelationen b κ , b λ b κ
, bλ 0 ,
b κ , b λ δκλ .
(6.12)
Beweis: (6.12a,b) folgt aus der Gültigkeit der Relationen bκ bλ N . . . , n κ , . . . , n λ , . . .
n κ n λ N 2 . . . , n κ 1, . . . , n λ 1, . . .
bλ bκ N . . . , n κ , . . . , n λ , . . .
und bκ bλ N . . . , n κ , . . . , n λ , . . .
(n κ 1)(n λ 1) N 2 . . . , n κ 1, . . . , n λ 1, . . .
bλ bκ N . . . , n κ , . . . , n λ , . . .
für sämtliche Basiszustände. (6.12c) folgt aus bκ bλ N . . . , n κ , . . . , n λ , . . .
n κ (n λ 1) N . . . , n κ 1, . . . , n λ 1, . . .
bλ bκ N . . . , n κ , . . . , n λ , . . .
(6.13)
für κ λ sowie bκ bκ N . . . , n κ , . . .
bκ n κ 1 N 1 . . . , n κ 1, . . .
(n κ 1) N . . . , n κ , . . .
und bκ bκ N . . . , n κ , . . .
bκ
n κ N 1 . . . , n κ 1, . . .
n κ N . . . , n κ , . . . (6.14)
mit der Folge (bκ bκ
bκ bκ ) N . . . , n κ , . . .
für alle Zustände N . . . , n κ , . . . .
(n κ 1n κ ) N . . . , n κ , . . .
N . . . , n κ , . . .
142
6.3
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Erzeugungs- und Vernichtungsoperatoren für Fermionen
Für Fermionen definieren wir einen Erzeugungsoperator a κ durch die Forderung a κ N . . . , n κ , . . .
(1) Nκ δnκ ,0 N 1 . . . , n κ 1, . . .
mit Nκ
nλ .
(6.15)
(6.16)
λ<κ
Der Faktor δnκ ,0 erlaubt für a κ N . . . , n κ , . . . gemäß dem Pauli-Verbot im κ-ten EinTeilchen-Zustand nur einfache Besetzung, die Anwendung von a κ auf einen im κ-ten Ein-Teilchen-Zustand schon besetzten Viel-Teilchen-Zustand liefert null, a κ N . . . , n κ 1, . . .
0.
Man beachte, daß dies nicht mit einer Erzeugung des Vakuumzustands verwechselt werden darf, die erneute Anwendung von a κ liefert a κ a κ N . . . , n κ 1, . . . a κ 00 , während a κ 0 1 0, . . . , n κ 1, . . . wäre. Infolgedessen gilt für jeden beliebigen Zustand N . . . , n κ , . . . 2 a κ N . . . , n κ , . . . 0 , woraus 2 a κ 0 (6.17) folgt. Der Faktor ( 1) Nκ auf der rechten Seite von (6.15) ist eine nützliche Konvention, die mit der Darstellung antisymmetrischer Zustände durch Slater-Determinanten bzw. durch (6.2) zu tun hat und wie folgt verstanden werden kann: Wird für den Fermionenzustand N n 1 , n 2 , . . . die Darstellung (6.2) mit der dort gewählten und in Tabelle 6.1 illustrierten Zuordnung zwischen Teilchen- und Zustandsnummern des Basiszustands α1 β2 . . . ζ N benutzt, so definiert man die Wirkung des Erzeugungsoperators a κ auf diese durch N 1 a κ (1) p(ρ) Pρ α1 β2 ζ N (6.18) N ρ 1 (N 1) 1 (1) p(ρ) Pρ κ1 α2 β3 ζ N 1 . (N 1) ρ 1
Der durch a κ erzeugte Ein-Teilchen-Zustand wird also mit Teilchen 1 besetzt, und um das zu ermöglichen, werden die Platzziffern der bereits vorhandenen Teilchen um eins heraufgesetzt. Damit der neue Viel-Teilchen-Zustand in der Besetzungsdarstellung ausgedrückt werden kann, muß κ1 α2 β3 ζ N 1 gemäß dem für die Darstellung (6.2) benutzten Ordnungsschema angeordnet werden. Hierzu wird der Ein-Teilchen-Zustand κ in κ1 α2 β3 ζ N 1 durch sukzessive Zwei-TeilchenVertauschungen so lange nach rechts geschoben, bis er an seinen richtigen Platz i (κ)
6.3 Erzeugungs- und Vernichtungsoperatoren für Fermionen
143
gelangt ist. Weil hierzu i (κ) 1 Zwei-Teilchen-Vertauschungen notwendig sind, gilt mit i (κ) 1 κλ 1 n λ 1 λ<κ n λ Nκ nach (6.3) und (6.16) (der vorletzte Schritt folgt aus n κ 1) ( 1) p(ρ) Pρ κ1 α2 β3 ζ N
1
(
1) p(ρ)
Nκ
Pρ α1 β2 κi ζ N
1
.
Hiermit folgt aus der Definition (6.18) a κ
1
N
N ρ 1
( 1) p(ρ) Pρ α1 β2 ζ N
((N1) 1) Nκ
(N 1) ρ 1
( 1) p(ρ) Pρ α1 β2 κi ζ N
1
,
was mit (6.2) schließlich zu (6.15) führt. Auch bei Fermionen läßt sich jeder Zustand durch sukzessive Einwirkung von Erzeugungsoperatoren auf den Vakuumzustand darstellen: Aus (6.15) folgt
N . . . , 1, . . . ( und
N n1 , n2 , . . .
$
1) Nκ a κ N 1 . . . , 0, . . . % + ' Nκ ( 1) a '0 0, 0, . . . . κ
(6.19)
κ 1,2,... nκ N
Der zu a κ adjungierte Operator a κ ist wieder ein Vernichtungsoperator: Zunächst gilt N
. . . , n , . . . a N . . . , n , . . . a N
. . . , n , . . . , N . . . , n , . . .
κ κ κ κ κ κ
(6.5) s.u. (6.5)
(6.15)
( 1) Nκ δnκ ,0 N 1 . . . , n κ 1, . . . N , . . . , n κ , . . . ( 1) Nκ δnκ ,0 δ N
1,N δn 1 ,n 1
. . . δn κ
1,n κ
...
( 1)nκ δnκ ,1 δ N,N 1 δn1 ,n1 . . . δnκ ,nκ 1 . . .
( 1)nκ δnκ ,1 N . . . , n κ , . . . N 1 . . . , n κ 1, . . . , wobei für den Ausdruck in der vorletzten Zeile Nκ Nκ λ<κ nλ und δnκ ,0 δnκ ,1 benutzt wurde. Das gilt, weil dieser wegen der Faktoren δnζ ,nζ für ζ < κ sowie der Faktoren δnκ 1,nκ und δnκ ,0 in der Zeile davor nur für n 1 n1, . . . , n κ 1 n κ 1 und für 0 n κ n κ 1 von null verschieden ist. Unter erneutem Weglassen des Strichs folgt daher a κ N . . . , n κ , . . .
(
1) Nκ δnκ ,1 N 1 . . . , n κ 1, . . . .
(6.20)
Der Faktor δnκ ,1 erlaubt für N . . . , n κ , . . . nur einfach besetzte Zustände κ, und die Anwendung von a κ auf einen an der κ-ten Stelle unbesetzten Zustand liefert null, a κ N . . . , n κ 0, . . .
0.
144
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Generell gilt a κ2 N . . . , n κ , . . . mit der Folge
0 für jeden beliebigen Zustand N . . . , n κ , . . . a κ2
0.
(6.21)
Für die Erzeugungs- und Vernichtungsoperatoren gelten die Vertauschungsrelationen a , a λ
a , a λ
κ
κ
0,
a , a λ
κ
δκλ ,
(6.22)
wobei die Definition
L, M
LM
ML
(6.23)
für Antikommutatoren L, M eingeführt wurde. Beweis: Für κ λ folgen die Vertauschungsrelationen (6.22a,b) unmittelbar aus (6.17) und (6.21). Sei daher λ > κ. Dann ist aκ aλ N .., n κ , .., n λ , .. (1) Nκ (1) Nλ δn κ ,0 δn λ ,0 N 2 .., n κ 1, .., n λ 1, .. mit Nκ n μ , Nλ n μ und μ<κ
μ<λ
aλ aκ N .., n κ , .., n λ , ..
¼
(1) Nλ (1) Nκ δn κ ,0 δn λ ,0 N 2 .., n κ 1, .., n λ 1, ..
s.u.
aκ
aλ N .., n κ , .., n λ , ..
mit Nκ wie oben und Nλ Nλ 1, weil n κ vor der Einwirkung von aλ um 1 erhöht wurde. Hieraus folgt (6.22b). Der Beweis von (6.22a) und der Beweis für λ<κ verlaufen ähnlich. Zum Beweis von (6.22c) berechnen wir zunächst aκ aκ N .., n κ , ..
(6.20)
aκ (1) Nκ δn κ ,1 N 1 .., n κ 1, ..
(6.15)
(1)2Nκ δn κ ,1 N .., n κ , ..
(6.24)
δn κ ,1 N .., n κ , ..
und aκ aκ N .., n κ , ..
aκ (1) Nκ δn κ ,0 N 1 .., n κ 1, ..
(1)2Nκ δn κ ,0 N .., n κ , ..
(6.25)
δn κ ,0 N .., n κ , .. .
Hieraus folgt sowohl für n κ 0 als auch für n κ 1 (aκ aκ d. h. aκ , aκ
1.
aκ aκ ) N .., n κ , ..
N .., n κ , .. ,
Für λ > κ gilt
aκ aλ N .., n κ , .., n λ , ..
(1) Nκ (1) Nλ δn κ ,1 δn λ ,0 N .., n κ 1, .., n λ 1, .. ,
aλ aκ N .., n κ , .., n λ , ..
aλ (1) Nκ δn κ ,1 N 1 .., n κ 1, .., n λ , ..
N N (1) κ (1) λ δn κ ,1 δn λ ,0 N .., n κ 1, .., n λ 1, ..
und damit (aκ aλ Dasselbe ergibt sich für λ<κ.
aλ aκ ) N .., n κ , .., n λ , ..
(6.26)
0.
6.4 Besetzungszahl- und Teilchenzahloperatoren
6.4
145
Besetzungszahl- und Teilchenzahloperatoren
Die Gleichungen (6.14) und (6.24) lassen erkennen, daß die Operatoren n
bκ bκ ,
,κ
n
a κ a κ
,κ
(6.27)
die Zustände N n 1 , n 2 , . . . als Eigenzustände zu den Eigenwerten n κ (im Fall der Fermionen n κ 0 oder n κ 1) besitzen, n ,κ N . . . , n κ , . . .
n κ N . . . , n κ , . . . .
(6.28)
Sie werden daher als Besetzungszahloperatoren bezeichnet, die Operatoren
N mit der Eigenschaft
n ,κ
(6.29)
N N n 1 , n 2 , . . .
(6.30)
κ
N N n 1 , n 2 , . . .
als Teilchenzahloperatoren. Werden die Operatoren a λ und bλ zur Vereinheitlichung in c
,λ
c,λ bλ
a λ ,
(6.31)
umbenannt (Index für Fermionen, + für Bosonen), so gelten die Vertauschungsrelationen n ,κ , c,λ δκλ c,λ , n ,κ , c,λ δκλ c,λ bzw.
wobei
N , c,λ
c,λ ,
N , c,λ
c,λ ,
den Minus-Kommutator bezeichnet.
b z. B. gilt Beweis: Für den Bosonen-Erzeugungsoperator c ,λ λ n ,κ , bλ
und
bκ bκ bλ bλ bκ bκ
N , c ,λ
κ
(6.12b)
n ,κ , c,λ
(6.12c) bκ bκ , bλ bκ δκλ
κ
δκλ c,λ
δκλ bλ
c,λ .
Für den Fermionen-Vernichtungsoperator c ,λ aλ z. B. gilt n ,κ , aλ
(6.22a) aκ aκ , aλ aκ aκ aλ aλ aκ aκ
(6.22c) aλ , aκ aκ
Der Beweis der übrigen Vertauschungsrelationen verläuft analog.
δκλ aλ
.
146
6.5
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Darstellung physikalischer Observablen durch Erzeuger und Vernichter
In der Besetzungszahldarstellung wird selbst gedanklich nicht zwischen gleichartigen Teilchen unterschieden. Bei der Behandlung konkreter Probleme hat man es jedoch mit der Einwirkung von Operatoren auf Zustände zu tun, und hier kennen wir bisher nur Operatoren, die zwischen Teilchen unterscheiden, auch wenn die Ununterscheidbarkeit der Teilchen durch symmetrisierte Linearkombination der spezifischen Teilchenzustände, auf die sie wirken, zum Ausdruck gebracht ist. Mit unserer neuen Darstellung von Zuständen wäre jedoch wenig gewonnen, wenn es nicht gelänge, eine entsprechende Darstellung für Operatoren zu finden, denn wir wüßten z. B. nicht, wie der Operator i p i 2 /(2m) auf einen Zustand N n 1 , n 2 , . . . wirkt. Tatsächlich können die üblichen, Viel-Teilchen-Observablen repräsentierenden Operatoren durch Erzeugungsund Vernichtungsoperatoren dargestellt werden. In dieser Darstellung treten allerdings Koeffizienten auf, die mit Hilfe von Zuständen berechnet werden müssen, die zwischen den Teilchen unterscheiden. Wir werden unsere diesbezügliche Betrachtung auf Operatoren beschränken, die sich wie der Hamilton-Operator H H 1 H 2 V (x1 x2) des Heliumatoms, aus Ein-Teilchen-Operatoren (wie H i p i 2 /(2m)Vi (xi ) beim Heliumatom) und ZweiTeilchen-Operatoren (wie V (x1 x2 )) zusammensetzen, L
N
L i
i 1
1 Lij . 2 i j
Dabei nehmen wir an, daß die Wirkung von L i auf das i -te Teilchen dieselbe ist wie die ) und analog L von L k auf das k-te Teilchen: L i (i j ). i j (i, Wir nehmen uns zuerst Ein-Teilchen-Operatoren L i vor. Im Fall eines Ein Teilchen-Systems ergibt sich für einen beliebigen Ein-Teilchen-Operator L aus der Vollständigkeitsrelation α α α β β β 1 L α α L β β . α,β
Bezeichnen wir den Erzeugungsoperator für den Zustand α mit c,α , so gilt α c,α 0 ,
(6.32)
und aus der Gültigkeit von β γ β , γ c,β 0, γ 0 c,β γ für beliebige Zustände γ folgt β
Hiermit sowie mit (6.32) erhalten wir L c,α 0α L β 0 c,β α,β
0 c,β .
(6.33)
α L β c,α 00 c,β ,
α,β
6.5 Darstellung physikalischer Observablen durch Erzeuger und Vernichter
147
und mit der Vollständigkeitsrelation (6.8) ergibt sich schließlich die Darstellung
L
α,β
α L β c ,α c
,β
.
(6.34)
Ihre Anwendung auf die Zustände 1 n 1, n 2 , . . . ist wohldefiniert, weil die Größen α L β Zahlen sind, die aus den Ein-Teilchen-Zuständen α, β und dem Operator L
berechnet werden können. Im folgenden überzeugen wir uns daß für den aus Ein-Teilchen-Operatoren davon, zusammengesetzten Operator L L i i i (i ) eines Systems identischer Teilchen ebenfalls (6.34) gilt. Beweis: Die Wirkung des Operators L bzw. (6.2) und (1) p(ρ) 1 L N n 1 , n 2 , . . .
N s.u.
s.u.
i 1 N i 1 ξ
N
1 8
N
i 1 (i) auf die Zustände N n 1 , . . .
N λ n λ ρ 1
ξ γ
N
1 8
ist mit (6.1)
(1) p(ρ) Pρ α1 (i)γi ζ N N
n λ ρ 1
(1) p(ρ) Pρ α1 ξi(γ ) ζ N
,
wobei für den Fall der Fermionen n λ 1 (wegen n λ 0 oder 1) und zuletzt die Zerlegung (i)γi
ξ ξ (i)γi
ξ
ξ
ξ γ ξi(γ )
mit
ξ γ
ξ γ
benutzt wurde. Der Index i wurde dabei vom Zustand γ auf den Zustand ξ übertragen, wobei durch die Notation i(γ ) erkennbar gemacht ist, daß sich der letztere am Platz des Zustands γ befindet. Für ξi γi ξ liefert der Ausdruck in runden Klammern wieder den Ausgangszustand Ni n 1 , n 2 , . . . . Das gilt für n ξ verschiedene Indizes i, wenn n ξ die Besetzungszahl des Zustands ξ ist. Da der Koeffizient ξ γ für all diese Indizes den gleichen Wert ξ ξ besitzt, kommt von den Zuständen ξi γi zur Summe über i der Beitrag ξ
n ξ ξ ξ N n 1 , n 2 , . . . .
(6.35)
Den von ξi γi kommenden Beitrag berechnen wir zuerst für Bosonen. In diesem Fall liefert der Klammerausdruck einen neuen Viel-Teilchen-Zustand, bei dem der Zustand γ einmal weniger und mehr besetzt ist. Unter Berücksichtigung der Vorfaktoren – ξ einmal der Zustand es gilt 1/ n ξ n γ (n ξ 1)/n γ / (n ξ 1) (n γ 1) – ist er durch
n ξ 1 N . . . , n γ 1, . . . , n ξ 1, . . . nγ
gegeben. Der gleiche Klammerausdruck und der gleiche Koeffizient ξ γ ergeben sich bei gegebenem ξ γ für alle Zustände γi γi . . . γ , also n γ mal, wenn n γ die Besetzungszahl ¼
148
6 Fock-Darstellung von Viel-Teilchen-Zuständen
des Zustands γ ist. Insgesamt folgt damit zusammen mit dem vorherigen Ergebnis L N n 1 , n 2 , . . .
n ξ ξ ξ
ξ
N n 1 , n 2 , . . .
(6.36)
n γ (n ξ 1) ξ γ N . . . , n γ 1, . . . , n ξ 1, . . . .
γ ,ξ γ ξ
Mit (6.13) und (6.14) läßt sich dieses Ergebnis zu L N n 1 , n 2 , . . . ξ γ bξ bγ N n 1 , n 2 , . . .
(6.37)
γ ,ξ
zusammenfassen. Jetzt berechnen wir den von ξi γi kommenden Beitrag für Fermionen. Hierzu muß der Ein-Teilchen-Zustand ξ in α1 ξi(γ ) ζ N erst durch Zwei-Teilchen-Vertauschungen vom Platz des Zustands γ an seinen richtigen Platz gebracht werden. Unter der Annahme ξ >γ sind hierfür i(ξ )i(γ ) Vertauschungen notwendig, wobei i(ξ ) die mit dem Zustand ξ verbundene Teilchenplatzziffer nach der Verschiebung und i(γ ) die vor der Verschiebung ist. Nach (6.3) handelt es sich demnach um ξ λ 1
nλ
γ
nλ
s.u.
λ 1
λ<ξ
nλ
λ<γ
(6.16)
nλ
Nξ
Nγ
Verschiebungen, wobei im zweiten Schritt benutzt wurde, daß in der ersten Summe n ξ 1 und in der zweiten n γ 1 ist. (Man beachte, daß n γ und n ξ vor und nach der Verschiebung jeweils verschiedene Werte haben: Vorher hat das Teilchen im Zustand ξ die Teilchenplatzziffer des Zustands γ ; dieser wird daher als besetzt behandelt, n γ 1, während der Zustand ξ als unbesetzt behandelt wird, n ξ 0. Nachher ist der Zustand γ unbesetzt und der Zustand ξ besetzt, also n γ 0 und n ξ 1. Hieraus folgt, daß Nξ mit n γ 0 berechnet wird.) Damit und mit n λ 1 ergibt sich für den fraglichen Beitrag zu L N n 1 , . . . , da sich bei Fermionen nur ein Teilchen im Zustand γ befindet, N (1)(Nξ Nγ ) ξ γ (1) p(ρ) Pρ α1 ξi(ξ ) ζ N , N
ξ >γ ρ 1 wobei sich ξ jetzt am richtigen Platz befindet. Nun gilt nach (6.15) und (6.20) a ξ a γ N .., n γ 1, .., n ξ 0, ..
a ξ (1) Nγ N 1 .., n γ 0, .., n ξ 0, .. (1) Nγ Nξ N .., n γ 0, ..n ξ 1, ..
N N Nξ (6.2) (1) γ
N
ρ 1
(1) p(ρ) Pρ α1 ξi(ξ ) ζ N ,
wobei Nξ wie oben mit n γ 0 berechnet wird. (Dieses Ergebnis stimmt trotz des scheinbar unterschiedlichen Vorzeichens mit dem früheren Ergebnis (6.26) überein, weil dort Nκ und Nλ auf den Ausgangszustand N .., n κ , .., n λ , .. bezogen sind, Nλ also mit n κ 1 berechnet wird und daher um 1 größer ist als hier.) Hiermit läßt sich der fragliche Beitrag schließlich in die Form ξ γ (1)2Nγ a ξ a γ N . . . ξ γ a ξ a γ N . . . ξ >γ
ξ >γ
6.5 Darstellung physikalischer Observablen durch Erzeuger und Vernichter
149
bringen, und für ξ <γ erhält man Summanden derselben Form. Die Zusammenfassung dieser Beiträge mit dem auch für Fermionen gültigen Beitrag (6.35) von ξi γi ξ führt mit der aus (6.24) für n ξ 0 oder 1 folgenden Beziehung n ξ N ..., n ξ , .. a ξ a ξ N ..., n ξ , .. schließlich zu L N n 1 , n 2 , . . . ξ γ a ξ a γ N n 1 , n 2 , . . . . (6.38) γ ,ξ
Da (6.37) bzw. (6.38) für alle Zustände des Raums N gilt, können wir daraus für L die Darstellung L ξ γ c (6.39) ,ξ c,γ γ ,ξ
ablesen. (6.39) stimmt wie behauptet mit dem für Ein-Teilchen-Zustände abgeleiteten Ergebnis (6.34) überein.
Die Einwirkung des Operators L auf den Viel-Teilchen-Zustand N n 1 , n 2 , . . . hat von selbst zu Zuständen mit veränderten Besetzungszahlen n κ geführt. Dies liefert die eigentliche Begründung für die Einführung von Erzeugungs- und Vernichtungsoperatoren. Die Wahl der Vorfaktoren in den Definitionsgleichungen (6.9) und (6.11) bzw. (6.15) und (6.20) ist dadurch begründet, daß sie zu dem einfachen, für Bosonen und Fermionen formal identischen Ergebnis (6.39) führt. Für den Zwei-Teilchen-Operator L 12 i j (i, j ) erhält man mit analoger Rechnung (Aufgabe 6.1) L
1 α1 β2 (12) α1β2 c,α c,β c,α c,β . 2 ¼
¼
(6.40)
α,β α ¼ ,β ¼
Beispiel 6.1: Als Beispiel betrachten wir den Hamilton-Operator H
p i 2 2m
i
1 V ( xi x j ) 2 i j
eines in einem Würfel der Kantenlänge L eingesperrten Systems spinloser identischer Teilchen mit dem Zwei-Teilchen-Wechselwirkungspotential V ( xi x j ). Benutzt man die ebenen Wellen ϕk
1 L 3/2
eik x
mit
k
2π l ex L
me y
nez
als Basisfunktionen, wobei l, m und n ganze Zahlen sind, so findet man für Bosonen H
h 2 k 2 b b 2m k k
l,m,n
wobei Vq durch Vq definiert ist (Aufgabe 6.2).
1 L3
1 Vq b k q b k q b k b k , 2L 3 ¼
q,k,k ¼
V ( x ) eiq x d 3x
¼
150
6.6
6 Fock-Darstellung von Viel-Teilchen-Zuständen
Feldoperatoren
6.6.1 Unitäre Transformation zu Feldoperatoren Erzeugungs- und Vernichtungsoperatoren hängen von der für die Ein-Teilchen-Zustände gewählten Basis ab. Gehen wir von einer Basis aκ zu einer neuen Basis bκ über – dabei seien die Zustände numeriert, während der Buchstabe eine spezielle Basis markiert –, so gilt der Zusammenhang aκ bλ bλ aκ Uκλ bλ . (6.41) λ
λ
Die Matrix Uκλ bλ aκ
(6.42)
ist nach Abschn. Q6.2.5 unitär, UU U U 1 bzw. in Komponenten mit (U )κλ Uλκ Uκλ Uμλ Uλκ Uλμ δκμ . (6.43) λ
λ
Damit folgt aus (6.41) bλ
κ
Uκλ aκ .
(6.44)
Definieren wir die Erzeugungsoperatoren bezüglich der Basis aκ bzw. bκ durch
aκ cκ 0
bzw.
bλ dλ 0 ,
(6.45)
wobei cκ Erzeugungsoperatoren für Bosonen oder Fermionen sein sollen, also der Kürze halber c ,κ cκ gesetzt ist, so folgt aus (6.45a) cκ 0
(6.41)
λ
Uκλ bλ
(6.45b)
λ
Uκλ dλ 0 ,
und weil der Zustand 0 den ganzen Raum 0 aufspannt, erhalten wir den Zusammenhang cκ Uκλ dλ , dλ Uκλ cκ . (6.46) κ
λ
Mit (Uκλ dλ ) Uκλ dλ folgt daraus für die Vernichtungsoperatoren cκ (cκ ) und dλ (dλ ) cκ Uκλ dλ , dλ Uκλ cκ . (6.47) dκ
κ
λ
und denselben Vertauschungsrelationen genügen wie cκ Man findet leicht, daß und cκ (Aufgabe 6.3). Jetzt betrachten wir speziell den Übergang von einer diskreten Basis aκ zur kontinuierlichen Basis der Ortszustände x . In der letzteren erhalten wir nach (6.46b) aus cκ die – kontinuierlich von x abhängigen – Erzeugungsoperatoren (6.42) ψ (x) dx Uκ x cκ x aκ cκ . (6.48) dκ
κ
κ
6.6 Feldoperatoren
151
2 2 Mit x x d 3x 1 gilt aκ x x aκ d 3x, d. h. die Größen ϕκ (x) x aκ sind die Komponenten der Basiszustände aκ in der Ortsdarstellung. Mit diesen können wir (6.48) auch in der Form ψ (x) ϕκ (x) cκ (6.49) κ
(x) schreiben. Für die Vernichtungsoperatoren ψ(x) ψ folgt daraus ψ(x)
κ
ϕκ (x) cκ
ϕκ (x) x aκ .
mit
(6.50)
ψ (x) und ψ(x) werden als Feldoperatoren bezeichnet. Aus (6.49) folgt
ψ (x) 0
κ
ϕκ (x) cκ 0
(6.45a) (6.50b)
κ
x aκ aκ
aκ aκ x x ,
(6.51)
κ
d. h. ψ (x) erzeugt aus dem Vakuum den Ein-Teilchen-Zustand x . Da dieser ein Eigenzustand des Ortsoperators X zum Eigenwert x ist, bedeutet dies, daß ψ (x) ein Teilchen am Ort x erzeugt. Aus (6.51) folgt in Analogie dazu, wie sich (6.33) aus (6.32) ergibt, 0 ψ(x) x . (6.52) Die Feldoperatoren ψ (x) und ψ (x) erfüllen die Vertauschungsrelationen ψ(x), ψ(x ) ψ (x), ψ (x )
0,
ψ(x), ψ (x ) δ 3 (x x ) ,
(6.53)
wobei der Kommutator für Bosonen und der Antikommutator für Fermionen gilt. Beweis: (6.53a,b) folgt durch Einsetzen von (6.49) und (6.50) in die Vertauschungsrelationen (6.12a,b) bzw. (6.22a,b). (6.53c) ergibt sich gemäß ψ(x), ψ (x )
(6.49) (6.50) ϕκ (x) ϕ
κ,λ
) c (x , c ,κ λ ,λ
(6.12c) (Q3.208) (6.22c) ϕκ (x) ϕκ (x ) δ 3 (x x ) .
κ
6.6.2 Darstellung physikalischer Observablen durch Feldoperatoren Mit den Methoden und Ergebnissen von Abschn. 6.5 soll jetzt der Hamilton-Operator der Ortsdarsteldurch die Erzeugungs- und Vernichtungsoperatoren ψ (x) und ψ(x) lung ausgedrückt werden. Wir tun dies für den Hamilton-Operator H
p 2 (i ) 2m i
i
V (i )
1 V (i, j ) 2 i< j
152
6 Fock-Darstellung von Viel-Teilchen-Zuständen
eines Systems identischer Teilchen, die einem externen Ein-Teilchen-Potential V (i ) ausgesetzt sind und aufeinander Zwei-Teilchen-Wechselwirkungskräfte 2 2 mit dem Potential V (i, j ) ausüben. Mit der Vollständigkeitsrelation d 3x x x d 3x ¼ x ¼ x ¼ 1 ergibt sich für den Fall eines Einzelteilchens (6.51) ' ' ' ' p 2 1 (6.52) 1 ) d 3x d 3x ¼ x x ' p 2 ' x ¼ x ¼ d 3x d 3x ¼ ψ (x) 0 x ' p 2 ' x 0 ψ(x 2m 2m 2m ' ' 1 (6.8) ) d 3x d 3x ψ (x) x ' p 2 ' x ψ(x 2m ' ' (6.50) 1 cκ d 3x ψ (x) x ' p 2 ' x ϕκ (x ) d 3x . 2m κ Unter Benutzung der Beziehung (Q6.166) mit V (x)0 wird daraus p 2 h 2 h 2 (6.50) cκ d 3x ψ (x) ϕκ (x) ψ (x)ψ(x) d 3x 2m 2m κ 2m 2 s.u. h ψ (x)ψ(x) d 3x , (6.54) 2m wobei im letzten Schritt eine partielle Integration ausgeführt wurde. Für mehr als ein Teilchen ergibt sich nach Abschn. 6.5 dasselbe Ergebnis. Für das Ein-Teilchen-Potential V (X), in dem X der Ortsoperator ist, gilt V (X) d 3x d 3x x x V (X) x x d 3x d 3x ψ (x) x V (X) x ψ (x ) , wobei der Faktor 00
1 gleich weggelassen wurde. Mit
x V (X) x x V (x ) x V (x ) x x V (x ) δ 3 (x x )
folgt hieraus ) d 3x V (x) ψ (x) ψ(x) d 3x d 3x ψ (x) V (x ) δ 3 (x x ) ψ(x . (6.55) V (X) Auch dieses Ergebnis gilt wieder sowohl für ein Einzelteilchen als auch für mehrere Teilchen. Für den Zwei-Teilchen-Operator V (X 1 , X 2 ), in dem X 1 der Ortsoperator für Teilchen 1 und X 2 der Ortsoperator für Teilchen 2 ist, ergibt sich mit ähnlicher Rechnung (Aufgabe 6.5) 1 ) . d 3x d 3x V (x, x ) ψ (x) ψ (x ) ψ(x) ψ(x (6.56) V (X 1 , X 2 ) 2 Die Zusammenfassung aller Ergebnisse liefert für den Hamilton-Operator H
h 2 (x)ψ(x) ψ (x) ψ(x) V (x)ψ d 3x 2m 1 ) d 3x d 3x . V (x, x ) ψ (x) ψ (x ) ψ(x) ψ(x 2
(6.57)
Aufgaben
153
Aufgaben 6.1
Beweisen Sie für ein System zweier identischer Teilchen die Darstellung 1 α1 β2 L 12α1 ¼ β2 ¼ cα cβ cα cβ L 12 2 ¼
¼
α,β,α ¼ ,β ¼
des Zwei-Teilchen-Operators L 12 L 21 .
6.2
Der Hamilton-Operator eines in einem Würfel der Kantenlänge L eingesperrten Systems zweier identischer spinloser Teilchen sei P2 1 i V ( X i X j ) , H 2m 2 i j
i
wobei Pi die Impuls- und X i die Ortsoperatoren ohne Bezug auf eine spezielle Darstellung sind. Berechnen Sie die in Beispiel 6.1 angegebene FockDarstellung von H durch die Erzeugungs- und Vernichtungsoperatoren b k und b k der Basis ebener Wellen eik x 2π le . ϕ k x k , k me ne x y z L 3/2 L Hinweis: Das Potential V ( x ) besitzt die Fourier-Darstellung 1 1 iq x V ( x ) eiq x d 3x . Vq e mit Vq V ( x ) (2π)3 q L3 6.3
Zeigen Sie, daß der Zusammenhang b k Ukl cl ,
bk
l
Ukl cl
l
zwischen den Erzeugungs- bzw. Vernichtungsoperatoren verschiedener EinTeilchen-Basen zwischen den b-Operatoren die Vertauschungsrelationen
bi , bk
6.4
0,
bi , bk
0,
bi , bk
δik
induziert, wenn diese zwischen den c-Operatoren gelten. Beweisen Sie für den Ein-Teilchen-Operator L i L i mit L i L (xi ) die Dar stellung L ψ (x) L ψ (x) d 3 x,
in der L die Ortsdarstellung des Ein-Teilchen-Operators L(X) ist. Anleitung: 1. Gehen Sie von der in Abschn. 6.6.2 bewiesenen Fock-Darstellung (6.34), L α,β α L β bα bβ , des Ein-Teilchen-Operators in der diskreten Basis α aus und invertieren Sie ψ (x) ϕα (x) b α , ψ(x) ϕα (x) b α . α
α
2. Berechnen Sie den Zusammenhang zwischen den Matrixkomponenten L αβ α L β in der diskreten Basis α und den Komponenten L x x in der kontinuierlichen Basis x . 3. Benutzen Sie schließlich die Beziehung ¼
L x x φ(x ) d 3 x ¼
L φ(x)
zwischen den Operatoren und den Matrixelementen.
154
6 Fock-Darstellung von Viel-Teilchen-Zuständen
6.5
Drücken Sie den Zwei-Teilchen-Operator V (X 1 , X 2 ), in dem X 1 und X 2 die Ortsoperatoren für Teilchen 1 bzw. 2 sind, durch die Erzeugungs- und Vernich tungsoperatoren ψ (x) und ψ(x) der Ortsdarstellung aus.
Lösungen 6.1
Unter Ausnutzung der Vollständigkeitsrelation gilt L 12
1 L 12 1
α1 β2
L 12
α,β,α ,β
1 β2
α
1 β2
α1 β2
1 2
α
1 β2 .
¼
(1 P12 )α1 β2 /2
α1 β2 L 12 α
α
α ¼ ,β ¼
α1 β2 L 12 α β
¼
Mit (Q9.49), α1 β2
α1 β2
α,β
2 1 wird sowie P12
β
1 (1 P )α β , L (1 P )α β 12 1 2 12 12 1 2 4
1 2
1 4
α1 β2 ,
L 12 (1 P12 )2 α1 β2
1 α β L α β 1 α β L P α β 2 1 2 12 1 2 2 1 2 12 12 1 2
1 α β L α β 1 α β L β α 2 1 2 12 1 2 2 1 2 12 1 2
und L 12
1 α1 β2 L 12 α β α1 β2 1 2 2 α,β α ¼ ,β ¼
Term 2Î α ¼ °β ¼ 1 α1 β2 L 12 α
2
α,β α ¼ ,β ¼
s.u.
α
1 β2 α1 β2
α1 β2 L 12 α
α,β α,β α ¼ ,β ¼ α ¼ ,β ¼
wobei im letzten Schritt
β
α1 β2
α
β
1 2
1 2
α
β
α
1 β2 α1 β2
1 α2
β α1 β2 L 12 β α α1 β2 1 β2 α1 β2 L 12 α1 β2 α1 β2
α
1 2
1 α2
1 β2 ,
1 β2 benutzt worden ist. Mit
c α c β 0 ,
α
1 β2
0c
α¼ c β ¼
und 001 folgt daraus die behauptete Beziehung. 6.2
Mit (6.34) und dem Ergebnis von Aufgabe 6.1 lautet die Fock-Darstellung von H mit α k etc. H
0 '' p2 '' 1 k' 'k bk bk 2m k,k ¼
¼
1 k1 k2 V ( X 1 X 2 ) k k b b b ¼ b ¼ . 1 2 k1 k2 k k 2 1 2 ¼ ¼ k1 ,k2 ,k1 ,k2
Aufgaben
155
Durch Einschieben des Operators
2 3 d x x x
k p 2 k
h 2 L3
und
1 ergibt sich mit x k eik x /L 3/2
h ∂ 2 3 k x x k d x i ∂x h 2 k 2 ei (k k) x d 3x h 2 k 2 δkk L3
(Q6.164)
k x x p 2 k d 3x
ei k x 2 ei k x d 3x
¼
0 '' p 2 '' 1 k' 'k b k b k 2m
¼
¼
h 2 k 2 k
k,k ¼
2m
¼
b k b k .
2 Durch Einschieben des Operators d 3x1 d 3x2 x1 x2 x1 x2 1 erhalten wir weiterhin mit V (X) x V (x) x (siehe nach (Q6.165)) 3 3 k1 k2 V k k k1 k2 V ( X 1 X 2 ) x1 x2 x1 k x2 k d x1 d x2 1 2 1 2 3 3 k1 x1 k2 x2 V ( x1 x2 ) x1 k x2 k d x1 d x2 1 2 1 V ( x1 x2 ) ei (k1k1 ) x1 ei (k2k2 ) x2 d 3x1 d 3x2 . L6 ¼
¼
Mit der Substitution x1 x2 x (Folge d 3x1 d 3x) wird daraus 1 i (k1 k ) x 3x ei (k1 k1 k2 k2 ) x2 d 3x 1 k1 k2 V k k x ) e d V ( 2 1 2 L6 1 V δ . L 3 k1 k1 k1 k2 ,k1 k2 ¼
¼
¼
¼
¼
¼
Hiermit, mit der Definition q k1 k1 sowie den Umbenennungen k1 k und k2 k , die wegen der Kronecker-Funktion k2 k1 k2 k1 k q zur Folge haben, erhalten wir
k1 k2 V k1 k2 b k b k b k b k 1 2 1 2 ¼
k1 ,k2 ,k1¼ ,k2¼
¼
1 Vq b kq b kq b k b k L3 ¼
k,k ¼ ,q
und damit insgesamt wie behauptet H
h 2 k 2 k
2m
b k b k
1 Vq b kq b kq b k b k . 2L 3 ¼
k,k ¼,q
¼
¼
7
Klassische relativistische Feldtheorie
In Schrödingers Wellenmechanik kann ψ(x, t) als Wellenfunktion für ein oder mehrere Teilchen aufgefaßt werden. In beiden Fällen ergibt sich ein Erhaltungssatz d ψψ d 3x 0 dt für die Wahrscheinlichkeitsdichte ψψ . Da mit ψ auch jedes Vielfache von ψ eine Lösung der Schrödinger-Gleichung ist, mußt die Quantisierung * 1 für eine Ein-Teilchen-Theorie, 3 ψψ d x N für eine N-Teilchen-Theorie als zusätzliche Bedingung mit in die Theorie aufgenommen werden, sie ergibt sich nicht als eine Folge der Theorie. Das muß als eine deutliche Schwäche der SchrödingerTheorie angesehen werden, diese ist keine vollständige Quantentheorie. Die aus dem Photoeffekt erschlossenen Quantisierungsregeln E
hω,
p hk
(7.1)
von Einstein legen es nahe, den Maxwell-Gleichungen die gleiche Rolle bezüglich der Photonen zuzuschreiben, welche z. B. die Schrödinger-Gleichung im nichtrelativistischen Grenzfall bezüglich spinloser Teilchen spielt. Dementsprechend wäre die durch hω geteilte Energiedichte des elektromagnetischen Feldes, 1 ε0 2 1 2 n E B , hω 2 2μ0 als Wahrscheinlichkeitsdichte von Photonen der Energie hω zu interpretieren. In diesem Sinne ist also auch schon die Maxwellsche Elektrodynamik eine Quantentheorie. Aber auch sie liefert nicht die Quantisierungsregeln (7.1). Das Ziel dieses Teils des Buches ist es, eine Theorie zu entwickeln, welche die aufgezeigten Lücken schließt. Der hier beschrittene Weg steht in enger Analogie zur Quantisierung der klassischen Mechanik von Punktteilchen, die in der Quantenmechanik behandelt wurde. Es stellt sich heraus, daß Feldtheorien wie die Maxwell-Theorie in eine kanonische Form gebracht werden können, die dem kanonischen Formalismus der Mechanik entspricht. Wendet man auf diese die Quantisierungsregeln der Quantenmechanik an, so gelangt man zu einer Quantentheorie von Feldern. Mit der letzteren können nicht nur die oben aufgeführten Lücken der bisher von uns betrachteten Quantentheorie geschlossen werden, sondern es tun sich auch neue Ergebnisse und Erkenntnisse
7.1 Mechanisches Beispiel einer Feldtheorie
157
auf. Dabei soll allerdings nicht verschwiegen werden, daß auch viele neue Schwierigkeiten und Probleme auftauchen, die nur mit großer Mühe behoben bzw. gelöst werden können. Die auf diese Weise erhaltene Quantenfeldtheorie ist so umfangreich, daß in diesem Buch nur ihre Anfangsgründe behandelt werden können.
7.1
Mechanisches Beispiel einer Feldtheorie
Anhand eines einfachen mechanischen Beispiels kann gezeigt werden, wie man zu kanonischen Bewegungsgleichungen für ein Feld kommt. Wir gehen dazu von einem vertrauten mechanischen Problem mit endlich vielen Freiheitsgraden aus und vollziehen an diesem den Grenzübergang zu einem kontinuierlichen System mit unendlich vielen Freiheitsgraden. Das mechanische System bestehe aus N 1 Massenpunkten gleicher Masse m, die sich an den Punkten x i , i 0, 1, . . . , N , der x-Achse befinden und durch gleichartige Federn der Federkonstante k verbunden sind (Abb. 7.1). Die Gleichgewichtslagen der Massenpunkte seien x i,0 i a , i 0, 1, . . . , N, ihre Bewegung sei an die x-Achse gebunden. Nun definieren wir Verschiebungen η(x i,0 , t) x i (t) x i,0
(7.2)
und erhalten für die kinetische Energie des Systems mit der Notation η ∂t η T
N m i 0
2
xi 2
N m i 0
2
η i 2 .
(7.3)
Die potentielle Wechselwirkungsenergie benachbarter Teilchen ist *k (x j x i a)2 k2 (η j ηi )2 für j i 1, Vi j 2 0 sonst. Mit der aus der Mechanik bekannten Formel V i< j Vi j für die gesamte potentielle Energie erhalten wir daher N 1 V k (ηi 1 ηi )2 . (7.4) 2 i 0
Die Lagrange-Funktion des Systems ist L
T V
N 2
η 1 m 2 i 1 ηi a, η i ka 2 a a i 0
(7.5)
wobei sich der für spätere Zwecke eingeschobene Faktor a herauskürzt. Hieraus folgen die Lagrangeschen Bewegungsgleichungen m ηi 1 ηi η i (t) ka a a2
ka ηi a 2ηi 1 .
(7.6)
158
7 Klassische relativistische Feldtheorie
k
m a x0
x1
x2
x3
x4
Abb. 7.1: Modell durch gleichartige Federn gekoppelter Punktmassen.
Nun lassen wir gleichzeitig a die Ausdrücke Na
und N gehen derart, daß dabei m μ, ka Y (7.7) a
0, m
0, k
,
konstant bleiben. η(x i,0 , t) ist die Verschiebung des Teilchens mit der Gleichgewichtslage x i,0 . Beim Grenzübergang a 0 erhalten wir unendlich viele Gleichgewichtslagen und schreiben kürzer η(x, t) , ηi (x i,0 , t) wobei η(x, t) die Verschiebung des Teilchens mit der Gleichgewichtslage x bedeutet. Wegen x i 1,0 x i,0 a erhalten wir
ηi
1
η η(x a, t) η(x a i
i,0
i,0 , t) a
a
0
∂η , ∂x
und mit den Gleichungen (7.7) ergeben sich für den betrachteten Grenzfall aus (7.5)–(7.6) die Lagrange-Funktion 2 % $ 1 ∂η μ η2 Y dx (7.8) L 2 0 ∂x
und die Bewegungsgleichung
Y ∂∂ xη . 2
μη
(7.9)
2
2t Gleichung (7.6) kann durch Variation des Integrals t01 L dt gewonnen werden, wenn L durch (7.5) gegeben ist. Daher steht zu erwarten, daß Gleichung (7.9) durch Variation des Integrals 2 % $ 1 t1 ∂η 2 μη d x dt (7.10) Y I 2 t0 0 ∂x
erhalten werden kann. Aus den endlich vielen abhängigen Variablen ηi (t) in (7.5), die durch den Index i unterschieden werden, wurden dabei die unendlich vielen Variablen η(x, t), die sich im Ort x unterscheiden. Mathematisch kann η(x, t) natürlich auch als eine Variable aufgefaßt werden, die von den zwei unabhängigen Parametern x und t abhängt. Wir variieren jetzt das Integral (7.10), indem wir η(x, t) η(x, t) ε ζ (x, t) setzen, und erhalten durch Differentiation nach ε ' t1 d I '' μ η ζ Y η ζ d x dt, ' dε ε 0 t0 0
7.2 Hamiltonsches Prinzip für Feldtheorien
159
wobei η¼ ∂x η gesetzt wurde. Durch partielle Integration nach t im ersten und nach x im zweiten Term des Integranden erhalten wir ' d I '' dε 'ε
0
t1 μ η t0
0
Y η ζ d x dt
0
μ η ζ
t1 t0
t1
dx t0
Y η ζ
0
dt.
Bei der Variation des Zeitintegrals über den Integranden (7.5) muß ζi (t0 ) ζi (t1 ) 0 gesetzt werden, damit (7.6) erhalten wird. Hier müssen wir offensichtlich die etwas weitergehenden Randbedingungen ζ (x, t0 ) ζ (x, t1 ) 0,
ζ (0, t) ζ(, t) 0
(7.11)
stellen, um aus der Forderung d I /dε ε 0 0 die partielle Differentialgleichung (7.9) zu erhalten. Die zweite der Bedingungen (7.11) bedeutet, daß die Amplitude der durch (7.9) beschriebenen elastischen Welle η(x, t) bei x 0 und x festgehalten wird. Auch die Periodizitätsforderung η(x, t) η(x
, t) mit den Konsequenzen ζ (0, t) ζ (, t) und η (0, t) η (, t) würde das letzte Integral in dem für d I /dεε 0 erhaltenen Ausdruck zum Verschwinden bringen. 7.2
Hamiltonsches Prinzip für Feldtheorien
Es ist nun leicht, zu sehen, wie sich das eben betrachtete spezielle Beispiel verallgemeinern läßt. η(x, t) sei ein Feld – jedem Ort x wird zu jeder Zeit t ein Wert des Feldes η zugeordnet –, das einer gegebenen Differentialgleichung genügen soll. η kann ein skalares reelles, ein skalares komplexes, ein Vektor- oder ein Tensorfeld sein. Wir können alle diese Fälle zusammenfassen, indem wir η mit einem Index r versehen und diesen entsprechend viele Werte durchlaufen lassen. Mit x 0 ct und x, t x α ct, x gehen wir zu einer Schreibweise über, die gleich die relativistische Gleichwertigkeit von Orts- und Zeitvariablen enthält. Wir haben dann ein Feld ηr
ηr (x)
(7.12)
zu betrachten – x steht dabei wieder als Abkürzung für die vier Komponenten x α –, das gegebenen Differentialgleichungen genügen soll. Die Ableitungen von ηr nach den x α werden wir im folgenden durch ∂ηr ηr,α ∂xα abkürzen. In leichter Verallgemeinerung der Betrachtungen des vorigen Abschnitts suchen wir nach einer Lagrange-Dichte
(ηr , ηr,α , x) ,
(7.13)
160
7 Klassische relativistische Feldtheorie
welche die Eigenschaft besitzt, daß das Variationsproblem δ G
d4x
' ' δηr '
0,
∂G
0
(7.14)
zu der gegebenen Differentialgleichung führt. Der Lagrange-Funktion (7.8) entspricht dabei das Integral L G3
d 3x.
Die Variationsnebenbedingung δηr ∂G 0 (d. h. δηr soll auf dem Rand ∂ G des Gebietes G verschwinden) wurde dabei in Analogie zu den Forderungen (7.11) gestellt. Zur Lösung des Variationsproblems (7.14) ziehen wir die Variation unter das Integral. Das ist möglich, weil nur ηr variiert werden soll und die Grenzen des Integrationsgebiets nichts mit dieser Variation zu tun haben sollen. Nun gilt δ und1
∂ δηr,α ∂ηr,α
∂ ∂xα
∂ δηr ∂ηr
∂ δηr ∂ηr,α
∂ δηr,α ∂ηr,α
(7.15)
∂ ∂ ∂ x α ∂ηr,α
δηr ,
(7.16)
wobei wir bezüglich des Index α die – später auch für nicht-relativistische Zwecke brauchbare – Summenkonvention Aα B α A0 B 0 A1 B 1 A2 B 2 A3 B 3 benutzen und bezüglich des Index r vereinbaren, daß über die Zahl der Feldkomponenten summiert wird, wenn der Index unten und oben auftritt. Außerdem wurde die Relation δηr,α
∂α δηr
benutzt, die aus ηr
ηr0 δηr
ηr0 εζr ,
ηr,α
und
ηr0,α
δηr,α
ηr0,α
εζr,α
gemäß δηr,α εζr,α ∂α (εζr ) ∂α δηr hervorgeht. Aus dem Gaußschen Satz in vier Dimensionen ergibt sich mit der Randbedingung (7.14b) ∂ ∂ ∂ 4 δηr d x δηr d 4 fα 0 . α ∂ηr,α G ∂x ∂G ∂ηr,α
Mit (7.15) und (7.16) liefert das Variationsprinzip (7.14) somit ∂ ∂ ∂ δηr d 4 x 0 . ∂ x α ∂ηr,α G ∂ηr
1
(7.17)
In (7.16) ist unter ∂/∂x α die partielle Ableitung nach x α bei festgehaltenen x β x α verstehen, nicht jedoch bei festgehaltenen ηr und ηr,α . Diese sind Funktionen von x und sollen bei der Ableitung nach x α mit differenziert werden.
7.3 Hamiltonsche Bewegungsgleichungen für Feldtheorien
161
Die Variationen δηr können beliebig gewählt werden, insbesondere so, daß nur ein δηr in der infinitesimalen Umgebung des Raum-Zeit-Punktes x von Null verschieden ist. Daher erhalten wir aus (7.17) die Lagrangeschen Feldgleichungen
∂ ∂ ∂ x α ∂ηr,α
∂ . ∂ηr
(7.18)
Man überzeugt sich leicht davon, daß sich hieraus im Fall der Lagrange-Dichte 1 1 2 2 2 μ η 2 Y (∂η/∂ x) die partielle Differentialgleichung (7.9) ergibt. Es verbleibt anzumerken, daß die zu den Differentialgleichungen (7.18) gehörige Lagrange-Dichte nicht eindeutig ist. Offensichtlich führt die Lagrange-Dichte
¼
γ
∂ ∂x β Λβ (ηr , x)
(7.19)
mit einer beliebigen Konstanten γ und Funktion Λβ (ηr , x) zu denselben Feldgleichungen, da die vierdimensionale Divergenz bei der Variation wegen δηr ∂G 0 keinen Bei 2 2 2 2 S. v. Gauß trag liefert. δ G ¼ d 4 x γ δ G d 4 x δ ∂G Λβ (ηr , x) d f β γ δ G d 4 x .
7.3
Hamiltonsche Bewegungsgleichungen für Feldtheorien
Während die Lagrange-Gleichungen (7.18) eine gleichartige Behandlung von Zeit- und Ortskoordinaten zulassen – für die Mechanik von Massenpunkten gibt es eine ähnliche Formulierung –, spielt in der Hamiltonschen Mechanik die Zeit eine besondere Rolle. Um aus (7.18) eine Hamiltonsche Formulierung ableiten zu können, müssen wir daher erst Orts- und Zeitvariablen trennen: Erstreckt sich die Summation bei lateinischen Indizes wieder nur von 1 bis 3, so erhalten wir aus (7.18) mit ηr ηr,t
∂
∂ ∂ ∂t ∂ ηr
∂ηr
∂ ∂ . ∂ x l ∂ηr,l
(7.20)
In Anlehnung an die Mechanik von Massenpunkten definieren wir nun durch πr
∂ ∂ ηr
(7.21)
aus der Lagrange-Dichte eine kanonische Impulsdichte. Es besteht die Abhängigkeit πr
π r (ηs , ηs , ηs , x).
(7.22)
Wir stellen uns vor, daß diese Beziehungen nach den ηs aufgelöst werden können (was häufig explizit nicht möglich ist), ηr
fr (ηs , ηs , π s , x)
(7.23)
162
7 Klassische relativistische Feldtheorie
und definieren dann durch π r ηr
(7.24)
eine Hamilton-Dichte. Sind in dieser die ηr gemäß (7.23) durch die π r ersetzt, so gilt (ηr , ηr,l , π r , x) .
(7.25)
Aus der Definitionsgleichung (7.24) folgt ∂ ∂ ∂ ηs s ηr π r ∂π ∂ ηs ∂π r
bzw. mit (7.21) ηr
Analog ergibt sich ∂ ∂ηr
πs
und
∂ ηs ∂
∂ ∂ ηs
∂ ∂ηr,l
∂ηr πs
∂ ∂ ηs
(7.26)
(7.20) (7.21)
∂ ∂ηr
∂ ηs ∂ηr,l
∂ ∂ηr,l
(7.21)
∂ηr
∂ . ∂π r
π
r
∂ ∂ ∂ x l ∂ηr,l
∂ . ∂ηr,l
Die Kombination der beiden letzten Ergebnisse führt zu πr
∂ ∂ηr
∂ ∂ . ∂ x l ∂ηr,l
(7.27)
Gegenüber der Mechanik von Massenpunkten gibt es auf der rechten Seite einen weiteren Term. Der Grund für sein Auftreten ist, daß nach (7.25) nicht nur von den ηr , sondern auch von deren Ortsableitungen abhängt. Um eine engere formale Übereinstimmung mit der Mechanik von Massenpunkten zu erhalten, führen wir für eine Funktion f
f (ηr , ηr,l , π r , π r,l , x)
(7.28)
die sogenannten Variationsableitungen δf δηr
∂f ∂ηr
∂ ∂f , ∂ x l ∂ηr,l
δf δπ r
∂f ∂π r
∂ ∂f ∂ x l ∂π r,l
(7.29)
ein. Die Motivation zu dieser Notation ergibt sich aus der zur linken Seite von (7.17) analogen Beziehung ∂f ∂f ∂f ∂f 3 3 δηr δηr,l δπr δπr,l d 3x δ f d x δf d x ∂ηr ∂ηr,l ∂πr ∂πr,l ∂ ∂f ∂ ∂f ∂f ∂f 3 δηr d x δπr d 3x . ∂ηr ∂ x l ∂ηr,l ∂πr ∂ x l ∂πr,l
7.3 Hamiltonsche Bewegungsgleichungen für Feldtheorien
163
(Variiert wird nur bezüglich der von x abhängigen Funktionen ηr und πr sowie ihrer Ortsableitungen. Man beachte, daß f nicht von ηr und πr abhängt.) Wird bei festen πr nur ein ηr variiert, und ist dessen Variation auf ein kleines, den Punkt P umgebendes Volumen V begrenzt, so folgt aus der letzten Beziehung
δ f d x/V 3
und
δ f δηr
∂f ∂ηr
∂f ∂ηr
' ∂ ∂ f '' d 3x δη r ' ∂ x l ∂ηr,l P V
' ∂ ∂ f '' , ∂ x l ∂ηr,l ' P
(7.30)
wobei δ f und δηr die Mittelwerte der schnell veränderlichen Funktionen δ f und δηr über V darstellen, während auf der rechten Seite von (7.30) eine in V langsam veränderliche Funktion steht, die an einem Punkt P innerhalb von V zu nehmen ist. Geht nun V derart gegen null, daß sich V auf einen Punkt zusammenzieht, so steht rechts der Funktionswert an dieser Stelle. Der Vergleich von (7.29a) mit (7.30) zeigt die Bedeutung der Variationsableitung: In (7.29a) sind δ f und δηr die mittleren Variationen in einem infinitesimalen Volumen. Die Interpretation von (7.29b) ist analog. Mit den Definitionen (7.29) lauten die Beziehungen (7.26) und (7.27) ηr
δ , δπ r
πr
δ . δηr
(7.31)
Dies sind die Hamiltonschen Bewegungsgleichungen für das Feld ηr (x, t). Für die totale Zeitableitung einer Funktion (7.28) ergibt sich mit ihnen df dt
∂f ∂f ∂f r ∂f ∂f ηr ηr,l π π r,l r r ∂ηr ∂ηr,l ∂π ∂π ,l ∂t ∂ ∂f ∂ ∂f ∂f ηr l ηr ∂ηr ∂ x l ∂ηr,l ∂ x ∂ηr,l ∂ ∂f ∂ ∂f ∂f ∂f r r π π ∂π r ∂ x l ∂π r,l ∂ x l ∂π r,l ∂t δf δ δf δ ∂f ∂ ∂f ∂f r . η π r δηr δπ r δπ r δηr ∂t ∂ x l ∂ηr,l ∂π r,l
Nun definieren wir als Poisson-Klammer
f,
δf δ δηr δπ r
δf δ δπ r δηr
(7.32)
und erhalten damit für das letzte Ergebnis df dt
f,
∂f ∂t
∂ ∂xl
∂f ηr ∂ηr,l
∂f r π . ∂π r,l
(7.33)
164
7 Klassische relativistische Feldtheorie
Setzen wir speziell f
, so folgt hieraus ∂ ∂t
d dt
∂ ∂xl
∂ ηr , ∂ηr,l
(7.34)
da nicht von π r,l abhängt. Sowohl Gleichung (7.33) als auch Gleichung (7.34) unterscheidet sich von den aus der Mechanik von Massenpunkten vertrauten Ausdrücken, obwohl durch Benutzung der Variationsableitung schon eine bessere Angleichung erzielt wurde. Das ändert sich, wenn wir zu den integralen Größen f d 3x bzw. H d 3x (7.35) F IR3
IR3
übergehen. Es gilt dF dt
∂F ∂t
df 3 d x, 3 IR dt
IR3
∂f 3 d x, ∂t
und unter der Annahme, daß die Feldgrößen ηr und π r bzw. deren Zeitableitungen ηr und π r für x hinreichend schnell verschwinden, folgt hieraus mit (7.33) nach Umwandlung des Divergenzterms in ein – verschwindendes – Oberflächenintegral mit Hilfe des Gaußschen Satzes dF dt wobei F,
durch
definiert ist. Für f
F, H
F, H
IR3
(7.36)
f, d 3x
folgt aus (7.36) wegen , dH dt
7.4
∂F , ∂t
(7.37)
0
∂∂tH .
(7.38)
Anwendung auf spezielle Felder
Im folgenden werden zu einer Reihe quantenmechanischer Bewegungsgleichungen und für das elektromagnetische Feld die Lagrange- und die Hamilton-Dichte berechnet.
7.4.1 Schrödinger-Feld Wir suchen als erstes eine Lagrange-Dichte für das der Schrödinger-Gleichung ih ∂t ψ
h 2 ψ 2m
Vψ
(7.39)
7.4 Anwendung auf spezielle Felder
165
genügende Schrödinger-Feld ψ(x, t). Dieses ist komplexwertig, und wir setzen ψ
ψ1
i ψ2 .
Mit Hilfe der Beziehungen ψ1
12
ψ
ψ ,
2i
ψ2
ψ
ψ
können wir die Lagrange-Dichte statt durch ψ1 und ψ2 auch durch die komplexwertigen Felder ψ und ψ ausdrücken und die letzteren als unabhängig auffassen, da zwischen ihnen und den Funktionen ψ1 und ψ2 ein eindeutiger Zusammenhang besteht. Mit
(ψ, ψ ) (ψ1 , ψ2 ) erhalten wir ∂ ∂ψ
∂ ∂ψ1 ∂ψ1 ∂ψ 1 ∂ ∂ ∂ψ 2 ∂ψ 1
∂ ∂ψ2 ∂ψ2 ∂ψ ∂ i ∂ψ2
1 2
i ∂ , ∂ψ
∂ ∂ψ1
(7.40)
2
(7.41)
sowie ∂ ∂ψ,α
∂ ∂ψ1,α ∂ ∂ψ2,α 1 ∂ i ∂ , ∂ψ1,α ∂ψ,α ∂ψ2,α ∂ψ,α 2 ∂ψ1,α ∂ψ2,α ∂ 1 ∂ ∂ . i ∂ψ 2 ∂ψ ∂ψ ,α
1,α
(7.42) (7.43)
2,α
Aus den Variationsgleichungen (7.18) folgt mit η1 ψ1 und η2 ψ2 zunächst
∂ , ∂ψ
∂ ∂ ∂ x α ∂ψ1,α
1
∂ . ∂ψ
∂ ∂ ∂ x α ∂ψ2,α
2
Wird dies in (7.40) und (7.41) eingesetzt, so ergibt sich mit (7.42) und (7.43) ∂ ∂ ∂ x α ∂ψ,α
∂ ∂ψ
und
∂ ∂ ∂ x α ∂ψ ,α
∂ , ∂ψ
(7.44)
d. h. die Feldgleichungen haben in den komplexen Größen ψ und ψ die gleiche Form wie in ψ1 und ψ2 . Man überprüft leicht, daß die Gleichungen (7.44) mit (7.39) bzw. der zu (7.39) konjugiert-komplexen Gleichung übereinstimmen, wenn mit der Umbenennung die Lagrange-Dichte
h 2 ih ψ ψ 2m ψ ψ V ψψ ,
(7.45)
166
7 Klassische relativistische Feldtheorie
–wegen
sowie
ih ∂t (ψψ ) ist diese nicht reell– genommen wird: Es gilt ∂ ∂ ∂ h 2 ψ ,l , ih ψ , V ψ ∂ψ,l 2m ∂ψ ∂ψ 0,
h 2 ψ , ,l 2m
ih ψ
∂ ∂ψ ,l
∂ ∂ ψ
∂ ∂ψ
Vψ ,
und durch Einsetzen in die Lagrange-Gleichungen (7.44) in der Form (7.20) ergibt sich ih ∂t ψ
V ψ
h 2 ψ ,l,l 2m
0 ih ψ
und
Vψ
h 2 ψ,l,l , 2m
also die Schrödinger-Gleichung (7.39) und die zu ihr konjugiert-komplexe Gleichung. Als kanonische Impulse erhalten wir π
∂∂ ih ψ , ψ
π
∂∂ψ 0 .
(7.46)
(Der durch (7.46b) definierte Impuls π ist offensichtlich nicht zu π komplexkonjugiert.) Die Hamilton-Dichte (7.24) ist
π ψ π ψ π ψ (π bzw. mit (7.46a)
ih ψ ) ψ
h 2 2m ψ ψ V ψψ
h 2 2m ψ ψ V ψψ ,
(7.47)
im Gegensatz zur Lagrange-Dichte ist sie reell. Die Gleichungen (7.46) lassen sich nicht zur Elimination von ψ bzw. ψ benutzen, andererseits ist von π und π unabhängig. Daher bleibt zunächst unklar, ob die Gleichungen (7.31) mit (7.47) der Schrödinger-Gleichung und der zu dieser komplexkonjugierten Gleichung äquivalent sind. Aus (7.31b) folgt π
δ δψ
(7.29a)
V ψ
h 2 ψ , 2m
und mit (7.46a) ergibt sich daraus wie erwünscht die zur Schrödinger-Gleichung komplex-konjugierte Gleichung. Aus (7.31a) folgt jedoch ψ δ /δπ 0, was sicher nicht richtig ist. Setzt man allerdings schon bei der Variation π i h ψ , so ergibt sich 1 δ 1 ∂ ∂ 1 h 2 V ψ ψ , ψ ∂ l i h δψ i h ∂ψ ∂ψ , l i h 2m also die Schrödinger-Gleichung. Dieser Vorgehensweise äquivalent ist es, wenn man ψ in mit Hilfe von (7.46a) durch π ersetzt, also statt (7.47) die Hamilton-Dichte
h 2 i1h 2m ψ π V ψπ
(7.48)
7.4 Anwendung auf spezielle Felder
167
benutzt. Entgegen der Voraussetzung (7.25) wird dann allerdings auch zu einer Funktion von π,l . Gleichung (7.31a) mit (7.29b) liefert dann ψ
δ δπ
∂ ∂π
∂ ∂ ∂ x l ∂π,l
1 i h
h 2 ψ 2m
Vψ
,
(7.49)
stimmt also mit der Schrödinger-Gleichung überein, während aus (7.31b) mit (7.48) die zu dieser komplex-konjugierte Gleichung π
(7.46a)
ih ψ
(7.31b) (7.29a)
1 Vπ ih
h 2 π,l,l 2m
(7.46a)
h 2 ψ V ψ 2m
folgt. Für die durch (7.35b) definierte Hamilton-Funktion H erhalten wir mit (7.48) nach jeweils einer partiellen Integration die beiden äquivalenten Formen H
1 ih
IR3
π
h 2 V 2m
ψ d 3x
1 ih
IR3
ψ
h 2 V π d 3x. 2m
(7.50)
7.4.2 Klein-Gordon-Schrödinger-Feld Wir betrachten nur den kraftfreien Fall (4.6) der Klein-Gordon-Schrödinger-Gleichung. Die dazu konjugiert-komplexe Gleichung hat die gleiche Form. Wie beim SchrödingerFeld können φ und φ als unabhängige Variablen aufgefaßt werden. Als mögliche Lagrange-Dichte errät man 2
h 2m
0
g αβ (∂α φ)(∂β φ )
m 0 c2 φφ . 2
(7.51)
Diese Wahl von ist nicht die in der Literatur übliche, gebräuchlicher ist 2m 0, was zusammen mit der häufig zur Abkürzung des Schreibaufwands getroffenen Konvention, h 1 und c1 zu setzen, zur Lagrange-Dichte
gαβ (∂α φ)(∂β φ
) m 20 φφ
(7.52)
führt. Zu Gunsten der Definition (7.51) gibt es folgende Argumente: 1. Wenn φφ wie ψψ im Fall des Schrödinger-Feldes und ψ ψ im Fall des Dirac-Feldes mit l = Länge die Dimension einer Enerdie Dimension 1/l 3 einer Teilchendichte besitzt, hat giedichte. Im Fall der Lagrange-Dichte (7.52) muß φφ dagegen aus dem gleichen Grund die Dimension m/l 3 einer Massendichte besitzen. Die Vermeidung dieser etwas unglücklichen Dimension begründet in /(2m 0 ) den Faktor 1/m 0. 2. Aus (7.51) folgt in dem formal mit c erhältlichen nicht-relativistischen Limes die in Aufgabe 7.1 angegebene Lagrange-Dichte des Schrödinger-Feldes, die wie (7.45) die mit
168
7 Klassische relativistische Feldtheorie
der klassischen Energie E m Ú 2 /2 V korrespondierende Energiedichte (7.47) zur 2 Folge hat. Mit dem Ansatz φ ψ e i m 0 c t /h ergibt sich nämlich
2 φ φ h 2 φ φ m 0 c2φφ h 2 ψ ψ h2m 2m 2 c2 2m c2
i h (ψ ψ ψ ψ ) h 2 ψ ψ 2m 2 0
0
0
c
0
i h h 2 ψ ψ ψ ψ ψ ψ . 2 2m 0
Die Kompatibilität von mit dem nicht-relativistischen Ergebnis begründet in /(2m 0) den Faktor 1/2. 3. Weiterhin paßt die Definition (7.51) zum HamiltonOperator (4.22) der nicht-quantisierten Klein-Gordon-Theorie: Die aus berechnete
Energie reproduziert z. B. im Fall ebener Wellen das Ergebnis (4.28) (Aufgabe 7.3), mit (7.52) dagegen erhielte das spätere Ergebnis (7.60) auf der rechten Seite einen Faktor zwei. In der nicht-quantisierten Klein-Gordon-Theorie ist die Definition (7.51) übrigens üblich. In vielen Büchern kommt es daher beim Übergang von der klassischen Theorie zur Quantenfeldtheorie zu einem Bruch der Darstellung, der hier vermieden wird. Da in diesem Buch durchgängig SI-Einheiten benutzt werden, dimensionsbehaftete Faktoren also immer berücksichtigt werden, bedeutet es keinen großen zusätzlichen Aufwand, wenn in aus Gründen der Kompatibilität mit der Schrödinger- und der klassischen Klein-Gordon-Theorie der zusätzliche Faktor 1/(2m 0 ) eingebaut wird. Dieser wirkt sich nicht auf alle Ergebnisse aus, wird aber bei einigen zwangsläufig auftreten. Das wird nicht in jedem Fall eigens vermerkt, sondern nur bei einigen besonders wichtigen Ergebnissen. Dem Leser wird empfohlen, beim Vergleich mit anderen Büchern den Faktor in Erinnerung zu behalten. ist offensichtlich ein Lorentz-Skalar. Aus (7.18) folgt wieder (7.44) bzw.
∂ ∂φ
∂ ∂ ∂ x β ∂φ,β wobei
und
∂ , ∂φ
∂ ∂ ∂ x β ∂φ ,β
wieder in umbenannt wurde. Mit h 2 β ∂ (7.51) h 2 αβ g ∂α φ ∂ φ, ∂φ ,β
2m 0
(7.53)
m 0 c2 φ 2
∂ ∂φ
2m 0
(7.54)
und entsprechenden Ausdrücken für ∂ /∂φ,β etc. ergeben sich aus den Gleichungen (7.53) die Klein-Gordon-Schrödinger-Gleichung h 2 ∂β ∂ β φ
h 2 φ m 02 c2φ
(7.55)
und die zu ihr konjugiert-komplexe Gleichung. Zur Ableitung der kanonischen Impulse benötigen wir die ausführliche Form 2 2 h 2 2mh c2 φ φ 2m φ φ m 02c φφ
von
. Es folgt π
0
(7.56)
0
2 ∂∂φ 2mh c2 φ 0
,
π
2 ∂∂φ 2mh c2 φ π
0
(7.57)
7.4 Anwendung auf spezielle Felder
169
(π ist der zu φ kanonisch-konjugierte Impuls, π ist das Konjugiert-Komplexe des zu φ konjugierten Impulses), und die Hamilton-Dichte lautet
πφ π φ
4m 0 c2
h 2
ππ
2m 0 c2 h 2
ππ
h 2 φ 2m 0
φ
m 0 c2 φφ 2
oder 2m 0 c2
h 2
ππ
h 2 φ 2m 0
φ
m 0 c2 φφ . 2
(7.58)
Hiermit und mit η φ folgen aus (7.31) die Gleichungen φ
δ δπ
δ δπ
2m 0 c2
π
π,
h 2
δ δφ
m 0 c2 h 2 φ φ . 2 2m 0
2 Aus der zweiten Gleichung folgt mit der ersten bzw. π h 2 φ/(2m 0 c ) nach Multiplikation mit 2m 0 die Klein-Gordon-Schrödinger-Gleichung (7.55). Mit (7.57) kann (7.58) auch in der Form
h 2 h 2 φ φ φ 2 2m 0 c 2m 0
φ
m 0 c2 φφ 2
(7.59)
2 d 3x ergibt sich hieraus durch geschrieben werden. Für die Hamilton-Funktion H Übersetzung in die Schrödinger-Form von Abschn. 4.3 (7.60) H Ψ σ3 H Ψ d 3x . Beweis: Es gilt Ψ
σ3 H Ψ
(4.22b)
Mit σ3 (i σ2 σ3 )
Ψ
σ3 (i σ2 σ3 )
(4.21)
1 0
0 1
h 2 Ψ 2m 0 1 1
1 1
Ψ σ3 m 0 c 2 σ3 Ψ .
1 1 1 1
und σ32 1 ergibt sich daraus Ψ σ3 H Ψ
h 2 (ϕ , χ ) 2m 0
h 2 (ϕ χ) (ϕ χ) m 0 c2 (ϕϕ χχ ) . 2m 0
Aus (4.16) folgt ϕχ
φ,
1 1 1 1
ϕϕ χχ
ϕ χ
m 0 c2 Ψ ψ
1 h 2 φφ 2 φ φ , 4 2 m0c
170
7 Klassische relativistische Feldtheorie
womit aus dem letzten Ergebnis Ψ σ3 HΨ
h 2 φ φ 2m 0 c2
h 2 m c2 φ φ 0 φφ 2m 0 2
wird. Hieraus ergibt sich durch Integration nach einer partiellen Integration bezüglich des zweiten Terms 4 3 2 h φ φ h 2 φ φ m 0 c2 φφ 3 3x (7.59) d 3x H . d Ψ σ3 H Ψ d x 2m 0 2 2m 0 c2
7.4.3 Maxwell-Feld Stellt man die Felder E und B mit
φ
E
∂t A ,
B
rot A
durch die Potentiale φ und A dar, so ergeben sich für diese aus den Maxwell-Gleichungen nach (E7.4)–(7.5) die Gleichungen A ∂t φ/c2 div A μ0 j . φ ∂t ∂t φ/c2 div A λ/ε0 , Mit dem Viererpotential Aα φ/c, A, dem Viererstrom jα λc, j sowie mit ∂t φ/c2 div A ∂ σ Aσ und ε0 μ0 1/c2 lassen sich diese Gleichungen in die Form ∂0 (∂ σ Aσ )
A0
μ0 j0 ,
∂l (∂ σ Aσ )
Al
μ0 jl
überführen, oder nach Heben der Indizes 0 und l zusammengefaßt in Aα
∂ α (∂ σ Aσ )
μ0 j α .
(7.61)
Gleichung (7.61) gilt, wenn keine spezielle Eichung zugrunde gelegt ist. Im Fall der Lorenz-Eichung ∂ σ Aσ 0 entfällt der zweite Term der linken Seite. Als Lagrange-Dichte mit der Dimension einer Energiedichte, bei der über einen freien Multiplikationsfaktor so verfügt ist, daß sie die mit φ verknüpfte potentielle Energiedichte wie in der klassischen Mechanik als Beitrag λφ A0 j 0 enthält, erweist sich 2μ1 (gαβ ∂α Aβ )2 (∂α Aβ )(∂ αAβ ) Aβ j β . (7.62) 0
Dabei ist der Strom j β als vorgegebenes (externes) Feld aufgefaßt, das nicht variiert wird. Die Lagrange-Gleichung (7.18) lautet mit ηr Aβ
∂ ∂A
∂ ∂ ∂ x α ∂ Aβ,α und mit
1 gαβ ∂ σ A σ μ
∂ ∂ Aβ,α
0
β
∂ αA β ,
,
(7.63)
jβ
∂ ∂ Aβ
(7.64)
7.4 Anwendung auf spezielle Felder
171
ergeben sich aus ihr unmittelbar die Maxwell-Gleichungen (7.61).2 Für den Fall der Lorenz-Eichung, ∂ β Aβ g αβ ∂α Aβ 0, lautet (7.62) ausführlicher 1 β Aβ A 2μ0 c2
1 (∂l Aβ )(∂ lAβ ) Aβ j β . 2μ0
(7.66)
Hieraus folgen nach (7.21) mit ηr A β bzw. A β die zu Aβ bzw. Aβ konjugierten Impulsdichten ∂ 1 ∂ 1 β πβ Aβ , πβ A . (7.67) 2 β μ0 c μ0 c 2 ∂ A ∂ A β
(Der Faktor 1/2 entfällt aus Gründen, die den in Fußnote 2 angegebenen entsprechen.) Als Hamilton-Dichte ergibt sich damit
πβ A β πβ A β 2μ1 c2 A β A β 2μ1 0
0
(∂l Aβ )(∂ lAβ )
Aβ j β
oder nach Elimination von A β mit Hilfe von (7.67)
Aus π β onsverhalten
μ0 c 2 πβ π β 2
2μ1
0
(∂l Aβ )(∂ lAβ )
Aβ j β .
(7.68)
∂0 Aβ /(μ0 c) folgt bei einer Lorentz-Transformation das Transformati-
π ¼β
∂0¼ A¼ β μ0 c
Λ 0 0 Λβ γ π γ
∂ x α/∂ x ¼ 0 ∂α (Λβ γ Aγ ) μ0 c Λl 0 Λβ γ ∂l Aγ , μ0 c
Λ α 0 Λβ γ ∂α Aγ μ0 c
d. h. die kanonischen Impulse sind keine Vierervektoren. Die Auswertung der Hamiltonschen Bewegungsgleichungen (7.31) mit (7.68) führt zu den Feldgleichungen (7.61) ohne den Term ∂ α (∂ σ Aσ ) zurück (Aufgabe 7.4). Bei der Berechnung ihrer Lösungen muß die Eichbedingung ∂ σ Aσ 0 als Nebenbedingung berücksichtigt werden.
2 Man beachte, daß bei der Ableitung des Klammerterms von nach Aβ,α auch ∂ α Aβ g αρ g βσ Aρ,σ differenziert werden muß, was am einfachsten wird, wenn man Tαβ ∂ α Aβ T αβ ∂α Aβ benutzt. In der Literatur wird häufig statt (7.62) die Lagrange-Dichte
¼
1 (∂α Aβ )(∂ β Aα ) 2μ0
(∂α Aβ )(∂ α Aβ )
Aβ j β
1 Fαβ F αβ 4μ0
Aβ j β
(7.65)
mit Fαβ ∂α Aβ ∂β Aα Aβ,α Aα,β benutzt, die ebenfalls zu (7.61) führt. Diese besitzt jedoch den Nachteil, daß sie in der Hamilton-Theorie π 0 0 zur Folge hat. Bei der kanonischen Feldquantisierung geht man dann zu einer anderen Dichte über, die im wesentlichen (7.62) entspricht.
172
7 Klassische relativistische Feldtheorie
In Aufgabe 7.5 werden die Ausdrücke berechnet, die sich für πα bzw. π α und für ohne die Lorenz-Eichung ergeben. Sie lauten π0 und
1 l ∂ Al , μ0 c
π0
2μ1
0
1 Al , μ0 c 2
πl
πl
1 l A μ0 c 2
(7.69)
1 β 2 σ l β σ 2 A A (∂ A )(∂ A ) A ∂ A (∂ A ) Aβ j β . β l β 0 σ σ c2 c
(7.70)
7.4.4 Dirac-Feld Wir betrachten zunächst den Spezialfall freier Teilchen, also die Dirac-Gleichung h α γ ∂α ψ i
m 0c ψ 0
(7.71)
und die dazu adjungierte Gleichung, (2.213) mit Aα 0, h ∂α ψ γ α i
m0c ψ
0.
(7.72)
Als Lagrange-Dichte mit der Dimension einer Energiedichte errät man
h c ψ γ α ∂α ψ i
m 0 c2 ψψ
.
(7.73)
Für diese gilt
∂ ∂ψ
2
m 0c ψ ,
h c ψ γ α , i
∂ ∂ψ,α
∂
∂ψ
∂
h c α γ ∂α ψ i
m0c ψ
2
,
0,
∂ψ ,α
und aus (7.18) folgt für ηr ψ bzw. ηr ψ h α γ ∂α ψ i
m0c ψ 0
bzw.
h ∂α ψ γ α i
m0c ψ ,
also die Dirac-Gleichung (7.72) bzw. die zu dieser adjungierte Gleichung. (An sich müßte dies für jede Spinorkomponente der Gleichung einzeln gezeigt werden, aber man kann die dabei erhaltenen Ergebnisse, wie geschehen, gleich wieder zu Spinoren zusammenfassen. Die Ableitung ∂ /∂ψ ist dabei als Spaltenmatrix aufzufassen, in der die Elemente ∂ /∂ψ 1 , ∂ /∂ψ 2 usw. stehen.) Ausführlicher ist durch
ih ψ γ 0 ψ hic ψ γ l ∂l ψ
m 0 c2 ψ ψ
(7.74)
7.4 Anwendung auf spezielle Felder
173
gegeben. Hieraus folgt der zu ψ kanonisch-konjugierte Impuls π
ih ψ γ 0
∂ ∂ψ
(2.212)
ih ψ γ 0 γ 0
der zu ψ konjugierte Impuls π verschwindet. Für
πψ
(7.75) hc
i
ψ γ l ∂l ψ
ψ γ0 ψ
π
ih
m 0 c2 ψψ .
(2.205)
ih ψ ,
(7.75)
finden wir daher hc ψ γ l ∂l ψ i
m 0 c2 ψψ (7.76)
von den kanoniWie bei der Schrödinger-Gleichung besteht das Problem, daß schen Impulsen π und π unabhängig ist, so daß aus (7.29a) ψ δ /δπ 0 folgen würde. Ähnlich wie bei dieser muß daher Gleichung (7.75) zur Elimination von ψ benutzt werden. Dazu multiplizieren wir diese von rechts mit γ 0 und erhalten ψ πγ 0 /(i h). Aus (7.76) ergibt sich damit die komplexwertige Hamilton-Dichte
cπγ 0 i h
h l γ ∂l ψ i
m 0 cψ
.
(7.77)
Für spätere Zwecke sei angemerkt, daß sie mit (7.75d) und (2.171) auch in der Form
ψ H D ψ
mit
H D
cαl
h ∂l i
m 0 c2 β
(7.78)
geschrieben werden kann, wobei H D nach (2.44) der Hamilton-Operator der in der Form ψ geschriebenen Dirac-Gleichung ist. Die Hamilton-Funktion (7.35b) ist i h∂ tψ H D (7.79) H ψ H D ψ d 3x . Für die in Abschn. 2.4 untersuchten Ebene-Welle-Lösungen ergibt sich hieraus mit (2.71a) und (2.78) H Ep ψ ψ d 3x , was bei Einschränkung der Lösungen auf das Volumen eines Würfels zum Zwecke der 2 Normierbarkeit mit der Normierungsbedingung ψ ψ d 3x 1 zu H Ep führt. Im Gegensatz zu dem, was wir in Abschn. 7.5.2 beim Klein-Gordon-Schrödinger-Feld feststellen werden, führt hier auch die (klassische) Feldtheorie (außer zu positiven) noch zu negativen Energien. Erst die Feldquantisierung verhilft schließlich auch dem Dirac-Feld zu ausschließlich positiven Energien (Abschn. 8.4.2). Die zu (7.77) gehörigen Hamilton-Gleichungen (7.31) lauten δ 1 hc δ 1 0 l 2 0 2 0 hc 0 l γ γ ∂l ψ m 0 c γ ψ , π m 0 c πγ ∂l πγ γ . ψ δπ i h i δψ i h i
174
7 Klassische relativistische Feldtheorie
Aus der ersten dieser Gleichungen folgt nach Linksmultiplikation mit γ 0 /c die DiracGleichung (7.71), aus der zweiten nach Multiplikation mit 1/c und Einsetzen von (7.75) die zu dieser adjungierte Gleichung (7.72). Jetzt wenden wir uns dem Fall der Dirac-Gleichung mit elektromagnetischem Feld zu. Nach (2.173) geht diese mit e q aus der Dirac-Gleichung für freie Teilchen durch die (2.145) entsprechende Ersetzung (h /i)∂α (h /i)∂α q Aα hervor. Statt (7.73) erwarten wir daher die Lagrange-Dichte
hc ψ γ α ∂α ψ i
m c ψψ cqψγ A ψ . 0
α
2
(7.80)
α
Die daraus folgenden Lagrangeschen Bewegungsgleichungen (7.18) lauten
h α γ ∂α ψ i
qγ A ψ m cψ 1c ∂∂ψ 1c ∂ ∂x α
α
0
∂ α
∂ψ ,α
0,
führen also zu (2.173). Da der durch das Feld Aα hinzugekommene Term nicht von ψ und ψ abhängt, ergeben sich als kanonische Impulse wieder π 0 und (7.75) sowie die Hamilton-Dichte
π ψ cqψγ A ψ cqπγ γ A ψ/(i h ) , α
0
α
0 α
0
α
(7.81)
wobei 0 die Hamilton-Dichte (7.77) ohne elektromagnetisches Feld ist. Nach (2.220b) ist cψγ α ψ die Teilchenstromdichte. Wird diese mit der Teilchenladung q multipliziert, so entsteht aus ihr die elektromagnetische Stromdichte.Wird auch in der Form diese mit jelα bezeichnet, so können wir
j 0
α el A α
mit
jelα
qcψγ
α
ψ
(7.82)
schreiben.
7.5
Noether-Theorem und Erhaltungssätze
7.5.1 Ableitung des allgemeinen Noether-Theorems
Wie in der Mechanik folgen auch in einer Feldtheorie Erhaltungssätze, beson2 wenn dere Symmetrien vorliegen. Das ist der Fall, wenn die Wirkung S d 4 x bei einer gemeinsamen (aktiven) Transformation xα
α
x¼ ,
ηr (x)
ηr¼ (x ¼ )
der Koordinaten und Feldvariablen unverändert bleibt, d. h. wenn ¼ ¼ ¼ ¼ 4 ¼ (ηr , ∂ α ηr , x ) d x (ηr , ∂α ηr , x) d 4 x
(7.83)
(7.84)
7.5 Noether-Theorem und Erhaltungssätze
175
gilt. Da jede endliche Transformation aus infinitesimalen Transformationen zusammengesetzt werden kann, genügt es, wenn wir unsere Betrachtung auf letztere einschränken. Wir definieren dxα
x¼
α
xα ,
dηr
ηr (x ) ¼
ηr (x) .
¼
(7.85)
Aus x ¼ α x α d x α folgt ∂ x ¼α ∂xβ
∂xβ ∂ x ¼α
δαβ ∂β d x α ,
δβα
∂ ¼α d x β
δβα
∂α d x β ,
da unter Vernachlässigung von Termen quadratischer Ordnung in den Differentialen ∂ dxβ ∂ x ¼α
∂∂dxxγ
β
∂xγ ∂ x ¼α
β
∂∂dxxγ
gilt, außerdem ist d4x ¼
det
δγα
∂ ¼α d x γ
∂ x ¼α ∂xβ
β
∂∂dxxα (d x 2)
d4x .
Die Determinante besteht aus einer Summe von Produkten aus jeweils vier Elementen der Matrix ∂ x ¼ α/∂ x β δ αβ ∂β d x α , unter denen auch das Produkt der Diagonalterme enthalten ist. Alle außer diesem enthalten mindestens zwei Nicht-Diagonalterme und sind daher mindestens von der Ordnung (d x 2 ), sodaß sie weggelassen werden dürfen. Einen Beitrag erster Ordnung liefert nur das Produkt der Diagonalterme, und dieses ist 3 + ∂x α ∂xα ¼
α 0
3 +
(1 ∂α d x α ) 1 ∂α d x α (d x 2 ) .
α 0
Damit ergibt sich d4x
(1 ∂α d x α ) d 4 x .
(7.86)
Weiterhin gilt ∂ηr ∂ x α
∂(ηr∂x βdηr ) ∂∂xx α β
ηr,β ∂β dηr
δ βα ∂α d x β
ηr,α (dηr ),α
ηr,β ∂α d x β,
wobei das Produkt zweier Differentiale weggelassen wurde. Damit erhalten wir bis zu Termen erster Ordnung (ηr , ∂ α ηr , x ) d 4x ηr dηr , ηr,α (dηr ),α ηr,β ∂α d x β, x α d x α 1∂β d x β d 4x
(ηr , ηr,α , x) d 4 x d d 4x (ηr , ηr,α , x) (∂β d x β ) d 4x
mit d
∂ ∂ ∂η dηr ∂η r
r,α
(dηr ),α
∂ ηr,β ∂α d x β ∂ηr,α
(7.87)
∂∂xβ d x β ,
wobei die „explizite Ableitung“ ∂ /∂ x β bedeutet, daß die Ableitung nach x β entgegen unserer früheren Verabredung (Fußnote 1) bei festegehaltenen ηr und ηr,α gebildet
176
7 Klassische relativistische Feldtheorie
wird. Mit der Ableitung ∂ /∂ x β , bei der nur die unabhängigen Variablen x β x α festgehalten und die Feldgrößen ηr sowie ηr,α variiert werden, besteht der Zusammenhang
∂ (ηr , ηr,α , x) ∂xβ
∂ ∂ ∂η ηr,β ∂η
r
r,α
∂β ηr,α
∂∂xβ .
Wenn dies in d eingesetzt und ∂ /∂ηr (zweimal) mit Hilfe von (7.18) ersetzt wird, folgt ∂ ∂ ∂ ∂ s.u. d dηr ∂α dηr ηr,β ∂α d x β ∂ x α ∂ηr,α ∂ηr,α ∂ηr,α ∂ ∂x α ∂η∂ ηr,β d x β ∂η∂ (∂α ηr,β ) d x β ∂∂x β d x β , r,α r,α
wobei für den vorletzten Term ∂β ηr,α ∂α ηr,β benutzt wurde. Durch das Zusammenfassen von Ableitungen ergibt sich schließlich ∂ ∂ ∂ ∂ d α dηr ηr,β d x β β d x β . (7.88) ∂x ∂ηr,α ∂ηr,α ∂x
Hiermit und mit (7.87) lautet die Symmetrieforderung (7.84)
∂ ∂ ∂ α β d x d4x d ∂β d x β d 4 x dη η δ β r r,β α ∂η ∂ x ∂η r,α r,α G G
0.
Wenn wir verlangen, daß (7.84) bzw. diese Bedingung für beliebige Gebiete G gilt, erhalten wir aus ihr den als Noether-Theorem bezeichneten differentiellen Erhaltungssatz
∂ ∂ ∂ α β d x dη η δ 0. (7.89) β r r,β ∂ x α ∂ηr,α ∂ηr,α
Hinweis. Auf folgendes sei noch hingewiesen. In Gleichung (7.83b) kann sich ηr einerseits dadurch ändern, daß bei gleichbleibendem Ort das Feld abgeändert wird, andererseits dadurch, daß bei festgehaltenem Feld im Ort von x zu x ¼ übergegangen wird. Wird der erste dieser beiden Bestandteile mit δηr (x) ηr¼ (x) ηr (x)
(7.90)
bezeichnet, so folgt aus (7.85b)
ηr (x ) ηr (x ) ηr (x ) ηr (x) (7.90) δηr (x ) ηr,α d x α s.u. δηr (x) ηr,α d x α. (Dabei wurde in δηr (x )δηr (x)(∂α δηr )d x α der in differentiellen Größen quadratidηr
¼
¼
¼
¼
¼
¼
sche zweite Term weggelassen.) Hiermit kann (7.89) auch in die Form ∂ ∂ α δη d x 0 r ∂ x α ∂ηr,α
gebracht werden.
(7.91)
7.5 Noether-Theorem und Erhaltungssätze
177
7.5.2 Translationsinvarianz und Energie-Impuls-Erhaltung Besitzt das Feld ηr (x) raum-zeitliche Verschiebungsinvarianz, so gilt dηr bige konstante d x β εβ 0. Mit der Definition Θ αβ
∂η∂
r,α
ηr,β
δαβ
0 für belie-
(7.92)
folgt dann aus (7.89) wegen der raum-zeitlichen Konstanz der εβ εβ ∂α Θ αβ
0.
Da die Verschiebungsinvarianz bei beliebigen Verschiebungen bestehen soll, können die Verschiebungen εβ unabhängig voneinander beliebig gewählt werden, insbesondere so, daß nur eine der vier von null verschieden ist. Damit folgt aus der zuletzt abgeleiteten Gleichung die Kontinuitätsgleichung ∂α Θ αβ
∂ α Θαβ 0 .
(7.93)
Nach unseren Erfahrungen aus der Mechanik und der Elektrodynamik erwarten wir, daß Θ αβ der Energie-Impuls-Dichtetensor ist. Tatsächlich gilt Θ 00
∂∂η ηr (7.21) π r ηr (7.24) r
,
(7.94)
d. h. Θ 0 0 ist die Hamilton-Dichte des betrachteten Feldes, die in sämtlichen der in Abschn. 7.4 untersuchten Spezialfälle mit der Energiedichte übereinstimmt. Nach der Speziellen Relativitätstheorie, Abschn. „Kovariante Formulierung der Elektrodynamik“, muß demnach 1 Θ 0 α d 3x E/c, p (7.95) c gelten, wobei E die Energie und p der Impuls des Feldes ist. Mit (7.94), der Beziehung Θ 0l c(∂ /∂ η r )ηr,l cπ r ηr,l und pl pl ergibt sich aus (7.95)
E
p
d 3x ,
π r ηr d 3x .
(7.96)
Bei der Ableitung des Erhaltungssatzes (7.93) wurde nichts über das zugrundeliegende Inertialsystem ausgesagt,2d. h. dieses kann beliebig gewählt werden. Allerdings ist zu beachten, daß die Größen Θ 0α d 3x/c keine Vierervektoren sind, im allgemeinen gilt vielmehr 1 1 0α 3 ¼ Θ dx Θ 0β d 3x Λ αβ . c c ¼
Dies bedeutet, daß beim Übergang 2S S ¼ zwischen Inertialsystemen Θ αβ als Tensor transformiert und dann E ¼ /c, p¼ Θ 0α d 3x ¼ gesetzt werden muß. ¼
178
7 Klassische relativistische Feldtheorie
(7.93) ist äquivalent zu ∂t Θ 0β c∂l Θ lβ . Für β 0 bzw. β 1, 2, 3 ergibt sich hieraus durch räumliche Integration der Energie- bzw. Impulserhaltungssatz dE dt
d dt
IR3
Θ
0
0d
3
x
0,
d pl dt
s.u.
d dt
Θ 0l 3 dx IR3 c
0.
s.u.
(7.97)
(Man beachte pl pl und Θ 0 l Θ 0l .) Dabei wurde mit Hilfe des Gaußschen Satzes die Umformung ∂ l 3 Θβd x Θ lβ d fl 0 l IR3 ∂ x vorgenommen und angenommen, daß Θ lα im Unendlichen hinreichend schnell verschwindet. Die Voraussetzungen für die Gültigkeit der Erhaltungssätze (7.97) sind offensichtlich immer erfüllt, wenn die Lagrange-Dichte nicht explizit vom Ort und von der Zeit abhängt. Für das Klein-Gordon-Schrödinger-Feld ergibt sich aus (7.96a) mit (7.59) die Feldenergie 2 1 h h 2 2 E φφ φ φ m 0c φφ d 3x. (7.98) 2 IR3 m 0 c2 m0 Diese ist positiv definit, d. h. die Feldtheorie liefert nur positive Energiewerte für das Klein-Gordon-Schrödinger-Feld und beseitigt damit die Schwierigkeiten, die bei der Ein-Teilchen-Deutung hinsichtlich der Energie entstanden sind. In Abschn. 7.4.2 wurde gezeigt, daß (7.98) mit dem verallgemeinerten Mittelwert (7.60) für die Energie übereinstimmt. Der Impuls des Klein-Gordon-Schrödinger-Feldes ist nach (7.96b) mit η1 φ und η2 φ π φ π φ d 3x . p (7.99) IR3
Beim freien Dirac-Feld hängt ist pl
1c
Θ 0l d 3x
oder
nach (7.74) nur von ψ und nicht von ψ ab. Daher
(7.92)
p
∂ ψ,l d 3x ∂ ψ
i h
i h
(7.75)
ψ ψ,l d 3x
ψ ψ d 3x .
(7.100)
Symmetrie des Energie-Impuls-Tensors. Aus (7.92) folgt mit (7.51) Θαβ
h 2 2m
0
(∂α φ )(∂β φ) (∂α φ)(∂β φ )
gαβ
Θβα .
(7.101)
Der Energie-Impuls-Tensor des Klein-Gordon-Schrödinger-Feldes ist also symmetrisch, was darauf zurückzuführen ist, daß φ ein skalares Feld ist. Aus der Definition (7.92) folgt dagegen im allgemeinen kein symmetrischer Energie-Impuls-Tensor. In
7.5 Noether-Theorem und Erhaltungssätze
179
der Speziellen und Allgemeinen Relativitätstheorie wiederum erwies sich der EnergieImpuls–Tensor bzw. der Materietensor eines Systems von Punktteilchen, des elektromagnetischen Feldes und allgemeiner aller gravitationserzeugenden Ursachen als symmetrisch (siehe Spezielle Relativitätstheorie und Allgemeine Relativitätstheorie). Da die von uns betrachteten Felder materielle Teilchen beschreiben sollen, ist es daher wünschenwert, auch bei allen Quantenfeldern mit einem symmetrischen EnergieImpuls-Tensor rechnen zu können. Das ist tatsächlich möglich, weil sich aus dem Erhaltungssatz (7.93) für Θαβ eine ganze Klasse weiterer Erhaltungssätze für Größen Tαβ ableiten läßt, an die weitergehende Forderungen gestellt werden können. Um diese zu erhalten, wählen wir den Ansatz Θαβ
Tαβ
∂ σ f σ αβ
(7.102)
mit einem dreistufigen Tensor f σ αβ . Die Symmetrieforderung Tαβ führt zu der Gleichung ∂ σ ( f σ αβ
Tβα
(7.103)
fσβα ) Θβα Θαβ ,
(7.104)
und die aus (7.102) mit (7.93) folgende Gleichung ∂ α Tαβ
∂ α ∂ σ fσ αβ ∂ σ ∂ α fασβ 12 ∂ α ∂ σ
f ασβ
fσ αβ
führt zu der Kontinuitätsgleichung ∂ α Tαβ
0,
(7.105)
wenn wir an f ασβ noch zusätzlich die Antisymmetrieforderung f ασβ
fσ αβ
(7.106)
stellen. Aus dieser folgt f ααβ 0, was zur Folge hat, daß bei festem β noch sechs Komponenten frei wählbar sind, so daß es unter Einschluß der vier Möglichkeiten für die Wahl von β insgesamt 4 624 unabhängige Komponenten fσ αβ gibt. Von diesen müssen die linearen partiellen Differentialgleichungen (7.104) erfüllt werden. Da wegen der Antisymmetrie in α und β nur 6 von ihnen unabhängig sind, haben sie immer eine Lösung. Wird diese in (7.102) eingesetzt, so besitzt Tαβ die Symmetrieeigenschaft (7.103) und erfüllt die Kontinuitätsgleichung (7.105). Die aus Tαβ in Analogie zu (7.95) gemäß 1 T 0α d 3x E/c, p (7.107) c abgeleiteten Werte für Energie und Impuls stimmen mit den aus Θαβ abgeleiteten Werten überein, denn es gilt s.u. σ 0 3 s.u. l 0 3 ∂ fσ α d x ∂ fl α d x fl 0 α d f l 0 IR3
IR3
½
180
7 Klassische relativistische Feldtheorie
), und damit folgt
( f 0 0 α verschwindet wegen (7.106), und es gilt fl 0 α 0 für x Θ 0α d 3x . T 0α d 3x
7.5.3 Rotationsinvarianz und Drehimpulserhaltung In diesem Abschnitt werden Erhaltungssätze abgeleitet, die aus dem Noether-Theorem bei Invarianz der Wirkung gegenüber raum-zeitlichen Drehungen folgen. Ausder für räumlicheDrehungen gültigen Beziehung d x (x ¼ x) d x bzw. d xi j,k εi j k dϕ j x k k dϕik x k mit dϕik j εi j k dϕ j entnehmen wir für raumzeitliche Drehungen um den Koordinatenursprung x α 0 den Ansatz
x x dϕ
dxα
¼
α
α
αβ
xβ
(7.108)
mit in Raum und Zeit konstanten Drehwinkeln dϕ αβ . Damit es sich wirklich um Drehungen handelt, muß die Invarianz des Abstands vom Koordinatenursprung, also (x α d x α )(x α d x α ) x α x α gefordert werden, unter Vernachlässigung von Termen zweiter Ordnung also 2x α d x α 2x α x β dϕ αβ 2x β x α dϕ βα x α x β dϕ αβ dϕ βα 0.
Hieraus folgt
dϕ αβ
dϕ
βα
.
(7.109)
Bei der räumlichen Drehung eines Vektorfeldes ist die Feldänderung proportional zum Drehwinkel und zur Feldstärke (Abb. 7.2). In Verallgemeinerung dieses Sachverhalts betrachten wir Änderungen des Feldes ηr (x), die durch dηr
η (x ) η (x ) 12 I ¼
r
¼
α
βγ s rs dϕβγ η
α
r
(7.110)
gegeben sind, wobei ηr ηr gesetzt wurde, um auch bezüglich des Index r die relativistische Summenkonvention (Summation, wenn ein oberer und ein unterer Index überβγ einstimmen) benutzen zu können. Dabei kann an die Koeffizienten Irs die Antisymmetrieforderung βγ
Irs
I
γβ rs
(7.111)
gestellt werden, da wegen βγ
Irs dϕβγ
I
I
(7.109) γβ rs dϕγ β
γβ rs dϕβγ
12
βγ
Irs
I
γβ rs
dϕβγ
nur ihr antisymmetrischer Anteil einen Beitrag zu dηr liefert. Der Zusammenhang (7.108) zwischen x ¼ α und x α ist eine affine Transformation, die den Abstand x α x α invariant läßt. Nach Abschn. „Lorentz-Transformation – Affinität der Transformation“ der Speziellen Relativitätstheorie handelt es sich daher um
7.5 Noether-Theorem und Erhaltungssätze
181
B B d B B dϕ Abb. 7.2: Drehung eines Vektorfeldes um den Koordinatenursprung.
dϕ
dϕ
eine Lorentz-Transformation. Gleichung (7.110) beschreibt die durch diese induzierte Transformation des Feldes ηr (x). (In Aufgabe 7.7 wird gezeigt, daß das aus (2.180) mit (2.200) hervorgehende Transformationsgesetz für Spinoren bei infinitesimalen Drehungen (ϕ dϕ) in (7.110) enthalten ist.) Die funktionale Abhängigkeit der LagrangeDichte von ηr , ∂α ηr und x muß in jedem Inertialsystem die gleiche sein, außerdem ist ein Skalar und daher invariant. Dies hat zur Folge, daß für die durch (7.108) und (7.110) beschriebenen infinitesimalen Lorentz-Transformationen ¼ ¼ ¼ ¼ ¼ ¼ (7.112) ηr (x ), ∂α ηr (x ), x ηr (x), ∂α ηr (x), x
gelten muß. Da für diese außerdem d 4 x ¼ d 4 x ist, folgt die Gültigkeit der Invarianzbeziehung (7.84) und damit des Erhaltungssatzes (7.89). Mit (7.108), (7.110) und (7.92) lautet dieser ∂ 1 ∂ βγ s αβ γ dϕβγ I η Θ x 0, (7.113) rs ∂ x α 2 ∂ηr,α
wobei die raum-zeitlich konstanten dϕβγ vor die Ableitung gezogen werden konnten. Unter Benutzung von β γ (7.109) 1 Θ αβ x γ Θ αγ x β dϕβγ dϕβγ Θ αβ x γ dϕγ β Θ αγ x β 2 kann die letzte Gleichung auch in die Form 1 dϕβγ ∂α 2 mit
αβγ s.u.
1 ∂ βγ Irs ηs c ∂ηr,α
αβγ
0
(7.114)
Θ αβ x γ Θ αγ x β
(7.115)
gebracht werden, in der der Faktor 1/c eingefügt wurde, damit αβγ eine geeignete Dimension erhält. Der Tensor αβγ ist in den beiden letzten Indizes antisymmetrisch,
αβγ
αγ β ,
was aus (7.111) und der Struktur des Terms in runden Klammern hervorgeht. Nach (7.114) muß das Produkt des antisymmetrischen Tensors ∂α αβγ mit dem antisymmetrischen Tensor dϕβγ für jede beliebige Wahl des letzteren verschwinden. Das ist nur möglich, wenn
∂ βγ s αβγ (7.93) 1 βγ γβ c ∂α ∂η Irs η Θ Θ 0 (7.116) ∂α r,α
182
7 Klassische relativistische Feldtheorie
gilt. (7.116) ist ein differentieller Erhaltungssatz für die Tensordichte der integrale Erhaltungssatz d 0βγ 3 dx 0 dt folgt, d. h. die Größe
αβγ,
aus dem
M αβ
0αβ
d 3x
L αβ
S αβ
M βα
(7.117)
mit L
αβ
1 c
α
x Θ
0β
β
x Θ
0α
3
d x L
βα
,
1 ∂ S I αβ ηs d 3x c ∂ηr,0 rs αβ
(7.111)
S βα
(7.118) ist eine Erhaltungsgröße. Nach (7.95) ist Θ 0l/c eine Impulsdichte, der Integrand von L lm also das Kreuzprodukt aus dem Ortsvektor und der Impulsdichte in Komponentendarstellung. Die räumlichen Komponenten von L αβ können daher als Bahndrehimpulskomponenten aufgefaßt werden. lm 0 gilt für den Bahndrehimpuls allein offensichtlich kein ErhaltungsIm Fall Irs satz. Es liegt nahe, S lm als einen intrinsischen Drehimpuls des Feldes aufzufassen, der durch den Spin der dem Feld zugeordneten Teilchen zustande kommt. Von der Richtigkeit dieser Interpretation werden wir uns später am Beispiel des Dirac-Feldes überzeugen. Die Erhaltung der raum-zeitlichen Komponenten M 0α M α0 stellt den Schwerpunktsatz dar (Aufgabe 7.9). βγ Im Fall skalarer Felder, ηr φ, sind alle Koeffizienten Irs 0, und aus (7.116) folgt Θ γ β Θ βγ 0, d. h. der Tensor Θ αβ muß symmetrisch sein, wie wir das z. B. auch beim Klein-GordonSchrödinger-Feld festgestellt haben. Wenn Θ αβ nicht symmetrisch ist, kann mit (7.102) zu einem symmetrischen Energie-Impuls-Tensor übergegangen werden. Dann stellt sich allerdings die Frage, wie sich durch T αβ eine geeignete Drehimpulsdichte darstellen läßt. Der einfache Zusammenhang :αβγ 1 T αγ x β T αβ x γ , (7.119) c
der dem Spin scheinbar nicht Rechnung trägt, erweist sich als passend. Mit (7.103) und (7.105) ergibt sich, daß :αβγ die Kontinuitätsgleichung
∂α :αβγ
0
erfüllt. Die zur Symmetrisierung von Θ αβ benutzte Funktion f σ αβ und eine weitere, in den beiden ersten Indizes antisymmetrische Funktion g σ αβγ
g ασβγ
(7.120)
7.5 Noether-Theorem und Erhaltungssätze
lassen sich so bestimmen, daß zwischen
:
αβγ
183 αβγ
αβγ
und :αβγ der Zusammenhang 1 ∂σ g σ αβγ c
(7.121)
besteht (Beweis unten), der mit g 00βγ g 00βγ 0 die Gleichung 1 l0αβ 3 αβ 0αβ 3 0αβ 0αβ 3 : : ∂l g dx dx dx M c
M αβ
zur Folge hat. Die aus :αβγ berechneten Drehimpulse stimmen also mit den aus berechneten überein und enthalten daher auch einen Spinanteil.
αβγ
Beweis: Aus (7.119) und (7.121) folgt mit (7.102) und (7.115), daß g σ αβγ die Gleichung x β ∂σ f σ αγ
x γ ∂σ f σ αβ
∂η∂
r,α
βγ
Irs ηs
∂σ gσ αβγ
erfüllen muß. Mit dem Ansatz g σ αβγ
x β f σ αγ
x γ f σ αβ
(7.122)
folgt aus dieser die Gleichung f γ αβ
f βαγ
∂η∂
r,α
βγ
Irs ηs ,
und man verifiziert leicht durch Einsetzen, daß sich hieraus 1 αβ ∂ ∂ βσ ∂ σ αβ ασ 2 Irs ∂η Irs ∂η Irs ∂η ηs f r,σ r,α r,β
ergibt. f σ αβ genügt der Symmetriebedingung (7.106), denn 1 σβ ∂ Irs f ασβ Irsβα ∂η∂ Irsσ α 2 ∂ηr,α r,σ 1 βσ ∂ (7.111) Irs Irsαβ ∂η∂ Irsασ 2 ∂ηr,α r,σ
∂ ∂ηr,β ∂ ∂ηr,β
ηs ηs
f σ αβ ,
und hiermit sowie mit (7.122) folgt die Erfüllung der Symmetriebedingung (7.120). Es verbleibt, zu zeigen, daß auch Gleichung (7.104) erfüllt wird. Hierzu berechnen wir 1 αβ ∂ βσ ∂ βα ∂ βσ ∂ ασ ∂ ασ ∂ Irs ηs Irs Irs Irs Irs Irs f σ αβ f σβα 2 ∂ηr,σ ∂ηr,α ∂ηr,β ∂ηr,σ ∂ηr,β ∂ηr,α
(7.106) αβ Irs
∂ ηs . ∂ηr,σ
Aus (7.104) wird damit
αβ ∂ ∂σ Irs ηs Θβα ∂ηr,σ
und nach (7.116) ist diese Gleichung erfüllt.
Θαβ ,
184
7 Klassische relativistische Feldtheorie
7.5.4 Eichinvarianz und Ladungserhaltung
Die Lagrange-Dichte (7.51) des Klein-Gordon-Schrödinger-Feldes ist offensichtlich invariant gegenüber der Eichtransformation φ φ ¼ φ e iδ , die bei der Wellenfunktion eine konstante Phasenverschiebung δ bewirkt – es gilt φ ¼ φ ¼ £ φφ £ und (∂α φ ¼ )(∂α φ ¼ £ ) (∂α φ)(∂α φ £ ). Diese Invarianz gilt natürlich erst recht für die Wirkungsfunktion, so daß daraus nach dem Noether-Theorem ein Erhaltungssatz folgen muß. Für infinitesimale Transformationen δ dδ gilt
dφ
φ¼ φ φ (e 1) i dδ φ,
dφ £
i dδ
i dδ φ£ .
(7.123)
Die Transformation erfolgt ohne Veränderung der unabhängigen Variablen x α , also mit d x α 0. Die Lagrange-Dichte (7.73) des Dirac-Feldes ist invariant gegenüber der Eichtransψ ¼ ψ e iδ , es gilt ψ ¼ γ α ∂α ψ ¼ ei δ ψγ α ∂α ψe i δ ψγ α ∂α ψ und formation ψ ¼ ¼ ψ ψ ψψ sowie
dψr
i dδ ψ ,
dψ r
r
i dδ ψ
r
dxα
,
0
(7.124)
für die infinitesimale Transformation der Spinorkomponenten ψr bzw. ψ r . Beide Beispiele sind als Spezialfälle unter den Eichtransformationen dηr
dδ λ
rs η
s
,
dxα
0
(7.125)
mit raum-zeitlich konstanten dδ und λrs enthalten. Ist die Wirkung S unter den Transformationen (7.125) invariant, so folgt aus dem allgemeinen Noether-Theorem (7.89) der differentielle Erhaltungssatz ∂ ∂ s λrs η 0 (7.126) ∂ x α ∂ηr,α
und aus diesem der integrale Erhaltungssatz ∂ d (7.21) d π r λrs ηs d 3x λrs ηs d 3x dt ∂ ηr dt
0.
(7.127)
Die hierin auftretende Erhaltungsgröße Q
π r λrs ηs d 3x
(7.128)
wird als Ladung bezeichnet. Im Fall des Klein-Gordon-Schrödinger-Feldes zeigt der Vergleich von (7.125a) mit (7.123), daß λrs i für ηs φ und λrs i für ηs φ £ zu setzen ist. Der Erhaltungssatz (7.126) erhält damit die Form ∂ ∂ α α s.u. 1 £ ∂α j 0 , (7.129) mit j i φ i £ φ h ∂φ,α ∂φ ,α
Aufgaben
185
wobei in j α aus Dimensionsgründen der Faktor 1/h hinzugefügt wurde. Mit (7.54) ergibt sich hieraus ih α jα φ ∂ φ φ ∂ α φ nc, j , (7.130) 2m 0 d. h. (7.129) ist die Kontinuitätsgleichung (4.34) mit (4.35) für den Fall Aα 0. (Die Definition (7.52) würde zu j α 2m 0 j α führen.) Für elektrisch geladene Teilchen der Ladung q folgt daraus, daß die Gesamtladung Q q
3 (7.57) i q i hq j0 3 d x φ π φπ d 3x φ ∂t φ φ ∂t φ d x c h 2m 0 c2
(7.131)
eine Erhaltungsgröße ist. Im Fall des Dirac-Feldes ist nach Gleichung (7.73) nur von ψ,α , nicht jedoch von ψ ,α abhängig, und der Vergleich von (7.125a) mit (7.124a) zeigt, daß λrs i δrs für ηs ψs zu setzen ist. Der Erhaltungssatz (7.126) erhält in diesem Fall die Form
∂α j α
0
mit
jα
i ∂ δrs ψs h ∂ψr,α
i ∂ (7.73) ψ cψγ α ψ, h ∂ψ,α
(7.132) wobei in j α aus Dimensionsgründen wieder der Faktor 1/h hinzugefügt wurde. Mit ψγ 0 ψ ψ (γ 0 )2 ψ ψ β 2 ψ ψ ψ folgt daraus für elektrisch geladene Teilchen der Ladung q die Erhaltung der Gesamtladung Q
q
j0 3 dx c
q
ψ ψ d 3x .
(7.133)
Aufgaben 7.1
1. Zeigen Sie, daß die reelle Lagrange-Dichte ih h2 ψ ψ ψψ ψ ψ V ψψ 2 2m 0
wie die Dichte (7.45) auf die Schrödinger-Gleichung führt. 2. Was ergibt sich aus ihr für die kanonischen Impulse π und π ? 3. Welche Hamilton-Dichte folgt aus ihr? 7.2
1. Zeigen Sie, daß die Lagrange-Dichte der Klein-Gordon-Schrödinger-Gleichung in der Schrödinger-Form durch
ih Ψ
σ3 (∂t Ψ )
h2 ( Ψ )σ3 (i σ2 σ3 )( Ψ ) m 0 c2 Ψ Ψ 2m 0
gegeben ist. 2. Inwiefern stimmt diese mit der Lagrange-Dichte der skalaren Klein-Gordon-Schrödinger-Gleichung überein bzw. unter welchen Umständen ist das der Fall?
186
7 Klassische relativistische Feldtheorie
7.3
Bestimmen Sie den freien Faktor in der Lagrange-Dichte des Klein-Gordon2 3 x freier Wellen Schrödinger-Feldes so, daß sich als Energie E d V E
(m 0 c2 )2
c2 p2
ergibt, wenn das Volumen V die Ladung q trägt. Anleitung: Betrachten Sie ebene Wellen der Form φ(x, t) A ei(Et px)/hÆ und bestimmen Sie A aus der Normierungsforderung für die Ladung. Nach Einsetzen der normierten Ebene-Welle-Lösungen in
1 £ φφ c2
φ φ
£
m 02 c2 h 2
φφ
£
ergibt sich aus der Normierungsforderung für die Energie der zu bestimmende freie Faktor. 7.4
Zeigen Sie, daß die Hamiltonschen Bewegungsgleichungen (7.31) mit der Hamilton-Dichte (7.68) zu den Feldgleichungen (7.61) führen.
7.5
Berechnen Sie die aus der Lagrange-Dichte (7.62) folgenden Impulse πα und π α sowie die zu gehörige Hamilton-Dichte ohne Lorenz-Eichung.
7.6
1. Welche Bedingungen müssen die Komponenten der Dirac-Spinoren erfüllen, damit die Lagrange-Dichte (7.73) des Dirac-Feldes reellwertig ist? 2. Zeigen Sie, daß die Langrange-Dichte
12 hic ψ γα ∂ α ψ ψ γα∂ α ψ m 0 c2 ψψ (7.134) (der Operator ∂ α wirkt nach links auf den Spinor ψ) reell ist und wie die Lagrange-Dichte (7.73) auf die Dirac-Gleichung führt. (Explizite Rechnung!) Hinweis: In der Literatur findet man für die obige Darstellung der LagrangeDichte häufig die abkürzende Notation
hic ψ γα ∂ α ψ m 0 c2 ψψ,
(7.135)
wobei der Operator ∂ nach links und rechts wirkt und oft nach dem römischen Gott Janus der Türen und Tore mit zwei in entgegengesetzte Richtungen blickenden Gesichtern als Janus-Operator bezeichnet wird. 7.7
Zeigen Sie, daß das relativistische Transformationsgesetz für Dirac-Spinoren, 1 ¼ ¼ ¼ ρ σ ωρσ γ , γ dϕ , ψ (x ) Sψ x(x ) mit S exp 8 in dem Transformationsgesetz dηr enthalten ist.
ηr (x α ) ηr (x α ) 12 Irsβγ dϕβγ ηs ¼
¼
Aufgaben
7.8
187
Wie müssen die bei der Ableitung des Drehimpulssatzes benutzten Koeffizienten μν Irs in der Transformationsgleichung ηr¼ (x ¼α )
1 μν s dωμν Irs η 2
ηr (x α )
aussehen, damit der intrinsische Anteil S mn des Drehimpulstensors mit dem Elektronenspin Sh /2 übereinstimmt? Anleitung: Für das Dirac-Feld ist S mn durch 1 ∂ mn S I mn ψ d 3x c ∂ψ,0
gegeben. Dieser Ausdruck ist mit dem Mittelwert h ψ Σl ψ d 3x, S mn l, m, n zyklisch 2 des Spinoperators zu vergleichen. 7.9
Zeigen Sie, daß die Erhaltung der Komponenten M 0α M α0 des Tensors
α 0β β 0α 1 ∂ αβ s x Θ x Θ M αβ Irs η d 3x c ∂ηr,0
den Schwerpunktsatz darstellt.
Lösungen 7.1
1. Mit
∂ ∂ψ
i h ψ , 2
folgt aus ∂0
∂0
i h ψ , 2
∂ ∂ψ,0
∂l
∂ ∂ψ,l
h 2 ψ 2m 0
∂ ∂ ∂ α ∂ψ ∂ψ
∂ ∂ ∂l ∂ψ ∂ψ,0 ,l
,α
die Bewegungsgleichung i h ψ 2. Es gilt π
h 2 2m
0
ψ
∂ i2h ψ , ∂ψ
i h ψ
π
∂ ∂ ψ
h 2 ψ . 2m 0 i h ψ. 2
3. Damit folgt
π ψ π ψ i2h
h 2 ψ ψ V ψψ ψ ψ ψ ψ ψ ψ ψ ψ 2m 0
h 2 ψ ψ V ψψ . 2m 0
188
7 Klassische relativistische Feldtheorie
7.4
Aα
∂ ∂πα
1 α A μ0 c2
πα
Hieraus folgt
7.5
μ0 c
1 ∂00 A α μ0
∂ ∂ Aα
2π α ,
∂l
∂l ∂ l A α
∂ ∂ A α,l
jα
1 A α μ0
j
1 ∂l ∂ l A α . μ0 α.
Mit (7.64a) ergibt sich cπ β
c
∂ ∂ Aβ
∂ ∂ A β,0
1 0β σ g ∂ Aσ μ0
∂ 0A β
1 0β σ g ∂ Aσ μ0
Aβ . c
Mit g 00 1 folgt hieraus π 0
1 00 σ A0 1 0 A0 1 l g ∂ Aσ ∂ A 0 ∂ l Al ∂ Al , μ0 c c μ0 c c μ0 c
π l
1 Al μ0 c2
und
π β Aβ
(7.62)
1 0β σ Aβ 1 g ∂ Aσ Aβ (∂ σ A σ )2 μ0 c c 2μ0
7.7
1 1 Aβ Aβ (∂l A β )(∂ l A β ) A β j β 2 2μ 2μ0 c 0
1 1 1 1 (∂ σ A σ )2 Aβ Aβ (∂l A β )(∂ l A β ) A β j β . (∂ σ A σ ) A 0 2 μ0 c 2μ0 2μ 2μ0 c 0
Mit der Entwicklung S 1 18 ωρσ γ ρ , γ σ dϕ ergibt sich 1 ψ ¼ (x ¼ ) 1 ωρσ γ ρ , γ σ dϕ ψ 8
dψ
1 ωρσ γ ρ , γ σ dϕ ψ . 8
In Komponenten folgt daraus mit Summenkonvention bezüglich s dψr
1 ωρσ γ ρ , γ σ rs dϕ ψ s . 8
ωρσ ist durch (2.194) definiert, es gilt x¼
ρ
Λρσ x σ
(δ ρσ
ωρσ dϕ) x σ
xρ
ωρσ dϕ x σ
(7.108)
xρ
dϕ ρσ x σ
und als Folge davon dϕρσ
ωρσ dϕ
sowie
dψr
1 ρ σ s γ , γ rs dϕρσ ψ . 8
ρσ
(7.110) bzw. dψr 12 Irs dϕρσ ψ s ist erfüllt, wenn ρσ
Irs
1 ρ σ γ , γ rs 4
gesetzt wird. Mit γ ρ , γ σ γ σ , γ ρ ist auch die Bedingung (7.111) erfüllt.
8
Kanonische Feldquantisierung
Nachdem wir uns mit einer zur Hamiltonschen Mechanik analogen Formulierung für Felder vertraut gemacht haben, können wir jetzt eine an die Quantenmechanik angelehnte Quantisierung von Feldern in Angriff nehmen. Aus dem in Abschn. 7.1 behandelten Beispiel der Mechanik (Gleichung (7.2)) geht hervor, daß das Feld ηr (x, t) der Ortskoordinate x(t) der Mechanik entspricht. Das wird noch deutlicher, wenn wir den Raum in sehr kleine, durchnumerierte Volumenelemente Vi unterteilen und ηr (x, t) durch den Mittelwert 1 ηri (t) ηr (x, t) d 3x (8.1) Vi Vi in Vi ersetzen. Der Feldimpuls in diesem Volumenelement ist pri (t) π r (x, t) d 3x π ri (t)Vi ,
(8.2)
Vi
wobei π ri (t) die mittlere Impulsdichte in Vi ist. Jetzt machen wir die „Orte“ ηri (t) und Impulse pri (t) zu Heisenberg-Operatoren, 1 3 ri ηri (t) ηr (x, t) d x, p (t) π r (x, t) d 3x π ri (t) Vi , (8.3) Vi Vi Vi und verlangen, daß diese den vertrauten Vertauschungsrelationen p
ri
(t), p sk (t) 0,
ηri (t), ηsk (t)
0
(8.4)
und ηri (t),
p sk (t) i h δr s δi k
(8.5)
(mit dem Minus-Kommutator) genügen. Die zusammen mit ηri und pri eingeführten lokalen Operatoren ηr (x, t) und π r (x, t) hängen vom Ort und von der Zeit ab. Beim Grenzübergang Vi 0 gilt ηri (t) ηr (x, t), π ri (t) π r (x, t) sowie ri p (t) π r (x, t) Vi , und mit p
ri
(t), p sk (t) π ri (t), π sk (t) Vi Vk
folgen aus (8.4) die für alle r , s, x und x ¼ gültigen Vertauschungsrelationen π
r
(x, t), π s (x ¼ , t) 0,
ηr (x, t), ηs (x
¼
, t) 0 .
(8.6)
190
8 Kanonische Feldquantisierung
Aus (8.5) wird ηr (x, t), π s (x ¼ , t) i h δrs lim Vk
denn es gilt
δi k 3 dx f (x) Vk
*
δi k 0 Vk
f (x) f (x)
i h δrs δ 3 (x x ), für i für i
0
(8.7)
k, k.
Ersetzen wir in der Hamilton-Funktion (7.35b) mit (7.25) die Funktionen ηr (x, t) und π s (x, t) durch die zugehörigen Operatoren, so erhalten wir den Hamilton-Operator H (t) ηr (x, t), ηr,l (x, t), π s (x, t), x d 3x. (8.8) In Analogie zu den Heisenbergschen Bewegungsgleichungen q
1 q, H , i h
p
1 p, H i h
für die Operatoren q und p fordern wir als Bewegungsgleichungen für die Feldoperatoren i h ηr
ηr , H ,
i h π r
π r , H ,
(8.9)
wobei η r ∂t η r gesetzt ist und die letzte Gleichung unmittelbar aus der eigentlich zu fordernden Gleichung i h p ri p ri , H durch Herauskürzen von Vi hervorgeht. Allgemeiner fordern wir als Bewegungsgleichung für einen beliebigen Operator L
i h L
H (t) . L,
(8.10)
Da wir es in der Quantenmechanik häufig mit komplexen Wellenfeldern zu tun haben, überlegen wir uns noch, wie sich die obigen Quantisierungsregeln direkt auf diese übertragen lassen, beschränken unsere Betrachtung jedoch im Moment auf den Fall komplexer Skalarfelder. Den komplexen Wellenfunktionen ψ ψ1 i ψ2 , ψ ψ1 i ψ2 und den dazu kanonisch-konjugierten Impulsdichten1 ∂ ∂ 1 ∂ 1 1 2 π i (π i π ) , 2 ∂ ψ1 2 ∂ψ ∂ ψ2
1 Für die Ableitung einer komplexen Funktion f (z) f ¼ (z) ∂x u
i ∂x v
u(x, y)
∂y v i ∂y u
Wenn f (z) reell ist, gilt v 0, und es ergibt sich df dz
12 ∂x u 2i ∂ y u 12 (∂x f i ∂ y f ) ,
1 (∂x u 2 df dz
i v(x, y) nach der Variablen z x ∂ y v)
i (∂x v 2
df dz
i y gilt
∂ y u) .
12 (∂x f
i ∂y f ) .
Die Lagrange-Dichte ist eine reelle Funktion komplexer Argumente, und zur Berechnung von ∂ /∂ ψ x ψ 1 und y ψ 2 gesetzt werden. muß in der vorletzten Formel f , z ψ,
8.1 Quantisierung des Schrödinger-Feldes
∂ ∂ψ
π
1 2
∂ ∂ ψ1
191
1 (π 1 i π 2 )
∂ i ∂ ψ2
2
ordnen wir die Operatoren 1 1 π i π 2 , 2 (8.11) 1 1 ψ ψ1 i ψ2 , π π i π 2 2 zu, was allerdings nur möglich ist, wenn π nicht, wie im Fall des Schrödinger-Feldes, verschwindet. Aus den nach (8.6) und (8.7) für ψ i und π k gültigen Vertauschungsrelationen i k (x, t), ψ k (x , t) 0 , ψ π (x, t), π (x , t) 0, i ψ
ψ 1
i ψ 2 ,
(x, t), π ψ i
k
(x , t)
π
i h δi k δ 3 (x x )
folgen dann die Vertauschungsrelationen ψ(x, t), ψ(x π(x, t), π(x
, t) , t)
ψ(x, t), ψ π(x, t), π
(x , t) ψ (x, t), ψ (x , t) 0,
(x , t)
π
, t) 0 ψ(x, t), π (x , t) ψ (x, t), π(x
(x, t), π (x , t) 0,
(8.12)
ohne und die Vertauschungsrelation ψ(x, t), π(x
, t) ψ (x, t), π (x , t) i h δ 3 (x x)
(8.13)
mit Kommutationsrest. Bisher wurde noch nichts über den Zustandsraum gesagt, in dem die eingeführten Operatoren wirken sollen. Da die Quantisierung im Heisenberg-Bild vorgenommen wurde, muß es sich um zeitunabhängige Zustände handeln. Nähere Einzelheiten werden anhand der konkreten Beispiele besprochen, denen wir uns jetzt zuwenden wollen.
8.1
Quantisierung des Schrödinger-Feldes
Unsere ursprüngliche Motivation zur Feldquantisierung bestand darin, eine Quantentheorie des elektromagnetischen Feldes bzw. für Photonen zu finden. Da das elektromagnetische Feld für Photonen eine ähnliche Rolle spielt wie das SchrödingerFeld für die durch dieses beschriebenen Teilchen, ist es möglich und in der Tat auch einfacher, das Schrödinger-Feld auf der Ebene der Elektrodynamik als klassisches Feld zu interpretieren und der im letzten Abschnitt beschriebenen Feldquantisierung zu unterziehen.2 Da hierbei ein Feld quantisiert wird, das vorher zur Quantenbeschreibung von Teilchen eingeführt wurde, spricht man dabei manchmal von der zweiten Quantisierung. 2 Ein wesentlicher Unterschied besteht allerdings darin, daß die Schrödinger-Gleichung ebenso wie die Klein-Gordon-Schrödinger- und die Dirac-Gleichung die Quantengröße h enthält, während das auf die Maxwell-Gleichungen nicht zutrifft.
192
8 Kanonische Feldquantisierung
8.1.1 Quantisierung für Bosonen Beim Schrödinger-Feld liegt der Fall vor, der bei der Einführung der Operatoren (8.11) und der Vertauschungsrelationen (8.12)–(8.13) gerade ausgeschlossen wurde: Nach (7.46b) ist π 0, und daher läßt sich kein zum Operator ψ adjungierter Impulsoperator π definieren. Das ist allerdings auch nicht nötig, denn nach (8.8) mit (7.48) bzw. (7.50) und nach (8.9) kann die Dynamik des Systems schon durch die Operatoren ψ und π allein beschrieben werden. Für diese gilt nach (8.12)–(8.13) ψ(x, t), ψ(x ψ(x, t), π(x
, t) 0,
π(x, t), π(x
, t) 0,
, t) i h δ 3 (x x ) ,
(8.14)
und nach (7.50) ist H (t)
π(x , t) π(x , t) 3 dx HS (x ) ψ(x , t) d 3x ψ(x , t) HS (x ) i h i h
(8.15)
mit dem Schrödinger-Operator HS(x )
h 2 V (x ) . 2m
(8.16)
Dieser ist als Differentialoperator zu behandeln, der auf die Ortsabhängigkeit im Opeder rator ψ(x , t) bzw. π (x , t) einwirkt, und nicht als Operator im Hilbertraum Zustände ψ , auf die die Operatoren ψ(x , t) und π(x , t) einwirken. Wir wollen den Erwartungswert
H ψ H ψ
des Hamilton-Operators H in einem beliebigen Zustand ψ als Erwartungswert der Energie deuten und müssen daher fordern, daß er reell ist. Dies hat zur Folge, daß H hermitesch sein muß (siehe Quantenmechanik, Abschn. Q3.7.1), was mit (8.15) zu π(x , t) π(x , t) H H HS(x ) ψ (x , t) d 3x ψ (x , t) HS (x ) d 3x i h i h (8.17) führt. Schreiben wir die letzte der Vertauschungsrelationen (8.14) und mit der Umbenennung x x die zu ihr adjungierte Vertauschungsrelation in aufgelöster Form an, so erhalten wir mit den Abkürzungen ψ(x, t) ψ und π(x , t) π π π π π 3 ψ ψ ψ ψ (8.18) δ (x x ) , i h i h i h i h mit (π /i h) vertauscht. während nach (8.14 a,b) ψ mit ψ und (π/i h) Die ganze Physik des quantisierten Schrödinger-Feldes ist in den Vertauschungsrelationen und in der Struktur des Hamilton-Operators enthalten. Der Vergleich von
8.1 Quantisierung des Schrödinger-Feldes
193
(8.17b) mit (8.15a) und der Vergleich der beiden Vertauschungsrelationen (8.18) zeigt, daß (π/i h) dieselbe Rolle wie ψ und (π/i h) dieselbe Rolle wie ψ spielt. Die Anwendung auf einen beliebigen Zustand ψ führt daher zum gleichen Ergebnis, und infolgedessen sind die Operatoren gleich, π ih
ψ
.
(8.19)
(Diese Beziehung zwischen Operatoren steht in Korrespondenz zur „klassischen“ Beziehung (7.46a).) Aus (8.14c) ergibt sich damit ψ(x, t), ψ
(x , t) δ 3 (x x ) ,
(8.20)
woraus unmittelbar folgt, daß der Feldoperator des Schrödinger-Feldes nicht hermi tesch ist. (Wäre er hermitesch, so würde aus (8.20) ψ(x, t), ψ(x , t)δ 3 (x x ) folgen, was im Widerspruch zu (8.14a) steht.) In Abschn. 8.2.1 wird sich am Beispiel des Klein-Gordon-Schrödinger-Feldes zeigen, daß dies ein wesentliches Merkmal eines „geladenen Feldes“ ist. Aus (8.9) folgen mit ψ(x, t), H (t) (8.15a) 1 ψ(x, t)π(x , t) H S (x ) ψ(x , t)π(x , t) H S (x ) ψ(x , t)ψ (x, t) d 3x ih (8.14a) 1 ψ(x.t), π(x , t) H S (x ) ψ(x , t) d 3x ih (8.14c) δ 3 (x x ) H S(x ) ψ(x , t) d 3x H S(x) ψ(x, t) und
π(x, t), H (t)
(8.15b)
(8.14c)
1 π(x, t), ψ(x , t) H S (x ) π(x , t) d 3x ih δ 3 (x x ) H S (x ) π(x , t) d 3x H S(x) π(x, t)
die Bewegungsgleichungen t) H S (x) ψ(x, t) , i h ψ(x,
i h π(x, t) H S (x) π(x, t) ,
(8.21)
t) genügt also der Schrödingerwobei (8.21b) nach (8.21a) auch für π ψ gilt. ψ(x, Gleichung und π(x, t) bzw. ψ (x, t) der zu dieser adjungierten Gleichung, was in Übereinstimmung mit (8.19) steht. Im folgenden soll gezeigt werden, daß N (t) ψ (x, t) ψ(x, t) d 3x (8.22)
194
8 Kanonische Feldquantisierung
der Teilchenzahloperator ist. Der Beweis hierfür wird am einfachsten, wenn man die Feldoperatoren ψ(x, t) und ψ (x, t) gemäß ψ(x, t)
bi (t) ψi (x),
ψ (x, t)
i
bi (t) ψi (x)
(8.23)
i
nach einer Basis von Operatoren bi (t) entwickelt, die wie die in (8.3) eingeführten Operatoren ηri (t) und p ri (t) ortsunabhängig sind. Damit sich auf diese Weise beliebige t) bzw. ψ (x, t) darstellen lassen, müssen die EntwicklungskoefFeldoperatoren ψ(x, fizienten ψi (x) ortsabhängig sein und ein vollständiges Funktionensystem bilden, von dem wir annehmen, daß es orthonormiert ist. Aus (8.23) folgen durch Umkehrung (Multiplikation mit ψk (x) bzw. ψk (x) und Integration) die Relationen t) ψk (x) d 3x, bk (t) ψ (x, t) ψk (x) d 3x, bk (t) ψ(x, und hiermit ergeben sich aus (8.14) die Vertauschungsrelationen
bi , bk
bi, bk
0,
bi , bk
0,
δik .
(8.24)
Beweis: Die dritte Vertauschungsrelation folgt gemäß b
i
, b k
ψ(x, t) ψ
3 i (x) d x,
ψ (x , t) ψ
k
(x ) d 3x
ψ(x, t), ψ (x , t) ψi (x) ψk (x ) d 3x d 3x (8.20) δ 3 (x x ) ψi (x) ψk (x ) d 3x d 3x ψi (x) ψk (x) d 3x
δik .
ψ ψ , ψ 0. Die erste und zweite beweist man analog mit ψ,
Aus dem Hamilton-Operator (8.15a) und dem Teilchenzahloperator (8.22) wird in der Darstellung (8.23) (8.19) ψi (x) H S(x) ψk (x) d 3x H (t) Hik bi (t) bk (t) mit Hik (8.25) i,k
bzw. N (t)
b i (t) bi (t) .
(8.26)
i
Aus der Bewegungsgleichung (8.10) folgt für L N i h N
N , H
(8.25) (8.26)
i
bi bi ,
j,k
H j k b j bk
j,k
H jk
i
bibi , b j bk
0,
8.1 Quantisierung des Schrödinger-Feldes
weil
bi bi b j bk
(8.24c)
i
bi b j bi
i
b j b k
195
δi j bk (8.24a,b) b j bk b j bi bk bi
b j bk bi
δik bi
i
i
b j bk bi bi
i
gilt. Dies bedeutet, daß der Operator N zeitunabhängig ist, während die einzelnen Summanden n i bi bi im allgemeinen zeitabhängig sind (Aufgabe 8.1). Für die folgenden Betrachtungen nehmen wir an, daß das Potential in H zeitunabhängig ist, V V (x), und wählen als Entwicklungsfunktionen ψk (x) die Eigenfunktionen des Schrödinger-Operators H S (x), H S ψk (x) E k ψk (x). 2 ψi E k ψk d 3x E k δik und Dann erhalten wir aus (8.25) Hik H (t) E i bi bi .
(8.27)
i
Dieses Ergebnis legt zusammen mit (8.26) die Vermutung nahe, daß der Operator n i (t)
b i bi
(8.28)
die Teilchenbesetzungszahl im i -ten Energieniveau E i festlegt. Dem Nachweis dieser Vermutung gelten die folgenden Betrachtungen. Als erstes ist zu bemerken, daß die Operatoren n i miteinander vertauschen, n i , n j 0, (8.29) denn nach (8.24) gilt für i j (für i n i n j
bi bi b j b j
j ist die Vertauschbarkeit trivial)
bi b j bi b j
b j bi b j bi
b j b j bi bi
n j n i .
Weiterhin vertauschen alle n i auch mit dem Hamilton-Operator (8.27), der mit (8.28) in die Form H (t) (8.30) E i n i gebracht werden kann. In dem hier betrachteten Spezialfall ∂t V 0 sind die n i daher zeitunabhängig. Da der Hamilton-Operator (8.30) mit sämtlichen n i und diese alle miteinander vertauschen, existiert ein System gemeinsamer Eigenzustände sämtlicher n i und von H . Weil H jedoch nach (8.30) von den Operatoren n i linear abhängig ist, lassen sich diese Eigenzustände schon vollständig durch die Eigenwerte n i der Operatoren n i charakterisieren, so daß wir für sie n 1 , n 2 , . . . schreiben können. Sie erfüllen die Eigenwertgleichungen n i n 1 , n 2 , . . .
n i n 1 , n 2 , . . .
für alle i .
(8.31)
196
8 Kanonische Feldquantisierung
Aus der Definition (8.28) folgt, daß die Operatoren n i hermitesch sind, n i bi bi bi bi bi bi n i . Ihre Eigenwerte n i sind daher reell. Die Eigenzustände können orthonormiert werden,
n1 , n2 , . . . n1 , n2 , . . .
δn1 ,n1 δn2 ,n2 . . . , ¼
(8.32)
¼
was im weiteren vorausgesetzt wird. Jetzt überzeugen wir uns davon, daß die bi Erzeugungs- und die bi Vernichtungsoperatoren sind. Unter Benutzung von (8.24) und (8.31) ergibt sich bi bi bi . . . , n i , . . .
n i bi . . . , n i , . . .
(8.24c)
bi (n i 1) . . . , n i , . . . (n i 1) b i . . . , n i , . . .
und analog
n i bi . . . , n i , . . .
bi (bi bi 1) . . . , n i , . . .
bi (n i 1) . . . , n i , . . .
(n i 1) b i . . . , n i , . . . .
bi . . . , n i , . . . ist also ein Eigenzustand des Operators n i zum Eigenwert n i 1, bi . . . , n i , . . . ein Eigenzustand zum Eigenwert n i 1. Außerdem gilt für alle j i mit n j bi b j b j bi b j bi b j bi b j b j bi n j und n j bi bi n j n j bi . . .
bi n j . . .
n j bi . . . ,
n j bi . . .
n j bi . . . .
Nach (8.31) kann daher bi . . . , n i , . . . bi . . . , n i , . . .
αi . . . , n i 1, . . .,
(8.33)
βi . . . , n i 1, . . .
geschlossen werden. Indem wir in jeder dieser Gleichungen das Skalarprodukt der linken und der rechten Seite mit sich selbst bilden, erhalten wir mit bi . . . , n i , . . ., bi . . . , n i , . . . . . . , ni , . . . bi bi . . . , ni , . . . (8.24c) (8.28)
(8.31) (8.32)
. . . , ni , . . . ni 1 . . . , ni , . . . ni 1 , bi . . . , n i , . . ., bi . . . , n i , . . . . . . , ni , . . . ni . . . , ni , . . . und . . . , n i 1, . . . . . . , n i 1, . . . 1 für αi und βi die Gleichungen αi 2 ni 1, βi 2 ni .
ni
(8.34)
Über eine nicht weiter festgelegte Phase der Zustände verfügen wir derart, daß αi und βi reell werden. Aus (8.33) und (8.34) ergeben sich damit die mit (6.9) und (6.11) übereinstimmenden Gleichungen
n 1 . . . , n 1, . . ., i i bi . . . , ni , . . . ni . . . , ni 1, . . ., bi . . . , n i , . . .
(8.35)
8.1 Quantisierung des Schrödinger-Feldes
197
die bi und bi wie behauptet als Erzeugungs- und Vernichtungsoperatoren ausweisen. Jetzt kann gezeigt werden, daß die reellen Eigenwerte n i ganzzahlig sind. Wären sie das nicht, so käme man durch (n i 1)-malige Anwendung des Operators b i auf den Zustand . . . , n i , . . . zu dem Zustand . . . , n i (n i 1), . . . mit negativer Besetzungszahl des i -ten Energieniveaus, und indem man auf diese Weise mit allen Energieniveaus verführe, zu einem Zustand mit ausschließlich negativen Besetzungszahlen. Für diesen ergäbe sich nach (8.27)–(8.28) gemäß H n 1 , n 2 , . . .
E i n i n 1 , n 2 , . . .
i
Ei ni
(8.36)
i
auch eine negative Gesamtenergie. Aus physikalischen Gründen muß nun einerseits gefordert werden, daß die Energie positiv ist, andererseits muß jeder zulässige Operator durch Einwirkung auf einen beliebigen Zustand des Hilbert-Raums wieder einen Zustand aus diesem Raum erzeugen. Mit anderen Worten heißt das: Wir können das Problem negativer Energien nicht einfach dadurch lösen, daß wir negative Besetzungszahlen als unzulässig erklären, vielmehr dürfen diese nicht auftreten können. Das ist nur dann der Fall, wenn die n i ganzzahlig sind, nur dann gilt bi . . . , n i 1, . . . 1 . . . , n i 0, . . . und
bi . . . , n i 0, . . . 0 . . . , n i 1, . . . 0 ,
so daß keine Zustände negativer Energie erzeugt werden. Aus der Ganzzahligkeit der Eigenwerte n i und den Gleichungen (8.30)–(8.31) folgt schließlich, daß n i wie vermutet der Operator der Teilchenbesetzungzahl im i -ten Energieniveau ist. Den völlig unbesetzten Zustand 0 0, . . . bezeichnen wir wie in Abschn. 6.1 als Vakuumzustand 0, für ihn gilt b i 0 0 ,
bi 0 0, . . . , n i 1, . . . , 0.
(8.37)
Die Zustände n 1 , n 2 , . . . entstehen demnach und nach (8.35a) aus dem Vakuumzustand gemäß n1 , n2 , . . . n 1n . . . (b1 )n1 (b2 )n2 . . . 0. (8.38) 1 2 Die Gesamtteilchenzahl in diesem Zustand berechnet sich nach (8.26) und (8.28) gemäß N n 1 , n 2 , . . . n i n 1 , n 2 , . . . n i n 1 , n 2 , . . . i i zu N ni . i
Offensichtlich sind wir durch die Feldquantisierung genau zu dem Formalismus gelangt, der in Abschn. 6.1 für vollständig symmetrische N-Teilchen-Wellenfunktionen abgeleitet wurde. Wir können uns davon auch noch explizit überzeugen, indem wir
198
8 Kanonische Feldquantisierung
mit der Definition x1 , . . . , x N , t
1
(8.23b)
1
N
N
i1 ,...,i N
ψ (x1 , t) ψ (x N , t) 0 ψi1 (x1) ψi N (x N ) bi1 (t) biN (t) 0
(8.39)
zu ortsabhängigen Zuständen übergehen. Dabei handelt es sich um eine Superposition von Zuständen n 1 , n 2 , . . . mit ortsabhängigen Koeffizienten, wenn die in (8.23) auftretenden Entwicklungskoeffizienten ψi (x) die Eigenfunktionen eines zeitunabhängigen Hamilton-Operators sind. Die Zustände x1, . . . , x N , t sind Eigenzustände des Operators n(x, t) ψ (x, t) ψ (x, t) , (8.40) der nach (8.22) die Bedeutung des Teilchendichteoperators hat. Ersichtlich wird das aus der kurzen Rechnung n(x, t) x1, . . . , x N , t 1
ψ (x, t) ψ (x, t) ψ (x1, t) ψ (x N , t) 0
ψ (x, t) ψ (x1 , t)ψ (x, t) δ 3 (x x1) ψ (x2, t) 0
(8.14b) (8.19)
ψ (x1 , t) ψ (x, t)ψ (x, t) δ 3 (x x1 ) ψ (x2, t) 0
(8.20)
N 1 N 1
N ........................
(8.39a),s.u.
1
N N
N ψ (x1 , t) ψ (x N , t) ψ (x, t)ψ (x, t) δ 3 (x xi ) 0
δ 3 (x xi )
i 1
x1 , . . . , x N , t ,
(8.41)
i 1
bei der zuletzt ψ (x, t) 0 i ψi (x)bi (t) 0 0 benutzt wurde. Zum Zeitpunkt t sind die durch den Zustand x1, . . . , x N , t beschriebenen Teilchen offensichtlich scharf an den Punkten x1 , . . . , xn lokalisiert. Da n(x, t) im allgemeinen nicht mit dem HamiltonOperator vertauscht (Aufgabe 8.2), geht diese Lokalisierung verloren, die Wellenfunktion der Teilchen zerfließt. Da die Feldoperatoren ψ (xi , t) nach (8.14b) und (8.19) alle miteinander vertauschen, sind die Zustände (8.39a) vollständig symmetrisch gegenüber beliebigen Teilchenvertauschungen und beschreiben daher Bosonen. Für N 1 besagt (8.39) und (8.41) n(x, t) x , t δ 3 (x x ) x , t
mit
x, t ψ (x, t) 0 .
(8.42)
Dies bedeutet, daß der Feldoperator ψ (x, t) zur Zeit t am Ort x ein Teilchen erzeugt, und entsprechend wird durch den Operator ψ(x, t) ein dort befindliches Teilchen vernichtet.
8.1 Quantisierung des Schrödinger-Feldes
199
8.1.2 Jordan-Wigner-Quantisierung für Fermionen In Kapitel Q9 wurde zur Behandlung der Dynamik von Systemen identischer Teilchen unabhängig davon, ob es sich um Bosonen oder Fermionen handelte, die SchrödingerGleichung benutzt. Der Unterschied der beiden Teilchensorten ergab sich dadurch, daß Bosonen durch eine vollständig symmetrische und Fermionen durch eine vollständig antisymmetrische Wellenfunktion beschrieben wurden. Die Methode der Feldquantisierung führte uns bislang nur zu Bosonen. 1928 entdeckten P. Jordan und E. P. Wigner, daß man durch eine Abänderung der Quantisierungsregeln (8.14) bzw. (8.20) auch zu Fermionen gelangt: Dazu müssen nur die Kommutatoren durch Antikommutatoren ersetzt werden, d. h. für Fermionen müssen die Vertauschungsrelationen ¼ ψ(x, t), ψ(x , t)
ψ(x, t), ψ (x , t)
ψ (x, t), ψ (x , t)
0,
0,
δ 3 (x x )
(8.43)
benutzt werden, die übrigen Regeln bleiben unverändert. (8.15) ist also der HamiltonOperator, und in den Bewegungsgleichungen (8.9) bzw. (8.10) sind Minus-Kommutatoren zu benutzen, damit das Korrespondenzprinzip erfüllt wird. Auch mit den Vertauschungsrelationen (8.43) erfüllen die Feldoperatoren wieder die Schrödinger-Gleichung bzw. die zu dieser adjungierte Gleichung, z. B. i h ψ
(8.9a)
(8.17c) (8.19)
H ψ,
(8.43a)
d 3x (ψ ψ H S(x ) ψ ψ H S (x ) ψ ψ)
(ψ ψ H S (x ) ψ ψ ψ H S(x ) ψ ) d 3x
ψ ψ,
H
3 (8.43c) δ 3 (x x ) H S (x ) ψ d 3x H S (x) ψ. S (x ) ψ d x
Mit einer (8.23) entsprechenden Entwicklung ψ(x, t) i a i (t) ψi (x) der Feld operatoren ψ(x, t) nach ortsunabhängigen Operatoren a i (t) ergeben sich aus (8.43) statt (8.24) die Vertauschungsrelationen a i , a k
a i , a k
0,
a i , a k
0,
δik
(8.44)
mit der Folge (a i )2
(a i )2
0,
0.
(8.45)
Damit folgt für die Teilchenbesetzungszahloperatoren n i (t) a i a i ,
(8.46)
deren Summe N
n i
(8.47)
200
8 Kanonische Feldquantisierung
wieder zeitunabhängig ist (Aufgabe 8.3), die Beziehung (8.45) (8.44c) n i 2 a i a i a i a i a i 1 a i a i a i a i a i
n i .
(8.48)
Aus der Eigenwertgleichung n i . . . , n i , . . .
n i . . . , n i , . . .
(8.48)
n i 2 . . . , n i , . . .
n i 2 . . . , n i , . . .
n i n i . . . , n i , . . .
ergibt sich daher n i (n i 1)
0
ni
0
oder n i
1.
Es gibt also nur die Besetzungszahlen n i 0 und n i 1, die früher (Abschn. 6.4) für Fermionen abgeleitet wurden. In Analogie zu (8.38) führt man die Basiszustände
n1, n2 , . . . (a 1 )n (a 2 )n . . . 0 (8.49) ein und weist für a i und a i leicht die Erzeugungs- bzw. Vernichtungseigenschaften 1
2
(6.15) und (6.20),
a i N . . . , n i , . . . a i N . . . , n i , . . .
(1) Ni δni ,0 N 1 . . . , n i 1, . . .
(1) Ni δni ,1 N 1 . . . , n i 1, . . . .
(8.50) (8.51)
mit Ni k
x1, . . . , x N , t 1 ψ (x1, t) ψ (x N , t) 0 N
(8.52)
erweist sich als vollständig antisymmetrisch: Da die Vertauschung je zwei benachbarter Feldoperatoren nach (8.43b) zu einem Vorzeichenwechsel führt und jede Teilchenvertauschung i j die ungerade Anzahl ( j i )( j 1i ) von Nachbarvertauschungen erfordert, gilt Pi j x1, . . . , x N , t
x1, . . . , x N , t
für alle i, j .
Für den Hamilton-Operator ergibt sich auch hier Gleichung (8.25) mit bi ai , da zu deren Ableitung keine Vertauschungsregeln benutzt wurden. Wenn zu der (8.23) entsprechenden Entwicklung als Entwicklungskoeffizienten wieder die Eigenfunktionen ψi (x) H S ψi (x)/E i des Hamilton-Operators H S herangezogen werden, gilt erneut Gleichung (8.30), also H
E i n i .
(8.53)
8.1 Quantisierung des Schrödinger-Feldes
201
8.1.3 Zur physikalischen Bedeutung der Feldquantisierung Wir gehen jetzt der Frage nach, was durch den Prozeß der Feldquantisierung physikalisch gewonnen wurde. Zieht man die bislang hauptsächlich zur Berechnung von Ein-Teilchen-Zuständen benutzte Schrödinger-Gleichung für ψ(x, t) als klassische Feldgleichung für viele Teilchen heran – dies steht in Analogie dazu, daß die Maxwell-Gleichungen als Gleichungen für viele Photonen aufgefaßt werden können –, so muß die Bedingung, daß es sich um N Teilchen handelt, zusätzlich als Normierungseigenschaft gefordert werden. Dagegen liefert die Feldquantisierung die Quantisierung der Teilchenzahl als Ergebnis. Weiterhin läßt sich sagen, daß die Feldquantisierung in recht natürlicher Weise zu einer Klassifizierung der Teilchen in Bosonen und Fermionen führt. Zwar ergaben sich zunächst nur Bosonen, und erst durch eine ad hoc eingeführte Abänderung der Quantisierungsvorschrift ließen sich auch Fermionen beschreiben. Wir werden allerdings später sehen, daß bei der Quantisierung relativistischer Wellenfelder diejenigen, die wie das Klein-Gordon-Schrödinger- und das Maxwell-Feld Bosonen beschreiben, nur mit Minus-Kommutator-Regeln zu physikalisch sinnvollen Ergebnissen führen, während Fermionen-Felder wie das Dirac-Feld nur mit Antikommutator-Regeln physikalisch sinnvoll quantisiert werden können. Dennoch liegt es natürlich an der ausschließlichen Benutzung entweder von Kommutator- oder von Antikommutator-Vertauschungsrelationen, daß nur für Bosonen oder Fermionen eine Theorie erhalten wurde. Da nicht bewiesen wurde, daß es keine anderen Quantisierungsmöglichkeiten gibt, läßt sich nicht behaupten, daß das Spin-Statistik-Theorem von Abschn. Q9.2.6 vollständig bewiesen worden bzw. daß es eine eindeutige Folge der Feldquantisierung wäre. An der Aussage, daß die Feldquantisierung in natürlicherer Weise zum Spin-Statistik-Theorem führt, läßt sich jedoch festhalten. Ansonsten wurde beim Schrödinger-Feld durch die Feldquantisierung nichts hinzugewonnen – wir sind zu einer Theorie gelangt, deren Ergebnisse mit denen der gewöhnlichen N-Teilchen-Quantenmechanik für vollständig symmetrisierte bzw. vollständig antisymmetrisierte Wellenfunktionen in der Fock-Darstellung identisch sind. Hierin liegt der eigentliche Grund dafür, warum der Begriff „zweite Quantisierung“ nicht besonders sinnvoll ist, denn letztlich kam es zu keiner weitergehenden Quantisierung. Und beim Maxwell-Feld, wo die Feldquantisierung zu den Einsteinschen Quantenbedingungen für Photonen führt, handelt es sich um die erste Quantisierung. Die Situation ändert sich allerdings, wenn die Wechselwirkung verschiedener Felder betrachtet wird. Dann werden die Prozesse der Teilchenerzeugung und -vernichtung, die bisher wegen der Erhaltung der Gesamtteilchenzahl nur formalen Charakter hatten, zu dynamischen Prozessen, bei denen gegenüber den klassischen Feldtheorien Neuerungen auftreten. Zwar tauchten auch schon in deren Rahmen Phänomene wie das Kleinsche Paradoxon auf, die auf Paarerzeugungsprozesse hinweisen, aber über eine quantitativ richtige Beschreibung derartiger Prozesse hinausgehend führt die Feldquantisierung dann auch zu Phänomenen wie der Streuung von Licht an Licht (dabei spielen auch „virtuelle Teilchen“ eine Rolle), die über die klassischen Feldtheorien hinausgehen. Hierzu sei allerdings bemerkt, daß die „klassischen Feldtheorien“ in vielen Fällen zu denselben Ergebnissen wie die Quantenfeldtheorie führen, wenn sie durch relativ harmlos erscheinende Zusatzannahmen wie die Feynman-Stückelberg-Interpretation
202
8 Kanonische Feldquantisierung
der Lösungen negativer Energie der Dirac-Gleichung ergänzt werden (siehe dazu auch Abschn. 10.13). Die für Bose-Teilchen geforderten Vertauschungsrelationen (8.12)–(8.13) mit dem Minus-Kommutator haben eine klassische Korrespondenz, da Minus-Kommutatoren dieselben algebraischen Eigenschaften wie die in den „klassischen“ Bewegungsgesetzen (7.36) auftauchenden Poisson-Klammern besitzen. Für die FermionenVertauschungsregeln (8.43) gilt das nicht. Hieraus muß geschlossen werden, daß die Feldoperatoren bei Fermionen keine klassische Korrespondenz haben, mit anderen Worten: Es gibt keinen klassischen Grenzfall, in dem das Fermionen-Feld gemessen werden kann. Das läßt sich auch physikalisch verstehen, denn zur Meßbarkeit müßte das Feld lokal hinreichend stark werden, was die Anwesenheit vieler Teilchen am selben Ort voraussetzt, und das ist für Fermionen aufgrund des Pauli-Prinzips nicht möglich. Demnach können nur Bosonen-Felder wie das elektromagnetische Feld klassisch gemessen werden, was durch die Praxis bestätigt wird. Die letzten Ausführungen zeigen, daß die scheinbare Willkür, als welche die Einführung von Antikommutatoren aufgefaßt werden könnte, unvermeidbar ist: Da es keinen quasiklassischen Grenzfall gibt, kann es auch keine Deduktion der Antikommutationsregeln aus einer Quantenmechanik mit quasiklassischem Grenzfall geben. Völlig vom Himmel fallen die Antikommutatoren aber nicht, denn in der gewöhnlichen Quantenmechanik identischer Teilchen sind wir bei der Forderung nach vollständiger Antisymmetrie der Zustände von selbst auf Antikommutatoren gestoßen (siehe Abschn. 6.3, Gleichung (6.22)–(6.23)). Die völlige Äquivalenz, die zwischen der Quantenfeldtheorie mit Antikommutatoren und der gewöhnlichen Quantenmechanik für vollständig antisymmetrische Viel-Teilchen-Zustände besteht, läßt sich als nachträgliche Rechtfertigung der Antikommutationsregeln oder sogar als deren indirekter Beweis für freie Felder deuten, mit weit über diese Analogie hinausgehenden Konsequenzen für den Fall der Wechselwirkung.
8.2
Quantisierung des Klein-Gordon-Schrödinger-Feldes
Beim Klein-Gordon-Schrödinger-Feld wird sich herausstellen, daß nur die bosonische Quantisierung physikalisch sinnvoll ist. Dies bedeutet, daß die durch das KleinGordon-Schrödinger-Feld beschriebenen Teilchen, bei denen es sich nach Abschn. 4.2 um Spin-0-Teilchen handelt, Bosonen sind. Im ersten Teil dieses Abschnitts wird unter Vorwegnahme dieses Ergebnisses die entsprechende Feldquantisierung durchgeführt. Daß nur diese Sinn macht, wird nachträglich in den Teilabschnitten 8.2.2 und 8.2.3 gezeigt. Diese befassen sich mit einer relativistisch invarianten Formulierung der Vertauschungsregeln für Feldoperatoren und Konsequenzen der relativistischen Kausalitätsforderung für die Messungen lokaler Observablen an verschiedenen Punkten der Raum-Zeit.
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
203
8.2.1 Bosonische Feldquantisierung Wir betrachten zuerst den allgemeinen Fall eines komplexen Feldes φ, das nach Abschn. 4.2 geladene Teilchen beschreibt, und spezialisieren diesen anschließend auf ein ungeladene Teilchen beschreibendes reelles Feld.
Komplexes Feld Das komplexe Klein-Gordon-Schrödinger-Feld wird quantisiert, indem den „klassischen“ Feldern φ(x, t) und φ (x, t) sowie den diesen durch (7.57) zugeordneten kanonischen Impulsdichten π(x, t) und π (x, t) die Operatoren φ(x, t) und φ (x, t) t) und π (x, t) zugeordnet und für diese die Vertauschungsrelationen bzw. π(x, (8.12)–(8.13) gefordert werden, also
, t) φ(x, φ(x, t), φ(x t), φ (x , t) φ (x, t), φ (x , t) 0 , , t) π(x, π(x, t), π(x t), π (x , t) π (x, t), π (x , t) 0 und
(8.54)
, t) 0 , φ(x, t), π (x , t) φ (x, t), π(x , t) φ (x, t), π (x , t) i h δ 3 (x x) . φ(x, t), π(x
(8.55)
Der Hamilton-Operator ist durch (8.8) gegeben, wobei die aus (7.58) folgende Operatordichte 2m 0 c2 h 2 m 0 c2 φ π) (φ, π π φ φ φ (8.56) 2m 0 2 h 2 einzusetzen ist, d. h. 2m 0 c2 H π π h 2 IR3 2m 0 c2 s.u. π π h 2 IR3
h 2 φ φ 2m 0
h 2 φ (φ) 2m 0
m 0 c2 φφ 2
m 0 c2 φφ 2
d 3x (8.57)
d x. 3
Die zweite Darstellung geht aus der ersten durch partielle Integration bzw. 3 3 φ d 3x div ( φ) φ d x φ φ d x (φ) 0 IR3
IR3
IR3
hervor. Der Impulsoperator des Feldes ergibt sich aus (7.99) zu d 3x , p π φ π φ IR3
und Gleichung (7.131) erlaubt die Definition eines Ladungsoperators iq Q φ π φ π d 3x . h IR3
(8.58)
(8.59)
204
8 Kanonische Feldquantisierung
Wären die Feldoperatoren φ und π hermitesch, so ergäbe sich hieraus Q 0. Die NichtHermitezität der Feldoperatoren ist daher ein wesentliches Charakteristikum geladener Felder. φ , π und π müssen nach Zur Berechnung der Zeitableitungen der Operatoren φ, (8.10) deren Kommutatoren mit dem Hamilton-Operator auswertet werden, es ergibt sich 2 2m 0 c2 2m 0 c2 h 2 t) m 0c φ(x, t) (8.60) φ π , φ π , π φ(x, 2 2 2m 0 2 h h (Beweis folgt), und durch Zeitableitung der ersten dieser Beziehungen und Einsetzen der dritten folgt m 02 c2 m 02 c2 1 ∂ φ(x, t) φ(x, t) φ(x, t) 0 . (8.61) tt c2 h 2 h 2
t) muß also der Klein-Gordon-Schrödinger-Gleichung Auch der Feldoperator φ(x, t) π(x, t), H führt mit ähnlicher Rechgenügen. Die Bewegungsgleichung i h π(x, nung auf die zu (8.61) adjungierte Gleichung. Beweis: Mit der Umbenennung x x lautet (8.57b) etwas ausführlicher 4 3 h2 m 0 c2 2m 0 c2 φ (x , t) φ (x , t) H π (x , t) π (x , t) φ (x , t)φ (x , t) d 3x , 2m 0 2 h2
und damit folgt
φ (x, t), H
$
2m 0 c2
π (x , t) π
2mh φ (x, t) φ (x , t) φ (x , t) φ (x , t) φ (x , t) φ (x, t) % m c 2 φ(x, t) φ(x , t) φ (x , t)φ(x , t) φ (x , t) φ(x, t) d x 3 2mh c φ (x, t), π (x , t) π (x , t) h 2mφ (x , t) φ (x, t), φ (x , t) 4 m c 2 φ(x, t), φ (x , t) φ (x , t) d x i h 2mh c δ (x x) π (x , t) d x i h 2mh c π (x, t) i h φ . h2
IR3
φ (x, t) π (x , t) π (x , t)
(x , t) φ (x, t)
2
0
0
(8.54) (8.55)
2
0 2
2
2
0
0
(8.54) (8.55)
3
0 2
2
3
2
3
3
0 2
2
(8.10)
(8.60b) ergibt sich analog, und (8.60c) ergibt sich aus der Rechnung $ 2m 0 c2 π (x, t), H π (x, t) π (x , t) π (x , t) π (x , t) π (x , t) π (x, t) h2 IR3 h2 π (x, t) φ (x , t) φ (x , t) φ (x , t) φ (x , t) π (x, t) 2m 0
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
(8.54) (8.55)
(8.54) (8.55)
3
205
% m 0 c2 π (x, t) φ(x , t) φ (x , t)φ(x , t) φ (x , t) π (x, t) d 3x 2
h 2 φ(x , t) 2m 0 c2 π (x, t), π (x , t) π (x , t) π (x, t), φ (x , t) 2m 0 h 2 4 m 0 c2 φ(x , t) π (x, t), φ (x , t) d 3x 2 3 4 h 2 m 0 c2 3 i h δ (x x) φ(x , t) φ(x , t) d 3x 2m 0 2 IR3 3 4 h 2 m 0 c2 i h φ(x, t) φ(x, t) i h π (x, t) . 2m 0 2
Wir suchen jetzt die allgemeine Lösung von Gleichung (8.61) und superponieren t) ei ( px Et )/h ansetdazu ebene Wellen, die wir nach (4.29) in der Form u(x, 2 2 2 2 zen. Mit ∂t t u (E /h )u sowie u ( p /h )u ergibt sich für diese aus (8.61) ( E 2 /c2 p2 m 02 c2 ) u 0 oder E Ep mit Ep (m 0 c2 )2 p2 c2 , (8.62) d. h. zu jedem p gibt es zwei Lösungen, eine Lösung positiver und eine Lösung negativer Energie. Die allgemeine Lösung positiver Energie ergibt sich durch Superposition sämtlicher Ebene-Welle-Lösungen positiver Energie zu i ( px Ep t )/h 3 s.u. φ () (x, t) s.u. N p a p ei px/h d 3p , N p a p e d p (8.63) wobei die Entwicklungskoeffizienten a p nur von p abhängige Operatoren und N p Normierungskonstanten sind, deren – reell wählbare Werte – wir später bestimmen werden. Im letzten Schritt der obigen Beziehung wurde x 0 ct, pλ Ep /c, p und die relativistische Notation (8.64) p x pλ x λ Ep t p x benutzt. Die allgemeine Lösung negativer Energie ergibt sich durch Superposition sämtlicher Ebene-Welle-Lösungen negativer Energie zu i ( p x Ep t )/h 3 s.u. φ () (x, t) s.u. N p b p ei px/h d 3 p . N p c p e d p (8.65) Da in c p ein beliebiger Faktor frei ist, konnte dieselbe Normierungskonstante N p wie in (8.63) angesetzt werden. Im letzten Schritt wurde Ep E p E p und p p i ( px E p t )/h 3 c p e d p c p ei ( p x E p¼ t )/h (d 3 p ) ¼
¼
¼
p¼ p
c p ei ( px Ep t )/h d 3p
206
8 Kanonische Feldquantisierung
benutzt, c p b p definiert und wie bei den Lösungen positiver Energie px als Abkürzung für Ep t p x gesetzt. Letzteres bedeutet, daß bei den Wellen negativer Energie nicht wie sonst üblich p x pλ x λ mit p0 E/c gilt. Da wir jedoch gleich Lösungen positiver und negativer Energie zusammenfassen wollen, benötigen wir für den Ausdruck px eine einheitliche Bedeutung. Die aus Lösungen positiver und negativer Energie zusammengesetzte allgemeinste t) φ ( ) (x, t)φ ()(x, t). Mit der Definition Lösung ist φ(x, N p ei px/h
u p (x, t)
(8.66)
können wir sie in der Form
t) φ(x,
a p u p b p u p d 3 p
φ
(x, t)
a p u p b p u p d 3 p
(8.67)
schreiben. Aus (8.60b) folgt mit ∂t u p
i hEp u p ,
∂t u p
i Ep up h
(8.68)
t) und φ (x, t) konjugierten Operatoren π(x, für die zu φ(x, t) und π (x, t) die Entwicklung i h π(x, t) 2m c2 a p u p b p u p Ep d 3p , 0 (8.69) i h Ep d 3 p . π (x, t) a u b u p p p p 2m 0 c2 Die Beziehungen (8.67) lassen sich nach a p und b p invertieren. Die Inversion wird besonders einfach, wenn wir für zwei Klein-Gordon-Schrödinger-Felder φ und ζ ein Skalarprodukt (φ, ζ ) einführen, aus dem sich für φ ζ die (4.49) mit (4.15)–(4.16) entsprechende Normierung 4 3 1 φ i h ∂t φ/(m 0 c2 ) 3 Ψ σ3 Ψ d x mit Ψ (φ, φ) 2 φ i h ∂t φ/(m 0 c2 ) IR3 bzw. nach (4.40a) mit (4.16) (φ, φ)
i h 2m 0 c2
IR3
φ ∂t φ φ∂t φ d 3x
ergibt. Die geforderte Entsprechung wird mit dem Skalarprodukt (φ, ζ )
i h 2m 0 c2
IR3
φ ∂t ζ
ζ ∂t φ
d 3x
(8.70)
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
207
erreicht. Mit der Definition (8.70) ergibt sich E u u E u u p p p 3 p p p ih 3 (8.68) u d (u p , u p ) ∂ u u ∂ u x dx t p t p p p 2 2 2m 0 c IR3 2m 0 c IR3 (8.66) N p N p (Ep Ep ) ei ( p p )¡x/hÆ d 3x 2m 0 c2 IR3 N p N p (Ep Ep ) ei (Ep Ep )t /hÆ e i ( p p )¡x/hÆ d 3x . 2m 0 c2 IR3 ¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
Aus (2.90b) folgt ck 1/(2π)3/2 für f (x)δ 3 (x), und aus (2.90a) ergibt sich damit 1 ei k ¡x d 3 k . (8.71) δ 3 (x) (2π)3 Für x ( p¼ p) und k x/h folgt daraus e i ( p p )¡x/hÆ d 3x ¼
IR3
(2π h)3 δ 3 ( p¼ p) ,
und aus dem zuletzt erhaltenen Ergebnis wird mit Ep (u p , u p ) ¼
(8.62)
(8.72)
Ep für p p¼ ¼
N p N p (Ep Ep ) ei (Ep Ep )t /hÆ (2π h)3 δ 3 ( p¼ p) N 2p Ep (2π h)3 3 ¼ δ ( p p). 2m 0 c2 m 0 c2 ¼
¼
¼
Den Normierungsfaktor N p wählen wir jetzt gemäß 1 m 0 c2 , Np 3/2 Ep (2π h)
(8.73)
so daß die ebenen Wellen (8.66) die Form u p (x, t)
1 (2π h)3/2
m 0 c2 i p¡x/hÆ e Ep
(8.74)
annehmen und der Normierung (u p , u p ) δ 3 ( p¼ p)
(8.75)
¼
genügen. (Bei der Lagrange-Dichte (7.52) ergäben sich ebene Wellen u ¼ u/ 2m 0 .) Mit ähnlicher Rechnung wie eben erhält man auch noch
(u £p , u £p ) δ 3 ( p¼ p) , ¼
(u p , u £p ) (u £p , u p ) 0 . ¼
¼
(8.76)
(Bei der Ableitung der letzten zwei Normierungsbedingungen wird E p E p sowie (E p E p )δ 3 ( p p¼ )(E p E p )δ 3 ( p p¼ )(E p E p )δ 3 ( p p¼ ) 0 benutzt.) ¼
208
8 Kanonische Feldquantisierung
Mit (8.75)–(8.76) können wir jetzt die Beziehungen (8.67) nach a p und b p auflösen. Indem wir das Skalarprodukt (8.70) dahingehend erweitern, daß ζ auch ein von x und t abhängiger Operator sein darf, erhalten wir 3 (8.67a) (u p , φ) u p , a p u p b p u p d p a p u p , u p b p u p , u p d 3p ¼
¼
¼
¼
a p δ 3 ( p p) d 3 p
¼
¼
¼
¼
a p ,
¼
und analog ergibt sich b p aus (u p , φ ), zusammengefaßt gilt a p
, (u p , φ)
b p
(u p , φ ) .
(8.77)
Mit Hilfe dieser Ergebnisse lassen sich die aus a p , a p , b p und b p gebildeten Kommutatoren berechnen, es gilt a p , a p b p , b p s.u. δ3 ( p p ) , a p , a p b p , b p a p , b p a p , b p ¼
¼
¼
¼
¼
¼
(8.78)
0.
Zu jeder dieser Beziehungen gibt es noch eine, die aus ihr durch Übergang zum Adjun gierten hervorgeht, z. B. a p , a p 0. Der Beweis der Beziehungen (8.78) folgt am Ende des Abschnitts. Dort wird auch gezeigt, daß das Einsetzen der Entwicklungen (8.67) und (8.69) in die durch (8.57)–(8.59) gegebenen Operatoren H , p und Q zu H 1 a p a p a p a p b p b p b p b p Ep d 3p , (8.79) 2 1 3 p a p a a a b b b b (8.80) p p p p p p p pd p, 2 q 3 Q a p a (8.81) p a p a p b pb p b p b p d p 2 führt. Wie beim Schrödinger-Feld gibt es natürlich auch beim Klein-Gordon-SchrödingerFeld einen Hilbertraum mit Zuständen φ , auf welche die Operatoren H etc. einwirken. Ähnlich wie in Abschn. 8.1 kann dabei folgendes gezeigt werden: a p und b p sind voneinander unabhängige Erzeugungsoperatoren, a p und b p voneinander unabhängige Vernichtungsoperatoren, und ¼
n (a) p
a p a p ,
n (b) p
b p b p
(8.82)
sind Besetzungszahloperatoren mit ganzzahligen Eigenwerten n p 0 und n p 0 zu (a) (b) Eigenzuständen φ p und φ p . Es gibt also zwei Teilchensorten a und b, die durch a p bzw. a p und b p bzw. b p erzeugt bzw. vernichtet werden. Bei der Auswertung der (a)
(a)
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
209
Mittelwerte von H , p usw. in einem Zustand φ können dann die Beiträge von a p a p (a)
(a)
(a)
(a)
und b p b p unter Ausnutzung z. B. von n p φ p n p φ p mit Hilfe einer Zerlegung 2 (a) 3 φ c(a) p φ p d p unmittelbar berechnet werden. Zur Berechnung der Beiträge von a p a p und b p b p müssen die Vertauschungsrelationen (8.78) herangezogen werden, mit denen sich z. B. (a) Ep 3 3 δ (0) d 3p E H n p n (b) d p 2 p p 2 ergibt. Das erste Integral besitzt einen endlichen Wert, das zweite ist jedoch unendlich. Wäre das Feld in ein Gebiet mit endlichem Volumen eingesperrt, so ergäbe sich statt des kontinuierlichen ein diskretes Spektrum, und der Kommutator a p , a p hätte für p p den Wert 1 statt δ 3 (0). In diesem Fall ergäbe sich mit ω p Ep /h für das zweite Integral ¼
H 0
2
hω p p
2
.
Auch diese Summe ist unendlich groß, aber sie läßt sich einfach physikalisch interpretieren: Befinden sich im Zustand mit dem Impuls p insgesamt n (a) p Teilchen der Sorte a und n (b) Teilchen der Sorte b, so liefert jedes Teilchen über das erste Intep gral zur Gesamtenergie den Beitrag Ep , außerdem kommt über das zweite Integral von jedem Zustand für jede der beiden Teilchensorten noch ein Beitrag hω p /2. Bei einem harmonischen Oszillator der Frequenz ω ist die kleinste quantenmechanische Energie nicht null sondern gleich der Nullpunktsenergie hω/2. Der unendliche Beitrag von H 0 läßt sich daher als Summe der Nullpunktsenergien unendlich vieler Oszillatoren interpretieren, d. h. die ebenen Wellen u p und u p , nach denen der Feldoperator φ zerlegt wurde, sind im Vakuumzustand jeweils mit einer kleinsten Amplitude angeregt, die der Nullpunktsenergie des harmonischen Oszillators entspricht. Bei der Messung von Energien werden im allgemeinen nur Differenzen gemessen, und bei diesen hebt sich der unendliche Beitrag heraus. Aus diesem Grund kann man den Operator H gleich so definieren, daß dieser Beitrag entfällt, d. h. man kann H 0 2 (a) (b)
einfach weglassen und H n p n p Ep d 3 p definieren, eine Vorgehensweise, die als Renormierung bezeichnet wird. Formal erhält man den um die Nullpunktsenergie bereinigten Hamilton-Operator auch dadurch, daß man in H alle Operatorprodukte so umordnet, daß die Erzeugungsoperatoren immer links stehen. Diese modifizierte Operatoranordnung wird als Normalordnung bezeichnet und symbolisch durch Doppelpunkte vor und hinter dem normal zu ordnenden Operator gekennzeichnet, z. B. :(b b c c ): b b c c . Damit erhalten wir
H
3 b :H : a p b pa p p Ep d p .
(8.83)
Im folgenden lassen wir die Tilde bei H weg und definieren als neuen Hamilton-
210
8 Kanonische Feldquantisierung
Operator gleich den normalgeordneten, der dann mit (8.82) die Form H
(b) Ep d 3 p n (a) p n p
(8.84)
erhält. Das Weglassen der Nullpunktsenergie ist nicht generell gerechtfertigt, es gibt Situationen, in denen diese von Bedeutung ist. Ein Beispiel liefert die Kosmologie. Dank der Äquivalenz von Energie und Masse muß der Nullpunktsenergie eine gravitationserzeugende Wirkung zugeschrieben werden, diese liefert einen Beitrag zu der sogenannten Vakuumenergie. In diesem Fall wirkt sich ihre Divergenz allerdings störend aus. Man geht jedoch davon aus, daß die Quantentheorie für Längen unterhalb der Planck-Länge ungültig wird, und schneidet daher mit p h k und ω p ωk in E 0 ωk )/2 die k (h Summe bei einem Maximalwert von k ab, so daß 1/ k für alle Summenterme oberhalb einer geeigneten Abschneidelänge liegt. Leider stellt sich heraus, daß der dadurch erhaltene endliche Wert immer noch viel zu groß ist. Da es zur Vakuumenergie noch andere Beiträge als die Nullpunktsenergien sämtlicher Teilchenfelder gibt, könnte die geschilderte Diskrepanz durch solche Beiträge kompensatorisch behoben werden. Das Problem der Vakuumenergie ist allerdings bislang nicht vollständig verstanden und wird gegenwärtig als eines der wichtigsten ungelösten Probleme der Physik angesehen. Daß die Nullpunktsenergie tatsächlich physikalische Relevanz besitzt, wurde experimentell durch ein Differenzexperiment nachgewiesen. Bringt man im Vakuum zwei elektrisch leitfähige ebene Platten, die parallel zueinander angeordnet sind, sehr eng zusammen, so verändert sich in dem Vakuumgebiet zwischen den Platten durch die veränderten Randbedingungen die Nullpunktsenergie von ihrem Wert E 0 vor Einbringen zu dem Wert E 1 nach Einbringen der Platten. Wird bei der Berechnung der Summen für E 0 und E 1 wieder bei einem Maximalwert von k abgeschnitten, so ergibt sich für die Differenz E 1 E 0 ein endlicher negativer Wert, der mit abnehmendem Plattenabstand a dem Betrage nach wie 1/a 3 zunimmt.3 Da die Energie mit abnehmendem Plattenabstand demnach immer negativer wird, wirkt zwischen den Platten eine anziehende Kraft. Deren Stärke konnte gemessen werden und befindet sich in guter Übereinstimmung mit dem von der Theorie berechneten Wert. Die durch die Nullpunktsenergie hervorgerufene Anziehung der Platten wird als Casimir-Effekt bezeichnet. Für den Impulsoperator p ergibt sich durch Überführen von a p a p und b p b p in a p a p bzw. b p b p (a) p : p : n p n (b) (8.85) p d 3p , p 2 weil wegen der p-Antisymmetrie des Integranden δ 3 (0) p d 3p 0 gilt. (Beim Impuls gäbe es keine physikalische Rechtfertigung für das Weglassen eines unendlichen Beitrags.) Bei Q führt die entsprechende Umordnung der Erzeugungs- und Vernichtungs3 Die einschlägigen Rechnungen findet man z. B. in Abschn. 3-2-4 des Buches [8] der Literaturliste.
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
211
operatoren ebenfalls ohne Renormierung zu Q
: Q:
q
3 (b) d p, n (a) p n p
(8.86)
weil sich ein unendlicher Beitrag der a-Teilchen gegen den der b-Teilchen weghebt. Die Feldoperatoren φ und φ für a- und b-Teilchen genügen Gleichung (8.61) mit demselben Masseparameter m 0 . a- und b-Teilchen haben daher die gleiche Ruhemasse m 0 , außerdem handelt es sich bei beiden um Spin-0-Teilchen, nach Gleichung (8.86) haben sie jedoch entgegengesetzte Ladung. Die b-Teilchen können daher als Antiteilchen der a-Teilchen aufgefaßt werden, und umgekehrt. Das quantisierte komplexe Klein-Gordon-Schrödinger-Feld beschreibt also zugleich Teilchen und Antiteilchen. Ein Beispiel für derartige Antiteilchenpaare sind die geladenen Pi-Mesonen π und π mit der Ladung e und e. In Gleichung (8.86) wurde durch die Multiplikation mit q hineingesteckt, daß der Ladungsoperator Q eine elektrische Ladung beschreibt. Es gibt jedoch auch elektrisch neutrale Teilchen, die durch ein komplexes Feld φ beschrieben werden müssen und 2 3 0 für die n (a) n (b) p p d p von null verschieden ist. Neutrale K -Mesonen z. B. besitzen einen als Hyperladung Y bezeichneten inneren Freiheitsgrad: Das K 0 -Meson besitzt Y 1. die Hyperladung Y 1 und sein Antiteilchen, das K 0 -Meson, die Hyperladung 2 (a) (b) 3 Der mit der Hyperladung Y 1 multiplizierte Ladungsoperator n p n p d p kann in diesem Fall zur Beschreibung der gesamten Hyperladung der Teilchen in einem Zustand φ benutzt werden. Zum Abschluß folgt noch der Beweis der Gleichungen (8.78a) und (8.79). Der Beweis der übrigen Gleichungen (8.78) sowie von (8.80) und (8.81) verläuft analog und bleibt dem Leser überlassen (Aufgabe 8.5 und 8.6). Beweis: 1. Beweis von (8.78a). a p
2
h 3 u p ∂t φ φ ∂t u p d x, u p ∂t φ φ ∂t u p d 3x p 2m 0 c2 2 h u p (x, t) ∂t φ(x, t)φ(x, t) ∂t u p (x, t), 2m 0 c2 u p (x , t) ∂t φ (x , t)φ (x , t) ∂t u p (x , t) d 3x d 3x (8.60) 1 , t) d 3x d 3x u p (x, t) u p (x , t) π (x, t), π(x 2 h 1 u p (x, t) ∂t u p (x , t) π (x, t), φ (x , t) 2 2m 0 c , t) d 3x d 3x u (x , t) ∂t u p (x, t) φ(x, t), π(x p
, a ¼
(8.77a) (8.70)
¼
¼
¼
¼
¼
¼
¼
2 h (x, t) ∂t u (x , t) φ(x, (x , t) d 3x d 3x ∂ u t), φ t p p 2m 0 c2 ¼
212
8 Kanonische Feldquantisierung u p (x, t) ∂t u p (x ¼, t) u p (x ¼, t) ∂t u p (x, t) δ 3 (x x ) d 3x d 3x u p (x, t) ∂t u p (x, t) u p (x, t) ∂t u p (x, t) d 3x 2mi hc2 0 (8.70) u p , u p (8.75) δ3 ( p p) . (8.54) (8.55)
i h 2m 0 c2
¼
¼
¼
¼
¼
2. Beweis von (8.79). Mit
(8.66) A u p u p d 3x N p N p ei( p p )x/h d 3x N p N p ei(Ep Ep )t /h ei( p p )x/h d 3x ¼
¼
¼
(8.72)
2 (8.73) m 0 c 3 N p N p ei (Ep Ep )t /h (2π h )3 δ 3 ( p p ) N 2p (2π h )3 δ 3( p p ) δ ( p p) Ep ¼
¼
und den ähnlich abzuleitenden Beziehungen B u p u p d 3x C u p u p d 3x u p u p d 3x D ¼
¼
¼
ergibt sich (8.69) π π d 3x
und
u p
2
φ φ d 3x
δ 3 ( p p ) e2i Ep t /h , δ 3 ( p p ) e2i Ep t /h , δ 3 ( p p )
¼
φ φ d 3x (8.67) m 02c h
m 0 c2 Ep m 0 c2 Ep m 0 c2 Ep
h 2 a A b B b a C b b D E E d 3 p d 3 p a a p p p p p p p p p p 4m 02 c4 h 2 2i Ep t /h b p a p e2i Ep t /h Ep d 3p. a p a p b p b p a p b p e 2 4m 0 c
Mit u p i ( p/h )u p ,
¼
¼
¼
1
¼
¼
i ( p/h )u p und p p δ 3 ( p p ) p2 δ 3 ( p p ) ist
h2
p p a p a p D a p b p C
a p a p bp bp
¼
¼
a p b p e2i Ep t /h bp a p e2i Ep t /h
a p a p D a p b p C ¼
3 3 b p a p B b p b p A d p d p
¼
¼
a p a p bp bp
(8.67)
¼
¼
¼
bp a p B bp b p A ¼
a p b p e2i Ep t /h bp a p e2i Ep t /h
¼
p2 d 3p Ep
d 3 p d 3 p
m c2 0 d3p . Ep
Aus (8.57a) ergibt sich mit diesen drei Ergebnissen und der aus (8.62) folgenden Beziehung (m 02 c4 p2 c2 )/(2Ep ) Ep /2 1 a p b p e2i Ep t /h H a p a p a p a p b p b p b p b p b p a p 2 a p b p b p a p e2i Ep t /h Ep d 3p .
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
213
Nun gilt p p a p b p Ep e 2i Ep t /h d 3 p a p b p E p e2i E p t /h d 3 p (8.78) a p b p Ep e2i Ep t /h d 3 p b p a p Ep e2i Ep t /h d 3 p , so daß der Beitrag des mit e2i Ep t /h und analog des mit e2i Ep t /h multiplizierten Terms zu H verschwindet. Gleichung (8.79) ist damit bewiesen. Die übrigen Beziehungen werden ähnlich bewiesen.
Reelles Feld Im Spezialfall eines reellen Klein-Gordon-Schrödinger-Feldes, das nach Abschn. 4.2 ungeladene Spin-0-Teilchen beschreibt, ergibt sich aus der Realitätsforderung φ φ für das Feld die Forderung φ φ für den Feldoperator. Aus (8.67) folgt in diesem Fall 3 3 d a u b u p a u b u p p p p p p p p d p. Hieraus ergeben sich die miteinander verträglichen Bedingungen ap
bp ,
a p
bp ,
und für φ folgt die Entwicklung 3 φ a p u p a p up d p.
(8.87)
In den im letzten Abschnitt abgeleiteten Beziehungen kann jedoch nicht einfach überall a p b p gesetzt werden, weil die Zahl der Freiheitsgrade reduziert wurde und einige Formeln daher mit dem Faktor 1/2 bzw. 2 multipliziert werden müssen. Aus (7.56) bzw. h 2 h 2 m 0 c2 2 2 2 φ φ ( φ) 2m 0 2 2m 0 c2 folgt z. B. ∂ h 2 φ π m 0 c2 ∂ φ und m 0 c2 2 h 2 m 0 c2 2 2 φ , πφ π ( φ) 2m 0 2 2h 2
statt (7.99) gilt p
IR3
π φ d 3x
und (7.131) führt zu Q 0. Statt (8.69a) ergibt sich für π die Entwicklung i h 3 π(x, t) a p u p a p u p Ep d p . 2 m 0c
214
8 Kanonische Feldquantisierung
Dem einen Freiheitsgrad weniger entsprechend ergibt sich statt (8.84) und (8.85) 3 H n p Ep d p , p n p p d 3 p (8.88) mit n p a p a p , und die „klassische“ Feldbeziehung Q 0 geht in Q 0 über. Q 0 bedeutet nicht nur, daß die durch ein reelles Klein-Gordon-Schrödinger-Feld beschriebenen Teilchen elektrisch neutral sind, sondern auch, daß sie keine andere Art von Ladung wie z. B. eine Hyperladung tragen, weshalb sie auch als streng neutral bezeichnet werden.
8.2.2 Lorentz-invariante Vertauschungsrelationen Die Vertauschungsrelationen (8.54)–(8.55) betreffen Feldoperatoren an zwei verschiedenen Raumpunkten, jedoch zu gleichen Zeitpunkten, weshalb sie auch als gleichzeitige Vertauschungsrelationen bezeichnet werden. Offensichtlich sind sie nicht Lorentz-invariant, denn die Gleichzeitigkeit von Ereignissen an verschiedenen Raumpunkten wird von verschiedenen Inertialsystemen aus unterschiedlich beurteilt. Für manche Zwecke ist es jedoch nützlich, Lorentz-invariante Vertauschungsrelationen zur Verfügung zu haben. Solche werden in diesem Abschnitt für den Fall des komplexen Klein-Gordon-Schrödinger-Feldes abgeleitet. Für die auf voneinander verschiedene Zeitpunkte erweiterten Kommutatoren (8.54) ergibt sich mit x ct x , x und y ct y , y φ(y) φ(x),
s.u.
π(x), π(y)
0.
(8.89)
Man erhält dieses Ergebnis durch Einsetzen der Entwicklungen (8.67) und (8.69) sowie Bennutzung der Vertauschungsrelationen (8.78) (Aufgabe 8.7). Die durch den Kommutator φ (y) i (x y) φ(x), (8.90) definierte Funktion (x y) wird als Pauli-Jordan-Funktion, gelegentlich auch als Schwinger-Funktion bezeichnet. (Daß der Kommutator nur von der Differenz x y abhängt, folgt aus der Homogenität der Raum-Zeit und wird auch aus dem später abgeleiteten Ergebnis ersichtlich.) Einsetzen der Entwicklungen (8.67) liefert (8.78c,..) 3 3 i (x y) u p (x) u p (y) a p , a p u p (x) u p (y) b p , b p d p d p ¼
(8.78a,b)
(8.74)
¼
¼
¼
u p (x) u p (y) u p (x) u p (y) d 3 p
m 0 c2 (2π h )3
d 3p ei p(x y)/h ei p(x y)/h . Ep
Mit z x y , der Umformung
2
ei p z/h /Ep d 3p
p p
(8.91)
2 i p z/h 3 /E e p d p beim
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
215
zweiten Integral, unter Benutzung der Vorzeichenfunktion *
p0 < 0 p0 > 0
1 für 1 für
ε( p0 )
(8.92)
und mit Ep >0 ergibt sich e
i p z/h
ei p z/h d 3p Ep d 3p Ep
d 3p
ei
Ep
Ep d p0 δ( p0 Ep /c)
c z0 p z
&
h
ei
Ep
c z0 p z
& 3 h d p Ep
δ( p0 Ep /c) ei ( p0 z0 p z)/h
d p0 ε( p0 ) δ( p0 Ep /c) δ( p0 Ep /c) ei ( p z)/h .
Wird dies in das für i (x y) eingesetzt, wird die nach (E2.43) gültige letzte Ergebnis Umformung δ f (x) i δ(x x i )/ f (x i ) mit f (x i )0 benutzt, die hier zu δ( p p m 02 c2 )
(8.62b)
δ( p0 Ep /c) δ p02 Ep2 /c2 2Ep /c
0 Ep /c) δ( p2E /c
(8.93)
p
führt, und wird außerdem noch d 3p d p0d 4 p gesetzt, so erhalten wir schließlich 2m 0 c ε( p0) δ p p m 02 c2 ei p (x y)/h d 4 p . (8.94) i (x y) 3 (2π h ) Diesem Ergebnis ist die Lorentz-Invarianz direkt anzusehen: d 4 p ist wie d 4 x invariant und auch die Deltafunktion sowie ihr Argument sind invariant. Die Invarianz der Vorzeichenfunktion ε( p0 ) folgt schließlich daraus, daß bei eigentlichen LorentzTransformationen alle zeitartigen Impulsvektoren ( p0 >0) zeitartig und alle raumartigen ( p0 <0) raumartig bleiben. Natürlich folgen aus (8.90) mit (8.91) wieder die gleichzeitigen Vertauschungsrelationen: Aus (8.91) ergibt sich sin p(x y)/h /Ep d 3p , (x y) 2m 0 c2 /(2π h )3 und für t x t y folgt hieraus mit der ausführlicheren Notation (z)(z 0 , z) (0, z)
1 2m 0 c2 φ(x, t), φ (x z, t) i (2π h )3
sin( p z/h )
d 3p Ep
0,
(8.95)
also (8.54b), weil der Integrand in p antisymmetrisch ist. Durch Ableitung nach z 0 x 0 y0 folgt aus (8.90) einerseits ' ∂(z 0 , z) '' m0c (8.91) (8.71) 2m 0 c 3 i p z/h i p z/h δ (z) d 3p e e (8.96) ' 3 ∂z 0 h (2π h ) h z 0 0
216
8 Kanonische Feldquantisierung
und andererseits mit x ¼ x z sowie ∂ φ /∂z 0 (∂ φ /∂t y )(∂t y /∂z 0 ) (∂ φ /∂t y )/c ' ∂(z 0 , z) '' 1 2m 0 c (8.90) t), φ (x z, t) (8.60b) t), π(x , t) . φ(x, φ(x, ' 2 ∂z 0 ic i h z 0 0 Der Vergleich der beiden Ergebnisse führt mit δ 3 (z)δ 3 (x x ) zu (8.55c). Nach (8.90) gilt 1 φ (0) . (x) φ(x), i Aus dieser Beziehung und (8.61) folgt unmittelbar
m 02 c2 h 2
(x) 0 ,
(8.97)
d. h. (x) ist eine Lösung der Klein-Gordon-Schrödinger-Gleichung. Jede von deren Lösungen wird durch die Vorgabe einer Anfangsbedingung für (x) und ∂t (x) eindeutig festgelegt. Die (x) festlegenden Anfangsbedingungen sind (8.95) und (8.96), also ∂(x) 2m 0 c2 3 δ (x) für t 0. (x) 0 , ∂t h Jeder raumartige Punkt x der Raum-Zeit (x x < 0) kann durch eine eigentliche Lorentz-Transformation in den – ebenfalls raumartigen – Punkt 0, x transformiert werden. Aus (8.95) bzw. (0, x)0 und der Lorentz-Invarianz von (x) folgt daher (x) 0
für
x x < 0 .
(8.98)
8.2.3 Mikrokausalität Die Voraussetzung dafür, daß man eine lokale Observable (x) an zwei kausal unverbundenen Punkten x und y der Raum-Zeit (raumartiger Abstand, (x y)(x y)<0) unabhängig voneinander, also ohne Einflußnahme des einen auf den anderen Punkt, messen kann, ist das Verschwinden des Kommutators, (x), (y) 0 für (x y)(x y) < 0 . (8.99)
Das Erfülltsein dieser Bedingung wird als Mikrokausalität bezeichnet. Die Kausalitätsforderung der Relativitätstheorie, nach der sich Signale oder gegenseitige Einwirkungen nicht von einem Raumpunkt zu einem anderen mit Überlichtgeschwindigkeit ausbreiten dürfen, führt in der relativistischen Quantenfeldtheorie zu der Forderung nach Mikrokausalität. Im folgenden überzeugen wir uns davon, daß diese bei einem Klein-Gordon-Schrödinger-Feld mit bosonischer Quantisierung erfüllt ist. Nach (8.57)–(8.59) mit (8.60) sind globale physikalische Observablen wie H etc. räumliche Integrale über lokale Observablen (Operatordichten) der Form
(x) x φ
, (x) x φ(x)
8.2 Quantisierung des Klein-Gordon-Schrödinger-Feldes
217
wobei x und x entweder von x abhängige Funktionen oder auf x einwirkende Differentialoperatoren sind. Für die lokalen Observablen gilt
(x), (y) s.u.
(8.90)
i
i
x φ(x) y φ (y) y φ(y) y φ (y) y φ(y) x φ (x) x φ(x) φ (y) y φ(y) φ (x)x φ(x) x φ (x) x y φ(x) y φ (y) y x φ(y) y φ(y) x φ (x) x y (x y) y φ(y) x φ (x) y φ (y) x φ(x) x φ(x) y φ (y) y x (y x) x φ(x) y φ (y) x φ (x) y φ(y) i , x φ (x) x y (x y) y φ(y) y φ (y) y x (y x) x φ(x)
x φ
i
(x)
wobei im letzten Schritt x φ
(x)
y φ
(y)
x φ(x) y φ(y)
(8.89)
y φ x φ
(y) (x)
x φ y φ
(x)
y φ(y) x φ(x)
(y)x y φ(x), φ(y)
(8.89)
0
benutzt wurde. Mit (8.98) folgt daraus, daß (8.99) erfüllt ist. Wir wollen jetzt untersuchen, welche Konsequenzen eine fermionische Quantisierung des Klein-Gordon-Schrödinger-Feldes für dessen mikrokausales Verhalten haben würde. Mit der Definition i 1 (x y) φ(x), φ (y) (8.100) ergäbe sich statt (8.91) 3 3 i 1 (x y) u p (x) u p (y) a p , a p u p (x) u p (y) b p , b p d p d p , ¼
¼
¼
¼
und mit Hilfe der an die Stelle von (8.78a) tretenden Vertauschungsrelationen a p , a p ¼
b p , b p ¼
δ 3 ( p p ) ,
für die b p , b p b p , b p statt b p , b p b p , b p gilt, würde daraus ¼
¼
¼
i 1 (x y)
m 0 c2 3 (2π h)
¼
d 3p ei p(x y)/h ei p(x y)/h Ep
statt (8.91) und 1 (0, z)
(8.62b),s.u.
d 3p 1 2m 0 c2 cos( p φ(x, t), φ (x z, t) z/h) 3 i i (2π h) Ep p z cos ϑ 2π π p 2 cos 2m 0 c2 h dϕ dϑ sin ϑ d p 0 3 i (2π h) 0 0 (m 0 c2 )2 p2 c2
statt (8.95) folgen. (Im letzten Schritt wurde im p-Raum zu Polarkoordinaten p, ϑ und ϕ mit Polarachse in Richtung z übergegangen.)
218
8 Kanonische Feldquantisierung
Aus dem letzten Ergebnis folgt 1 (x y) 0 für (x y) (x y)< 0,und hieraus mit ähnlicher Rechnung wie oben für raumartige Abstände (x), (y) 0. Da hiermit keine Mikrokausalität vorliegen würde, kann für das Klein-Gordon-SchrödingerFeld die fermionische Quantisierung ausgeschlossen werden. Für den Spezialfall dieses Spin-0-Feldes ist damit das Spin-Statistik-Theorem von Abschn. Q9.2.6 im Sinne von Abschn. 8.1.3 bewiesen.
8.3
Quantisierung des Maxwellschen Vakuumfeldes
In diesem Abschnitt wird die Quantisierung elektromagnetischer Vakuumfelder durchgeführt. Dabei treten Schwierigkeiten auf, die daher rühren, daß zur Lorentz-invarianten Feldbeschreibung alle vier Komponenten des Vektorpotentials Aα benötigt werden, während nur zwei von ihnen unabhängig sind. Das Maxwellsche Vakuumfeld enthält nämlich nur zwei Freiheitsgrade, die in zwei möglichen Polarisationsrichtungen ebener elektromagnetischer Wellen zum Ausdruck kommen. Wir überzeugen uns als erstes von diesem Umstand.
8.3.1 Zahl der Freiheitsgrade des freien Feldes Ausgedrückt durch das Vektorpotential Aα lauten die Maxwell-Gleichungen (7.61) im Vakuum ( j α 0) Aα ∂ α ∂ σ Aσ 0 . (8.101) Bei der Eichtransformation A¼α
Φ ¼ /c, A¼ (Φ ∂t Λ)/c, A Λ Aα
∂α Λ
(8.102)
bleiben die Felder E und B unverändert (Elektrodynamik, Gleichung (7.6) ff.), B
rot A rot A , ¼
E
Φ
∂t A
Φ
¼
∂t A¼ .
Λ kann so gewählt werden, daß die Bedingung ∂ αA¼α 0 erfüllt wird. Hierzu muß Λ für gegebenes Aα (x) nur als Lösung der Wellengleichung Λ
∂ αA α
bestimmt werden. Die von A¼α Aα erfüllte Eichbedingung ∂ αAα
0
(8.103)
ist die aus der Speziellen Relativitätstheorie vertraute Lorenz-Eichung. Auch die Lorenz-Eichung macht das Vektorpotential Aα nicht eindeutig, denn mit Aα erfüllt auch jedes Vektorpotential A¼α Aα ∂α Λ¼ , für das mit Λ¼ Λ Λ 0
(8.104)
8.3 Quantisierung des Maxwellschen Vakuumfeldes
219
gilt, die Eichbedingung (8.103). Von den Lösungen der Gleichung (8.104) wählen wir diejenige, die zusätzlich auch noch die Gleichung A¼0 A0 ∂0 Λ 0 bzw. ∂t Λ Φ
(8.105)
erfüllt. Eine derartige Lösung gibt es, denn Φ erfüllt nach (8.101) mit (8.103) die Gleichung Φ 0 , und aus (8.105) folgt damit
∂t Λ 0 .
Es genügt daher, Gleichung (8.104) nur zu einem Zeitpunkt t0 zu befriedigen, damit sie immer erfüllt ist. Zu diesem Zweck müssen wir nach (8.104) mit (8.105) Λ(x, t0 ) aus ' ' 1 2 '' 1 Λ(x, t0 ) 2 ∂t Λ t 2 ∂t Φ '' 0 c c t0 bestimmen, was immer möglich ist. Das hiermit festgelegte Λ(x, t0 ) wählen wir dann als Anfangswert zur Lösung von Gleichung (8.105). Deren entsprechende Lösung ist t Λ(x, t) Φ(x, t ¼ ) dt ¼ Λ(x, t0 ) , t0
sie erfüllt (8.104) und (8.105). Das damit ausgewählte Vektorpotential A¼α erfüllt (8.103) und A¼0 0, also Φ ¼ 0 und div A¼ 0. Die letzte Eichbedingung ist die aus der Elektrodynamik bekannte Coulomb-Eichung. Die beiden Eichbedingungen Φ
0,
div A 0
(8.106)
werden zusammen als Strahlungseichung bezeichnet. An dieser erkennt man, daß das freie elektromagnetische Feld nur zwei Freiheitsgrade besitzt: Nur drei Komponenten von Aα sind von null verschieden, und aus (8.106b) folgt, daß A A0 ei (k x ωt ) nur zwei senkrecht zur Ausbreitungsrichtung k stehende Komponenten besitzt, div A i k A 0 . Auf den ersten Blick erscheint die Feldquantisierung in der Strahlungseichung einfacher. Bei der Behandlung von Problemen mit Wechselwirkung ( jα 0) muß A0 jedoch mitgenommen werden, die Strahlungseichung ist dann nicht möglich. Wir beschränken uns im folgenden daher auf die kovariante Quantisierung in Lorenz-Eichung.
8.3.2 Vertauschungsrelationen und Bewegungsgleichung Die Hamilton-Dichte des Maxwell-Feldes in Lorenz-Eichung ist in Gleichung (7.68) angegeben. Sie enthält die vier reellen Felder Aα und vier zu diesen kanonischkonjugierte Impulse π α A α /(μ0 c2 ), die ebenfalls reell sind. Wir ordnen diesen
220
8 Kanonische Feldquantisierung
jetzt Feldoperatoren zu, und eine mögliche Übertragung der Vertauschungsrelationen (8.6)–(8.7), die sich für eine Lorentz-invariante Theorie eignet, ist
A α (x, t), A β (x ¼, t) α A (x, t), π β (x ¼, t)
α π (x, t), π β (x ¼, t)
0,
0,
(8.107)
i h g αβ δ 3 (x x ¼ ) .
Diese gleichzeitigen Vertauschungsrelationen sind allerdings noch nicht Lorentzinvariant, denn zum einen transformiert sich die dreidimensionale Deltafunktion nicht wie ein Skalar, zum anderen geht die Gleichzeitigkeit der Felder Aα (x, t) und Aα (x ¼, t) beim Übergang zu anderen Inertialsystemen verloren. Es gelingt jedoch, Lorentzinvariante Vertauschungsrelationen zu finden, die in dem System, in welchem bei x ¼ gerade t ¼ t wird, in (8.107) übergehen. Da wir diese aber nicht benötigen, wird hier auf ihre Ableitung verzichtet.4 Da der metrische Tensor g αβ Komponenten zweierlei Vorzeichens enthält, hat die rechte Seite von (8.107c) für α β 1, 2 und 3 nicht das übliche Vorzeichen. Dies führt dazu, daß der Hilbert-Raum der Zustände, auf welche die Operatoren wirken, eine indefinite Metrik besitzt, bei der Zustände mit negativer Norm auftreten (siehe Abschn. 8.3.5). Dieses Problem wurde zwangsläufig mit der Forderung nach LorentzInvarianz erkauft, läßt sich aber, wie wir in Abschn. 8.3.6 sehen werden, ausräumen. (Da der Ansatz (8.107c) nicht für alle α und β zu den üblichen Vertauschungsrelationen führt, wäre genausogut auch ein Ansatz möglich gewesen, bei dem auf der rechten Seite ein Minuszeichen eingefügt ist.) Aus (7.35b) ergibt sich mit (7.68) und ∂ l glm ∂m ∂l für j α 0 der HamiltonOperator H 1 μ0c2 π α¼ π ¼ α 1 ¼A ¼α ¼A ¼α d 3x ¼ , (8.108) 2 μ0 und aus (8.10) folgen mit
π β π β A α (8.107c) A α π β π β π β A α π β i h gαβ δ3 (x x ) (8.107c) i h g αβ π β g αβ π β δ 3 (x x ) 2i h π α δ 3 (x x ) , π α A β A β A β A β π α π α A β A β A β A β π α π α A β A β A β π α A β i h g αβ δ 3 (x x ) i h gαβ A β gαβ A β δ3(x x ) 2i h ( A α ) δ3(x x ) A α π ¼β π ¼β
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
( A α ) δ 3 (x x ) d 3x ¼
¼
¼
¼
¼
¼
(¼ A ¼α ) δ 3 (x x ¼ ) d 3x ¼
4 Eine Ableitung findet sich z. B. in Kap. 6 des Buches [3] der Litertaturliste.
¼
¼
¼
sowie
¼
A α
¼
8.3 Quantisierung des Maxwellschen Vakuumfeldes
221
die Bewegungsgleichungen
i h A α
α, H i h A
μ0 c2 π α ,
i h π α
π
α
, H
i h α A . μ0
(8.109)
Die erste bedeutet, daß sich der klassische Zusammenhang (7.67) auf die Operatoren überträgt, 1 α 1 ∂0 A α . π α A (8.110) 2 μ0 c μ0 c Wenn man dies in die zweite Bewegungsgleichung einsetzt, folgt 1 α A c2
A α
A α
0,
(8.111)
also das Analogon der klassischen Bewegungsgleichung (8.101) in der Lorenz-Eichung. Die letztere ist nicht automatisch erfüllt und muß weiterhin als Nebenbedingung gestellt werden. Hier entsteht allerdings ein Problem: Die Lorenz-Eichung läßt sich nicht als Operatorbedingung stellen, die Forderung ∂α A α 0 stünde im Widerspruch zu den Vertauschungsrelationen (8.107), denn α, A ¼β ∂α A
l ¼β 0, A ¼β ∂ A ∂0 A l ,A
(8.107c)
(8.107a) (8.110)
μ0 c π
0 ¼β ,A
i h μ0 c g 0β δ 3 (x x ¼ ) 0 .
Ohne Lorenz-Eichung würde andererseits nach (7.69a,b) π 0
1 ∂l A l , μ0 c
π l
1 l A μ0 c 2
gelten, und aus (8.107c) ergäbe sich damit für α β 0 i hδ(x ¼ x) A 0 , π ¼ 0
1 0 ¼ ¼l 1 ¼ 0 ¼l ∂ A , A , A , ∂l A μ0 c μ0 c l
was im Widerspruch zu (8.107a) stünde. Ohne Lorenz-Eichung hätte man also ein ähnliches Problem. Der von S. N. Gupta und K. Bleuler vorgeschlagene Ausweg aus diesem Dilemma besteht darin, die Lorenz-Eichung nicht als Operatorbedingung zu stellen, sondern stattdessen zu fordern, daß der Erwartungswert des offensichtlich von null verschiedenen Operators ∂α A α für alle physikalischen Zustände verschwindet, α
ψ ψ ∂α A
0.
(8.112)
Wir werden diese Idee in Abschn. 8.3.6 aufgreifen. Die Vorgehensweise ist demnach folgende: In der zu quantisierenden klassischen Theorie wird die Lorenz-Eichung zugrunde gelegt. Dies führt zu den kanonischen Impulsen (7.67) statt (7.69) und zu der Hamilton-Dichte (7.68) statt (7.70). Die im Fall
222
8 Kanonische Feldquantisierung
der Lorenz-Eichung gültige Zuordnung (8.110) zwischen Impuls- und Feldoperatoren ist im Gegensatz zu der ohne Lorenz-Eichung gültigen Zuordnung (7.69) mit den Vertauschungsrelationen (8.107) verträglich (Aufgabe 8.8). Die Lorenz-Eichung, die aus Konsistenzgründen in der klassischen Theorie an die Felder gestellt werden muß, wird in der Quantentheorie nicht an die diesen zugeordneten Operatoren gestellt, sondern an deren Erwartungswert, also gewissermaßen ebenfalls an die Felder.
8.3.3 Entwicklung der Feldoperatoren nach Erzeugungs- und Vernichtungsoperatoren Gleichung (8.111) kann durch den Ansatz A α
b Aα (x)
Aα (x)
mit
εα e
i k x
kμ
,
gelöst werden. Dessen Einsetzen in sie liefert kμ k μ b εα ωk2 /c2 k2
kμ k μ
ωk /c, k
(8.113)
0 bzw.
0.
(8.114)
Dabei bleibt der Operator b εα unbestimmt, und da er vier unabhängig voneinander vorgebbare Komponenten besitzt, gibt es zu jedem k vier linear unabhängige Operatoren b (λ)(k) εα(λ)(k), λ 0, 1, 2, 3. Über die vier raum-zeitlich konstanten Vierervektoren εα(λ)(k) verfügen wir willkürlich derart, daß die Orthogonalitätsrelationen g αβ εα(λ)(k) εβ(λ )(k)
εα(λ)(k) ε(λ )α(k)
¼
¼
g λλ
¼
(8.115)
erfüllt werden und daß in dem System, in welchem der Wellenausbreitungsvektor k α bzw. kα die (Gleichung (8.114)) erfüllenden) Komponenten
k, 0, 0, k
kα
bzw.
k, 0, 0, k
kα
(8.116)
besitzt (Wellenausbreitung in Richtung der z-Achse), ε(0)α
1, 0, 0, 0 ,
ε(1)α
0, 1, 0, 0 ,
ε(2)α
0, 0, 1, 0 ,
ε(3)α
0, 0, 0, 1
(8.117) gilt. Durch diese Wahl werden die Vektoren εα (λ) in sämtlichen Koordinatensystemen reell und erfüllen in ihnen wegen der Lorentz-Invarianz des Skalarproduktes kα ε(1)α
kα ε(2)α
0,
kα ε(0)α
kα ε(3)α k
0,
(8.118)
d. h. die Vektoren ε(1)α und ε(2)α liegen transversal zum Wellenausbreitungsvektor k α . Wir werden später feststellen, daß sie die Polarisation von Photonen beschreiben. Die durch ε(0)α beschriebenen Photonen werden als zeitartig oder skalar bezeichnet (für sie ist das skalare Potential Φ 0), die durch ε (3)α beschriebenen als longitudinal (die räumliche Komponente liegt in Richtung des Wellenausbreitungsvektors k). Die experimentelle Erfahrung zeigt, daß es nur das durch die Amplituden ε (1)α und ε (2)α beschriebene transversal polarisierte Licht gibt. Die hier zusätzlich auftretenden Polarisationen
8.3 Quantisierung des Maxwellschen Vakuumfeldes
223
müssen wir jedoch mitnehmen, da es keine theoretischen Gründe gibt, sie einfach unter den Tisch fallen zu lassen. (In Abschn. 8.3.6 wird sich allerdings zeigen, daß sie energetisch keine Rolle spielen.) Die vier Vierervektoren εα(λ)(k) erfüllen die Vollständigkeitsrelation 3
gλλ εα(λ) (k) εβ(λ)(k)
gαβ .
(8.119)
λ 0
Beweis: Weil Tαβ
3
gλλ εα(λ) εβ(λ)
εα(0) εβ(0) εα(1) εβ(1) εα(2) εβ(2) εα(3) εβ(3)
λ 0
und gαβ Tensoren sind, gilt Gleichung (8.119) in allen Inertialsystemen, wenn sie in einem gilt. Es genügt daher, sie in dem System zu beweisen, in welchem die εα(λ) die Form (8.117) annehmen. In diesem gilt z. B. εα(0) εβ(0)
1, 0, 0, 0α 1, 0, 0, 0β
δα0 δβ0
und ähnlich εα(l) εβ(l) δαβ δαl für l 1. Damit ergibt sich ⎧ ⎨ 1 für α β ⎪ Tαβ δαβ δα0 δα1 δα2 δα3 1 für α β ⎪ ⎩ 0 sonst
δαβ δα0
⎫ ⎪ 0, ⎬ gαβ . 1, 2, 3 , ⎪ ⎭
Die allgemeine Lösung von Gleichung (8.111) zum Wellenvektor k μ ergibt sich durch Superposition der vier zu k μ gehörigen Lösungen (8.113), 3 2 hμ 0c s.u. Aα (k, x) b(λ)(k)Aα(λ)(k, x) mit Aα(λ)(k, x) εα (λ)(k) e i k x . 2ωk λ 0 (8.120) Da (8.111) eine homogene lineare Gleichung ist, bleibt in ihrer Lösung ein Faktor frei. 2 Daher konnte in Aα (k, x) der Faktor hμ 0 c /(2ωk ) hinzugefügt werden, was geschah, um später einfache Vertauschungsrelationen für die Operatoren b(λ)(k) zu erhalten. Die allgemeinste Lösung von (8.111) ergibt sich durch Superposition von Wellenlösungen (8.120), d3k s.u. Aα (x) Aα (k, x) A (k, x) α (2π)3 3 d3k 2 hμ 0c (λ) (λ) (λ) (λ) b (k)A (k, x) b (k)A (k, x) α α (2π)3 2ωk λ0 3 d3k 2 hμ 0c (λ) (λ) i k x (λ) i k x ε (k) b (k) e b (k) e . (8.121) α (2π)3 2ωk λ0
224
8 Kanonische Feldquantisierung
Dabei wurden zur Superposition außer den Operatoren (8.120) auch noch die dazu adjungierten benutzt. Das ist möglich, weil mit A α (k, x) auch A α (k, x) eine Lösung von (8.111) ist, und es ist notwendig, damit die Operatoren A α (x) hermitesch werden, A α (x) .
A α (x)
(8.122)
Letzteres muß gefordert werden, damit der Erwartungswert von A α (x) das reelle Vektorpotential Aα (x) beschreibt. Zur Vollständigkeit der Darstellung (8.121) muß garantiert sein, daß bei der k-Integration sowohl in Richtung von k als auch von k laufende Wellen erfaßt werden. Dies wird dadurch erreicht, daß bei der Auflösung von Gleichung (8.114b) für ωk die positive Wurzel gewählt wird, ω
c k
ωk
k
bzw.
k .
k0
(8.123)
(Hieraus ergibtsich als Phasengeschwindigkeit der Welle Úk (ωk / k)k/ k ck/ k.) Der Faktor 1/ 2(2π)3ωk in (8.121) wurde eingefügt, damit die Kommutatoren der b (λ)(k) möglichst einfach werden. Aus (8.110) folgt mit (8.121) und ∂t ei k x i k0 cei k x i ωk ei k x für die Impulsoperatoren 3 h ω ε (λ)(k) b (λ)(k) e i kx b (λ)(k) ei kx d 3 k . π α (x) i k α 2(2π)3μ0 c2 λ0 (8.124) Durch Inversion der Fourier-Reihen (8.121) und (8.124) sowie mit (8.110a) erhalten wir i g λλ d 3x b (λ)(k) A α (x) i ωk A α (x) εα(λ)(k) ei k x , (2π)3/2 2μ0 c2 h ωk (8.125) λλ 3x i g d b (λ)(k) A α (x) i ωk A α (x) εα(λ)(k) e i k x . (2π)3/2 2μ0 c2 h ωk (In g λλ keine Summation über λ!) Beweis: Zum Beweis nehmen wir in (8.121) und (8.124) die Ersetzungen k k und λ multiplizieren beide Gleichungen mit ei k x/(2π)3 und integrieren über d 3x. Mit 1 1 i (k k ) x 3 3 d x δ (k k ) , e ei (k k ) x d 3x δ 3 (k k ) , (2π)3 (2π)3
(8.110a) und k k ω /c für k k ergibt sich ω h μ c A (x) e d x b (k)ε (2π) 2(2π) ¼
0
k 3
und i (2π)3
α
0
ik x
¼
λ vor,
(8.126)
k
A α (x) i k x 3 e d x ωk
3
h μ c 2(2π) 0
(λ¼ ) α (k)
b
b(λ )(k)εα (λ )(k)
b
2
0
3
(λ¼ )
λ¼
2 3
λ¼
¼
¼
(λ¼ ) ( k)ε (λ¼ )( k) e2iωk t α
(λ¼ ) ( k)ε (λ¼ ) ( k) e2iωk t . α
8.3 Quantisierung des Maxwellschen Vakuumfeldes
225
Die Addition der beiden Gleichungen liefert
b(λ )(k)εα (λ )(k) ¼
λ¼
i
¼
μ0 c2 hω k
d 3x Aα (x) i ωk A α (x) ei k x . 2(2π)3
Die Multiplikation dieser Gleichung mit ε (λ)α(k) (dabei wird über α summiert) führt mit den Orthogonalitätsrelationen (8.115), g λλ 0 für λλ und 1/g λλ g λλ schließlich zu (8.125a). b(λ) (k) kann auf analoge Weise berechnet werden und ist natürlich zu b(λ) (k) adjungiert. ¼
Formal hängen die durch (8.125a) gegebenen Operatoren b (λ)(k) noch von der Zeit ab, da über x 0 nicht integriert wird. Da sie aber als zeitunabhängig definiert wurden und die zu (8.125) führende Rechnung korrekt ist, muß sich die Zeitabhängigkeit der Integranden herausintegrieren. Das läßt sich auch explizit beweisen (Aufgabe 8.9). Aus (8.125) ergeben sich mit (8.107) die Kommutationsrelationen
b (λ)(k), b (λ ) (k ) ¼
b (λ)(k), b (λ ) (k ) ¼
0,
b (λ)(k), b (λ ) (k ) ¼
0,
(8.127)
gλλ δ3(k k ). ¼
Beweis: Aus (8.125) folgt mit (8.110a) sowie der Hermitezität von A α und π α beispielsweise b(λ)(k), b(λ ) (k ) ¼
3 3 g λλ g λ λ d xd x ε (λ)(k) εβ (λ )(k ) ei k x ei k x 3 α 2(2π) 2 μ0 c h ωk ωk α 2 α β (x ) μ c2 π β (x ) iω k A (x) μ0 c π (x), iω k A 0 ¼
¼
¼
¼
¼
¼
(8.107a,b) (8.122))
3 3 g λλ g λ λ d xd x εα (λ)(k) εβ (λ )(k ) ei (ωk t ωk t ) ei (k x k x) (2π)3 2h ωk ωk α β β α iω k A (x), π (x ) iω k A (x ), π (x) ¼
¼
¼
¼
¼
¼
¼
¼
(8.107c)
h (ωk ωk ) λλ λ λ g g 2h ωk ωk ¼
(8.115),s.u. h (8.126a)
¼
¼
d 3x αβ (λ) g εα (k) εβ (λ )(k ) ei (ωk t ωk t ) ei (k k) x (2π)3 ¼
¼
¼
¼
(ωk ωk ) λλ λ λ i (ωk ω ) t (λ) k g g e ε (k) ε (λ )α(k ) δ 3 (k k) /, .α 2h ωk ωk g λλ δ 3 (k k) λλ δ 3 (k k) . g ¼
¼
¼
¼
¼
¼
¼
Hier wurde zuletzt beim Koeffizienten der δ 3 -Funktion k k mit der aus (8.123) folgenden Konsequenz ωk ωk benutzt, da dieser nur für k k von null verschieden ist, außerdem die aus (g λλ )2 1 folgende Beziehung g λλ g λ λ g λλ (g λλ )2 g λλ g λλ . Bei der vorletzten Umformung wurde t t gesetzt, was möglich ist, weil der berechnete Kommutator zeitunabhängig ist und daher für beliebige Zeiten t und t dasselbe Ergebnis liefern muß. ¼
¼
¼
¼
¼
¼
226
8 Kanonische Feldquantisierung
Aufgrund unserer Erfahrungen bei der Quantisierung des Schrödinger-Feldes erwarten wir, daß es sich bei den Operatoren b (λ) (k) und b (λ)(k) um Erzeugungs- bzw. Vernichtungsoperatoren handelt. Diese Erwartung wird durch die Rechnungen des nächsten Abschnitts bestätigt, wo die Energie und der Impuls der Photonen durch diese Operatoren ausgedrückt werden.
8.3.4 Energie und Impuls der Photonen Jetzt berechnen wir den Hamilton-Operator (8.108) in der Darstellung (8.121). Unter Benutzung von ei k x ei (ωk t k x) ikei k x und (8.124) ergibt sich mit x x zunächst d 3 k d 3 k ωk ωk h c2 k k d 3x εα (λ)(k) ε(λ )α(k ) H 2 ωk ωk 2(2π)3 c2 λ,λ b (λ)(k) b (λ ) (k ) ei (k k) x b (λ)(k) b(λ ) (k ) ei (k k) x
(λ) (λ ) i (k k) x (λ) (λ ) i (k k) x .
b (k) b (k ) e b (k) b (k ) e ¼
¼
¼
¼
¼
¼
¼
Mit (8.126) bzw. d 3x ei (k k) x (2π)3 d 3x ei (k k) x (2π)3
¼
ei (ωk ωk )t
¼
ei (ωk ωk )t
¼
ei (k k) x
d 3x (2π)3
ei (ωk ωk )t δ 3 (k k) ,
ei (k k) x
d 3x (2π)3
ei (ωk ωk )t δ 3 (k k)
¼
¼
¼
¼
¼
¼
¼
¼
¼
(8.128) ¼
folgt hieraus H
ωk ωk h c2 k k 3 3 (λ )α (λ) d k d k εα (k) ε (k ) ω ω 4 c2 k k λ,λ b (λ)(k) b (λ ) (k ) ei (ωk ωk )t b (λ)(k) b (λ ) (k ) ei (ωk ωk )t δ3(k k)
(λ) (λ ) i (ωk ωk )t (λ) (λ ) i (ωk ωk )t 3 δ (k k) .
b (k) b (k ) e b (k) b (k ) e ¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
Für k k 0 wird k k k2 , ωk ωk ωk , und nach (8.114) verschwindet der Vorfaktor ( ωk ωk /c2 k k / ωk ωk ). Für k k 0 wird er gleich 2ωk /c2 , und mit ωk ωk 0, den Orthogonalitätsrelationen (8.115) und g λλ 0 für λ λ erhalten wir schließlich h H g λλ b (λ)(k) b (λ)(k) b (λ)(k) b (λ)(k) ωk d 3 k
2 λ h ωk 3 (8.127c) λλ (λ) (λ) 3 δ (0) d 3 k . g b (g λλ )2
(k) b (k) h ωk d k 2 ¼
¼
¼
¼
¼
λ
λ
8.3 Quantisierung des Maxwellschen Vakuumfeldes
227
Das zweite Integral liefert in jedem Zustand einen unendlichen Beitrag zur Energie, wobei jeder Polarisationszustand λ wegen (g λλ )2 1 dazu mit 12 hωk beiträgt. Wie beim Klein-Gordon-Schrödinger-Feld läßt sich das zweite Integral als Nullpunktsenergie unendlich vieler Oszillatoren deuten. Um zu einer physikalisch sinnvollen Theorie zu kommen, ziehen wir diese unendliche Energie wieder ab und erhalten H
b
(0)
(k) b (0)(k)
3
b (λ) (k) b (λ)(k) hωk d 3 k .
(8.129)
λ 1
(Der renormierte Hamilton-Operator ist normalgeordnet.) Von der zu Aα kanonisch-konjugierten Impulsdichte kann nicht erwartet werden, daß sie mit der physikalischen Impulsdichte übereinstimmt. Die letztere ergibt sich vielmehr nach (7.95) aus den Komponenten des Energie-Impuls-Tensors (7.92), 1 0 Θl c
1 ∂ Aα,l c ∂ Aα,0
∂ Aα,l ∂ A α
(7.66)
1 α A Aα,l μ0 c 2
ε 0 A
α
Aα,l .
2 Mit (7.95) bzw. (1/c) Θ 0α d 3x E/c, p folgt hieraus der Gesamtimpuls p ε 0
A 0
A0
l A
Al
3
d x ε0
A 0
A 0
3
A l Al d 3x .
l 1
Dementsprechend definieren wir als Impulsoperator p ε0
0 A A 0
3
A l A l d 3x.
(8.130)
l 1
Eine ähnliche Rechnung wie die, die zu (8.129) führte (Aufgabe 8.10), liefert in der Darstellung (8.121) den normalgeordneten Impulsoperator p
b
(0)
(k) b (0)(k)
3
b (λ)(k) b (λ)(k) h k d 3 k .
(8.131)
λ 1
8.3.5 Teilchenzahloperatoren und Metrik des Photonen-Hilbert-Raums Der Vergleich der Vertauschungsrelationen (8.127) und des Hamilton-Operators (8.129) mit den entsprechenden Größen (8.24) und (8.27) des Schrödinger-Feldes legt es nahe, die Größen b (λ)(k) und b (λ)(k) als Erzeugungs- bzw. Vernichtungsoperatoren für Photonen und n (λ)(k) g λλ b (λ)(k) b (λ)(k)
(8.132)
228
8 Kanonische Feldquantisierung
als Operator der Teilchenzahldichte im k-Raum aufzufassen. Der Operator der Gesamtteilchenzahl ist dann 3
N
λ 0
n (λ)(k) d 3 k .
(8.133)
Der Hamilton-Operator (8.129) und der Impulsoperator (8.131) können mit (8.132) in der Form 3
H
λ 0
n (k) h ωk d k , (λ)
p
3
3 λ 0
n (λ)(k) h k d 3 k
(8.134)
geschrieben werden. Die Gesamtteilchenzahl in dem durch Einwirkung des Erzeugungsoperators b (λ) (k) auf den Vakuumzustand 0 hervorgerufenen Zustand ergibt sich aus 3 ' 1 ' 1 N b (λ) (k)''0 gλ λ d 3 k b (λ ) (k ) b (λ ) (k ) b (λ) (k) ''0 ¼
(8.127c)
3 s.u. λ¼ 0
3
λ¼ 0
¼
¼
¼
λ¼ 0
' 1 ' g λ λ d 3 k b (λ ) (k ) b (λ) (k) b (λ ) (k )g λ λ δ 3 (k k ) '0 ¼
¼
¼
¼
¼
' 1 ' 1 ' 1 2 ' ' ' g λλ b (λ) (k) '0 b (λ) (k) '0 . g λ λ g λ λ d 3 k δ 3 (k k ) b (λ ) (k ) '0 ¼
¼
¼
¼
s.u.
(Bei dem mit markierten Schritt wurde benutzt, daß die Einwirkung des Vernichtungsoperators b (λ ) (k ) auf den Vakuumzustand 0 null erzeugt.) b (λ) (k)0 ist demnach ein Eigenzustand von N zum Eigenwert 1, in ihm befindet sich also ein Teilchen, und wir bezeichnen ihn mit ' 1 1 b (λ) (k)''0 . (8.135) ¼
Dieses Ergebnis rechtfertigt im Nachhinein die Definitionen von n λ und N . Analog ergibt sich durch Anwendung des Hamiltonoperators (8.134a) auf den Zustand 1 H 1
h ωk 1 .
Für den Erwartungswert von N im Zustand 1 ergibt sich mit N 1 1 ' ' ' ' ' (λ) 1' N '1 1'1 0'b (k) b (λ) (k)'0 ' (8.37a) (8.127c) '' (λ) (k) b (λ)(k)g λλ δ 3 (0)'0 gλλδ3(0) , 0 b
und für den von H analog
' ' 1' H '1
gλλh ωk δ3(0) .
8.3 Quantisierung des Maxwellschen Vakuumfeldes
229
Für λ 0, also zeitartige (skalare) Photonen, ist also sowohl der Erwartungswert der Teilchenzahl als auch der der Energie negativ. Das ist darauf zurückzuführen, daß in diesem Fall die Norm des Zustands, 11g 00 δ 3 (0), ebenfalls negativ wird: Der HilbertRaum für Photonen hat wie die Raum-Zeit eine indefinite Metrik. Die Unendlichkeit der Norm muß uns dabei nicht weiter stören, da wir in einem unendlich ausgedehnten Gebiet nach einem Kontinuum ebener Wellen entwickelt haben. Der negative Erwartungswert der Energie zeitartiger Photonen verschärft das Problem mit den in der Realität nicht beobachteten skalaren Photonen. In einer nicht Lorentz-invarianten Theorie mit der Coulomb-Eichung scheint dieses umgangen zu sein, denn in ihr treten nur transversale Photonen auf. Wir werden im folgenden Abschnitt jedoch sehen, daß alle Schwierigkeiten durch die bisher noch nicht berücksichtigte Bedingung (8.112) zur Erfüllung der Lorenz-Eichung (8.103) behoben werden können, ohne daß dazu die longitudinalen und skalaren Photonen aus der Theorie verbannt werden müssen.
8.3.6 Berücksichtigung der Lorenz-Eichung An die zulässigen Zustände ψ kann statt (8.112) sogar die etwas schwächere Eichbedingung ∂ α A α( ) (x)ψ 0
(8.136)
gestellt werden, wobei A α( ) (x) bzw. A α() (x) den Anteil der Zerlegung (8.121) mit den Erzeugungs- bzw. Vernichtungsoperatoren meint, 3 2 hμ 0c A α() (x) b (λ)(k) εα (λ)(k) e i k x d 3 k , (8.137) 2(2π)3 ωk λ0 3 2 hμ 0c A α( ) (x) b (λ)(k) εα (λ)(k) ei k x d 3 k . (8.138) 2(2π)3 ωk λ0
(Zur Begründung der Notation siehe nach Gleichung (9.44).) Offensichtlich gilt A (α ) (x) A α() (x) . Hiermit, mit ψ L ψ (ψ , L ψ ) (L ψ , ψ ) (ψ , L ψ ) ψ L ψ und A α A α() A α( ) folgt dann nämlich ψ ∂ α A α ψ
(8.136)
ψ ∂ α A α(
)
ψ
ψ ∂ α A (α ) ψ
ψ ∂ α A α() ψ
(8.136)
0.
Wird (8.137) in (8.136) eingesetzt, so ergibt sich nach Herauskürzen konstanter Faktoren 3 d3k e i k x k α εα(λ)(k) b (λ)(k)ψ 0 . ωk λ0
230
8 Kanonische Feldquantisierung
Multipliziert man diese Gleichung mit ei k x /(2π)3 und integriert sie dann über d 3x, so entsteht dabei nach (8.126) die Funktion δ 3 (k k ), und die anschließende Ausführung der d 3 k-Integration liefert nach Herauskürzen weiterer Faktoren und der Umbenennung k k in dem durch (8.116)–(8.117) definierten Koordinatensystem die Bedingung ¼
0
3
λ 0
(8.118)
k α εα (λ)(k) b (λ)(k)ψ
3 λ0
kα ε(λ)α(k) b (λ)(k)ψ
' 1 ' 1 ' ' kα ε(0)α(k) b (0)(k)kα ε(3)α(k) b (3)(k) 'ψ k b (0)(k) b (3)(k) 'ψ ,
die
b (0)(k)ψ
b (3)(k)ψ
zur Folge hat. Bilden wir das Skalarprodukt jeder Seite mit sich selbst, so folgt ' ' ' ' (0) ψ 'b (k) b (0)(k)'ψ ψ 'b (3) (k) b (3)(k)'ψ und daraus mit (8.132) ' ' ' (0) ' n (k) n (3)(k) ψ 'n (0)(k)'ψ ψ 'n (3)(k)'ψ 0 ,
(8.139)
d. h. in jedem physikalischen Zustand muß der (negative) Erwartungswert der Zahl skalarer Photonen den (positiven) der Zahl longitudinaler Photonen kompensieren. Für den Erwartungswert der Energie ergibt sich hiermit aus (8.134)
H
3 λ0
ψ n(λ)(k)ψ h ωk d 3 k
2 λ1
ψ n(λ)(k)ψ h ωk d 3 k .
(8.140)
Die Beiträge der skalaren und longitudinalen Photonen heben sich gegenseitig weg, energetisch spielen nur die transversalen Photonen eine Rolle. Dieselbe Aussage gilt offensichtlich auch für den Impuls und – wie gezeigt werden kann – noch für andere Observablen wie den Drehimpuls. Dies bedeutet allerdings nicht, daß die skalaren und longitudinalen „Pseudophotonen“ nur die Rolle lästiger Anhängsel spielen, die praktisch überflüssig sind und nur aus formalen Gründen mitgeschleppt werden müssen. Wenn sie auch nicht als freie Teilchen meßbar sind, beeinflussen sie doch die – bisher nicht behandelten – Wechselwirkungsprozesse mit anderen Feldern. Wenn man sie – verbotenerweise – wegließe, erhielte man für diese Prozesse andere Ergebnisse. Da sie hierbei nur indirekt in Erscheinung treten – was übrigens auch auf transversale Photonen zutreffen kann – spricht man auch von virtuellen Photonen. Die physikalische Rolle der Pseudophotonen bei Wechselwirkungsprozessen steht nicht im Widerspruch zur Quantisierung des elektromagnetischen Feldes in der Strahlungseichung, bei der nur transversale Photonen auftreten. Bei der Behandlung von Wechselwirkungen muß natürlich auch das beim freien Feld auf null gesetzte skalare Potential Φ mit berücksichtigt werden, und in der dann vorliegenden Coulomb-Eichung ergibt sich über dieses Potential auf anderem Wege dieselbe Beeinflussung der Wechselwirkung.
8.3 Quantisierung des Maxwellschen Vakuumfeldes
231
8.3.7 Photonenspin Den klassischen Spin des elektromagnetischen Feldes erhält man durch Berechnung der räumlichen Komponenten Slm des in (7.118b) angegebenen Tensors S αβ für das Maxwell-Feld. Mit ηr,0 Aρ /c, ηs Aσ und ∂ /∂ Aρ π ρ ergibt sich zunächst
S
lm
μ 1c
(7.67b)
lm σ 3 π ρ Iρσ A dx
0
2
A I
ρ lm σ ρσ A
d 3x .
(8.141)
βγ
Im Fall des Vektorpotentials Aα sind die Koeffizienten Iρσ nach (7.110) durch
12 I
d Aρ
βγ ρσ dϕβγ
Aσ
(8.142)
definiert. Zu ihrer Berechnung benutzen wir, daß sich d Aρ bei den raum-zeitlichen Drehungen (7.108)–(7.109), die Lorentz-Transformationen repräsentieren, wie d x α transformiert, also gemäß d Aρ
dϕ
ρσ
Aσ
δ δ 12 δ
β γ ρ σ
dϕβγ Aσ
β γ ρδ σ
δ
γ
ρ
δ
γ
δ βσ dϕγ β Aσ
ρ
δ
(7.109)
δ βσ dϕβγ Aσ .
γ
ρ
δ βσ dϕβγ Aσ
Durch Vergleich mit (8.142) ergibt sich hieraus βγ Iρσ
δ
β γ ρδ σ
δ
γ
ρ
δ βσ
I
γβ ρσ
.
(8.143)
Damit erhalten wir aus (8.141) schließlich das Ergebnis
S
lm
Aρ δlρ δ mσ δ mρ δlσ Aσ 3 dx μ0 c 2
das sich für Φ
μ1c 0
2
AlAm AmAl d 3x,
(8.144)
0 mit E ∂ A in t
S
1 μ0 c 2
(E
A) d x 3
(8.145)
umschreiben läßt, wenn die Komponenten von S durch Sn
S
lm
,
l, m, n zyklisch
(8.146)
definiert werden. Der Spinoperator des Photonenfeldes ergibt sich, indem man in (8.144) die Felder Aα und Aα durch die Operatoren Aα und Aα ersetzt. In der Darstellung (8.121) und
232
8 Kanonische Feldquantisierung
(8.124) erhält man auf diese Weise mit (8.120b) und (8.110a) durch ähnliche Rechnungen wie für H l m m l 3 l m 1 lm S μ c2 A A A A d x π A π m A l d 3x 0 3 3 ¼ 3 5 i h d k d k d x ωk (λ)l (λ )m ¼ (λ)m (λ )l ¼ ε (k) ε (k ) ε (k) ε (k ) 2 (2π)3 ωk λ,λ (λ) i k x (λ) i k x b (k) e b (k) e b (λ )(k ) e i k x b (λ ) (k ) ei k x (8.123) d 3 k ε(λ)l(k) ε(λ )m (k) ε(λ)m(k) ε(λ )l (k) (8.128) i h 2 λ,λ b (λ)(k) b (λ ) (k) e 2iωk t b (λ)(k) b(λ ) (k) e2iωk t i2h d 3 k ε(λ)l(k) ε(λ )m(k) ε(λ)m(k) ε(λ )l(k) λ,λ b (λ)(k) b (λ ) (k) b (λ)(k) b (λ )(k) . ¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
Im letzten Ergebnis verschwindet das erste Integral, weil die erste eckige Klammer für λλ und k k bei in sich selbst übergehender zweiter Klammer das Vorzeichen wechselt, so daß sich bei der Summation und Integration je zwei Terme gegenseitig wegheben. Definiert man analog zu (8.146) einen vektoriellen Spinoperator S mit den Komponenten Sn S lm , l, m, n zyklisch, (8.147) so kann der verbliebene Beitrag zu i h 3 (λ) d k S (k) (λ )(k) b (λ)(k) b (λ ) (k)b (λ)(k) b (λ )(k) 2 ¼
¼
¼
λ,λ¼
zusammengefaßt werden, wobei der Dreiervektor (λ)(k) als Komponenten die drei räumlichen Komponenten des Vierervektors ε (λ)α(k) besitzt. Da das Kreuzprodukt der Polarisationsvektoren für λ λ verschwindet, erstreckt sich die Summe nur über Terme mit λ λ . Dann können die Operatoren b (λ)(k) und b (λ ) (k) nach (8.127c) wegen g λλ 0 vertauscht werden, und wir erhalten schließlich (mit k k und λ λ ) den Spinoperator ¼
S
i h 2
¼
d 3 k
(k )
(λ¼¼ )
(k )
(λ¼ )
b (λ ) (k ) b (λ )(k ) b (λ ) (k ) b (λ )(k ) . ¼
¼¼
¼¼
¼
λ¼ ,λ¼¼
(8.148) Dieser ist ohne Abzug eines divergenten Terms von Haus aus normalgeordnet. Die drei Komponenten des Spinoperators vertauschen nicht miteinander, daher kann der Spin nicht vollständig scharf gemessen werden. Von den – einzeln scharf meßbaren – Spinkomponenten interessiert in Fällen, in denen eine eindeutige Richtung der Wellenausbreitung definiert ist, besonders die in diese Richtung fallende Komponente,
8.3 Quantisierung des Maxwellschen Vakuumfeldes
233
die sogenannte Helizität. Eine eindeutige Richtung gibt es z. B. bei den Ein-PhotonenZuständen b (λ) (k) 0, für die wir jetzt die Wirkung des Helizitätsoperators S k S k/ k
(8.149)
berechnen wollen. Dabei benutzen wir die Vertauschungsrelationen (8.127) und berücksichtigen, daß die in S k auftretenden Vernichtungsoperatoren nach der Vertauschung auf den Vakuumzustand 0 wirken und dann den Beitrag 0 liefern, k i h (λ ) d3k S k b (λ) (k) 0 (k ) (λ )(k ) δ 3 (k k ) 2 k λ ,λ ' 1 ' λ λ (λ ) g b (k )g λ λ b (λ ) (k ) '0 i h k (λ) (k) (λ )(k) g λλ b (λ ) (k) 0 2 k λ i h k (λ ) (k) (λ)(k) g λλ b (λ ) (k) 0 2 k ¼¼
¼
¼
¼¼
¼¼
¼
¼
¼¼
¼
¼
¼
¼¼
¼¼
λ¼¼
oder mit der Umbenennung λ
λ
S k b (λ)(k) 0 i h g λλ
k k
(λ)
(k)
(k) b (λ ) (k) 0.
(λ¼ )
¼
(8.150)
λ¼
Aus den für k μ k , 0, 0, k gültigen Relationen (8.117) folgt k/ k
0, 0, 1 ,
(1)
1, 0, 0 ,
(2)
0, 1, 0 ,
(3)
0, 0, 1
und (0) 0. Hiermit ergibt sich aus (8.150) zum einen, daß skalare Photonen (λ 0) keinen Spin besitzen. (Man erhält für diesen auch schon ohne Projektion auf die k-Richtung null.) Zum anderen folgt wegen k (3) , daß die Spinkomponente longitudinaler Photonen (λ 3) in Ausbreitungsrichtung null ist. Für die transversalen Photonen verschwindet der Summenbeitrag von λ 0 und λ 3, so daß wir für sie mit g λλ 1 und * k (λ) 1 für λ 1, λ 2 (λ ) (k) (k) k 1 für λ 2, λ 1 schließlich ¼
S k b (1) (k) 0 i h b (2) (k) 0,
S k b (2) (k) 0 i h b (1) (k) 0
(8.151)
erhalten. Offensichtlich sind die transversalen Ein-Photonen-Zustände keine Eigenzustände von S k . Es ist jedoch einfach, durch lineare Superposition von Ein-Photonen-Zuständen Eigenzustände von S k zu erzeugen. Definiert man neue Erzeugungsoperatoren 1 1 bR (k) b (1) (k) i b (2) (k) , bL (k) b (1) (k) i b (2) (k) , 2 2 (8.152)
234
8 Kanonische Feldquantisierung
so folgt aus (8.151) sofort S k bR (k) 0 h bR (k) 0,
S k bL (k) 0 h bL (k) 0 ,
(8.153)
d. h. bR (k) 0 und bL (k) 0 sind Eigenzustände des Helizitätsoperators S k zu den Eigenwerten h und h. Klassisch entsprechen die durch Anwendung der Operatoren (8.152) auf den Vakuumzustand 0 hervorgehenden Quantenzustände rechts- und linkshändig zirkular polarisierten Lichtwellen, so daß man sie als Eigenzustände rechtsbzw. linkshändig zirkular polarisierter Photonen auffassen kann. Deren Spinkomponenten in Ausbreitungsrichtung betragen h, was nach der üblichen Nomenklatur – als Spin bezeichnet man die kleinste positive Spinkomponente geteilt durch h – bedeutet, daß Photonen den Spin 1 besitzen. Nach der allgemeinen Quantenmechanik des Drehimpulses hätte man erwarten können, daß die Spinkomponente eines Spin-1-Teilchens die Werte h, 0 und h annimmt. Wir finden jedoch nur h, da den longitudinalen Photonen keine reale Bedeutung zukommt. Das hat mit der verschwindenden Photonenmasse und der daraus folgenden Ausbreitung mit Lichtgeschwindigkeit zu tun. Unsere früheren Rechnungen zum Drehimpulsoperator waren nicht-relativistisch und bezogen sich auf ein ruhendes Drehzentrum. Für Photonen gibt es jedoch prinzipiell keinen nicht-relativistischen Grenzfall. Massive Spin-1-Teilchen können bei Lorenz-Eichung durch die Proca-Gleichungen Aα
m 02 c2 h 2
Aα
μ0 j α
0
(8.154)
beschrieben werden. Diese geht aus den Maxwell-Gleichungen der Form (7.61) in Lorenz-Eichung durch Hinzufügen eines Masseterms ähnlich hervor wie die KleinGordon-Schrödinger-Gleichung (4.6) aus der entsprechenden Gleichung für masselose Teilchen. Ihre Quantisierung kann ähnlich wie die des Maxwell-Feldes erfolgen, wobei den longitudinalen Feldquanten allerdings reale Bedeutung zukommt. Dies führt dazu, daß in Übereinstimmung mit den gewöhnlichen Drehimpulsregeln drei Spinkomponenten auftreten. Wegen der endlichen Ruhemasse existiert hier allerdings auch ein nicht-relativistischer Grenzfall.
8.3.8 Vakuumfluktuationen Wie wir am Anfang dieses Kapitels gesehen haben, spielt das Vektorpotential Aα in der Quantentheorie des elektromagnetischen Feldes dieselbe Rolle wie der Teilchenort in der gewöhnlichen Quantenmechanik. Vom letzteren wissen wir, daß er nicht permanent einen scharfen Wert beibehalten kann, sondern eine durch die Unschärferelation x i pi > vorgegebene Unschärfe aufweist. Das steht jedoch nicht im Widerspruch
h zu einer festen mittleren Lage, z. B. x 0. Da die Quantentheorie des elektromagnetischen Feldes in völliger Analogie zur Quantenmechanik entwickelt wurde, können wir ein analoges Verhalten des Operators A α und und seines Erwartungswerts ψ A α ψ erwarten. Im Vakuumzustand, der 0 ∂ αA α 0 0 erfüllt und daher mit zu den physikalischen Zuständen zählt, ergibt sich für den Erwartungswert des Feldes mit b (λ)(k) 0 0
8.3 Quantisierung des Maxwellschen Vakuumfeldes
235
und 0b (λ) (k) 0 0 A α 0 2 hμ 0c
3 (8.121) λ 0
Aα(λ) (k, x) 0b (λ)(k)0 Aα(λ) (k, x) 0b (λ)(k)0 3 d k (2π)3 2ωk
0.
Ein Maß für die mittlere quadratische Abweichung vom Mittelwert null bildet die Größe (x) A α (x)0. Wir berechnen zuerst mit (8.121) 0 A α ' 1 0 ' d 3 k d 3 k ' ' 2 0 ' A α (x) A α (x )' 0 hμ c εα (λ)(k) ε(λ )α(k ) 0 3 2(2π) ωk ωk λ,λ 0 ' ' 1 ' (λ) i k x b (λ)(k) ei k x b (λ )(k ) ei k x b (λ ) (k ) ei k x '' 0 .
0 ' b (k) e ¼
¼
¼
¼
¼
¼
¼
¼
¼
Mit ' 1 0 ' ' 1 0 ' ' 1 0 ' ' ' ' ' ' ' 0 'b (λ)(k) b (λ )(k )' 0 0 'b (λ)(k) b (λ ) (k )' 0 0 'b (λ)(k) b (λ )(k )' 0 0 ¼
¼
¼
(in jedem der drei Fälle wirkt ein Vernichtungsoperator auf den Vakuumzustand) und b (λ)(k) b (λ ) (k ) ¼
(8.127c) (λ¼ ) (λ) b (k ) b (k)
g λλ δ 3 (k k ) ¼
sowie mit der Normierung 00 1 erhalten wir ' 1 0 ' ' ' 0 ' A α (x) A α (x )' 0 hμ 0c
¼
hμ 0c
λ,λ¼ (g
¼
¼
¼
λ,λ¼
d3k εα (λ)(k) ε(λ )α(k) g λλ ei k (x x) 3 2(2π) ωk ¼
2
(8.115b) 2 hμ 0c
und mit
d 3 k d 3 k εα (λ)(k) ε(λ )α(k ) g λλ δ 3 (k k ) ei (k x k x) 2(2π)3 ωk ωk ¼
2
¼
¼
λ,λ¼
d3k 2(2π)3 ω
λλ¼ )2 4
(g λλ )2 ei k (x x) ¼
k
¼
λ,λ¼
schließlich
' ' 2 0' A α (x) A α (x )'0 2hμ 0c
d3k ei k (x x) . (2π)3 ωk ¼
(8.155)
Für x x folgt daraus mit Aα Aα Φ 2/c2 A2 , ωk c k und d 3 k 4π 2 k2 d k d3k hμ 0c 2 2 2 2 0 A Φ /c 0 2hμ k d k , 0c (2π)3 ωk π 0 d. h. die durch 0 A α A α 0 beschriebenen Vakuumfluktuationen werden sogar unendlich stark. Diese Divergenz kann nicht durch Subtraktion eliminiert werden, da der Mittelwert des Feldes im Vakuumzustand verschwindet. Daraus kann geschlossen werden,
236
8 Kanonische Feldquantisierung
daß der Erwartungswert der berechneten Größe nicht an einem isolierten Raum-ZeitPunkt meßbar ist. Offenbar kann man die Divergenz jedoch beheben, indem man Gleichung (8.155) über x μ und x ¼μ mittelt. Der Erwartungswert des Produktes von Mittelwerten der Feldoperatoren über endliche Raum-Zeit-Gebiete wird damit zu einer meßbaren Größe. Das kann damit verglichen werden, daß in der gewöhnlichen Quantenmechanik nur Wellenpakte physikalisch sinnvoll sind, nicht jedoch die diese konstituierenden ebenen Einzelwellen. Als Resümee halten wir fest, daß der Vakuumzustand nicht feldfrei ist. Die in ihm auftretenden Fluktuationen können indirekt gemessen werden. Sie führen z. B. zu Fluktuationen des Elektronenorts im Atom, die sich ähnlich wie die Zitterbewegung des Elektrons auswirken und zu einer (schwachen) Verschiebung der Energieniveaus führen, die als Lamb-Shift bezeichnet wird.
8.4
Quantisierung des freien Dirac-Feldes
Bei der Quantisierung des Dirac-Feldes treten Besonderheiten auf, die dazu führen werden, daß wir bei ihm teilweise anders als beim Schrödinger-Feld vorgehen müssen. Als erstes wird der Spinor ψ mit den vier Komponenten ψα , α 1, . . . , 4, zu einem Spinoroperator ψ mit Komponenten ψα gemacht, desgleichen der durch (7.75) π π i h definierte Impuls, i hψ ψ . Da das Dirac-Feld Fermionen beschreibt, können wir aufgrund unserer Erfahrungen bei der Jordan-Wigner-Quantisierung des Schrödinger-Feldes fordern, daß zwischen den Operatoren Antikommutationsregeln gelten. In Abschn. 8.4.2 wird sich zeigen, daß diese aus physikalischen Gründen erzwungen werden. In Analogie zu (8.107) lauten sie
ψα (x, t), ψβ (x , t) 1 ψα (x, t), πβ (x , t) i h
πα (x, t), πβ (x , t) 0, 3 ψα (x, t), ψβ (x , t) δαβ δ (x x ) .
0,
(8.156)
(Gegenüber (8.107) ist g αβ durch δαβ ersetzt, weil sich die Indizes auf gleichberechtigte Spinor- und nicht Vektorkomponenten mit indefiniter Metrik beziehen.) Wie im nächsten Abschnitt gezeigt wird, erfüllt der Operator ψ(x, t) unabhängig davon, ob die Vertauschungsrelationen mit Kommutatoren oder Antikommutatoren gebildet werden, wie das Feld ψ(x, t) die Dirac-Gleichung. Aus (7.79) mit (7.78) ergibt sich der Hamilton-Operator H ψ (x, t) HD(x)ψ(x, t) d 3x
α,β
ψα (x, t) HD αβ (x) ψβ (x, t) d 3x , (8.157)
wobei HD αβ (x) als Differentialopertor aufzufassen ist, der auf die Ortsabhängigkeit in ψβ (x, t) einwirkt. Nach Abschn. 7.5.4 ist die durch (7.133) gegebene Ladung Q eine
8.4 Quantisierung des freien Dirac-Feldes
237
Erhaltungsgröße der klassischen Feldtheorie. Ihr ist der Ladungsoperator Q q ψ ψ d 3x zugeordnet. Dem Impuls (7.100) des Dirac-Feldes ist der Impulsoperator h p ψ ψ d 3x i zugeordnet.
8.4.1 Bewegungsgleichung für den Feldoperator
(8.158)
(8.159)
x t
Aus (8.10) folgt mit (8.157) für ψ σ (x, t) die Bewegungsgleichung ψ σ (x, t), ψ α (x , t) H D αβ (x ) ψ β (x , t) d 3x . i h ∂t ψσ (x, t) ψσ (x, t), H α,β
Wenn die Art der Vertauschungsrelationen zwischen Spinoren offengelassen wird, folgt hieraus mit
ϕ, χ ψ
ϕ χ ψ
χ ψ ϕ
ϕ χ ψ
χ ϕ ψ χ ϕ ψ χ ψ ϕ ϕ, χ ψ χ ϕ, ψ
die Beziehung i h ∂t ψ σ (x, t)
α,β
α,β
ψ σ (x, t), ψ α (x , t) H D αβ (x ) ψ β (x , t) d 3x
ψ α (x , t) H D αβ (x ) ψ σ (x, t), ψ β (x , t) d 3x .
Der zweite Term der rechten Seite verschwindet für beide Arten von Vertauschungsrelationen, und mit (8.156d) oder der entsprechenden Vertauschungsrelation mit dem Minus-Kommutator ergibt sich δσ α δ 3 (x x ) H D αβ (x ) ψ β (x , t) d 3x H D σβ (x) ψ β (x, t) i h ∂t ψσ (x, t) α,β
bzw. in Spinornotation
β
i h ∂t ψ
H D(x) ψ .
t) also Unabhängig von der Art der Vertauschungsrelationen erfüllt der Operator ψ(x, wie das Spinorfeld ψ(x, t) die Dirac-Gleichung, in invarianter Schreibweise h α γ ∂α ψ i
m 0 cψ
0.
(8.160)
238
8 Kanonische Feldquantisierung
8.4.2 Entwicklung nach ebenen Wellen Die physikalischen Konsequenzen der Feldquantisierung lassen sich am besten durch die Entwicklung von ψ und ψ nach Erzeugungs- und Vernichtungsoperatoren erkennen. Wie in Abschn. 2.4 entwickeln wir nach ebenen Wellen, wobei wir für eine Einzelwelle zunächst analog zu (2.69) mit k μ pμ /h U e
ψ
i p x/h
ansetzen. Wird dies in die Bewegungsgleichung (8.160) eingesetzt, so ergibt sich für U die Gleichung (/ p m 0 c) U 0. (8.161) (γ α pα m 0 c) U Die Lösbarkeitsbedingung für diese Gleichung (Verschwinden der Determinante) liefert wie in Abschn. 2.4 die Dispersionsrelation (2.78), E p0 c Ep mit Ep c (m 0 c)2 p2 > 0 , (8.162) die mit p p pα pα Ep2 /c2 p2 auch in der Form p p
m 02 c2
(8.163)
geschrieben werden kann. Statt für p0 E/c positive und negative Werte zuzulassen, beschränken wir p0 ähnlich wie k0 im Fall des Maxwell-Feldes auf positive Werte und betrachten zum Ausgleich die Wellen U ()( p) e
ψ () ψ (
U ( )( p) e
)
i p x/h i p x/h
U ()( p) e( U ( )( p) e
i Ep t i px)/h (i Ep t i px)/h
, ,
wobei ψ () für Wellen positiver und ψ ( ) für Wellen negativer Energie steht. Dies hat zur Folge, daß (8.161) durch die Gleichungen (/ p m 0 c) U ()
0,
(/ p m 0 c) U (
)
0
(8.164)
ersetzt werden muß. Aus (8.164) ergeben sich analog zu Abschn. 2.4 für U ()( p) und U ( )( p) je zwei Lösungen. Die vier Wellenlösungen, die damit zu jeder Ausbreitungsrichtung p gehören, können in der Form U l p mit
1 (2π h )3/2
ψl p (x, t) a (l, p) ,
m 0 c2 u(l, p) e Ep
εl i p x/h
l
1, . . . , 4 *
(8.165)
1, 2 3, 4 (8.166) geschrieben werden, wobei pα Ep /c, p für alle l gilt und der Spinor-Charakter von U l p in ψl p bzw. u(l, p) enthalten ist, während es sich bei den a (l, p) um vier einkomponentige Operatoren handelt. ψl p ist für l 1, 2 eine (Spinor-)Welle positiver und für ψl p (x, t)
,
εl
1
1
für für
l l
8.4 Quantisierung des freien Dirac-Feldes
239
l 3, 4 eine Welle negativer Energie. Einsetzen von (8.165)–(8.166) in (8.164) liefert für die Spinoren u(l, p) die Bestimmungsgleichungen p/ m 0 c u(l, p) p/ m 0 c u(l, p)
0 0
für für
1, 2 , 3, 4 .
l l
(8.167)
Da diese mit Gleichung (2.72) identisch und ihre Lösungen nur bis auf einen freien Faktor festgelegt sind, können die letzteren so gewählt werden, daß sie statt (2.83) (mit λμ) die Orthonormierungsbedingung Ep l , εl p u (l, εl p) δl l m 0 c2
u
¼
(8.168)
¼
erfüllen. (Der Grund für die unterschiedliche Normierung ist, daß bei den Rechnungen des Abschnitts 2.4 die nicht Lorentz-invariante Größe u u möglichst einfach sein sollte, während jetzt ein möglichst einfacher Ausdruck für die Lorentz-invariante Größe uu angestrebt wird.) Dabei ist zu beachten, daß sich die Bedingungen (2.83) auf denselben Impuls p beziehen, während p hier mit εl bzw. εl multipliziert ist. Der Grund dafür findet sich in dem folgenden Beweis. ¼
Beweis: Zwischen den Lösungen (2.84) aus Abschn. 2.4 und den Lösungen (8.166) besteht die Zuordnung ()
Ui
ei (E
( )
Ui
( ) t p x)/h
() t p x)/h i (E
e
() (i Ep t i px)/h e
ψl p (x, t)
für l
1, 2 ,
() ( i Ep t i px)/h e
ψl p (x, t)
für l
3, 4 .
Ui
Ui
Der Vergleich zeigt, daß für l 3, 4 in (2.83) p durch p ersetzt werden muß. Auf diese Weise kommt bis auf den frei wählbaren Faktor (8.168) zustande.
Aus Gleichung (8.166) folgt ψl p (x, t) ψl p (x, t) d 3x
m 0 c2 u (l , p ) u(l, p) ei (εl Ep εl Ep ) t /h Ep Ep 2
mE0 cE u
(l , p ) u(l, p) ei (εl Ep εl Ep ) t /h δ 3 (εl p
ei (εl p εl p)x/h 3 dx (2π h )3 εl p) .
p p
Wegen der δ 3 -Funktion ist die rechte Seite nur für εl p εl p oder p εl εl p von null verschieden, außerdem gilt nach (8.162) Ep Ep für p p, weshalb wir auch ψl p (x, t)ψl p (x, t) d 3x
mE0c p
2
u (l , εl εl p) u(l, p) ei (εl Ep εl Ep ) t /h δ 3( p
εl εl p)
schreiben können. Die Orthonormalitätsrelationen (8.168) gelten für beliebige Vektoren p. Insbesondere dürfen wir in ihnen auch pεl p mit der Folge εl p p setzen,
240
8 Kanonische Feldquantisierung
womit sie in u
l , εl εl p u l, p ¼
¼
¼
ψlp (x, t) ψl p (x, t) d 3x ¼
δl l
¼
(8.169)
¼
εl εl p)δl l δ 3 ( p
übergehen. Hiermit und mit δl l δ 3 ( p aus dem letzten Ergebnis schließlich
¼
Ep δl l m 0 c2
¼
δ3 ( p
εl2 p)δl l δ 3 ( p
p) wird
¼
p) .
(8.170)
Die Entwicklung der Operatoren ψ und ψ nach ebenen Wellen (8.165) lautet
t) ψ(x,
4
ψ (x, t)
a (l, p) ψl p (x, t) d 3p ,
4
l 1
a (l, p) ψlp (x, t) d 3p .
l 1
(8.171)
Ihre Auflösung nach den Entwicklungskoeffizienten a (l, p) ergibt sich aus
t) d 3x ψl p (x, t) ψ(x,
4 l
(8.170)
und liefert mit (8.166) a (l, p) a (l, p)
¼
¼
p¼ (x, t) d
3
x d 3p
1
a (l , p ) δl l δ 3 ( p p ) d 3p ¼
a (l, p)
l ¼ 1
t) d 3x ψl p (x, t) ψ(x,
(x, t) ψl p (x, t) d 3x
a (l , p ) ψl p (x, t) ψl
4
ψ
m 0 c2 (2π h )3 Ep
m 0 c2 (2π h )3 Ep
t) eεl i px/h d 3x , u (l, p) ψ(x,
(8.172) ψ (x, t) u(l, p) e
εl i p x/h
d 3x .
Hieraus ergeben sich für die Operatoren a(l, p) mit (8.156) die Vertauschungsrelationen
a(l, p), a (l , p ) δl l δ 3 ( p p ) , a (l, p), a (l , p ) a (l, p), a (l , p ) ¼
0.
(8.173)
Beweis: (8.172a) ψlp (x, t) ψ(x, t), ψ (x , t) ψl p (x , t) d 3x d 3x a(l, p), a (l , p ) ψlp (x, t) ψl p (x , t) ψα (x, t), ψβ(x , t) d 3x d 3x ¼
αβ
α
¼
¼
β
¼
8.4 Quantisierung des freien Dirac-Feldes (8.156c)
ψl p (x, t)
αβ
α
(8.170)
ψlp (x, t)
δl l δ 3 ( p
241
ψl p (x , t) δαβ δ 3 (x x ) d 3x d 3x α β ¼
¼
ψl p (x, t) d 3x α α ¼
¼
ψlp (x, t) ψl p (x, t) d 3x ¼
¼
p)
¼
Die übrigen Beziehungen (8.173) beweist man analog.
Werden die Entwicklungen (8.171) in den Hamilton-Operator (8.157) eingesetzt, so ergibt sich zunächst 4
H
3
dx
d 3 p d 3p a (l , p ) ψlp (x, t) a (l, p) H D ψl p (x, t) . ¼
¼
l,l ¼ 1
Da die ebenen Wellen ψl p (x, t) Lösungen der Dirac-Gleichung sind, erfüllen sie H D ψl p (x, t)
i h ∂t ψl p (x, t)
(8.166)
εl p0c ψl p (x, t)
εl Ep ψl p (x, t) ,
und damit folgt weiterhin 4
H (8.170)
l,l ¼ 1 4
d 3 p d 3p a (l , p ) a (l, p) εl Ep
ψlp (x, t) ψl p (x, t) d 3x ¼
¼
d 3p d 3p a (l , p ) a (l, p) εl Ep δl l δ 3 ( p p ) ¼
l,l
¼
1
4
a (l, p) a (l, p) εl Ep d 3p
l 1
oder ausführlicher mit (8.166b) 4 3 2 4 H a (l, p) a (l, p) a (l, p) a (l, p) Ep d 3p . l 1
l 3
Für den Ladungsoperator (8.158) ergibt sich analog (man muß dazu nur in der Rechnung für H den Differentialoperator H D bzw. später εl Ep durch 1 ersetzen) Q
4
a (l, p) a (l, p) d 3 p .
l 1
Jetzt kommen wir zur physikalischen Deutung. Für die Lösungen positiver Energie (l 1, 2) ergibt sich kein Problem, wir können n l ( p) (a)
a (l, p) a (l, p)
(8.174)
242
8 Kanonische Feldquantisierung
als Operator der Teilchenzahldichte im p-Raum auffassen und haben damit 2
H (a)
Q (a)
n l ( p) Ep d 3 p , (a)
q
l 1
2
n l ( p) d 3p . (a)
(8.175)
l 1
wurden ohne Benutzung von VertauDie Ausdrücke für n l(a) ( p), H (a) und N (a) Q/q schungsrelationen abgeleitet und stimmen sowohl mit den bei der bosonischen Quantisierung der Schrödinger-Gleichung erhaltenen Beziehungen (8.28), (8.30) und (8.26) als auch den bei deren fermionischer Quantisierung erhaltenen Beziehungen (8.46), (8.53) und (8.47) überein. Es können dieselben Schlüsse wie dort gezogen werden, und in beiden Fällen erhält man physikalisch sinnvolle Ergebnisse. Dies bedeutet, daß bei den Lösungen positiver Energie sowohl die bosonische als auch die fermionische Quantisierung möglich wäre. Wenn man zum Ausdruck bringen will, daß es sich bei den durch (8.174)–(8.175) beschriebenen Teilchen um Elektronen handelt, muß man q e setzen. Für die Lösungen negativer Energie (l 3, 4) haben wir H (b)
4
Q (b)
a (l, p) a (l, p) Ep d 3p ,
q
l 3
4 l 3
a (l, p) a (l, p) d 3 p .
Würden wir a (l, p) für l 3, 4 als Erzeugungsoperatoren auffassen, so wäre die Energie unabhängig von der Art der Vertauschungsrelationen negativ, was unphysikalisch ist. Wenn wir jedoch b (l 2, p)
a (l, p)
für
l
3, 4
(8.176)
als Vernichtungsoperatoren und dementsprechend b (l 2, p) a (l, p) für l 3, 4 als Erzeugungsoperatoren auffassen, wird 2 2 H (b) b (l, p) b (l, p) Ep d 3p , Q (b) q b (l, p) b (l, p) d 3 p . l 1
l 1
Aus (8.173) und (8.176) folgen mit δl 2, l 2 δl l unter Berücksichtigung von a, a a , a für l 1, 2 die fermionischen Vertauschungsrelationen ¼
b (l, p), b (l , p ) b (l, p), b (l , p )
¼
a (l 2, p), a (l 2, p ) b (l, p), b (l , p ) 0
δl l δ 3 ( p p ) ¼
(8.177)
sowie das Verschwinden sämtlicher Antikommutatoren zwischen a und b . Mit b (l, p) b (l, p) b (l, p) b (l, p)δ 3 (0) ergibt sich nach Abzug negativ unendlicher konstanter Beträge H (b)
2 l 1
n l(b) ( p) Ep d 3p ,
Q (b)
q
2 l 1
n l(b) ( p) d 3p
(8.178)
8.4 Quantisierung des freien Dirac-Feldes
mit
243
b (l, p) b (l, p) .
(b)
n l ( p)
(8.179)
(Die Konsequenzen bosonischer Vertauschungsrelationen werden weiter unten besprochen.) Die Energie ist jetzt wie gefordert positiv. Da auch die Ladung das Vorzeichen gewechselt hat, kann es sich bei den durch die Operatoren b (l, p) erzeugten Teilchen allerdings nicht wie bei den durch a (l, p) erzeugten um Elektronen handeln, es sind vielmehr deren Antiteilchen, die Positronen. Damit die Ladung bei beiden Teilchensorten das richtige Vorzeichen hat, muß dabei sowohl für Elektronen als auch für Positronen q e (8.180) gesetzt werden. Die Erzeuger- und Vernichtereigenschaften von a (l, p) und b (l, p) bzw. a (l, p) 2 2 (a) 3 und b (l, p) sowie die Ganzzahligkeit der Eigenwerte von N (a) l 1 n l ( p) d p 2 (b) 2 3 und N (b) l 1 n l ( p) d p können wie in Abschn. 8.1.2 nachgewiesen werden. Dabei kann wieder ein Vakuumzustand 0 eingeführt werden, der durch a (l, p)0
0,
b (l, p)0
0a (l, p)
0,
0,
0b (l, p)
0
(8.181)
charakterisiert ist. Wären statt (8.156) bosonische Vertauschungsrelationen angesetzt worden, so p)δ3 (0) ergeben, und mit hätte sich statt (8.177a) b (l, p) b (l, p) b (l, p) b(l, (b) n l ( p) b (l, p) bl ( p) wäre 2 2 H (b) n l(b)( p) Ep d 3p Ep δ3 (0) d 3p , Q
l 1
(b)
2
n l ( p) d p
l 1
3
2
l 1 3
δ (0) d 3p .
l 1
Nach Addition eines konstanten unendlichen Beitrags käme man selbst dann, wenn H durch 2 H (b) H0 n l ( p) Ep d 3p l 1
mit H0>0 definiert würde, durch hinreichend häufige Teilchenerzeugung auf jeden Fall zu negativen Energien. Da dies jedoch ausgeschlossen werden muß, kommen für das Dirac-Feld nur fermionische Vertauschungsrelationen in Frage. Da das Dirac-Feld Spin1/2-Teilchen beschreibt, ist hiermit das Spin-Statistik-Theorem von Abschn. Q9.2.6 auch für Elektronen und Positronen bewiesen. Das Elektronen und Positronen umfassende Gesamtergebnis für H H (a) H (b) und Q Q (a) Q (b) lautet mit (8.180) H
2 n l(a) ( p) n l(b) ( p) Ep d 3p , l 1
(8.182)
244
8 Kanonische Feldquantisierung
e
Q
2
(a) (b) n l ( p) n l ( p) d 3 p .
(8.183)
l 1
Für den Impulsoperator (8.159) ergibt sich durch Einsetzen der Entwicklungen (8.171) mit der Umbenennung (8.176) p
2 a (l, p) a (l, p) b (l, p) b (l, p) p d 3 p , l 1
wobei der Faktor p und der Vorzeichenunterschied der a und b -Terme durch die Ortsableitung von ei px /h zustandekommt. Durch Benutzung der Vertauschungsrelation (8.177a) wird dieses Ergebnis mit (8.174) und (8.179) in p
2 n l(a) ( p) n l(b) ( p) p d 3p l 1
(8.184)
2 überführt, wobei wieder δ 3 (0) p d 3p 0 benutzt wurde. t) Abschließend wird noch angegeben, wie die Entwicklung des Feldoperators ψ(x, nach ebenen Wellen mit der Umdefinition (8.176) lautet. Aus (8.171a) mit (8.166) folgt zunächst 2 m 0 c2 i px/h a (l 2, p) u(l 2, p) ei px/h d 3 p. t) ψ(x, a (l, p) u(l, p) e (2π h )3 Ep l 1
Mit (8.176) bzw. b (l, p) a (l 2, p) und der Umbenennung v(l, p) u(l 2, p)
(8.185)
wird daraus
2
m 0 c2 i px/h b (l, p) v(l, p) ei p x/h d 3 p , a (l, p) u(l, p) e (2π h )3 Ep l 1 (8.186) 2 2 m0c t) ψ(x, a (l, p) u(l, p) ei px/h b (l, p) v(l, p) ei px/h d 3 p , (2π h )3 Ep
t) ψ(x,
l 1
wobei (8.186b) eine unmittelbare Folge von (8.186a) ist. Die Bedeutung der in ψ und ψ stehenden Erzeugungs- und Vernichtungsoperatoren wurde in Anschluß an Gleichung (8.179b) angegeben und ist nochmals in Tabelle 8.1 zusammengefaßt.
Erzeuger Vernichter
Elektronen a (l, p) a (l, p)
Positronen b (l, p) b (l, p)
Tabelle 8.1: Bedeutung der Erzeuger und Vernichter in ψ und ψ.
8.4 Quantisierung des freien Dirac-Feldes
245
8.4.3 Eigenschaften der Spinoren u l p und l p Für spätere Zwecke erweist es sich als nützlich, im Raum der zu fest vorgegebenem Impuls p gehörigen vier Spinoren u(l, p) und v(l, p), l 1, 2, die Projektionsoperatoren p/ m 0 c 2m 0 c
Π
(8.187)
einzuführen. (Zwischen diesen und den in Abschn. 2.7 eingeführten Projektionsoperatoren Π besteht eine gewisse Verwandtschaft. Hier handelt es sich jedoch um Matrixoperatoren, während die Π Differentialoperatoren sind.) Die durch (8.187) eingeführten Matrizen Π erfüllen die Gleichungen Π
Π 1 ,
Π2
Π ,
Π Π
Π Π 0
(8.188)
und besitzen die Projektionseigenschaften
0, u(l, p) u(l, p) ,
Π u(l, p)
Π v(l, p)
Π
u(l, p)Π
v(l, p) , u(l, p) ,
v(l, p) , v(l, p) 0 .
v(l, p)Π
(8.189)
Π
(8.190)
Beweis: (8.188a) folgt direkt aus den Definitionen (8.187). (8.188b) und (c) folgen mit γ α γ β pα pβ
p/2
(2.204) γ β γ α pα pβ g αβ pα pβ
1 α β γ γ 2
γ β γ α pβ pα
p p (8.163) m 02 c2 Π Π p/
gemäß
m 02 c2 4m 02 c2 2
Π Π und 2 Π
0
2 2 2 p/ 2m 0 c p2/ 2 m 0 c 2m 0 c (p/2 2 m 0 c) Π . 4m c 4m c 0
0
Die Gültigkeit der Beziehungen (8.189a) und (8.190c) folgt unmittelbar aus (8.167a) bzw. (8.167b) mit (8.185). (8.190a) folgt mit (8.188a) gemäß u(l, p) (Π
Π )u(l, p)
(8.189a)
Π u(l, p) ,
und hiermit folgt (8.190b) gemäß u(l, p)
u (l, p) γ 0
u (l, p)
u(l, p)
(8.187)
Π u(l, p)
γ0
u
(l, p) Π γ 0
γ α (γ 0 )2 pα (γ α ) γ 0 pα γ 0 m 0 c (2.202) u (l, p) γ 0 2m 0 c 2m 0 c
γ α pα m 0 c 2m 0 c
u(l, p) Π
(8.189b) und (c) werden genauso bewiesen.
m0c
.
246
8 Kanonische Feldquantisierung
Aus den Orthonormierungsbedingungen (8.169) wird mit der Umbenennung (8.185) Ep u l , p u l, p δl l , u l , p v l, p 0 2 m0c (8.191) Ep v l , p u l, p 0 , v l , p v l, p δl l . m 0 c2 ¼
¼
Alternativ gelten die mit u statt u etc. gebildeten Orthonormierungsbedingungen u l , p u l, p δl l , u l , p v l, p 0 (8.192) v l , p u l, p 0 , v l , p v l, p δl l . ¼
¼
Beweis: (8.192b) folgt mit (8.189b), (8.190b) und (8.188c) gemäß u(l , p) v(l, p)
u(l , p)Π Π v(l, p)
0,
und (8.192c) beweist man analog. (8.192a) beweisen wir zunächst für den Fall p 0. In diesem reduziert sich die Bestimmungsgleichung (8.167a) für u mit p/ γ α pα γ 0 p0 sowie p0 Ep p0 /cm 0 c und γ 0 β auf (βm 0 c m 0 c)u 0 bzw. βu u (8.193) und hat nach (2.80) die zwei Lösungen χl , l 1, 2 u(l, 0) 0
χ1
mit
1 , 0
χ2
0 . 1
Dabei wurde der Normierungsfaktor N schon so gewählt, daß die in diesem Abschnitt gewählte Normierungsbedingung (8.169) bzw. (8.191a), die für p0 wegen Ep p0 m 0 c2 u (l , 0) u(l, 0) χl χl ¼
δll
(8.194)
¼
lautet, erfüllt ist. Für die angegebenen Lösungen gilt u(l , 0) u(l, 0) u (l , 0) γ 0 u(l, 0) u (l , 0) β u(l, 0)
(8.193)
u (l , 0) u(l, 0)
(8.194)
δll , ¼
also (8.192a). Analog beweist man für p0 auch die Gültigkeit von (8.192d), wobei die statt (8.193) gültige, aus (8.167b) folgende Beziehung βv v zu dem Minuszeichen vor δl l führt. Die Lösungen der – Lorentz-invarianten – Gleichungen (8.167a) und (8.167b) für p 0 könnenaus denen für p0 durch eine Lorentz-Transformation zu einem System der Geschwindigkeit Ú 1v 2 /c2 p/m 0 gewonnen werden. Bei dieser gehen die Spinoren u(l, 0) und v(l, 0) nach (2.180) in S(Ú )u(l, 0) bzw. S(Ú )v(l, 0) über. Da die Skalarprodukte uu und vv dabei nach (2.217) invariant sind, gelten (8.192a) und (8.192d) auch für beliebiges p 0. ¼
Nach (2.40) ist uu eine 44-Matrix, und dasselbe gilt für uu bzw. vv. Nach (8.192) gilt für die Summen dieser Matrizen 2 2 u(k, p) u(k, p) u(l, p) u(k, p) δkl k 1
k 1
u(l, p) ,
2 u(k, p) u(k, p)v(l, p)0 k 1
Aufgaben
247
und 2
2
v(k, p) v(k, p) u(l, p) 0 ,
k 1
v(k, p) v(k, p)v(l, p)
v(l, p) ,
k 1
2 d. h. u(k, p) u(k, p) besitzt dieselben Projektionseigenschaften wie Π 2 k 1 v(k, p) v(k, p) dieselben wie Π (siehe (8.189)–(8.190)), was k 1 Π
2 k 1
u(k, p) u(k, p) u(l, p) 0 ,
Π
2 k 1
und
u(k, p) u(k, p) v(l, p) 0
und analoge Beziehungen für Π 2k 1 v(k, p) v(k, p) zur Folge hat. Da die vier Spinoren u(l, p) und v(l, p), l 1, 2 den Raum, auf den Projektionsoperatoren zu gegebenem Impuls p wirken können, voll aufspannen, folgt aus den zuletzt erhaltenen Gleichungen, daß die auf u(l, p) bzw. v(l, p) wirkende Matrix die Nullmatrix sein muß. Hiermit und mit (8.187) erhalten wir die später benötigten Beziehungen 2 p/ m 0 c , u(k, p) u(k, p) 2m 0 c k 1
2 p/ v(k, p) v(k, p) k 1
m 0c . 2m 0 c
(8.195)
Aufgaben 8.1 8.2 8.3 8.4
Zeigen Sie, daß n i im allgemeinen zeitabhängig ist. Wann gilt n i 0?
Zeigen Sie, daß im allgemeinen n (x, t), H 0 gilt. Beweisen Sie, daß N i n i auch für durch die Schrödinger-Gleichung beschriebene Fermionen zeitunabhängig ist. Beweisen Sie für Ni k
( a i N . . . , n i , . . . (
1) Ni δni ,0 N 1 . . . , n i 1, . . .
1) Ni δni ,1 N 1 . . . , n i 1, . . . .
8.5
Beweisen Sie weitere der Vertauschungsrelationen (8.78).
8.6
Beweisen Sie die Beziehungen (8.80)–(8.81), 1 p a p a p a p a p b p b p 2 Q q a pa p a p a p b pb p 2
b p b p
p d 3p ,
b p b p d 3 p .
248
8.7
8.8
8 Kanonische Feldquantisierung
Beweisen Sie die relativistischen Vertauschungsrelationen φ(x), φ(y) π (x), π(y) 0. Anleitung: Benutzen Sie die Entwicklungen (8.67) und die Vertauschungsrelationen (8.78). & Zeigen Sie, daß die bei Lorenz-Eichung gültige Zuordnung π α A α (μ0 c2 ) verträglich ist mit den Vertauschungsrelationen A α (x, t), A β (x ¼ , t) 0 und A α (x, t), π β (x ¼ , t) i h g αβ δ 3 (x x ¼ ) . Anleitung: Untersuchen Sie die Zeitableitung der zwei Vertauschungsrelationen.
8.9
Beweisen Sie explizit die Zeitunabhängigkeit der Operatoren b (λ)(k)
8.10
i g λλ μ0 c2 h ωk
Zeigen Sie, daß dem durch p
ε0
d 3x α A (x) i ωk A α (x) εα(λ) (k) ei k x . 2(2π)3
IR3
0 A 0 A
3
A l A l d 3x
l 1
definierten Impulsoperator in der Darstellung (8.121) der normalgeordnete Impulsoperator 3 k (0) p b (k) b (0) (k) b (λ) (k) b (λ)(k) d 3 k ωk λ 1
zugeordnet ist.
Lösungen 8.6
Mit den Definitionen für A, B, C und D im Beweis gegen Ende von Abschn. 8.2.1 ist 1 a p π φ π φ d 3x p a p A b p a p C a p b p B b p b p D 2m 0 c2 a p a p Da p b p C bp a p B bp b p A Ep p d 3p d 3p 1 3 a p a p a p a p b p b p b p b p p d p 2 12 (a p b p b p a p ) e2i Ep t /h (a p b p bp a p ) e2i Ep t /h p d 3p . ¼
¼
¼
Mit
b p a p p e2i Ep t /h d 3 p
¼
p p
¼
¼
¼
b p a p p e a p b p p e
2i E
¼
p t /h
d 3p
2i E p t /h d 3 p
und einer entsprechenden Umformung des Terms mit e2i Ep t /h folgt das Ergebnis für p .
Aufgaben
249
Q
q 2m 0 c2
a p a p Aa p b p B b p a p C b p b p D a p a p Da p b p C b p a p B b p b p A Ep ¼
¼
¼
¼
¼
¼
¼
¼
¼
d 3p d 3p
q 3 a p a p a p a p b p b p b p b p d p 2 q2 (b p a p a p b p ) e2i Ep t /h (a p b p bp a p ) e2i Ep t /h d 3p . Mit
b p a p e2i Ep t /h d 3 p
b p a p e2i E
p t /h
d 3p
a p b p e2i E Ep p t /h d 3 p
und einer entsprechenden Umformung des Terms mit e2i Ep t /h folgt das Ergebnis für Q. 8.8
Aus der ersten Vertauschungsrelation folgt durch Zeitableitung ∂t A α (x, t), A β (x , t) A α (x, t), ∂t A β (x , t) ∂t A α (x, t), A β (x , t)
0.
μ0 c2 π α folgt daraus nach Kürzen durch μ0 c2 und unter Benutzung der Mit A zweiten Vertauschungsrelation 0 π α (x, t), A β (x , t) A α (x, t), π β (x , t) A β (x , t), π α (x, t) A α (x, t), π β (x , t) α
i h gβα δ3 (x x) i h gαβ δ3 (x x ) . Aus der zweiten Vertauschungsrelation folgt durch Zeitableitung α (x, t), π β (x , t) A α (x, t), π β (x , t) A 0 (8.109b)
μ0 c2 π α (x, t), π β (x , t) μ1 A α (x, t), A α (x , t) μ1 A α (x, t), A α (x , t) 0
0
0.
9
Wechselwirkende Felder
Wir untersuchen in diesem Abschnitt die allgemeine Wechselwirkung von Feldern bzw. der durch diese beschriebenen Teilchen. Bei konkreten Anwendungen werden wir uns in diesem Teil des Buches auf Wechselwirkungen zwischen dem Dirac- und dem MaxwellFeld beschränken, die den Inhalt der im nächsten Kapitel behandelten Quantenelektrodynamik, kurz QED, bilden. Aus diesem Grund werden sich die meisten der in diesem Kapitel herangezogenen Beispiele auch schon auf diese Felder beziehen. In den die Maxwell-Gleichungen zusammenfassenden Gleichungen (7.61) beschreibt der Term μ0 j α , wie das durch Aα (x) repräsentierte elektromagnetische Feld von Ladungen und Strömen beeinflußt wird. Werden diese von Elektronen getragen, dann ist j α durch (7.82b) gegeben, wobei der die Ladungsträger beschreibende Spinor ψ(x) der Dirac-Gleichung (2.55) bzw. (2.173) genügen muß. Die Felder ψ(x) und Aα (x) können sich dann nicht mehr unabhängig voneinander entwickeln, sondern müssen gemeinsam das System der gekoppelten Differentialgleichungen h ∂/ ψ m 0 cψ q A /ψ i Aα μ0 cqψγ α ψ
0,
0
(9.1)
/ ψ und μ0 cqψγ α ψ werden aus den erfüllen. Durch die Wechselwirkungsterme q A linearen, ungekoppelten Gleichungen für freie Teilchen nichtlineare gekoppelte Gleichungen. Zur feldtheoretischen Behandlung der beiden gekoppelten Felder wird eine gemeinsame Lagrange-Dichte benötigt, aus der die Gleichungen (9.1) folgen. Aus den Lagrange-Dichten (7.62) und (7.80) läßt sich für die Form
D M W
mit
D
hc ψγ α ∂α ψ i
(9.2)
m 0 c2 ψψ ,
(9.3)
M 2μ1 (∂α Aβ )(∂ α Aβ ) , W cqψγ α ψ Aα (9.4) 0 erraten, wobei D die Lagrange-Dichte (7.73) des Dirac-Feldes für freie Spin-1/2Teilchen, M die aus (7.80) für j α 0 und ∂ β Aβ 0 hervorgehende Lagrange-Dichte des Maxwell-Feldes für freie Photonen und W der den beiden Dichten (7.80) und (7.62) gemeinsame Wechselwirkungsterm ist. Dieser tritt in allerdings nur einfach auf, so daß nicht durch Addition der Dichten (7.62) und (7.80) entsteht. Mit ∂ ∂ hc α γ ∂ ψ m c2 ψ cqγ α A ψ , 0 ∂ψ
i
α
0
α
∂ψ ,α
251
und
∂ ∂ Aβ
∂ ∂ Aβ,α
ψγ β ψ ,
1 α β ∂ A μ0
ergeben sich aus (7.18) bzw. ∂α
∂
∂ ,
∂ψ ,α
∂ψ
∂α
∂ ∂A
∂ ∂ Aβ,α
β
die Lagrange-Gleichungen (9.1). Für die kanonischen Impulse erhalten wir π
∂∂ ih ψ ψ
,
π
∂ 0 ,
πβ
∂ψ
∂∂A β
1 Aβ μ0 c 2
und damit für die Hamilton-Dichte
π ψ πβ A β mit D
m 0 c2 ψψ , 1 β A A M 2 β
i h c ψ γ l ∂l ψ
2μ0 c
D
W
M
W
W
(9.5)
cqψγ α ψ Aα ,
(9.6)
1 (∂l Aβ )(∂ lAβ ) , 2μ0
(9.7)
wobei D die Hamilton-Dichte (7.76) des freien Dirac-Feldes und M die aus (7.68) mit (7.67b) für j β 0 erhaltene Hamilton-Dichte des freien Maxwell-Feldes ist. Die Wechselwirkung zweier Felder wie die durch das System (9.1) beschriebene Wechselwirkung von ψ und Aα ist naturgemäß nichtlinear. Umgekehrt lassen sich nichtlineare Terme in einer Feldgleichung als Wechselwirkungsterme deuten. Ein besonders einfaches Feld mit Nichtlinearitäten ist ein reelles skalares Feld, dessen LagrangeDichte in Anlehnung an (9.2) durch
2mh 0 gαβ (∂α φ)(∂β φ) 2
m 0 c2 2 φ 2
g 4 φ 4
(9.8)
gegeben ist und das als 4 -Feld bezeichnet wird. Hier führt der nichtlineare φ 4 -Term zu Selbstwechselwirkungsphänomenen. Dieses Feld wird gerne als Modellfeld benutzt, weil es besonders einfach ist und viele Effekte in besonders übersichtlicher Weise zu studieren erlaubt. Wir hatten gesehen, daß sich in der Quantentheorie freier Felder keine neuen Erkenntnisse gegenüber der gewöhnlichen Quantenmechanik von Systemen identischer Teilchen in der Fock-Darstellung ergeben. Anders wird die Situation bei der Quantisierung wechselwirkender Felder. Neue Quantenphänomene kommen hier durch die die Wechselwirkung beschreibenden Kopplungsterme zustande, im Fall der gekoppelten Dirac-Maxwell-Felder also durch W bzw. W . (Siehe dazu aber die Ausführungen in Abschn. 10.13, wo kritisch durchleuchtet wird, was durch die Quantenfeldtheorie gegenüber der gewöhnlichen Quantenmechanik hinzugewonnen wird.) Quantenphysikalisch beschreibt W die Wechselwirkung zwischen Elektronen und Photonen. Dabei handelt es sich um Teilchenbegegnungen mit Ablenkung, direkte Stöße haben
252
9 Wechselwirkende Felder
bei Punktteilchen die Wahrscheinlichkeit null, sind damit nach der Wahrscheinlichkeitstheorie aber nicht ausgeschlossen (siehe Thermodynamik und Statistik). Bei den Wechselwirkungen können auch neue Teilchen erzeugt oder vorhandene Teilchen vernichtet werden. Man interessiert sich hauptsächlich dafür, wie die Teilchenzustände, die vor dem Wechselwirkungsprozeß bestanden haben, durch diesen verändert werden. Für diesen auch als Streuung bezeichneten Prozeß berechnet man die Übergangswahrscheinlichkeit zwischen Zuständen vor und nach der Wechselwirkung. Wegen der Nichtlinearität der Wechselwirkung kann diese im allgemeinen nicht exakt berechnet werden – eine Ausnahme bilden einfache Spezialfälle. Man ist daher im allgemeinen auf Näherungsmethoden angewiesen, wie sie in der Quantenmechanik, Kap. Q8, behandelt wurden. Diese Methoden sind besonders erfolgreich, wenn der Hamiltonoperator gemäß H H 0 H 1 (9.9)
in einen zeitunabhängigen Anteil H 0, für den die Lösung des dynamischen Problems bekannt ist, und einen im allgemeinen zeitabhängigen Anteil H 1 zerlegt werden kann, dessen Amplitude gegenüber der von H 0 hinreichend klein ist. Das ist bei der Wechselwirkung der von uns ins Auge gefaßten Felder oft der Fall, wenn 3 ( D M ) d 3x , H 0 H 1 Wd x
gesetzt wird. H 0 ist der Hamilton-Operator für freie, entkoppelte Felder. In den Abschnitten 8.3.3 und 8.4.2 konnte H 0 sowohl für Dirac-Teilchen als auch Photonen nach Ebene-Welle-Lösungen entwickelt werden. Für die hier angetroffene Situation empfiehlt sich eine Störungsrechnung im Wechselwirkungsbild, bei dem die Zeitabhängigkeit der Operatoren dieselbe wie im Heisenberg-Bild des ungestörten Problems ist und durch H 0 bestimmt wird, während die – schwache – Zeitabhängigkeit der Zustände allein von dem die Wechselwirkung beschreibenden Störoperator H 1 festgelegt wird. Das Wechselwirkungsbild wurde ausführlich in Abschnitt Q8.4.2 der Quantenmechanik abgehandelt. Dem Leser wird empfohlen, diesen Abschnitt vor dem Weiterlesen zu rekapitulieren, außerdem den dazu vorausgesetzten Abschnitt Q6.2.5 über unitäre Transformationen sowie die Ausführungen in Abschnitt Q6.3.1 und Q6.3.6 zum Zeitverschiebungsoperator. Im folgenden Exkurs werden die wesentlichen Ergebnisse, die für das weitere benötigt werden, nochmals kurz zusammengefaßt.
Exkurs 9.1: Erinnerung an das Wechselwirkungsbild Das Wechselwirkungsbild entsteht durch eine unitäre Transformation aus dem Schrödinger-Bild. Unitäre Transformationen werden durch einen unitären Operator U (U ) 1 vermittelt, wobei die Zustände ψ und Operatoren L gemäß ψ U ψ ,
L
U LU
(9.10)
transformiert werden. Dabei bleiben folgende Größen invariant: Skalarprodukte, Eigenwerte, algebraische Operatorgleichungen und Operatoreigenschaften wie Hermitezität.
253
Ein spezieller unitärer Operator, der für den Übergang zum Wechselwirkungsbild benötigt wird, ist der Zeitverschiebungsoperator T (t, t0 ), der im Schrödingerbild die zeitliche Entwicklung der Zustände gemäß ψ, t S T (t, t0 ) ψ, t0 S (9.11) beschreibt und T (t0 , t0 )1 erfüllt. Aus der Schrödinger-Gleichung ih∂ t ψ, t S
H ψ, t S
(9.12)
ergibt sich mit (9.11) für T (t, t0 ) die Gleichung ih∂ t T (t, t0 ) H T (t, t0 ) ,
(9.13)
wobei H der Hamilton-Operator im Schrödinger-Bild ist. Bei Zeitunabhängigkeit des HamiltonOperators besitzt (9.13) zur Anfangsbedingung T (t0 , t0 )1 die Lösung T e iH (t t0 )/h .
(9.14)
Der Zusammenhang zwischen Schrödinger- und Heisenberg-Bild besteht in den Relationen ψ H
T 1 ψ, t S
LH
T LT
eiH (t t0 )/h ψ, t S
ψ, t0 ,
eiH (t t0)/h L eiH (t t0 )/h
(9.15) L H (t0 ) L(t0 ) .
(9.16)
Die Heisenberg-Operatoren L H erfüllen die Bewegungsgleichung d LH dt
∂ LH 1 L , H . ih H ∂t
(9.17)
Im Wechselwirkungsbild wird die Zerlegung (9.9) mit ∂t H 0 0 vorausgesetzt, und man benutzt den (unitären) Zeitverschiebungsoperator T 0 des ungestörten Problems zu einer vom Schrödinger-Bild ausgehenden unitären Transformation, ψ, t W LW
(T 0 ) ψ, t S (T 0 ) L T 0
0 eiH (t t0 )/h ψ, t S
iH 0 (t t
e
0 )/h L
e
ψ, t0 W
0 iH (t t
0 )/h
ψ, t0 S ,
L W (t0 ) L(t0 ) .
(9.18) (9.19)
0 ergibt sich aus (9.19a) Für den ungestörten Hamilton-Operator HW 0 HW
0 0 eiH (t t0)/h H 0 eiH (t t0)/h
H 0.
(9.20)
0 iH (t t
0 )/h ψ, t Wird (9.18a) bzw. ψ, t S e W in (9.12) eingesetzt, so ergibt sich mit der Zerlegung (9.9) und der Definition (9.19a) im Wechselwirkungsbild die Bewegungsgleichung
ih∂ t ψ, t W
1 ψ, t HW W
mit
1 HW
0 0 eiH (t t0 )/h H 1 eiH (t t0 )/h .
(9.21)
Die entsprechende Bewegungsgleichung für Operatoren L W ergibt sich durch Zeitableitung von (9.19a) zu d LW dt
∂ LW 1 L , H 0 W ih ∂t
mit
∂ LW ∂t
T 0
∂L 0 T . ∂t
(9.22)
1 bestimmt (9.21) bedeutet, daß die Dynamik der Zustände ψ, t W nur vom Störungsoperator HW wird, die Bewegung der Operatoren L W gemäß (9.22) ist dagegen dieselbe wie die der Operatoren des ungestörten Problems im Heisenbergbild.
254
9 Wechselwirkende Felder
Wird die Lösung der Bewegungsgleichung (9.21a) für ψ, t W mit Hilfe eines Zeitverschiebungsoperators U (t, t0 ) dargestellt, ψ, t W
U (t, t0 ) ψ, t0 W ,
(9.23)
so ist dieser wie der Zeitverschiebungsoperator T (t, t0 ) des Schrödingerbildes unitär und erfüllt als Folge von (9.21) die Gleichung ∂U 1 H U . (9.24) ih W ∂t Aus U ψ, t0 W
ψ, t W
(9.18a)
T 0 ψ, t S
(9.18b)
T 0 T ψ, t0 S
T 0 T ψ, t0 W
folgt der Zusammenhang T 0 T U bzw. T
T 0U
(9.25)
zwischen U und T . Unter Berücksichtigung der Anfangsbedingung U (t0 , t0 ) 1 kann die Differentialgleichung (9.24) in die Integralgleichung 1 t 1 H (τ )U (τ, t0 ) dτ (9.26) U (t, t0 ) 1 ih t0 W 1 (τ )λ H 1 (τ ) und Reihenentwicklung nach λ überführt werden. Durch Iteration oder mit HW W findet man für diese die Lösung U n (t, t0 ) (9.27) U (t, t0 )
n 0
mit
τ2 t τn 1 1 (τ )H 1 (τ 1 dτ dτ ... dτ1 HW n n W n 1 )...HW (τ1 ) , n 1 n (ih) t0 t0 t0
U n (t, t0 )
(9.28)
und mit (9.27) ergibt sich aus (9.23) ψ, t W
U n (t, t0 ) ψ, t0 W .
n 0
Wir nehmen jetzt an, daß die Störung erst zur Zeit t 0 eingeschaltet wird und daß sich das System bis zu diesem Zeitpunkt in einem Eigenzustand m des Operators H 0 befunden hat, d. h. ψ, t S
0 m e iE m t /h
für
t
0
0 m . Die Wahrscheinlichkeit für einen Übergang vom Anfangszustand m in mit H 0 m E m einen anderen Eigenzustand n von H 0 ist
wmn
' 1' ' '2 ' '2 (9.14) '0 ' ' ' ' ' (9.25) ' ' iH 0 t /h ' '2 U 'm ' 'n ψ, t S ' 'n T ψ, 0S ' ' n 'e ' '2 '2 ' 0 ' i E n0 t /h ' ' ' n , U m ' 'e i E n t /h n U m ' , ' e
0 wegen e iEn t /h
' 0 '2 ' iH t /h ' n , U m ' ' e
1 also
wmn
n U m 2 .
(9.29)
9.1 Zeitgeordnete Produkte
255
Bei den ins Auge gefaßten Streuprozessen soll die Übergangswahrscheinlichkeit wea zwischen Anfangs- und Endzuständen a bzw. e bestimmt werden, die wir später noch genauer festlegen werden. Dazu muß die Streumatrix Sea
e U a
(9.30)
(9.18b)
berechnet werden. Der Zustand, in den a ψ, 0S ψ, 0W durch die Wechselwirkung überführt wird, ist nach (9.23) a ¼ W U a . Wird dieser nach einem vollständigen System für die Messung geeigneter Endzustände e entwickelt, z. B. nach Eigenzustän0 , so folgt mit a ¼ ¼ den des Operators H 0 HW e e e a W W a ¼ W
ee U a ,
e
d. h. die Übergangsamplituden (9.30) sind die Entwicklungskoeffizienten des Zustands a ¼ W nach den Zuständen e. Aus W a ¼ a ¼ W 1 folgt
e¼ ee U a e¼ U a £
δee e U a e¼ U a £ ¼
e,e¼
e
e,e¼
e U a e U a £
Sea
2
1,
e
die Summe der Übergangswahrscheinlichkeiten vom Anfangszustand zu allen möglichen Endzuständen ist wie zu erwarten gleich eins. In (9.30) ist für U die Reihenentwicklung (9.27) einzusetzen ist. Bei der Auswertung der durch (9.28) gegebenen Terme U n (t, t0 ) bereitet die Berechnung der Vielfachintegrale allerdings wegen der variablen Integrationsgrenzen erhebliche mathematische Schwierigkeiten. Der nächste Abschnitt befaßt sich mit deren Behebung.
9.1
Zeitgeordnete Produkte
Nach einer Idee von F. Dyson können die in (9.28) auftretenden Integrale mit variablen oberen Integrationsgrenzen, über die im jeweils davor stehenden Integral integriert wird, alle in Integrale über dasselbe feste Intervall t0 bis t umgewandelt werden, wenn 1 (τ ) in geeigneter Weise umgeordnet wird. Um das zu das Produkt der Operatoren HW i erkennen, betrachten wir zuerst den einfachen Fall des zweifachen Integrals I
t
τ2
dτ1 H (τ2) H (τ1) .
dτ2
t0
(9.31)
t0
Nach Abb. 9.1 wird in der τ1 , τ2 -Ebene über eine Dreiecksfläche integriert, wobei sich die Integration in dem zuerst auszuführenden Integral über τ1 von τ1 t0 bis zu der
256
9 Wechselwirkende Felder
τ2
τ1
τ2
t
t0 τ1 t0
Abb. 9.1: Integrationsgebiet des Integrals (9.31)(schattiert).
t
Geraden τ1 τ2 erstreckt. Man kann stattdessen auch zuerst über τ2 von τ2 τ1 bis τ2 t integrieren und anschließend über τ1 von t0 bis t, d.h. es gilt auch t t dτ1 dτ2 H (τ2)H (τ1) . I t0
τ1
t0
τ2
Mit der Umbenennung τ1 τ2 wird daraus t t I dτ2 dτ1 H (τ1)H (τ2) .
(9.32)
Durch Addition von (9.31) und (9.32) ergibt sich τ2
t t 2I dτ2 dτ1 H (τ2) H (τ1) dτ1 H (τ1)H (τ2) . t0
τ2
t0
Im ersten Integral ist τ2 τ1 , weil τ1 im Intervall t0 , τ2 liegt, im zweiten τ1 τ2 , weil τ2 die untere Grenze für τ1 bildet. In beiden Integralen steht also links der Term mit der größeren, rechts der mit der kleineren Zeit. Mit Hilfe eines mit T bezeichneten Zeitordnungsoperators1 definiert man nun als zeitgeordnetes Produkt oder Dyson-Produkt (1) p H (τα1 )H (τα2 ) . . . H (ταn ) (9.33) T H (τ1)H (τ2) H (τn ) mit τα1
τα τα 2
n
,
wobei p die Anzahl der für die Zeitordnung benötigten Vertauschungen benachbarter Operatoren H (τi ) angibt und in (1) p das Pluszeichen gilt, wenn diese kommutieren, das Minuszeichen, wenn sie antikommutieren. Hiermit und aufgrund der Vertauschbarkeit von H (τ1) mit H (τ2) – der Faktor (1) p in der Definition des Dyson-Produkts wird erst später bei der Zerlegung der H (τi ) wichtig werden – kann I in der Form τ2
t 1 t I dτ2 dτ1 T H (τ1)H (τ2) dτ1 T H (τ1)H (τ2) 2 t0 τ2 t0 t t 1 dτ2 dτ1 T H (τ1)H (τ2) (9.34) 2 t0 t0 1 Der Zeitordnungsoperator wird leider mit dem gleichen Symbol wie der Zeitentwicklungsoperator bezeichnet und sollte nicht mit diesem verwechselt werden
9.1 Zeitgeordnete Produkte
257
geschrieben werden. Das gesetzte Ziel ist damit für zwei geschachtelte Integrale erreicht. Wir werden bei den Anwendungen nicht über den Störungsterm zweiter Ordnung mit zwei geschachtelten Integralen hinausgehen. Dennoch soll das Ergebnis auch für das allgemeine, in (9.28) auftretende Integral mit n Integrationen und einem Produkt aus n Operatoren angegeben werden. Es gilt t τn τ2 1 1 dτn dτn 1 dτ1 HW (τn ) HW (τ1 ) (9.35) t0 t0 t0 t t 1 1 1 dτ1 dτn T HW (τ1 ) HW (τn ) n t0 t0 t t 1 1 1 T dτ1 HW (τ1 ) dτn HW (τn ) . n t0 t0 Der Beweis kann mit Hilfe vollständiger Induktion geführt werden (Aufgabe 9.1). Wird (9.35) in (9.28) und (9.28) in (9.27) eingesetzt, so kann U in der Form i 2t 1 (τ ) s.u. dτ HW U (t, t0 ) T e h t0 (9.36) geschrieben werden. Die Bedeutung der Exponentialfunktion mit einem Operator als Argument liegt dabei in deren Reihenentwicklung, so daß (9.36) nur eine kompakte Schreibweise für diese darstellt. 1 ein Feldoperator, In der Feldtheorie ist HW 1 3 HW Wd x, und mit c dτ d 3x d 4x ¼ erhalten wir in diesem Fall i 2 U (t, t0 ) T e ch
Ç
W (x) d
4x
.
(9.37)
Bei der Berechnung der Matrixelemente (9.30) im Rahmen einer Quantenfeldtheorie werden der Anfangszustand a und der Endzustand e als Zustände dargestellt, die durch Einwirkung von Erzeugungsoperatoren freier Felder aus dem Vakuum hervorgehen. Wenn z.B. die Streuung zweier Teilchen betrachtet wird, denen vor der Wechselwirkung die Wellenzahlen k1 bzw. k2 und nach dieser die Wellenzahlen k1¼ bzw. k2¼ zugeordnet werden können, wenn also a a (k1 ) a (k2 ) 0 ,
e a (k1 ) a (k2 ) 0
(9.38)
gilt – inwieweit diese Annahme gerechtfertigt ist bzw. welche Näherungen mit ihr verbunden sind, wird in Abschn. 9.4 diskutiert –, erhält Sea die Form ' ' (k2 )'0 . Sea 0'a(k 1 ) a(k 2 ) U a (k1 ) a Werden die in bzw. U auftretenden Feldoperatoren nach den gleichen Erzeugern und Vernichtern wie die freien Felder bzw. die Feldoperatoren des Anfangs- und Endzustandes entwickelt, so besteht auch U aus einer Summe von Produkten der Erzeuger und
258
9 Wechselwirkende Felder
Vernichter a (k) bzw. a(k). Zur Berechnung von Sea geht man dann zweckmäßigerweise so vor, daß man in jedem Summanden von U durch Kommutation der Operatoren unter Berücksichtigung der Kommutationsreste alle Vernichtungsoperatoren nach rechts und alle Erzeugungsoperatoren nach links bringt, also U in Normalordnung überführt. Alle Terme, die auf diese Weise die Struktur a (k1 ) a (k2 )
a(k 2 ) a(k 1)
erhalten (also die zu den Zuständen a und e gehörigen Vernichter bzw. deren Adjun giertes enthalten), tragen zu Sea bei, da die weitere Vertauschung der Vernichter a(k 1) und a(k 2 ) mit den Erzeugern des Zustands a und die Vertauschung der nach links als Vernichter wirkenden Erzeuger a (k1 ) und a (k2 ) mit den Erzeugern des Zustands e einen nicht-verschwindenden Kommutator produziert, bevor die Vernichter auf den Vakuumzustand treffen und dann null ergeben. Bei allen anderen Termen können die Vernichter ohne Kommutationsrest bis zum Zustand 0 durchgeschoben werden, diese liefern daher keinen Beitrag zu Sea . Um nicht in jedem Einzelfall von Hand die Umordnung von der zeit- in die normalgeordnete Form durchführen zu müssen, wird im folgenden Abschnitt abgeleitet, welcher Zusammenhang zwischen zeit- und normalgeordneten Operatorprodukten besteht.
9.2
Wicksches Theorem
Im Wickschen Theorem wird das zeitgeordnete Produkt von Operatoren durch normalgeordnete Produkte ausgedrückt, da diese rechnerisch einfacher zu handhaben sind. Wir leiten diesen Zusammenhang zuerst für das Produkt zweier Feldoperatoren A und B ab, die vom Ort und von der Zeit abhängen können, in relativistischer Kurznotation also A A(x) und B B(x ). Zur Erinnerung wird für diesen Fall nochmals die Definition des zeitgeordneten Produkts angegeben, es gilt * A B für t A > t B T A B (9.39) εBF B A für t B > t A und
T B A
*
B A εBF A B
für für
tB > tA tA > tB ,
wobei t A die zu A(x) gehörige Zeit angibt etc. und * 1 für bosonische Kommutation εBF für fermionische Kommutation 1
(9.40)
(9.41)
2 1 unmittelbar gesetzt wurde. Aus dem Vergleich von (9.39) und (9.40) folgt mit εBF ε T ( A B) BF T ( B A) .
(9.42)
9.2 Wicksches Theorem
259
(9.39) hat entweder oder
T ( A B) T ( A B)
s.u.
A B A A B B,
B (9.43)
A B A εBF B A benutzt.) zur Folge. (Dabei wurde A B B, zweier beliebiger Operatoren Zur Berechnung des normalgeordneten Produkts : A B: A und B zerlegen wir diese gemäß A
A () A () ,
B
B () B ()
(9.44)
in ihren Erzeugeranteil A () bzw. B () und ihren Vernichteranteil A () bzw. B () . (Die Bezeichnung knüpft an die in (2.100) mit (2.101) durchgeführte Zerlegung von Spinoren in Anteile zu positiver und negativer Energie an: Zu positiver Energie gehört bei der Zerlegung nach ebenen Wellen der Zeitfaktor ei Ep t /h , der beim Übergang zu Feldoperatoren in (8.186) mit den Vernichtungsoperatoren a (l, p) verbunden ist. A () meint daher einen zu positiver Energie gehörigen Vernichtungsoperator, A () einen zu negativer Energie gehörigen Erzeugungsoperator.) Mit (9.44) ergibt sich A B
: A B: und
: B A:
A () B () A () B () A () B () A () B () ,
(9.45)
A () B () εBF B () A () A () B () A () B ()
(9.46)
B () A () εBF A () B () B () A () B () A () εBF A () B () A () B () A () B () B () A () .
(9.47)
Aus (9.45)–(9.46) folgt
: A B:
A B εBF B () A () A () B ()
A B B (), A ()
(9.48)
und aus (9.46)–(9.47) folgt
: A B:
. εBF : B A:
Die Beziehungen (9.43) und (9.48) haben * entweder : A B: T ( A B) oder
(9.49)
B (), A () A B (), A () B,
zur Folge. Weil der Kommutator oder Antikommutator freier Felder eine mit einer physikalischen Dimension multiplizierte (komplexe) Zahl ist, ist die als Kontraktion bezeichnete Größe : A B: A B T ( A B) (9.50) daher kein Operator, sondern eine Zahlengröße, woraus
0 A B 0
A B 00
A B
260
9 Wechselwirkende Felder
folgt. Da die Einwirkung des Vernichteranteils eines Operators auf den Vakuumzustand null liefert, ergibt sich für den Vakuumerwartungswert des normalgeordneten Produktes ( ) 0 nach (9.46) wegen A ( ) 00, B ( ) 00 und 0 A : A B: 0 0 . 0 : A B:
Aus Gleichung (9.50) folgt mit diesen beiden Ergebnissen A B
0 0 T ( A B)
(9.42)
εBF B A .
(9.51)
0 kann in konkreten Fällen berechnet werden (siehe Abschnitt 9.3) und wird 0 T ( A B) im weiteren als gegeben angesehen. Der am Ende des letzten Abschnitts gesuchte Zusammenhang zwischen zeit- und normalgeordneten Operatorprodukten ist für den Fall zweier Operatoren durch (9.50) bzw. B :A B: A T ( A B) (9.52)
gegeben. Seine Verallgemeinerung auf n-fache Produkte lautet T ( A 1 A 2 A 3 .. A n ) : A 1 A 2 A 3 .. A n : A .. A A .. A .. A : A 1 2 A 3 n: :A 1 2 A 3 n : .. : A 1 n : A 1 A 2 A 3 A 4 .. A n : .. : A 1 .. A n
: 1A n
: 3A n 2A n 1A n
(9.53)
................................................
und wird als Wicksche Theorem bezeichnet (Beweis folgt). In der zweiten Zeile enthält jeder Term eine Kontraktion von zwei Operatoren, wobei jede mögliche Kontraktion einmal vertreten ist; in der dritten Zeile treten in jedem Term zwei Kontraktionen auf, wobei sämtliche Paarkontraktionen vorkommen, usw. Normalprodukte mit Kontraktionen werden dabei als verallgemeinerte Normalprodukte bezeichnet. Bei Gültigkeit gewöhnlicher Kommutationsregeln (Minus-Kommutatoren) können die zu kontrahierenden Operatoren durch Vertauschen nebeneinander gebracht und aus dem normalgeordneten Produkt als Faktor herausgezogen werden, bei Antikommutationsregeln kommt bei jeder Permutation ein Minuszeichen ins Spiel, so daß z.B. : A 1 A 2 A 3 . . . A n
: 1A n
(1) p A 1 A 3 A n
:A ... 1A n 2 A 4
A n
2:
gilt. Beweis: Wir führen den Beweis des Wickschen Theorems zunächst unter der Annahme, daß die Operatoren in dem Produkt A 1 A 2 A 3 .. A n schon zeitgeordnet sind, d. h. t1 > t2 > t3 > . . . > tn .
(9.54)
9.2 Wicksches Theorem
261
Mit der Zerlegung (9.44) gilt dann T ( A 1 A 2 A 3 . . . A n )
A 1( ) A 2() A 2( ) . . . A n() A n( ) () () () ( ) ( ) () () ( ) () A 1 A 2 . . . A n A 1 A 2 . . . A n A 1 A 2 . . . A n . . . A 1( ) A 2( ) . . . A n( ) . (9.55) A 1 A 2 A 3 . . . A n
A 1
( )
Einige Summanden auf der rechten Seite, z. B. der erste, zweite und letzte, sind normalgeordnet, andere jedoch nicht. Greifen wir einen der letzteren heraus. Diesen überführen wir in Normalordnung, indem wir von den noch nicht am richtigen Platz befindlichen Erzeugern der Reihe nach jeweils den am weitesten links stehenden unter Beachtung der Kommutationsregeln (Vertauschung oder Antivertauschung) so lange mit Vernichtern links von ihm vertauschen, bis alle ( ) Vernichter rechts von ihm stehen. Ist A l ein derart zu verschiebender Erzeuger, so steht links ()
von ihm ein Vernichter A k , und aufgrund der Voraussetzung (9.54) ergibt sich () ( ) () ( ) (9.52) () ( ) () ( ) s.u. ( ) ( ) A k A l T A k A l : A k Al : A k A l εBF A l A k A k A l , ()
weil mit A l
0 und 0 A k
0
( )
0 '
(9.56)
0 0 '
' 1
' 1
() ( ) (9.51a) ' () ( ) ' (9.56a) ' () ( ) ' 0'T A k Al 0' A k Al '0 Al '0
A k
0 ' ' 1 ' ( ) ( ) ( ) ( ) ' 0' A k A k Al Al '0
' 1 0 ' ' ' 0' A k A l '0
0 ' ' 1 ' ' 0'T A k A l '0
A k A l
gilt. Beim Durchschieben von A l nach links tritt daher bei jeder Vertauschung zum einen ein Vorzeichenfaktor εBF auf und zum anderen ein Term mit einer Kontraktion hinzu. Nachdem alle für die Normalordnung notwendigen Vertauschungen durchgeführt wurden, ist der herausgegriffene Summenterm in eine Summe von n-fachen Operatorprodukten mit keiner, einer, zwei usw. Kontraktionen überführt. Jedes von diesen ist dabei normalgeordnet und mit einem der Anzahl vorausgegangener Vertauschungen entsprechenden Produkt von Vorzeichenfaktoren versehen. Die Produkte der Vorzeichenfaktoren kann man loswerden, indem man die Operatoren nicht in der normalgeordneten, sondern der ursprünglichen Reihenfolge anschreibt und die Normal() ( ) ordnung durch die :-Symbole vorschreibt, indem man also z. B. wie in (9.56) : A k A l : statt ( )
( ) () A k schreibt. Für drei Terme erhält man entsprechend z. B.
εBF A l
() () ( ) (9.56) () ( ) () A k Al εBF A j Al A k
A j
A (j) A k A l ( ) () () () εBF εBF A l A j A j A l A k A j A k A l
( ) () () A j Ak
εBF A j A l A k() A (j) A k A l () () ( ) ( ) () : A j A k A l : : A j A k A l : : A j A k A l : . 2 A εBF l
Nachdem jeder Summenterm aus (9.55) derart umgeordnet wurde, ist T ( A 1 A 2 A 3 . . . A n ) in eine Summe von Termen überführt, von denen jeder in der rechten Seite von (9.53) enthalten ist. (Man denke sich auf dieser alle nicht kontrahierten Operatoren gemäß (9.44) zerlegt und alle Produkte ähnlich wie in (9.55) ausmultipliziert.)
262
9 Wechselwirkende Felder
Umgekehrt enthält die aus (9.55) durch die geschilderte Umordnung erhaltene Summe alle Terme der rechten Seite von (9.53): (9.55) enthält auf der rechten Seite 2n Terme. Jeder von diesen steuert entweder direkt oder nach dem Umordnen genau einen normalgeordneten Term ohne Kontraktion bei; alle auf diese Weise entstandenen Terme sind voneinander verschieden, weil sie durch reines Umordnen von Produkten entstehen, die sich paarweise in mindestens einem Faktor unterscheiden. Dies liefert gerade die 2n Terme von : A 1 A 2 A 3 . . . A n :. Die umgeordnete Summe enthält auch sämtliche verallgemeinerten Normalprodukte der rechten Seite von (9.53), denn in (9.55) bzw. A 1 . . . A n gibt es zu jeder dort angegebenen Kontraktion bzw. Kombination mehrfacher Kontraktionen einen Summanden mit den entsprechenden, nicht normalgeordneten Operatoranteilen, z. B. ( ) ( ) A 2 A 3 . . . A n
zu
: A 1 A 2 A 3 . . . A n :
() ( ) () ( ) A 2 A 3 A 4 A 5 . . . A n
zu
: A 1 A 2 A 3 A 4 A 5 . . . A n : .
A 1 oder
A 1
Die zu einer, zwei, drei etc. Kontraktionen gehörige Teilsumme enthält S1 K 1 (n)2n 2 , S2 K 2 (n)2n 4 , S3 K 3 (n)2n 6 etc. Summanden, wobei K 1 (n) n(n 1)/2 die Gesamtzahl der voneinander verschiedenen Einfachkontraktionen, K 2 (n) K 1 (n) K 1 (n 2) die der Zweifachund K 3 (n) K 1 (n) K 1 (n 2) K 1 (n 4) die der Dreifachkontraktionen ist etc. Jeder dieser Summanden führt nach dem geschilderten Umordnen u.a. zu einem normalgeordneten Term mit der angegebenen Zahl von Kontraktionen, und alle auf diese Weise erhaltenen Terme sind voneinander verschieden. Die nach dem Umordnen erhaltene Summe enthält daher alle S1 , S2 , S3 etc. Terme des normalgeordneten Produkts mit den entsprechenden ein, zwei, drei etc. Kontraktionen. Wenn eine Menge A in der Menge B enthalten ist und diese ihrerseits in A, muß A B gelten. Mit A T ( A 1 A 2 A 3 . . . A n ) und B rechte Seite von Gleichung (9.53) ist die letztere unter der Voraussetzung (9.54) bewiesen. Bei beliebiger Reihenfolge der Zeiten t1 , t2 , . . . , tn folgt mit (9.42) T ( A 1 A 2 A 3 . . . A n )
(εBF ) p P( A 1 A 2 A 3 . . . A n ) ,
(9.57)
wobei P( A 1 A 2 A 3 . . . A n ) die Permutation des Produktes A 1 A 2 A 3 . . . A n ist, welche die Faktoren in die zeitgeordnete Reihenfolge bringt und p die Anzahl der Zwei-OperatorenVertauschungen angibt, durch die diese herbeigeführt wurde. Aus (9.49) und (9.51) folgt für diese Permutation : A 1 A 2 A 3 . . . A n : (εBF ) p :P( A 1 A 2 A 3 . . . A n ): (9.58) : A 1 A 2 A 3 . . . A n : (εBF ) p :P( A 1 A 2 A 3 . . . A n ): (9.59) ...............
........................... ,
(9.60)
wobei p derselbe Exponent wie in (9.57) ist und (9.60) für die noch fehlenden verallgemeinerten Normalprodukte mit einer sowie alle mit mehr als einer Kontraktion steht. Außer im ersten Schritt von Gleichung (9.55) wurde die Zeitordnung der Operatoren an keiner weiteren Stelle des bisherigen Beweises benutzt. Daher gilt die Beziehung (9.53) bei beliebiger Zeitordnung der Operatoren, wenn man auf der linken Seite T ( A 1 A 2 A 3 . . . A n ) durch A 1 A 2 A 3 . . . A n ersetzt. Läßt man auf die derart erhaltene Gleichung den Permutationsoperator P einwirken, multipliziert sie anschließend mit (εBF ) p und benutzt dann (9.57)–(9.60), so folgt wieder Gleichung (9.53). (Dem Leser wird empfohlen, sich die einzelnen Schritte des Beweises nochmals am Fall n 3 klar zu machen, siehe Aufgabe 9.2.)
Wird in (9.53) über zwei miteinander vertauschbare Operatoren kontrahiert, dann verschwindet der zugehörige Summand, denn aus der Gültigkeit einer der beiden
9.2 Wicksches Theorem
263
Vertauschungsrelationen
A(x), B(y)
folgt
A(x) B(y)
s.u.
0,
(9.61)
0.
(9.62)
Für den gleich folgenden Beweis wird folgendes benötigt: Gilt für zwei Feldoperatoren ( ) (x) A () (x) und B(y) ( ) (y) B () (y) eine der beiden Vertauschungs A(x) A B relationen (9.61), so folgt daraus A ( ) (x), B ( )(y)
A ( )(x), B () (y) A ()(x), B () (y)
A () (x), B ( )(y) 0
(9.63)
und B(y) kön(entweder Plus- oder Minuskommutator), denn die Feldoperatoren A(x) nen beliebige Superpositionen von Erzeugern und Vernichtern des zugehörigen Feldes sein, und Gleichung (9.61) ist so zu verstehen, daß sie für jede dieser Superpositionen ( ) (x), B(y) ( ) (y) oder A B gilt, insbesondere also auch für die Spezialfälle A(x) ( ) B(y) B (y) etc. Beweis: Aus (9.43) folgt entweder T ( A B) A B
T ( A B)
A A B B,
(9.61)
A B
. . . oder
A ( ) B ( ) A ( ) B () A () B ( ) A () B () .
Hiermit und mit (9.46) ergibt sich aus (9.50) A B
A ( ) B () εBF B () A (
)
A (
) , B ()
(9.63)
0.
Durch Zeitordnen wird ein Produkt, das schon zeitgeordnet ist, nicht mehr verändert, d. h. es gilt T T ( A B C . . .) T ( A B C . . .) und T ( A B)
B 0 0 T ( A B) 0 A . T 0T ( A B)
Aus (9.52) folgt damit B A : A B:
B T T (A B) B:) B) T (: A B:) T ( A B) T (: A T (A A
: A B: . Aus (9.53) ergibt sich damit durch vollständige Induktion oder T (: A B:)
T : A 1 A 2 A 3 . . . A n : : A 1 A 2 A 3 . . . A n : .
(9.64)
Bei der Auswertung von Streumatrizen treten auch gemischte zeitgeordnete Produkte wie T (: A 1 A 2 A 3 : : A 4 A 5 A 6 :) mit t1 t2 t3 t4 t5 t6 auf. Werden diese nach dem im Beweis zum Wickschen Theorem angegebenen Schema umgeordnet, so kommt es zwischen den gleichzeitigen Operatoren wegen ihrer schon bestehenden Normalordnung zu keinen Vertauschungen und damit auch zu keinen Kontraktionen, ansonsten entstehen jedoch dieselben Terme wie beim Wickschen Theorem. Für gemischte
264
9 Wechselwirkende Felder
T -Produkte der beschriebenen Art gilt daher das Wicksche Theorem mit der Maßgabe, daß alle verallgemeinerten Normalprodukte mit Kontraktionen zwischen gleichzeitigen Operatoren, also Operatoren, die im gleichen normalgeordneten Teilprodukt stehen, entfallen.
9.3
Propagatoren
Ein einfaches Beispiel eines Ausdrucks der Form (9.51), das sich im weiteren Verlauf als fundamental erweisen wird, ist der mit dem Feldoperator φ(x) des Klein-Gordon Schrödinger-Feldes gebildete Erwartungswert 0T (φ(x) φ (y))0. Nach (8.39) und (8.41) ist y, t y φ ( y, t y )0 ein Zustand mit einem durch das Feld φ beschriebenen Teilchen, das zur Zeit t y am Ort y lokalisiert ist. ' ' ' x, tx y, t y '2
' '2 ' 0φ(x, tx )φ ( y, t y )0'
ist daher nach (Q6.89) die Wahrscheinlichkeit dafür, ein durch das Feld φ(x) beschriebenes Teilchen, das sich zur Zeit t y am Ort y befand, zur Zeit tx am Ort x anzutreffen, bzw. dafür, daß es durch das Feld vom Punkt y der Raum-Zeit zum Punkt x „propagiert“ wurde (von engl. propagate im Sinne von transmittieren, übertragen). Die Größe F (x y)
' 1 1 '' 0 T φ(x) φ (y) '0 φ(x) φ (y) i i
(9.65)
wird daher als Propagator bzw. Feynman-Propagator bezeichnet. (Daß F nur von der Differenz x y abhängt, wird sich im nächsten Teilabschnitt zeigen.)
9.3.1 Feynman-Propagator des Klein-Gordon-Schrödinger-Feldes Im Fall eines komplexen Klein-Gordon-Schrödinger-Feldes erhält man durch Einsetzen der Entwicklungen (8.67) in die rechte Seite von Gleichung (9.65) ⎧ i p¡(x y)/hÆ d 3p e ⎪ ⎪ m c ⎪ 0 ⎨ 3 Ep /c (2π h) s.u. i F (x y) i p¡(x y)/hÆ ⎪ e d 3p ⎪ ⎪ ⎩ m0c 3 Ep /c (2π h)
für
x 0 >y0 (9.66)
für
x 0
Die beiden Ergebnisse können auch in die einheitliche Form i F (x y) m 0 c
Ep ' x y ' p¡(x y) i c ' 0h 0' i Æ e hÆ e
Ep /c
d 3p 3 (2π h)
gebracht werden. (Mit der Lagrange-Dichte (7.52) ergäbe sich ¼F F /(2m 0 ).)
(9.67)
9.3 Propagatoren
265
φ (y), und Einsetzen von (8.67) sowie Benutzung Beweis: Für x0 >y0 ist T φ(x) φ (y) φ(x) von b p 0 0 und 0b p ¼
φ 0φ(x)
(y)0
0 etc. liefert 0 ' ' 1 ' ' 3 3 0' a p u p (x)b p u p (x) a p u p (y)b p u p (y) '0 d p d p 0 ' ' 0' u p (x) u p (y) a p a p u p (x) u p (y) a p b p ¼
¼
¼
¼
¼
¼
¼
¼
u p (x) u p (y) bp a p u p (x)u p (y) bp b p ¼
¼
¼
¼
' 1 ' '0 d 3 p d 3 p
0 ' ' 1 ' ' 3 3 0' u p (x) u p (y) a p a p '0 d p d p ¼
¼
0 ' ' 1 (8.78a) ' 3 ' 3 3 0' u p (x) u p (y) a p a p δ ( p p ) '0 d p d p ¼
¼
u p (x) u p (y) 00 d 3 p
(6.6) (8.74)
m0c (2π h )3
ei p (x y)/h 3 d p. Ep /c
φ (y) φ (y)φ(x), und Einsetzen von (8.67) liefert analog Für y0 >x0 ist T φ(x)
0 0φ (y)φ(x)
m0c (2π h )3
u p (y) u p (x) d 3 p
ei p (x y)/h 3 d p. Ep /c
Für x0 >y0 folgt die Darstellung (9.67) aus (9.66a) mit
i p (x y) i (Ep /c)(x0 y0) i p (x y) i (Ep /c)x0 y0 i p (x y) , für x0
i (Ep /c)(x0 y0 ) i p (x y) '
'
Ep ' x 0 y0 ' i ' h ' i p(x y) h e e c
Ep /c
d 3p
p p
i (Ep /c)x0 y0i p (x y)
'
'
Ep ' x 0 y0 ' i ' h ' i p(x y) h e e c
Ep /c
d 3p .
Durch zusätzliche Integration über p0 längs einer Kontur, die sich in die komplexe Zahlenebene erstreckt, läßt sich das Ergebnis (9.67) in eine besonders nützliche Form bringen. Das wird in dem folgenden Exkurs zur Funktionentheorie vorbereitet.
Exkurs 9.2: Hilfsmittel aus der Funktionentheorie Wir betrachten zunächst das Integral I
1 2πi
ei αz dz (z a)(z a)
mit reellen Zahlen α und a>0 über eine Kontur in der Ebene der komplexen Zahlen z. Der Integrand besitzt zwei Pole an den Punkten z a und z a der reellen Achse und ist ansonsten
266
9 Wechselwirkende Felder
in der ganzen komplexen Zahlenebene regulär. Die Residuen des Integranden sind ⎧ e i αz e i αa ⎪ ⎪ ⎪ bei z a ⎨ z a 2a I ⎪ ⎪ e i αz e i αa ⎪ ⎩ bei z a , za 2a
(9.68)
wobei sich das zu ihrer Berechnung benutzte Integral über kleine Kreise vom Radius ρ 0 um die Polstellen herum mit der in Abb. 9.2 (a) eingezeichneten Integrationsrichtung erstreckt. Die Integrationskonturen können beliebig ausgeweitet und verschoben werden, sofern dabei keine Pole überschritten werden. Auf diese Weise kann erreicht werden, daß sich das Integral zur Berechnung des Residuums bei z a über die ganze x-Achse so von x bis x erstreckt, daß es um die Polstelle z a oben und die Polstelle z a unten herum führt und bei x durch einen Halbkreis um den Punkt z 0 in der unteren Halbebene der komplexen Zahlenebene geschlossen wird (Abb. 9.2 (b)). Für das Residuum bei z a wird die Integration längs desselben Wegs, aber von x bis x die x-Achse entlang geführt und durch einen Halbkreis um den Punkt z 0 in der oberen Halbebene geschlossen. zum Gesamtintegral I läßt sich leicht abschätzen. Für die Der Beitrag des Halbkreises Zerlegung z r ei ϕ r cos ϕ i r sin ϕ gilt auf dem Halbkreis r const und dz i r ei ϕ dϕ. Unter Benutzung von (z a)(z a)z 2 a 2 ergibt sich damit für r >a ' ' ' ' ' ' ' ' e i αz i r ei ϕ eαr sin ϕ e i αr cos ϕ r eαr sin ϕ ' ' ' ' dϕ dϕ dz ' ' ' ' ' ' (z a)(z a) ' ' r 2 e2i ϕ a 2 r 2 e2i ϕ a2 2 r 2 eαr sin ϕ dϕ 22πr 2 eαr sin ϕ , r a r a wobei ϕ ein Zwischenwert von ϕ auf ist. Wegen sin ϕ >0 für 0< ϕ < π (obere Halbebene) zu I für r gegen und sin ϕ < 0 für π< ϕ < 2π (untere Halbebene) geht der Beitrag von null, wenn der Halbkreis für α>0 in der unteren Halbebene und für α< 0 in der oberen Halbebene liegt. Das Gesamtintegral I für das Residuum bei z a reduziert sich daher für α>0 auf das Integral über den Weg in Abb. 9.2 (b) längs der x-Achse von x bis x ohne den Halbkreis und hat den Wert des Residuums. Wird bei gleicher Wegform von x bis x integriert, so wechselt bei unverändertem Absolutwert das Vorzeichen, und es gilt 1 2πi
ei αz dz (z a)(z a)
e 2a
i αa
ei αz dz (z a)(z a)
e2a
für
α > 0,
wobei den in Abb. 9.2 (c) dargestellten Weg längs der x-Achse von x bis x bezeichnet. Das Gesamtintegral I für das Residuum bei z a reduziert sich für α< 0 ebenfalls auf das Integral längs , und es gilt 1 2πi
i αa
für
Die beiden Ergebnisse können zu 1 2πi zusammengefaßt werden.
ei αz dz (z a)(z a)
i α a
e 2a
α < 0.
9.3 Propagatoren
267 y
y
z a
z a
z a
x
(a)
z a
x
(c) y
y
z a
z a
z a1
x
x z a 2
(b)
(d)
Abb. 9.2: Integrationskonturen.
Nach (9.68) hängt der Wert von I stetig von der Lage der Pole ab. I ändert sich daher nur wenig, wenn wir diese etwas verschieben. Wird der Pol z a für ε> 0 nach z a2 a i ε/(2a) und der Pol z a nach z a1 a i ε/(2a) verschoben, und wird jetzt überall längs der x-Achse integriert (Abb. 9.2 (d)), so verläuft der Integrationsweg wie vorher unterhalb des linken und oberhalb des rechten Pols, und im Limes ε 0 erhält I denselben Wert wie oben. Hiermit, mit ε2 ε 0 (z a2 )(z a1 ) z a i ε/(2a) z a i ε/(2a) z 2 a 2 i ε 2 z 2 a 2 i ε 4a
und z x auf der x-Achse erhalten wir für das letzte Ergebnis schließlich die Form 1 e i αx e i αa lim d x mit ε > 0. 2a ε 0 2πi x 2 a2 i ε
(9.69)
Wir wollen jetzt das Ergebnis (9.69) auf Gleichung (9.67) anwenden, setzen dazu α (x 0 y0 )/h , a Ep /c , x p0 und erhalten Ep '' x 0 y0 '' i h e c 1 e i p0 (x0 y0 )/h e i αa (9.69) lim d p0 ε 0 2πi 2a 2Ep /c p02 Ep2 /c2 i ε
s.u.
ε
0
lim
1 2πi
ei p (x y )/h 0
p p
0
0
m 0 2 c2 i ε
d p0 ,
wobei zuletzt mit (8.62) die Umformung p02 Ep2 /c2 p02 p2 m 0 2 c2 p pm 0 2 c2 vorgenommen wurde. Für F (x y) ergibt sich hiermit 2m 0 c i F (x y) 3 2πi (2π h)
y)/h d p0 d 3p
e i p0 (x0 y0 )/h ei p (x p p m 0 2 c2 i ε
268
9 Wechselwirkende Felder
oder (mit (9.65))
φ (y) i F (x y) φ(x)
i 2h m 0c
s.u.
e p p
i p (x y)/h
d 4p . m 0 2 c2 i ε (2π h )4
(9.70)
Der Limes ε0 ist dabei in der Notation wie üblich unterdrückt und muß hinzugedacht werden. Für F (x) können wir mit diesem Ergebnis die Gültigkeit der Gleichung m 0 2 c2 m 0 2 c2 d 4p e i px/h (x) lim 2 h m c F 0 2 2 2 2 ε 0 p p m 0 c i ε (2π h )4 h h 2 2 i p x/h d 4p 2h m 0c ( p p2 m 0 c ) 2e 2 (2π h )4 h ( p p m 0 c ) 4 2m 0 c h e i px/h (2πd hp)4 ableiten. Mit der Übertragung
ei px/h
d 4p (2π h )4
δ4 (x)
(9.71)
der für die dreidimensionale Deltafunktion gültigen Beziehung (8.71) auf vier Dimensionen erhalten wir dafür die Form m 0 2 c2 2m 0 c 4 δ (x) . F (x) (9.72) h h 2 Der Vergleich von (9.65) mit (8.90) oder (9.66) mit (8.91) zeigt, daß die Funktion F (x y) ähnlich wie die Pauli-Jordan-Funktion (x y) definiert ist. (x y) ist nach (8.97) eine Lösung der homogenen, F (x y) dagegen die Lösung der inhomogenen Klein-Gordon-Schrödinger-Gleichung (9.72). Bis auf einen konstanten Faktor ist F (x y) eine Greensche Funktion von dieser, denn G(x x )
h F (x y) 2m 0 c
erfüllt nach (9.72) die Gleichung m 0 2 c2 G(x x ) δ 4 (x x ) . h 2
(9.73)
(9.74)
Die Klein-Gordon-Schrödinger-Gleichung für ein komplexes Feld φ mit geladenen Teilchen, die mit einem durch Aα (x) beschriebenen elektromagnetischen Feld in Wechselwirkung stehen, ist nach (4.5) m 02 c2 1 α α α 2 α φ 2 i I φ, A mit I φ, A h q A ∂ φ q A A φ . α α h 2 h 2 (9.75)
9.3 Propagatoren
269
Mit Hilfe der Greenschen Funktion erhält man als “Lösung“ dieser Gleichung φ(x) G(x x ¼ )I φ(x ¼ ), Aα (x ¼ ) d 4x ¼ , denn es gilt m 0 2 c2 φ(x) h 2
(9.74)
m 0 2 c2
h 2
G(x x ¼ ) I φ(x ¼ ), Aα (x ¼ ) d 4x ¼
δ 4 (x x ¼ ) I φ(x ¼ ), Aα (x ¼ ) d 4x ¼
I φ(x), Aα (x) .
Dies ist allerdings nur eine formale Lösung, weil die rechte Seite unter dem Integral die gesuchte Lösung φ(x) enthält, handelt es sich um eine Integralgleichung. Diese kann jedoch, wie im Exkurs 9.1 gezeigt, iterativ oder durch Reihenentwicklung gelöst werden, was viel einfacher ist, als die direkte Lösung der Differentialgleichung (9.75).
9.3.2 Feynman-Propagator des Dirac-Feldes In Analogie zu (9.65) wird der Feynman-Propagator des Dirac-Feldes mit Hilfe der Komponenten ψ α des Spinoroperators ψ als Matrix mit den Komponenten SF αβ (x y)
' 1 1 ' ψ α (x) ψ β (y) 0'T ψ α (x)ψ β (y) '0 i i
definiert. Wegen der fermionischen Vertauschungsrelationen gilt * ψ α (x)ψ β (y) für x 0 >y0 , T ψ α (x)ψ β (y) ψ β (y)ψ α (x) für x 0
(9.76)
(9.77)
Einsetzen der Entwicklungen (8.186) liefert für x 0 >y0 2
i SF αβ
2 0 ' ' 0' a (l, p) u α (l, p) ei px/h b (l, p) v α (l, p) ei px/h
m0c (2π h )3 l,l
¼
1
a (l , p ) uβ (l , p ) ei p y/h b(l , p ) v β (l , p ) ei p y/h ¼
¼
' 1 d 3 p d 3p ' '0 Ep Ep ¼
' 1 3 3 m 0 c2 0 '' (l , p ) u α (l, p) u β (l , p ) ei ( px p y)/h ''0 d p d p 0 a (l, p) a ' (2π h )3 Ep Ep l,l ' 1 d 3 p d 3 p 0 ' 2 (8.181) m 0 c ' ' 0' a (l, p), a (l , p ) u α (l, p)u β (l , p )ei ( px p y)/h '0 (2π h )3 Ep Ep l,l 2 d 3p (8.173a) m 0 c '' (2π h )3 0 0 u α (l, p) u β (l, p) ei p(x y)/h Ep /c l 1 3 (8.195a) (2π1h )3 p/m 0 c αβ ei p(x y)/h 2Ed p/c . p
(8.181)
¼
¼
¼
¼
¼
¼
270
9 Wechselwirkende Felder
Mit i h ∂/ e
i p (x y)/h
i hγ α ∂α ei p (x y)/h
γ αpα ei p (x y)/h
kann dies schließlich in der Form i p (x y)/h d 3p e i SF αβ i h ∂/ m 0 c αβ 2Ep /c (2π h)3
für
p /e
i p (x y)/h
x 0 > y0
(9.78)
geschrieben Das im vorletzten Schritt der obigen Rechnung erzielte Ergebnis ' werden. kann mit 0'0 1 und (8.166) in die später benötigte Form i SF (x x )
2
ψl p (x, t) ψ l p (x , t ) d 3 p
für
t > t
(9.79)
l 1
gebracht werden. Für x 0
x 0 > y0 .
(9.80)
t < t .
(9.81)
Das (9.79) analoge Ergebnis lautet mit (8.185) i SF (x x )
4
ψl p (x, t) ψ l p (x , t ) d 3 p
für
l 3
Durch Einsetzen von (9.66) in (9.78) und (9.80) ergibt sich die einheitliche Darstellung i i SF αβ (x y) i h ∂/ m 0 c αβ F (x y) , (9.82) 2m 0 c durch welche der Propagator des Dirac-Feldes auf den des Klein-Gordon-SchrödingerFeldes zurückgeführt wird. (Wie nach (9.67) bemerkt wurde, würde bei Verwendung der Lagrange-Dichte (7.52) F F /(2m 0 ) gelten. Damit ergäbe sich statt der letzten Gleichung mit h 1 und c1 der Zusammenhang i SF αβ (i ∂/ m 0 )αβ F mit der Folge, daß SF und F verschiedene Dimensionen hätten.) Wird jetzt noch die Beziehung (9.70) benutzt, so ergibt sich aus (9.82) mit i hγ α ∂α ei p (x y)/h d 4p γ α pα ei p (x y)/h d 4p i h ∂/ F (x y) 2hm 0 c p p m 0 2 c2 i ε (2π h)4 p p m 0 2 c2 i ε (2π h)4
9.3 Propagatoren
271
für den Feynman-Propagator des Dirac-Feldes die vierdimensionale Darstellung
ψ (y) i i SF (x y) ψ(x) wobei die durch
SF ( p) e
i p (x y)/h
d 4p , (2π h )4
h (/ p m 0 c) p p m 0 2 c2 i ε
SF ( p)
(9.83)
(9.84)
mit ε>0 definierte Matrix SF ( p) (Komponenten SF αβ ) bis auf einen Faktor die FourierTransformierte der Matrix SF αβ (x) ist. SF (x)/h ist eine Greensche Funktion der DiracGleichung, sie erfüllt (Aufgabe 9.3) (i h ∂/ m 0 c) SF (x)/h
δ4 (x) .
(9.85)
9.3.3 Feynman-Propagator des Maxwell-Feldes Beim Maxwell-Feld ist der Feynman-Propagator durch ' 1 1 ' Aα (x) A β (y) 0'T A α (x) A β (y) '0 i i
DF αβ (x y)
(9.86)
definiert. Durch Einsetzen der Entwicklung (8.121) von A α (x) nach ebenen Wellen ergibt sich i DF αβ (x y) A α (x) A β (y) i
D F αβ (k) ei k (x y)
d 4k , (2π)4
(9.87)
wobei D F αβ (k) durch D F αβ (k)
h μ0 c gαβ , k k i ε
ε>0
(9.88)
gegeben und bis auf eine Faktor die Fourier-Transformierte von DF αβ (x) ist. Beweis: Für x0 >y0 ergibt sich mit T A α (x) A β (y) A α (x) A β (y) i DF αβ
3 0 ' h μ0 c2 ' (λ) (λ) (k, x) b (λ) (k)A (λ) (k, x) 0 b (k)A ' α α 2(2π)3 λ,λ¼ 0
b(λ ) (k )Aβ(λ ) (k , y) b(λ ) ¼
¼
¼
' 1 d 3 k d 3 k ' (k )A β(λ ) (k , y) '0 ωk ωk ¼
¼
272
9 Wechselwirkende Felder 3 0 ' ' 1 d 3 k d 3 k hμ0 c2 ' (λ) ' (λ ) (k )'0 A (λ) (k, x)A (λ ) (k , y) 0 b (k) b ' α β ωk ωk 2(2π)3 ¼
¼
¼
λ,λ¼ 0
(8.127c)
3 3 3 hμ0 c2 λλ δ 3 (k k )A (λ) (k, x)A (λ ) (k , y) d k d k 00 g α β ωk ωk 2(2π)3 ¼
¼
λ,λ¼ 0
¼
3 hμ0 c2 d3 k g λλ A α(λ) (k, x)A β(λ) (k, y) 3 ωk 2(2π)
λ 0 2 3 (8.120b) hμ0 c λλ (λ) (λ) (k) g ε (k) ε α β (2π)3 λ0 i k (x y) hμ0 c2 e (8.119) g d3 k αβ 3 2ωk (2π)
ei k (x y) 3 d k 2ωk
Analog ergibt sich für x0
i DF αβ
hμ0 c2 gαβ (2π)3
ei k (x y) 3 d k. 2ωk
Durch Vergleich von (9.66) und (9.70) folgt mit den Substitutionen phk, Ep hωk , pα hk α , der Umformung p pm 0 2 c2 p02 Ep2 /c2 h 2 (k02 ω2k /c2 ) sowie mit εh 2 ε und der anschließenden Umbenennung ε ε der mathematische Zusammenhang ⎧ ⎪ ei k (x y) 3 ⎪ ⎪ d k ⎪ ⎨ i k (x y) 2ωk /c i e 4 d k ⎪ 2π k02 ω2k /c2 i ε ⎪ ei k (x y) 3 ⎪ ⎪ d k ⎩ 2ωk /c
für
x0 >y0
für
x0
Mit diesem ergibt sich für DF αβ die einheitliche Darstellung DF αβ
hμ0 c
gαβ
ei k (x y)
d 4k . k02 ω2k /c2 i ε (2π)4
Wird jetzt noch die für ebene Wellen des Maxwell-Feldes gültige Beziehung (8.123) bzw. ω2k /c2 k 2 sowie k k kα k α k02 k 2 benutzt, so ergibt sich schließlich (9.87).
Die Matrix
G αβ (x y)
DF αβ (x y) h μ0 c
(9.89)
ist eine Greensche Funktion der inhomogenen Maxwell-Gleichungen, sie erfüllt (Aufgabe 9.4) G αβ (x y) gαβ δ 4 (x y) .
(9.90)
9.4 Anwendung der Störungstheorie auf Streuprozesse
9.4
273
Anwendung der Störungstheorie auf Streuprozesse
Jetzt sind alle mathematischen Hilfsmittel bereitgestellt, um die ins Auge gefaßten Streuprozesse behandeln zu können. Aus physikalischer Sicht betrachten wir als Anfangszustand einen Zustand mit aufeinander zufliegenden Teilchen, die soweit voneinander entfernt sind, daß sie praktisch als wechselwirkungsfrei angesehen werden können. Wenn es sich um geladene Teilchen handelt, treten sie mit dem Vakuum in Wechselwirkung. Nach dem ursprünglichen Bild von Dirac ist dieses mit Elektronen und Positronen negativer Energie besetzt. Dieses Bild konnte zwar nicht aufrecht erhalten werden, dennoch kommt es auch in der Quantenelektrodynamik aufgrund von Vakuumfluktuationen zu Wechselwirkungen mit dem Vakuum, die sich allerdings als Prozesse höherer Ordnung herausstellen werden. Wir behandeln ein Modell, bei dem die Teilchen nur während einer endlichen Zeitspanne miteinander wechselwirken. Vor der Wechselwirkung können die Teilchen dann als freie Teilchen betrachtet werden. Nach der Wechselwirkung verlassen die die Wechselwirkung überlebenden sowie neue, bei der Wechselwirkung entstandene Teilchen das Wechselwirkungsgebiet (Abb. 9.3) und können dann ebenfalls als freie Teilchen aufgefaßt werden. Die Zustände ein- und auslaufender Teilchen sind dann Lösungszustände2 des freien Feldes, wie sie im vorigen Kapitel mit Hilfe des Hamilton-Operators 3 ( D H 0 M ) d x für freie Teilchen behandelt wurden, und können daher durch Einwirkung der dortigen Erzeugungsoperatoren a (l, p) und b (l, p) für Elektronen bzw. Positronen sowie b (λ) (k) für Photonen auf das Vakuum 0 dargestellt werden. Die Erzeuger a (l, p), b (l, p) und b (λ) (k) sind Ebene-Welle-Lösungen zugeordnet, und ebene Wellen sind räumlich sowie zeitlich unendlich ausgedehnt. Dies bedeutet, daß sie sich auch in das Innere des in Abb. 9.3 durch einen Kreis abgegrenzten Wechselwirkungsgebiets erstrecken, wo der Wechselwirkungsterm wirksam wird, die Teilchen also aufgrund ihrer Wechselwirkung nicht frei sind. Die Annahme von Anfangs- und Endzuständen der Form (9.38) ist also bei kritischer Betrachtung nicht mit der Annahme vereinbar, daß es sich um freie Teilchen handelt, es kommt zu einem Widerspruch. Zu dessen Beseitigung gibt es zwei Möglichkeiten. Die adäquate, aber wesentlich mühsamere bestünde darin, Anfangs- und Endzustände durch Wellenpakete endlicher Ausdehnung zu beschreiben, die aus Ebene-Welle-Lösungen für freie Teilchen superponiert sind. Da man jedoch deren viel einfachere Beschreibung durch ebene Wellen beibehalten möchte, hat man sich als Alternative das im folgenden benutzte Modell ausgedacht: Es wird angenommen, daß die Wechselwirkung auf ein Zeitintervall τ t τ beschränkt ist, zu dessen Beginn die Wechselwirkung sehr langsam ein- und gegen dessen Ende sie sehr langsam ausgeschaltet wird, eine Annahme, die als Adiabatizitätshypothese bezeichnet wird. (Diese entspricht der Tatsache, daß die Stärke der Wechselwirkung bei Annäherung der Teilchen zu- und bei deren Auseinanderlaufen wieder abnimmt.) Vor dem Ein- und nach dem Ausschalten der Wechselwirkung sind dann freie Teilchenzustände möglich. Das Ein- und Ausschalten der Wechselwirkungspotentiale muß sehr langsam erfolgen, weil diese sonst durch Ein- oder Ausschwingvorgängen zu Emissionsquellen oder Absorptionssenken für Energie werden. Es ist klar, daß die mit der Adiabatizitätshypothese erreichte Vereinfachung ihren Preis
274
9 Wechselwirkende Felder
auslaufende Teilchen
— Wechselwirkungsgebiet
Abb. 9.3: Streuprozeß mit Erzeugung eines Teilchens.
einlaufende Teilchen
hat: Die mit ihr erzielten Lösungen stellen eine Näherung dar. Dieser Preis ist jedoch gut zu verkraften, weil weitere Näherungen ohnehin unumgänglich sind. Wenn der Zustand des Systems wechselwirkender Teilchen durch ψ, t beschrieben wird, gilt nach der Adiabatizitätshypothese für hinreichend großes τ ψ, τ W
a ,
ψ, τ W
e ,
und nach (9.30) ist die Streumatrix für den Übergang a e Sea
e U (τ, τ ) a .
Es ist zweckmäßig, τ gehen zu lassen. Mit der Bezeichnung i 2½ 4 (9.37) S lim U (t, t0 ) T e ch ½ W (x) d x t0 t
(9.91)
haben wir dann die Streumatrix Sea
e S a .
Aufgaben 9.1
Beweisen Sie durch vollständige Induktion die Gültigkeit der Beziehung t τn τ2 1 1 dτn dτn 1 dτ1 HW (τn ) HW (τ1 ) t0
t0
t0
9.2
1 n
t
t
dτ1 t0
t0
1 1 dτn T HW (τ1 ) HW (τn ) .
Beweisen Sie das Wicksche Theorem für den Fall n 3, indem sie in ( ) ( ) ( ) ( ) ( ) ( ) A 1 A 2 A 3 A 1 A 1 A2 A 2 A3 A3
Aufgaben
275
explizit alle Summanden mit Hilfe der Beziehung A k( ) A l(
εB F A l(
)
A k() A k A l
)
in Normalordnung überführen. 9.3
Beweisen Sie für die Matrix G(x) S F (x)/h die Gültigkeit der Gleichung (i h ∂/ m 0 c)G(x)
9.4
Beweisen Sie für die Matrix G αβ (x) D F αβ (x)/(h μ0 c) die Gültigkeit von G αβ (x)
9.5
δ 4 (x) .
gαβ δ 4 (x) .
Zeigen Sie: Die Proca-Gleichungen Aα (m 02 c2 /h 2 ) Aα μ0 j α 0 haben den Feynman-Propagator h 3 μ0 c gαβ . D F αβ ( p) p p m 20 c2 i ε
Lösungen 9.3
Im Limes ε
0 gilt
(i h ∂/ m 0 c) G(x)
(9.83)
(/ p
m c)(i h ∂/m c) e p p m c i ε 0
0 2 2 0
m c)( p/m c) e d p (2π h ) p p m c i ε ( p ppp m mc c) e i ε (2πd hp) e
( p/
0
0 2 2 0
i p x/h
Im Limes ε
4
4
4
i p x/h
d 4p (9.71) 4 δ (x) . (2π h )4
0 gilt d k g kke iε (2π) d k g kkkke i ε (2π) g
G αβ (x)
(9.87)
ik x
4
αβ
ik x
αβ
9.5
d 4p (2π h )4
4
2 2 i p x/h 0 2 2 0
9.4
i p x/h
4
4
αβ
4
d4k e i k x (2π)4
g
4 αβ δ (x) .
DF αβ (x) muß in Analogie zu (9.89) mit (9.90) die Gleichung
h μ c g δ (x) erfüllen. Unter Benutzung von (9.71) und (9.87) mit k p/h ergibt sich daraus p p mh c D ( p) h μ c g e (2πd hp) 0 . DF αβ
(m
2 2 0 2
2 2 2 0 c /h ) DF αβ
F αβ
0
0
αβ
αβ
4
i p x/h
4
4
Aus dem Verschwinden der eckigen Klammer folgt die behauptete Beziehung.
10
Quantenelektrodynamik
Wir untersuchen in diesem Kapitel die Wechselwirkung von Teilchen, die durch das Dirac- und das Maxwell-Feld beschrieben werden, also die Wechselwirkung von Elektronen, Positronen und Photonen. Der (normalgeordnete) Hamilton-Operator für die e Wechselwirkung von Elektronen und Photonen ist nach (9.6b) mit q H W
α ψ A α : . ce:ψγ
(10.1)
Die Begründung für die Benutzung der Normalordnung ist dabei dieselbe wie in den Abschnitten 8.3.4 und 8.4.2. Nach Gleichung (9.16a) und (9.19a) sind die Operatoren im Wechselwirkungsbild die gleichen wie im Heisenberg-Bild des ungestörten Problems. 1 H 1 setzen und für ψ bzw. A α die OperatoIn Gleichung (9.36) können wir daher H W ren für freie Teilchen einsetzen, nach (8.186) und (8.121) also 2 3 m 0c23 a (l, p)u(l, p) e i px/h b (l, p)v(l, p) ei px/h d p , (10.2) ψ(x) (2π h ) Ep l 1 2 ψ(x) m 0c2 a (l, p) u(l, p) ei px/h b (l, p) v(l, p) e i px/h d 3p , (10.3) (2π h )3 Ep l 1 3 d3k h μ0 c2 εα (λ)(k) b (λ)(k) e i k x b (λ)(k) ei k x . A α (x) (10.4) 3 ωk 2(2π) λ0
Im folgenden wird es sich verschiedentlich als nützlich erweisen, wenn wir in Einklang mit der Adiabatizitätshypothese annehmen, daß die Wechselwirkung der Teilchen auf ein endliches Gebiet beschränkt ist. Nach Auswertung der Übergangsamplituden kann man dann immer noch die Ausdehnung des Gebiets gegen unendlich gehen lassen. Der Einfachheit halber nehmen wir an, das Wechselwirkungsgebiet sei ein Würfel der Kantenlänge L und der Ursprung des gewählten Koordinatensystems befinde sich und A α (x) außerhalb die ψ(x) im Zentrum des Würfels. Damit die Operatoren ψ(x), ses würfelförmigen Gebiets verschwinden, müssen alle Wellen, aus denen sie aufgebaut sind, am Rand des Würfels die Amplitude null besitzen. Dies hat zur Folge, daß nur eine diskrete Menge ebener Wellen möglich ist, für die mit ganzzahligem n pi L h
2πn
bzw.
ki L
2πn ,
i
1, 2, 3
(10.5)
gilt. Hieraus ergibt sich pi 2π h n/L 2π h /L bzw. ki 2π/L, und mit der Ersetzung d 3 pp x p y pz (2π h /L)3 gehen die Integrale auf den rechten Seiten der
277
Gleichungen (10.2)–(10.4) gemäß 2π h 3 3 d p... ... L p
3
d k...
bzw.
L
k
in Summen über. Werden außerdem die Umdefinitionen L 3/2 L 3/2 a (l, p) a l, p , b(l, p) b l, p , 2π h 2π h
2π 3
b(λ)(k)
L 2π
3/2 b(λ) k
vorgenommen, so ergeben sich aus (8.173a) und (8.177a) bzw. (8.127c) die Vertauschungsrelationen a l, p , al , p δl l δ p, p , b l, p , bl , p δl l δ p, p (10.6)
¼
¼
bzw.
b , b g δ ¼
(λ) k
¼
(λ¼ ) k¼
λλ¼
¼
¼
k,k ¼
¼
¼
,
(10.7)
die übrigen Vertauschungsrelationen mit einer Null als Kommutationsrest übertragen sich analog. Beweis: Zur Ableitung z. B. von (8.173a) wurde (8.170) benutzt, und die hierin auftretende 2 δ 3 -Funktion stammt von dem Integral e i (εl p εl p)x/h d 3x. Bei endlichem Integrationsgebiet führt dieses im Endergebnis bis auf einen Faktor zu δ p, p statt δ 3 ( p p). Der Faktor kann aus der Bedingung 2 2 (8.173a) δll a (l, p), a (l , p ) d 3 p δ 3 ( p p) d 3 p 1 ¼
¼
¼
¼
l ¼ 1 2 l ¼ 1 p
l ¼ 1
2π h 3 L 3 a l, p , al, p L 2π h ¼
¼
2 a l, p , al, p
l ¼ 1 p
¼
¼
bestimmt werden, und der Faktor beim Übergang von a (l, p) zu a l, p wurde gerade so gewählt, daß diese erfüllt ist, aus (10.6a) folgt 2 a l, p , , al, p ¼
l ¼ 1 p
¼
2 l ¼ 1 p
δl l δ p, p ¼
¼
1.
Mit der angegebenen Ersetzung von Integralen durch Summen und Umdefinition von Operatoren sowie mit V L 3 wird aus (10.2)–(10.4) 2 m 0 c 2 1 ψ(x) a l, p u(l, p) e i px/h bl,p v(l, p) ei px/h , (10.8) V Ep l 1 p 2 m 0 c 2 1 ψ(x) a l, p u(l, p) ei px/h bl, p v(l, p) e i px/h , (10.9) V Ep l 1 p 3 h μ0 c 2 1 (λ) (λ) (10.10) Aα (x) εα (λ)(k) bk e i k x bk ei k x . 2V ωk
λ0 k
278
10 Quantenelektrodynamik
Für den in (9.91) definierten Streuoperator S ergibt sich mit (10.1) durch Reihenentwicklung ie 2 ½ α 4 S T e h ½ :ψγ ψ Aα : d x 1 S (1) S (2) . . . (10.11) mit α ψ(x) S(1) i e T :ψ(x)γ A α (x): d 4x , (10.12) 1 h 2 1)γ α ψ(x 2)γ β ψ(x S(2) e 2 T :ψ(x 1) A α (x1): :ψ(x 2 ) A β (x2): d 4x1 d 4x2.(10.13) 2 h Hierin sind die Entwicklungen (10.2)–(10.4) bzw. (10.8)–(10.10) einzusetzen. Mit den letzteren, c2 1/(ε0 μ0 ) und der von Sommerfeld eingeführten Feinstrukturkonstanten α e2 /(4πε0 h c) ergibt sich in grober Näherung α . e d 4x α ψ A α : d 4x α m 0c2 :ψγ h Ep V V ωk /c
Die Reihenentwicklung (10.11) ist mit S (n) α n/2 daher zugleich eine Entwicklung nach der kleinen Größe (α)1/2 1/12. Bei der Berechnung von Übergangsamplituden wird daraus in vielen Fällen effektiv sogar eine Entwicklung nach α 1/137, da sich nur in jeder zweiten Ordnung von null verschiedene Beiträge zu den Übergangsamplituden ergeben (Aufgabe 10.12). Das ist der Grund dafür, warum die Quantenelektrodynamik schon bei Berücksichtigung nur weniger der niedrigsten Entwicklungsordnungen Ergebnisse liefert, die in außergewöhnlich guter Übereinstimmung mit experimentellen Befunden stehen.
10.1 Alphabet der Feynman-Diagramme R. Feynman hat eine sehr einfache und anschauliche graphische Darstellung von Wechselwirkungsprozessen in Raum-Zeit-Diagrammen vorgeschlagen, mit der diese in übersichtlicher Weise geordnet und berechnet werden können. Die Grundelemente dieser Feynman-Diagramme, sozusagen ihr Alphabet, sind Linien für ein- und auslaufende sowie vorübergehend erzeugte und dann wieder vernichtete virtuelle Teilchen sowie Punkte, welche die Absorption und Emission von Teilchen charakterisieren. Aus den Feynman-Diagrammen kann mit Hilfe geeigneter Regeln, die in Abschn. 10.6 besprochen werden, sogar die zugehörige mathematische Formel für den Beitrag zur Streumatrix rekonstruiert werden. Ein Elektron wird in einem Ort/Zeit-Diagramm mit vertikaler Zeitachse durch eine nach oben laufende durchgezogene Linie mit Pfeil in positiver Zeitrichtung (Abb. 10.1 (a)), ein Positron der Feynman-Stückelberg-Interpretation entsprechend durch eine nach unten laufende durchgezogene Linie mit Pfeil in negativer Zeitrichtung (Abb. 10.1 (b)) dargestellt, – die Pfeile können als Richtungsangabe für den Ladungsfluß interpretiert werden. Ein Photon wird durch eine gewellte Linie (Abb. 10.1 (c)) repräsentiert; da das Photon sein eigenes Antiteilchen ist, unterbleibt die Angabe einer
10.1 Alphabet der Feynman-Diagramme
oder
oder
(a) Elektron
oder
279
oder
(b) Positron
oder
oder
(c) Photon
oder (d) externes Feld
(e) Vertex
(f) Kontraktion
Abb. 10.1: Grundelemente von Feynman-Diagrammen der QED. Die Elektron-, Positron- oder Photonlinien der oberen Reihe beginnen oder enden bei einem (nicht dargestellten) Vertex. Bei den in (f) dargestellten Kontraktionen sind die Vertizes, an denen die inneren Linien enden, nicht ausgefüllt. Dies soll sie als Anschlußelemente charakterisieren, die bei der in Abschn. 10.6.1 besprochenen Zuordnung mathematischer Ausdrücke zu den Elementen der Feynman-Diagramme nicht zu den Kontraktionen zählen, sondern separat berücksichtigt werden.
Zeitrichtung. Um die Diagramme fließender in den Text einbinden zu können, läßt man die Zeitachse häufig auch horizontal von links nach rechts laufen, was später zum Teil auch in diesem Buch geschehen wird. Ein statisches externes elektromagnetisches Feld wird bei vertikaler Zeitachse durch eine horizontale Photonlinie dargestellt, die in einem die Anschlußstelle an die Außenwelt symbolisierenden Kreuz endet (Abb. 10.1 (d)). Raumpunkte, an denen Teilchen erzeugt oder vernichtet werden, bezeichnet man als Vertizes (Plural von Vertex, engl. für Ecke, Spitze, Scheitelpunkt). Sie werden als Punkte dargestellt (Abb. 10.1 (e)). Kontraktionen treten nach (9.62) nur zwischen nicht-vertauschbaren Operatoren auf. Da Photonenoperatoren im Zustandsraum der Photonen und Fermionenoperatoren im Zustandsraum der Fermionen wirken, sind Photonen- und Fermionenoperatoren miteinander vertauschbar. Infolgedessen treten nur Fermion-Fermion- und PhotonPhoton-Kontraktionen auf. Im Zusammenhang mit Gleichung (9.65) wurde dargelegt, daß die Kontraktion ein Maß für die Wahrscheinlichkeit des Übergangs eines Teilchens von einem Punkt der Raum-Zeit zu einem anderen darstellt. In den FeynmanDiagrammen wird dafür eine etwas erweiterte Interpretation benutzt: Im Fall der Kon traktion (9.65) bedeutet 0T φ(x) φ (y) 0 z. B. für T φ(x) φ (y) φ(x) φ (y), daß bei y die Erzeugung eines Teilchens stattfindet und anschließend bei x seine Vernichtung. Kontraktionen können daher als Übergänge aufgefaßt werden, bei denen Teilchen an einem Punkt der Raum-Zeit erzeugt und anschließend an einem anderen vernichtet werden. Eine Kontraktion wird dementsprechend durch zwei Vertizes dargestellt, die im Fall der Kontraktion von Fermionenoperatoren durch eine gerichtete Fermionlinie (Abb. 10.1 (f) oben) und im Fall der Kontraktion von Photonenoperatoren durch eine ungerichtete Photonlinie verbunden sind (Abb. 10.1 (f) unten). Linien, die nicht beidseitig durch Vertizes begrenzt sind, charakterisieren ein- oder auslaufende Teilchen und werden als äußere Linien bezeichnet. Linien, die beidseitig durch Vertizes begrenzt
280
10 Quantenelektrodynamik
sind, charakterisieren intermediäre Wechselwirkungsprozesse und werden als innere Linien bezeichnet. Da die bei den intermediären Prozessen auftretenden Teilchen nicht nach außen in Erscheinung treten, werden sie als virtuelle Teilchen bezeichnet. (Weitere Gründe für ihre Benennung werden in Abschn. 10.3.1 angegeben.) Wie die Elemente der Feynman-Diagramme zu Diagrammen zusammengesetzt werden und wie die letzteren zu interpretieren sind, wird in den folgenden Abschnitten anhand konkreter Wechselwirkungsprozesse erläutert.
10.2 Streuprozesse erster Ordnung 10.2.1 Streuprozesse freier Teilchen Da in den Operatoren, aus denen S (1) nach Gleichung (10.12) aufgebaut ist, nur eine Zeit auftaucht, kann der Zeitordnungsoperator T weggelassen werden. Mit der Zer ψ(x) und A α (x) in je einen Erzeuger- und Vernichteranteil legung (9.44) für ψ(x), ergibt sich h (1) S : ψ ( ) ψ ( ) γ α ψ () ψ ( ) A α() A α( ) : d 4x (10.14) ie ψ () γ α ψ () A α():ψ () γ α ψ ( ) : A α()ψ ( )γ α ψ () A α()ψ ( )γ α ψ ( ) A α() A α( )ψ ()γ α ψ () A α( ):ψ ()γ α ψ ( ) : A α( )ψ ( ) γ α ψ () A α( )ψ ( )γ α ψ ( ) d 4x. Dabei wurde benutzt, daß der Operator A α mit den Operatoren ψ und ψ vertauscht. Bei der Untersuchung der Übergangsamplituden gibt es zwei Möglichkeiten: •
•
Man gibt den Anfangszustand a und den Endzustand e vor und berechnet die Übergangsamplitude. Dann besteht die Aufgabe darin, in S nach der Zerlegung mit Hilfe des Wickschen Theorems diejenigen Terme herauszusuchen, die nichtverschwindende Beiträge zu Sea liefern. Bei unglücklicher Wahl der Zustände a und e kann sich dabei Sea 0 ergeben. Dennoch besteht das physikalische Problem oft gerade darin, die Wahrscheinlichkeit vorgegebener Übergänge zu bestimmen. Man wählt die Zustände a und e so, daß sie zu S in dem Sinn passen, daß sich eine von null verschiedene Übergangsamplitude ergibt.
Um einen allgemeinen Überblick zu gewinnen, werden wir im folgenden den zweiten Weg beschreiten. Durch das Wicksche Theorem und die Entwicklung der Feldoperatoren nach Erzeugern und Vernichtern wird S in eine Summe von Termen zerlegt, welche die Struktur S(i)
fi e1 e2 . . . em a 1a 2 . . . a n (10.15) mit Erzeugern ei , Vernichtern a i und einem Zahlenfaktor f i besitzen. Der Anfangszustand a und der Endzustand e sind Zustände, die aus dem Vakuumzustand 0 durch
10.2 Streuprozesse erster Ordnung
281
die Einwirkung von Erzeugungsoperatoren für die ein- bzw. auslaufenden Teilchen hervorgehen. Wählt man für sie a a n a n
so gilt
0 ,
e eem m
1 ...a 1
0 ,
1 . . . e1
(10.16)
a 1 a 2 . . . a n a a 1 a 2 . . . a n a n a n 1 . . . a 1 0 0 ,
weil a 1 a 2 . . . a n die Teilchen wieder vernichtet, die durch a n a n 1 . . . a 1 erzeugt wurden, analog gilt e1 e2 . . . em e 0, und es folgt a 1 a 2 . . . a n a fi e1 e2 . . . em e, a 1 a 2 . . . a n a Sea e S(i) a f i e e1 e2 . . . em (6.6) fi 0 , 0 f i 0 0 f i . Sea ist also von null verschieden, wenn der Anfangszustand aus dem Vakuumzustand durch Einwirkung derjenigen Erzeuger hervorgeht, deren zugehörige Vernichter die in S enthaltenen Vernichter sind, wenn der Endzustand durch Einwirkung der in S enthaltenen Erzeuger aus dem Vakuum hervorgeht und wenn schließlich f i 0 gilt. In Elementen Sea 0 wirken also im Operator S enthaltene Vernichter auf den Anfangszustand und vernichten die einlaufenden Teilchen, während die in S enthaltenen Erzeuger so interpretiert werden können, daß sie die auslaufenden Teilchen erzeugen. Nach (8.42) erzeugt ein Erzeugungsoperator ψ (x, t) zur Zeit t ein Teilchen am Ort x, während ein Vernichtungsoperator ψ(x, t) ein dort befindliches Teilchen vernichtet. In Anwendung auf die Feldoperatoren A α() (x, t) bedeutet dies die Erzeugung eines Photons durch A α( ) (x, t) und Vernichtung eines Photons durch A α() (x, t) am Ort x zur Zeit t. Bei den Dirac-Operatoren ψ und ψ ist die Situation aufgrund der in (8.186) zu treffenden Zuordnung der Erzeuger und Vernichter zu verschiedenartigen Teilchen etwas komplizierter. Die Zerlegung (9.44) bedeutet gemäß den im Anschluß an ihre Einführung gegebenen Erläuterungen p x d 3 p s.u. px m 0 c2 m 0 c2 i ( ) ψ (x) b (l, p)v(l, p) e h bl, p v(l, p) ei h , 3 (2π h) V Ep Ep ( )
ψ
(x)
ψ
()
(x)
l, p
m 0 c2 a(l, p)u(l, p) e 3 (2π h)
ψ ( )(x)
c2
m0 3 (2π h)
i
a (l, p) u(l, p) ei
px h
px h
m 0 c2 b(l, p) v(l, p) e 3 (2π h)
i
p x h
d 3p Ep
s.u.
m 0 c2 l, p
V Ep
d 3p
2 s.u. m 0 c
Ep
V Ep
d 3p Ep
l, p s.u.
px h
i
a l, p u(l, p) e
,
(10.17) i a l, p u(l, p) e
m 0 c2 b v(l, p) e V Ep l, p
px h
,
i
px h
,
l, p
wobei für jeden Operator zwei Ausdrücke angegeben sind, die alternativ gelten: der erste bei unendlichem und der zweite bei endlichem Wechselwirkungsvolumen. Aufgrund der in Tabelle 8.1 angegebenen Zuordnung ergibt sich hieraus die Erzeugung
282
10 Quantenelektrodynamik
Elektron Positron Photon
Erzeugung
Vernichtung
ψ ( ) (x, t)
ψ ( ) (x, t)
ψ () (x, t) ( ) A α (x, t)
ψ ( ) (x, t) ( ) A α (x, t)
Tabelle 10.1: Erzeugung bzw. Vernichtung eines Teilchens zur Zeit t am Ort x.
bzw. Vernichtung eines Elektrons durch ψ () bzw. ψ ( ) und die Erzeugung bzw. Vernichtung eines Positrons durch ψ () bzw. ψ ( ) . Die gefundenen Zuordnungen sind nochmals übersichtlich in Tabelle 10.1 zusammengestellt. Enthält ein Term von S keine Erzeuger, so kann der zugehörige Beitrag zu Sea nur für e0 ungleich null werden, der Endzustand ist dann der Vakuumzustand. Enthält ein Term von S dagegen keine Vernichter, so ist der Anfangszustand der Vakuumzustand. Im ersten Fall gibt es keine auslaufenden, im zweiten keine einlaufenden Teilchen. Betrachten wir als erstes den ersten Beitrag zu S (1) in (10.14), ie (1) S(a) ψ ( ) γ α ψ ( ) A α( ) d 4x . h (1) S(a) enthält nur Vernichter, und daher kann die zugehörige Übergangsamplitude nur (1)
dann von null verschieden sein, wenn e der Vakuumzustand ist. In S(a) vernichtet ( )
A α (x) bei x ein Quant des Maxwell-Feldes (in Abb. 10.2 als γ -Quant bezeichnet), ψ ( )(x) vernichtet ein Elektron und ψ ( ) (x) ein Positron. Der durch ψ ( ) γ α ψ ( ) A α( ) (1) beschriebene Beitrag zu S(a) beschreibt also die gleichzeitige Vernichtung eines bei x einlaufenden Elektrons, Positrons und Photons, und da der Endzustand das Vakuum ist, gibt es keine auslaufenden Teilchen. Abb. 10.2 (a) enthält das zu diesem Prozeß gehörige Feynman-Diagramm. Im zweiten Beitrag zu S (1) , ie (1) :ψ ( ) γ α ψ () : A α( ) d 4x , S(b) h ( )
wird bei x durch A α (x) ein γ -Quant und durch ψ ( ) (x) ein Positron vernichtet, während der Erzeugungsoperator ψ ()(x) nach Tabelle 10.1 ein auslaufendes Positron erzeugt. Dieser im Diagramm (b) der Abb. 10.2 dargestellte Prozeß kann als Absorption eines Photons durch ein Positron interpretiert werden. Die übrigen sechs Beiträge zu S können in ähnlicher Weise diskutiert werden. Die zugehörigen Feynman-Diagramme sind (c)–(h) in Abb. 10.2, ihre Interpretation ist im Text zur Abbildung angegeben. Soweit wurde nur eine der Bedingungen für Sea 0 untersucht, nicht jedoch, ob auch der nach (10.15) dazugehörige numerische Faktor f i von null verschieden ist. Dieser Frage gilt die folgende Untersuchung. Zwei der acht in Abb. 10.2 dargestellten Prozesse müssen offensichtlich aus energetischen Gründen verboten sein, d. h. für sie muß f i 0 gelten, was bedeutet, daß ihre Wahrscheinlichkeit gleich null ist: In dem durch das Diagramm 10.2 (a) dargestellten
10.2 Streuprozesse erster Ordnung
283
e
(a) e
(b)
(c)
e γ
γ
e
e
(d)
e γ
e
(e)
γ
(f)
e
e
γ
e (g)
e
γ
e
( ) () ( ) ψ ( ) γ α ψ ( ) A α :ψ ( ) γ α ψ ( ) : A α ψ ( ) γ α ψ () A α
γ
e
( ) ψ ( ) γ α ψ ( ) A α
e
γ
e
(h) e
( ) ( ) ( ) ( ) A α ψ () γ α ψ () A α :ψ () γ α ψ ( ): A α ψ ( ) γ α ψ () A α ψ ( ) γ α ψ ( )
Abb. 10.2: Feynman-Diagramme der Streuprozesse erster Ordnung, in der oberen Reihe unter Absorption und in der unteren unter Emission eines Photons. (a) Gegenseitige Vernichtung eines Elektrons, Positrons und Photons, (b) Absorption eines Photons durch ein Positron, (c) Absorption eines Photons durch ein Elektron, (d) Zerfall eines Photons in ein Elektron-Positron-Paar, (e) Elektron-Positron-Paarvernichtung unter Emission eines Photons, (f) Emission eines Photons durch ein Positron, (g) Emission eines Photons durch ein Elektron, (h) gemeinsame Entstehung eines Elektrons, Positrons und Photons.
Prozeß werden drei Teilchen vernichtet, ohne daß dabei ein neues Teilchen entsteht, welches deren Energie übernehmen könnte, und in dem durch das Diagramm 10.2 (h) dargestellten Prozeß entstehen drei Teilchen aus dem Nichts. Die Unmöglichkeit dieser Prozesse folgt natürlich auch aus der expliziten Berechnung der zugehörigen Übergangsamplitude. Wir werden diese Rechnung allerdings nicht für alle acht Prozesse durchführen, sondern nur exemplarisch für einen. Hierzu wählen wir den in Abb. 10.2 (d) dargestellten Prozeß der Paarerzeugung durch ein γ -Quant aus, dessen (Nicht-) Realisierbarkeit nicht offensichtlich ist. Sein Beitrag zu S (1) ist ie (1) S(d) ψ ( ) γ α ψ ( ) A α() d 4x . (10.18) h Die dazu passenden Zustände a und e für ein- und auslaufende Teilchen sind nach (10.15) sowie (8.137) und (10.17)
a b (λ)(k)0 ,
e a (l , p ) b (l , p )0 .
(10.19)
Hiermit ergibt sich für die Übergangsamplitude (1) S(d) ea
ihe
' ' 0' b (l , p ) a (l , p ) ψ ( )(x)γ α ψ ( )(x) A α()(x) b (λ)(k) '0 d 4x
284
10 Quantenelektrodynamik (8.137) (10.17a,c)
i em 0 c3 μ0 (2π h )3 2(2π)3 h
γ
α
0 ' d 3p ' d x 0' a (l ¼ , p¼ ) a (l, p) u(l, p) ei px/h Ep l 4
d 3p b (l , p ) b (l, p)v(l, p) ei px/h Ep
l
Mit
λ
d 3 k '' 1 εα (λ )(k ) b (λ ) (k ) b (λ) (k) ei k x '0 . ωk
' 0'a (l , p ) a (l, p)
' 0' a (l , p ), a (l, p)
' 0'b (l , p ) b (l, p)
' 0' b (l , p ), b (l, p)
' b (λ ) (k )b (λ) (k)'0
b (λ ) (k ), b (λ)
£
£
und 00 1 wird daraus (1) S(d) ea p°x
s.u.
in (9.71)
ie
(8.173a)
' (k) '0
' δl l δ 3 ( p p) 0' , ¼
δl
' g λ λ δ 3 (k k)'0
(8.127c)
4π Ep Ep ωk
£
¼
p ¼¼ h k) x/h
¼¼
i e m 0 c3 h μ0 u(l , p )γ α v(l , p ) g λλ εα (λ)(k) 4π Ep Ep ωk ¼
l
¼¼
h μ m c3u(l , p )γ α v(l , p ) gλλ ε (λ)(k) 0 0 α ei ( p ¼
' δ 3 ( p p) 0' ,
(8.177a)
¼¼
δ 4 ( p p h k) ,
d 4x (2π h )4
(10.20)
wobei die für ein auslaufendes (reelles) Elektron gültige Umformung δ 3 ( p p) ei px/h
δ 3 ( p (8.162) 3 δ (p
p) ei (E p t p x)/h p) ei (E p
¼
δ 3 ( p t p x)/h δ 3 ( p ¼
p) ei (E p t p x)/h ¼
p) ei p x/h ¼
und entsprechende Umformungen für die anderen Teilchen benutzt wurden. Wegen der (1) δ 4 -Funktion wird S(d) ea nur für p α
bzw. Ep
¼
pα h k α 0
Ep h ωk , ¼¼
p p
h k
(10.21)
von null verschieden. Mit (8.114b) und (8.162b) folgt aus dem Quadrat der Gleichung (10.21a) 2m 20 c2 p 2 p 2 2 (m 20 c2 p 2 )(m 20 c2 p 2 ) h 2 k2 ,
und mit dem Quadrat von Gleichung (10.21b) wird daraus nach Division durch zwei m 20 c2 p p (1 m 20 c2 / p 2 )(1 m 20 c2 / p 2 )) p p cos ϑ , wobei ϑ der Winkel zwischen den Richtungen der Vektoren p und p ist. Offensichtlich ist die linke Seite größer als die rechte, was bedeutet, daß die Gleichungen
10.2 Streuprozesse erster Ordnung
285
(1) (10.21) nicht gleichzeitig erfüllt werden können. S(d) ea ist daher gleich null, der Prozeß der Paarerzeugung durch ein γ -Quant ist nicht möglich. Angemerkt sei, daß die Paarerzeugung durch ein zusätzliches externes Feld ermöglicht wird. Auch bei den übrigen Prozessen erster Ordnung führt die Auswertung der Übergangsamplitude zum Auftreten einer δ 4 -Funktion, die nur dann nicht verschwindet, wenn zwischen ein- und auslaufenden Teilchen Energie- und Impulserhaltung besteht, und die Erhaltungssätze können in keinem Fall gleichzeitig erfüllt werden. Dies bedeutet, daß alle in Abb. 10.2 aufgeführten Prozesse die Wahrscheinlichkeit null besitzen.
10.2.2 Elektronenstreuung an festem Kern Ein Prozeß erster Ordnung mit nicht-verschwindender Übergangswahrscheinlichkeit ist die durch das Feynman-Diagramm der Abb. 10.3 dargestellte und als Mott-Streuung bezeichnete Streuung eines Elektrons an einem Atomkern. Da der Kern viel schwerer als das Elektron ist, kann seine Position näherungsweise als fixiert aufgefaßt werden. Das von ihm erzeugte elektromagnetische Feld ist bei Vernachlässigung des durch seinen Spin hervorgerufenen Magnetfelds ein statisches elektrisches Feld, das in guter Näherung als klassisches externes Feld aufgefaßt werden darf. Der Wechselwirkungsterm ist auch hier durch Gleichung (10.1) gegeben, wobei nur der Operator A α (x) durch das klassische Feld Aα (x) φ(x)/c, 0, 0, 0 (φ(x)=Coulomb-Potential des Kerns) ersetzt werden muß. In niedrigster Ordnung wird die Streumatrix mit dem Operator (10.12) gebildet, wobei der Zeitordnungsoperator T wieder weggelassen werden kann. Für den Prozeß mit einem ein- und einem auslaufenden Elektron ergibt sich nach Tabelle 10.15 S(1) i e ψ ( ) γ α Aα ψ ( ) d 4x . h Unser Ziel ist es, für die Streuung des Elektrons ähnlich wie im Abschn. Q4.2.6 und Beispiel Q8.3 der gewöhnlichen Quantenmechanik einen differentiellen Wirkungsquer(1) und aus schnitt zu berechnen. Dazu müssen zunächst die Übergangsamplituden Sea diesen Übergangsraten berechnet werden.
e φ(x) e
ψ () γ 0 ψ ( ) φ/c
Abb. 10.3: Mott-Streuung.
286
10 Quantenelektrodynamik
Übergangsamplituden Für die Feldoperatoren ψ(x) und ψ(x) wählen wir diesmal die Zerlegung nach diskreten ebenen Wellen. (Eine Begründung dafür wird später gegeben.) Analog zu (10.19b) sind der Anfangs- und Endzustand dann durch
a a l, p 0 ,
e a l , p 0 ¼
(10.22)
¼
(1) gegeben. Ähnlich wie die Übergangsamplitude S(d) ea im letzten Abschnitt erhält man α 0 mit γ Aα γ φ(x)/c ' 4 γ 0 φ(x) () i e '' (1) '0 d x 0 a l , p ψ ( )(x) Sea ψ (x) a l, p h c 2 0 ' ei px/h γ 0 φ(x) (10.17b,c) i e m 0 c ' 0' a l , p a l, p u(l, p) h V c Ep l, p £ e i p x/h '' 1 4 a l £, p£ a l,p u(l , p ) '0 d x Ep£ l £ , p£ ¼
¼
¼
u(l , p ) ei p x/h γ 0 φ(x) u(l, p) e i px/h 4 dx c Ep¼ Ep 0 0 3 u(l , p ) γ u(l, p) i ( p0¼ p0 )x 0 /h d x φ(x) ei ( p e i em 0 c h h V Ep¼ Ep
(10.6a)
¼
i e m 0 c2 h V
¼
p¼ ) x/h d
3x
h 3
.
Aus der eindimensionalen Version von Gleichung (8.71) ergibt sich für das erste Integral Ep Ep¼ s.u. dx0 ¼ ei ( p0 p0 )x0 /h 2π δ( p0 p ) 2π δ 2πc δ(Ep Ep ¼ ) , 0 h c (10.23) wobei p0 Ep /c und zuletzt Gleichung (E2.41) benutzt wurde. Das zweite Integral ist bis auf einen Faktor die Fourier-Transformierte des Coulomb-Potentials φ(x), mit φ Z e/(4πε0 x ) ergibt sich für dieses i ( p p¼ ) x/h 3 3 Ze d x s.u. Ze e i ( p p¼ ) x/h d x . (10.24) φ(x) e 3 3 4πε0 x ε0 h p p 2 h h (1)
(Beweis folgt.) Für Sea folgt damit schließlich (1) Sea
2πi Z e2 m 0 h 2 c2 Mea δ(Ep Ep¼ ) ε0 V Ep¼ Ep p p 2
mit
Mea
u(l , p ) γ 0 u(l, p) . (10.25)
Beweis: Mit x/h x x und q ( p p ) haben wir bis auf einen Faktor das Integral e i q x 3 J d x. x
10.2 Streuprozesse erster Ordnung
287
In Kugelkoordinaten, deren Polarachse in Richtung von q weist, ist x d 3x r 2 sin ϑ dr dϑ dϕ und
½π
1 2π i qr cos ϑ e s.u. 2 r sin ϑ dr dϑ dϕ 2π r ei qrα dr dα , r r 0 ϑ 0 ϕ 0 r 0 α 1
J
r , q x qr cos ϑ,
wobei die Substitution α cos ϑ vorgenommen wurde. Die Integration nach α läßt sich zwar formal ausführen, doch die Weiterintegration nach r führt zu einem unbestimmten Ausdruck, was bedeutet, daß das Nacheinander-Ausführen der Integrale wegen der Divergenz des Integranden für r nicht möglich ist. Wir umgehen diese Schwierigkeit, indem wir vorübergehend statt φ 1/r ein Potential φ eμr /r betrachten und dann μ0 gehen lassen. Für dieses Hilfspotential erhalten wir statt des letzten Doppelintegrals J(μ) 2π
r eμr ei qαr dr dα ,
1
1
r 0 α
und die Integration nach α führt zu J (μ)
2π
μr re
r 0
2π iq
3
e(i q μ)r i q μ
'1 ei qαr '' ' dr i qr '
2π (i q μ)r (i q μ)r e dr e iq r 0 1 4' 1 e(i q μ)r '' 2π 1 4π . ' ' i q μ i q i q μ i q μ q 2 μ2
0
Hieraus folgt J
lim J(μ)
μ0
4π . q2
Übergangsrate zu festem Endzustand Zur Berechnung der Übergangsrate zu einem Ebene-Welle-Endzustand mit fest vorgegebenem Impuls p benötigen wir die Übergangswahrscheinlichkeit. Da in dieser das Quadrat der δ-Funktion auftritt, ist sie nicht wohldefiniert. Anders ist das bei der durch die Dauer τ des Übergangs geteilten Übergangswahrscheinlichkeit, der Übergangsrate wea
(1) 2
Sea
lim
τ
τ
(1) /τ das Zeitintegral Wird in limτ Sea
δ(Ep Ep ) ¼
1 2π h
(1) lim Sea lim
τ
τ
½ i (E e ½
p
(1)
Sea
τ
Ep¼ )t /h
.
(10.26)
dt ,
durch das die δ-Funktion nach (10.23) dargestellt werden kann, mit endlichen Integrationsgrenzen eingesetzt, so ergibt sich mit (10.25) wea
2πc4 Z 2 e4 m 20 h 3 Mea 2 δ(Ep Ep ) lim Ep Ep p p 4 τ ε02 V 2 ¼
¼
2 τ/2 τ/2
ei (Ep τ
Ep¼ )t /h
dt
.
288
10 Quantenelektrodynamik
Wegen der Multiplikation mit δ(Ep Ep ) kann im Integral unter dem Limes Ep Ep 0 2 τ/2 gesetzt werden, was mit τ/2 dt τ schließlich zu ¼
¼
Mea 2 δ(Ep Ep ) (10.27) Ep Ep p p 4 führt, einer Größe mit einfacher δ-Funktion. Wegen dieser ist w ea nur für Ep Ep von null verschieden, was nach (8.162b) p2 p 2 zur Folge hat. Damit ergibt sich w ea
2πc
4 Z 2 e4 m 2 h 3 0 ε02 V 2
¼
¼
¼
( p p )2
p2
2 p p
p 2 2 p2(1
cos ϑ) 4 p2 sin2 (ϑ/2) ,
wobei ϑ der Winkel zwischen p und p ist, sowie
πc
w ea
Mea 2 δ(Ep
4 Z 2 e4 m 2 h 3 0 2 2 8ε0 V
Ep2
Ep¼ ) 4 4 p sin (ϑ/2)
.
(10.28)
Ableitungsgemäß bezieht sich die Übergangsrate w ea aufgrund unserer Wahl (10.22) auf einen Anfangszustand mit der durch l beschriebenen Polarisation und auf einen Endzustand mit der durch l beschriebenen Polarisation. Bei gegebener Anfangspolarisation l sind Übergänge l l l und l l l möglich. Wir nehmen an, daß bei der Messung des Wirkungsquerschnitts nicht bezüglich der Polarisation des gestreuten Elektrons gefiltert wird. Die von der Polarisation des gestreuten Elektrons unabhängige Übergangsrate ist einfach die Summe (über l von 1 bis 2) der polarisationsabhängigen Übergangsraten. Bezüglich des Anfangszustands nehmen wir an, daß keine bestimmte Polarisation präpariert wurde. Wir betrachten stattdessen einen gemischten Anfangszustand, in dem jede Polarisation mit dem statistischen Gewicht 1/2 vertreten ist. Die gesamte Übergangsrate setzt sich dann aus der Summe der Übergangsraten für alle Übergangsmöglichkeiten zwischen verschiedenen Polarisationsrichtungen zusammen und ist unter Berücksichtigung des statistischen Gewichtsfaktors 1/2 für die Anfangszustände 2 2 δ(E p Ep ) l,l 1 Mea πc4 Z 2 e4 m 20 h 3 w p p . (10.29) 16 ε02 V 2 Ep2 p4 sin4 (ϑ/2) ¼
¼
¼
Jetzt berechnen wir Mit 0 uγ u
l,l ¼
Mea 2 und setzen dazu kurz u(l, p)u und u(l , p )u .
u (γ ) u u (γ 0)2 u uγ 0u
0 2
(2.205)
u u
4 α 1
u α uα
4 α 1
u α u
α
u
u
'2 und u γ 0 u ' (u γ 0 u)(u γ 0 u) erhalten wir zunächst 2 l,l ¼ 1
Mea 2 (10.25b)
' ' 'u γ 0 u ' 2 l,l ¼
l,l ¼
(u γ 0 u)(uγ 0 u )
αβλμ l,l ¼
0 0 u α γαβ u β u λ γλμ uμ
10.2 Streuprozesse erster Ordnung αβλμ (8.195)
2
0 γαβ
289
2 0 u β (l, p)u λ (l, p) γλμ u μ (l , p )u α (l , p )
l 1
αβλμ
0 γαβ
Weiterhin ist p m 0 c)γ 0 (/ p Sp γ 0 (/
l¼ 1
p/ m c / m c 0 0 0 p γλμ 2m 0 c βλ 2m 0 c μα
Sp γ 0 (/ p m 0 c)γ 0 (/ p
m 0 c)
4m 20 c2
.
Sp γ 0p/γ 0p/ m 0 c Sp γ 0p/γ 0 (γ 0 )2p/ m 20 c2 Sp(γ 0 )2 s.u. Sp γ 0p/γ 0p/ 4m 20c2 , wobei zuletzt (γ 0 )2 E, Sp E 4, Sp γ α 0 als Folge von (2.172), Sp p/ pα Sp γ α 0 und
m 0 c)
Sp γ 0p/γ 0 pα Sp γ 0 γ α γ 0
(2.204)
pα 2g 0α Sp γ 0 Sp γ α 0
benutzt wurde. Mit Sp(AB) Sp(B A) und daraus folgend 1 Sp γ α γ β Sp γ α γ β γ β γ α 2
(2.204)
g αβ Sp E
4gαβ
ergibt sich schließlich Sp γ 0p/γ 0p/ pα pβ Sp γ 0 γ α γ 0 γ β pα pβ Sp 2g α0 γ 0 γ β γ α γ β 2 p0 pβ Sp γ 0 γ β pα pβ Sp γ α γ β 8 p0 pβ g0β 4gαβ pα pβ Ep Ep 0 0 0 8 p p 4 p p0 4 p p 4 c2 p p sowie 2 2 2 2 Mea 2 m 0 c Ep E2p 2/c p p . m0c l,l 1 ¼
¼
¼
Beim Einsetzen dieses Ergebnisses in die Übergangsrate (10.29) können wir wegen der δ 3 -Funktion Ep Ep und p p p2 cos ϑ setzen, was mit m 20 c2 Ep2 /c2 p2 zu ¼
m 20 c2
Ep Ep c2
¼
p p
2Ep2 c2
p2 (1 cos ϑ)
2Ep2 c2
2 p2 sin2 (ϑ/2)
führt. Mit pm Ú (Ep /c2 )Ú erhalten wir schließlich 2 l,l ¼ 1
Mea 2
2Ep2 Ú2 2 1 sin (ϑ/2) , c2 m 20 c4
und aus der Übergangsrate (10.29) wird damit π Z 2 e4 h 3 1(Ú 2 /c2 ) sin2 (ϑ/2) δ(Ep Ep ) w p p . 8 ε02 V 2 p4 sin4 (ϑ/2) ¼
¼
(10.30)
290
10 Quantenelektrodynamik
Übergangsrate zu Intervall von Endzuständen w p p ist die Übergangsrate von einer ebenen Welle mit dem Impuls p als Anfangszustand zu einer ebenen Welle mit dem Impuls p als Endzustand. In der Praxis interessiert man sich jedoch für die Streuung zu all denjenigen Ebene-Welle-Endzuständen, deren Impulse p mit dem Impuls p der einfallenden ebenen Welle einen Winkel aus dem Intervall ϑ, ϑ dϑ einschließen. Das entspricht dem Streufluß durch die Fläche eines Ringgebiets, das durch einen Kegel mit den Öffnungswinkeln ϑ und ϑ dϑ aus einer Kugelfläche ausgeschnitten wird (siehe Mechanik, Abb. M4.19). Hierzu muß über alle Übergangsraten w p p , die in die entsprechenden Elemente
¼
¼
d 3p
p 2 sin ϑ d p dϑ dϕ
des Impulsraums führen, summiert werden. Aus (8.162) folgt d Ep c2 p d p/Ep , womit die Impulsraumelemente die Form d 3p
p Ep d Ep sin ϑ dϑ dϕ/c2 ¼
¼
annehmen. Wegen (10.5a) liegen im Intervall 0, P gleichmäßig verteilt Ni P L/(2π h) verschiedene Werte der Impulskomponente pi . Da dies für jede Impulsrichtung gilt, ist die Anzahl möglicher Impulswerte im Volumen P 3 des Impulsraums durch 3 und ihre Dichte in diesem mit V L 3 durch N N1 N2 N3 P 3 L 3 /(2π h) np
N P3
V 3 (2π h)
(10.31)
gegeben. Die Zahl von Wellen mit Impulswerten im Element d 3 p des Impulsraums ist daher V p Ep d Ep sin ϑ dϑ dϕ . (10.32) d N( p ) n p d 3 p 3 2 (2π h) c
¼
¼
Für die gesamte Übergangsrate zu Ebene-Welle-Zuständen mit Streuwinkeln im Intervall ϑ, ϑ dϑ ergibt sich damit dWp
d 3 p¼
wp
ϕ,Ep¼
p
¼
2π
d N( p ) sin ϑ dϑ
dϕ 0
Ep ¼
Ep 1(Ú 2 /c2 ) sin2 (ϑ/2) Z 2 e4 dΩ , 4 64π 2 c2 ε02 V p3 sin (ϑ/2)
(10.30)
V p Ep w p 3 2 (2π h) c ¼
p¼
d Ep
¼
(10.33)
wobei zuletzt das Raumwinkelelement dΩ 2π sin ϑ dϑ eingeführt wurde. Die Tatsache, daß d W p d 3 p 0 für V gilt, ist der Grund dafür, warum die Feldoperatoren nach diskreten ebenen Wellen entwickelt wurden. Bei der Berechnung des Wirkungsquerschnitts im nächsten Abschnitt wird der Faktor 1/V durch einen weiteren Faktor V kompensiert, sodaß der Übergang V möglich wird. (Die Entwicklung nach einem Kontinuum ebener Wellen hätte zu einem nicht wohldefinierten Produkt 0 geführt.) ¼
10.2 Streuprozesse erster Ordnung
291
Differentieller Wirkungsquerschnitt Die Berechnung eines differentiellen Wirkungsquerschnitts für die Streuung des Elektrons am Kern erfolgt im Prinzip wie im Abschn. Q4.2.6 oder Beispiel Q8.3. (Dem Leser wird daher empfohlen, sich die entsprechenden Abschnitte nochmals anzusehen.) Der differentielle Wirkungsquerschnitt dσ ist die Fläche, die senkrecht vom Wahrscheinlichkeitsstrom jeinf des einfallenden Teilchens durchsetzt werden muß, um dieselbe Wahrscheinlichkeit pro Zeiteinheit für den Durchgang des Elektrons zu besitzen wie dessen Streuung in das Raumwinkelelement dΩ, d. h. jeinf dσ
d W p
d 3 p¼
.
Hieraus ergibt sich als differentieller Wirkungsquerschnitt dσ dΩ
d W p
1
jeinf
d 3 p¼
dΩ
.
(10.34)
Anschaulich ist der Vierervektor des einfallenden Wahrscheinlichkeitsstroms durch α nv α gegeben, was mit der Teilchendichte n 1/V (ein Teilchen im Volumen V ), jeinf der (bewegten) Masse m Ep /c2 und v α pα /m zu α jeinf
c2 pα V Ep
jeinf
c2 p V Ep
(10.35)
führt. Korrekter wird dieses Ergebnis auf folgende Weise bewiesen. Beweis: Nach (7.132) ist der Teilchenstrom eines Elektrons j α cψγ α ψ. In der Quantenfeldtheorie ist diesem der Feldoperator j α c:ψγ α ψ: (10.36) zugeordnet. Sein Erwartungswert in dem durch (10.22a) gegebenen Zustand a des einlaufenden Elektrons ist ' 1 ' 1 0 ' 0 ' ' ' ' ' j α j α c 0' a l, p :ψγ α ψ: a l, p '0 c 0' a l, p ψ ( ) γ α ψ ( ) a l, p '0 ,
denn der Beitrag von ψ ( ) γ α ψ ( ) bzw. ψ ( ) γ α ψ ( ) zu j α könnte nur dann von null verschieden sein, wenn a bzw. e der Vakuumzustand wäre, und für einen nicht-verschwindenden Beitrag von :ψ ( ) γ α ψ ( ) : müßte nach Tabelle 10.1 ein Positron ein- und auslaufen. Mit (10.17) ergibt sich weiterhin
jα
¼ £ m 0 c3 0 '' ei p x/h α e i p x/h '' 1 a l, p a l ¼ , p¼ u(l , p ) γ a l £ ,p£ al, p u(l , p ) 0' '0 V Ep ¼ Ep £ £ £ ¼ l,¼ p,l ,p
3 (10.6a) m 0 c
V Ep
u(l, p)γ α u(l, p) .
Mit der gleich zu beweisenden Beziehung u(l, p)γ α u(l, p)
pα m0c
(10.37)
292
10 Quantenelektrodynamik
führt das zu (10.35). Aus (8.190a) und (b) folgt u(l, p)γ α u(l, p)
u(l, p)Π γ α Π u(l, p) .
Mit 4m 20 c2 Π γ α Π
(8.187)
(γ μ pμ m 0 c)γ α (γ ν pν m 0 c)
pμ pν γ μ γ α γ ν
pμ pν (2g μα γ α γ μ )γ ν
2 pα pν γ ν
2m 0 cpα 1
(2.204)
und (8.163) wird
m 0 c( pμ γ μ γ α pν γ α γ ν )
α
γ2
Π γ αΠ
m 0 cpμ (γ μ γ α γ α γ μ )
pμ pν (γ μ γ ν γ ν γ μ )
p//(m 0 c) pα 1
m 20 c2 γ α
2m 0 cpα
m 20 c2 γ α m 20 c2 γ α
(m 20 c2 pμ pμ )γ α
p//(m 0 c) , 2m 0 c
und aus (8.190a) mit (8.187) ergibt sich (/ p
m 0 c) u(l, p) 2m 0 c u(l, p)
p/ u(l, p) u(l, p) . m0c
Zusammenfassen der letzten Ergebnissen führt zu pα u(l, p) 1 p//(m 0 c) u(l, p) u(l, p)γ α u(l, p) 2m 0 c
pα u(l, p) u(l, p) , m0c
und mit (8.192a) ergibt sich daraus (10.37).
Aus (10.34) folgt mit (10.33), (10.35b) und der Sommerfeldschen Feinstrukturkonstanten α e2 /(4πε0 hc) nach Herauskürzen eines Faktors V im Zähler und im Nenner dσ dΩ
Z α h Ep 2c p2
2
1(Ú
2 /c 2 ) sin2 (ϑ/2)
sin4 (ϑ/2)
.
(10.38)
Für v/c0 und Z 1 ergibt sich hieraus mit Ep / p2 m 0 c2 /(m 0 v)2 c2 /(m 0 v 2 ) das Ergebnis (Q4.176) der Schrödingerschen Wellenmechanik. (10.38) ist also dessen relativistische Verallgemeinerung, was bedeutet, daß es in der hier behandelten niedrigsten Ordnung keine Effekte der Feldquantisierung gibt.
10.3 Streuprozesse zweiter Ordnung Bei der Zerlegung des Integranden von S (2) , Gleichung (10.13), mit Hilfe des Wickschen Theorems (9.53) treten nach den am Ende von Abschnitt 9.2 gegebenen Erläuterungen nur Kontraktionen zwischen Operatoren auf, von denen einer im ersten und einer
10.3 Streuprozesse zweiter Ordnung
293
im zweiten Normalprodukt steht, und dabei nach (9.61)–(9.62) nur Photon-Photon oder Fermion-Fermion-Kontraktionen bzw. -Propagatoren. Unter den letzteren sind wegen des Verschwindens der Kommutatoren ψ(x), ψ(y) und ψ(x), ψ(y) wiederum nur die von null verschieden, bei denen ψ und ψ kontrahiert werden. (In (8.156) wurde das Verschwinden nur für tx t y gefordert, aus den gleichzeitigen Vertauschungsrelationen mit verschwindendem Kommutationsrest folgt dieses jedoch wie im Fall des Klein-Gordon-Schrödinger-Feldes – siehe (8.89) – auch für die entsprechenden nichtgleichzeitigen Vertauschungsrelationen.) Auf diese Weise erhält S (2) einen Term ohne Kontraktionen, drei Terme mit einer Kontraktion, drei Terme mit zwei Kontraktionen und einen Term mit drei Kontraktionen,
S (2)
e2 2h 2 e2 2h 2 e2 2h 2 e2 2h 2 e2
2h 2 e2
2h 2 e2
2h 2 e2 2h 2
α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 )ψ(x 2) : d x1 d x2 α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ(x 2) : d x1 d x2
α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ(x 2) : d x1 d x2
α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ(x 2) : d x1 d x2
(10.39) β : ψ(x 1 ) γ α A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ
(x 2 ) : d x 1 d x 2 4
4
α β (x ) : d 4x d 4x : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ 2 1 2
α β (x 2 ) : d 4x 1 d 4x 2 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ
α β 4 4 : ψ(x 1) γ A α (x 1 ) ψ(x 1 ) ψ(x 2 ) γ A β (x 2 ) ψ(x 2) : d x1 d x2 .
Würde man jeden nicht kontrahierten Operator gemäß (9.44) in seinen Erzeugerund Vernichteranteil zerlegen, so erhielte man durch Ausmultiplizieren und Normalordnen beim ersten Summanden 26 64 verschiedene Terme, beim zweiten bis vierten je 24 16 und beim fünften bis siebten je 22 4 Terme, beim letzten Summanden bliebe es bei einem Term. Jeder auf diese Weise erhaltene Term hat seine eigene physikalische Bedeutung, wobei jedoch zwischen vielen Termen Ähnlichkeiten bestehen. Auf die Zerlegung in Erzeuger und Vernichter wird wegen dieser Vielfalt verzichtet, die Bedeutung der acht Summanden wird jedoch anhand repräsentativer Beispiele erläutert.
294
10 Quantenelektrodynamik
Erster Summand. Von den 64 Termen, in die der erste Summand bei der Zerlegung der Operatoren zerfällt, greifen wir den heraus, der bei x 1 und x 2 jeweils denselben (1) Beitrag wie in S(d) , Gleichung (10.18), liefert, S (2)
(dd)
e2
2h 2 e2
2h
2
:ψ ( )(x 1 )γ α ψ ( )(x 1 ) A α( )(x 1 )ψ ()(x 2 )γ β ψ ()(x 2 ) A β( )(x 2 ): d 4x 1 d 4x 2 ψ ()(x 1 )γ α ψ ()(x 1 ) ψ ()(x 2 )γ β ψ ()(x 2 ) A α( )(x 1 ) A β (x 2 ) d 4x 1 d 4x 2 . ( )
Die hierzu passenden Anfangs- und Endzustände für ein- und auslaufende Teilchen sind in Analogie zu (10.19)
a b (λ ) 1
(k1 ) b (λ2) (k2 )0 ,
e a
(l1 , p1 ) b (l1 , p1 ) a (l2 , p2 ) b (l2 , p2 )0 .
Sie entsprechen zwei einlaufenden Photonen, und zu jedem von diesen gehört ein auslaufendes Elektron-Positron-Paar. Abb. 10.4 enthält das zugehörige FeynmanDiagramm: Es besteht aus zwei Diagrammen 10.2 (d), die beiden Photonen zerfallen unabhängig voneinander jeweils in ein Elektron-Positron-Paar. Da jeder der Einzelprozesse unmöglich ist, gilt das natürlich auch für ihre Kombination, und die Auswertung (2) der zu S(dd) gehörigen Übergangsamplitude zwischen den angegebenen Zuständen
(1) a und e liefert wie die für S(d) durchgeführte null, weil die zugehörigen Energie-
und Impulserhaltungssätze nicht gleichzeitig erfüllt werden können. Offensichtlich bestehen die Feynman-Diagramme der übrigen 63 Terme des ersten Summanden aus allen möglichen Paarkombinationen der Diagramme aus Abb. 10.2, d. h. sämtliche Prozesse erster Ordnung können in zweiter Ordnung unabhängig voneinander paarweise auftreten. Alle 64 Prozesse sind jedoch aus Gründen der Energie- und Impulserhaltung verboten, sie haben also die Übergangswahrscheinlichkeit null. Abb. 10.4: Feynman-Diagramm für einen Term des ersten Summanden. Zwei Photonen zerfallen unabhängig voneinander jeweils in ein ElektronPositron-Paar.
Zweiter und vierter Summand. Wir bringen im zweiten und vierten Summanden erst das Produkt A α (x 1 ) A β (x 2 ) ganz nach rechts. Da in jedem Summanden über x 1 und x 2 integriert sowie über α und β summiert wird, können die Umbenennungen x 1 x 2 und α β vorgenommen werden. Wird dies beim vierten Summanden durchgeführt und 1), 2) mit ψ(x werden anschließend folgende Vertauschungen vorgenommen: 1. γ β ψ(x 1) mit ψ(x 2 ), 4. γ α ψ(x 2 ) und schließlich 1) mit γ β ψ(x 2), 3. ψ(x 1 ) mit ψ(x 2. γ α ψ(x 5. Aβ (x 2 ) mit Aα (x 1 ), dann geht der vierte in den zweiten Summanden über. Wegen der geraden Anzahl dazu benötigter Fermionenvertauschungen und der Normalordnung des Integranden bleibt das ohne Konsequenzen für den Wert des Summanden, daher stellen der zweite und vierte Summand dieselben Prozesse dar.
10.3 Streuprozesse zweiter Ordnung
x1
x2 (a)
x2 x1
(b)
295
Abb. 10.5: Bedeutung der Kontraktion des zweiten Summanden: entweder virtuelles Positron, (a), oder virtuelles Elektron, (b).
Bei den 16 durch den zweiten bzw. vierten Summanden beschriebenen Prozessen gibt es ein durch die Kontraktion ψ(x 1 )ψ(x 2 ) bzw. ψ(x 1 )ψ(x 2 ) beschriebenes virtuelles Fermion, das an einem Vertex bei x 1 oder x 2 erzeugt und bei x 2 oder x 1 vernichtet wird, außerdem zwei Photonen und zwei Fermionen, von denen bei x 1 und x 2 je eines etc. erzeugt und vernichtet wird. Im folgenden wird für ψ(x 1 ) etc. zur Abkürzung ψ 1 geschrieben. Durch Zerlegung der Operatoren in Erzeugungs- und Vernichtungsanteil ergibt sich mit 0 A( ) B ( ) 0 0 A( ) B ( ) 00 für die Kontraktion des zweiten Summanden * ' ' ' () ( ) ( ) () ' für t1 > t2 0'ψ 1() ψ 2( ) '0 (9.51) ' ' 0 ψ 1 ψ 2 0 T ψ 1 ψ2 ψ 1 ψ2 ' ( ) ( ) ' '0 für t2 > t1 . 0 'ψ 2 ψ1 Im ersten Fall beschreibt die Kontraktion nach Tabelle 10.1 die Emission eines Positrons bei x 2 und dessen Absorption bei x 1 (Abb. 10.5 (a)), im zweiten Fall die Emission eines Elektrons bei x 1 und dessen Absorption bei x 2 (Abb. 10.5 (b)). Da in (10.39) über x 1 und x 2 integriert wird, treten immer beide Möglichkeiten auf, t1 >t2 und t2 > t1 . Die Zerlegung des Terms ψ 1 ψ 2 im zweiten Summanden liefert ( )
()
ψ 1 ψ 2
( ) ( ) ψ ψ 1 2 () ( )ψ ψ 1 2 ( ) ( )ψ ψ 1 2
(Absorption eines Elektrons bei x 1 und eines Positrons bei x 2 ) (Absorption eines Elektrons bei x 1 , Emission eines Elektrons bei x 2 ) (Emission eines Positrons bei x 1 , Absorption eines Positrons bei x 2 ) (Emission eines Positrons bei x 1 und eines Elektrons bei x 2 ) . ( )
()
Wegen der Multiplikation mit A 1α A 2β A 1α A 2β
( ) A ( ) ( ) ( ) ( ) ( ) A 1α 2β A 1α A 2β A 1α A 2β
(1) (2) (3) (4) (5) (6) (7) (8) ein e γ eγ e γ e e eγ e e e γ γ e γ e γ e aus γ γ γ γ e e γ γ e γ e γ (9) (10) (11) (12) (13) ein γ e γ γ e e γ e γ γ aus e e γ e γ e γ γ e e
(14) (15) (16) γ γ e e γ e γ e eγ e γ
Tabelle 10.2: Mögliche Kombinationen von Absorption und Emission beim zweiten Summanden von (10.39). “ein“ bedeutet einlaufende Teilchen, die absorbiert und “aus“ auslaufende Teilchen, die emittiert werden. Bei jedem der 16 aufgeführten Prozesse stehen links (ein oder zwei Einträge) die bei x1 und rechts (ein oder zwei Einträge) die bei x2 absorbierten und emittierten Teilchen. Der () ()
( ) ( ) ( ) ( ) ( ) ( ) ψ 2 in (5) – (8), ψ 1 ψ 2 in (9) – (12) und ψ 1 ψ 2
Prozeß ψ 1 ψ 2 ist in (1) – (4), ψ 1 in (13) – (16) enthalten.
296
10 Quantenelektrodynamik
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
(14)
(15)
(16)
Abb. 10.6: Feynman-Diagramme der durch den zweiten Summanden dargestellten Prozesse, darunter die Vernichtung eines eines Elektron-Positron-Paares zu Gammaquanten (4), die ElektronPhoton-Streuung (6) und (7) sowie die Positron-Photon-Streuung (10) und (11).
kann jede dieser Möglichkeiten in Kombination mit der Absorption von zwei Photonen (eines bei x 1 , das andere bei x 2 ), der Absorption eines Photons bei x 1 oder x 2 und Emission eines Photons bei x 2 oder x 1 sowie der Emission von zwei Photonen (eines bei x 1 , das andere bei x 2 ) auftreten. Insgesamt ergeben sich dadurch die Möglichkeiten der Tabelle 10.2. Die zugehörigen Feynman-Diagramme sind mit der gleichen Numerierung in Abb. 10.6 aufgeführt. Die den Kontraktionen zugeordneten inneren Fermionlinien sind dabei horizontal eingezeichnet, um anzudeuten, daß bei jeder die beiden Möglichkeiten (b) und (c) der Abb. 10.7 bestehen. (Diese illustriert den mit (7) numerierten Fall der Streuung eines Photons an einem Elektron.) Einige der Prozesse, z. B. (1) und (16),
10.3 Streuprozesse zweiter Ordnung
(a)
(b)
297
(c)
Abb. 10.7: Streuung eines Photons an einem Elektron, (a) Darstellung in Abb. 10.6, (b) Alternative mit virtuellem Elektron und (c) Alternative mit virtuellem Positron.
sind offensichtlich aus rein energetischen Gründen nicht möglich und haben daher die Wahrscheinlichkeit null, bei anderen können wieder Energie- und Impulserhaltungssatz nicht gleichzeitig erfüllt werden. Unter den 16 angegebenen Prozessen befinden sich diesmal jedoch auch solche mit von null verschiedener Wahrscheinlichkeit. Einer von diesen, die durch die Diagramme (6) und (7) repräsentierte Compton-Streuung eines Photons an einem Elektron, wird repräsentativ in Abschn. 10.3.1 behandelt. Man beachte, daß beim Zusammentreffen äußerer und innerer Fermionlinien in Vertizes immer die Richtung fortgesetzt wird, entgegengesetzte Richtungen treffen in einem Vertex nie aufeinander. Letzteres würde in den Übergangsamplituden Kombinationen wie ψ ( ) (x 1 )ψ ( ) (x 1 ) ψ ( ) (x 2 ) oder ψ () (x 1 ) ψ ( ) (x 2 ) ψ ( ) (x 2 ) (Zusammentreffen von ψ () (x 1 ) und ψ () (x 1 ) bzw. von ψ ( ) (x 2 ) und ψ ( ) (x 2 )) erfordern, die in α (x ): nicht vorkommen und daher auch in keinem der Entwicklungs:ψ(x i )γ ψ(x i)A α i terme von (10.11). Das bedeutet jedoch keineswegs die Unmöglichkeit der Kollision von Fermionen, diese ist vielmehr mit dem Austausch eines virtuellen Photons verbunden (Abb. 10.8). Dritter Summand. Bei den 16 durch den dritten Summanden von (10.39) repräsentierten Prozessen gibt es insgesamt vier ein- und/oder auslaufende Fermionen, wobei die Zahl der ein- bzw. auslaufenden Fermionen zwischen null und vier variieren kann. Die beiden Vertizes bei x 1 und x 2 sind durch eine innere Photonlinie verbunden, welche die Kontraktion * ' ( ) ( ) ' ' für t1 > t2 0' A A 2β '0 (9.51) '' () ( ) ( ) ( ) ' 1α 0 T A 1α A 2β A 1α A 2β '0 A 1α A 2β () ( ) '' für t2 > t1 0' A 2β A1α 0
(1) (2) (3) ein e e e e e e e e e e aus e e
ein e aus e
(4) (5) e e e e e e e e
(6) e e e e
(7) (8) e e e e e e e e
(9) (10) (11) (12) (13) (14) (15) e e e e e e e e e e e e e e e e e e e e e e e e e e
(16) e e e e
Tabelle 10.3: Mögliche Kombinationen von Absorption und Emission beim dritten Summanden.
298
10 Quantenelektrodynamik
(4)
(6)
(7)
(11)
Abb. 10.8: Feynman-Diagramme der vier wesentlich voneinander verschiedenen Prozesse des dritten Summanden mit zwei ein- und zwei auslaufenden Fermionen: (4) und (7) beschreibt die Streuung eines Elektrons an einem Positron, (6) die eines Positrons an einem Positron und (11) die eines Elektrons an einem Elektron (Numerierung wie in Tabelle 10.3).
repräsentiert. (Für t1 >t2 z. B. gilt
( )
( )
( )
( )
0T ( A 1α A 2β )0 0 A 1α A 2β 00 wegen
( ) A 2β 00.) Sie kann von links nach rechts ansteigen (Fall t2 >t1 ) oder abfallen (Fall t2
Fünfter und siebter Summand. Der siebte Summand kann wieder durch die Umbenennungen x 1 x 2 und α β sowie anschließendes Vertauschen in die Form des fünften gebracht werden und beschreibt daher dieselben Prozesse wie dieser. Es gibt zwei innere Linien, eine für ein Photon und eine für ein Fermion, sowie zwei äußere Fermionlinien. Beim fünften Summanden stammen die letzteren von ψ 1 ψ 2
( ) ( ) ( ) ( ) ( )ψ ( )ψ ( )ψ ( )ψ ψ ψ ψ ψ 2 2 2 2 1 1 1 1
und führen zu den in Tabelle 10.4 angegebenen Möglichkeiten für ein- und auslaufende Teilchen. Die zugehörigen Feynman-Diagramme finden sich mit gleicher Numerierung in Abb. 10.9. Daß die Photonlinie als Bogen gezeichnet ist, hat keine tiefere Bedeutung, damit wird nur vermieden, daß zwei innere Linien übereinander liegen. Energetisch möglich sind nur die Prozesse (2) und (3).
ein aus
(1) e e
(2) e
(3) e e
(4) e e
e
Tabelle 10.4: Mögliche Kombinationen von Absorption und Emission beim fünften Summanden.
10.3 Streuprozesse zweiter Ordnung
(1)
299
(2)
(3)
(4)
Abb. 10.9: Feynman-Diagramme der durch den fünften Summanden beschriebenen Prozesse.
Sechster Summand. Bei diesem treten als ein- und auslaufende Teilchen nur zwei Photonen auf, und es gibt zwei innere Fermionlinien. Abb. 10.10 enthält die FeynmanDiagramme der vier möglichen Kombinationen von ein- und auslaufenden Photonen. Energetisch möglich sind nur die Fälle (2) und (3). Der durch sie beschriebene Prozeß ist der als Vakuumpolarisation bezeichnete Prozeß der Erzeugung eines virtuellen Elektron-Positron-Paares. (1)
(2)
(3)
(4) Abb. 10.10: Feynman-Diagramme der durch den sechsten Summanden beschriebenen Prozesse.
Achter Summand. Da der achte Summand keine unkontrahierten Operatoren enthält, sind der passende Anfangs- und Endzustand der Vakuumzustand. Das Betragsquadrat der zugehörigen Übergangsamplitude gibt daher die Wahrscheinlichkeit dafür an, daß Vakuum in Vakuum übergeht, und diese muß gleich 1 sein. Da der Integrand jedoch wegen der drei Kontraktionen konstant ist, divergiert das Integral. Um ein physikalisch sinnvolles Ergebnis zu erhalten, müssen der achte Summand und entsprechende Terme höherer Ordnung weggelassen werden. Abb. 10.11 enthält das zugehörige FeynmanDiagramm, eine geschlossene Blase oder Vakuumblase.
Abb. 10.11: Feynman-Diagramm der durch den achten Summanden beschriebenen Vakuumblase.
10.3.1 Übergangsamplituden Die Berechnung der Übergangsamplitude kann für jeden der in den acht Summanden enthaltenen Elementarprozesse ähnlich wie bei den Streuprozessen erster Ordnung durchgeführt werden. Die entsprechende Rechnung wird im folgenden exemplarisch bei zwei ausgewählten Prozessen durchgeführt.
300
10 Quantenelektrodynamik
Elektron-Elektron-Streuung Bei der Streuwechselwirkung zweier Elektronen gibt es zwei ein- und zwei auslaufende Elektronen. Das zugehörige Feynman-Diagramm, Nummer (11) in Abb. 10.8, entspricht dem Term 2 (2) S(ee) e 2 :ψ ( )(x1) γ α A α (x1 ) ψ ( )(x1)ψ ()(x2) γ β A β (x2 )ψ ( )(x2): d 4x1 d 4x2 2h (10.40) im dritten Summanden der rechten Seite von Gleichung (10.39). Dazu passende Anfangs- und Endzustände sind a al1 , p1 a l2 , p2 0 , e a l , p al , p 0 . (10.41)
2 i em 0 c2 2 hV
' 0'a l
k1 ,..,k4 q1 ,..,q4
u(k1 ,q1
)γ αu(k
2 ,q2 ) u(k 3 ,q3 )γ
¼
¼
¼
1
2
2
' (2) ' e' S(ee) 'a zwischen diesen Zuständen ergibt sich
(2) Für die Übergangsamplitude Sea mit (9.87) und (10.17) (2) Sea
¼
1
1 , p1 ¼
βu(k
¼
a l
' : a k1 ,q1 a k2 ,q2 a k3 ,q3 a k4 ,q4 : a l1 , p1 a l2 , p2 '0
2 , p2 ¼
¼
4 ,q4 )
Eq1 Eq2 Eq3 Eq4
DFαβ (x 1 x 2 ) ei
(q1 q2 )x 1 (q3 q4 )x 2 h
d 4x 1 d 4x 2 .
Es gilt : a k1 ,q1 a k2 ,q2 a k3 ,q3 a k4 ,q4 : a k1 ,q1 a k3 ,q3 a k2 ,q2 a k4 ,q4 , da die Fermionenoperatoren Antivertauschungsrelationen genügen, und damit ' ' 0'a l1 , p1 a l2 , p2 : a k1 ,q1 a k2 ,q2 a k3 ,q3 a k4 ,q4 : a l1 , p1 a l2 , p2 '0 ' ' 0'al , p a l , p a k1 ,q1 a k3 ,q3 a k2 ,q2 a k4 ,q4 al1 , p1 al2 , p2 '0 . 1
1
2
2
Zur weiteren Auswertung dieses Vakuumerwartungswertes werden alle Erzeugungsoperatoren nach links durchgetauscht. Zunächst ergibt sich mit Hilfe der Vertauschungsrelationen (10.6a) a k2 ,q2 a k4 ,q4 a l1 , p1 a l2 , p2 a k2 ,q2 δl1 k4 δ p1 q4 a l1 , p1 a k4 ,q4 a l2 , p2 δl1 k4 δp1 q4 δl2 k2 δ p2 q2 al2 , p2 a k2 ,q2 δl1 k2 δ p1 q2 al1 , p1 a k2 ,q2 δl2 k4 δ p2 q4 al2 , p2 a k4 ,q4 δl1 k4 δp1 q4 δl2 k2 δ p2 q2 δl1 k2 δ p1 q2 δl2 k4 δ p2 q4 δl1 k4 δp1 q4 a l2 , p2 a k2 ,q2 δl1 k2 δ p1 q2 a l2 , p2 a k4 ,q4
δl k δ p q al , p a k ,q δl k δ p q al , p a k ,q al , p a l , p a k ,q a k ,q 2 4
2 4
1
1
2
2 2
2
2 2
1
4
1
4
1
1
2
2
2
2
4
4
und analog a l1 , p1 a l2 , p2 a k1 ,q1 a k3 ,q3
δk1 l2 δq1 p2 δk3 l1 δq3 p1 δk1 l1 δq1 p1 δk3 l2 δq3 p2
δk l δq p a k ,q al , p δk l δq p a k ,q a l , p δk l δq p a k ,q a l , p δk l δq p a k ,q al , p a k ,q a k ,q al , p a l , p . 1 2
1 2
3
3
1
1
1 1
3 1
3 1
1
1
2
2
1
1 1
3
3
2
2
1
3
1
1
2
3
3 2
2
3 2
1
1
1
1
10.3 Streuprozesse zweiter Ordnung
301
Zur Berechnung des Vakuumerwartungswertes müssen die letzten beiden Ergebnisse miteinander multipliziert werden. Bei allen Produkttermen außer denen ohne Erzeugungs- oder Vernichtungsoperatoren trifft entweder links ein Erzeuger oder rechts ein Vernichter auf den Vakuumzustand und führt zum Verschwinden des entsprechenden Beitrags. Daher erhalten wir schließlich (mit 001) ' ' 0'a l1 , p1 a l2 , p2 : a k1 ,q1 a k2 ,q2 a k3 ,q3 a k4 ,q4 : a l1 , p1 a l2 , p2 '0 δk1 l δq1 p δk3 l δq3 p δl1 k4 δp1 q4 δl2 k2 δ p2 q2 δk1 l δq1 p δk3 l δq3 p δl1 k2 δ p1 q2 δl2 k4 δ p2 q4 ¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
2
2
1
1
1
1
2
2
δk1 l ¼ δq1 p¼ δk3 l ¼ δq3 p¼ δl1 k2 δ p1 q2 δl2 k4 δ p2 q4 δk1 l ¼ δq1 p¼ δk3 l ¼ δq3 p¼ δl1 k4 δp1 q4 δl2 k2 δ p2 q2 2 2 1 1 1 1 2 2
.
(2) Durch Einsetzen dieses Ergebnisses in Sea ergibt sich (2) s.u. Sea
2 DFαβ (x 1 x 2 ) em 0 c2 d 4x 1 d 4x 2 i hV Ep1 Ep Ep2 Ep 1 2 (p i 1 ¼ ¼ α ¼ ¼ β u(l 1 , p1 )γ u(l 1 , p1 ) u(l 2 , p2 )γ u(l 2 , p2 ) e ¼
¼
u(l 1 , p1 )γ ¼
¼
(2)
α
(10.42)
¼
u(l2 , p2 ) u(l2¼ , p2¼ )γ βu(l1 , p1 ) ei
p1 )x 1 ( p p2 )x 2 2 h
( p p 2 ) x 1 ( p p 1 ) x 2 1 2 h
.
Dabei wurden nach der in Sea vorzunehmenden Summation über die ki und qi beim ersten und dritten Term die Umbenennungen x 1 x 2 und α β vorgenommen, die aus (9.87) für k k und x y y x folgende Eigenschaft DF βα (y x) DF αβ (x y) des Photonenpropagators sowie u 2 γ β u 2 u 1 γ α u 1 u 1 γ α u 1 u 2 γ β u 2 benutzt und damit der erste in den dritten und der zweite in den vierten Term überführt. Das letzte Ergeb(2) nis für Sea enthält daher nur noch zwei Summanden, und der von der Verdopplung der verbliebenen Summanden herrührende Faktor 2 hat sich gegen den Entwicklungskoeffizienten 1/2 herausgekürzt. (Ähnlich hebt sich bei den Übergangsamplituden n-ter Ordnung ein von gleichen Summanden herrührender Faktor n , welcher der Permutation von n Vertizes entspricht, gegen einen Entwicklungskoeffizienten 1/n weg.) (2) Die zwei in Sea verbliebenen Terme können wie folgt interpretiert werden: Im ersten beschreibt u(l1¼ , p1¼ )γ α u(l1 , p1 ) ei ( p1 p1 )¡x1 /hÆ die Vernichtung und anschließende Erzeugung des mit 1 indizierten Elektrons bei x 1 und u(l2¼ , p2¼ )γ β u(l2 , p2 ) ei ( p2 p2 )¡x2 /hÆ die Vernichtung und anschließende Erzeugung des mit 2 indizierten Elektrons bei x 2 . (2) Der entsprechende Beitrag zur Streuung Sea wird daher als direkte Streuung bezeichnet. Im zweiten Term beschreibt u(l1¼ , p1¼ )γ α u(l2 , p2 ) ei ( p1 p2 )¡x1 /hÆ die Vernichtung des mit 2 und Erzeugung des mit 1 indizierten Elektrons beim Vertex x 1 , u(l2¼ , p2¼ )γ β u(l1 , p1 ) ei ( p2 p1 )¡x2 /hÆ beschreibt die Vernichtung des mit 1 und die Erzeugung des mit 2 indizierten Elektrons beim Vertex x 2 . Dieser Beitrag zur Streuung wird als bezeichnet. Wenn man auf das Zusammenfassen der vier in ' ' Austauschstreuung 0'a l , p . . . '0 enthaltenen Terme verzichtet, läßt sich das Feynman-Diagramm (11) 1 1 der Abb. 10.8 wie in Abb. 10.12 dargestellt in vier differenziertere Diagramme zerlegen, von denen die zwei ersten die direkte und die zwei letzten die Austauschstreuung
302
10 Quantenelektrodynamik
p1¼
p2¼ p2 p2¼
=
p1¼ p1
p1
p2¼
p1¼ p2 p2¼
+
+
p1¼ p1
p2 p2
p2¼
p1¼ p1 p2¼ p1¼ p2
p1 p1
p1¼
p2¼ p1 p2¼
+
p1¼ p2
p2 p2
p1
Abb. 10.12: Zerlegung des Feynman-Diagramms für die Elektron-Elektron-Streuung in zwei Diagramme der Direktstreuung (erstes und zweites der rechten Seite) und zwei der Austauschstreu(2) ung (drittes und viertes). In Sea ist der Beitrag der direkten Streuung mit einem Pluszeichen, der der indirekten Streuung mit einem Minuszeichen versehen. Die Photonlinien sind so mit Richtungspfeilen versehen, daß an jedem Vertex Impulserhaltung gilt.
repräsentieren. Der Beitrag der direkten Streuung in (10.42) ist mit einem Pluszeichen, der der Austauschstreuung mit einem Minuszeichen versehen. Durch Benutzung der Darstellung (9.87) mit (9.88) des Photonenpropagators läßt (2) sich das für Sea erhaltene Ergebnis noch weiter vereinfachen. Mit DFαβ (x 1 x 2 ) ei
( p1¼ p1 )x 1 ( p2 p2 )x 2 h
(9.71)
d 4x 1 d 4x 2
D Fαβ (k) ei
( p p1 h k)x 1 1 h
D Fαβ (k) ei
( p1 p1 h k) x 1 h
ei
D Fαβ
p
( p ¼ p1 p p2 ) x 1 1 2 h
¼
2
d 4x 2
d 4k 4 d x1 (2π)4
δ 4 ( p2¼ p2 h k) h 4 d 4 k d 4x 1
p2 ei h (2π h )4 D Fαβ p2h p2 δ4( p1
( p p2 h k) x 2 2 h
¼
¼
d 4x 1
p2¼ p1 p2 )
für den direkten Term und dem analogen Ergebnis
DFαβ (x 1 x 2 ) ei
( p p2 )x 1 ( p p1 )x 2 1 2 h
(2π h )4 D Fαβ
d 4x 1 d 4x 2
p
1
p2 δ4 ( p 1 h ¼
¼
p2¼ p1 p2)
für den Austauschterm ergibt sich unter Weglassen des Superskripts (2) für die zweite Ordnung
i (2π h )4 δ (2p1 4
Sea
4V
¼
p2¼ p1 p2 ) Ep1 Ep1 Ep2 Ep2
Mea
mit
Mea
M1
M2
(10.43)
10.3 Streuprozesse zweiter Ordnung
303
und M1 M2
2em c2 2 p p¼ 2 0 2 , u(l1¼ , p1¼ )γ α u(l1 , p1 ) u(l2¼ , p2¼ )γ β u(l2 , p2 ) D Fαβ h h 2em c2 2 p1 p ¼ 0 2 . u(l1¼ , p1¼ )γ α u(l2 , p2 ) u(l2¼ , p2¼ )γ β u(l1 , p1 ) D Fαβ h h
Das Auftreten der δ 4 -Funktion sorgt dafür, daß zwischen ein- und auslaufenden Teilchen Erhaltung des Viererimpulses bzw. Energie- und Impulserhaltung gilt, p1α
p2α
p¼ α1
p¼ α2 .
(10.44)
Der Photonenpropagator D Fαβ hat bei direkter Streuung das Argument ( p2 p2¼ )/h, das wegen der δ 4 -Funktion dem Photonenimpuls hk p2 p2¼ p1¼ p1 entspricht, bei indirekter Streuung ist das Argument ( p1 p2¼ )/h und entspricht dem Impuls hk p1 p2¼ p1¼ p2 . Werden den Photonlinien der Feynman-Diagramme in Abb. 10.12 die dort eingetragenen Richtungen zugewiesen, so gilt an jedem Vertex Impulserhaltung: Im ersten Diagramm auf der rechten Seite der Graphengleichung z. B. gilt dann unter Berücksichtigung der Pfeilrichtungen (zum Vertex hinweisender Pfeil für einlaufende und vom Vertex wegweisender Pfeil für auslaufende Teilchen) p1 hk
p1 p1¼ p1
p1¼
bei x 1 ,
p2
p2¼ p2 p2¼
p2¼ hk
bei x 2 .
Bei den anderen Diagrammen ergibt sich die Erhaltung des Viererimpulses analog. Im ersten Diagramm transportiert das vom Vertex x 2 zum Vertex x 1 laufende virtuelle Photon den Impuls hk p2 p2¼ p1¼ p1 , der dem Elektron 2 während des Streuprozesses am Vertex x 2 verloren geht, und überträgt ihn am Vertex x 1 auf das Elektron 1. Da es sich hierbei um die Differenz p von zwei Elektronenimpulsen handelt, für die (p)(p) jeden beliebigen positiven oder negativen Wert annehmen kann (Aufgabe 10.2), ist für das virtuelle Photon der für reelle Photonen gültige Zusammenhang ω2 h 2 k k h 2 2k k2 0 E hωk h kc pc c zwischen Energie und Impuls im allgemeinen nicht erfüllt – daher der Name virtuelles Photon. Elektron-Photon-Streuung Bei der Streuwechselwirkung eines Elektrons mit einem Photon gibt es als ein- und auslaufende Teilchen je ein Elektron und ein Photon. Der Prozeß wird durch die FeynmanDiagramme (6) und (7) der Abb. 10.6 dargestellt. Diese entsprechen den Termen e2 () α ( ) β ( ) 4 4 ( ) :ψ(x 1) γ A α (x 1 ) ψ (x 1 )ψ (x 2 ) γ A β (x 2 )ψ(x 2 ): d x 1 d x 2 2 2h e2 () α () β ( ) 4 4 ( ) :ψ(x 1) γ A α (x 1 ) ψ (x 1 )ψ (x 2 ) γ A β (x 2 )ψ(x 2 ): d x 1 d x 2 2 2h
304
10 Quantenelektrodynamik
des zweiten Summanden der rechten Seite von (10.39) und zwei analogen Termen des vierten Summanden, bei denen gegenüber dem zweiten Summanden x 1 und x 2 vertauscht sind und die durch die Umbenennung x 1 x 2 in dieselbe Form gebracht werden können. In den Normalprodukten können die Fermionen- und Photonenoperatoren wegen ihrer Vertauschbarkeit voneinander getrennt werden, d. h. mit den Abkürzungen ψ(x 1 ) ψ1 etc. gilt z. B.
:ψ γ A ψ ψ 1
α
( ) 1α
( ) 1
:ψ γ ψ ψ
( ) β ( ) 2 γ A 2β ψ 2 :
α
1
( ) 1
( ) β () ( ) 2 γ ψ 2 : : A 1α A 2β : .
Weiterhin gilt (mit 1V = eine Vertauschung, 2V = zwei Vertauschungen)
:ψ ψ γ ψ γ ψ : ψ ψ γ ψ γ ψ ψ γ ψ ψ γ ψ .
:ψ 1 γ α ψ1() ψ 2( ) γ β ψ 2 :
( ) 2
2V
1
( ) β 2
1V
( ) β 1
α
2
β
1
2
α
( ) 1
( ) 1
α
1
( ) 2
1V
2
Hiermit, mit den zur Elektron-Photon-Streuung passenden Anfangs- und Endzuständen
e a b 0
a a b 0 , (λ) l, p k
l ¼ , p¼
(λ¼ ) k¼
sowie mit (9.83), (10.10) und (10.17) ergibt sich für die Übergangsamplitude (2) Sea
22eh
s.u.
2
2
i e 2mh Vμ c 2
' ( ) β ( ) () ( ) () '' 4 e'ψ 2 γ ψ2 ψ 1 γ α ψ1() A2β A1α A1α A2β a d x 1 d 4x 2
0 0 2
4
d 4x 1 d 4x 2
λ1 ,λ2 k1 ,k2 l1 ,l2 p1 , p2
0''b a a a b b a b ''0ε
u(l2 , p2 )γ β SF (x 2 x 1 )γ α u(l1 , p1 ) ωk1 ωk2 Ep1 Ep2
' ( p2 h k2 )x 2 ( p1 h k1 )x 1 (λ ) (λ ) (λ ) (λ)' (λ ) h 0'bk al , p al2 , p2al1 , p1 bk22 bk11 al,p bk '0 εβ 2 (k2 )εα(λ1 )(k1 ) ei ¼
¼
¼
(λ ) l,p k
¼
(λ1 ) l2 , p2 l1 , p1 k1
(λ2 ) (λ) l, p k k2
(λ2 ) i (λ1 ) α (k1 )εβ (k2 ) e
( p2 h k2 )x 2 ( p1 h k1 )x 1 h
.
Dabei wurden gleiche Beiträge vom vierten Summanden durch einen Faktor 2 berücksichtigt. Mit al , p al2 , p2 al1 , p1 al,p δl2 l δ p2 , p δl1 l δ p1 , p . . . ,
b b b b g b b g b b (λ ) (λ2 ) k2 k
(λ1 ) (λ) k1 k
λ2 λ
(λ ) (λ1 ) k k1
(λ2 ) (λ) k2 k
λ1 λ
... , ... ,
δk2,k g λ1 λ δk1 ,k δk1,k g λ2 λ δk2 ,k
wobei die Punkte für Terme stehen, deren Vakuumerwartungswert null ist, ergibt sich
' (λ) (λ ) (λ ) (λ)' 0'bk al , p al2 , p2al1 , p1 bk22 bk11 al,p bk '0 ' (λ) (λ ) (λ ) (λ)' 0'bk al , p al2 , p2al1 , p1 bk11 bk22 al,p bk '0
δ δ
l2 l δ p2 , p δl1 l δ p1 , p g l2 l δ p2 , p δl1 l δ p1 , p g
λ2 λ λ1 λ
δk2 ,k g λ1 λ δk1,k , δk1 ,k g λ2 λ δk2,k
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
305
(2) und durch Ausführen der Summationen in Sea u(l ¼ , p¼ )γ β SF (x 2 x 1 )γ α u(l, p) i e 2 m 0 μ0 c 4 (2) 4 4 d Sea x d x 1 2 2h V 2 ωk ωk Ep Ep ( p h k )x 2 ( p h k)x 1 ( p h k)x 2 ( ph k)x 1 h h . gλ λεα(λ )(k¼ )gλλεβ(λ)(k) ei gλ λ εβ(λ )(k¼ )gλλεα(λ)(k)ei ¼
¼
¼
¼
¼
¼
Unter Benutzung der Darstellung (9.83) mit (9.84) der Matrix SF erhalten wir daraus mit ähnlicher Rechnung wie die, welche zu (10.43) geführt hatte, (2) Sea
i
(2π)4 h 3 e2 m 0 μ0 c4 g λλ g λ λ 4 δ ( ph k p ¼ h k ¼ ) (10.45) 2V 2 ωk ωk Ep Ep u(l ¼ , p¼ )γ β SF ( p¼ h k ¼ )γ α u(l, p) εβ(λ )(k¼ ) εα(λ)(k) u(l ¼ , p¼ )γ β SF ( p¼ h k)γ α u(l, p) εα(λ )(k¼ ) εβ(λ)(k) .
Weitere Prozesse Weitere wichtige Prozesse erster und zweiter Ordnung, die hier nur erwähnt seien, jedoch nicht diskutiert werden können, sind: Bremsstrahlung, Paarerzeugung im Feld eines Atomkerns, Teilchen-Antiteilchen-Zerstrahlung, Streuung eines Elektrons an einem freien Proton und Streuung von Positronen.
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen Das Ziel dieses Abschnitts ist es, eine allgemeine Formel für den differentiellen Wirkungsquerschnitt von Zwei-Teilchen-Stößen abzuleiten, womit Wechselwirkungsprozesse mit zwei freien einlaufenden Teilchen gemeint sind. Die Formel soll sich auf die im letzten Abschnitt untersuchten Streuprozesse zweiter Ordnung zwischen zwei anfangs freien Teilchen anwenden lassen, darüber hinaus jedoch auch dann gelten, wenn einige oder alle Terme höherer Ordnung oder auch andere als elektromagnetische Wechselwirkungen mit einbezogen werden. Bei den Wechselwirkungsprozessen zweiter Ordnung der QED ist bei zwei einlaufenden Teilchen die Zahl auslaufender Teilchen immer ebenfalls gleich zwei. Werden Terme höherer Ordnung und/oder außer dem Dirac- und Maxwell-Feld noch andere Felder mit einbezogen, so kann sich die Zahl auslaufender Teilchen von der der einlaufenden Teilchen unterscheiden. Dabei können die einlaufenden Teilchen den Stoß überleben, also unter den auslaufenden Teilchen enthalten sein. Sie können beim Stoßprozeß jedoch auch vernichtet werden, so daß es sich bei den auslaufenden um ganz andere Teilchen handelt. Die ins Auge gefaßten Stoßprozesse lassen sich in Form einer chemischen Gleichung a1 a2
F n 1
en
(10.46)
306
10 Quantenelektrodynamik
darstellen, wobei der Fall des Überlebens der einfallenden Teilchen z. B. mit e1 a1 und e2 a2 eingeschlossen ist. Wir haben bei sämtlichen Streuprozessen der QED sowohl in erster als auch in zweiter Ordnung die Erhaltung des Viererimpulses festgestellt. Sie kam dadurch zustande, daß die Streuamplitude als Faktor eine δ 4 -Funktion mit der Differenz der Gesamtimpulse ein- und auslaufender Teilchen als Funktionsargument enthält. Man kann sich überlegen, daß auch in sämtlichen Termen höherer Ordnung eine entsprechende δ 4 -Funktion auftreten muß. Die Erhaltung des Viererimpulses läßt sich jedoch auch einsehen, ohne in die Details der Störungsrechnung zu gehen. Die Hamilton-Dichte (9.5) der QED ist für Stoßprozesse der betrachteten Art, an denen keine externen Felder beteiligt sind, raumzeitlich translationsinvariant. Für diesen Fall wurde in (7.97) ein Energie- und Impulserhaltungssatz abgeleitet. Dieser gilt zunächst nur für die noch nicht quantisierte Feldtheorie. In der Quantenfeldtheorie läßt sich daraus ein Erhaltungssatz für die Mittelwerte der entsprechenden Operatoren ableiten. Etwas einfacher läßt sich dieses Ergebnis auch durch2Betrachten der Energie allein erzielen. Aus (7.96a) ergibt sich der Energieoperator H d 3x , und H ist mit bei den betrachteten Stoßprozessen nicht explizit zeitabhängig. Damit folgt nach (Q3.120) dH dt
0∂H 1
∂t
0
und
H
const .
(10.47)
Als Anfangszustand limτ ψ, τ haben wir einen Zustand a betrachtet, in dem die beiden einlaufenden Teilchen durch Ebene-Welle-Lösungen beschrieben werden. Es handelt sich dabei um einen Eigenzustand des Operators H , in dem sowohl die Einzelenergien und Einzelimpulse der beiden einlaufenden Teilchen als auch deren Gesamtenergie E a und Gesamtimpuls Pa scharfe Werte besitzen, in ihm gilt H E a . Der ψ, τ , in den der Anfangszustand a durch die WechselwirZustand ψe limτ kung überführt wird, hängt mit dem Anfangszustand a nach (9.23) und (9.91a) gemäß
ψe
ψ, τ Sa
S lim τ
zusammen. Er kann nach Ebene-Welle-Zuständen e für F auslaufende Teilchen entwickelt werden, d. h. ψe e e ψe e e S a . e
e
Aus (10.47) folgt Ea
a H a ψe H ψe .
(10.48)
Da ψe im Gegensatz zum Anfangszustand im allgemeinen aus vielen Ebene-WelleLösungen superponiert ist, folgt hieraus noch nicht die bei der Störungsrechnung in erster und zweiter Ordnung gefundene Energieerhaltung E a E e bei den Einzelübergängen e S a . Mit ∂ H /∂t 0 und d H /dt 0 folgt jedoch 2 d ( H H )2 d H2 d H2 d H 2 ∂H2 H , H 0, dt dt dt dt ∂t
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
307
d. h. auch die Streuung der Energie bleibt bei der Wechselwirkung unverändert. Da sie im Anfangszustand a verschwindet, muß sie das auch in dem aus Wellenlösungen e mit scharfen Energiewerten E e superponierten Endzustand ψe tun, d. h. die Energien E e der verschiedenen Realisierungen des Endzustands müssen übereinstimmen und wegen (10.48) gleich der Anfangsenergie E a sein, Ea
Ee .
Jetzt betrachten wir die Differenz P α Peα Paα der Vierervektoren des Gesamtimpulses der Ebene-Wellenlösungen a und e, Paα
2
α pa,n ,
Peα
n 1
F
α pe,n .
(10.49)
n 1
Aus P 0 (E e E a )/c und E a E e folgt P 0 0. Wegen der vorausgesetzten raumzeitlichen Translationsinvarianz gilt das in jedem beliebigen Inertialsystem, aus dem der Stoßprozeß beobachtet wird. Als Differenz zweier Vierervektoren ist auch P α ein Vierervektor, dessen Nullkomponente in jedem beliebigen Inertialsystem verschwindet. In der Speziellen Relativitätstheorie, Abschn. „Sätze über Tensoren und LorentzTransformation“, Satz 4 wurde gezeigt, daß ein Vektor der Nullvektor ist, wenn eine seiner Komponenten in allen Inertialsystemen verschwindet. Aus P 0 0 folgt also P α 0 bzw. Peα
Paα .
(10.50)
Wir nehmen im folgenden für alle ins Auge gefaßten und durch die Reaktionsgleichung (10.46) beschriebenen Streuprozesse die für die Gültigkeit von (10.50) vorausgesetzte raum-zeitliche Translationsinvarianz als gegeben an. Übergangsamplituden. Die Entwicklung (10.11) legt es nahe, die Zerlegung S 1V vorzunehmen, womit die Übergangsamplituden mit e a δea in Sea δea e V a aufspalten. Der erste Term δea liefert nur einen Beitrag zur Amplitude des Übergangs a a , bei dem die Erhaltung des Viererimpulses automatisch garantiert ist. Bei den Übergängen a e a können diese durch einen in e V a enthaltenen Faktor δ 4 (Pe Pa ) wie in (10.20), (10.43) und (10.45) erzwungen werden. Es ist für die weitere Rechnung bequem, in Analogie zu diesen Gleichungen auch noch weitere Faktoren herauszuziehen und für e a Sea
4 4 i (2π h) δ (Pe Pa ) Mea
2 +
F + 1 1 2V E n n 1 2V E ¼ n
(10.51)
n 1
¼
¼
anzusetzen. (Die Produktfaktoren sind so gewählt, daß sie die V -Abhängigkeit der Reihenentwicklungen für ein- und auslaufende Teilchen erfassen, vgl. (10.8)–(10.10). Damit Sea wie zu fordern dimensionslos wird, muß Mea eine entsprechende, von F abhängige Dimension besitzen.)
308
10 Quantenelektrodynamik
Für die Übergangsrate wea w P P (mit Paα E a /c, P und Peα E e /c, P ) erhalten wir mit der Darstellung (9.71) der δ 4 -Funktion ähnlich wie in Abschn. 10.2.2 ¼
wP
P¼
lim τ
2
τ
V
(10.51)
Sea
lim Sea τlim
τ V
V
(2π h) Mea δ (Pe Pa )
8
2 4
2 +
n 1 s.u.
4 2 4 (2π h) cV Mea δ (Pe Pa )
Sea
τ
τ/2 2 τ/2 V ei ( P P )x/h (2πd xh )
2
F 1 + 1 lim 2V E n 2V E n Vτ n
2 +
n 1
1
e
4
a
4
τ
F + 1 1 , 2V E n 2V E n n
1
wobei die V -Terme trotz V stehen gelassen wurden – sie werden später gegen andere V -Terme weggekürzt. Die gesamte Übergangsrate zu Ebene-Welle-Zuständen 8 im Element d 3F P n d 3 pn des Impulsraums für F Teilchen ist
dWP
d 3F P
P
wP
F +
d N( pn )
(10.31),(10.32a)
wP
P
n 1
F + V d 3 pn 3 (2π h)
n 1
oder nach Einsetzen des letzten Ergebnisses dWP
d 3F P
(2π h) cV Mea δ (Pe Pa ) 4
2
4
2 +
n 1
F + d 3 pn 1 . (10.52) 3 2V E n (2π h) 2E n n
1
Als differentieller Wirkungsquerschnitt folgt aus ihr analog zu (10.34) dσ
d W P d 3F P jeinf
4 2 (2π h) cV Mea
2 F + d 3pn δ 4 (Pe Pa ) + 1 . 3 jeinf 2V E n (2π h) 2E n
n 1
n
1
Im Ruhesystem des zweiten Teilchens ist der Fluß der einfallenden Teilchen mit n 1/V durch Ú1 jeinf n Ú1 V gegeben. Mit p1α E 1 /c, p1 und p2α m 02c, 0 gilt in diesem System ( p1 p2 )2 m 201 c2 m 202 c2
m 201 c2 m 202 c2
m 201 c2 m 202 c2 v 12 /c2
und hieraus folgt v1
E 12 c2
1 v 12 /c2
m 201 c2 1 v 12 /c2
E 12 m 202 v 12 , c2
( p1 p2 )2 m 201 c2 m 202 c2 E 1 m 02
c.
m 201 c2 m 202 c2
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
309
Dieses mit klassischer Rechnung erhaltene Ergebnis kann ähnlich wie (10.35) auch quantentheoretisch abgeleitet werden. Für den differentiellen Wirkungsquerschnitt ergibt sich mit ihm F 4 2 4 d 3pn¼ s.u. (2π h) Mea δ (Pe Pa ) + dσ . (10.53) 3 ¼ 4c2 ( p1 p2 )2 m 201 c2 m 202 c2 n 1 (2π h) 2E n Dabei wurde zuletzt noch die im Ruhesystem des zweiten Teilchens gültige Beziehung E 2 m 02 c2 benutzt. Dieses zunächst nur für das Ruhesystem des zweiten Teilchens abgeleitete Ergebnis ist allgemein gültig, da es Lorentz-invariant ist. Beweis: Daß die δ 4 -Funktion Lorentz-invariant ist, folgt aus ihrer Darstellung (9.71), für Mea folgt die Lorentz-Invarianz aus der Ableitung aus Lorentz-invarianten Ausdrücken (z. B. (10.25b,c) und (10.43b)), und die Lorentz-Invarianz des Nenners von dσ ist offensichtlich. Mit der Definition * Θ( p0 )
0
für
p0 < 0
1
für
p0 > 0
(10.54)
für die Sprungfunktion Θ( p0 ) folgt die Lorentz-Invarianz der Faktoren d 3 pn /(2E n ) aus der Umrechnung d 3p 2E
d 3 p d p0 d 4p δ( p0 E/c) δ( p0 E/c) δ( p0 E/c) Θ( p0 ) 2cp0 2cp0
4 d 4p δ( p0 E/c) δ( p0 E/c) (8.93) d p Θ( p0 ) δ p pm 20 c2 Θ( p0 ) . c 2E/c 2E/c c
d 4 p, p p und δ( p pm 20 c2 ) sind offensichtlich Lorentz-invariant, und für Θ( p0 ) gilt das ebenfalls mit folgender Begründung: Weil die Energie in allen Inertialsystemen positiv ist, folgt für alle Systeme p0¼ >0 aus p0 >0 und damit Θ( p0¼ )Θ( p0 ) .
Das Ergebnis (10.53) kann noch vereinfacht werden, wenn man in das Schwerpunktsystem der Teilchen geht, in dem p1 p2 Pa Pe 0 gilt. Mit p1 p2 p und m 20i c2 E i2 /c2 pi2 E i2 /c2 p2 für i 1, 2 ergibt sich in diesem ( p1 p2 )2 m 201 c2 m 202 c2
E1 E2 c2
2
p1 p2
m 201 c2 m 202 c2
E 12 E 22 E 12 E 22 2E 1 E 2 2 4 p p c4 c2 c4 2 E1 E2 p , c
E 12 E 22 2 p p4 c2
und Einsetzen dieser Beziehung in Gleichung (10.53) liefert schließlich als differenti-
310
10 Quantenelektrodynamik
ellen Streuquerschnitt im Schwerpunktsystem
dσ
F (2π h)4 Mea 2 δ 4 (Pe Pa ) + d 3 pn¼ . 4c (E 1 E 2 ) p (2π h)3 2E n¼
(10.55)
n 1
Für den Spezialfall von nur zwei auslaufenden Teilchen folgt daraus mit Pe p1¼ p2¼ , Pa 0 und δ 4 (Pe Pa )δ 3 ( Pe Pa )δ(E e /c E a /c)cδ 3 ( p1¼ p2¼ ) δ(E 1¼ E 2¼ E 1 E 2 ) dσ
Mea
2 δ 3 ( p¼ p¼ )δ(E ¼ E ¼ E E ) 1 2 1 2 1 2 16 (2π h)2 (E 1 E 2 ) p
d 3 p1¼ d 3 p2¼ . E 1¼ E 2¼
Die Deltafunktionen bringen zum Ausdruck, daß p1¼ und p2¼ bzw. E 1¼ und E 2¼ nicht unabhängig voneinander gewählt werden können. Wir führen daher die zu deren Auswertung notwendigen Integrationen aus, was durch Integration über p2¼ und E 1¼ E 2¼ geschehen kann. Nach der Integration über p2¼ muß p2¼ p1¼ gesetzt werden, mit der Umbenennung p1¼ p¼ haben wir d 3p1¼
d 3 p¼
2
¼
p
d p¼ dΩ ¼ ,
(10.56)
aus 2 4 2 4 E 1¼ 2 p1¼ 2 c2 m ¼01 c p¼ 2 c2 m ¼01 c ,
folgt ¼
¼
p d p
und hieraus
d(E 1¼ E 2¼ )
1 1 E 1¼ E 2¼
2 4 2 4 E 2¼ 2 p2¼ 2 c2 m ¼02 c p¼ 2 c2 m ¼02 c
E 1¼ d E 1¼ c2
E 2¼ d E 2¼ c2
c 2 p¼ d p¼
E 1¼ E 2¼ 2 ¼ c p d p¼ . E 1¼ E 2¼
Damit ergibt sich aus (10.56) ¼
d 3 p1¼
d 3 p¼
¼
¼
p E1 E2
c2 (E 1 E 2¼ ) ¼
dΩ ¼ d(E 1¼ E 2¼ ) .
(10.57)
Durch Einsetzen dieses Ergebnisses in den durch Integration von dσ über p2¼ erhaltenen Ausdruck und Integration über E 1¼ E 2¼ bekommen wir den Wirkungsquerschnitt d σ dΩ
¼
2 δ(E ¼ E ¼ E E ) p¼ 1 2 1 2 16 (2π h)2 c2 (E 1 E 2 ) p
Mea
2 ¼ ¼ d(E 1¼ E 2¼ ) Mea p dΩ . ¼ ¼ (E 1 E 2 ) 16 (2π h)2 c2 (E 1 E 2 )2 p
Mit der Umbenennung d σ dσ und nach Teilen durch dΩ ¼ wird daraus schließlich dσ dΩ ¼
2
¼
Mea p
(8π hc)2 (E 1 E 2 )2 p
.
(10.58)
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
311
Beispiel 10.1: Elektron-Elektron-Streuung Wir wollen Gleichung (10.58) auf die Elektron-Elektron-Streuung anwenden und bestimmen dazu als erstes die Winkelabhängigkeit der in (10.43) angegebenen Übergangsmatrix Mea . Zunächst gilt Mea 2 M1 2 M2 2 2 Re (M1 M2 ) . Wie in Abschn. 10.2.2 nehmen wir an, daß die einfallenden Elektronenstrahlen unpolarisiert sind, so daß jede der beiden Polarisationsrichtungen mit dem statistischen Gewicht 1/2 vertreten ist. Außerdem soll bei der Messung des Wirkungsquerschnitts keine spezielle Polarisationsrichtung herausgefiltert werden, so daß die Übergangswahrscheinlichkeiten zu Endzuständen verschiedener Polarisationsrichtung summiert werden müssen. Die gesamte Übergangsrate ist dann die Summe der Übergangsraten zwischen allen Polarisationen der Anfangs- und Endzustände, versehen mit dem Gewichtsfaktor 1/2 für jeden der beiden einfallenden Elektronenstrahlen, Mea 2
2
1 4
M1 2 M2 2 2 Re (M1 M2
M1 2 M2 2 2 Re (M1 M2 ) .
l1 ,l2 ,l1 ,l2 1 ¼
¼
(10.59) Zur Berechnung von M1 2 M1 M1 benutzen wir (9.88), (10.43), γα gαβ γ β , bei der Auswertung von M1 die Tatsache, daß u γ β u ein Skalar ist, und die Beziehung uγ β u
u γ β u ,
(10.60)
die in Aufgabe 10.3 bewiesen wird. Indem wir vorerst die Abkürzung k ( p2 p2 )/h beibehalten, bekommen wir M1 2
1 4
2em 0 c2 h
4
hμ 0c k k i ε
2
u(l1 , p1 )γ α u(l1 , p1 ) u(l2 , p2 )γα u(l2 , p2 )
l1 ,l2 ,l1¼ ,l2¼
u(l1 , p1 )γ β u(l1 , p1 ) u(l2 , p2 )γβ u(l2 , p2 )
s.u. 1.
em 0 c2 4 h
4
hμ 0c k k i ε
2
u(l1 , p1 )γ β u(l1 , p1 ) u(l1 , p1 )γ α u(l1 , p1 )
l1 ,l2 ,l1 ,l2 ¼
¼
s.u. 2.
4
em 0 c2 h
4
hμ 0c k k i ε
2 Sp
γ β u(l1 , p1 ) u(l1 , p1 )γ α u(l1 , p1 ) u(l1 , p1 )
l1 ,l ¼
Sp
u(l2 , p2 )γβ u(l2 , p2 ) u(l2 , p2 )γα u(l2 , p2 )
1
γβ u(l2 , p2 ) u(l2 , p2 )γα u(l2 , p2 ) u(l2 , p2 ) .
l2 ,l2¼
Dabei wurden in dem mit 1. bezeichneten Schritt die Skalare u(l1 , p1 )γ β u(l1 , p1 ) und u(l2 , p2 )γβ u(l2 , p2 ) verschoben, und in dem mit 2. bezeichneten Schritt wurde u Nv
4
ij 1
u i Ni j v j
4
ij 1
Ni j v j u i
Sp(Nvu)
312
10 Quantenelektrodynamik
mit v γ α u und N γ β u ¼ u ¼ sowie Sp A Sp B Sp(A B) benutzt. Unter Verwendung der Beziehungen (8.195), k ( p2 p2¼ )/h und Sp A/(2m 0 c)4 )(Sp A)/(2m 0 c)4 ergibt sich daraus schließlich M1 2 Sp γ β (/p1¼ m 0 c) γ α (/p1 m 0 c) Sp γβ (/p2¼ m 0 c) γα (/p2 m 0 c) , (10.61) 2 2 4 ( p2 p2¼ )( p2 p2¼ ) h e2 μ0 c3 wobei im Nenner i ε h 2 weggelassen wurde, weil herleitungsgemäß der Limes ε 0 zu nehmen ist und dieser bereits hier ausgeführt werden kann. Nach (10.43) geht M2 aus M1 durch die Vertauschungen p1 p2 und l 1 l2 hervor, und weil die l i aus dem zuletzt erhaltenen Ergebnis aufgrund der erfolgten Summationen herausgefallen sind, haben wir ' M2 2 M1 2 '' . (10.62) Mit
p1
°p
2
¼ ¼
¼ ¼ ¼ ¼ ¼ ¼ u(l2, p2) γ β u(l1¼ , p1¼ ) u(l1¼ , p1¼ ) γ α u(l1 , p1) u(l1, p1) γβ u(l2¼ , p2¼ ) u(l2¼ , p2¼ ) γα u(l2, p2) Sp γ β u(l1¼ , p1¼ ) u(l1¼ , p1¼ ) γ α u(l1 , p1) u(l1, p1) γβ u(l2¼ , p2¼ ) u(l2¼ , p2¼ ) γα u(l2 , p2) u(l2, p2)
u(l1 , p1 ) γ α u(l1 , p1 ) u(l2 , p2 ) γα u(l2 , p2 ) u(l2 , p2 ) γ β u(l1 , p1 ) u(l1 , p1 ) γβ u(l2 , p2 )
ergibt sich analog
£
Re(M1 M2 ) 2 h e2 μ0 c3
£
Sp γ β (/ p1 m 0 c) γ α (/ p1 m 0 c) γβ (/ p2 m 0 c) γα (/ p2 m 0 c) . 4 ( p2 p2 )( p2 p2 ) ( p1 p2 )( p1 p2 )
¼
¼
¼
¼
¼
¼
(10.63)
(M2 enthält ein Minuszeichen.) Zur weiteren Auswertung benutzen wir die Beziehungen β Sp γ β (/ p1 m 0 c) γ α (/ p1 m 0 c) 4 g αβ m 20 c2 p1α p1 β p1 p1 α g αβ p1 p1
¼
¼
¼
¼
und Sp γ β (/ p1 m 0 c) γ α (/ p1 m 0 c) γβ (/ p2 m 0 c) γα (/ p2 m 0 c) 16 2m 40 c4 m 20 c2 p1 p1 m 20 c2 ( p1 p1 )( p2 p2 ) m 20 c2 p2 p2 2 p1 p2 p1 p2 ,
¼
¼
¼
¼
¼
¼
¼ ¼
die in den Aufgaben 10.4–10.7 bewiesen werden. Mit diesen ergibt sich zunächst αβ m 2 c2 pα p β pβ p α g αβ p p g m 2 c2 p p 4 g p p g p p 2 αβ αβ 1 1 M1 1 1 1 1α 1β 1β 1α 1 1 1 0 0 2 2 2 3 p ) ( p p ) ( p h e μ0 c 2 2 2 2 8 2m 40 c4 m 20 c2 ( p1 p1 p2 p2 ) p1 p2 p1 p2 p1 p2 p1 p2 , 2 ( p2 p2 )( p2 p2 )
¼
¼
¼
¼
¼
¼
¼
¼ ¼ ¼
¼
¼
¼
¼
¼ ¼
woraus nach (10.62)
M2 2
(h e2μ0 c3 )2
8 2m 40 c4 m 20 c2 ( p1 p2 p1 p2 ) p1 p2 p1 p2 p1 p1 p2 p2 2 ( p1 p2 )( p1 p2 )
¼
¼
¼
¼
¼ ¼
¼
¼
10.4 Wirkungsquerschnitt von Zwei-Teilchen-Stößen
folgt, sowie 4 Re(M1 M2 ) 2 he2μ0 c3
2m
313
4 c4m 2 c2p p m 2 c2 ( p p )( p p )m 2 c2p p 2 p p p p 1 1 1 2 2 2 1 2 1 2 0 0 0 0 1 2
( p2 p2 )( p2 p2 ) ( p1 p2 )( p1 p2 )
.
Zur weiteren Rechnung gehen wir ins Schwerpunktsystem. In diesem gilt p1 p2 p , m 20 c4 p12 c2 m 20 c4 p2 c2 E 2 E , m 20 c4 p1 2 c2 m 20 c4 p 2 c2 E 2 E ,
p1
p2
E1
E1
p,
und wegen der Energieerhaltung, die aus dem Auftreten der δ 4 -Funktion in (10.43) folgt, ergibt sich hieraus 2E E 1 E 2 E 1 E 2 2E mit der Folge E1
E2
E1
E2
E,
p p .
(10.64)
Mit diesen Ergebnissen und p p
p p cos ϑ
(10.64)
p2 cos ϑ ,
(10.65)
wobei ϑ den von p und p eingeschlossenen Winkel bezeichnet, erhalten wir p1 p1
E 2 /c2 p1 p1
m 20 c2 p2 (1 cos ϑ) p2 p2 ,
p1 p2
E 2 /c2 p1 p2
m 20 c2 2 p2
p1 p2
E 2 /c2 p1 p2
m 20 c2 p2 (1 cos ϑ) p1 p2 ,
( p1 p2 )( p1 p2 )
( p1 p
2)
2
( p1 p
( p2 p2 )( p2 p2 )
( p2 p2 )
2
2 p
1)
2
p1 p2 ,
2 p
2 (1 cos ϑ) ,
2 (1 cos ϑ) .
Einsetzen dieser Beziehungen in die zuletzt erhaltenen Ausdrücke für M2 2 , M2 2 und Re(M1 M2 ) liefert mit p p p1 p p2 p p1 p p p für p1 p2 M1 2
M2 2
2 2 (m 2 c2 p2 )2 3 p4 2 p2 (2m 2 c2 p2 ) cos ϑ p4 cos2 ϑ 0 0 2 he2μ0 c3 , p4 (1 cos ϑ)2 ' 2 m 4 c4 4 p4 ' 0 M1 2 ' und Re(M1 M2 ) 2 he2μ0 c3 . cos ϑ cos ϑ p4 sin2 ϑ
Mit diesen Ergebnissen folgt aus (10.59) nach Umwandlung von cos ϑ in sin ϑ 4 3 2 3m 40 c4 12m 20 c2 p2 8 p4 4(m 20 c2 2 p2 )2 2 3 Mea 2 4 he μ0 c . 1 p4 sin2 ϑ p4 sin4 ϑ Wird dies in Gleichung (10.58) eingesetzt, so ergibt sich schließlich mit (10.64) als differentieller Wirkungsquerschnitt der Elektron-Elektron-Streuung dσ dΩ ¼
3 3m 40 c4 12m 20 c2 p2 8 p4 α hc 2 1 2E p4 sin2 ϑ
4(m 20 c2 2 p2 )2 p4 sin4 ϑ
4 .
(10.66)
314
10 Quantenelektrodynamik
Er wurde zuerst von C. Møller abgeleitet, weshalb die durch ihn beschriebene Streuung oft als Møller-Streuung bezeichnet wird. Im nicht-relativistischen Grenzfall gilt p2 m 20 c2 sowie E m 0 c2 , und das Ergebnis reduziert sich auf α 2 h 2 m 20 c2 4 3 dσ dΩ ¼ 4 p4 sin4 ϑ sin2 ϑ α 2 h 2 m 20 c2 1 1 1 . (10.67) 16 p4 sin4 ϑ/2 cos4 ϑ/2 sin2 ϑ/2 cos2 ϑ/2
Die zwei ersten Terme der letzten Klammer entsprechen dem Ergebnis (Q4.176) für die Streuung eines Elektrons an einem festen Coulomb-Potential, dσ/dΩ sin 4 ϑ/2: Im Schwerpunktsystem fällt das erste Elektron unter einem Winkel ein, der gegenüber dem Einfallswinkel des zweiten um π gedreht ist, weshalb in der Streuformel ein Beitrag sin 4 ϑ/2 für das eine und ein Beitrag sin 4 (π ϑ)/2 cos 4 ϑ/2 für das andere Elektron auftritt. Der letzte Klammerterm ist ein Interferenzterm. Im ultra-relativistischen Grenzfall gilt p2 m 20 c2 sowie E p c, und aus (10.66) ergibt sich dσ α2h 2 1 2 4 α2h 2 1 1 . (10.68) 1 dΩ ¼ 4 sin2 ϑ p2 4 p2 sin4 ϑ sin4 ϑ/2 cos4 ϑ/2
Da Positronen bis auf die Ladung die gleichen Eigenschaften wie Elektronen besitzen und sich wie diese paarweise abstoßen, gelten die abgeleiteten Formeln auch für die Streuung zweier Positronen.
Beispiel 10.2: Elektron-Photon-Streuung Die Rechnungen, die von der Übergangsamplitude (10.45) der Elektron-Photon-Streuung zum zugehörigen differentiellen Wirkungsquerschnitt führen, sind ebenso aufwendig, jedoch ähnlich wie bei der Elektron-Elektron-Streuung und werden aus Platzgründen nicht vorgeführt. Unter der Annahme, daß der einfallende Elektronen- und Photonenstrahl unpolarisiert sind und daß bei der Streumessung keine spezielle Polarisationsrichtung herausgefiltert wird, ergibt sich als differentieller Wirkungsquerschnitt der auch als Compton-Streuung bezeichneten Streuung des Photons an einem Elektron im Ruhesystem des Elektrons k 2 (10.69) k¼ sin ϑ . Dabei ist ϑ der Ablenkungswinkel des Photons, d. h. k k ¼ k k ¼ cos ϑ, und als Folge der durch 4 dσ dΩ ¼
1 2
αh c 2 k¼ 2 k¼ k k m 0 c2
die δ -Funktion in (10.45) zum Ausdruck kommenden Energie-Impuls-Erhaltung gilt k k¼ 1h k(1cos ϑ)/(m 0 c)
(10.70)
als relativistische Verallgemeinerung der klassischen Beziehung (Q2.25) (Aufgabe 10.8). Im Grenzfall kleiner Photonenenergien bzw. -impulse, h ω m 0 c2 bzw. h k m 0 c, folgt aus (10.70) k ¼ k , und aus (10.69) wird damit dσ 1 αh c 2 2ϑ . sin (10.71) 2 dΩ ¼ 2 m 0 c2
10.5 Teilchenzerfälle
315
Die Integration über den Raumwinkel dΩ ¼ sin ϑ dϑ dϕ, π 1 α hc 2 2π 2 2 σ dϕ sin ϑ sin ϑ dϑ , 2 m 0 c2 0 0 liefert den sogenannten Thomson-Streuquerschnitt σ
8π 3
α hc 2 . m 0 c2
(10.72)
Für sehr hohe Photonenenergien, h k m 0 c, gilt zunächst exakt ¼
k k
1 1(1 cos ϑ)/ε
ε 1ε cos ϑ
ε
mit
m0 c h k
1.
sin2 ϑ und k ¼ / k können dann gegen k / k ¼ vernachlässigt werden, und es ergibt sich genähert 1 α hc 2 k ¼ 1 α hc 2 ε dσ (10.73) dΩ ¼ 2 m 0 c2 k 2 m 0 c2 1ε cos ϑ sowie σ
πε
α hc 2 π sin ϑ z cos ϑ dϑ m 0 c2 0 1ε cos ϑ
oder σ
1 πα 2 h dz m 0 c k 1 1εz
2 πα 2 h ln m 0 c k ε
πα 2 h 2h k . ln m 0 c k m0c
(10.74)
10.5 Teilchenzerfälle Die Überlegungen des letzten Abschnitts gelten auch für den Zerfall eines Teilchens. Als einlaufende Teilchen hat man in diesem Fall nur ein einziges, und wir betrachten im folgenden nur den durch die chemische Gleichung a
e1
e
(10.75)
2
beschriebenen Spezialfall, daß ein Teilchen in8zwei zerfällt. Aus Gleichung (10.52) ergibt sich in diesem mit P p1 p, E 1 E, n (2V E n )1 1/(2V E) und einer wie im letzten Abschnitt vorgenommenen Zerlegung der δ 4 -Funktion im Schwerpunktsystem des zerfallenden Teilchens ( p 0 und E m 0 c2 )
d W pd 3F P
p p) δ(E E E) d p d p M c δ ( p8(2π E E h ) E p ) δ(E E m c ) d p d p M δ ( p 8(2π . E E h ) m ea
¼
2 2
3
1
2
1
3
2
2
ea
2
1
3
1
2
1
2
3
1
0
2
0
2
3
2
3
1
1
2
2
2
316
10 Quantenelektrodynamik
Die durch die Deltafunktionen bewirkten Einschränkungen können wie im letzten Abschnitt durch Integration über p2¼ und E 1¼ E 2¼ explizit berücksichtigt werden und
p führen mit (10.56), (10.57), p¼ p1¼ p2¼ und der Bezeichnung dΓ d W dΓ
2 Mea2 2 p2 4 dΩ . 32π h m 0 c
d 3F P ¼
zu
(10.76)
Dabei ist p als Lösung der Gleichung E 1 E 2 m 0 c2 bzw. m01 2 c2
p 2
p 2 m 0 c
m02 2 c2
(10.77)
zu bestimmen und durch
p m20c
1
m 01 2 m 02 2 m 02 m 02
2
2
m 01 2 m02
m 02 2 m 02
(10.78)
gegeben. Mea kann bei spinbehafteten Teilchen winkelabhängig sein. Im allgemeinen wird man diese Winkelabhängigkeit jedoch durch Mittelung über alle Spinrichtungen des zerfallenden und Summation über alle Spinrichtungen der beim Zerfall entstehenden Teilchen eliminieren. Der in (10.78) angegebene Wert von p ist ebenfalls winkelunabhängig. Das spingemittelte dΓ kann daher über dΩ integriert werden und ist mit 2 dΩ 4π durch
Γ
2 Mea2 2p 4 8π h m 0 c
(10.79)
gegeben, wobei für p die rechte Seite von (10.78) einzusetzen ist. Γ wird als Zerfallsbreite bezeichnet, manchmal stattdessen auch G h Γ (Folge: statt (10.80) gilt dann 2 τ h /G). Γ d W p d 3F ist die Gesamtwahrscheinlichkeit pro Zeitintervall dt für den Übergang des Teilchens a in die Zerfallsprodukte e1 und e2 und ist zeitunabhängig. Nach der Zeit t ist die Wahrscheinlichkeit für den Übergang daher W (t)Γ t, und für t τ mit τ
1 Γ
(10.80)
wird W 1. (Da der Ausgangszustand als nicht normierbare Welle angesetzt wurde, beschreibt er nicht ein Teilchen, sondern einen Teilchenstrom, also viele Teilchen. Aus vielen anfänglichen Teilchen können durch Zerfall daher viele Teilchenpaare entstehen, und daher kann W (t) größer als eins werden.) τ ist die Zeit, nach der die Wahrscheinlichkeit für die Erzeugung eines Teilchenpaares und damit den Zerfall eines Ausgangsteilchens gleich eins wird und kann daher als statistische Lebensdauer des zerfallenden Teilchens angesehen werden.
10.6 Feynman-Regeln
317
10.6 Feynman-Regeln Meßbare Konsequenzen der Quantenfeldtheorie von Teilchenwechselwirkungen ergeben sich bei Teilchenstößen aus dem durch (10.55) bzw. (10.58) gegebenen differentiellen Wirkungsquerschnitt und bei Teilchenzerfällen aus der mittleren Lebensdauer bzw. der durch (10.79) gegebenen Zerfallsbreite. In beiden Fällen benötigt man das Übergangselement Mea bzw. die mit diesem gemäß (10.51) zusammenhängende Übergangsamplitude Sea . Für deren Berechnung erwiesen sich die zugehörigen FeynmanDiagramme in allen bislang betrachteten Fällen als außerordentlich nützlich, weil sie in übersichtlicher Weise graphisch darstellen, welche ein- und auslaufenden Teilchen beteiligt sind und welche virtuellen Teilchen bei internen Wechselwirkungen auftreten. R. Feynman hat herausgefunden, daß sich aus den Diagrammen mit Hilfe von heute nach ihm benannten Feynman-Regeln, welche den einzelnen Diagrammelementen bestimmte mathematische Ausdrücke zuordnen, die Formeln zur Berechnung von Sea ablesen lassen. Die meisten dieser Regeln können für den uns hier ausschließlich interessierenden Fall der Quantenelektrodynamik aus den bisher betrachteten Beispielen abgeleitet werden. Im folgenden werden sie jedoch gleich systematisch zusammengestellt, und ihre Richtigkeit wird anschließend anhand früher behandelter Beispiele überprüft. Regeln, die nicht aus dem Vorangegangenen folgen, werden im Nachhinein bewiesen. Wir sind bei konkreten Beispielen so vorgegangen, daß wir zuerst Sea durch die Zustände ein- und auslaufender Teilchen sowie orts- und zeitabhängige Operatoren ausgedrückt haben. Für diese Ortsdarstellung gibt es Feynman-Regeln im Ortsraum. Werden die Operatoren nach ebenen Wellen entwickelt, wie wir es später getan haben, so gibt es für die dabei erzielten Ausdrücke Feynman-Regeln im Impulsraum. Hier hängen die Regeln noch davon ab, ob nach einem Kontinuum oder nach einem vollständigen Satz diskreter ebener Wellen entwickelt wird. Die im folgenden angegebenen Regeln beziehen sich auf den zuletzt genannten Fall.
10.6.1 Feynman-Regeln der QED im Impulsraum •
Ein Streu- oder Zerfallsprozeß wird eindeutig durch Anzahl und Art der ein- und auslaufenden Teilchen festgelegt. Die zugehörige Übergangsamplitude ist eine Reihe ½ (n) Sea . Sea δea n 1
•
Zur Amplitude der n-ten Ordnung tragen alle Feynman-Diagramme bei, deren einund auslaufende Linien die ein- und auslaufenden Teilchen des betrachteten Prozesses beschreiben können. Berücksichtigt werden alle topologisch voneinander verschiedenen Feynman-Diagramme n-ter Ordnung. Zu jedem von diesen gehört eine (mn) (n) Teilamplitude Sea , deren Summe Sea ergibt, (n) Sea Sea(mn) . m
318
10 Quantenelektrodynamik einlaufend m 0 c2 u(l, p) V Ep m 0 c2 v(l, p) V Ep
Elektron Äußere Linien
Positron Photon
i (2π h)
Vertex
Innere Linien
hμ0 c2 λλ (λ) g εα (k) 2V ωk 4
auslaufend m 0 c2 u(l ¼ , p¼ ) V Ep m 0 c2 v(l ¼ , p¼ ) V Ep ¼
¼
hμ0 c2 λ λ (λ ) ¼ g εα (k ) 2V ωk ¼
¼
¼
¼
e α 4 ¼ γ δ p p q h
Fermion i
h( q/ m 0 c) d 4q d 4q .. S (q).. i F 4 4 (2π h) (2π h) q q m 20 c2 i ε 4 hμ0 c d 4q d k D (k).. i gαβ .. Photon i Fαβ 4 (2π) (2π h)4 q q/h 2 i ε
Tabelle 10.5: Die Impulse ein- und auslaufender Teilchen sind mit p bzw. p¼ , die virtueller Teilchen mit q bezeichnet. Auf einen Vertex zugerichtete Impulse werden negativ, von ihm weggerichtete Impulse positiv gezählt. Daher geht der Impuls q virtueller Teilchen am einen Vertex mit q und an dem zugehörigen Nachbarvertex mit q ein. Der obere Index der dem Vertex zugeordneten Matrix γ .. wird mit einem der Indizes des Faktors gαβ der am Vertex einmündenden Photonlinie verjüngt. Der Faktor g λλ bei den äußeren Photonlinien ist auf die Normierung (8.115) der (reellen) Wellenamplituden εα (λ) zurückzuführen. (Es gibt auch Darstellungen mit anderer Normierung, bei denen dieser Faktor entfällt.) Die Pünktchen am Ende der Integrale für die inneren Linien sollen andeuten, daß noch Terme folgen können, über die integriert wird.
•
• •
Zur Übergangsamplitude eines Feynman-Diagramms tragen dessen einzelne Elemente je einen multiplikativen Faktor bei, der Tabelle 10.5 zu entnehmen ist. Die Anordnung der fermionischen Faktoren – Spinor, γ -Matrix oder Propagator einer inneren Fermionlinie – ist dabei in der Reihenfolge zu treffen, wie sie beim Durchlaufen der Fermionlinien entgegen der Pfeilrichtung und über die Vertizes hinweg im Diagramm auftritt. (mn) Für jede geschlossene Fermionenschleife ist in Sea ein Faktor 1 einzufügen. Ein Faktor 1 ist auch einzufügen, wenn eine ungerade Anzahl von Transpositionen notwendig ist, um die Fermion-Operatoren in Normalform zu bringen.
Erläuterungen und Beweise. Nach (10.11)–(10.13) enthält der Operator S (n) , aus dem (mn) die Übergangsamplituden Sea gebildet werden, unter dem Integral n mal das Produkt α ψ(x) A α (x): mit n verschiedenen Argumenten x 1 bis x n . Hieraus folgt: Jedes :ψ(x)γ
10.6 Feynman-Regeln
319
Diagramm n-ter Ordnung enthält n verschiedene Vertizes, an denen je zwei durch ψ und ψ beschriebene Fermionen- und eine durch A α beschriebene Photonlinie aufeinandertreffen. (Durch letzteres wird garantiert, daß an jedem Vertex Ladungserhaltung gilt.) Aus der Struktur von S (n) und dem Wickschen Theorem folgt: Jedes FeynmanDiagramm mit einer beliebigen Anzahl von Vertizes, bei dem an jedem Vertex zwei Fermionlinien durchgängiger Richtung und eine Photonlinie münden, stellt einen möglichen Prozeß dar. Alle Linien, die zwei Vertizes verbinden, sind dabei innere, alle anderen äußere Linien. (mn) Nach Tabelle 10.5 bringen n Vertizes den Faktor (e/h)n mit sich, den Sea nach (n) (10.11)–(10.13) enthalten muß. Der in S auftretende Vorfaktor 1/n kommt dagegen (mn) in den Regeln zur Berechnung von Sea nicht vor, weil die Zuordnung der RaumZeit-Punkte x 1 , . . . , x n zu den Vertizes beliebig ist und es daher n topologisch äquivalente Diagramme gibt, die durch Permutation der x 1 , . . . , x n auseinander hervorgehen. (Beispiel: Von den vier in Abb. 10.12 dargestellten detaillierten Diagrammen zweiter Ordnung für die Elektron-Elektron-Streuung gehen die zwei ersten auseinander durch Vertauschen der beiden Vertizes hervor und sind daher topologisch äquivalent. Dasselbe gilt für die zwei letzten, die jedoch von den beiden ersten topologisch verschieden sind. In (10.43) gibt es daher nur zwei Summanden ohne den Faktor 1/2 von S (2) .) Eine geschlossene Fermionenschleife wird z. B. durch den achten Summanden von Gleichung (10.39) beschrieben und ist in Abb. 10.11 dargestellt. Nach (9.83) gilt ψ(x 1 ) ψ(x 2 ) i SF (x 1 x 2 )
ψ(x 1 ) ψ(x 2 ) i SF (x 1 x 2 ) ,
weil die Vertauschung von ψ und ψ zu einem Minuszeichen führt. Eine der beiden Kontraktionen der Schleife führt daher zu einem Minuszeichen. Das gilt in jedem beliebigen Diagramm mit einer geschlossenen Fermionenschleife, da in diesem stets beide Kombinationen ψ(x i ) ψ(x j ) und ψ(x j ) ψ(x i ) auftreten. Die Gültigkeit der letzten Regel (Faktor 1 bei ungerader Anzahl fermionischer Transpositionen zur Normalform) ist offensichtlich. Bei den Diagrammen zur ElektronElektron-Streuung in Abb. 10.12 führt sie zu einem Faktor 1 bei der direkten Streu(2) beim Übergang zur Normalform nach (10.40) ψ ( )(x 1 ) und ψ ( )(x 2 ) ung, weil in S(ee) vertauscht werden müssen. (Das Matrixelement für die Austauschstreuung geht nach Abb. 10.12 aus dem für die direkte Streuung hervor, indem man in dem durch (10.41) gegebenen Endzustand e die Vertauschung a l, p a l, p vornimmt. Wegen der dabei 1 1 2 2 anzuwendenden Antivertauschungsrelationen führt dies gegenüber dem Matrixelement für die direkte Streuung zu einem weiteren Minuszeichen.) Die in Tab. 10.5 angegebenen Faktoren für die inneren Linien sind nach ihrer ursprünglichen Definition (9.76) bzw. (9.86) quadratisch in den Amplituden u(l, p) und v(l, p) bzw. εα(λ) (k), während die Faktoren für die äußeren Linien in diesen nur linear sind. Es macht daher Sinn, wenn man sich die inneren Linien im Gegensatz zu den äußeren als doppelte Linien vorstellt, von denen eine die Propagation vom ersten zum zweiten der durch sie verbundenen Vertizes beschreibt, die andere die Propagation vom zweiten zum ersten. Nutzanwendungen dieser Vorstellung werden sich in Abschn. 10.10.2 ergeben. ¼
¼
¼
¼
320
10 Quantenelektrodynamik
Beispiel 10.3: Paarerzeugung durch ein Gammaquant Das Feynmandiagramm für diesen Vorgang ist das Diagramm (d) aus Abb. 10.2. Das Anschreiben der zugehörigen Faktoren in der Reihenfolge auslaufendes Elektron, Vertex, auslaufendes Positron und einlaufendes Photon unter Voranstellen aller skalaren Faktoren liefert i (2π h )4 em 0 c2 h μ0 c2 u(l ¼ , p¼ )γ α v(l ¼¼ , p¼¼ )g λλ εα (λ)(k) 4 ¼ ¼¼ (1) Sea δ p p h k . 3/2 h V 2ωk Ep Ep ¼
¼¼
Nimmt man hierin die Ersetzung V 1/2 (2π h )3/2 für die beiden Fermionen und V 1/2 (2π)3/2 für das Photon vor, die nach (10.17) bzw. (10.4) und (10.10) mit dem Übergang von diskreten zu kontinuierlichen Wellen verbunden sind, setzt man insgesamt also V 3/2 (2π h )3 (2π)3/2 , so wird daraus das früher abgeleitete Ergebnis (10.20), (1)
Sea
i em 0 c3 h μ0 u(l ¼ , p¼ )γ α v(l ¼¼ , p¼¼ )g λλ εα (λ)(k) 4 ¼ ¼¼ δ p p h k . 4πωk Ep Ep ¼
¼¼
Beispiel 10.4: Elektron-Elektron-Streuung Wir berechnen den Beitrag der direkten Streuung mit Hilfe des ersten Diagramms der rechten Seite in Abb. 10.12, schreiben die Terme in der Reihenfolge innere Photonlinie, linkes auslaufendes Elektron, linker Vertex, linkes einlaufendes Elektron, rechtes auslaufendes Elektron, rechter Vertex und rechtes einlaufendes Elektron an und erhalten unter Voranstellen aller skalaren Faktoren und Berücksichtigung eines Faktors 1 nach der letzten Feynman-Regel e2 (2π h )8 (m 0 c2 )2 μ0 c d 4q δ 4 p2¼ p2 q 4 ¼ (2) δ p1 p1 q Sea ( 1)( i)( i)2 (2π h )4 q q/h 2 i ε h V 2 Ep1 Ep Ep2 Ep ¼
¼
1
2
gαβ u(l1 , p1) γ α u(l1 , p1) u(l2, p2)γ β u(l2 , p2) ¼
¼
¼
¼
i e2 (2π h )4 m 20 c4 h μ0 c δ 4 p1¼ p2¼ p1 p2 gαβ u(l1¼ , p1¼ )γ α u(l1 , p1 )u(l2¼ , p2¼ )γ β u(l2 , p2 ) . V 2 Ep1 Ep Ep2 Ep ( p2 p2¼ )( p2 p2¼ ) ¼
¼
1
2
Das ist gerade der M1 enthaltende Teil des Ergebnisses (10.43). Der Beitrag der indirekten Streuung ergibt sich analog.
Dem Leser wird empfohlen, die Gültigkeit der Feynman-Regeln noch an weiteren der früher berechneten oder an neu zu berechnenden Amplituden zu überprüfen (Aufgaben 10.9 und 10.10).
10.7 Korrekturen vierter Ordnung Zu allen in zweiter Ordnung der Störungsrechnung erhaltenen Prozessen gibt es in höheren Ordnungen Korrekturen. Weil die Störungsrechnung bei den Übergangsamplituden auf eine Entwicklung nach der kleinen Größe α 1/137 hinausläuft (Aufgabe 10.12),
10.7 Korrekturen vierter Ordnung
321
sollte es sich dabei im allgemeinen nur noch um sehr kleine Korrekturen handeln, es sei denn, die Koeffizienten der α-Entwicklung werden sehr groß. Häufig ist das nicht der Fall. Es gibt jedoch wichtige Ausnahmen hiervon, die zudem sehr wichtig sind und bei denen die Koeffizienten sogar unendlich werden. Das ist der Grund dafür, warum wir uns im folgenden kurz mit einem Beispiel für Korrekturen höherer Ordnung befassen. Mit dem Problem divergenter Terme höherer Ordnung werden wir uns dann ausführlich im nächsten Abschnitt befassen. Beispiel 10.5: Elektron-Positron-Streuung Die Elektron-Positron-Streuung wird wie die Elektron-Elektron-Streuung von der Störungsreihe (10.11) schon in zweiter Ordnung erfaßt und durch das Feynman-Diagramm (7) der Abb. 10.8 beschrieben. (Ähnlich wie das Diagramm (11) der Elektron-Elektron-Streuung die vier detaillierteren Diagramme der Abb. 10.12 zusammenfaßt, gibt es auch zum Diagramm (7) vier detailliertere Diagramme.) Wir betrachten in diesem Abschnitt Korrekturen höherer Ordnung zur ElektronPositron-Streuung, weil unter diesen Beiträge enthalten sind, die auch bei vielen anderen Prozessen auftreten und die Besonderheit aufweisen, zu divergieren. Bei der Elektron-Positron-Streuung muß es in jeder Ordnung ein ein- und ein auslaufendes Elektron sowie ein ein- und ein auslaufendes Positron geben, d. h. die zugehörigen FeynmanDiagramme haben vier externe Fermionlinien. Weil S (3) drei Photonenoperatoren A α enthält, von denen nur zwei kontrahiert werden können, ist an allen Prozessen mit nicht-verschwindenden Korrekturen dritter Ordnung ein externes Photon beteiligt. Korrekturen zur Elektron-PositronStreuung sind daher mindestens vierter Ordnung. S (4) enthält vier Photonen- und acht Fermionenoperatoren. Bei vier externen Fermionlinien müssen daher alle Photonen- und vier Fermionenoperatoren kontrahiert sein, was zu je zwei inneren Photon- und Fermionlinien führt. Zugehörige Feynman-Diagramme sind in Abb. 10.13 präsentiert. Außer diesen gibt es noch acht weitere, topologisch verschiedene Diagramme, die ähnlich den vier ersten der zweiten Zeile sind und sich von diesen durch die Plazierung einer inneren Photonlinie unterscheiden. Außer den verbundenen Graphen der Abb. 10.13, bei denen von allen inneren Linien eine Verbindung zu den äußeren Linien besteht, gibt es noch weiter Graphen vierter Ordnung, für die das nicht gilt. Diese zerfallen entweder in unverbundene Teilgraphen, wie das bei dem in Abb. 10.4 dargestellten Diagramm zweiter Ordnung der Fall ist, oder sie enthalten einen verbundenen und einen unverbundenen Anteil. Ein Beispiel für das Letztere bildet eine Kombination des Diagramms (7) aus Abb. 10.8 mit dem Diagramm der Abb.10.11. Der verbundene Anteil erhöht die Amplitude zweiter Ordnung um eine Korrektur der Ordnung α 2 . Die Vakuumblase beschreibt
Abb. 10.13: Korrekturen vierter Ordnung zur Elektron-Positron-Streuung.
322
10 Quantenelektrodynamik
dagegen eine Vakuumfluktuation (Bildung und Vernichtung eines virtuellen Elektron-PositronPaares) und liefert nur einen physikalisch irrelevanten Phasenfaktor (Abschn. 10.8.2). Wie schon eingangs erwähnt gibt es in den Diagrammen der Abb. 10.13 Teile, deren Beitrag zur Amplitude vierter Ordnung divergiert. Diese Teildiagramme finden sich in Abb. 10.16. Teildiagramm (a) ist im letzten Diagramm der ersten und der zweiten Zeile von Abb. 10.13, (b) im zweiten und vierten und (c) im dritten Diagramm der zweiten Zeile enthalten. Die Divergenzen dieser Teildiagramme und ihre Behebung werden in den nächsten Abschnitten besprochen.
10.8 Strahlungskorrekturen Wir befassen uns in diesem Abschnitt zunächst systematisch damit, welche Übergangsamplituden möglicherweise divergieren, und werden dabei unter anderen auch auf die Teildiagramme stoßen, denen im letzten Abschnitt divergente Übergangsamplituden zugesprochen wurden. Bei der im Anschluß durchgeführten Untersuchung aller Graphen mit potentieller Divergenz wird sich zeigen, daß diese sogar die einzigen mit echten Divergenzen sind, die nicht auf einfache Weise beseitigt werden können. Divergente Korrekturen höherer Ordnung werden oft als Strahlungskorrekturen bezeichnet.
10.8.1 Primitiv divergente Feynman-Graphen In den Übergangsamplituden sämtlicher Ordnungen treten Impulsintegrationen auf, die sich von bis erstrecken und inneren Linien zugeordnet sind. Durch Abzählen der zur Berechnung einer Übergangsamplitude insgesamt erforderlichen Einfachintegrationen läßt sich erkennen, welche Übergangsamplituden möglicherweise divergieren. Tabelle 10.5 ist zu entnehmen, daß jeder inneren Fermionlinie für q q q 1/2 ein Integrand 1/q und jeder Photonlinie ein Integrand 1/q 2 zugeordnet ist. Von jedem Vertex kommt ein Integrand δ 4 (q), und in n-ter Ordnung gibt es n solche Beiträge. Mit Fi Anzahl innerer Fermionlinien ,
Pi Anzahl innerer Photonlinien
verhält sich jede Übergangsamplitude n-ter Ordnung daher wie
P
P
lim
P
n δ 4 (q) d 4Fiq d 4 Piq F 2P P q i q i
P
δ4 (Pe
Pa ) lim P D , P
(10.81)
wobei D den gleich zu berechnenden potentiellen Divergenzgrad angibt. Durch n 1 der n im Zähler auftretenden δ 4 -Funktionen wird die Divergenz von 4(n 1) Impulsintegrationen aufgefangen, weil nach (10.51) eine δ 4 -Funktion übrig bleiben muß, welche die Erhaltung des gesamten Viererimpulses bewirkt. Aus der Anzahl verbliebener q-Integrationen ergibt sich unter Berücksichtigung der q -Potenzen im Nenner D
4(Fi Pi
n 1)
Fi
2Pi
3Fi 2Pi 4
4n .
(10.82)
10.8 Strahlungskorrekturen
323
D
Fa
Pa
Bezeichnung
Graph
4
0
0
Vakuumblase
3
0
1
Fermionenring mit einem Vertex
2
0
2
Selbstenergie des Photons
1
0
3
Fermionenring mit drei Vertizes
1
2
0
Selbstenergie des Elektrons (Positrons)
0
0
4
Photon-Photon-Streuung
0
2
1
Vertexkorrektur
Abb. 10.14: Primitiv divergente Feynman-Graphen. Die Vakuumblase geht nach Zerschneiden der Photonlinie in den Selbstenergie-Graphen des Photons und nach Zerschneiden einer Fermionlinie in den Selbstenergie-Graphen des Elektrons (Positrons) über.
In diesem Ergebnis können n, Fi und Pi noch durch Fa Anzahl äußerer Fermionlinien ,
Pa Anzahl äußerer Photonlinien
ausgedrückt werden, wodurch das Ergebnis von der betrachteten Ordnung der Störungsrechnung unabhängig wird. Jede äußere Linie hängt nur an einem Vertex, jede innere dagegen an zwei Vertizes, und auf jeden Vertex laufen zwei Fermionen- sowie eine Photonlinien zu. Daher gilt 1 Pa 2Pi n (Fa 2Fi ) , (10.83) 2 und für D ergibt sich damit bzw. mit Pi (n Pa )/2 sowie Fi n Fa /2 aus (10.82) D
4 3Fa /2 Pa .
(10.84)
Für D 0 divergiert die Übergangsamplitude im allgemeinen, es sei denn, die Divergenz wird durch besondere Symmetrien vermieden. (Ein Beispiel hierfür liefert die in Abschn. 10.8.3 behandelte Photon-Photon-Streuung.) Für D>0 ist die potentielle Divergenz wie die von P D für P , für D 0 ist sie logarithmisch wie 2P bei 1 d p/ p ln P. Eine Übergangsamplitude kann auch für D<0 divergieren, wenn bereits eine in ihm enthaltene Teilintegration divergiert. Dieser Teilintegration entspricht in dem zugehörigen Feynman-Diagramm ein divergenter Teilgraph. Ein divergenter Graph (oder Teilgraph), der keine kleineren divergenten Bestandteile enthält, heißt primitiv divergent.
324
10 Quantenelektrodynamik
Nach (10.84) ist der potentielle Divergenzgrad D von der betrachteten Ordnung der Störungsrechnung unabhängig und hängt allein von der Zahl einlaufender und auslaufender Teilchen ab. Offensichtlich gilt D 4, was dazu führt, daß es in der QED nur eine kleine Anzahl primitiv divergenter Graphen bzw. Teilgraphen gibt. Diese sind in Abb. 10.14 aufgeführt. Die den primitiv divergenten Graphen entsprechenden Prozesse werden in den nächsten Abschnitten besprochen. Am wichtigsten sind dabei die Selbstenergie des Photons und des Elektrons bzw. Positrons sowie die Vertexkorrektur. Für diese werden die Übergangsamplituden explizit berechnet, und es wird gezeigt, wie die auftretenden Divergenzen durch eine physikalische Reinterpretation behoben werden können. Zur Bedeutung der übrigen primitiv divergenten Graphen wird in den nächsten zwei Teilabschnitten kurz das nötigste gesagt.
10.8.2 Vakuumgraphen und Fermionenringe Vakuumgraphen. Die schon in zweiter Ordnung auftretende Vakuumblase und alle zusätzlich in höheren Ordnungen auftretenden Vakuumgraphen (Feynman-Graphen ohne äußere Linien) treten außer bei Wechselwirkungsprozessen zwischen Teilchen auch im reinen Vakuum auf. Ihre Summe liefert die gesamte Übergangsamplitude für den Übergang von Vakuum zu Vakuum, und die Wahrscheinlichkeit dafür muß eins betragen, ' ' '0 S V G 0'2 1 Sea 0 S V G 0 ei α . Die Divergenz äußert sich hier in einer Divergenz des Phasenfaktors α. Bei Wechselwirkungsprozessen sind die Vakuumgraphen nicht mit den Linien für ein- und auslaufende Teilchen verbunden, es handelt sich um unverbundene Teilgraphen (siehe dazu auch Abschn. 10.7). In der Übergangsamplitude äußert sich diese Unverbundenheit darin, daß die entsprechenden Integrationen von denen für die verbundenen Anteile des entsprechenden Prozesses separieren, d. h.
. . . S . . . . . . S . . .0 SV G 0 . . . S . . .ei α . ¼
¼
Auch bei Wechselwirkungsprozessen liefern die Vakuumgraphen also nur einen physikalisch irrelevanten Phasenfaktor. Fermionenringe mit einem oder drei Vertizes. Die divergenten Fermionenringe aus Abb. 10.14 mit einem bzw. drei Vertizes bilden einen Spezialfall von Fermionenringen mit einer ungeraden Anzahl von Vertizes. Zu jedem Ring, der von der Ladung im Uhrzeigersinn durchlaufen wird, gibt es einen zweiten, der entgegen dem Uhrzeigersinn durchlaufen wird. Für den Fall einer ungeraden Anzahl von Vertizes gilt das Theorem von Furry, nach dem sich die zugehörigen Übergangsamplituden gegenseitig kompensieren. Daher spielt die bei ein oder drei Vertizes auftretende Divergenz keine Rolle. Auf den (nicht besonders schwierigen) Beweis des Furry-Theorems wird hier verzichtet.
10.8 Strahlungskorrekturen
325
1’
2’ 2’
1’ 1’
2’ 1’
2’ 2’
1’ 1’
2’
1
2
2
2
2
2
2
1
1
1
1
1
Abb. 10.15: Die topologisch verschiedenen Feynman-Diagramme der Photon-Photon-Streuung.
10.8.3 Photon-Photon-Streuung Bei der Photon-Photon-Streuung gibt es vier äußere Photonlinien, zwei für einlaufende und zwei für auslaufende Photonen. Für eine nicht-verschwindende Übergangsamplitude muß in S (n) zu jedem Photon ein Photonenoperator A α enthalten sein. Die niedrigste Übergangsamplitude ist daher vierter Ordnung und lautet 4 0 ' ' 1)γ α ψ(x 2 )γ α ψ(x (4) 1) A α (x1): :ψ(x 2) A α (x2): Sea e'T :ψ(x e4 4 h ' 1 3)γ α ψ(x 4 )γ α ψ(x 3) A α (x3)::ψ(x 4) A α (x4): ''a d 4x1 d 4x2 d 4x3 d 4x4 :ψ(x mit a b (λk11) b (λk22) 0 , e b (λk 1) b (λk 2) 0 . ¼
¼
¼
¼
1
2
Da es keine äußeren Fermionlinien gibt, müssen alle Fermionenoperatoren kontrahiert sein, was bei acht Fermionenoperatoren zu vier Kontraktionen bzw. vier inneren Fermionlinien führt. Hierzu gibt sechs topologisch verschiedene Feynman-Diagramme, die in Abb. 10.15 dargestellt sind. Die zugehörigen Übergangsamplituden können mit Hilfe der im letzten Abschnitt aufgestellten Feynman-Regeln berechnet werden. Nach Tabelle 10.14 könnten sie im Prinzip divergieren, was jedoch nicht der Fall ist, weil sich Teilintegrale aufgrund von Antisymmetrien der Integranden, die mit der Eichinvarianz der Maxwell- und DiracGleichung zu tun haben, gegenseitig kompensieren. Das Ergebnis sind endliche, von null verschiedene Übergangsamplituden, die zur Folge haben, daß Photonen aneinander gestreut werden können. Die Voraussetzung dazu ist allerdings, daß die Energie der einlaufenden Photonen ausreicht, um ein virtuelles Elektron-Positron-Paar zu erzeugen. Die Streuung von Licht an Licht ist ein wichtiges Ergebnis der Quantenfeldtheorie, das es in der zugehörigen klassischen Theorie, also der Maxwell-Theorie, nicht gibt. Die letztere ist eine lineare Theorie, in der das Superpositionsprinzip gilt. Aus ihr folgt, daß zwei sich gegenseitig durchdringende Lichtstrahlen zwar im Überlappungsbereich Interferenzerscheinungen zeigen, aber aus diesem ohne jede Beeinflussung durch den jeweils anderen austreten. Aus den Feynman-Diagrammen läßt sich ablesen, wie es in der Quantenfeldtheorie zu einer gegenseitigen Beeinflussung kommt: Durch die Wechselwirkung der beiden Photonenstrahlen wird vorübergehend ein Elektron-PositronPaar erzeugt, und bei dessen anschließender Vernichtung entstehen zwei neue Photonen, die zusammen denselben Impuls und dieselbe Energie wie die einfallenden Photonen aufweisen. Wenn man in die klassische Theorie diesen Paarerzeugungsprozeß heuristisch mit einbezieht, erhält man auch in dieser eine Streuung von Licht an Licht.
326
10 Quantenelektrodynamik
q¼
k¼ γν
q1
γβ q2
γμ
q ¼ γ α k2
k
q2
q1 γα q
k (a)
(b)
γβ q
γ μ q1
k1 (c)
Abb. 10.16: Strahlungskorrekturen: (a) Selbstenergie des Photons (Vakuumpolarisation), (b) Selbstenergie des Elektrons und (c) Vertexkorrektur. Bei den mit k und k ¼ bzw. q und q ¼ bezeichneten Linien in (a) bzw. (b) handelt es sich um innere Linien, die gestrichelten Linien in (c) sind Anschlußlinien.
10.8.4 Selbstenergien, Vertexkorrektur und Ward-Identität Selbstenergie des Photons. Wir berechnen als erstes den Beitrag des FeynmanGraphen der Vakuumpolarisation zur Übergangsamplitude. Nach den Feynman-Regeln des Abschnitts 10.6.1, mit den Bezeichnungen der Abb. 10.16 (a) und unter Einbeziehung des Faktors 1 für die geschlossene Fermionenschleife ist er in der Reihenfolge untere (innere) Photonlinie, unterer Vertex, innere Elektronlinie, oberer Vertex, innere Positronlinie und obere (innere) Photonlinie durch
(2) s.u. SVP
e2
h 2 2
q e2 h
q1
d 4k d 4k ¼ 4 d q1 d 4q2 δ 4 (q1 q2 h k) δ 4 h k ¼ q2 q1 (2π)4 (2π)4 D Fαμ (k) Sp γ μ SF (q1 )γ ν SF (q2) D Fνβ (k ¼ )
d 4 k d 4 k d 4q 4 δ h k (2π)8
oder unter Benutzung von δ 4 (h k (2)
SVP
e2
(2π)4 h 6
h k D Fαμ (k) Sp γ μ SF(q)γ ν SF (q h k) D Fνβ (k )
h k) δ4 (k
k)/h 4 durch
d 4k i D (k) Sp γ μ SF (q)γ ν SF (q h k) d 4q i D Fνβ (k) Fαμ 4 (2π)
gegeben. Die Spurbildung des der Fermionenschleife zugeordneten Matrizenproduktes γ μ SF (q1 )γ ν SF (q2 ) kommt dadurch zustande, daß die Matrizen der in der Schleife aufeinander folgenden Elemente der Reihe nach miteinander multipliziert werden müssen. Dies bedeutet, daß jeweils der zweite Index der vorangehenden Matrix dem ersten der darauf folgenden Matrix gleichgesetzt und daß über die gleichgesetzten Indizes summiert wird. Da in der Fermionenschleife auf die letzte Matrix wieder die erste folgt, führt diese Prozedur zur Spurbildung. (2) SVP ist die Strahlungskorrektur einer inneren Photonlinie und muß daher zu deren Beitrag zur Übergangsamplitude addiert werden, was in der Sprache der Feynman-
10.8 Strahlungskorrekturen
327
Graphen die Ersetzung + bedeutet. Formelmäßig entspricht das unter Benutzung des obigen Ergebnisses der Ersetzung 4 4 d k d k (2) i D (k).. i D ¼ Fαβ (k).. (10.85) Fαβ (2π)4 (2π)4 mit (2) (10.86) i D ¼ Fαβ (k) i DFαβ (k) i DFαμ (k) i Π(2)μν i DFνβ (k)
und dem Polarisationstensor Π(2)μν (k)
i he
2 2
Sp γ μ SF (q)γ ν SF (q h k)
d 4q . (2π h )4
(10.87)
In Π(2)μν wird über alle möglichen Vierervektoren q α integriert. Für große Werte q q gilt SF (q) SF (q h k) 1/ q , und da über d 4q integriert wird, divergiert von q (2)μν in Übereinstimmung mit dem in der Tabelle von2Abb. 10.14 für die SelbstenerΠ gie des Photons angegebenen Verhalten quadratisch. ( d 4 k DFαμ (k).. DFνβ (k) liefert wegen D
Fαμ (k)
1/k
2
keinen Beitrag zum Divergenzverhalten.)
Selbstenergie des Elektrons. Der Feynman-Graph für die Selbstenergie eines Elektrons ist in Abb. 10.16 (b) angegeben, der für die Selbstenergie eines Positrons geht daraus durch Umdrehen der Pfeilrichtungen hervor. Durch Anwendung der FeynmanRegeln aus Tab. 10.5 in der Reihenfolge untere (innere) Elektronlinie, unterer Vertex, innere Elektronlinie, oberer Vertex, obere (innere) Elektronlinie und innere Photonlinie ergibt sich für die Übergangsamplitude e2 h 2 (2) SSE d 4q d 4q1 d 4q ¼ d 4 k δ 4 (q1 h k q) δ 4 q ¼ h k q1 8 (2π h ) SF (q)γ α SF (q1 )γ β SF (q ¼ ) DFαβ (k) e2 h 2 d 4q d 4 k SF (q)γ α SF (q h k)γ β SF (q) DFαβ (k) . (2π h )8
(2) So wie SVP zum Amplitudenbeitrag einer inneren Photonlinie addiert werden mußte, (2) muß SSE zum Beitrag einer inneren Elektronlinie addiert werden. Die Berücksichtigung der Selbstenergie des Elektrons führt also zu der Ersetzung d 4q d 4q (2) S (q) . . . i S ¼ (q) . . . i (2π h )4 F (2π h )4 F
mit
S (q) S (q) S (q)Σ (q) S (q) e Σ (q) i D (k) γ S (q h k)γ h ¼
und
(2) F
(2)
F
F
2
2
Fαβ
(2)
α
(10.88)
F
F
β
d 4k . (2π)4
(10.89)
328
10 Quantenelektrodynamik
Vertexkorrektur. Der Feynman-Graph für die Vertexkorrektur ist in Abb. 10.16 (c) angegeben. Durch Anwendung der Feynman-Regeln in der Reihenfolge linker oberer Vertex, innere Elektronlinie, unterer Vertex, innere Positronlinie, rechter oberer Vertex und innere Photonlinie ergibt sich für die Übergangsamplitude 3 e (3) SV d 4q2 d 4q1 h 4 d 4 k2 δ 4 q ¼ hk2 q2 δ 4 (q2 q1 hk1 ) δ 4 (q1 hk2 q) h α μ β γ S F (q2 )γ SF (q1 )γ DFαβ (k 2 ) 3 e h d 4q1 d 4k2 δ 4 q ¼ q1 hk1 hk2 δ 4 (q1 hk2 q) γ
k2
k
e3 h δ 4 q
q hk1
e3 h δ 4 q
q hk1
α SF (q1 hk1 )γ μ SF (q1 )γ β D Fαβ
(k2 )
d 4k D Fαβ (k) γ α SF (q hk1 hk)γ μ SF (q hk)γ β d 4 k D Fαβ (k) γ α SF (q
(3)
hk)γ μ SF (q hk)γ β .
SV muß zu dem Ausdruck für einen Vertex addiert werden, der den Photonenimpuls hk1 mit den Fermionenimpulsen q und q verbindet, d. h. für einen Vertex muß bei Berücksichtigung der Strahlungskorrekturen niedrigster Ordnung die Ersetzung 4 e μ 4 4 e (2)μ 4 γ δ q q hk1 Γ i (2π h) i (2π h) δ q q hk1 h h mit (10.90) Γ (2)μ (q , q) γ μ Λ(2)μ (q , q)
und (2)μ
Λ
e2 (q , q) i 2 h
D Fαβ (k) γ α SF (q
hk)γ μ SF(q hk) γ β
d 4k (2π)4
(10.91)
vorgenommen werden. Ward-Identität. Zwischen den durch (10.89) und (10.91) definierten Größen Σ (2) (q) und Λ(2)μ (q , q) besteht ein wichtiger Zusammenhang. Um ihn abzuleiten, schreiben wir für den Propagator (9.84) zunächst unter Benutzung der ähnlich wie (8.188b) q m 0 c)q q m 20 c2 und Unterdrückung des ε-Terms beweisbaren Identität (/ q m 0 c)(/ im Nenner h(/ q m 0 c) h (10.92) SF (q) (/ q m 0 c)(/ q m 0 c) q/ m 0 c
– unter dem letzten Ausdruck ist die Inverse der Matrix (/ q m 0 c)/h zu verstehen – und erhalten daraus durch Ableiten nach q α
∂ SF 1 (q) ∂q α
∂(/ q m 0 c)/h ∂q α
∂(γα q α m 0 c)/h ∂q α
∂ SF1 (q)
γα . h
Durch Ableiten der Identität 1 SF (q) SF 1 (q) nach q α ergibt sich damit 0
∂ SF (q) 1 SF (q) SF (q) ∂q α
∂q α
∂ SF (q) 1 SF (q) γα . S (q) F ∂q α h
10.9 Dimensionsmäßige Regularisierung
329
Die Rechtsmultiplikation dieser Gleichung mit SF (q) liefert schließlich ∂ SF (q) ∂q α
SF (q) γα SF (q) . h
(10.93)
Wenn wir jetzt Σ (2) (q) nach q μ differenzieren und das letzte Ergebnis benutzen, erhalten wir 4 e2 ∂Σ (2) (q) (10.89) α β d k i D (k) γ S (q hk) γ S (q hk)γ . μ Fαβ F F ∂q μ (2π)4 h 3 Der Vergleich mit (10.91) liefert die Ward-Identität Λ(2) μ (q, q) h
∂Σ (2) (q) . ∂q μ
(10.94)
10.9 Dimensionsmäßige Regularisierung Die Divergenz der im letzten Abschnitt für Π(2)μν (k), Σ (2) (q) und Γ μ (q ¼ , q) abgeleiteten Integrale kommt von den unendlichen Integrationsgrenzen k bzw. q . Diese entsprechen unendlich kleinen (de-Broglie-) Wellenlängen der durch die QED beschriebenen Teilchen (Elektronen, Positronen und Photonen), und man spricht daher von Ultraviolett-Divergenzen. Man kann die Frage stellen, ob die QED bis zu derart kleinen Längen überhaupt anwendbar ist. Das würde jedenfalls voraussetzen, daß es sich bei den Teilchen der QED um Punktteilchen handelt. In Hinblick auf mögliche Zweifel daran wäre es sinnvoll, die Integrationen bei einem endlichen Impuls q P< bzw. einer endlichen Wellenzahl k K < abzuschneiden und zu sehen, wie das die Ergebnisse der Theorie beeinflußt. Sollten diese auch noch für sehr große Werte von dem Abschneideparameter P bzw. K abhängen, so würde das nach dem vorher Gesagten auf eine innere Struktur der Teilchen hinweisen, und die Folge davon wäre die Unzulässigkeit des Grenzübergangs P bzw. K . Wir werden jedoch feststellen, daß die QED nicht von dieser Art ist, vielmehr wird sich der Grenzübergangs P bzw. K als möglich erweisen, was bedeutet, daß die QED keine Hinweise auf eine innere Struktur der durch sie beschriebenen Teilchen liefert. Der oben geschilderte Weg der Regularisierung durch Abschneiden der Integrale bei endlichen Integrationsgrenzen ist zwar konzeptionell sehr einfach, aber nicht besonders zweckmäßig, weil er nicht relativistisch invariant ist. Eine Alternative dazu besteht darin, vom Integranden des divergenten Integrals eine von einem Parameter K oder P abhängige Funktion mit gleichem asymptotischem Verhalten bzgl. k bzw. q abzuziehen, die das Integral für endliche Parameterwerte konvergieren läßt und für K bzw. P verschwindet. Ein Beispiel dafür bietet die Ersetzung des Photonenpropagators (9.88) durch 1 1 . hμ 0 cgαβ k k i ε k k K K i ε
330
10 Quantenelektrodynamik
Ein elegantes und relativistisch invariantes Verfahren dieser Art ist die Pauli-VillarsRegularisierung. Die entsprechenden Rechnungen sind allerdings sehr umfangreich, weshalb hier ein noch andersartiger Weg eingeschlagen wird, der zu wesentlich kürzeren Rechnungen führt und zudem über die QED hinausgehend weiter anwendbar als die Pauli-Villars-Regularisierung ist. Die Rede ist von der – ebenfalls Lorentz-invarianten – dimensionsmäßigen Regularisierung, die im folgenden besprochen wird. Bei der dimensionsmäßigen Regularisierung werden die divergenten Integrale auf eine d-dimensionale Raum-Zeit mit zunächst ganzzahligem d verallgemeinert, wobei sich herausstellt, daß sie für hinreichend kleine d 4 konvergieren und explizit berechnet werden können. (Der Frage nach oberen Grenzen von d wird im folgenden nicht nachgegangen, da sie für den später benutzten Wert d 4 nicht relevant ist.) Die Rechnungen liefern für die Integrale Ausdrücke, die von d abhängen und zwar zunächst nur für ganzzahlige Werte d definiert sind, sich jedoch analytisch zu beliebigen reellen Werten von d fortsetzen lassen. Man setzt dann d 4δ und betrachtet die Integrale zunächst für 0<δ 1. Dabei stellt sich heraus, daß alle Integrale in einen divergenten Anteil 1/δ (einfacher Pol bei d 4) und einen von δ unabhängigen, aber von den physikalischen Parametern des Problems abhängigen regulären Anteil zerfallen. Nach dieser Zerlegung ist es möglich, δ 0 gehen zu lassen. Der divergente Anteil kann dann durch eine Uminterpretation physikalischer Größen wie der Elektronenmasse und -ladung eliminiert werden. Diese als Renormierung bezeichnete Reinterpretation wird im Anschluß an die Regularisierung behandelt. In dem folgenden Exkurs werden zunächst einige mathematische Formeln abgeleitet, die zur dimensionsmäßigen Regularisierung benötigt werden.
Exkurs 10.1: Mathematische Hilfsmittel zur Regularisierung Feynmansche Rechentricks. a, b und c seien komplexe Zahlen. Aus b 1 1 1 1 1 b a dx x2 ab b a a b a
ergibt sich mit der Substitution x az b(1 z), die d x (a b) dz zur Folge hat, 1 dz 1 . ab 0 az b(1 z)2 Weiterhin gilt 1 abc
2
1
1 x dx
0
0
a(1
dy , x y)bx cy 3
(10.95)
(10.96)
was man am einfachsten durch nacheinander Ausführen der Integrationen überprüft, 1 x 1 x dy dy a(1 x y)bx cy 3 0 a(b a)x (c a)y 3 0 '1 x
' 1 1 1 1 ' . 2(c a) bx a(1 x)2 bx c(1 x)2 2(c a) a (b a)x (c a)y 2 '0 Die Weiterintegration nach x führt mit (10.95) zu (10.96).
10.9 Dimensionsmäßige Regularisierung
331
y0
Pol
x0 Pol
Abb. 10.17: Wick-Rotation. Integrale in d Dimensionen. Wir legen eine d-dimensionale Raum-Zeit mit einer Zeit- und d 1 Raumdimensionen der Metrik g00 1, g11 . . . gd 1,d 1 1 und gαβ 0 für α β zugrunde. Als erstes berechnen wir für 1ε>0, >0 und ganzzahlige n Integrale der Form d dx . (10.97) Id () (x x i ε)n d 1 2 d d 1x d x und x x x 2 x 2 können wir dafür Mit x 2 0 0 l 1 xl , d x d d x0 d d 1x Id () (x02 x 2 i ε)n IRd 1 schreiben. Bei iε z 0 x0 i y0 x 2 i ε x 2 2 x 2
liegen die Pole des Integranden. Da dieser für z 0 hinreichend schnell verschwindet, kann der Integrationsweg x0 durch einen Halbkreis im Unendlichen mit Zentrum bei z 0 0 zu einer geschlossenen Integrationskontur ergänzt werden, ohne daß sich dadurch etwas am Wert des Integrals ändert. Wenn wir uns für einen Halbkreis in der oberen Hälfte der z 0 -Ebene entscheiden, wird dabei der linke Pol umschlossen (Abb. 10.17, gestrichelter Halbkreis). Nach der Funktionentheorie kann die Integrationskontur beliebig verformt werden, solange dabei keiner der beiden Pole überschritten wird. Insbesondere können wir eine Integrationskontur wählen, die entlang der y0 -Achse von nach führt und durch einen Halbkreis in der linken Halbebene geschlossen wird (Abb. 10.17, durchgezogener Halbkreis). Weil jedoch auch dessen Beitrag zum Integral verschwindet, kann die Integration auf die y0 -Achse beschränkt werden. Dies bedeutet, daß der ursprüngliche Integrationsweg in der z 0 -Ebene um 90° gegen den Uhrzeigersinn gedreht werden kann, was als Wick-Rotation bezeichnet wird. Längs der y0 -Achse gilt z 02 (i y0 )2 y02 und dz 0 i d y0 , so daß wir für den Wick-rotierten Integrationsweg i d y0 i d dxe d d 1x Id () (1)n IRd (xe2 )n ( y02 x 2 )n IRd 1
erhalten, xe der Ortsvektor in einem d-dimensionalen euklidischen Raum ist, d. h. d wobei 1 2 xe2 α 0 xeα mit xe0 y0 und xel xl . (Man beachte, daß jetzt im Nenner der Term iε entfallen kann, weil auf der y0 -Achse keine Nullstelle liegt.) Weil der Integrand des Integrals Id () nur vom radialen Abstand r (xe2 )1/2 abhängt, können alle Winkelintegrationen ausgeführt werden, womit sich i Ωd r d 1 dr Id () (1)n 0 (r 2 )n
332
10 Quantenelektrodynamik
ergibt. Dabei2 ist Ωd die Oberfläche einer d-dimensionalen Einheitskugel des euklidischen Raums und V Ωd r d 1 dr ihr Volumen. Aus
π
d
s.u.
2 e x dx
d
d Ωd 2 r2 2 0
1 er dr 2 Ωd 2 e
d 2 n 1 xn
ex d x 2
Ωd und wir erhalten Id ()
d xd Ωd
0
2
dx1
2 r d 1 e r dr
0
d s.u. Ωd z 2 1 e z dz Γ (d/2) 2
2
– dabei wurde die bekannte Formel benutzt – folgt
π und die Definition der Gamma-Funktion
d/2
Γ2π(d/2) , d/2
(1)i 2πn Γ (d/2)
r d 1 dr . (r 2 )n
0
(10.98)
Mit der Substitution t /(r 2 ) bzw. r 2 /t und deren Folge dr 2 dt/t 2 ergibt sich r d 1 dr 1 r d 2 dr 2 1 0 t n d/2 1 1 t d/2 1 dt 2 0 (r 2 )n 2 1 t t2 0 (r 2 )n 1 1 t n 1 d/2 (1 t)d/2 1 dt . 2n d/2 0
Das letzte Integral kann durch die Eulersche Betafunktion 1 Γ (x) Γ (y) t x 1 (1 t) y 1 dt B(x, y) Γ (x y) 0
ausgedrückt werden, deren Zusammenhang mit der Gammafunktion gleich mit angegeben wurde, so daß wir r d 1 dr B(n d/2, d/2) Γ (n d/2)Γ (d/2) 2 )n 2n d/2 2Γ (n)n d/2 0 (r
erhalten. Einsetzen in den zuletzt für Id () erhaltenen Ausdruck liefert mit (10.97) schließlich als erstes Ergebnis i π d/2 Γ (n d/2) d dx . (10.99) n (x x i ε) ( 1)n Γ (n)n d/2
Weil über alle xμ von bis integriert wird, ändert sich an diesem Ergebnis nichts, wenn auf der linken Seite x durch x q mit konstantem q ersetzt wird. Da die rechte Seite von q unabhängig ist, ergibt sich durch Ableiten beider Seiten nach q μ (man beachte dabei ∂(q q)/∂q μ ∂(gαβ q α q β )/∂q μ 2qμ ) nach Herauskürzen des Faktors 2n (xμ qμ ) d dx (x q)(x q)i εn1 0 oder
xμ d dx (x q) (x q) i ε n 1
d
d
qμ d x qμ d x n 1 (x q)(x q)i ε x x i εn1 .
10.9 Dimensionsmäßige Regularisierung
333
Erneute Ableitung dieses Ergebnisses nach q ν führt mit ∂qμ /∂q ν ∂(gμλ q λ )/∂q ν gμλ δνλ gμν zu 2xμ (xν qν ) d dx d dx g . (10.100) (n 1) μν n 2 (x q)(x q) i ε x x i εn 1
Hieraus ergibt sich für q 0, n 2n, unter Benutzung des Ergebnisses (10.99) für die rechte Seite und mit (n 1)Γ (n 1)Γ (n) schließlich
xμ xν d x x i εn d x
gμν d/2) i π(1)Γn(n12Γ1(n) . n 1 d/2 d/2
(10.101)
Entwicklung der Gammafunktion. Die Gammafunktion ist die analytische Fortsetzung der für ganze Zahlen n definierten Funktion n in die komplexe Zahlenebene und erfüllt wie diese die Funktionalgleichung Γ (z 1)zΓ (z). Nach Weierstrass besitzt ihr Inverses die Darstellung
z + 1 z eC z 1 e z/n Γ (z) n n 1
(C
mit C lim
n
1
1 2
...
1 ln n 0.5772156649 . . . n
Euler-Konstante). Aus dieser Darstellung folgt ln Γ (z) ln z Γ (1)Γ (1)
und damit
Cz
$ 1 C
n 1
z z ln 1 n , n
1 1 n
n 1
Γ (1 z) Γ (1)
1 n
%
Γ (1)
Γ (1)z
(z) ΓΓ (z) 1z $ 1 C
1 n
n 2
1 z n
C
n 1
n1 n 1
%
n1
,
Γ (1)1
C
(z 2 ) 1Cz (z 2 ) .
Mit Γ (z 1)zΓ (z) ergibt sich hieraus Γ (z)
1 z
C (z) .
(10.102)
Selbstenergie des Elektrons. Einsetzen von (9.84) und (9.88) in (10.89) liefert h μ0 c gαβ γ α h ( q/ h k/m 0 c)γ β d 4k (2) 2 ie . Σ (q) (h 2 k k i ε) (q h k)(q h k) m 20 c2 i ε (2π)4 Die Verallgemeinerung von 4 auf d Dimensionen lautet dd k μ0 c γ α ( q/ h k/m 0 c)γα s.u. . Σ (2) (q) i e2h 2 μ4 d (h 2 k k i ε) (q h k)(q h k) m 20 c2 i ε (2π)d Dabei wurde der Faktor μ4 d eingefügt, damit Σ (2) (q) für alle d die gleiche physikalische Dimension besitzt, wozu Dim(μ/k)1 gewählt werden muß. Zur
334
10 Quantenelektrodynamik
Auswertung des Integrals benutzen wir die Feynman-Formel (10.95), in der wir a (q h k)(q h k) m 20 c2 i ε sowie bh 2 k k i ε setzen, und erhalten Σ
(2)
e2 h 2 μ4 i (2π)d
(q)
d 1
Mit der Substitution h k
dz 0
h k
μ0 c γ α ( q/ h k/m 0 c)γα
(q h k)(q h k)z m 20 c2 z h 2 k k(1 z)i ε
d 2 d k .
qz wird daraus γ α q/ (1 z) h k/ m 0 c γα e2 μ0 c h 2 μ4d 1 (2) d dz Σ (q) i 2 d k 2 2 2 (2π)d 0 h k k m 0 c z q q z(1 z)i ε 2 1 d d (h k ) 2 μ4d dz s.u. 0 ch α i e μ(2π γ q / (1 z) m c γ 0 α 2 h )d 0 h 2 k k m 20 c2 z q q z(1 z)i ε d/2 Γ (2 d/2) e 2 μ c h 2 μ4d 1 γ α q / (1 z)m 0 c γα (10.99) π 0 2 2d/2 dz . 2 Γ (2)(2π h )d 0 m c z q q z(1 z) 0 Dabei hat sich beim zweiten Schritt der in k/ γ α kα lineare Term wegen der Antisymmetrie des Integranden herausintegriert, und beim letzten Schritt waren die Voraussetzungen zur Anwendbarkeit von (10.99) mit ε > 0 sowie m 20 c2 z q q z(1 z) (m 20 c2 q q)z q qz 2
(8.163)
q qz 2
(8.163)
0
erfüllt. Zur weiteren Auswertung benötigen wir eine Folge der Relationen (2.204) zwischen den γ -Matrizen,
γ α , γ β 2gαβ
gαβ (γ α γ β γ β γ α ) 2γα γ α
bzw. deren Verallgemeinerung
2gαβ gαβ 2δαα 8 ,
d
γα γ α
(10.103)
auf d Dimensionen, mit deren Hilfe sich γ α q/ (1 z)m 0 cγα
ergibt. Hiermit, mit Γ (2)1 und mit Γ (2 dem letzten Ergebnis Σ
(2)
γ α γ β qβ γα (1 (1 z) 2gαβ
z)m 0 cγ α γα γ β γ α qβ γα m 0 cd
4 d/2)Γ (δ/2)2/δ
(2
d)(1 z) q/ dm 0 c
δ,
d
(10.104)
C (δ) nach (10.102) erhalten wir aus
2/δ C (δ) e2 μ0 c 1(4 δ)m 0 c (2 δ)(1 z) q/ (q) dz . 16π 2 h 2 (4πμ2 h 2 ) δ/2 0 m 2 c2 z q q z(1 z) δ/2 0
Unter Benutzung der Entwicklung 1 eln N N δ/2
δ/2
e
(δ/2) ln N
1
δ ln N 2
(10.105)
10.9 Dimensionsmäßige Regularisierung δ/2
für den mit (4πμ2 h 2 ) Σ (2) (q)
335
multiplizierten Nenner des Integranden ergibt sich daraus 1 e 2 μ0 c 2 4m 0 c2(1z) q/ δ( q/ q/ z m 0 c) C (δ) 2 2 δ 16π h 0 4 3 δ m 20 c2 z q q z(1z) 2 1 ln (δ ) dz . 2 2 4πμ2 h
Ausführen der einfacheren Integrationen, 1 4m 0 c2(1z) q/ δ( q/ q/ z m 0 c) dz 0
δ 4m 0 c q/ ( q/ 2m 0 c) , 2
führt schließlich zu Σ (2) (q)
e 2 μ0 c
8π 2 h 2
mit
(1C) q/ (12C) m 0 c RΣ (q) 2
4m 0 c q/ δ
z
RΣ (q) (δ)
(1z) q/ 2m 0 c ln
0
3
(10.106)
m 20 c2 z q q z(1z)
4
4πμ2 h 2
dz .
Selbstenergie des Photons. Einsetzen von (9.84) in (10.87) liefert gleich in d-dimensionaler Verallgemeinerung μ4 d e 2 k m 0 c) Sp γ μ ( q/ m 0 c)γ ν ( q/ h/ (2)μν d dq . Π i 2 2 (2π h)d q q m 0 c i ε (q hk)(q hk)m 20 c2 i ε Mit der Feynman-Formel (10.95), in der wir a (q hk)(q hk)m 20 c2 i ε und bq q m 20 c2 i ε setzen, sowie mit der Substitution q ¼ q hkz ergibt sich hieraus Sp γ μ ( q/ ¼ h k/z m 0 c)γ ν ( q/ ¼ h/ k (1z)m 0 c) d ¼ μ4 d e2 1 (2)μν i dz dq . Π 2 (2π h)d 0 q ¼ q ¼ m 2 c2 z(1z) h 2 k k i ε 0
Für den Zähler Z
Z Sp γ μ . . .
des Integranden gilt (qα¼ hkα z)qβ¼ hkβ (1z) Sp γ μ γ α γ ν γ β m 20 c2 Sp γ μ γ ν μ α ν μ ν β ¼ ¼ . m 0 c(qα hk α z) Sp γ γ γ m 0 c qβ hk β (z 1) Sp γ γ γ
Mit der Erweiterung der Ergebnisse von Aufgabe 10.4 auf d Dimensionen, Sp E
Sp(γ α γ β )
Sp(γ κ γ λ γ μ γ ν )
d,
dg αβ , Sp(γ λ γ μ γ ν ) 0 , κλ μν κν λμ κμ λν , d g g g g g g
ergibt sich hieraus Z d qα¼ qβ¼ z(1z)h 2 kα kβ hkα zqβ¼ qα¼ hkβ (1z) g μα g νβ g μβ g αν g μν g αβ d
m 20 c2 g μν .
336
10 Quantenelektrodynamik
Bei der Integration über d dq ¼ liefern die in q ¼ linearen Terme des Zählers den Beitrag null, womit sich der Zähler des Integranden nach Ausführung der Summation über doppelt auftretende Indizes und Zusammenfassen von Termen auf Z¼
d 2q ¼ μ q ¼ ν 2z(1 z)h 2 k μ k ν g μν q ¼ q ¼ m 20 c2 z(1 z)h 2 k k d 2q ¼ μ q ¼ ν g μν q ¼ q ¼ m 20 c2 z(1 z)h 2 k k 2z(1 z)h 2 (k μ k ν g μν k k)
reduziert. Für Π(2)μν ergibt sich damit (2)μν
Π
2q ¼ μ q ¼ ν g μν q ¼ q ¼ m 20 c2 z(1 z)h 2 k k d ¼ dz dq 2 0 q ¼ q ¼ m 20 c2 z(1 z) h 2 k k i ε d μ 4 d e 2 1 2z(1 z)h 2 (k μ k ν g μν k k) d ¼ i dz 2 d q d 2 2 (2π h ) ¼ ¼ 2 0 q q m 0 c z(1 z) h k k i ε de2 μ4 d 1 2z(1 z)h 2 (k μ k ν g μν k k) d ¼ i dz 2 d q d 2 2 (2π h ) ¼ ¼ 2 0 q q m 0 c z(1 z) h k k i ε
s.u.
d μ4 d e2 i (2π h )d
(10.99)
1
2h 2 e2 μ4 d π d/2 d Γ (2 d/2) (k μ k ν g μν k k) (2π h )d Γ (2) 1 2 2 z(1 z) dz2 2 d/2 . 0 m 0 c z(1 z) h k k
Dabei wurde in dem mit gekennzeichneten Schritt (10.100) mit n 0 und q 0 benutzt, was zum Wegfall des ersten Integrals führte. Für d 4 δ folgt daraus mit dΓ (2 d/2)(4 δ)Γ (δ/2)4 2/δ C 1/2 (δ) und Γ (2)1 sowie der Abkürzung N(k, z)m 20 c2 z(1 z) h 2 k k /(4π h 2 μ2 ) s.u.
Π(2)μν
(10.105)
– dabei wurde
1 e2 (k μ k ν g μν k k) 2 1 C (δ) δ 2 2π 2 h 2 0 2 μ ν μν e (k k g k k) 2 1 C (δ) 16 δ 2 2π 2 h 2
2z 0
δ 2
1
z(1 z) ln N(k, z) dz 0
z(1 z) dz 1/6 benutzt –, woraus sich schließlich
Π(2)μν (k)
RΠ ( k )
mit
ergibt.
z(1 z) dz
N(k, z)δ/2
e2
6π 2 h 2
(k μ k ν g μν k k)
C 1/2 2
3
1
RΠ ( k ) (δ) δ
1
z(1 z) ln 0
m 2 c2 z(1 z) h 2 k k 0 4π h 2 μ2
(10.107)
dz
10.9 Dimensionsmäßige Regularisierung
337
Vertexkorrektur. Einsetzen von (9.84) und (9.88) in (10.91) liefert unter dem später kommentierten Weglassen der ε-Terme in d-dimensionaler Verallgemeinerung mit Dim(μ/k) 1 d
e2 μ0 c h 3 μ4 i (2π)d
(2)μ
Λ
gαβ γ α (/ q ¼ h k/m 0 c)γ μ (/ q h k/m 0 c)γ β d d k . h 2 k k (q ¼ h k)(q ¼ h k) m 20 c2 (q h k)(q h k) m 20 c2
Unter Benutzung der Feynman-Formel (10.96) mit a h 2 kk, b(q h k)(q h k) m 20 c2 und c(q ¼ h k)(q ¼ h k) m 20 c2 wird daraus Λ(2)μ i
2e2μ0 ch 3μ4 d 1 1 x γ α ( q/ ¼ h k/m 0 c)γ μ ( q/ h k/m 0 c)γα d d k dx dy 3 . d (2π) 0 0 h 2 k k m 2 c2 (x y) 2h k (q x q ¼ y)q q x q ¼q ¼ y 0
Mit der Substitution h k ¼ h k q x q ¼ y geht dies in Λ(2)μ
1 x 2e2 μ0 c h 3 μ4 d 1 d x dy (2π)d 0 0 α ¼ γ q/ (1 y) h k/¼ q/ x m 0 c γ μ q/ (1 x) h k/¼ q/ ¼ y m 0 c γα d ¼ 2¼ ¼ 22 3 d k h k k m 0 c (x y)q q x(1 x)q ¼ q ¼ y(1 y) 2q q ¼ x y i
über. Bei der Integration über d d k ¼ liefern die in k ¼ linearen Terme des Zählers den Beitrag null, und das verbleibende Integral zerlegen wir gemäß Λ(2)μ
Λ(2)μ Λ(2)μ 1 2
mit (2)μ
(2)μ
Λ1
Λ2
(10.108)
1 x 2e2 μ0 c h 3 μ4 d 1 d x d y γ α q/ ¼ (1 y) q/ x m 0 c d (2π) 0 0 d ¼ μ ¼ γ q/ (1 x) q/ y m 0c γα N(kd¼ , x,k y)3 , 1 x α ¼ μ ¼ 2e2 μ0 c h 5 μ4 d 1 γ k/ γ k/ γα d ¼ i dx dy d k d (2π) N(k ¼ , x, y)3 0 0 i
und N(k ¼ , x, y)
h 2k k ¼
¼
m 20 c2 (x y)q q x(1 x)q ¼ q ¼ y(1 y) 2q q ¼ x y .
Die Berücksichtigung der ε-Terme hätte in N den zusätzlichen Faktor i ε mit ε>0 gebracht, womit bezüglich der Polstellen genau die Voraussetzungen erfüllt sind, die uns zur Anwendung der im Exkurs 10.1 abgeleiteten Formeln berechtigen und aus denen ε aufgrund der Wick-Rotation herausfällt. Auch die Voraussetzung >0 ist erfüllt, wir werden in Abschn. 10.11.2 sehen, daß in dem von uns benötigten Kontext durch die rechte Seite von Gleichung (10.158) gegeben ist. (2)μ In Λ1 ist das Integral über d d k ¼ auch für d 4 konvergent, da der Integrand für k ¼ wie 1/k ¼ 6 gegen null geht. Wir können daher d 4 setzen und erhalten unter
338
10 Quantenelektrodynamik
Benutzung von Gleichung (10.99) für x hk ¼ , d 4x h 4 d 4 k ¼ und n 3 2 i π Γ (1) d 4k¼ . N(k ¼ , x, y)3 h 4 Γ (3) m 20 c2 (x y)q q x(1x)q ¼ q ¼ y(1 y)2q q ¼ x y Damit sowie mit Γ (1)1 und Γ (3)2 wird schließlich e2 μ0 c 1 1 x γ α q/ (1 y) q/ x m 0 c γ μ q/ (1x) q/ y m 0 c γα (2)μ Λ1 dy . dx 16 π 2h 0 0 m 20 c2 (x y)q q x(1x)q q y(1 y)2q q x y (10.109) (2) Zur Berechnung von Γμ benutzen wir α kρ kσ γ k/ γμ k/ γα d α ρ σ d k dd k γ γ γμ γ γα N(k , x, y)3 N(k , x, y)3 (10.101)
i π d/2 Γ (2d/2) γ α γ ρ γμ γ σ γα gρσ 2 2Γ (3) h d 2 m 20 c2 (x y)q q x(1x)q q y(1 y)2q q x y
d/2
und γ α γ ρ γμ γ σ γα gρσ
(10.103)
γ α γ ρ γμ γρ γα
(2.204)
(2d)γ α γμ γα
γ α γ ρ (2gμρ γρ γμ )γα
(2d)γ α (2gμα γα γμ ) (2d)2 γμ ,
setzen wieder d 4δ und erhalten α i π 2 π δ/2 1δ (δ 2 ) Γ (δ/2) γμ γ k/ γμ k/ γα d d k δ/2 N(k , x, y)3 h 6 h δ m 20 c2 (x y)q q x(1x)q q y(1 y)2q q x y sowie
1δ (δ 2 ) Γ (δ/2)e2 μ0 cγμ 1 dx 8π 2 h 0 δ/2 1 x 4π h 2 μ2 δ/2 d y . 2 0 m 0 c2 (x y)q q x(1x)q q y(1 y)2q q x y Mit 1δ (δ 2 ) Γ (δ/2)2/δ C 2 (δ), der (10.105) entsprechenden Entwicklung des Integranden und mit 1 1 1 x 1 dx dy (1x) d x 2 0 0 0 (2)μ Λ2
(2)μ
erhalten wir schließlich nach Berechnen von Λ2 als Endergebnis für Λ(2)μ e 2 μ0 c 1 (2)μ (2)μ μ Λ (q , q) RΛ (q , q) γ Λ1 (q , q) (δ) (10.110) 8π 2 h δ mit 4 1 1 x3 2 2 m 0 c (x y)q q x(1x)q q y(1 y)2q q x y C 2 d y, dx ln RΛ 2 4π h 2 μ2 0 0 (2)μ
wobei Λ1
durch (10.109) gegeben ist.
10.10 Renormierung
339
10.10 Renormierung Durch die im letzten Abschnitt vorgenommene Regularisierung konnten die für die primitiv divergenten Graphen der Selbstenergie und der Vertexkorrektur abgeleiteten Integrale in einen divergenten und einen regulären Anteil zerlegt werden. In diesem Abschnitt werden in einer als Renormierung bezeichneten Prozedur physikalische Parameter wie die Ruhemasse und die elektrische Ladung der Elektronen durch Unterscheidung zwischen ihren in die Rechnung eingegangenen Werten und ihren bei einer Wechselwirkung wirksam werdenden Bestandteilen so umdefiniert, daß wir es am Ende nur noch mit endlichen Größen zu tun haben. Die Vorgehensweise ist also anders als bei der in Kapitel. 8 bei Einzelteilchenzuständen vorgenommenen Renormierung, wo divergente Integrale einfach als physikalisch irrelevant weggelassen wurden. Zur Vorbereitung nehmen wir im folgenden zuerst noch einige Umformungen vor.
10.10.1 Vorbereitung Als erstes befassen wir uns mit dem durch die Selbstenergie des Elektrons modifizierten Propagator des Dirac-Feldes (10.88), SF¼ (2) (q) SF (q) SF (q)Σ (2) (q) SF (q) .
(10.111)
Nach Art der Herleitung wurde der Korrekturterm SF (q)Σ (2) (q) SF (q) dabei trotz seiner (2) Divergenz als kleine Größe behandelt, was wegen Σdiv e2 μ0 /δ α/δ (nach (10.106)) zulässig ist, wenn wir uns vorerst auf δ-Werte im Bereich 1δ α 1/137 beschränken. Statt (10.111) können wir dann auch 1 SF¼ (2) (q) 1 SF (q)Σ (2) (q)
(10.112)
schreiben, was sich durch Betrachten der Reihe SF¼ (2)
SF SF Σ (2) SF SF Σ (2) SF Σ (2) SF SF Σ (2) SF Σ (2) SF Σ (2) SF . . .
(10.113)
erkennen läßt: Für diese gilt SF¼ (2)
SF SF Σ (2) SF SF Σ (2) SF . . . SF SF Σ (2) SF¼ (2) ,
und Linksmultiplikation dieser Beziehung mit SF 1 liefert ( SF 1 Σ (2) ) SF¼ (2) 1 oder (10.112). Der Vergleich der (10.112) äquivalenten Reihe (10.113) mit (10.111) zeigt, daß bis auf Terme der Ordnung (Σ (2) )2 Übereinstimmung besteht. Tatsächlich ist (10.112) sogar mehr als eine (10.111) gleichwertige Näherung, denn diagrammatisch entspricht die Reihe (10.113) der Summe der Feynman-Diagramme +
+
+ ...
340
10 Quantenelektrodynamik
– man beachte, daß gegenüber dem Diagramm der Abb. 10.16 (b) die analytisch durch SF beschriebene Fortsetzung der Fermionlinie über die Vertizes hinaus fehlen muß, weil hier Σ (2) und dort SF Σ (2) SF dargestellt wird –, und die zusätzlich auftretenden Teildiagramme sind Beiträge, die in höheren Ordnungen als weitere Korrekturterme hinzutreten. Aus (10.112) ergibt sich mit (10.92b) SF¼ (2) (q)
h (2) (q) q/ m 0 chΣ
(10.114)
bzw. nach Einsetzen des Ergebnisses (10.106) für Σ (2) (q) und mit der Definition (Q2.39) bzw. α e2 μ0 c/(4π h) SF¼ (2) (q)
α q/ m 0 c 2π
α 1 2πδ
h
4m 0 c q/ δ
RΣ
h RΣ α α 4 q/ 1 2πδ m 0 c 1 2π δ m 0 c
h C . R α 4 α q/ m 0 c 1 2π 1 Σ δ m0c 2πδ
Durch Entwicklung der eckigen Klammern des Zählers nach α bis zu linearen Termen ergibt sich hieraus schließlich α h 1 2πδ ¼ (2) . (10.115) SF (q) 3α α RΣ (q) q/ m 0 c 1 2πδ 2π m 0 c Zu den inneren Fermionlinien gibt es weitere Korrekturen höherer Ordnung, die in der Reihe (10.113) noch nicht enthalten sind. Diejenigen Diagramme höherer Ordnung, die den in dieser Reihe bereits enthaltenen Korrekturen zugeordnet sind, zerfallen nach der obigen Feynman-Darstellung durch Zerschneiden der Elektronlinie zwischen zwei nicht durch innere Photonlinien verbundenen Vertizes in Diagramme für Korrekturen niedrigerer Ordnung und werden daher als reduzibel bezeichnet. Alle Korrekturdiagramme, bei denen das nicht möglich ist, heißen irreduzibel. Durch die Summe der letzteren definieren wir eine Matrix Σ(q), für die in der diagrammatischen Formel Σ(q)
+
+
+ ... =
1I
einige irreduzible Teildiagramme angegeben sind. Für die Summe aller irreduziblen Teildiagramme wird das nach dem letzten Gleichheitszeichen angegebene Diagramm benutzt. Mit dem auf diese Weise definierten Σ läßt sich eine (10.113) entsprechende Reihe bilden, die sich analog zu (10.112) zu 1 SF¼ (q) 1 SF (q)Σ(q)
(10.116)
10.10 Renormierung
341
summieren läßt und die graphische Darstellung =
1I
+
1I
1I
+
1I
1I
1I
+ ...
besitzt. Der auf diese Weise erhaltene Propagator würde alle möglichen divergenten Korrekturen innerer Fermionlinien enthalten und wäre daher vollständig – die Berechnung von Σ würde allerdings die Auswertung unendlich vieler Diagramme erfordern. Das in (10.114) bzw. (10.115) angegebene Ergebnis stellt eine bis auf Terme der Ordnung Σ 2 korrekte Näherung an diesen Propagator dar, weil in niedrigster Ordnung Σ Σ (2) gilt. Ganz ähnlich behandeln wir den durch die Vakuumpolarisation modifizierten Photonenpropagator (10.86) bzw. gleich dessen Verallgemeinerung ¼ (k) i DFαβ (k) i DFαμ (k) i Π μν i DFνβ (k) . i DFαβ
(10.117)
Darin ist Π μν ein Polarisationstensor, der durch Summation aller irreduziblen Teildiagramme für die Selbstenergie des Photons entsteht und in niedrigster Ordnung mit dem in (10.87) angegebenen Polarisationstensor Π(2)μν übereinstimmt. Man kann zeigen, daß Π μν die gleiche Struktur wie Π(2)μν besitzt, sich also (10.107) entsprechend in der Form Π μν (k) R(k ) k μ k ν
Π(k ) g μν
mit
R(k )
Π(k ) k k
(10.118)
schreiben läßt, wobei in der später benötigten niedrigsten Ordnung Π (2) (k )
e2 k k 1 RΠ (k ) 6π 2 h 2 δ
(10.119)
gilt. Die in (10.118) angegebene Form von Π μν (k) ist übrigens notwendig dafür, daß die Eichinvarianz der Maxwell-Theorie auch in deren quantisierter Form erhalten bleibt. Beweis: Um das einzusehen, betrachten wir die Wechselwirkung eines Elektrons mit einem äußeren Potential A μ (x), also einen Prozeß, der als Verallgemeinerung der in Abschn. 10.2.2 untersuchten Mott-Streuung aufgefaßt werden kann. (Das zugehörige Feynman-Diagramm ergibt sich, wenn man in Abb. 10.3 Φ(x) durch Aμ (x) ersetzt.) Aus Gleichung (10.25) läßt sich schließen, daß die Übergangsamplitude hier den Faktor u(l ¼ , p¼ ) γ α u(l, p) A α (k)
mit
¼ hk p p
enthält, wobei A α (k) die Fourier-Transformierte von A μ (x) ist. Durch die Selbstenergie des Photons ergibt sich in Analogie zu (10.117) das strahlungskorrigierte Feld (10.140) (Beweis dort), das in u ¼ γ α u A α zu einem Korrekturterm
u(l ¼ , p¼ ) γ α u(l, p)gαμΠ μν A ν (k) u(l ¼ , p¼ ) γ α u(l, p)Παν A ν (k)
(10.120)
führt. Bei Eichinvarianz darf sich dieser Ausdruck nicht verändern, wenn A ν (x) durch A ν (x)∂ν Λ(x) ersetzt wird bzw. A ν (k) durch A ν (k)i kν Λ(k) nach Fourier-Transformation. Das ist jedoch nur der Fall, wenn Παν k ν 0 gilt, und aus (10.118) folgt gerade die Gültigkeit dieser Gleichung.
342
10 Quantenelektrodynamik
Außer der durch i DFαμ i Π μν i DFνβ beschriebenen Korrektur zu i DFαβ gibt es auch hier noch weitere Korrekturen, die der Graphengleichung =
1I
+
1I
1I
+
1I
1I
1I
+ ...
entsprechen, wobei das erste Element der rechten Seite Π μν darstellt. In Matrixnotation für DFαβ und Π μν lautet die entsprechende analytische Gleichung i D¼F
i DF i DF i Π i DF i DF i Π i DF i Π i DF . . . ,
und in Analogie zu (10.112) liefert die Summe mit identischem Beweisgang i D¼F
1 (i DF )
1 i Π
.
(10.121)
In dem folgenden Beweis wird gezeigt, daß der Term R(k ) k μ k ν in Π μν weggelassen werden darf, da er bei der Berechnung von Matrixelementen keinen Beitrag liefert. Beweis: Auch äußere Photonlinien werden durch die Selbstenergie des Photons modifiziert, d. h. =
+
+ ... .
In diesem Fall wird statt des Faktors A ν (k) wie in Gleichung (10.120) der in Tabelle 10.5 angegebene Faktor für eine äußere Photonlinie mit Π αν multipliziert. Dabei entsteht bezüglich des (λ¼ )
k μ k ν -Terms das Produkt εα k α k ν R(k ), und dieses ist nach (8.118a,b) gleich null, da ein- und auslaufende Photonen als reelle Teilchen nur transversal polarisiert sein können. Ist die durch die Selbstenergie modifizierte Photonlinie eine innere Linie, so grenzt sie an zwei Vertizes, an denen je zwei Fermionlinien münden. Wenn wir uns auf Strahlungskorrekturen von Prozessen zweiter Ordnung beschränken, muß es sich dabei um ein- und auslaufende Fermionlinien handeln. In dem Beitrag, der von dem einen Vertex und den bei diesem einmündenden Linien zur Übergangsamplitude herrührt, also z. B. dem Teildiagramm p¼ hk p entspricht, tritt nach Tabelle 10.5 ein Teilbeitrag auf, der unter Berücksichtigung der Strahlungs(2) korrekturen zweiter Ordnung den Faktor u(l ¼ , p¼ )γ α u(l, p) D ¼ Fαβ (k) enthält. Der k μ k ν -Term lie-
fert dazu nach (10.117)–(10.118) mit DFαμ (k)... DFνβ (k)gαμ ...gνβ /(k k)2 einen Beitrag gαμ R(k )k μ k ν gνβ 4 ¼ δ p phk (k k)2 R(k )kα kβ d 4x (9.71) u(l ¼ , p¼ ) γ α u(l, p) ei ( p p h k) x/h 2 (k k) (2π)4 4 R(k )kβ s.u. α ψ (x) ∂ e i k x d x . ψ (x) γ α l p l p i (k k)2 (2π)4
u(l ¼ , p¼ ) γ α u(l, p)
½ ½
½ ½
¼
¼
¼
¦Æ ¡ Æ
¦ ¡
10.10 Renormierung
343 ¼
Dabei wurde im letzten Schritt ψl p (x) u(l, p) e i p ¡x/hÆ und ψ l p (x) u(l ¼ , p¼ ) ei p ¡x/hÆ gesetzt, was die ein- und auslaufende ebene Elektronenwelle darstellt, außerdem wurde i kα e¦i k ¡x benutzt. Durch partielle Integration ergibt sich ∂α e¦i k ¡x ¼
½
d 4x ψ l ¼ p¼ (x) γ α ψl p (x) ∂α e¦i k ¡x 4 (2π)
½
¼
d 4x s.u. e¦i k ¡x ∂α ψ l p (x) γ α ψl p (x) 0, (2π)4 ½ ½
¼
¼
weil nach (8.189a) und (8.190b) mit (8.187) p/u
m 0 cu
p/ψl p
m 0 cψl p ,
u p/ m 0 cu
ψ l p p/ m 0 cψ l p ¼
¼
¼
¼
und damit ∂α ψ l p γ α ψl p ¼
¼
i ¼ ∂α ψ l p γ α ψl p ψ l p γ α ∂α ψl p p ψ γ α ψl p ψ l p γ α pα ψl p h α l p
im c i ψ l p p/¼ ψl p ψ l p p/ψl p 0 ψ l p ψl p ψ l p ψl p 0 h h
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
gilt.
Unter Berücksichtigung der eben bewiesenen Tatsache ergibt sich aus (10.121) mit (9.88) und (10.118) bei Unterdrückung des ε-Terms ¼ i DFαβ
s.u.
1 1 i hμ i Π(k ) g αβ 0 c gαβ /k k
s.u.
1 αβ g αβ k k/(i hμ c) 0 i Π(k ) g
i hμ 0 c gαβ . k k hμ 0 cΠ(k ) β
(Dabei wurde zweimal benutzt, daß g αβ wegen gαμ g μβ δα die zu gαβ inverse Matrix ist.) Hieraus folgt nach Herauskürzen des Faktors i mit (10.119) in zweiter Ordnung (2)
D ¼ Fαβ (k)
hμ hμ (Q2.39) 0 c gαβ 0 c gαβ 2α 1 1 k k 1 3π δ RΠ (k ) k k δ RΠ (k ) hμ 2α 2α 0 c gαβ R Π ( k ) , 1 3πδ 3π k k
s.u.
2 1 e6πμ20hc Æ
wobei im letzten Schritt nach α entwickelt wurde. Für das letzte Ergebnis können wir auch hμ 2α 2α 0 c gαβ (2) 1 R Π ( k ) (10.122) D ¼ Fαβ (k) 1 3πδ 3π k k schreiben, da in α nur bis zu linearen Termen entwickelt wurde und der Unterschied von (α 2 ) ist. Auch zur Vertexkorrektur kommen noch Korrekturen höherer Ordnung, durch die in Analogie zu (10.90) ein allgemeiner Vertexfaktor Γμ
γ μ Λμ
γ μ Λ(2)μ Λ(4) μ . . .
(10.123)
344
10 Quantenelektrodynamik
mit der graphischen Darstellung =
+
+
+ ... (2)μ
definiert wird. Unter Berücksichtigung der Tatsache, daß nach (10.109) Λ1 α gilt, ergibt sich aus (10.90) mit (10.110) und (Q2.39) die bis zu linearen Termen in α korrekte Beziehung
α α RΛ μ α α RΛ μ (2)μ (2)μ (2)μ 1 2πδ 2π γ Λ1 1 2πδ 1 2π γ Λ1 (α2 ) . Γ Mit 1α/(2πδ)1α/(2πδ) Γ
(2)μ
(q , q) ¼
1
(α2 ) schreiben wir dafür
(2)μ 1α RΛ (q ¼ , q)/(2π) γ μ Λ1 (q ¼ , q) . 1α/(2πδ)
(10.124)
10.10.2 Renormierung in niedrigster Ordnung Wenn δ wie zu fordern gegen null geht, entstehen in den für SF¼ (2) (q), D ¼ Fαβ (k) und Γ (2)μ (q ¼ , q) erhaltenen Ausdrücke nach (10.115), (10.122) und (10.124) Singularitäten. Der Vergleich des ursprünglichen Fermionenpropagators (10.92b) mit seiner durch Berücksichtigung der Selbstenergie erhaltenen Modifikation (10.115) gibt einen Hinweis darauf, wie diese Singularitäten behoben werden können. Der Nenner hat in beiden Ausdrücken dieselbe Struktur, nur daß in (10.115) die Ruhemasse m 0 mit einem divergenten Faktor versehen ist. Das Feynman-Diagramm für die Selbstenergie des Elektrons, Abb. 10.16 (b), läßt den Grund dafür erkennen: Das Elektron tritt mit dem von ihm selbst erzeugten elektrischen Feld in Wechselwirkung. Dasselbe Phänomen ist uns schon in der klassischen Theorie des Elektrons bei der Diracschen Ableitung der Lorentz-Dirac-Gleichung begegnet (Spezielle Relativitätstheorie, Exkurs „Skizze der Diracschen Ableitung“). Dort wurde die beobachtete Ruhemasse m 0 gemäß m 0 m £0 m em in eine „nackte Ruhemasse“ m £0 und einen elektromagnetischen (a) Masseanteil m em zerlegt, der nach der Beziehung m em e2 /(8πε0 ac2) (siehe Abschn. „Elektromagnetische Theorie des Elektrons“ der Speziellen Relativitätstheorie) unendlich wird, wenn der Elektronenradius a 0 geht. Von dort greifen wir die Möglichkeit auf, die Ruhemasse in verschiedene Bestandteile zu zerlegen, und wählen einen von diesen so groß, daß er eine der Divergenzen kompensiert. Bevor wir uns näher mit dieser Aufgabe befassen, soll noch geklärt werden, welche weiteren Größen durch eine Reinterpretation zur Renormierung herangezogen werden können. Außer der Ruhemasse bietet sich natürlich auch die elektrische Elektronenladung e an, ansonsten kommen von den zur Berechnung von Übergangsamplituden benutzten Faktoren aus Tabelle 10.5 nur solche Größen in Frage, die nicht variabel sind, und da auch allgemeine Naturkonstanten wie h und c ausscheiden, verbleiben nur noch die Amplituden externer Fermionen und Photonen. (2)
10.10 Renormierung
345
Wir werden in diesem Abschnitt die in (10.115), (10.122) und (10.124) enthalte(2)μ nen regulären Strahlungskorrekturen RΣ (q), RΠ ( k ), RΛ (q ¼ , q) und Λ1 (q ¼ , q), die ja Korrekturen der (α) sind, der besseren Übersichtlichkeit halber vernachlässigen. Welche physikalischen Konsequenzen ihre Berücksichtigung nach sich zieht, wird für einige von ihnen in Abschn. 10.11 nachgeholt. Renormierung des Fermionenpropagators. Als erstes wenden wir uns der Divergenz des Fermionenpropagators zu und stellen uns dazu auf den Standpunkt, daß die in die Formeln (10.115), (10.122) und (10.124) eingegange Masse m 0 nicht die beobachtete Ruhemasse ist, sondern gemäß m0
m 0r
m 0
(10.125)
aus der beobachteten bzw. renormierten Ruhemasse m 0r und einem Korrekturanteil m 0 zusammengesetzt ist. Den letzteren wählen wir so, daß er einen der von den Strahlungskorrekturen herrührenden divergenten Bestandteile von SF¼ (2) (q) gerade kompensiert. Bevor wir δ 0 gehen lassen, fassen wir den zu kompensierenden Term jedoch als Entwicklungsterm erster Ordnung in der Entwicklung nach α auf und nehmen daher an, daß auch m 0 (α) gilt. Mit der Zerlegung (10.125) und unter Vernachlässigung des RΣ -Terms lautet der Nenner von SF¼ (2) (q) nach (10.115) 3α 3α s.u. . q / m 0r cm 0 cm 0r c N S q/ (m 0r m 0 )c 1 2πδ 2πδ ¼
Dabei wurde im letzten Rechenschritt ein Term α m 0 als Term zweiter Ordnung in α vernachlässigt. Wenn wir jetzt 3α m 0r m 0 (10.126) 2πδ setzen, wird N S
¼
q/ m 0r c, und aus (10.115) folgt SF¼ (2) (q)
h Z 2 q/ m 0r c
mit
Mit der Definition SFr (2) (q)
Z2
h q/ m 0r c
1
α . 2πδ
(10.127)
(10.128)
eines renormierten Fermionenpropagators SFr (2) (q), der regulär ist, erhalten wir schließlich SF¼ (2) (q) Z 2 SFr (2) (q) . (10.129) Nunmehr können wir δ 0 und damit Z 2 gehen lassen. Nach (10.126) wird dann m 0 , was nach (10.125) zur Folge hat, daß auch die Ruhemasse m 0 , mit der die Rechnung begonnen wurde, unendlich wird. Bei der weiter unten besprochenen Renormierung der Vertexkorrektur werden wir sehen, daß trotz der mit Z 2 verbundenen Divergenz von SF¼ (2) (q) endliche Übergangsamplituden erhalten werden, weil in diese nach allen Renormierungen nur SFr (2) (q) eingeht.
346
10 Quantenelektrodynamik
Renormierung des Photonenpropagators. Nach (10.122) mit (Q2.39) gilt unter Vernachlässigung des RΠ -Terms (2)
D ¼ Fαβ (k) Z 3
hμ 0 c gαβ k k
mit
Z3
1
2α . 3πδ
(10.130)
In Analogie zu (10.128) definieren wir durch (2) DFr αβ (k)
hμ 0 c gαβ k k
(9.88)
DF αβ (k)
(10.131)
(2)
einen renormierten Photonenpropagator DFr αβ (k) und erhalten damit (2) D ¼ Fαβ (k) Z 3 DF αβ (k) .
(10.132)
(2)
Auch die Beseitigung der durch D ¼ F αβ (k) über Z 3 hervorgerufenen Singularität wird im Zusammenhang mit der Vertexkorrektur besprochen. Glücklicherweise ergibt sich keine Notwendigkeit zu einer Renormierung der – verschwindenden – Ruhemasse der Photonen. Renormierung äußerer Linien. Wie schon im letzten Abschnitt festgestellt gibt es bei den äußeren Linien die gleichen Strahlungskorrekturen wie bei den inneren, was diagrammatisch durch den Übergang von einer Linie ohne zu einer mit Strahlungskorrekturen gemäß
=
+
+ ... ,
=
+
+ ...
zum Ausdruck gebracht wird. Unter Einbeziehung der Massenrenormierung bei den Fermionen entsprechen die Diagramme nach Tab. 10.5 den Ersetzungen
m 0 u(l, p)
m 0r u ¼ (l, p) , εα(λ)(k)
m 0 v(l, p)
m 0r v ¼ (l, p) ,
εα¼ (λ)(k) ,
wobei die Amplituden u ¼ (l, p) und v ¼ (l, p) von Fermionen bzw. εα¼ (λ)(k) von Photonen aufgrund der Strahlungskorrekturen in Analogie zu den entsprechenden Ausdrücken für (2) die inneren Linien, SF¼ (2) (q) bei Fermionen und D ¼ Fαβ (k) bei Photonen, divergent sind. Die Zuordnung mathematischer Faktoren zu den Elementen von Feynman-Graphen ist zwar nach Tab. 10.5 bei inneren und äußeren Linien verschieden, die Divergenz erzeugenden Faktoren sind jedoch bei beiden für jede Teilchensorte die gleichen; dabei ist allerdings zu beachten, daß sie nach den in Abschn. 10.6.1 zur Tabelle 10.5 gegebenen Erläuterungen bei den inneren Linien doppelt auftreten. (Die inneren Linien zugeordneten Faktoren sind quadratisch, die äußeren Linien zugeordneten Faktoren linear in den Feldamplituden.) Da SF¼ (2) (q) nach (10.129) wie Z 2 divergiert, muß daher
10.10 Renormierung
347
u ¼ (l, p) (Z 2 )1/2 sowie v ¼ (l, p) (Z 2 )1/2 gelten, und entsprechend folgt aus (10.132) εα¼ (λ) (k) (Z 3 )1/2 . Wir können daher durch u ¼ (l, p) Z 2 u r (l, p) , v ¼ (l, p) Z 2 vr (l, p) , εα¼ (λ)(k) Z 3 εr(λ) α(k) (10.133) (λ) renormierte Feldamplituden u r (l, p), vr (l, p) und εr α(k) einführen, die regulär sind und den Orthonormierungsbedingungen (8.191) mit m 0 m 0r oder (8.192) bzw. (8.119) genügen. Bei der gleich folgenden Beseitigung der durch die Vertexkorrektur hervorgerufenen Divergenz wird sich zeigen, daß durch die Anwendung von (10.133) auf alle äußeren Linien in Kombination mit den anderen Renormierungsvorschriften sämtliche Divergenzen beseitigt werden. Beseitigung der Divergenz der Vertexkorrektur. Bei den an einem Vertex einmündenden drei Linien handelt es sich um zwei Fermion- und eine Photonlinie, unter denen sich keine, eine, zwei oder drei externe Linien befinden können. Da sich unter ein oder zwei am gleichen Vertex einmündenden externen Linien jeweils eine oder keine Photonlinie befinden kann, gibt es insgesamt 12 216 verschiedene Möglichkeiten (22 kommt von den Fällen ein bzw. zwei externe Linien mit je zwei Möglichkeiten bezüglich der Photonlinien), von denen in Abb. 10.18 repräsentativ drei dargestellt sind. Wir wollen durch eine weitere Renormierung erreichen, daß alle derartigen Teildiagramme, die alle möglichen Strahlungskorrekturen enthalten, endlich werden. Da es nur auf die divergenten und die renormierbaren Faktoren ankommt, kann man sich auf diese konzentrieren und es sich ersparen, für alle sechs möglichen Fälle die Übergangsamplitude zu berechnen. (2)μ Nach (10.124) gilt unter Vernachlässigung der regulären Terme RΛ α und Λ1 α Γ (2)μ
γμ Z1
mit
Z1
α . 1 2πδ
(10.134)
Vom Vertex erhalten wir daher nach Tab. 10.5 den divergenten Faktor FV e/Z 1 , wobei e die einzig verbliebene renormierbare Größe ist. Von jeder am Vertex einmündenden Fermionlinie stammt unter Berücksichtigung der Selbstenergie der Faktor FF (Z 2 )1/2 (da zwei Fermionlinien einmünden, insgesamt zweimal) und von jeder Photonlinie der Faktor FPh (Z 3 )1/2 (einmal), in beiden Fällen unabhängig davon, ob es sich um eine innere oder äußere Linie handelt. (Bei den inneren Linien liefert zwar SF¼ (2) (q) den (2) Faktor Z 2 und D ¼ Fαβ (k) den Faktor Z 3 , dieser verteilt sich jedoch jeweils auf zwei Vertizes, weshalb zu einem Vertex jeweils nur die Wurzel davon beiträgt.) Insgesamt tritt in jedem der sechs möglichen Diagramme am Vertex der gleiche Faktor F
FV (FF )
2
FPh
eZ 2 Z 3 Z1
e
s.u.
Z3
(10.135)
auf, wobei zuletzt benutzt wurde, daß sich nach (10.127b) und (10.134b) Z 1 gegen Z 2 wegkürzt. Damit die betrachteten Beiträge zur Übergangsamplitude endlich bleiben, führen wir eine Renormierung der Ladung durch, d. h. wir zerlegen die Elektronenladung gemäß e er e (10.136)
348
10 Quantenelektrodynamik
int
ext
int int
int
int int
(a)
ext
(b)
(c)
ext
Abb. 10.18: Drei von sechs Möglichkeiten für die an einem Vertex einmündenden Linien mit sämtlichen Strahlungskorrekturen. Innere Linien sind mit „int“, äußere mit „ext“ gekennzeichnet.
in eine renormierte Ladung er und eine Korrektur e (α). Aus (10.135) ergibt sich damit 2α 1/2 α F e Z 3 (er e) 1 er (α 2 ) . er e 3πδ 3πδ Wählen wir jetzt e so, daß e
α er 3πδ
(α2 )
(10.137)
gilt, so ergibt sich für den Faktor F der endliche Wert F
er .
(10.138)
Für δ 0 geht e, was bedeutet, daß die Ladung e, mit der die Rechnung begonnen wurde, unendlich sein muß. Durch die Ladungsrenormierung ist erreicht, daß in der betrachteten Ordnung der Störungsrechnung alle Übergangsamplituden endlich bleiben. F er ist der Faktor, der bei deren Berechnung den ursprünglichen Vertexfaktor e ersetzen muß, wenn unter Berücksichtung der Selbstenergie aller einlaufenden (inneren und äußeren) Linien die divergenten Propagatoren bzw. Amplituden durch renormierte ersetzt werden. Wir können uns jetzt überlegen, welchen Einfluß die Strahlungskorrekturen auf die in Tab. 10.5 angegebenen Feynman-Regeln zur Berechnung von Übergangsamplituden unter Berücksichtigung der Renormierung haben. Werden in der Tabelle die (λ) vorgenommen, so gilt Ersetzungen m 0 m 0r , eer , u u r , v vr und εα(λ) εrα nach (10.128) auch SF (q) SFr (2)(q), und nach (10.131) ist schon von Hause aus (2) D Fr αβ (k) DF αβ (k). Mit e er ist auch die an den Vertizes vorzunehmende Korrektur erledigt. Damit läuft die Berechnung von Übergangsamplituden unter Berücksichtigung sämtlicher divergenten, aber Vernachlässigung aller endlichen Strahlungskorrekturen nach der Renormierung darauf hinaus, daß nur Umbenennungen vorgenommen werden müssen. Alle weiteren Rechnungen verlaufen so, als wären die divergenten Strahlungskorrekturen nicht vorhanden, da sie durch die Benutzung renormierter Größen schon berücksichtigt sind. Auf die Umbenennungen kann dann schließlich auch verzichtet werden.
10.11 Auswirkungen regulärer Strahlungskorrekturen
349
10.11 Auswirkungen regulärer Strahlungskorrekturen In diesem Abschnitt untersuchen wir einige Auswirkungen der bei der Renormierung bislang ignorierten regulären Strahlungskorrekturen. Führt man unter deren Einbeziehung die gleichen Rechnungen wie im letzten Abschnitt durch, so erhält man aus (10.115), (10.122) und (10.124) mit (10.125)–(10.126) (2) SF¼ (2) (q) Z 2 S Fr (q) ,
(2) (2) D ¼ Fαβ (k) Z 3 D Fr αβ (k) ,
Γ (2)μ (q ¼ , q)
(2)μ
Γr
(q ¼ , q) Z1 (10.139)
mit (2)
S Fr (q)
2α hμ c g h 0 αβ (2) , D Fr αβ (k) 1 RΠ (k ) q/ m 0r cα RΣ (q)/(2π) 3π k k (2)μ Γr(2)μ (q ¼ , q) 1α RΛ (q ¼ , q)/(2π) γ μ Λ1 (q ¼ , q)
und den früheren Werten der Z i . Die divergenten Faktoren Z 1 Z 2 und Z 3 können wie gehabt in einer Redefinition der Ladung und der strahlungskorrigierten Feldamplituden absorbiert werden. Die Feynman-Regeln der Tabelle 10.5 sind jetzt dahin(2) (2) gehend abzuändern, daß die Ersetzungen SF (q) S Fr (q), DFαβ (k) D Fr αβ (k) und (2)μ
γ μ Γr (q ¼ , q) vorgenommen und dann keinerlei Strahlungsterme zweiter Ordnung mehr berücksichtigt werden müssen.
10.11.1 Uehling-Potential Ein besonders einfaches Beispiel für eine physikalische Auswirkung des regulären Beitrags RΠ (k ) zur Selbstenergie des Photons bietet ein externes Potential A0 Φ/c, das wie innere und äußere Photonlinien durch die Photonenselbstenergie beeinflußt wird. Das zugehörige Feynman-Diagramm entspricht dem linken, horizontal verlaufenden Teil der Abb. 10.19. Wie A0 modifiziert werden muß, können wir der Ersetzung (10.85) mit (10.86) für eine innere Photonlinie entnehmen, wenn wir in dieser 2 d 4k i DFαβ (k) unter Ignorieren des Index β durch Aα (k) ersetzen und anschließend (2π)4 Al 0 setzen. Auf diese Weise erhalten wir mit Unterdrückung des ε-Terms in DFαμ (k) Aα
A¼α
Aα
i DFαμ (k) i Π(2)μν Aν
(9.88)
Aα
hμ 0c gαμ Π(2)μν Aν . (10.140) k k
Mit (10.107), unter Berücksichtigung der in Abschn. 10.10.1 bewiesenen Tatsache, daß der zu k μ k ν proportionale Anteil von Π(2)μν keine physikalischen Auswirkungen hat und daher weggelassen werden darf, sowie unter Weglassen des in die Renormierung aufgegangenen 1/δ-Terms erhalten wir daraus ¼
Aα
Aα
e 2 μ0 c gαμ g μν RΠ (k ) Aν 6π 2 h
1
e 2 μ0 c R Π ( k ) A α 6π 2 h
350
10 Quantenelektrodynamik
oder mit (Q2.39) und unter Einschränkung auf A0 Φ/c 2α ¼ RΠ (k ) Φ(k) . Φ (k) 1 (10.141) 3π Mit m 0 2 c2 z(1z)h 2 k k m 0 2 c2 z(1z)h 2 k k ln ln ln 1 m 0 2 c2 4π h 2 μ2 4π h 2 μ2 21 und 0 z(1z)dz 1/6 ergibt sich aus der im Anschluß an (10.107) getroffenen Definition von RΠ (k ) 1 m 0 2 c2 C 1/2 1 z(1z)h 2 k k ln dz . RΠ (k ) 3 z(1 z) ln 1 2 2 4π h 2 μ2 m 0 2 c2 0 Da 1/δ const1/δ für δ 0 gilt, können wir uns vorstellen, daß die konstanten Beiträge zu Π(2)μν in der Renormierung aufgehen, und diese daher in Gleichung (10.141) weglassen. Aus der letzteren wird damit
2α 1 z(1z)h 2 k k dz Φ(k) . Φ ¼ (k) 1 z(1z) ln 1 π 0 m 0 2 c2 Mit der Substitution z (u 1)/2 vereinfachen wir das Integral gemäß 1 1 z(1z)h 2 k k 1 (1u 2 )h 2 k k 2 dz du z(1z) ln 1 (1 u ) ln 1 8 1 m 0 2 c2 4m 0 2 c2 0 1 2 2 2 1 1d(u u 3 /3) (1u 2 )h 2 k k u (u /31) du k k s.u. h ln 1 du , 2 2 k k 2 2 8 1 du 4m 0 2 c2 2 4m 0 0 c (1u )h wobei durch eine partielle Integration der Logarithmus beseitigt und aufgrund der Sym21 21 metrie des zuletzt erhaltenen Integranden 1 du . . . 2 0 du . . . gesetzt wurde, und
erhalten α h 2 k k 1 u 2 (u 2 /31) Φ (k) 1 Φ(k) . du 2 2 2 2 k k π 0 4m 0 c (1u )h Für die Fourier-Transformierte des statischen Potentials Φ(x) gilt Φ(k)
Φ(x) ei k x
2
d 4x (2π)2
eik0 x0
Ze 4πε0 x
d x0 (2π)1/2
Φ(x) ei k x
d 3x (2π)3/2
δ(k0 )Z e , 2πε0 k2
wobei eik0 x0 d x 0 2πδ(k0 ) und (10.24) mit p0 und p /h k benutzt wurde. Setzen wir dies in unser letztes Ergebnis für Φ (k) ein und berücksichtigen, daß wegen des Faktors δ(k0 ) in der Klammer vor Φ(k) nur der Wert k0 0 in Frage kommt, so erhalten wir mit k k k02 k2 k2 schließlich Z eα h 2 1 u 2 (1u 2 /3) Ze Φ (k) δ(k0 ) du . 2πε0 k2 2π 2 ε0 0 4m 0 2 c2 (1u 2 )h 2 k2
10.11 Auswirkungen regulärer Strahlungskorrekturen
351
Dieses Ergebnis soll nun durch Fourier-Rücktransformation in den Ortsraum übersetzt werden, wobei klar ist, daß der erste Term wieder das Coulomb-Potential liefert. 2 Damit und mit δ(k0 ) ei k0 x0 dk0 1 ergibt sich $ % 4 4 ei k x d 3 k Z e 1 α h 2 1 i k x d k 2 u Φ (k) e du u Φ (x) (2π)2 4πε0 x 2π 3 0 3 4m 0 2 c2 (1u 2 )h 2 k2 s.u.
$ Ze 1 4πε0 x
α π
1 0
2m 0 c
u 2 )1/2 (u 2 u 4 /3) e h(1 (1u 2 ) x
x
% du ,
wobei zuletzt die in Büchern über die Fourier-Transformation nachschlagbare Formel e i k x d 3 k ea x 4π x k2 a 2 (2π)3
benutzt wurde. Mit der weiteren Substitution v 1/ 1u 2 , die das Integrationsintervall 1 v und in diesem 2 v 2 1 1 u 2 u 4 /3 1 2 dv du 1 u 2 3v 2 2v zur Folge hat, ergibt sich schließlich nach Herausziehen des gemeinsamen Faktors 1/ x $ % Ze 2α v 2 1 1 2m 0 cv x /h 1 1 2 e Φ (x) dv . (10.142) 4πε0 x 3π 1 v2 2v Dieses erstmals 1935 von E. Uehling berechnete und als Uehling-Potential bezeichnete Potential enthält die durch die Vakuumpolarisation hervorgerufene Strahlungskorrektur des Coulomb-Potentials. Wir wollen das allgemein nicht weiter vereinfachbare Ergebnis (10.142) für den Fall „großer“ x -Werte, d. h. Werte, für die X 2m 0 c x /h 1 gilt, noch näherungsweise auswerten. Dazu setzen wir v 1ε und erhalten damit für das Integral in (10.142) zunächst allgemein ε(2ε) 1 1 e X ε dε . J e X (1ε)2 2(1ε)2 0 Da e X ε wegen des großen Wertes von X mit zunehmendem ε>0 extrem schnell nach null abfällt, gibt es zum Integral nur für sehr kleine Werte von ε wesentliche Beiträge. Wir 2 können daher nach ε entwickeln underhalten in niedrigster Ordnung mit Γ (x) 0 et t x 1 dt und Γ (3/2)Γ (1/2)/2 π/2 J
3 e X
X tXε 3 e ε e X ε dε
2
0
3 e X Γ (3/2)
2 X 3/2
3 π e X
2 X 3/2
2 2 X 3/2
.
t 0
1/2
3 e X et dt
2 X 3/2
0
t 3/21 et dt
352
10 Quantenelektrodynamik
Einsetzen in (10.142) liefert mit X 2m 0 c x /h Φ (x) ¼
Ze 4πε0 x
1
e 2m 0 c x /h 3/2 4 π (m 0 c x /h) α
.
(10.143)
Man erkennt, daß der das Coulomb-Potential korrigierende Klammerausdruck mit wachsenden x wegen des schnellen Abfalls der Exponentialfunktion sehr schnell 13 m gibt es gegen 1 geht. Nur in dem Intervall 0 x < 0 c)λCompt 410 h/(m 3 daher eine merkliche Korrektur, die sich grob gesehen wie δ ( x ) verhält. Sehr nahe bei x 0 verhält sich das Potential so, als wäre die das Feld erzeugende Ladung größer als e. Der Grund, warum sie nach außen abgeschwächt wird, ist die durch Elektron-Positron-Paarbildung hervorgerufene Polarisation des Vakuums, die zu einer Abschirmung der nackten Ladung in größerem Abstand führt. Wir sind einer deltaförmigen Korrektur des Coulomb-Potentials schon in der relativistischen Quantenmechanik, Gleichung (3.50), begegnet, wo auch diskutiert wurde, wie durch sie im Wasserstoffatom die Energieniveaus der Drehimpulsquantenzahl l 0 verschoben werden. Hier sei nur noch darauf hingewiesen, daß eine durch das UehlingPotential hervorgerufene Verschiebung der Energieniveaus einen Beitrag zur LambShift liefert, zu dem aufgrund anderer Strahlungskorrekturen noch weitere und zum Teil deutlich größere Beiträge hinzutreten.
10.11.2 Anomales magnetisches Moment des Elektrons Der nicht zu γ μ proportionale Anteil der Vertexkorrektur, der nach Gleichung (10.110) (2)μ in Λ1 (q , q) enthalten ist, führt zu einer Korrektur des magnetischen Moments des Elektrons bzw. Positrons. Um diese abzuleiten, betrachten wir die Wechselwirkung eines Elektrons mit einem statischen Magnetfeld. Dabei handelt es sich um eine Wechselwirkung, bei der sich wie bei der in Abschn. 10.2.2 behandelten Mott-Streuung schon in erster Ordnung der Störungsrechnung eine von null verschiedene Übergangsamplitude ergibt. Das zugehörige Feynman-Diagramm entspricht dem Diagramm der Abb. 10.3, nur daß γ 0 durch γ α und φ/c durch Aα ersetzt werden muß. Es ist unter Einschluß der Diagramme für die Strahlungskorrekturen in Abb. 10.19 wiedergegeben. (Der Vergleich mit der um 90 Grad im Uhrzeigersinn gedrehten Abb. 10.16 (c) zeigt, daß bei der Vertexkorrektur q mit p und q mit p identifiziert werden muß.) Die Berechnung der Übergangsamplitude erfolgt wie bei der Mott-Streuung, d. h. wir können das Ergebnis (10.25) übertragen, indem wir die Ersetzungen γ 0 γ α
und
Ze (2π)3/2ε0 h p p
2
c A α ( p p)
vornehmen, wobei A α ( p p) die Fourier-Transformierte des Vektorpotentials Aα (x) ist. Auf diese Weise erhalten wir (1) Sea
(2π)5/2 i m 0 h 3 c2 Mea A α ( p p) δ(Ep Ep ) , V Ep Ep ¼
¼
Mea ec u(l , p ) γ α u(l, p) .
10.11 Auswirkungen regulärer Strahlungskorrekturen
353
p¼
Aα
p Abb. 10.19: Ablenkung eines Elektrons an einem externen Magnetfeld.
Mea j α ist die Fourier-Transformierte der Elektronenstromdichte und j α Aα die der Wechselwirkungsenergiedichte zwischen Elektronen und Magnetfeld. Jetzt berücksichtigen wir die Vertexkorrektur, indem wir γ α gemäß den Gleichungen (10.90) und (10.139) durch Γr(2)α ersetzen. Aus der Elektronenstromdichte wird dann j ¼ α ecu(l ¼ , p¼ )Γr(2)α u(l, p), und aus deren Lorentz-Transformationseigenschaften kann für sie die Struktur iΣ αβ qβ u(l, p) (10.144) j ¼ α ec u(l ¼ , p¼ ) F1 (q 2 )γ α F2 (q 2 ) 2m 0 c i α β mit qβ pβ¼ pβ , γ γ γ β γ α (10.145) Σ αβ 2 abgeleitet werden. q p ¼ p ist der vom Elektron abgegebene bzw. auf das Magnetfeld übertragene Viererimpuls. Im Argument der Funktionen Fi wurde für q q der Einfachheit halber q 2 geschrieben, und es gilt q2
0.
(10.146)
Beweis: Mit p p p¼ p¼ m 20 c2 und p¼ pm ¼ c mc p¼ pmm ¼ c2 mv m ¼ v ¼ cos α ergibt sich q2 2m 20 c2
( p¼ p)2 2m 20 c2
1
p¼ p m 20 c2
wegen 1 vv ¼ /c2
1
mm ¼ m 20
1
vv ¼ cos α 1 vv ¼ /c2 1 2 c (1v 2 /c2 ) (1v ¼2 /c2 )
(1v 2 /c2 ) (1v ¼2 /c2 )
(v ¼ v)2
0.
0
Auf den allgemeinen Beweis von Gleichung (10.144) kann verzichtet werden, weil sich die angegebene Struktur von j ¼ α in der von uns benötigten Näherung weiter unten (nach dem Beweis der Beziehung (10.154)) von selbst ergeben wird. Ohne Strahlungskorrekturen gilt offensichtlich F1 (q 2 )1 und F2 (q 2 )0. Der Matrixtensor Σ αβ enthält als räumliche Komponenten die Komponenten der Spinmatrix und kann daher als Tensor für den Spin aufgefaßt werden, denn nach (2.206) gilt für zyklische l, m, n der Zusammenhang Σn
i γ lγ m
(2.204)
i l m (10.145b) (γ γ γ m γ l ) Σ lm , 2
354
10 Quantenelektrodynamik
der auch in der Form Σkl
εklm Σ m
(10.147)
geschrieben werden kann. Bevor wir uns der Bestimmung der Funktionen F1 (q 2 ) und F2 (q 2 ) zuwenden, wollen wir erst untersuchen, wie das magnetische Moment des Elektrons von diesen abhängt, weil sich daraus die für sie erforderliche Genauigkeit ergeben wird. Zu dieser Untersuchung benötigen wir die Gordon-Identität 1 u(l ¼ , p¼ ) p¼ α pα i Σ αβ qβ u(l, p) , 2m 0
c u(l ¼ , p¼ ) γ α u(l, p)
(10.148)
die wie folgt bewiesen wird. Beweis: Zum Beweis benötigen wir die Gleichungen (8.190a) und (8.190b), die von den Spinoren u(l, p) und u(l ¼ , p¼ ) erfüllt werden und mit (8.187) die Form p/ u(l, p) γ α pα u(l, p) m 0 c u(l, p) ,
u(l ¼ , p¼ ) p/¼ u(l ¼ , p¼ ) γ α pα¼ m 0 c u(l ¼ , p¼ )
(10.149)
annehmen. Aus der ersten von diesen folgt u(l, p) γ β pβ u(l, p)/(m 0 c) und daraus 1 γ α γ β pβ u(l, p) . m0c
γ α u(l, p)
Addition der mit 2/i multiplizierten Gleichung (10.145b) zu (2.204) liefert γ α γ β g αβ i Σ αβ , womit das zuletzt erhaltene Ergebnis in γ α u(l, p)
i Σ αβ pβ u(l, p)
1 α p m0c
überführt wird. Analog folgt aus Gleichung (10.149b) u(l ¼ , p¼ ) γ α
m1 c u(l , p ) ¼
¼
p¼ α
0
i Σ αβ pβ ¼
.
Mit diesen Ausdrücken für γ α u(l, p) und u(l ¼ , p¼ ) γ α ergibt sich u(l ¼ , p¼ ) γ α u(l, p)
1 ¼ ¼ α 1 u(l ¼ , p¼ ) γ α u(l, p) u(l , p )γ u(l, p) 2 2 1 u(l ¼ , p¼ ) pα i Σ αβ pβ p¼ α i Σ αβ pβ¼ u(l, p) 2m 0 c
Durch Anwenden der Gordon-Identität auf den γ α -Term von j¼ α ergibt sich aus (10.144) j¼ α
2me
0
u(l ¼ , p¼ ) F1 (q 2 ) p ¼ α pα
F1 (q 2 ) F2 (q 2 ) iΣ αβ qβ u(l, p) .
Im Fall eines statischen Magnetfelds mit dem Vektorpotential Aα 0, A wird hiermit aus der Wechselwirkungsenergie j¼ α A α
2me
0
u(l ¼ , p¼ )
F1 (q 2) ( p
¼
p) A
F1 (q 2 ) F2 (q 2 ) iΣ kβ qβ A k u(l, p) .
10.11 Auswirkungen regulärer Strahlungskorrekturen
355
Jetzt beschränken wir uns auf den Fall schwacher Wechselwirkung, bei dem p nur wenig und die Spinorquantenzahl l überhaupt nicht verändert wird, so daß wir l ¼ l haben und in q p ¼ p höchstens bis zu linearen Termen gehen müssen. Insbesondere dürfen wir dann später (10.150) ( p ¼ p)( p¼ p) q q 0 setzen. Für den ersten Klammerterm von j¼ α A α erhalten wir unter dieser Annahme F1 (q 2 ) ( p¼ p) A 2F1 (0) p A . Auch im zweiten können wir q 2 0 setzen, mit q0 p0¼ p0m 0 c m 0 c0 ergibt sich Σ kβ qβ A k
Σkl q l A k (10.147) εklm q l Σ m A k (q )k A k (q ) A (q A) , außerdem können wir in dieser Näherung noch u(l , p )u(l, p) setzen. Insgesamt ¼
erhalten wir damit j¼ α A α
2me
0
¼
2F1 (0) p A F1 (0) F2 (0) i (q A)u(l, p) u(l, p) ,
wobei für den ersten Term in eckigen Klammern die Normierungsbedingung (8.192a) benutzt worden ist. Wir wollen das letzte Ergebnis in den Ortsraum zurück übersetzen. A( p¼ p) A(q) ist die Fourier-Transformierte des Vektorpotentials A(x) und i q A(q)/h die des Magnetfelds B(x), denn es gilt iq x iq x iq x iq x e h B(x) d 3x e h rot A(x) d 3x rot (e h A) d 3x e h A d 3x
s.u.
iq x e h
A d x 3
iq h
e
i q x h
A(x) d 3x
(2π h )3/2 ihq A(q) ,
wobei im dritten Schritt unter Benutzung der in der Elektrodynamik abgeleiteten Variiq x iq x D 2 ante (E2.29) des Gaußschen Integralsatzes rot(e h A) d 3x ½ ne h A) d f 0 gesetzt wurde. Damit ergibt sich im Ortsraum die Wechselwirkungsenergie e E ww 2F1 (0) p A(x) F1 (0) F2 (0) h B(x)u u . 2m 0
Jetzt spezialisieren wir das Ergebnis noch auf nicht-relativistische Verhältnisse. Der Spinor u(l, p) besitzt dann nach Abschn. 2.8 nur zwei obere Komponenten, und mit (2.155) gilt u u ϕ ϕ , wobei ϕ ein Zweierspinor und der Erwartungswert von im Zustand ϕ ist. Unter Benutzung von Gleichung (Q7.38), 2S/h , erhalten wir schließlich E ww
eF1 (0) pm A 2me 0
0
F1 (0) F2 (0) 2 S B .
(10.151)
356
10 Quantenelektrodynamik
Nach der klassischen nicht-relativistischen Mechanik ist die Hamilton-Funktion für ein Teilchen der Ladung q in einem Magnetfeld mit dem Vektorpotential A ohne Berücksichtigung eines eventuellen Spins durch H
( p q A)2 2m 0
2
2mp
0
q p A m0
2
2
q2mA
0
gegeben. Für ein Elektron (Ladung q e) ergibt sich daraus die Wechselwirkungsenergie e p A/m 0 zwischen Ladung und Magnetfeld. In Anschluß an Gleichung (10.144) wurde festgestellt, daß ohne Strahlungskorrekturen F1 (q 2 ) F1 (0)1 und F2 (q 2 ) F2 (0)0 gilt. Dies zeigt, daß der erste Term in unserem Ergebnis für E ww die Wechselwirkungsenergie zwischen Ladung und Magnetfeld ist. Ohne Strahlungskorrekturen ist der zweite Term gleich B mit gs e S/(2m 0 ) und gs 2, nach (Q7.23) und (Q7.24) also die Wechselwirkungsenergie eines Spin-1/2-Teilchens der Ladung e mit dem gyromagnetischen Verhältnis 2. Bei Berücksichtigung der Strahlungskorrekturen können alle Ultraviolettdivergenzen in renormierten Größen absorbiert werden. Wenn wir dann annehmen, daß unser Ausdruck für E ww schon ausschließlich mit renormierten Größen gebildet ist, wobei wir den Index für renormierte Größen verabredungsgemäß weglassen, muß erneut F1 (0) 1
(10.152)
gelten, damit der erste Term mit der Ladungswechselwirkung des Elektrons identifiziert werden kann. Für die Wechselwirkung des Spins mit dem Magnetfeld ergibt sich damit aus dem zweiten Term das gyromagnetische Verhältnis gs
2 1 F2 (0)
.
(10.153)
Um die Auswirkungen der Strahlungskorrekturen auf das gyromagnetische Verhältnis (2)μ zu bestimmen, genügt es also, aus dem für Γr ( p¼ , p) abgeleiteten Ergebnis den Wert von F2 (0) abzuleiten. Zuvor jedoch noch eine kurze Anmerkung zu den Funktionen F1 (q 2 ) und F2 (q 2 ). Die Beziehung (10.151) läßt erwarten, daß die Wechselwirkung des Elektrons mit dem Magnetfeld oder allgemeiner mit einem elektromagnetischen Feld für q q>0 von q q abhängt. Dabei erscheint es so, als würden die Ladung und der Spin, also innere Teilcheneigenschaften, durch F1 (q 2) und F2 (q 2 ) modifiziert. Dies hat dazu geführt, die Funktionen F1 (q 2 ) und F2 (q 2 ) als Formfaktoren des Elektrons zu bezeichnen. Der physikalische Grund für die scheinbare Modifikation der inneren Struktur des Elektrons ist, daß das Elektron permanent von einem Strahlungsfeld virtueller Photonen umgeben ist, das durch die Strahlungskorrekturen berücksichtigt wird. Jetzt kommen wir zur Berechnung von F2 º0» mit Strahlungskorrektur. Dazu benötigen wir von der in Gleichung (10.144) angegebenen Zerlegung der Größe j¼ α ec u(l ¼ , p¼ ) Γr(2)α u(l, p) diejenigen Anteile von Γr(2)α , die nicht zu γ α proportio(2)μ nal sind. Nach (10.90) und (10.110) müssen diese in Λ1 (q ¼ , q) enthalten sein. Da wir nur F2 (0) bestimmen wollen, können wir uns auf den Fall schwacher Wechselwirkung beschränken, in dem die Näherung (10.150) gilt. Die etwas mühsame Auswertung
10.11 Auswirkungen regulärer Strahlungskorrekturen
357
der Beziehung (10.109), die in dem nachfolgenden Beweis durchgeführt wird, liefert in diesem Fall α ( p¼ α pα ) α J3 α 2π γ 4πm 0 c
(2)α
Λ1 ( p¼ , p) mit J3
1
2
dx 0
(10.154)
1 x 2 4(x y)(x y)2 dy , (x y)2 0
wobei ausgenutzt ist, daß Λ1 in jα A α zwischen den Spinoren u(l ¼ , p¼ ) (linker Hand) und u(l, p) (rechter Hand) steht – viele der im folgenden abgeleiteten Formeln gelten nur unter dieser Voraussetzung, d. h. sie sind so zu verstehen, daß man sich rechts u(l, p) und links u(l ¼ , p¼ ) als zusätzliche Faktoren hinzudenken muß. (2)α
Beweis: In u(l ¼ , p¼ ) Λ1
(2)α
( p¼ , p) u(l, p) können die beiden Spinoren unter die beiden Integrale (2)α
gezogen werden, aus denen Λ1 gemäß (10.109) berechnet werden muß. Um dann die Beziehungen (10.149) ausnutzen zu können, bringen wir mit Hilfe der Vertauschungen (2.204) (10.155) 2g αβ γ β γ α pβ¼ 2 p¼α p/¼ γ α, p/ γ α 2 pα γ α p/ γ α p/¼ γ α γ β pβ¼ p/ ganz nach rechts und p/¼ ganz nach links. Auf diese Weise erhalten wir für den (gedanklich) (2)α zwischen u(l ¼ , p¼ ) und u(l, p) gestellten Zähler Z des Integranden von Λ1 ( p¼ , p) (1 y)(2 p¼α p/¼ γ α ) xγ αp/m 0 cγ α γ μ (1 x) (2 pα γα p/) y p/¼ γα m 0 cγα Z (10.149) (1 y)(2 p¼α m 0 cγ α ) xγ αp/m 0 cγ α γ μ (1 x) (2 pα γα m 0 c) y p/¼ γα m 0 cγα 2(1 y) p¼α ym 0 cγ α xγ αp/ γ μ 2(1 x) pα xm 0 cγα y p/¼ γα 4(1 x)(1 y) p¼α γ μ pα 2x(1 y)m 0 cγ μ p/¼ 2y(1 y)γ μp/¼ p/¼
2(1
x)ym 0 c p/ γ μ x ym 20 c2 γ α γ μ γα y 2 m 0 cγ α γ μp/¼ γα
2x(1 x)/ p p/ γ μ x 2 m 0 cγ αp/ γ μ γα x yγ αp/ γ μp/¼ γα .
Unter Benutzung der Relationen (10.149) und (10.155) sowie unter Berücksichtigung der Anwendung auf u(l, p) bzw. u(l ¼ , p¼ ) findet man (Aufgabe 10.14) γ μp/¼p/¼
m 20 c2 γ μ , p/ p/ γ μ m 20 c2 γ μ ,
2γ μ , γ αp/γ μ γα 4 pμ , γ α γ μ γα
γ α γ μp/¼ γα
4 p¼ μ , γ αp/γ μp/¼ γα 2m 20 c2 γ μ ,
und durch Einsetzen in den zuletzt für Z erhaltenen Ausdruck ergibt sich Z
4(1 x)(1 y) p p¼ γ μ2x(1 y)m 0 c(2 p¼ μ m 0 cγ μ ) 2y(1 2(1 x)ym 0 c(2 pμ m 0 cγ μ ) 2x ym 20 c2 γ μ 4y 2 m 0 cp¼ μ 2x(1 x)m 20 c2 γ μ 4x 2 m 0 cpμ 2x ym 20 c2 γ μ
4m 0 c(y x y 4(1 x)(1
x 2 ) pμ 4m 0 c(x x y y 2 ) p¼ μ y) p p¼ γ μ 2 2x 2y x 2 y 2 m 20 c2 γ μ .
y)m 20 c2 γ μ
358
10 Quantenelektrodynamik
Aus der Annahme (10.150) folgt noch 2 p p¼
p p p¼ p¼
p/ p/ p/¼ p/¼
(10.156)
sowie unter Berücksichtigung der Einwirkung auf u(l, p) bzw. u(l ¼ , p¼ ) und mit Hilfe einiger der in Aufgabe 10.14 abgeleiteten Beziehungen 2 p p¼ γ μ
p/ p/γ μ p/¼ p/¼ γ μ
2m 20 c2 γ μ .
Damit erhalten wir schließlich
Z 4m 0 c(y x y x 2 ) pμ 4m 0 c(x x y y 2 ) p¼ μ 2 24(x y) (x y)2 m 20 c2 γ μ . (10.157) (2)α
Zur Umformung des Nenners des Integranden von Λ1 ( p¼ , p) benutzen wir die Näherung (10.156a) und erhalten mit p pp/ p/ unter Hinzudenken der Spinoren u(l, p) bzw. u(l ¼ , p¼ ) auf der rechten bzw. linken Seite Z m 20 c2 (x y)(x 2 x y x) p p(y 2 x y y) p¼ p¼
Z N
Zp/ p/ N p p
Zm 20 c2
N p p
Z p p(x y)(x 2 x y x)( p p)2 /m 20 c2 (y 2 x y y) p p p¼ p¼ /m 20 c2
Z N p p/m 20 c2
.
Der erste und der letzte Ausdruck müssen für alle x und y übereinstimmen, was nur für p pm 20 c2 der Fall ist, d. h. im Nenner darf p p durch m 20 c2 ersetzt werden, und das Gleiche kann analog für p¼ p¼ gezeigt werden. Aus dem Nenner wird damit N
m 20 c2 (x y)2 .
(10.158)
(In dem Integral, dessen Auswertung mit Hilfe der Beziehung (10.99) zu (10.109) geführt hat, gilt N und damit wie gefordert 0.) Einsetzen von (10.157) und (10.158) in (10.109) liefert mit e2 μ0 c/(8π 2 h) α/(2π) (2)μ
Λ1 mit J1
α α J1 pμ J2 p¼ μ J γμ π m0c 2π 3
1 1 x 1 1 x y x y x 2 x x y y2 dx d y , J dx dy , 2 2 (x y) (x y)2 0 0 0 0 1 1 x 24(x y)(x y)2 J3 d x dy . (x y)2 0 0
Unter Benutzung von x x y y 2 x x(x y)(x y)2 ergibt sich 1 x 1 x 1 x 1 x x x y y2 dy dy d y x x dy xy (x y)2 0 0 (x y)2 0 0 und mit d(x 2 ln x))/d x 2x ln x x folgt hieraus 1 '1 1 1 1 ' J2 x ln x d x (x 2 ln x)' x dx 0 2 2 0 0
x ln x ,
1 . 4
Analog findet man J1 1/4. Das Integral J3 müssen wir nicht berechnen, da es mit γ μ multipliziert wird und daher nicht zu dem von uns gesuchten Wert F2 (0) beiträgt. Auf ein mit ihm verbundenes Problem wird kurz im nächsten Teilabschnitt eingegangen.
10.11 Auswirkungen regulärer Strahlungskorrekturen
359
Um j ¼ α ec u(l ¼ , p¼ ) Γr(2)α u(l, p) in die Form (10.144) zu überführen, belassen wir alle zu γ α proportionalen Anteile einschließlich des entsprechenden, in (10.154) ¼ ¼α α angegebenen Anteils von Λ(2)α 1 ( p , p) so, wie sie sind. Den zu p p proportionalen (2)α ¼ ¼ ¼ Anteil von u(l , p ) Λ1 ( p , p) u(l, p) überführen wir dagegen mit Hilfe der GordonIdentität (10.148) bzw. u(l ¼ , p¼ ) p¼ α pα u(l, p) u(l ¼ , p¼ ) 2m 0 cγ α i Σ αβ qβ u(l, p) in
α u(l ¼ , p¼ ) p¼ α pα u(l, p) u(l ¼ , p¼ ) 4πm 0 c
α α α γ i Σ αβ qβ u(l, p) . 2π 4πm 0 c
Der zweite Klammerterm der rechten Seite ist der einzige nicht zu γ α proportionale Anteil von Γr(2)α und liefert zu j ¼ α ec u(l ¼ , p¼ ) Γr(2)α u(l, p) den Beitrag α i Σ αβ qβ ¼ ¼ u(l, p) . ec u(l , p ) 2π 2m 0 c Durch den Vergleich mit (10.144) ergibt sich aufgrund unserer Vernachlässigung von Termen (q q) sofort α , (10.159) F2 (0) 2π und aus (10.153) folgt hiermit für das gyromagnetische Verhältnis des Elektrons der korrigierte Wert α gs 2 1 , (10.160) 2π der erstmals 1948 von J. Schwinger gefunden wurde. Heute ist gs unter Berücksichtigung von Korrekturen höherer Ordnung und der damit verbundenen Renormierungen bis zu Termen der Ordnung α 3 bekannt, und für die relative Abweichung vom gyromagnetischen Verhältnis gs 2 der Dirac-Theorie ergibt sich der theoretische Wert ath
gs 2 2
0, 5
α π
0, 32848
α 2 π
1, 49
α 3 π
0, 0011596524()4 .
Der experimentell gefundene Wert liegt mitsamt seiner Fehlergrenzen innerhalb der theoretischen Fehlergrenzen, d. h. die Theorie wird in beeindruckender Weise durch das Experiment bestätigt. Daß der Wert des gyromagnetischen Verhältnisses durch die Strahlungskorrekturen erhöht wird, läßt sich qualitativ verstehen: Das Elektron emittiert und absorbiert laufend Photonen und ist damit permanent von virtuellen Photonen umgeben, deren Energie dem Energieäquivalent seiner Ruhemasse entzogen wird. Damit ist das Verhältnis e/m 0 effektiv etwas erhöht, was in gs e S/(2m 0 ) durch einen Faktor gs >2 zum Ausdruck kommt.
Infrarotkatastrophe In diesem Abschnitt soll noch kurz auf eine Schwierigkeit hingewiesen werden, die bei der Berechnung des magnetischen Moments zwar angedeutet, jedoch übergangen
360
10 Quantenelektrodynamik
wurde. Die Berechnung des Integrals J3 führt mit 1 x 2 4(x y)(x y)2 2 dy 4 ln x 1 x 2 x (x y) 0 zu 1 2 J3 4 ln x 1 x d x 5, 5 2 lim ln ε . ε 0 x 0 J3 enthält also eine logarithmische Singularität, und diese überträgt sich auf den Faktor F1 (0), von dem wir im letzten Abschnitt angenommen haben, er würde nach der Renormierung den Wert eins annehmen. Man könnte daran denken, diese neue Divergenz einfach in den bisherigen Renormierungsprozeß mit einzubeziehen. Nur ein Problem unter anderen wäre dabei jedoch, daß die Größe, mit der die Singularität regularisiert wird – oben ε und bei einer gleich zu erwähnenden relativistisch invarianten Regularisierung eine andere Größe – nichts mit dem zur Regularisierung der Ultraviolettdivergenzen benutzten Parameter δ zu tun hat. Die genauere Untersuchung hat gezeigt, daß diese Vorgehensweise auch nicht nötig ist, vielmehr wird die mit J3 verbundene Singularität auf physikalische Weise behoben. Im folgenden soll nur skizziert werden, wie es dazu kommt, für eine ausführliche Diskussion wird auf die Spezialliteratur verwiesen.1 (2)μ Das Integral J3 ist ein Bestandteil der Größe Λ1 , von der wir sichergestellt hatten, daß sie keine Ultraviolettdivergenz aufweist. Der Nenner ihres Integranden ist der (2)μ gleiche wie der des Integranden von Λ2 bzw. Λ(2)μ und enthält nach (10.91) wie D Fαβ (k) den Faktor k k i ε, verschwindet also für k k 0 und ε0. Es sieht zwar so aus, als wäre diese Singularität nur scheinbar, weil in Λ(2)μ über d 4 k integriert wird, tatsächlich tritt sie sich jedoch in J3 echt zum Vorschein. Am einfachsten erkennt man sie bei ihrer invarianten Regularisierung: Bei dieser ersetzt man im Nenner h 2 k k durch h 2 k k μ20 c2 und läßt später μ0 0 gehen. Das kann so interpretiert werden, als erhielte das Photon vorübergehend eine kleine Ruhemasse μ0 . (Diese müßte dann zwar auch im Zähler berücksichtigt werden, da sie jedoch als sehr klein angenommen wird, kann sie überall vernachlässigt werden, wo dadurch keine Divergenz entsteht.) Ihr wesentlicher Effekt besteht darin, daß im Nenner von J3 zu (x y)2 der Term μ20 c2 addiert wird, wodurch der divergente Teil von J3 in 2 ln(μ0 c) überführt wird. Da die Divergenz von J3 demnach auf kleine Werte von k k bzw. große Wellenlängen zurückzuführen ist, wird sie als Infrarotdivergenz bezeichnet und ihr Auftreten als Infrarotkatastrophe. (Die Ward-Identität (10.94) läßt übrigens erkennen, daß auch Σ (2) (q) von einer Infrarotdivergenz betroffen ist, weil sich die Singularität von J3 nach (10.154) auf Λ(2)α 1 (q, q) überträgt.) Um qualitativ zu verstehen, wie die Infrarotdivergenzen physikalisch behoben werden, sehen wir uns noch einmal den Prozeß an, bei dem wir auf sie gestoßen sind, die Streuung eines Elektrons an einem externen Magnetfeld (Abb. 10.19). Da bei dem von uns behandelten Prozeß alle vom Elektron abgestrahlten Photonen wieder von diesem absorbiert werden, also weder zur Quelle des Magnetfelds noch woandershin laufen – das einzige auslaufende Teilchen ist das Elektron –, handelt es sich um eine elasti1 Eine ausführliche Behandlung der Infrarotkatastrophe findet sich in den Büchern [1] und [2] der Literaturliste.
10.12 Strahlungskorrekturen höherer Ordnung und Renormierbarkeit
361
sche Streuung des Elektrons. Dieses kann jedoch auch unter Abstrahlung von Photonen inelastisch gestreut werden, – unter Emission von Zyklotronstrahlung bei der Wechselwirkung mit einem homogenen Magnetfeld, von Bremsstrahlung bei der Wechselwirkung mit dem elektrischen Feld eines Kerns oder allgemeiner einer Kombination von beidem. Bei einer inelastischen Streuung ist die experimentelle Anordnung genau die gleiche wie bei der elastischen. Nun kann bei einem Streuprozeß nie vorhergesagt werden, ob eine elastische oder inelastische Streuung stattfinden wird, das läßt sich allenfalls im Nachhinein anhand gestreuter Photonen feststellen. Allerdings besitzt jedes Meßgerät eine endliche – eventuell vom Gerät abhängige – Energieschwelle E S für die Detektion von Photonen derart, daß jedes Photon unbemerkt bleibt, dessen Energie hωk unterhalb dieser Schwelle liegt. Daher kann in einem Elektronen-Streuexperiment nach Herausrechnen aller detektierbaren Photonen immer nur der kombinierte Wirkungsquerschnitt für die elastische Streuung und alle nicht detektierbaren inelastischen Streuprozesse bestimmt werden, also der Wirkungsquerschnitt für die Summe der Diagramme, bei denen ein Elektron und kein oder ein oder zwei oder drei usw. Photonen mit Energien 0hωk E S auslaufen. Es stellt sich heraus, daß alle Diagramme mit auslaufenden Photonen für hωk 0 ebenfalls Infrarotdivergenzen aufweisen. Diese können wie die Divergenz von J3 regularisiert werden. Werden ihre Amplituden zur Amplitude des elastischen Streuprozesses addiert, so heben sich die Singularitäten insgesamt für jede endliche Schwelle E S >0 gegenseitig weg. Die bei rein elastischer Streuung erhaltene Singularität von F1 (0) wird also durch Einbeziehen unvermeidbarer physikalischer Begleitprozesse durch deren Singularitäten kompensiert, und für das effektive F1 (q 2 ) all dieser Prozesse ergibt sich F1 (0)1.
10.12 Strahlungskorrekturen höherer Ordnung und Renormierbarkeit Wir haben bisher nur die Strahlungskorrekturen niedrigster Ordnung behandelt und deren Divergenzen durch Renormierung behoben. Wie wir schon gesehen haben, treten auch in allen höheren Ordnungen der Störungsrechnung Divergenzen auf, und es fragt sich, ob auch diese alle durch Renormierung behoben werden können. Die Antwort auf diese Frage ist positiv, allerdings muß auf den Beweis dafür aus Platzgründen verzichtet werden. Der interessierte Leser wird auf die Literatur verwiesen, insbesondere auf die Bücher [11] und [14] des Literaturverzeichnisses oder auf eine besonders kompakte Darstellung in [12]. Der wesentliche Gedankengang soll jedoch wenigstens skizziert werden. Ausgangspunkt sind die Gleichungen (10.116), (10.121) und (10.123) bzw. S ¼F 1 (q) SF 1 (q) Σ(q) , Γ μ (q ¼ , q)
1 1 D ¼ F (k) DF (k) Π(k) , (10.161)
γ μ Λμ (q ¼ , q)
(10.162)
für die alle Strahlungskorrekturen umfassenden Propagatoren SF¼ (q) und D F¼ (k) bzw. Vertexfunktion Γ μ (q ¼ , q). Diese enthalten die unbekannten Größen Σ(q), Π(k) und
362
10 Quantenelektrodynamik
Λμ (q ¼ , q), die wir in niedrigster Ordnung ausgewertet haben, und sind natürlich divergent. Weiterhin wird die allgemeine Ward-Identität h
Λμ (q, q)
∂Σ(q) ∂q μ
(10.163)
benutzt, die nur in niedrigster Ordnung bewiesen wurde und allgemein bewiesen werden muß. Unter Ausnutzung der Gleichungen (10.161)–(10.163) kann gezeigt werden, daß alle Divergenzen wie bei den in niedrigster Ordnung erhaltenen Ergebnissen (10.139) in multiplikativen Faktoren Z 1 , Z 2 und Z 3 enthalten sind, so daß SF¼ (q) Z 2 SFr (q) ,
D F¼ (k) Z 3 DFr (k) ,
Γ μ (q ¼ , q)
μ
Γr (q ¼ , q) Z1
μ
mit regulären Größen SFr (q), DFr (k) und Γr (q ¼ , q) gilt. Die divergenten Faktoren Z 1 , Z 2 und Z 3 können wie in der niedrigsten Ordnung in (divergenten) Korrekturen der Ruhemasse und der Ladung absorbiert werden, womit man zu einer Theorie gelangt, die nur endliche Meßgrößen enthält. Quantenfelder wie die Felder der QED, bei denen alle Divergenzen durch Renormierung beseitigt werden können, heißen renormierbar. Da die Frage der Renormierbarkeit bei der Entwicklung der Quantentheorie anderer Felder eine wichtige Rolle gespielt hat, folgen hier noch einige Anmerkungen zu diesem Thema. Zu deren Verständnis ist es nützlich, wenn wir die Beziehung (10.82) für den potentiellen Divergenzgrad von Übergangsamplituden auf den Fall einer QED in d Dimensionen verallgemeinern. Statt aus (10.81) muß dieser dann aus P P d n d Fi d Pi d qδ Fi(q) PD q 2 Pi d q d q δ (Pe Pa ) Plim P P abgelesen werden und ist D
d(Fi Pi
n 1)
Fi
2Pi
(d
1)Fi
(d
2)Pi
(n 1)d .
Die Beziehungen (10.83) gelten wie früher und können wieder zur Elimination von Pi und Fi benutzt werden, was zu
d d24 n
d 1 d 2 Fa Pa 2 2 führt. (Für d 4 folgt daraus natürlich (10.84).) Das Interessante an diesem Ergebnis ist, daß die Ordnung n der Störungsrechnung, die mit der Zahl der Vertizes in Diagrammen der entsprechenden Ordnung übereinstimmt, nur für d 4 herausfällt. Bei allen anderen Dimensionen spielt sie jedoch eine wichtige Rolle. Für d 3 wird der n-Term gleich n/2 und damit negativ. Dies hat zur Folge, daß D bei gegebener Anzahl Fa und Pa externer Linie für alle n>n (Fa , Pa ) negativ wird, d. h. ab einer gewissen Ordnung n sind keine Divergenzen mehr zu erwarten. Es gibt Felder, die dasselbe Verhalten in der vierdimensionalen Raum-Zeit aufweisen. Alle derartigen Felder werden als superrenormierbar bezeichnet. Für d 5 ist der n-Term gleich n/2, d. h. der Divergenzgrad D
10.12 Strahlungskorrekturen höherer Ordnung und Renormierbarkeit
363
wird mit zunehmender Ordnung immer größer. Dies bedeutet, daß immer mehr divergente Graphen auftauchen, bis ab einer gewissen Ordnung alle Diagramme potentiell divergent sind. Eine Theorie mit diesen Eigenschaften heißt nicht-renormierbar. Auch hier gibt es wieder Felder mit derselben Eigenschaft in vier Dimensionen, z. B. ein Skalarfeld, dessen Lagrange-Dichte durch
h 2 αβ m 0 c2 2 g φ φn g (∂α φ)(∂β φ) 2m 0 2 n
mit n
5
statt (9.8) gegeben ist. Für dieses gilt D 4(n 4)V N, wenn N die Anzahl äußerer Linien und V die mit zunehmender Ordnung anwachsende Zahl von Vertizes ist (Aufgabe 10.15). Bezüglich der Renormierbarkeit gibt es also drei verschiedene Möglichkeiten: 1. Superrenormierbarkeit: Es gibt nur eine endliche Anzahl potentiell divergenter Diagramme, ab einer gewissen endlichen Ordnung gibt es keine potentiellen Divergenzen mehr. 2. Renormierbarkeit: Es gibt nur endlich viele primitiv divergente Diagramme, aber in jeder Ordnung der Störungsrechnung treten Divergenzen auf (Beispiel QED). 3. Nicht-Renormierbarkeit: Ab einer gewissen Ordnung der Störungsrechnung sind alle Diagramme divergent. Man hat lange geglaubt, daß Renormierbarkeit eine unabdingbare Eigenschaft einer physikalisch sinnvollen Feldtheorie sei. Da bislang jedoch keine renormierbare Feldtheorie der Gravitation gefunden wurde, sich andererseits aber gezeigt hat, daß in nichtrenormierbaren Theorien zumindest eine Teilrenormierung möglich ist, hat sich diese Sichtweise mittlerweile gewandelt. Näheres dazu findet der interessierte Leser im Kapitel 12 des Buches [14], Band I aus dem Literaturverzeichnis. Zum Schluß dieses Abschnitts sei noch auf ein im Zusammenhang mit der Renormierung stehendes mathematisches Problem hingewiesen. Wir sind relativ sorglos mit zwei kombinierten Grenzübergängen umgegangen, zum einen δ 0 und zum anderen dem mit der Reihenentwicklung nach α verbundenen Grenzübergang n bei der Störungsordnung n. Bei Unterdrückung der involvierten physikalischen Parameter haben wir es mit Ausdrücken der Form f (α, δ) lim N
f N (α, δ)
N
gn α n
n 0
zu tun, wobei f N (α, δ) für δ 0 gilt und die gn von δ unabhängig sind. Unser Ziel wäre es im Prinzip gewesen, zunächst für endliche Werte von δ, bei denen die f N (α, δ) noch hinreichend klein sind, die Funktion f (α, δ) zu berechnen und dann δ 0 gehen zu lassen. Stattdessen haben wir die Reihe mit N 1 abgebrochen und schon dann δ 0 gehen lassen. Hier wäre nachzuweisen, daß dies eine gute Näherung an das zuerst genannte eigentliche Ziel darstellt. Außerdem treten bei dieser Vorgehensweise Mehrdeutigkeiten auf, über die wir einfach hinweggegangen sind. Die bei der Ableitung von Gleichung (10.124) vorgenommene Umrechnung Z 1 1/ 1α/(2πδ) 1α/(2πδ) (α 2 ) ist nur für α/δ 1 zulässig. Läßt
364
10 Quantenelektrodynamik
man jedoch δ 0 gehen, so liefert der erste Ausdruck Z 1 0, der zweite hingegen Z1 . Daß der zweite Ausdruck, für den wir uns entschieden haben, der richtige ist, läßt sich zwar mit Hilfe von Gleichung (10.106) und der Ward-Identität (10.94) rechtfertigen, denn die letztere verknüpft gerade die beiden Größen miteinander, deren Singularitäten sich bei der Renormierung in (10.135) gegenseitig wegheben. Außerdem kommt es bei den physikalisch relevanten Konsequenzen der Theorie hauptsächlich n darstellt. Dennoch bleibt nur darauf an, daß g1 α eine gute Näherung an ½ g α n 1 n ein gewisses Unbehagen, und dem Autor ist nicht bekannt, ob diese mathematische Problematik untersucht wurde und geklärt ist. Die hervorragende Übereinstimmung der berechneten mit experimentellen Ergebnissen ist allerdings ein weiterer Beleg dafür, daß alles seine Richtigkeit hat.
10.13 Quantentheorie versus Quantenfeldtheorie Wir sind im Rahmen der relativistischen Quantenmechanik des Elektrons verschiedentlich an Grenzen der Theorie gestoßen, die mit der Existenz des Positrons als Antiteilchen des Elektrons zu tun haben und darauf hinwiesen, daß die Dirac-Theorie nur in begrenztem Umfang als Ein-Teilchen-Theorie zu gebrauchen ist. Um so erstaunlicher mag es erscheinen, daß die in diesem Kapitel behandelten Streuprozesse trotz der involvierten Teilchenerzeugungs- und Vernichtungsprozesse auch ohne den von uns bemühten Formalismus der Feldquantisierung aus der relativistischen Quantenmechanik und der unquantisierten Maxwell-Theorie abgeleitet werden können. Die einzige über den Rahmen der Dirac-Theorie hinausgehende Voraussetzung ist dabei die Feynman-Stückelberg-Interpretation des Positrons als eines in der Zeit rückwärts laufenden Elektrons. Der aufwendige Weg der Feldquantisierung wurde in diesem Buch beschritten, um den Leser mit dieser wichtigen Methode vertraut zu machen, und weil die Präsentation beider Methoden zu viel Platz in Anspruch genommen hätte. Der interessierte Leser sei hier auf die noch immer sehr empfehlenswerten Bücher [1] und [2] der Literaturliste von J. D. Bjorken und S. D. Drell hingewiesen, wo er alle von uns abgeleiteten Ergebnisse einschließlich der Renormierung im Rahmen der relativistischen Quantenmechanik abgehandelt findet. Im folgenden soll wenigstens kurz skizziert werden, wie das möglich ist. Dabei wird für den Fall der Elektron-Elektron-Streuung sogar eine Übergangsamplitude berechnet. Wir schreiben die Dirac-Gleichung (2.173) in der Form
(i h ∂/ m 0 c)ψ(x)
e A/ (x)ψ(x) .
(10.164)
Ihre formale Lösung ist ψ(x)
ψ (x)
e h
h
SF (x x ) A / (x )ψ(x ) d 4x ,
(10.165)
wobei ψh (x) eine beliebige Lösung der „homogenen“ Dirac-Gleichung (Gleichung (10.164) mit A / (x) 0) und SF (x x ) der durch (9.83) definierte Feynman-Propagator
10.13 Quantentheorie versus Quantenfeldtheorie
365
des Dirac-Feldes ist, denn mit (i h ∂/ m 0 c)ψh (x)0 gilt 1 / (x ¼ )ψ(x ¼ ) d 4x ¼ (i h ∂/ m 0 c)ψ(x) e (i h ∂/ m 0 c) SF (x x ¼ ) A h (9.85) 4 ¼ e δ (x x ) A / (x ¼) ψ(x ¼ ) d 4x ¼ e A / (x)ψ(x) . Da (10.165) die gesuchte Funktion ψ(x) auch auf der rechten Seite unter dem Integral enthält, handelt es sich um eine Integralgleichung. Wird der Wechselwirkungsterm eA / (x)ψ(x) als kleine Störung aufgefaßt, so kann die Lösung iterativ oder durch Reihenentwicklung gewonnen werden, e ψ(x) ψh (x) SF (x x ¼ ) A / (x ¼ )ψh (x ¼ ) d 4x ¼ h (10.166) e2 ¼ ¼ ¼ ¼¼ ¼¼ ¼¼ 4 ¼ 4 ¼¼ SF (x x ) A / (x )SF (x x ) A / (x )ψh (x ) d x d x .. . h2 Nun treffen wir bezüglich der Wechselwirkung die gleichen Annahmen über adiabatisches Ein- und Ausschalten wie in Abschn. 9.4. Da aus (10.165) bei verschwindender Wechselwirkung ψ(x)ψh (x) folgt, könne wir ψh (x) mit dem wechselwirkungsfreien Anfangszustand ψa (x) des Systems identifizieren, und wir nehmen an, daß es sich dabei um einen Ebene-Welle-Zustand (8.166) handelt, d. h. ψh (x)ψa (x)ψl p (x, t). Damit ergibt sich aus (10.166) für den Übergang zu einem Ebene-Welle-Zustand ψe (x)ψl p (x, t) ¼
¼
Sea
ψe (x 2 ) ψ(x 2 ) d x2 3
(8.170)
ψl
¼
p¼ (x2 , t2 ) ψl p (x2 , t2 ) d
(1) (2) x2 Sea Sea
3
(1) (2) δl l δ 3 ( p p) Sea Sea ¼
mit (1) Sea (2) Sea
e h e2
d x ψl p (x2 , t2 ) SF (x 2 x ) A / (x ) ψl p (x , t ) d 3x2 , 4
¼
h2
¼
d x d 4x ψl p (x2 , t2 ) SF (x 2 x ) A / (x )SF (x x ) A / (x )ψl p (x , t ) d 3x2 . 4
¼
¼
Dabei ist t2 die Zeit der Bestimmung der Übergangsamplitude. Mit der Darstellung (9.79) bzw. (9.81) von SF (x 2 x ) ergibt sich für t2 >t
1 3 ψl p (x2 , t2 ) SF (x 2 x ) d 3x2 d p ψl p (x2, t2 ) ψl p (x2, t2 ) d 3x2 ψ l p (x , t ) i l 1 2
¼
¼
¼
(8.170)
¼
2 1 δl l δ 3 ( p p) ψ l p (x , t ) d 3p i ¼
l 1
1 δl l ψ l p (x , t ) i 2
¼
l 1
¼
366
10 Quantenelektrodynamik
und analog für t2
¼
3 p (x2 , t2 ) SF (x 2 x ) d x2 ¼
1 δl l ψ l p (x , t ) . i 4
¼
l 3
¼
Ausführen der verbliebenen Summation und Zusammenfassen der beiden Ergebnisse * ⎧ liefert ⎪ l 1, 2 und t2 >t , ⎨ i ε ψ (x , t ) für l l p 3 ψl p (x2 , t2 ) SF (x 2 x ) d x2 l 3, 4 und t2
¼
¼
¼
¼
wobei wie früher εl 1 für l 1, 2 und εl 1 für l 3, 4 definiert ist. Hiermit ergibt sich (1) Sea i εl he ψ l p (x , t ) A/ (x ) ψl p (x , t ) d 4x (10.167) ¼
und (2) Sea
i εl
¼
e2
¼
¼
h 2
ψl
¼
p¼ (x
, t ) A/ (x )S (x x ) A/ (x ) ψ (x , t ) d 4x d 4x . (10.168) F lp
Wie in der Feldtheorie enthalten die Übergangsamplituden den Anfangs- und Endzustand, nur werden diese Zustände nicht durch die Einwirkung von Erzeugungsoperatoren auf den Vakuumzustand dargestellt, sondern als Spinoren im Ortsraum. Geht die Zeit t2 der Bestimmung der Übergangsamplitude , so gelten die Ergebnisse (10.167)– (10.168) nur für l 1, 2, für l 3, 4 ergeben sich dagegen wegen der For(1) derung t >t2 für von null verschiedene Integranden die Übergangsamplituden Sea 0 (2) und Sea 0. Wenn wir jedoch nach Feynman und Stückelberg ein in der Zeit rückwärts laufendes Elektron negativer Energie als Positron interpretieren, müssen wir als Zeit der Bestimmung der Übergangsamplitude t2 wählen und erhalten dann für l 3, 4 von null verschiedenen Amplituden. Als konkretes Anwendungsbeispiel untersuchen wir die Elektron-ElektronStreuung. In diesem Fall sind in den Gleichungen (10.167)–(10.168) l und l entweder gleich eins oder gleich zwei, und es gilt εl 1 . Die unter den Integralen stehenden Spinoren ψ sollen das erste Elektron beschreiben, während Aα (x) das von der Stromdichte j2 α (x) des zweiten Elektrons erzeugte Feld sein soll und der Gleichung D (x y) F αβ β j2 (y) d 4y Aα (x) (10.169) h c ¼
genügt, weil aus dieser D (x y) F αβ β Aα (x) μ0 j2 (y) d 4y h μ0 c
(9.89) (9.90)
μ0
β
gαβ δ 4 (x y) j2 (y) d 4y
μ0 j2 α (x)
folgt. Durch Einsetzen von (10.169) wird aus (10.167) i (1) , t ) γ α ψ (x , t ) D (x x ) j β (x ) d 4x d 4x . Sea eψ (x l p l p F αβ 2 1 1 1 1 h 2 c ¼
¼
10.13 Quantentheorie versus Quantenfeldtheorie
367
Paarervernichtung
Paarerzeugung (a)
(b)
Abb. 10.20: Elektron-ElektronStreuung (a) ohne sowie (b) mit Paarerzeugung und -vernichtung. Der Kreis markiert das Wechselwirkungsgebiet.
Der in eckige Klammern gesetzte Ausdruck ist offensichtlich der Beitrag der Stromdichte des ersten Elektrons zur Übergangsamplitude. Aus Symmetriegründen muß der β Beitrag j2 (x ¼¼ ) des zweiten Elektrons die gleiche Form haben, so daß wir schließlich i e2 (1) Sea ψ l p (x ¼ , t ¼ )γ α ψl1 p1 (x ¼ , t ¼ )DFαβ (x ¼ x ¼¼ ) 1 1 h 2 c ψ l p (x ¼¼, t ¼¼ )γ β ψl2 p2 (x ¼¼, t ¼¼ ) d 4x ¼ d 4x ¼¼ ¼
¼
¼
¼
2 2
erhalten. Wird hierin (8.166) eingesetzt, so ergibt sich bis auf einen Faktor der erste Term der in der Quantenfeldtheorie berechneten Übergangsamplitude (10.42). Der unterschiedliche Faktor ist zum Teil dadurch begründet, daß zur Ableitung von (10.42) im Gegensatz zu hier diskrete Wellen benutzt wurden. Außerdem haben wir bei der jetzigen Ableitung nicht die für zwei Elektronen zu fordernde Antisymmetrie der Gesamtwellenfunktion berücksichtigt, sondern die beiden Elektronen wie unterscheidbare Teilchen behandelt. Wird das nachgeholt, so erhält man auch noch den zweiten Term von (10.42) und den korrekten Vorfaktor. Es kann als einer der Vorteile der Quantenfeldtheorie angesehen werden, daß die Symmetrieeigenschaften identischer Teilchen ohne weiteres Zutun automatisch berücksichtigt werden. In der Übergangsamplitude zweiter Ordnung (10.168) werden auch Prozesse der Elektron-Positron-Paarerzeugung und -vernichtung mit erfaßt: Da über x ¼ und x ¼¼ integriert wird, gibt es zu den Integralen Beiträge des Elektronenpropagators mit t ¼¼ >t ¼ und t ¼¼
¼
368
10 Quantenelektrodynamik
Aufgaben 10.1
Vergleichen Sie die Dimension der Übergangsamplitude (10.20) für die Paarerzeugung durch ein Gammaquant und (10.43) für die Elektron-ElektronStreuung. Wie ist der Unterschied zu erklären?
10.2
Zeigen Sie, daß bei der Elektron-Elektron-Streuung für den vom virtuellen Photon übertragenen Impuls p pi pk¼ (mit Teilchennummern i und k ) jeder beliebige Wert von (p) (p) möglich ist.
10.3
Beweisen Sie die Beziehung (u ¼ γ β u)£ uγ β u ¼ .
10.4
Zur Lösung der Aufgaben 10.5–10.7 werden die Beziehungen
0, γ αγα 4 ,
Sp γ α
Sp(γ α γ β )4g αβ ,
Sp(γ λ γ μ γ ν )0 ,
γ βγ α γβ 2γ α, Sp(γ κγ λγ μγ ν )4(g κλg μν g κνg λμ g κμg λν )
benötigt. Beweisen Sie diese. 10.5
Beweisen Sie die Beziehung β p1¼ m 0 c) γ α (/ p1 m 0 c) 4 g αβ m 20 c2 p1α p1¼ β p1 p1¼ α g αβ p1 p1¼ . Sp γ β (/
10.6
Zur Lösung von Aufgabe 10.7 wird die Beziehung γ β (/ p1¼ m 0 c) γ α (/ p1 m 0 c) γβ
10.7
2m 20 c2 γ α 4m 0 c( p1α p1¼ α ) 2/ p1γ αp/1¼
benötigt. Beweisen Sie diese. Beweisen Sie für Aγ β p/1¼ m 0 c γ α p/1 m 0 c γβ p/2¼ m 0 c γα p/2m 0 c die Beziehung Sp A 16 2m 40 c4 m 20 c2 p1 p1¼ m 20 c2 ( p1 p1¼ )( p2 p2¼ ) m 20 c2 p2 p2¼ 2 p1 p2 p1¼ p2¼ .
10.8
Zeigen Sie: Bei der Elektron-Photon-Streuung folgt aus der Energie- und Impulserhaltung im Ruhsystem des Elektrons die Beziehung k . k¼ 1h k(1 cos ϑ)/(m 0 c)
10.9
Berechnen Sie mit Hilfe der Feynman-Regeln die Übergangsamplitude der Elektron-Photon-Streuung und vergleichen Sie das Ergebnis mit (10.45).
10.10 Berechnen Sie die Übergangsamplitude der Elektron-Positron-Streuung mit Hilfe der entsprechenden Anteile des dritten Summanden in Gleichung (10.39) und überprüfen Sie das Ergebnis mit Hilfe der Feynman-Regeln. 10.11 Wieviele Diagramme gibt es in n-ter Ordnung zu einem Prozeß, bei dem n Ph Photonen und n F Fermionen einlaufen sowie n ¼Ph Photonen und n ¼F Fermionen auslaufen?
Aufgaben
369
10.12 Zeigen Sie: Wenn es zu einem gegebenen QED-Prozeß n-ter Ordnung zusammenhängende Graphen mit von null verschiedener Amplitude gibt, können erst in n 2-ter Ordnung wieder Graphen mit von null verschiedener Amplitude auftreten. 10.13 Berechnen Sie die Übergangsamplitude der Mott-Streuung mit Hilfe der Beziehung (10.167). 10.14 Beweisen Sie die Beziehungen
m 20 c2γ μ , p/ p/ γ μ m 20 c2 γ μ ,
γ μp/¼p/¼
2γ μ , γ αp/γ μ γα 4 p μ ,
4p μ , γ αp/γ μp/ γα 2m 20 c2 γ μ .
γ α γ μ γα
γ α γ μp/¼ γα
¼
¼
10.15 Beweisen Sie, daß das Feld φ mit der Lagrange-Dichte h 2 2m
0
g αβ (∂α φ)(∂β φ)
m 0 c2 2 g φ φn 2 n
den potentiellen Divergenzgrad D 4 (n 4)V N besitzt.
Lösungen 10.1
(1)
In (10.20) ist u(l ¼ , p¼ )γ α v(l ¼¼ , p¼¼ ) g λλ εα (λ)(k) dimensionslos, so daß S(d) ea die Dimension von e h μ0 m 0 c3 δ 4 ( p¼ . . .)/ Ep Ep ωk besitzt. Die δ 4 -Funktion hat die Dimension von 1/ p4 . Mit μ0 c2 1/ε0 und der dimensionslosen Feinstrukturkonstanten α e2 /(ε0 h c) läßt sich sehr einfach die Dimension von μ0 berücksichtigen. Insgesamt ergibt sich auf diese Weise 4 3 3 3 4 4 e2 h αh2 c e h μ0 m 0 c3 (1) Dim Dim Dim Dim S(d)ea p 8 ε0 ω p8 ω p4 E 2 ω 1 Dim 3 3/2 . p k Ähnlich findet man für (10.43) 3 4 h 4 e2 m 20 c4 h μ0 c 1. Dim (Sea ) Dim p4 V 2 E 2 h 2 k 2
¼
¼¼
Der Unterschied erklärt sich auf folgende Weise: In beiden Fällen hat S mit der Wahrscheinlichkeit des Übergangs vom Zustand a zum Zustand e zu tun. Im ersten Fall wurden hierfür nicht-normierbare Wellen aus einem Kontinuum benutzt, im zweiten diskrete Wellen. In S e S a ist der Operator S dimensionslos, was z. B. aus (10.11) ersichtlich wird, so daß S die Dimension von e a erhält. Im ersten Fall ist diese nach (10.19) bezüglich a gleich der von b(λ) und bezüglich e gleich der von a b , nach (8.127c) und (8.177a,b) also gleich Dim(1/k 3/2 ) bzw. Dim(1/ p3 ). Im zweiten Fall ergibt sich für Anfangs- und Endzustand aus (10.6) und (10.41) die Dimension eins. Im ersten Fall ist S 2 daher eine Wahrscheinlichkeitsdichte, im zweiten eine Wahrscheinlichkeit für den Übergang.
370
10 Quantenelektrodynamik
10.2
Für jedes ein- bzw. auslaufende Elektron gilt Gleichung (8.163), p p m 20 c2 , so daß jedes von ihnen 3 Freiheitsgrade besitzt. Durch den Erhaltungssatz p1α p2α p¼ α1 p¼ α2 werden insgesamt vier von diesen festgelegt. Die Größe (p)(p) ( piα
p αk )( pi α p k α )
1 oder 2 enthält zwei Impulse und daher nach Berücksichtigung von p pm 20 c2 noch sechs freie ¼
¼
mit i, k
Impulskomponenten. Durch den Impulserhaltungssatz werden von diesen maximal vier festgelegt, so daß (p)(p) noch mindestens zwei freie Parameter enthält. Diese können so gewählt werden, daß (p)(p) jeden beliebigen Wert annimmt.
10.3
Unter Benutzung von (2.212), (2.205) und (2.202) bzw. u ¼ u ¼ γ 0, (γ 0 )2 1, 0 β 0 β 0 0 0 0 0 und γ γ γ γ γ ergibt sich γ γ γ γ β (u γ u) (u γ 0 γ β u) (u γ 0 γ β γ 0 γ 0 u) (u γ β γ 0 u) γ β u ) γ 0 u
s.u.
(γ 0 u) γ β u
γ 0 γ β u
u
u
γ 0γ β u
uγ β u .
Dabei benutzt wurde die für Spinoren ψ und χ gültige Beziehung 4 (ψ χ) (ψl χl ) (χl ψl ) χ ψ . l 1
10.4
l
Sp γ α 0 folgt aus der Darstellung (2.172). Weiterhin gilt mit Sp(A B) Sp(B A) 1 (2.204) gαβ Sp E 4gαβ . Sp γ α γ β Sp γ β γ α Sp γ α γ β γ β γ α 2 Mit (2.209) und Sp(A B) Sp(B A) ergibt sich Sp γ λ γ μ γ ν Sp (γ λ γ μ γ ν γ 5) γ 5 Sp γ 5(γ λ γ μ γ ν γ 5) (2.208b) Sp γ λ γ 5γ μ γ ν γ 5 . . . Sp γ λ γ μ γ ν γ 5γ 5 Sp γ λ γ μγ ν 0 . Den zweiten Satz von Gleichungen erhält man gemäß 1 α β γ α γα gαβ γ α γ β gβα γ β γ α gαβ γ β γ α gαβ (γ α γ β γ β γ α )gαβ g αβ 4, 2 β α αβ α β αβ α γ γ γβ 2g γ γ γβ 2g γβ γ γ β γβ 2γ α 4γ α 2γ α . und mit Sp(γ λ γ μ γ ν γ κ ) Sp(γ κ γ λ γ μ γ ν ) aus Sp(γ κ γ λ γ μ γ ν ) Sp (2g κλ γ λ γ κ )γ μ γ ν 2g κλ Sp(γ μ γ ν ) Sp(γ λ γ κ γ μ γ ν ) 8gκλ gμν Sp γ λ (2gκμ γ μ γ κ )γ ν 8gκλ gμν 8gκμ gλν Sp(γ λ γ μ γ κ γ ν )
. . . 8gκλ gμν 8gκμ gλν 10.5
8g κν g λμ Sp(γ λ γ μ γ ν γ κ ) .
Mit den Ergebnissen von Aufgabe 10.4 ergibt sich p1μ Sp γ β γ λ γ α γ μ m 2 c2 Sp γ β γ α Sp γ β (/ p1 m 0 c) γ α (/ p1 m 0 c) p1λ 0 Sp γ β γ λ γ α m 0 c p1λ p1μ Sp γ β γ α γ μ p1μ Sp γ β γ λ γ α γ μ 4m 20 c2 gαβ p1λ p1μ gβλ gαμ gβμ gλα gβα gλμ , 4m 20 c2 gαβ 4 p1λ
Aufgaben
371
und aus der letzten Zeile folgt unmittelbar die behauptete Beziehung. 10.6
Zunächst gilt B
γ β p/1¼ m 0 c γ α p/1 m 0 c γβ
m 20 c2 γ β γ α γβ γ β p/1¼ γ α p/1 γβ β /¼ γ α γ γ β γ α p/ γ m 0 c γ p β 1 β . 1
Mit dem vorletzten Ergebnis von Aufgabe 10.4 ergibt sich γ β p/1¼ γ α γβ
¼ ¼ 2g βλ γ λ γ β γ α γβ p1λ γ β γ λ γ α γβ p1λ ¼ ¼ 2 p1λ g αλ 4 p1¼ α γ α γ λ γ λ γ α 4 p1λ
und analog γ β γ αp/1 γβ 4 p1 α . Mit der Formel γ αp/1
γ α γ λ p1λ
2g αλ γ λ γ α p1λ
2 p1α
p/1 γ α ,
deren Anwendung durch Überklammerung des entsprechenden Ausdrucks angezeigt wird, ergibt sich weiterhin , -. / γ βp/1¼ γ α p/1 γβ
weil
, -. / , -. / γ β p/1¼ 2 p1α p/1 γ α γβ 2 p1α γ β p/1¼ γβ γ β p/1¼ p/1 γ α γβ ¼ 2 p1α γ β 2 p1β γβ p /1¼ 2 p1¼ β p/1¼ γ β p/1 γ α γβ 4 p1α p/1¼ 8 p1α p/1¼ 2/ p1 γ αp/1¼ p/1¼ γ βp/1 γ α γβ
, -. / p/1¼ γ βp/1 γ α γβ
2/ p1 γ αp/1¼ ,
, -. / p/1 γ β γ α γβ 2/ p1¼ γ αp/1 2/ p1¼ p/1 γ α 2/ p1¼ γ αp/1 2/ p1¼ 2 p1α γ αp/1 4 p1αp/1¼ .
p/1¼ 2 p1 β
Einsetzen der erzielten Teilergebnisse und von γ β γ α γβ 2γ α in B führt zu der angegebenen Umformung. 10.7
Mit
, -. / γ αp/1¼ p/2¼ m 0 c γα
(2 p1¼ α p/1¼ γ α )(/ p2¼ m 0 c)γα , -. / 2/ p2¼ p/1¼ 2m 0 c p/1¼ p/1¼ γ αp/2¼ γα 4m 0 c p/1¼ 2/ p2¼ p/1¼ 2m 0 c p/1¼ p/1¼ 2 p2¼ α p/2¼ γ α γα 4m 0 c p/1¼ 2/ p2¼ p/1¼ 2m 0 c p/1¼ 2/ p1¼ p/2¼
s.u.
4 p1¼ p2¼ 2m 0 c p/1¼ ,
¼ ¼ ¼ ¼ p1μ (γ λ γ μ γ μ γ λ )2 p1λ p1μ g λμ 2 p1¼ p2¼ benutzt wurde, wofür p/1¼ p/2¼ p/2¼ p/1¼ p1λ mit p2¼ m 0 c)γα 2 p2¼ α γα (m 0 cp/2¼ )γ α γα 4m 0 c2/ p2¼ γ α (/
372
10 Quantenelektrodynamik
und mit dem Ergebnis von Aufgabe 10.6 wird A 2m 20 c2 γ α 4m 0 c( p1 p1¼ )α 2 p/1 γ α p/1¼ ( p/2¼ m 0 c)γα ( p/2 m 0 c)
2m 20 c2 (4m 0 c 2 p/2¼ )( p/2 m 0 c)4m 0 c ( p/2¼ m 0 c)( p/1 p/1¼ )( p/2 m 0 c)
8m 30 c3 p/2 8m 40 c4 4m 20 c2 p/2¼ p/2 4m 30 c3 p/2¼ 4m 0 c p/2¼ p/1 p/2 4m 20 c2 p/2¼ p/1
2 p/1 (4 p1¼ p2¼ 2m 0 c p/1¼ )( p/2 m 0 c)
4m 0 c p/2 p/1 p/2 4m 20 c2 p/2 p/1 4m 20 c2 p/1 p/2 4m 30 c3 p/1 4m 20 c2 p/1 p/2 4m 30 c3 p/1 8 p1 p2 p/1 p/2 8m 0 cp1 p2 p/1 4m 0 c p/1 p/1 p/2 4m 20 c2 p/1 p/1 . Mit Sp( A i ) Sp A i sowie dem ersten und dritten Ergebnis von Aufgabe 10.4 wird ¼
¼
¼
¼
z. B.
Sp p/2
¼
¼
¼
¼
¼
p2λ Sp γ λ 0 ,
¼
¼
¼
¼ Sp(/ p2¼ p/1 p/2 ) p2λ p1μ p2ν Sp(γ λ γ μ γ ν ) 0 .
Hiermit und mit Sp(/ p1p/2 ) p1λ p1μ Sp(γ λ γ μ ) 4g λμ p1λ p1μ
4 p1 p2
etc. ergibt sich schließlich
Sp A 32m 40 c44m 20 c2 Sp p/2¼ p/2 p/2¼ p/1 p/2¼ p/1¼ p/1 p/2 p/1¼ p/2 p/1 p/1¼ 8 p1¼ p2¼ Sp(/ p1 p/2 ) 16 2m 40 c4m 20 c2 ( p2 p2¼ p1 p2¼ p1¼ p2¼ p1 p2 p1¼ p2 p1 p1¼ ) 2 p1¼ p2¼ p1 p2 .
10.8
Energie- und Impulserhaltung bedeuten E h ω E ¼ h ω¼ ,
ph k p¼ h k ¼ .
Im Ruhsystem des einfallenden Elektrons gilt E m 0 c2 und p0. Mit ω k c, ω¼ k ¼ c und k k ¼ k k ¼ cos ϑ sowie E ¼ (m 20 c4 p¼ 2 c2 )1/2 folgt aus dem Energieerhaltungssatz (nach Teilen durch c) m 20 c2 p¼ 2 m 0 c h ( k k ¼ ) und aus dem Impulserhaltungssatz
h 2 (k2k 2 2kk cos ϑ) . Elimination von p 2 und Auflösen nach k führt zu der behaupteten Beziehung. Mit (8.190a) und b) bzw. p/ u m 0 c u und u p/ m 0 c u ergibt sich ,-./ ,-./ u γ αp/ γ μp/ γα u u γ αp/ γ μ 2 pα γα p/ u 2u p/ p/γ μ u u γ αp/ γ μ γα p/ u 2m 0 cu 2 pμ γ μp/ u u 2 pα p/γ α γ μ γα p/ u p¼ 2
h 2 (k
k ¼ )2
¼
¼
10.14
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
¼
,-./ u ¼ 4m 0 cpμ 2m 20 c2 γ μ u u ¼ 2 γ μp/ p/¼ p/γ α γ μ γα p/¼ u s.u. ¼ u 4m 0 cpμ 2m 20 c2 γ μ u 2u ¼ 2 pμ p/ γ μ p/¼ u 2u ¼p/ γ μp/¼ u u ¼ 4m 0 cpμ 2m 20 c2 γ μ 4 pμ m 0 c u 2m 20 c2 u ¼ γ μ u .
Dabei wurde in dem mit bezeichneten Schritt γ α γ μ γα 2γ μ benutzt. Die übrigen Ergebnisse erhält man auf ähnliche Art und Weise. s.u.
III
Einführung in die Elementarteilchentheorie
11
Einleitung zur Elementarteilchentheorie
Die Elementarteilchenphysik befaßt sich mit den kleinsten Bestandteilen der Materie und deren Wechselwirkungen. Sie bietet den Versuch einer Lösung des berühmten Problems von Goethes Faust: „... daß ich erkenne, was die Welt im Innersten zusammenhält“. In diesem Teil des Buches wird es zunächst darum gehen, die Teilchen kennen zu lernen, die man heute als elementar auffaßt. Dabei benutzen wir die Bezeichnung Elementarteilchen entweder für isolierte Teilchen, die sich nicht weiter zerlegen lassen und nach derzeitiger Kenntnis keine innere Struktur aufweisen (z. B. Elektronen), oder für die kleinsten Elemente der inneren Struktur nicht weiter zerlegbarer, aber strukturierter Teilchen, z. B. Quarks im Neutron. (Diese Verfahrensweise ist nicht durchgängig üblich, es gibt Autoren, die Quarks nicht als Elementarteilchen auffassen, da sie nicht frei auftreten, sondern stattdessen nur die einfachsten, aus diesen zusammengesetzten freien Teilchen.) Als nächstes erhebt sich die Frage, welche Eigenschaften diese „Teilchen“ besitzen – diese äußern sich in den verschiedenen Möglichkeiten der Wechselwirkung. Schließlich möchte man Gesetzmäßigkeiten finden, auf denen diese Eigenschaften beruhen, und diese zu einer möglichst umfassenden Theorie zusammenfassen. Unter den vielen heute bekannten Elementarteilchen treten nur wenige in unserer natürlichen Umgebung auf, die meisten sind unter den hier vorliegenden Bedingungen instabil und deshalb nicht vorzufinden. Zur Beschreibung des Aufbaus von Atomen, Molekülen und der aus diesen zusammengesetzten makroskopischen Materie benötigt man nur Elektronen, Protonen und Neutronen. Die letzteren sind allerdings als freie Teilchen instabil und zerfallen mit einer mittleren Zerfallsdauer von 15 Minuten; im Kern gebunden verhalten sie sich dagegen im wesentlichen wie stabile Teilchen. Ansonsten spielen in unserer Umwelt noch Photonen eine Rolle. In der Frühzeit des Universums, als alle Materie bei extrem hohen Temperaturen extrem dicht zusammengepackt war, bestand eine völlig andere Situation. In dieser fanden Teilchen, die heute nur künstlich erzeugt werden können oder als Boten ganz anderer Umstände aus dem Weltraum zu uns gelangen, die Bedingungen für eine natürliche Existenz vor. Dieser Sachverhalt hat zu einem faszinierenden Zusammenhang der Physik des Weltalls, also des ganz Großen, mit der Physik des Allerkleinsten geführt. Zwei Elementarteilchen derselben Sorte sind identische Kopien desselben Musters, es gibt zwischen ihnen auch nicht den geringsten Unterschied. Dies hat zu so einprägsamen Formulierungen geführt wie: „Ein Elektron ist ein Elektron ist ein Elektron“ oder „Kennt man eines, so kennt man alle“. Warum man das so genau weiß, wurde in der Quantenmechanik dargelegt: Es gibt Bedingungen, unter denen sich ein Ensemble vieler, sehr ähnlicher aber voneinander verschiedener Teilchen ganz anders verhält als ein Ensemble identischer Teilchen. Da Materie Masse besitzt, haben Elementarteilchen als deren kleinste Bausteine natürlich auch eine Masse – Ruhemasse oder bewegte Masse. Nach der Einsteinschen
376
11 Einleitung zur Elementarteilchentheorie
Formel E mc2 ist diese einer Energie äquivalent. Es war eine der großen Überraschungen bei der Erforschung des Aufbaus von Atomen zu Beginn des 20ten Jahrhunderts, daß deren Masse bzw. die dieser entsprechende Energie in einem winzigen Bruchteil des zur Verfügung stehenden Raumes konzentriert ist, so daß die Atome fast nur aus leerem Raum zu bestehen scheinen. Als E. Rutherford bei seinen berühmten Streuversuchen feststellte, wie winzig der Atomkern im Vergleich zum ganzen Atom ist, äußerte er: „Es war fast so, wie wenn jemand eine Granate auf ein Stück Seidenpapier geschossen hätte, diese wäre zurückgeprallt und hätte ihn getroffen.“ Nachdem sich mittlerweile herausgestellt hat, daß die Atomkerne aus Protonen und Neutronen zusammengesetzt sind, die ihrerseits eine Quarkstruktur aufweisen, ist klar, daß die Masse bzw. Energie unter extremer Dichte in den Elementarteilchen konzentriert ist. Es ist bemerkenswert, daß sich diese Konzentration von Masse auf kleine Bereiche eines viel größeren Raumgebiets, das im Prinzip zur Verfügung stehen würde, auf immer größer werdenden Skalen mehrfach wiederholt. Beim Aufbau von Molekülen aus Atomen bleiben zwischen den letzteren größere Lücken, und auch wenn wir von den Dimensionen unseres Alltagslebens in größere Dimensionen schauen, tun sich große Lücken auf: Im Sonnensystem zwischen den Planeten sowie zwischen diesen und der Sonne, in der Milchstraße zwischen den verschiedenen „Sonnensystemen“, in Galaxienhaufen zwischen den verschiedenen Galaxien usw. Die starke Konzentration von Energie in kleinsten Raumdimensionen hat für die Theorie der Elementarteilchen zwei wichtige Konsequenzen: Sowohl relativistische als auch Quanteneffekte spielen eine Rolle, d. h. es handelt sich um eine relativistische Quantentheorie. Da wir uns auch für die Wechselwirkungen der Elementarteilchen interessieren und die Relativitätstheorie bei diesen keine Fernwirkungen, sondern nur Nahewirkungen zuläßt, müssen wir die Wechselwirkungen durch Felder beschreiben. Für diese werden im Bereich der betrachteten Raumdimensionen und Feldstärken ebenfalls Quanteneffekte wichtig, so daß eine vollständige Theorie der Elementarteilchen zwangsläufig eine relativistische Quantenfeldtheorie ist. Viele Fragen lassen sich allerdings auch schon mit einer relativistischen Quantentheorie beantworten, ohne dabei die komplizierten Schritte einer Feldquantisierung nachvollziehen zu müssen. Wie in den meisten Gebieten der Physik kommt auch in der Elementarteilchenphysik ausgeklügelten Experimenten eine ebenso große Bedeutung zu wie klug erdachten theoretischen Gedankengebäuden. In diesem Buch wird es im wesentlichen um die letzteren gehen. Eine sehr wichtige Frage ist natürlich, wie man zu Informationen über Elementarteilchen gelangt. Das geschieht durch Streuexperimente, die Untersuchung des Zerfalls instabiler Teilchen oder das Studium gebundener Zustände von mehreren Elementarteilchen. Aus Platzgründen muß dieser Aspekt der Elementarteilchentheorie jedoch in dieser Einführung ausgespart werden. Die für einen einzelnen Streuprozeß benötigte Energie ist nicht sehr hoch. Man gibt sie üblicherweise in eV, MeV oder GeV an, und wenn man bedenkt, daß eine 100 W-Lampe in einer Stunde 0,1 kWh 21015 GeV verbraucht, erkennt man, daß selbst 1 GeV eine kleine Energiemenge darstellt. Die für Streuprozesse benötigte Energie muß allerdings wegen der Kleinheit des Targets außerordentlich konzentriert sein. Dies gelingt nur, indem man sehr kleinen Teilchen, im allgemeinen also Elementarteilchen wie Elektronen, oder aber Protonen und allenfalls größeren Kernen diese Energie gibt und sie auf das zu untersuchende Targetteilchen schießt. Damit man dann aber eine
377 Teilchen Moleküle Atome Kerne Nukleonen
Aufbau Atome Kern + Elektronen Nukleonen Quarks
B/(m K c2 ) 10 10 10 4 10 3 0 10 10 2
Tabelle 11.1: Bindungshärte der Konstituenten zusammengesetzter Teilchen, gemessen in Bindungsenergie B geteilt durch die der Konstituentenmasse m K entsprechenden Energie m K c2 .
hinreichend große Trefferwahrscheinlichkeit erhält, muß man das Target mit sehr vielen Teilchen beschießen, die alle auf dieselbe Energie gebracht wurden, und dann kommt man in der Summe doch auf ganz beachtliche Energien. Dies wird in den großen Teilchenbeschleunigern bewerkstelligt, die deshalb für die Elementarteilchenphysik von überragender Bedeutung sind. Streuexperimente führt man nicht nur an separaten Elementarteilchen durch, sondern an größeren Teilchen, die aus Elementarteilchen zusammengesetzt sind, entweder, weil die elementaren Bausteine gar nicht isolierbar sind – dies gilt, wie wir später noch sehen werden, für die Quarks –, oder weil sie in gebundenen Zuständen stabiler sind. Es hat sich herausgestellt, daß die Kräfte, durch die zusammengesetzte Teilchen zusammengehalten werden, mit abnehmender Größe der Teilchen immer stärker werden, die Teilchen werden immer „härter“ (Tabelle 11.1). Daher benötigt man zu ihrer Untersuchung oder Zerlegung auch immer höhere Energien. Bei den Streuprozessen können jedoch auch Teilchen erzeugt werden, die vorher in keinem der Stoßpartner enthalten waren. Aus Gründen der Energieerhaltung muß bei ihrer Erzeugung mindestens die in ihrer Ruhemasse enthaltene Energie zur Verfügung gestellt werden. Sie ist von dem stoßenden Teilchen aufzubringen, dessen kinetische Energie daher mit zunehmender Masse der Teilchen, die man erzeugen möchte, größer werden muß. Dies zeigt, daß der Trend zu immer größeren Beschleunigern nicht von Rekordsucht diktiert wird, sondern mit den Teilchen zu tun hat, die es zu untersuchen bzw. zu erzeugen gilt. Eigentlich sollte man erwarten, daß es sich bei den elementaren Bestandteilen der Materie um etwas Einfaches und Überschaubares handelt, das sich am einfachsten in einer übersichtlichen Tabelle präsentieren oder durch ein einfaches Modell darstellen läßt. So etwas gibt es bei den Atomen. Auf deren Theorie kam man durch das Studium einer zunächst als unüberschaubar erscheinenden Fülle von Spektrallinien angeregter Atome, indem man dessen Erkenntnisse mit dem Wissen über die Eigenschaften des Elektrons und die Existenz von Kernen in Atomen aufgrund von Streuversuchen verband. Leider ist die Situation bei den Elementarteilchen nicht ganz so einfach: Es gibt davon zu viele verschiedene, und diese weisen in ihren Eigenschaften eine relativ große Vielfalt auf. Man hat für sie allerdings heute ein Standardmodell, das sich, wenn es auch in mancherlei Hinsicht noch unvollständig ist, für viele Zwecke als äußerst brauchbar erwiesen hat und letztlich einen hervorragenden Überblick ermöglicht. Die hier präsentierte Einführung in die Elementarteilchentheorie soll tatsächlich nur eine Einführung sein: Sie soll das Interesse für eines der spannendsten Kapitel der Physik wecken, aber den Leser nicht durch ellenlange Rechnungen abschrecken. Es ist erstaunlich, daß man schon auf einem quasi klassischen Niveau, auf dem die
378
11 Einleitung zur Elementarteilchentheorie
die Teilchen beschreibenden Felder ähnlich wie das Maxwell- oder Schrödinger-Feld behandelt und nicht quantisiert werden, wesentliche Strukturen der Theorie erkennen kann, insbesondere die Gruppierung der Teilchen in Familien. Das macht sich diese Einführung zunutze, indem sie durchwegs auf diesem Niveau verbleibt. Für quantitative Fragen wie die Berechnung von Wirkungsquerschnitten, Lebensdauern oder Zerfallsraten, aber auch für einige wichtige Fragen qualitativer Natur wie die der großen Vereinheitlichung muß man die sehr viel schwierigere Quantenfeldtheorie heranziehen. Dies involviert dann Techniken, die teilweise in der Quantenfeldtheorie dieses Bandes behandelt wurden und deren Anwendung sich hier noch aufwendiger als dort gestalten würde. Aus Platzgründen muß darauf leider vollständig verzichtet werden. Wenn der Leser jedoch dazu angeregt wird, mehr erfahren zu wollen und Lücken zu schließen, die hier offen bleiben müssen, hat die hier dargebotene Einführung schon einen wichtigen Zweck erfüllt.
11.1
Historischer Rückblick auf die Entdeckung der Elementarteilchen
Das Standardmodell der Elementarteilchen ist zwar nicht so einfach wie das Bohrsche Atommodell, doch es hat eine beeindruckende Ordnung in eine große Vielfalt unterschiedlichster Phänomene gebracht. Sicher würde etwas von seiner Faszination verloren gehen, wenn man gleich mit ihm beginnen würde, ohne deutlich zu machen, in welchen „Wirrwarr“ scheinbar nicht zusammengehöriger Erfahrungen es Ordnung gebracht hat. Außerdem läßt sich viel dabei lernen, wenn man sich den historischen Ablauf der für die Elementarteilchenphysik wichtigen Entdeckungen vor Augen führt. Dies soll nachfolgend in kurzen Zügen geschehen, d. h. wir lassen die Akteure in der Reihenfolge ihrer Entdeckung die Bühne betreten, wobei dort, wo weitere Kommentare unnötig erscheinen, im wesentlichen nur Datum und Ereignis angegeben werden. Antike: Die Idee einer atomistischen Struktur der Materie geht auf die Griechen der Antike zurück. Nachdem Vorgänger wie Thales von Milet über einen Urstoff der Materie spekuliert hatten, brachte Demokrit das Konzept von Atomen auf, unter denen er kleine, unteilbare materielle Körper verstand, die alle aus derselben Substanz bestehen und sich nur durch ihre geometrische Form (rund, oval, eckig usw.) unterscheiden. Platon, für den „Ideen“ die eigentliche Wirklichkeit bildeten, hielt immaterielle symmetrische Gebilde wie Tetraeder, Würfel, Oktaeder usw. für die eigentlichen Grundelemente. Demgegenüber hielt Aristoteles eine Diskretisierung der Materie nicht für möglich, da er nicht einsehen mochte, warum man beim immer weiteren Zerteilen der Materie zu einem Ende kommen sollte. Derartige Gedanken aus dem Altertum haben zwar deutliche Parallelen in der moderneren Physik, wo z. B. Symmetrien für die Theorie der Elementarteilchen eine bedeutende Rolle spielen. Dennoch handelte es sich bei ihnen aber nicht um Erkenntnisse im Sinne einer modernen Wissenschaft, sondern eher um Spekulationen, die sich auch als völlig falsch herausgestellt haben könnten. Jedenfalls ging die spätere Weiterentwicklung von gänzlich neuen, auf empirischen Fakten beruhenden Erkenntnissen aus, wenn es auch sicher eine gewisse Erleichterung darstellte,
11.1 Historischer Rückblick auf die Entdeckung der Elementarteilchen
379
auf die alten Vorstellungen zurückgreifen zu können. Ihren Ursprung hatten die Überlegungen der Antike wohl in der Erkenntnis, daß in der Natur trotz aller Vielfalt Gesetzmäßigkeiten bestehen, die dafür sorgen, daß sich unter ähnlichen Umständen ähnliche Vorgänge abspielen, aber auch, daß unter relativ verschiedenen Umständen dieselben Stoffe wie Wasser, Metalle usw. anzutreffen sind. Ähnliche Überlegungen haben Jahrhunderte später auch I. Newton zu der Annahme geführt, daß „Gott am Anfang die Materie in festen, massiven, harten, undurchdringlichen, beweglichen Teilchen“ geschaffen habe „und daß die Natur aus diesem Grunde dauerhaft sei, wobei die Veränderungen der körperlichen Dinge nur den verschiedenen Trennungen und erneuten Zusammenfügungen dieser dauerhaften Teilchen zuzuschreiben seien.“ Moderne: Um die Wende vom 17. zum 18. Jahrhundert erfuhr die Atomtheorie eine Renaissance, die durch Gesetzmäßigkeiten inspiriert wurde, welche bei chemischen Reaktionen entdeckt wurden. 1794 stellte der französische Chemiker J.L. Proust sein Gesetz der konstanten Proportionen auf, nach dem zwei chemisch miteinander reagierende Substanzen bei der Reaktion nur dann völlig aufgebraucht werden, wenn ihre Massen in einem bestimmten, festen Verhältnis zueinander stehen. 1804 erweiterte der englische Physiker und Chemiker J. Dalton dieses zu einem Gesetz der multiplen Proportionen, nach dem für zwei Substanzen auch mehrere feste Massenverhältnisse möglich sind. 1803 postulierte Dalton die Existenz von Atomen. Alle Atome reiner Substanzen sind nach ihm chemisch und physikalisch identisch. Chemische Verbindungen werden in ganzzahligen Verhältnissen aus Atomen aufgebaut. Eine erste Tabelle Daltons mit Atomgewichten enthielt 6 Elemente und 13 Verbindungen. 1811 formulierte der Physiker A. Avogadro seine Atomhypothese: Gleiche Volumina idealer Gase enthalten bei gleichem Druck und gleicher Temperatur die gleiche Anzahl von Atomen bzw. Molekülen. Diese sind sehr klein und befinden sich andauernd in Bewegung. 1860 wird auf dem ersten internationalen Chemikerkongreß in Karlsruhe endgültig die Existenz von Atomen akzeptiert. 1869 ordnete D.I. Mendelejew die Elemente nach ihrer atomaren Massenzahl und ihren chemischen Ähnlichkeiten im Periodensystem der Elemente an. 1897 brachte J. J. Thomson den endgültigen Nachweis dafür, daß die schon länger bekannten Kathodenstrahlen, wie bereits vorher von anderen vermutet, aus elementaren Teilchen bestehen, nachdem G.J. Stoney 1874 für die kleinste Ladungseinheit den Namen Elektron eingeführt hatte. Erst im 20ten Jahrhundert wurde dieser auch auf das Teilchen übertragen. 1897/98 gelang W. Wien der Nachweis, daß Kanalstrahlen aus positiv geladenen Ionen bestehen. 1898 wies E. Rutherford nach, daß beim Zerfall von Uran zwei verschiedene Sorten von Strahlen emittiert werden, die er Alpha- und Betastrahlen nannte. Wenige Jahre später wurde man sich klar darüber, daß es sich bei den Betastrahlen um Elektronen handelt. 1900 hat M. Planck bei seinen Versuchen, das Spektrum der Hohlraumstrahlung zu erklären, die Idee der Quantisierung eingeführt. Er quantelte jedoch nur die Ener-
380
11 Einleitung zur Elementarteilchentheorie
giemenge, die von den in der Wand des Hohlraums befindlichen Oszillatoren in Licht überführt wird, also weder die Oszillatoren noch das Licht. 1905 stellte A. Einstein die Quantenhypothese für Licht auf, was jedoch lange nicht akzeptiert wurde. (Schon früher, z. B. zur Zeit Newtons, hatte man für Licht eine Korpuskulartheorie. Diese schien jedoch durch die Beobachtung von Wellenphänomenen, z. B. der Beugung, endgültig widerlegt.) 1913 entdeckte E. Rutherford bei seinen Streuversuchen (Beschuß von Atomen mit Alphastrahlen), daß die Atome einen sehr kleinen Kern besitzen, in dem im wesentlichen die ganze Ruhemasse und auch die positiven Ladungen des Atoms konzentriert sind. Außerdem erkannte er, daß es sich bei den Alphastrahlen um Kerne von Heliumatomen handelt. Den Kern von Wasserstoffatomen nannte er Proton. Im selben Jahr konstruierte N. Bohr sein berühmtes Atommodell. 1923 lieferte die Erklärung der Compton-Streuung durch A.H. Compton die endgültige Bestätigung von Einsteins Quantenhypothese für Licht. 1925 wurde von W. Heisenberg die Matrizenmechanik eingeführt. 1926 folgte E. Schrödinger mit der Wellenmechanik, die sich später als eine der Matrizenmechanik äquivalente Darstellung derselben Physik herausstellte. In diesem Jahr wurde auch von dem Chemiker G. Lewis für die Lichtquanten der Name Photonen eingeführt. 1927 stellte P. M. Dirac eine relativistische Wellengleichung auf, die heute als Dirac-Gleichung bezeichnet wird. Die Existenz von Lösungen negativer Energie und die damit verbundene Problematik der Instabilität von Zuständen positiver Energie inspirierte Dirac 1929 zu der Idee, daß die Zustände negativer Energie schon alle besetzt sind, und daß Löcher in der von den Elektronen negativer Energie gebildeten „Dirac-See“ positiv geladene Teilchen positiver Energie repräsentieren. Dies bedeutete im Grunde die theoretische Vorhersage des Positrons und von Antiteilchen. Allerdings wagte es Dirac zunächst nicht, die Existenz eines neuen Teilchens zu postulieren, und stellte die Löcher in seiner Publikation als Protonen vor, obwohl ihm klar war, daß deren Ruhemasse dafür zu groß ist. Erst in seiner 1931 erschienenen Arbeit über magnetische Monopole stellte er klar, daß es sich sich um Antielektronen handeln müsse. 1930 Vorhersage des Neutrinos durch W. Pauli, um beim Betazerfall von Atomen, A... B ... e , das Problem zu lösen, daß der Energie- und Impulssatz nicht gleichzeitig erfüllt werden können, wenn man den Zerfall in nur zwei Teilchen annimmt (Aufgabe Q2.2). Nach Pauli werden Teile des Impulses von einem ungeladenen Teilchen, dem Neutrino, übernommen. Erst 1955 gelang ein direkter Nachweis der Neutrinos durch C.L. Cowan und F. Reines mit dem inversen Betazerfall p n e . 1932 entdeckte C.D. Anderson das von Dirac postulierte Antielektron, das Positron. 1932 entdeckte J. Chadwick beim Beschuß von Kernen mit Alphateilchen (Heliumkernen) das Neutron. Mit diesem konnte erklärt werden, warum das Atomgewicht vom Wasserstoff zum Helium von 1 auf 4 und nicht nur auf 2 anwächst. Heisenberg brachte die Idee auf, Neutron und Proton wegen ihrer fast gleichen Ruhemassen als zwei Zustände ein und desselben Teilchens aufzufassen. 1933 entwickelte E. Fermi eine Theorie des Betazerfalls. Diese lieferte eine Bestätigung der Existenz des Neutrinos, wobei das beim Betazerfall entstehende Neutrino heute aus systematischen Gründen als Antineutrino bezeichnet wird. 1934 entwickelte H. Yukawa eine Theorie der Kernkraft, also der Kraft, die Proto-
11.1 Historischer Rückblick auf die Entdeckung der Elementarteilchen
381
nen und Neutronen im Kern zusammenhält. Für die Quanten des Feldes dieser Kraft berechnete er eine Ruhemasse von etwa 300 Elektronenmassen. Weil diese zwischen der des Elektrons und des Protons liegt, wurde dafür der Name Meson (von griech. mesos = mittel) eingeführt, während Elektronen zur Klasse der Leptonen gehören (von griech. leptos = leicht) und Protonen sowie Neutronen zur Klasse der Baryonen (von griech. barys = schwer). Später wurden die Namen dieser Klassen beibehalten, obwohl man längst andere Ordnungskriterien als leicht, mittel und schwer gefunden hatte, so daß sich heute in diesen Klassen auch Teilchen befinden, zu denen der Name nicht paßt. 1938 führte E.C.G. Stückelberg eine Baryonenzahl ein, die bei Zerfallsprozessen erhalten bleiben soll. Hierdurch wollte er die Stabilität des Protons erklären, das ohne diese Forderung gemäß p e zerfallen könnte. 1947 wurden in der Höhenstrahlung die Myonen entdeckt, welche die gleiche Ladung wie das Elektron tragen. Ihre Ruhemasse von etwa 207 Elektronenmassen legte zunächst die Vermutung nahe, es könne sich um die von Yukawa postulierten Quanten des Feldes der starken Wechselwirkung handeln, weshalb sie auch mit dem nach heutigen Maßstäben irreführenden Namen -Mesonen belegt wurden. Da sie jedoch nur sehr schwach mit gewöhnlicher Materie wechselwirken, mußte diese Idee aufgegeben werden. Bei ihnen traf man zum ersten Mal auf Teilchen, die nicht zur Erklärung des Aufbaus oder Zerfalls gewöhnlicher Materie benötigt werden. Da sie sich in allen ihren Eigenschaften bis auf das Gewicht wie Elektronen verhalten, werden sie zur Klasse der Leptonen gezählt. Außerdem wurde entdeckt, daß sich neben ihnen in der Höhenstrahlung auch andere, mittelgewichtige Teilchen befinden, mit denen sie gelegentlich verwechselt worden waren. Diese werden heute als -Mesonen bezeichnet, und bei ihnen handelt es sich um die von Yukawa postulierten Vermittler der starken Kraft in den Kernen. 1947–1960 Entdeckung der seltsamen Teilchen (Kaonen, die zur Familie der Mesonen gehören, weitere Mesonen, zu den Baryonen gehörige -Teilchen, -Teilchen usw.) Der Name „seltsame Teilchen“ rührt daher, daß diese in modernerer Nomenklatur unter der „starken Wechselwirkung“ erzeugt werden, aber unter der „schwachen Wechselwirkung“ zerfallen. 1953 führten M. Gell-Mann und K. Nishijima in Weiterführung einer Idee von A. Pais eine neue Erhaltungszahl Strangeness ein, die bei starken Wechselwirkungsprozessen erhalten bleibt, nicht jedoch bei schwachen. Im selben Jahr konnten Cowan und Reines mit Hilfe der Reaktion p n e die Existenz von Neutrinos nachweisen, die in hoher Intensität aus einem Kernreaktor kamen. 1955 Entdeckung des Antiprotrons, p, am Berkeley-Bevatron. 1956 Entdeckung des Antineutrons, n, am Berkeley-Bevatron. 1961 führte M. Gell-Mann ein Schema zur Klassifizierung von Baryonen und Mesonen ein, das als Achtfacher Weg bezeichnet wird und unabhängig davon auch von Y. Ne’eman gefunden wurde (Abb. 11.1). Dieses Schema erwies sich als außerordentlich fruchtbar, weil der Versuch zu seiner Erklärung nur wenig später zum Konzept der Quarks führte. Von dem in Abb. 11.2 dargestellten Baryonen-Dekuplett waren 1961 alle Teilchen bis auf das bekannt. Gell-Mann forderte die Existenz des letzteren aus systematischen Gründen, ja, er hatte sogar eine einfache Formel zur Berechnung seiner Ruhemasse aus den Ruhemassen der übrigen Mitglieder des Dekupletts, und tatsächlich
382
11 Einleitung zur Elementarteilchentheorie n0 Σ0
Σ
0
Σ
Λ (a)
Ξ
Ξ0
K
K0
p
(b)
K
0 K
Abb. 11.1: (a) Baryonen-Oktett. Auf Geraden, die schräg von links oben nach rechts unten verlaufen, befinden sich Teilchen gleicher Ladung, auf horizontal verlaufenden Geraden Teilchen gleicher Strangeness. (b) Mesonen-Nonett. Teilchen gleicher Ladung bzw. Seltsamkeit sind wie im Baryonen-Oktett angeordnet.
wurde seine Vorhersage wenig später bestätigt. Im gleichen Jahr wurde von L. Lederman, M. Schwartz und J. Steinberger ein neuartiges Neutrino entdeckt, das sich trotz fehlender Ladung in einer anderen Quantenzahl vom Elektron-Neutrino e unterscheidet. Es wurde dem Myon zugeordnet und wird als Myon-Neutrino bezeichnet. (Zu beiden gibt es ein dazugehöriges Antineutrino.) 1964 wurde von M. Gell-Mann und G. Zweig die Hypothese der Existenz von Quarks aufgestellt. Nach dieser sollen Mesonen und die gemeinsam als Nukleonen bezeichneten Kernbausteine Proton und Neutron eine Substruktur aus viel kleineren, Quarks genannten Teilchen besitzen. Dabei handelt es sich um Fermionen mit dem Spin 1/2, die in drei verschiedenen „Geschmacksrichtungen“ bzw. Flavors auftreten (eine Eigenschaft, die auch Leptonen besitzen), d. h. es gibt drei verschiedene Sorten, u, d und s für up, down bzw. strange, und zu jedem Quark gibt es natürlich ein entsprechendes Antiquark. Außerdem besitzen Quarks keine ganzen Elementarladungen, sondern die Ladungen (1/3)e oder (2/3)e (Tabelle 11.2; ob das obere oder untere Vorzeichen gilt, hängt davon ab, ob man es mit dem Quark oder seinem Antiteilchen zu tun hat.) Schließlich wurde ihnen außer dem Flavor noch die Quantenzahl Strangeness zugewiesen. Nach dem Quarkmodell besteht jedes Baryon aus drei Quarks, jedes Antibaryon aus drei Antiquarks, jedes Meson dagegen aus einem Quark und einem Antiquark. Wir werden im nächsten Abschnitt sehen, wie man mit dem Quarkmodell zu einer einfachen Erklärung des Achtfachen Weges kommt. Bei der Namengebung der Quarks war Gell-Mann zuerst der Klang des Wortes in den Sinn gekommen. Als er später bei einem „seiner gelegentlichen Streifzüge durch Finnegans Wake von James Joice“ in dem Satz „Three quarks for Muster Mark“ auf das Wort „quark“ stieß, fand er, daß „die Zahl drei perfekt mit der Art und Weise übereinstimmte, in der Quarks in der Natur vorkommen“, und entschied sich für die Schreibweise Quark. Noch in gleichen Jahr wurde von J.D. Bjorken und S. Glashow die Idee der Existenz eines vierten Quarks aufgebracht, das später den Namen Charm-Quark erhielt. Außerdem wurde auch das von Gell-Mann vorausgesagte -Teilchen entdeckt. Im selben Jahr wurde von O.W. Greenberg eine als Farbe bezeichnete Art von Ladung der Quarks eingeführt. Es gibt also nicht nur drei verschiedene Quarks, sondern jedes von diesen tritt in drei verschiedenen Farben auf, den Farben rot, grün oder blau,
11.1 Historischer Rückblick auf die Entdeckung der Elementarteilchen
383
0
0
0
Abb. 11.2: Baryonen-Dekuplett. Eigenschaften wie in Abb. 11.1.
zu denen es beim Antiteilchen die entsprechenden Antifarben gibt. Die Einführung der Farbe wurde notwendig, damit durch das Quarkmodell nicht das Pauli-Prinzip verletzt wird: So besteht nach dem Quarkmodell z. B. das Teilchen aus drei u-Quarks im gleichen Zustand, und wenn diese sich nicht durch ihre Farbe unterschieden, würde das Pauli-Prinzip verletzt. Die etwas verspielte Verwendung des Begriffes Farbe hat natürlich nichts mit dessen üblicher Wortbedeutung zu tun, vielmehr muß man sich Farbe als eine Eigenschaft wie Ladung oder Ruhemasse vorstellen, weshalb man manchmal auch von Farbladung spricht. Dabei gibt es Felder, die auf alle Teilchen mit Farbladung einwirken. Der Begriff der Quarkfarbe macht sich allerdings eine wichtige Eigenschaft unserer physiologischen Farbwahrnehmung zunutze: Eine Mischung der Spektralfarben rot, grün und blau sehen wir als weiß (farblos), und es ist natürlich, Antifarben so zu definieren, daß sich Farbe und Antifarbe zu weiß (farblos) ergänzen. Damit läßt sich jedoch ein wichtiger Befund über die in der Natur auftretenden Teilchen, die aus Quarks zusammengesetzt sind, sehr einfach ausdrücken: Alle natürlich auftretenden Teilchen sind farblos, und zwar in dem Sinne, daß entweder jede Farbe durch ihre Antifarbe neutralisiert wird, oder aber, daß von allen drei Farben gleich viele Quarks beteiligt sind. (Diese Aussage umfaßt auch alle Teilchen, die keine Quarks enthalten, da diese ebenfalls farblos sind.) Hierdurch wird auch der Tatsache Rechnung getragen, daß es keine freien Quarks gibt, denn jedes von diesen wäre farbig. Freie Teilchen, die aus zwei Quarks bestehen, müssen demnach aus einem Quark und einem Antiquark bestehen; diese Eigenschaft besitzen sämtliche Mesonen. Baryonen bestehen aus drei Quarks und werden durch die Formel qqq beschrieben, wobei q für einen der Flavors u, d oder s steht. Natürlich kann es auch Teilchen geben, die aus mehr als drei Quarks bestehen. Diese können jedoch in Teilchen aus zwei bzw. drei Quarks zerlegt werden. 1967/68 wurde, auf früheren Ideen von A. Salam basierend, die heutige Form einer Theorie der schwachen Wechselwirkung aufgestellt, zunächst von S. Weinberg und davon unabhängig etwas später von S. Glashow. Diese Theorie wird heute als Quantenflavordynamik (QFD) oder Glashow-Weinberg-Salam-Theorie (kürzer GWS-Theorie) bezeichnet. In ihr werden die schwache Wechselwirkung und die durch die Quantenelektrodynamik (QED) beschriebene elektromagnetische Wechselwirkung als verschiedene Erscheinungsformen einer einzigen Kraft, der elektroschwachen Kraft, behandelt. Als andere Erscheinungsform dieser Kraft wurde eine Flavorkraft vorhergesagt, welche die Streuung von Elektronneutrinos an Protonen und Neutronen beschreibt, ohne daß dabei eine Änderung der Quantenzahl Flavor eintritt. Die Quanten des zu dieser Kraft gehörigen Feldes sind die geladenen Teilchen W , W
384
11 Einleitung zur Elementarteilchentheorie
und das ungeladene Z0 -Teilchen. Vorläufer dieser Theorie waren die schon genannten Untersuchungen Fermis im Jahre 1933 sowie Arbeiten von R. Feynman, M. Gell-Mann und vielen anderen. 1970 wurde das Quarkmodell von S. Glashow, J. Iliopoulos und L. Maiani um ein weiteres Quark, das c-Quark, erweitert, das wegen einiger als zauberisch angesehener Auswirkungen auf die Theorie den Namen Charm (engl. für Zauber) erhielt. 1972 wurde erstmals eine umfassende Quantentheorie der Quarks und deren Wechselwirkungen aufgestellt, für die der an ihr beteiligte Gell-Mann den Namen Quantenchromodynamik, kurz QCD, einführte. Die starke Wechselwirkung ist nach ihr nicht, wie einst von Yukawa vermutet, eine von Pionen vermittelte Kraft zwischen den Nukleonen des Kerns, sondern eine durch Gluonen (von engl. glue = Leim, weil sie die Kerne „zusammenleimen“) vermittelte Kraft zwischen Quarks, die auf deren „Farbladung“ einwirkt und alle Teilchen mit Farbladung beeinflußt. Dabei verlangt die Theorie die Existenz von acht Gluonen, die selbst eine Farbladung tragen. 1974. In dieses Jahr fällt die als „Novemberrevolution“ bezeichnete Entdeckung des J-Teilchens durch C. C. Ting und etwas später unabhängig davon durch B. Richter, der es -Teilchen nannte. (Da man sich nicht auf einen Namen einigen konnte, blieben beide Namen bestehen, und man benutzt manchmal auch die Bezeichnung J/-Teilchen.) Dabei handelt es sich um ein elektrisch neutrales, schweres Meson, dessen Entdeckung deshalb als sensationell empfunden wurde, weil seine Lebensdauer, obwohl nur 10 20 s, um den Faktor 103 höher ist als die anderer instabiler Elementarteilchen. Dies wurde als Indiz für eine völlig neue Physik angesehen. cc stellte sich als ein gebundener Zustand des Charm-Quarks heraus. In der Folge wurden viele weitere Teilchen mit Charm (d. h. mit einem Charm-Quark) gefunden. 1975 wurde von M. Perl ein neues Lepton, das Tau-Teilchen, entdeckt. Dieses ist 3491mal so schwer wie das Elektron, und zu ihm sollte ein eigenes Neutrino existieren, das erst im Jahr 2000 entdeckt wurde. Damit kannte man zu dieser Zeit sechs Leptonen, jedoch nur vier Quarks. 1977 Entdeckung des Y-Mesons Ybb. Dieses enthält ein neues Quark, das zuerst „Beauty“ genannt wurde. Heute wird es jedoch aus systematischen Gründen als Bottom-Quark bezeichnet und mit b abgekürzt, weil es in der unteren Reihe der in Tabelle 11.2 aufgeführten Quarksystematik stehen muß. Eine zwischen Quarks und Leptonen festgestellte Symmetrie, die durch den Vergleich der Tabelleneinträge der beiden Teilchensorten erkennbar wird, ließ die Existenz eines weiteren, als Top-Quark bezeichneten Quarks erwarten. Zum Nachweis von dessen Existenz mußte allerdings bis 1996 gewartet werden. 1978 kann als das Jahr bezeichnet werden, ab dem das aus der Theorie der schwachen Wechselwirkung und der Quantenchromodynamik bestehende Standardmodell allgemein als Grundlage der Elementarteilchentheorie anerkannt ist. Nach ihm gibt es zwei Sorten von Elementarteilchen, Leptonen und Quarks, zwischen denen eine enge Parallelität besteht. Wechselwirkungen innerhalb dieser und zwischen diesen Sorten kommen durch Austauschteilchen, die Quanten der Wechselwirkungsfelder, zustande (Tabelle 11.2). Die starke Wechselwirkung wirkt nur zwischen Quarks, die schwache zwischen Quarks, zwischen Leptonen sowie zwischen Quarks und Leptonen, die elektromagnetische schließlich zwischen allen elektrisch geladenen Teilchen. Im Rahmen des Stan-
11.2 Erster Überblick
Fermionen Austauschteilchen (Bosonen)
385
Leptonen e , , e,
,
Q 0
Quarks u , c , t rot, grün, blau
Q 2/3
1
d , s , brot, grün, blau
1/3
schwache WW: W , Z0 z.T. el. magn. WW: Photon
starke WW: schwache WW: el. magn. WW:
8 Gluonen W , Z0 Photon
Tabelle 11.2: „Periodensystem“ der Elementarteilchen. Es gibt 6 Leptonen (links oben), 6 Quarks (rechts oben) und die deren Wechselwirkungen vermittelnden Austauschteilchen (unten): 8 Gluonen für die starke Wechselwirkung, 3 Vektorbosonen W , W und Z0 für die schwache Wechselwirkung und das Photon für die elektromagnetische Wechselwirkung. Leptonen und Quarks lassen sich in drei Familien einordnen derart, daß jeweils die Leptonen und Quarks der ersten, zweiten bzw. dritten Spalte zusammengehören, also e , e, u, d usw. Die Ladung Q ist in Vielfachen der Elementarladung e angegeben.
dardmodells wird zusätzlich auch noch die Existenz eines Higgs-Bosons gefordert, das von P.W. Higgs eingeführt wurde, um die Ruhemassen der Elementarteilchen erklären zu können. Einen experimentellen Nachweis von dessen Existenz gibt es bis heute nicht. 1979 gelang der Nachweis der Existenz der vom Standardmodell geforderten Gluonen im Speicherring PETRA am DESY (Hamburg). 1980. Um diese Zeit gelang mit Streuexperimenten der experimentelle Nachweis der Quarkstruktur von Nukleonen. 1981 Entdeckung des ersten Beauty-Baryons b udb. 1983 Entdeckung der Beauty-Mesonen B0 bd und B bu. Nachweis der Vektorbosonen W , W und Z0 durch C. Rubia und Mitarbeiter am CERN (Genf). 1996 Entdeckung des Top-Quarks (t), das auch „Truth“ genannt wird. Damit war die Symmetrie zwischen der Zahl der Leptonen und Quarks wiederhergestellt. 2000 Entdeckung des Tauneutrinos ντ am Fermi-Laboratorium. 2002 T. Nakano entdeckt ein aus fünf Quarks bestehendes Pentaquark (uudds).
11.2
Erster Überblick
In diesem Abschnitt wird zusammengefaßt, welche vorläufigen Erkenntnisse wir in dem historischen Abschnitt gewonnen haben und welche Schlüsse sich daraus im Moment ziehen lassen. Dabei sollen einige Befunde noch etwas ausführlicher erläutert werden. Schließlich können wir uns auch schon überlegen, welche Aufgaben bei einer theoretischen Beschreibung auf uns zukommen werden. Viele der Teilchen, die zuerst als elementar angesehen wurden, haben sich als zusammengesetzte Teilchen entpuppt. Wir wollen jedoch, wie schon im letzten Abschnitt gesagt, nur diejenigen Teilchen oder Strukturen als elementar ansehen, die nach gegenwärtiger Kenntnis keine innere Struktur aufweisen. Die Gesamtheit der in diesem Sinne elementaren Teilchen ist in Tabelle 11.2 zusammengefaßt. Es
386
11 Einleitung zur Elementarteilchentheorie ' ' '
Leptonen Teilchen Elektron Myon Tau Elektronneutr. Myonneutr. Tauneutrino
e
e μ τ
Quarks
Massec2
Mittl. Lebensd. [s]
Teilchen
0,51 MeV 106 MeV 1777 MeV < 5 10 6 MeV < 0,17 MeV < 24 MeV
2, 2 10 6 (291 1, 5) 10 15 ? ? ?
Up Down Charme Strange Top Bottom
¡
Tabelle 11.3: Leptonen und Quarks. „ Lebensdauer für möglich gehalten wird.
½ ¡ ¦ ¡ ½ ½ ½
Massec2 u d c s t b
1,5-5 MeV 5-17 MeV 1,1-1,4 GeV 60-170 MeV 165-180 GeV 4,1-4,4 GeV
½?“ bedeutet, daß auch ein Ze