Grundlagen der Quantenmechanik und Statistik
Teil II: Thermodynamik und Statistik
Vorlesungen an der Ruhruniversit¨ at...
105 downloads
998 Views
568KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Grundlagen der Quantenmechanik und Statistik
Teil II: Thermodynamik und Statistik
Vorlesungen an der Ruhruniversit¨ at Bochum
K.–U. Riemann
Inhaltsverzeichnis
1. Einfu ¨hrung 1.1 Temperatur und Zustandsgr¨oßen - Extensive und intensive Gr¨oßen - Thermodynamisches Gleichgewicht
1
1.2 Thermodynamik und Statistik
2
1.3 Ideales Gas und elementare Statistik - Verteilungsfunktionen im µ–Raum, Mittelwerte - Definition der Temperatur T und des Drucks - Thermische und kalorische Zustandsgleichung des idealen Gases
3
1.4 Die Maxwell-Boltzmannverteilung
5
2. Thermodynamik 2.1 Zustandsgr¨oßen und totale Differentiale - Der nullte Hauptsatz: Zustandsgr¨oße Temperatur
8
2.2 Der erste Hauptsatz - Arbeit und W¨arme, Energiesatz - Verbot des perpetuum mobile erster Art
9
2.3 Der zweite Hauptsatz - Die Entropie als Zustandsgr¨oße beim idealen Gas - Der Carnotsche Kreisprozeß - Verbot des perpetuum mobile zweiter Art - Die Entropie als universelle Zustandsgr¨oße - Entropie und Gleichgewicht, Zeitrichtung
11
2.4 Die thermodynamischen Potentiale - Legendretransformationen - Freie Energie, Enthalpie und Gibbssches Potential Maxwellrelationen - Extremaleigenschaften des thermodynamischen Gleichgewichts
17
2.5 Variable Teilchenzahl - Das chemische Potential µ - Das Potential J(T, V, µ) = −pV - Die Entropie des idealen Gases - Mischungsentropie und Gibbssches Paradoxon
20
i
2.6 Anwendungen: Reaktionsgleichgewichte - Gleichgewicht bei Stoffumwandlungen - Dampfdruck und Clausius–Clapeyron–Gleichung - Chemische Reaktionen und Massenwirkungsgesetz
22
2.7 Das Nernstsche Theorem
25
3. Die Grundlagen der Statistik 3.1 Shannons Informationsentropie - Der Informationsgehalt einer unkorrelierten Zeichenkette - Korrelationen
27
3.2 Die physikalische Entropie - Makro– und Mikrozust¨ande
30
3.3 Ideales Gas und µ–Raum–Statistik - Das Boltzmannsche H–Funktional - Maxwellverteilung und maximale Unkenntnis - Zerlegung des µ–Raums in Zellen h3 - Ununterscheidbarkeit und korrigierte Abz¨ahlung - Die Sackur–Tetrode–Formel
31
3.4 Die statistischen Gesamtheiten - Mikro– und Makro–Nebenbedingungen - Die Maximierung der Entropie - Lagrangeparameter und intensive Zustandsgr¨oßen
35
3.5 Die mikrokanonische Gesamtheit
38
3.6 Die kanonische Gesamtheit
39
3.7 Die großkanonische Gesamtheit
41
¨ 3.8 Die Aquivalenz der Gesamtheiten - Energieschwankungen in der kanonischen Gesamtheit - Dichteschwankungen in der großkanonischen Gesamtheit - Phasen¨ uberg¨ange
43
3.9 Klassische Γ–Raum–Statistik - Phasenraumdichte und Gesamtheiten - Die klassische und halbklassische Zustandssumme
45
4. Anwendungen 4.1 Der Gleichverteilungs–Satz
49 ii
4.2 Das klassische ideale Gas - Rotationsfreiheitsgrade des mehratomogen Gases
50
4.3 Der ideale Festk¨orper - Das Dulong–Petitsche Gesetz - Das Einstein–Modell
53
4.4 Eingefrorene Freiheitsgrade - Vibrations– und Rotationstemperatur
56
4.5 Das Problem idealer Quantengase - Der Fehler bei korrigierter Boltzmannabz¨ahlung - Zust¨ande und Besetzungszahlen - Die Zustandssumme und das Problem der Nebenbedingung - Der halbklassische Grenzfall
57
4.6 Fermi–Dirac– und Bose–Einstein–Statistik - Die Separation der großkanonische Zustandssumme - Besetzungszahlen bei Fermionen und Bosonen - Fermi–, Bose– und Boltzmann–Verteilung - Die Thermodynamik der Quantengase
61
4.7 Quantengase geringer Dichte - Druck¨anderung und Entartungsgrad
65
4.8 Das hochentartete Fermigas - Fermisee, Fermikante und Fermitemperatur - Nullpunktsenergie und Nullpunktsdruck - Metallelelektronen - Weiße Zwerge
67
4.9 Das entartete Bosegas - Die Bose–Einstein–Kondensation - Der λ–Punkt des 4 He
70
4.10 Das Photonengas - Strahlung als hochrelativistisches Bosegas - Das Stefan–Boltzmann–Gesetz - Das Plancksche und Rayleigh–Jeanssche Strahlungsgesetz
73
5. Probleme der Statistik 5.1 Meß–, Zeit– und Scharmittel - Das Problem der a priori–Wahrscheinlichkeiten - Mikrozust¨ande und Ergode - Mesung und Zeitmittelwert iii
75
- Die Reproduzierbarkeit von Meßergebnissen - Zeitmittel und Scharmittel 5.2 Die Ergoden– und die Quasi–Ergoden–Hypothese
77
5.3 Der Poincar´ esche Wiederkehreinwand
78
5.4 Irreversibilit¨at und Zeitumkehr - µ–Raum und Boltzmanns H–Theorem - Γ–Raum und Liouvillesatz - Entropie und effektives Phasenraumvolumen - Die Zeit als Ordnungsparameter - Das Problem der Zeitrichtung
79
Literaturhinweise
82
iv
1
Einfu ¨ hrung
1.1
Temperatur und Zustandsgr¨ oßen
Das ausgehende 18. Jahrhundert ahnte noch nichts von den grundlegenden Umw¨alzungen, die hundert Jahre sp¨ater das mechanistische Weltbild ersch¨ utterten. Die analytische Mechanik galt im wesentlichen als abgeschlossen, die Lehre von der Elektrizit¨at machte beeindruckende Fortschritte, und die ersten W¨armekraftmaschinen wurden entwickelt. Wie die Elektrizit¨at so wurde auch die “W¨arme” als ein zus¨atzliches akzidentelles Attribut der Materie angesehen: So wie eine Metallkugel eine elektrische Ladung tragen kann, so kann sie auch eine oder bestimmte “W¨armemenge” aufnehmen. Zum generellen Stand der wissenschaftlichen Erkenntnis merken wir an, daß 1775 — zehn Jahre nach dem Bau der ersten “modernen” Dampfmaschine durch J. Watt — die franz¨osische Akademie beschloß, keine Konstruktionsvorschl¨age f¨ ur ein perpetuum mobile mehr zur Pr¨ ufung anzunehmen. Sowohl der Wunsch, den Wirkungsgrad der W¨armekraftmaschinen zu verbessern, als auch Bed¨ urfnisse der aufbl¨ uhenden Chemie f¨ uhrten dann im 19. Jahrhundert zur systematischen Entwicklung der Thermodynamik, einer makroskopisch–ph¨anomenologischen Theorie der W¨arme. Ziel der Thermodynamik ist es, Gesetzm¨aßigkeiten zwischen den Zustandsgr¨ oßen eines Systems aufzufinden. Unter den Zustandsgr¨oßen versteht man makroskopische Parameter (z. B. Druck p und Volumen V ), die den thermodynamischen Zustand des Systems eindeutig festlegen. Ein Teil der Aufgabe ist daher, zu ermitteln, welche Parameter und Meßgr¨oßen u ¨berhaupt zu den Zustandsgr¨oßen geh¨oren. Daß diese Frage keineswegs trivial ist, mag man daran sehen, daß gerade der “W¨armeinhalt” (etwa einer W¨armeflasche) nicht zu den Zustandsgr¨oßen geh¨ort. Es zeigt sich, daß der Zustand eines thermodynamischen Systems nur dann eindeutig durch wenige makroskopische Parameter — also Zustandsgr¨oßen — beschrieben werden kann, wenn sich das System im thermodynamischen Gleichgewicht befindet. Das “Gleichgewicht” k¨onnen wir im Augenblick noch nicht pr¨azise definieren; notwendige Voraussetzung ist in jedem Fall die (Quasi–)Stationarit¨at. Einen ersten Schritt weiter kommen wir, wenn wir extensive und intensive Zustandsgr¨oßen unterscheiden. Extensiv sind solche Zustandsgr¨oßen, (z. B. Energie E und Volumen V ), die sich bei der Zusammensetzung des Systems aus Teilsystemen additiv verhalten1 . Intensive Zustandsgr¨oßen (z. B. der Druck p) ¨andern sich dagegen nicht, wenn man das System verdoppelt. Eine wichtige Gleichgewichtsbedingung ist nun, daß intensive Gr¨oßen in allen Teilsystemen gleich sind. 1
In dieser Annahme liegt eine Idealisierung “großer” Systeme, in denen Oberfl¨ acheneffekte gegen¨ uber Volumeneffekten vernachl¨ aßigt werden k¨ onnen.
1
Zu den intensiven Zustandsgr¨oßen geh¨ort insbesondere die Temperatur, ein Parameter, der zun¨achst der allt¨aglichen Erfahrung (kalt, warm, heiß) entnommen ist, und der innerhalb der Thermodynamik axiomatisch eingef¨ uhrt und definiert wird.
1.2
Thermodynamik und Statistik
Der axiomatische Aufbau der Thermodynamik arbeitet mit nur wenigen Begriffen, die sich als leistungsf¨ahig und universell anwendbar erwiesen haben. Daher ist die mathematische Formulierung der Thermodynamik auch ¨außerst knapp und elegant. Wenn die Thermodynamik trotzdem h¨aufig als schwierigstes Teilgebiet der theoretischen Physik empfunden wird, so liegt das daran, daß die Theorie sehr abstrakt und der Anschauung wenig zug¨anglich ist. Es gab daher von Anfang an Bem¨ uhungen, die Thermodynamik aus elementaren Grundprinzipien der u ¨brigen physikalischen Disziplinen herzuleiten und zu verstehen. Hintergrund solcher Bem¨ uhungen war eine fr¨ uhe Vermutung u ¨ ber den Zusammenhang zwischen der Temperatur und der (mittleren) Teilchenenergie einer atomistischen Beschreibung der Materie, welche die gleichzeitig sich entwickelnde Chemie mit sich brachte. (Die “Atomhypothese” blieb allerdings bis in die Anf¨ange des 20. Jahrhunderts umstritten!) Die alternative mikroskopische Theorie, welche die Axiome der Thermodynamik begr¨ undet, ihre abstrakten Begriffe mit konkreten Inhalten f¨ ullt und last not least die thermodynamischen Materialeigenschaften explizit zu berechnen erlaubt, ist die statistische Mechanik. Wie in der Quantenmechanik werden wir also auch in diesem Teil der Vorlesung statistische Betrachtungen durchf¨ uhren und mangelnde Detailkenntnis durch Wahrscheinlichkeitsaussagen ersetzen — aber aus einem andern Grund als in der Quantenmechanik: Dort war uns die Statistik von der prinzipiellen Unm¨oglichkeit, den Ort und Impuls eines Teilchens — und damit seine Bahn — genau anzugeben, aufgezwungen worden. Formales Kennzeichen dieser prinzipiellen Unm¨oglichkeit war die Naturkonstante h ¯ , die unsere m¨ogliche Kenntnis u ¨ber ein Teilchen begrenzt. In der W¨armelehre betreiben wir Statistik aus der praktischen2 Unm¨oglichkeit, ∼ 1023 Teilchenkordinaten und –impulse zu berechnen. Das k¨onnen wir nicht und wollen wir nicht: Ein einziger Koordinatensatz f¨ ur L = 6 · 1023 Teilchen w¨ urde 1022 Seiten, also 1019 B¨ ucher, also 1014 Universit¨atsbibliotheken f¨ ullen! Stattdessen wollen wir die “verborgenen Parameter”, n¨amlich die individuellen Koordinaten und Impulse des Vielteilchen–Systems statistisch beschreiben und die makroskopischen Zustandsgr¨oßen aus mikroskopischen Teilcheneigenschaften u ¨ ber Gesetzm¨aßigkeiten großer Zahlen konstruieren. 2
Die prinzipielle Unm¨ oglichkeit der Quantenmechanik mag hinzukommen: Wir betreiben dann Quantenstatistik.
2
Mehr oder weniger trivial ist das f¨ ur die extensiven Zustandsgr¨oßen: Sie setzen sich ja additiv aus den entsprechenden Gr¨oßen von Teilsystemen zusammen und lassen sich damit letztlich direkt auf die mikroskopischen Teilcheneigenschaften zur¨ uckf¨ uhren. Die erste Aufgabe einer elementaren Statistik besteht also darin, intensive Gr¨oßen wie Druck oder Temperatur zu erkl¨aren und zu berechnen.
1.3
Ideales Gas und elementare Statistik
Wir greifen diese erste Aufgabe der elementaren Statistik auf, ehe wir im n¨achsten Kapitel das Ger¨ ust der Thermodynamik aufbauen und im dritten Kapitel eine systematische Statistik betreiben. Dazu betrachten wir das Modell des klassischen idealen Gases. Die mikroskopischen Bausteine des idealen Gases sind Massenpunkte, die keinen Raum beanspruchen und keine Kr¨afte aufeinander aus¨ uben. Viele reale Gase — insbesondere leichte Edelgase (He) bei hoher Temperatur und niedriger Dichte — kommen diesem Ideal recht nahe. Entsprechend unserem Vorhaben, das ideale Gas statistisch zu beschreiben, fragen wir nicht nach den einzelnen Teilchenorten und –geschwindigkeiten, sondern nach der Wahrscheinlichkeit, am Ort r ein oder mehrere Teilchen der Geschwindigkeit v anzutreffen. Genauer fragen wir nach der Verteilungsfunktion f (r, v, t), welche die Dichte der Teilchen im sogenannten µ–Raum mit den Koordinaten r und v repr¨asentiert. Wir erwarten also, im sechs–dimensionalen Volumenelement dτµ = d3 rd3 v bei (r, v) dN = f (r, v, t)d3 rd3 v
(1)
Teilchen zu finden. Eine Integration u ¨ber alle Geschwindigkeiten liefert die Dichte n(r, t) =
Z
f (r, v, t)d3 v
(2)
im Konfigurationsraum. Integrieren wir schließlich noch u ¨ ber die Ortskoordinaten, so erhalten wir die gesamte Teilchenzahl N=
Z
n(r, t)d3 r =
Z
f (r, v, t)d3 rd3 v
(3)
unseres Systems. Die Wahrscheinlichkeit, daß die Geschwindigkeit eines beliebig herausgegriffenen Teilchens im Volumenelement d3 v bei v liegt, ist also durch 1 f (r, v, t)d3 v n 3
gegeben. Daraus ergeben sich die Mittelwerte hAi =
1 n
Z
A(v)f (r, v, t)d3v
(4)
beliebiger Funktionen A(v) der Teilchengeschwindigkeiten. Als besonders wichtiges Beispiel f¨ ur solche Mittelwerte nennen wir die mittlere kinetische Energie hεkin i der Gasmolek¨ ule. Diese mittlere Teilchenenergie benutzen wir, um die Temperatur T zu definieren: 3 m 2 hv i = kT . 2 2
hεkin i =
(5)
T ist dabei die absolute Temperatur. Sie wird in K (Kelvin) gemessen und unterscheidet sich von der b¨ urgerlichen Temperatur in Celsiusgraden lediglich durch eine additive Konstante: Der Schmelzpunkt des Eises liegt bei T0 = 273.2 K. Zur Anpassung an diese historische Temperaturskala wird in der energetischen Temperaturdefinition der Gl. (5) die Boltzmannkonstante k = 1.38 · 1023 Ws/K benutzt. (k ist also eine Maßsystemskonstante und keine Naturkonstante.) Nach der Definition der Temperatur wollen wir auch den Druck des idealen Gases bestimmen. Unter dem Druck verstehen wir die Kraft, die das ideale Gas auf jede Einheitsfl¨ache der Gef¨aßwand aus¨ ubt. Wir gehen von der Vorstellung aus, daß diese Kraft auf dem mittleren Impuls¨ ubertrag der Gasmolek¨ ule, die an der Gef¨aßwand reflektiert werden, beruht. Ein Fl¨achenelement dA – etwa in z–Richtung – wird je Zeiteinheit von Z dN = dA vz f (v)d3 v vz >0
Molek¨ ulen getroffen. Dabei bezeichnet f wieder die Verteilungsfunktion der Molek¨ ule. Ein einzelnes Molek¨ ul mit der Geschwindigkeitskomponente vz u ¨bertr¨agt den Impuls 2mvz . Der gesamte Impuls¨ ubertrag je Zeiteinheit, also die Kraft, ist daher durch Z Z 2 3 dK = 2dA mvz f (v)d v = dA mvz2 f (v)d3 v vz >0
gegeben. F¨ ur das Integral gilt bei isotroper Verteilungsfunktion offenbar aus Symmetriegr¨ unden [vgl. Gl. (5)] Z
mvz2 f (v)d3 v
1 = 3
Z
1 mv2 f (v)d3 v = n3kT . 3
Da der Druck durch p = dK/dA definiert ist, folgt so die thermische Zustandsgleichung des idealen Gases p = nkT
oder pV = N kT . 4
(6)
Unter einer thermischen Zustandsgleichung verstehen wir allgemein eine Beziehung zwischen der Temperatur und den u ¨ brigen Zustandsgr¨oßen (hier Druck p und Volumen V oder Dichte n = N/V ), welche die Systemeigenschaften charakterisieren. Neben der thermischen Zustandsgleichung benutzt man noch eine kalorische Zustandsgleichung, welche den gesamten Energieinhalt U des Systems angibt. Wegen der Definition der Gl. (5) folgt f¨ ur das (einatomige) ideale Gas die einfache kalorische Zustandsgleichung 3 U = N hεkin i = N kT . 2
(7)
Wir betrachten abschließend ein ideales Gas in einem ¨außeren Kraftfeld −∇Φ(r) (z. B. im Schwerefeld, Φ = mgz). Anhand eines quaderf¨ormigen infinitesimalen Volumenelements u ¨berlegt man sich dazu leicht, daß der Gradient ∇p eine Volumenkraft dKp = −∇p d3 r
beschreibt. Diese Volumenkraft muß im Gleichgewicht die ¨außere Volumenkraft dKΦ = −n ∇Φ d3 r kompensieren. Daraus folgt 1 kT ∇Φ = − ∇p = − ∇n . n n
Im Gleichgewicht darf die Temperatur nicht vom Ort abh¨angen. Daher k¨onnen wir integrieren und erhalten Φ = −kT ln n+const oder Φ
n = n0 e− kT .
(8)
Das Verh¨altnis n/n0 nach Gl. (8) wird als Boltzmannfaktor bezeichnet. Speziell im homogenen Schwerefeld erh¨alt man daraus die barometrische H¨ohenformel n(z) = n0 e−
mgz kT
bzw. p(z) = p0 e−
mgz kT
,
(9)
welche (bei konstanter Temperatur, wir sind im Gleichgewicht!) die Dichte nz bzw. den Druck pz in der H¨ohe z mit der Dichte n0 bzw. dem Druck p0 am Erdboden in Beziehung bringt.
1.4
Die Maxwellverteilung
Im vorigen Abschnitt haben wir die Verteiungsfunktion zur Formulierung wichtiger Mittelwerte benutzt. Sie enth¨alt dar¨ uber hinaus die gesamte physikalisch relevante Information u ¨ber ein System. Ihre Berechnung unter allgemeinen Bedingungen 5
ist Aufgabe der Kinetik, einer Verallgemeinerung der Statistik, die wir in dieser Vorlesung nicht behandeln. In der Statistik fragen wir nur nach der Gleichgewichts– Verteilung. Daß wir f¨ ur das ideale Gas u ¨ berhaupt eine bestimmte Gleichgewichtsverteilung erwarten k¨onnen, bedarf einer Erl¨auterung. Die Verteilungsfunktion eines homogenen Systems wechselwirkungsfreier Teilchen zeigt n¨amlich keine Tendenz zu irgendeiner “Relaxation”. Wir setzen beim idealen Gas also doch einen Rest an Wechselwirkung der Gasmolek¨ ule untereinander (und/oder mit den Gef¨aßw¨anden) voraus, der ausreicht, jeden beliebigen speziellen Ausgangszustand bald in ein v¨olliges “Chaos”, eben das thermodynamische Gleichgewicht, zu u uhren. ¨berf¨ Die Gleichgewichtsverteilung fM des idealen Gases wurde 1860 von Maxwell angegeben und wird daher als Maxwellverteilung bezeichnet. Sie darf nat¨ urlich nicht von der Zeit abh¨angen. F¨ ur ein homogenes System ohne a¨ußere Kr¨afte gilt also fM (v) = ng(v) .
(10)
¨ Die Funktion g bestimmte Maxwell durch eine genial einfache Uberlegung: 1. g muß isotrop sein, also g(v) = g(vx2 + vy2 + vz2 ) . 2. Die Wahrscheinlichkeiten der einzelnen Geschwindigkeitskomponenten vx , vy und vz m¨ ussen unkorreliert sein, d.h, g(v) = h(vx2 )h(vy2 )h(vz2 ) . Es gilt also (mit x = vx2 , y = vy2 und z = vz2 ) die Funktionalgleichung g(x + y + z) = h(x)h(y)h(z) , und durch logarithmisches Differenzieren nach x folgt h0 (x) g 0 (x + y + z) = . g(x + y + z) h(x) Nun h¨angt die rechte Seite dieser Gleichung aber gar nicht von y und z ab; also ist die linke Seite konstant: g 0 (x) = −α d.h. g(x) = Ce−αx g(x) Mit dem Integral
Z∞
e
−αx2
dx =
−∞
6
2
oder g(v) = Ce−αv .
r
π α
und der Normierung Z
π gd v = C α
3
3/2
=1
folgt daher α fM (v) = n π
3/2
2
e−αv .
Im Gleichtgewicht sind die Geschwindigkeiten also Gauss–verteilt. Die Konstante α repr¨asentiert die Breite der Verteilung oder das mittlere Geschwindigkeitsquadrat:
1Z 2 v fM (v)d3 v hv i = n 3/2 Z α d 2 = − e−αv d3 v π dα 3 d , also = −α3/2 α−3/2 = dα 2α 3 α = . 2hv2 i 2
Mit der Temperaturdefinition in Gl. (10) erhalten wir α = m/2kT und m fM (v) = n 2πkT
3/2
mv2
e− 2kT .
(11)
Entsprechend ihrer sehr allgemein gehaltenen Herleitung ist die Maxwellverteilung von fundamentaler Bedeutung f¨ ur unz¨ahlige Anwendungen (nicht nur beim idealen Gas). Sie enth¨alt bereits in komprimierter Form die gesamte Information der klassischen Thermodynamik und Statistik des idealen Gases. Um so erstaunlicher ist die Tatsache, daß sie in der Quantenstatistik ihre G¨ ultigkeit verliert. Das muß uns im Moment um so mehr u ¨berraschen, als wir bei ihrer Herleitung nirgendwo von den Bewegungsgleichungen der klassischen Mechanik Gebrauch gemacht haben. Wir werden auf dieses Problem im Abschnitt 4.5 zur¨ uckkommen. Faßt man den Boltzmannfaktor (9) mit der Maxwellverteilung (11) zusammen, so erh¨alt man die Maxwell–Boltzmann–Verteilung fM B (r, v) = n0
m 2πkT
3/2
e−
Φ+mv2 /2 kT
.
(12)
Sie zeigt, daß die Dichte fM B im µ–Raum exponentiell mit der Gesamtenergie ε = Φ + mv2 /2 der Gasmolek¨ ule f¨allt. Wir h¨atten diesen Zusammenhang auch aus der Wechselwirkungsfreiheit und dem Boltzmannfaktor erahnen k¨onnen.
7
2 2.1
Thermodynamik Zustandsgr¨ oßen und totale Differentiale
Wie bereits in der Einf¨ uhrung angedeutet, geben wir nun einen kurzen Abriß der Thermodynamik, bei dem es wesentlich um die Definition bestimmter Zustandsgr¨oßen im Gleichgewicht geht. Nehmen wir an, der makroskopische Gleichgewichtszustand sei durch die Variablen x1 , x2 , . . . , xn eindeutig charakterisiert. Dann ist jede Funktion y = f (x1 , x2 , . . . , xn )
(13)
eine Zustandsfunktion und kann selbst als eine Zustandsgr¨oße benutzt werden. H¨aufig ist eine interessierende Gr¨oße y nicht explizit, sondern durch eine Differentialform (Pfaffsche Form) δy =
X
ai (x1 , x2 , . . . , xn ) dxi
(14)
i
gegeben, und es stellt sich die Frage, ob Gl. (14) eine Zustandsgr¨oße y definiert. Wir benutzen darum das Differential–Symbol δ an Stelle von d, um auszudr¨ ucken, daß sich durch Gl. (14) nicht notwendigerweise eine Zustandsfunktion (13) definieren l¨aßt. Notwendige (und hinreichende) Voraussetzung ist vielmehr, daß ai =
∂f ∂xi
und folglich ∂ai ∂aj = = ∂xj ∂xi
∂2f ∂xi ∂xj
(15)
gilt. Eine Differentialform (14), welche die Bedingung (15) erf¨ ullt, heißt total. Eine totale Differentialform ist integrabel und definiert eine Zustandsfunktion y. F¨ ur totale Differentiale ersetzen wir das Symbol δ wieder durch das vertraute d und schreiben dy =
X
ai (x1 , x2 , . . . , xn ) dxi .
i
Als Zustandsvariable benutzen wir (immer)
8
(16)
— den Druck p und das Volumen V sowie (je nach Bedarf) verschiedene makroskopische Parameter wie — das Magnetfeld H und die Magnetisierung M — die Spannung U und die Ladung q — die Federkraft K und die Auslenkung x usw. Wer glaubt, daß solche weiteren Parameter nichts in einer Theorie der W¨arme zu suchen haben, der sei an die Curietemperatur, an den thermoelektrischen Effekt, an eine Autobatterie im Winter oder an die thermischen Spannungen in Bauelementen erinnert. Die Teilchenzahl N betrachten wir, wenn nichts anderes gesagt wird, als fest vorgegeben. Ist sie variabel (offenes System, chemische Reaktionen), geh¨ort auch sie zu den Zustandsvariablen. Und schließlich gibt es eine Zustandsgr¨oße, die ganz im Zentrum der Thermodynamik steht. Ihrer zentralen Bedeutung entsprechend f¨ uhrt man sie oft axiomatisch durch einen Hauptsatz ein: • Nullter Hauptsatz der Thermodynamik: Es gibt eine Zustandsgr¨oße Temperatur. Die Temperatur T charakterisiert die Klasse aller Systeme, die miteinander im Gleichgewicht stehen. Wir werden hier nicht den abstrakten Weg gehen, den Temperaturbegriff von dieser axiomatischen Definition ausgehend schrittweise mit physikalischem Inhalt zu f¨ ullen, sondern wir werden unter Bezug auf Abschnitt 1.3 die Temperatur als wohldefinierte Gr¨oße betrachten. In den obigen Beispielen haben wir jeweils zwei Zustandsvariablen zu Paaren (Y, X) zusammengefaßt. Das erste Element Y eines Paares repr¨asentiert dabei eine intensive und das zweite Element X “die konjugierte” extensive Zustandsvariable. Das R Produkt konjugierter Zustandsvariablen (genauer: das Integral Y dX) stellt jeweils eine Energie dar. Tats¨achlich liegt im Energiesatz der Ausgangspunkt, aus dem die formale Theorie entwickelt wird. F¨ ur die Zustandsvariablen Temperatur und Teilchenzahl fehlen uns noch die konjugierten Gr¨oßen. Ihre Definition ist ein Kernpunkt des abstrakten Formalismus.
2.2
Der erste Hauptsatz
Wir greifen die Bemerkung zum Energiesatz am Ende des vorigen Abschnitts auf und notieren die Energie¨anderung unseres Systems in der Form 9
δU = δQ + δA .
(17)
Gl. (17) soll zun¨achst ausdr¨ ucken, daß die Energie¨anderung nicht allein durch die am System geleistete Arbeit δA = −pdV
"
+
X
#
Yi dXi ,
i
(18)
sondern außerdem durch eine “W¨armezufuhr” δQ beschrieben wird. Bei der Arbeitsleistung δA ber¨ ucksichtigen wir grunds¨atzlich die Druckarbeit −pdV und je nach Bedarf zus¨atzliche Terme Yi dXi (s. o.), die verschiedene Formen mechanischer, elektromagnetischer oder auch chemischer Energie repr¨asentieren k¨onnen. Die eckigen Klammern sollen andeuten, daß wir diese zus¨atzlichen Terme meistens weglassen, da wir nicht mit ihnen arbeiten. Bez¨ uglich der W¨armezufuhr δQ verlassen wir uns zun¨achst auf unsere naive Erfahrung und denken an einen Tauchsieder oder an einen Eisw¨ urfel. H¨aufig werden wir die W¨armezufuhr in der Form δQ = cdT beschreiben k¨onnen, wobei c eine “W¨armekapazit¨at” bedeutet. In unserer rein formalen Anschrift der Energiezufuhr haben wir bewußt das Symbol δ f¨ ur die Differentiale δU , δA und δQ benutzt. Dagegen besagt das Symbol d in dV , dXi und dT , daß wir V , Xi und T als Zustandsgr¨oßen betrachten und daß die Differentiale deshalb total sind. Der erste Hauptsatz behauptet nun, daß dU ebenfalls ein totales Differential ist. Wir k¨onnen das axiomatisch fordern (s. u.), ziehen aber vor, von der physikalischen Formulierung auszugehen: • Erster Hauptsatz (physikalisch): Es gibt kein perpetuum mobile erster Art. Ein perpetuum mobile ist dabei eine Maschine, die “aus nichts” Energie erzeugt. Nach hinreichend vielen Frustrationen ist die Menschheit n¨amlich zu dem Schluß gekommen, daß die Energie (wobei wir das relativistische mc2 einschließen) eine universelle Erhaltungsgr¨oße ist, die weder aus dem Nichts geschaffen werden noch zu nichts vergehen kann. Und wenn ich in der Mechanik durch Reibung Energie verliere, so tritt eben diese Energie als “W¨armeenergie” wieder in Erscheinung. Mit einer thermodynamischen Maschine, die einen Zyklus C durchl¨auft, kann ich demnach weder Energie gewinnen noch verlieren: I
C
δU = 0 .
Aus der Wegunabh¨angigkeit des Integrals folgt aber unmittelbar, daß sich U eindeutig als Zustandsfunktion definieren l¨aßt oder daß das Differential dU total ist: 10
• Erster Hauptsatz (axiomatisch): Die innere Energie U ist eine (extensive) Zustandsgr¨oße mit dem Differential dU = δQ + δA .
2.3
(19)
Der zweite Hauptsatz
Nachdem U als Zustandsgr¨oße ausgewiesen ist, greifen wir die naheliegende Frage nach einem “W¨armestoff” auf und fragen, ob auch Q eine Zustandsgr¨oße und damit δQ = dU − δA ein totales Differential ist. Wir k¨onnen diese Frage f¨ ur ein spezielles System, bei dem wir bereits u ugen, rein rechnerisch entscheiden: Das ideale ¨ber alle Information verf¨ Gas. Aus den Zustandsgleichungen 3 U = N kT 2
und pV = N kT
folgt sofort 3 dU = N k dT 2 und δA = −pdV = −
N kT dV . V
Damit erhalten wir das Differential δQ = N k
3 T dT + dV 2 V
.
(20)
Ist dieses Differential total? Wir fassen Q als Funktion von T und V auf und rechnen ∂ 3 = 0 und ∂V 2
∂ T 1 6= 0 . = ∂T V V V
δQ ist also kein totales Differential, es gibt daher keine Zustandsgr¨oße Q und — entgegen der vermeintlichen Alltagserfahrung mit der W¨armeflasche — keinen wohldefinierten “W¨armeinhalt” oder “W¨armestoff”! 11
Dagegen f¨allt uns f¨ormlich ins Auge, daß wir Gl. (20) durch einen einfachen “integrierenden Faktor” integrabel machen k¨onnen: Die Differentialform δQ dV 3 dT dS = = Nk + T 2 T V
!
(21)
ist offenbar total und l¨aßt sich sofort zu der eigenartigen Zustandsfunktion S = Nk
3 ln T + ln V + C(N ) , 2
(22)
die den Namen Entropie tr¨agt, integrieren. Dabei ist C eine Integrationskonstante. Da wir die Teilchenzahl N konstant gehalten haben, m¨ ussen wir damit rechnen, daß in C noch eine Abh¨angigkeit von N “versteckt” ist. Die Entropie — die unserer direkten Anschauung kaum zug¨anglich ist und deren allgemeine Bedeutung wir bisher noch keineswegs postuliert haben — kontrolliert den Wirkungsgrad einer einfachen W¨armekraftmaschine, die mit dem idealen Gas arbeitet: der Carnot–Maschine. Diese idealisierte Maschine arbeitet zwischen zwei Temperaturniveaus T0 und T1 mit einem Zyklus, dessen Weg in der p–V –Ebene unten skizziert ist. Der Zyklus werde in der Reihenfolge (1)–(2)–(3)–(4)–(1)– . . . periodisch durchlaufen, die Wege (1)–(2) und (3)–(4) sind Isothermen, also Kurven konstanter Temperatur, und die Wege (2)–(3) und (4)–(1) Adiabaten, also Wege ohne W¨armezu– oder –abfuhr (δQ = 0).
1 p
T1
2
4 T0
3 V
W¨ahrend eines Zyklus wird auf dem Weg (1)–(2) die W¨arme Q12 aus dem “W¨armebad” der Temperatur T1 aufgenommen und auf dem Weg (3)–(4) die W¨arme −Q34 ¨ an das W¨armebad der Temperatur T0 < T1 abgegeben. Der Uberschuß ∆Q = Q12 + Q34 = −∆A 12
wird von der Maschine in mechanische Arbeit |∆A| = −∆A umgesetzt. (Denn U ist Zustandsgr¨oße!) W¨ahrend als k¨ uhlendes W¨armebad (T0 ) die nat¨ urliche Umgebung gew¨ahlt werden kann, muß die Temperatur T1 > T0 durch eine Heizung aufrecht erhalten werden. Q12 ist also die Prim¨arenergie, die je Zyklus von außen in die Maschine “investiert” werden muß. Diese Prim¨arenergie wird mit dem Wirkungsgrad ηC =
|∆A| Q12 + Q34 = Q12 Q12
in mechanische Arbeit umgesetzt. Und nun kommt die Entropie ins Spiel: Aus I
dS =
I
Q12 Q34 δQ = + =0 T T1 T0
folgt ohne jede Rechnung Q34 = −Q12 T0 /T1 und ηC = 1 −
T0 . T1
(23)
Ehe wir die physikalischen Konsequenzen besprechen, machen wir uns bewußt, daß wir das Ergebnis praktisch ohne Rechnung erhalten haben. Wir haben keine W¨arme¨ kapazit¨aten (cp , cV , Ubungen!) berechnet, brauchten keine “Adiabatengleichung” ¨ (Ubungen!) herzuleiten und haben kein Integral ∆A =
I
pdV
ausgewertet. Wir haben den Carnotschen Wirkungsgrad ηC einzig und allein aus der Kenntnis, daß U und S Zustandsgr¨oßen sind, erhalten. Und nun zur Physik: Der Wirkungsgrad der Carnotschen Maschine h¨angt vom Verh¨altnis der Temperaturen ab und ist immer kleiner als eins. F¨ ur den Besitzer einer Carnot–Maschine ist W¨armeenergie also nicht so wertvoll wie mechanische oder elektrische Energie, die vollst¨andig in Arbeit umgesetzt werden kann. Die W¨armeenergie ist um so wertvoller, je h¨oher das obere Temperaturniveau T1 bei der Umsetzung gew¨ahlt werden kann. Erst f¨ ur T1 = ∞ oder T0 = 0 wird die W¨armeenergie — bezogen auf die Carnotmaschine — “vollwertig”. Dem Besitzer einer Carnotmaschine steht nicht nur eine W¨armekraftmaschine zur Verf¨ ugung, sondern auch eine Klimaanlage, mit der er im Sommer k¨ uhlen und im Winter heizen kann. Durchl¨auft man den Zyklus n¨amlich in umgekehrter Richtung, so erh¨alt man eine ”W¨armepumpe”, die von außen Arbeitsleistung aufnimmt, um W¨arme von dem niedrigeren Temperaturniveau T0 in das h¨ohere Temperaturniveau 13
T1 zu “pumpen”. Da aus dem niedrigen Niveau noch W¨arme aufgenommen wird, ist der “Heiz–Wirkungsgrad” η¯C =
−Q12 1 = ∆A ηC
(24)
der W¨armepumpe gr¨oßer als eins. Der Besitzer zweier Carnotmaschinen CM und CM0 kann nun folgendes am¨ usante Spiel treiben: Er schafft sich zwei gemeinsame W¨armeb¨ader (T0 und T1 ) f¨ ur seine 0 beiden Maschinen und l¨aßt CM als W¨armekraftmaschine laufen. Mit der gewonnen Arbeitleistung treibt er CM als W¨armepumpe an und pumpt die von CM0 “verbrauchte” W¨arme ins obere W¨armebad zur¨ uck. Dieses Spiel ist besonders ¨okologisch, denn als Gesamtwirkung f¨ ur die Umwelt passiert — rein gar nichts: Es wird effektiv weder Arbeit geleistet noch verbraucht und den Temperaturniveaus wird effektiv weder W¨arme entzogen noch zugef¨ uhrt. Nachdem sich obiger Maschinenbesitzer lange genug an seinem Spiel erfreut hat, kommt ihm ein genialer Gedanke: Ich ersetze, so u ¨berlegt er, die Carnotsche 0 W¨armekraftmaschine CM durch eine Hightech–W¨armekraftmaschine HM mit einem Wirkungsgrad ηH > η C . Nun kann ich meinen Maschinenpark st¨andig laufen lassen, ohne das obere W¨armebad effektiv zu belasten, und gleichzeitig st¨andig eine Nettoarbeitsleistung entnehmen. Die Energie entnehme ich dabei der unersch¨opflichen Umwelt (Atmosph¨are, Meer, . . . ) als W¨armebad T0 . Leider haben sich an dieser und an ¨ahnlichen genialen Ideen schon viele Genies frustriert, so viele, daß die Menschheit daraus gelernt und den folgenden Satz formuliert hat: • Zweiter Hauptsatz (physikalisch): Es gibt kein perpetuum mobile zweiter Art. Dabei versteht man unter einem perpetuum mobile zweiter Art eine periodisch arbeitende Maschine, die nichts weiter bewirkt, als einem Temperaturbad T0 W¨arme zu entziehen und in Arbeit umzuwandeln. Eine solche Maschine w¨ urde zwar den Energiesatz nicht verletzen, sie w¨are wegen der universellen Verf¨ ugbarkeit eines Temperaturbades aber einem “echten” perpetuum mobile de facto gleichwertig. Eine ¨aquivalente Formulierung des Hauptsatzes lautet • Es gibt keine periodisch arbeitende Maschine, die nichts weiter bewirkt, als W¨arme von einem niedrigen Temperaturniveau T0 in ein h¨oheres Temperaturniveau T1 zu transportieren (Clausius). 14
Damit ist klar, daß die Hightech–Maschine keinen h¨oheren Wirkungsgrad haben kann als die Carnotsche. Falls sie ebenfalls reversibel arbeitet, kann sie aber auch keinen niedrigeren haben. Denn dann brauchte ich die Rolle der Maschinen CM und HM ja nur zu vertauschen, um ein perpetuum mobile zweiter Art zu bauen. Als unmittelbare Folge des zweiten Hauptsatzes gilt also der Satz • Alle reversibel arbeitenden W¨armekraftmaschinen haben denselben Wirkungsgrad T0 . (25) η = ηC = 1 − T1 Damit sind unsere obigen Feststellungen u ¨ber mehr oder weniger wertvolle Formen der W¨armeenergie also nicht mehr auf die Carnotsche Maschine oder das ideale Gas als Arbeitssubstanz beschr¨ankt, sondern gelten universell. Das aber heißt — wenn wir uns an die Herleitung der Formel f¨ ur ηC zur¨ uckbesinnen und infinitesimale Zyklen untersuchen — daß auch die Eigenschaft der Entropie, eine Zustandsgr¨oße zu sein, universell ist. Damit kommen wir zu der axiomatischen Formulierung des zweiten Hauptsatzes: • Zweiter Hauptsatz (axiomatisch): Die Entropie S ist eine (extensive) Zustandsgr¨oße mit dem Differential dS =
δQrev . T
(26)
Mit dem Index rev wollen wir dabei an eine ganz wichtige Voraussetzung unserer Argumentation erinnern: Die reversible Prozeßf¨ uhrung. Mit “dissipativen” Prozessen (z. B. Reibung) kann man n¨amlich auf irreversible Weise W¨arme erzeugen. Eine Maschine mit Dissipation arbeitet irreversibel und hat einen kleineren Wirkungsgrad als die Carnotsche. Durchl¨auft eine solche Maschine einen vollen Zyklus, so bleibt die Entropie nicht erhalten. Die Berechnung der Entropie nach der Formel dS = δQ/T setzt also reversible Prozeßf¨ uhrung voraus. Und was ist, wenn der Prozeß nicht reversibel gef¨ uhrt wird? Dann bleibt die Feststellung, daß eine andere Maschine keinen h¨oheren Wirkungsgrad haben kann als die (reversibel arbeitende!) Carnotsche, weiterhin g¨ ultig, l¨aßt sich aber nicht mehr durch Vertauschung der Maschinen umkehren. Statt Gl. (25) haben wir also allgemein η ≤ ηC = 1 −
T0 , T1
Wenn wir die Rechnung r¨ uckw¨arts verfolgen, finden wir daraus 15
(27)
Q12 Q34 + ≤ 0. T1 T0 Dieses Ergebnis l¨aßt sich (z. B. u ¨ ber gekoppelte infinitesimale Kreisprozesse) zur Clausiusschen Ungleichung I
δQ ≤0 T
(28)
verallgemeinern. Wir wollen diese Beziehung auf einen beliebigen Weg von A nach B anwenden. Um zu einem vollen Umlauf zu kommen, schließen wir die Kurve durch einen reversiblen R¨ uckweg. Damit k¨onnen wir die Clausiussche Ungleichung auch in der Form
SB − S A ≥
ZB
A
δQ . T
(29)
schreiben. Fassen wir nun Subsysteme, in denen irreversible Prozesse ablaufen d¨ urfen, zu einem thermisch abgeschlossenen Gesamtsystem (δQ = 0) zusammen, so gilt offenbar SB ≥ S A ,
in Worten :
• Die Entropie eines thermisch abgeschlossenen Systems kann nur zunehmen. Dieser Satz, der auch als zweiter Teil des zweiten Hauptsatzes3 bezeichnet wird, pr¨agt der Physik erstmals eine Zeitrichtung auf. Dieser Umstand hat im 19. Jahrhundert maßgeblich dazu beitragen, daß der Begr¨ undung der Thermodynamik durch die Statistik lange mit großer Skepsis begegnet wurde. In einem abgeschlossenen System wird die Entropie also st¨andig zunehmen — bis sie schließlich ihren maximalen Wert annimmt: Das Gleichgewicht ist erreicht. Dies ist denn auch der Ausgangspunkt, das Gleichgewicht, von dem nun schon so oft die Rede war, in aller Strenge zu definieren. Auf dieses Gleichgewicht und auf die reversiblen Prozesse, die von einem Gleichgewichtszustand zu einem anderen Gleichgewichtszustand f¨ uhren, beschr¨ankt sich die “eigentliche” Thermodynamik, die wir hier behandeln. 3
Der erste Teil postuliert S als Zustandsgr¨ oße.
16
2.4
Die thermodynamischen Potentiale
Wir beschr¨anken uns im folgenden wieder grunds¨atzlich auf reversible Prozesse, ohne durch eine Kennzeichnung explizit daran zu erinnern. Dann gilt δQ = T dS und wir k¨onnen den ersten und zweiten Hauptsatz in der Form dU = T dS − p dV [+
P
i
Yi dXi ]
(30)
zusammenfassen, in der nur noch Zustandsgr¨oßen und totale Differentiale vorkommen. Die innere Energie U erscheint hier als Funktion der “nat¨ urlichen Variablen” S, V und (je nach Bedarf) Xi und wird ein thermodynamisches Potential genannt: U = U (S, V, [Xi ]) .
(31)
Die nat¨ urliche Variable S ist h¨aufig unbequem: Die Entropie haben wir l¨angst noch nicht “verstanden”, und einer Messung ist sie auch nicht leicht zug¨anglich. Da ein Thermometer sch¨on einfach und handlich ist, m¨ochten wir S gern durch die “konjugierte” Temperatur ∂U ∂S
T =
!
(32) V
ersetzen. Umformungen solcher Art sind uns von der Mechanik vertraut: Dort haben wir die die generalisierten Geschwindigkeiten q˙k durch die kanonischen Impulse pk =
∂L ∂ q˙k
ersetzt, indem wir von der Lagrangefunktion L(qk , q˙k ) zur Hamiltonfunktion H(qk , pk ) = −L +
X
pk q˙k
k
u uhren wir nun auch in der ¨bergegangen sind. Eine solche Legendretransformation f¨ Thermodynamik durch, indem wir ausgehend von der inneren Energie U (S, V, [Xi ]) die freie Energie F (T, V, [Xi ]) = U − T S
(33)
bilden. Die freie Energie ist ebenfalls ein thermodynamisches Potential. Daß dieses Potential tats¨achlich von den nat¨ urlichen Variablen T , V [und Xi ] abh¨angt, erkennt man, wenn man unter Beachtung von (30) und (32) das Differential 17
dF = −S dT − p dV [+
P
i
Yi dXi ]
(34)
bildet. Dieses Differential macht auch den Namen verst¨andlich: Wir k¨onnen daraus n¨amlich ablesen, daß die freie Energie diejenige Energie beschreibt, die bei konstanter Temperatur in Arbeitsleistung umgesetzt werden kann. Energien wie die elektrische Feldenergie oder die mechanische Energie einer gespannten Feder (usw.) sind in diesem Sinne als freie Energien zu betrachten! In ganz analoger Weise kann man auch die Variable V durch die konjugierte Variable p ersetzen und erh¨alt als neues Potential die Enthalpie H(S, p, [Xi ]) = U + pV
(35)
mit dem Differential dH = T dS + V dp [+
Yi dXi ] .
P
i
(36)
Dieses Potential eignet sich besonders zur Beschreibung adiabatischer Prozesse bei konstantem Druck. Schließlich und endlich k¨onnen wir sowohl S als auch V ersetzen und erhalten das Gibbssche Potential oder die freie Enthalpie G(T, p, [Xi ]) = U − T S + pV
(37)
mit dem Differential dG = −S dT + V dp [+
P
i
Yi dXi ] .
(38)
Dieses Potential bleibt konstant, wenn man Vorg¨ange bei konstanter Temperatur und konstantem Druck untersucht. Es ist daher das Lieblingspotential der Chemiker. Grunds¨atzlich ist jedoch zu beachten, daß alle thermodynamischen Potentiale ¨aquivalent sind: Besitzt man irgendein thermodynamisches Potential als Funktion seiner nat¨ urlichen Variablen4 , so besitzt man die gesamte thermodynamische Information. Denn alle Zustandsgr¨oßen lassen sich daraus durch bloßes Differenzieren berechnen. Beispielsweise erh¨alt man sofort die thermische Zustandsgleichung p = p(T, V ), wenn man die freie Energie nach V differenziert. Die Wahl des einen oder anderen Potentials ist also allein eine Frage der Bequemlichkeit. Wir k¨onnen unsere vier Potentiale U , F , H und G mit ihren wechselnden nat¨ urlichen Variablen S, T , V und p in der folgenden kleinen Tabelle zusammenfassen: 4
Vgl. L(q, q) ˙ und H(q, p) in der Mechanik.
18
S H p
U V & % F G T
In der Mitte der Seiten dieses Quadrats steht jeweils eins der thermodynamischen Potentiale, und an den benachbarten Ecken findet man die zugeh¨origen nat¨ urlichen Variablen. Die Reihenfolge der Symbole kann man sich mit dem Merkspruch Sch¨one Und Vornehme Frauen Tragen Große pr¨achtige H¨ ute ins Ged¨achtnis rufen (vorausgesetzt, man beh¨alt, welche Attribute durch “und” verbunden sind). Das Pfeilkreuz in der Mitte soll die Vorzeichen der partiellen Ableitungen andeuten. Beispielsweise gilt ∂F ∂T
!
= −S ,
V
“weil” man sich bei der Anschrift dieser Gleichung gegen die Pfeilrichtung bewegt. Aus dem Diagramm lassen sich nach dem Schema ∂ 2f ∂ 2f = ∂x∂y ∂y∂x auch ein paar n¨ utzliche Beziehungen ablesen, die als Maxwellrelationen bezeichnet werden. Als Beispiel notieren wir ∂S ∂V
!
= T
∂p ∂T
!
V
"
∂2F =− ∂T ∂V
#
,
(39)
gehen aber nicht weiter auf die Bedeutung5 der Maxwellrelationen ein. Die Effizienz der thermodynamischen Potentialen bei der L¨osung konkreter Probleme demonstrieren wir im Abschnitt 2.7. Wir beenden diesen Abschnitt mit einem erg¨anzenden Hinweis zum thermischen Gleichgewicht. Im vorigen Abschnitt hatten wir aus der Clausiussche Ungleichung [vgl. Gln. (28) und (29)] dS ≥ 5
δQ T
Vgl. aber die Analogie zwischen Gl. (39) und der Clausius–Clapeyron–Beziehung (50).
19
gefolgert, daß das Gleichgewicht eines abgeschlossenen Systems durch eine maximale Entropie ausgezeichnet ist. Betrachten wir statt eines abgeschlossenen Systems nun ein System im W¨armebad (konstante Temperatur T und konstantes Volumen V ), so wird dF = dU −T dS ≤ dU −δQ = δA = 0 . Der Gleichgewichtszustand eines isothermen und isochoren Systems ist also durch ein Minimum der freien Energie ausgezeichnet. In ¨ahnlicher Weise l¨aßt sich f¨ ur andere Nebenbedingungen zeigen, daß im Gleichgewicht jeweils dasjenige thermodynamische Potential minimal wird, dessen nat¨ urliche Variable konstant gehalten werden: - S, V [, Xi ] fest =⇒
U minimal,
- T , V [, Xi ] fest =⇒
F minimal,
- T , p [, Xi ] fest =⇒
G minimal,
- S, p [, Xi ] fest =⇒
H minimal.
2.5
Variable Teilchenzahl
Bisher haben wir die Teilchenzahl N konstant gehalten und als Variable ignoriert. In offenen Systemen und in Systemen mit chemischen Reaktionen werden die Teilchenzahlen Nk aber selbst zu interessanten Zustandsgr¨oßen. Eine “versteckte” Abh¨angigkeit der Entropie von der Teilchenzahl haben wir im Zusammenhang mit der Entropieformel (22) des idealen Gases bereits angedeutet. Wollen wir eine solche Abh¨angigkeit ber¨ ucksichtigen, so m¨ ussen wir die bisherige Definition δQ dU + pdV [− dS = = T T
P
i
Yi dXi ]
durch dU + pdV [− dS = T
P
i
Yi dXi ]
+
X k
∂S ∂Nk
!
dNk U,V,Xi
verallgemeinern. Damit erh¨alt der kombinierte erste und zweite Hauptsatz die Form dU = T dS − p dV +
X k
20
µk dNk [+
P
i
Yi dXi ]
(40)
wobei die chemischen Potentiale µk durch die partiellen Ableitungen ∂S ∂Nk
!
U,V,Xi
=−
µk T
(41)
definiert sind. Der Zusatzterm +
X
µk dNk
k
tritt dann unver¨andert auch in den Differentialen der thermodynamischen Potentiale F , H und G hinzu. Die chemischen Potentiale treten also formal als die konjugierten Variablen zu den Teilchenzahlen auf. Um ihre Bedeutung und die Namensgebung wenigstens zu erahnen, betrachten wir wie gewohnt ein homogenes System, in dem sich bei einer Halbierung des Systems auch die thermodynamischen Potentiale halbieren6 , also extensiv sind. Wir haben dann insbesondere G(T, p, λNk ) = λG(T, p, Nk ) . Differenziert man nach λ und setzt λ = 1, so erh¨alt man wegen (∂G/∂Nk )T,p = µk die Gibbs–Duhem–Relation G(T, p, Nk ) =
X
N k µk .
(42)
k
Die chemischen Potentiale geben also an, welchen Beitrag ein einzelnes Teilchen (bei konstanter Temperatur und konstantem Druck) zum Gibbschen Potential G liefert. Wir w¨ urden auf diese formalen und wenig anschaulichen Betrachtungen ja gern verzichten, aber leider ben¨otigen wir die chemischen Potentiale zur Definition eines weiteren thermodynamischen Potentials J(T, V, µk ) = F −
X k
Nk µk = F − G = −pV
(43)
mit dem Differential dJ = −S dT − p dV − 6
X
Nk dµk .
k
Wir schließen damit insbesondere Oberfl¨ acheneffekte aus.
21
(44)
Dieses Potential ohne feste Teilchenzahl ist n¨amlich unverzichtbar f¨ ur eine elegante Formulierung der Quantenstatistik. Damit wollen wir den abstrakten Formalismus abschließen und uns explizit mit der Entropie des idealen Gases befassen. Wir betrachten wieder die Gl. (22) und u ¨ berlegen, wie die Integrationskonstante C(N ) von N abh¨angen muß. Die Entropie wird nur dann wie gefordert extensiv, wenn die Klammer [. . . ] in Gl. (22) eine intensive Gr¨oße beschreibt, die sich bei einer Verdoppelung des Systems nicht ¨andert. Mit einer Entropiekonstante σ0 folgt daher C(N ) = σ0 − ln N und S = Nk
3 V ln T + ln + σ0 . 2 N
(45)
Im n¨achsten Abschnitt werden wir hieraus das chemische Potential des idealen Gases berechnen. Hier wollen wir auf eine viel interessantere Folgerung hinaus: Wir betrachten zwei verschiedene ideale Gase A und B gleicher Dichte und gleicher Temperatur (⇒ gleicher Druck!) in zwei getrennten Teilvolumina VA und VB . Diese beiden Gase haben eine Gesamtentropie 3 VA VB 3 S0 = NA k ln T + ln + σA + NB k ln T + ln + σB . 2 NA 2 NB
Wenn wir nun die Trennwand zwischen den beiden Teilvolumina entfernen, steht beiden Gasen das gesamte Volumen V = VA + VB zur Verf¨ ugung und wir erhalten die gr¨oßere Entropie S1 = N A k
V V 3 3 ln T + ln + σA + NB k ln T + ln + σB . 2 NA 2 NB
Die Differenz V V + NB ln ∆S = S1 − S0 = k NA ln VA VB
(46)
wird als Mischungsentropie bezeichnet. Die Entropie ¨andert sich also nicht nur bei W¨armezufuhr, sondern auch bei einer Mischung verschiedener Komponenten. Und hieran schließt sich sofort das Gibbssche Paradoxon an: Was wird aus der Entropie, wenn ich immer ¨ahnlichere und schließlich nicht mehr unterscheidbare Gase mische?
2.6
Anwendungen: Reaktionsgleichgewichte
In unserer “abgespeckten” Thermodynamik k¨onnen wir uns den u ¨blichen Katalog von Anwendungen nicht leisten und wollen nur exemplarisch demonstrieren, wie man 22
mit dem abstrakten Formalismus konkrete Probleme l¨ost. Dazu betrachten wir ein System aus verschiedenen Komponenten Ak , die gem¨aß einer “Reaktiongleichung” X
νk Ak = 0
(47)
k
ineinander umgewandelt werden k¨onnen. Dabei denken wir sowohl an chemische Reaktionen wie 2H2 + O2 − 2H2 O = 0 (also νH2 = 2, νO2 = 1 und νH2 O = −2) als auch an Phasen¨ uberg¨ange. So werden wir das Gleichgewicht zwischen einer Fl¨ ussigkeit F und ihrem Dampf D durch die Reaktionsgleichung F−D=0 (also νF = 1 und νD = −1 beschreiben. Wir betrachten unser System nun bei vorgegebener Temperatur T und vorgegebenem Druck p. Dann ist das Gleichgewicht durch ein Minimum des Gibbsschen Potentials ausgezeichnet. Da T und p nicht ver¨andert werden, gilt im Gleichgewicht also dG =
X k
∂G ∂Nk
!
dNk = T,p
X
µk dNk = 0 .
¨ Entsprechend der Reaktionsgleichung (47) verhalten sich die Anderungen der Teilchenzahlen wie die νk : dNk ∼ νk . Damit erhalten wir die allgemeine Gleichgewichtsbeziehung (T , p fest!) X
νk µk (T, p) = 0 ,
(48)
k
die noch einmal besonders deutlich macht, wie die chemischen Potentiale zu ihrem Namen kommen. Wir wollen sie aber zun¨achst auf das Gleichgewicht zwischen Fl¨ ussigkeit und Dampf anwenden. Um in der abstrakten Formulierung 23
µD (T, p) = µF (T, p)
(49)
die Dampfdruckkurve p = pD (T ) zu erkennen, gehen wir von den Gibbs–Duhem– Relationen µk =
Gk = gk (T, p) , Nk
k = D, F
des Dampfes und der Fl¨ ussigkeit aus7 und bilden die Differentiale dµk = dgk = −sk dT + vk dp . Dabei bezeichnet sk = Sk /Nk die spezifische Entropie und vk = Vk /Nk das spezifische Volumen. Aus Gl. (49) folgt damit die Differentialgleichung (sD − sF )dT = (vD − vF )dp . ¨ Ber¨ ucksichtigen wir schließlich noch, daß die Entropie¨anderung beim Ubergang vom fl¨ ussigen zum dampff¨ormigen Zustand durch sD − s F =
qD T
mit der spezifischen Verdampfungsw¨arme qD verkn¨ upft ist, so erhalten wir die ber¨ uhmte Clausius–Clapeyron–Beziehung8 qD dpD = dT T (vD − vF )
(50)
¨ f¨ ur die Anderung des Dampfdrucks pD mit der Temperatur T . Wir kehren nun zu Gl. (48) zur¨ uck und werten sie f¨ ur chemische Reaktionen zwischen idealen Gasen aus. Um aus Gln. (41) und (45) das chemische Potential µk eines idealen Gases zu berechnen, bilden wir am einfachsten (warum?) zun¨achst die freie Energie9 Nk 3 − σk Fk = Uk − T Sk = Nk kT (1 − ln T ) + ln 2 V
7
Genau hier verlieren wir Aussagen u opfchen. ¨ber den Dampfdruck kleiner Tr¨ Vgl. hierzu auch die Maxwellrelation (39)! 9 Unsere Formulierung ist eigentlich nur f¨ ur einatomige Gase g¨ ultig; die generelle Form bleibt aber auch bei Molek¨ ulgasen erhalten. 8
24
und erhalten µk =
∂Fk ∂Nk
!
T,V
3 Nk − σk . = kT + kT (1 − ln T ) + ln 2 V
Ersetzen wir Nk durch den Partialdruck pk =
Nk kT , V
so folgt µk = kT ln pk − ck (T ) , wobei wir uns die genaue Spezifizierung von ck (T ) schenken. Damit erh¨alt Gl. (48) die Form X
νk ln pk =
X
ck (T ) .
k
k
Gehen wir vom Logarithmus zum Numerus u ¨ber, so erhalten wir das Massenwirkungsgesetz Y
pνkk = C(T ) .
(51)
k
2.7
Das Nernstsche Theorem
Unsere Thermodynamik ist im wesentlichen “abgeschlossen” und wir brauchen keine neue Zustandsgr¨oße mehr einzuf¨ uhren. Ein gewisser Mangel der bisherigen Theorie liegt aber darin, daß die Entropie nur differentiell definiert ist. Es gibt n¨amlich F¨alle, in denen zwei verschiedene Zust¨ande nicht durch einen reversiblen Weg verbunden werden k¨onnen. In solchen F¨allen kann das Ergebnis einer thermodynamischen Rechnung von der richtigen Wahl der Entropiekonstanten abh¨angen. Zur Behebung dieses Mangels formulierte Nernst 1905 im Einklang mit der Erfahrung sein ber¨ uhmtes Theorem • Die Entropie eines Systems am absoluten Nullpunkt ist eine von allen Zustandsgr¨oßen unabh¨angige Konstante, die man zu Null w¨ahlen darf.
25
Dieses Theorem wurde sp¨ater auch als dritter Hauptsatz der Thermodynamik bezeichnet. Die wichtigste Konsequenz dieses Satzes ist, daß s¨amtliche spezifischen W¨armen f¨ ur T → 0 verschwinden. Hiermit kommen wir jedoch (u. a.) in ernsthafte Schwierigkeiten mit dem idealen Gas, f¨ ur das wir unabh¨angig von der Temperatur cV =
∂U ∂T
!
V
3 = N k 6= 0 2
finden. Auch die Entropieformel (41) strebt nicht gegen eine universelle Konstante, sondern divergiert f¨ ur T → 0. Daß es in der Natur keinen Stoff gibt, der f¨ ur T → 0 als ideales Gas angesehen werden kann, ist nur ein schwacher Trost f¨ ur das prinzipielle Versagen des Modells. Außerdem treten ganz analoge Diskrepanzen auch bei der spezifischen W¨arme des Festk¨orpers auf. Wir stehen mit diesen Problemen wieder am Beginn des 20. Jahrhunderts und m¨ ussen die Diskrepanzen zum Nernstschen Theorem mit den “schwarzen Wolken” aus Teil I der Vorlesung in Verbindung bringen: Der dritte Hauptsatz formuliert einen makroskopischen Quanteneffekt! Was aber haben wir in der Maxwell–Boltzmann–Statistik des Abschnitts 1.3 falsch gemacht? Wo ist u ¨berhaupt spezifiziert worden, ob unsere Gasteilchen den Newtonschen Gesetzen oder der Schr¨ odingergleichung folgen? Es ist an der Zeit, daß wir eine systematische Statistik entwickeln, in der wir klassische Teilchen und Quantenzust¨ande sauber unterscheiden k¨onnen.
26
3 3.1
Die Grundlagen der Statistik Shannons Informationsentropie
Im ersten Kapitel hatten wir erl¨autert, daß es nicht nur unm¨oglich, sondern auch nicht w¨ unschenswert ist, die detaillierte mikroskopische Information eines makroskopischen Systems festzulegen: Die Informationsmenge w¨are einfach zu groß. Stattdessen haben wir uns entschlossen, uns mit der Verteilungsfunktion zu begn¨ ugen. Wie detailliert ist die verbleibende Information? Brauchen wir immer noch Bibliotheken, um sie zu notieren? Und wodurch zeichnet sich die Gleichgewichtsverteilung ¨ aus? Wir hatten den Ubergang zum Gleichgewicht bereits intuitiv mit einem tota¨ len “Chaos” in Verbindung gebracht. Wird bei diesem Ubergang alle Information zerst¨ort? Wenn wir diese Frage beantworten wollen, stehen wir vor dem Problem, ein Maß f¨ ur Information zu definieren. Mit genau dem Problem hat man sich jedoch außerhalb der Physik in der Nachrichtentechnik und in der Datenverarbeitung befaßt: Welchen Speicherplatz ben¨otige ich, um ein Bild zu speichern? Wie h¨angt die Aufl¨osung des ¨ Fernsehbildes von der Breite des Ubertragungskanals ab? Wieviel Information kann ich noch aus einem “verrauschten” Signal retten? . . . Wenn wir die Information messen wollen, gehen wir naiv von der L¨ange des Textes oder der Zahl der Zeichen aus. Da ein Zeichen einer Bilderschrift sicherlich “informativer” ist als ein Zeichen des lateinischen Alphabets, wollen wir die Zeichen universell codieren und benutzen dazu “bin¨are Digits” oder “bit”s. Zur Codierung eines Zeichens einer modernen Schreibmaschine benutzt man 8 bit oder ein “byte”. F¨ ur einen Text von 1000 Zeichen (ca. 12 Seite) ben¨otigt man also eine Speicherkapazit¨at von 8000 bit oder 1k (kilobyte). Dabei ist der Text aber nicht optimal gespeichert, er l¨aßt sich “komprimieren”. Denn die einzelnen Zeichen zi (i = 1, . . . , n) des Alphabets haben eine verschiedene a priori – Wahrscheinlichkeit pi . Da ein ‘e’ in deutschen Texten wesentlich h¨aufiger vorkommt als ein ‘y’, ist es ¨okonomisch, das ‘e’ mit weniger bit zu codieren als das ‘y’ (vgl. das Morsealphabet!). Zu einer wesentlich besseren Codierung kommen wir (vereinfachend), wenn wir die Zeichen zi unter Ausnutzung der Normierung n X
pi = 1
i=1
durch Teilintervalle Zi der L¨ange pi des Grundintervalls I = (0, 1) repr¨asentieren:
Z1
Z2
Z3
...
Zn−1
Zn 1
0 27
Das Grundintervall I teilen wir in die Teilintervalle I0 = (0, 12 ) und I1 = ( 21 , 1), die Teilintervalle Iν weiter in Iν,0 und Iν,1 , usw. Bei der fortgesetzten Halbierung notieren wir jeweils, ob Zi (mehr) in der linken (0) oder rechten (1) H¨alfte von Iν1 ,... liegt. Nach m Schritten erhalten wir ein Teilintervall Iν1 ,...,νm der L¨ange 2−m , welches das Zeichen zi eindeutig festlegt, wenn 2−m ≤ pi
oder m ≥ −log2 pi
¨ gilt. Zur Ubermittlung des Zeichens zi ≡ {ν1 , . . . νm } ben¨otigen wir also σi = − log2 pi
(52)
bit, und es bietet sich an, diese bit–Zahl σi als Informationsmaß des Zeichens zi zu definieren. Der Nachricht z1 , z2 , . . . zN entspricht demnach dem Informationsgehalt σ1 + σ2 + . . . + σN . In vielen F¨allen wird die genaue Zeichenfolge einer Nachricht aber nicht bekannt sein oder soll variabel sein. Beispielsweise m¨ochte man wissen, welche Information verloren geht, wenn etwa jedes zehnte Zeichen verrauscht, und bei der Festlegung der Breite von Fernsehkan¨alen wird man sich nicht an einem bestimmten Bild, sondern an typischen Bildern orientieren wollen. Darum interessiert sich der Nachrichtentechniker f¨ ur den mittleren Informationsgehalt σ eines Zeichens oder ΣN einer Nachricht von N Zeichen. Da die einzelnen Zeichen zi mit der Wahrscheinlichkeit (also der relativen H¨aufigkeit) pi in den Nachrichten vorkommen, gilt σ = hσi i = −
n X
pi log2 pi
und ΣN = N σ .
(53)
i=1
σ bzw. ΣN wird als die Shannon–Entropie bezeichnet. Diese Shannon–Entropie mißt also — den mittleren Informationsgehalt einer Nachricht von N Zeichen oder — die Unkenntnis, die ich im Mittel habe, wenn ich nicht weiß, welche N Zeichen u ¨bermittelt werden (oder verloren gehen). So ganz optimal ist unsere Codierung noch nicht, wenn wir nur die Wahrscheinlichkeiten der einzelnen Zeichen ber¨ ucksichtigen. Tritt beispielsweise in einem deutschen Text das Zeichen ‘q’ auf, so wird das Zeichen ‘u’ nahezu mit Sicherheit und nicht mit der geringen Wahrscheinlichkeit pu ≈ 0.032 folgen. Die generelle Bedeutung solcher Korrelationen demonstrieren wir an den vier Zufallstexten im folgenden Kasten, bei denen Zweierkorrelationen ber¨ ucksichtigt wurden, die jeweils einem deutschen, einem englischen, einem griechischen und einem lateinischer Mustertext entnommen wurden. 28
Zufallstexte mit deutschen, englischen, griechischen und lateinischen Zweierkorrelationen la epekalierses es matasin kai gar sphilon gyn lon en the anthron allai olyto theon toi os ypephroys er o dethos oi otimon thlontestelgemin agon os mylien popioikopolla thai de rhyron o kai zen allagchthosthygai eripon ai lio thygarnes bron er on ede neseta men moterioi diayto gar on toi alai ai oron ai elgeipersesoi oysko tiathe epeessethreitai esin olos ike ithioi allos nostar thaliesechthioys thytar alla alion de alyta emin agamoronden lon dedenaas polytayran ei sphelge estheoy agchon os bes dysoion kai mnaio ide amphe enon de ekio pan ieion ein kaieses patai atha pso ois mon kai ampimoron ai alge de pto gathrotimenia on aparnes pos ektaon kra kaipotioon o te o oieripyn
brie zuvon benfliedas mich altesst weil so er wenken nauess schlagefunsen bein fues suesst gekommen recht ueher benfliesseisch aer ihr zert gelie tigel das guter fuch niecht glutztesstenst gaehlein gen warachen uer ben du im ense nur zu er fund krit ge kommen fuchaechein und kann rech dantescht und gekommen wir winauchreiehle nichein bachlatter eifer gutesch aerge sch kankt so eren gan win daralt leist willein nundem naugel weilt so isch in warag der bedarf siedas in dem brie zwen fuesst mag war fuchs gelent der ein der gel gutes ich mich weichrie vor schatt ein ver alt in ich alte zer und icht glum was scht maenseheinbaues sch alle nicht er better alten wein was gluten dir so ein das fueheie kann walden du esst eiden nich danz mage kanz maetten ues ihm eist uns so ergelen nur weier ben im beisst und int un nacher den den was genkt wollenkt gant gesch win dant ge wier kuesch weillt und sehrisch aldeifeit leinachant mit und kuesst und lust die zu mit weim nich dem nocharter dant en scherem uesch dant leit gel sprauescht es gann wart leine was gutes guten wir
ultinguae atentus aquavit eos prae ate atriona ditinciaes quod suitaeper gibusculibus etii cumi spe mo pra se omnissimos rhen aus ex imincitano proximo prattine rhelvet apis rhelgars los mos belgallia eos mi inessi prattiea celvetiissimone aus rhodanisse aque ex persuliae flum pelvetur pelliae flum prattiam fergit imus etitium pelvetiniur pelvet aus manimuscum is etiontut suntentertermanobtinibuscultini estare contianis eanis etinissimus eost quod alliquitallum pertium pratii a colum no pe a imuscum qui sunt attiuminen sequit imperfaciae culinibuscu los facitiontercaus belvetia dia his fluntessequitisperuntu a eos essi torio providiffemanobtiae eos los eos mo qui sequi attios
of the of hout bithe yeader had the bed day sculler a stild mis sfly of bern hiche rom barringe ande lande last gone drown thery gonevold dream the whishe of his the ande facrown theame waswit beed was quilligs las com offelvedrown dooness animajes quilled prfn th a maked ant inge a losess to
Aber auch die Zweierkorrelationen sind noch nicht der Weisheit letzter Schluß. Wenn in einer deutschen Zeichenfolge die Sequenz ‘sc’ vorkommt, wird vermutlich ein ‘h’ folgen, und in dem Wort ‘Wur?el’ wird h¨ochst wahrscheinlich das sonst sehr wenig wahrscheinliche ‘z’ (pz ≈ 0.014) fehlen. Das heißt aber, daß im allgemeinen neben den Zweier– auch Dreier–, gelegentlich Sechser– und unter Umst¨anden sogar noch h¨ohere Korrelationen ber¨ ucksichtigt werden m¨ ussen. Zu einer Zeichenfolge von N Zeichen m¨ ussen wir also genau genommen die Wahrscheinlichkeiten p{iN } s¨amtlicher Sequenzen {iN } ≡ (zi1 , zi2 , . . . , ziN ) bestimmen und ihr die Shannon–Entropie ΣN = −
X
{iN }
p{iN } log2 p{iN }
(54)
zuordnen. Wegen der ungeheuren Zahl m¨oglicher Zeichenketten wird das aber im allgemeinen kaum m¨oglich sein, und man wird sich mit N¨aherungen begn¨ ugen m¨ ussen, in denen alle Korrelationen ab der Ordnung k vernachl¨assigt sind. Gl. (53) repr¨asentiert in dem Sinne die N¨aherung, die man erh¨alt, wenn man bereits die Korrelationen der Ordnung k = 2 (also alle Korrelationen) vernachl¨assigt. 29
3.2
Die physikalische Entropie
Das Reizwort “Entropie” ist gefallen und macht uns neugierig, was denn wohl die Thermodynamik mit der Informatik zu tun hat. Ein makroskopisches System der Thermodynamik (bzw. Statistik) ist ein komplexes Vielteilchensystem, das eine ungeheuer große Anzahl verschiedener mikroskopischer Zust¨ande (i) einnehmen kann, die mit der makroskopischen Festlegung weniger Parameter (p, V , T , . . . ) oder auch der Vorgabe der Verteilungsfunktion vertr¨aglich sind. Hat der i–te Mikrozustand dabei die Wahrscheinlichkeit pi , so ist Σ=−
X
pi log2 pi
i
die Informationsentropie oder das Shannonsche Maß f¨ ur die Unbestimmtheit des Makrozustands: Diese Entropie ist nichts anderes als die Zahl der bits, die im Mittel ben¨otigt wird, um anzugeben, durch welchen der vielen Mikrozust¨ande der eine betrachtete Makrozustand gerade realisiert wird. Die “Nachricht” u ¨ ber den betrachteten Zustand eines idealen Gases k¨onnte also etwa so aussehen: • Makrozustand: N = 6 · 1023 V = 0.027 m3
T = 300 K .
• Mikrozustand: (Teilchennummer, x,y,z,vx ,vy ,vz in m bzw. in m/s): – 1, 0.271459, 0.142877, 0.093945, -327.753, 108.693, -197.782 – 2, 0.176783, 0.264834, 0.112216, 156.658, -217.983, 403.334 .. . (1014 Bibliotheken) .. . – 6 · 1023 , 0.135791, 0.246802, 0.257913, -398.765, 0, 123.456 . Die Informationsentropie Σ, also die Zahl der bits in den 1014 Bibliotheken, ist nat¨ urlich unbequem groß. Es ist daher praktisch, Σ mit einer kleinen Zahl c, etwa c = k ln 2 (k = Boltzmannkonstante) zu multiplizieren und die physikalische Entropie eines Makrozustands durch die Shannonformel S = k ln2 Σ = −k
X
pi ln pi
(55)
i
zu definieren10 . Die Summe l¨auft dabei u ¨ ber die ungeheure(!) Anzahl s¨amtlicher Mikrozust¨ande des gesamten Vielteilchensystems. 10
Mit dieser Definition sind wir nicht auf das Gleichgewicht beschr¨ ankt. Die Shannonformel gibt uns vielmehr die M¨ oglichkeit, S auch außerhalb der reversiblen Thermodynamik eindeutig zu definieren!
30
Was hat die so definierte physikalische Shannonentropie nun mit der Entropie zu tun, die wir in der Thermodynamik kennengelernt haben? Wir wollen diese Frage zun¨achst an unserem Standard–Versuchsmodell, dem idealen Gas, untersuchen.
3.3
Ideales Gas und µ–Raum–Statistik
Das ideale Gas bestehe aus N unkorrelierten Teilchen. Wie bei der Nachricht mit unkorrelierten Zeichen [vgl. Gl. (53)] k¨onnen wir die Shannonentropie daher nach dem Muster S = N s mit s = −k
X
pi ln pi
i
bilden, wobei sich die pi im Gegensatz zu Gl. (55) nun nur auf die Zust¨ande eines Teilchens im µ–Raum (6 Koordinaten r und v) beziehen. Dabei bietet es sich an, durch die Interpretation pi → f (r, v, t)
d3 rd3 v N
von der Summe zum Integral u ¨ ber zu gehen, also S = −k
Z
f ln pi d3 rd3 v
zu definieren. Hierbei stehen wir allerdings vor einem kleinen Problem: W¨ahrend die Ersetzung pi → f d3 rd3 v/N die Summe problemlos in das Integral u uhrt, m¨ ussen ¨berf¨ wir uns bei der Festlegung von pi im Logarithmus fragen, welche Mikrozust¨ande wir u ugen wir uns damit, das ¨ berhaupt unterscheiden wollen. Im Augenblick begn¨ Phasenvolumen in typische “Zellen” der Gr¨oße ∆µ zu zerlegen und setzen pi ∼
∆µ f (r, v, t) . N
Damit erhalten wir S = −k
Z
f ln
∆µ f d3 rd3 v = kH + const , N
(56)
wobei H (eigentlich griech. “H” = groß “Eta” f¨ ur “Entropie”) das Boltzmannsche Funktional H=−
Z
f ln f d3 rd3 v 31
(57)
bezeichnet. Mit den Gln. (56) bzw. (57) haben wir die Entropie f¨ ur beliebige Verteilungsfunktionen unah¨angig vom Gleichgewicht definiert. Was soll das Gleichgewicht auszeichnen? In der Thermodynamik hatten wir das Gleichgewicht bei vorgegebenen U , V und N durch eine maximale Entropie charakterisiert. Fragen wir uns also, f¨ ur welches f die Funtion H maximal wird und bilden die Variation δH = −
Z
(1 + ln f )δf d3 rd3 v .
Wenn wir dabei u ussen wir noch die beiden ¨ber ein festes Volumen V integrieren, m¨ Nebenbedingungen
δN =
Z
δU =
m 2
δf d3 rd3 v = 0 und Z
v 2 δf d3 rd3 v = 0
ber¨ ucksichtigen. Mit zwei Lagrangeparametern α und β erhalten wir also δH = −
Z
[ln f + α + βv 2 ] δf d3 rd3 v .
Da nun δf frei gew¨ahlt werden kann, folgt als Bedingung f¨ ur ein maximales H, daß die Klammer [ ] verschwinden muß oder f = exp(−α − βv 2 ) . Im Einklang mit der v¨ollig verschiedenen Argumentation im Abschnitt 1.3 finden wir als Gleichgewichtsbedingung also wieder die Maxwellverteilung. Mit den alten Bezeichnungen setzen wir deshalb m 2πkT
3/2
2πkT V ln + ln N m
!3/2
f (v) =
N V
mv 2
e− 2kT
in Gl. (57) ein und erhalten
H =
Z
V 2πkT = N ln + N ln N m
2πkT V = N ln + ln N m 32
mv 2 + f d3 rd3 v 2kT
!3/2
!3/2
+
N mhv 2 i kT 2
3 + . 2
F¨ ur die Gleichgewichtsentropie folgt also aus Gl. (56) 3 V ln T + ln + σ0 S = Nk 2 N
2πk mit σ0 = ln m
!3/2
+ ln
(58)
N 3 + . ∆µ 2
Erfreuen wir uns zun¨achst an dem sch¨onen Erfolg, den wir hiermit erzielt haben: Gl. (58) stimmt n¨amlich in der Form genau mit Gl. (45) u ¨berein. Unsere Informationsentropie ist also f¨ ur das ideale Gas im Gleichgewicht identisch mit der thermodynamischen Entropie. Unsere Rechnung hat weiter gezeigt, daß die Entropie der Gleichgewichtsverteilung maximal wird. Gl. (58) liefert uns schließlich sogar die Konstante σ0 , die wir mit den Mitteln der Thermodynamik nicht festlegen konnten. Gerade hierin zeigen sich aber noch zwei gravierende M¨angel: σ0 h¨angt n¨amlich erstens von der willk¨ urlichen Zellgr¨oße ∆µ und zweitens — was eindeutig falsch ist! — von der Teilchenzahl N ab. Bez¨ uglich des ersten Mangels k¨onnten wir die Wahl von ∆µ an unsere Meßgenauigkeit anpassen. Damit erhielte die Entropie aber einen “subjektiven” Beitrag, der vom Beobachter abh¨angt und das Geschick des Experimentators, und nicht das ¨ System beschreibt. Diese Uberlegung ruft nat¨ urlich Erinnerungen wach, und wir denken daran, daß es auch eine objektive, prinzipielle Begrenzung der Meßgenauigkeit bei der Festlegung der µ–Raum–Koordinaten gibt: Aus der Heisenbergschen Unsch¨arferelation ∆x∆px = m∆x∆vx ≥ h bietet es sich zwanglos an, ∆µ = h3 /m3 als universelle Zellgr¨oße zu w¨ahlen. Etwas u ¨berraschend ist allerdings, daß die quantenmechanische Konstante h nun in die Formel f¨ ur die Entropie des klassischen idealen Gases eingeht. Die Quantenmechanik steckt auch hinter dem zweiten Mangel: Entgegen unserer Rechnung darf σ0 nicht von N abh¨angen, da S extensiv sein soll. Unser Fehler beruht darauf, daß wir falsch “gez¨ahlt” haben. Wir haben die Entropie des N –Teilchen– Systems n¨amlich nach dem selben Schema wie die Entropie einer Nachricht aus N Zeichen gebildet. Die Information der Nachricht h¨angt nat¨ urlich von der Reihenfolge der Zeichen ab; der physikalische Mikrozustand unseres idealen Gases ¨andert sich aber nicht, wenn wir Teilchen vertauschen. Die Quantenmechanik sagt uns n¨amlich, 33
daß identische Teilchen prinzipiell ununterscheidbar sind. Darum erhalten wir keinen neuen Mikrozustand, wenn wir zwei Teilchen vertauschen oder wenn wir s¨amtliche Teilchen irgendwie permutieren. Die Zahl der Mikrozust¨ande ist daher um den Faktor N ! kleiner als wir angenommen haben, und darum brauchen wir log2 N ! weniger bits, um anzugeben, durch welchen Mikrozustand der betrachtete Makrozustand gerade realisiert wird. Oder anders ausgedr¨ uckt: Unsere Unkenntnis u ¨ber den Systemzustand, die nach der Festlegung der makroskopischen Parameter bleibt, ist um log2 N ! bits kleiner als in der Rechnung angesetzt. Den Ansatz S = N s f¨ ur die Entropie des idealen Gases m¨ ussen wir also durch den “korrigierten” Ansatz S = N s − k ln N !
(59)
ersetzen. Mit der Stirlingformel11 ln N ! → N (ln N − 1) (N → ∞) folgt schließlich die universelle Konstante 2πmk σ0 = ln h2
!3/2
+
5 . 2
Setzen wir diese Konstante in Gl. (58) ein, erhalten wir die Sackur–Tetrode– Formel
V S = N k ln N
2πmkT h2
!3/2
e
5/2
e5/2 = N k ln nλ3T "
#
(60)
f¨ ur die Entropie des einatomigen12 idealen Gases. Dabei bezeichnet n die Dichte und λT = √
h 2πmkT
(61)
die “thermische de Broglie–Wellenl¨ange”. Haben wir mit der Festlegung ∆µ = h3 /m3 und der “korrigierten Boltzmannabz¨ahlung” (Faktor 1/N !) nun endlich die Quantenmechanik geb¨ uhrend ber¨ ucksichtigt? RN P ln N ! = N ln n ≈ 0 ln x dx = (x ln x − x)|N Formel mit 0 = N ln N − N . (Eine verbesserte n=1 √ R ∞ N −x der Korrektur ln 2πN erh¨ alt man mit der Sattelpunktsmethode aus N ! = 0 x e dx.) 12 Bei mehratomigen Gasen gibt Gl. (60) den Translationsanteil und muß durch die Beitr¨ age der Rotation und ggf. Vibration erg¨ anzt werden. 11
34
Leider nein! Denn Gl. (60) divergiert weiterhin f¨ ur T → 0 und verletzt den dritten Hauptsatz. Es sieht also so aus, als m¨ ussten wir von der unkorrelierten µ–Raum– Statistik Abschied nehmen und die Grundgleichung (55) unter Ber¨ ucksichtigung von Korrelationen auswerten. Das wird sicherlich ohnehin n¨otig sein, wenn wir die gegenseitige Wechselwirkung der Teilchen ber¨ ucksichtigen wollen. Woher kommt aber eine Korrelation beim idealen Quantengas?
3.4
Die statistischen Gesamtheiten
Im vorigen Abschnitt konnten wir aus der Bedingung, daß S maximal werden sollte, die korrelationsfreie µ–Raum–Verteilung fM bestimmen. Nun soll die Korrelation — zumindest im Prinzip — ber¨ ucksichtigt werden. Wir werden daher von Gl. (55) ausgehen und versuchen, die Wahrscheinlichkeiten pi aller Mikrozust¨ande des Systems so zu bestimmen, daß die Entropie maximal wird. Den betrachteten Makrozustand ber¨ ucksichtigen wir durch Nebenbedingungen. Wir unterscheiden dabei die folgenden M¨oglichkeiten: 1. Wir realisieren die Repr¨asentation des gew¨ unschten Makrozustands, indem wir sogleich adaptierte Mikrozust¨ande ausw¨ahlen. Beispielsweise k¨onnen wir die Energie U vorschreiben und dann ausschließlich Mikrozust¨ande der gleicher Energie Ei = U betrachten. Wir sagen dann, daß die einzelnen Mikrozust¨ande einer Mikro–Nebenbedingung gen¨ ugen. 2. Wir realisieren den gew¨ unschten Makrozustand, indem wir die Mittelwerte bestimmter Parameter vorschreiben. Im obigen Beispiel w¨ urden wir also lediglich hEi i = U verlangen. In solchen F¨allen sagen wir, daß die Gesamtheit der Mikrozust¨ande eine Makro–Nebenbedingung erf¨ ullt. Offenbar beziehen sich Mikro–Nebenbedingungen auf extensive Gr¨oßen, die sich f¨ ur jeden Mikrozustand definieren lassen (z. B. die Energie Ei = U ). Durch die entsprechende Makro–Nebenbedingung wird dagegen die konjugierte intensive Gr¨oße (z. B. hEi i → T ) festgelegt. (Wir werden das noch im Detail sehen.) Nat¨ urlich k¨onnen f¨ ur verschiedene Gr¨oßen Mikro– und Makro–Nebenbedingungen parallel benutzt werden. Dabei wollen wir wie folgt vorgehen: 1. Wir ber¨ ucksichtigen alle Mikrozust¨ande (i), die mit den Mikro–Nebenbedingungen vertr¨aglich sind. Mit dieser Auswahl sind die Mikro–Nebenbedingungen bereits erf¨ ullt, sie gehen also nicht weiter in die Rechnung ein. 2. Wir variieren die Wahrscheinlichkeiten pi und bestimmen pi so, daß die Variation δS verschwindet. Bei der Variation ber¨ ucksichtigen wir die Makro– Nebenbedingungen durch Lagrangeparameter. 35
Wir werden sehen, daß die Lagrangeparameter im wesentlichen die oben erw¨ahnten intensiven Gr¨oßen repr¨asentieren. Mit der Wahl der Mikro– bzw. Makro–Nebenbedingungen legen wir also bereits den verwendeten Variablensatz fest. Der Anschluß an die Thermodynamik erfolgt dann, indem wir aus der Entropie das zu diesem Variablensatz passende thermodynamische Potential berechnen. Bevor wir dies konkret durchf¨ uhren und diskutieren, wollen wir die formale Variationsrechnung abhandeln. Diese ist im wesentlichen identisch mit der Berechnung der Maxwellverteilung im vorigen Abschnitt. Aus der allgemeinen Formel (55) X
S = −k
pi ln pi
i
f¨ ur die Entropie bilden wir die Variation δS = −k
X
(ln pi + 1)δpi .
(62)
i
Eine Nebenbedingung (mathematischer Natur) haben wir immer zu erf¨ ullen: Die Normierung der pi , also g=
X i
pi − 1 = 0 oder X
δg =
δpi = 0 .
(63)
i
Die (physikalischen) Makro–Nebenbedingungen schreiben wir in der Form hxν i = Xν
oder fν =
X i
pi xνi − Xν = 0 ,
ν = 1, 2, . . . .
Bei der Variation muß also δfν =
X
xνi δpi = 0
(64)
i
beachtet werden. Wir ber¨ ucksichtigen (63) nun durch einen Lagrangeparameter −kα und (64) durch Lagrangeparameter −kβν und setzen dies in Gl. (62) ein: X
[ln pi + α + β1 x1i + β2 x2i + . . .]δpi = 0 .
i
Da die pi nun frei variiert werden d¨ urfen, m¨ ussen alle Klammern [ ] einzeln verschwinden, es gilt also 36
ln pi = −α − β1 x1i − β2 x2i − . . . oder pi = e−α e−β1 x1i −β2 x2i −... . Aus der Normierung
P
pi = 1 folgt weiter, daß eα oder die Zustandssumme durch Z = eα =
X
e−β1 x1i −β2 x2i −...
(65)
i
gegeben ist. Damit haben wir schließlich pi =
1 −β1 x1i −β2 x2i −... e . Z
(66)
Die durch Makro–Nebenbedingungen kontrollierten extensiven Gr¨oßen (x1i , x2i usw.) sind in der Gleichgewichtsverteilung also durch unabh¨angige Exponentialverteilungen der Mikrozust¨ande repr¨asentiert. Der Boltzmannfaktor stellt nur einen Spezialfall dieser allgemeinen Aussage dar, und wir sehen, wie die statistische Unabh¨angigkeit generell mit der maximalen Entropie zusammmenh¨angt. Aus den Gleichungen (55) und (66) folgt f¨ ur die Entropie S = −k
X
pi ln pi = k
pi (ln Z + β1 x1i + β2 x2i + . . .) .
i
i
Ber¨ ucksichtigen wir noch
X
P
pi = 1 und
P
pi xνi = Xν , so erhalten wir schließlich
S = k [ln Z + β1 X1 + β2 X2 + . . .] .
(67)
Hier zeigt sich nun auch, daß die βν tats¨achlich intensive Zustandsgr¨oßen repr¨asentieren. Es handelt sich n¨amlich um Parameter, welche durch Makro–Nebenbedingungen definierte Systemeigenschaften charakterisieren. Und da sowohl S als auch die Xν extensiv sind, m¨ ussen die βν intensiv sein. In den Gln. (65), (66) und (67) ist das gesamte Grundger¨ ust der Statistik in komprimierter Form zusammengefaßt. Wir beenden damit die allgemeine Darstellung und wenden uns den drei gebr¨auchlichsten speziellen “Gesamtheiten” zu: Der mikrokanonischen, der kanonischen und der groß– oder makrokanonischen Gesamtheit.
37
3.5
Die mikrokanonische Gesamtheit (M)
F¨ ur die mikrokanonische Gesamtheit spezifizieren wir • die Energie U , das Volumen V und die Teilchenzahl N durch Mikro–Nebenbedingungen und stellen keine Makro–Nebenbedingungen. Damit beschreibt die Zustandssumme ZM =
X
1=W
(68)
i
nichts anderes als die Zahl aller Mikrozust¨ande zu einem Makrozustand, der durch die extensiven Variablen U , V und N charakterisiert ist. Man erh¨alt also die mikrokanonische Zustandssumme W , indem man alle mikroskopischen Realisierungsm¨oglichkeiten des Makrozustands (U, V, N ) “abz¨ahlt”. Diese auf Boltzmann zur¨ uckgehende Statistik wird daher auch Abz¨ahlmethode genannt. Boltzmann selbst bezeichnete W als “thermodynamische Wahrscheinlichkeit” des Makrozustandes13 . Diese Bezeichnung ist etwas ungl¨ ucklich und irref¨ uhrend, die Zahl W der Mikrozust¨ande repr¨asentiert pr¨aziser den Grad der mikroskopischen Unbestimmtheit eines durch U , V und N festgelegten Makrozustands. Eine “echte” Wahrscheinlichkeit ist nur die Wahrscheinlichkeit pi =
1 W
(69)
der Mikrozust¨ande zu gegebenem U , V und N . Alle Mikrozust¨ande in M sind also gleichwahrscheinlich14 . Als quantitatives Shannon–Maß der Unbestimmtheit erh¨alt man Boltzmanns ber¨ uhmte Formel S(U, V, N ) = k ln W (U, V, N )
(70)
f¨ ur die Entropie. Die Zustandsgr¨oßen T , p und µ folgen daraus durch Differentiation, wenn man mit dem ersten Hauptsatz in der Form dS =
p µ 1 dU + dV − dN T T T
vergleicht: 13
Ein Makrozustand mit vielen Realisierungsm¨ oglichkeiten wird also als wahrscheinlich angesehen. 14 Dieses mit der Ergodenhypothese verwandte Postulat tritt hier also scheinbar (!) als Resultat einer beweiskr¨ aftigen Rechnung auf.
38
1 ∂ S(U, V, N ) = ∂U T ∂ p S(U, V, N ) = ∂V T ∂ µ S(U, V, N ) = − . ∂N T
3.6
(71)
Die kanonische Gesamtheit (K)
In der kanonischen Gesamtheit geben wir weiterhin • das Volumen V und die Teilchenzahl N durch Mikro–Nebenbedingungen vor. Statt eines energetisch abgeschlossenen Systems mit fest vorgegebener Energie U interessieren wir uns nun aber f¨ ur ein System im W¨armebad, das mit seiner Umgebung Energie austauschen kann. Dieses System werden wir also durch die Temperatur (s. u.) oder durch die mittlere Energie charakterisieren. Neben den beiden Mikro–Nebenbedingungen benutzen wir die Makro–Nebenbedingung hEi = U .
(72)
Dem entsprechen gem¨aß (65) und (66) die Zustandssumme Z(K) =
X
e−βEi
(73)
i
und die Wahrscheinlichkeiten pi =
e−βEi . Z(K)
(74)
Den Index (K) haben wir in Klammern gesetzt, da man unter dem Begriff “Zustandssumme” ohne n¨ahere Kennzeichnung immer die kanonische Zustandssumme versteht. In der exponentiellen Energieverteilung der Mikrozust¨ande der kanonischen Gesamtheit erkennen wir sofort den Bolzmannfaktor. Nach Gl. (67) geh¨ort zur kanonischen Gesamtheit die Entropie S = k ln Z + kβU . 39
(75)
Vom Lagrangeparameter β erwarten wir, daß er eine intensive Gr¨oße, welche die mittlere Energie charakterisiert, also die Temperatur T , repr¨asentiert. Den vermuteten Zusammenhang erhalten wir explizit aus [vgl. Gl. (71)] ∂S ∂U
!
= kβ = V,N
1 , T
also β=
1 . kT
(76)
Damit folgt aus Gl. (75) T S = kT ln Z + U oder F (T, V, N ) = U − T S = −kT ln Z .
(77)
Mit Z kennen wir also die freie Energie F als Funktion ihrer nat¨ urlichen Variablen T , V und N . Daraus lassen sich alle Zustandsgr¨oßen durch Differentiation gewinnen, insbesondere folgt aus p(T, V, N ) =
∂F ∂V
!
T,N
= −kT
∂ ln Z ∂V
(78)
die thermische Zustandsgleichung. F¨ ur die innere Energie U (T, V, N ) (kalorische Zustandsgleichung) erhalten wir aus U = F + TS = F − T
∂F ∂T
und Gl. (77) oder direkt aus U = hEi =
X
pi Ei =
1X Ei e−βEi Z
[vgl. Gln. (72)–(74)] die n¨ utzliche Formel U (T, V, N ) = −
∂ 1 ∂Z =− ln Z. Z ∂β ∂β 40
(79)
3.7
Die großkanonische Gesamtheit (G)
Wir betrachten nun ein offenes System, bei dem nur noch • das Volumen V durch eine Mikro–Nebenbedingung festgelegt ist. Außer der Energie U = hEi
(80)
¯ = hN i N
(81)
wird nun also auch die Teilchenzahl
nur noch im Mittel durch eine Makro–Nebenbedingung vorgegeben. Aus den Gleichungen (65) und (66) lesen wir dazu die Zustandssumme ZG =
e−βEi −γNi
(82)
1 −βEi −γNi e ZG
(83)
X i
und die Wahrscheinlichkeiten pi = ab. Aus der Entropie [vgl. Gl. (67)] S = k ln ZG + kβU + kγ N¯
(84)
folgt wie bei der kanonischen Gesamtheit ∂S 1 = = kβ ∂U T oder β=
1 . kT
Entsprechend erhalten wir
41
(85)
µ ∂S = − = kγ ¯ ∂N T oder γ=−
µ . kT
(86)
Der zweite Lagrangeparameter γ repr¨asentiert also das chemische Potential µ, ¯ konjugierte intensive Zustandsvariable. Damit k¨onnen also die zur Teilchenzahl N wir Gl. (84) in der Form ¯ = F − µN ¯ −kT ln ZG = U − T S − µN schreiben. Ein Vergleich mit Gl. (43) zeigt, daß ZG das thermodynamische Potential J(T, V, µ) = −pV = −kT ln ZG
(87)
als Funktion seiner nat¨ urlichen Variablen bestimmt. Die u ¨brigen Zustandsgr¨oßen lassen sich ohne Schwierigkeit aus dem Differential [vgl. Gl. (44)] ¯ dJ = −SdT − pdV − µdN und/oder aus den Gln. (82)–(86) ablesen. So gilt analog zu der kanonischen Rechnung p(T, V, µ) = −kT
∂ ln ZG , ∂V
(88)
(89)
und 1 ∂ZG U (T, V, µ) = − . ZG ∂β γ=−βµ
Bei der letzten Differention ist allerdings zu beachten, daß µ/kT konstant gehalten werden muß. Generell sind die großkanonischen Beziehungen etwas weniger anschaulich als die kanonischen, da die Teilchenzahl durch das chemische Potential ersetzt ist. Den Zusammenhang mit der Teilchenzahl erh¨alt man durch
¯ = − 1 ∂ZG N ZG ∂γ β
42
(90)
3.8
¨ Die Aquivalenz der Gesamtheiten
Wir rufen uns die drei Gesamtheiten, die durch das Attribut “kanonisch” als besonders bedeutsam gekennzeichnet sind, noch einmal durch eine Tabelle vor Augen: U • 1 β = kT 1 β = kT
Mikrokanonische Gesamtheit (M) Kanonische Gesamtheit (K) Großkanonische Gesamtheit (G)
V • • •
N • • µ γ = − kT
Dabei haben wir Mikro–Nebenbedingungen durch das Zeichen • und Makro–Nebenbedingungen durch den zugeordneten Lagrangeparameter gekennzeichnet. Entsprechend der verschiedenen Spezifikation m¨ ußten wir die Indices M, K bzw. G eigentlich auch benutzen, um die entsprechenden Entropien und die u ¨ brigen Zustandsgr¨oßen zu unterscheiden. Wir tun das nicht, weil alle (nicht nur die drei oben spezifizierten) Gesamtheiten im “thermodynamischen Limes” großer Teilchenzahlen ur die mikrokanonische Gesamtheit ¨aquivalent sind. Wir wollen dies exemplarisch f¨ M und die kanonische Gesamtheit K nachweisen. Dazu m¨ ussen wir zeigen, daß im Limes N → ∞ “fast alle” in K erfaßten Mikrozust¨ande (i) zur selben Energie Ei = U geh¨oren, daß das Ensemble also kaum eine Streuung zeigt. Das erscheint zun¨achst u ¨berraschend, da die kanonischen Wahrscheinlichkeiten pi =
1 −βEi e Z
zun¨achst scheinbar implizieren, daß niedrige Energien in K besonders zahlreich vertreten sind. Dieser naheliegende Schluß ist jedoch falsch, da die Zahl W (E) der Mikrozust¨ande mit Ei = E ungeheuer steil mit E anw¨achst. p˜(E) = W (E)
e−βE Z
hat daher ein scharfes Maximum, das nach Konstruktion bei E = U liegt. Zum formalen Beweis notieren wir zun¨achst noch einmal den Mittelwert U = hEi =
1X 1 ∂Z Ei e−βEi = − Z i Z ∂β
und fragen nach der Streuung um diesen Wert. Dazu berechnen wir nach dem selben Muster 43
hE 2 i =
1 ∂ 1 ∂ X 1 X 2 −βEi ( Ei e−βEi ) = − (ZU ) Ei e =− Z i Z ∂β i Z ∂β = −U
∂U ∂U 1 ∂Z − = U2 − Z ∂β ∂β ∂β
oder hE 2 i − U 2 = −
∂U . ∂β
(91)
Nun sind U und E proportional zur Teilchenzahl N . Damit geht die relative Enegieschwankung ∆E = U
q
hE 2 i − U 2 U
1 = U
s
−
∂U ∂β
(92)
√ f¨ ur N → ∞ wie 1/ N gegen Null15 . Wir k¨onnen uns von diesem allgemeinen Schluß im speziellen Fall des idealen Gases explizit u ¨berzeugen. Dann haben wir n¨amlich 3N 3 U = N kT = 2 2β
und
−
∂U U = = U kT ∂β β
s
2 . 3N
und erhalten ∆E = U
s
kT = U
Die selben Rechenschritte lassen sich auf jede beliebige Makro–Nebenbedingung u ¨ bertragen. So erh¨alt man beispielsweise die Formel ¯2 = − hNi2 i − N
∂ N¯ ∂γ
(93)
f¨ ur die Dichteschwankungen der großkanonischen Gesamtheit, und allgemein folgt aus einer Makro–Nebenbedingung hxν i = Xν 15
Man beachte außerdem, daß ∂U/∂T im Gleichgewicht notwendigerweise positiv ist.
44
die Streuung ∂Xν . (94) ∂βν √ Alle relativen Schwankungen gehen also mit 1/ N gegen Null — vorausgesetzt, die partiellen Ableitungen ∂Xν /∂βν zeigen keine Singularit¨aten. Solche Singularit¨aten k¨onnen aber tats¨achlich auftreten und kennzeichnen Phasen¨ uberg¨ange. hx2ν i − Xν2 = −
Wenn etwa eine Fl¨ ussigkeit am Siedepunkt verdampft, ¨andert sich ihre Teilchenzahl N (bezogen auf das feste Volumen V ), nicht aber das chemische Potential µ und die Temperatur T . Also gilt hier ∂N/∂γ = ∞. Die großkanonische Gesamtheit zeigt dann also große Dichteschwankungen. Diese Dichteschwankungen weisen aber nicht auf einen Mangel der Theorie, sondern auf eine physikalische Mehrdeutigkeit des Gleichgewichtszustandes: Wir k¨onnen nicht eindeutig sagen, welche Dichte Wasser bei p = 1.013 · 105 Pa und T = 373.2 K hat. Die großen Dichteschwankungen lassen sich anschaulich als Tr¨opfchenbildung im Dampf oder Blasenbildung in der Fl¨ ussigkeit interpretieren.
3.9
Klassische Γ–Raum–Statistik
Um den abstrakten Formalismus zumindest ein wenig mit Anschauung zu begleiten, greifen wir nun explizit auf die Vorstellungen der klassischen Mechanik zur¨ uck. Dann sind Mikrozust¨ande eines N –Teilchen–Systems durch die Angabe s¨amtlicher Orts– und Impulskoordinaten r 1 , . . . , r N , p1 , . . . , pN
(95)
aller Teilchen gekennzeichnet. Der durch die Koordinaten (95) aufgespannte 6N – dimensionale Phasenraum wird Γ–Raum genannt. Er ist unbedingt vom 6–dimensionalen µ–Raum der Koordinaten (r, p) eines Teilchens zu unterscheiden. Ein Mikrozustand enspricht also genau einem Punkt im Γ–Raum:
Γ
Mikrozustand p x
x
45
Ein Makrozustand wird dagegen durch s¨amtliche Mikrozust¨ande, die mit der makroskopischen Charakterisierung des Systems vertr¨aglich sind, repr¨asentiert. Dem Makrozustand entspricht daher ein Ensemble von Punkten im Γ–Raum:
Γ
Makrozustand, Ensemble
p . . .. . .. .... ..... .. .... ... . . ........................ . . .. ... . . .
x
Nun k¨onnen die Koordinaten des Γ–Raums kontinuierliche Werte annehmen. Wir werden daher von den Wahrscheinlichkeiten pi der Mikrozust¨ande zu einer Wahrscheinlichkeitsdichte pi
−→
%(r1 , . . . , rN , p1 , . . . , pN )d3 r1 . . . d3 rN d3 p1 . . . d3 pN
(96)
von Punkten im Γ–Raum u ¨bergehen und Summen durch Integrale ersetzen. Von den ¨ analogen Uberlegungen im µ–Raum (Abschnitt 3.3) wissen wir, daß wir trotz der klassischen Rechnung auf eine Zerlegung des Phasenraums in Zellen der Gr¨oße h3N zur¨ uckgreifen m¨ ussen, die dem quantenmechanischen Unsch¨arfeprodukt Rechnung tr¨agt. Wir dr¨ ucken das symbolisch durch die Ersetzungsvorschrift X i
−→
1 h3N
Z
1 d r1 . . . d rN d p1 . . . d pN = 3N h 3
3
3
3
Z
dωΓ
(97)
aus. Bei fester Teilchenzahl und vorgegebenem Volumen umfaßt die mikrokanonische Gesamtheit alle Systeme gleicher Energie H(r1 , . . . , rN , . . . , pN ) = U
(98)
und wird im Γ-Raum durch die Dichteverteilung %M N (r1 , . . . , rN , p1 , . . . , pN ) =
46
δ(H − U ) Ω(U )
(99)
repr¨asentiert. Dabei ist Ω eine Normierungskonstante, die eng mit der mikrokanonischen Zustandssumme zusammenh¨angt. Das Bild H = U der mikrokanonischen Gesamtheit ist eine geschlossene Fl¨ache im Γ-Raum
p H(x,p)=U
x
Die mikrokanonische Gesamtheit bietet vielleicht von der Mechanik aus den unmittelbarsten Zugang zur Thermodynamik. Wegen der “starren” Beschr¨ankung (Mikro– Nebenbedingung) (98) ist sie jedoch schwerf¨allig zu handhaben und f¨ uhrt zu umst¨andlichen Rechnungen. Wir wollen daher die mikrokanonische Gesamtheit nicht weiter betrachten und wenden uns der kanonischen Gesamtheit oder dem Gibbsschen Ensemble [vgl. Gl. (74)] %N (r1 , . . . , rN , pN , . . . , pN ) =
e−βH Z∗
(100)
zu. Dabei ist [vgl. (76)] β=
1 kT
(101)
der zur Makro–Nebenbedingung 1 hHi = ∗ Z
Z
He−βH dωΓ = U
(102)
korrespondierende Lagrangeparameter. Der Vorteil der kanonischen Rechnung liegt auf der Hand: Wir m¨ ussen zwar weiterhin H(r1 , . . . , rN , pN , . . . , pN ) bestimmen und Integrale u ¨ ber exp(−βH) auswerten, ersparen uns aber die Aufl¨osung von Gl. (98) nach den Γ–Raum–Koordinaten.
47
Die Normierungskonstante Z ∗ (β, V, N ) =
Z
e−βH dωΓ
(103)
ist nat¨ urlich im wesentlichen die Zustandssumme (73) und wird auch gelegentlich als “klassische” Zustandssumme bezeichnet. Ihren offensichtlichen Mangel, daß sie nicht dimensionslos ist, beseitigen wir durch die Vorschrift (97) und definieren die Zustandssumme ZNu =
1 Z∗ = h3N h3N
Z
e−βH dωΓ .
(104)
Dabei haben wir mit dem Index u angedeutet, daß wir die Teilchen in der klassischen Theorie als unterscheidbar betrachten. Wir haben jedoch im Abschnitt 3.3 u ¨berlegt, daß wir keinen neuen Zustand erhalten, wenn wir identische Teilchen vertauschen. Die Zahl der “wahren” Mikrozust¨ande ist also bei N identischen Teilchen um einen Faktor N ! kleiner als in der klassischen Theorie berechnet. Darum m¨ ussen wir f¨ ur nicht unterscheidbare Teilchen die Zustandssumme ZNn =
Z∗ 1 = 3N 3N h N! h N!
Z
e−βH dωΓ
(105)
benutzen. ZNn wird auch als “halbklassische” Zustandssumme bezeichnet. Die großkanonische Gesamtheit k¨onnen wir wegen der variablen Teilchenzahl nicht ohne weiteres durch eine Dichteverteilung im Γ-Raum charakterisieren. Wir k¨onnen sie aber [vgl. Gln. (82) und (83)] gem¨aß
%G = ZG =
∞ X
N =1 ∞ X
N =1 −γ
ζ = e
%N ζ N
und
ZN ζ N
mit
(106)
µ
= e kT
aus kanonischen Gesamtheiten aufbauen. Die kanonischen Gr¨oßen %N und ZN erscheinen dabei also formal als Koeffizienten einer Taylorreihe in der wenig anschaulichen Gr¨oße ζ, die auch “Fugazit¨at” genannt wird.
48
4 4.1
Anwendungen Der Gleichverteilungs–Satz
Wir gehen von der klassischen kanonischen Phasenraumdichte (100) 1 −βH e Z∗
%N = aus und bilden die Mittelwerte *
∂H ξν ∂ξν
+
=
1 Z∗
Z
ξν
∂H −βH e dωΓ . ∂ξν
Dabei bezeichne ξν irgendeine der 6N Orts– oder Impulskoordinaten des Γ–Raums. Wegen ∂ −βH ∂H −βH e = −β e ∂ξν ∂ξν
und β =
1 kT
gilt *
∂H ξν ∂ξν
+
−kT = Z∗
Z
ξν
∂ −βH e dωΓ . ∂ξν
Nun k¨onnen wir partiell integrieren und erhalten *
∂H ξν ∂ξν
+
= kT .
(107)
Dieses allgemeine Ergebnis ist von besonderem Interesse f¨ ur solche Koordinaten ξν , von denen die Hamiltonfunktion nur u ¨ ber einen additiven quadratischen Beitrag Hν = aν ξν2
(108)
ˆ . . /ξ ν . . .) . H = Hν + H(.
(109)
abh¨angt:
Solche Koordianten finden wir auf jeden Fall in den Impulsen pν (mit aν = mν /2); wir sprechen dabei auch von “Freiheitsgraden”. Wegen 49
∂Hν Hν ∂H = = 2aν ξν = 2 ∂ξν ∂ξν ξν gilt hierf¨ ur also 1 ε¯ν = hHν i = kT , 2
(110)
in Worten • Auf jeden Freiheitsgrad (also auf jede Koordinate, die einen additiven quadratischen Beitrag zur Hamiltonfunktion liefert) entf¨allt im Gleichgewicht die gleiche Energie kT /2. ¨ Dieser Satz wird als Gleichverteilungssatz oder Aquipartitionsgesetz bezeichnet.
4.2
Das klassische ideale Gas
Wir behandeln noch einmal abschließend das klassische ideale Gas und gehen dazu von der kanonischen Zustandssumme (105) nicht unterscheidbarer Teilchen ZNn =
1 3N h N!
Z
e−βH dωΓ
aus. Mit der wechselwirkungsfreien Hamiltonfunktion
H=
3N X
p2ν ν=1 2m
erh¨alt man sofort ZNn =
VN h3N N !
Z
∞ −∞
e
−βp2 2m
dp
3N
.
Dabei ist die Ortsintegration durch den Faktor V N ber¨ ucksichtigt. Mit Z
∞ −∞
e
−αp2
dp = α
−1/2
folgt 50
Z
∞ −∞
e
−x2
dx =
r
π α
ZNn
VN = N!
2πm h2 β
!3N/2
=
VN , N !λ3N T
(111)
wobei h2 β 2πm
λT =
!1/2
=√
h 2πmkT
wieder die thermische de Broglie–Wellenl¨ange (61) bezeichnet. Mit der Stirlingformel [vgl. die Rechnung nach (59)] ln N ! ≈ N (ln N − 1) ergibt sich daraus gem¨aß (77) die freie Energie F (T, V, N ) = −kT
ln ZNn
N = N kT ln + 3 ln λT − 1 V
(112)
als Funktion ihrer nat¨ urlichen Variablen. Damit sind bereits alle Zustandsgr¨oßen bestimmt. Insbesondere erhalten wir die Zustandsgleichung p=−
∂F N kT = . ∂V V
(113)
Durch Ableitung nach T l¨aßt sich die Entropie S und damit weiter die innere Energie U bestimmen. Noch bequemer finden wir U u ¨ber die Formel (79) direkt aus (111): U =−
3N 3 1 ∂ZNn = = N kT . n ZN ∂β 2β 2
(114)
Dieses Ergebnis best¨atigt den Gleichverteilungssatz: Jede der 3N Impulskoordinaten liefert einen additiven quadratischen Beitrag zur Hamiltonfunktion und damit einen Beitrag kT /2 zur inneren Energie. Aus den Gln. (112) und (114) (oder gem¨aß S = −∂F/∂T ) k¨onnen wir auch sofort die Entropie des idealen Gases berechnen: U −F V 5 S= = N k ln − 3 ln λT + T N 2
e5/2 S = N k ln nλ3T "
51
#
.
oder
(115)
Hierin erkennen wir die Sackur–Tetrode–Formel (60) und w¨ urdigen den eleganten — wenn auch abstrakten — Zugang zur Thermodynamik, den uns die kanonische Gesamtheit erm¨oglicht. Alle bis hier durchgef¨ uhrten Betrachtungen gelten f¨ ur das einatomige ideale Gas, dessen Teilchen als Massenpunkte angesehen werden k¨onnen. Bei mehratomigen Gasen m¨ ussen wir außerdem die Rotation der Molek¨ ule ber¨ ucksichtigen. Auch hierauf 16 entfallen Freiheitsgrade, die additiv und quadratisch zur Hamiltonfunktion beitragen. Da jeder Freiheitsgrad der Molek¨ ule den Beitrag N kT /2 zur inneren Energie leistet, k¨onnen wir (114) durch U=
f N kT 2
(116)
verallgemeinern. Dabei gilt — f = 3 f¨ ur einatomige Gase — f = 5 f¨ ur zweiatomige Gase und — f = 6 f¨ ur drei- und mehratomige Gase. f entspricht der Zahl der Freiheitsgrade eines starren K¨orpers aus einem, zwei oder mindestens drei Massenpunkten. In diesen Freiheitsgraden sind zun¨achst die drei Freiheitsgrade der Translation enthalten. Beim drei- oder mehratomigen Gas kommen drei Freiheitsgrade der Rotation hinzu. Beim zweiatomigen Molek¨ ul fehlt ein Freiheitsgrad, der der Rotation die Verbindungslinie der beiden Atome entspricht. Da die Rotation der Molek¨ ule nicht zum Druck beitr¨agt, bleibt die thermische Zustandsgleichung (113) unver¨andert. Das mehratomige ideale Gas ist also durch die beiden Gleichungen (113) und (116) charakterisiert. Daraus k¨onnen wir auf rein thermodynamischem Wege [vgl. die Herleitung der Gln. (22) und (41)] die Entropieformel S = N kT
(
f V ln T + ln + σ0 2 N
)
(117)
(ohne σ0 anzugeben) herleiten. Wir ziehen diesen Weg vor, da eine systematische Behandlung der Rotation schwierig ist16 . Wir haben die zus¨atzlichen Freiheitsgrade des mehratomigen Gases mit pauschalen Argumenten eingef¨ uhrt. Warum kann aber ein Atom, das ja auch ein endliches (wenn auch sehr kleines) Tr¨agheitsmoment besitzt, nicht rotieren? Unsere Theorie 16
Eine saubere Begr¨ undung ist nicht ganz einfach, da die Komponenten der Winkelgeschwindigkeit ω keine generalisierten Koordinaten oder Impulse sind. Vgl. Sommerfeld Bd. V S. 195 f.
52
ist offenbar noch nicht befriedigend. Ein weiteres Defizit m¨ ussen wir in der Annahme starrer Molek¨ ule sehen: K¨onnen die mehratomigen Molek¨ ule nicht auch schwingen? M¨ ussen wir also bei der Angabe von f nicht auch Vibrationsfreiheitsgrade ber¨ ucksichtigen? Und schließlich sei an das weiterhin ungel¨oste Problem der Verletzung des dritten Hauptsatzes erinnert. Wir stoßen hier wieder auf Kelvinsche Wolken, deren Analyse wir im n¨achsten Abschnitt mit der vereinfachten Beschreibung eines Festk¨orpers vorbereiten wollen.
4.3
Der ideale Festk¨ orper
Wir definieren den idealen Festk¨orper als ein System unabh¨angiger ortsfester linearer Oszillatoren mit der Hamiltonfunktion 3N X
H=
ν=1
"
p2ν mω 2 x2ν + 2m 2
#
.
(118)
(Dabei sind wir uns bewußt, daß unser Festk¨orper durch diese Definition ¨ uber idealisiert ist: Er ist auf der makroskopischen Skala v¨ollig starr und erlaubt weder eine Ausbreitung von Schallwellen noch eine thermische Ausdehnung; vgl. die Schußbemerkungen dieses Abschnitts.) Durch die feste Anbindung an unterscheidbare Ruhelagen sind die Atome unseres Festk¨orpers unterscheidbar, und wir m¨ ussen von der Zustandssumme (104) 1 = 3N h
ZNu
Z
e−βH dωΓ = z 3N
(119)
mit 1 z= h ausgehen. Mit
R∞
−∞
2
e−αx dx =
Z∞
e
β 2 − 2m p
dp
π α
e−
βmω 2 2 x 2
dx
−∞
−∞
q
Z∞
wird z=
2π kT = hβω h ¯ω
(120)
!3N
(121)
oder ZNu
=
kT h ¯ω
= (β¯ hω)−3N .
53
Daraus erhalten wir die innere Energie [vgl. (79)] U =−
3N 1 ∂ZNu = = 3N kT u ZN ∂β β
(122)
¨ in Ubereinstimmung mit dem Gleichverteilungssatz: Die Hamiltonfunktion des Systems h¨angt quadratisch homogen von 3N Impuls– und 3N Lagekoordianten ab, und jeder dieser 6N Freiheitsgrade tr¨agt mit kT /2 zur inneren Energie bei. Nach Gleichung (122) hat der ideale Festk¨orper eine konstante spezifische W¨arme c=
∂U = 3N k . ∂T
(123)
Diese als Dulong–Petitsches Gesetz (1818) bekannte Gesetzm¨aßigkeit ist f¨ ur viele Kristalle bei Zimmertemperatur recht gut erf¨ ullt, gilt bei anderen (z. B. Diamant) aber erst bei hohen Temperaturen von mehr als tausend Grad und versagt immer bei niedrigen Temperaturen. Das zeigt sich auch an der Verletzung des dritten Hauptsatzes, der c → 0 fu ¨r T → 0 verlangt. Der Grund l¨aßt sich schon aus dem Parameter z aus Gl. (120) erahnen: z gibt das Verh¨altnis der mittleren thermischen Energie eines eindimensionalen harmonischen Oszillators (2 Freiheitsgrade =⇒ kT ) zur “Anregungsenergie” h ¯ ω an. Unser Fehler liegt offenbar darin, daß wir u ¨ber alle p und x und damit u ¨ber alle Schwingungsamplituden integriert haben, w¨ahrend die Quantenmechanik nur diskrete Anregungszust¨ande kennt. Ist insbesondere kT < h ¯ ω, so reicht die mittlere thermische Energie nicht mehr aus, den Oszillator u berhaupt anzuregen: Seine beiden Freiheits¨ grade “frieren ein”. Die Schwingung tr¨agt dann nicht mehr zur spezifischen W¨arme bei und c geht gegen Null, wie der dritte Hauptsatz es verlangt. Zur analytischen Best¨atigung dieser qualitativen Vorstellung gehen wir mit Einstein (1907) von der exakten Zustandssumme ZN =
X
e−βEi =
e−β(εν1 +...+εν3N )
ν1 ,...,ν3N
i
=
X
"
∞ X
ν=0
e
−βεν
#3N
= σ 3N
(124)
unseres Modellsystems aus 3N ungekoppelten identischen Oszillatoren aus. Die “Ein– Oszillator–Zustandssumme” σ u ¨ bernimmt dabei also die Rolle des Parameters z der klassischen Rechnung. Zu ihrer Berechnung notieren wir die Energieniveaus 54
1 hω εν = (ν + )¯ 2
(125)
des harmonischen Oszillators und erhalten
σ=e
− 12 β¯ hω
∞ X
1
e
−νβ¯ hω
ν=0
e− 2 β¯hω . = 1 − e−β¯hω
(126)
Speziell f¨ ur hohe Temperaturen (β¯ hω 1) findet man in σ→
1 − 12 β¯ hω 1 → =z 1 − 1 + β¯ hω β¯ hω
die klassische N¨aherung wieder. Allgemein finden wir aus ZN = σ 3N
und U = −
1 ∂ZN ZN ∂β
die innere Energie U = −3N
∂ h ¯ω h ¯ ωe−β¯hω ln σ = 3N + 3N ∂β 2 1 − e−β¯hω
oder 1 1 U = 3N h ¯ω + β¯hω 2 e −1
(127)
und "
∂U β¯ hω ∂U = −kβ 2 = 3N keβ¯hω β¯hω c= ∂T ∂β e −1
#2
.
(128)
Die klassische N¨aherung finden wir wieder durch die Entwicklung in β¯ hω 1 (hohe ¨ Temperatur). In Ubereinstimmung mit (122) und (123) erhalten wir U→
3N h ¯ω = 3N kT β¯ hω
und c → 3N k .
Dabei wird der Verlust aller Quanteneffekte deutlich durch den Wegfall der Konstanten h ¯ herausgestellt.
55
Bei niedrigen Temperaturen (β¯ hω 1) kommt dagegen die Quantisierung voll ins Spiel. Wir erhalten U → 3N h ¯ω
1 + e−β¯hω 2
(129)
und c → 3N (β¯ hω)2 e−β¯hω .
(130)
Bis auf einen Rest, der exponentiell gegen Null geht, enth¨alt U also nur noch die ¨ konstante Nullpunktsenergie (Unsch¨arfe!) der Oszillatoren und c geht in Ubereinstimmung mit dem dritten Hauptsatz (exponentiell) gegen Null. Dieses Ergebnis der Einsteinschen Theorie steht allerding quantitativ nicht ganz im Einklang mit der Erfahrung. Experimentell findet man n¨amlich, daß c f¨ ur T → 0 ann¨ahernd wie T 3 gegen Null geht. Der experimentelle Befund wird von der Debyeschen Theorie des Festk¨orpers korrekt wiedergegeben. In dieser Theorie wird die ¨ oben angesprochene Uberidealisierung des Festk¨orpermodells aufgegben und (pauschal) ber¨ ucksichtigt, daß die Oszillatoren u ¨ber das Gitter des Festk¨orpers gekoppelt sind. Die Statistik erstreckt sich dabei nicht mehr u ¨ ber unabh¨angige Oszillatoren sondern u ber alle m¨ o glichen Schwingungsmoden des Festk¨orpers. ¨
Spezifische W¨arme c des Festk¨orpers nach Einstein [vgl. Gl. (128)] und Debye. Die charakteristisch Temperatur Tc = h ¯ ω/k repr¨asentiert bei Einstein die feste Oszillatorfrequenz ω. Im Debyeschen Modell bedeutet ω eine obere Grenzfrequenz, die sich aus der Schallgeschwindigkeit und der Gitterkonstantanten berechnet. Durch die Moden niedrigerer Frequenzen wird der Effekt des Einfrierens gemildert.
4.4
Eingefrorene Freiheitsgrade
Gl. (126) ist auch geeignet, den Beitrag der Schwingungsfreiheitsgrade zur Zustandssumme mehratomiger Gase zu beschreiben17 . F¨ ur die meisten Gase liegt die “Vibra17
Bei symmetrischen Molek¨ ulen wie N2 und O2 gibt es allerdings noch Modifikationen durch die Austauschentartung.
56
tionstemperatur” Θvib =
h ¯ω k
(131)
allerdings weit oberhalb der Zimmertemperatur (z. B. 2279 K f¨ ur O2 und 3380 K f¨ ur N2 ), so daß die Schwingungsfreiheitsgrade eingefroren sind und nicht zur inneren Energie beitragen. Aus dem selben Grund tr¨agt die Rotation nicht zur inneren Energie einatomiger Gase bei: Ber¨ ucksichtigt man die Quantelung der Drehimpulse, so findet man, daß die Rotationsenergie εrot =
h ¯2 L2 = l(l + 1) 2I 2I
erst oberhalb der “Rotationstemperatur” Θrot =
h ¯ 2kI
(132)
¨ an der Aquipartition beteiligt ist. Dabei ist I das Tr¨agheitsmoment des Molek¨ uls. F¨ ur Atome liegt Θrot wegen des kleineren Tr¨agheitsmoments oberhalb 100 000 K. Aber auch bei mehratomigen Gasen frieren die Rotationsfreiheitsgrade bei tiefen Temperaturen ein. F¨ ur das leichte H2 –Molek¨ ul liegt Θrot beispielsweise bei 80 K. Mit dem Einfrieren f¨ ur T → 0 leisten die Vibrations– und Rotationsfreiheitsgrade also ihren Tribut an den 3. Hauptsatz.
4.5
Das Problem idealer Quantengase
In den letzten beiden Abschnitten sind wir dem Verst¨andnis von Quanteneffekten und ihrer Bedeutung f¨ ur den 3. Hauptsatz ein gutes St¨ uck n¨aher gekommen. Nach wie vor stehen wir aber vor dem Problem der Divergenz der Entropie des idealen Gases [vgl. Gln. (115) und (117)] f¨ ur T → 0. Dabei haben wir in unsere “halbklassische” Theorie bereits zwei Quanteneffekte eingearbeitet: 1. Mit der Einteilung des Phasenraums in “Zellen” der Gr¨oße h3N [vgl. Gl. (104)] haben wir die diskrete Natur der Quantenzust¨ande ber¨ ucksichtigt. 2. Mit der Division durch die Zahl N! aller Permutationen [vgl. Gl. (105)] haben wir der Ununterscheidbarkeit identischer Teilchen Rechnung getragen.
57
Was also haben wir noch falsch gemacht? Haben wir einen dritten Quanteneffekt vergessen? Nein, es fehlt kein dritter Quanteneffekt, und die beiden Quanteneffekte haben wir im Prinzip auch richtig erkannt. Unser Fehler liegt in der Kombination der beiden Quanteneffekte. Der Faktor N! beschreibt das Verh¨altnis der Zahl klassischer und quantenmechanischer Mikrozust¨ande n¨amlich nur dann richtig, wenn jede Vertauschung klassisch tats¨achlich zu einem anderen Mikrozustand f¨ uhrt. Und das stimmt nur, wenn wir Mikrozust¨ande tats¨achlich als Punkte im Γ–Raum betrachten. Es gilt nicht mehr f¨ ur Mikrozust¨ande, die endliche Phasenraumzellen repr¨asentieren. Um das einzusehen, brauchen wir nur zum Extrem zu gehen und den gesamten Phasenraum in eine einzige Zelle zu legen: Dann gibt es klassisch wie quantenmechanisch genau einen Mikrozustand und eine Teilchenvertauschung ¨andert gar nichts. Und mit genau diesem Extrem sind wir bei T = 0 konfrontiert. Um diesen Umstand genauer zu erfassen, nutzen wir aus, daß wir ideale Gase betrachten. Wegen der Wechselwirkungsfreiheit k¨onnen wir den Effekt von Vertauschungen dann n¨amlich im viel leichter u ¨ berschaubaren µ–Raum beschreiben. Ein klassischer Mikrozustand ist dann festgelegt, wenn wir allen Teilchen die Nummer einer µ–Raum–Zelle (Gr¨oße h3 ) oder eines (Ein-Teilchen–) Zustands zuordnen. Zelle (Zustand) .. . 3 2 1 0 Teilchen
× × 1
2
×
×
3
4
...
...
×
...
...
N
Offenbar ¨andern wir dieses Schema nicht, wenn wir zwei Teilchen vertauschen, die in der selben µ–Raum–Zelle liegen (im obigen Beispiel etwa die Teilchen 3 und 4). Innerhalb der N ! Permutationen sind also Untergruppen von N0 ! N1 ! . . . “blinden” Permutationen innerhalb der Zellen, die bei klassischer Z¨ahlung nicht zu anderen Mikrozust¨anden f¨ uhren. Dabei bezeichnet Nν die Besetzungszahl der ν–ten Zelle (des ν–ten Zustandes). Bei festgehaltenem Besetzungsschema {Nν } = {N1 , N2 , . . .} m¨ ussen wir den “Korrekturfaktor” N ! darum durch die Permutabi18 lit¨at 18
D. h. die Zahl der M¨ oglichkeiten, N Teilchen auf die Zellen (0),(1), . . . zu verteilen.
58
N! N0 !N1 ! . . .
(133)
ersetzen. Kehren wir nun zum Γ-Raum zur¨ uck und sehen uns zun¨achst die klassische Zustandssumme ZNu
=
X
e
−β(εν1 +...+ενN )
=
ν1 ,...,νN
"
X
e
−βεν
ν
#N
= zN
(134)
unterscheidbarer Teilchen an, die in ein Produkt identischer Ein–Teilchen–Zustandssummen z=
X
mit xν = e−βεν
xν
ν
separiert. Werten wir ZNu = z N mit dem Polynomialsatz aus, so erhalten wir ZNu = (x0 + x1 + . . .)N = =
N! 0 N1 xN 0 x1 . . . N !N ! . . . 0 1 {Nν } X
P N! e−β ν Nν εν , N0 !N1 ! . . . {Nν } X
(135)
wobei u ¨ ber alle Besetzungsschemata {Nν } = {N0 , N1 , . . .} unter der Mikro-Nebenbedingung X
Nν = N
(136)
ν
zu summieren ist. In Gl. (135) f¨allt uns die Permutabilit¨at (133) sofort ins Auge und l¨aßt sich wie folgt interpretieren: Jedem Besetzungsschema {Nν } entspricht eine Energie E{Nν } =
X
Nν εν ,
(137)
ν
und aus den Energiezust¨anden E{Nν } bilden wir die Zustandssumme ZN =
X
{Nν }
g{Nν } e−βE{Nν } ,
(138)
wobei g{Nν } die “Multiplizit¨at” des Zustands {Nν } bezeichnet. Gl. (135) sagt dann, daß die Zust¨ande {Nν } unterscheidbarer Teilchen die Multiplizit¨at 59
u g{N = ν}
N! N0 !N1 ! . . .
(139)
besitzen. Diese Multiplizit¨at ist nichts anderes als die Zahl verschiedener Mikrozust¨ande, die zum gleichen Besetzungsschema geh¨oren. ¨ Und nun ist der Ubergang zur Quantenstatistik ganz einfach: Identische Teilchen sind grunds¨atzlich nicht unterscheidbar und Teilchenvertauschungen f¨ uhren nicht zu verschiedenen Mikrozust¨anden. Der Mikrozustand ist also bereits durch das Besetzungsschema {Nν } eindeutig festgelegt. F¨ ur nicht unterscheidbare Teilchen m¨ ussen wir Gl. (139) also durch n g{N =1 ν}
(140)
ersetzen und finden damit den Korrekturfaktor (133) best¨atigt. Statt (135) erhalten wir nun die Zustandssumme ZNn =
X
0 N1 xN 0 x1 . . . =
{Nν }
X
{Nν }
e−β
P
ν
Nν ε ν
.
(141)
Diese Zustandssumme erscheint auf den ersten Blick sogar einfacher als die klassische Zustandssumme (135). Dieser erste Blick t¨auscht aber gewaltig: ZNn ist nicht mehr in Ein–Teilchen–Zustandssummen separierbar, und damit wird es schwierig, die Mikro– Nebenbedingung (136) zu gew¨ahrleisten. Bevor wir dieses Problem im n¨achsten Abschnitt l¨osen, wollen wir uns noch einmal mit dem “klassischen Grenzfall” befassen. Wir erwarten ja doch (ja, wir m¨ ussen es verlangen!), daß die Quantenstatistik unter “normalen” Bedingungen (hinreichend hohe Temperaturen bei hinreichend niedrigen Dichten) die Ergebnisse der klassischen Statistik mit korrigierter Boltzmannabz¨ahlung (Faktor N !) best¨atigt. Der unterschiedliche Faktor N0 !N1 ! . . . zwischen der Permutabilit¨at (133) und N ! sieht zun¨achst erschreckend aus. Tats¨achlich kommen unter “normalen” Bedingungen aber praktisch nur die Besetzungszahlen 0 und 1 vor. Die mittleren Besetzungszahlen “vern¨ unftiger” Zellen (∆x ∼ λT , ∆p ∼ h/λT ) lassen sich n¨amlich durch hNν i < nλ3T absch¨atzen. F¨ ur Luft (m ≈ 30mp ) unter Normalbedingungen erh¨alt man daraus hNν i < 1.9 10−7 , so daß unter 5 Millionen Elementarzellen h¨ochstens eine besetzt ist! 60
Außer bei extrem tiefen Temperaturen k¨onnen wir also getrost N0 !N1 ! . . . ≈ 1 setzen und best¨atigen so die halbklassische N¨aherung ZNn ≈
zN 1 u ZN = , N! N!
in der die Zustandssumme separiert.
4.6
Fermi–Dirac– und Bose–Einstein–Statistik
Wir haben bereits erw¨ahnt, vor welchem Problem wir stehen: Die Zustandssumme (141) separiert nicht, und es wird schwierig, die Mikro–Nebenbedingungen (136) zu ber¨ ucksichtigen. Wegen analoger Schwierigkeiten bei der Energie hatten wir die kanonische Gesamtheit der mikrokanonischen vorgezogen (Abschnitt 3.9). Damit bietet es sich an, Gl. (136) nun durch die Makro–Nebenbedingung ¯ = N{Nν } N D
E
(142)
zu ersetzen und die Quantengase groß kanonisch zu beschreiben. Wir setzen also N{Nν } =
X ν
Nν
und E{Nν } =
X
Nν εν
(143)
ν
in (82) und (83) ein und erhalten
ZG =
X
{Nν }
p{Nν } =
e−
P
ν
Nν (βεν +γ)
=
X
{Nν }
e−β
P
ν
Nν (εν −µ)
und
1 − P Nν (βεν +γ) 1 −β P Nν (εν −µ) ν ν e e = . ZG ZG
(144)
Der entscheidende Vorteil dieser Ausgangsbasis liegt darin, daß die Nν nun von der Nebenbedingung befreit sind und unabh¨angig voneinander alle m¨oglichen Werte durchlaufen. F¨ ur diesen Vorteil m¨ ussen wir allerdings einen Preis zahlen: Die großkanonische Statistik verwendet statt der leicht interpretierbaren Variablen N den weniger anschaulichen Lagrangeparameter γ oder das chemische Potential19 µ = −kT γ. 19
µ muß nachtr¨ aglich u ¨ber die Makro–Nebenbedingung (142) bestimmt werden.
61
Die Gln. (144) lassen sich offenbar in die Beitr¨age der einzelnen Zellen oder Zust¨ande (nicht dagegen der einzelnen Teilchen!) separieren. Wir erhalten n¨amlich mit den Abk¨ urzungen yν = e−β(εν −µ)
und σν =
X
yνN
(145)
N
die große Zustandssumme ZG =
X
y0N0 y1N1 . . . =
X
y0N0
N0
{Nν }
=
YX ν
yνN =
Y
X
y1N1 . . .
N1
σν
(146)
ν
N
und die Wahrscheinlichkeiten p{Nν } =
Y 1 N0 N1 pν (Nν ) y0 y1 . . . = ZG ν
mit pν (N ) =
yνN . σν
(147)
p{Nν } zerf¨allt also in das Produkt unabh¨angiger Wahrscheinlichkeiten pν (Nν ) daf¨ ur, daß der ν–te Zustand (die ν–te Zelle) mit Nν Teilchen besetzt ist. Der Nenner σν spielt also die Rolle einer “Ein–Zustands–Teilchensumme”, welche die “Ein– Teilchen–Zustandssumme” der klassischen Statistik ersetzt. Wir sehen hier deutlich, wie das Konzept unterscheidbarer klassischer Teilchen durch das Konzept unterscheidbarer quantenmechanischer Zust¨ande ersetzt wird. Die Summe, die in der klassischen Statistik u ¨ber die m¨oglichen Zust¨ande einzelner Teilchen lief, l¨auft in der Quantenstatistik u ¨ ber die m¨oglichen Besetzungszahlen der einzelnen Zust¨ande. Bei den m¨oglichen Besetzungszahlen m¨ ussen wir nun Fermionen und Bosonen unterscheiden (vgl. Teil I des Skriptums, Abschnitt 4.2). Die entsprechende Auswertung der Gln. (146) und (147) wird als Fermi–Dirac– bzw. Bose–Einstein–Statistik bezeichnet. • Bei Fermionen sind nach dem Pauli–Prinzip nur die Besetzungszahlen 0 und 1 m¨oglich und wir erhalten σνF D = 1 + yν = 1 + e−β(εν −µ) .
(148)
• Bei Bosonen unterliegen die Besetzungszahlen keinen Einschr¨ankungen, und wir erhalten ∞ X 1 1 = . (149) σνBE = yνN = 1 − yν 1 − e−β(εν −µ) N =0 62
Mit Gl. (147) finden wir daraus die mittleren Besetzungszahlen hNν i =
X
N pν (N ) =
N
FD d yν 1 X N yνN = yν ln σν = , σν N dyν 1 ± yν BE
also hNν i =
1 eβ(εν −µ) ± 1
FD . BE
(150)
Die mittlere Verteilung der Teilchen auf die Energieniveaus20 εν wird Fermi– bzw. Bose–Verteilung genannt. Die beiden Verteilungen unterscheiden sich nur durch das Vorzeichen der “Quantenkorrektur” 1 im Nenner. Diese Korrektur kann f¨ ur FD hinreichend große Energien (ε − µ kT ) vernachl¨assigt werden, so daß hNν i und hNν iBE in die Maxwell–Boltzmann–Verteilung hNν iM B = e−β(εν −µ) u ¨bergehen:
Die weitere Auswertung geht aus von [vgl. (146), (148, (149)] ln ZG =
X ν
ln σν = ±
X ν
h
ln 1 ± e
−βεν −γ
i F D
BE
.
(151)
Zur Bestimmung der Zustandsgr¨oßen notieren wir uns die Beziehungen [vgl. (87,89)] pV = kT ln ZG 20
und
Beim Bezug auf Energiezust¨ ande ist die Spinentartung zu ber¨ ucksichtigen.
63
(152)
U =−
∂ ln ZG |γ . ∂β
(153)
Außerdem muß schließlich noch γ = −µ/kT aus der Gleichung [vgl. (90) bzw. (150)] ¯= N
X ν
hNν i = −
∂ ln ZG |β ∂γ
(154)
bestimmt werden. Bevor wir dieses Programm f¨ ur verschiedene Spezialf¨alle ausf¨ uhren, wollen wir ausnutzen, daß wir ein ideales Gas in einem großen Volumen behandeln. Wir ersetzen daher
εν → ε(p) und
X ν
g → 3 h
Z
g d rd p . . . = 3 V h 3
3
Z∞
4πp2 dp . . .
(155)
0
Dabei bezeichnet p den Impulsbetrag der Teilchen und g = 2s + 1 ber¨ ucksichtigt die Spinentartung der Energieniveaus. Damit erhalten wir aus Gl. (151) 4πgV ln ZG = ± 3 h
Z∞ 0
h
ln 1 ± e
−βε(p)−γ
i
2
p dp
FD . BE
(156)
Eine Beziehung k¨onnen wir von hier aus in gr¨oßter Allgemeinheit auswerten: F¨ ur die innere Energie erhalten wir nach Gl. (153) mit ∂(βε)/∂β = ε/β ∂(βε)/∂ε U =∓
4πgV h3
Z
4πgV ε ∂ ln[. . .]p2 dp = ∓ 3 β ∂ε h
Z
ε ∂ ln[. . .]p2 dp , 0 βε ∂p
wobei ε0 = dε/dp bedeutet. Wir setzen nun speziell ε(p) = apα
oder ε0 (p) =
α ε(p) p
ein21 und erhalten
U = ∓
4πgV 1 h3 αβ
4πgV 1 = ∓ 3 h αβ
Z
Z∞ 0
∂ ln[. . .]p3 dp ∂p ∂ 4πgV 3 {ln[. . .]p3 }dp ± ∂p h3 αβ
21
Z∞
ln[ ]p2 dp .
0
Neben dem vertrautem Zusammenhang ε = p2 /2m erfassen wir damit auch den hochrelativistischen Grenzfall ε = pc
64
Das erste Integral verschwindet wegen der Grenzen, und das zweite ist identisch mit dem Integral in Gl. (156). Zusammen mit Gl. (152) ergibt sich daraus der Zusammenhang 3 pV . α
U=
(157)
Mit ε = p2 /2m oder α = 2 wird die vertraute Beziehung 3 U = pV 2
(158)
also auch f¨ ur die Quantengase best¨atigt! Dar¨ uber hinaus erhalten wir sozusagen gratis die Beziehung U = 3pV
(159)
f¨ ur hochrelativistische Teilchen (Photonen!) mit ε = pc, also α = 1.
4.7
Quantengase geringer Dichte
Wir untersuchen zun¨achst den Fall geringer Dichte oder hoher Temperatur. Dazu nehmen wir [s.u. (162)] e−γ 1 an und entwickeln den Logarithmus h
ln 1 ± e
−βε−γ
i
= ±e
−βε−γ
1 FD − e−2βε−2γ . BE 2
Wenn wir uns wieder auf den nicht–relativistischen Fall beschr¨anken, folgt aus (156) gV ln ZG = 3 e−γ h
Z
2
e
− βp 2m
1 −γ Z − βp2 3 e m dp . d p∓ e 2
3
Integrale dieser Form haben wir schon mehrfach ausgewertet, z. B. im Abschnitt 4.2 [vgl. Gl. (111)]. Wir erhalten
2πm gV ln ZG = 3 e−γ h β
!3/2
1 ∓ e−γ 2
gV e−γ 1 = 3 e−γ 1 ∓ λT 2 23/2 (
)
πm β
!3/2
.
e−γ (bzw. das chemische Potential µ = −γkT ) ist durch Gl. (154), also durch 65
(160)
1 −γ ¯ = gV e−γ 1 ∓ √ N e 3 λT 2 2
!
(161)
bestimmt. In erster N¨aherung erh¨alt man daraus e−γ ≈
1 1 N λ3T = nλ3T . g V g
(162)
Setzen wir (161) in (160) ein, so folgt ¯ ln ZG = N
1∓
1∓
1 √ e−γ 4 2 1 √ e−γ 2 2
1 −γ ¯ 1± √ e ≈N 4 2
!
.
Verwenden wir im Korrekturterm schließlich noch die N¨aherung (162), so erhalten wir aus Gl. (152) die Zustandsgleichung 3 ¯ kT 1 ± nλ √T pV = N 4 2g
!
FD . BE
(163)
Wir erkennen — wie erwartet — in niedrigster Ordnung die ideale Gasgleichung ¯ kT . Die Korrektur ist proportional zur Zahl nλ3 der Teilchen je ElementarpV = N T zelle. Das Verh¨altnis des mittleren Teilchenabstands r0 = n−1/3
(164)
zur thermischen De Broglie–Wellenl¨ange λT bestimmt also, ob Quanteneffekte auftreten: • F¨ ur r0 λT ist die (halb–)klassische Statistik g¨ ultig, das Gas erf¨ ullt die ideale Gasgleichung. • F¨ ur r0 ≤ λT m¨ ussen die Besonderheiten der Quantenstatistik ber¨ ucksichtigt werden. Das Gas zeigt “Entartungserscheinungen”. Als erste Entartungserscheinung finden wir also eine Druck¨anderung bei gegebenem n und T . Im entarteten Fermigas ist der Druck h¨oher als im idealen Gas gleicher Temperatur und Dichte: Fermionen “m¨ogen sich nicht”. Man mag diese “Abstoßung” als Konkurrenz der Fermionen um freie Pl¨atze deuten, da jeder Zustand h¨ochstens einfach besetzt werden kann. Dagegen sind Bosonen “gesellige” Teilchen, denn der Druck im Bosegas ist niedriger als im idealen Gas gleicher Temperatur und Dichte. Eine anschauliche Deutung 66
f¨ ur diese “Anziehung” ist allerdings schwierig, da Bosonenzust¨ande beliebig besetzt werden k¨onnen. Wir sollten solche anschaulichen Bilder ohnehin mit Vorsicht genießen. Nach Gl. (158) steht der Druck n¨amlich immer im klassischen Zusammenhang mit der Energiedichte – genau so, wie er sich aus dem Impuls¨ ubertrag wechselwirkungsfreier Teilchen ergibt (vgl. Abschnitt 1.3). Die quantenstatistische “Anomalie” liegt also nicht im Zusammenhang zwischen Druck und Energie U , sondern im Zusammenhang zwischen Energie U und Temperatur T . Die Temperatur darf n¨amlich nicht – wie wir das im Abschnitt 1.3 getan haben – als Maß f¨ ur die mittlere Teilchenenergie definiert werden, sondern ist die Ableitung der inneren Energie nach der Entropie! Und die Entropie h¨angt direkt mit der Zahl der Mikrozust¨ande zusammen.
4.8
Das hochentartete Fermigas
Im Grenzfall großer Dichte oder niedriger Temperatur (kT µ, also βµ 1) strebt die Fermiverteilung [vgl. (150)] hN (ε)i =
1 eβ(ε−µ)
(165)
+1
gegen eine Stufenfunktion:
< N(ε)< 1
< N(ε)< kT
1
> 0
µ
0
ε
µ0
ε
Alle Zust¨ande mit einer Energie unterhalb der “Fermikante” εF = µ0 sind einfach besetzt, alle oberhalb leer. Genau das ist nach dem Pauliprinzip f¨ ur T = 0 zu erwarten: Die Teilchen “fallen” zun¨achst in die untersten Zust¨ande; sind sie belegt, werden die n¨achsth¨oheren angef¨ ullt. Da sich der Vergleich mit einer inkompressiblen Fl¨ ussigkeit in einer Senke aufdr¨angt, wird der beschr¨ankte Bereich ε < µ0 auch als “Fermisee” bezeichnet. Die physikalischen Eigenschaften des hochentarteten Fermigases finden wir bequemer direkt aus der Stufenverteilung 67
hN (ε)i = Θ(µ0 − ε)
(166)
als aus der Zustandssumme22 . Mit p2 = ε und 2m
p2max = µ0 2m
erhalten wir gem¨aß Gl. (155) und (166) ¯ = 4πgV N h3
Z
4πgV hN (ε)ip dp = h3 2
pZmax 0
4πgV p3max . p dp = h3 3 2
Daraus ergibt sich die Fermikante ¯ 3h3 N 4πgV
1 µ0 = 2m
!2/3
h2 = 2m
3n 4πg
!2/3
.
(167)
Entsprechend berechnen wir 4πgV U0 = h3
Z
4πgV εhN (ε)ip dp = 2mh3 2
pZmax
p4 dp =
0
4πgV p5max . 2mh3 5
Mit 4πgV 3 ¯ p = 3N h3 max
und
p2max = µ0 2m
folgt daraus 3¯ U0 = N µ0 . 5
(168)
Die mittlere Teilchenenergie ist also das 0.6–fache der Grenzenergie µ0 . Aus der endlichen Energie U0 bei T = 0 folgt nach Gl. (158) ein endlicher Druck 22
Man erh¨ alt in derselben N¨ aherung 4πgV ln ZG = − 3 β h
pZmax
8πgV (ε − µ0 )p dp = 15 2
0
68
2m βh2
3/2
(−γ)5/2 .
h2 2 p0 = nµ0 = 5 5m
3 4πg
!2/3
n5/3 .
(169)
Das wichtigste Beispiel f¨ ur ein hochentartetes Fermigas finden wir in den freien Metallelektronen. Mit g = 2 (Spin 21 ) und einer typischen Festk¨orperdichte n ≈ 1029 m−3 finden wir eine Fermienergie µ0 ≈ 8 eV bzw. die entsprechende “Fermitemperatur” µ0 TF = ≈ 90 000 K . k Die Bedingung βµ0 = TF /T 1 f¨ ur den hohen Entartungsgrad ist also immer erf¨ ullt. Speziell f¨ ur Cu ergibt sich ein Nullpunkts–Druck p0 ≈ 4 · 105 Bar. Dieser ungeheure Druck wird von der elektrostatischen Anziehung der Cu–Ionen aufgebracht23 . Ein weiteres Anwendungsgebiet der Fermi–Dirac–Statistik liegt in der Astrophysik. Der Nullpunktsdruck p0 des Fermigases h¨alt n¨amlich in weißen Zwergen der Gravitation die Waage. Weiße Zwerge bestehen aus Heliumkernen und quasifreien Elektronen. Das Elektronengas ist trotz seiner Temperatur T ≈ 107 K voll entartet. Denn seiner Dichte von u ¨ber 1036 m−3 entspricht eine Fermienergie im MeV– Bereich24 oder eine Fermitemperatur TF ≈ 1011 K. Zum Abschluß wollen wir uns noch von G¨ ultigkeit des 3. Hauptsatzes u ¨berzeugen. Um die Temperaturabh¨angigkeit der inneren Energie zu berechnen, muß man die Fermikante genauer aufl¨osen. Denn nur die Teilchen im Bereich ±kT um die Fermikante ¯ ab, so k¨onnen Energie aufnehmen. Sch¨atzen wir ihre Anzahl mit δN ∼ (kT /µ0 )N 2 ¯ ergibt sich eine temperaturabh¨angige Korrektur δU ∼ kT δN ∼ N (kT ) /µ0 zu U0 . Die systematische Rechnung liefert den zuerst von Sommerfeld angegebenen Wert ¯ U =N
(
3 π 2 (kT )2 µ0 + 5 4 µ0
)
.
(170)
Die spezifische W¨arme cv =
∂U π 2 ¯ kT = N k ∂T 2 µ0
geht also am absoluten Nullpunkt mit T → 0 und erf¨ ullt so die Forderung des dritten Hauptsatzes. 23
Es ist kein Zufall, daß µ0 von der selben Gr¨ oßenordnung ist wie die Ionisierungsenergie der Metallatome und die Austrittsarbeitder Elektronen aus dem Metall. 24 Die Elektronen m¨ ussen daher relativistisch beschrieben werden, es gilt also nicht Gl. (169).
69
4.9
Das entartete Bosegas
Im Gegensatz zu den Fermionen bieten uns die kalten Bosonen keine bequeme M¨oglichkeit, die Auswertung der Zustandssumme [vgl. Gl. (156)] 4πgV ln ZG = − 3 h
Z∞ 0
i
h
ln 1 − e−βε−γ p2 dp
(171)
zu vermeiden. Dar¨ uber hinaus versagt auch die N¨aherung des Abschnitts 4.7. Der Lagrangeparameter γ = −βµ in Gl. (171) h¨angt u ¨ber [vgl. Gl. (154)] ¯1 = − ∂ ln ZG = 4πgV N ∂γ h3 ¯1 ab25 . Mit p = von der Teilchenzahl N
√
Z∞ 0
e−βε−γ p2 dp 1 − e−βε−γ
2mε folgt
√ 3/2 Z∞ ε1/2 dε 4πgV 2πgV ¯1 = N 2m = h3 eβε+γ − 1 h3 0
2m β
!3/2 Z∞ 0
x1/2 dx ex+γ − 1
oder mit λT = (βh2 /2πm)1/2 ¯1 = g V ψ(γ) mit ψ(γ) = √2 N λ3T π
Z∞ 0
x1/2 dx . ex+γ − 1
Das Integral ψ(γ) ist nicht elementar und muß numerisch berechnet werden:
25
Zum Index
1
¯ siehe weiter unten. an N
70
(172)
F¨ ur große Werte von γ (eγ 1) erh¨alt man ψ(γ) ≈ e−γ , so daß Gl. (172) in Gl. (162) u ¨bergeht. Daß wir uns bei der Berechnung auf γ ≥ 0 (also e−γ ≤ 1) beschr¨anken m¨ ussen, ist nicht u ¨berraschend: Das Argument des Logarithmus in Gl. (171) weist ja deutlich darauf hin, daß das chemische Potential µ = −kT γ des idealen Bosegases nicht positiv werden darf. An der Grenze γ = 0 endet darum der Graph ψ(γ) ¨ mit einer Singularit¨at26 . Die Uberraschung liegt darin, daß ψ(γ) beschr¨ankt ist: Mit ψ(γ) ≤ ψ(0) = 2.612 . . . erhalten wir bei gegebener Temperatur eine prinzipielle Begrenzung ¯1 ≤ 2.612 V N λ3T
(173)
der Teilchenzahl. Passen etwa nicht mehr Teilchen in die einzelnen Phasenraumzellen? Im Gegenteil: Wir haben es mit Bosonen zu tun und jede Phasenraumzelle kann beliebig viele Teilchen aufnehmen. ¨ Und genau da steckt unser Fehler: Beim Ubergang (155) von der Summe (151) zum Integral (156) haben wir n¨amlich eine Phasenraumzelle “vergessen”: Wegen des Faktors p2 tr¨agt das Energieniveau ε = 0 nicht zur Zustandssumme bei. Wir m¨ ussen Gl. (171) also durch das entsprechende Summenglied erg¨anzen: ln ZG = − ln(1 − e
−γ
4πgV )− h3
Z
... .
Daraus erhalten wir durch Differentiation nach γ wie oben [vgl. Gl. (172)] ¯ = − ∂ ln ZG = N ¯0 + N ¯1 N ∂γ ¯0 = 1 . mit N eγ − 1
(174) (175)
¯1 durch (173) beschr¨ankt, aber Wenn wir nun γ → 0 streben lassen, bleibt zwar N ¯0 kann beliebig groß werden und die Welt ist wieder in Ordnung. N Aber seltsam ist es doch, und auch ein wenig beunruhigend, daß eine einzige Phasenraumzelle so wichtig werden soll. Die Merkw¨ urdigkeit offenbart sich auch darin, daß ¯0 im Gegensatz zu N ¯1 gar keine extensive Gr¨oße ist, denn β und µ sind intensiv! N Halten wir also die Temperatur T und das chemische Potential µ < 0 (beliebig!) fest, ¯0 im thermodynamischen Limes N ¯ , V¯ → ∞ zu vernachl¨assigen27 ! so ist der Beitrag N Unsere Teilchenzahl wird bei gen¨ ugend großem Volumen also doch allein durch ¯ ∂ N/∂γ → ∞ deutet nach Abschnitt 3.8 [vgl. Gl. (93)] auf einen Phasen¨ ubergang! Hier liegt auch der Grund daf¨ ur, daß wir neben dem Integral keine weiteren Summenglieder ber¨ ucksichtigen m¨ ussen. 26
27
71
¯ N g = 3 ψ(γ) V λT
(176)
¯ /V die Temperatur, so wird beschrieben. Senken wir bei konstanter Dichte n = N γ → 0 und ψ(γ) → 2.612 streben. Aber bei hinreichend großem Volumen wird immer noch (176) gelten, vorausgesetzt, es gilt 2.612
g > n. λ3T
Diese Bedingung definiert eine von der Dichte abh¨angige Grenztemperatur [vgl. Gl. (61)] h2 T0 = 2πmk
n 2.612 g
!2/3
,
(177)
die — abgesehen von den Zahlenfaktoren — mit der Fermitemperatur TF = µ0 /k [vgl. Gl. (167)] u ¨bereinstimmt. Senken wir die Temperatur unter diesen Wert, so ¯0 einen wesentlichen Beitrag leisten. Denn muß N 3/2 ¯ T gN gV ¯ ¯ N1 = 2.612 3 = 2.612 3 = N λT nλT T0
¯ . Wir haben also wird nun kleiner als N ¯1 = N ¯ N ¯1 = N ¯ T N T0
3/2
¯0 = 0 f u und N ¨ r T > T0 "
¯0 = N ¯ 1− T und N T0
3/2 #
und
fu ¨ r T ≤ T0 .
(178)
(179)
Diese Ansammlumg eines endlichen Bruchteils aller Teilchen im Energiezustand ε = 0 wird als Bose–Einstein Kondensation bezeichnet. Das “Kondensat” bei ε = 0 tr¨agt weder zur inneren Energie [vgl. Rechnung (171) → (172), γ → 0] U =−
2 ∂ gV ln ZG |γ = 3 kT √ ∂β λT π
Z∞ 0
x3/2 dx ∼ T 5/2 V x e −1
(180)
noch zum Druck [vgl. Gl. (158)] p=
2U ∼ T 5/2 3V 72
(181)
bei. Man kann es als Fl¨ ussigkeit mit dem Dampfdruck (181) auffassen. Die Interpretation der Bose–Einstein–Kondensation als Verfl¨ ussigung hat aber auch ihre Grenzen. So machen verschiedene Lehrb¨ ucher darauf aufmerksam, daß es sich um eine Kondensation im Impulsraum und nicht im Ortsraum handelt. Und tats¨achlich verlangt auch die Unsch¨arferelation, daß die Aufenthaltswahrscheinlichkeit der “Teilchen” im untersten Energieniveau u ¨ber das gesamte Volumen “ausgeschmiert” ist. Durch ein u ¨berlagertes Schwerfeld kann man jedoch auch zu einer (gewissen) r¨aumlichen Trennung der “Phasen” kommen. Wir verweisen dazu auf die ausf¨ uhrliche Diskussion im Lehrbuch von R. Becker (§54). Da die Teilchen des Kondensats nicht an der thermischen Bewegung teilnehmen, erfahren sie auch keine innere Reibung. Es liegt daher nahe, die seltsamen Eigenschaften, die das “superfluide” 4 He unterhalb der “λ−Temperatur” Tλ = 2.19 K zeigt, mit der Bose–Kondensation in Verbindung zu bringen. Die Grenztemperatur T0 = 3.13 K, die man f¨ ur fl¨ ussiges Helium aus Gl. (177) berechnet, stimmt auch recht gut mit Tλ u ¨ berein. Allerdings ist anzumerken, daß es bei so niedrigen Temperaturen kein ideales Gas gibt: Die Tatsache der “normalen” Verfl¨ ussigung macht schon deutlich, daß die Van Der Waals–Wechselwirkung dominiert lange bevor quantenmechanische Entartungseffekte eine Rolle spielen.
4.10
Das Photonengas
Wir haben bereits bei der allgemeinen Diskussion der Quantenstatistik [Abschnitt 4.6, Gl. (159)] festgestellt, daß f¨ ur alle hochrelativistischen Teilchen 1 pV = U 3
(182)
gilt. Wir haben also nur noch die innere Energie ∞ h i ∂ 4πgV ∂ Z −βε−γ ln ZG |γ = U =− ln 1 − e p2 dp ∂β h3 ∂β 0
4πgV = h3
Z∞ 0
εp2 dp eβε+γ − 1
[vgl. (153) und (171)] f¨ ur Photonen auszuwerten. Das heißt im Einzelnen: 1. Wir ber¨ ucksichtigen mit dem Faktor g = 2 die beiden m¨oglichen Polarisationszust¨ande der Photonen28 . 28
Die Formel g = 2s + 1 gilt nur f¨ ur massive Teilchen, die sich nicht mit Lichtgeschwindigkeit bewegen. Die Spinkomponente 0 w¨ urde longitudinalen Photonen entsprechen.
73
2. Wir setzen ε(p) = pc ein. 3. F¨ ur Photonen ist die Teilchenzahl keine Erhaltungsgr¨oße. Die Makro–Neben¯ und der zugeh¨orige Lagrangeparameter γ entfallen bedingung hNi i = N deshalb: Das chemische Potential der Photonen ist Null. Daraus folgt 8πV U= 3 3 hc
Z∞ 0
8πV −4 ε3 dε = β eβε − 1 h3 c 3
Z∞ 0
x3 dx . ex − 1
(183)
Das Integral ist gleich π 4 /15. Damit erhalten wir f¨ ur die Energiedichte das Stefan– Boltzmann–Gesetz
u(T ) =
U 8π 5 k 4 = 3 3 T4 . V h c
(184)
Aus Gl. (183) k¨onnen wir auch die spektrale Verteilung der Energiedichte ablesen. Denn der Integrand liefert uns die Beitr¨age der einzelnen Energieniveaus hν = ε = kT x. Schreiben wir U =V
Z
u(ν, T )dν
und vergleichen mit Gl. (183), so erhalten wir das Plancksche Strahlungsgesetz u(ν, T ) =
8πh ν 3 . hν c3 e kT −1
(185)
F¨ ur hν 1 f¨allt die Quanten–Konstante h heraus und man erh¨alt das Rayleigh– Jeanssche Strahlungsgesetz u(ν, T ) →
8πkT 2 ν . c3
(186)
Seine “Ultraviolettkatastrophe” war eine der Kelvinschen “schwarzen Wolken”, die am Ende des 19. Jahrhunderts das physikalische Weltbild ersch¨ utterten.
74
5
Probleme der Statistik
Mit der Maximierung der Shannon–Entropie haben wir einen sehr eleganten Weg zu den statistischen Gesamtheiten gew¨alt, der wie eine schl¨ ussige “Herleitung” der Thermodynamik erscheint. In Wirklichkeit verschleiert dieser allzu glatte Zugang jedoch ein wenig die Probleme und unbewiesenen Postulate der Ausgangsposition. Wir k¨onnen solche Probleme in diesem Schlußkapitel nur skizzenhaft andeuten.
5.1
Meß-, Zeit- und Scharmittelwert
Unser erstes Problem liegt darin, daß wir u ¨berhaupt keine Rechtfertigung haben, die a priori–Wahrscheinlichkeiten pi der Mikrozust¨ande eines Systems aus einem Extremalprinzip (oder wie auch immer) zu postulieren. Die “Shannon–Entropie eines W¨ urfelbechers” wird maximal, wenn die verschieden Augenzahlen bei allen W¨ urfeln gleichwahrscheinlich sind. Aber wenn die W¨ urfel entsprechend pr¨apariert sind, sind die Wahrscheinlichkeiten eben nicht gleich. Im Grunde sind die a priori– Wahrscheinlichkeiten also Systemeigenschaften, die wir aus einer Analyse des speziellen Systems bestimmen m¨ ußten. Ja, es kommt noch schlimmer: Wie sollen wir u ¨berhaupt a priori–Wahrscheinlichkeiten von Mikrozust¨anden eines Systems definieren? Was sind die g¨ unstigen und die m¨oglichen F¨alle, deren Verh¨altnis durch pi angegeben ist? Welchen “Ereignisraum” sollen wir zu Grunde legen? Wir interessieren uns ja f¨ ur ein bestimmtes physikalisches System mit einem wohldefinierten Makrozustand. Der Mikrozustand ist nicht nur unbekannt, sondern ¨andert sich ungeheuer rasch. Beispiel: Ideales Gas im Volumen V Makrozustand
Mikrozustand
V
1
p,T
7
5 8
Wenige Zustandsgr¨oßen (p, T ) 75
10
2 3
(
4
9
6
3N Koordinaten xi (t) 3N Impulse pi (t)
µ
Der Mikrozustand beschreibt eine Bahn im Γ–Raum, die Ergode29 .
p
Γ
t0
x
x
t1
x t 2
x
K¨onnten wir beliebig schnell und beliebig exakt messen, so k¨onnten wir die verschiedenen Mikrozust¨ande — also die verschiedenen Punkte auf der Ergode an Fluktuationen unserer makroskopischen Parameter unterscheiden. Die Meßkurve f¨ ur die Druckkraft w¨ urde etwa so aussehen:
K/A p
t
K verschwindet, wenn gerade kein Molek¨ ul auf die Wand tritt und wird groß, wenn ein gerade besonders schnelles Molek¨ ul reflektiert wird. Im Mittel messen wir K = pA. Unsere Meßwerte, die makroskopische Gr¨oßen festlegen, sind also Zeit–Mittelwerte. Entsprechend w¨aren als pi die relativen Verweildauern auf geeignet gew¨ahlten Abschnitten der Ergode zu w¨ahlen. Dazu aber m¨ ußten wir die Ergode — die von den speziellen mikroskopischen Anfangsbedingungen abh¨angt — genau kennen, und gerade das k¨onnen und wollen wir nicht. Vielmehr verlangen wir von einer Messung reproduzierbare Ergebnisse: Eine Messung soll • heute, morgen, Weihnachten und Ostern sowie in • Bochum, San Francisco, Tokyo und Dortmund unter gleichen Voraussetzungen dasselbe Resultat liefern und eben nicht von den speziellen Anfangsbedingungen — die v¨ollig un¨ uberschaubar sind — abh¨angen. Wir erwarten und verlangen also eine Unabh¨angigkeit von der speziell herausgegriffenen Ergode (linke Skizze): 29
Kunstwort aus griech. εργoν (ergon) = Werk, Arbeit (f¨ ur Energie) und oδoς (hodos) = Weg.
76
p 1
Γ
3
Γ
p
2
x
x
Dieser Gedanke f¨ uhrt fast zwangsl¨aufig zu der Idee, den Zeitmittelwert durch den Mittelwert u ¨ber ein Ensemble vieler Punkte im Γ–Raum zu ersetzen und auch die pi auf das Ensemble zu beziehen (Skizze rechts). Diese Punkte im Γ–Raum repr¨asentieren also gedachte Kopien desselben (makroskopisch!) Systems (beispielsweise zu anderen Zeiten oder an anderen Orten). Damit geht die Statistik von dem Grundpostulat • Zeitmittel = Schar– (Ensemble–)Mittel aus, das eng mit der sogenannten Ergodenhypothese zusammenh¨angt.
5.2
Die Ergodenhypothese
Aus der unstrittigen Forderung nach Reproduzierbarkeit geht noch nicht hervor, wie ein geeignetes Ensemble (= Gesamtheit) zu w¨ahlen ist — oder: Welche Punkte des Γ–Raums “gleichwertige” Kopien des Ausgangssystems darstellen. Zur L¨osung dieser Frage formulierte Boltzmann 1887 die ber¨ uhmte • Ergodenhypothese: Die Ergode eines abgeschloßenen Systems (E = const) durchl¨auft jeden Punkt der Hyperfl¨ache H = E des Γ–Raums. Wenn diese Hypothese gilt, so folgt, daß alle Zust¨ande gleicher Energie als gleichwahrscheinlich anzusehen sind. Hierin liegt die eigentliche Begr¨ undung f¨ ur die Mi¨ krokanonische Gesamtheit (und wegen der Aquivalenz auch f¨ ur die anderen Gesamtheiten). Die Hypothese kann jedoch gar nicht streng gelten, denn die eindimensionale Bahn kann — so komplex und verschlungen sie auch sein mag — nicht die (6N − 1)– dimensionale Hyperfl¨ache H = E u ¨berdecken! Darum ersetzte sie Ehrenfest 1911 durch die • Quasi–Ergodenhypothese: Die Ergode eines abgeschlossenen Systems(E = const) kommt (fast) jedem Punkt der Hyperfl¨ache H = E des Γ–Raums beliebig nahe. 77
Diese schw¨achere Formulierung reicht zur Begr¨ undung des Grundpostulats Zeitmittel = Scharmittel f¨ ur die mikrokanonische Gesamtheit (und die ihr ¨aquivalenten Gesamtheiten), was man ja auch wegen der endlichen Meßgenauigkeit erwarten muß. Mit der Formulierung “fast” werden singul¨are F¨alle, die durch die kleinste St¨orung wieder in “herrlichste Unordnung” (Becker S. 97) u ucksichtigt. Aber ¨bergehen, ber¨ auch mit diesen Einschr¨ankungen ist die Hypothese nicht allgemein beweisbar. Und daß F¨alle, in denen die Hypothese de facto nicht erf¨ ullt ist, sogar eine praktische Bedeutung haben, zeigt uns die Existenz “metastabiler Gleichgewichte” (z. B. Knallgas H2 +O2 unterhalb der Z¨ undtemperatur).
5.3
Der Poincar´ esche Wiederkehreinwand
Wenn die Ergode eines abgeschlossenen Systems (fast) jedem Punkt beliebig nahe kommt, dann auch (fast) jedem Ausgangspunkt. Und wenn die Quasi–Ergoden– Hypothese nicht g¨ ultig ist, stimmt diese Aussage ebenfalls. Denn in jedem Fall ist die Ergode eines abgeschlossenen Systems auf ein endliches Phasenraumvolumen beschr¨ankt, das von einer Umgebung der Ergode u ¨berdeckt wird (formaler Beweis: Siehe Huang, Abschnitt 4.5). Ein physikalisches System wird also — wenn man nur lange genug wartet — seinem Ausgangszustand wieder beliebig nahe kommen: Die verbrannte Zigarette wird aus der Asche neu entstehen, die Scherben einer zerbrochenen Tasse werden sich wieder von selber zusammenf¨ ugen und die gemischten Gase werden sich wieder entmischen. Dieser Poincar´ esche Wiederkehreinwand, der offenbar aller Erfahrung widerspricht, war am Ende des neunzehnten Jahrhunderts eine schwere H¨ urde f¨ ur die Anerkennung der jungen statistischen Mechanik. Die Aufl¨osung dieses Widerspruchs liegt in der langen “Wiederkehrzeit”, die den Rahmen alles bekannten Geschehens sprengt. Nehmen wir an, wir w¨ahlen als Ausgangszustand ein ideales Gas von N ≈ 3 · 1022 Teilchen, das auf eine H¨alfte des Volumens V ≈ 1 l beschr¨ankt ist. (Bei t = 0 platzt beispielweise eine Membran.) Dann werden sich die Gasatome bald unabh¨angig voneinander im gesamten Volumen V aufhalten. Zu jedem sp¨ateren Zeitpunkt besteht also eine Wahrscheinlichkeit 22
w = 2−N = 23·10 ≈ 10−10
22
daß — wie im Anfangszustand — nur in der einen Volumenh¨alfte Teilchen anzutreffen sind. Nehmen wir an, daß die Zust¨ande eine typische Lebensdauer τ haben. Dann wird man eine Zeit τ 22 (187) T ≈ ≈ 1010 τ w auf den außergew¨ohnlichen Zustand warten m¨ ussen. Wir k¨onnen es uns schenken, die Lebensdauer τ abzusch¨atzen, denn es gilt ganz sicher 78
t0 < τ < t ∞ wobei t0 =
r0 c
=
10−15 m 3·108 m/s
≈ 3 · 10−24 s
die “Elementarzeit”, die Licht braucht, um einen Atomkern zu durchqueren, bezeichnet und t∞ ≈ 1010 a ≈ 3 · 1017 s das Alter der Welt bedeutet. Daraus folgt die grobe Absch¨atzung −23.5 < log
τ < 17.5 . s
Im Rahmen einer expliziten Rechnung k¨onnen wir also die Addition 1022 + log(τ /s) in Gl. (187) gar nicht ausf¨ uhren. Das heißt mit anderen Worten: T ist so ungeheuer groß, daß wir nicht einmal unterscheiden k¨onnen, ob wir in Elementarzeiten t0 oder in Weltaltern t∞ messen: Bei der unvorstellbaren Zahl der Dezimalstellen von T kommt es auf die 41 Zehnerpotenzen zwischen t0 und t∞ nicht mehr an. Unsere physikalische Erfahrung, die auf h¨ochstens Weltalter beschr¨ankt ist, wird mit diesem Ereignis also sicherlich nicht konfrontiert werden. Damit ist der Poincar´ esche Wiederkehreinwand ausger¨aumt. Auf der anderen Seite zeigen die langen Wartezeiten aber auch, wie irrelevant die Frage ist, ob die Ergode tats¨achlich (fast) jedem Punkt der Hyperfl¨ache H = E irgendwann nahekommt. Damit bricht die Begr¨ undung der mikrokanonischen Gesamtheit mit der Quasi–Ergodenhypothese schon wieder zusammen.
5.4
Irreversibilit¨ at und Zeitumkehr
Ludwig Boltzmann, der vielleicht bedeutendste Pionier einer atomistischen Theorie der W¨arme, stellte vor u ¨ber einem Jahrhundert eine “Transportgleichung” ∂f + C(f ) = S(f ) ∂t
(188)
auf, welche die zeitliche Ver¨anderung der Verteilungsfunktion f (r, v,t) eines Gases im µ–Raum durch einen “Konvektionsterm” C(f ) und einen “Stoßterm” S(f ) beschreibt. Diese “Boltzmanngleichung” ist seitdem die wichtigste Grundgleichung jeder kinetischen Theorie verd¨ unnter Systeme. Bez¨ uglich der Zeit ist die Boltzmanngleichung ist eine Differentialgleichung erster Ordnung. Da der Stoßstrom S (im Gegensatz zum Konvektionsterm C) sein Vorzeichen bei einer Zeitumkehr (v → −v) nicht ¨andert, ist Gl. (188) nicht zeitumkehrvariant. Im Gegenteil: Boltzmann selbst wies nach, daß aus Gl. (188)
79
dH ≥0 dt
(189)
folgt, wobei H das in Gl. (57) definierte Funktional bedeutet (Boltzmannsches H– Theorem). Das Gleichheitszeichen gilt genau dann, wenn f die Maxwellverteilung ist (also H seinen maximalen Wert annimmt, vgl. Abschnitt 3.3). So u ¨berzeugend Gl. (189) das zeitliche Anwachsen der Entropie und damit die Relaxation zum Gleichgewicht beschreibt, so wenig u undung aus der ¨berzeugte damals Boltzmanns Begr¨ Mechanik. Denn die Grundgleichungen der Mechanik sind ohne Zweifel zeitumkehrvariant. Tats¨achlich wird die Zeitumkehrvarianz in Boltzmanns halbempirischer Begr¨ undung durch ein ad hoc–Postulat aufgehoben: Zur Berechnung der Stoßwahrscheinlichkeit nimmt Boltzmann an, daß Teilchen vor einem Stoß unkorreliert sind. Entsprechende Annahmen einer korrelationsfreien Vergangenheit ben¨otigen auch andere “kinetische Gleichungen” (wie die Fokker–Planck–Gleichung). So einleuchtend diese Annahme der Intuition auch erscheinen m¨ogen: Wie sollen sie aus einer zeitumkehrvarianten Mechanik begr¨ undet werden? Das Dilemma des Zeitumkehreinwandes wird im Γ–Raum vielleicht noch deutlicher: Es l¨aßt sich n¨amlich zeigen, daß die Zahl W aller Mikrozust¨ande der mikrokanonischen Gesamtheit im wesentlichen mit dem eingeschlossenem Phasenraumvolumen Σ(U ) identisch ist30 . Wegen des Zusammenhangs [vgl. Gl. (70)] S = k ln Σ mit der Entropie erwarten wir thermodynamisch also ein zeitliches Anwachsen des Phasenraumvolumens. Aus der Mechanik folgt dagegen der fundamentale Satz von Liouville, der besagt, daß das Phasenraumvolumen immer konstant bleibt! Wie soll dann aber die Entropie je anwachsen k¨onnen? Und wie soll sich das kleine Phasenraumvolumen, das die Umgebung eines speziellen Ausgangpunktes im Γ– Raum (Mikrozustand) beschreibt, u ¨ ber die ganze mikrokanonische Gesamtheit ausbreiten k¨onnen? Beruht die Quasi–Ergoden–Hypothese von vornherein auf einem groben Fehler? Die L¨osung — oder ein Teil der L¨osung — liegt in dem chaotischen Verhalten der mechanischen Vielteilchensysteme. Nach dem Satz von Liouville bewegt sich das Phasenraumvolumen wie eine inkompressible Fl¨ ussigkeit, die stets dasselbe Volumen einnimmt. Der Satz behauptet aber nicht, daß benachbarte Fl¨ ussigkeitelemente auch benachbart bleiben. Vielmehr wird das Phasenraumvolumen durch die Dynamik des Systems wie Zuckerwatte in einen immer d¨ unneren Faden auseinandergezogen, der sich chaotisch — also in einer der deterministischen Analyse nicht mehr zug¨anglichen 30
Σ h¨ angt eng mit der Normierungskonstante Ω in Gl. (99) zusammen: Ω = ∂Σ/∂U .
80
Weise — u ur unsere ¨ ber die gesamte mikrokanonische Gesamtheit “verspinnt”. F¨ Unkenntnis des Systemzustandes ist aber das “effektive Phasenraumvolumen” — das Volumen der Watte, nicht das des Zuckers — entscheidend. Dieses Volumen, das mit der Informationsentropie verkn¨ upft ist, w¨achst mit der Zeit, ohne den Satz von Liouville zu verletzen. Die Zeit tritt hierbei als reiner Ordnungsparameter auf, der Zeitschritt ist einem Iterationsschritt im Rechner vergleichbar. Je nach sprachlicher Pr¨aferenz k¨onnen wir einen Ausgangszustand durch — genaue Kenntnis — geringe Entropie oder — hohe Ordnung charakterisieren. Aus der chaotischen Systemdynamik folgt dann, daß wir von Schritt zu Schritt — einen Kenntnisverlust — ein Anwachsen der Entropie oder — eine wachsende Unordnung beobachten, bis wir schließlich die totale Unordnung, das Gleichgewicht, erreicht haben. Und damit haben wir wieder erreicht, daß uns die zeitliche Zunahme der Entropie intuitiv einleuchtend erscheint. Es ist eben wahrscheinlicher, daß eine Vase zu Scherben wird, als daß Scherben zu einer Vase werden. Warum aber tritt in der uns bekannten Welt immer t und nie −t als Ordnungsparameter auf? Kein bekanntes Naturgesetz31 w¨ urde das verbieten! Gibt es neben unserer Welt eine Antiwelt (vielleicht aus Antimaterie), in der −t der Ordnungsparameter ist? Gibt es u ¨berhaupt mehrere 32 isolierte Welten, in denen zuf¨allig t oder −t als Ordnungsparameter dient? Oder ist die Auswahl von t f¨ ur unsere eine Welt eine (vielleicht zuf¨allige) “kosmologische Randbedingung”? Wir wissen es nicht.
31
Damit werten wir die Verletzung der Zeitsymmetrie bei der Konstruktion der retardierten Potentiale und bei der Reduktion des Zustandsvektors nicht als Naturgesetz. 32 Eine Wechselwirkung von Welt–Teilen mit entgegengesetzter Zeitrichtung w¨ urde zu chaotischen Konsequenzen f¨ uhren!
81
Literaturhinweise Bei der Ausarbeitung dieser Vorlesung habe ich insbesondere die folgenden B¨ ucher zu Rate gezogen: a) A. Sommerfeld: Vorlesungen u ¨ber Theoretische Physik, Bd. V (Thermodynamik und Statistik), VAG Leipzig, Teubner b) R. Becker: Theorie der W¨ arme, Springer c) K. Huang: Statistische Mechanik I und II, B I 68 und 69 d) G. Adam & O. Hittmair: W¨ armetheorie, Vieweg Diese Aufstellung der Quellen ist nicht als spezielle Empfehlung zu verstehen. Je nach pers¨onlichem Geschmack eignen sich alle u ucher der Thermody¨blichen Lehrb¨ namik und Statistik, einzelne Probleme nachzulesen oder zu vertiefen. Dabei gehen sie nat¨ urlich im Umfang wesentlich u ¨ ber den Inhalt dieser Vorlesung hinaus. Die Darstellungen von a) Sommerfeld und b) Becker (b) vermitteln ein tiefes Verst¨andnis des physikalischen Hintergrundes, sie eignen sich wegen der Gliederung und Schwerpunktsetzung aber weniger zur dierekten Begleitung der Vorlesung. Methodisch habe ich mich am ehesten an d) (Adam & Hittmair) orientiert. Das erste B¨andchen von Huang c) bietet eine gr¨ undliche Diskussion von Problemen, die mit der Irreversibilit¨at zusammenh¨angen (H–Theorem, Anfangschaos, Wiederkehreinwand etc.), kommt dabei aber zu einigen fraglichen Interpretationen. Daneben empfehle ich, zur Vertiefung des Verst¨andnisses einzelne Kapitel in den ber¨ uhmten Feynman Lectures Feynman/Leighton/Sands: Vorlesungen u ¨ber Physik, Bd. 1 und 2, R. Oldenbourg Verlag M¨ unchen nachzulesen. Dabei ist allerdings zu beachten, daß diese ausgezeichnete Darstellung der gesamten Physik stark von der u ¨blichen Gliederung in Teilgebiete abweicht.
82