Springer-Lehrbuch
Harald Ibach
Hans Lüth
Festkörperphysik EinfuÈhrung in die Grundlagen Siebte Auflage mit 277 Abbildungen, 18 Tafeln und 104 UÈbungen
12
Professor Dr. Harald Ibach Institut für Bio- und Nanosysteme Forschungszentrum Jülich GmbH, 52425 Jülich und Rheinisch-Westfälische Technische Hochschule 52062 Aachen, Deutschland E-mail:
[email protected] Professor Dr. Dr. h.c. Hans Lüth Institut für Bio- und Nanosysteme Forschungszentrum Jülich GmbH, 52425 Jülich und Rheinisch-Westfälische Technische Hochschule 52062 Aachen, Deutschland E-mail:
[email protected]
ISBN 978-3-540-85794-5 DOI 10.1007/978-3-540-85795-2
e-ISBN 978-3-540-85795-2
Springer-Lehrbuch ISSN 0937-7433 Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag Berlin Heidelberg 1981, 1988, 1990, 1995, 1999, 2002, 2009 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Satz: K + V Fotosatz GmbH, Beerfelden Einbandgestaltung: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier 987654321 springer.com
Vorwort zur siebten Auflage
Mit der sechsten Auflage hat sich unsere „Festkörperphysik“ weiter als Standardwerk weltweit etabliert. Dies zeigt sich u. a. daran, dass neben den Übersetzungen ins Englische, Japanische und Polnische nun auch eine koreanische Fassung vorliegt. Es war deshalb wiederum an der Zeit, das Buch an neue Entwicklungen in Forschung und Lehre anzupassen. Wir haben uns dabei vor allem durch die Tatsache leiten lassen, dass immer weitere Bereiche der Festkörperforschung und ihrer Anwendungen durch Nanostrukturen und nanostrukturierte Materialien bestimmt werden. Ein treibendes Moment hierbei ist vor allem die Entwicklung der Mikroelektronik hin zu einer Nanoelektronik, in der charakteristische Bauelementstrukturen in den 10 nm-Bereich hinunterskaliert werden. Auf dieser Größenskala treten vermehrt dimensionsbedingte Quanteneffekte auf. Die Nanoelektronik wird so zur Quantenelektronik. Dementsprechend haben wir neben einer neuen Tafel über Verfahren zur Nanostrukturierung einen Abschnitt über Quantentransport in Nanostrukturen aufgenommen. Hier werden die wichtigsten Quanteneffekte beschrieben, die uns beim elektronischen Transport in nanoskalierten Festkörpern begegnen. Mit immer kleineren Dimensionen wächst die Bedeutung von Grenzflächen. Dies wird besonders augenfällig bei den magnetischen Eigenschaften von Dünnschichtsystemen mit ihrem Wechselspiel verschiedener magnetischer Anisotropien. Einen besonderen Akzent setzt der von Albert Fert und Peter Grünberg (Nobelpreis 2007) entdeckte Riesenmagnetowiderstand. Ihm und dem Magnetismus in Dünnschichtsystemen ist eine neue Tafel gewidmet. Zum Verständnis dieser neuen Entwicklungen war auch die Einfügung eines Abschnitts über magnetokristalline Anisotropie erforderlich. Um das Buch nicht zu umfangreich werden zu lassen, haben wir eine Tafel über Oberflächenmagnetismus entfallen lassen. Die Tafel über magnetostatische Spinwellen haben wir hingegen belassen, einerseits wegen ihres pädagogischen Wertes und andererseits, weil Peter Grünberg in seinem Nobelvortrag darauf hingewiesen hat, wie sehr ihm seinerzeit die Herausstellung seines Experimentes in einem Lehrbuch Ermutigung war. Natürlich wurden auch Inkonsistenzen und Druckfehler beseitigt, auf die uns Kollegen und Studenten dankenswerterweise aufmerksam gemacht haben. Jülich und Aachen, im Oktober 2008
H. Ibach · H. Lüth
Vorwort zur fünften und sechsten Auflage
Nachdem die „Einführung in die Festkörperphysik“ mittlerweile auch in den Sprachen Englisch, Japanisch und Polnisch als Lehrbuch an vielen Universitäten benutzt wird, war es an der Zeit, den Text einmal gründlich zu überarbeiten und durch neue Abschnitte an zeitnahe Forschungsthemen anzupassen. Hierbei haben wir uns von dem Gedanken leiten lassen, dass in der festkörperphysikalischen Ausbildung die Bezüge zur Materialwissenschaft und zur Anwendung in den letzten Jahren stärker betont werden. Dementsprechend betonen wir in der neuen Auflage die Abweichungen vom periodischen Festkörper stärker: So werden jetzt z. B. Phasendiagramme von Legierungen, Grundzüge der Defektphysik und verschiedene Aspekte amorpher Festkörper behandelt. Wegen der hohen Bedeutung mechanisch verspannter Systeme für Bauelemente ist eine Ausbildung in den Grundlagen der Elastizitätstheorie (wieder) notwendig geworden, der wir deshalb einen Abschnitt gewidmet haben. Der neue Abschnitt über das Anregungsspektrum des Supraleiters soll den Leser an die moderne Forschung auf dem Gebiet der Supraleiter/Normalleitergrenzflächen und an Anwendungen im Bereich der Supraleiterelektronik heranführen. Ähnliches gilt für die Ergänzung über Metall/Halbleiter-Schottky-Kontakte und für den neuen Abschnitt über wichtige Halbleiterbauelemente. Hier werden Grundlagen erarbeitet, welche die Verständnislücke zwischen klassischer Festkörperphysik und moderner Mikroelektronik, einem der wichtigsten Anwendungsfelder der Festkörperphysik, schließen sollen. Bei allen Ergänzungen haben wir versucht, dem bisherigen Geist des Werkes treu zu bleiben, und wir haben deshalb die Phänomene in den allgemeinen Zusammenhang eines atomistisch begründeten festkörperphysikalischen Verständnisses gebracht. Die sechste Auflage ist gegenüber der fünften nur wenig verändert. Neben Druckfehlerkorrekturen wurde die Darstellung in den Kapiteln 3, 9 und 10 in einigen Punkten neu gestaltet. Für zahlreiche Anregungen bedanken wir uns bei Dipl.-Phys. Klaus Dahmen, Dr. Arno Förster, Dr. Margret Giesen, Dr. Michel Marso, Dr. Angela Rizzi und Dr. Thomas Schäpers. Dank gilt auch den Herren Dr. H. J. Kölsch und C.-D. Bachem vom Springer-Verlag für die sehr effiziente und erfreuliche Zusammenarbeit. Jülich, im Juli 1999 und Oktober 2001
H. Ibach · H. Lüth
Vorwort zur vierten Auflage
Die vorliegende Einführung in die Festkörperphysik hat sich an vielen deutschsprachigen Universitäten und mittlerweile in der englischsprachigen Ausgabe auch an amerikanischen Hochschulen mit Erfolg als Lehrbuch durchgesetzt. Die englische Ausgabe enthielt zum ersten Mal Übungsaufgaben zu den einzelnen Kapiteln, was sich als überaus nützlich für den Gebrauch des Buches im Rahmen der Vorlesung erwies. Für die vorliegende 4. deutsche Auflage haben wir die Übungsaufgaben überarbeitet. Sie sollen den Stoff vertiefen; in einzelnen Fällen führen sie aber auch über den Stoff des Buches hinaus, um zu weiteren Studien anzuregen. Neben Fehlerkorrekturen und kleineren Verbesserungen der Darstellung wurden im Vergleich zur dritten Auflage einige Kapitel überarbeitet oder ergänzt. So wurde Tafel V über Photoemissionsspektroskopie durch eine Darstellung der winkelaufgelösten Photoemission (ARUPS) und deren Bedeutung für die Untersuchung elektronischer Bandstrukturen ergänzt. Abschnitt 10.10 über „Hochtemperatur“-Supraleiter wurde neu geschrieben, weil dieser hochaktuelle Forschungszweig sich rasch weiterentwickelt und seit der Herausgabe der dritten Auflage des Lehrbuches wesentliche neue wissenschaftliche Ergebnisse vorliegen, die manches in einem anderen Licht erscheinen lassen. Für die Neufassung des Abschnittes 10.10 waren uns Diskussionen mit Fachkollegen, die in der Supraleitungsforschung selbst arbeiten, hilfreich. Besonders danken wir Prof. C. Calandra von der Universität Modena und Dr. R. Wördenweber aus dem Institut für Schicht- und Ionentechnik des Forschungszentrums Jülich. An der Überarbeitung der Übungsaufgaben waren die Herren Dr. W. Daum, Dr. A. Förster, A. Leuther und Ch. Ohler beteiligt. Ihnen sei an dieser Stelle gedankt. Wir danken Frau Dr. Margret Giesen für die kritische Durchsicht des Manuskripts und zahlreiche Verbesserungsvorschläge. Jülich und Aachen, Juli 1995
H. Ibach · H. Lüth
Vorwort zur zweiten Auflage
Die erste Auflage unseres Lehrbuches hat bei Fachkollegen und Studenten eine überaus positive Resonanz gefunden. Insbesondere wurde die gleichrangige Behandlung theoretischer und experimenteller Aspekte der Festkörperphysik sowie die neuartige Darstellung wichtiger Experimente und aktueller Forschungsgebiete in der Form von Experimenttafeln gelobt. Neben spezifischer Kritik wurde vor allem der Wunsch nach Vervollständigung geäußert und das Fehlen der wichtigen Gebiete des Magnetismus und der Supraleitung bemängelt. Letztere Kritik wog um so schwerer, als es sich bei diesen beiden Gebieten um besonders aktuelle und wichtige Forschungsgebiete in der gegenwärtigen Festkörperphysik handelt. Die zweite Auflage wurde deshalb durch je ein Kapitel über Magnetismus und Supraleitung ergänzt. Wir haben uns bemüht, einfache Grundmodelle für die Vielteilchenwechselwirkung vorzustellen und zu diskutieren. Im Kapitel über Magnetismus wird die magnetische Kopplung sowohl lokalisierter Elektronen als auch delokalisierter Elektronen besprochen, und der Leser wird bis an moderne Dünnschichtexperimente herangeführt. In der Supraleitung wird vor allem die klassische Supraleitung im Rahmen einer einfachen Darstellung der BCS-Theorie behandelt. Den neuen Hochtemperatur-Supraleitern wird ebenfalls ein Abschnitt gewidmet. Allerdings ist die Entwicklung hier noch so im Fluss, dass wir uns auf eine Darlegung experimenteller Ergebnisse und einiger Grundgedanken beschränken mussten. Selbst hierbei ist zu erwarten, dass bis zur Veröffentlichung des Buches neue wichtige Resultate aus Experiment und Theorie vorliegen, auf die noch nicht eingegangen werden konnte. Das Kapitel über Halbleiter wurde gegenüber der ersten Auflage wesentlich erweitert und vor allem durch die Themen Halbleiter-Heterostrukturen, Übergitter, Epitaxie und Quanten-HallEffekt ergänzt. Durch die umfangreichen Erweiterungen hat sich der Charakter des Buches dahingehend geändert, dass Gebiete aktueller Forschung eine deutlich stärkere Betonung erfahren haben. Darüber hinaus haben wir die Gelegenheit benutzt, Druckfehler und Unschönheiten der ersten Auflage zu beseitigen. Für die vielen Anregungen von Kollegen, die wir hierzu in den vergangenen Jahren erhielten, bedanken wir uns herzlich. Dank gilt insbesondere den Kollegen A. Stahl und W. Zinn, die durch einige Ratschläge und Bereitstellung von experimentellem Material zu den beiden neuen Kapiteln Supraleitung und Magnetismus beigetragen haben. Für
Vorwort zur zweiten Auflage
IX
die kritische Durchsicht von Teilen des Manuskriptes und der Druckfahnen bedanken wir uns bei Frau Dr. Angela Rizzi und den Herren W. Daum, Ch. Stuhlmann und M. Wuttig. Die Zeichnungen haben Frau U. Marx-Birmans und Herr H. Mattke mit dankenswerter Geduld angefertigt. Das Manuskript schrieben die Sekretärinnen Frau D. Krüger, M. Jürss-Nysten und G. Offermann. Den Herren Dr. H. Lotsch und C.-D. Bachem vom Springer-Verlag danken wir für die erfreuliche Zusammenarbeit. Jülich, im September 1988
H. Ibach · H. Lüth
Vorwort zur ersten Auflage
Ein neues Buch neben vielen vorhandenen, ausgezeichneten Lehrbüchern bedarf wohl der Rechtfertigung. Wir meinen, sie ist in der Entwicklung der Festkörperphysik als Wissensgebiet und Unterrichtsfach begründet. Die Festkörperphysik hat sich in den letzten Jahrzehnten zu einer eigenständigen Disziplin innerhalb der Physik entwickelt und ein nicht unerheblicher Teil der aktuellen physikalischen Forschung ist auf sie konzentriert. Gleichzeitig hat sich die Festkörperphysik ausgedehnt auf Bereiche, die vormals den Ingenieurwissenschaften, der Chemie oder empirischen Wissensgebieten vorbehalten waren. Als Folge dieser Entwicklung vermag heute weder der einzelne Dozent das Gesamtgebiet zu überschauen und in seiner Entwicklung zu verfolgen, noch ist die Festkörperphysik als solche dem Studenten vermittelbar. Wir haben geglaubt, dass in dieser Situation ein Lehrbuch, welches sich radikal auf wesentliche Elemente der Festkörperphysik beschränkt, nützlich sein könnte. Aufbauend auf dieser Grundlage können dann Spezialvorlesungen angeboten werden, die sich an den jeweiligen Forschungsschwerpunkten der einzelnen Hochschulen ausrichten. Ein weiterer Gesichtspunkt für die Gestaltung dieses Buches war die Beobachtung, dass Festkörperphysik aus technischen Gründen kaum als klassische ExperimentalphysikVorlesung mit Demonstrationsexperimenten gelesen werden kann. Aus diesem Grunde und wegen der Eigentümlichkeit der Festkörperphysik, eine starke Verbindung von Theorie und Experiment herzustellen, ist eine strenge Trennung zwischen experimenteller und theoretischer Festkörperphysik unseres Erachtens nicht zweckmäßig. Das vorliegende Buch basiert auf dem Stoff einer Vorlesung, die ein Semester vierstündig bzw. zwei Semester zweistündig gehalten wurde. Im Zentrum der Darstellung steht der periodische Festkörper in der Einteilchen-Näherung. Von daher ist es verständlich, dass so wichtige Gebiete wie z. B. die Supraleitung nicht behandelt werden konnten. Das Buch versucht zwischen Experimentalphysik und theoretischer Physik eine Mittellinie einzuhalten. Dort wo theoretische Betrachtungen ohne allzu großen Aufwand möglich und hilfreich sind, haben wir uns nicht gescheut, stärkere Anforderungen an das Abstraktionsvermögen zu stellen. Wir haben ferner versucht, Begriffsbildungen, Modelle und Bezeichnungen, deren Kenntnis für das Verständnis gegenwärtiger Originalliteratur der theoretischen Festkörperphysik unumgänglich ist, mit in dieses Buch aufzunehmen. Wir haben uns andererseits bemüht, dort wo ein klassisches Bild möglich und vertretbar ist, in diesem Bilde zu arbeiten.
Vorwort zur ersten Auflage
XI
In der Reihenfolge der Darstellung folgt das Buch dem Schema: chemische Bindung, Struktur, Gittereigenschaften, elektronische Eigenschaften. Wir glauben, dass diese Reihenfolge aus didaktischen Gründen zweckmäßig ist, weil sie es ermöglicht, besonders schwierige festkörperphysikalische Begriffsbildungen zu einem späteren Zeitpunkt einzuführen, wenn wichtige Fundamente bereits an einfacheren Modellen bzw. Beispielen erarbeitet worden sind. Die verhältnismäßig straffe und auf das Wesentliche konzentrierte Darstellung wird ergänzt durch Experimenttafeln, in denen jeweils einige ausgewählte Experimente der Festkörperphysik dargestellt sind. Hier hat der Leser Gelegenheit, sein bisher erarbeitetes Wissen zu überprüfen bzw. Anregungen für sein weiteres Selbststudium zu empfangen. Die Auswahl des Stoffes in den Kapiteln und in den Experimenttafeln erfolgte in dem Bemühen der Konzentration und andererseits im Hinblick darauf, das zu erfassen, was didaktisch gut darstellbar und zu verstehen ist. Dass Auswahl und Auswahlkriterien nicht frei von subjektiven Einflüssen sind und andere Autoren die Akzente anders gesetzt hätten, ist wohl unvermeidbar. Das Buch wäre nicht entstanden ohne Unterstützung durch Kollegen und Mitarbeiter. Auch ist viel Gedankengut unserer akademischen Lehrer G. Heiland und G. Leibfried eingeflossen. Für die Experimenttafeln haben insbesondere die Kollegen U. Bonse, G. Comsa, W. Hartmann, B. Lengeler, H. Raether, W. Richter, W. Sander, H. H. Stiller Bild- und Literaturmaterial ausgewählt und zur Verfügung gestellt. Für die kritische Durchsicht einzelner Abschnitte danken wir den Kollegen G. Comsa und W. Sander sowie Herrn R. Matz. Weiterer Dank gilt Frau M. Mattern für ihre intensive Mitarbeit bei der Korrektur der letzten Manuskriptfassung. Das Manuskript haben die Sekretärinnen Frau H. Dohmen, I. Kratzenberg, D. Krüger und G. Offermann geschrieben. Besonderer Dank gilt Frau U. Marx, die alle Zeichnungen anfertigte und unseren vielfältigen Änderungswünschen große Geduld entgegenbrachte. Dem Springer-Verlag, insbesondere den Herren Dr. H. Lotsch und R. Michels, danken wir für die ausgezeichnete Zusammenarbeit. Jülich, Aachen im November 1980
H. Ibach · H. Lüth
Inhaltsverzeichnis
1. Die chemische Bindung in Festkörpern . . . . . . . . . . . 1.1 Das Periodensystem . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Kovalente Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Die Ionenbindung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Metallische Bindung . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Die Wasserstoffbrückenbindung . . . . . . . . . . . . . . . . . . . 1.6 Die Van der Waals-Bindung . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 1 4 9 13 14 15 17
2. Die Struktur von Festkörpern . . . . . . . . . . . . . . . . . . . 2.1 Translationsgitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Punktsymmetrien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Die 32 Kristallklassen (Punktgruppen) . . . . . . . . . . . . . 2.4 Die Bedeutung der Symmetrie . . . . . . . . . . . . . . . . . . . 2.5 Einfache Kristallstrukturen . . . . . . . . . . . . . . . . . . . . . . 2.6 Phasendiagramme von Legierungen . . . . . . . . . . . . . . . . 2.7 Defekte in Festkörpern . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21 22 25 27 28 31 36 46 49
3. Die Beugung an periodischen Strukturen . . . . . . . . . 3.1 Die allgemeine Beugungstheorie . . . . . . . . . . . . . . . . . . 3.2 Periodische Strukturen und reziprokes Gitter . . . . . . . . . 3.3 Die Streubedingung bei periodischen Strukturen . . . . . . 3.4 Die Braggsche Deutung der Beugungsbedingung . . . . . 3.5 Die Brillouinschen Zonen . . . . . . . . . . . . . . . . . . . . . . . 3.6 Der Strukturfaktor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 Methoden der Strukturanalyse . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel I: Beugungsexperimente mit verschiedenen Teilchen . . . Tafel II: Röntgeninterferometer und Röntgentopographie . . . .
51 51 57 58 60 63 64 67 70 72 77
4. 4.1 4.2 4.3 4.4
81 82 83 85
Dynamik von Atomen in Kristallen . . . . . . . . . . . . . . Das Potential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Die Bewegungsgleichungen . . . . . . . . . . . . . . . . . . . . . . Die lineare zweiatomige Kette . . . . . . . . . . . . . . . . . . . Streuung an zeitlich veränderlichen Strukturen – Phononenspektroskopie . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Elastisches Verhalten von Kristallen . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel III: Raman-Spektroskopie . . . . . . . . . . . . . . . . . . . . . . .
89 92 103 105
XIV
Inhaltsverzeichnis
5. Thermische Eigenschaften . . . . . . . . . . . . . . . . . . . . . 5.1 Die Zustandsdichte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Thermische Energie eines harmonischen Oszillators . . . 5.3 Spezifische Wärme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 Anharmonische Effekte . . . . . . . . . . . . . . . . . . . . . . . . 5.5 Thermische Ausdehnung . . . . . . . . . . . . . . . . . . . . . . . 5.6 Wärmeleitung durch Phononen . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel IV: Experimente bei tiefen Temperaturen . . . . . . . . . . .
111 112 115 116 119 120 123 129 130
6. 6.1 6.2 6.3 6.4 6.5
135 136 140 142 145
„Freie“ Elektronen im Festkörper . . . . . . . . . . . . . . . Das freie Elektronengas im Potentialkasten . . . . . . . . . Das Fermi-Gas bei T = 0 K . . . . . . . . . . . . . . . . . . . . . . Fermi-Statistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Spezifische Wärme der Metallelektronen . . . . . . . . . . . Elektrostatische Abschirmung in einem Fermi-Gas – Mott-Übergang . . . . . . . . . . . . . 6.6 Glühemission aus Metallen . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
149 152 156
7. Elektronische Bänder in Festkörpern . . . . . . . . . . . . 7.1 Allgemeine Symmetrieeigenschaften . . . . . . . . . . . . . . 7.2 Näherung des quasifreien Elektrons . . . . . . . . . . . . . . . 7.3 Näherung vom „stark gebundenen“ Elektron her . . . . . 7.4 Beispiele von Bandstrukturen . . . . . . . . . . . . . . . . . . . . 7.5 Zustandsdichten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6 Zustandsdichte nichtkristalliner Festkörper . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel V: Photoemissionsspektroskopie . . . . . . . . . . . . . . . . . .
159 160 163 168 173 177 179 183 185
8. 8.1 8.2 8.3 8.4 8.5
189 190 195 198 200
Magnetismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dia- und Paramagnetismus . . . . . . . . . . . . . . . . . . . . . . Austauschwechselwirkung . . . . . . . . . . . . . . . . . . . . . . Austauschwechselwirkung zwischen freien Elektronen . Das Bandmodell für den Ferromagnetismus . . . . . . . . . Das Temperaturverhalten eines Ferromagneten im Bandmodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.6 Ferromagnetische Kopplung bei lokalisierten Elektronen 8.7 Antiferromagnetismus . . . . . . . . . . . . . . . . . . . . . . . . . 8.8 Spinwellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.9 Kristallanisotropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel VI: Magnetostatische Spinwellen . . . . . . . . . . . . . . . . . Tafel VII: Magnetismus in Schichtsystemen und GMR-Effekt 9. 9.1
204 208 210 214 218 225 226 230
Bewegung von Ladungsträgern und Transportphänomene . . . . . . . . . . . . . . . . . . . . . 235 Bewegung von Ladungsträgern in Bändern – die effektive Masse . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
Inhaltsverzeichnis
XV
9.2 Ströme in Bändern und Defektelektronen . . . . . . . . . . . 9.3 Streuung von Elektronen in Bändern . . . . . . . . . . . . . . . 9.4 Boltzmann-Gleichung und Relaxationszeit . . . . . . . . . . 9.5 Die elektrische Leitfähigkeit von Metallen . . . . . . . . . . 9.6 Thermoelektrische Effekte . . . . . . . . . . . . . . . . . . . . . . . 9.7 Das Wiedemann-Franz-Gesetz . . . . . . . . . . . . . . . . . . . . 9.8 Elektrische Leitfähigkeit durch lokalisierte Elektronen . 9.9 Quantentransport in Nanostrukturen . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel VIII: Quantenoszillationen und die Topologie von Fermi-Flächen . . . . . . . . . . . . . . . . . . . . . . . .
239 241 245 250 256 260 261 264 280
10. Supraleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1 Einige Grundphänomene der Supraleitung . . . . . . . . . . . 10.2 Phänomenologische Beschreibung durch London-Gleichungen . . . . . . . . . . . . . . . . . . . . . . 10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare . . . . . . 10.4 Der BCS-Grundzustand . . . . . . . . . . . . . . . . . . . . . . . . . 10.5 Das Anregungsspektrum des Supraleiters . . . . . . . . . . . 10.6 Konsequenzen der BCS-Theorie und Vergleich mit experimentellen Befunden . . . . . . . . . . . . . . . . . . . . 10.7 Suprastrom und kritischer Strom . . . . . . . . . . . . . . . . . . 10.8 Kohärenz des BCS-Grundzustandes und Meissner-Ochsenfeld-Effekt . . . . . . . . . . . . . . . . . . 10.9 Quantisierung des magnetischen Flusses . . . . . . . . . . . . 10.10 Supraleiter 2. Art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.11 Neuartige „Hochtemperatur“-Supraleiter . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel IX: Einelektronen-Tunneln an Supraleitern . . . . . . . . . . Tafel X: Cooper-Paar-Tunneln – Josephson-Effekte . . . . . . . .
287 287
322 327 331 338 347 349 356
11. Dielektrische Eigenschaften der Materie . . . . . . . . . . 11.1 Die dielektrische Funktion . . . . . . . . . . . . . . . . . . . . . . 11.2 Absorption elektromagnetischer Strahlung . . . . . . . . . . . 11.3 Die dielektrische Funktion für harmonische Oszillatoren 11.4 Longitudinale und transversale Eigenschwingungen . . . 11.5 Oberflächenwellen eines Dielektrikums . . . . . . . . . . . . . 11.6 Das Reflexionsvermögen des dielektrischen Halbraums . 11.7 Das lokale Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.8 Polarisationskatastrophe und Ferroelektrika . . . . . . . . . . 11.9 Das freie Elektronengas . . . . . . . . . . . . . . . . . . . . . . . . 11.10 Interband-Übergänge . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.11 Exzitonen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.12 Dielektrische Energieverluste von Elektronen . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel XI: Spektroskopie mit Photonen und Elektronen . . . . . . Tafel XII: Infrarot-Spektroskopie . . . . . . . . . . . . . . . . . . . . . . Tafel XIII: Die Methode der frustrierten Totalreflexion . . . . .
361 361 364 367 370 372 374 375 378 379 382 389 390 394 397 399 401
282
292 295 300 309 314 318
XVI
Inhaltsverzeichnis
12. 12.1 12.2 12.3 12.4 12.5 12.6
Halbleiter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Daten einiger wichtiger Halbleiter . . . . . . . . . . . . . . . . Ladungsträgerdichte im intrinsischen Halbleiter . . . . . . Dotierung von Halbleitern . . . . . . . . . . . . . . . . . . . . . . Ladungsträgerdichte in dotierten Halbleitern . . . . . . . . Leitfähigkeit von Halbleitern . . . . . . . . . . . . . . . . . . . . Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt . . . . . . . . . 12.7 Halbleiterheterostrukturen und Übergitter . . . . . . . . . . . 12.8 Wichtige Halbleiterbauelemente . . . . . . . . . . . . . . . . . . Übungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel XIV: Hall-Effekt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tafel XV: Zyklotron-Resonanz bei Halbleitern . . . . . . . . . . . Tafel XVI: Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt . . . . . . . . . . . . . . . . . . . Tafel XVII: Halbleiterepitaxie . . . . . . . . . . . . . . . . . . . . . . . . Tafel XVIII: Präparation von Nanostrukturen . . . . . . . . . . . .
403 404 408 412 416 421 427 443 456 471 473 475 477 483 488
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 493 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505 Periodensystem der Elemente (Vordere Einbandrückseite) Konstanten und Äquivalentwerte (Hintere Einbandrückseite)
1. Die chemische Bindung in Festkörpern
Festkörperphysik ist die Physik des festen Aggregatzustandes einer großen Zahl chemisch gebundener Atome. Die Betonung liegt dabei auf der großen Zahl der beteiligten Atome. Typische Volumen von „Festkörpern“ liegen im Bereich von cm3. Die Zahl beteiligter Atome ist deshalb von der Größenordnung 1023. Es erscheint hoffnungslos, mit einer solchen Zahl von Atomen auf das quantitative Verständnis ausgerichtete Wissenschaft betreiben zu wollen. Jedoch gerade die große Zahl beteiligter Atome ermöglicht in vielen Fällen die quantitative Beschreibung durch neue, festkörpertypische Modelle. Voraussetzung ist allerdings, dass sich die beteiligten Atome nicht willkürlich aus dem gesamten Periodensystem rekrutieren, sondern dass der Festkörper sich aus einer begrenzten Anzahl von Elementen in bestimmter Ordnung aufbaut. Schaustücke der Festkörperphysik in diesem Sinne sind die Elementkristalle, d. h. dreidimensional periodische Anordnungen von Atomen einer Sorte, oder auch die Verbindungen von zwei Elementen. Wenn wir also den Festkörper mit seinen besonderen Eigenschaften verstehen wollen, müssen wir uns ein Basisverständnis zunächst im Hinblick auf zwei Fragestellungen verschaffen: Die erste ist die Frage nach den Kräften, die die Atome im Festkörper zusammenhalten, also die Frage nach der chemischen Bindung. Die zweite ist die Frage nach der strukturellen Ordnung. Die Erarbeitung dieses Basiswissens ist der Gegenstand der ersten beiden Kapitel. Beide Kapitel können dazu nur eine kurze Einführung geben. Für genauere Darstellungen sei auf Lehrbücher der Quantenchemie und Kristallographie verwiesen.
1.1 Das Periodensystem Zur Einführung in das Verständnis der chemischen Bindung wollen wir uns kurz noch einmal den Aufbau des Periodensystems der Elemente vor Augen führen. Die Elektronenterme eines Atoms werden klassifiziert nach den Einelektronenzuständen des radial-symmetrischen Potentials. Es gibt demnach 1 s, 2 s, 2 p, 3 s, 3 p, 3 d, 4 s, 4 p, 4 d, 4 f . . . Zustände, wobei die Zahl der Hauptquantenzahl n und die Buchstaben s, p, d, f den Werten der Bahndrehimpulsquantenzahl entsprechen (l = 0, 1, 2, 3 . . .). Dieser Klassifizierung entspricht die Vorstellung,
2
1 Die chemische Bindung in Festkörpern
Tabelle 1.1. Aufbau des Periodensystems durch Füllung der Schalen mit Elektronen. Zu den Elementen sind jeweils die äußeren Elektronenniveaus angegeben, die gerade aufgefüllt werden. Die maximale Besetzung der Niveaus ist in Klammern angegeben 1s 2s 2p 3s 3p
(2) (2) (6) (2) (6)
H, He Li, Be B ? Ne Na, Mg Al ? Ar
4s 3d 4p 5s 4d
(2) (10) (6) (2) (10)
K, Ca Übergangsmetalle Sc ? Zn Ga ? Kr Rb, Sr Übergangsmetalle Y ? Cd
5p 6s 4f 5d 6p
(6) (2) (14) (10) (6)
In ? Xe Cs, Ba Seltene Erden Ce ? Lu Übergangsmetalle La ? Hg Tl ? Rn
dass für ein jeweils betrachtetes Elektron die Wirkung der übrigen Elektronen durch eine kontinuierliche, feste Ladungsverteilung mit abschirmender Wirkung auf das Kernpotential beschrieben werden kann. Zusätzlich zur Hauptquantenzahl n und zur Bahndrehimpulsquantenzahl l gibt es noch die magnetische Quantenzahl m, die (2 l+1) Werte annehmen kann. Nach dem Pauli-Prinzip ist jeder Elektronenzustand mit zwei Elektronen entgegengesetzten Spins besetzbar. Dadurch ergibt sich mit steigender Kernladungszahl der in Tabelle 1.1 dargestellte Aufbau des Periodensystems. Wie wir aus der Tabelle entnehmen, werden nach den 3 p-Zuständen nicht, wie man nach den Energieniveaus des Wasserstoffatoms annehmen könnte, die 3 d-Zustände aufgefüllt, sondern zunächst die 4 s-Zustände. Mit der nachfolgenden Auffüllung der 3 d-Zustände entsteht die erste Serie der Übergangsmetalle (3 d-Metalle). Entsprechend gibt es 4 dund 5 d-Übergangsmetalle. Der gleiche Effekt bei den f-Zuständen führt zu den sogenannten seltenen Erden. Der Grund für diese Anomalie liegt darin, dass s-Zustände eine nichtverschwindende Aufenthaltswahrscheinlichkeit am Ort des Kernes haben, wodurch sich die abschirmende Wirkung der übrigen Elektronen weniger bemerkbar macht und deshalb die Energie der s-Terme niedriger liegt. Bringt man in einem Gedankenexperiment mehrere Atome allmählich näher zusammen, so entsteht durch die Wechselwirkung der Atome untereinander eine Aufspaltung der Terme. Ist eine große Zahl von Atomen beteiligt wie im festen Körper, so liegen die Elektronenterme auf der Energieskala quasikontinuierlich verteilt, und man spricht deshalb von Bändern (Abb. 1.1). Die Größe der Aufspaltung hängt vom Überlapp der betreffenden Wellenfunktionen ab. Sie ist also klein für tiefliegende Energieniveaus, die ihren Schalencharakter auch im festen Körper behalten. Bei den höchsten noch besetzten Elektronentermen ist dagegen die Aufspaltung so groß, dass s- und p- und ggf. auch d-Zustände ein gemeinsames Band bilden. Die Elektronen in diesem Band sind für die chemische Bindung verantwortlich, weshalb man auch vom Valenzband spricht. Ursache für die Bindung ist letztlich die durch die Aufspaltung ermöglichte Absenkung der Elektronenenergie, welche trotz erhöhter Repulsion der Kerne (bis zum Gleichgewichtsabstand) zu einer Verminderung der Gesamtenergie führt. Von wesentlicher Bedeutung für die Art der Bindung ist es, ob im Gleichgewichtsabstand der Überlapp von Wellenfunktionen im wesentlichen nur zwischen benachbarten Atomen stattfindet oder
1.1 Das Periodensystem
3
Abb. 1.1. Aufspaltung der Energieniveaus bei Annäherung einer großen Zahl gleicher Atome der ersten Reihe des Periodensystems aneinander (schematisch). Der Abstand r0 soll etwa den Gleichgewichtsabstand in einer chemischen Bindung charakterisieren. Durch die Überlappung der 2 s- und 2 p-Bänder wird auch das Element Be mit zwei sElektronen zum Metall. Tiefliegende Atomniveaus spalten wenig auf und behalten deshalb weitgehend ihren atomaren Charakter
ob die Ausdehnung der Wellenfunktionen so groß ist, dass zugleich viele Atome mit erfaßt werden. Im ersten Fall sind für die Stärke des Überlapps und damit für die Bindungsstärke nicht nur die Abstände der Atome voneinander, sondern auch die Bindungswinkel von Bedeutung. Man spricht in diesem Sinne von gerichteter Bindung. Sie wird auch als kovalente Bindung bezeichnet. Die kovalente Bindung wird zwar in ihrer reinsten Form zwischen einigen Elementen gleicher „Valenz“, d. h. gleicher Elektronenkonfiguration realisiert, doch ist gleiche Elektronenkonfiguration weder notwendige noch hinreichende Voraussetzung für kovalente Bindung. Wichtig ist lediglich die relative Ausdehnung der Wellenfunktionen im Vergleich zum interatomaren Abstand. Ist die Ausdehnung der Wellenfunktion groß im Vergleich zum Abstand zwischen nächsten Nachbarn, so spielt die Position der nächsten Nachbarn eine geringere Rolle bei der Erzielung eines möglichst großen Überlapps mit vielen Atomen. Die Packungsdichte ist dann also wichtiger als die relative Lage der nächsten Nachbarn. In diesem Sinne spricht man hier auch von einer ungerichteten Bindung. Der Fall großer Ausdehnung der Wellenfunktion im Verhältnis zu den atomaren Abständen ist charakteristisch für die metallische Bindung. Eine ebenfalls ungerichtete Bindung, jedoch mit extrem geringem Überlapp der Wellenfunktion, ist die Ionenbindung. Sie entsteht, wenn ein Elektronentransfer von einer Atomsorte auf eine andere energetisch genügend günstig ist. Ionenbindung setzt also die Verschiedenheit der beteiligten Atome notwendig voraus. In den folgenden Abschnitten wollen wir die verschiedenen Bindungstypen etwas detaillierter kennenlernen.
4
1 Die chemische Bindung in Festkörpern
1.2 Kovalente Bindung Wir hatten die kovalente Bindung im Festkörper als eine Bindung charakterisiert, bei der die Wechselwirkung zwischen den nächsten Nachbarn dominiert. Deshalb können wesentliche Eigenschaften dieser Festkörperbindung aus der Quantenchemie der Moleküle übernommen werden. Zur Erläuterung wollen wir das einfachste Modell für die Bindung, das zweiatomige Molekül mit einem Bindungselektron, diskutieren. Der Hamiltonoperator H für dieses Molekül enthält die kinetische Energie des Elektrons und die Coulomb-Wechselwirkung zwischen allen Partnern (Abb. 1.2 a)
H
h2 D 2m
Z e2 4 p e0 rA
Z 0 e2 ZZ 0 e2 : 4 p e0 rB 4 p e0 R
1:1
Das richtige Molekülorbital für das Elektron wMo würde die Schrödinger-Gleichung
H wMo E wMo
1:2
lösen. Allerdings muss man schon in diesem einfachen Fall auf Näherungslösungen zurückgreifen. Mit einer solchen Näherungslösung w berechnet sich der Erwartungswert der Energie für den Grundzustand
Abb. 1.2 a–c. Einfachstes Modell der kovalenten Bindung (das H+2 Molekül). (a) Definition der Symbole in (1.1). (b) Bindende und antibindende Kombination von Atomorbitalen. Die bindende Kombination führt zu einer Anhäufung der Elektronendichte zwischen den Kernen, was zu einer Absenkung der Coulomb-Energie führt. (c) Aufspaltung der Atomniveaus in bindenden und antibindenden Zustand. Die größte Bindungsenergie wird gewonnen, wenn gerade der bindende Zustand voll, d. h. mit zwei Elektronen, besetzt ist und der antibindende leer ist („Elektronenpaarbindung“)
1.2 Kovalente Bindung
5
w H wdr : E w w dr 0
1:3
Ein Ansatz für die Näherungslösung w ist die Linearkombination von Zuständen der beiden getrennten Einzelatome w cA wA cB wB :
1:4
Wellenfunktionen und Koeffizienten sind hier reell. Man kann zeigen, dass die Energie E ' mit einer solchen Versuchsfunktion stets über dem wahren Wert E liegt (s. Übung 1.8). Die besten Werte für die Koeffizienten cA und cB sind diejenigen, die zu einem minimalen Wert von E ' führen. Mit Hilfe der Abkürzungen S wA wB dr
Uberlappungsintegral
1:5 a HAA wA H wA dr ;
1:5 b
HAB wA H wB dr ;
1:5 c
folgt für das zu minimierende E ' E0
c2A HAA c2B HBB 2 cA cB HAB : c2A c2B 2 cA cB S
1:6
Für das Minimum von E ' bezüglich cA und cB wird verlangt @ E0 @ E0 0; @ cA @ cB
1:7
d. h., es folgen die Säkulargleichungen cA
HAA
E0 cB
HAB
cA
HAB
E0 S cB
HBB
E0 S 0 ;
1:8 a
E0 0 ;
1:8 b
deren Lösungen durch das Verschwinden der Determinante bestimmt sind:
HAA
E0
HBB
E0
HAB
E0 S2 0
1:9
Nehmen wir der Einfachheit halber gleiche Kerne (z. B. H2+) an, d. h. HAA = HBB, dann ergeben sich durch Molekülbildung aus dem einen atomaren Eigenwert HAA = HBB der freien Einzelatome zwei neue Molekularorbitale mit den Energien HAA HAB :
1:10 1S Hierbei ist wegen (1.5 a) S = 0 für unendlich weit voneinander entfernte Kerne, während beim Zusammenfallen beider Zentren S = 1 wird. Aus (1.10) folgt, dass aus dem räumlichen Überlapp der Wellenfunktionen wA und wB eine Aufspaltung des Energieniveaus 0 E . E
6
1 Die chemische Bindung in Festkörpern
HAA bzw. HBB in ein etwas höher und in ein etwas tiefer liegendes Niveau des Moleküls resultiert (Abb. 1.2 c). Das zum energetisch höher liegenden Energieniveau gehörende Molekülorbital nennt man antibindend, das andere bindend. Im Molekül findet das Elektron auf dem energetisch etwas niedriger liegenden bindenden Orbital Platz, was insgesamt zu einer Absenkung der Energie bei der Bindung führt. Diese Absenkung ist also die Bindungsenergie der kovalenten Bindung. Weiter erkennt man, dass nur unvollständig besetzte, also mit weniger als zwei Elektronen besetzte Orbitale von Einzelatomen kovalente Bindungen eingehen können: Da das bindende Molekülorbital nur zwei Elektronen (Pauli-Prinzip erlaubt zwei Spineinstellungen) aufnehmen kann, würde sonst das energetisch höher liegende antibindende Orbital besetzt, was die Energieabsenkung wieder kompensieren würde (vgl. dazu auch Übung 1.7). Bei zweiatomigen Molekülen, wie hier betrachtet, gehört zum bindenden Molekülorbital die additive Überlagerung von wA und wB d. h. wMo = wA+wB [in (1.4) ist cA = cB für Moleküle mit gleichen Kernen]. Dies führt, wie in Abb. 1.2 b gezeigt, zu einer Anhebung der Ladungsdichte zwischen den Kernen. Dadurch wird die Coulomb-Repulsion der Kerne gemindert. Die antibindende Kombination wMo =wA–wB führt dagegen zu einer Absenkung der Ladungsdichte. Man sieht, dass kovalente Bindung mit einer Anhäufung von elektronischer Ladung zwischen den das Molekül oder den Festkörper bildenden Atomen verknüpft ist. Der dafür verantwortliche räumliche Überlapp der Wellenfunktion bestimmt die Stärke der energetischen Absenkung der bindenden Molekül- oder Kristallatom-Orbitale und damit die Bindungsenergie. Wie Abb. 1.3 zeigt, gibt es bei gegebenen Atomorbitalen (s, p, d etc.) für den Überlapp günstige und ungünstige Orientierungen. Hieraus erklärt sich der stark gerichtete Charakter der kovalenten Bindung, der insbesondere bei den kovalent gebundenen Kristallen Diamant (C), Si, Ge mit ihrer tetraedrischen Nahordnung (Abb. 1.4) gegeben ist. Diese kovalente tetraedrische Bindung sei am Beispiel des Diamanten etwas näher betrachtet: Aufgrund seiner Elektronenkonfiguration 1 s 2, 2 s 2, 2 p 2 wäre C nur in der Lage, zwei kovalente Bindungen (2 nur mit einem Elektron besetzte p-Orbitale) einzuge-
Abb. 1.3 a, b. Anschauliche Darstellung des räumlichen Überlappens zwischen je einer s- und einer p-Wasserstoffwellenfunktion. Die räumliche Ausdehnung der Orbitale ist dargestellt in Form von Flächen gleicher Wellenamplitude. (a) Sich gegenseitig kompensierender Überlapp zwischen s und pz. (b) Nichtverschwindender Überlapp zwischen s und py
1.2 Kovalente Bindung
7
Abb. 1.4. Die tetraedrische Konfiguration nächster Nachbarn in den Kristallstrukturen von C, Si, Ge und -Sn. Sie ist eine Folge der dadurch ermöglichten periodischen Anordnung im dreidimensionalen Raum und der Ausbildung von sp 3-Hybrid-Orbitalen aus den Wellenfunktionen s, px , py und pz. Die Abbildung zeigt die Orbitale für Diamant (C). Für Si, Ge und -Sn besitzen die Orbitale zusätzliche Knoten
hen. Offenbar tritt beim Einbau in einen Kristall aber eine stärkere Energieabsenkung insgesamt ein, wenn der Überlapp von vier Bindungsorbitalen ermöglicht wird. Im Einelektronenbild stellt man sich dies vereinfacht so vor, dass aus dem 2 s-Orbital ein Elektron in das leere 2 p-Orbital angeregt wird. Die nun jeweils nur mit einem Elektron besetzten drei 2 p- und das 2 s-Orbital können vier Bindungen eingehen. Maximaler Überlapp zu den nächsten Nachbarn wird erreicht, wenn man aus den vier Wellenfunktionen 2 s, 2 px, 2 py, 2 pz vier neue Linearkombinationen bildet. Diese neuen Molekularorbitale nennt man sp 3-Hybride und den Vorgang auch „Rehybridisierung“ (s. Übung 1.9). Der dadurch ermöglichte Überlapp zu den nächsten Nachbarn in den tetraedrischen Richtungen führt zu einer Energieabsenkung, die die notwendige Anregung des 2 s-Elektrons in das 2 p-Orbital überkompensiert. Fügt man nun Kohlenstoffatome zur Diamant-Struktur zusammen, bei der jedes Atom gerade von vier weiteren in tetraedrischer Konfiguration umgeben ist (Abb. 2.12), kann sich im sp 3-Hybrid jedes Kohlenstoffatom mit seinen Nachbarn die verfügbaren Elektronen so teilen, dass gerade nur die bindenden Terme besetzt sind. Dadurch entsteht ein vollgefülltes Valenzband, welches vom nächsten darüberliegenden leeren (antibindenden) Band durch eine Lücke getrennt ist. Energie kann nur noch in Form großer Quanten zugeführt werden, die es gestatten, die Bandlücke zu überspringen. Deshalb sind solche kovalent gebundenen Festkörper bei genügend tiefen Temperaturen Nichtleiter. Ist die Bandlücke nicht zu groß, kann die thermische Anregung von Elektronen zu einer messbaren Leitfähigkeit führen. Man spricht dann von Halbleitern. Eine genauere Definition wird in Kap. 9 und 12 gegeben. Statt eines räumlichen sp 3-Hybridorbitals kann Kohlenstoff auch das flächenhafte sp2-Hybridorbital aus einer 2 s- und zwei 2 pFunktionen bilden (s. Übung 1.10). Diese Orbitale bilden dann einen ebenen 120 ° Stern. Zusätzlich existiert noch ein mit einem
8
1 Die chemische Bindung in Festkörpern
Elektron gefülltes pz-Orbital senkrecht zur Ebene des Sterns. Der Überlapp dieser pz-Orbitale von benachbarten C-Atomen führt zu einer zusätzlichen Bindung, der sogenannten p-Bindung. Diese Art der Bindung wird innerhalb der Schichten der Graphitstruktur des Kohlenstoffs realisiert. Die Bindung zwischen den kovalent gebundenen Schichten der Graphitstruktur ist vom Van der Waals Typ (Abschn. 1.6) und deshalb vergleichsweise schwach. Eine interessante räumliche Struktur unter Verwendung von sp 2Orbitalen stellen die Fullerene dar, deren prominentester Vertreter das C60 ist (Abb. 1.5). Die räumliche Struktur der Fullerene entsteht durch die Fünfecke, von denen aus topologischen Gründen immer 12 erforderlich sind, um eine geschlossene Form zu bilden. Der C60-Cluster weist neben den 12 Fünfecken auch 20 Sechsecke auf. Größere Moleküle lassen sich durch Einfügen weiterer Sechsecke bilden. Aus C60-Clustern lassen sich u. a. durch Beifügen von anderen Atomen, z. B. Alkali- oder Erdalkaliatomen, auch dreidimensionale Kristallstrukturen herstellen.
Abb. 1.5. Die Struktur von C60
Eine vollständige Absättigung der kovalenten Bindung wird bei den Elementen der 4. Gruppe C, Si, Ge und a-Sn in der den dreidimensionalen Raum erfüllenden, tetraedrischen Konfiguration ermöglicht. Die Elemente der 5. Gruppe P, As, Sb benötigen dazu nur eine Dreierkoordination. Sie bilden Schichtstrukturen. Entsprechend bilden die Elemente der 6. Gruppe Te und Se Kettenstrukturen mit Zweierkoordination. Kovalent gebundene Festkörper lassen sich natürlich auch aus verschiedenen Elementen herstellen. Als Beispiel betrachten wir Bornitrid. Die Elemente haben dabei die Elektronenkonfiguration: B (2 s 2, 2 p 1); N (2 s 2, 2 p 3). Aus diesen Elementen lässt sich ebenfalls das Diamantgitter mit tetraedrischer Koordination aufbauen. Dabei ist jedes Boratom von 4 Stickstoffatomen umgeben und umgekehrt. Zur gemeinsamen Bindung steuert das Stickstoffatom 5 Elektronen und das Boratom 3 Elektronen bei. Insgesamt ergibt sich also dieselbe Elektronenzahl pro Atom wie beim Kohlenstoffgitter. Wegen der Verschiedenheit der Elemente hat die Verbindung aber einen Ionencharakter. Darüber soll im folgenden Abschnitt gesprochen werden.
1.3 Die Ionenbindung
9
Typische Bindungsenergien für rein kovalent gebundene Kristalle sind beispielsweise: C (Diamant): 7,3 eV pro Atom (712 kJ/Mol); Si: 4,64 eV pro Atom (448 kJ/Mol); Ge: 3,87 eV pro Atom (374 kJ/Mol).
1.3 Die Ionenbindung Zur Erklärung der Ionenbindung werden zweckmäßigerweise die Ionisierungsenergie und die Elektronenaffinität von Atomen betrachtet. Die Ionisierungsenergie I ist dabei definiert als diejenige Energie, die aufgewendet werden muss, um ein Elektron von einem neutralen Atom zu entfernen. Die Elektronenaffinität A ist die Energie, die gewonnen wird, wenn man einem neutralen Atom ein zusätzliches Elektron hinzufügt. Die Ionenbindung bildet sich immer dann aus, wenn man Elemente mit vergleichsweise niedriger Ionisierungsenergie mit Elementen hoher Elektronenaffinität kombiniert. Als Beispiel betrachten wir die Elemente Natrium-Chlor. Die Ionisierungsenergie von Natrium beträgt 5,14 eV, die Elektronenaffinität von Chlor 3,71 eV. Beim Transfer von einem Elektron von einem Natriumatom auf ein Chloratom muss also die Energie von 1,43 eV aufgewandt werden. Die elektrostatische Anziehung zwischen den beiden dabei entstandenen Ionen führt mit zunehmender Annäherung zu einem größer werdenden Energiegewinn, wobei der minimale Abstand durch die Summe der Ionenradien gegeben ist. Insgesamt lässt sich auf diese Weise eine Energie von 4,51 eV gewinnen, wodurch eine positive Energiebilanz von 3,08 eV verbleibt. Aus Natrium und Chlor kann also ein zweiatomiges Molekül mit starkem Ionencharakter gebildet werden. Auch räumliche Strukturen lassen sich auf diese Weise aufbauen, indem jedes Chloratom von Natriumatomen umgeben ist und umgekehrt. Die sich ergebende Struktur ist durch optimale Raumausnutzung bei gegebenen Ionenradien und durch die Bedingung bestimmt, dass die Coulomb-
Abb. 1.6. Die beiden typischen Strukturen für Ionenbindung in Festkörpern. (a) NaCl-Struktur, (b) CsCl-Struktur
10
1 Die chemische Bindung in Festkörpern
Anziehung ungleichnamiger Ladungen stärker sein muss als die Coulomb-Abstoßung von Ionen gleicher Ladung. Die für die ZweiIonenbindung typischen Strukturen, die Natriumchlorid- und die Cäsiumchloridstruktur, sind in Abb. 1.6 abgebildet. Die Ionenradien bestimmen den minimalen Abstand deshalb, weil eine stärkere Annäherung zu einem starken Überlapp der ionischen Elektronenhüllen führen würde. Bei aufgefüllten Elektronenschalen führt dies (s. Abschn. 1.2) wegen des Pauli-Prinzips zur Auffüllung energetisch höher liegender antibindender Orbitale, was zu einem starken Ansteigen der Energie und damit zur Abstoßung führt. Während sich dieser abstoßende Anteil des Gesamtpotentials analog zur kovalenten Bindung nur aus quantenmechanischen Rechnungen ergibt, lässt sich der anziehende Coulomb-Anteil der Energie in einer Ionenbindung einfach durch die Summe über Coulomb-Potentiale angeben: Für das Potential zwischen zwei Ionen i und j mit dem Abstand rij schreibt man uij
e2 B ; 4 p e0 rij rijn
1:11
hierbei ist der zweite, die Abstoßung der Elektronenhüllen beschreibende Anteil ein heuristischer Ansatz, der zwei freie Parameter n und B enthält. Diese Parameter müssten natürlich durch eine exakte quantenmechanische Behandlung des Problems geliefert werden. Sie können aber auch, wie häufig getan, durch Anpassung an experimentelle Messgrößen (Ionenabstand, Kompressibilität usw.) gewonnen werden; n liegt dabei in vielen Fällen zwischen 6 und 10. Den typischen Verlauf eines solchen Potentials zeigt Abb. 1.7. Das Potential aller Ionen j am Ort des Ions i ergibt sich durch Summation:
Abb. 1.7. Energie als Funktion des Abstandes zweier Ionen
1.3 Die Ionenbindung
ui
X
uij :
11
1:12
i6j
Mit r als Abstand nächster Nachbarn schreibt man rij r pij ;
1:13
wobei pij spezifisch für die betreffende Struktur ist. Besteht der Kristall aus N Ionenpaaren, so ergibt sich die gesamte potentielle Energie zu e2 X 1 B X 1 :
1:14 n U N ui N 4 p e0 r i6j pij r i6j pnij Hierbei nennt man die für eine spezielle Struktur charakteristische Größe X 1
1:15 A pij i6j Madelung-Konstante. Für die Natriumchloridstruktur ist A = 1,748, für die Cäsiumchloridstruktur 1,763. Typische Bindungsenergien sind: für NaCl: 7,95 eV pro Molekül (764 kJ/Mol), für NaI: 7,10 eV pro Molekül (683 kJ/Mol) und für KBr: 6,92 eV pro Molekül (663 kJ/Mol). Eine Wanderung von Elektronen in Ionenkristallen ist ohne erhebliche Energiezufuhr (*10 eV) nicht möglich. Festkörper mit Ionenbindung sind deshalb Nichtleiter. Allerdings ermöglichen Fehlstellen bei höheren Temperaturen eine Wanderung von Ionen und damit eine Ionenleitfähigkeit. Ionenbindung und kovalente Bindung sind Grenzfälle, von denen nur der letztere im Falle der Verbindung von gleichen Atomen realisiert ist. Die Mehrzahl der Fälle stellt einen Mischtyp zwischen beiden Bindungsarten dar. Eine qualitative Abschätzung über den Ionencharakter einer Bindung ermöglicht die Skala der Elek-
Tabelle 1.2. Die Elektronegativitäten einiger Elemente. (Nach Pauling [1.1]) H 2,1 Li 1,0
Be 1,5
B 2,0
C 2,5
N 3,0
O 3,5
F 4,0
Na 0,9
Mg 1,2
Al 1,5
Si 1,8
P 2,1
S 2,5
Cl 3,0
K 0,8
Ca 1,0
Sc 1,3
Ge 1,8
As 2,0
Se 2,4
Br 2,8
Rb 0,8
Sr 1,0
Y 1,3
Sn 1,8
Sb 1,9
Te 2,1
J 2,5
12
1 Die chemische Bindung in Festkörpern
tronegativitäten. Diese Skala wurde zuerst von Pauling aus Betrachtungen über die Bindungsenergie entwickelt. Später hat Milikan eine aus den physikalischen Größen Ionisierungsenergie I und Elektronenaffinität A abgeleitete Definition der Elektronegativität eines Elementes gegeben X 0;184
I A :
1:16
Werden Ionisierungsenergie und Affinität in eV eingesetzt, so ergibt sich die Paulingsche Elektronegativitätsskala (Tabelle 1.2). Je größer die Ionisierungsenergie und die Elektronenaffinität eines Atoms sind, desto stärkere Tendenz zeigt es, in einer Verbindung Elektronen an sich zu ziehen. In einer Verbindung ist deshalb das Element mit der größeren Elektronegativität stets das Anion. Die Elektronegativitätsdifferenz ist ein Maß für den Ionencharakter der Bindung.
Abb. 1.8. Elektronendichten der Valenzelektronen in dem typischen Ionenkristall NaCl und in einem typischen kovalent gebundenen Kristall Si (nach Göttlicher [1.2] sowie Young u. Coppens [1.3]). Deutlich erkennt man die Konzentration der Ladung entlang der Bindungsrichtung zwischen den Si-Atomen, während bei der Ionenbindung die Elektronen im wesentlichen kugelsymmetrisch um die Ionen verteilt sind
1.4 Metallische Bindung
13
Den Unterschied zwischen Ionenbindung und kovalenter Bindung auch in der Elektronendichteverteilung verdeutlicht Abb. 1.8. Dort sind die Linien konstanter Elektronendichte gezeichnet. Sie wurden durch Röntgenbeugung ermittelt. Während bei Ionenbindung die Elektronen auf die Ionen konzentriert sind, ist bei kovalenter Bindung die Elektronendichte zwischen den Atomen angehäuft.
1.4 Metallische Bindung Als Extremfall einer durch Elektronenanhäufung zwischen den Kernen erzeugten Bindung lässt sich die Bindung bei Metallen auffassen. Im Gegensatz zur kovalenten Bindung sind hier aber die Wellenfunktionen sehr ausgedehnt im Vergleich zu den Bindungsabständen. In Abb. 1.9 sind als Beispiel die Radialanteile der 3 d und 4 s Wellenfunktionen von Nickel im Metallverband dargestellt. Die 4 s Wellenfunktion hat merkliche Werte noch beim halben Abstand zu den drittnächsten Nachbarn und entsprechend tragen viele Nachbarn zur Bindung bei. Dies führt zu einer starken Abschirmung der positiven Kernladung und zu einer Bindung, die eine gewisse Ähnlichkeit mit der kovalenten Bindung besitzt; jedoch sind die Bindungskräfte wegen der starken „Verschmierung“ der Valenzelektronen über den gesamten Kristall nicht gerichtet wie bei den kovalent-gebundenen Kristallen. Die Struktur von Metallen ist deshalb auch weitgehend durch die Bedingung optimaler Raumerfüllung bestimmt (s. Abschn. 2.5). Anders als die s-Elektronen sind die d-Elektronen der Übergangsmetalle lokalisiert. Der Überlapp ist entsprechend geringer.
Abb. 1.9. Die Amplitude der 3 dzz-Wellenfunktion und der 4 s-Wellenfunktion von Ni nach Walch u. Goddard [1.4]. Die halbe Entfernung zu den nächsten, übernächsten und drittnächsten Nachbarn (r1, r2 und r3) sind zum Vergleich mit eingetragen
14
1 Die chemische Bindung in Festkörpern
Die d-Elektronen stellen gewissermaßen ein kovalentes Gerüst in den Übergangsmetallen dar und leisten den größten Beitrag zur Bindungsenergie. Das aus s-, p- und evtl. d-Elektronen gebildete Valenzband der Metalle ist nicht vollständig besetzt (vgl. Tabelle 1.1). Infolge der quasi-kontinuierlichen Verteilung der Zustände auf der Energieskala bei einer großen Zahl von Atomen kann man den Elektronen Energie in infinitesimal kleinen Portionen zuführen, insbesondere also sie in einem angelegten elektrischen Feld beschleunigen. Kennzeichen der Metalle ist also eine hohe elektrische Leitfähigkeit, die mit einer hohen thermischen Leitfähigkeit gekoppelt ist. In diesem Sinne ist die metallische Bindung eine besondere Eigenart des Festkörpers, also des Zusammenschlusses von vielen Atomen. Wie ein Blick auf Tabelle 1.1 lehrt, kann bei den Metallen das partiell gefüllte Valenzband auf verschiedene Weise entstehen. Bei den Alkalimetallen (Li, Na, K, Rb, Cs) ist bereits der s-Zustand nur einfach besetzt. Bei den Erdalkalimetallen (Be, Mg, Ca, Sr, Ba) könnte man zunächst ein vollgefülltes Band, gebildet aus den s-Zuständen, erwarten. Wegen der Bandüberlappung mit den p-Bändern der gleichen Schale gibt es jedoch praktisch nur ein gemeinsames spBand. Einen Sonderfall bilden die Übergangsmetalle. Hier bilden die s- und p-Zustände wieder ein gemeinsames Band großer Breite. Wie besprochen, haben die d-Elektronen eine geringere räumliche Ausdehnung (s. Abb. 1.9). Durch den geringeren Überlapp mit den Nachbaratomen ist auch die energetische Aufspaltung geringer. Die große Ausdehnung der Wellenfunktion der Valenzelektronen in Metallen macht eine theoretische Berechnung der Bindungsenergie besonders schwierig. Andererseits sind die Valenzelektronen zwischen den Atomen weitgehend frei beweglich. Dadurch vereinfacht sich die Beschreibung der elektrischen Leitfähigkeit und der spezifischen Wärme der Elektronen. Dies wird insbesondere in Kap. 6 deutlich.
1.5 Die Wasserstoffbrückenbindung Von Wasserstoffbrückenbindung spricht man, wenn ein Wasserstoffatom an zwei Atome gebunden ist. Eine solche Bindung scheint nicht möglich, da Wasserstoff doch nur ein Valenzelektron hat. Man kann sich die Wasserstoffbrückenbindung jedoch folgendermaßen veranschaulichen: Beim Eingehen einer kovalenten Bindung mit einem stark elektronegativen Atom, wie z. B. Sauerstoff, kommt es zu einem weitgehenden Ladungstransfer des einzigen Wasserstoffelektrons an den Bindungspartner. Das verbleibende Proton kann eine anziehende Wirkung auf einen zweiten negativ geladenen Partner ausüben. Wegen der räumlich weit ausladenden Elektronenwolke des elektronegativen Partners und der verschwindend geringen Ausdehnung des daran gebundenen Wasserstoffs (Proton mit geringer
1.6 Die Van der Waals-Bindung
15
elektronischer Abschirmung) kann ein dritter Bindungspartner nicht mehr gebunden werden: Das bindende Wasserstoffatom tritt in Zweier-Koordination auf. Wasserstoffbrückenbindungen bilden sich also vorwiegend zwischen stark elektronegativen Atomen aus, sind aber nicht auf diese beschränkt. Sie können vom symmetrischen A–H– A und vom antisymmetrischen A–H . . . B Typ sein. Als Kriterium für das Auftreten einer H-Brückenbindung kann angesehen werden, wenn der beobachtete Abstand der Atome A und B kleiner ist, als wenn lediglich Van der Waals-Bindung (Abschn. 1.6) vorläge. Weitere Anzeichen für das Auftreten einer H-Brücke ergeben sich aus der Infrarotspektroskopie, wo die der Wasserstoffschwingung zugeordneten Banden eine starke Verschiebung, häufig auch Verbreiterung, zeigen. Insgesamt ist das Erscheinungsbild der Wasserstoffbrückenbindung sehr vielfältig und weniger eindeutig abgrenzbar als im Falle der übrigen Bindungstypen. Typische Bindungsenergien liegen in der Größenordnung von 0,1 eV pro Bindung. Indem die Wasserstoffbrückenbindung die Doppelhelix in der DNS miteinander verknüpft, spielt sie eine entscheidende Rolle beim Mechanismus der genetischen Reproduktion. Das bekannteste Beispiel aus dem Bereich der anorganischen Chemie ist das Wasser, insbesondere in der Form von Eis. Beim Eis ist jedes Sauerstoffatom tetraedrisch von weiteren Sauerstoffatomen umgeben, und die Verbindung wird durch H-Brücken hergestellt. Auch im flüssigen Wasser liegen noch Wasserstoffbrücken vor, woraus sich zum Beispiel die Ausdehnungsanomalie erklärt. Sie besteht darin, dass Wasser bei 4 °C seine größte Dichte hat. Der Grund ist, dass auch in flüssigem Wasser Komplexe von wasserstoffbrückengebundenen H2O-Molekülen existieren, die verglichen mit den nicht brückengebundenen H2O-Molekülen ein größeres Volumen einnehmen. Mit wachsender Temperatur schmelzen die brückengebundenen Aggregate, was zu einer Zunahme der Dichte führt. Oberhalb von 4 °C überwiegt dann wieder die gewöhnliche thermische Ausdehnung, d. h. man findet eine Abnahme der Dichte mit steigender Temperatur.
1.6 Die Van der Waals-Bindung Sie ist eine zusätzliche Bindung, die grundsätzlich immer auftritt. Sie wird aber nur bemerkt, wenn z. B. zwischen Atomen mit abgeschlossener Schale oder zwischen gesättigten Molekülen andere Bindungen nicht möglich sind. Die physikalische Ursache dieser Bindung sind Ladungsfluktuationen in den Atomen durch die Nullpunktunruhe. Die dabei entstehenden Dipolmomente bewirken eine zusätzliche anziehende Kraft. Die Van der Waals-Bindung ist für den festen Zustand von Molekülkristallen verantwortlich. Die Bindungsenergie ist abhängig von der Polarisierbarkeit der beteiligten Atome und von der Größenordnung 0,1 eV. Die typischen Bindungsradien der
16
1 Die chemische Bindung in Festkörpern
Atome für Van der Waals-Bindung sind deutlich größer als bei einer chemischen Bindung. Der Bindungsanteil im Potential der Van der Waals-Bindung hängt wie r –6 vom Abstand der Bindungspartner (Atome oder Moleküle) ab. Dies lässt sich sehr einfach durch die Art der Dipol-Wechselwirkung verstehen. Ein durch Ladungsfluktuation momentan entstandener Dipol p1 erzeugt am Ort seines Nachbarn im Abstand r ein elektrisches Feld E * p1/r 3, das über die Polarisierbarkeit des dort befindlichen Atoms oder Moleküls an diesem ein Dipolmoment p2 * p1/r 3 induziert. Weil das Potential dieses Dipols im Feld proportional zu E und p2 ist, folgt damit für den bindenden Anteil der Van der Waals-Wechselwirkung eine Abstandsabhängigkeit der Form * r –6 (s. Übung 1.11).
Übungen zu Kapitel 1
1.1 (a) Berechnen Sie die Madelung-Konstante A einer linearen Ionenkette! (b) Berechnen Sie näherungsweise die Madelung-Konstante des NaCl-Gitters (A = 1,7476) numerisch auf zwei Arten: In einer Würfelgeometrie, wobei 2 ma die Kantenlänge des Würfels und a der Abstand nächster Nachbarn ist, und in einer Kugelgeometrie mit ma als Kugelradius! In beiden Fällen soll das Aufion im Zentrum sitzen. Führen Sie die Berechnung für die Werte m = 97, 98 and 99 durch und vergleichen Sie die Ergebnisse! Was ist die Ursache für die Diskrepanz? 1.2 Bestimmen Sie den isothermen Kompressi @p onsmodul j V und die Bindungs@V T energie pro Ionenpaar für NaCl aus dem Ausdruck für die Bindungsenergie für N Ionenpaare: e2 B X 1 A n ! U
r N 4 p e0 r r i6j p nij Man benutze n = 9 und berechne B aus der Bedingung, dass U (r) am Gleichgewichtsabstand minimal ist. 1.3 Bekanntlich löst sich Kochsalz (NaCl) gut in Wasser, wobei die Na und Cl Atome als positive bzw. negative (solvatisierte) Ionen vorliegen. Man zeige, dass durch die große Dielektrizitätskonstante von Wasser und die damit vorliegende Abschirmung des Coulomb-Potentials die Bindungsenergie eines NaCl Kristalls in Wasser kleiner als die mittlere thermische Energie der freien Ionen
wird. Berechnen Sie den Gleichgewichtsabstand der Ionen in einem hypothetischen NaCl Kristall in Wasser und zeigen Sie, dass dieser Abstand größer ist als der van der Waals Durchmesser eines Wassermoleküls, wodurch die hier vorgenommene näherungsweise Betrachtung zur Löslichkeit von NaCl gerechtfertigt wird! 1.4 Diskutieren Sie die Ionizität von Alkalihalogeniden mit Hilfe von Tabelle 1.2! 1.5 Man betrachte die CsCl Struktur und nehme an, dass der Radius des Kations immer kleiner wird, während der Radius des Anions konstant bleibt. Wie ändert sich die Bindungsenergie? Zeigen Sie, dass für kleine Kationen die NaCl Struktur bevorzugt wird! Für noch kleinere Kationradien hat die ZnS Struktur die größte Bindungsenergie (Madelungkonstante A = 1,638). Geben Sie Beispiele an! 1.6 Berechnen Sie näherungsweise die Nullpunktsentropie von Eis! In der Struktur von Eis bilden die Sauerstoffatome ein Wurtzitgitter, das durch Wasserstoffbrückenbindung zwischen den nächstbenachbarten Sauerstoffatomen stabilisiert wird. Die Nullpunktsentropie entsteht aus den möglichen Verteilungen von je zwei Wasserstoffatomen pro Sauerstoffatom auf die vier Bindungen zu den jeweils nächsten Nachbarn. 1.7 Diskutieren Sie die Elektronenkonfiguration des Sauerstoffmoleküls! Warum entspricht die Bindungsstärke der einer chemischen Doppelbindung? Warum ist O2 paramagnetisch? Erklären Sie, warum O+2 ein stabiles Ion ist!
18
Übungen zu Kapitel 1
1.8 Man beweise, dass im Ritzschen Näherungsverfahren die mit Hilfe einer Näherungsfunktion w ermittelte Abschätzung für die Grundzustandsenergie
w; H w E
w; w immer größer als oder gleich dem exakten Eigenwert E0 ist! Man entwickle dazu die Näherungsfunktion nach den exakten Eigenfunktionen wi (zugehöriger exakter Eigenwert Ei ). 1.9 Das Kohlenstoffatom in der tetraedrischen Bindungskonfiguration des Diamants kann näherungsweise durch vier 2 sp 3-Wellenfunktionen wi („sp 3-Hybridorbitale“) dargestellt werden, die als Linearkombinationen aus den vier 2 s-, 2 px-, 2 py- und 2 pzWellenfunktionen yj des Wasserstoffatoms gebildet werden: X aij yj mit i; j 1; 2; 3; 4; wi
(b) Zeigen Sie, dass aus der Forderung nach Orthonormierung von wi folgt, dass X aij akj dik fur aij aji ! j
(c) Bestimmen Sie vier mögliche wi, die die Orthonormierungsbedingungen mit aij = ± 12 erfüllen! (d) Zeigen Sie, dass die Maxima von jwi j2 in den vier tetraedrischen Richtungen liegen, und zeichnen Sie diese durch Vektoren zu den Würfelecken in einem Würfel mit den Kanten parallel zu den x-, y-, z-Achsen! (e) Zeigen Sie, dass die Elektronendichte 4 X
jwi j2 kugelsymmetrisch ist!
i1
(f) Warum konzentriert sich die Ladungsverteilung im Diamantgitter dennoch auf die tetraedrischen Richtungen?
An die wi stellt man die Forderung, dass sie – genau wie die yj – orthonormiert sind, d. h. es gilt: R wi wk dr dik :
1.10 (a) Diskutieren Sie analog zur sp 3-Hybridisierung des Kohlenstoffs im Diamantgitter die Möglichkeit einer sp 2-Hybridisierung, bei der die Richtungen der drei gebildeten sp 2-Hybridorbitale in einer Ebene liegen! Fertigen Sie eine qualitative Zeichnung der drei sp 2-Orbitale und des verbleibenden pz-Orbitals an, und geben Sie die Elektronenbesetzung an! (b) Erklären Sie die chemische Bindung im Benzolmolekül C6H6 mit der sp 2-Hybridisierung der Kohlenstoffatome! Wie kommt es zu dem System der p-Bindungen parallel zum hexagonalen Ringgerüst der sechs Kohlenstoffatome? (c) Erklären Sie die stark anisotropen Eigenschaften des hexagonalen Schichtengitters des Graphits mit der sp2-Hybridisierung des Kohlenstoffs (anisotrope Stärke der chemischen Bindung, quasi-metallische Eigenschaften parallel zu den Kohlenstoffschichten)! Wie werden diese anisotropen Eigenschaften im Alltag genutzt?
(a) Zeichnen Sie Konturen von y
R const; h; u für den s- und einen p-Zustand in einem Polardiagramm!
1.11 Als einfaches quantenmechanisches Modell für die Van der Waals-Wechselwirkung be-
j
wobei die in Frage kommenden Funktionen yj in sphärischen Polarkoordinaten wie folgt aussehen: y1 y
2 s c e y2 y
2pz c e
R
1
R
R ;
R cos h ;
R
y3 y
2px c e R sin h cos u ; y4 y
2 py c e
R
R sin h sin u ;
mit R
Zr : 2a0
(Z Kernladungszahl – hier von Kohlenstoff, a0 Bohrscher Atomradius)
Übungen zu Kapitel 1
trachtet man zwei identische harmonische Oszillatoren im Abstand R. Jeder Oszillator besteht aus zwei Ladungen mit entgegengesetztem Vorzeichen, deren Abstand x1 bzw. x2 ist. Die Federkonstante der Oszillatoren sei f. (a) Stellen Sie den Hamiltonoperator H 0 für die zwei Oszillatoren ohne Berücksichtigung der elektrostatischen Wechselwirkung auf! (b) Bestimmen Sie die Wechselwirkung H 1 zwischen den vier Ladungen! (c) Unter der Annahme, dass jx1 j R; jx2 j R nähere man H 1 durch
H1
2 e2 x1 x2 ! R3
(d) Man zeige, dass die Transformation auf Normalkoordinaten 1 xs p
x1 x2 2 1 xa p
x1 x2 2
19
den Hamiltonoperator H = H 0+H 1 in einen symmetrischen und einen antisymmetrischen Teil separiert! (e) Man berechne die Eigenfrequenzen xs und xa der symmetrischen und antisymmetrischen Schwingungen als Taylor-Reihe in 2 e 2/f R 3 und breche nach dem zweiten Term ab! (f) Die Energie des Gesamtsystems zweier wechselwirkender Oszillatoren kann als U = – 12 h
xs xa ausgedrückt werden. Leiten Sie den Ausdruck für die Energie der isolierten Oszillatoren her und zeigen Sie, dass dieser durch die Wechselwirkung um einen Betrag c/R 6 erniedrigt wird! 1.12 Berechnen Sie die Abhängigkeit der Van der Waals-Bindung eines Moleküls vom Abstand d von einer Festkörperoberfläche! Wählen Sie zur Vereinfachung eine kubisch primitive Struktur. Zeigen Sie, dass das Ergebnis nicht von der Kristallstruktur abhängt!
2. Die Struktur von Festkörpern
Gehen Atome eine chemische Verbindung ein, so ergeben sich wohldefinierte Gleichgewichtsabstände, die durch das Minimum der Gesamtenergie charakterisiert sind. Bei einem Festkörper, gebildet aus gleichen Atomen, kann deshalb das Energieminimum nur dann erreicht werden, wenn von jedem Atom aus betrachtet die Umgebung gleich ist. Die Anordnung der Atome ist deshalb dreidimensional periodisch. Man bezeichnet diesen Zustand der Materie als kristallin. Entsprechendes gilt auch für Festkörper, die aus mehreren Elementen gebildet werden: Dort wiederholen sich bestimmte Baugruppen in periodischen Abständen. An die Periodizität knüpfen sich entscheidende festkörperphysikalische Eigenschaften und Untersuchungsmethoden. Im Hinblick auf die theoretische Beschreibung und das Verständnis ist die Periodizität eine außerordentliche Vereinfachung. Obgleich der reale Festkörper niemals exakt dreidimensional periodisch ist, benutzt man gerne den periodischen Festkörper als Modell für die Beschreibung und behandelt Abweichungen von der Periodizität als Störung. Dreidimensional periodische Anordnungen von Atomen, bzw. Baugruppen von Atomen, lassen sich auf sehr verschiedene Weise realisieren. Damit beschäftigen sich die Unterabschnitte 2.1–2.5. Im Gegensatz zum kristallinen Zustand steht der amorphe Zustand der Materie. Bei ihm ist die Fernordnung aufgehoben, die Nahordnung jedoch erhalten. Beispiele für diesen Zustand sind: Gläser, Keramiken, Gele, Polymere, rasch erstarrte Schmelzen und bei tiefen Temperaturen aufgedampfte Schichten. Der amorphe Zustand stellt ein wichtiges Gebiet der aktuellen Forschung dar. Das Verständnis amorpher Festkörper ist jedoch wegen der fehlenden Periodizität schwieriger. Aus dem Vergleich der Eigenschaften amorpher und kristalliner Festkörper hat man gelernt, dass wesentliche Elemente der Elektronenstruktur und damit auch der makroskopischen Eigenschaften von der Nahordnung bestimmt werden, also für kristalline und amorphe Festkörper ähnlich sind. Im Rahmen dieses Lehrbuches werden wir einige strukturelle und elektronische Eigenschaften amorpher Festkörper in den Abschnitten 3.1, 7.6 und 9.8 behandeln. Reale Festkörper sind häufig Mehrstoffsysteme. Man denke zum Beispiel an die teilweise schon aus der frühen Menschheitsgeschichte bekannten Legierungen wie Bronze (eine Legierung aus Kupfer und Zinn), Messing (Cu/Zn) oder Stahl (Fe/C). Die moderne Materialforschung hat diesen klassischen Legierungen eine Vielzahl
22
2. Die Struktur von Festkörpern
von Mehrkomponentensystemen an die Seite gestellt. Im Rahmen dieses Lehrbuches werden besonders Halbleiterlegierungen behandelt werden (Kap. 12). Typisch für Legierungen ist, dass sie in der Regel keine homogene Phase bilden: Sie bestehen vielmehr aus Mikrokristalliten unterschiedlicher Komposition, deren Zusammensetzung wiederum von der Temperatur und den globalen Konzentrationsverhältnissen der beteiligten Elemente abhängen. Die Phasendiagramme einfacher Legierungen werden in Abschnitt 2.6 behandelt.
2.1 Translationsgitter Zur Darstellung der reinen Translationsstruktur eines Kristalls wird die Lage einer jeden Baugruppe, die im einfachsten Falle nur durch ein Atom gegeben sein kann, durch einen Punkt angegeben. Aus der periodischen Anordnung der Baugruppen wird somit ein Gitter von Punkten, das Translationsgitter, im folgenden auch einfach Gitter genannt. Ein zweidimensionales Translationsgitter wird durch zwei Vektoren a und b aufgespannt. Jeden Punkt des Gitters kann man durch den Gittervektor rn n1 a n2 b
2:1
erreichen mit beliebigen ganzen Zahlen n1 und n2. Je nach den Längenverhältnissen der Vektoren a und b und der Größe des von ihnen eingeschlossenen Winkels c lassen sich Gitter verschiedenartiger Geometrie aufbauen. Das allgemeinste Gitter ohne weitere Symmetrie ergibt sich für a = b, c = 90 ° (Abb. 2.1). Eine ebene Kristallstruktur entstünde aus diesem „Parallelogrammgitter“, wenn man sich jeden Gitterpunkt mit einem Atom belegt denkt. In diesem Falle würde die von a und b aufgespannte Elementarzelle ein Atom enthalten. Solche Elementarzellen nennt man primitiv. Kristallgitter können aber auch mehr als 1 Atom in der Elementarzelle enthalten. In diesem Falle entsprechen die in Abb. 2.1 dargestellten Gitterpunkte solchen Punkten im Kristallgitter, von denen aus betrachtet die Umgebung jeweils identisch aussieht. Dieser Punkt kann, muss aber nicht, in das Zentrum eines Atoms gelegt werden. Weitere Gitter der Ebene mit höherer Symmetrie erhält man durch Wahl spezieller Werte für c, a und b. Das Rechteckgitter ergibt sich für c = 90 ° (Abb. 2.2). Für a = b wird daraus das quadrati-
Abb. 2.1. Das ebene Parallelogrammgitter
2.1 Translationsgitter
23
Abb. 2.2. Weitere Translationsgitter der Ebene: Quadratgitter, Rechteckgitter, zentriertes Rechteckgitter und hexagonales Gitter (c = 60 °, a = b )
sche Gitter. Man kann ferner eine Ebene regelmäßig mit Sechsecken überdecken. Die Einheitszelle wird dann durch a = b und c = 60 ° realisiert. Eine hexagonal dichteste Packung von Kugeln hat diese Einheitszelle. Die Bedingung a = b (c beliebig) führte ebenfalls auf einen neuen Gittertyp. Dieses Gitter wird jedoch besser als „zentriertes“ Rechteckgitter mit a j b, c = 90 ° beschrieben (Abb. 2.2). Man behält so den Vorteil eines rechtwinkligen Koordinatensystems. Allerdings ist in dieser Beschreibung das Gitter nicht mehr primitiv. Es ist leicht zu sehen, dass nur für das Rechteckgitter eine Zentrierung sinnvoll ist. Führt man Zentrierungen beim quadratischen Gitter, beim Parallelogrammgitter oder beim hexagonalen Gitter ein, so lässt sich das entstandene Gitter jeweils durch einen Satz kleinerer Basisvektoren beschreiben. Man hätte also lediglich eine zu große Elementarzelle gezeichnet. Tabelle 2.1. Die sieben verschiedenen Basisvektorsysteme bzw. Kristallsysteme. Die meisten Elemente kristallisieren mit kubischer oder hexagonaler Struktur. Aus diesem Grunde und wegen ihrer hohen Symmetrie sind das kubische und das hexagonale Achsensystem besonders wichtig Basisvektoren bzw. Kristallachsen
Winkel
Kristallsystem
a j b j c a j b j c a j b j c ab j c ab j c abc abc
j b j c j 90 c 90 b j 90 b c 90 b c 90 b 90 c 120 bc j 90 b c 90
triklin monoklin orthorhombisch tetragonal hexagonal rhomboedrisch kubisch
24
2. Die Struktur von Festkörpern
Abb. 2.3. Die 14 Translationsgitter des Raumes (Bravais-Gitter). Das hexagonale Gitter und die beiden zentrierten kubischen Gitter sind für die Festkörperphysik besonders wichtig
Die bisherigen Betrachtungen lassen sich auf den dreidimensionalen Raum erweitern. Anstelle der fünf verschiedenen Basisvektorsysteme in der Ebene treten die sieben verschiedenen Basisvektorsysteme des dreidimensionalen Raumes. Sie sind in Tabelle 2.1 aufgeführt. Die verschiedenen Basisvektorsysteme entsprechen den Kristallsystemen der Kristallographie. Wiederum kann man durch Hinzufügen von Zentrierungen aus den Basisvektorsystemen die möglichen Translationsgitter des Raumes aufbauen. Zusätzlich zur Flächenzentrierung gibt es im dreidimensionalen auch die Raumzentrierung (Abb. 2.3). Wie in der Ebene kann man sich davon
2.2 Punktsymmetrien
25
überzeugen, dass nur bestimmte Zentrierungen sinnvoll sind. So wäre z. B. ein tetragonal basiszentriertes Gitter einem primitiven Gitter mit kleinerer Zelle äquivalent.
2.2 Punktsymmetrien Jeder Punkt der eben besprochenen Translationsgitter symbolisiert ein Atom oder aber auch eine komplizierte Baugruppe, die ihrerseits bestimmte Symmetrieeigenschaften hat. Diese Symmetrien mit ihren Bezeichnungen sollen im folgenden vorgestellt werden. Spiegelung an einer Ebene Sie wird mathematisch ausgedrückt durch eine Koordinatentransformation. Zum Beispiel lässt sich die Spiegelung an einer yz-Ebene durch die Transformation y ' = y, z ' = z, x ' =–x darstellen. Das Vorhandensein einer Spiegelebene in einer Kristallstruktur wird durch das Symbol m angezeigt. Ein Molekül, welches zwei senkrecht zueinander stehende Spiegelebenen besitzt, ist z. B. das Wassermolekül (Abb. 2.7). Die eine Spiegelebene wird durch die Molekülebene selbst gebildet, die andere geht senkrecht dazu durch das Sauerstoffatom. Inversion Die Inversion wird durch die Koordinatentransformation y ' =–y, x ' =–x, z ' =–z beschrieben. Sie stellt also gewissermaßen eine Spiegelung an einem Punkt dar. Ihr Symbol ist 1¯. Ein Beispiel für ein Molekül mit Inversionssymmetrie ist das Zyklohexan (Abb. 2.4). Auch gleichnamige, zweiatomige Moleküle haben ein Inversionszentrum, natürlich auch Spiegelebenen.
Abb. 2.4. Das Zyklohexanmolekül (C6H12). Hauptsymmetrieelement ist die 3zählige Drehachse C3. Das Molekül hat ferner ein Inversionszentrum, drei Spiegelebenen und senkrecht zur Hauptachse drei 2zählige Drehachsen, die einen Winkel von jeweils 120° einschließen. Die Punktgruppe wird mit D3d bezeichnet (Tabelle 2.2)
26
2. Die Struktur von Festkörpern
Drehachsen Eine Drehachse ist dann gegeben, wenn durch Rotation um einen bestimmten Winkel Deckungsgleichheit hergestellt wird. Selbstverständlich ist diese Deckungsgleichheit stets nach Rotation um 360 ° hergestellt. Die Zahl der dazwischenliegenden Drehungen, die ebenfalls zur Deckung führen, wird als Zähligkeit bezeichnet. So gibt es z. B. 2-, 3-, 4- und 6zählige Drehachsen, für die jeweils Deckungsgleichheit nach den Drehungen um 180 °, 120 °, 90 ° und 60 ° hergestellt wird. Bei Molekülen sind auch 5zählige, 7zählige, usw. Drehachsen möglich. Kleine Festkörperteilchen („cluster“) können ebenfalls 5zählige Drehachsen aufweisen. Ein Beispiel ist das besonders stabile Ikosaeder mit 13 Atomen. Ikosaeder bilden sich auch beim raschen Abkühlen von Schmelzen. Dabei kann der Festkörper eine quasikristalline Struktur mit scharfen Röntgenbeugungsreflexen einnehmen, welche die lokale 5zählige Symmetrie widergeben [2.1]. Für streng periodisch aufgebaute Kristalle hingegen sind nur 2-, 3-, 4- und 6zählige Drehachsen möglich, da andere Drehachsen nicht mit der Translationssymmetrie kompatibel sind. Die Bezeichnung der Drehachsen erfolgt durch die Zahlen 2, 3, 4 und 6. Das in Abb. 2.4 gezeigte Zyklohexan hat z. B. eine 3zählige Drehachse. Ein Molekül mit einer 6zähligen Drehachse ist das Benzol (C6H6), dessen Kohlenstoffskelett aus einem ebenen, gleichseitigen Sechseck besteht.
Drehinversionsachsen Drehung und gleichzeitige Inversion können zu einem neuen Symmetrieelement, den Drehinversionsachsen, kombiniert werden. Ihre Bezeichnungen sind 2¯, 3¯, 4¯ und 6¯. In Abb. 2.5 ist eine 3zählige Drehinversionsachse dargestellt. Man sieht daraus, dass die 3zählige Drehinversionsachse äquivalent einer 3zähligen Achse mit Inversion
Abb. 2.5. Darstellung einer 3zähligen Drehinversionsachse. Die Wirkung kann auch durch die Zusammensetzung anderer Symmetrieelemente beschrieben werden
2.3 Die 32 Kristallklassen (Punktgruppen)
27
ist. Die 6zählige Drehinversionsachse lässt sich auch darstellen durch eine 3zählige Drehachse und eine dazu senkrechte Spiegelebene.
2.3 Die 32 Kristallklassen (Punktgruppen) Die besprochenen Symmetrieelemente können in verschiedenartiger Weise miteinander kombiniert werden. Umgekehrt wird jeder Kristall durch eine bestimmte Kombination von Punktsymmetrieelementen beschrieben. Eine vollständige Beschreibung muss einer Reihe von Bedingungen genügen. So muss z. B. die Ausführung zweier Symmetrieoperationen nacheinander durch ein weiteres Symmetrieelement beschreibbar sein, A 6 B = C. Führt man 3 Symmetrieoperationen nacheinander aus, so muss das sogenannte assoziative Gesetz erfüllt sein, (A 6 B ) 6C = A 6 (B 6 C ). Ferner gibt es ein Einheitselement E, das z. B. der Nichtausführung einer Operation bzw. einer Drehung um 360 ° entsprechen kann, A 6 E = A. Weiter existiert das inverse Element, das in der Umkehrung der jeweiligen Operation besteht, A –1 6 A = E. Diese Eigenschaften definieren mathematisch eine Gruppe. Es gibt 32 verschiedene kristallographische Punktgruppen. Nimmt man die Translationen hinzu, so entstehen die 230 Raumgruppen. Wir bemerken, dass nicht notwendigerweise, wohl aber bei den Translationen A 6 B = B 6 A gilt (Abelsche Gruppen). Die Darstellung der 32 kristallographischen Punktgruppen erfolgt gewöhnlich in der sogenannten stereographischen Projektion. Diese Projektion wurde in der Kristallographie entwickelt, um die bei natürlich gewachsenen Kristallen vorkommenden Flächen in systematischer Weise zu erfassen. Es werden dabei die Durchstoßpunkte der Flächennormalen durch eine Kugel markiert und anschließend in die Ebene, die senkrecht auf der Achse höchster Zähligkeit steht, projiziert. Durchstoßpunkte von oberhalb werden durch einen Kreis, von unterhalb durch einen offenen Kreis oder ein Kreuz symbolisiert. Bei der systematischen Darstellung der Punktgruppen steht die Achse mit der höchsten Zähligkeit im Zentrum. Zwei stereographische Projektionen und Punktgruppen sind in Abb. 2.6 dargestellt. Die Bezeichnung der Punktgruppen kann auf drei verschiedene Arten erfolgen:
Abb. 2.6. Darstellung der Symmetrieelemente zweier Punktgruppen in der stereographischen Projektion. Die Symbole (), s, n bedeuten 2-, 3- und 4zählige Drehachsen. Die ausgezogenen Linien sind Spiegelebenen. Wenn der Kreis ausgezogen ist, stellt die Zeichenebene ebenfalls eine Spiegelebene dar
28
2. Die Struktur von Festkörpern
1. durch die Angabe eines Systems von erzeugenden Symmetrieoperationen 2. durch Angabe des internationalen Punktgruppensymbols 3. durch die Symbole nach Schönflies. Die Bezeichnung durch die erzeugenden Symmetrieelemente ist in der Kristallographie üblich, während die Symbole nach Schönflies sich in der Gruppentheorie und der Spektroskopie allgemein durchgesetzt haben. Sie sollen deshalb hier besprochen werden. Die Bezeichnung nach Schönflies erfolgt durch ein Hauptsymbol, welches die dem System zugeordneten Drehachsen (soweit vorhanden) charakterisiert und durch ein Zusatzsymbol, welches die Lage der Spiegelebenen angibt. Die Bedeutung der Symbole kann Tabelle 2.2 entnommen werden. Betrachten wir als Beispiel das Wassermolekül, so ist dort die Achse mit der höchsten Zähligkeit eine 2zählige Achse. Die Spiegelebenen liegen vertikal, d. h. parallel zur Hauptdrehachse. Entsprechend ist die Bezeichnung nach Schönflies C2v. Ein Würfel hat drei 4zählige Drehachsen und vier 3zählige Drehachsen sowie eine Spiegelebene senkrecht zur 4zähligen Drehachse. Entsprechend ist die Bezeichnung Oh.
2.4 Die Bedeutung der Symmetrie Die richtige Einordnung und Bezeichnung der Symmetrie erscheint dem Anfänger häufig unübersichtlich und verwirrend. Es ist deshalb nützlich, kurz auf die überragende Bedeutung der Symmetrien für die Beschreibung des Festkörpers einzugehen. Wir müssen hierzu auf die Quantenmechanik zurückgreifen. Wie wir gesehen haben, hat z. B. das Wassermolekül zwei Spiegelebenen. Diese zwei
Tabelle 2.2. Die Punktgruppensymbole nach Schönflies
Klassifizierung nach Drehachsen bzw. Hauptspiegelebenen
Symbol
Bedeutung
Cj Sj Dj
(j = 2, 3, 4, 6) j-zählige Drehachse j-zählige Drehinversionsachse j 2zählige Drehachsen ^ zu einer (j-zähligen) Hauptdrehachse Vier 3- und drei 2zählige Drehachsen wie im Tetraeder Vier 3- und drei 4zählige Drehachsen wie im Oktaeder ein Inversionszentrum eine Spiegelebene horizontal = senkrecht zur Drehachse vertikal = parallel zur Hauptdrehachse diagonal = parallel zur Hauptachse in der Winkelhalbierenden zwischen den 2zähligen Drehachsen
T O
Zusatzsymbol für Spiegelebenen
Ci Cs h v d
2.4 Die Bedeutung der Symmetrie
29
Spiegelebenen müssen sich auch in allen physikalischen Eigenschaften des Moleküls ausdrücken. Beschreibt man die elektronischen oder auch Schwingungseigenschaften des Moleküls durch einen Hamiltonoperator, so hat dieser die zweifache Spiegelsymmetrie, d. h. er bleibt bei entsprechenden Koordinatentransformationen invariant. Die Invarianz kann man auch noch auf andere Weise ausdrücken. Man ordnet der Spiegelung einen Operator r zu. Dieser, angewandt auf den Hamiltonoperator H , einen Eigenzustand W oder einen Ortsvektor R, soll gerade H , W und R in den gespiegelten Koordinaten beschreiben. Dargestellt werden solche Operatoren durch Matrizen. So lässt sich z. B. die Spiegelung der Koordinaten an der yz-Ebene durch die Matrixoperation 1 0 10 1 0 x x 1 0 0 @ 0 1 0 A@ y A @ y A
2:2 z z 0 0 1 darstellen. Diese Darstellung ist dreidimensional. Sie lässt sich offenbar auf drei eindimensionale Matrizen reduzieren
1x;
1y;
1z
x; y; z ; von denen jede nur auf eine Komponente wirkt. In diesem Fall heißt die dreidimensionale Darstellung „reduzibel“, während die entsprechende eindimensionale „irreduzibel“ heißt, da sie nicht weiter vereinfacht werden kann. Es ist leicht zu sehen, dass auch die irreduzible Darstellung einer Drehung um 180 ° (2zählige Drehachse) eindimensional ist, da sie bei geeigneter Lage der Koordinaten durch Umkehrung eines Vorzeichens ausgedrückt werden kann. Bei einer 3-, 4- und 6zähligen Drehachse sind dagegen außer bei der Drehung um 360 ° stets zwei Koordinaten betroffen. Die irreduzible Darstellung ist dann zweidimensional. Hat der Hamiltonoperator eine bestimmte Symmetrie, z. B. die Spiegelsymmetrie, so ist es gleichgültig, ob die Spiegeloperation vor oder nach dem Hamiltonoperator H steht, d. h. die Operatoren sind vertauschbar. Wie in der Quantenmechanik gezeigt wird, haben solche Operatoren ein gemeinsames System von Eigenzuständen. Die möglichen Eigenzustände zu H können also nach den Eigenwerten, die sie bezüglich der Symmetrieoperatoren haben, klassifiziert werden. Da im Falle der Spiegelung und einer 2zähligen Drehachse C2 stets r 2 = 1 und (C2)2 = 1 gilt, so können die Eigenwerte nur ± 1 sein: r W W
C2 W W ;
rW
C2 W
W
W :
2:3
Die Eigenzustände von H können sich also symmetrisch oder antisymmetrisch zu diesen Operatoren verhalten. Man sagt auch, die Zustände haben gerade oder ungerade „Parität“. Ein Beispiel für Zustände gerader und ungerader Parität hatten wir bei der Diskussion der chemischen Bindung zwischen H-Atomen kennengelernt (Ab-
30
2. Die Struktur von Festkörpern
schn. 1.2). Der bindende Zustand war eine symmetrische Kombination der Atomfunktionen, also ein Zustand gerader Parität. Wie in diesem Beispiel gehören die Eigenzustände W+ und W– jeweils zu verschiedenen Eigenwerten von H . Die entsprechenden Terme sind also nicht entartet. Wir lernen daraus, dass z. B. das Wassermolekül nur nichtentartete Terme haben kann (von zufälligem Zusammenfallen von Termen oder Eigenschwingungen wird dabei abgesehen). Wir wollen das Gesagte zur Illustration noch auf die Eigenschwingungen des Wassermoleküls anwenden. Die Bewegungen der Atome können sich dann symmetrisch oder antisymmetrisch zu den beiden Spiegelebenen des Moleküls verhalten. Für Atome, die auf einer Spiegelebene liegen, müssen für die bezüglich dieser Spiegelebene antisymmetrische Eigenschwingung die Bewegungsrichtungen senkrecht zur Spiegelebene sein, da ja nur dann die Spiegelung die Bewegungsrichtung gerade umkehrt. Entsprechend muss eine symmetrische Bewegung in der Ebene liegen. Eine der beiden Spiegelebenen des H2O-Moleküls ist die Molekülebene selbst (Abb. 2.7). Die zu dieser Ebene antisymmetrischen Bewegungsformen sind zwei Molekülrotationen und die Translation senkrecht zur Ebene. Die 6 symmetrischen Bewegungsformen mit Bewegungsrichtungen in der Molekülebene sind die zwei Translationen, eine Rotation um eine Achse senkrecht zur Ebene und die drei Eigenschwingungen (Abb. 2.7). Von diesen wiederum sind zwei symmetrisch und eine antisymmetrisch bezüglich der Spiegelebene senkrecht zur Molekülebene. Auch für kompliziertere Moleküle als das Wassermolekül lässt sich eine Klassifikation der Eigenschwingungen bzw. Elektronenzustände durchführen. Allerdings sind die Verhältnisse etwas schwieriger bei Operatoren, die zweidimensionale irreduzible Darstellungen
Abb. 2.7. Die beiden symmetrischen und die antisymmetrische Schwingungsform des Wassermoleküls. Zusammen mit den drei Rotationen und drei Translationen ergeben sich neun Bewegungsformen entsprechend den neun Freiheitsgraden
2.5 Einfache Kristallstrukturen
31
haben wie z. B. C3. Ist C3 mit H vertauschbar, so ist mit Zustand W auch C3 W ein Eigenzustand zu H . Jetzt gibt es zwei Möglichkeiten: 1) C3 W ist bis auf einen Zahlenfaktor, der bei geeigneter Normierung 1 gemacht werden kann, identisch mit W. Dann ist W also total symmetrisch bezüglich C3, und die Operation C3 kann eindimensional, nämlich durch eine Zahl, dargestellt werden. Der Zustand W ist dann – jedenfalls bezüglich der Operation C3 – nicht entartet. 2) C3 W erzeugt einen neuen, linear unabhängigen Zustand W ', der aber wegen der Vertauschbarkeit von C3 mit H auch Eigenzustand zu H mit gleichem Eigenwert E sein muss. Die Terme sind damit entartet. Da die Drehung C3 immer zwei Koordinaten betrifft, ist die irreduzible Darstellung eine zweidimensionale Matrix. Jeder Eigenzustand zu C3 lässt sich dann als Linearkombination von zwei Funktionen aufbauen, die orthonormiert gewählt werden können. Die Energieterme sind also zweifach entartet. Solche entarteten Terme gibt es bei allen Punktgruppen, die eine mehr als 2zählige Drehachse enthalten. Die in der Festkörperphysik besonders wichtigen Strukturen, die Diamantstruktur und die kubisch flächen- oder raumzentrierte Struktur, gehören zu den Punktgruppen Td bzw. Oh, d. h. sie weisen eine tetraedrische bzw. oktaedrische Symmetrie auf (Abb. 2.8, 2.10, 2.12). Die Darstellung einer solchen Symmetrie betrifft drei Koordinaten. Die Punktgruppen Td und Oh haben also dreidimensionale irreduzible Darstellungen. Entsprechend gibt es Zustände mit dreifacher Entartung. Wir werden solche Zustände in Gestalt der Eigenschwingungen dieser Gitter (Abschn. 4.5) und bei den Elektronenzuständen (Abschn. 7.4) kennenlernen. Neben den symmetriebedingten Entartungen gibt es natürlich auch solche, die durch eine spezielle Gestalt von H verursacht werden. Die Entartung bezüglich der Bahndrehimpulsquantenzahl l beim Wasserstoffatom ist bekanntlich eine Folge des 1/r-Potentials, während die Entartung bezüglich der magnetischen Quantenzahl m eine Symmetrieentartung ist. Die Kristallsymmetrie bestimmt auch die Zahl der unabhängigen Komponenten von makroskopischen Materialtensoren. Wir merken uns für später, dass Tensoren zweiter Stufe wie z. B. thermische Ausdehnung und Suszeptibilität in kubischen Kristallen eine und in hexagonalen Kristallen zwei unabhängige Komponenten haben.
2.5 Einfache Kristallstrukturen Die kubisch flächenzentrierte Struktur Die einfachsten Kristallstrukturen entstehen, wenn man sich die Punkte eines Translationsgitters mit Atomen belegt denkt. Aus
32
2. Die Struktur von Festkörpern
dem kubisch flächenzentrierten Gitter wird dann die kubisch flächenzentrierte Struktur. In ihm ist jedes Atom von 12 nächsten Nachbarn umgeben. Diese Zahl der nächsten Nachbarn in einer bestimmten Struktur wird auch als Koordinationszahl bezeichnet. Die Koordinationszahl 12 entspricht einer dichtest möglichen Packung von Kugeln. Die Zahl der nächsten Nachbarn einer solchen Kugelpackung in einer Ebene beträgt 6. Hinzu kommen je 3 nächste Nachbarn der Ebene darüber und darunter. Bezeichnet man die Gitterkonstante der flächenzentrierten Struktur mit a, so beträgt der Abstand der nächsten Nachbarn, wie aus Abb. 2.8 ersichtlich, p 1/2 a 2. Die dichtest gepackten Ebenen sind ebenfalls in Abb. 2.8 gezeigt. Sie liegen senkrecht zur Raumdiagonalen des Würfels. Schreitet man in Richtung der Raumdiagonalen fort, so trifft man auf eine identische Ebene erst wieder, nachdem zwei weitere verschiedene dicht gepackte Lagen durchschritten sind. Diese Packungsfolge wird durch Abb. 2.9 deutlicher. Eine dicht gepackte Ebene hat zwei Sorten von Lücken (in der Ebene A sichtbar). Die 2. Ebene entsteht durch Plazierung weiterer Kugeln über der einen Lückensorte, die 3. Ebene durch Plazierung über der zweiten Lückensorte. Die kubisch flächenzentrierte Struktur entsteht also durch dicht gepackte Ebenen in der Stapelfolge ABC, ABC. . .. Jede dieser Ebenen hat hexagonale Symmetrie. Gestapelt übereinander jedoch, reduziert sich die Symmetrie auf eine 3zählige Drehachse (Abb. 2.9). Die kubisch flächenzentrierte Struktur hat also drei 4zählige Drehachsen, vier 3zählige Drehachsen sowie je eine Spiegelebene senkrecht zu den 4zähligen Drehachsen und gehört deshalb zur Punktgruppe Oh. Die kubisch flächenzentrierte Struktur wird abgekürzt als fcc (face centered cubic) Struktur bezeichnet. In der fcc Struktur kristallisieren z. B. die Metalle Cu, Ag, Au, Ni, Pd, Pt und Al. Diese Metalle sind trotz vergleichsweise hohen Schmelzpunktes ziemlich weich. Ursache dafür ist die Möglichkeit des Abgleitens der dichtest gepackten Ebenen aneinander. Dieses Abgleiten erfolgt bei der plastischen Verformung allerdings nicht für eine ganze Kristallebene auf einmal, sondern an sogenannten Versetzungen (Abschn. 2.7).
Abb. 2.8 a, b. Die kubisch-flächenzentrierte Struktur mit einbeschriebener primitiver, rhomboedrischer Zelle (a). Die dichtest gepackten Ebenen sind durch strichpunktierte Linien angedeutet (b). Die Zahl der nächsten Nachbarn (= Koordinationszahl) ist 12
2.5 Einfache Kristallstrukturen
33
Abb. 2.9. Die dicht gepackten Ebenen des kubisch flächenzentrierten Gitters in der Stapelfolge ABC ABC . . .
Die hexagonal dichte Kugelpackung Die hexagonal dichte Kugelpackung (abgekürzt: hcp für hexagonal close packed) entsteht aus Ebenen dichter Kugelpackungen in der Packungsfolge AB, AB. . .. Im Gegensatz zur kubisch flächenzentrierten Struktur enthält die kleinstmögliche Elementarzelle zwei Atome. Die Hauptdrehachse ist deshalb auch nur 3zählig statt 6zählig. Wie aus Betrachtung der Lagen A und B (ohne Lage C) in Abb. 2.9 ersichtlich wird, existieren senkrecht zur 3zähligen Drehachse drei 2zählige Drehachsen. Ferner ist die hexagonal dicht gepackte Schicht auch Spiegelebene. Die hexagonal dicht Kugelpackung gehört deshalb zur Punktgruppe D3h. Wie bei der kubisch flächenzentrierten Struktur ist die Koordinationszahl 12. Wichtige Metalle, die in der hexagonal dichten Packung kristallisieren, sind Zn, Cd, Be, Mg, Re, Ru und Os. Die kubisch raumzentrierte Struktur Die kubisch raumzentrierte Struktur ist in Abb. 2.10 dargestellt. Hier beträgt die Koordinationszahl nur noch 8. Für ungerichtete Bindungen ist das raumzentrierte Gitter (bcc für body centered cu-
Abb. 2.10. Die kubisch raumzentrierte Struktur mit der Koordinationszahl 8
34
2. Die Struktur von Festkörpern
bic) also scheinbar weniger bevorzugt. Trotzdem kristallisieren alle Alkali-Metalle, ferner Ba, V, Nb, Ta, W und Mo in dieser Struktur und von Cr und Fe existieren raumzentrierte Phasen. Dieses scheint zunächst schwer verständlich. Man muss jedoch beachten, dass in der raumzentrierten Struktur die sechs übernächsten Nachbarn nur wenig weiter entfernt sind als die nächsten Nachbarn. Je nach räumlicher Ausdehnung und Art der an der Bindung beteiligten Wellenfunktionen kann somit die effektive Koordination in der bcc Struktur höher als in der fcc Struktur sein. In Abb. 2.11 ist die Elektronen-Aufenthaltswahrscheinlichkeit als Funktion des Abstandes vom Atomkern für Lithium aufgetragen. Gleichfalls angegeben sind der halbe Abstand zu den nächsten Nachbarn r1, den übernächsten Nachbarn r2 und den drittnächsten Nachbarn r3 für die tatsächlich eingenommene bcc Struktur und eine hypothetische fcc Struktur mit gleichem Abstand zu den nächsten Nachbarn. Es ist leicht erkennbar, dass unter Berücksichtigung der übernächsten Nachbarn in der bcc Struktur ein besserer Überlapp der Wellenfunktionen und damit erhöhte chemische Bindung erzielt wird. Dies gilt um so mehr, als für die kubische Struktur die p-Orbitale entlang der Kubuskanten orientiert sind und dementsprechend die p-Funktionen zur Bindung mit den übernächsten Nachbarn beitragen. Das Bild ändert sich, sobald d-Elektronen an der Bindung beteiligt werden. Die d-Orbitale sind sowohl entlang der Kubuskanten als auch entlang der Flächendiagonalen orientiert. Da d-Orbitale im Verhältnis stärker an den Atomen lokalisiert sind (s. Abb. 1.9), können sie nur zur Bindung beitragen, insoweit sie in Richtung auf die nächsten Nachbarn orientiert sind. Die fcc Struktur ermöglicht diese Bindung. Daraus erklärt sich, dass Metalle mit hohem Anteil von d-Elektronen häufig in der fcc Struktur kristallisieren.
Abb. 2.11. Absolutquadrat des Radialanteils der Wellenfunktion für Lithium als Funktion des Abstandes vom Kern. Bei der raumzentrierten Struktur fallen sowohl die 8 nächsten Nachbarn als auch die 6 übernächsten in einen Bereich hoher Aufenthaltswahrscheinlichkeit. Deswegen kann für ungerichtete metallische Bindung die kubisch-raumzentrierte Struktur energetisch günstiger als die flächenzentrierte sein. Beispiele sind die Alkalimetalle Li, Na, K, Rb, Cs und Fr. Vergleichen Sie diese Auftragung auch mit Abb. 1.9, wo die Amplitude der Wellenfunktionen, nicht die Aufenthaltswahrscheinlichkeit, dargestellt wurde. Die Abnahme bei höheren Abständen erscheint dann geringer
2.5 Einfache Kristallstrukturen
35
Die Diamantstruktur Die Diamantstruktur ermöglicht eine dreidimensionale kovalente Bindung (vgl. Abschn. 1.2), bei der jedes Atom von vier nächsten Nachbarn in tetraedrischer Konfiguration umgeben ist (Abb. 2.12). Die Koordinationszahl beträgt also 4. In der Diamantstruktur kristallisieren Kohlenstoff, Silizium, Germanium und -Zinn. Die Diamantstruktur lässt sich darstellen durch zwei ineinandergestellte, kubisch flächenzentrierte Strukturen, die entlang der Raumdiagonalen verschoben sind. Die Verschiebung beträgt, ausgedrückt in den Komponenten des Basisvektors, (a/4, a/4, a/4), mit a der Gitterkonstanten. p Der Abstand zu den nächsten Nachbarn beträgt also a 3/4. Da der Abstand der dichtgepackten Ebenen in der flächenzentrierpkubisch ten Struktur entlang der Raumdiagonalen 3 a/3 ist, ist die Höhe gegenüber der Basis des Zentralatoms in einem Tetraeder 1/4 der Höhe des Tetraeders gemessen von der Basis bis zur Spitze.
Abb. 2.12. Die Diamantstruktur. Sie entsteht durch zwei ineinander gestellte kubisch-flächenzentrierte Strukturen, die entlang der Raumdiagonalen um 1/4 der Diagonalenlänge gegeneinander verschoben sind. Die Diamantstruktur ist typisch für die kovalent gebundenen Elemente der IV-Gruppe des Periodensystems (C, Si, Ge, -Sn), ferner für III-V-Verbindungen, wobei die Plätze (000) und (1/4 1/4 1/4) jeweils durch die beiden verschiedenen Atome besetzt sind (ZnS-Typ)
Die Zinkblendestruktur Die Zinkblendestruktur entsteht aus der Diamantstruktur, indem beide konstituierenden fcc Strukturen mit verschiedenen Atomsorten besetzt werden. In der Struktur vom ZnS-Typ kristallisieren die wichtigsten Verbindungen aus Elementen der III-ten und der V-ten Gruppe des Periodensystems, also z. B. GaAs, GaP, InSb etc. Ferner hat natürlich die Verbindung ZnS, von der ja die Struktur ihren Namen hat, die „Zinkblendestruktur“. Diese Namensgebung ist insofern nicht ganz glücklich, weil ausgerechnet die Verbindung ZnS auch in einer verwandten, hexagonalen Phase, der Wurtzitstruktur, existiert. Diese Struktur hat eine tetraedrische Konfiguration der nächsten Nachbarn wie im ZnS-Typ, jedoch ist die Packungsfolge der (111)-Ebenen nicht ABC ABC . . . sondern ABAB . . . , wodurch die hexagonale Struktur entsteht, wie wir bereits gesehen haben. Die Wurtzitstruktur wird auch von anderen Verbindungen der II-ten und VI-ten Gruppe des Periodensystems angenommen (ZnO, ZnSe, ZnTe, CdS, CdSe). Statt der geordneten Packungsfolgen ABAB . . .
36
2. Die Struktur von Festkörpern
bzw. ABC ABC . . . kann man auch Mischformen mit zufälliger Stapelung oder langen Perioden beobachten, so z. B. bei SiC (Polytypie). Ionenstrukturen Als typische Kristallstrukturen für die Ionenbindung hatten wir schon in Abschn. 1.3 die CsCl-Struktur und die NaCl-Struktur kennengelernt (Abb. 1.6). Die CsCl-Struktur leitet sich von der kubisch raumzentrierten (bcc) Struktur ab, indem man die raumzentrierte Position mit der anderen Ionensorte besetzt. Die NaClStruktur ergibt sich durch Ineinanderstellen von zwei kubisch flächenzentrierten Strukturen (Abb. 1.6). Die Koordinationszahl in der CsCl-Struktur ist 8, in der NaCl-Struktur nur 6. Wie wir schon in Abschn. 1.3 gesehen haben, ist der Madelung-Faktor und damit die ionische Energie bezogen auf den gleichen Ionenabstand in der CsCl-Struktur größer. Die Unterschiede sind verhältnismäßig gering. Es scheint aber trotzdem verwunderlich, dass die meisten Ionenkristalle im NaCl-Typ kristallisieren. Jedoch lässt sich diese Tatsache verstehen: In den meisten Fällen ist der Radius des Kations sehr viel kleiner als der des Anions. Beispiel:
rNa 0;98 A
rCl 1;81 A : Ein großes Kation ist dagegen das Cäsium
rCs 1;65 A : Mit kleiner werdendem Kation geraten in der CsCl-Struktur die Anionen in Kontakt. Dies geschieht bei einem Radienverhältnis r +/ r – = 0,732. Bei weiterer Verkleinerung des Kations könnte sich dann die Gitterkonstante nicht mehr reduzieren und die CoulombEnergie bliebe konstant. In diesem Fall ist der NaCl-Typ günstiger, bei dem Anionenkontakt erst bei r +/r– = 0,414 auftritt. Noch extremere Radienverhältnisse gestattet die ZnS-Struktur. Tatsächlich ist das Verhältnis der Ionenradien bei ZnS r+/r– = 0,40. Dies kann man als eine Erklärung dafür betrachten, dass ZnS nicht in der NaClStruktur kristallisiert. Bei dieser Betrachtung wird allerdings der starke kovalente Anteil der Bindung vernachlässigt.
2.6 Phasendiagramme von Legierungen Moderne Funktionswerkstoffe bestehen aus einer Vielzahl von Elementen in unterschiedlichen Phasen. Unter einer Phase verstehen wir einen Bereich homogener Konzentration und Struktur auf einer Längenskala, die groß gegen atomare Dimensionen ist. Unterschiedliche Phasen lassen sich schon bei einfachen binären Legie-
2.6 Phasendiagramme von Legierungen
37
rungen beobachten. Abb. 2.13 zeigt z. B. das Schliffbild einer Ag/ Cu-Legierung im Rasterelektronenmikroskop. Die kupferreiche fcc-Phase wird dunkel und die silberreiche fcc-Phase wird hell dargestellt.
Abb. 2.13. Rasterelektronenmikroskopische Aufnahme eines Anschliffs einer Ag/Cu Legierung mit 30% Ag- und 70% Cu-Atomen. Die dunklen Bereiche bestehen aus einer fcc-Phase mit ca. 95% Cu-Atomen und die hellen Bereiche aus einer fcc-Phase mit ca. 86% Ag-Atomen
Die verschiedenen Phasen eines realen Werkstoffs befinden sich insbesondere bei modernen Werkstoffen in der Regel nicht im thermodynamischen Gleichgewicht. Trotzdem bildet das Verhalten im Gleichgewicht die Grundlage des Verständnisses. Die Beschreibung des Gleichgewichtsverhaltens erfolgt anhand von Phasendiagrammen. In ihnen werden auf der Ordinate die Temperatur und auf der Abszisse die Atomkonzentration einer Komponente (zu Lasten einer zweiten) aufgetragen. Zu einer festen Temperatur und einer definierten Bruttozusammensetzung ergibt sich im Gleichgewicht ein bestimmter Zustand der Materie. Die Grenzen zwischen Bereichen unterschiedlicher Zustände, im einfachsten Fall zwischen festem und flüssigem Zustand, werden durch Linien markiert. Für zahlreiche wichtige Legierungssysteme sind diese Phasendiagramme durch detaillierte thermodynamische Messungen experimentell bestimmt worden [2.2]. Wir wollen im folgenden nur den einfachen Fall der Phasendiagramme binärer Substitutionslegierungen betrachten. Substitutionslegierungen bestehen aus zwei Sorten von Atomen A und B, die jeweils als reine Materialien in der gleichen Struktur kristallisieren. Wenn zusätzlich die Bindungsart ähnlich ist und die Gitterkonstante sich nicht sehr unterscheidet, werden bei dem zweikomponentigen System die Atome A und B auf den gleichen Kristallgitterplätzen sitzen. Selbst für diesen allereinfachsten Fall gibt es eine Reihe verschiedener möglicher Zustände: der flüssige Zustand mit beliebiger Durchmischung der beiden Komponenten, eine Mischung aus flüssiger Phase mit einer festen Phase, bei der die Atomsorte A an-
38
2. Die Struktur von Festkörpern
Si-Konzentration (Gewicht %) 5
10
20
30
40
70
50
90
1500
Abb. 2.14. Phasendiagramm für die im festen Zustand beliebig mischbare Legierung Ge/Si. In dem durch die Liquidus- und Soliduskurven umgrenzten Bereich gibt es eine Koexistenz einer Gereichen flüssigen Phase mit einer Si-reichen festen Phase
Temperatur (°C)
1412 °C
1300
+s 1100
s 940 °C
900
0
20
40
60
80
100
Si-Konzentration (Atom %) Abb. 2.14
gereichert ist, eine entsprechende Mischung, bei der die Atomsorte B angereichert ist, eine feste Phase mit Mikrokristalliten aus einer Areichen und einer B-reichen Phase oder eine kontinuierlich mischbare feste Phase. Das allereinfachste Phasendiagramm ergibt sich für die binären Legierungen, die im festen Zustand kontinuierlich mischbar sind. Ein Beispiel ist die Legierung SiGe. Das zugehörige Phasendiagramm ist in Abb. 2.14 dargestellt. In Abhängigkeit von der Temperatur und dem relativen Si-Gehalt kann die Legierung entweder als homogene Flüssigkeit (l für liquidus), als homogener Festkörper (s für solidus) oder als Zweiphasensystem mit festen und flüssigen Anteilen (l + s) vorliegen. Die Existenzbereiche der verschiedenen Phasen sind durch die sog. Liquidus- und Soliduskurven voneinander getrennt. Eine weitere Substitutionslegierung ist AgCu. Hier ist das Phasendiagramm schon sehr viel komplexer (Abb. 2.15). Der Grund ist, dass im Fall von AgCu die feste Phase nicht kontinuierlich mischbar ist. Cu ist in Ag nur bis zu einem bestimmten Prozentsatz löslich, der von der Temperatur abhängt (a-Phase, Abb. 2.15 links). Umgekehrt ist auch Ag in Cu nur bis zu einem von der Temperatur abhängigen Prozentsatz löslich (b-Phase, Abb. 2.15 rechts). In dem Zwischenbereich, in der sog. Mischungslücke, besteht der Festkörper aus mikrokristallinen Bereichen einer Ag-reichen aPhase und einer Cu-reichen b-Phase (vgl. dazu Abb. 2.13). Die Größe der Mikrokristallite ist in realen Systemen in der Regel kinetisch bedingt. Allerdings gibt es auch durchaus eine Gleichgewichtsgröße der Kristallite. Sie ist durch ein Minimum der Summe aus der Grenzflächenenergie zwischen den Mikrokristallen und der elastischen Verformungsenergie in den Mikrokristallen bestimmt. Die elastische
2.6 Phasendiagramme von Legierungen
39
Cu-Konzentration (Gewicht %) 20
10
30
60
40
80 1085 °C
962 °C
1000
liq.
Temperatur (°C)
β+liq. 800
α α+liq.
600
39.9%
β
779 °C
95.1%
13.5 %
Abb. 2.15. Phasendiagramm für die binäre Ag/Cu-Legierung. Das System ist im festen Zustand nicht beliebig mischbar, sondern es existiert eine breite Mischungslücke, in der eine Ag-reiche fccPhase (-Phase) neben einer Cu-reichen fcc-Phase (b-Phase) existiert (s. auch Abb. 2.13)
α+ β
400 200 0
0
20
40
60
80
100
Cu-Konzentration (Atom %) Abb. 2.15
Verformungsenergie ist eine Folge der unterschiedlichen natürlichen Gitterkonstanten der Mikrokristallite. Der Aufwand an Verformungsenergie wird um so geringer je kleiner die Verformungsvolumina, also die Kristallite sind. Gleichzeitig wächst aber die Größe der Grenzfläche zwischen den Kristalliten, so sich ein Minimum bei einer bestimmten Größenverteilung ergibt. Im weiteren Verlauf dieses Abschnitts wollen wir auf der Basis thermodynamischer Betrachtungen zu einem Verständnis der Ursache für die unterschiedlichen Phasendiagramme der beiden Substitutionslegierungen SiGe und AgCu gelangen. Wie wir oben gesehen haben, ist der entscheidende Unterschied zwischen beiden Systemen die Möglichkeit bzw. Unmöglichkeit einer kontinuierlichen Mischung. Unsere thermodynamische Betrachtung wird sich deshalb auf die mit einer Mischung verbundene freie Enthalpie konzentrieren. Bekanntlich ist die freie Enthalpie G eines Systems eine Linearkombination aus innerer Energie U, Entropie S und mechanischer (und anderer) Arbeit. Im einfachsten Fall eines homogenen, flüssigen oder gasförmigen Stoffes ist G GU
TS pV ;
2:4
wobei T die Temperatur, p der Druck und V das Volumen sind. Für einen festen Körper ist der Term für die mechanische Arbeit komplizierter. Neben der Arbeit gegen einen äußeren Gasdruck muss auch die mechanische Arbeit verknüpft mit den inneren Freiheitsgraden des Systems (siehe die Diskussion oben) berücksichtigt werden. Dieser Anteil ist sehr schwierig zu behandeln (siehe auch Abschn. 4.5). Glücklicherweise stellen Mischungsentropie und Mi-
40
2. Die Struktur von Festkörpern
schungsenergie die qualitativ wichtigsten Beiträge. Wir werden deshalb im folgenden nur diese beiden Beiträge betrachten und den Beitrag der mechanischen Arbeit oder sonstige Arbeitsbeiträge, z. B. elektrischer oder magnetischer Art, vernachlässigen. Ebenso vernachlässigen wir im ersten Schritt die thermischen Beiträge. Für die Berechnung der Mischungsenergie und Mischungsentropie müssen wir noch eine zusätzliche Näherung machen. Diese besteht darin, dass wir nur homogen gemischte Phasen zulassen, also örtliche und zeitliche Fluktuationen in den Konzentrationen ausschließen. Dies entspricht einer Molekularfeldnäherung (engl. mean field approximation), die uns noch öfter begegnen wird. In dem Zusammenhang hier heißt sie Bragg-Williams Näherung. Die mit einer Mischung verbundene Enthalpieänderung Gmix besteht also aus einer Änderung der inneren Energie Umix, die nichts anderes als die Lösungswärme darstellt, und einer Änderung der Entropie durch die Mischung Smix Gmix Umix
T Smix :
2:5
Wir berechnen zunächst die Änderung der inneren Energie unter der Annahme, dass sich die Bindungsenergien der beteiligten Atome als paarweise Wechselwirkung zwischen benachbarten Atomen schreiben lassen. Dieser einfache Ansatz entspricht in der Regel nicht der Realität, muss uns aber hier genügen. Wir bezeichnen VAA, VBB und VAB als die Bindungsenergien (positive Zahlenwerte) eines benachbarten AA-, BB- und AB-Atompaares und z als die Koordinationszahl (Anzahl der nächsten Nachbarn) der Struktur. Für die Diamantstruktur (Si, Ge) ist z = 4, für die fcc-Struktur (Ag, Cu) ist z = 12. Wir bezeichnen ferner mit NA und NB die Anzahl der Atome A und B und mit NAA, NBB und NAB die Anzahl der Bindungen zwischen zwei Atomen der Sorte A oder B und der Sorte A mit B. Die Energiedifferenz Umix durch Mischen ist damit Umix
NAA VAA NBB VBB NAB VAB 1
z NA VAA z NB VBB : 2
2:6
Die Summe der ersten drei Terme ist die Energie nach der Mischung und die Summe der letzten beiden Terme die Energie vor der Mischung. Der Faktor ½ tritt auf, weil zu jedem Atom z/2 Bindungen gehören. Bezüglich der Vorzeichen in (2.6) beachte man, dass die Definition von Bindungsenergie und innerer Energie ein umgekehrtes Vorzeichen implizieren: Eine höhere Bindungsenergie entspricht einer niedrigeren inneren Energie. Die Zahl der Atompaare NAA, NBB und NAB kann durch die Konzentrationen xA NA =N xB NB =N mit N NA NB
2:7
2.6 Phasendiagramme von Legierungen
41
ausgedrückt werden, und zwar gilt: NAA NA xA z=2 N x2A z=2 NBB NB xB z=2 N x2B z=2
2:8
NAB NA xB z=2 N xA xB z=2 : Damit wird aus der Mischungsenergie Umix Umix N z xA xB WAB
2:9
mit 1 WAB
VAA VBB 2
VAB :
2:10
Ist WAB < 0 so hat die Legierung eine höhere Bindungsenergie und die innere Energie der Legierung ist niedriger als die Summe der inneren Energien der Komponenten. Wegen xA+xB = 1 hat die Mischungsenergie in diesem Modell die Form einer Parabel. Umix N z xA
1
xA WAB :
2:11
Mit der Mischung zweier Komponenten ist stets eine Entropievergrößerung verbunden, weil eine Mischung mikroskopisch auf verschiedene Weise realisiert werden kann. Die verschiedenen mikroskopischen Zustände entstehen durch Vertauschung der Atome A mit denen von B. Die Zahl der Vertauschungsmöglichkeiten aller Atome N = NA+NB ist N!. Die Vertauschung von Atomen der Sorte A oder B jeweils untereinander ergibt keinen veränderten Zustand. Die Zahl der unterscheidbaren Zustände ist also N!/(NA! NB!). Die Mischungsentropie wird damit Smix k ln
N! N! k ln NA ! NB !
N xA !
N xB !
2:12
Unter Benutzung der Stirling-Formel ln N! N ln N erhält man Smix
N k xB ln xB
1
xB ln
1
xB :
N; N 1
2:13
Der Wert von Smix ist Null für xB = 0 und xB = 1 und positiv für alle Zwischenwerte. Die freie Enthalpie der Mischung ist Gmix Umix T Smix Nfz xB
1 xB WAB k T xB ln xB
1 xB ln
1 xB g : (2.14) Die Funktion hat einen Extremalwert bei xB = 0,5. Ob es sich dabei um ein Minimum oder ein Maximum handelt, hängt vom Verhältnis von WAB zu k T ab. Es ergibt sich
Abb. 2.16. Freie Enthalpie einer Mischung gemäß einem einfachen Modell (2.14). Die voll ausgezogene Kurve entspricht dem Grenzfall, bei dem gerade noch kein Zwischenmaximum in der freien Enthalpie auftritt. Wenn ein Zwischenmaximum auftritt, so ist das System in einem Konzentrationsbereich instabil gegen den Zerfall in eine NBarme und eine NB-reiche Phase, und zwar unabhängig davon, ob insgesamt gegenüber den unlegierten Komponenten freie Enthalpie gewonnen wird oder nicht (gepunktete und gestrichelte Linie)
2. Die Struktur von Festkörpern
Gmix/N k T
42
zWAB/k T= 3 zWAB/k T= 2.5 zWAB/k T= 0.5
ein Minimum fur z WAB =k T < 0; 5 ;
2:15
ein Maximum fur z WAB =k T > 0; 5 :
2:16
Beispiele für z WAB/k T = 0,5, 2,5 und 3 sind in Abb. 2.16 dargestellt. Für negative Werte von WAB ist die freie Enthalpie der Mischung in jedem Fall kleiner als die Summe der freien Enthalpie der ungemischten Systeme. Ein solches System ist in beliebigem Konzentrationsverhältnis mischbar. Das gleiche gilt für jedes System, wenn nur die Temperatur genügend hoch ist (2.14). Wenn die freie Enthalpie bei xB = 0,5 ein Maximum aufweist, ist das System instabil und zerfällt in zwei Phasen mit einer Konzentration x 0B < 1=2 und x 00B > 1=2 und zwar unabhängig davon ob die Mischungsenthalpie selber größer oder kleiner als null ist. Für den symmetrischen Fall in Abb. 2.16 ist leicht zu sehen, dass diese Instabilität nicht nur bei xB = 1/2 auftritt sondern für den ganzen Bereich zwischen den beiden Minima in der Kurve für die freie Enthalpie. Der allgemeinere Fall eines asymmetrischen Verlaufs der freien Enthalpie wird in Abb. 2.17 betrachtet. Wenn das System in zwei Phasen mit zwei verschiedenen Konzentrationen x 0B und x 00B mit den zugehörigen freien Enthalpien G 0 und G 00 zerfällt, so müssen diese beiden Phasen miteinander im Gleichgewicht stehen, d. h. die chemischen Potentiale der beiden Phasen müssen gleich sein. Die chemischen Potentiale der Phasen G 0 und G 00 bezüglich der Teilchensorte NB sind l 0B l 00B
@ G0 1 @ G0 @ NB N @ xB
@ G 00 1 @ G 00 : @ NB N @ xB
(2.17)
Freie Enthalpie G
2.6 Phasendiagramme von Legierungen
43
''
G(x )
G(x0) '
G(x )
'
0
xB
xB0
''
xB
1
Konzentration xB
Abb
Das System zerfällt also in zwei Phasen, für welche die Steigung der freien Enthalpie (Abb. 2.17) gleich ist. Unter der Mannigfaltigkeit aller Punktepaare auf der Kurve von G, welche die Bedingung der Steigungsgleichheit erfüllen, ist die freie Enthalpie des Gesamtsystems minimal für das Punktepaar x 0B und x 00B , durch das sich eine gemeinsame Gerade als Tangente legen lässt (Abb. 2.17). Durch diese Doppeltangentenkonstruktion sind die Konzentrationen x 0B und x 00B eindeutig festgelegt. Man kann nun durch einige geometrische Betrachtungen zeigen, dass der gesamte Konzentrationsbereich zwischen x 0B und x 00B instabil ist. Wir betrachten dazu eine beliebige Konzentration xB0 zwischen den Punkten x 0B und x 00B . Die Massenerhaltung bei der Phasentrennung verlangt, dass für die Atomzahlen N 0 und N 00 in den Phasen die Relation N 0 x 0B N 00 x 00B
N 0 N 00 xB0
2:18
gelten muss. Daraus folgt, dass sich die Atomzahlen wie die Achsenabschnitte auf der Doppeltangente verhalten müssen. N0 x 00B N 00 xB0
xB0 : x 0B
2:19
Ein entsprechendes Gesetz gilt für die Atomzahlen der Komponente A. Dieses einfache Gesetz zur Beschreibung der Verhältnisse der Atomzahlen erinnert an das Hebelgesetz in der Mechanik und wird deshalb als das Hebelgesetz der Zustandsdiagramme bezeichnet. Es gilt für jede Phasentrennung gleich welcher Ursache sie ist. Nach erfolgter Phasentrennung ist die freie Enthalpie des Systems G
x 0B ; x 00B G
x 0B N 0 =N G
x 00B N 00 =N :
Abb. 2.17. Freie Enthalpie einer Legierung mit einem Zwischenmaximum und zwei Minima unterschiedlicher Tiefe. In dem Konzentrationsbereich zwischen den Berührungspunkten der Doppeltangente bei x 0B und x 00B ist das System instabil und zerfällt in zwei Phasen mit den Konzentrationen x 0B und x 00B . Die freie Enthalpie des Zweiphasensystems wird dann gerade durch die Doppeltangente beschrieben
2:20
44
2. Die Struktur von Festkörpern
Durch Einsetzen von (2.19) und geeignete Umformung lässt sich dieser Wert als G
x 0B ; x 00B G
x 0B G
x 00B
G
x 0B
xB0 x 00B
x 0B x 0B
2:21
schreiben. Das ist aber gerade der Ordinatenwert der Doppeltangente am Punkt x0. Die Doppeltangente beschreibt also den Wert der freien Enthalpie nach der Phasentrennung. Da die Werte im gesamten Bereich zwischen x 0B und x 00B unter dem Wert für die freie Enthalpie vor der Phasentrennung liegt (Abb. 2.17), ist in diesem Bereich das System instabil gegenüber einer Phasentrennung. Angewandt auf binäre Legierungen spricht man von einer Mischungslücke. Eine solche liegt bei der Ag/Cu Legierung vor, wie man aus dem Phasendiagramm (Abb. 2.15) entnehmen kann. Kühlt man eine Schmelze von 40 Atom % Silber und 60 Atom% Kupfer ab, so wird zunächst die b-Phase mit ca. 95% Cu ausgeschieden. Die verbleibende Schmelze reichert sich mit Ag an bis am sog. eutektischen Punkt bei der Temperatur von 7798C und einer Cu-Konzentration von 39.9% sich die b-Phase (95,1% Cu) und die silberreiche -Phase (85,9% Ag) gemeinsam abscheiden. Bei weiterer Abkühlung des Systems müssten sich eigentlich die Konzentrationen in den beiden noch weiter verändern (Abb. 2.15). Wegen der geringen Diffusivität der Atome im festen Zustand lässt sich das aber nur durch sehr langsames Abkühlen erreichen. Die Konzentrationen in den dunklen und hellen Bereichen von Abb. 2.15 entsprechen in etwa den Gleichgewichtskonzentrationen der - und bPhase am eutektischen Punkt. Die thermodynamischen Betrachtungen lassen sich auch auf den Phasenübergang binärer Legierungen von flüssig nach fest anwenden. Wir betrachten dazu die freie Enthalpie eines beliebig mischbaren Systems im festen und flüssigen Zustand (Abb. 2.18). Das System ist beliebig mischbar, wenn die freie Enthalpie durch eine Kurve mit durchweg positiver Krümmung dargestellt werden kann. Zu einer Koexistenz von flüssiger und fester Phase kommt es dann, wenn die Minima der freien Enthalpie der flüssigen und der festen Phase gegeneinander verschoben sind. In Abb. 2.19 sind die Verhältnisse noch einmal so dargestellt, dass sie in etwa dem System Ge/Si entsprechen. Wir betrachten zunächst den Fall hoher Temperatur T > 1412 8C. Dort liegt die freie Enthalpie der Schmelze für jede Konzentration unter der des festen Zustandes. Dies liegt an dem entropischen Beitrag zur freien Enthalpie. Bei hohen Temperaturen ist die Entropie für die flüssige Phase höher als für die feste, weil eine Flüssigkeit viele Anregungsmöglichkeiten niedriger Quantenenergie aufweist: Vereinfacht gesprochen werden aus den Freiheitsgraden der transversalen Schallwellen im Festkörper Freiheitsgrade der Translation in der Schmelze. Bei einer Temperatur von 1412 8C werden die freien Enthalpien der beiden Phasen für die Konzentration xSi = 1 gerade gleich. Hier können also Schmelze und Festkörper ko-
2.6 Phasendiagramme von Legierungen
45
< 940 °C
0.5
feste Phase
Freie Enthalpie
Freie Enthalpie
940 °C
flüssige Phase
0.0
1150 °C
G fest xSi(flüssig)
xSi(fest)
1412 °C > 1412 °C
0
xB(flüssig)
xB(fest)
Konzentration xB
0
1
Konzentration xSi
1
Abb
Abb. 2.18. Freie Enthalpie des festen und flüssigen Zustands einer im festen Zustand beliebig mischbaren Legierung im Temperaturbereich zwischen der Liquidus- und Solidus-Kurve
Abb. 2.19. Freie Enthalpien für das System Ge/Si bei verschiedenen Temperaturen als Funktion der Si-Konzentration xSi (schematisch)
existieren. Mit anderen Worten: wir haben den Schmelzpunkt für reines Silizium erreicht. Bei noch tieferen Temperaturen, z. B. bei 1150 8C, hat man gemäß der Doppeltangentenkonstruktion eine Koexistenz einer Si-armen, flüssigen Phase mit einer Si-reicheren, festen Phase. Unterhalb von 940 8C schließlich gibt es nur noch eine feste Phase für jedes Mischungsverhältnis. Führt man den beschriebenen Abkühlungsprozess mit einer Schmelze von endlichem Volumen mit einem festen Mischungsverhältnis von z. B. 50 Atom% Ge und 50 Atom% Si durch, so werden sich zunächst bei einer Temperatur knapp unterhalb von ca. 1270 8C Kristalle mit einer Konzentration von ca. 80% Si abscheiden. In dem Temperaturbereich zwischen der Liquidus- und Soliduskurve sind die Gleichgewichtskonzentrationen von Si in der flüssigen und festen Phase jeweils durch den Abszissenwert der Liquidus- und Soliduskurve gegeben. Die Verhältnisse der Atomzahlen in den beiden Phasen richten sich nach dem Hebelgesetz (2.19). Mit sinkender Temperatur steigt der Anteil der festen Phase, deren Si-Konzentration sich dabei kontinuierlich verändert. Bei kontinuierlich mischbaren Systemen ist es also nicht möglich, aus der Schmelze einen Kristall mit homogener Konzentration zu ziehen, es sei denn man beschränkt sich darauf, nur einen sehr geringen Bruchteil der Schmelze zu kristallisieren. Die unterschiedliche Gleichgewichtskonzentration in der Schmelze und im Festkörper kann man sich aber zunutze machen, um Kristalle von Verunreinigungen zu befreien. Darauf beruht das technisch wichtige Verfahren des Zonenreinigens. Bei diesem Verfahren wird zunächst am Ende eines Kristallstabs eine Zone aufgeschmolzen. In dieser Schmelzzone sind die Verunreinigungskonzentrationen zunächst noch wie sie im Kristall waren. Dann zieht man die Schmelzzone langsam über den Kristallstab hinweg. Wenn
Abb. 2.19
46
2. Die Struktur von Festkörpern
die Liquidus- und Soliduskurven bezüglich einer Verunreinigung so wie in Abb. 2.14 beschaffen sind (für Si als Grundmaterial und Ge als Verunreinigung), hat der in der Abkühlzone neu entstehende Kristall eine geringere Konzentration an Verunreinigungen als (jeweils) in der Schmelzzone. Die Verunreinigungen werden also durch das Zonenschmelzen in dem Teil des Kristalls angereichert, welcher zum Schluss aufgeschmolzen wird. Durch vielfaches Wiederholen des Vorgangs kann man schließlich die Verunreinigungen weitgehend in ein Endstück des Kristalls schieben, das dann nicht verwertet wird.
2.7 Defekte in Festkörpern Mechanische und elektrische Eigenschaften von Festkörpern werden maßgeblich von Defekten in der periodischen Struktur bestimmt. In diesem Abschnitt geben wir einen kurzen Überblick über die verschiedenen Defekte. Einen speziellen Defekt haben wir im vorigen Abschnitt im Zusammenhang mit Legierungen kennengelernt. Bei einer verdünnten Substitutionslegierung sitzen Fremdatome auf den Plätzen der Majoritätsatome. Bei Halbleitern lässt sich mit Hilfe solcher Fremdatome, einer „Dotierung“, die elektrische Leitfähigkeit über viele Größenordnungen steuern. Die Dotierung von Halbleitern wird in Kap. 12 besprochen werden. Besteht der Defekt nur aus einem oder wenigen Atomen wie im Fall einer Dotierung, so spricht man von Punktdefekten. Punktdefekte müssen nicht notwendigerweise durch Fremdatome gebildet werden. So können Atome aus ihren regulären „Gitterplätze“ in die Räume zwischen die Atome auf „Zwischengitterplätze“ verschoben werden. Ein solcher Defekt wird Frenkel-Defekt genannt. Das Atom auf dem Zwischengitterplatz und die entstandene Lücke werden zusammen als Frenkel-Paar bezeichnet. Die Bildung eines FrenkelPaares kostet Energie, da das Atom auf dem Zwischengitterplatz schlechter gebunden ist. Trotzdem bilden sich bei höherer Temperatur im thermischen Gleichgewicht Frenkel-Paare, weil ihre Bildung mit einer Entropievermehrung verbunden ist. Sie ergibt sich daraus, dass Lücke und Zwischengitterplatz je für sich auf allen Atom- bzw. Lückenplätzen sitzen können. Eine bestimmte Anzahl von nl Lücken und von nzw Zwischengitterplätzen kann also mikroskopisch auf verschiedene Weise realisiert werden. Die Zahl der Möglichkeiten nl Lücken unterscheidbar auf N Atomplätze zu verteilen ist N!/[nl!(N–nl)!]. Ebenso ist die Zahl der Möglichkeiten nzw Zwischengitteratome auf N ' Zwischengitterplätze zu verteilen N'!/[nzw!(N'–nzw)!]. Bei einem Frenkel-Paar ist die Zahl der Zwischengitteratome nzw notwendigerweise gleich der Zahl der Lücken nl. Mit n = nzw = nl erhält man für die Entropie S (vgl. (2.12)).
2.7 Defekte in Festkörpern
S k ln
47
N! N 0! k ln n!
N n! n!
N 0 n!
k N ln N N 0 ln N 0
N
0
n ln
N
0
2n ln n
N n ln
N n
(2.22)
n :
Im Gleichgewicht stellt sich der Zustand niedrigster freier Energie F = n D E – TS ein, mit D E der Energie für die Bildung eines Frenkel-Paares. Die zugehörige Gleichgewichtskonzentration hni erhält man durch Differenzieren der freien Energie nach n dF 0 D E k T ln
N 0 dn
hni2 hni
N
hni
:
2:23
Da die Konzentration von Defekten klein ist
hni N; N 0 , ist hni näherungsweise gegeben durch p DE=2 k T :
2:24 hni N N 0 e Die Konzentration steigt also exponentiell mit der Temperatur gemäß einem Arrhenius-Gesetz. Die Aktivierungsenergie ist gleich der halben Bildungsenergie eines Frenkel-Paares. Der Faktor 2 im Nenner des Exponenten entsteht dadurch, dass sowohl die Lücke als auch das Atom im Zwischengitter unabhängig voneinander im Kristall verteilt sind und man deshalb zwei unabhängige Beiträge zur Entropie erhält. Wandert das Atom von einem Gitterplatz zur Oberfläche („Schottky-Defekt“), so hat es dort weniger Plätze zur Verfügung. Im Limes makroskopischer Körper verschwindet die Zahl der Oberflächenplätze gegen die Zahl der Plätze im Volumen. Dann tragen nur die Lücken zur Entropie bei und im ArrheniusGesetz erscheint als Aktivierungsenergie die volle Bildungsenergie. Neben den Punktdefekten gibt es auch linienhafte Defekte, die Versetzungen. Ein einfaches Beispiel für eine Versetzung ist in Abb. 2.20 dargestellt. Die Linienhaftigkeit der Versetzung ergibt sich daraus, dass man sich den Kristall außerhalb der Darstellungsebene fortgesetzt denken muss. Versetzungen werden durch den Burgersvektor beschrieben. Richtung und Betrag des Burgersvektors ermittelt man aus der Betrachtung eines beliebigen geschlossenen Umlaufs um eine Versetzungslinie. Man vergleicht dazu die Positionen des Atoms, bei dem der Umlauf abgeschlossen wurde, für einen Kristall ohne und mit Versetzung (Abb. 2.20). Steht der Burgersvektor senkrecht auf der Versetzungslinie wie in Abb. 2.20, so wird die Versetzung als Stufenversetzung bezeichnet. Liegt der Burgersvektor dagegen in Richtung der Versetzungslinie, so nennt man die Versetzung eine Schraubenversetzung, weil man sich bei jedem Umlauf um die Versetzungslinie schraubenartig von einer Atomebene in die nächste bewegt. Zwischen den beiden Grenzformen Stufenversetzung und Schraubenversetzung gibt es beliebige Mischformen. Auch kann eine Versetzung entlang der Versetzungslinie kontinuierlich von einer Idealform in die andere übergehen. Bei einer gewöhnlichen Schrau-
48
2. Die Struktur von Festkörpern
b A
B
Abb. 2.20. Schnitt durch einen Kristall mit einer Stufenversetzung (schematisch). Die gestrichelte Linie stellt einen Umlauf um die Versetzung dar. Wäre die Versetzung nicht vorhanden, so wäre der Umlauf, der am Atom A beginnt, schon beim Atom B abgeschlossen. Der Burgersvektor b zeigt von Atom A nach Atom B. Nach Richtung und Betrag der gleiche Vektor ergibt sich für jeden anderen Umlauf der die Versetzung einschließt
ben- und Stufenversetzung ist der Betrag des Burgersvektors gleich dem Abstand atomarer Ebenen. Es gibt aber auch Versetzungen, wo die Länge des Burgersvektors nur ein Bruchteil eines Ebenenabstands beträgt. Eine solche Partialversetzung entsteht z. B., wenn man bei einem fcc Kristall die dicht gepackten Ebenen (Abb. 2.9) gegeneinander verschiebt und dabei einen Stapelfehler erzeugt. Versetzungen spielen eine große Rolle bei der plastischen Verformung von Kristallen. Man stelle sich vor, eine Scherkraft wirke parallel zu einer Atomebene. Eine Abgleitung der ganzen Ebene auf einmal ist nicht möglich, da dann alle Atombindungen zwischen den Ebenen gleichzeitig beansprucht würden. Statt dessen ist es energetisch günstiger, wenn an der Oberfläche eine Stufenversetzung gebildet wird, die anschließend durch den Kristall geschoben wird. Dann muss nicht mehr die ganze Ebene auf einmal abgleiten, sondern die Abgleitung erfolgt Atomreihe für Reihe, bis die Versetzung durch den Kristall gewandert ist. Der Kraftaufwand für die Versetzungswanderung ist viel geringer, da Bindungen nicht gebrochen, sondern nur verlagert werden müssen. Plastische Verformungen sind also mit der Erzeugung und Wanderung von Versetzungen verbunden. Bei idealen Kristallen, z. B. von Metallen, wandern Versetzungen häufig sehr leicht. Ist das gleiche Material dagegen polykristallin, so wird die Versetzungswanderung durch die Korngrenzen zwischen den einkristallinen Bereichen eingeschränkt und das Material setzt einer plastischen Verformung größeren Widerstand entgegen.
Übungen zu Kapitel 2
2.1 Der Phasenübergang vom Graphit zum Diamant verlangt hohen Druck und hohe Temperaturen, um das Gleichgewicht in Richtung Diamant zu schieben. Hohe Temperaturen sind auch erforderlich zur Überwindung der Aktivierungsbarriere. Schlagen Sie eine Methode vor, mit der man Diamant(-schichten) ohne die Anwendung hoher Drücke herstellen kann! 2.2 Unterhalb von 910 °C liegt Eisen in der bccStruktur (-Fe), zwischen 910 °C und 1390 °C in der fcc-Struktur (c-Fe) vor. Bestimmen Sie (unter Annahme kugelförmiger Atome) die Form und Größe der oktaedrischen Zwischengitterplätze in c-Fe ˚ ) (Oktae(a = 3,64 A) und -Fe (a = 2,87 A der = Achtflächner)! Fertigen Sie eine Skizze der Gitter und der Zwischengitterplätze an! Von welcher Phase würde man eine höhere Löslichkeit für Kohlenstoff erwarten? (Hinweis: Der kovalente Radius von Kohlenstoff ˚ ). beträgt 0,77 A Warum findet bei der Abkühlung einer Eisenschmelze, die etwas Kohlenstoff (£ 1%) enthält, eine Entmischung in ein mehr oder weniger geordnetes Gefüge aus einer -Fe-haltigen Phase (Ferrit) mit einer geringen Konzentration von Kohlenstoffatomen auf Zwischengitterplätzen sowie einer eisenkarbidhaltigen Phase (Zementit, Fe3C) statt? Warum verstärkt Zementit das Gefüge gegen plastische Deformationen (Stahlhärte)? (Hinweis: Fe3C ist wie viele Karbide sehr hart und spröde.) 2.3 Kupfer und Gold bilden eine kontinuierlich mischbare Legierung, bei der die Kupferund Goldatome stochastisch auf die Plätze einer fcc-Struktur verteilt sind. Für welche Konzentrationsverhältnisse erwarten Sie ge-
ordnete Legierungen und wie sehen sie aus? Zeichnen Sie die Einheitszelle dieser Legierungen und geben Sie die zugehörigen Bravais-Gitter an. Schlagen Sie Experimente vor, mit denen sich ermitteln lässt, ob die Legierungen geordnet sind oder nicht! 2.4 Zeichnen und beschreiben Sie die Symmetrieelemente aller Bravais-Gitter! 2.5 Zeichnen Sie die primitive Einheitszelle des kubisch-flächenzentrierten Gitters und bestimmen Sie die Länge der primitiven Gittervektoren a ', b ', c ' (in Einheiten der Gitterkonstanten a ) sowie die Winkel ', b ', c ' zwischen den primitiven Gittervektoren! (Hinweis: Stellen Sie die primitiven Gittervektoren als Linearkombination der Gittervektoren a, b, c des kubisch-flächenzentrierten Gitters dar und benutzen Sie elementare Vektorrechnung.) Was unterscheidet diese Einheitszelle von der des rhombischen Bravais-Gitters? 2.6 Bestimmen Sie das Verhältnis der Gitterkonstanten c und a für eine hexagonal-dichtgepackte Kristallstruktur und vergleichen Sie es mit den Werten c/a für folgende in dieser Struktur kristallisierende Elemente: He: 1,633, Mg: 1,623, Ti: 1,586, Zn: 1,861! Was könnte die Abweichungen vom idealen Wert erklären? 2.7 Welcher Bruchteil des Raumes wird durch die Atome (als feste Kugeln) in der kubischprimitiven, fcc-, hcp- und bcc-Kristallstruktur sowie im Diamantgitter ausgefüllt? 2.8 Man ermittle die Matrixdarstellung einer 2-, 3-, 4- und 6zähligen Drehung. Welche Darstellung ist reduzibel?
50
Übungen zu Kapitel 2
2.9 Man zeige, dass sich das rhomboedrische Translationsgitter in Abb. 2.3 auch durch ein hexagonales Gitter mit zwei Atomen auf der Raumdiagonalen auf den jeweiligen Höhen c/3 und 2 c/3 darstellen lässt. Anleitung: Man betrachte dazu die Projektion des rhomboedrischen Translationsgitters entlang der Raumdiagonalen in die Ebene senkrecht zu dieser Raumdiagonalen: Die Raumdiagonale des Rhomboeders ist parallel zur cAchse des hexagonalen Gitters! Wie hängt
das Verhältnis der a und c-Achse des zugeordneten hexagonalen Gitters mit dem Winkel b c und der Länge a b c des rhomboedrischen Gitters zusammen? 2.10 Man erläutere warum getempertes Kupferblech leicht plastisch verformbar ist und warum nach Hämmern des Materials das Kupferblech einer plastischen Verformung deutlich größeren Widerstand entgegensetzt.
3. Die Beugung an periodischen Strukturen
Eine direkte Abbildung atomarer Strukturen wird durch das hochauflösende Elektronenmikroskop, das Feldionenmikroskop und das Tunnelmikroskop ermöglicht. Trotzdem ist man zur Aufklärung unbekannter Strukturen oder zur genauen Vermessung von Strukturparametern auf Beugungsexperimente angewiesen. Ihr größerer Informationsgehalt beruht letztlich darauf, dass in Beugungsexperimenten von der Eigenschaft der Periodizität des Festkörpers optimal Gebrauch gemacht wird. Die direkte Abbildung atomarer Strukturen hat dagegen ihr Hauptanwendungsfeld bei der Untersuchung von Punktdefekten, Versetzungen und Stufen sowie Oberflächen und Grenzflächen, also bei Störungen der Periodizität. Zu Beugungsexperimenten können Röntgenlicht, Elektronen, Neutronen und Atome herangezogen werden. Die verschiedenen Strahlungsarten unterscheiden sich allerdings erheblich hinsichtlich der Stärke der elastischen und inelastischen Wechselwirkung mit dem Festkörper, wodurch ihre Anwendungsfelder verschieden werden. Atome mit geeigneter Materie-Wellenlänge für Beugungsexperimente dringen nicht in den Festkörper ein, sind also nur für Oberflächenuntersuchungen geeignet. Abgeschwächt gilt dies auch für Elektronen niedriger Energie. Unterschiedlich für die Strahlungsarten ist auch die räumliche Ausdehnung der Streuzentren. Neutronen werden z. B. an den Kernen gestreut, Röntgenlicht und Elektronen an der *104 mal größeren Elektronenhülle. Trotz dieser und anderer Verschiedenheiten, die im Abschn. 3.7 noch etwas eingehender diskutiert werden, lässt sich der wesentliche Aspekt der Beugung in einer für alle Strahlungsarten gemeinsamen Theorie behandeln. Selbstverständlich entfallen bei einer solchen Betrachtungsweise Unterschiede, die sich aus der Polarisation bzw. Spinpolarisation ergeben. Die nachfolgend beschriebene Beugungstheorie ist quasiklassisch, denn die Streuung selbst wird klassisch behandelt. Der quantenmechanische Aspekt liegt lediglich in der Beschreibung von Teilchen als Welle. Für eine genaue und strahlungsart-spezifische Darstellung sei auf [3.1–3.3] verwiesen.
3.1 Die allgemeine Beugungstheorie Wir wollen bei der mathematischen Beschreibung der Beugung die Voraussetzung der Einfachstreuung machen: Die einfallende Welle
52
3. Die Beugung an periodischen Strukturen
soll die streuende Materie an allen Orten r zur Emission von Kugelwellen anregen. Dabei wird eine feste Phasenbeziehung zwischen der Primärwelle und der jeweils emittierten Kugelwelle angenommen (kohärente Streuung). Die emittierten Kugelwellen werden kein zweites Mal gestreut. Diese Näherung heißt auch die „kinematische“ und entspricht der 1. Bornschen Näherung in der quantenmechanischen Streutheorie. Die Näherung gilt für Neutronen, Röntgenstreuung und mit Einschränkungen auch für die Streuung von Elektronen genügend hoher Energie. Bei Streuung an sehr guten Einkristallen können „nichtkinematische“ („dynamische“) Effekte auch mit Röntgenstrahlung beobachtet werden. Zur Herleitung der Streukinematik betrachten wir Abb. 3.1. Dabei sei Q der Ort der Strahlungsquelle, P der Ort eines der Streuzentren und B der Beobachtungsort. Als Beispiel für eine Quelle diene die Emission von Licht in Form einer Kugelwelle durch einen Elektronenübergang im Atom. In genügend großer Entfernung von der Quelle ist die Welle nahezu eine ebene Welle. Die Amplitude (bei Röntgenlicht genauer: Komponente des Feldstärkevektors) am Ort P zur Zeit t kann also beschrieben werden durch AP A0 ei k0
Rr
i x0 t
:
3:1
Denken wir uns die Welle zurückverfolgt zum Quellpunkt Q (R+ r = 0), so ist die Amplitude als Funktion der Zeit hier *exp (–i x0 t ), hat also zu jeder Zeit eine feste Phase. Einen solchen Ansatz kann man also nur für einen Emissionsprozess machen. In realen Strahlern emittieren viele Atome Photonen mit unkorrelierter Phase (Ausnahme Laser). Bei anderen Teilchen sind die Phasen ebenfalls unkorreliert. Wenn wir also mit einer Welle wie in (3.1) rechnen, müssen wir im Auge behalten, dass im Ergebnis die beobachtete Intensität durch Mittelung über viele einzelne Beugungsvorgänge entsteht. Die Phasenlage der Welle an den Orten P zu einer Zeit t (Momentaufnahme des Wellenbildes) ist durch den ortsabhängigen Faktor in (3.1) gegeben. Die Primärwelle rege nun die Materie zur Streuung an. Jeder Punkt der streuenden Materie P emittiert durch die Primärwelle ausgelöste Kugelwellen, deren Amplitude und
Abb. 3.1. Zur Herleitung der Streukinematik. Die Quelle Q sei genügend weit von der streuenden Materie entfernt, so dass die von ihr ausgesandten Kugelwellen am Ort der Streumaterie praktisch ebene Wellen sind. Das gleiche gilt für die Entfernung des Beobachtungsortes B von den Streuzentren
3.1 Die allgemeine Beugungstheorie
53
Phasenlage relativ zur anregenden Strahlung durch eine komplexe Streudichte R (r ) beschrieben wird. Das Zeitverhalten der Kugelwellen wird durch die Zeitabhängigkeit in (3.1) bestimmt (erzwungene Schwingung). Die Kugelwelle am Beobachtungspunkt B wird also beschrieben durch 0
ei k j R rj AB AP
r; t R
r 0 : jR rj
3:2
Für einen festen Ort P hat k die Richtung von R '– r. Wir können deshalb auch schreiben 0
AB AP
r; t R
r
ei k
R r : jR 0 rj
3:3
Für die großen Entfernungen vom Streuzentrum ist dann AB AB AP
r; t R
r
1 i k
R 0 e R0
3:4
r
mit gleicher Richtung von k für alle Orte P. Setzen wir (3.1) in (3.4) ein, so erhalten wir AB
A0 i
k0 Rk R 0 e e R0
i x0 t
R
r ei
k0
k r
:
3:5
Die gesamte Streuamplitude ergibt sich dann durch Integration über den streuenden Bereich AB
t / e i x0 t R
r ei
k0 k r dr :
3:6 Bei der Streuung an einer zeitlich unveränderlichen Struktur ist R (r) zeitunabhängig und die Zeitabhängigkeit von AB enthält nur die Frequenz x0. Im quantenmechanischen Bild entspricht dies der Energieerhaltung. Wir haben also elastische Streuung. Sie ist für die Strukturanalyse wichtig. Läßt man dagegen eine zeitabhängige Streudichte R (r, t) zu, so ergeben sich auch Streuwellen mit x j x0. Mit dieser, der inelastischen, Streuung werden wir uns in Abschn. 4.4 beschäftigen. In Beugungsexperimenten zur Strukturaufklärung beobachtet man nicht die Amplitude, sondern die Intensität der Streustrahlung
3:7 I
K / jAB j2 / j R
r e i Kr dr j2 : Wir haben dabei den Streuvektor K = k– k0 eingeführt. Wir sehen, dass die Intensität das Absolutquadrat der FourierTransformierten der Streudichte R (r) bezüglich des Streuvektors K ist. Daraus gewinnen wir eine wichtige Erkenntnis: Je kleiner die Strukturen sind, die durch Beugungsexperimente aufgelöst werden sollen, desto größer muss K, also auch der k-Vektor der verwendeten Welle, sein. Bei Strukturuntersuchungen von Festkörpern muss also die Wellenlänge in etwa der Gitterkonstanten entsprechen. Die Unmöglichkeit für solche Wellen, die Amplitude als Funktion von Ort und Zeit anstelle der Intensität zu messen, macht die wesentli-
54
3. Die Beugung an periodischen Strukturen
che Schwierigkeit der Strukturanalyse aus. Könnte man statt der Intensität die Amplitude beobachten, so könnte man von der Umkehrung der Fourier-Transformation Gebrauch machen und die örtliche Verteilung der Streudichte unmittelbar dem Beugungsbild entnehmen. Da man aber auf die Beobachtung der Intensitäten beschränkt ist, kann man wegen der verlorengegangenen Information über die Streuphasen die örtliche Verteilung der Streudichte aus den beobachteten Intensitäten nicht ohne weiteres berechnen. Zur Ermittlung einer Struktur ist man darauf angewiesen, für einen bestimmten Strukturvorschlag die Beugungsintensitäten zu berechnen, mit den experimentellen Ergebnissen zu vergleichen und die Strukturparameter so lange zu variieren, bis optimale Übereinstimmung mit den experimentellen Ergebnissen besteht. Eine gewisse Hilfe bei Strukturanalysen ist die sogenannte Patterson-Funktion. Sie ist die Fourier-Transformierte der Intensität. Um die Bedeutung dieser Patterson-Funktion zu verstehen, schreiben wir Gl. (3.7) für die Intensität noch etwas anders 0 I
K / R
r e i K r dr R
r 0 ei K r dr 0 :
3:8 Da die Integrale über den ganzen Raum zu nehmen sind, kann man im zweiten Integral die Variable r ' durch r '+ r ersetzen. Damit erhält man 0
3:9 I
K / ei K r dr 0 R
rR
r 0 r dr : Die Autokorrelationsfunktion der Streudichte P
r 0 R
r R
r 0 rdr
3:10
ist die Patterson-Funktion. Sie hat Maxima dort, wo r ' einem Vektor zwischen zwei Atomen in der Struktur entspricht. Besonders deutliche Maxima kann man für Vektoren erwarten, die von einem Atom mit großem Streuquerschnitt zu einem anderen Atom mit großem Streuquerschnitt zeigen. Mit Hilfe der Patterson-Funktion P (r ') lässt sich auch die Streuung an ungeordneten Systemen, also Flüssigkeiten und amorphen Festkörpern, behandeln. Wir zerlegen dazu die Streudichte R (r) in die Beiträge einzelner Atome. Der Einfachheit halber nehmen wir an, dass alle Atome von einer Sorte sein sollen. Die Streudichte um ein Atom i werde mit Rat (r–ri) bezeichnet X Rat
r ri :
3:11 R
r i
Mit dieser Zerlegung kann die Patterson-Funktion P (r ') in zwei Anteile aufgespalten werden: Ein Teil beschreibt die Korrelation eines Atoms mit sich selbst und der andere die Korrelation mit allen anderen Atomen
3.1 Die allgemeine Beugungstheorie
P
r 0
X
Rat
r
ri Rat
r
rj r 0 dr
Rat
r
ri Rat
r
ri r 0 dr
55
i; j
X i
X
Rat
r
X ri Rat
r
3:12
rj r 0 dr :
j6i
i
Die physikalische Aussage über die Struktur des Systems ist in dem zweiten Term von (3.12) enthalten. Wir wollen jetzt zusätzlich voraussetzen, dass die Atome nahezu punktförmige Streuer sind. Diese Annahme ist besonders gut für Neutronenstrahlung erfüllt (siehe auch Abschn. 3.7 und I.3). Das erste Integral liefert dann nur bei r0 0 einen Beitrag. Wir können das Integral also durch f 2 d0;r0 ersetzen mit d0;r0 dem Kronecker Symbol und f dem „Atomfaktor“, der die Stärke der Streuamplitude eines Atoms angibt. Die Summe über alle Atome i kann dann durch Multiplikation mit der Zahl der Atome N ersetzt werden. Das zweite Integral in (3.12) verschwindet für r0 0, da offensichtlich die Wahrscheinlichkeit, dass sich ein zweites Atom j am Orte eines anderen Atoms i befindet, Null sein muss. Wir wollen jetzt zusätzlich annehmen, dass das System ungeordnet, aber im Mittel homogen ist. Wegen der vorausgesetzten Unordnung ist von jedem Atom i aus betrachtet die umgebende Streudichte im Mittel gleich und sie* hängt nicht vom + Winkel ab. Der Mittelwert P der Summe R
r Rat
r rj hängt deshalb nur vom Abj6i
stand r von dem Atom ab, dessen Umgebung betrachtet wird. Damit erhält man für die Patterson-Funktion
3:13 P
r 0 Nf 2 d0;r0 N R
rR
r r0 dr : Es ist zweckmäßig eine Funktion g
r0 einzuführen, die unabhängig von Streuamplitude und Dichte ein Maß nur für die Paarkorrelation der Atome ist. Der Grenzwert von g
r0 für r0 ! 1 soll eins sein. Für große Entfernungen vom Aufatom hat die mittlere Streudichte den Wert lim R
r r0 Nf =V mit V dem Volumen. 0 r !1
Wir definieren deshalb g
r 0 durch
N 2 f g
r 0 R
r R
r r 0 dr :
3:14 V Nach Einsetzen von (3.14) und (3.13) in (3.9) erhält man für die Streuintensität I (K) N g
r e i K r d r :
3:15 I
K / S
K 1 V S (K) wird als Strukturfaktor bezeichnet. Die Paarkorrelationsfunktion g (r) lässt sich aus der Fourier-Transformation von S (K )–1 berechnen. Dabei ergibt sich allerdings noch eine technische Schwierigkeit. Der homogene Anteil von g (r ) für große r führt zu einer
Abb. 3.2. Paarkorrelationsfunktion für amorphes Silizium und flüssiges Eisen bei einer Temperatur von T = 1833 K [3.4, 3.5]. Die Abstände von nächsten, übernächsten und drittnächsten Nachbarn für kristallines Silizium sind als r1 (Si), r2 (Si) und r3 (Si) markiert, die entsprechenden Abstände von kristallinem Eisen (mit kubisch flächenzentrierter Struktur) als r1 (Fe) und r2 (Fe)
Paarkorrelationsfunktion g(r)
56
3. Die Beugung an periodischen Strukturen
6
r1(Si)
flüssiges Fe amorphes Si
5 4
r1(Fe)
3
r2(Fe) r2(Si) r3(Si)
2 1 0
2
4
6
8
10
°˚ ) Radius Radiusrr(A (A)
Vorwärtsstreuung bei K = 0. Dieser Anteil ist experimentell nicht vom Primärstrahl zu trennen. Deshalb ermittelt man aus den experimentellen Daten ohne Vorwärtsstreuung zunächst eine Funktion h (r) = g (r ) –1, die sich aus der Fourier-Transformation des Strukturfaktors ohne Vorwärtsstreuung ergibt (Übung 3.7). Abbildung 3.2 zeigt zwei Beispiele für die Paarkorrelationsfunktion g (r). Die gestrichelte und die durchgezogene Linie stellen g (r) für flüssiges Eisen und amorphes Silizium dar. Das erste Maximum entspricht dem Abstand nächster Nachbarn. Aus der Schärfe der Verteilung um diesen Abstand sehen wir, dass der Abstand der nächsten Nachbarn auch für strukturell ungeordnete Systeme gut definiert ist. Auch die mittleren Abstände weiterer Nachbarn sind noch gut erkennbar. Hier zeigt sich jedoch ein charakteristischer Unterschied zwischen dem amorphen und dem flüssigen Zustand. Im amorphen Zustand sind die Abstände übernächster Nachbarn noch praktisch gleich wie im kristallinen Zustand. Erst bei den drittnächsten Nachbarn macht sich die geringere Dichte des amorphen Zustandes bemerkbar. Bei Flüssigkeiten liegt das zweite Maximum bei etwa dem doppelten Abstand der nächsten Nachbarn, also bei einem wesentlich höheren Abstand als es z. B. dem Abstand übernächster Nachbarn in einer dichtesten Kugelpackung entspräche. Nur durch diesen größeren Abstand der zweitnächsten Nachbarn lässt sich ein flüssiger Zustand realisieren, wie sich leicht an einem Kugelmodell demonstrieren lässt (Übung 3.7).
3.2 Periodische Strukturen und reziprokes Gitter
57
3.2 Periodische Strukturen und reziprokes Gitter Für periodische Strukturen lässt sich R (r) in eine Fourier-Reihe entwickeln. Wir betrachten zunächst den eindimensionalen Fall, wobei sich R (x) mit einer Periode a wiederholen soll R
x R
x n a
n 0; 1; 2; ::: :
3:16
Dann lautet die entsprechende Entwicklung in eine Fourier-Reihe X R
x Rn ei
n 2 p=a x :
3:17 n
Es ist leicht zu sehen, dass die Verschiebung um einen beliebigen Gittervektor xm = ma wieder zum selben R (x) führt, die vorausgesetzte Translationsinvarianz also gegeben ist. Die entsprechende Erweiterung auf den dreidimensionalen Fall ist X R
r RG ei G r ;
3:18 G
wobei an den Vektor G bestimmte Bedingungen geknüpft werden müssen, damit die Translationsinvarianz von R bezüglich aller Gittervektoren rn n1 a1 n2 a2 n3 a3
3:19
gegeben ist. Es muss nämlich gelten G rn 2 p m
3:20
mit einer ganzen Zahl m für alle Werte von n1, n2, n3. Wir zerlegen auch G nach zunächst nicht festgelegten Basisvektoren gi, G h g1 k g2 l g3
3:21
mit ganzen Zahlen h, k, l. Die Bedingung (3.20) besagt dann z. B. für den Fall n2 = n3 = 0:
h g1 k g2 l g3 n1 a1 2 p m :
3:22
Das ist für beliebige n1 nur zu erfüllen, wenn g1 a1 2 p
und g2 a1 g3 a1 0
3:23
ist. Allgemein ausgedrückt muss also gelten gi aj 2 p dij :
3:24
Die damit definierte Basis g1, g2, g3 spannt das sogenannte reziproke Gitter auf. Das reziproke Gitter ist jedem Gitter eindeutig zugeordnet. Seine Gitterpunkte werden durch die Zahlen h, k, l bezeichnet. Die Konstruktionsvorschrift ergibt sich unmittelbar aus (3.24): Der Vektor des reziproken Gitters g1 steht senkrecht auf der von den Vektoren a2 und a3 aufgespannten Ebene und sein Betrag ist 2 p/[a1 cos<(g1, a1)]. Für ein ebenes Parallelogrammgitter ist das reziproke Gitter in Abb. 3.3 gezeichnet. Man beachte aber, dass bei
58
3. Die Beugung an periodischen Strukturen
Abb. 3.3. Ein ebenes Parallelogramm und das dazugehörige reziproke Gitter. Die Vektoren g1 und g2 stehen senkrecht auf den Vektoren a2 und a1
einer solchen Zeichnung Ortsraum und reziproker Raum (Dimension: m–1!) ineinander gezeichnet sind. Die Basisvektoren des reziproken Gitters lassen sich auch berechnen: g1 2 p
a2 a3 a1
a2 a3
und zyklisch :
3:25
Es ist leicht zu beweisen, dass (3.25) Bedingung (3.24) erfüllt. Aus der eindeutigen Zuordnung von Gitter und reziprokem Gitter folgt, dass jede Deckoperation des Gitters auch zu einem dekkungsgleichen reziproken Gitter führen muss. Das reziproke Gitter gehört also der gleichen Punktgruppe wie das Gitter an.
3.3 Die Streubedingung bei periodischen Strukturen Wir setzen nunmehr die Fourierentwicklung für R (r) in die Gleichung für die Streuintensität (3.7) ein und erhalten mit der Abkürzung K = k–k0 i
G K r 2 j A0 j2 X I
K / 0 2 RG e dr :
3:26 R G Wenn der Kristall aus vielen Elementarzellen besteht, liefert das Integral nur wesentliche Beiträge, wenn G = K ist. Das Integral, ausgeschrieben in den Komponenten, wäre für unendlich großes Volumen jeweils die Darstellung der d-Funktion. Sein Wert ist dann gleich dem Streuvolumen V i
G K r V fur G K dr :
3:27 e 0 sonst Die Beugung an Gittern führt also zu Beugungsreflexen, wenn die Differenz zwischen den k-Vektoren der einfallenden und der gestreuten Welle gerade gleich G ist. Die gemessene Intensität ist
3.3 Die Streubedingung bei periodischen Strukturen
59
j A0 j 2 j RG j2 V 2 :
3:28 R 02 Die Proportionalität zu V 2 ist allerdings nur scheinbar. Eine genaue Diskussion des Integrals zeigt, dass die Breite der Intensitätsverteilung um einen Beugungsreflex mit V –1 abnimmt. Die gesamte Intensität ist also, wie zu erwarten, proportional zum Streuvolumen. Der Vektor G ist eindeutig durch seine Komponenten h, k, l bezüglich der Basisvektoren gi des reziproken Gitters charakterisiert. Zur Kennzeichnung eines Beugungsreflexes kann man deshalb auch die Indizes hkl verwenden. Negative Werte von hkl werden dabei mit h¯k¯l¯ bezeichnet I
K G /
Ihkl / j Rhkl j2 :
3:29
Findet keine Absorption der Strahlung statt, so ist R (r) eine reelle Funktion und damit wegen (3.18) Rhkl Rhkl:
3:30
Das heißt aber, für die Intensitäten gilt Ihkl Ihkl
Friedelsche Regel :
3:31
Dieser Satz hat eine interessante Folge: das Röntgenreflexbild weist stets ein Inversionszentrum auf, selbst wenn die Struktur kein solches Inversionszentrum hat. Bei Strukturen mit einer polaren Achse kann die Orientierung dieser Achse mit Hilfe der Röntgenbeugung nicht ermittelt werden, es sei denn, man arbeitet in einem Bereich starker Absorption, in dem die o. g. Voraussetzung reeller Streudichte nicht mehr erfüllt ist. Wir wollen noch ein wenig bei der Interpretation der Streubedingung verweilen, die auch als Laue-Bedingung bekannt ist. KG:
3:32
Sie ist von fundamentaler Bedeutung für alle Beugungserscheinungen an periodischen Strukturen unabhängig von der verwendeten Strahlung. Sie lässt sich in der Ewaldschen Konstruktion veranschaulichen (Abb. 3.4). Man zeichnet dazu den Vektor k0 , mit der Spitze auf den Ursprung weisend, in das reziproke Gitter ein. Da wir elastische Streuung vorausgesetzt haben, ist k = k0 = 2 p/k mit k der Wellenlänge der Strahlung. Alle Punkte auf der Kugel um den Ursprung von k0 mit dem Radius k = k0 beschreiben die Endpunkte eines Vektors K = k–k0 . Die Bedingung G = K ist dort erfüllt, wo der Kreis durch Punkte des reziproken Gitters geht. Es entsteht ein „Beugungsreflex“, der nunmehr entsprechend dem Punkt des reziproken Gitters mit den Indizes (hkl) versehen wird.
60
3. Die Beugung an periodischen Strukturen
(34)
(040) (030) Abb. 3.4. Die Ewald-Kugel im reziproken Gitter zur Veranschaulichung der Streubedingung k–k0 = G. Beugungsreflexe treten auf, wenn die Kugel durch einen Punkt des reziproken Gitters geht. Für beliebig gewählten Betrag und Richtung von k0 wird das i. a. nicht der Fall sein. Zur Beobachtung von Reflexen muss entweder ein Wellenlängenkontinuum eingestrahlt oder der Kristall bewegt werden
G
(020)
k
(010) k0
(000) (10)
(20)
(30)
3.4 Die Braggsche Deutung der Beugungsbedingung Drei nicht auf einer Gerade liegenden Punkte eines Gitters spannen eine sogenannte Netzebene auf (Abb. 3.5). Solche Netzebenen werden in bestimmter Weise bezeichnet, die eine besonders einfache Interpretation der Beugung am Gitter erlaubt. Wir nehmen an, die Achsenabschnitte der Netzebenen in Einheiten der Basisvektorenlängen seien m, n, o (mit ganzen Zahlen m, n, o ). Man bildet dann die reziproken Werte h ' = 1/m, k ' = 1/n, l ' = 1/o und multipliziert h ', k ', l ' mit einer ganzen Zahl p, so dass ein Tripel ganzer, teilerfremder Zahlen (h, k, l ) entsteht. Die Zahlen h, k, l heißen die Millerschen Indizes der Netzebenenschar (h k l). Parallel zu den Netzebenen, die auf jeder der drei Achsen durch einen Gitterpunkt gehen (ausgezogene Linien in Abb. 3.5), lassen sich weitere, äqui-
Abb. 3.5 a, b. Zur Bezeichnung von Netzebenen im Gitter. Es sind die Netzebenen m = 1, n = 2, o = 2 gezeichnet. Die entsprechenden Millerschen Indizes entstehen aus dem Zahlentripel (1/m, 1/ n, 1/o ) durch Multiplikation mit einer ganzen Zahl p = 2, also (hkl) = (211). Zwischen die durch m, n, o indizierten Netzebenen lassen sich zusätzliche Netzebenen (gestrichelt ) legen. Diese haben die gleiche Besetzungsdichte mit Atomen, wie man aus (b) leicht ablesen kann, sind also den ursprünglichen völlig äquivalent. Der Abstand äquivalenter Netzebenen ist gerade um den Faktor p = 2 kleiner als der Abstand, der sich aus der ursprünglichen Konstruktion durch die Achsenabstände ergibt
3.4 Die Braggsche Deutung der Beugungsbedingung
61
valente Netzebenen zeichnen, und zwar gerade so viele, dass auf jeder der drei Achsen alle Gitterpunkte der Achse auch auf einer Netzebene liegen. Dies ist eine Folge der geforderten Translationssymmetrie (Abb. 3.5 b). Die Zahl der nun gezeichneten Netzebenen ist dann gerade p mal so groß wie die Zahl der ursprünglichen Netzebenen: Die reziproken Achsenabschnitte dieser Netzebenen (gestrichelte und ausgezogene Linien in Abb. 3.5) bilden nämlich direkt das geforderte teilerfremde Indextripel ganzer Zahlen (h k l). Wir beweisen nun eine wichtige Aussage. Der im vorigen Kapitel eingeführte reziproke Gittervektor G mit seinen Komponenten (h k l) steht senkrecht auf den jetzt ebenfalls mit den Indizes (h k l) bezeichneten Netzebenen (h k l). Der Betrag von Ghkl ist gleich dem 2p fachen des reziproken Abstandes der Netzebenen (h k l). Wir beweisen zunächst den ersten Teil dieser Aussage. Die Vektoren a1 a2 a3 a2 und 0 0 h k l0 k0 spannen die Netzebene auf. Ihr Vektorprodukt ist normal zur Ebene (h k l) a1 a2 a3 a2 1 1
a1 a2
a2 a3 h0 k0 l0 k0 h0k0 k0l0 1
a3 a1 :
3:33 h 0 l0 Wenn man diesen Vektor mit –2 p h ' k ' l '/[a1 (a2 ´ a3)] multipliziert, erhält man a2 a3 a3 a1 a1 a2 :
3:34 2p h0 k0 l0 a1
a2 a3 a1
a2 a3 a1
a2 a3 Das ist aber gerade bis auf den Zahlenfaktor p gleich Ghkl [(3.21) und (3.25)]. Damit ist also bewiesen, dass Ghkl senkrecht auf der Ebene (h k l) steht. Wir beweisen nun, dass der Netzebenenabstand dhkl = 2 p/Ghkl ist. Der Abstand einer Netzebene (hkl) vom Ursprung der Basis a1, a2, a3 ist d 0hkl
a1 cos <
a1 ; Ghkl h0
3:35
a1 a1 Ghkl 2p h 2p p: h 0 a1 Ghkl Ghkl h 0 Ghkl
3:36
Der Abstand der nächsten Netzebenen ist also dhkl = d h' kl /p = 2 p/Ghkl. Mit Hilfe der Netzebenen gelingt eine besonders anschauliche Deutung der Streubedingung. Wir nehmen den Betrag der Gleichung G = K
62
Ghkl
3. Die Beugung an periodischen Strukturen
2p 2 k0 sin H dhkl
Abb: 3:6
3:37
und erhalten damit die Braggsche Gleichung k 2 dhkl sin H :
3:38
Diese Gleichung besagt, dass sich Wellen so verhalten, als würden sie an den Netzebenen (h k l) reflektiert (Abb. 3.6). Daher stammt auch der Ausdruck „Bragg Reflex“. Die Streubedingung besagt dann nichts anderes, als dass der Gangunterschied zwischen den an der Netzebenenschar reflektierten Wellen gerade eine Wellenlänge oder ein Vielfaches davon betragen muss, wodurch konstruktive Interferenz auftritt (s. Abb. 3.7).
(hkl) Punkt des reziproken Gitters
k
k
G q
k0 Abb. 3.6. Die Braggsche Deutung der Streubedingung. Da der Vektor Ghkl senkrecht auf der Netzebene (hkl) des Ortsraumes steht, erscheint die Streuung als eine Spiegelung an der Netzebene. Man beachte, dass Ortsraum und reziproker Raum ineinander gezeichnet sind
Abb. 3.7. Herleitung der Braggschen Gleichung: Der Gangunterschied der Wellen ist 2 dhkl sin H
d hk
l
(hkl) Netzebenen des realen Gitters
3.5 Die Brillouinschen Zonen
63
3.5 Die Brillouinschen Zonen Die Bedingung für das Auftreten eines Bragg-Reflexes war k–k0 = Ghkl . Die Endpunkte aller Vektorenpaare k, k0 , die der Streubedingung genügen, liegen (Abb. 3.4) auf der Mittelsenkrechten-Ebene von Ghkl . Der kleinste von den Mittelsenkrechten-Ebenen um den Ursprung des reziproken Gitters aufgespannte Polyeder heißt Brillouinsche Zone (auch 1. Brillouinsche Zone). Die Konstruktion der Brillouinschen Zone macht man sich am einfachsten am ebenen Parallelogrammgitter (Abb. 3.8) klar. Für einige einfache räumliche Gitter sind die Brillouinschen Zonen in Abb. 3.9 abgebildet. Punkte in der Brillouin-Zone werden mit Bezeichnungen versehen, die der Gruppentheorie entstammen und die Symmetrie charakterisieren. Wie das reziproke Gitter hat auch die Brillouinsche Zone die Punktsymmetrie des jeweiligen Gittertyps. Ein Punkt auf der Zonengrenze ist dadurch ausgezeichnet, dass für jede Welle mit einem k-Vektor, der vom Ursprung aus die Zo-
Abb. 3.8. Konstruktion der 1. Brillouinschen Zone für das ebene Parallelogrammgitter. Weitere Zonen kann man konstruieren durch die Mittelsenkrechten-Ebenen größerer reziproker Gittervektoren
Abb. 3.9. Brillouinsche Zone für das kubisch-flächenzentrierte, das kubischraumzentrierte und das hexagonale Gitter. Punkte hoher Symmetrie tragen Bezeichnungen wie C, L, X etc. Die begrenzenden Flächen der Brillouinschen Zonen sind die Mittelsenkrechten-Ebenen zu den kleinsten reziproken Gittervektoren. Die durch die Konstruktionsvorschrift entstehenden Polyeder können um jeden Punkt des reziproken Gitters gezeichnet werden und füllen dann den gesamten reziproken Raum aus. Die Zelle nach derselben Konstruktionsvorschrift im Realraum heißt Wigner-SeitzZelle. Sie kann benutzt werden, um den Raum zu beschreiben, den man jedem Punkt des Translationsgitters zuordnen kann
64
3. Die Beugung an periodischen Strukturen
nengrenze erreicht, eine Bragg-reflektierte Welle entsteht. Die Intensität dieser Welle ist für den Fall schwacher Streuung und kleiner Kristalle gering. Für große Einkristalle aber werden die Intensitäten von Primär- und Bragg-reflektierter Welle gleich. Dadurch entsteht ein Feld stehender Wellen. Die Lage der Knoten und Bäuche ergibt sich aus der relativen Phasenlage beider Wellen und kann durch den Einschusswinkel des Primärstrahls variiert werden. Dieser Effekt kann z. B. durch Beobachtung der Röntgenfluoreszenz von Fremdatomen im Gitter zur Bestimmung von deren Lage benutzt werden. Die Ausbildung zweier Wellen gleicher Intensität mit fester Phasenbeziehung wird ferner zum Aufbau eines Röntgeninterferometers verwendet, mit dem einzelne Gitterfehler sichtbar gemacht werden können (Tafel II). Für den Fall der Elektronen im periodischen Festkörper wird die Ausbildung der Bragg-reflektierten Welle und ihre Bedeutung für die Elektronenbänder des Festkörpers noch ausführlich diskutiert werden (Kap. 7).
3.6 Der Strukturfaktor Die Streubedingung (3.27) besagt zunächst nur, wo Reflexe auftreten. Für die Berechnung ihrer Intensität aus (3.24) müssen wir die Fourier-Koeffizienten der Streudichte Rhkl berechnen.
1 R
re i G r dr :
3:39 Rhkl VZ Zelle
Das Integral ist dabei über die Elementarzelle zu erstrecken. Durch Einsetzen der Fourier-Entwicklung von R (r) (3.18) kann man sich von der Richtigkeit dieser Gleichung überzeugen. Die Streuung von Röntgenstrahlen erfolgt an den Elektronen der Atome. Mit Ausnahme der leichten Elemente ist auch im Festkörper die Mehrheit der Elektronen (Schalenelektronen) auf einen kleinen Bereich um die Atome konzentriert. Die Streuung an den Valenzelektronen, die sich auch auf den Bereich zwischen den Atomen erstrecken, kann dagegen vernachlässigt werden. Das Integral über die Streudichte R (r) kann deshalb aufgespalten werden in Einzelintegrale um die einzelnen Atome, die dann phasenrichtig überlagert werden müssen. Wir spalten dazu den Ortsvektor r auf in einen Vektor rn , der zum Ursprung jeder Elementarzelle führt, in einen Vektor r , der von dort zu den Zentren der Atome führt, und in einen Vektor r ', der jeweils vom Zentrum der Atome wegweist: r = rn + r+ r ' (Abb. 3.10). Damit erhalten wir für die Fourier-Koeffizienten der Streudichte Rhkl
1 X e VZ
i G r
R
r 0 e
i G r0
dr 0 :
3:40
3.6 Der Strukturfaktor
65
r rα
Abb. 3.10. Zur Definition der Vektoren rn, r und r '. Der Vektor rn zeigt zu einer Elementarzelle, die durch das Zahlentripel n = (n1, n2, n3) beschrieben wird, r weist auf ein Atom in der Elementarzelle und r ' vom Zentrum des Atoms zu einem Punkt innerhalb eines Atoms
rn
Das Integral erstreckt sich jetzt nur noch über den Bereich eines Atoms. Es beschreibt offenbar die Interferenz der von verschiedenen Punkten eines Atoms ausgehenden Kugelwellen und wird Atomfaktor genannt. Da die Verteilung der Streudichte um ein Atom im wesentlichen kugelsymmetrisch ist, kann das Integral durch Übergang zu Kugelkoordinaten weiter ausgewertet werden 0 0 f R
r 0 e i G r dr 0 R
r 0 e iGr cos # r 02 dr0 d
cos # du :
3:41 Dabei ist # der Polarwinkel zwischen G und r '. Durch Integration über # und u erhält man sin G r 0 0 dr :
3:42 f 4 p R
r0 r 02 Gr0 Bezeichnet man den Winkel zwischen k und k0 als den Streuwinkel 2 H (Vorwärtsstreuung: H = 0) so folgt wegen G 2 k0 sin H ;
3:43
sin 4 p r 0
sin H=k dr 0 : f 4 p R
r 0 r 02 4 p r 0
sin H=k
3:44
Der Atomfaktor ist also eine Funktion f (sin H/k), wobei die Vorwärtsstreuung den größten Wert für f liefert. Für H = 0 wird f = 4 p R (r ') r '2 dr ', also gleich der über das Atomvolumen integrierten Streudichte. Für Röntgenstrahlung ist diese proportional Z, der Gesamtzahl der Elektronen pro Atom. Die Summe in (3.40) führt auf den sogenannten Strukturfaktor Shkl . Sie beschreibt die Interferenzen zwischen Streuwellen von verschiedenen Atomen der Elementarzelle
66
Shkl
3. Die Beugung an periodischen Strukturen
X
f e
i Ghkl r
:
3:45
Für primitive Gitter ist S = f. Weitere Spezialfälle ergeben sich für zentrierte Gitter. Beschreiben wir den Vektor r in Einheiten der Basisvektoren des Gitters r u a1 v a2 w a3 ;
3:46
so sind die Zahlen u, v, w kleiner als eins, und die Strukturamplitude schreibt sich wegen der Definition des reziproken Gittervektors (3.24) X f e 2 p i
h u k v lw :
3:47 Shkl
Betrachten wir als Beispiel das kubisch raumzentrierte Gitter: Atome sitzen in den Positionen r1
0; 0; 0 und r2
1=2; 1=2; 1=2 : Beide haben den gleichen Atomfaktor f. Es folgt für S 0 h k l ungerade i p
hkl Shkl f
1 e : 2f h k l gerade
3:48
Es ergeben sich also systematische Auslöschungen. So gibt es z. B. keinen (100)-Reflex. Ursache ist die destruktive Interferenz der Bragg-Reflexe der Netzebenen, die die Würfelflächen ausmachen, und der zwischengeschobenen Netzebenen, die von den Atomen in der raumzentrierten Position eingenommen werden (s. Abb. 2.10). Voraussetzung für die vollständige Auslöschung ist, dass das Zentralatom wirklich identisch mit den Eckatomen ist, also wirklich ein raumzentriertes Bravais-Gitter vorliegt. Die CsCl-Struktur führt nicht zu Auslöschungen außer beim CsI, wo die Elektronenzahl von Cs+ und I– identisch ist. Es ist leicht zu zeigen, dass auch andere zentrierte Gitter Auslöschungen aufweisen. Auch wenn es nicht zu vollständigen Auslöschungen wie bei zentrierten Gittern kommt, wird doch die Intensität der Reflexe durch zusätzliche Atome in der Zelle moduliert. Lage und Verteilung der Atome in der Zelle können darum bestimmt werden. Wir merken uns also: Gestalt und Abmessungen der Elementarzelle können aus der Lage der Reflexe ermittelt werden, der Inhalt der Elementarzelle aus ihrer Intensität.
3.7 Methoden der Strukturanalyse
67
3.7 Methoden der Strukturanalyse Die Strahlungsarten Zur Strukturanalyse können Elektronen, Neutronen, Atome und Röntgenstrahlung eingesetzt werden. Dabei muss die Wellenlänge in einem Bereich liegen, der es erlaubt, Bragg-Reflexe zu erzeugen. Durch diese Bedingung wird auch der Energiebereich der jeweiligen Strahlungsart festgelegt (Abb. 3.11). Dieser ist 10 eV – 1 keV für Elektronen 10 meV – 1 eV für Neutronen und leichte Atome 1 keV – 100 keV für Photonen. Die tatsächlichen Einsatzmöglichkeiten dieser Strahlungsarten für die Strukturanalyse werden von den Wirkungsquerschnitten für elastische und inelastische Streuung und auch von der Verfügbarkeit und Intensität der Quellen bestimmt. Für Elektronen zwischen 10 eV und 1 keV sind die Wirkungs˚ Festkörpermaterie querschnitte so hoch, dass nur etwa 10–50 A durchstrahlt werden können. Elektronen werden also eingesetzt, wenn es um Fragen der Struktur von Oberflächen geht. Auch Beugungsexperimente mit Atomen sind ein Instrument zur Untersuchung der Oberfläche (Tafel I).
Abb. 3.11. Die de Broglie-Wellenlänge p kB h= 2mE für Photonen, Elektronen, Neutronen und Helium-Atome als Funktion der Teilchenenergie E. Der Pfeil zeigt die Energie für einen thermischen Strahler mit Raumtemperatur (eVSkala)
68
3. Die Beugung an periodischen Strukturen
Bei Verwendung von Photonen können je nach Art der Probe und Strahlung Proben bis einige mm Stärke durchstrahlt werden. Als Quelle der Strahlung dient meistens die Emission von charakteristischen Röntgenlinien aus Festkörpern bei Elektronenbeschuss (Röntgenröhre). Man erhält dabei auch ein kontinuierliches Bremsspektrum. Das Spektrum charakteristischer Linien entsteht durch die Ionisation von Schalenelektronen und Emission von Licht beim Wiederauffüllen der Schalen mit Elektronen höherer Energieterme. Eine weitere hervorragende Röntgenquelle mit hoher Intensität, stark gerichteter Strahlung und 100%iger Polarisation ist das Elektronensynchroton (Desy in Hamburg, Bessy in Berlin, ESRF in Grenoble, s. Tafel XI). Wegen der leichten Verfügbarkeit von Röntgenquellen ist die Mehrzahl aller Strukturuntersuchungen mit Röntgenstrahlung ausgeführt worden. Nicht alle Fragen jedoch lassen sich durch Röntgenstrahlung lösen. Wir hatten gesehen, dass die Atomfaktoren !Z (der Kernladungszahl) sind. Die Streuintensitäten sind also !Z 2. Deshalb kann z. B. Wasserstoff mit Röntgenstrahlung neben anderen schweren Elementen nur schwer nachgewiesen werden. Hierzu wird besser die Neutronenstrahlung verwendet, bei der die Wirkungsquerschnitte für alle Elemente innerhalb etwa einer Größenordnung liegen. Andererseits sind für Neutronen die Wirkungsquerschnitte von Elementen mit benachbarter Kernladungszahl, die sich in der Röntgenbeugung nur schwer unterscheiden lassen, deutlich verschieden. So gelingt z. B. die Trennung von Eisen, Kobalt und Nickel in der Neutronenstreuung leicht (Tafel I). Genügend intensive Neutronenstrahlung steht aber nur aus Reaktoren oder neuerdings auch aus sog. Spallationsquellen zur Verfügung. Auch sind die Wirkungsquerschnitte klein und der Nachweis der Strahlung schwieriger. Der experimentelle Aufwand ist dadurch ungleich höher als bei Röntgen- oder Elektronenstreuung. Man setzt also Neutronenstrahlung vor allem dort ein, wo sie ihre spezifischen Vorteile zur Geltung bringen kann, wie z. B. bei Strukturuntersuchungen von organischen Materialien und Polymeren. Verschiedene Verfahren zur Strukturbestimmung Die Einstrahlung einer monochromatischen ebenen Welle auf einen Kristall führt im allgemeinen zu keinem Beugungsreflex. Wir sehen dies sofort an der Ewaldschen Konstruktion (Abb. 3.4). Nur bei geeigneter Wahl der Wellenlänge, also des Betrages von k0, oder geeigneter Einstrahlrichtung fällt ein Punkt des reziproken Gitters auf die Ewald-Kugel. Die verschiedenen Verfahren der Strukturbestimmung unterscheiden sich durch die Methoden, mit denen das erreicht wird. So kann man z. B. den Kristall drehen (möglichst um eine Hauptachse und senkrecht zur Einstrahlrichtung). Da das reziproke Gitter starr mit dem Kristallgitter verbunden ist, stellt sich diese Drehung in der Ewaldschen Konstruktion als eine Drehung des reziproken Gitters durch die raumfeste Ewald-Kugel dar. Nacheinander treten dann die Punkte des rezipro-
3.7 Methoden der Strukturanalyse
69
ken Gitters durch die Kugeloberfläche. Damit ergeben sich für ganz bestimmte Drehwinkel in bestimmten Richtungen Beugungsreflexe, die durch einen um den Kristall gelegten Film auf fotografischem Wege sichtbar gemacht werden können. Dies ist das sogenannte Drehkristallverfahren. Für eine eindeutige Indizierung der Reflexe führt man noch eine zusätzliche Translationsbewegung längs der Drehachse aus (Weissenberg-Verfahren). Mit diesen beiden Verfahren können unbekannte Strukturen analysiert werden. Eine genaue Ausmessung der Gitterkonstanten bis in die fünfte Dezimale erlaubt die Pulvermethode nach Debye-Scherrer. Hierbei wird der Strahl auf ein Kristallpulver geschickt und die verschiedenen Orientierungen der Kristallite im Pulver sorgen für die Ausbildung der Reflexe. Im Bild der Ewald-Konstruktion im reziproken Gitter (Abb. 3.4) kann man sich die erlaubten Reflexe dadurch ermitteln, dass man sich das reziproke Gitter in allen Orientierungen um den Ursprung durch die Ewald-Kugel gedreht denkt. Es werden also alle Reflexe beobachtet, die innerhalb eines Radius von 2 k0 im reziproken Gitter liegen. Die Pulvermethode wird eingesetzt, um z. B. die Veränderung der Gitterkonstanten mit der Temperatur oder bei Variation der Zusammensetzung einer Legierung zu messen. Das allereinfachste Verfahren, Beugungsreflexe zu erzeugen, besteht darin, ein Wellenlängenkontinuum zu verwenden, wie z. B. das Röntgen-Bremsspektrum. Es werden dann alle Reflexe beobachtet, die zwischen der Ewald-Kugel mit minimalem und maximalem k0 des verwendeten Röntgenlichtes liegen. Dieses sogenannte Laue-Verfahren hat den Vorteil, dass bei geeigneter Orientierung des Kristalls die Symmetrie des Kristalls unmittelbar im Beugungsbild erscheint. Strahlt man z. B. entlang einer n-zähligen Achse ein, so hat das Beugungsbild n-zählige Symmetrie. Das Laue-Verfahren wird deshalb zur Orientierung von Einkristallen bekannter Struktur eingesetzt und spielt eine wichtige Rolle bei der Probenpräparation. Eine Strukturuntersuchung ist aber damit nicht möglich.
Übungen zu Kapitel 3
3.1 (a) Man zeige: Das reziproke Gitter des reziproken Gitters ist das ursprüngliche Realraumgitter! Hinweis: Seien G = m1 g1+m2 g2+m3 g3 reziproke Gittervektoren des Realraumgitters und die g1 die zugehörigen Basisvektoren, dann muss für die reziproken Gittervektoren G * = n1 g*1 +n2 g*2 +n3 g*3 des reziproken Gitters definitionsgemäß G *·G = 2 pk gelten, wobei k ganzzahlig ist. g2 g3 Dies ist erfüllt für g*1 = 2 p g1
g2 g3 und zyklische Vertauschung der Indizes. (b) Die Funktion f (r) sei gitterperiodisch. Zeigen Sie, dass die XVektoren k in der f^k exp
i k r Fourierreihe f
r
3.4 Zeigen Sie, dass das reziproke Gitter eines zweidimensionalen Gitters durch Stäbe dargestellt werden kann! Diskutieren Sie die Ewald-Konstruktion der Beugung an einem zweidimensionalen Gitter und bestimmen Sie die Richtung des gebeugten Strahls für eine feste Richtung des Wellenvektors der einfallenden Welle k0 ! Warum beobachtet man bei Elektronenbeugung an Oberflächen fester Körper (Rückstreuung) gebeugte Strahlen für beliebigen Betrag und Richtung von k0, sofern der Betrag von k0 über einem kritischen Wert liegt? Berechnen Sie die kritische Energie, bei der der erste gebeugte Strahl auftritt für den Fall senkrechter Inzidenz auf eine Cu(100)-Oberfläche!
k
reziproke Gittervektoren G sind! 3.2 (a) Berechnen X Sie den Strukturfaktor f exp
i Ghkl r für die Shkl
kubisch-flächenzentrierte Struktur! Für welche Indizes (hkl) findet man Auslöschung der gebeugten Strahlen? (b) Eine fcc-Struktur entsteht durch geeignete Ineinanderfügung von vier kubisch-primitiven (simple cubic, sc) Strukturen, die die gleiche Gitterkonstante wie die fcc-Struktur haben. Interpretieren Sie das Ergebnis aus (a) speziell für den (001)-Reflex (Auslöschung gegenüber sc) und den (111)-Reflex (Verstärkung gegenüber sc) durch eine Diskussion der Bragg-Reflexionen an den entsprechenden Netzebenen der sc- und der fcc-Struktur mit Hilfe geeigneter Skizzen! 3.3 Berechnen Sie den Strukturfaktor für die Diamantstruktur!
3.5 Berechnen Sie die Streuintensität für eine Rechteckstruktur gebildet von den Gittervektoren rn = 2 a n ex + a m ey! Die Struktur habe eine Basis von Atomen bei (0,0) und (1/2, R). Für welche Reflexe gibt es Auslöschungen durch die Gleitspiegelebene? Diskutieren Sie das Resultat in Abhängigkeit von R! 3.6 Man betrachte das Matrixelement für die Absorption von Röntgenstrahlen durch ein Atom h ijxj f i. Dabei sei h ij der Anfangszustand des gebundenen Elektrons und j f i ist der Endzustand in Gestalt einer s-Welle W = ei kr/r. Der Wert von k ist infolge der Energieerhaltung durch die Photonenenergie hm und die Ionisierungsenergie EI festgelegt: h 2 k 2/2 m = h m–EI. Die durch den Photoionisationsprozess emittierte Elektronenwelle werde an den nächsten Nachbaratomen gestreut. Der Endzustand besteht dann also aus der emittierten s-Welle und den Streuwellen der nächsten Nachbarn. Wie ist
Übungen zu Kapitel 3
der Verlauf der Absorptionskonstanten in Abhängigkeit von der Photonenenergie oberhalb der Absorptionskante? Beschreiben Sie eine Methode zur Bestimmung der Abstände nächster Nachbarn aus den Oszillationen der Absorptionskonstanten oberhalb der Absorptionskante (Extended X-ray Absorption Fine Structure: EXAFS!). Was für eine Röntgenlichtquelle braucht man für solche Untersuchungen? Warum muss man für die Anwendung der Methode die oszillatorische Struktur der Absorption deutlich oberhalb der Absorptionskante heranziehen? Warum ist es schwierig, die Abstände von Kohlenstoffatomen mit dieser Methode zu bestimmen (der Grund ist rein experimentell)? 3.7 (a) Man zeige, dass der Anteil für große r in der Korrelationsfunktion g (r) (3.14) zu einer Vorwärtsstreuung führt! Wie kann man aus der experimentellen Intensität I (K) die Korrelationsfunktion bestimmen, auch wenn man die Intensität der Vorwärtsstreuung I (K = 0) nicht kennt? (b) Flüssigkeiten sind durch das Verschwinden von Scherkräften charakterisiert. Das Pauli-Prinzip sorgt dafür, dass die Atome sich in etwa wie harte Kugeln
71
verhalten. Mit Hilfe von Kugeln (z. B. Tennisbällen) demonstriere man, dass der Abstand übernächster Nachbarn in einer p Flüssigkeit im Mittel wenigstens 2r 3 betragen muss, mit r dem Kugelradius bzw. dem halben Abstand nächster Nachbarn. Man vergleiche dieses Ergebnis mit Abb. 3.2! Warum gelten diese Überlegungen nicht für Wasser? 3.8 Berechnen Sie die Streuintensität von einer linearen Kette von Atomen mit geordneten Domänen von jeweils N Atomen! Es soll keine Phasenkorrelation zwischen den Atomen in verschiedenen Domänen bestehen. 3.9 Diskutieren Sie qualitativ den Verlauf des atomaren Streufaktors als Funktion des Streuwinkels für Elektronen, Röntgenstrahlen und Neutronen! 3.10 Die elastische Streuung an einem unendlich ausgedehnten Gitter führt gemäß (3.26) zu unendlich scharfen Beugungsreflexen. Diskutieren Sie auf der Basis von (3.26) die Beugung an Kristallen endlicher Größe! Wie lässt sich die durchschnittliche Kristallitgröße aus dem Beugungsbild bestimmen?
Tafel I
Tafel I Beugungsexperimente mit verschiedenen Teilchen
I.1 Elektronen Hier zeigen wir ein Experiment zur Beugung mit niederenergetischen Elektronen von 10–1000 eV
Abb. I.1. Schema einer Anordnung zur Beobachtung von LEED-Reflexion an einkristallinen Oberflächen
(LEED · Low Energy Electron Diffraction). Niederenergetische Elektronen werden vom Festkörper schon nach der Durchstrahlung von wenigen Netzebenen absorbiert. Beugungsexperimente sind deshalb nur als Reflexionsexperimente möglich und sie zeigen die Struktur der obersten Atomlagen eines Kristalls. Das erste Elektronenbeugungsexperiment wurde von Davisson u. Germer [I.1] 1927 ausgeführt, die damit die Wellennatur des Elektrons experimentell nachwiesen. Eine geeignete Anordnung, bei der die Beugungsreflexe direkt auf einem Fluoreszenzschirm sichtbar gemacht werden, zeigt Abb. I.1. Wegen der Oberflächenempfindlichkeit der Methode müssen LEEDExperimente im Ultrahochvakuum (p<10–8 Pa) mit reinen Oberflächen ausgeführt werden. Ein
Abb. I.2. (a) Beugungsbild einer Nickel (111)-Oberfläche bei einer Primärenergie von 205 eV, was einer Wellenlänge von ˚ entspricht. Aus der Lage der Reflexe könnte man z. B. 0,86 A die Gitterkonstante ermitteln. Interessanter sind Adsorptionsexperimente, da Adsorbate häufig Überstrukturen bilden. (b) Beugungsbild nach Adsorption von Wasserstoff. Die zusätzlichen Reflexe zeigen eine sogenannte (2´2) Überstruktur, d. h. die Elementarmasche ist in beiden Achsenrichtungen doppelt so groß
73
Beispiel für ein Beugungsbild einer (111)-Oberfläche von Nickel zeigt Abb. I.2 a. Die starke Absorption der Elektronen bringt mit sich, dass die dritte Laue-Bedingung der konstruktiven Interferenz zwischen den Netzebenen parallel zur Oberfläche, also den (111)-Ebenen, nur von geringer Bedeutung ist. Als Resultat werden die Beugungsreflexe bei jeder Elektronenenergie ( ^ Wellenlänge der Strahlung) beobachtet. Man beachte ferner, dass die Symmetrie des Beugungsbildes nur 3zählig, nicht 6zählig ist. Die für Beugung ohne Absorption hergeleitete Friedelsche Regel (3.31) gilt hier
also nicht, und das Beugungsbild zeigt die wirkliche Zähligkeit der Raumdiagonalen im fcc-Gitter. In Abb. I.2 b ist das Beugungsbild der gleichen Oberfläche nach Adsorption von Wasserstoff zu sehen. Die zusätzlichen Beugungsreflexe zeigen, dass Wasserstoff – wie viele andere Adsorbate auf Oberflächen – eine Überstruktur aufbaut. Die Größe der Elementarmasche der Wasserstoffschicht ist hier gerade doppelt so groß wie die Elementarmasche der Nickel (111)-Oberfläche. Die Zusatzreflexe liegen deshalb auf halber Position zwischen den Reflexen des Nickel-Substrates.
Abb. I.3. Beugung eines He-Strahls an einer gestuften Platinoberfläche nach Comsa [I.3]. Die Millerschen Indizes der Fläche sind (997). Wie bei einem Echelette-Gitter in der Lichtoptik erhält man maximale Intensität in den Beugungs-
ordnungen, die in Richtung der Spiegelreflexion am Wechselwirkungspotential liegen. Allerdings ist dieses Potential nicht genau parallel zu den Terrassen
Tafel I
I.1 Elektronen
Tafel I
74
Tafel I Beugungsexperimente mit verschiedenen Teilchen
I.2 Atomstrahlen Beugung von He- und H2-Strahlen an Festkörperoberflächen wurde erstmals in den Experimenten von Estermann u. Stern 1930 [I.2] nachgewiesen. Ein damals für die experimentelle Bestätigung der Quantentheorie wichtiges Resultat! Aus heutiger Sicht muss es als ein besonders glücklicher Umstand erscheinen, dass Estermann u. Stern mit Alkalihalogenid-Kristallen (NaCl und LiF) arbeiteten. Geben doch die meisten anderen Oberflächen, insbesondere die Metalle, keine Beugungserscheinungen. Der Grund ist, dass He-Atome geeigneter Wellenlänge (s. Abb. 3.11) nur mit der äußersten Oberfläche des Festkörpers wechselwirken und das Potential dort sehr glatt verläuft, also kaum etwas von der periodischen Anordnung der Kristallatome bemerkt. Weiterhin mussten Beugungsexperimente an Metallen und den meisten anderen Materialien schon deshalb erfolglos bleiben, als es erst die Entwicklung der Ultrahochvakuumtechnik erlaubt, deren Oberflächen in genügend reiner Form zu präparieren. Wir zeigen hier ein Beispiel für Beugung von He-Atomen an einer gestuften Platin-Oberfläche (Abb. I.3 unten) nach Comsa et al. [I.3]. Oberflächen mit regelmäßigen monoatomaren Stufen lassen sich durch entsprechenden Anschnitt und Glühen im Vakuum herstellen. Der für die Beugungsversuche verwendete Atomstrahl wird durch Überschallexpansion aus einer Düse hergestellt. Durch die Wechselwirkung der Atome untereinander bei der Expansion wird die Geschwindigkeitsverteilung deutlich schärfer als die Maxwellsche Geschwindigkeitsverteilung vor der Expansion: Wie Fahrzeuge auf einer verkehrsreichen Autobahn müssen die Atome ihre Geschwindigkeit in Vorwärtsrichtung aneinander anpassen. In Abb. I.3 wird die gebeugte Intensität als Funktion des Streuwinkels dargestellt. Der Einfallswinkel beträgt 85 ° zur Normalen auf die makroskopische Oberfläche. Die Intensitätsmaxima entsprechen den Beugungsordnungen am periodischen Gitter der Terrassen (nicht der Einzelatome!). Wie bei einem optischen Echelette-Gitter wird dabei die Richtung der Spiegelreflexion zu den Terrassen intensitätsmäßig bevorzugt. Al-
lerdings zeigt das Wechselwirkungspotential (gepunktete Linie in Abb. I.3 unten) eine zusätzliche Aufwölbung in der Nähe der Stufenkante, wodurch sich der günstige Beugungswinkel zu kleinen Werten verschiebt.
I.3 Neutronen Erste Beugungsexperimente mit Neutronen wurden schon in den dreißiger Jahren unternommen, aber erst die hohen Neutronenflüsse, die an Kernreaktoren seit etwa 1945 zur Verfügung stehen, ermöglichten den Einsatz dieser Strahlung für Strukturuntersuchungen. Der Hauptteil der Neutronen steht dabei als sog. thermische Neutronen (T*400 K) zur Verfügung. Wie wir aus Abb. 3.11 entnehmen können, fällt damit die deBroglie-Wellenlänge in einen für Strukturuntersuchungen günstigen Bereich. Um zu einer definierten Wellenlänge für Strukturuntersuchungen zu gelangen, verwendet man zwei verschiedene Verfahren. Beim Kristallmonochromator wird die Wellenlängenabhängigkeit des Bragg-Reflexes ausgenutzt. Die Monochromatisierung wird erzielt durch Ausblenden eines schmalen Winkelbereiches. Alternativ kommen Flugzeitspektrometer zum Einsatz, deren rotierende Schlitzblenden eine betimmte Geschwindigkeit (d. h. de Broglie Wellenlänge) selektieren. Bei heute vermehrt zu Verfügung stehenden gepulsten Neutronenquellen kann auch das gesamte weiße Spektrum eines Pulses für die Strukturanalyse wie beim LaueVerfahren eingesetzt werden. Im Unterschied zum Laue-Verfahren kann aber jetzt die Wellenlänge der Neutronen in einem Reflex durch eine Flugzeitmessung zwischen Probe und Detektor bestimmt werden. So wird eine eindeutige Zuordnung von Reflex und Wellenlänge erzielt, wie sie für eine Strukturuntersuchung erforderlich ist. Die Beugung von Neutronen findet ihre Hauptanwendungsfelder bei Lokalisierung von Wasserstoff im Festkörper (und biologischen Systemen), bei der Untersuchung magnetischer Strukturen und bei Ordnungs-Unordnungsphasenübergängen [I.4]. Wir wollen ein Beispiel aus dem Bereich der Phasenübergänge diskutieren:
75
Tafel I
I.3 Neutronen
Abb. I.4. (a) Die ungeordnete und geordnete Phase von FeCo. (b) Neutronendiffraktogramm der geordneten und ungeordneten FeCoPhase nach Shull u. Siegel [I.5]. Man beachte, welch geringe Zählraten in der Neutronenstreuung üblich sind. Für eine gute Statistik sind lange Messzeiten erforderlich
Die Legierung FeCo mit je 50% Fe und Co kristallisiert in der kubisch-raumzentrierten (bcc) Struktur. Bei hohen Temperaturen oder bei abgeschreckten Proben sind die Fe und Co Atome statistisch auf die Plätze der bcc Struktur verteilt (Abb. I.4 a). Bei langsamer Abkühlung jedoch bildet sich eine geordnete Phase, bei der die raumzentrierte Position von der anderen Atomsorte eingenommen wird (Abb. I.4 a). Es entsteht also eine CsCl-Struktur. Entsprechende Ordnungsphänomene sind auch bei anderen Legierungen und anderen Strukturen bekannt. Sie lassen sind durch Beugungsexperimente nachweisen. In Abschn. 3.6 hatten wir die systematischen Auslöschungen der kubisch-raumzentrierten Struk-
tur kennengelernt. Sie betrafen alle Reflexe, bei denen die Summe h+k+l ungerade ist, also (100), (111), (210), (300). Entsprechend treten diese Reflexe für die ungeordnete Phase (Abb. I.4 b, unten) nicht auf, wohl dagegen für die geordnete Phase (Abb. I.4 b, oben), denn die Atomfaktoren von Fe und Co sind verschieden. Diese Aussage gilt im Prinzip für jede Strahlungsart. Für Röntgenstrahlen sind die Atomfaktoren von Fe und Co jedoch nahezu gleich, da es sich um benachbarte Elemente handelt und der Atomfaktor für Röntgenstrahlung in systematischer Weise in etwa proportional mit der Kernladungszahl Z variiert. Wie aus (3.47) leicht ersichtlich wird, ist die Intensität des (100)Reflexes der CsCl-Struktur (geordnete Phase) pro-
Tafel I
76
Tafel I Beugungsexperimente mit verschiedenen Teilchen
portional zu (fFe–fCo)2. Der Ordnungszustand ist deshalb mit Röntgenbeugung üblicherweise nicht sichtbar. Anders dagegen bei Neutronenstreuung: Hier unterscheiden sich die Atomfaktoren für Fe und Co um einen Faktor 2,5. Abbildung I.4 b zeigt eine Pulveraufnahme für geordnetes und ungeordnetes FeCo. Die für die bcc-Struktur verbotenen Reflexe (100), (111), (210) sind in der geordneten Phase mit CsClStruktur deutlich sichtbar.
Literatur I.1 C. J. Davisson, L. H. Germer: Nature 119, 558 (1927); Phys. Rev. 30, 705 (1927) I.2 I. Estermann, O. Stern: Z. Phys. 61, 95 (1930) I.3 G. Comsa, G. Mechtersheimer, B. Poelsema, S. Tomoda: Surf. Sci. 89, 123 (1979) I.4 G. F. Bacon: Neutron Diffraction, 2nd edn. (Oxford University Press, Oxford 1962) I.5 C. G. Shull, S. Siegel: Phys. Rev. 75, 1008 (1949)
Röntgenstrahlen lassen sich nicht nur verwenden, um Strukturparameter von Einkristallen zu bestimmen, sondern auch um bestimmte Abweichungen von der periodischen Struktur und Baufehler sichtbar zu machen. Die Sichtbarmachung selbst geringfügiger Verspannungen eines Kristalls gelingt z. B. mit der Röntgeninterferometrie. Interferenzerscheinungen werden bekanntlich beobachtet bei der Überlagerung von Wellen mit gleicher Frequenz und fester Phasenbeziehung zueinander. In der Lichtoptik erreicht man dies durch Teilung und Wiederzusammenführung eines Lichtbündels. Analog kann man auch mit Röntgenstrahlen verfahren. Man benutzt dazu
eine Anordnung wie in Abb. II.1. Die mit S, M und A bezeichneten Platten sollen perfekte Einkristalle darstellen, die zueinander exakt parallel ausgerichtet sind. Im Strahlteiler S findet bei geeignetem Einschusswinkel Bragg-Reflexion an den Netzebenen statt. Wie in Abschn. 3.4 und 7.2 beschrieben, entstehen dabei im Kristall zwei Wellentypen, einer mit den Intensitätsknoten am Ort der Atome und ein zweiter mit den Knoten dazwischen (s. a. Abb. 7.4). Nur ersterer bleibt bei größerer Kristalldicke übrig, während letzterer stark absorbiert wird. (Anomale Transmission bzw. Absorption.) Beim Austritt aus dem Kristall entstehen zwei Bündel gleicher Intensität, wovon eines dem transmittierten und das andere dem
Abb. II.1. Eine Interferenzanordnung für Röntgenstrahlen nach Bonse [II.1]. d soll schematisch den Netzebenenabstand darstellen
Abb. II.2. Röntgeninterferometer aus einer Siliziumscheibe
Tafel II
Tafel II Röntgeninterferometer und Röntgentopographie
Tafel II
78
Tafel II Röntgeninterferometer und Röntgentopographie
Bragg-reflektierten Strahl entspricht. Sie werden durch weitere Bragg-Reflexion im Spiegel M wieder zusammengeführt. Die Knoten und Bäuche der stehenden Welle haben die gleiche Position wie im Strahlteiler. Sofern im Analysator A die Netzebenen mit den Knoten wie in S übereinstimmen, erhalten wir, nach Passieren von A, Helligkeit, bei Verschiebung um eine halbe Gitterkonstante dagegen, wegen der jetzt starken Absorption, Dunkelheit. Passen die Gitter S und A nicht exakt zueinander, so entstehen MoiréStreifen. Die Abb. II.2 und II.3 zeigen ein Beispiel nach Bonse [II.1]. Das Interferometer (Abb. II.2) ist aus einem Siliziumkristall von 8 cm Durchmesser geschnitten. Die zugehörige Moiré-Topographie zeigt deutlich, dass der Kristall großräumige Verzerrungen aufweist. Die beim Verschieben von A gegen S (Abb. II.1) entstehenden Hell-Dunkelphasen können auch zur direkten Bestimmung der Gitterkonstanten verwendet werden. Man braucht dazu
Abb. II.3. Moiré-Topographie des Siliziumferometers. Die vertikalen Linien sind durch die streifenweise Aufnahme bedingt
nur die mechanische Verschiebung durch die Zahl der Hell-Dunkelwechsel zu dividieren und erhält die Gitterkonstante ohne Verwendung der benutzten Wellenlänge des Röntgenlichtes. Damit ist z. B. ein genauer Anschluss der Skala der Röntgenwellenlängen an die Definition des Meters durch die rote Linie von 86Kr möglich. Während die Röntgeninterferometrie ein Moiré-Bild der Gitterverzerrungen bzw. von Baufehlern erzeugt, erlaubt die Röntgentopographie auch eine direkte Beobachtung. Wir betrachten dazu eine experimentelle Anordnung nach Hartmann [II.2] (Abb. II.4). Die Röntgenstrahlen einer Mo-Ka-Quelle durchsetzen dabei einen Kristall und werden nach Bragg-Reflexion auf einem Leuchtschirm sichtbar gemacht. Bei ideal punktförmiger Lichtquelle würden nur die beiden in Abb. II.4 gezeichneten Strahlen die Bragg-Be-
Abb. II.4. Röntgentopographie zur Direktabbildung von Gitterfehlern nach Hartmann [II.3]. Der Kristall befindet sich in einem Ofen mit Beryllium-Fenstern. Beryllium hat wegen seiner kleinen Kernladungszahl nur eine geringe Absorption für Röntgenstrahlen. Der Ofen kann durch Graphitstäbe beheizt werden. Gitterfehler erscheinen als helle Flecken auf dem Leuchtschirm und können in ihrem zeitlichen Verlauf direkt auf dem Fernseh-Monitor verfolgt werden
79
dingung erfüllen. Bei endlicher Ausdehnung der Quelle entstehen auf dem Leuchtschirm helle Flecken, die bei geeigneter Wahl der Quellengröße so groß gemacht werden können, dass die Helligkeitsbereiche von Ka1 und Ka2 gerade ineinander übergehen. Für feste Wellenlänge der Strahlung entspricht also in dieser Anordnung ein Punkt des Leuchtschirmes einem Punkt der
Quelle. Hat man dagegen Kristallstörungen, so ist die Bragg-Bedingung für einen Punkt des Leuchtschirmes nicht für einen Punkt der Quelle, sondern für einen größeren Bereich der Quelle oder sogar die ganze Quelle erfüllt. Kristallstörungen bewirken also eine weitere, zusätzliche Aufhellung. Abbildung II.5 a zeigt dies für einen mittels eines Diamanten verursachten Eindruck
Abb. II.5. (a) Röntgentopographie eines durch Eindruck eines Diamanten gestörten Si-Kristalls (nach Hartmann). (b) Nach Tempern auf 1130 °C wird die Ausbildung von Versetzungen beobachtet. Zwei Versetzungen (Pfeil ) haben einen Knoten.
(c) Der Knoten ist zur Oberfläche gewandert. Die Temperatur beträgt jetzt 1234 °C. (d) Die Versetzungen haben sich getrennt und bewegen sich weiter voneinander weg
Tafel II
Tafel II Röntgeninterferometer und Röntgentopographie
Tafel II
80
Tafel II Röntgeninterferometer und Röntgentopographie
auf einem Si-Kristall. Bei höheren Temperaturen können die Gitterdefekte teilweise wieder ausheilen. Es bleiben aber Versetzungen übrig. Eine schematische Darstellung einer Versetzung zeigt Abb. 2.20. Versetzungen erzeugen entlang einer Linie ein Verzerrungsfeld, das ebenfalls in der Topographie sichtbar wird. Abbildung II.5 b zeigt solche Versetzungslinien nach Tempern des SiKristalls. Bei noch höheren Temperaturen wandern die Versetzungen schließlich auseinander (Abb. II.5 c).
Literatur II.1 U. Bonse, W. Graeff, G. Materlik: Rev. Phys. Appl. 11, 83 (1976); U. Bonse: Private Mitteilung II.2 W. Hartmann: In X-Ray Optics, ed. by H.-J. Queisser, Topics Appl. Phys., Vol. 22 (Springer, Berlin, Heidelberg 1977) p. 191 II.3 W. Hartmann: Private Mitteilung
4. Dynamik von Atomen in Kristallen
Die physikalischen Eigenschaften eines Festkörpers lassen sich grob unterteilen in solche, die vom Elektronensystem her bestimmt werden, und solche, die durch die Bewegungen der Atome um ihre Gleichgewichtslage gegeben sind. Zu letzteren gehören z. B. die Ausbreitungsgeschwindigkeit von Schallwellen, ferner die thermischen Eigenschaften: spezifische Wärme, thermische Ausdehnung und – bei Halbleitern und Isolatoren – die Wärmeleitfähigkeit. Auch die Härte eines Materials ist letztlich durch Bewegungen der Atome aus ihrer Gleichgewichtslage bestimmt, jedoch spielen hier Strukturfehler eine entscheidende Rolle. Die Aufteilung der Festkörpereigenschaften in atomdynamische und elektronische hat einen qualitativ leicht einsehbaren Grund: Die Bewegungen der Atomkerne im Festkörper sind wegen ihrer hohen Masse viel langsamer als die der Elektronen. Verschiebt man die Atome aus ihrer Gleichgewichtslage, so stellt sich eine neue Elektronenverteilung (mit höherer Gesamtenergie) ein. Das Elektronensystem bleibt bei dieser Verschiebung im Grundzustand. Bei Rückführung in die Ausgangslage wird also die volle aufgewandte Energie zurückgewonnen und es verbleibt keine Anregung des Elektronensystems. Die Gesamtenergie als Funktion der Koordinaten aller Atomkerne spielt also die Rolle eines Potentials für die Atombewegungen. Natürlich ist diese Betrachtungsweise nur eine Näherung. Es gibt auch Effekte, bei denen die Wechselwirkung zwischen Atomdynamik und dem Elektronensystem wichtig ist (s. Kap. 9). Die hier besprochene sogenannte „adiabatische“ Näherung wurde von Born u. Oppenheimer [4.1] eingeführt. Da das Potential für die Bewegung der Atomkerne durch die Gesamtenergie und damit letztlich durch die Eigenschaften des Elektronensystems gegeben ist, könnte man daran denken, zunächst die elektronischen Eigenschaften in allen Einzelheiten zu beschreiben, daraus das Potential für die Atombewegungen abzuleiten und schließlich daraus wieder alle jene Eigenschaften des Festkörpers, die durch die Atombewegungen bestimmt werden. Dieser Weg ist tatsächlich gangbar, jedoch mit einem für ein Lehrbuch unvertretbaren mathematischen Aufwand. Glücklicherweise lassen sich viele prinzipielle Aussagen über das thermische Verhalten von Festkörpern oder die Wechselwirkung mit elektromagnetischer Strahlung gewinnen, ohne dass die explizite Form des Potentials für die Kernbewegungen bekannt sein muss. Man benötigt lediglich einen allgemeinen Formalismus, mit dem für ein beliebiges
82
4. Dynamik von Atomen in Kristallen
Potential Bewegungsgleichungen aufgestellt und gelöst werden können. Mit diesem Formalismus wollen wir uns im folgenden beschäftigen. Seine Erarbeitung ist Voraussetzung für das Verständnis des folgenden Kapitels, in dem die thermischen Eigenschaften des Festkörpers besprochen werden.
4.1 Das Potential Zunächst benötigen wir zur Kennzeichnung eines bestimmten Atoms eine geeignete Indizierung. Wir wollen die Indizierung so gestalten, dass sie für den periodischen Festkörper besonders geeignet ist. Sie ist leider wegen der vielen Freiheitsgrade etwas kompliziert. Wie bisher nummerieren wir die Elementarzelle durch das Zahlentripel n = (n1, n2, n3) bzw. m = (m1, m2, m3) und die Atome in der Zelle durch den Index bzw. b. Die i-te Komponente des Ortsvektors in der Gleichgewichtslage wird dann mit rn i und die Auslenkung aus der Gleichgewichtslage mit un i bezeichnet (Abb. 4.1). Wir entwickeln nun die Gesamtenergie des Kristalls U, die eine Funktion aller Kernkoordinaten ist, in eine Taylorreihe um die Gleichgewichtslagen rn i 1X @2U U
rn i un i U
rn i un i um b j . . . :
4:1 2 n i @rn i @rm b j mbj
Der in den un i lineare Term verschwindet, da um die Gleichgewichtslage entwickelt wird. Die Summationsindizes n, m zählen
u
Abb. 4.1. Erklärung der Vektornomenklatur für Gitterschwingungen im dreidimensionalen periodischen Kristall: Der Gittervektor rn führt vom willkürlich gewählten Gitterpunkt (0, 0, 0) zum Nullpunkt der n-ten Elementarzelle n = (n1, n2, n3), von wo aus die Lage des Atoms durch r beschrieben wird. Die Auslenkung des Atoms in der n-ten Zelle sei dann un , so dass eine zeitabhängige Lage in bezug auf (0, 0, 0) rn +un (t) ist
4.2 Die Bewegungsgleichungen
83
alle Elementarzellen ab, , b die Atome in der Zelle und i, j die drei Raumrichtungen. Höhere Glieder der Entwicklung sollen zunächst vernachlässigt werden. Die Gl. (4.1) stellt dann eine Erweiterung des Potentials eines harmonischen Oszillators auf viele Teilchen dar. Die Vernachlässigung höherer Terme in (4.1) heißt deshalb auch die „harmonische“ Näherung. Effekte, die erst durch Hinzunahme weiterer Terme beschrieben werden können (z. B. die thermische Ausdehnung von Festkörpern, s. Kap. 5), werden als anharmonische Effekte bezeichnet. Die Ableitungen des Potentials @2U bj Um ni @rn i @rm b j
4:2
heißen „Kopplungskonstanten“. Sie haben die Dimension von Federkonstanten und stellen die Verallgemeinerung der Federkonstanten eines harmonischen Oszillators auf ein System mit vielen Freibj heitsgraden dar. Die Größe –U m n i um b j ist also die Kraft auf das Atom in der Elementarzelle n in Richtung i, wenn das Atom b in der Elementarzelle m in Richtung j um die Strecke um b j verbj schoben wird. Bei positivem Wert von U m n i ist dabei die Kraft in negativer Richtung von u wirksam. Wir sehen, dass die Beschreibung Wechselwirkungen zwischen beliebig weit entfernten Atomen zulässt. Einfache Modelle begnügen sich häufig damit, nur die Wechselwirkung zwischen den nächsten Nachbarn zu berücksichtigen. Die Kopplungskonstanten müssen einer Reihe von Bedingungen genügen, die sich aus der Isotropie des Raumes, der Translationsinvarianz und den Punktsymmetrien ergeben [2.2]. Aus der Translationsinvarianz bei Verschiebungen des Gitters um einen beliebibj gen Gittervektor folgt z. B., dass die Größe U m n i nur von der Differenz zwischen m und n abhängen darf:
m n b j
bj Um n i U0 i
:
4:3
4.2 Die Bewegungsgleichungen Für die Auslenkung u eines Atoms in der Elementarzelle n in Richtung i muss die Summe der Kräfte aus der Kopplung zu anderen Atomen und der Trägheitskraft Null sein: X mbj M un i Un i um b j 0 :
4:4 mbj
Für N Elementarzellen und r Atome in der Zelle sind dies 3 r N gekoppelte Differentialgleichungen, die die Bewegung der Atome beschreiben. Für periodische Strukturen lässt sich glücklicherweise durch einen geeigneten Ansatz bereits eine weitgehende Entkopp-
84
4. Dynamik von Atomen in Kristallen
lung erzielen. Dieser besteht darin, den Auslenkungen un i bezüglich der Zellenkoordinaten die Form einer ebenen Welle zu geben: 1 un i p u i
qei
qrn M
xt
:
4:5
Im Gegensatz zu einer gewöhnlichen ebenen Welle ist diese Welle nur an den Gitterpunkten rn definiert. Setzt man den Ansatz in (4.4) ein, so erhält man eine Gleichung für die Amplituden u i XX 1 b j i q
rm rn p Um x2 u i
q ub j
q 0 :
4:6 ni e M M b bj m |{z} Db ji
q
Wegen der Translationsinvarianz hängen die Glieder der Summe nach (4.3) nur von der Differenz m – n ab. Nach Ausführung der Summation über m ergibt sich eine Größe D bji (q), die von n unabhängig ist. Sie koppelt also die Amplituden untereinander unabhängig von n. Dies ist die Rechtfertigung dafür, dass in dem Ansatz (4.5) die Amplituden tatsächlich ohne den Index n geschrieben werden durften. Die Größen D bji (q) bilden die dynamische Matrix. Das Gleichungssystem X bj D i
q ub j
q 0
4:7 x2 u i
q bj
ist ein lineares homogenes Gleichungssystem von der Ordnung 3 r. Im Falle eines primitiven Gitters ist r = 1 und für jeden Wellenvektor q ist nur noch ein System dreier Gleichungen zu lösen. Wir sehen, welche Vereinfachung die Translationssymmetrie bedeutet! Ein lineares homogenes Gleichungssystem hat nur dann Lösungen (Eigenlösungen), wenn die Determinante verschwindet: Det fD b ji
q
x2 1g 0
4:8
Diese Gleichung hat für jeden Wellenzahlvektor q gerade 3 r verschiedene Lösungen für x (q). Die Abhängigkeit x (q) wird als Dispersionsrelation bezeichnet. Die 3 r verschiedenen Lösungen bezeichnet man als die „Zweige“ der Dispersionsrelation. Über diese Zweige lassen sich eine Reihe von allgemeinen Aussagen machen. Wir wollen diese Aussagen jedoch nicht mathematischallgemein aus (4.8) herleiten, sondern einen speziellen Fall, die lineare zweiatomige Kette, diskutieren. Wir können dann die Ergebnisse benutzen, um uns einen Überblick über die Dispersionszweige des dreidimensionalen Kristalles zu verschaffen.
4.3 Die lineare zweiatomige Kette
85
4.3 Die lineare zweiatomige Kette Die in (4.1) und (4.2) dargestellten Zusammenhänge werden an einem Modell verdeutlicht, das zwar für die Physik des realen Festkörpers kaum eine Bedeutung hat, wegen seiner einfachen Mathematik aber gerne herangezogen wird. Wir betrachten eine lineare Kette mit gleichen Federn zu den nächsten Nachbarn (Federkonstante f ) und zwei Atomen in der Elementarzelle (Abb. 4.2). Die Indizes , b in (4.4) durchlaufen also die Werte 1 und 2, der Index i hat nur einen Wert, kann also weggelassen werden. Da nur Wechselwirkung mit den nächsten Nachbarn angenommen wird, kann in der Summe in (4.4) der Index m nur die Werte n+1, n, n–1 annehmen. Damit folgt M1 un1 Unn1 1;2 un
1;2
n2 Un1 n1 un1 Un1 un2 0 ;
n1;1 n2 un1;1 0 : M2 un2 Un1 n2 un1 Un2 un2 Un2
(4.9)
Die Werte dieser verbleibenden Kopplungskonstanten sind n1;1 n1 Unn1 1;2 Un2 n1 Un2 Un2
Un1 n1
Un2 n2
f
und
4:10
2f :
Damit erhalten wir M1 un1 f
2un1 M2 un2 f
2un2
un2 un1
un 1;2 0 ; un1;1 0 :
(4.11)
Der Ansatz ebener Wellen (4.5) lautet dann 1 un p u
q ei
qan M
xt
:
Wir setzen (4.12) in (4.11) ein und erhalten 2f 1 2 x u1 f p
1 e iqa u2 0 ; M1 M1 M2 1 2f iqa 2 f p
1 e u1 x u2 0 : M2 M1 M2 Die dynamische Matrix D bji (q) ist also 0 1 2f f p
1 e iqa B C M1 M1 M2 B C: @ A f 2f iqa p
1 e M2 M1 M2
4:12
(4.13)
4:14
Abb. 4.2. Modell der zweiatomigen linearen Kette
86
4. Dynamik von Atomen in Kristallen
Nullsetzen der Determinante des Gleichungssystems (4.13) führt auf die Dispersionsrelation " #1=2 1 1 1 1 2 4 2 2 qa f sin :
4:15 x f M1 M2 M1 M2 M1 M2 2 Offenbar ist diese Dispersionsrelation periodisch in q mit der Periode qa p; 2 2p :
4:16 q a Der Periodizitätsabstand in q ist also gerade ein reziproker Gittervektor. Dies lässt sich auch allgemein für beliebige Gitter zeigen. Wir brauchen dazu nur auf die Definition der dynamischen Matrix zurückzugehen. Es gilt nämlich Db ij
q Db ij
q G wegen
3:15
G rn 2 p m :
4:17
Also müssen auch die Eigenlösungen (4.7) bzw. (4.8) die Bedingung x
q x
q G
4:18
erfüllen. Es gilt ferner x
q x
q ;
4:19
denn u (– q) stellt gerade die rücklaufende Welle zu u (q) dar. Hinund rücklaufende Welle gehen aber auch durch Zeitumkehr auseinander hervor. Andererseits sind die Bewegungsgleichungen zeitumkehrinvariant, woraus folgt, dass die Eigenfrequenzen für + q und – q gleich sein müssen. Wir können die Inversionssymmetrie von x im q-Raum (4.19) auch aus der entsprechenden Symmetrie der dynamischen Matrix (4.6) herleiten. Ersetzt man in (4.6) q durch – q, so entspricht dies in der Definition der dynamischen Matrix lediglich einer Umbenennung der Indizes m und n. Die dynamische Matrix hängt aber von diesen Indizes nicht ab. Bei der Darstellung von x (q) genügt es also, sich auf den Bereich 0 5 q 5G/2 zu beschränken. Der Punkt q = G/2 liegt gerade auf dem Rand der in Abschn. 3.5 eingeführten Brillouin-Zone. Die Funktion x (q) ist also durch Angabe ihrer Werte in einem Oktanten der Brillouin-Zone vollständig bestimmt. Für das Beispiel der linearen Kette sind in Abb. 4.3 die beiden Zweige für ein Massenverhältnis M1/M2 = 5 dargestellt. Der Zweig, der für kleine q gegen Null geht, heißt akustischer Zweig. Für diesen Zweig ist für kleine q (q p/a) die Kreisfrequenz x proportional zum Wellenzahlvektor q. Der akustische Zweig beschreibt dann also die dispersionsfreie Ausbreitung von Schallwellen.
4.3 Die lineare zweiatomige Kette
87
Abb. 4.3. Dispersionskurven einer zweiatomigen linearen Kette mit einem Massenverhältnis M1/M2 = 5. Mit zunehmendem Massenverhältnis verläuft der optische Zweig immer flacher
Der Zweig, für den x (q) j 0 für q = 0 ist, heißt optischer Zweig. Seine Frequenzen an den Punkten q = 0 und q = p/a lassen sich einfach interpretieren: Bei q = 0 sind die Auslenkungen in jeder Elementarzelle gleich. Die Untergitter aus leichter und schwerer Masse schwingen gegeneinander. Damit reduziert sich das System auf ein Zweimassensystem mit der Federkonstanten 2 f und der reduzierten Masse 1/l = 1/M1+1/M2. Für q = p/a ist entweder das Gitter mit der schweren Masse M1 oder der leichten Masse M2 in Ruhe. Dementsprechend sind die Frequenzen (2 f/M2)1/2 und (2 f/M1)1/2. Das beschriebene Modell wird gerne herangezogen, um Schwingungen in Ionenkristallen zu beschreiben, wo benachbarte Gitterpunkte mit Ionen entgegengesetzter Ladung belegt sind. Beim Vorliegen einer optischen Mode bei q % 0 bewegen sich dann innerhalb einer Elementarzelle die positiven Ladungen entgegengesetzt zu den negativen, d. h. es entsteht ein Dipolmoment. Dieses koppelt an ein äußeres elektrisches Wechselfeld (z. B. Infrarotstrahlung) an, wodurch eine solche Schwingung „infrarot-aktiv“ wird, d. h. infrarotes Licht absorbiert (s. Kap. 11). Bei der linearen Kette hatten wir nur Auslenkungen in Richtung der Kette zugelassen. Die Wellen sind also longitudinale Wellen. Beim dreidimensionalen Kristall gibt es zusätzlich noch jeweils zwei transversale Wellen. Allerdings ist die Trennung in longitudinal und transversal nur in bestimmten Symmetrierichtungen des Kristalls möglich. Für beliebige Richtung haben die Wellen einen Mischcharakter. Jeder Kristall hat drei akustische Zweige. Für kleinere q (lange Wellen) entsprechen diese den Schallwellen der Elastizitätstheorie (Abschn. 4.5). Für jedes zusätzliche Atom in der Elementarzelle erhält man drei weitere optische Zweige. Die Abzählung der Zahl der Atome in der Elementarzelle muss dabei an der kleinstmöglichen Ele-
88
4. Dynamik von Atomen in Kristallen
Abb. 4.4. (a) Phonon-Dispersionskurven von Si. Die Kreise und Dreiecke sind Messpunkte, die ausgezogenen Linien das Ergebnis einer Modellrechnung nach Dolling u. Cowley [4.3]. Anstelle des Wellenzahlvektors q benutzt man häufig eine Auftragung in den Koordinaten des reduzierten Wellenzahlvektors f = q/(2 p/ a). Die gezeichneten Längen der Abszissen entsprechen den richtigen Entfernungen der Punkte in der Brillouin-Zone. Die Zweige der Phonon-Dispersionskurven tragen die Bezeichnungen TA (transversal akustisch), LA (longitudinal akustisch), TO (transversal optisch) und LO (longitudinal optisch). Entlang der [100]- und der [111]-Richtung sind die transversalen Zweige entartet. Zur Entartung von LO und TO in C s. a. Abschn. 11.4. (b) An diesen aneinander gezeichneten Brillouin-Zonen kann man sehen, dass man beim Fortschreiten entlang der [110]-Richtung von C nach K und von dort auf der angrenzenden Brillouin-Zone von K nach X gelangt. Man kann also den Punkt X durch die Wellenzahlvektoren q = 2 p/a [001] und q = 2 p/a [11¯0] beschreiben. Man mache sich an Hand der fcc-Struktur (Abb. 2.8 bzw. 2.12) klar, dass diese q-Vektoren dieselben Atombewegungen beschreiben
mentarzelle erfolgen. Bei der kubischen fcc-Struktur, in der ja viele Metalle kristallisieren, enthält die kleinstmögliche Elementarzelle nur ein Atom (s. Abb. 2.8 a). Solche Kristalle haben also nur akustische Zweige. Das gleiche gilt für die kubisch-raumzentrierte Struktur. Wenn man sagt, dass Kristalle drei akustische Zweige haben, so heißt das nicht, dass diese unter allen Umständen verschiedene Frequenzen haben müssen. In den kubischen Strukturen z. B. sind die beiden transversalen Zweige entlang der [001]- und [111]-Richtung entartet. Dies gilt auch für die Diamantstruktur (s. Abb. 4.4). Diese enthält aber in der kleinstmöglichen Elementarzelle zwei Atome, weist also neben den akustischen Zweigen auch optische Zweige auf.
4.4 Streuung an zeitlich veränderlichen Strukturen – Phononenspektroskopie
89
Man beachte, dass „optisch“ alle Zweige genannt werden, die bei q = 0 eine von Null verschiedene Frequenz aufweisen. Dies ist nicht gleichbedeutend mit optischer Aktivität, was gerade am Beispiel des Diamantgitters erläutert werden kann: Bei q = 0 im optischen Zweig schwingen die beiden kubisch-flächenzentrierten Untergitter der Diamantstruktur gegeneinander. Da aber beide Teilstrukturen gleich sind, entsteht bei dieser Schwingung kein Dipolmoment, und es findet keine Wechselwirkung mit Licht statt. Die optischen Zweige sind bei q = 0 dreifach entartet. In Abschn. 2.4 hatten wir gesehen, dass solche dreifachen Entartungen nur bei den Punktgruppen kubischer Strukturen möglich sind. Im Gegensatz zur Diamantstruktur sind bei Zinkblendeteilstrukturen die beiden fcc-Strukturen mit verschiedenen Atomen besetzt. Dadurch entsteht mit der „optischen“ Schwingung ein Dipolmoment, das zur Absorption elektromagnetischer Strahlung im Frequenzbereich dieser Schwingung Anlass gibt. In Kap. 11 werden wir lernen, dass dadurch auch die Entartung zwischen der longitudinal optischen und den transversal optischen Wellen aufgehoben wird.
4.4 Streuung an zeitlich veränderlichen Strukturen – Phononenspektroskopie Die Lösungen der Bewegungsgleichungen für die Atome haben die Form ebener Wellen. In Analogie zum Wellen-Teilchen-Dualismus in der Quantentheorie kann man sich fragen, ob auch diese Wellen als Teilchen (Phononen) aufgefaßt werden können. Der Teilchenaspekt müsste sich dann z. B. in der Wechselwirkung mit anderen Teilchen, also Elektronen, Neutronen, Atomen und Photonen, offenbaren. Wir erweitern deshalb die in Kap. 3 abgeleitete Streutheorie auf Strukturen, die einer zeitlichen Veränderung unterliegen. Die Behandlung des Problems erfolgt also wieder im Rahmen einer quasi-klassischen Betrachtung. Später bei der Elektron-Phonon-Streuung (Kap. 9) werden wir auch die quantenmechanische Darstellung kennenlernen. Wir gehen auf die mit Gl. (3.6) abgeleitete Streuamplitude AB zurück
4:20 AB / e ix0 t R
r
te iK r
t dr : Zur Vereinfachung der Mathematik betrachten wir jetzt eine primitive Struktur und die Atome als punktförmige Streuzentren an den P zeitabhängigen Orten rn (t). Wir setzen also R (r, t)) ! d (r – rn (t)) n X e iK rn
t :
4:21 AB / e ix0 t n
90
4. Dynamik von Atomen in Kristallen
Wir zerlegen die zeitabhängigen Vektoren rn (t) in den Gittervektor rn und die Auslenkung aus der Ruhelage un (t) rn
t rn un
t :
4:22
Damit erhält man X e iK rn e iK un
t e A/
ix0 t
:
4:23
n
Für kleine Auslenkungen un (t) können wir entwickeln [der Beweis ist für harmonische Systeme auch für beliebige un (t) zu führen] X e iK rn 1 i K un
t . . .e ix0 t :
4:24 A/ n
Mit der allgemeinsten Form der Entwicklung nach ebenen Wellen 1 un
t u p eiq rn M
x
qt
4:25
erhalten wir neben der schon bekannten elastischen Streuung Terme X 1 Ainel / e i
Kq rn iK u p e ix0 x
qt :
4:26 M n Es gibt also Streuwellen, für die die Frequenz x gegenüber der Primärwelle gerade um die Frequenz der Kristallschwingung verschoben ist. Für diese Streuwellen gilt auch hinsichtlich der Wellenzahlvektoren eine Streubedingung, da die Summe über n nur Beiträge liefert, wenn K+q gleich einem reziproken Gittervektor G ist x x0 x
q ; k
k0 q G :
(4.27)
Multipliziert man beide Gleichungen mit h hx hx0 hx
q 0 ; hk hk0 hq hG 0 ;
(4.28)
so erkennt man, dass die erste Gleichung in einer quantenmechanischen Interpretation dieses klassischen Ergebnisses einer Energieerhaltung entspricht. Das Plus-Zeichen steht für die Anregung einer Kristallschwingung, das Minus-Zeichen für die Abgabe von Energie aus der Kristallschwingung an das streuende Teilchen. Letzterer Prozess verlangt natürlich zusätzlich, dass die Kristallschwingung mit ausreichender Amplitude angeregt war (s. (5.8)). Die zweite Erhaltungsgleichung kann man als einen Quasiimpulssatz auffassen, wenn man h q als Quasiimpuls der Gitterwelle bezeichnet. Im Sinne der Erhaltungssätze (4.28) kann man also die wellenförmige Kristall-
4.4 Streuung an zeitlich veränderlichen Strukturen – Phononenspektroskopie
91
schwingung als Teilchen auffassen. Für diese „Teilchen“ ist der Ausdruck Phononen üblich. Der Quasiimpuls der Phononen ist allerdings, anders als ein gewöhnlicher Impuls, nur bis auf einen reziproken Gittervektor definiert. Auch P hat er nichts mit dem Impuls der Atome zu tun. Für diese gilt mi v i 0 für alle Zeiten (s. Übung i
4.2). Wir haben deshalb die Größe h q „Quasiimpuls“ genannt. Es sei betont, dass bei der Herleitung der Erhaltungssätze (4.28) die Bewegungen des Kristalls rein klassisch beschrieben wurden. Das Teilchenmodell ist also hier kein Ergebnis der Quantenmechanik, kann aber quantentheoretisch begründet werden, wenn man von den allgemeinen Quantisierungsvorschriften für Bewegungsgleichungen ausgeht. Die Impuls- und Energieerhaltungssätze für die inelastische Wechselwirkung von Licht- und Materiewellen mit Phononen lassen sich dazu verwenden, Phonon-Dispersionskurven experimentell zu ermitteln. Wir wollen zunächst die Wechselwirkung mit Licht diskutieren. Die inelastische Streuung von Licht im Frequenzbereich um das sichtbare Licht wird als Raman-Streuung (bzw. auch Brillouin-Streuung bei Wechselwirkung mit akustischen Wellen) bezeichnet. Die Streuung entsteht dabei durch Polarisation der Atome im Strahlungsfeld und Abstrahlung als Dipolstrahlung. Für den Frequenzbereich des sichtbaren Lichtes ist der maximale Wellenzahlübertrag 2k0
4p 2 10 3 A k
1
;
also etwa gleich 1/1000 eines reziproken Gittervektors. Mit der Raman-Streuung werden also nur Gitterschwingungen in der Nähe des Zentrums der Brillouin-Zone erfaßt (Tafel III). Anders sähe es mit inelastischer Streuung von Röntgenlicht aus. Mit Röntgenlicht kann man, wie wir schon aus der Diskussion der Beugung wissen, leicht Wellenzahlen von der Größenordnung reziproker Gittervektoren übertragen. Die Quantenenergie der Röntgenstrahlen liegt dann aber bei 104 eV. Die natürliche Breite charakteristischer Röntgenlinien ist ungefähr 1 eV, während Phononenenergien im Bereich von 1–100 meV liegen. Für eine Phononenspektroskopie müsste man also das Röntgenlicht auf ca. 1 meV monochromatisieren. Hierzu könnte man Kristallmonochromatoren verwenden. Dabei wird wie bei optischen Gittern (Tafel XII) die Wellenlängenabhängigkeit der Beugung ausgenutzt. Differenziert man die Braggsche Gleichung k 2d sin h ;
4:29
Dk 2Dd sin h 2dDh cos h ; so erhält man einen Ausdruck für die Monochromasie der Strahlung als Funktion der Winkelapertur D h und der Abweichung D d der Gitterkonstanten vom mittleren Wert (Tafel II)
92
4. Dynamik von Atomen in Kristallen
Dk DE Dd Dh ctg h :
4:30 k E d Für Röntgenlicht müsste D k/k*10–7 sein. Die entsprechende Winkelapertur lässt nur bei der Verwendung von Röntgenstrahlen aus Synchrotronquellen ausreichend Intensität übrig. Schwer erfüllbar ist auch die Anforderung an die Perfektion bzw. Verspannungsfreiheit des Kristalls mit D d/d*10–7 (Tafel II). Immerhin sind Energieauflösungen von einigen meV unter Verwendung von Synchrotronstrahlen möglich. Bedeutend günstiger liegen die Verhältnisse bei Neutronen (auch Atomen). Hier sind die Primärenergien, die zu genügend großen Wellenzahlüberträgen führen, im Bereich von 0,1–1 eV (D k/k* 10–2–10–3). Entsprechende Neutronen stehen als thermische Neutronen an Reaktoren zur Verfügung. Das Prinzip eines vollständigen Neutronenspektrometers mit Monochromator, Probe und Analysator zeigt Abb. I.4. Mit inelastischer Neutronenstreuung sind die Phonon-Dispersionskurven für alle wichtigen Materialien bestimmt worden. Als Beispiel zeigt Abb. 4.4 die Dispersionskurven für Si.
4.5 Elastisches Verhalten von Kristallen Am Beispiel der linearen Kette war gezeigt worden, dass die Frequenz der Phononen in den „akustischen Zweigen“ im Grenzfall langer Wellen (q ! 0) proportional zu q ist. Für akustische Phononen großer Wellenlänge (Schallwellen) unterscheiden sich die Auslenkungsvektoren von Atomen in benachbarten Elementarzellen nur sehr wenig voneinander. Der dadurch gegebene Verformungszustand des Kristalls ist im Rahmen einer Kontinuumstheorie beschreibbar. Wir betrachten den Übergang von der Atomdynamik zur Kontinuumsmechanik am Beispiel eines einfach kubischen Kristalls, bei dem die Atome nur mit den nächsten Nachbarn durch Federn verbunden sind (Abb. 4.5). Dieses Modell ist zwar unrealistisch für einen Festkörper, da es keine Stabilität gegen eine Scherung besitzt, aber es genügt für die folgende Betrachtung von longitudinalen Wellen entlang einer kubischen Achse. Die Koordinate entlang dieser Achse sei mit x1 bezeichnet und die Komponenten der Auslenkungsvektoren des Atoms in der n-ten Elementarzelle in Richtung der x1-Achse mit un1. Bei einer longitudinalen Welle entlang einer kubischen Achse sind die Auslenkungsvektoren aller Atome in einer Ebene senkrecht zu dieser Achse gleich. Außerdem werden nur die entlang der Achse orientierten Federn belastet. Damit wird die Bewegungsgleichung eindimensional wie bei der linearen Kette (4.11) Mun1 f
u
n11
un1
f
un1
u
n
11 :
4:31
Unterscheiden sich die Auslenkungen in benachbarten Zellen nur wenig, können wir die Differenzen durch Differentialquotienten ersetzen
4.5 Elastisches Verhalten von Kristallen
!
!
un–1 n -1
un
n
x1
!
93
Abb. 4.5. Erweiterung des Federmodells einer linearen Kette in drei Dimensionen zu einem kubisch primitiven Kristall. Das Modell mit Federkräften nur zu den nächsten Nachbarn hat keine Stabilität gegen Scherung, genügt aber für den einfachsten Ansatz zur Berechnung einer longitudinalen Schallwelle entlang der kubischen Achse
!
un+1 n +1
x1
u
n11
un1
un1
u
n
@u1 11 a @x1 x
n1=2a @ 2 u1 a2 2 : @x1 xna
@u1 a @x1 x
n
1=2a
4:32
Die Ableitung e11
@u1 @x1
4:33
ist bereits eine Kontinuumsgröße. Sie beschreibt die Änderung der Verschiebung der Atome pro Länge, also eine Dehnung des Materials, wenn e11> 0 ist, bzw. eine Stauchung, wenn e11 < 0 ist. Aus (4.32) sehen wir, dass die elastische Rückstellkraft in Richtung der x1-Achse proportional der örtlichen Änderung der Dehnung e11 entlang der x1-Achse ist. Ersetzt man noch die Masse eines Atoms durch die Dichte R = M/a3, so erhält man die Kontinuumsgleichung für die longitudinale Schallwelle Ru1 c11
@ 2 u1 @x21
mit
c11
f : a
4:34
Die Größe c11 ist ein elastischer Modul, welcher die Kräfte in Richtung der x1-Achse bei Verformungen entlang der x1-Achse beschreibt. Die Schallgeschwindigkeit der longitudinalen Welle ist r c11 :
4:35 cL R Diese Kontinuumsgleichung für eine longitudinale Schallwelle entlang einer kubischen Achse gilt für jeden kubischen Kristall. Nur die Verknüpfung mit dem interatomaren Potential ist spezifisch für die Struktur. Die Verknüpfung ist also verschieden, je nachdem ob eine fcc-, bcc- oder Diamant-Struktur vorliegt.
94
4. Dynamik von Atomen in Kristallen
Bisher haben wir uns für Kräfte entlang der kubischen Achse interessiert, die bei Verformungen entlang derselben Achse auftreten. Wir wollen jetzt auch allgemeine Verformungen und Kräfte beschreiben und verallgemeinern dazu zunächst die Definition der Verformung in (4.33) eij
@ui : @xj
4:36
Die Größe eij ist ein Tensor zweiter Stufe. Zweckmäßigerweise wählt man als Achsensystem für die Darstellung der Tensorkomponenten stets kartesische Koordinaten mit Achsen, die möglichst weitgehend mit den kristallographischen Achsen übereinstimmen. Die Diagonalelemente des Dehnungstensors eii beschreiben infinitesimale Verformungen mit einer Volumenänderung (Abb. 4.6 a). Die Größe der Volumenänderung ist durch die Spur des Tensors gegeben. DV X eii : V i
4:37
Die nichtdiagonalen Elemente von eij beschreiben Verzerrungen eines Volumenelementes in i-Richtung bei Fortschreiten in j-Richtung, also Scherungen (Abb. 4.6 b). Für die Betrachtung statischer Verformungen ist es sinnvoll, eij in einen bezüglich der Vertauschung von i und j symmetrischen und einen antisymmetrischen Teil aufzuspalten. @ui 1 @ui @uj 1 @ui @uj eij :
4:38 @xj 2 @xj @xi 2 @xj @xi Der antisymmetrische Anteil
@ui =@xj
@uj =@xi beschreibt eine Rotation, während der Verformungszustand durch den symmetrischen Tensor 1 @ui @uj eij
4:39 2 @xj @xi gegeben ist (Abb. 4.6 c). Ein Festkörper setzt Verformungen Widerstand entgegen, Verformungen erzeugen also Kräfte. Bei einem homogenen Material sind die Kräfte bei einer Dehnung oder Scherung proportional zu der Fläche, an welcher die Dehnung oder Scherung wirkt. Deshalb werden alle Kräfte auf die Flächen bezogen, an denen sie wirken. Zur Definition dieser Flächenkräfte (=„Spannungen“) denke man sich einen Schnitt senkrecht zur xl-Achse durch den Kristall und entferne in Gedanken das Material auf der rechten Seite. Die Komponenten des Spannungstensors skl sind dann die Kräfte pro Fläche in Richtung k, die notwendig sind, um den Kristall im Gleichgewicht zu halten (Abb. 4.7). Auch der Spannungstensor ist symmetrisch. Ein antisymmetrischer Teil des Spannungstensors entspricht einem Drehmoment,
4.5 Elastisches Verhalten von Kristallen
aa.)
95
1 e11 @u @x1
ε11 =
∂ u1 ∂ x1
2 bb.) @u e21 ∂ u@x212
ε 21 =
1
c
e
e
1
@u2
∂ x1
@u1
21 12 1 ⎛ ∂2u @x1 ∂ @xu1 ⎞ ε 21 = ε12 = ⎜ 2 + 1 2 ⎝ ∂ x1 ∂ x2 ⎠
c.)
Abb. 4.6 a–c. Darstellungen zur Elastizitätstheorie. (a) Dehnung entlang der x1-Achse. (b) Scherung entlang der x2Achse, ohne Abtrennung des Anteils in e21, der nur eine Rotation beschreibt. (c) Dieselbe Scherung nach Abtrennung des Rotationsanteils durch Symmetrisierung des Dehnungstensors
kk m m
sτklkl
τsklkl
ll
sτllll
Abb. 4.7. Definition der Schubspannung skl und der Normalspannung sll
96
4. Dynamik von Atomen in Kristallen
und im Gleichgewicht müssen Drehmomente im Innern des Festkörpers verschwinden. Die Beziehung zwischen Spannung und Verformung ist in erster Näherung linear (Hooksches Gesetz). In seiner allgemeinsten Form lautet das Hooksche Gesetz X skl cklij eij
4:40 ij
mit den Komponenten cklij des elastischen Tensors (Moduls). Wegen der Symmetrie der Tensoren skl und eij gilt cklij clkij cklji :
4:41
Die Zahl der unabhängigen Komponenten des elastischen Tensors reduziert sich weiter durch die Forderung, dass die elastische Energie eine eindeutige Funktion des Dehnungszustandes sein muss [4.2]. Die Energiedichte u ist X X skl dekl 12 cklij eij ekl
4:42 u kl
ijkl
Diese Gleichung ergibt nur dann ein von der gewählten Indizierung für die Dehnungen unabhängiges Ergebnis, wenn cklij cijkl
4:43
ist. Die Relationen (4.41) und (4.43) erlauben es, eine vereinfachte Indizierung nach Voigt einzuführen, bei der je einem Indexpaar i j eine Zahl von 1 bis 6 zugeordnet wird. Die Zuordnung erfolgt nach dem Schema 11 ! 1 23 ! 4 22 ! 2 13 ! 5 33 ! 3 12 ! 6 :
4:44
Auch bei den Spannungs- und Dehnungstensoren kann man zu den Voigtschen Indizes übergehen. Damit aber in der Energiedichte (4.42) auch die nichtdiagonalen Komponenten des Dehnungstensors mit den jeweils vertauschten Indizes, also eij und eji, mitgezählt werden, erfolgt der Übergang in einer bestimmten Weise mit neu zu definierenden elastischen Modulen. Für unsere Zwecke ist es einfacher, die Voigtsche Notation nur als Abkürzung der Indizes in den elastischen Modulen zu verwenden, im übrigen aber die normale Tensornotation beizubehalten. In der abkürzenden Notation wird aus dem elastischen Tensor ein 6´6 symmetrischer Tensor mit maximal 21 unabhängigen Komponenten. Durch die Kristallsymmetrie wird die Zahl der unabhängigen Komponenten weiter reduziert. Bei kubischen Kristallen gibt es nur drei unabhängige Komponenten des elastischen Tensors.
4.5 Elastisches Verhalten von Kristallen
0
c11 B c12 B B c12 B B 0 B @ 0 0
c12 c11 c12 0 0 0
c12 c12 c11 0 0 0
0 0 0 c44 0 0
0 0 0 0 c44 0
1 0 0 C C 0 C C: 0 C C 0 A c44
97
4:45
Auch ohne Mathematik ist leicht zu sehen, dass für einen kubischen Kristall der elastische Tensor diese Form haben muss. So sind z. B. die drei kubischen Achsen gleichwertig. Deshalb müssen die Diagonalkomponenten für Scherungen und Normalverformungen jeweils gleich sein (c11 = c22 = c33 und c44 = c55 = c66). Aus einer Scherung um eine Achse können keine Kräfte entstehen, die eine Scherung um eine andere kubische Achse bewirken (c45 = 0, etc.). Ferner kann aus einer Scherung keine Normalspannung entstehen (c14 = 0, etc.), und schließlich müssen die Querkräfte senkrecht zur Richtung einer Dehnung isotrop sein (c12 = c13, etc.). Bei einem hexagonalen Kristall hat der elastische Tensor die Komponenten 0 1 0 0 c11 c12 c13 0 B c12 c11 c13 0 0 0 C B C B c13 c13 c33 0 0 0 C B C:
4:46 B 0 0 0 c44 0 0 C B C @ 0 0 0 0 c44 0 A 0 0 0 0 0 c66 Ein hexagonaler Kristall ist in seiner Basisfläche elastisch isotrop. Deshalb ist die Komponente, welche die Spannungs-Dehnungsrelation bei einer Scherung in der Basisfläche beschreibt, c66 durch eine Isotropiebedingung (siehe auch (4.65)) mit den Komponenten c11 und c12 verknüpft. 2c66 c11
c12 :
4:47
Mit Hilfe des elastischen Tensors können wir die Wellengleichung (4.34) verallgemeinern. Für die folgenden Überlegungen ist es zweckmäßiger, bezüglich der Spannungen und Dehnungen bei den Doppelindizes zu bleiben. Unter Verwendung der Definition des Spannungstensors kann man die Volumenkraft in Richtung k, die auf ein Volumenelement der Größe dV = dx1dx2dx3 wirkt, durch die Flächenkräfte ausdrücken.
98
4. Dynamik von Atomen in Kristallen
dFk
sk1
x1 dx1 sk1
x1 dx2 dx3
sk2
x2 dx2 sk2
x2 dx1 dx3
sk3
x3 dx3 sk3
x3 dx1 dx2 X @skl dV @xl l X 1 @ 2 ui @ 2 uj cklij dV 2 @xl @xj @xl @xi ijl dV
X ijl
cklij
4:48
@ 2 ui : @xl @xj
Die Summe aus elastischen Kräften und der Trägheitskraft RdVuk muss Null sein, und man erhält die verallgemeinerte Wellengleichung, welche die Fortpflanzung elastischer Wellen in einem Kristall beliebiger Symmetrie beschreibt. X @ 2 ui Ruk cklij :
4:49 @xl @xj ijl Ein einfaches Beispiel für die Anwendung von (4.49) sind die Schallwellen in einem kubischen Kristall entlang der x1-Achse. Wegen der kubischen Symmetrie sind die Wellen entweder transversal oder longitudinal. Ferner sind die transversalen Wellen entartet. Wir wählen die Polarisation entlang der x2-Achse. Dann ist nur die Ableitung @ 2 u2 6 0 ; @x1 @x1
4:50
und man erhält als Bewegungsgleichung für die transversale Schallwelle Ru2 c2121
@ 2 u2 @ 2 u2 c 44 @x21 @x21
mit der Schallgeschwindigkeit r c44 cT : R
4:51
4:52
Für viele Zwecke ist es nützlich, statt mit dem Tensor der elastischen Module cijkl, mit dem inversen Tensor der elastischen Konstanten sijkl zu arbeiten, der durch die Relation X sijkl skl
4:53 eij kl
definiert ist. Die Relationen zwischen den Tensorkomponenten von c und s lassen sich aus einer formalen Transformation, aber auch durch Beschreibung definierter Verformungszustände ermitteln. Betrachtet man z. B. für einen kubischen Kristall eine isotrope Verformung
4.5 Elastisches Verhalten von Kristallen
eij e dij
99
4:54
so muss wegen der kubischen Symmetrie auch die Spannung sij s dij
4:55
sein. Die elastischen Gleichungen (4.43 und 4.53) reduzieren sich damit auf s
c11 2c12 e ; e
s11 2s12 s ;
4:56
und man erhält die Relation
c11 2c12
s11 2s12 1 :
4:57
Wir entnehmen (4.57), dass eine Messung der Volumenänderung eines kubischen Kristalls unter hydrostatischem Druck den Wert der Kombination der elastischen Konstanten c11+2c12 bzw. s11+2s12 liefert. Eine zweite Relation
c11
c12
s11
s12 1
4:58
erhält man durch eine analoge Betrachtung eines Verformungszustandes e11 = –e22, e33 = 0 mit allen eij = 0 für i=j. Aus (4.57) und (4.58) erhält man 1 1 2 s11 ; 3 c11 2c12 c11 c12 (4.59) 1 1 1 s12 : 3 c11 2c12 c11 c12 Wegen der Diagonalform des elastischen Tensors für Scherungen (4.45) gilt ferner c44 1=s44 :
4:60
Die Relationen (4.58) und (4.60) gelten auch für hexagonale Kristalle und für die wichtigsten tetragonalen. Anstelle von (4.57) treten die Gleichungen
c11 c12 s33 s c13
s13 s
1
1
;
;
c33
s11 s12 s mit s s33
s11 s12
4:61 1
; 2s213 :
Ferner ist c66 = s–1 66 . Trotz seiner hohen Symmetrie ist selbst der kubische Kristall nicht elastisch isotrop (Tabelle 4.1). Die Spannung, die bei einer Verformung entlang der kubischen Achse auftritt, ist verschieden von der Spannung bei einer Verformung in Richtung einer Flächendiagonalen. Zur Herleitung der Bedingung, unter der ein kubischer
100
4. Dynamik von Atomen in Kristallen
a 33
a.)
22
exx ε xx = e−yyε yy
ezz ε 0= 0 zz
sxx s22
c11
c e
e11 εexx = ε 11
xx
e22 eεyy = ε 22 yy
τxx = τ22 = (c11 −12c12xx) ε xx
33
b
b.) yy 22 xx
τs23 23 a
a
exx
c
c.) I
e23 32 τs32
2u2 a2u 2
εx =
I
Abb. 4.8. Zur Herleitung der Isotropiebedingung wird eine volumenerhaltende Verformung eines Materials betrachtet: (a) unter der Annahme, dass die Verformung entlang der kubischen Achsen erfolgt und (b), dass die Verformungsrichtungen einen Winkel von 458 mit den Achsen bilden. Die Verformung unter (b) entspricht in den kubischen Achsen einer Scherung (c). Bei einem isotropen Material müssen die auftretenden Kräfte (Spannungen) in beiden Fällen gleich sein, woraus sich die Isotropiebedingung für die elastischen Konstanten ergibt (4.66)
u2u 2
a
1 @u2 @u3 exx 2 1@x ⎛ ∂3 u 2@x2∂ u 3 ⎞
⎟= ε 23 = ⎜ + 2 ⎝ ∂ x3 ∂ x2 ⎠
Kristall elastisch isotrop wäre, betrachten wir einen Körper, der entlang der x-Achse um exx gedehnt und entlang der y-Achse um eyy = –exx gestaucht werde. Sind die kubischen Achsen x1 und x2 parallel zur x- bzw. y-Achse, so erhält man für die Spannung sxx sxx
c11
c12 exx :
4:62
Sind die kubischen Achsen um 458 gegen die x- und y-Achse verdreht, dann wird bezüglich der kubischen Achsen geschert (Abb. 4.8). Schreibt man die Komponenten des Dehnungstensors in den kubischen Achsen und der x- und y-Achse in Einheiten des Verschiebungsvektors u2 (Abb. 4.8), dann ist leicht zu sehen, dass e23 = exx ist. Wir erhalten also die Spannung
4.5 Elastisches Verhalten von Kristallen
101
Tabelle 4.1. Elastische Konstanten für einige kubische Kristalle bei 20 8C (Werte nach [4.6]). Die Steifigkeiten cij sind in 1010 N/m2 und die Nachgiebigkeiten sij in 10–12 m2/N. Die Zahlenwerte beziehen sich auf das kristallographische Achsensystem. Für die Transformation auf beliebig gedrehte kartesische Koordinaten siehe [4.4, 4.5]. Die Zuverlässigkeit und Genauigkeit der Daten ist für die einzelnen Materialien wegen der unterschiedlichen Qualität der zur Verfügung stehenden Kristalle sehr verschieden. Bei Kalium und Natrium hängen die elastischen Konstanten besonders stark von der Temperatur ab. Bei tiefen Temperaturen werden diese Materialien steifer. Die Bedingung für elastische Isotropie, 2c44/(c11–c12) = 1, wird nur in Ausnahmefällen näherungsweise erfüllt. Viele Metalle sind überraschend anisotrop (letzte Spalte) Material s11
s44
s12
c11
c44
c12
2c44 c11 c12
K Na Ta Cr Mo W Fe Ir Ni Pd Pt Cu Ag Au Al C Si Ge GaAs LiF NaCl
530 240 12,1 9,9 9,1 6,55 8,9 3,91 9,0 13,9 131 13,3 21,7 23,8 35,9 1,74 12,56 14,9 18,6 15,9 79,4
–560 –270 –2,58 –0,495 –0,78 –0,726 –2,8 –0,67 –3,0 –5,95 30,8 –6,3 –9,8 –10,7 –5,8 –0,517 2,14 –2,66 –4,23 –3,1 –4,65
0,37 0,74 26,7 35,0 45,5 50,1 23,7 58,0 24,4 22,7 3,46 16,8 12,4 18,6 11,2 107,6 16,57 12,9 11,9 11,1 4,87
0,19 0,42 8,25 10,0 11,0 15,1 11,6 25,6 11,2 7,17 0,764 7,54 4,6 4,2 2,8 57,6 7,96 6,71 5,4 6,3 1,26
0,31 0,62 16,1 6,78 17,6 20,5 14,1 24,2 15,4 17,6 2,5 12,1 9,35 16,3 6,6 12,5 6,39 4,83 6,0 4,2 1,24
6,3 7,0 1,56 0,71 0,79 1,0 2,4 1,5 2,5 2,8 1,44 3,2 3,0 3,7 1,2 1,21 1,56 1,66 1,83 1,82 0,69
1225 590 6,86 3,05 2,8 2,53 7,7 2,28 7,7 13,6 73,4 15,0 22,9 23,3 15,7 1,48 7,68 9,75 12,6 11,35 22,9
s23 c44 e23 c44 exx :
4:63
Wir müssen jetzt noch s23 durch sxx ausdrücken. Die Spannung sxx übt auf den Kubus der Kantenlänge a eine Kraft p fx sxx a2 = 2
4:64 aus. Projiziert in die Richtung x2 hat man also die Kraft p f2 s23 a2 fx = 2 sxx a2 =2 :
4:65
Mit (4.63) und (4.65) erhält man durch Vergleich mit (4.62) die Bedingung für elastisch isotropes Verhalten 2c44 c11
c12 :
4:66
Der elastisch isotrope Körper hat also nur zwei unabhängige elastische Konstanten. k c12
l c44 :
4:67
102
4. Dynamik von Atomen in Kristallen
Das Hooksche Gesetz (4.40) lautet damit X eii 2leik : sik kdik
4:68
i
In der Technik werden als elastische Konstanten der Elastizitätsmodul Y (Young Modul, häufig auch mit E bezeichnet) und die Querkontraktionszahl (Poisson-Zahl) m verwandt. Der Elastizitätsmodul Y beschreibt die Längenänderung eines Stabes bei einem Zugversuch, und m ist die relative Querkontraktion des Stabes. Zwischen den Konstanten Y, m, k, l und den Konstanten sij im kubischen System bestehen die Relationen: m
k 2
k l
s12 s11
Y
l
2l 3k 1 : lk s11
4:69
Man beachte, dass Y zwar die Dimension eines Moduls hat, aber eigentlich nur 1/s11 ist, also nicht eine Komponente des inversen Tensors c darstellt!
Übungen zu Kapitel 4
4.1 Lokale Schwingungen in einem Kristall werden durch Überlagerung von Phononmoden mit verschiedenen Wellenvektoren dargestellt. Man zeige, dass sich der örtliche Schwerpunkt eines solchen Wellenpaketes mit der Gruppengeschwindigkeit v g = d x/dq bewegt! 4.2 Stellen Sie die Bewegungsgleichung auf für eine eindimensionale lineare Kette von N Atomen (N groß) mit Abstand a und Masse m, die mit Federn der Federkonstanten f untereinander verbunden sind! Lösen Sie die Bewegungsgleichung mit dem Ansatz un (t) = u (q) exp [i (q n a–x t)]! (a) Vergleichen Sie die erhaltene Dispersionsrelation x (q) mit der der zweiatomigen Kette (4.15)! (b) Zeigen Sie, dass der Gesamtimpuls N P mu_ n
t eines Phonons verschwindet! n1
4.3 Berechnen Sie die Eigenfrequenz eines Massendefektes der Masse M j m an der Stelle n = 0 in der linearen Kette mit Hilfe des Ansatzes un (t) = u0 exp (–j|n|–i x t)! Für welchen Bereich von M existieren lokalisierte Schwingungen? 4.4 Berechnen Sie die Dispersionsrelation für longitudinale und transversale Phononen entlang der [100]-Richtung eines fcc-Gitters, dessen Atome über Federn mit den nächsten Nachbarn verbunden sind! Stellen Sie zunächst eine Symmetrieüberlegung an, um mögliche Entartungen zu finden! Auf welche andere Richtung hoher Symmetrie kann man diese Überlegung anwenden?
Versuchen Sie dann, die Beschreibung der Phononen auf die Bewegungsgleichung der linearen Kette zurückzuführen. Dazu mache man sich klar, welche Auswirkung die Lage der Phasenebenen auf die Auslenkungen der Atome hat. Zeichnen Sie die Auslenkungen der Atome für verschiedene Phononen am Rande der Brillouin-Zone! 4.5 Berechnen Sie die elastische Konstante c11 und die Scherkonstante c44 unter der Annahme von Zentralkräften zu den nächsten Nachbarn. Wählen Sie die Kraftkonstante so, dass die maximale Frequenz des Gitters 8,85 THz ist (entspricht Nickel) und berechnen Sie die Schallgeschwindigkeiten! Wie vergleicht sich das Ergebnis mit den experimentellen Werten clong = 5300 m/s und ctrans = 3800 m/s? 4.6 Berechnen Sie die Frequenz einer Oberflächenwelle auf der (100)-Oberfläche eines fcc-Kristalls an der Zonengrenze in Richtung [110] unter der Annahme von Zentralkräften zu den nächsten Nachbarn! Das Oberflächenphonon soll ungerade Symmetrie bezüglich der Spiegelebene haben, die durch die Richtung des Wellenvektors q und die Oberflächennormale aufgespannt wird. Warum ist die Rechnung so einfach? Gibt es noch ein zweites Oberflächenphonon auf dieser Oberfläche, das streng auf die erste Monolage lokalisiert ist? 4.7 Leiten Sie das Erhaltungsgesetz für die Wellenzahlvektoren für den Fall der inelastischen Phononstreuung in einem zweidimensionalen Gitter her! Lösen Sie das gleiche Problem für den Fall der inelastischen
104
Übungen zu Kapitel 4
Streuung an Oberflächen, wenn die einfallende Welle (z. B. eines Elektrons) innerhalb des Festkörpers gemäß exp (–z/k) mit k der mittleren freien Weglänge gedämpft wird! Nehmen Sie der Einfachheit ein primitives Gitter an. Beschreiben Sie die Ewald-Konstruktion für den Fall der Streuung an einem zweidimensionalen Gitter! 4.8 Berechnen Sie den nächsten Term in der Entwicklung (4.24) der Streuamplitude nach den Auslenkungen un (t) und berechnen Sie den zeitlichen Mittelwert der Streuamplitude! Schreiben Sie dazu näherungsweise 2 1 1 h
K un 2 it e 2h
Kun it : 2 Durch Gleichsetzen des Zeitmittels mit dem Scharmittel berechne man für ein primitives Gitter die Streuintensität! Die Größe W 2 1 2 h
K un i in der Intensität heißt DebyeWaller-Faktor. Der Ausdruck für die Intensität wurde hier hergeleitet unter der Annahme kleiner Auslenkungen u, gilt aber für beliebige Werte von u. Berechnen Sie unter Verwendung von (5.2) und (5.15) die Temperaturabhängigkeit des Debye-Waller-Faktors unter der Annahme, dass alle Atome als unabhängige Oszillatoren mit der Frequenz x schwingen! Führen Sie die gleichen Rechnungen auf der Grundlage des Debye-Modells aus!
1
4.9 Berechnen Sie die elastischen Konstanten c11, c12 und c44 für die kubisch flächenzentrierte Struktur unter der Annahme von Federkräften zu den nächsten Nachbarn. Zeigen Sie, dass c12 = c44 ist. Dies ist die sog. Cauchy-Relation für kubische Kristalle. Sie gilt allgemein für alle Zentralkraftmodelle mit Wechselwirkung bis zu beliebig entfernten Nachbarn. Welche Materialien erfüllen die Cauchy-Relation wenigstens näherungsweise (vgl. Tabelle 4.1). Zeigen Sie, dass das Modell nicht elastisch isotrop ist.
4.10 Berechnen Sie die elastische Energie pro Fläche in einem dünnen, epitaktischen und pseudomorphen Cu-Film, der auf der (100)Oberfläche eines Ni-Kristalls aufgewachsen ist. Hinweis: Die Dehnung des Films em ergibt sich aus der Fehlpassung der Gitterkonstanten, em = (aNi – aCu)/aP Ni. Die elastische e Energiedichte ist u d ij 0 m sij deij , mit d der Dicke des Films. Warum kann der Film nicht bis zu einer beliebigen Dicke d pseudomorph wachsen? 4.11 Elektrisches Analogon zu den Gitterwellen der einatomigen linearen Kette. a) Eine verlustfreie elektrische Doppelleitung werde im Ersatzschaltbild beschrieben durch eine in Serie geschaltete Reihe gleichartiger Selbstinduktivitäten Ln, die jeweils gegenüber der Gegenleitung die Kapazitäten Cn besitzen. Man zeige, dass auf dieser Doppelleitung Strom und Spannung in Form ebener Wellen propagieren, deren Dispersion x (k) die Gestalt der Dispersion von Gitterwellen der einatomigen Kette (4.15) mit M1 = M2 hat. Anleitung: Man benutze die Kirchhoffschen Verzweigungsregeln, um für ein Leitungselement der Länge a, bestehend aus Ln und Cn, die Stromänderung In–In–1 bzw. die Spannungsänderung Un–Un–1 zwischen beiden Leitungen längs der Länge a zu ermitteln. b) Man betrachte die Doppelleitung mit kontinuierlich verteilter Induktivität und Kapazität, indem man eine Induktivität L' pro Länge und eine Kapazität C' pro Länge einführt. L'dx bzw. C'dx sind dann die einem Längenelement dx zugeordneten Induktivitäten bzw. Kapazitäten. Man stelle die Wellen-Differentialgleichung für Strom und Spannung auf und zeige, dass sich die Dispersion x (k) der Strom- bzw. Spannungswellen analog zu der von Schallwellen (Gitterwellen mit kleinem Wellenvektor k) ergibt.
Tafel III
Tafel III Raman-Spektroskopie
Seit der Entwicklung der Laser hat sich die Raman-Spektroskopie [III.1] als ein wichtiges Hilfsmittel zur Untersuchung elementarer Anregungen des Festkörpers, wie Phononen, Plasmonen usw. durchgesetzt. Bei dieser Art der Spektroskopie wird die inelastische Lichtstreuung durch die betreffenden elementaren Anregungen untersucht. Im Zusammenhang mit der Streuung an Phononen wurde diese inelastische Streuung schon in Abschn. 4.5 erwähnt. Wie bei allen Streuprozessen an zeitlich sich ändernden periodischen Strukturen (z. B. Schwingungen der Atome) müssen Energie und Wellenzahlvektor (bis auf einen reziproken Gittervektor G ) erhalten bleiben, d. h. es muss gelten hx0
hx hx
q 0 ;
III:1
hk0
hk hq hG 0 ;
III:2
wobei x0 und k0 bzw. x und k die einfallende bzw. gestreute Lichtwelle beschreiben; x (q) und q sind Frequenz und Wellenzahlvektor der elementaren Anregung, z. B. des Phonons. Für Licht aus dem sichtbaren Spektralbereich ist nach Abschn. 4.4 |k0| bzw. |k| von der Größenordnung 1/1000 eines reziproken Gittervektors, d. h. es nehmen an der Raman-Streuung nur Anregungen aus dem Zentrum der Brillouin-Zone (|q|&0) teil. Die Wechselwirkung von Licht aus dem sichtbaren Spektralbereich mit dem Festkörper geschieht über die Polarisierbarkeit der Valenzelektronen. Eine einfallende Lichtwelle erzeugt mit ihrem elektrischen Feld E 0 über den Suszeptibilitätstensor v eine Polarisation P, d. h. ~ X vij E j0 ;
III:3 P e0 v E 0 bzw: Pi e0 ~ j die periodische Änderung von P wiederum hat die Ausstrahlung einer Welle, der gestreuten Welle, zur Folge. In klassischer Näherung lässt
sich die Streustrahlung als Dipol-Strahlung der durch P gegebenen oszillierenden Dipole auffassen. Nach den Gesetzen der Elektrodynamik ergibt sich die pro Festkörpervolumen in eine Richtung sˆ (Einheitsvektor) abgestrahlte Energiestromdichte (Poynting-Vektor) S im Abstand r zu S
t
x4 P2 sin2 # ^s : 16p2 e0 r 2 c3
III:4
Hierbei ist # der von der Beobachtungsrichtung sˆ und der Schwingungsrichtung der Polarisation P eingeschlossene Winkel. Die elektronische Suszeptibilität v in (III.3) ist nun eine Funktion der ~ Kernkoordinaten, d. h. also auch der Auslenkungen, die mit der Schwingung [x (q), q ] gegeben sind. In gleicher Weise ist v eine Funktion ir~ gendwelcher anderen Kollektivanregungen X [x (q), q ], z. B. der Dichteschwankungen, die mit einer longitudinalen Elektronenplasmawelle (s. Abschn. 11.9) gegeben sind, oder der wellenförmig sich ausbreitenden Abweichung der Magnetisierung von einer perfekten Anordnung in Ferromagneten (Magnon). Diese „Auslenkungen“ X [x (q), q ] sind als Störungen aufzufassen und in einer formalen Entwicklung nach X kann man sich auf zwei Glieder beschränken
III:5 v v0
@v=@XX : ~ ~ ~ Weil nur Anregungen bei q & 0 betrachtet werden müssen, schreiben wir vereinfachend X = X0 cos [x (q)·t ], und wenn das elektrische Feld E 0 der einfallenden Lichtwelle als E 0 E^0 cos x0·t beschrieben wird, ergibt sich nach (III.3) für die in (III.4) einzusetzende Polarisation:
Tafel III
106
Tafel III Raman-Spektroskopie
A
B
Abb. III.1 a, b. Schematische Erklärung der Mechanismen elastischer (A) und inelastischer (B) Lichtstreuung (Raman-Streuung): (A) Falls die elektronische Suszeptibilität v als zeitlich konstant angenommen wird, schwingt die Polarisation P mit der Frequenz x0 der einfallenden Lichtwelle und strahlt ihrerseits nur mit dieser Frequenz (elastischer Prozess). (B) Falls
die Suszeptibilität v ihrerseits mit der Frequenz x (q) einer Elementaranregung (z. B. Phonon) schwingt, ist die durch das Primärlicht (Frequenz x0) angeregte Polarisations (P)Schwingung mit der Frequenz x (q) moduliert. Diese Schwingung der Polarisation führt im Streulicht zu den sog. RamanSeitenbanden mit den Frequenzen x0±x (q)
@v P e0 v0 E^0 cos x0 t e0 ~ X0 E 0 @X ~ cosx
q t cos x0 t 1 @v e0 v0E^0 cos x0 t e0 ~ X0 E^0 2 @X ~ fcosx0 x
qtcosx0 x
qtg :
III:6
stark ab, weil dann die betreffende elementare Anregung sich überwiegend im Grundzustand befindet. Die Intensität der inelastisch gestreuten Strahlung ist typischerweise um 106 kleiner als die des erregenden Lichtes. Maßgebend für das Auftreten einer sog. RamanLinie ist das Nichtverschwinden der Suszeptibilitätsableitungen (III.5) (@vij =@X) nach den Koordinaten X der Elementaranregung. Wegen der Kristallsymmetrie und den daraus folgenden Symmetrieeigenschaften der Elementaranregung, die das Verschwinden oder Nichtverschwinden der Größen (@vij =@X) bedingen, hängt die Beobachtbarkeit der entsprechenden Raman-Linien von der Versuchsgeometrie ab. Dies ist am Beispiel zweier Ramanspektren gezeigt, die an einem Bi2Se3Einkristall aufgenommen wurden (Abb. III.2). Bi2Se3 besitzt eine trigonale c-Achse, längs derer der Kristall aus Schichten von Bi und Se aufgebaut ist. Unter anderem bedingt diese Kristallsymmetrie, dass der normale Suszeptibilitätstensor in der Hauptachsendarstellung die Gestalt
Die Streustrahlung, die sich nach (III.4) ergibt, enthält also neben dem elastischen Anteil mit der Frequenz x0 (genannt Rayleigh-Streuung ) die sog. Raman-Seitenbanden mit den Frequenzen x0±x (q) (s. Abb. III.1). Plus- und Minuszeichen bedeuten Streuung des Lichtquants unter Aufnahme bzw. Abgabe der Energie der betreffenden Elementaranregung [ x (q), q ]. Die Linien mit niedrigerer Frequenz als x0 heißen Stokes-, die mit erhöhter Frequenz Anti-Stokes-Linien. Zum Auftreten letzterer muss die elementare Anregung, z. B. das Phonon, bereits im Kristall angeregt sein. Bei Erniedrigung der Temperatur nimmt die Intensität der Anti-Stokes-Linien also
Abb. III.2 a–c. Raman-Spektren von Phononen des Typs A1g und E 2f aufgenommen an einem Bi2Se3-Einkristall. Die trigonale c-Achse des Kristalls liegt parallel zur z-Richtung des Koordinatensystems. (a) Schwingungsformen der A1g und Eg Phononen, dargestellt an einer der drei Basis-Atomkonfigurationen in der nichtprimitiven Elementarzelle. Pfeile bzw. Plus- und Minuszeichen geben die Richtung der Atomauslenkung in einer „Momentaufnahme“ wieder. (b) Raman-Spektrum, aufgenommen in der Geometrie z (xx) z¯, d. h. das in z-Richtung einfallende Primärlicht ist in x-Richtung polarisiert und es wird Raman-Streulicht in Rückstreuung (längs –z bzw. z¯ ) mit einer Polarisation längs x analysiert. (c) Raman-Spektrum aufgenommen in der Geometrie z (xy) z¯. (Nach Richter et al. [III.2])
2
v0xx 0 4 v 0 ~ 0
0 v0xx 0
3 0 0 5 v0zz
107
(Abb. III.2 c). Dies lässt sich aus der Art der Atomauslenkungen bei den beiden Typen von Phononen (Abb. III.2 a) verstehen: Ist ein Phonon des Typs A1 g angeregt, so wird dadurch die Symmetrie des Kristalls nicht verändert; die mit der Phononenauslenkung sich ergebende Änderung der Suszeptibilität vij, d. h. (@vij =@X) dX, führt also wieder auf einen Tensor, der die Gestalt von v 0ij (III.7) selbst hat. Über einen solchen Tensor wird aus einem elektrischen Feld des eingestrahlten Lichtes E0
Ex0 ; Ey0 ; 0 eine Polarisation erzeugt, die die gleiche Richtung wie E0 hat, d. h. für Phononen des Typs A1 g gilt (@vxy =@X) = 0. Nach Abb. III.2 a enthält der allgemeine Schwingungszustand eines Phonons vom Typ Eg Auslenkungen sowohl in x- wie auch in y-Richtung. Die trigonale Kristallsymmetrie wird durch diese Phononen gestört. Eine Modifikation der Suszeptibilität in x-Richtung durch dieses Phonon ist mit einer Änderung in y-Richtung verknüpft. Ein elektrisches Feld Ex0 des einfallenden Lichtes erzeugt also Polarisationsänderungen in x- wie auch in y-Richtung. Das daraus resultierende Streulicht enthält Polarisationskomponenten in diesen beiden Richtungen, d. h. (@vxx =@X) j 0, (@vxy =@X) j 0.
III:7
besitzt. Bei den Messungen der Abb. III.2 wurde längs der c-Achse (z-Achse des Koordinatensystems) eingestrahlt und in Rückstrahlrichtung längs z das Streulicht analysiert. Wird sowohl für das eingestrahlte als auch für das Streulicht eine Polarisation in x-Richtung vorgegeben, so werden die mit A 11 g, A 21 g und E 2g bezeichneten Phononen beobachtet (Abb. III.2 b), während nur E 2g im Raman-Spektrum erscheint, wenn Streulicht mit einer Polarisation in y-Richtung untersucht wird
Abb. III.3. Raman-Spektrum, aufgenommen an n-dotiertem GaAs bei 5 K Probentemperatur (Konzentration freier Elektronen n & 1016 cm–3); TO und LO bezeichnen transversal bzw. longitudinal optische Phononen. Die Bande bei 40 cm–1 rührt im wesentlichen von Plasmon-Anregungen her. (Nach Mooradian [III.3])
Tafel III
Tafel III Raman-Spektroskopie
Tafel III
108
Tafel III Raman-Spektroskopie
Für Kristalle mit Inversionszentrum (z. B. NaClund CsCl-Struktur) gilt allgemein das Ausschließungsprinzip, dass die infrarot-aktiven Transversal Optischen (TO) Phononen (Abschn. 4.3, 11.3, 11.4) nicht Raman-aktiv und umgekehrt Ramanaktive Phononen nicht infrarot-aktiv sind. Abbildung III.3 zeigt als weiteres experimentelles Beispiel ein Ramanspektrum, das an n-dotiertem GaAs mit einer Konzentration „freier“ Elektronen von n & 1016 cm–3 (s. Abschn. 12.3) aufgenommen wurde. Neben den starken Linien zwischen 250 und 300 cm–1 Wellenzahl (m~ = k –1), die auf die Anregung von transversalen (TO) und longitudinalen (LO) optischen Phononen zurückzuführen sind, wird eine Struktur bei 40 cm–1 unmittelbar neben der Linie der elastischen Streuung (m~= 0) beobachtet. Hier handelt es sich im wesentlichen um die Anregung von kollektiven Dichteschwankungen des „freien“ Elektronengases, sog. Plasmonen (s. dazu Abschn. 11.9). Eine schwache Ankopplung an das LO Phonon bewirkt geringfügige Frequenzverschiebungen sowohl des Plasmons als auch des LO Phonons. Die Abhängigkeit der Raman-Spektren von der Primärenergie h x0 ist ebenfalls von Interesse: Regt man mit Photonenenergien h x0 an, die gerade in einen elektronischen Übergang, d. h. in eine Resonanz von v bzw. der Dielektrizitätskonstanten e (x) fallen, so erhält man enorm hohe Verstärkungen des Raman-Streuquerschnittes, sog. Resonanz-Raman-Streuung. Durch Variation der Primärenergie und Aufsuchen solcher Resonanzen im Raman-Streuquerschnitt lassen sich auch elektronische Übergänge untersuchen. Aus (III.4) folgt, dass für Frequenzen unterhalb der elektronischen Resonanz die Intensität der gestreuten Strahlung wie x 4 bzw. k–4 von der Frequenz bzw. der Wellenlänge des verwendeten Lichtes abhängt; man ist dann also bestrebt, mit möglichst kurzwelligem Licht anzuregen. Dazu werden heute Hochleistungs-Laser (Neodym, Krypton, Argon-Ionen, usw.) verwendet. Insbesondere zur Resonanz-Raman-Spektroskopie werden auch begrenzt durchstimmbare Farbstoff-Laser verwendet. Ausgangsleistungen bis zu mehreren Watt im violetten oder nahen UV-Spektralbereich werden angewandt. Zum Nachweis der Streustrahlung im sichtbaren bzw. nahen UV-Bereich stehen
Abb. III.4. Schema einer Messanordnung zur Beobachtung des Raman-Effektes: Zur Unterdrückung von Streulicht wird ein Doppelmonochromator verwendet und wegen der Kleinheit der Signale wird Pulszähltechnik angewandt. Der Strahlengang des Raman-Lichtes ist gestrichelt angedeutet
hochempfindliche Photomultiplier zur Verfügung. Hohe Anforderungen sind an die verwendeten Spektrometer zur Analyse der Streustrahlung gestellt: Während das verwendete Primärlicht Photonenenergien im Bereich 2–4 eV, d. h. Frequenzen m von der Größenordnung 1015 Hz hat, sollen Frequenzdifferenzen zwischen diesem und den Raman-Banden zwischen einigen Hertz und 1014 Hz ( ^ 3000 cm–1) gemessen werden. Insbesondere bei der Streuung an Schallwellen ist eine Auflösung bis zu x0 /Dx = 108 wünschenswert. Dies kann mit Fabry-Pérot-Interferometern erreicht werden. Die Methode wird dann häufig als Brillouin-Streuung bezeichnet. Wegen der Intensitätsschwäche der Raman-Linien darf in Spektralbereichen unmittelbar neben der Primärlinie kein Untergrund durch im Gerät vagabundierendes Streulicht der Primärenergie h x0 vorgetäuscht werden, d. h. hohe Anforderungen sind an den Kontrast der Spektren gestellt. Neben hoher Auflösung ist hohe Streulichtfreiheit erforderlich. Man verwendet heute Doppel- und Dreifach-Spektrometer (s. Abb. III.4). Die verwendeten Gitter werden holografisch hergestellt, um unerwünschte fehlerhafte Beugungsordnungen, d. h. vorgetäuschte Strukturen (Geister), im spektralen Untergrund zu vermeiden. Abbildung III.4 zeigt schematisch eine moderne Anordnung zur RamanSpektroskopie.
Literatur III.1 D. A. Long: Raman Spectroscopy (McGraw-Hill, New York 1977) W. Hayes, R. Loudon: Scattering of Light by Crystals (Wiley, New York 1978)
109
III.2 W. Richter, H. Köhler, C. R. Becker: Phys. Status Solidi (b) 84, 619 (1977) III.3 A. Mooradian: Light Scattering Spectra of Solids, ed. by G. B. Wright (Springer, Berlin, Heidelberg 1969) p. 285
Tafel III
Literatur
5. Thermische Eigenschaften
Im Abschn. 4.2 hatten wir gesehen, wie sich die 3 r N Bewegungsgleichungen eines periodischen Festkörpers bei Annahme harmonischer Kräfte durch einen Wellenansatz weitgehend entkoppeln lassen. Wir waren dabei mit (4.7) zu einem Gleichungssystem der Ordnung 3 r gelangt, welches zum gegebenen Wellenzahlvektor q die Wellenamplituden der Atome innerhalb einer Elementarzelle miteinander koppelt. Mathematisch lässt sich zeigen, dass sich die Bewegungsgleichungen in harmonischer Näherung auch für den nichtperiodischen Festkörper durch eine lineare Koordinatentransformation auf sogenannte Normalkoordinaten völlig entkoppeln lassen. Wir erhalten damit also insgesamt 3 r N unabhängige Bewegungsformen des Kristalles mit harmonischer Zeitabhängigkeit und einer spezifischen Frequenz, die im Falle des periodischen Festkörpers durch die Dispersionsrelation x (q) gegeben ist. Jeder dieser Bewegungsformen kann man unabhängig von allen anderen Energie zuführen oder entziehen. Allerdings sind die Energiebeträge gequantelt wie bei einem einzigen harmonischen Oszillator: 1 En n h x n 0; 1; 2; . . . :
5:1 2 Klassisch entspricht der Quantenzahl n die Amplitude der Schwingung gemäß 1
5:2 M x2 hs2 i n h x : 2 Will man jetzt also z. B. die thermische Energie eines Festkörpers pro Volumen in harmonischer Näherung berechnen, so muss man einerseits das Spektrum der Eigenfrequenzen des Festkörpers kennen, andererseits auch die Energie eines harmonischen Oszillators im Gleichgewicht mit einem Temperaturbad. Wir wollen zunächst überlegen, wie sich das Frequenzspektrum des Festkörpers wenigstens im Prinzip ermitteln lässt.
112
5. Thermische Eigenschaften
5.1 Die Zustandsdichte Die 3 r N Bewegungsgleichungen (4.4) haben genau 3 r N i.a. verschiedene Lösungen. Der Ansatz ebener Wellen (4.5) für den periodischen Festkörper täuscht dagegen eine kontinuierliche Mannigfaltigkeit von Lösungen vor. Der Widerspruch rührt daher, dass wir einerseits volle Translationssymmetrie, d. h. ein unendlich ausgedehntes Gitter, andererseits aber eine endliche Zahl von Elementarzellen N annehmen. Wir können das Verfahren widerspruchsfrei machen, indem wir uns einen endlichen Kristall mit dem Volumen V und N Elementarzellen denken, diesen aber in drei Dimensionen mit allen seinen Eigenschaften periodisch fortsetzen. Auf diese Weise entsteht einerseits ein Kristall endlicher Größe. Andererseits ist aber auch die volle Translationssymmetrie gewährleistet, die Voraussetzung für die ebenen Wellen als Lösung war. Die Betrachtung eines von vornherein endlichen Kristalls führt dagegen zu Schwierigkeiten, weil zusätzliche, an den Oberflächen lokalisierte, Lösungen auftreten. Eine explizite Berücksichtigung solcher Lösungen im Hinblick auf die thermischen Eigenschaften ist bei sehr kleinen Kristallen erforderlich, wenn die Zahl der Oberflächenatome vergleichbar mit der Zahl der Volumenatome ist. Die Forderung, dass sich alle Eigenschaften des Gitters in jeder der Richtungen des Basisvektorsystems nach N 1/3 Elementarzellen wiederholen sollen, bedeutet, dass auch die Auslenkungen der Atome sn sich wiederholen. Dies führt nach (4.5) auf die Bedingung eiN
1=3
q
a1 a2 a3
1:
5:3 a
Zerlegt man den Wellenvektor q nach den Basisvektoren des reziproken Gitters gi (3.21), müssen die einzelnen Komponenten qi die Gleichung ni qi 1=3 mit N ni 0; 1; 2; . . . N 1=3 1 ni 0; 1; 2; . . . mit der Bedingung G q 12 G2
(5.3 b)
erfüllen. Die Reihe der ganzen Zahlen ni kann entweder so gewählt werden, dass q eine Elementarmasche des reziproken Gitters durchläuft oder gerade die in Abschn. 3.5 eingeführte Brillouin-Zone, die im reziproken Raum das gleiche Volumen einnimmt. Im letzteren Falle sind die Maximalwerte der Zahlen ni durch die Bedingung G q 12 G2 festgelegt (s. a. Abb. 3.8). Dieses Verfahren, ein endliches Gitter einzuführen, aber trotzdem die volle Translationssymmetrie zu gewährleisten, führt also auf diskrete q-Werte. Die Zahl der q-Werte ist insgesamt gleich der Zahl der Elementarzellen N. Die Dichte der erlaubten q-Werte im reziproken Raum ist N dividiert durch das Volumen der Einheitszelle des reziproken Gitters g1·(g2 ´ g3). Durch Verwendung von (3.25) erhält man für
5.1 Die Zustandsdichte
113
die Dichte der Zustände im reziproken Raum bzw. q-Raum V/ (2p)3. In einem kubischen Gitter ist also der Abstand zwischen erlaubten q-Werten einfach 2 p/L (= g/N 1/3), wenn L die Periodizitätslänge im Ortsraum ist. Dieses Ergebnis können wir auch unmittelbar (5.3) entnehmen (Abb. 5.1). Für große N liegen die Zustände im q-Raum sehr dicht und bilden eine homogene, quasikontinuierliche Verteilung. Die Zahl der Zustände in einem Frequenzintervall d x ist dann gegeben durch das Volumen des q-Raumes zwischen den Flächen x (q) = const und x (q) + dx (q) = const multipliziert mit der Dichte der Zustände im q-Raum Z
xdx
xdx
V
dq :
2p3
5:4
x
Z
x heißt auch die Zustandsdichte. Der Begriff der Zustandsdichte ist von zentraler Bedeutung in der Festkörperphysik, auch bei elektronischen Eigenschaften (Abschn. 6.1). Wir zerlegen das Element dq in einen Anteil senkrecht zur Fläche x (q) = const und ein Flächenelement dieser Fläche dq df x dq? : Mit dx jgradq xjdq? erhalt man Z
x dx
V 3
2 p
dx xconst
df x : jgradq xj
5:5
Die Zustandsdichte Z (x) ist hoch, wo die Dispersionskurven flach verlaufen. Für Frequenzen, bei denen die Dispersionsrelation eine waagerechte Tangente hat, hat die Ableitung der Zustandsdichte
Abb. 5.1. Erlaubte Werte im q-Raum. L ist die Periodizitätslänge im Ortsraum
114
5. Thermische Eigenschaften
nach der Frequenz eine Singularität (van Hove-Singularität; s. Abb. 5.2). Im Falle der linearen Kette wird sogar die Zustandsdichte selbst singulär. Wir beachten, dass der Begriff der Zustandsdichte nicht die Periodizität der Struktur voraussetzt. Auch amorphe Festkörper haben eine Zustandsdichte, die meistens nicht so sehr verschieden von der des entsprechenden periodischen Festkörpers ist. Allerdings gibt es im Falle des amorphen Festkörpers keine van Hove-Singularitäten. Wir berechnen als Beispiel die Zustandsdichte eines elastisch isotropen Mediums mit der Schallgeschwindigkeit cL für longitudinale Wellen und cT für die beiden (entarteten) transversalen Zweige. Für jeden Zweig ist dann die Fläche x (q) = const eine Kugel. Damit wird |gradq x| für jeden Zweig i gleich der Schallgeschwindigkeit ci unabhängig von q und das Flächenintegral in (5.5) ist einfach die Kugelfläche 4 p q 2. Damit ergibt sich für jeden Zweig Zi
x dx
V q2 V x2 dx dx 2 p2 c i 2 p2 c3i
und für die gesamte Zustandsdichte V 1 2 Z
x dx 2 3 3 x2 dx : 2 p cL cT
5:6
5:7
Die Zustandsdichte für ein elastisch isotropes Medium bzw. für einen Kristall im Bereich kleiner Frequenzen und Wellenzahlvektoren steigt also quadratisch mit der Frequenz. Sie würde also mit zunehmender Frequenz immer weiter wachsen. Am Beispiel der linearen Kette (Abb. 4.3) können wir aber erkennen, dass für jeden Festkörper eine maximale Frequenz existiert. Das gilt auch für nichtperiodische Strukturen.
Abb. 5.2. Zustandsdichte von Si [5.1] (vgl. auch Abb. 4.4). Die gestrichelte Linie ist die Zustandsdichte, die sich ergäbe, wenn man ein elastisch isotropes Kontinuum ansetzt (Debyesche Näherung mit H = 640 K, s. Abschn. 5.3)
5.2 Thermische Energie eines harmonischen Oszillators
115
5.2 Thermische Energie eines harmonischen Oszillators Wir betrachten nun einen Oszillator im Gleichgewicht mit einem Temperaturbad der Temperatur T. Der Oszillator befindet sich dann nicht in einem festen und bekannten Quantenzustand n mit der Energie En
n 1=2h x, sondern man kann zu jedem Zustand n nur die Wahrscheinlichkeit Pn angeben, mit der er eingenommen wird. Diese Wahrscheinlichkeitsverteilung ist die Boltzmann-Verteilung (auch kanonische Verteilung genannt) Pn / e
k
En = T
k : Boltzmann-Konstante :
5:8
Die Proportionalitätskonstante ist durch die Bedingung gegeben, dass der Oszillator in irgendeinem Zustand sein muss. 1 X
Pn 1 ;
n0 1 X
e
k
En = T
e
h x=2
n0
1 kT X
e
k
k
h x= T n
n0
e
h x=2
k T
1
e
k
:
h x= T
1
:
5:9
Also ist Pn e
k
n h x= T
1
e
h x= T
5:10
Die mittlere Energie e (x, T) ist damit e
x; T
1 X
En Pn
1
e
k
h x= T
n0
1 X 1 n
e h x 2 n0
k
h x= T n
:
5:11 Wie man durch Differenzieren der Summenformel für die geometrische Reihe 1 X n0
xn
1 1
5:12
x
zeigen kann, ist 1 X x nxn ;
1 x2 n0
5:13
und damit
1 e
x; T h x 2
1 e
k
h x= T
: 1
5:14
116
5. Thermische Eigenschaften
Der Ausdruck hat eine ähnliche Form wie die Energieterme eines Oszillators (5.1). Deshalb kann man hniT
1
k
h x= T
5:15
e 1 auch als Erwartungswert der Quantenzahl n für einen Oszillator im thermischen Gleichgewicht bezeichnen. Entsprechend den Überlegungen in Abschn. 4.3 kann man die Wellenbewegung der Atome auch als nicht wechselwirkende Teilchen (Phononen) betrachten, deren Zustand durch den Wellenvektor q und den Zweig j festgelegt ist. Die Zahl n ist dann die Zahl der Teilchen in einem Zustand q, j und hniT der Erwartungswert der Phononenzahl. Die Statistik solcher nichtwechselwirkender Teilchen ohne Beschränkung der Teilchenzahl in einem Zustand heißt Bose-Statistik. Die Wellen verhalten sich also thermisch wie Bose-Teilchen. Man beachte, dass die verschiedenen statistischen Verteilungen Pn in (5.8) und hniT in (5.15) (Boltzmann-Verteilung bzw. BoseVerteilung) durch die verschiedenen Fragestellungen ins Spiel kommen: Die Boltzmann-Verteilung gilt für die Frage, mit welcher Wahrscheinlichkeit ein Teilchen Zustände einnimmt, die Bose-Statistik für die mittlere Teilchenzahl nicht wechselwirkender Teilchen auf Zuständen, die von beliebig vielen Teilchen besetzt werden können.
5.3 Spezifische Wärme Wir kennen nun die thermische Energie e (x, T) eines Oszillators der Frequenz x. Sie gibt uns auch den Energieinhalt jeder Eigenschwingung. Die Gesamtenergie des Festkörpers im thermischen Gleichgewicht, also die innere Energie U (T), erhalten wir durch Summation über alle Eigenfrequenzen. Mit der in Abschn. 5.1 eingeführten Zustandsdichte Z (x) ist also die innere Energie 1
1 U
T Z
x e
x; T dx :
5:16 V 0
Die Ableitung dieser inneren Energie nach der Temperatur ist die spezifische Wärme. Es sei hier gleich erwähnt, dass im Rahmen der harmonischen Näherung die spezifische Wärme bei konstantem Volumen und die spezifische Wärme bei konstantem Druck gleich werden, und wir deshalb weitere Parameter bei der Ableitung nicht zu berücksichtigen brauchen. Die thermische Energie eines Kristalls bzw. die spezifische Wärme lässt sich also nach (5.16) aus der Zustandsdichte Z (x) und diese wiederum im Prinzip aus den Kopplungsmatrizen berechnen.
5.3 Spezifische Wärme
117
Solche Rechnungen sind aber nur nummerisch durchführbar. Zum Verständnis des qualitativen Verlaufs der spezifischen Wärme in Abhängigkeit von der Temperatur genügt es, ein einfaches Modell für die Zustandsdichte zu betrachten. Als solches kann die schon berechnete Zustandsdichte des elastisch isotropen Mediums dienen. Es wird also als Dispersionsrelation einfach x = c q gesetzt. Die typische Dispersion ist vernachlässigt. Dies ist das Debyesche Modell der spezifischen Wärme. Wir erhalten dafür mit (5.7) und (5.16) x
D 1 1 2 d cv
T 2 3 3 e
x; T dx :
5:17 x2 2 p cL cT dT 0
Die Debyesche Abschneidefrequenz xD wird dabei so festgelegt, dass die Gesamtzahl der Zustände gerade 3 r N ist x
D V 1 2 x2 dx :
5:18 3 rN 2 3 3 2 p cL cT 0
Die Festlegung einer gemeinsamen Abschneidefrequenz für alle drei akustischen Zweige ist dabei eine gewisse Inkonsequenz des Modells, die allerdings zu einer besseren Übereinstimmung mit den experimentellen Werten für cv
T führt als die Einführung getrennter Abschneidefrequenzen für den longitudinalen Zweig und die transversalen Zweige. Aus (5.14) und (5.17) ergibt sich 9 rN 1 d cv V x3D dT
x
D
0
h x3 dx e
k
h x= T
:
5:19
1
Mit Einführung der Debye-Temperatur h nach h xD k H
5:20
ergibt sich daraus mit der Integrationsvariablen y h x=k T 3 H=T
4 y 3 rN k T y e dy 3 cv : V H
ey 12
5:21
0
Der Verlauf von cv
T ist in Abb. 5.3 dargestellt. Wie aus (5.19) leicht ablesbar, wird für k T > h xD 1 3 rN k : V Die spezifische Wärme wird also temperaturunabhängig und auf die Dichte bezogen für alle Festkörper gleich, da die charakteristische Temperatur h nicht mehr auftritt. Allerdings gilt dies nur im Rahmen der harmonischen Näherung. Experimentell beobachtet cv
118
5. Thermische Eigenschaften
Abb. 5.3. Verlauf der spezifischen Wärme pro Volumen nach dem Debyeschen Modell. Die spezifische Wärme ist normiert auf die Boltzmannkonstante k, die Dichte der Elementarzellen N/V und auf die Zahl der Atome in der Elementarzelle r. In diesem Modell unterscheiden sich verschiedene Materialien nur durch den Wert der Debye-Temperatur H
man einen zusätzlichen schwachen Anstieg der spezifischen Wärme etwa proportional zu T. Für tiefe Temperaturen kann die Integrationsgrenze in (5.21) nach +? ausgedehnt werden und es ergibt sich für cv
T 1 4 p4 T 3 TH:
5:22 cv
T 3 rN k 5 H V Da für genügend tiefe Temperaturen nur elastische Wellen angeregt sind und für diese die Zustandsdichte in realen Festkörpern tatsächlich !x 2 ist, gilt das T 3-Gesetz für den Schwingungsbeitrag zur spezifischen Wärme für alle Festkörper. Allerdings kann der Temperaturbereich, für den das T 3-Gesetz erfüllt ist, unter 1 K liegen. Im Rahmen der Debyeschen Näherung ist die spezifische Wärme eines Festkörpers durch Angabe einer charakteristischen Temperatur H für alle T festgelegt. Zum Vergleich verschiedener Materialien untereinander ist deshalb die Angabe von H nützlich (Tabelle 5.1). Da die spezifische Wärme in Wirklichkeit von der Debyeschen abweicht, ist nicht ganz klar, wie H zweckmäßig zu definieren ist. Üblich ist, dem gemessenen Wert von cv bei tiefen Temperaturen gemäß (5.22) ein H zuzuordnen. Dieser H-Wert kann von dem H-Wert für höhere Temperaturen nach (5.20) erheblich abweichen. Tabelle 5.1. Beispiele für Debye-Temperaturen H in K [5.2] Cs Hg Se K Ar Pb
38 72 90 91 93 105
In Te Au KCl Pt Nb
108 153 165 235 240 275
ZnS NaCl Cu Li Ge W
315 321 343 344 370 400
C Ir LiCl Al Mo Ni
420 420 422 428 450 450
Fe Cr Si LiF Be C
467 630 640 732 1440 2230
5.4 Anharmonische Effekte
119
5.4 Anharmonische Effekte Wir haben bislang die Atombewegungen in harmonischer Näherung betrachtet. Höhere Entwicklungsglieder im Potential (4.1) wurden vernachlässigt. Viele wichtige Eigenschaften des Festkörpers werden jedoch im Rahmen dieser Näherung nicht beschrieben. Beispiele sind die thermische Ausdehnung, die Temperaturabhängigkeit elastischer Konstanten und der (geringfügige) Anstieg der spezifischen Wärme oberhalb von H. Auch hätte ein „harmonischer“ Festkörper eine unendlich hohe Wärmeleitfähigkeit, denn die Lebensdauer eines einmal erzeugten Wellenpaketes elastischer Wellen wäre unbegrenzt. Der damit verbundene Wärmestrom würde also nicht gestört. Leider ist die Beschreibung anharmonischer Festkörpereigenschaften nicht einfach. Eine exakte Behandlung wie im harmonischen Fall ist nicht möglich, da die schöne Entkopplung der Bewegungsgleichungen durch den Ansatz ebener Wellen entfällt. Deshalb betrachtet man auch im anharmonischen Fall die Lösungen des harmonischen Potentials, die Phononen, als erste Näherung für die Lösungen. Die Phononen sind nun aber nicht mehr die exakten Eigenlösungen der Bewegungsgleichungen. Selbst wenn man also zu einem bestimmten Zeitpunkt den Bewegungszustand eines realen Kristalls durch eine ebene Welle, ein Phonon, beschreiben könnte, würde diese Beschreibung nicht mehr für alle Zeiten gelten wie im harmonischen Fall, sondern im Laufe der Zeit immer unrichtiger. Stattdessen müsste man ein Spektrum anderer Phononen zur Beschreibung heranziehen. Dies nennt man auch einen „Phononenzerfall“. Ein Phonon kann in zwei oder mehrere andere Phononen zerfallen. Eine genaue, quantenmechanische Behandlung dieses Problems im Rahmen einer Störungsrechnung zeigt, dass der Zerfall eines Phonons in zwei andere bzw. der entsprechende inverse Prozess gerade durch das dritte Entwicklungsglied der Potentialentwicklung hervorgerufen wird. Prozesse, an denen vier Phononen beteiligt sind, werden durch das nächst höhere Entwicklungsglied verursacht usw. Da die Größe höherer Entwicklungsglieder i. a. monoton abnimmt, werden solche Multiphononprozesse immer unwahrscheinlicher. Das hat z. B. Bedeutung für die inelastische Wechselwirkung mit Licht oder Materiewellen (s. Abschn. 4.4): Am größten ist der inelastische Wirkungsquerschnitt für die Anregung eines Phonons. Der erste anharmonische Entwicklungsterm ermöglicht die gleichzeitige Anregung zweier Phononen. Die Absorption durch Anregung dreier Phononen dagegen ist sehr schwach. Nur dadurch sind Dispersionskurven wie in Abb. 4.4, die ja der Anregung oder Absorption eines Phonons entsprechen, überhaupt ausmessbar. Eine andere in diesem Zusammenhang interessante Frage ist, ob es auch für nichtlineare Kraftgesetze stationäre Lösungen geben kann. Für spezielle Fälle lassen sich in der Tat solche stationären
120
5. Thermische Eigenschaften
Lösungen, Solitonen genannt, angeben. Solitonen spielen vor allem in der Elektrodynamik nichtlinearer Medien eine Rolle [5.3]. In den folgenden zwei Abschnitten werden die beiden wichtigsten anharmonischen Effekte besprochen und modellmäßig beschrieben: die thermische Ausdehnung und die Wärmeleitfähigkeit durch Phononen.
5.5 Thermische Ausdehnung Alle Stoffe verändern ihr Volumen oder ihre Abmessungen mit der Temperatur. Obgleich die Änderungen beim festen Körper verhältnismäßig klein sind, ist ihre technische Bedeutung hoch, besonders dann, wenn es darauf ankommt, Materialien mit verschiedenen Ausdehnungskoeffizienten dauerhaft miteinander zu verbinden. Um zu einer von den äußeren Abmessungen l der Probe unabhängigen Definition zu gelangen, definiert man als den linearen Ausdehnungskoeffizienten
1 dl : l dT
5:23
Bei isotropen Körpern oder kubischen Kristallen ist er gleich einem Drittel des Volumenausdehnungskoeffizienten V 3
1 dV : V dT
5:24
Typische Werte für lineare Ausdehnungskoeffizienten liegen bei 10–5 K–1. Selbstverständlich kann der Ausdehnungskoeffizient nur gemessen werden, wenn der Körper im spannungsfreien Zustand gehalten wird. Thermodynamisch bedeutet dies, dass die Ableitung der freien Energie nach dem Volumen, d. h. der Druck p, gleich Null sein muss für alle Temperaturen. @F p0:
5:25 @V T Diese Gleichung kann zur Berechnung des Ausdehnungskoeffizienten benutzt werden. Gelingt es nämlich, die freie Energie als Funktion des Volumens auszudrücken, so liefert die Bedingung der Spannungsfreiheit für jede Temperatur eine Beziehung zwischen Volumen und Temperatur, also die thermische Ausdehnung. Wir wollen diesen Weg gehen und betrachten dazu zunächst die freie Energie eines einzigen Oszillators. Die Verallgemeinerung auf ein Gitter ist dann unmittelbar einzusehen. Die freie Energie eines Systems lässt sich durch die Zustandssumme Z ausdrücken
5.5 Thermische Ausdehnung
F
k T ln Z
Z
mit
X
k
Ei = T
e
:
121
5:26
i
Dabei läuft der Index i über alle quantenmechanisch unterscheidbaren Zustände des betrachteten Systems. Bei einem harmonischen Oszillator ist X
k
h x
n1=2= T
e
e
k
h x = T=2
: h x=k T 1 e Der Schwingungsanteil der freien Energie Fs ist dann also Z
5:27
n
1 h x=k T :
5:28 Fs h x k T ln
1 e 2 Zum Gesamtwert der freien Energie gehört noch der Wert der potentiellen Energie in der Ruhelage U 1 h x=k T :
5:29 F U h x k T ln
1 e 2 Wie man sich leicht überzeugen kann, hängt bei einem harmonischen Oszillator die Frequenz x nicht von einer Verschiebung aus der Gleichgewichtslage ab. Entsprechend liefert die Anwendung der Gleichgewichtsbedingung keine thermische Ausdehnung. Wir gehen nun zum anharmonischen Oszillator über, indem wir zulassen, dass die Frequenzen sich mit einer Verschiebung aus der Gleichgewichtslage verändern. Die Energieterme seien weiter durch En
n 12h x gegeben. Dieses Verfahren wird als die quasi-harmonische Näherung bezeichnet. Für einen Oszillator lässt sich die Frequenzänderung leicht durch den dritten Koeffizienten der Potentialentwicklung (4.1) ausdrücken. Die entsprechende Rechnung braucht aber hier nicht durchgeführt zu werden. Für die einfache Berechnung der Ableitung (5.25) denken wir uns die freie Energie um die Gleichgewichtslage entwickelt. Wir wollen den Abstand im Potentialminimum mit a0 bezeichnen. Der zeitliche Mittelwert der Lage des Oszillators für den anharmonischen Fall ist jetzt nicht mehr identisch mit a0 sondern sei a. Damit erhalten wir für die Entwicklung mit der Federkonstanten f 1 f
a a0 2 ; 2 @Fs
a a0 : Fs Fs
a0 @a aa0 U U0
a0
5:30
Die Gleichgewichtsbedingung (5.25) liefert dann mit (5.29) 1 @x e
x; T 0 :
5:31 x @a Diese Gleichung ist schon die Beziehung zwischen der mittleren Verschiebung und der Temperatur. Die Verschiebung ist proportiof
a
a0
122
5. Thermische Eigenschaften
nal der thermischen Energie e
x; T des Oszillators. Wir erhalten also für den linearen Ausdehnungskoeffizienten
T
1 da a0 dT
1 @ ln x @ e
x; T : a20 f @ ln a @T
5:32
Zur Verallgemeinerung auf Festkörper brauchen wir nur a0 1
da=dT durch v V 1
dV=dT zu ersetzen und über alle Phononenwellenvektoren q und alle Zweige j zu summieren. An der Stelle von a 20 f tritt dann V j mit j V
@p=@V, dem Kompressionsmodul, 1 dV
T 1 X @ ln x
q; j @ V e x
q; j; T :
5:33 V dT Vj q; j @ ln V @T Dies ist die thermische Zustandsgleichung eines Gitters. Man kann daraus unmittelbar erkennen, dass im Grenzfall sehr tiefer und hoher Temperaturen der Ausdehnungskoeffizient dasselbe Temperaturverhalten hat wie die spezifische Wärme, also proportional T 3 für tiefe Temperaturen und konstant (im Rahmen dieser Näherung) für hohe Temperaturen ist. Für viele Gittertypen ist sogar die Grüneisen-Zahl @ ln x
q; j
5:34 @ ln V nicht sehr stark von der Frequenz x (q, j) abhängig. Dann lässt sich die Grüneisen-Zahl in Form eines mittleren Parameters aus der Summe in (5.33) herausziehen und der Ausdehnungskoeffizient wird im ganzen Temperaturbereich näherungsweise proportional zur spezifischen Wärme. Typische Werte des Grüneisen-Parameters hci liegen bei 2. Er ist relativ unabhängig vom Material. Daraus folgt wegen des Kompressionsmoduls im Nenner von (5.33) die Faustregel, dass weiche Materialien mit kleinem Kompressionsmodul einen hohen Ausdehnungskoeffizienten haben. Die Proportionalität zwischen aV und der spezifischen Wärme ist jedoch nicht für alle Kristallklassen gegeben. Bei tetraedrisch koordinierten Strukturen wechselt der Ausdehnungskoeffizient bei tiefen Temperaturen das Vorzeichen. Als Beispiel möge der in Abb. 5.4 aufgetragene Ausdehnungskoeffizient von Silizium dienen. Wir haben in der Herleitung der thermischen Zustandsgleichung implizit vorausgesetzt, dass es sich um eine kubische Struktur handelt. Hexagonale Kristalle haben parallel und senkrecht zur hexagonalen c-Achse verschiedene Ausdehnungskoeffizienten. Sie können sogar ungleiche Vorzeichen haben wie beim Tellur: Mit zunehmender Temperatur dehnt sich ein Tellurkristall senkrecht zur cAchse aus, schrumpft aber – um einen geringeren Betrag – in der Richtung parallel zur c-Achse. Kristalle mit triklinen, monoklinen und rhombischen Gittern schließlich haben drei verschiedene Ausdehnungskoeffizienten. c
5.6 Wärmeleitung durch Phononen
123
Abb. 5.4. Linearer Ausdehnungskoeffizient von Silizium als Funktion der Temperatur [5.4]
5.6 Wärmeleitung durch Phononen Im festen Körper wird Wärme durch Phononen und durch freie Elektronen transportiert. Bei Metallen überwiegt der Elektronenanteil an der Wärmeleitfähigkeit. Daraus darf aber nicht geschlossen werden, dass Isolatoren unbedingt schlechtere Wärmeleiter sind. Die Wärmeleitfähigkeit von kristallinem Al2O3 und SiO2 bei tiefen Temperaturen ist höher als die Wärmeleitfähigkeit von Kupfer. Von der Eigenschaft der elektrischen Isolation bei gleichzeitig guter Wärmeleitung wird in der experimentellen Tieftemperaturphysik häufig Gebrauch gemacht. Im Gegensatz zu den bisher besprochenen thermischen Eigenschaften ist die Wärmeleitung ein Phänomen des Ungleichgewichts. Ein Wärmestrom tritt nur auf bei einem Temperaturgradienten, und die Wärmestromdichte Q ist dem Temperaturgradienten proportional Q
k grad T :
5:35
Dabei ist k der Koeffizient der Wärmeleitfähigkeit. Die Tatsache, dass wir es mit Abweichungen vom thermischen Gleichgewicht und örtlich verschiedenen Temperaturen zu tun haben, bringt eine gewisse Schwierigkeit in der Beschreibung mit sich: Die thermischen Größen Energie e
x; T und mittlere Phononenzahl hni (Abschn. 5.2) waren bislang nur für homogene Temperaturen erklärt. Wir müssen deshalb voraussetzen, dass die örtliche Variation von T gering ist, so dass in einem genügend großen, d. h. viele Atome enthaltenden, Gebiet die Temperatur als homogen angesehen werden kann und deshalb eine Phononenzahl hni auch in diesem Fall definierbar ist. Nachbargebiete sollen dann eine abweichende Temperatur haben. In diesem Sinne ist also jetzt die Phononenzahl eine Funktion des Ortes. Für die Berechnung der Wärmeleitfähigkeit müssen wir zunächst die Wärmestromdichte Q durch Eigenschaften der Phononen ausdrücken. Wie mit Hilfe von Abb. 5.5 ersichtlich, ist der durch die Fläche F in der Zeit s in xRichtung hindurchtretende Wärmefluss gleich der Energiedichte mal dem Volumen des Zylinders mit der Höhe v x s. Dabei ist v die
124
5. Thermische Eigenschaften
Abb. 5.5. Zur Herleitung des Wärmeflusses durch eine Querschnittsfläche F: Im Zeitintervall s treffen auf die Fläche F alle Phononen, die sich in einem Zylinder der Höhe v x s befinden
Energie-Transportgeschwindigkeit der Phononen. Diese ist nicht die Phasengeschwindigkeit der Phononwellen x/q, sondern, wie z. B. in Lehrbüchern der Elektrodynamik für Licht bzw. in Lehrbüchern der Quantenmechanik für Elektronen gezeigt wird, gleich der Geschwindigkeit einer Wellengruppe @ x=@ q (s. Abschn. 9.1) 1X @x Qx h x hni v x ; v x :
5:36 V q; j @ qx Hier wie im folgenden lassen wir in der Zwischenrechnung die Indizes q, j in x, hni und v x zur kürzeren Schreibweise weg. Im thermischen Gleichgewicht ist der Wärmefluss Q natürlich Null. Das ist auch an dem Ausdruck für Q leicht zu sehen, denn im Gleichgewicht ist die Phononenbesetzungszahl für positive und negative q-Werte gleich. Wegen der Symmetrie der Dispersionskurven ist aber v x
q v x
q. Dadurch summiert sich der gesamte Wärmefluss zu Null. Ein Wärmefluss besteht also nur dann, wenn die Phononenzahl hni vom Gleichgewichtswert hni0 abweicht. Wir können deshalb den Wärmefluss auch durch die Abweichung der Phononenzahlen vom Gleichgewichtswert ausdrücken. 1X h x
hni hni0 v x :
5:37 Qx V q; j Eine zeitliche Änderung der Phononenzahl hni in einem Gebiet kann auf zweierlei Art zustandekommen: Aus den Nachbargebieten diffundieren mehr oder weniger Phononen in das betrachtete Gebiet hinein als hinaus, oder aber Phononen zerfallen in andere. d hni @ hni @ hni :
5:38 dt @t @t diff:
Zerfall
Dies ist eine spezielle Form einer sog. Boltzmann-Gleichung, die auch bei Elektronen-Transportproblemen Anwendung findet (Abschn. 9.4). Betrachten wir speziell stationäre Wärmeflüsse, bei denen also die Temperatur zeitlich konstant ist, so ändert sich auch die Phononenzahl nicht mit der Zeit. Die totale zeitliche Ableitung d hni=dt ist also Null.
5.6 Wärmeleitung durch Phononen
125
Für die zeitliche Veränderung durch Phononenzerfall kann man einen Relaxationsansatz mit einer Relaxationszeit s machen @ hni hni hni0 :
5:39 s dt Zerfall Nach diesem Ansatz ist die zeitliche Änderung um so größer, je mehr die Phononenzahl vom Gleichgewichtswert abweicht. Der Diffusionsterm ist mit dem Temperaturgradienten verknüpft. In einer bestimmten Zeit Dt gelangen alle die Phononen in das betrachtete Gebiet, die vorher am Ort x v x Dt waren. Dann ist @ hni 1 hn
x v x Dti hn
xi lim @t diff: Dt ! 0 Dt
vx
@hni @x
vx
@hni0 @T : @T @x
5:40
Entsprechend der Voraussetzung stationärer Verhältnisse und der Annahme, dass sich jedes Gebiet im thermischen Gleichgewicht befinden soll, haben wir nach Einführung des Temperaturgradienten hni durch hni0 ersetzt. Setzen wir nun (5.38–5.40) in (5.37) ein, so erhalten wir Qx
1X @hn
q; ji0 @T : h x
q; j s
q; j v 2x
q; j @T V q; j @x
5:41
Für kubische oder isotrope Systeme können wir weiterhin 1 2
5:42 v 3 setzen. Durch Vergleich mit der phänomenologischen Gl. (5.35) erhalten wir für den Koeffizienten der Wärmeleitfähigkeit 1 X @ e x
q; j; T :
5:43 v
q; j K
q; j k 3 V q; j @T hv 2x i
Dabei ist K vs die freie Weglänge eines Phonons. Eine analoge Beziehung gilt auch für die Wärmeleitfähigkeit eines Gases oder des Elektronengases (Abschn. 9.7). Wie zu erwarten, spielt die spezifische Wärme der einzelnen Phononen eine wichtige Rolle beim Wärmetransport. Von Bedeutung ist ferner die Gruppengeschwindigkeit: Phononen in der Nähe der Zonengrenze oder optische Phononen tragen wenig zum Wärmefluss bei. Das Temperaturverhalten von k wird aber auch durch die freie Weglänge bestimmt. Hier muss man je nach Temperatur verschiedene Prozesse betrachten, die im folgenden näher diskutiert werden. Wir müssen dazu den Zerfall von Phononen näher betrachten. Beim Zerfall durch anharmonische Wechselwirkung, die in Abschn. 5.4 schon beschrieben wurde, gelten Quasiimpulserhaltung und Energieerhaltung:
126
5. Thermische Eigenschaften
Abb. 5.6 a, b. Normalprozesse (a) und Umklappprozesse (b) im q-Raum. Im Falle (b) wird der Vektor q1 unter Zuhilfenahme eines Vektors G in zwei Vektoren q2 und q3 zerlegt, für die die Gruppengeschwindigkeit in Richtung der negativen qx-Achse verläuft. Dadurch tritt eine Umkehrung der Richtung des Energieflusses ein
q1 q2 q3 G ; h x1 h x2 h x3 :
5:44
Für den Fall tiefer Temperaturen, wo nur Schallwellen thermisch angeregt sind, sind Impuls- und Energiesatz nur mit G = 0 erfüllbar. Solche Prozesse sind in Abb. 5.6 a dargestellt. Man sieht, dass die Projektionen von q1 und q2 + q3 auf eine beliebige Richtung in diesem Fall gleich sind. Da für elastische Wellen auch der Betrag der Gruppengeschwindigkeit unabhängig von q ist, wird also der Wärmefluss durch den Zerfallsprozess gar nicht gestört. Bei tiefen Temperaturen (in der Praxis etwa unterhalb von 10 K) führt also die anharmonische Wechselwirkung nicht zu einer Begrenzung der freien Weglänge in (5.43). Nur Prozesse, bei denen die q-Erhaltung nicht gilt, tragen hier zum Wärmewiderstand bei. Solche Prozesse sind die Streuung von Phononen an Defekten des Kristalls oder – bei einem sehr guten Einkristall – die Streuung an den Oberflächen des Kristalls. Wir haben dann die zunächst etwas seltsam anmutende, aber tatsächlich beobachtete Erscheinung, dass die Wärmeleitfähigkeit von den äußeren Abmessungen sowie der Beschaffenheit
5.6 Wärmeleitung durch Phononen
127
Abb. 5.7. Wärmeleitfähigkeit von einkristallinem SiO2 (Quarz) senkrecht zur c-Achse, desselben Kristalls mit Defekten durch Neutronenbeschuss und von Quarzglas [5.5, 5.6]
der Oberfläche abhängt. Die Temperaturabhängigkeit von k ist dann durch die spezifische Wärme gegeben, also proportional T 3. Bei höheren Temperaturen können Impuls- und Energiesatz bei Phononenzerfall auch mit einem reziproken Gittervektor realisiert werden. Solche Prozesse können die Richtung des Energietransportes umkehren (s. Abb. 5.6 b). Sie heißen deshalb auch „Umklapp“Prozesse. Bedingung für ihr Auftreten ist, dass Phononen mit genügend hohem q-Vektor angeregt sind. Das zerfallene Phonon muss also ein q1 von der Größenordnung des halben Durchmessers der Brillouin-Zone und somit eine Energie von k H=2 besitzen. Die Wahrscheinlichkeit dafür ist proportional exp
H=bT mit b = 2. Für die Konstante b wird dabei experimentell tatsächlich ungefähr der Wert 2 gefunden. Die freie Weglänge wird damit also proportional zu K / eH=bT :
5:45
Diese starke exponentielle Abhängigkeit bestimmt das Temperaturverhalten von k in einem mittleren Temperaturbereich. Bei hohen Temperaturen sinkt K nur noch langsam mit der Temperatur
/ T 1 . Der sich insgesamt ergebende, charakteristische Verlauf der Wärmeleitfähigkeit eines (nichtleitenden) Einkristalls ist in Abb. 5.7 am Beispiel von SiO2 (Quarz) dargestellt. Zum Vergleich ist auch das völlig andersartige Verhalten des gleichen Materials im amorphen Zustand (Quarzglas) aufgetragen.
128
5. Thermische Eigenschaften
Hier überwiegt die Streuung an Defekten schon bei der DebyeTemperatur, und k sinkt mit fallender Temperatur rasch ab ohne das für Einkristalle charakteristische Zwischenmaximum. Auch Strahlenschäden oder andere Defekte reduzieren die Wärmeleitfähigkeit von Einkristallen beträchtlich.
Übungen zu Kapitel 5
5.1 Berechnen Sie die Zustandsdichte und die spezifische Wärme bei hohen und tiefen Temperaturen für ein eindimensionales und ein zweidimensionales elastisches Kontinuum! Gibt es physikalische Realisierungen solcher Systeme?
5.4 Berechnen und zeichnen Sie die Phasen- und Gruppengeschwindigkeit von Phononen in einer zweiatomigen linearen Kette mit einem Massenverhältnis von 1 : 5! Schätzen Sie den Beitrag optischer Phononen zur Wärmeleitfähigkeit ab!
5.2 Berechnen Sie die thermische Energie und die spezifische Wärme für (a) ein System von zwei harmonischen Oszillatoren, (b) ein System mit zwei Energieniveaus!
5.5 Zeigen Sie, dass die Bewegungsgleichung für den anharmonischen Oszillator
Erklären Sie den Unterschied im Ergebnis! Gibt es physikalische Realisierungen für den Fall (b)? 5.3 Man betrachte eine tetragonale Struktur mit einer Basis von zwei Ionen bei (0, 0, 0) und (0, 0, 12) mit entgegengesetzter Ladung q. (a) Berechnen Sie die statische Polarisation! (b) Welche Oberflächenladungen müssen an den (001)-Oberflächen angebracht werden, damit die statische Polarisation kompensiert wird? (c) Berechnen Sie die piezoelektrische Konstante @P3 =@s3 unter der Annahme von Zentralkräften zu den nächsten Nachbarn! s3 ist die mechanische Spannung entlang der polaren c-Achse. (d) Für welche Richtungen erwarten Sie einen longitudinalen Piezoeffekt im Fall der Wurtzitstruktur (der Zinkblendestruktur)?
Mu fu
1 2 gu 0 2
durch den Ansatz 1 X an ein x0 t ; u n1
mit x 20 = f/M näherungsweise gelöst wird! Diskutieren Sie das Ergebnis im Hinblick auf den Phononenzerfall! Erläutern Sie die Analogie zu elektrischen Schaltkreisen und zur Nachrichtenübertragung in nichtlinearen Medien. 5.6 Berechnen Sie die thermische Ausdehnung eines anharmonischen Oszillators entsprechend der Darstellung in Abschn. 5.5! Die Frequenzänderung bei einer Verschiebung ustat lässt sich durch den Ansatz u (t) = ustat+u1 sin x t ermitteln.
Tafel IV
Tafel IV Experimente bei tiefen Temperaturen
In der Geschichte der Festkörperphysik waren Fortschritte in der Herstellung und Messung tiefer Temperaturen und die Entdeckung neuer physikalischer Phänomene häufig miteinander verknüpft. So hat z. B. Kamerlingh Onnes 1911 kurz nach der ersten Verflüssigung von 4He (1908) die Supraleitung [IV.1] entdeckt. Es ist ja eine Besonderheit des Vielteilchensystems „Festkörper“, elementare Anregungen mit kleiner Quantenenergie zu besitzen. Der Quantencharakter des Anregungsspektrums ist aber nur dann besonders ausgeprägt, wenn k T klein gegen die Quantenenergien wird. In dem Bestreben, immer tiefere Temperaturen zu erzeugen, ist man heute bis in den Mikro-Kelvin-Bereich vorgestoßen (12 lK [IV.2]). Zur Herstellung solcher Temperaturen bedarf es des Zusammenwirkens vieler ausgefeilter Techniken. So darf z. B. die Wärmezufuhr zu der abzukühlenden Probe 10–9 W nicht überschreiten. Selbst elektromagnetische Einstrahlung im Radiofrequenzbereich oder Vibrationen müssen vermieden werden. Haupthilfsmittel bei der Erzeugung tiefster Temperaturen ist neben der Verwendung flüssiger Edelgase 4He (T = 4,2– 1,2 K) und 3He (T = 3,2–0,3 K) zur Vorkühlung die sog. „adiabatische Entmagnetisierung“ von Kernspinsystemen. Bei dieser Art der Kühlung lässt man bei höherer Temperatur im Milli-Kelvin-Bereich die Kernspins eines im Magnetfeld aufgespaltenen Spinsystems durch Wärmeentzug tiefere Zustände einnehmen. Anschließend fährt man das Magnetfeld langsam herunter, wodurch sich die Niveauabstände des Spinsystems verkleinern, bis schließlich bei der entsprechenden Temperatur einige Spins die Möglichkeit haben, höhere Zustände des Kernspinsystems einzunehmen. Die dafür aufzuwendende Energie wird als Wärme dem Elektronen- und (bei nicht zu niedrigen Temperaturen) auch dem Phononensystem des Festkörpers entzogen.
Wie in allen Grenzgebieten der Physik ist im lK-Bereich nicht nur die Erzeugung, sondern auch die Messung tiefster Temperaturen ein Problem. Allein der Temperaturausgleich zwischen Kernspin- und Elektronensystem kann Stunden in Anspruch nehmen Wir wollen in dieser Experimenttafel zwei Anordnungen kennenlernen, die es erlauben, die spezifische Wärme und die Wärmeleitfähigkeit von Festkörpern bis etwa 0,3 K zu messen. Verglichen mit der Arbeit im lK-Bereich sind dies einfache Experimente. Sie lassen aber doch wesentliche Elemente der Tieftemperaturtechnik erkennen. In Abb. IV.1 stellen wir ein sog. Nernst-Kalorimeter nach Gmelin [IV.3] zur Messung der spezifischen Wärme vor. Das Kalorimeter besteht aus einem zur Vermeidung der Gaswärmeleitung evakuierten Gefäß, welches in das Heliumbad eines konventionellen Kryostaten eingetaucht wird. Das Heliumbad ist seinerseits zur Verringerung der thermischen Zustrahlung von einem Mantel auf der Temperatur flüssigen Stickstoffs umgeben. Das Prinzip der Messung der spezifischen Wärme besteht in der Messung der Temperaturerhöhung der zu untersuchenden Probe bei bekannter Energiezufuhr meistens in der Form elektrisch erzeugter Wärme. Hauptproblem dabei ist die unerwünschte Wärmezufuhr zur Probe. Diese Wärmezufuhr erfolgt auf drei Wegen: Wärmeleitung durch Restgas im Kalorimeter, Wärmestrahlung und Wärmeleitung durch die Zuleitungen. Die Wärmeleitung durch das Restgas kann durch Evakuieren (möglichst bei höheren Temperaturen) weitgehend vermieden werden. Der Einfluss der Strahlung wird klein gehalten, wenn man die Probe mit einem Strahlungsschild umgibt, dessen Temperatur durch geeignete Beheizung stets in der Nähe der Temperatur der Probe gehalten wird (sog. „adiabatisches“ Kalorimeter). Die Probe selbst wird – thermisch weit-
131
Tafel IV
Tafel IV Experimente bei tiefen Temperaturen.
Abb. IV.1. Ein adiabatisches Nernst-Kalorimeter nach Gmelin [IV.3]
gehend isoliert – mit Baumwoll- oder Nylonfäden gehalten. Die Wärmeleitung durch die Zuleitungen ist nicht ganz vermeidbar, kann aber durch sorgfältige Auswahl der Materialien sowie durch sorgfältige thermische Ankopplung der Zuleitungen an das äußere Strahlungsschild klein gehalten werden. Zur Einstellung einer gewünschten Probentemperatur, insbesondere zum Abkühlen, kann ein Wärmeschalter verwendet werden. In dem Kalorimeter nach Gmelin in Abb. IV.1 ist dieser Wärmeschalter eine pneumatisch geschaltete Wärmebrücke, mit der die Probe an die Temperatur des Heliumbades angekoppelt werden kann. Die Temperatur der Probe wird durch den Widerstand von Kohlewiderständen oder, noch reproduzierbarer, durch den Wi-
derstand eines dotierten Germaniumkristalles gemessen, der ja exponentiell mit steigender Temperatur fällt (s. Kap. 12). Solche Widerstandsthermometer müssen ihrerseits gegen die thermodynamischen Fixpunkte von 3He und 4He oder besser gegen ein Dampfdruckthermometer mit diesen Gasen geeicht werden. Als kleines Beispiel für die Raffinesse der Ausgestaltung der experimentellen Anordnung in Abb. IV.1 beachte man, wie durch spezielle Gestaltung der Vakuumleitung verhindert wird, dass die 300 K-Strahlung aus der Vakuumleitung in das Kalorimeter gelangt. Trotz sorgfältiger Abschirmung ist ein Temperaturgang der Probe nicht zu vermeiden (Abb. IV.2). Nach erfolgter Wärmezufuhr D Q muss man deshalb die wahre Temperaturerhö-
Tafel IV Experimente bei tiefen Temperaturen
Tafel IV
132
hung durch Extrapolation der Temperaturgänge vor und nach der Wärmezufuhr ermitteln (Abb. IV.2). Die spezifische Wärme errechnet sich dann nach 1 DQ :
IV:1 m DT Mit einem Kalorimeter nach Abb. IV.1 lässt sich im Prinzip auch die Wärmeleitfähigkeit einer Probe messen. Eine etwas andere Anordnung aus dem Labor von Pohl [IV.4], die speziell für Wärmeleitungsuntersuchungen entwickelt wurde, zeigt Abb. IV.3. Wiederum kann die gesamte Anordnung in ein Bad aus 4He (4,2 K bei Normaldruck) eingetaucht werden. Dieses Bad ist seinerseits durch ein Strahlungsschild auf der Temperatur flüssigen Stickstoffs abgeschirmt. Zusätzlich enthält die Anordnung in Abb. IV.3 einen Tank cp
Abb. IV.2. Typischer Temperaturverlauf an der Probe bei der Ermittlung der spezifischen Wärme aus der Temperaturerhöhung bei bekannter Wärmezufuhr. Zur Ermittlung der wahren Temperaturerhöhung müssen die Temperaturgänge vor und nach der Messung in der angegebenen Weise extrapoliert werden
Abb. IV.3. Eine Anordnung zur Wärmeleitungsmessung (vereinfacht) nach Seward und Narayanamurti [IV.4]
für 3He. Durch Ausnutzung der Verdampfungswärme von 3He durch Abpumpen kann etwa 0,3 K erreicht werden. Die Vorrichtung zur Wärmeleitungsmessung in Abb. IV.3 enthält zwei Heizelemente, eines dient zur Einstellung einer Grundtemperatur der Probe, das zweite am oberen Ende der Kristallprobe erzeugt einen stationären Wärmestrom durch die Probe. Die Temperaturdifferenz wird durch die beiden Kohlewiderstände abgegriffen. Die Wärmeleitfähigkeit errechnet sich dann nach k
L Q_ F DT
IV:2
133
wobei L die Distanz zwischen den Kohlewiderständen, F der Querschnitt der Probe und Q_ die dem Heizelement zugeführte Leistung ist.
Literatur IV.1 W. Buckel: Supraleitung, 2. Aufl. (Physik Verlag, Weinheim 1977) IV.2 K. Gloos, P. Smeibidel, C. Kennedy, A. Singsaas, P. Sekowski, R. M. Mueller, F. Pobell: J. Low Temp. Phys. 73, 101 (1988) IV.3 E. Gmelin: Thermochim. Acta 29, 1 (1979) IV.4 W. D. Seward, V. Narayanamurti: Phys. Rev. 148, 463 (1966)
Tafel IV
Literatur
6. „Freie“ Elektronen im Festkörper
Festkörpereigenschaften lassen sich näherungsweise in schwingungsdynamische und elektronische Eigenschaften aufteilen. Dieser sog. adiabatischen Näherung (Kap. 4) lag die Tatsache zugrunde, dass für die Dynamik der schweren Kerne oder auch der Kerne einschließlich der stark gebundenen Rumpfelektronen (man nennt diese Zusammenfassung „Atomrumpf“) die Energie als Funktion der Kern- oder Rumpfkoordinaten als zeitunabhängiges Potential aufgefaßt werden kann: Das Elektronensystem folgt wegen seiner so viel geringeren Masse fast augenblicklich der Kern- oder Rumpfbewegung. Vom Elektronensystem aus betrachtet, heißt das auch, dass für die Dynamik des Elektronensystems die Kern- oder Rumpfbewegung als sehr langsam und im Grenzfall als nicht vorhanden betrachtet werden darf. Innerhalb der adiabatischen Näherung lassen sich dann die Anregungszustände des Elektronensystems im statischen Potential der positiv geladenen, periodisch angeordneten Kerne oder Atomrümpfe ermitteln. Man hat bei diesem Vorgehen dann Wechselwirkungen zwischen den sich bewegenden Atomrümpfen und den übrigen Elektronen des Kristalls vernachlässigt. Zur Behandlung von Transporterscheinungen der Elektronen im Kristall (Abschn. 9.3–9.5) müssen diese sog. Elektron-Gitterwechselwirkungen nachträglich wieder in Form einer Störung eingeführt werden. Auch im Rahmen der adiabatischen Näherung mit ruhenden Kernen oder Rümpfen lassen sich Anregungszustände der Elektronen noch nicht quantitativ behandeln, denn man müsste immer noch die Schrödinger-Gleichung für etwa 1023 Elektronen (die untereinander auch wechselwirken) im periodischen, statischen Rumpfpotential lösen. Das Problem wird deshalb weiter vereinfacht: Man betrachtet nur ein einziges Elektron in einem effektiven periodischen und zeitunabhängigen Potential. Dieses Potential wird dabei aus den ruhenden, sich in ihrer Gleichgewichtslage befindenden Atomkernen und allen anderen Elektronen gebildet. Diese Elektronen schirmen das Kernpotential weitgehend ab, und es ergibt sich qualitativ bei einem Schnitt längs einer Atomreihe im Kristall für dieses Aufelektron ein Potentialverlauf wie in Abb. 6.1 (durchgezogene Linie) dargestellt. In dieser sog. Einelektronennäherung sind alle Elektron-Elektronwechselwirkungen vernachlässigt, die sich nicht als lokales Potential für das betrachtete Aufelektron darstellen lassen, z. B. Wechselwirkungen, die auf Austausch zweier Elektronen zurückzuführen sind. Solche Korrelationen zwischen Elektronen sind aber z. B. wichtig für das Verständnis des Magnetismus und der Supralei-
136
6. „Freie“ Elektronen im Festkörper
Abb. 6.1. Qualitativer Verlauf des Potentials für ein Kristallelektron im periodischen Gitter der positiven Rümpfe (+). EVac ist das Vakuum-Energieniveau, auf das ein Elektron gebracht werden muss, wenn es aus dem Kristallinnern ins Unendliche gebracht wird. Die einfachste Näherung zur Beschreibung ist durch ein Kastenpotential (gestrichelt) mit unendlich hohen Energiewänden an der Oberfläche angedeutet
tung. Wir werden also auf das Thema Elektronenkorrelation noch zurückkommen müssen. Im Augenblick beschränken wir uns jedoch darauf, ein periodisches, lokales Potential anzunehmen und die Schrödinger-Gleichung für ein einziges Aufelektron in diesem Potential zu lösen. Für das eine Elektron ergeben sich Einelektronen-Quantenzustände, die dann sukzessive mit den zur Verfügung stehenden Elektronen aufgefüllt werden. Hierbei verlangt das Pauli-Prinzip, dass ein solcher Quantenzustand nur von einem einzigen Elektron eingenommen werden darf.
6.1 Das freie Elektronengas im Potentialkasten Ein weiter vereinfachtes Modell, das zum erstenmal von Sommerfeld u. Bethe (1933) [6.1] betrachtet wurde, nimmt nicht einmal Notiz vom periodischen Potential im Kristall. Trotzdem hat dieses Modell zum ersten Mal ein vertieftes Verständnis vieler elektronischer Eigenschaften, insbesondere der Metalle, gebracht. In dem Modell wird ein Metallkristall (Kubus mit den Längen L ) durch einen dreidimensionalen „Potentialkasten“ mit unendlich hoher Energieschwelle an der Oberfläche beschrieben (Abb. 6.1); d. h. Elektronen können das Metall nicht verlassen, was sicherlich eine grobe Vereinfachung angesichts von Austrittsarbeiten im Bereich von 5 eV (Abschn. 6.6) darstellt. Die stationäre Schrödinger-Gleichung für das Aufelektron der Einelektronennäherung im Kastenpotential schreibt sich damit h2 D w
r V
r w
r E 0 w
r ; 2m wobei für ein Kastenpotential gilt: V
x; y; z V0 const fur 05x; y; z5L 1 sonst: Mit E E 0
6:1
6:2
V0 gilt:
h2 D w
r E w
r : 2m
6:3
6.1 Das freie Elektronengas im Potentialkasten
137
Da wegen der unendlich hohen Energieschwelle an den Oberflächen (x, y, z = 0 und L) das Elektron den Kasten nicht verlassen kann, gelten die sog. festen Randbedingungen (vgl. die Begründung für periodische Randbedingungen in Abschn. 5.1) w 0 fur
x 0 und L ; y 0 und L ;
y; z beliebig zwischen 0 und L ; x; z beliebig zwischen 0 und L ;
z 0 und L ;
x; y beliebig zwischen 0 und L :
6:4
Da das Elektron mit Sicherheit im Kasten anzutreffen ist, schreibt sich die Normierungsbedingung für w
r:
d rw
rw
r 1 :
6:5 Kasten
Die Schrödinger-Gleichung (6.3) ergibt mit den Randbedingungen (6.4) als Lösung 3=2 2 w
r sin kx x sin ky y sin kz z :
6:6 L Die möglichen Energiezustände ergeben sich durch Einsetzen von (6.6) in (6.3) zu h2 k2 h2 2 kx ky2 kz2 :
6:7 E 2m 2m Die Energiewerte sind, wie erwartet, die eines freien Elektrons (de Broglie-Beziehung), wobei jedoch aus der Bedingung w = 0 bei r = (L, L, L) (6.4) Einschränkungen für die Wellenzahlen kx, ky, kz folgen: p kx nx ; L p ky ny ;
6:8 L p kz nz mit nx ; ny ; nz 1; 2; 3; . . . : L Die Lösung mit nx oder ny oder nz = 0 ist nicht normierbar über das Kastenvolumen und muss deshalb ausgeschlossen werden. Negative Wellenzahlvektoren ergeben keine linear unabhängigen Lösungen in (6.6). Die möglichen Zustände eines Elektrons im Potentialkasten (stehende Wellen, s. Abb. 6.2) lassen sich ordnen nach ihren Quantenzahlen (nx, ny, nz) oder (kx, ky, kz). Eine Darstellung im dreidimensionalen Raum der Wellenzahlvektoren liefert als Flächen konstanter Energie Kugeln E h2 k2 =2m. Bei den beschriebenen festen Randbedingungen nehmen die möglichen Zustandsvektoren nur den positiven Oktanten des k-Raumes ein. Im Vergleich zu den periodischen Randbedingungen Abschn. (5.1) liegen die Zustände aber in jeder Achsenrichtung doppelt so dicht. Einem Zustand kommt also das Volumen Vk = (p/L)3 zu.
138
6. „Freie“ Elektronen im Festkörper
Abb. 6.2. Ortsabhängigkeit in x-Richtung für die ersten drei Wellenfunktionen eines freien Elektrons in einem rechteckigen Potentialkasten der Länge L in x-Richtung. Die Wellenlängen zu den Quantenzahlen nx = 1, 2, 3, . . . sind k = 2 L, L, 23 L . . .
Wieder liegen bei makroskopischen Dimensionen L die Zustandspunkte quasikontinuierlich, so dass für viele Zwecke Summen im k-Raum durch Integrale ersetzt werden können. Wie im Fall der Phononen können wir eine Zustandsdichte berechnen. Dazu dividieren wir das Volumen eines Achtels der Kugelschale, begrenzt durch die Energieflächen E (k) und E (k)+dE, durch das Volumen Vk eines k-Punktes: 1
6:9 dZ 0 4 p k2 dk=
p=L3 : 8 Wegen dE
h2 k=mdk folgt für die Anzahl der Zustandspunkte pro Kristallvolumen L 3:
2m3=2 1=2 E dE :
6:10 4p2 h3 In der Schrödingerschen Wellenmechanik, wie sie bisher benutzt wurde, wird dem Eigendrehimpuls, d. h. dem Spin des Elektrons, keine Rechnung getragen. Wie man schon am Aufbau des Periodensystems (Abschn. 1.1) sehen kann, muss man dem Elektron einen Spin zuordnen, der in einem äußeren Magnetfeld zwei mögli-
dZ
Abb. 6.3 a, b. Darstellung der Zustände eines Elektrons im Potentialkasten durch das Punktgitter im k-Raum der Wellenzahlvektoren. Wegen der beiden Spineinstellungen beschreibt ein Punkt 2 Zustände. (a) Für feste Randbedingungen liegen die Zustandspunkte nur in einem Oktanten und haben einen linearen Abstand von p/L. (b) Für periodische Randbedingungen wird der gesamte k-Raum überdeckt, dafür ist der lineare Abstand zwischen 2 Punkten 2 p/L. Dargestellt ist ein Schnitt längs der kx, ky-Ebene (vgl. Abb. 5.1). In beiden Fällen sind Kugeln konstanter Energie E (k) bzw. E (k)+dE dargestellt
6.1 Das freie Elektronengas im Potentialkasten
139
che Einstellungen haben kann. Ohne äußeres Feld sind die Energieniveaus zu diesen beiden Einstellungen entartet, d. h. jeder Punkt des k-Raumes in Abb. 6.3 beschreibt unter Berücksichtigung des Elektronenspins zwei mögliche Elektronenzustände. Aus (6.10) folgt somit für die Zustandsdichte des freien Elektronengases im Potentialtopf D (E) = dZ/dE
2m3=2 1=2 E :
6:11 2p2 h3 D (E) wird üblicherweise in den Einheiten cm–3 eV–1 angegeben. Die gleiche Zustandsdichte (Abb. 6.4) und somit gleiche Ausdrücke für die makroskopischen Größen des Kristalls ergeben sich, wenn man die periodischen Randbedingungen verwendet: D
E
w
x L; y L; z L w
x; y; z :
6:12
Die Bedingung liefert als Lösung von (6.3) laufende Elektronenwellen 3=2 1 w
r ei k r : L Da positive und negative k-Werte hier linear unabhängige Lösungen ergeben, und die komplexe Welle für k = 0 normierbar ist, nehmen die Zustandspunkte jetzt den gesamten k-Raum der Wellenzahlen ein: kx 0; 2p=L; 4p=L; . . . ; 2p nx =L; . . . ky 0; 2p=L; . . . ; 2p ny =L; . . . kz 0; 2p=L; . . . ; 2p nz =L; . . . :
6:13
Der Abstand zweier k-Punkte ist jetzt 2 p/L, und das einem Zustandspunkt zugeordnete Volumen Vk ist (2 Elektronenzustände wegen Spin)
2p=L3 8Vk : Da aber statt eines Oktanten ein Raumwinkel von 4 p zur Berechnung der Zustandsdichte herangezogen werden muss, ergibt sich auch bei periodischen Randbedingungen der Ausdruck (6.11) für D (E).
Abb. 6.4. Dichte von Einteilchenzuständen D (E) eines freien Elektronengases in Abhängigkeit von der Energie E im Dreidimensionalen
140
6. „Freie“ Elektronen im Festkörper
Berücksichtigung einer nur endlich hohen Potentialschwelle an der Kristalloberfläche (endliche Austrittsarbeit) bringt eine Modifizierung der abgeleiteten Ausdrücke: Die Elektronenwellen klingen außerhalb des Kristalls exponentiell ab, d. h. es liegt in der Nähe der Kristalloberfläche auch eine nicht verschwindende Aufenthaltswahrscheinlichkeit im Vakuum vor. Auch können besondere, an Oberflächen lokalisierte Zustände auftreten. Wir wollen uns hier aber nur für die Volumeneigenschaften genügend großer Kristalle interessieren, bei denen diese Effekte vernachlässigt werden können.
6.2 Das Fermi-Gas bei T = 0 K Die Zustände, die ein Elektron im Rahmen der Einelektronnäherung im Potentialtopf besetzen kann, sind auf die Energieachse entsprechend der Zustandsdichte D (E) verteilt. Die Besetzung der Zustände mit den im Kristall zur Verfügung stehenden Elektronen muss nun so sein, dass sie der mittleren thermischen Energie des Systems entspricht, d. h. die Besetzung muss durch eine temperaturabhängige sog. Besetzungswahrscheinlichkeit f (T, E) geregelt sein. Die Elektronendichte (bezogen auf die Volumeneinheit) ist damit 1
n D
Ef
T; EdE :
6:14 0
Für ein Gas klassischer Teilchen wäre diese Verteilungsfunktion f (T, E) die bekannte Boltzmannsche Exponentialfunktion, die verlangen würde, dass bei Temperaturen T ? 0 K alle Elektronen den tiefsten zur Verfügung stehenden Zustand besetzen. Für alle Fermionen, d. h. Elementarteilchen mit halbzahligem Spin, zu denen die Elektronen gehören, gilt jedoch das Pauli-Prinzip, das im Rahmen der Einteilchennäherung für nicht wechselwirkende Teilchen so formuliert werden kann: In einem atomaren System können keine zwei Fermionen in allen Quantenzahlen übereinstimmen. Dieses Ausschließungsprinzip verlangt also, dass im Zustand niedrigster Energie, d. h. für T ? 0 K, alle zur Verfügung stehenden Elektronen des Kristalls die Energieterme von niedrigen Energien her sukzessive bis zu einer oberen Grenze auffüllen. Diese obere Grenzenergie, die bei T ? 0 K besetzte von unbesetzten Zuständen trennt, heißt Fermi-Energie E 0F bei der Temperatur T = 0 K. Im Modell des freien Elektronengases im Potentialtopf stellt sich diese Energie als Kugelfläche E 0F (kF) = h2 k 2F/2 m mit dem sogenannten Fermi-Radius kF im k-Raum dar. Die Besetzungswahrscheinlichkeit für Elektronen im Potentialkasten bei T = 0 K ist eine Stufenfunktion mit f = 1 für E < E 0F und f = 0 für E > E 0F (Abb. 6.5 u. 6.6). Aus der Kugelgestalt der Fermi-Fläche E 0F (kF) bei T ? 0 K folgt sofort ein einfacher Zusammenhang zwi-
6.2 Das Fermi-Gas bei T = 0 K
141
Abb. 6.5 a–c. Beschreibung der quasifreien Metall-Valenzelektronen bei T = 0. (a) f (E ) ist eine Stufenfunktion. (b) Die Konzentration n aller Valenzelektronen ergibt sich als Fläche unterhalb der Zustandsdichte D (E) bis zur festen Fermi-Energie E 0F . (c) Im k-Raum der Wellenzahlen trennt die Fermi-Kugel E (k) = E 0F besetzte von unbesetzten Zuständen
schen Elektronendichte n und Fermi-Radius kF bzw. Fermi-Energie E 0F: nL3
L3 kF3 ; 3p2
6:15
h2
3p2 n2=3 :
6:16 2m Werte für die Größe der Fermi-Energie kann man also abschätzen, wenn man die Elektronenkonzentration n aus der Zahl der Valenzelektronen pro Atom errechnet. Einige Werte für E 0F sind in Tabelle 6.1 zusammengestellt. Wir sehen daran, dass die Fermi-Energie EF0
Tabelle 6.1. Fermi-Energie E0F , Radius der Fermi-Kugel im k-Raum kF , FermiGeschwindigkeit v F = h kF/m und Fermi-Temperatur TF = E 0F/k für einige typische Metalle. n ist die Konzentration der Leitungselektronen, ermittelt aus den Strukturdaten der Elemente [6.2]. Dabei ist zu beachten, dass die Elektronenkonfiguration von Cu, Ag und Au 3 d 10 4 s 1 ist, also jedes Atom ein „freies“ Elektron beiträgt (Abb. 7.12). Häufig wird auch der charakteristische Radius rs verwendet. Er ist definiert durch das Volumen einer gedachten Kugel, die jedes Elektron einnimmt, –1 4 p r 3s/3 = a –3 0 n , wobei a0 der Bohrsche Radius ist, so dass rs dimensionslos wird. Werte für rs liegen zwischen 2 und 6 für typische Metalle Metall
n (1022 cm–3)
rs (–)
kF (108 cm–1)
vF (108 cm/s)
E 0F (eV)
TF (104 K)
Li Na Cs Al Cu Ag Au
4,62 2,53 0,86 18,07 8,47 5,86 5,9
3,27 3,99 5,71 2,07 2,67 3,02 3,01
1,11 0,91 0,63 1,75 1,36 1,20 1,20
1,29 1,05 0,74 2,03 1,57 1,39 1,39
4,70 3,14 1,53 11,65 7,03 5,50 5,52
5,45 3,64 1,78 13,52 8,16 6,38 6,41
142
6. „Freie“ Elektronen im Festkörper
bei üblichen Temperaturen immer sehr groß gegen k T ist. Um dieses noch augenfälliger zu machen, kann man eine Fermi-Temperatur TF EF0 =k definieren. Sie liegt etwa zwei Größenordnungen über der Schmelztemperatur der Metalle. Eine interessante Folge des Pauli-Prinzips ist es, dass das Fermi-Gas im Gegensatz zum klassischen Gas bei T = 0 K eine nichtverschwindende innere Energie besitzt. Die innere Energiedichte U eines Systems ist bekanntlich der Mittelwert über alle Zustände. Wir erhalten also bei T = 0 K EF0
U
D
EE dE 0
3
6:17 nEF0 : 5 Wie wir gesehen hatten, liegt dieser Wert um viele Größenordnungen über der inneren Energie eines klassischen Gases bei 300 K. Für die Behandlung der Leitungselektronen in einem Metall genügt es also häufig, die Beschreibung bei T = 0 K (Abb. 6.5) heranzuziehen.
6.3 Fermi-Statistik Wir wollen nunmehr das Fermi-Gas bei endlicher Temperatur betrachten. Wir müssen dazu die Verteilungsfunktion bzw. Besetzungswahrscheinlichkeit f (E, T) für endliche Temperaturen ableiten. Dies ist ein Problem der Thermodynamik, denn wir fragen ja nach einer Verteilung, die sich einstellt, wenn verschiedene quantenmechanische Zustände miteinander im Gleichgewicht stehen. Zur Herleitung der Verteilung f (E, T) müssen wir deshalb auf thermodynamische Begriffsbildungen zurückgreifen. Wir betrachten dazu ein atomares System mit Einteilchenenergieniveaus Ej. Die Energieterme Ej sollen wie im Festkörper sehr dicht liegen. Wir können uns dann viele Ej zusammengefaßt denken zu neuen „Energietermen“ Ei. Deren Entartungsgrad sei gi und ihre Besetzungszahl ni, wobei gi und ni große Zahlen sind. Wegen der Gültigkeit des Pauli-Prinzips muss dabei ni 5 gi sein. Aus der Thermodynamik kennen wir die Bedingung, die das System erfüllen muss, wenn alle Energieniveaus miteinander im Gleichgewicht sein sollen. Es muss nämlich die freie Energie F des Gesamtsystems stationär sein gegenüber einer Variation der Besetzungszahlen der Niveaus untereinander. Es muss also gelten dF
X @F i
@ni
dni 0
6:18
6.3 Fermi-Statistik
mit der Nebenbedingung der Teilchenzahlerhaltung X dni 0 :
143
6:19
i
Betrachten wir speziell den Austausch von Elektronen zwischen zwei beliebigen Niveaus k und l, so lauten die Gleichgewichtsbedingungen @F @F dnk dnl 0 ; @nk @nl
6:20
dnk dnl 0 :
6:21
Daraus folgt sofort, dass die Ableitungen der freien Energie nach den Besetzungszahlen gleich sein müssen @F @F : @nk @nl
6:22
Da die zwei Niveaus beliebig waren, sind im Gleichgewichtsfall die @F=@ni also alle gleich und wir führen dafür eine neue Konstante l ein, die das chemische Potential der Elektronen definiert. Wir wollen nun die freie Energie des Elektronensystems wirklich berechnen. Aus der Thermodynamik entnehmen wir FU
6:23
TS
mit der inneren Energie U X U ni Ei
6:24
i
und der Entropie S. Diese ist gleich S k ln P ;
6:25
wobei P die Zahl der Möglichkeiten darstellt, die Elektronen auf die Zustände zu verteilen. Die Zahl der Möglichkeiten, ein Elektron auf Ei unterzubringen, ist gi, ein zweites Elektron ebenfalls auf Ei unterzubringen, gi –1 usw. Es gäbe also gi
gi
1
gi
2 . . .
gi
ni 1
gi !
gi ni !
6:26
Möglichkeiten, ni Elektronen auf festen Plätzen auf dem Energieniveau Ei unterzubringen. Anordnungen, die sich nur durch Vertauschung von Elektronen auf einem Energieniveau ergeben, sind allerdings nicht unterscheidbar. Da es dafür ni ! Möglichkeiten gibt, erhalten wir für die Zahl der Möglichkeiten, ni Elektronen unterscheidbar auf dem Niveau Ei unterzubringen gi ! : ni !
gi ni !
6:27
144
6. „Freie“ Elektronen im Festkörper
Die Zahl der Realisierungsmöglichkeiten P für das gesamte System ist dann das Produkt aller Möglichkeiten, die sich für die Besetzung eines Niveaus ergaben: Y gi ! P :
6:28 !
g ni ! n i i i Damit wird die Entropie X ln gi ! ln ni ! ln
gi S k
ni ! ;
6:29
i
wobei wir die Fakultäten durch Verwendung der Stirlingschen Näherungsformel ln n! n ln n
n
fur groûe n
6:30
ersetzen können. Damit lässt sich nun die Ableitung der freien Energie F nach der Teilchenzahl in einem beliebigen Niveau i, also das chemische Potential, leicht berechnen l
@F ni Ei k T ln : gi ni @ni
6:31
Für die Besetzungszahlen erhalten wir nach ni aufgelöst: ni gi
e
k
Ei l= T
1
1
:
6:32
Die Wahrscheinlichkeit, dass ein quantenmechanischer Zustand (auch entartete Zustände werden als verschieden betrachtet) besetzt ist, und damit unsere Verteilungsfunktion f (E, T) ist also (Abb. 6.6): 1
:
6:33
E l=k T e 1 Diese Verteilungsfunktion heißt auch Fermi-Verteilung. Sie ist die Gleichgewichtsverteilung für Teilchen, wenn nicht mehr als ein
f
E; T
Abb. 6.6. Fermi-Verteilungsfunktion für verschiedene Temperaturen. Als Entartungstemperatur TF = E 0F/k ist 5·104 K gewählt. Die Wendetangente an die Verteilung (–··–) schneidet bei jeder Temperatur die Energieachse bei 2 k T oberhalb von E 0F
6.4 Spezifische Wärme der Metallelektronen
145
Teilchen auf jeden Zustand gesetzt werden kann. Bei Elektronen, also Fermionen mit Spin 1/2, wird dies gerade durch das PauliPrinzip garantiert. Trotzdem wäre es falsch zu sagen, die FermiVerteilung gelte nur für Teilchen mit Spin 1/2, sie gilt genauso für die Verteilung von Atomen oder Molekülen auf feste, vorgegebene Plätze, wenn immer gerade nur ein Atom oder Molekül auf einen solchen Platz passt. Entsprechende Fragestellungen ergeben sich bei der Thermodynamik von Fehlstellen, bei der Löslichkeit von Gasen in Festkörpern und Adsorptionsvorgängen. Die Bedeutung des chemischen Potentials l in der Fermi-Verteilung ist am Grenzfall T = 0 K besonders einfach zu sehen. Hier wird die Fermi-Verteilung nämlich gerade zu der schon diskutierten Stufenfunktion, die den Wert 1 für E < l, und den Wert 0 für E > l hat. Bei T = 0 K ist also das chemische Potential der Elektronen gleich der Fermi-Energie l
T 0 K EF0 :
6:34
Wegen dieser Gleichheit spricht man statt vom chemischen Potential auch vom „Fermi-Niveau“ und verwendet auch das Symbol EF , das dann aber eine temperaturabhängige Größe ist! Für höhere Temperaturen weicht die scharfe Fermi-Kante der Verteilung auf; Zustände unterhalb von EF werden mit einer gewissen Wahrscheinlichkeit nicht besetzt, während Zustände kurz oberhalb von EF eine endliche Besetzungswahrscheinlichkeit bekommen (Abb. 6.6). Die Größe der „Aufweichungszone“ ist dabei von der Größenordnung 2 k T nach jeder Seite, wie die Tangente an f (E, T) bei EF zeigt. Bei einer Erhöhung der Temperatur kann also nur ein ganz geringer Bruchteil der Elektronen Energie aufnehmen. Das hat erhebliche Folgen, z. B. für die spezifische Wärme des Elektronengases (Abschn. 6.4). Will man die Besetzungswahrscheinlichkeit f (E, T) für Energiebzw. Temperaturbereiche EF – E 2 k T oder E–EF 2 k T angeben, so können Näherungen der Fermi-Funktion (6.33) benutzt werden. Die Bedingung E–EF 2 k T ist z. B. für die Leitungselektronen in Halbleitern häufig erfüllt (s. Abschn. 12.2). Für Energien E weit oberhalb der Fermi-Kante kann dann die Fermi-Funktion f (E, T) durch die klassische Boltzmann-Besetzungswahrscheinlichkeit [f (E, T) * exp (EF – E)/ k T, s. (12.5)] angenähert werden.
6.4 Spezifische Wärme der Metallelektronen Die Anwendung des Potentialtopfmodells auf die Leitungselektronen gestattet eine sehr einfache Beschreibung der spezifischen Wärme cV dieser Metallelektronen. Hierbei handelt es sich um ein altes Problem, das vor der Entwicklung der Quantenmechanik nicht lösbar schien. Bei einer Leitungselektronendichte von typischerweise n = 1022 cm–3 hätte man zusätzlich zur Gitterwärme
146
6. „Freie“ Elektronen im Festkörper
Abb. 6.7. Erklärung zur spezifischen Wärme der quasifreien Metallelektronen. Die Wirkung einer Temperaturerhöhung von 0 K auf T kann dadurch veranschaulicht werden, dass die Elektronen aus einem Energiebereich der Größenordnung 2 k T unterhalb der Fermi-Energie EF auf einen Bereich von ungefähr 2 k T oberhalb von EF angehoben werden. Die Wendetangente (– – –) schneidet die Energieachse bei EF+2 k T
klassisch nach dem Gleichverteilungssatz zumindest für höhere Temperaturen einen Elektronenbeitrag von c = 3 nk/2 erwartet. Experimentell wurde aber bei Metallen keine Abweichung vom Dulong-Petitschen Wert gefunden. Der Grund ist einfach, dass Elektronen im Gegensatz zu einem klassischen Gas nur dann Energie aufnehmen können, wenn sie energetisch in ihrer Nachbarschaft freie Zustände finden. Der Bruchteil dieser Elektronen, bezogen auf die gesamte Dichte n, ist aber nur von der Größenordnung 1/ 100, wie folgende, einfache Abschätzung zeigt: Die „Aufweichungszone“ der Fermi-Funktion ist von der Größenordnung 4 k T, d. h. nach Abb. 6.7 kann also wegen der Gültigkeit des Pauli-Prinzips nur ein Bruchteil der Größenordnung 4 k T/EF aller „freien“ Elektronen (Dichte n ) thermische Energie aufnehmen. Die Energie pro Elektron ist etwa k T. Die Gesamtenergie dieser Elektronen ist deshalb von der Größenordnung U 4
k T2 n=EF :
6:35
Mit TF = EF/k als Fermi-Temperatur folgt größenordnungsmäßig für die spezifische Wärme der Elektronen cV @U=@T 8 k nT=TF :
6:36
Nach Tabelle 6.1 sind die Fermi-Temperaturen TF typischerweise in der Größenordnung von 105 K, womit sich wegen des Faktors T/TF der verschwindend geringe Beitrag der Leitungselektronen zur spezifischen Wärme erklärt. Die exakte Rechnung zur Ermittlung der spezifischen Wärme des Gases freier Elektronen verläuft wie folgt: Beim Aufheizen eines Fermi-Gases von 0 K auf die Temperatur T wird die innere Energie (pro Volumen) um folgenden Betrag U erhöht:
6.4 Spezifische Wärme der Metallelektronen E
F0
1
U
T
147
dE ED
E f
E; T
dE ED
E :
6:37
0
0
Weiterhin gilt mit n als Gesamtkonzentration der freien Elektronen: 1
EF n E F
dE D
E f
E; T :
6:38
Differenzieren von (6.37) und (6.38) ergibt: 1
cV @U=@T E D
E
@f =@TdE ;
6:39
0
0 1
0 EF
@n=@T
EF D
E
@f =@TdE :
6:40
0
Damit folgt durch Subtraktion von (6.40) und (6.39) für die spezifische Wärme cV der Elektronen 1
cV @U=@T
dE
E
EF D
E
@f =@T :
6:41
0
Die Ableitung @f =@T (Abb. 6.7) hat merkliche Werte nur in der „Aufweichzone“, d. h. ±2 k T um EF herum. In diesem Bereich ändert sich D (E) nicht allzusehr und darf deshalb durch D (EF) angenähert werden, d. h. 1
cV D
EF dE
E EF
@f =@T :
6:42 0
Hierbei gilt exp
E EF =k T @f E EF : 2 @T k T fexp
E EF =k T 1g2 Mit der Abkürzung x
E cV k TD
EF
6:43
EF =k T folgt
1
dx x2 exp x
exp x 1
2
2
:
6:44
k
EF = T
Da der Faktor exp x im Integranden für x 5 –EF/k T vernachlässigt werden kann, wird die untere Integrationsgrenze bis ins negativ Unendliche gezogen, denn das Integral
148
6. „Freie“ Elektronen im Festkörper
1
dx x2 exp x
exp x 1
2
p2 =3
6:45
1
ist aus einschlägigen Formeltabellen bekannt. Es folgt allgemein für die spezifische Wärme der „freien“ Metallelektronen: p2 D
EF k 2 T :
6:46 3 In der Ableitung von (6.46) wurde an keiner Stelle die explizite Form der Zustandsdichte D (E) benutzt. Gleichung (6.46) gilt deshalb auch für den Fall, dass die Zustandsdichte, wie im allgemeinen zu erwarten, von der des „freien“ Elektronengases abweicht. Die Messung der elektronischen spezifischen Wärme wird deshalb bei Metallen dazu benutzt, die Zustandsdichte D (EF) am Fermi-Niveau zu bestimmen. Im Modell des „freien“ Elektronengases lässt sich D (EF) sehr einfach durch die Elektronenkonzentration ausdrücken. Wegen der bei Metallen gültigen Näherung TTF gilt cV
E
F
n
D
EdE :
6:47
0
Hierbei lässt sich die Zustandsdichte schreiben D
E D
EF
E=EF 1=2 :
6:48
Damit folgt
Abb. 6.8. Auftragung der auf die Temperatur bezogenen spezifischen Wärme c über dem Quadrat der Temperatur T für Kupfer. Die Messpunkte stammen aus zwei verschiedenen Messungen. (Nach Bailey u. Smith [6.3])
c/T (10–4 J Mol–1 K–2)
2 n D
EF EF ; 3 sowie aus (6.46)
6:49
6.5 Elektrostatische Abschirmung in einem Fermi-Gas – Mott-Übergang
149
Abb. 6.9. Qualitativer Verlauf der Zustandsdichte D (E) für das Leitungsband eines Übergangsmetalles. Dem s-Band (teilweise gestrichelt) ist in der Nähe des Fermi-Niveaus der starke Beitrag der d-Elektronen überlagert
cV
k T p2 p2 T nk nk : EF 2 2 TF
6:50
Die exakte Rechnung liefert im Vergleich zur groben Abschätzung (6.36) also nur den Faktor p 2/2 statt 8. Die hier abgeleitete lineare Abhängigkeit der elektronischen spezifischen Wärme von der Temperatur wird experimentell sehr gut bestätigt. Für niedrige Temperaturen, wo der zusätzlich vorhandene Phononenbeitrag zu cV die Debyesche T 3-Abhängigkeit zeigt, erwartet man im Experiment cV cT bT 3 ;
c; b const:
6:51
Die Messergebnisse in Abb. 6.8 liefern die aus (6.51) folgende lineare Abhängigkeit bei einer Auftragung von cV /T gegen T 2. Zumindest für die Hauptgruppenmetalle stimmen die experimentell gefundenen c Werte mit den aus dem Elektronengas-Modell berechneten leidlich überein, wie Tabelle 6.2 zeigt: Die starken Abweichungen bei Fe, Co und Ni sind darauf zurückzuführen, dass bei diesen Übergangsmetallen die d-Schale nur teilweise aufgefüllt ist, d. h., dass das entsprechende d-Band am Fermi-Niveau liegt. Wegen der stärkeren Lokalisierung der d-Elektronen an den Atomen ist der Überlapp zwischen den w-Funktionen gering und damit das entsprechende Band relativ scharf. Diese d-Elektronen liefern also einen hohen Beitrag zur Zustandsdichte, wie Abb. 6.9 zeigt.
6.5 Elektrostatische Abschirmung in einem Fermi-Gas – Mott-Übergang Bringt man in ein Metall eine elektrische Ladung, z. B. durch Einbau einer geladenen Störstelle, so tritt in deren Nähe eine Störung
Tabelle 6.2. Vergleich experimentell ermittelter mit aus dem Modell des „freien“ Elektronengases errechneten Koeffizienten c der elektronischen spezifischen Wärme. Bei tiefen Temperaturen gilt cV = cS+bS 3 für den elektronischen (!T ) und atomdynamischen (!T 3) Anteil der spezifischen Wärme cexp./ Metall cexp. 10 3 MolJ K2 ctheoret. Li Na K Cu Ag Al Fe Co Ni
1,7 1,7 2,0 0,69 0,66 1,35 4,98 4,98 7,02
2,3 1,5 1,1 1,37 1,02 1,6 10,0 10,3 15,3
150
6. „Freie“ Elektronen im Festkörper
der sonst homogenen Elektronenkonzentration auf, die das elektrische Feld dieser Ladung kompensiert bzw. abschirmt. Dieses Problem lässt sich näherungsweise auch im Modell des quasifreien Elektronengases im Potentialtopf behandeln: Ein lokales Störpotential d U (es wird je d Uj EF angenommen) hebt lokal die Zustandsdichteparabel D (E) um e d U an (Abb. 6.10). Betrachtet man den Augenblick des Einschaltens dieses Störpotentials, so müssen unmittelbar danach Elektronen in die Umgebung dieser Störung abfließen, damit das Fermi-Niveau als thermodynamische Zustandsgröße (elektrochemisches Potential) im ganzen Kristall den gleichen Wert hat. Für nicht zu große d U ist die Änderung der Elektronenkonzentration durch die Dichte am Fermi-Niveau D (EF) gegeben (analog zur spezifischen Wärme): dn
r D
EF jejdU
r :
6:52
Nimmt man an, dass außer in der unmittelbaren Umgebung der Störladung d U (r) im wesentlichen durch die entstandene Raumladung verursacht wird, so ist d n (r) mit d U über die Poisson-Gleichung verknüpft: D
2
dU
dR e e2 dn D
EF dU : e0 e0 e0
6:53
Mit k2 = e 2 D (EF)/e0 hat diese Differentialgleichung für das Abschirmpotential dU eine nichttriviale Lösung in Kugelkoordinaten 1 @ 2 @ 2 : 2 r r @r @r D
dU
r e
kr
=r :
6:54
Kugelkoordinaten bieten sich zur Lösung an, wenn man an punktförmige Störungen denkt; für eine Punktladung e wäre dann auch e=
4pe0 , da für k ? 0 der Abschirmeffekt verschwände und sich das Potential dieser Punktladung ergeben muss. rTF = 1/k heißt Thomas-Fermi-Abschirmlänge:
Abb. 6.10. Einfluss eines lokalen Störpotentials d U auf das Fermi-Gas der „freien“ Elektronen: Unmittelbar nach Einschalten der Störung müssen d n Elektronen abfließen, damit das Fermi-Niveau EF im gesamten Festkörper im thermischen Gleichgewicht homogen ist
6.5 Elektrostatische Abschirmung in einem Fermi-Gas – Mott-Übergang
rTF e2 D
EF =e0
1=2
:
151
6:55
Speziell für das Modell des freien Elektronengases gilt nach (6.49) und (6.16) 3 D
EF n=EF 2 d. h.
und EF
h2
3 p2 n2=3 ; 2m
1 2m
3 p2 n1=3 :
6:56 2 2 2p h Damit folgt für die Thomas-Fermi-Abschirmlänge im Potentialtopfmodell:
D
EF
1=3 1 me2 4 2 2 1=3 2 1=3 n
3 p k
3 p n ; 2 a0 p rTF p2 h2 e0
1 n1=6 ' 2 1=2 rTF a0
n oder rTF ' 0;5 3 a0
6:57
1=6
;
6:58
wo a0 4 p h2 e0 =
m e2 der Bohrsche Radius ist. Beispielsweise ist für Kupfer mit einer Elektronenkonzentration ˚. von n = 8,5´1022 cm–3 die Abschirmlänge rTF = 0,55 A Die hier beschriebene starke Abschirmung z. B. eines CoulombPotentials (Abb. 6.11) ist dafür verantwortlich, dass in einem Metall die energetisch höchsten Valenzelektronen nicht lokalisiert sind. Diese Elektronen können nicht mehr im Feld der Rumpfpotentiale gehalten werden. Mit abnehmender Elektronendichte wird die Abschirmlänge rTF immer größer. Man kann sich auf diese Weise auch einen scharfen Übergang zwischen metallischen und Isolator- bzw. Halbleitereigenschaften veranschaulichen, den sog. Mott-Übergang [6.4]. Oberhalb einer kritischen Elektronenkonzentration nc wird die Abschirmlänge rTF so klein, dass Elektronen keinen gebundenen Zustand mehr einnehmen können: man hat metallisches Verhalten.
Abb. 6.11. Abgeschirmtes (—–) und nicht abgeschirmtes (–·–) Coulomb-Potential einer positiven Einheitsladung in einem Fermi-Gas freier Elektronen. Der Abstand r ist als Vielfaches der Thomas-Fermi-Abschirmlänge rTF ausgedrückt
152
6. „Freie“ Elektronen im Festkörper
Unterhalb dieser kritischen Elektronenkonzentration ist die Potentialmulde des abgeschirmten Feldes so weit, dass ein gebundener Elektronenzustand darin möglich ist. Das Elektron ist im wesentlichen in einer kovalenten oder ionogenen Bindung lokalisiert. Dieser lokalisierte Zustand ist gleichbedeutend mit isolatorischen Eigenschaften, wo die höchsten besetzten Orbitale lokalisierten Bindungen entsprechen. Für eine einfache Abschätzung, ab wo ein gebundener Zustand im abgeschirmten Potential möglich wird, nehmen wir an, dass die Abschirmlänge wesentlich größer als der Bohrsche Radius a0 sein muss, d. h., dass ein an ein positives Zentrum gebundenes Elektron noch Platz in der Potentialmulde findet 2 rTF '
1 a0 a20 ; 4 n1=3
6:59
4a0 :
6:60
d. h. n
1=3
Diese von Mott zum ersten Mal angegebene Abschätzung besagt also, dass der metallische Charakter eines Festkörpers zusammenbricht, wenn der mittlere Elektronenabstand n –1/3 wesentlich größer als etwa 4 Bohr-Radien wird. Man hat es dann also mit einem abrupten Übergang in den Isolatorcharakter zu tun. Man versucht heutzutage, bei Übergangsmetalloxiden, bei Gläsern und amorphen Halbleitern scharfe Leitfähigkeitssprünge auf die oben skizzierte Art zu erklären.
6.6 Glühemission aus Metallen Erhitzt man ein Metall, so treten Elektronen aus. Dieser Effekt der Glühemission wird bei allen Elektronenröhren benutzt. In der Schaltung nach Abb. 6.12 beobachtet man einen von der Kathodentemperatur T abhängigen Sättigungsstrom js in der StromSpannungscharakteristik (Abb. 6.12). Die Existenz des Effektes zeigt, dass die Annahme eines Potentialtopfes mit unendlich hohen Wänden zur Beschreibung der Metallelektronen zu einfach ist. Der Potentialkasten muss endlich hohe Wände haben. Die Energiedifferenz EVac–EF = U wird Austrittsarbeit genannt. Diese Austrittsarbeit muss ein Elektron überwinden, wenn es vom „Fermi-See“ im Metall bis zum Energieniveau des Vakuums EVac (weit entfernt von der Metallprobe) angehoben werden soll. Wenn das Elektron zusätzlich eine genügend große Impulskomponente senkrecht zur Oberfläche besitzt, kann es das Metall verlassen und trägt zum Sättigungsstrom js bei. Wir wollen den temperaturabhängigen Sättigungsstrom für das Modell des freien Elektronengases berechnen. Bei homogener Driftgeschwindigkeit v von Ladungsträgern ist die Stromdichte
6.6 Glühemission aus Metallen
153
Abb. 6.12. (a) Schema einer Diodenschaltung zur Beobachtung der Glühemission von Elektronen aus der geheizten Kathode K (Anode: A). (b) Qualitativer Verlauf der Strom-Spannungskennlinie für zwei verschiedene Temperaturen T1 und T2 > T1. Infolge ihrer thermischen Austrittsenergie können Elektronen schon eine Gegenspannung (A negativ gegen K) durchlaufen. Dieser Bereich der Kennlinie heißt Anlaufstrombereich
j = e n v, wenn n die Ladungsträgerkonzentration ist. (Das eigentlich erforderliche negative Vorzeichen lassen wir weg.) Wir können diesen Ausdruck verallgemeinern, wenn die Geschwindigkeit der Elektronen vom Wellenvektor k abhängt.
eX e jx v x
k v x
k dk :
6:61 V k
2p3 E>EF U v x
k>0
Hierbei wird berücksichtigt, dass die Dichte der Zustände im kRaum V/ (2 p)3 ist. Die Summe wie das Integral erstreckt sich dabei nur über besetzte Zustände gemäß der Fermi-Statistik. Wir können diese Bedingung dadurch einbringen, indem wir mit der Besetzungswahrscheinlichkeit gemäß (6.33) multiplizieren. 1 1
2 e h jx dky dkz dkx kx f
E
k; T :
6:62
2 p3 m 1
kx min
Hier haben wir mv x h kx gesetzt und berücksichtigt, dass beim freien Elektronengas alle Zustände zweifach entartet sind. Da die Austrittsarbeit U groß gegen k T ist, können wir die Fermi-Statistik durch die Boltzmann-Statistik nähern. 1 1
e h h2 ky2 =2m k T h2 k2 =2m k T jx 3 dky e dkz e z 4p m 1
1
dkx kx e
1
k
k
h2 kx2 =2m T EF = T
e
:
6:63
kx min
Die Integrale sind also faktorisiert und können elementar ausgewertet werden. Bei dem letzten Integral müssen wir noch berück-
154
6. „Freie“ Elektronen im Festkörper
sichtigen, dass die kinetische Energie in +x-Richtung größer sein muss als EF+U. 1 1
1 2 h2 kx2 =2m k T EF =k T h2 kx2 =2m k T EF =k T dk e dkx kx e e e 2 x
EF U2m= h
kx min
m kT
k
U= T
e :
6:64 h2 Damit folgt die sog. Richardson-Dushman-Formel für die Sättigungsstromdichte: 4pme U=k T
k T2 e :
6:65 h3 Der universelle Faktor 4 p m e k 2 =h3 hat den Wert 120 A/(K2 cm2). Bei der Herleitung haben wir vereinfachend vorausgesetzt, dass Elektronen, die mit einer Energie h2 kx2 =2m5EF U auf die Oberfläche treffen, eine 100%ige Wahrscheinlichkeit haben, das Material zu verlassen. Diese Annahme ist auch im Modell des freien Elektronengases nicht korrekt. Die bekannte quantenmechanische Betrachtung der Reflexion und Transmission von Elektronen an einer Potentialschwelle lehrt uns, dass Elektronen, die genau die Schwellenenergie haben, eine Transmissionswahrscheinlichkeit von Null besitzen. Berücksichtigt man die Transmission für eine Schwelle, so erhält man q einen zusätzlichen Faktor von p k T=
EF U, welcher die Sättigungsstromdichte deutlich reduziert. Die Richardson-Dushman-Formel kann auch auf den ballistischen Transport von Ladungsträgern in Halbleiter-Vielschichtstrukturen angewandt werden (vgl. Kap. 12.7). Speziell bei der Glühemission muss noch die Abhängigkeit der Austrittsarbeit vom äußeren Feld E berücksichtigt werden. Eine js
Abb. 6.13. Schema zur Glühemission von freien Elektronen (Dichte n ) aus einem Metall: Ein Elektron aus dem Potentialtopf muss die Austrittsarbeit } = EVac–EF überwinden, um ins Vakuum (Energieniveau des Vakuums EVac) angeregt zu werden. Als wesentlicher Anteil der Austrittsarbeit ist das Coulomb-Potential zwischen ausgetretenem Elektron und dazugehöriger positiver Bildladung im Metall angenommen (Bildkraftpotential – · –). Liegt ein äußeres elektrisches Feld an, so wird } um den Betrag D } erniedrigt. Erniedrigungen der Austrittsarbeit von der dargestellten Größenordnung von 1 eV werden nur in extrem hohen äußeren Feldstärken von 107–108 V/cm erreicht
6.6 Glühemission aus Metallen
155
entsprechende Korrektur verlangt statt der Materialkonstanten U im Exponenten die feldabhängige Größe s e3 E U0 U U DU :
6:66 4 p e0 Der Korrekturterm DU kann leicht abgeleitet werden, wenn man als wesentlichen Anteil in der Austrittsarbeit die Coulomb-Bildkraft des vor der Metalloberfläche befindlichen Elektrons und die Erniedrigung der Potentialschwelle durch die Wirkung des äußeren Feldes berücksichtigt. Dies ist anschaulich durch Überlagerung des außen angelegten Potentials E x und des Bildkraftpotentials (strichpunktiert) in Abb. 6.13 dargestellt. Man kann die Richardson-Dushman-Formel in dieser erweiterten Form zur Bestimmung der Austrittsarbeiten aus Metallen benutzen. Dazu muss man zuerst die Emissionssättigungsströme js 0 bei E = 0 durch Extrapolation der bei endlichem äußerem Feld E gemessenen Ströme js bestimmen. Eine halblogarithmische Auftragung von js 0 /T 2 gegen 1/T liefert die Austrittsarbeit. Austrittsarbeiten der Elemente in polykristalliner Form sind in Tabelle 6.3 angegeben. Es sei noch bemerkt, dass die Austrittsarbeit natürlich sehr stark von der kristallografischen Ebene eines Einkristalles, von Verunreinigungen u. ä. abhängen kann.
Tabelle 6.3. Austrittsarbeiten der Elemente in eV (polykristalline Proben, nach Michaelson [6.5]) Li Be 2,9 4,98
B C 4,45 5,0
Na Mg 2,75 3,66
Al Si P 4,28 4,85 –
S –
K Ca Sc Ti V Cr Mn Fe Co Ni Cu Zn Ga Ge As Se 2,30 2,87 3,5 4,33 4,3 4,5 4,1 4,5 5,0 5,15 4,65 4,33 4,2 5,0 3,75 5,9 Rb Sr Y Zr Nb Mo Tc 2,16 2,59 3,1 4,05 4,3 4,6 –
Ru Rh Pd Ag Cd In Sn Sb Te 4,71 4,98 5,12 4,26 4,22 4,12 4,42 4,55 4,95
Cs Ba La Hf Ta W Re Os Ir Pt Au Hg Tl Pb Bi Po 2,14 2,7 3,5 3,9 4,25 4,55 4,96 4,83 5,27 5,65 5,1 4,49 3,84 4,25 4,22 –
Übungen zu Kapitel 6
6.1 (a) Man berechne die Zustandsdichte eines zweidimensionalen Gases freier Elektronen in einem sog. Quantentopf! Die Randbedingungen für die elektronischen Wellenfunktionen sind w (x, y, z) = 0 für |x| > a, wo a atomare Dimensionen hat. (b) Man berechne die Zustandsdichte eines eindimensionalen Gases freier Elektronen in einem sog. Quantendraht mit den Randbedingungen: w (x, y, z) = 0 für jxj > a und jyj > b, wo a und b atomare Dimensionen haben! (c) Sind solche Elektronengase physikalisch realisierbar? 6.2 Man berechne in niedrigster Ordnung die Temperaturabhängigkeit des chemischen Potentials eines Gases freier Elektronen von konstanter Dichte. Hinweis: Man gebe einen Ausdruck für die Elektronendichte bei endlicher Temperatur an. Hierbei ergibt sich ein Integral der Form 1
F
x 0
p y dy ; 1 ey x
welches sich für x ³ 1,5 gut durch F (x) % p2 2=3x3=2 1 2 annähern lässt. 8x 6.3 Der Kompressionsmodul j ist als zweite Ableitung der Gesamtenergie Etot nach dem Volumen gegeben: j = V –1 @ 2 Etot /@ V 2. Man schätze den Kompressionsmodul von Alkalimetallen ab, indem man als Gesamtenergie die kinetische Energie des entsprechenden Fermi-Gases der freien Elektronen annimmt! Welche Vernachlässigungen werden dabei gemacht?
6.4 Bei welcher Temperatur T0 wird die spezifische Wärme der freien Elektronen größer als die spezifische Wärme der Gitterschwingungen? Man drücke diese Temperatur durch die Debye-Temperatur H und die Elektronenkonzentration aus! Man berechne T0 für Kupfer! 6.5 Benzol (C6H6) hat im ultravioletten Spektralbereich charakteristische Absorptionsbanden bei 180, 200 und 256 nm, die durch p-pÜbergänge des Kohlenstoff-Ringskeletts erklärt werden. Die besetzten p-Orbitale stellen sich im LCAO-Bild wie folgt dar: 1. p-Orbital: gleiches Vorzeichen der wFunktion entlang des C-Rings; 2. p-Orbital: eine Knotenlinie durch zwei gegenüberliegende C–C-Bindungen; 3. p-Orbital: eine Knotenlinie durch zwei gegenüberliegende C-Atome. Aus der gleichartigen Bindungslänge der C˚ ) kann man schließen, dass Atome (& 1,39 A die sechs p-Elektronen nicht in bestimmten Bindungen lokalisiert sind, sondern dass sie ein quasi-freies, eindimensionales ringförmiges Elektronengas bilden. Unter dieser vereinfachenden Annahme eines ringförmigen, eindimensionalen Elektronengases (periodische Randbedingung), bestehend aus 6 Elektronen, berechne man die möglichen Energieeigenwerte En dieses p-Systems! (a) Man fülle die Zustände sukzessive mit 6 Elektronen auf und ermittle die optische Absorption als Übergang zwischen dem energetisch höchsten besetzten und dem tiefsten unbesetzten Zustand! Man vergleiche mit den experimentellen Absorptionsbanden!
Übungen zu Kapitel 6
(b) Man zeichne schematisch die Wellenfunktionen der freien Elektronen in den p-Orbitalen und ordne sie den LCAO-Orbitalen zu! (c) Man diskutiere Gründe für die Abweichung der errechneten optischen Absorption von den experimentellen Werten!
(b)
6.6 Ein Plasma freier Elektronen fülle den Halbraum (z < 0) bis zur Oberfläche bei z = 0, wo es von Vakuum (z > 0) begrenzt ist. Man zeige, dass die Oberflächenwelle y y0 exp
kjzj exp i
kx
xt
eine Lösung der Laplace-Gleichung D} = 0 ist und dass die Maxwell-Randbedingungen für die Felder E und D an der Oberfläche mit der Bedingung e (xsp) = –1 erfüllt werden können! xsp ist hierbei die Frequenz einer Oberflächenplasmawelle. Man benutze die dielektrische Funktion e (x) eines ungedämpften Plasmas freier Elektronen und leite eine Beziehung zwischen den Frequenzen xp und xsp der Volumen- und Oberflächenplasmonen ab! 6.7 In „normalen“ Hauptreihensternen, wie der Sonne, herrscht ein Gleichgewicht zwischen dem Gravitationsdruck und dem Strahlungsdruck durch Kernfusion im Innern. Wenn bei Fortschreiten der Kernfusion aus Mangel an Fusionsbrennstoff nicht mehr genügend Energie im Innern bereitgestellt werden kann, geht der Stern in einen neuen Gleichgewichtszustand über. Er verliert Masse und kontrahiert aufgrund der Gravitation zu einem weißen Zwerg. Bei der Kontraktion wird viel Wärme erzeugt, was zu einer Desintegration der Atome und damit zu einem Plasma aus freien Elektronen und positiven Wasserstoff- und Helium-Kernen führt. Ein weißer Zwerg stabilisiert sich durch das Gleichgewicht zwischen dem Gravitationsdruck der ionisierten Kerne und dem Fermi-Druck des Elektronengases. (a) Man berechne für den nicht-relativistischen Fall (Elektronengeschwindigkeit v c ) die mittlere Energie pro Elektron
(c)
(d)
(e)
(f)
(g)
157
und den Druck des Elektronenplasmas p als Funktion der Elektronendichte n ! Man ermittle aus dem Gleichgewicht von Fermi- und Gravitationsdruck für den nicht-relativistischen Fall das Massenspektrum M (R) mit R als Massendichte von möglichen Weißen Zwergen! Hinweis: Wie sich leicht überlegen lässt, ist die Gravitationsenergie proportional zu G M 2/R mit G als Gravitationskonstante. Da die Dichteverteilung in einem Stern aber sehr inhomogen ist, benutze man für den Gravitationsdruck im Zentrum des Sterns die bessere Näherung: pGR (R = 0) % 2–1/3 G M 2/3 R 4/3. Man untersuche, ob Weiße Zwerge, für die die in (b) berechnete Massen-Dichte-Beziehung gilt, stabil sind? Man trage die Gesamtenergie bei fester Masse und Teilchenzahl gegen den Radius auf. Für welche Massen ist der Weiße Zwerg stabil? Mit abnehmendem Radius nimmt die Fermi-Geschwindigkeit der Elektronen zu. Man berechne für den relativistischen Fall (v % c) die mittlere Energie pro Elektron und den Druck des Elektronenplasmas als Funktion der Elektronendichte! Hinweis: Wenn die kinetische Energie deutlich größer als die Ruhemasse wird, gilt E % pc = h k c. Man berechne für den relativistischen Fall analog zu (b) das Gleichgewicht zwischen Fermi-Druck und Gravitationsdruck und bestimme eine Masse Mkrit , bei der dies möglich ist! Wie verhält sich Mkrit zur Sonnenmasse Ms = 2´1030 kg? Man beschreibe explizit, was mit Sternen geschieht, die Massen M > Mkrit, M = Mkrit und M < Mkrit besitzen! Man trage für die drei Fälle die Gesamtenergie bei fester Masse und Teilchenzahl als Funktion des Radius’ auf! Man berechne die Elektronendichte nc, für die die nicht-relativistische Näherung in die relativistische übergeht! Dies lässt sich in guter Näherung durch Gleichsetzung der relativistischen und nichtrelativistischen Elektronenimpulse an der Fermi-Kante erreichen:
158
Übungen zu Kapitel 6
non-rel prel
nc : F
nc pF
Man vergleiche den mittleren Abstand der Elektronen bei dieser Dichte mit ihrer Compton-Wellenlänge kc =h /mc! Welcher Sternmasse entspricht diese Dichte als Vielfaches der Sonnenmasse Ms? Bemerkung: Realistische Rechnungen ergeben als Obergrenze für die Masse Weißer Zwerge Mkrit % 1,4 Ms. Diese Obergrenze heißt nach dem indisch-amerikanischen Astrophysiker Subrahmanyon Chandrasekhar die Chandrasekhar-Grenze (Nobelpreis 1984).
6.8 Wenn der Gravitationskollaps eines „ausgebrannten“ Sterns zu noch höheren Temperaturen im Innern führt, finden inverse b-Zerfallsprozesse (e+p ? n) statt, die Neutronen (n) erzeugen. Im Endstadium besteht ein solcher Stern nur noch aus Neutronen (Masse MN). Diese bilden ein Fermi-Gas ähnlich dem Elektronenplasma im Weißen Zwerg. Man wende das in Übung 6.7 abgeleitete Stabilitätskriterium (Chandrasekhar-Grenze) auf das Neutronen-Fermi-Gas eines Neutronensterns an und schätze die kritische Masse Mkrit, die kritische Dichte Rkrit und den kritischen Radius Rkrit eines Neutronensterns ab (Vergleich mit Sonnendaten)!
7. Elektronische Bänder in Festkörpern
Trotz der Erfolge, die das Modell des freien Elektronengases in der Beschreibung von Kristallelektronen gebracht hat (s. Kap. 6), sind die Annahmen I) Einelektronennäherung, II) keine Wechselwirkung zwischen den Elektronen, III) Kastenpotential natürlich zu stark vereinfachend, als dass man annehmen könnte, dass mit Hilfe dieses Modells z. B. wesentliche elektronische und optische Eigenschaften von Halbleitern beschrieben werden könnten. Stellt man sich insbesondere, wie in Abschn. 1.1 kurz angedeutet, den Festkörper durch allmähliche Annäherung von anfangs freien Atomen entstanden vor, so sollte sich auch im Festkörper noch die diskrete Natur der Energieniveaus des einzelnen freien Atoms widerspiegeln. Diskret liegende Energieniveaus müssen z. B. vorhanden sein, um scharfe, resonanzartige Strukturen in optischen Spektren zu erklären. Dem trägt das Modell des freien Elektronengases keine Rechnung. Auch die Natur von Halbleitern und Isolatoren lässt sich in diesem Modell nicht verstehen. Wie in Kap. 1 kurz angedeutet, muss hierzu berücksichtigt werden, dass im Festkörper die elektronischen Zustände sogenannte Bänder bilden, die aus Zuständen des freien Atoms entstanden gedacht werden können. Wir werden im folgenden an der Einelektronennäherung (s. Kap. 6) festhalten, unser Modell des Festkörpers aber insoweit verbessern, als das Kastenpotential durch ein periodisches Potential der positiven Atomrümpfe ersetzt wird, wie es schematisch in Abb. 6.1 angedeutet ist. Da der interatomare Abstand in der Größenordnung von Ångström (10–8 cm) verschwindend klein ist gegen die makroskopischen Dimensionen des Festkörpers, werden wir in der formalen Beschreibung den Festkörper im allgemeinen als unendlich ausgedehnt ansehen können. Wieder liefert die Annahme strenger Periodizität wesentliche Vereinfachungen bei der Lösung des Problems. In der jetzt benutzten Näherung werden alle Abweichungen von der strengen Periodizität, seien sie statisch in Form von Gitterstörungen oder dynamisch in Form von Atomschwingungen, vernachlässigt. Wegen der Annahme des unendlich ausgedehnten Potentials werden auch Oberflächeneffekte aller Art vernachlässigt. Zu einem endlichen Kristall, d. h. einer endlichen Anzahl von Freiheitsgraden, die mit der unendlichen Periodizität verträglich ist, kommt man wieder mit Hilfe von periodischen Randbedingungen (s. Abschn. 5.1).
160
7. Elektronische Bänder in Festkörpern
7.1 Allgemeine Symmetrieeigenschaften Wir werden so zu dem Problem geführt, die stationäre Schrödinger-Gleichung für ein Elektron unter der Annahme zu lösen, dass das Potential V (r) periodisch ist: h2 2 H w
r r V
r w
r Ew
r ;
7:1 2m wo V
r V
r rn ; rn n1 a1 n2 a2 n3 a3 :
7:2
Wie in Abschn. 3.2 beschreibt rn einen beliebigen Translationsvektor im dreidimensionalen periodischen Gitter, d. h. rn ist zusammengesetzt aus Vielfachen (n1, n2, n3) der drei Basisvektoren a1, a2, a3 des Realgitters. Da das Potential V (r) gitterperiodisch ist, lässt es sich in eine Fourier-Reihe entwickeln: X VG eiGr :
7:3 V
r G
Hierbei muss analog zu den Betrachtungen im Abschn. 3.2 wegen der Gitterperiodizität von V (r) der Vektor G ein reziproker Gittervektor sein: G hg1 kg2 lg3 ; h; k; l ganzzahlig:
7:4
Im Eindimensionalen wird aus G, G = h 2 p/a. Der allgemeinste Ansatz für die aufzufindende Wellenfunktion w (r) in Form einer Entwicklung nach ebenen Wellen lautet: X Ck eik r :
7:5 w
r k
Hierbei ist k ein Punkt des reziproken Raumes, der mit den periodischen Randbedingungen verträglich ist (s. Abschn. 5.1 u. 6.1). Mit (7.3) und (7.5) folgt aus der Schrödinger-Gleichung (7.1): X h2 k2 X X 0 Ck0 VG ei
k G r E Ck eik r :
7:6 Ck eik r 2m k k k0 G Nach Umbenennung der Summationsindizes folgt: " # 2 2 X X h k E Ck eik r VG Ck G 0 : 2m G k
7:7
Da diese Bedingung für jeden Ortsvektor r gilt, muss für jedes k der Ausdruck in der Klammer, der nicht von r abhängt, verschwinden, d. h.
7.1 Allgemeine Symmetrieeigenschaften
2 2 h k 2m
X E Ck VG C k
G
0:
161
7:8
G
Dieser Satz von algebraischen Gleichungen, der nichts anderes als eine Darstellung der Schrödinger-Gleichung (7.1) im Wellenzahlraum ist, koppelt nur solche Entwicklungskoeffizienten Ck von w (r) (7.5), deren k-Vektoren sich um jeweils reziproke Gittervektoren G von diesem k unterscheiden, d. h. Ck koppelt mit Ck–G, Ck–G', C k–G'', . . . . Das ursprüngliche Problem zerfällt also in N (N: Zahl der Elementarzellen) Probleme, wobei jedes einem k-Vektor aus der Elementarzelle des reziproken Gitters zugeordnet ist. Jedes der N Gleichungssysteme liefert eine Lösung, die sich als Superposition von ebenen Wellen darstellen lässt, deren Wellenzahlvektoren k sich nur um reziproke Gittervektoren G unterscheiden. Die Eigenwerte E der Schrödinger-Gleichung (7.1) lassen sich also nach k indizieren. Ek = E (k) und die zu Ek zugehörige Wellenfunktion lautet: X wk
r Ck G ei
k G r
7:9 G
oder wk
r
X
Ck
Ge
i G r i k r
e
uk
r ei k r :
7:10 a
G
Hierbei ist die Funktion uk (r) als Fourier-Reihe über reziproke Gitterpunkte G eine gitterperiodische Funktion. Der Wellenzahlvektor k, dessen Komponenten bei periodischen Randbedingungen die Werte kx 0; 2 p=L; 4 p=L; . . . ; 2 p nx =L ky 0; 2 p=L; 4 p=L; . . . ; 2 p ny =L kz 0; 2 p=L; 4 p=L; . . . ; 2 p nz =L
7:10 b
(L: makroskopische Länge des Kristallwürfels) annehmen können (s. Abschn. 6.1), liefert die richtigen Quantenzahlen kx , ky , kz oder nx , ny , nz , nach denen sich Energie-Eigenwerte und Quantenzustände indizieren lassen; d. h. wir haben gezeigt, dass die Lösung der Einelektronen-Schrödinger-Gleichung mit periodischem Potential als eine modulierte ebene Welle wk
r uk
r ei k r
7:10 c
mit einem gitterperiodischen Modulationsfaktor uk
r uk
r rn
7:10 d
geschrieben werden kann. Diese Aussage heißt Blochsches Theorem und die durch (7.10 a–d) gegebenen Wellenfunktionen bezeichnet man als Bloch-Wellen oder Blochsche Zustände eines Elektrons (s. Abb. 7.1).
162
7. Elektronische Bänder in Festkörpern
Abb. 7.1. Beispiel der Konstruktion einer Bloch-Welle wk (r) = uk (r) ei k·r aus einer gitterperiodischen Funktion uk (r) mit p-artigem, bindenden Charakter und einer Welle
Die Forderung der strengen Periodizität für das Gitterpotential hat weitere Konsequenzen, die unmittelbar aus den Eigenschaften der Bloch-Zustände folgen. Aus der allgemeinen Darstellung einer Bloch-Welle (7.10 a) folgt durch Umbenennung der reziproken Gittervektoren G '' = G '–G: X 0 wkG
r CkG G0 e iG r ei
kG r G0
X 00
! Ck
G00
e
00
iG r
ei k r wk
r ;
7:11 a
G
d. h. wkG
r wk
r :
7:11 b
Bloch-Wellen, deren Wellenzahlen sich also um einen reziproken Gittervektor unterscheiden, sind gleich. Daraus folgt unter Anwendung der Schrödinger-Gleichung (7.1):
H
wk E
k wk
bzw. für das um G verschobene Problem:
7:12
7.2 Näherung des quasifreien Elektrons
H
wkG E
k GwkG
163
7:13
und wegen (7.11 b):
H
wk E
k Gwk :
7:14
Aus (7.12) und (7.14) folgt: E
k E
k G :
7:15 Die Eigenwerte E (k) sind also im Raum der Quantenzahlen k bzw. der Wellenzahlvektoren der Bloch-Wellen periodisch. Wie die Phononen also durch Angabe von q und x (q) im reziproken Raum mittels Dispersionsflächen beschrieben werden, lassen sich die Einelektronenzustände des periodischen Potentials durch Energieflächen E = E (k) im reziproken Raum der Wellenzahlen (Quantenzahlen) k als periodische Funktion darstellen. Die Gesamtheit dieser Energieflächen heißt „elektronisches Bänderschema “ des Kristalls. Da sowohl wk (r) als auch E (k) periodisch im reziproken Raum sind, genügt es, diese Funktionen für alle k in der ersten Brillouin-Zone (Abschn. 3.5) zu kennen. Durch periodische Fortsetzung lassen sich dann Aussagen über den ganzen k-Raum gewinnen.
7.2 Näherung des quasifreien Elektrons Besonders instruktiv für das allgemeine Konzept der elektronischen Bänder ist die Betrachtung des Grenzfalles eines verschwindend kleinen periodischen Potentials. Wir denken uns z. B. das periodische Potential von null her kommend langsam angeschaltet. Was passiert mit den Energiezuständen der freien Elektronen, die im Kastenpotential durch die „Energieparabel“ E = h 2 k 2/2 m beschrieben werden? Im Grenzfall, wo das Potential noch null ist, d. h. auch alle Fourier-Koeffizienten VG (7.3) verschwinden, soll aber noch die Symmetrie der Periodizität gefordert sein, da diese Forderung an das Problem schon bei dem kleinsten, nicht verschwindenden Potential entscheidend wird. Aus dieser allgemeinen Forderung der Periodizität ergibt sich dann unmittelbar wegen (7.15), dass die möglichen Einelektronenzustände nicht nur auf einer einzigen „Parabel“ im k-Raum zu finden sind, sondern auf allen um G gegeneinander verschobenen: h2 jk Gj2 :
7:16 2m Für den eindimensionalen Fall (G ? G = h 2 p/a) ist dies in Abb. 7.2 dargstellt. Da der E (k)-Verlauf im k-Raum periodisch ist, genügt auch eine Darstellung innerhalb der ersten Brillouin-Zone. Diese lässt sich leicht gewinnen durch Verschieben der entsprechenden Parabeläste um ein Vielfaches von G = 2 p/a. Man nennt dies
E
k E
k G
„Reduktion auf die 1. Brillouin-Zone“.
164
7. Elektronische Bänder in Festkörpern
Abb. 7.2. Im reziproken Raum periodisch fortgesetzte Energieparabel des freien Elektrons in einer Dimension. Das Periodizitätsintervall im Realraum ist a. Diese E (k)-Abhängigkeit ergibt sich für ein periodisches Gitter mit verschwindendem Gitterpotential („leeres“ Gitter)
Abb. 7.3. Bänderschema für das freie Elektronengas in einem kubisch primitiven Gitter (Gitterkonstante a), dargestellt als Schnitt längs kx innerhalb der ersten Brillouin-Zone. Das periodische Potential ist als verschwindend angenommen („leeres“ Gitter). Die verschieden dargestellten Äste rühren von Parabeln her, deren Ursprung im reziproken Raum mittels der Miller-Indizes h k l angegeben ist. (—–) 000, (– – –) 100, 1¯00, (– · –) 010, 01¯0, 001, 001¯, (· · ·) 110, 101, 11¯0, 101¯, 1¯10, 1¯01, 1¯1¯0, 1¯01¯
Im Dreidimensionalen wird das E (k)-Schema im Grenzfall des verschwindenden Potentials schon alleine dadurch komplizierter, dass nun in (7.16) G-Beiträge aus drei Koordinatenrichtungen auftreten. Für ein einfaches kubisches Gitter mit verschwindendem Potential ist der E (k)-Verlauf längs kx innerhalb der ersten Brillouin-Zone in Abb. 7.3 dargestellt. Der Effekt eines endlichen, wenn auch sehr kleinen Potentials lässt sich jetzt unmittelbar an den Abb. 7.2 u. 7.3 diskutieren: Beim eindimensionalen Problem der Abb. 7.2 liegt an den Grenzen der 1. Brillouin-Zone, d. h. bei +G/2 = p/a und –G/2 = –p/a eine Entartung der Energiewerte vor, die aus dem Schnittpunkt jeweils zweier Parabeln herrührt. Die Beschreibung des Zustandes eines Elektrons mit diesen k-Werten besteht zumindest in einer Superposition der beiden entsprechenden ebenen Wellen. Für verschwindendes Potential (nullte Näherung) sind diese Wellen eiG x=2
bzw:
ei
G=2
Gx
e
i G x=2
:
7:17
7.2 Näherung des quasifreien Elektrons
165
Gleichung (7.8) verlangt zwar, dass auch Wellen mit größeren GWerten als 2 p/a berücksichtigt werden müssen, aus der Darstellung (7.8) folgt jedoch bei Division durch [(h2 k2/2 m)]–E ], dass solche Ck besonders groß werden, für die sowohl Ek als auch Ek–G ungefähr gleich h 2 k 2/2 m und der Koeffizient Ck–G von ungefähr gleicher absoluter Größe wie Ck wird. Dies ist gerade der Fall für die beiden ebenen Wellen an den Zonenkanten (7.17), gegen die also in erster Näherung Beiträge, von anderen reziproken Gittervektoren herrührend, vernachlässigt werden. Die „richtigen“ Ansätze für eine Störungsrechnung zur Errechnung des Einflusses eines kleinen Potentials wären also x w
ei G x=2 e i G x=2 cos p ;
7:18 a a x
7:18 b w
ei G x=2 e i G x=2 sin p : a Dies sind stehende Wellen, die ortsfeste Nulldurchgänge besitzen. Wie schon bei der Beugung an periodischen Strukturen (Kap. 3) behandelt, kann man sich diese stehenden Wellen aus der Überlagerung einer einlaufenden und der „Bragg-reflektierten“, zurücklaufenden Welle entstanden denken. Die zu w+ und w– gehörigen Wahrscheinlichkeitsdichten w cos2 p x ;
7:19 a R w a x R w w sin2 p ;
7:19 b a sind in Abb. 7.4 zusammen mit einem qualitativen Potentialverlauf dargestellt. Für ein Elektron im Zustand w+ ist die Ladungsdichte jeweils maximal am Ort der positiven Rümpfe und minimal dazwischen. w– häuft die Ladung eines Elektrons gerade zwischen den Rümpfen. Verglichen mit einer laufenden ebenen Welle exp (i k x), wie sie in guter Näherung weiter weg von der Brillouin-Zonenkante als Lösung existiert, bedeutet also w+ eine Erniedrigung der Gesamtenergie (speziell der potentiellen) und w– eine Erhöhung im Vergleich zum Wert, der bei einem freien Elektron (verschwindendes Potential) auf der Energieparabel gegeben wäre. Diese Erhöhung bzw. Absenkung der Energie an der Zonengrenze führt zu den Abweichungen von der Energieparabel, wie sie in Abb. 7.5 gezeichnet sind. Nach dieser für das Verständnis hilfreichen, qualitativen Betrachtung des Problems lässt sich die formale Rechnung, die die Größe der sog. Bandaufspaltung in Abb. 7.5 liefert, leicht ausführen: Aus der allgemeinen Darstellung der Schrödinger-Gleichung im k-Raum (7.8) folgt durch Translation um einen reziproken Gittervektor
166
7. Elektronische Bänder in Festkörpern
Abb. 7.4. (a) Qualitativer Verlauf der potentiellen Energie V (x) eines Elektrons in einem linearen Kristallgitter. Die Orte der Ionenrümpfe sind durch Punkte im Abstand a (Gitterkonstante) gekennzeichw der net. (b) Wahrscheinlichkeitsdichte R w sich durch Bragg-Reflexion bei k p=a an der oberen Bandkante (Band Å in Abb. 7.5) ergebenden stehenden Welle. (c) Wahrscheinlichkeitsdichte R ww der stehenden Welle an der unteren Bandkante (Band Ç in Abb. 7.5) bei k p=a
E
h2 jk 2m
Gj
2
Ck
G
G0
P
X G0
VG 0
VG0 Ck VG 0
G G0
G Ck G0
;
d: h:
7:20 a
G Ck G0
:
7:20 b h2 2 jk Gj E 2m Für kleine Störungen kann man in erster Näherung zur Berechnung der Ck–G den richtigen, eigentlich zu ermittelnden Eigenwert E gleich der Energie des freien Elektrons (= h 2 k 2/2 m ) setzen. Ferner sind für eine erste Näherung auch nur die größten Koeffizienten Ck–G interessant, d. h. die stärksten Abweichungen vom Verhalten des freien Elektrons erwarten wir, wenn der Nenner in (7.20 b) verschwindet, d. h. für
Ck
G
G0
X
Abb. 7.5. Aufspalten der Energieparabel des freien Elektrons (gestrichelt) an den Berandungen der ersten Brillouin-Zone bei k p=a (im eindimensionalen Problem). Die Aufspaltung ist in erster Näherung durch den entsprechenden FourierKoeffizienten VG des Potentials gegeben. Durch periodische Fortsetzung in den gesamten k-Raum entstehen die Bänder Å und Ç, die hier nur in der Nähe der Energieparabel gezeichnet sind
k2 ' jk
Gj2 :
7:21
Diese Beziehung ist identisch mit der Bragg-Beziehung (3.32). Stärkste Störungen der Energiefläche des freien Elektrons (Kugel im kRaum) durch das periodische Potential treten also auf, wenn die Bragg-Beziehung erfüllt ist, d. h. für die k-Vektoren auf dem Rand
7.2 Näherung des quasifreien Elektrons
167
der 1. Brillouin-Zone. Neben dem Koeffizienten Ck–G ist aber, wie aus (7.20 b) bei G = 0 folgt, der Koeffizient Ck von gleicher Bedeutung. In dem Gleichungssystem (7.20 a) brauchen also in dieser Näherung nur zwei Beziehungen berücksichtigt zu werden (V0 = 0): h2 2 E k Ck VG Ck G 0 2m (7.22) h2 jk Gj2 Ck G V G Ck 0 : E 2m Das ergibt zur Bestimmung der Energiewerte die Determinantengleichung: 2 h 2 E VG 2m k 0;
7:23 2 h 2 jk Gj V G E 2m mit E 0k–G = (h2/2 m) | k–G | 2 als Energie der freien Elektronen schreiben sich die beiden Lösungen dieses Säkulargleichungsproblems: h i1=2 E 12
Ek0 G Ek0 14
Ek0 G Ek0 2 jVG j2 :
7:24 Das heißt, unmittelbar auf dem Brillouin-Zonenrand, wo die Beiträge der beiden Wellen mit Ck und Ck–G gleich sind – s. (7.21) – und E 0k–G = E 0k gilt, beträgt die Energieaufspaltung DE E
E 2jVG j ;
7:25
d. h. sie ist gleich der doppelten Fourier-Komponente des Potentials bei G.
Abb. 7.6. Energiedispersionskurven E (k) für das eindimensionale Gitter (Gitterabstand a) fortgesetzt über die erste Brillouin-Zone hinaus. Wie hier gezeigt, ergeben sich im Rahmen der Näherung vom freien Elektron her verbotene und erlaubte Energiebänder durch Aufspaltung nach Art der Abb. 7.5 und periodische Fortsetzung nach Abb. 7.2. Teile der Energieparabel des freien Elektrons sind verstärkt gezeichnet
168
7. Elektronische Bänder in Festkörpern
In der Nähe des Zonenrandes wird der Verlauf für beide Energieflächen, die durch die Aufspaltung entstehen, durch (7.24) beschrieben. (Man setze dazu wieder E 0k = h 2 k 2/2 m .) Für den eindimensionalen Fall zeigt Abb. 7.5 die Verhältnisse in der Nähe der Brillouin-Zonengrenze bei k = G/2. Der Zusammenhang zwischen der Energieparabel der freien Elektronen und der periodischen Bandstruktur, die sich unter Berücksichtigung der Aufspaltung an den Brillouin-Zonengrenzen ergibt, ist für das eindimensionale Problem in Abb. 7.5 u. 7.6 dargestellt.
7.3 Näherung vom „stark gebundenen“ Elektron her Elektronen, die am freien Atom energetisch tief liegen und räumlich stark lokalisierte Rumpfniveaus besetzen, werden beim Zusammenbau eines Kristalls natürlich auch stärker lokalisiert sein, so dass die vorhin besprochene Beschreibung des Problems durch „quasifreie“ Elektronen nicht adäquat erscheint. Da solche Rumpfelektronen auch beim Zusammenbau zum Kristall die Eigenschaften, die sie im freien Atom haben, weit stärker behalten, besteht eine vernünftige Beschreibung darin, die Eigenschaften der Kristallelektronen durch lineare Superposition aus den Atomeigenfunktionen abzuleiten. Dieses Verfahren, das auch LCAO (Linear Combination of Atomic Orbitals)-Methode heißt, wurde qualitativ schon in Kap. 1 bei der chemischen Bindung diskutiert, um grundsätzlich das Zustandekommen elektronischer Bänder im Festkörper zu erläutern. Zur Formulierung des Problems nimmt man an, dass für die freien Atome, aus denen der Kristall aufgebaut ist, die Schrödinger-Gleichung gelöst ist, d. h.
H A
r rn ui
r rn Ei ui
r rn :
7:26 H A (r– rn) ist der Hamilton-Operator für das freie Atom am Gitter-
platz rn = n1 a1+n2 a2+n3 a3, ui (r– rn) die Wellenfunktion für ein Elektron, das sich auf dem Energieniveau Ei befindet. Den Gesamtkristall denke man sich aus den Einzelatomen aufgebaut, d. h. der Hamilton-Operator für ein Elektron (Einelektronennäherung!) im Gesamtpotential aller Atome lässt sich schreiben:
H H A v
h2 D VA
r 2m
rn v
r
rn :
7:27
Hierbei wird der Einfluss von Atompotentialen in der Nachbarschaft von rn, wo das betrachtete Aufelektron als relativ stark lokalisiert angenommen wird, als Störung v (r– rn) des Potentials VA des freien Atoms beschrieben, d. h. die Störung X VA
r rm
7:28 v
r rn m jn
7.3 Näherung vom „stark gebundenen“ Elektron her
169
Abb. 7.7. Das in der Näherung vom stark gebundenen Elektron verwendete Potential (Schnitt längs x ): Das Gitterpotential VGitter (durchgezogene Linie) wird erhalten durch Summation aller Potentiale der freien Atome VA (r) (gestrichelte Linie). Das Störpotential v (r– rn), das in der Näherungsrechnung verwendet wird, ist strichpunktiert eingezeichnet
wird durch Summation der Atompotentiale am Ort r des Elektrons (außer dem an rn ) erhalten (s. Abb. 7.7). Gesucht werden jetzt Lösungen der Schrödinger-Gleichung
H wk
r E
kwk
r ;
7:29 wo H der durch (7.27) dargestellte Hamilton-Operator für das Kri-
stallelektron ist und wk (r) Bloch-Wellen mit den allgemeinen Eigenschaften aus Abschn. 7.1 sind. Aus (7.29) lässt sich durch Multiplikation mit wk und Integration über den Definitionsbereich von wk leicht erhalten
hwk jH jwk i ;
7:30 hwk jwk i wobei hwk jwk i dr wkwk und hwk jH jwk i dr wkH wk ist (vgl. Abschn. 1.2 und Übung 1.8). Setzt man in (7.30) statt der richtigen Wellenfunktion eine Versuchsfunktion Uk ein, so erhält man einen Energiewert E ' (k), der stets oberhalb von E (k) liegt. Der Energiewert E ' (k) liegt umso dichter am wahren Eigenwert, je besser die Versuchswellenfunktion die richtige Eigenfunktion approximiert. Dies ist die Grundlage des „Ritzschen Verfahrens“. Im vorliegenden Fall nehmen wir an, dass eine gute Näherung für wk in einer linearen Superposition von Atomeigenfunktionen ui (r– rn) besteht, d. h. X X an ui
r rn ei k rn ui
r rn :
7:31 wk Uk E
k
n
n
Die Festlegung der Entwicklungskoeffizienten an = exp (i k·rn) ergibt sich aus der Forderung, dass Uk eine Bloch-Welle sein soll. Es lässt sich leicht zeigen, dass Uk in (7.31) alle Eigenschaften von Bloch-Wellen (Abschn. 7.1) erfüllt, z. B.
170
7. Elektronische Bänder in Festkörpern
UkG
X n
ei k rn ei G rn ui
r
rn Uk :
7:32
E (k) wird nun näherungsweise berechnet nach (7.30) durch Einsetzen der Näherungswellenfunktion (7.31). Der Nenner in (7.30) ergibt:
X i k
rn rm hUk jUk i e
7:33 ui
r rm ui
r rn dr : n; m
uk (r– rm) nimmt bei hinreichender Lokalisierung des betrachteten Elektrons am Kristallatom nur merklich von Null verschiedene Werte in der Nähe von rm an. In erster Näherung berücksichtigen wir in (7.33) deshalb nur Glieder mit n = m und erhalten X
ui
r rn ui
r rn dr N ; hUk jUk i '
7:34 n
wo N die Anzahl der Atome im Kristall darstellt. Unter Berücksichtigung der Kenntnis der Verhältnisse für das freie Atom, d. h. mit (7.26), folgt
1 X i k
rn rm E
k e ui
r rm Ei v
r rn ui
r rn dr N n; m
7:35 mit Ei dem Energieeigenwert des freien Atoms. In dem Term mit Ei wird wieder der Überlapp zwischen nächsten Nachbaratomen vernachlässigt (nur Berücksichtigung der Glieder mit n = m ). In dem Term, der die Störung v (r– rn) enthält, berücksichtigen wir nur Überlapp bis zu den nächsten Nachbarn. Für den einfachen Fall, dass der betrachtete Atomzustand ui Kugelsymmetrie, d. h. s-Charakter besitzt, lässt sich dann das Ergebnis leicht mit Hilfe folgender beider Größen
7:36 a A u
r rn v
r rn u
r rn dr ; i
B
i
ui
r
rm v
r
darstellen als: E
k Ei
A
B
X
rn ui
r ei k
rn
rm
rn dr :
7:36 b
7:37
m
Hierbei läuft die Summe nur über Terme m, wo rm nächste Nachbarn zu rn bezeichnet. A ist im vorliegenden Fall positiv, da v negativ ist. Gleichung (7.37), angewandt auf den Fall eines primitiv kubischen Gitters, ergibt mit rn
rm
a; 0; 0 ;
0; a; 0 ;
0; 0; a ;
im Falle eines s-Atomzustandes: E
k Ei
A
2B
cos kx a cos ky a cos kz a :
7:38
7.3 Näherung vom „stark gebundenen“ Elektron her
171
Durch das „Zusammenfügen“ der Atome zu einem Kristall (mit primitiv kubischem Gitter) entsteht also aus dem Energieniveau Ei des freien Atoms ein elektronisches Band, dessen Schwerpunkt im Vergleich zu Ei um A abgesenkt ist und dessen Breite proportional zu B ist. Die Verhältnisse sind in Abb. 7.8 dargestellt. Folgende allgemeine Konsequenzen ergeben sich: I) Da die Cosinus-Terme zwischen ±1 variieren, beträgt die Breite des Energiebandes 12 B. Für kleine k-Werte lassen sich die Cosinus-Terme entwickeln, und man erhält in der Nähe des C-Punktes (Zentrum der 1. Brillouin-Zone bei k = 0): E
k Ei 2
A
6B B a2 k2 ;
= k 2x + k 2y + k 2z
7:39 2
ist. Diese k -Abhängigkeit entspricht der, wo k die auch aus der Näherung für das quasifreie Elektron (Abschn. 7.2) folgt. II) Aus (7.36 b) folgt, dass ein Band energetisch um so breiter ist, je stärker der Überlapp zwischen benachbarten Wellenfunktionen des entsprechenden Atomzustandes ist. Tiefer liegende Bänder, die von stärker lokalisierten Zuständen herrühren, werden also schmaler sein als Bänder, die von höher liegenden Atomniveaus mit ausgedehnten Wellenfunktionen herrühren. III) Im Rahmen der hier betrachteten Einelektronennäherung ergibt sich die Besetzung der in Bändern angeordneten Einelektronenzustände, indem man sich jeden Zustand mit zwei der insgesamt zur Verfügung stehenden Elektronen besetzt denkt. Das Pauli-Prinzip lässt eine Doppelbesetzung wegen des Unterschiedes im Spinanteil der Wellenfunktion (2 mögliche Spineinstellungen) zu.
Abb. 7.8 a–c. Qualitative Veranschaulichung der Ergebnisse einer Näherung für stark gebundene Elektronen in einem primitiv-kubischen Gitter mit dem Atom- bzw. Gitterabstand a. (a) Energetische Lage der Energieniveaus E1 und E2 im Potential V (r) des freien Atoms. (b) Absenkung und Aufspaltung der Energieniveaus E1 bzw. E2 in Abhängigkeit vom reziproken Atomabstand r –1. Beim Gleichgewichtsabstand a ist die Absenkung A und die Breite des Bandes 12 B. (c) Abhängigkeit der Einelektronen-Energie E vom Wellenzahlvektor k (1, 1, 1) in Richtung der Raumdiagonalen [111]
172
7. Elektronische Bänder in Festkörpern
Bestehe ein Kristall mit primitiv kubischem Gitter aus N Atomen, d. h. aus N primitiven Zellen, so spaltet ein atomares Niveau Ei des freien Atoms durch Wechselwirkung mit den (N–1) Atomen des Kristalls in N Zustände auf, die das entsprechende, quasikontinuierliche Band bilden. 2 N Elektronen können also dieses Band besetzen. Zum gleichen Ergebnis führt die Betrachtung vom quasifreien Elektron her: Im k-Raum nehmen die Elektronenzustände ein Volumen (2 p)3/V (V: makroskopisches Kristallvolumen) ein. Das Volumen der 1. Brillouin-Zone ist hingegen (2 p)3/Vz (Vz: Volumen der Elementarzelle); d. h. der in der 1. Brillouin-Zone verlaufende Teil eines Bandes liefert V/Vz = N Zustände, also unter Berücksichtigung des Spins 2 N besetzbare Plätze für Elektronen. Das Entstehen einer Bandstruktur aus direkten Termen isolierter Atome beim Zusammenfügen zum Kristall war schon in Abb. 1.1 qualitativ dargestellt worden: Bei Natrium z. B. entstehen aus den atomaren 3 s- und 3 p-Termen Bänder, die sich im Kristall (Gleichgewichtsabstand der Atome r0) überlappen. Da die Besetzung der atomaren Niveaus bei Na 1 s 2, 2 s 2, 2 p 6, 3 s 1 ist, liefert das atomare 3 s-Niveau nur ein Elektron pro Elementarzelle in das 3 s-Band des Kristalls, das aber 2 Elektronen pro Zelle Platz bietet; d. h. auch ohne den 3 s–3 p-Überlapp (analog zu 2 s–2 p in Abb. 1.1) wäre das 3 s-Band des Na nur halb besetzt. In Abschn. 9.2 werden wir sehen, dass diese nur teilweise Besetzung eines Bandes die metallisch-leitenden Eigenschaften des Na erklärt. Qualitative Argumente dafür sind schon im Abschn. 1.4 gegeben worden. Beim Diamanten – Kohlenstoff hat bekanntlich die Elektronenkonfiguration 1 s 2, 2 s 2, 2 p 2 – tritt infolge der Ausbildung des sp 3-
Abb. 7.9. Schematischer Verlauf der Bandaufspaltung als Funktion des interatomaren Abstandes für die tetraedrisch gebundenen Halbleiter Diamant (C), Si und Ge. Beim Gleichgewichtsabstand r0 existiert zwischen dem besetzten und unbesetzten Band, die aus den sp 3-Hybridorbitalen resultieren, eine verbotene Zone Eg. Beim Diamant entsteht der sp 3-Hybrid aus den atomaren 2 s, 2 p 3, bei Si aus 3 s, 3 p 3 und bei Ge aus 4 s, 4 p 3 Atomwellenfunktionen. Aus diesem Schema ersieht man, dass die Existenz einer verbotenen Zone nicht an die Periodizität des Gitters gekoppelt ist. Auch amorphe Materialien können eine Bandlücke aufweisen. (Nach Shockley [7.1])
7.4 Beispiele von Bandstrukturen
173
Hybrids (Mischung der 2 s- und 2 p-Wellenfunktionen mit tetraedrischer Bindungsanordnung, s. Kap. 1) eine Umlagerung der s- und p-Terme auf, die sich in einer Wiederaufspaltung des sp 3-Hybridbandes in 2 Bänder mit je 4 zu besetzenden Einelektronenzuständen pro Atom zeigt (Abb. 7.9). Die in der 2 s- und 2 p-Schale vorhandenen 4 Elektronen pro Atom füllen also den unteren Teil des sp3-Bandes vollständig auf, wobei der obere Teil unbesetzt bleibt. Zwischen beiden sp 3-Teilbändern existiert eine verbotene Zone Eg. Dies führt, wie im Abschn. 9.2 u. 12.1 gezeigt wird, zum Isolatorbzw. Halbleitercharakter des Diamanten. Ähnliche Verhältnisse liegen bei den Halbleitern Si und Ge vor (s. Kap. 12). Die in Abb. 7.9 gezeigten Verhältnisse beim Entstehen einer Bandstruktur lassen sich natürlich nicht mit den hier dargestellten einfachen Rechenverfahren gewinnen. Komplizierte Näherungsverfahren zur Berechnung der Bandstruktur mit Hilfe moderner Großrechenanlagen sind dazu erforderlich. Hierzu sei auf einschlägige theoretische Artikel und Lehrbücher verwiesen.
7.4 Beispiele von Bandstrukturen In den vorigen Abschnitten wurde das Zustandekommen einer elektronischen Bandstruktur (Bändermodell), d. h. die Aufeinanderfolge von erlaubten und verbotenen Energiebereichen für ein Kristallelektron, zurückgeführt auf das Auftreten von Bragg-Reflexionen, die aus dem kontinuierlichen Spektrum freier Elektronenzustände verbotene Bereiche herausschneiden. Die andere, ebenso wichtige Betrachtungsweise geht von den diskreten Energieniveaus der freien Atome aus und erklärt das Zustandekommen von Bändern als Aufspaltung der Atomterme durch Wechselwirkung im Kristallverband. In diesem Bild entspricht jedes Band des Bänderschemas einem Term des freien Atoms, und man klassifiziert deshalb die Bänder auch als s, p, d, . . . Bänder. Nach der mehr qualitativen Darstellung der Beispiele in Abb. 1.1 u. 7.9 eines typischen Metalls und eines typischen Isolators seien in diesem Kapitel einige weitere realistische Beispiele von Bandstrukturen vorgestellt. Abbildung 7.10 zeigt, wie man sich die energetisch höchsten besetzten Bänder des Ionenkristalls KCl aus dem Termschema von K+- und Cl–-Ionen bei Annäherung der Ionen bis in den Gleichgewichtsabstand entstanden denken kann. Auch im Gleichgewichtsabstand, der beim Kristall aus Röntgenbeugungsdaten bekannt ist, sind die besetzten Bänder extrem schmal, was auf einen geringen Überlapp der Ladungsverteilung zwischen den einzelnen Ionen hindeutet. Theoretische Ergebnisse wie in Abb. 7.10 lassen also, wenn sie gute Übereinstimmung zu experimentellen Daten der Bandstruktur liefern, weitreichende Schlüsse auch auf die Verhältnisse bei der chemischen Bindung zu.
174
7. Elektronische Bänder in Festkörpern
Abb. 7.10. Die vier höchsten besetzten Energiebänder von KCl, gerechnet in Abhängigkeit vom Ionenabstand in Bohr-Radien (a0 = 5,29´10–9 cm). Die Energien der freien Ionen sind durch Pfeile angegeben. (Nach Howard [7.2])
Die volle Information über Einelektronenzustände im periodischen Potential lässt sich natürlich aus einer Gesamtdarstellung der E (k)-Flächen im Raum der Wellenvektoren k entnehmen. Um einen Überblick über die häufig komplizierten Flächen zu bekommen, betrachtet man Schnitte der Energieflächen längs Richtungen hoher Symmetrie durch die 1. Brillouin-Zone. Dies ist für das Beispiel eines Al-Kristalls in Abb. 7.11 a dargestellt. Die Definitionen der Symmetrierichtungen und Punkte lassen sich aus der Darstellung der 1. Brillouin-Zone für das kubisch flächenzentrierte Gitter des Aluminiums (Abb. 3.9 u. 7.11 b) entnehmen. Auffällig ist, dass die Bandstruktur von Al sehr gut durch die parabelförmige Abhängigkeit eines freien Elektronengases (gestrichelt)
Abb. 7.11. (a) Theoretisch ermittelte Bandstruktur E (k) von Al längs Richtungen hoher Symmetrie (C-Zentrum der Brillouin-Zone). Gestrichelt eingezeichnet sind Bänder, die sich ergäben, wenn s- und p-Elektron im Al völlig frei wären („leeres“ Gitter). (Nach Segall [7.3]). (b) Schnitt durch die Brillouin-Zone im reziproken Raum für Al. Die Zonenränder sind gestrichelt eingezeichnet. Die „Fermi-Kugel“ (durchgezogene Linie) ragt bei Al über die erste Brillouin-Zone hinaus
7.4 Beispiele von Bandstrukturen
175
beschrieben werden kann. Die Aufspaltung an den Brillouin-Zonenkanten ist vergleichsweise gering, und die Komplexität der Bandstruktur ist im wesentlichen auf die Reduktion der Energieparabeln auf die 1. Brillouin-Zone zurückzuführen. Dies ist ein Charakteristikum der einfachen Metalle. Man findet solche Ähnlichkeiten zum freien Elektronengas vor allem auch bei den Alkalimetallen Li, Na, K. Die Auffüllung der Bandstruktur mit den zur Verfügung stehenden Elektronen geschieht bis zu der in Abb. 7.11 eingezeichneten Fermi-Energie EF. Es ist zu erkennen, dass die Fläche konstanter Energie, bis zu der die Bänder aufgefüllt sind, die sog. Fermi-Fläche E (k) = EF , mehrere Bänder schneidet. Schon beim Al ist also diese Fermi-Fläche keine einfach zusammenhängende Fläche: Während bei den einwertigen Alkalimetallen die näherungsweise kugelförmigen Fermi-Flächen voll in die 1. Brillouin-Zone hineinpassen, durchsetzt die „Fermi-Kugel“ bei Al gerade die Berandung
Abb. 7.12. Bandstruktur E (k) längs Richtungen hoher Kristallsymmetrie für Kupfer (rechts). Die experimentellen Daten stammen von verschiedenen Autoren und wurden von Courths und Hüfner [7.4] zusammengestellt. Die ausgezogenen Linien des E (k)-Verlaufes und die Zustandsdichte (links) wurden von Eckhardt et al. [7.5] berechnet. Bemerkenswert ist die gute Übereinstimmung sowohl der experimentellen Daten untereinander als auch die Übereinstimmung mit der Theorie
176
7. Elektronische Bänder in Festkörpern
der 1. Brillouin-Zone, d. h. auf den Rändern wird die Kugelgestalt leicht infolge der dort stattfindenden Bragg-Reflexion verändert. Dies ist qualitativ in Abb. 7.11 b in einem Schnitt durch den dreidimensionalen k-Raum gezeigt. Im Gegensatz zu den einfachen Metallen sind die Bandstrukturen der Übergangsmetalle durch den markanten Einfluss der d-Bänder wesentlich komplizierter. Neben Bändern, die aus s-Termen resultieren und mehr den Parabeln eines freien Elektronengases gleichen, erscheinen unterhalb der Fermi-Energie sehr flache E (k)-Strukturen, deren geringe energetische Breite (wenig Dispersion) auf die starke Lokalisierung der d-Elektronen zurückzuführen ist. Dies lässt sich z. B. an der Bandstruktur des Cu in Abb. 7.12 leicht erkennen. Insbesondere bei Übergangsmetallen wie Pt, W usw., wo komplizierte d-Bandstrukturen von der Fermi-Energie geschnitten werden, können die Fermi-Flächen sehr verwickelte Gestalt annehmen. In anderer Hinsicht interessante Phänomene – wie Halbleitereigenschaften (Kap. 12) – ergeben sich, wenn in der Bandstruktur eine
Abb. 7.13. Theoretisch ermitteltes Bänderschema E (k) für Germanium längs Richtungen hoher Symmetrie (rechts). Elektronische Zustandsdichte D (E) von Germanium (links). Einige kritische Punkte, bezeichnet nach ihrer Lage in der Brillouin-Zone (C, X, L), lassen sich auf Bereiche im Bänderschema zurückführen, wo E (k) waagerechte Tangenten hat. Die in der Zustandsdichte schraffierten Zustände sind besetzt. (Nach Herman et al. [7.6])
7.5 Zustandsdichten
177
absolute Lücke, ein sog. verbotenes Band auftritt: Es gibt dann in einem gewissen Energiebereich keine besetzbaren Zustände und dies für alle k-Richtungen (im reziproken Raum). Eine typische Bandstruktur ist die des Germaniums (Abb. 7.13), das ebenso wie Diamant und Silizium in der Diamantstruktur kristallisiert, wobei die tetraedrischen Bindungsverhältnisse am Einzelatom auf die Bildung des sp 3-Hybridorbitals zurückzuführen sind. Wie schon am Ende von Abschn. 7.3 ausgeführt, hat die Bildung des sp 3-Hybrids zur Folge, dass die unteren Teilbänder (unterhalb des verbotenen Bandes) voll besetzt sind, während die anderen aus dem sp 3-Hybrid entstandenen Bänder oberhalb des verbotenen Bandes unbesetzt sind. Die Fermi-Energie muss also im Bereich des verbotenen Bandes liegen, eine Tatsache, die bei der Besprechung der Halbleitereigenschaften (Kap. 12) dieser Kristalle von Bedeutung sein wird.
7.5 Zustandsdichten Analog zur Betrachtung der thermischen Eigenschaften des Phononensystems (Kap. 5) reicht auch im Falle der elektronischen Zustände die Kenntnis der Zustandsdichte zur Beschreibung z. B. des Energieinhaltes des Elektronensystems aus. Auch bei elektronischen Anregungsmechanismen (z. B. nicht-winkelaufgelöste Photoemissionsspektroskopie, Tafel V), bei denen infolge der experimentellen Anordnung über alle k-Richtungen integriert wird, genügt zur Interpretation der Spektren in vielen Fällen die Kenntnis der Anzahl der Elektronenzustände pro Energieintervall dE. Sind die Energieflächen E (k) der Bandstruktur gegeben, so ergibt sich analog zu (5.4) (Abschn. 5.1) die Zustandsdichte durch Integration über eine Energieschale {E (k), E (k)+dE} des k-Raumes: dZ
V
2 p3
EdE
dk ;
7:40
E
V/(2 p )3 ist die Dichte der Zustände im k-Raum. Zerlegt man das Volumenelement d k wieder in ein Flächenelement d fE auf der Energiefläche und eine Komponente dk^ normal zu dieser Fläche (Abb. 5.1), d. h. d k = d fE dk^, so folgt mit dE = jgradk Ejdk^ 1 0
1 B dfE C
7:41 D
EdE AdE : 3@ jgradk E
kj
2 p E
kconst
Hierbei wurde gleichzeitig die Zustandsdichte D (E) auf das Realvolumen V des Kristalls bezogen, um zu einer kristallspezifischen Größe zu gelangen. Es ist zu bedenken, dass wegen Spinentartung jeder Zustand mit zwei Elektronen besetzt werden kann.
178
7. Elektronische Bänder in Festkörpern
Die Hauptstruktur in der Funktion D (E) wird wieder durch solche Punkte im k-Raum geliefert, wo jgradk Ej verschwindet, d. h. wo die Energieflächen flach verlaufen. Diese Punkte heißen van Hove-Singularitäten oder kritische Punkte. Im dreidimensionalen Raum wird D (E) in der Nähe dieser kritischen Punkte nicht singulär, da bei einer Entwicklung von E (k) um diesen Extremalpunkt (E * k 2) jgradk E j–1 wie k –1 singulär wird, die Integration über die E (k)-Fläche (7.41) aber eine k 2-Abhängigkeit liefert. Das heißt, im Dreidimensionalen zeigt die Zustandsdichte in der Nähe der kritischen Punkte parabolische Verläufe, wie sie in Abb. 7.14 dargestellt sind. Für eindimensionale Bandstrukturen, die in guter Näherung zur Beschreibung von „eindimensionalen“ organischen Halbleitern herangezogen werden, divergiert die Zustandsdichte an den kritischen Punkten, aber das Integral über die Dichte bleibt endlich (s. Zustandsdichte der Gitterschwingungen einer linearen Kette, Abschn. 4.3). Zustandsdichten werden durch Integration im k-Raum über die 1. Brillouin-Zone einer errechneten Bandstruktur gewonnen und können dann mit experimentellen Daten, z. B. aus der Photoemissionsspektroskopie (Tafel V), verglichen werden. Sie liefern also eines der wesentlichen Bindeglieder, um Bandstrukturrechnungen mit experimentellen Daten zu vergleichen. Bei der Integration über den k-Raum liefern die kritischen Punkte die Hauptbeiträge. Da kritische Punkte zumeist auf Schnitten oder Punkten hoher Symmetrie im k-Raum liegen, erklärt sich weiter, warum in der Darstellung der Bandstrukturen bevorzugt Schnitte längs Linien hoher Symmetrie (z. B. CJ, CX, CL etc.) gewählt werden. Aus Bereichen dazwischen sind im allgemeinen nur Beiträge geringerer Bedeutung zu erwarten. Dort kann also zuweilen bei der Rechnung rein mathematisch interpoliert werden. Der Zusammenhang zwischen einer errechneten Bandstruktur und der zugehörigen Zustandsdichte ist für den Halbleiter Germa-
Abb. 7.14. Verlauf der Zustandsdichte D (E) in der Umgebung der vier im Dreidimensionalen möglichen kritischen Punkte. Die kritischen Punkte liegen jeweils bei der Energie Ec und im kRaum bei kci (i = 1, 2, 3); der Bandverlauf in der Umgebung istPin parabolischer Näherung E (k) = Ec+ i (ki–kci)2 i
dargestellt (i = const). D0 und C sind Konstanten
7.6 Zustandsdichte nichtkristalliner Festkörper
179
nium sehr schön aus Abb. 7.13 zu ersehen. Entscheidende Beiträge, d. h. Maxima in der Zustandsdichte, sind mit flach verlaufenden Bereichen der E (k)-Kurven längs Richtungen hoher Symmetrie korreliert. Weiter ist die absolute Bandlücke zwischen den vollständig besetzten sog. Valenzbandzuständen und den (bei tiefer Temperatur) nicht besetzten sog. Leitungsbandzuständen zu erkennen. Dieses verbotene Band hat bei Ge eine ungefähre Breite von 0,7 eV. Abbildung 7.12 zeigt als Beispiel für ein Übergangsmetall die errechnete Zustandsdichte von Kupfer. Die Zustandsdichte wurde durch Integration aus der ebenfalls in Abb. 7.12 gezeigten Bandstruktur E (k) gewonnen. Die scharfen Strukturen zwischen –2 und –6 eV unterhalb des Fermi-Niveaus lassen sich leicht kritischen Punkten der flach verlaufenden d-Bänder zuordnen. In der E (k)Auftragung (Abb. 7.12) ist auch der parabelähnliche Verlauf des sBandes mit einem Minimum bei C zu erkennen. Dieses s-Band liefert in der Zustandsdichte den bei etwa –9,5 eV einsetzenden, flach verlaufenden Beitrag. Eine Ähnlichkeit zu der beim „freien“ Elektronengas ermittelten Zustandsdichte-Parabel ist zumindest unterhalb von –6 eV nicht zu verkennen. Die Zustandsdichte am FermiNiveau ist bei Kupfer die der s-Elektronen, woraus sich erklärt, dass für Kupfer eine Beschreibung durch das „freie Elektronengas im Potentialtopf“ (Kap. 6) zu relativ guten Ergebnissen führt. Dies ist, wie schon im Abschn. 6.4 gezeigt, anders bei Fe, Ni, Co und anderen Übergangsmetallen. Bei diesen Metallen schneidet das Fermi-Niveau gerade die hohe Zustandsdichte der d-Bänder, die nur teilweise gefüllt sind. Für die Ferromagnete Fe, Ni, Co kommt, wie im Abschn. 8.3 ausgeführt wird, eine weitere Komplikation hinzu. Bei diesen Materialien stellt sich in der ferromagnetischen Phase (T < TC, Curie-Temperatur) eine Spinordnung ein, so dass man zwei Zustandsdichten, die für Elektronen mit Spinmoment parallel zur spontanen Magnetisierung M und die für Elektronen mit antiparalleler Einstellung, ermitteln muss. Abbildung 8.6 zeigt diese beiden Zustandsdichten für Ni. Solche Zustandsdichten wie in Abb. 8.6 lassen sich natürlich nur aus Bandstrukturen E (k) ermitteln, die unter Einschluss der Elektron-Elektron-Wechselwirkung berechnet wurden.
7.6 Zustandsdichte nichtkristalliner Festkörper Die elektronischen Zustände eines Festkörpers lassen sich nur dann nach den Komponenten des Wellenzahlvektors kx, ky und kz klassifizieren, wenn der Festkörper kristallin (= translationsinvariant gegenüber Vektoren eines Gitters) ist, und nur in diesem Fall werden die Energieeigenwerte durch eine Bandstruktur E (k) beschrieben. Der Begriff der Zustandsdichte mit verbotenen und erlaubten Bändern ist jedoch nicht an die Translationsinvarianz gebunden. Auch
180
7. Elektronische Bänder in Festkörpern
-1
eV )
ein nichtkristalliner Festkörper besitzt eine definierte Anzahl von elektronischen Zuständen pro Energieintervall und Volumen, wenn er nur auf einer mesoskopischen Längenskala ausreichend homogen in seiner Struktur und Zusammensetzung ist. Viele Materialien können sowohl in kristalliner als auch nichtkristalliner Form vorliegen. Typische Beispiele sind SiO2 und Al2O3, die als Kristalle und als unterkühlte Schmelzen (Gläser) existieren. Bekanntlich sind diese Materialien in beiden Modifikationen optisch transparent. Beide Phasen müssen deshalb eine Energielücke zwischen besetzten und unbesetzten elektronischen Zuständen haben, die größer als etwa 3 eV ist. Die Größe der Energielücke scheint also nur unwesentlich davon abzuhängen, ob der Zustand glasartig oder kristallin ist. Die amorphen Phasen von SiO2 und Al2O3, aber auch die von Si und Ge unterscheiden sich von den kristallinen Phasen im wesentlichen nur durch die fehlende Fernordnung. Die Nahordnung ist in beiden Phasen weitgehend gleich. Zum Beispiel ist für Si und Ge die Nahordnung durch die tetraedrische Koordination mit sp3-Bindungen zu den nächsten Nachbarn festgelegt. Da die elektronische Struktur in erster Linie durch die Nahordnung bestimmt wird, ist die Größe der Energielücke zwischen besetzten und unbesetzten Zuständen für den amorphen und kristallinen Zustand in etwa gleich. Auch sonst sind die Zustandsdichten für amorphe und kristalline Phasen ähnlich. Es verschwinden lediglich die scharfen Strukturen, die von den kritischen Punkten (Abb. 7.13) der Bandstruktur herrühren.
22
10
21
10
20
10
19
kristalline Phase amorphe Phase
10
22
10
21
10
20
10
19
Zustandsdichte (cm
-3
10
-0.4
0.0
0.4
0.8
1.2
1.6
Energie (eV) Abb. 7.15. Schematische Darstellung der Zustandsdichte eines idealen amorphen Materials mit tetraedrischer Koordination, bei dem alle Bindungen abgesättigt sind (ausgezogene Linie). Die Werte der Zustandsdichte und der Bandlücke repräsentieren in etwa amorphes Silizium. Im Vergleich zum kristallinen Material hat die Zustandsdichte exponentielle Ausläufer in die verbotene Zone hinein. Nicht abgesättigte Bindungen im amorphen Netzwerk führen zu zusätzlichen Beiträgen der Zustandsdichte innerhalb der Bandlücke. Für praktische Anwendungen von amorphem Silizium z. B. in Solarzellen versucht man die Konzentration nicht abgesättigter Valenzen durch Zugabe von Wasserstoff klein zu halten
7.6 Zustandsdichte nichtkristalliner Festkörper
181
Amorphe Phasen von Si und Ge werden durch Wachstum bei (relativ) tiefen Temperaturen hergestellt. Bei diesen Temperaturen kann sich die kristalline Gleichgewichtsform nicht ausbilden. Damit trotzdem möglichst viele Bindungen abgesättigt werden, müssen die sp3-Tetraeder mit leicht „verbogenen“ Bindungswinkeln zusammengesetzt und die Bindungsabstände etwas variiert werden. Anstelle der festen Tetraederwinkel und der festen Bindungsabstände zu den Nachbaratomen hat man also in der amorphen Phase eine (schmale) Gaußverteilung der Winkel und Abstände um einen Mittelwert. Wie in Abb. 7.9 gezeigt wurde, hängt die Größe der Bandlücke vom Abstand der nächsten Nachbarn ab. Die unscharfe Abstandsverteilung in amorphen Systemen führt deshalb auch zu einer „unscharfen“ Bandlücke. Die Zustandsdichte bekommt einen exponentiellen Ausläufer in die verbotene Zone hinein (Abb. 7.15). Der Wert der Zustandsdichte reflektiert dabei die Häufigkeit, mit der bestimmte Bindungsabstände und Winkel realisiert werden. Zustände in den Ausläufern der Zustandsdichte, die in die verbotene Zone hineinreichen, entsprechen also Bindungskonfigurationen, die relativ selten realisiert sind, und zwar umso seltener je tiefer die Zustände energetisch in der verbotenen Zone liegen. Die Wellenfunktionen solcher Zustände können sich deshalb nicht überlappen. Die tiefer in der verbotenen Zone liegenden Zustände müssen daher räumlich lokale Zustände sein. Elektronen in diesen Zuständen sind deshalb auch nicht frei beweglich wie Elektronen in Bändern (siehe auch Abschn. 9.8). Die theoretische Berechnung der elektronischen Zustände von amorphen Materialien ist schwieriger als für Kristalle. Zunächst einmal ist die Charakterisierung einer Struktur als „amorph“ keine hinreichende Beschreibung. Zumindest ist die Kenntnis der Verteilung der Bindungslängen und Bindungswinkel nötig. Man kann dann mit solchen Angaben eine Anordnung von Atomen vorgeben,
Abb. 7.16. Berechnete Energieterme unterhalb des Fermi-Niveaus für kubische Nickel-Cluster bestehend aus 13, 43 und 79 Atomen und nichtkubischen Clustern der Symmetrie D2h mit 20 und 28 Atomen [7.7]. Der Bezugspunkt der Energieskala ist das Vakuumniveau. Mit stärkerer Strichbreite gezeichnete Niveaus bestehen aus mehreren nahezu entarteten Einzelniveaus. Der Cluster mit 79 Atomen gibt die Austrittsarbeit des Festkörpers (5,2 eV [6.5]) und die Häufung der Zustände unterhalb des Fermi-Niveaus durch die teilweise besetzten d-Zustände schon recht gut wieder
182
7. Elektronische Bänder in Festkörpern
die in etwa die entsprechende Verteilung aufweist und diese Anordnung dann theoretisch als ein großes Molekül behandeln. Solche speziellen Moleküle aus gleichartigen Atomen werden als Cluster (= Haufen) bezeichnet. Die elektronischen Zustände eines solchen Clusters sind natürlich diskret. Erst mit zunehmender Anzahl von Atomen im Cluster lässt sich durch eine künstliche Verbreiterung der Energie eines jeden Zustandes so etwas wie eine Zustandsdichte angeben (Abb. 7.16). Es sind auch Verfahren entwickelt worden, solche Cluster theoretisch in nichtperiodischer Weise in allen drei Dimensionen fortzusetzen. Zunächst waren Cluster nur eine Hilfskonstruktion der Theoretiker zur Berechnung elektronischer Eigenschaften amorpher (und auch kristalliner) Festkörper. Durch die Möglichkeit, Cluster definierter Größe und Struktur auch experimentell herstellen zu können [7.8], ist ein eigenständiges Forschungsgebiet auf der Grenze zwischen Molekülphysik, Festkörperphysik und Materialwissenschaft entstanden.
Übungen zu Kapitel 7
7.1 Für das Potential 1; V
x; y; z 0;
E
ky
x<0 x0
löse man die Einelektronen-Schrödinger-Gleichung! Berechnen Sie daraus die Ladungsdichte X R
x; y; z
2 e jW k j2 ; kx ; ky ; kz
wobei der maximale k-Wert durch die FermiEnergie EF gegeben ist! Zeichnen Sie R (x) und diskutieren Sie das Ergebnis (Friedel-Oszillationen)! Man betrachte eine typische metallische Elektronendichte von 1022 cm–3 und den Fall eines schwach dotierten Halbleiters mit einer Dichte von 1016 cm–3. 7.2 Ein zweidimensionales Elektronengas werde im reziproken Raum durch ein zweidimensionales Gitter beschrieben, dessen BrillouinZone primitiv-quadratisch ist. (a) Man zeige, dass die kinetische Energie eines freien Elektrons in einer Ecke der ersten Brillouin-Zone um einen Faktor 2 größer ist als die eines Elektrons mit kVektor auf der Mitte der Brillouin-Zonenberandung! (b) Wie groß sind die entsprechenden Faktoren beim primitiv-kubischen Gitter in drei Dimensionen? (c) Man zeige, dass eine Überlappung der Energiebänder bereits im zweidimensionalen Fall auftreten kann! Dazu zeichne man für den Fall freier Elektronen, die durch ein schwaches periodisches Potential gestört werden, folgende Dispersionsrelationen:
kx 0 ; p E
ky fur kx ; a E
k fur kx ky : fur
7.3 Als einfaches Modell für einen Kristall diene eine eindimensionale lineare Kette mit 2 N Atomen jeweils im Abstand a0 voneinander. }i (x– na0) sei die korrekte Wellenfunktion eines Elektrons mit der Energie Ei (Energieeigenwert) am Atom an der Stelle na0. Unter welcher Voraussetzung kann man die Wellenfunktion eines über die ganze Kette delokalisierten Elektrons durch eine Linearkombination atomarer Orbitale (LCAO) annähern: W
x
N X
cn yi
x
n a0 ?
n N
Man wähle die Koeffizienten cn so, dass für N ? ? die Wellenfunktion W (x) Bloch-Gestalt hat. 7.4 (a) Man betrachte für genügend kleine Wellenzahlvektoren k die Umgebung eines Minimums der elektronischen Bandstruktur, wo E (k) in parabolischer Näherung als ! h2 kx2 ky2 kz2 E
k Ec 2 mx my mz mit mx , my und mz als positiven konstanten Zahlen angenähert werden kann. Zeigen Sie, dass die elektronische Zustandsdichte D (E) in der Nähe des kritischen Punktes Ec (k = 0) proportional zu (E–Ec)1/2 ist! (b) Man betrachte die Zustandsdichte in der Umgebung eines Sattelpunktes, wo
184
h2 kx2 ky2 E
k Ec 2 mx my
kz2 mz
Übungen zu Kapitel 7
!
mit positiven mx , my , mz gilt. Zeigen Sie, dass die Zustandsdichte in der Umgebung von Ec geschrieben werden kann als const fur E > Ec D
E / D0 C
Ec E1=2 fur E < Ec : Zeichnen Sie D (E) in der Umgebung eines Minimums (a) und eines Sattelpunktes von E (k) (b)! 7.5 Man erkläre auf der Basis der elektronischen Bandstruktur, bzw. der Zustandsdichte, warum Kupfer, im Gegensatz zu vielen anderen Metallen, farbig erscheint, d. h. eine signifikante spektrale Struktur in den optischen Konstanten des sichtbaren Spektralbereiches aufweist!
7.6 Erklären Sie, warum und wie sich die Bandlückenenergie Eg von Silizium und Diamant mit wachsender Temperatur ändert! 7.7 Man betrachte ein winkelaufgelöstes UVPhotoemissionsexperiment (ARUPS), bei dem UV-Photonen einer Energie von 40,8 eV auf eine (100)-Oberfläche eines kubischen Übergangsmetalls mit der Austrittsarbeit von 4,5 eV auftreffen. Photoemittierte Elektronen aus d-Zuständen, 2,2 eV unterhalb der FermiEnergie EF , werden unter einem Winkel von 45 ° zur Oberflächennormalen und im [100]Azimuth nachgewiesen. (a) Man berechne den Wellenzahlvektor k der emittierten Elektronen! (b) Welches Problem ergibt sich bei der Bestimmung des Wellenzahlvektors ki der Anfangszustände, aus denen die Elektronen stammen! Betrachten Sie die Wellenzahlvektorkomponenten k|| und k^ (parallel und senkrecht zur Oberfläche) getrennt!
Tafel V
Tafel V Photoemissionsspektroskopie
Als eine der wichtigsten Methoden, um experimentelle Information über Bandstrukturen und deren Zustandsdichten zu erhalten, hat sich die Photoemissionsspektroskopie [V.1] etabliert. Hierbei werden Photonen höherer Energie h x auf die Kristallprobe gestrahlt. Dadurch werden Elektronen aus ihren besetzten Zuständen (Bänder) in leere Zustände (Quasikontinuum) oberhalb des Vakuumniveaus EVac angeregt und können dann nach Überwindung der Austrittsarbeit } vermöge ihrer überschüssigen kinetischen Energie Ekin austreten. Wegen der Beziehung hx y Ekin Eb
V:1
ergibt die Messung des Spektrums N (Ekin) der durch Photoeffekt befreiten Elektronen ein Abbild der Verteilung der besetzten elektronischen Zustände (Bindungsenergie Eb) im Festkörper (s. Abb. V.1 b). Das hierdurch erhaltene „Abbild“ der Zustandsdichte der besetzten Zustände ist überlagert einem monotonen Hintergrund von sog. „Wahren Sekundärelektronen“, der sich aus Elektronen zusammensetzt, die durch mannigfache inelastische Streuprozesse beim Austritt aus dem Festkörper Energie verloren haben. Wegen der relativ starken Wechselwirkung der Elektronen mit dem Festkörper können nur Elektronen aus oberflächennahen Schichten (Ausdringtiefe *5 Å für Elektronen mit 50 eV< Ekin <100 eV) austreten. Die Methode ist also oberflächenempfindlich und eignet sich somit auch zum Studium der elektronischen Eigenschaften von Festkörperoberflächen. Andererseits müssen bei der Untersuchung von Volumen-Bandstrukturen die Oberflächen rein sein, d. h. die Oberflächen der zu untersuchenden Kristalle müssen unter Ultrahochvakuumbedingungen (Druck 5 10–8 Pa) präpariert werden. Als Lichtquellen werden Gasentladungslampen mit folgenden Spektrallinien benutzt: He: 21,2
Abb. V.1. (a) Schema einer Anordnung zur Messung von Photoemissionsspektren. Probe, Energieanalysator und Detektor befinden sich in einer Ultrahochvakuumkammer (Druck £10–8 Pa), und die als UV-Quelle dienende Gasentladungslampe ist an diese fensterlos, differentiell gepumpt, angeflanscht. (b) Schema des Messvorganges bei der Photoemissionsspektroskopie an einem Übergangsmetall, bei dem die Fermi-Kante EF im oberen Bereich der d-Bänder (besetzter Bereich schraffiert) liegt. EVac–EF = } ist die Austrittsarbeit. Die in quasikontinuierliche leere Kristallzustände angeregten Elektronen können austreten und werden als freie Elektronen mit der überschüssigen kinetischen Energie Ekin im Vakuum gemessen
und 40,8 eV, Ne: 16,8 und 26,9 eV. Die Methode heißt dann UPS (UV-Photoemission Spectroscopy). Höhere Photonenenergien werden mit Röntgenröhren (Al: 1486 eV, Mg 1253 eV) erzeugt, wobei dann die Methode den Namen XPS (X-ray Photoemission Spectroscopy) oder ESCA (Electron Spectroscopy for Chemical Analysis) hat.
Tafel V
186
Tafel V Photoemissionsspektroskopie
Mittlerweile wird vor allem auch mit der Synchrotron-Strahlung (Tafel XI) gearbeitet, die vermittels von UV-Monochromatoren eine kontinuierliche Variation der Lichtenergie erlaubt. Dadurch ist es auch möglich, die kinetische Energie der analysierten Elektronen festzuhalten und durch Variation von h x das Spektrum der Festkörperelektronen zu erfassen. Als Energieselektoren zur Messung von N (Ekin) sind verschiedenartige elektrostatische Elektronenanalysatoren in Betrieb. Abbildung V.I a zeigt einen sog. 127 ° Analysator. Durch Anlegen einer variablen Spannung zwischen den zylindrischen Sektorplatten lässt sich die Energie der Elektronen einstellen, die den Austrittsspalt passieren können. Der k-Vektor des photoemittierten Elektrons im Vakuum kV ist durch die kinetische Energie und die azimuthalen und polaren Austrittswinkel festgelegt. Für geordnete Oberflächen bleibt wegen der Translationssymmetrie die Komponente des k-Vektors parallel zur Oberfläche beim Durchtritt des Elektrons durch die Oberfläche erhalten. Durch die Parallelkomponente des photoemittierten Elektrons ist also auch die Parallelkomponente des Anfangszustandes festgelegt. Die senkrechte Komponente des k-Vektors bleibt hingegen beim Durchtritt des Elektrons durch die Oberfläche nicht erhalten, da das Elektron beim Austritt aus dem Festkörper eine Potentialbarriere überwinden muss. Der Anfangszustand des Elektrons lässt sich also nicht einfach aus einem winkelaufgelösten Photoemissionsspektrum entnehmen. Eine Methode, mit der die senkrechte Komponente des k-Vektors für den Anfangszustand des Elektrons im Innern des Festkörpers ermittelt werden kann, wird mit Abb. V.2 demonstriert. Dort sind drei Photoemissionsspektren von Kupfer für Elektronen aus dem Bereich der d-Elektronen gezeigt. Spektrum (a) wurde an einer Cu(111)-Oberfläche in Richtung senkrecht zur Oberfläche, also in [111]-Richtung, aufgenommen. Diese Richtung entspricht der CL-Richtung in der Brillouin-Zone (s.a. Abb. 7.12). Der Betrag des k-Vektors muss noch ermittelt werden. Dazu werden in einem zweiten Schritt die Spektren auf einer (110)-Oberfläche mit verschiedenem Polarwinkel in einer Ebene aufgenommen, die die [111]-Richtung enthält. Die [111]-Rich-
Abb. V.2. Winkelaufgelöste Photoemissionsmessungen von Kupferoberflächen. Spektrum (a) wurde an einer Cu(111)Oberfläche in [111]-Richtung aufgenommen. Die Spektren (b) und (c) stammen von einer Cu(110)-Oberfläche und wurden unter einem Polarwinkel von 35,2 ° bzw. 52,5 ° aufgenommen. Die Größe des k-Vektors des Anfangszustandes, der den Spektren (a) und (c) entspricht, wird aus der Projektion des k-Vektors, unter dem das Spektrum auf der (110)-Fläche erscheint, ermittelt (nach [V.2])
tung auf dieser Fläche liegt bei einem Polarwinkel von 35,2 °. Das Spektrum aufgenommen in dieser Richtung sieht allerdings ganz anders aus als das auf der (111)-Fläche in [111]-Richtung aufgenommene. Dies liegt daran, dass die Elektronen beim Durchtritt durch die Oberfläche eine Brechung erfahren. Wegen dieser Brechung erscheint das Spektrum wie auf der (111)-Fläche unter einem anderen Winkel, nämlich bei 52,5 °. Wir können jetzt wiederum von der Erhaltung der Parallelkomponente Gebrauch machen und den vollständigen k-Vektor des Anfangszustandes ermitteln (s. Einschub in Abb. V.2). Entsprechend der Konstruktionsvorschrift ergibt sich der Betrag des k-Vektors zu k111 kext sin 52;58= sin 35;28 :
V:2
Abb. V.3 a, b. UPS-Spektren gemessen an einer ZnO (101¯0)Oberfläche, die im Ultrahochvakuum durch Anlassen gereinigt wurde. Die Anregung wurde mit (a) He II- bzw. (b) He I-Strahlung durchgeführt. Der Hintergrund der wahren Sekundärelektronen (WS) ist gestrichelt eingezeichnet [V.3]
Als Übungsaufgabe können Sie berechnen, welche Datenpunkte in Abb. 7.12 den Spektren entnommen werden können. Mit Hilfe der hier kurz beschriebenen und anderen Methoden können aus winkelaufgelösten Photoemissionsspektren sowohl die Bindungsenergien besetzter Elektronenzustände als auch die zugehörigen Wellenzahlvektoren ermittelt werden. Die winkelaufgelöste Photoemissionsspektroskopie ist die wichtigste Methode zur experimentellen Bestimmung der elektronischen Bandstruktur E (k).
187
Der Vollständigkeit halber sei erwähnt, dass es auch möglich ist, die Bandstruktur der unbesetzten Zustände zu bestimmen. Dazu bedient man sich des sog. inversen Photoeffektes, d. h. man beschießt die Oberfläche eines Festkörpers mit Elektronen definierten Impulses und beobachtet die Emission von UV-Licht [V.4]. Durch Integration von Photoemissionsspektren über alle Winkel des Halbraums bzw. durch Messung mit einem winkelintegrierenden Analysator lässt sich ein qualitatives Bild der Zustandsdichte der besetzten Zustände gewinnen. Abbildung V.3 zeigt als Beispiel UPS-Spektren, die an ZnO (101¯0)-Oberflächen mit zwei verschiedenen HeSpektrallinien gemessen wurden. Die Spektren sind statt über der kinetischen Energie Ekin über der Bindungsenergie, bezogen auf die FermiEnergie EF , aufgetragen. Infolge von Matrixelementeffekten (Abschn. 11.10) erscheinen die Zn (3 d )- und O (2 p )-Bänder in beiden Spektren mit verschiedener Intensität. In Spektrum (b) ist der Hintergrund der wahren Sekundärelektronen (WS) vollständig zu sehen (gestrichelte Interpolation qualitativ). Bei ZnO liegt das Fermi-Niveau im verbotenen Band knapp unterhalb der Leitungsbandkante, also etwa 3,2 eV oberhalb von EV, der Einsatzenergie der Emission.
Literatur V.1 M. Cardona, L. Ley (eds.): Photoemission in Solids I, II; Topics Appl. Phys. Vols. 26, 27 (Springer, Berlin Heidelberg 1979) B. Feuerbacher, B. Fitton, R. F. Willis (eds.): Photoemission and the Electronic Properties of Surfaces (Wiley, New York 1978) V.2 R. Courths, S. Hüfner: Phys. Rep. 112, 55 (1984) V.3 H. Lüth, G. W. Rubloff, W. D. Grobmann: Solid State Commun. 18, 1427 (1975) V.4 H. Lüth: Solid Surfaces, Interfaces and Thin Films, 4th ed. (Springer, Berlin Heidelberg 2001) p. 319
Tafel V
Literatur
8. Magnetismus
In unseren bisherigen Überlegungen zur Elektronenstruktur der Materie waren wir von einer Einelektronennäherung ausgegangen: Energieterme und Bandstruktur wurden berechnet für ein Elektron in einem effektiven Potential, gebildet aus dem Potential der Ionenrümpfe und einem mittleren Potential der übrigen Elektronen. In diesem Modell lassen sich durchaus akzeptable Bandstrukturen berechnen. Wichtiger aber als eine qualitative Übereinstimmung mit dem Experiment und eine wenigstens im Prinzip einfache Rechenmethode ist ein anderer Aspekt des Einelektronenmodells. Im Einelektronenmodell lassen sich nämlich Anregungszustände des Elektronensystems, ausgelöst durch Wechselwirkung mit Photonen und anderen Teilchen, oder die thermische Anregung konzeptionell einfach verstehen. So wie das Termschema des H-Atoms das Modell für die Beschreibung der Elektronenterme aller Elemente bildet, ist das Einelektronenbild das Basismodell für das Verständnis des Festkörpers. Ferner gibt es Phänomene kollektiven Verhaltens der Elektronen, die ebenfalls einfacher Beschreibung zugänglich sind, wie zum Beispiel die Thomas-Fermi-Abschirmung (Abschn. 6.5) oder die Anregung von Ladungsdichtewellen (Abschn. 11.9). Bei magnetischen Erscheinungen im Festkörper, insbesondere beim Ferro- oder Antiferromagnetismus, mischen sich dagegen Einelektronen- und Vielelektronenaspekte in einer Weise, die es schwierig macht, einfache Grundmodelle herauszupräparieren. So werden wir zum Beispiel Anregungszustände kennen lernen, bei denen nur ein Elektronenspin umgeklappt wird und doch alle Valenz-Elektronen an diesem Anregungszustand beteiligt sind (Spinwellen). Darüber hinaus hat die Elektronentheorie des Magnetismus kollektive und lokale Aspekte, was ebenfalls das Verständnis erschwert. Ein Schwerpunkt dieses Kapitels ist der Ferromagnetismus der 3 d-Metalle Ni, Co und Fe, der durch Austauschwechselwirkung zwischen den weitgehend delokalisierten 3 d-Elektronen entsteht. Für die meisten magnetischen Verbindungen und insbesondere auch für die 4 f-Übergangsmetalle und ihre Verbindungen ist eine lokale Beschreibung angebracht. Auch der Antiferromagnetismus und die Spinwellen ergeben sich verhältnismäßig einfach aus der Austauschwechselwirkung zwischen lokalisierten Elektronen.
190
8. Magnetismus
8.1 Dia- und Paramagnetismus Die physikalischen Größen magnetische Feldstärke H und magnetische Induktion B sind im Vakuum durch die Relation B l0 H
8:1
verknüpft. Dabei ist l0 = 4 p·10–7 Vs/Am die Induktionskonstante. Zur Kennzeichnung des magnetischen Zustandes der Materie wird die Magnetisierung M verwendet (Sommerfeld-System). Dann gilt der Zusammenhang B l0
H M :
8:2
Es ist etwas unglücklich, dass im SI-System die Magnetisierung M und das Feld H die gleiche Dimension haben, obgleich sie begrifflich etwas Verschiedenes darstellen. Eine unangenehme Konsequenz ist, dass die Konversionsfaktoren aus dem cgs System in das SI-System für M und H verschieden sind. Für die Konversion von Hcgs in HSI gilt 1 Oe = 1 Gauss ) 1000/4 p Am–1; für die Konversion von Mcgs in MSI gilt 1 emu cm3= 1 Gauss ) 1000 Am–1. Dies schafft vor allem auch deshalb Verwirrung, weil nahezu alle Materialkonstanten in cgs-Einheiten tabelliert sind und auch die gegenwärtigen physikalischen Originalarbeiten auf dem Gebiet des Magnetismus sich auf das cgs-System beziehen. Bezüglich der Details der Problematik sei auf einen Artikel von Arrot verwiesen [8.1]. Die Magnetisierung M eines Festkörpers kann als Dichte magnetischer Dipolmomente m aufgefasst werden Mm
N : V
8:3
Wegen der oben beschriebenen Problematik ist es zweckmäßig, statt des äußeren Feldes H eine äußere Induktion B0 = l0 H einzuführen. Um die Sprache nicht zu umständlich zu gestalten, wollen wir diese Größe B0 einfach als „Magnetfeld“ bezeichnen. Zwischen dem „Feld“ B0 und der Magnetisierung M besteht häufig ein linearer Zusammenhang l0 M vB0
8:4
mit v der magnetischen Suszeptibilität. Ist v negativ, so ist die induzierte magnetische Polarisation entgegengesetzt zum angelegten Feld orientiert. Ein solches Verhalten heißt diamagnetisch, während umgekehrt das paramagnetische Verhalten durch v > 0 charakterisiert ist. Im allgemeinen setzt sich die Suszeptibilität von Atomen und damit auch die des Festkörpers aus einem dia- und einem paramagnetischen Anteil zusammen, den wir mit vd bzw. vp bezeichnen wollen. Der paramagnetische Anteil beruht auf der Orientierung bereits vorhandener magnetischer Momente, die ihrerseits vom Bahndrehimpuls und dem Spin der Elektronen verursacht wer-
8.1 Dia- und Paramagnetismus
191
den. So ist z. B. das magnetische Dipolmoment infolge der Bahndrehimpulse der Elektronen e X m ri pi lB L
8:5 2m i P mit h L = i ri ´ pi und dem Bohrschen Magneton lB = (eh/2m) (= 5,7884 ·10–5 eV/T = 9,2741·10–24 J/T; 1 T = 1 Tesla = 1 Vs/m2). Das Minuszeichen in (8.5) folgt daraus, dass der elektrische Strom wegen der negativen Elektronenladung den umgekehrten Umlaufsinn wie der Teilchenstrom hat. Die Elementarladung e wird hier wie im ganzen Buch also als positive Zahl eingeführt. Zusätzlich zum Bahnmoment bringen Elektronen noch Spinmomente mit, die sich zu einem Spinmoment des ganzen Atoms zusammensetzen X si lB g0 S :
8:6 m lB g0 i
Dabei ist g0 der elektronische g-Faktor (g0 = 2,0023) und si sind die (negativen) Elektronenspins. Wir haben (8.5, 8.6) schon so geschrieben, dass wir L und S ohne weiteres als Operatoren auffassen können. Die Vorzeichenwahl des Spinoperators erfolgte für das folgende zweckmäßigerweise so, dass Spinoperator und magnetisches Moment das gleiche Vorzeichen haben. Bildet man Erwartungswerte der Operatoren L und S für Atome, so sieht man, dass ein nicht verschwindender Erwartungswert sich nur für nichtabgeschlossene Schalen ergibt. Für abgeschlossene Schalen ist die Summe der Bahndrehimpulse und Spinquantenzahlen Null. Im Festkörper haben wir nicht abgeschlossene Schalen bei den Übergangsmetallen und seltenen Erden. Für beide lässt sich also paramagnetisches Verhalten erwarten. Neben dem Paramagnetismus gibt es auch einen Diamagnetismus der Elektronen. Er ist darauf zurückzuführen, dass durch ein äußeres Magnetfeld Kreisströme induziert werden. Nach der Lenzschen Regel ist das mit diesen Kreisströmen verbundene magnetische Moment dem angelegten Feld entgegengesetzt. Die Suszeptibilität bekommt dadurch einen negativen, diamagnetischen Beitrag. Zur Berechnung dieses diamagnetischen Beitrages müssen wir in der Schrödinger-Gleichung den Impulsoperator durch + e A ersetzen. Dabei ist A das Vektorpotential, welches mit dem B0-Feld durch die Bedingungen
p
B0 rot A
und divA 0
p
8:7
verknüpft ist. Für ein homogenes B0-Feld ist ein mögliches Vektorpotential durch A
1 2r
B0
8:8
gegeben. Man kann sich leicht überzeugen, dass (8.8) die Bedingungen (8.7) erfüllt. Wir können jetzt den kinetischen Anteil des Hamilton-Operators schreiben:
192
8. Magnetismus
H kin
1 X
2m i
p eA
1 X 2m i
p
i
i
2 i
2
1 X 2m i
e X
ri 2m i
2 e ri B0 2
p
i
p B i z
0z
e2 B20z X 2
x y2i : 8m i i
8:9
Bei dem zweiten Rechenschritt haben wir angenommen, dass B0 parallel zur z-Achse ist, und wir haben die Regeln der Vertauschung im Spatprodukt verwendet. Der Summenindex läuft über alle Elektronen. Der zweite Term in dem obigen Ausdruck ist nichts anderes als der schon diskutierte Paramagnetismus durch den Bahndrehimpuls. Aus dem Vergleich von (8.9) mit (8.5) folgt für den Erwartungswert des magnetischen Momentes in einem Zustand u m
@hujH jui @B0z
lB hujLz jui
X e2
x2i y2i jui : B0z huj 4m i
8:10
Der erste Term in (8.10) stellt ein magnetisches Moment auch ohne Anwesenheit eines Feldes dar und liefert im Zusammenwirken mit der Besetzungsstatistik der Energieterme verschiedener Orientierungen des magnetischen Momentes im äußeren Feld den temperaturabhängigen Paramagnetismus. Der zweite Term ist für den Diamagnetismus verantwortlich. Setzen wir zunächst wegen der kugelsymmetrischen Ladungsverteilung in Atomen hujx2i jui hujy2i jui 13 hujr2i jui ;
8:11
so erhalten wir für die Suszeptibilität (im SI-System) v
e2 n X l hujr2i jui ; 6m 0 i
8:12
wobei n die Anzahl der Atome pro Volumen ist. In der Summe über die Matrixelemente sind natürlich vor allem die Elektronen der äußeren Schale wichtig, da ihr mittleres Abstandsquadrat am größten ist. Bezeichnen wir die Zahl der äußeren Elektronen mit Za, und setzen wir für r 2i das Quadrat des Ionen- bzw. Atomradius ra ein, so erhalten wir v
e2 l n Za ra2 : 6m 0
8:13
Tatsächlich korrelieren die gemessenen Werte für die diamagnetische Suszeptibilität für Atome und Ionen mit abgeschlossener Schale recht gut mit Za r2a (Abb. 8.1). Allerdings zeigen die Werte, dass die obige Abschätzung durch einen Vorfaktor von *0,35 zu
8.1 Dia- und Paramagnetismus
193
Abb. 8.1. Molare diamagnetische Suszeptibilität (in cgs-Einheiten) von Atomen und Ionen mit abgeschlossener Schale als Funktion von Za r 2a . Um die Suszeptibilität eines Stoffes, z. B. eines Gases, aus diesen Atomen oder Ionen zu erhalten, ist mit der Dichte in mol/ cm3 zu multiplizieren. Setzt man den ˚ ] ein, so gibt der Ionenradius ra in [A Zahlenwert von Za r 2a gleich eine Abschätzung für v in 10–6 cm3/mol. Wollen wir v auf das SI-System umrechnen, so ist mit 4 p zu multiplizieren!
ergänzen wäre. Aus Abb. 8.1 entnehmen wir auch, dass für typische Festkörperdichten von 0,2 mol/cm3 die Suszeptibilität etwa 10–4 (SI) ist, also klein gegen 1. Die gleiche Größenordnung ergibt sich für eventuelle paramagnetische Anteile. Wir können also feststellen, dass, abgesehen vom Fall des noch zu besprechenden Ferromagnetismus, die magnetische Suszeptibilität des Festkörpers einen kleinen Wert hat. Im Gegensatz dazu ist die elektrische Suszeptibilität von der Größenordnung 1 oder größer. Das erklärt, warum in der Festkörperspektroskopie mit elektromagnetischer Strahlung, die ja zu den wichtigsten experimentellen Untersuchungsmethoden zählt, häufig nur elektrische Effekte betrachtet werden (Kap. 11). Wir haben bislang Elektronen betrachtet, die an Atome gebunden sind. Für die freien Elektronen eines Metalles ist (8.10) nicht verwendbar. Zur Berechnung des Diamagnetismus freier Elektronen müsste man die Schrödinger-Gleichung für freie Elektronen mit Magnetfeld lösen (Tafel VIII) und könnte dann aus den Energietermen die freie Energie mit Magnetfeld und daraus wiederum die Suszeptibilität berechnen. Der letztere Teil ist allerdings mathematisch recht aufwendig und bringt vergleichsweise wenig neue Einsichten, zumal ja auch das Modell des freien Elektronengases nur eine sehr grobe Näherung darstellt. Es soll aber noch bemerkt werden, dass es sich beim Diamagnetismus freier Elektronen um einen genuinen Quanteneffekt handelt. Für ein klassisches Gas freier Elektronen hängt die freie Energie nicht vom Magnetfeld ab, die diamagnetische Suszeptibilität verschwindet also. Wir sehen das schon an (8.9): Das Magnetfeld verschiebt gewissermaßen nur
194
8. Magnetismus
die Impulse um e A. Bildet man ein Zustandsintegral, in dem über alle Impulse integriert wird, so hängt das Ergebnis nicht von A, und damit nicht vom Magnetfeld ab. Neben dem Diamagnetismus durch die Bahnbewegung haben freie Elektronen aber auch einen Paramagnetismus (Pauli-Paramagnetismus). Dieser Teil ist leicht zu berechnen. Wir können uns auch den Umweg über die freie Energie sparen. Liegt kein Magnetfeld an, so sind die Zustände mit den beiden verschiedenen Spineinstellungen energiegleich (entartet). In einem Magnetfeld richten sich die Spins aus, und Elektronen mit dem Spin parallel zu den Linien des B0-Feldes befinden sich auf Zuständen, die in ihrer Energie um – 12 g0 lB B0 gegenüber den feldfreien Zuständen abgesenkt sind. Die antiparallele Stellung bewirkt eine Anhebung der Energie um +12 g0 lB B0. Die Energieparabel D (E) (Abb. 6.4) spaltet also in zwei Parabeln (Abb. 8.2) auf, die auf der Energieachse um g0 lB B0 gegeneinander verschoben sind. Aus der Abb. 8.2 folgt, dass im Rahmen der Näherung k T EF die Volumen-Dichte der Elektronen, die ihr Spinmoment nicht kompensieren können, ungefähr gleich 1 2 D (EF)g0 lB B0 ist (doppelt schraffierte Fläche in Abb. 8.2). Zur Magnetisierung trägt jedes dieser Elektronen das magnetische Moment 1 2 g0 lB bei und es ergibt sich für die Magnetisierung M 12 D
EF g0 lB B0 12 g0 lB :
8:14
Somit erhalten wir eine temperaturunabhängige paramagnetische Suszeptibilität vp g20 2
8:15 l D
EF l0 l2B D
EF : 4 B Wenn wir den diamagnetischen Anteil, den wir hier nicht berechnet haben, mit hinzurechnen, so ergibt sich 1 m 2 :
8:16 v l0 l2B D
EF 1 3 m
vp l0
Abb. 8.2. Zum Paramagnetismus freier Elektronen: Die Zustandsdichte D (E) spaltet in einem Magnetfeld B0 in zwei gegeneinander verschobene Parabeln auf, so daß ein resultierendes magnetisches Moment von Elektronenspins, parallel zu B0 orientiert, übrigbleibt (doppelt schraffierte Fläche)
8.2 Austauschwechselwirkung
195
Hierbei ist m die sog. effektive Masse der Ladungsträger, die der Tatsache Rechnung trägt, dass die Elektronen sich nicht im Vakuum, sondern im Kristallgitter bewegen (Abschn. 9.1). Je nach dem Wert der effektiven Masse können also die Ladungsträger paramagnetisches oder diamagnetisches Verhalten zeigen. Wir können auch die Größenordnung der Suszeptibilität von Leitungselektronen abschätzen: Werte für die Zustandsdichte am Fermi-Niveau erhält man aus der spez. Wärme (Tabelle 6.2) der Leitungselektronen. Setzen wir m= m, so erhalten wir z. B. für die molare Suszeptibilität von Natrium vm = 1,96 ·10–4 cm3/mol bzw. v = 8,6 ·10–6, wenn man mit der Dichte von metallischem Natrium multipliziert. Auch der Pauli-Paramagnetismus führt also nicht zu großen Werten für die Suszeptibilität. Er ist von der gleichen Größenordnung wie der Diamagnetismus abgeschlossener Schalen. Somit könnte man das Kapitel magnetische Effekte in Festkörpern schnell „zu den Akten“ legen, gäbe es nicht ein Phänomen kollektiver Kopplung von Elektronenspins, mit dem wir uns nun beschäftigen wollen.
8.2 Austauschwechselwirkung Zur Beschreibung der Austauschwechselwirkung zwischen lokalisierten Elektronen gehen wir zurück auf das Wasserstoffmolekül als den Prototyp der kovalenten Bindung. Die Einelektronennäherung dazu haben wir schon in Abschn. 1.2 besprochen. Unter Berücksichtigung beider Elektronen (bezeichnet mit 1 und 2) lässt sich der Hamilton-Operator H (1, 2) in drei Anteile zerlegen
H
1; 2 H
1 H
2 H w
1; 2 : Dabei sind H (1) und H (2) Hamilton-Operatoren
8:17
W
1; 2 uA
1 uB
1uA
2 uB
2
8:18
wie in (1.2) jeweils ausgeschrieben für die Koordinaten des Elektrons 1 und des Elektrons 2, H w (1, 2) bezeichnet den verbleibenden Wechselwirkungsterm zwischen den Elektronen. Wir kommen von (8.17) zurück zur Einelektronennäherung, wenn wir H w (1, 2) vernachlässigen und die Gesamtwellenfunktion (ohne Spinanteil) ansetzen als Produkt der Einelektronenlösungen. Für den Grundzustand wäre das mit den Atomfunktionen uA und uB. Man sieht gleich, dass das Eigenwertproblem sich so separiert. Der Rechengang verläuft dann wie in Abschn. 1.2. Den Ansatz (8.18) kann man durch Ausmultiplizieren auch schreiben: W
1; 2 uA
1uB
2 uB
1uA
2 uA
1uA
2 uB
1uB
2 :
8:19
196
8. Magnetismus
Man sieht, dass in diesem Ansatz Zustände, bei denen sich beide Elektronen an einem Atom befinden („ionische Zustände“), gleichwertig vertreten sind. Das ist in der Tat ganz in Ordnung, solange wir die repulsive Coulomb-Wechselwirkung vernachlässigen bzw. in einem effektiven Potential der Ionen verstecken. Für einen Hamilton-Operator mit Elektron-Elektron-Wechselwirkung ist (8.19) aber ein schlechter Ansatz, vor allem für weiter voneinander entfernte Kerne. Es ist dann besser, die ionischen Zustände wegzulassen. So gelangt man zur Näherung von Heitler und London W
1; 2 uA
1uB
2 uB
1uA
2 :
8:20
Dieser Ansatz ist symmetrisch in den Koordinaten der Elektronen. Da die Gesamtwellenfunktion mit Spinfunktion antisymmetrisch sein muss (verallgemeinertes Pauli-Prinzip), sind also die Spins in diesem Zustand antiparallel (Singulett-Zustand). Ein Triplett-Zustand mit paralleler Orientierung beschreibt die in den Ortskoordinaten antisymmetrische Gesamtwellenfunktion W
1; 2 uA
1uB
2
uB
1uA
2 :
8:21
Mit diesen beiden Ansätzen lassen sich die Erwartungswerte der Energie ausrechnen, und wir erhalten nach einiger Zwischenrechnung E
hW
1; 2jH jW
1; 2i CA 2 EI hW
1; 2jW
1; 2i 1S
8:22
mit EI der Ionisierungsenergie eines Wasserstoffatoms, mit C dem sog. Coulombintegral, mit A dem Austauschintegral und schließlich mit S dem Überlappintegral. Das +-Zeichen in (8.22) entspricht dem Singulett-Zustand.
h2 e2 D1 EI uA
1 u
1dr1 ;
8:23 2m 4p e0 rA1 A C
e2 4 p e0
1 1 RAB r12
1 rA2
1 juA
1j2 juB
2j2 dr1 dr2 ; rB1
8:24
e2 A 4 p e0
1 1 RAB r12
1 rA1
1 u
1uA
2uB
1uB
2dr1 dr2 ; rB2 A
8:25
S uA
1uA
2uB
1uB
2dr1 dr2 :
8:26
Das Ergebnis für die Energieterme im Zweielektronenmodell (8.22) ist durchaus verschieden vom Einelektronenmodell. Auch ist die Bedeutung der Energieterme (8.22) verschieden. Wir wollen
8.2 Austauschwechselwirkung
197
Abb. 8.3. Energieterme für Elektronenpaarbindung im Einelektronen- und Zweielektronenbild
diese unterschiedliche Bedeutung an Hand von Abb. 8.3 darlegen. Im Termschema des Einelektronenmodells sind die Energieterme durch zwei Elektronen, aber auch nur durch ein Elektron besetzbar. Ein angeregter Zustand in diesem Modell ist z. B. die Besetzung des niedrigsten Terms mit einem und des nächst höheren Terms mit dem zweiten Elektron. Der angeregte Zustand kann ein Singulett oder Triplett sein, die Energien sind notwendig entartet. Die Entartung der Energie für beide Zustände ist auch formal leicht einzusehen, wenn man unter Vernachlässigung der ElektronElektron-Wechselwirkung mit dem Hamilton-Operator (8.17) Erwartungswerte bildet. Im Zweielektronenbild gibt es keine Energien für einzelne Elektronen, sondern nur eine Gesamtenergie für beide. Der Grundzustand ist wie beim Einelektronenbild ein Singulett, der erste angeregte Zustand aber ein Triplett. Wir sehen an diesem Beispiel, dass das Termschema der in Kap. 6 und 7 berechneten Bandstrukturen nur im Einelektronenbild Sinn macht. In einem Vielteilchenbild würde die Energie des Grundzustandes nur durch eine Gesamtenergie, also einen „Term“, zu symbolisieren sein. Dieser Unterschied zwischen Einteilchen- und Vielteilchenbild wird uns im Kap. 10 erneut begegnen. Die Energiedifferenz zwischen Triplett-Zustand und SingulettZustand berechnen wir aus (8.22) und erhalten CS A :
8:27 1 S2 Die Größe J, welche die Aufspaltung der Energieterme für parallele und antiparallele Spineinstellung angibt, heißt Austauschkonstante. Sie ist für das Wasserstoffmolekül stets negativ und der Singulettzustand ist deshalb der Zustand niedriger Energie. Mit Hilfe der Austauschkonstanten ist es möglich, einen Modell-HamiltonOperator einzuführen, der nur auf die Spinfunktionen der beiden Elektronen wirkt und der die gleiche Aufspaltung der Energien für parallele und antiparallele Orientierung bewirkt (zum Beweis siehe z. B. [8.1] bzw. Lehrbücher der Quantenmechanik)
Et
Es
J2
198
H spin
8. Magnetismus
2Jr1 r2 :
8:28
Die Operatoren r können durch die Paulischen Spinmatrizen dargestellt werden. Ferromagnetische Kopplung zwischen beiden Elektronen erhält man für J > 0. Dieser nach Heisenberg benannte Hamilton-Operator ist Ausgangspunkt vieler Modelltheorien zum Magnetismus, soweit er verstanden werden kann im Modell einer jeweils paarweisen Kopplung zwischen Elektronen. Dies ist aber gerade bei den typischen Ferromagneten, den 3 d-Übergangsmetallen Ni, Co und Fe, nicht der Fall. Wir benötigen also über den Heisenberg-Operator hinaus noch die Beschreibung einer kollektiven Austauschwechselwirkung. Wir werden sie am Beispiel des freien Elektronengases studieren.
8.3 Austauschwechselwirkung zwischen freien Elektronen Während die Austauschwechselwirkung bei der Elektronenpaarbindung negativ ist, erhält man für freie Elektronen eine positive Austauschwechselwirkung. Dies lässt sich durch die Betrachtung zweier freier Elektronen i und j und ihrer Paarwellenfunktion Wij zeigen. Für Elektronen mit gleichem Spin muss die Paarwellenfunktion in den Ortskoordinaten antisymmetrisch sein. Die Antisymmetrisierung ergibt 1 W ij p
ei ki ri ei kj rj ei ki rj ei kj ri 2V 1 i
ki ri kj rj
1 e i
ki kj
ri p e 2V
rj
:
8:29
Dann ist die Wahrscheinlichkeit, das Elektron i in einem Volumenelement dri und das Elektron j in einem Volumenelement drj zu finden, gleich |w|ij2 dri drj: 1 1 cos
ki kj
ri rj dri drj :
8:30 V2 An diesem Ausdruck sieht man schon alles Wesentliche: Die Wahrscheinlichkeit, zwei Elektronen mit gleichem Spin am gleichen Ort zu finden, verschwindet für beliebige ki, kj . Dadurch können für ein bestimmtes Aufelektron die übrigen Elektronen mit gleichem Spin das Coulomb-Potential der Ionenrümpfe lokal nicht mehr so gut abschirmen, was eine Absenkung der Energie für das Aufelektron zur Folge hat. Dieser Absenkungseffekt wird verstärkt, wenn ein möglichst hoher Prozentsatz aller Elektronen den gleichen Spin wie das Aufelektron hat. Im Endeffekt ergibt sich so ein Energiegewinn für eine Einelektronenenergie bei paralleler Spinstellung und eine Art kollektiver Austauschwechselwirkung mit positivem Vorzeichen. jW ij j2 dri drj
8.3 Austauschwechselwirkung zwischen freien Elektronen
199
Bevor wir diesen Gedanken im Hinblick auf eine modellmäßige Beschreibung des Ferromagnetismus weiter ausbauen, ist es ganz nützlich, die kombinierte Aufenthaltswahrscheinlichkeit (8.30) noch etwas weiter zu betrachten. Wir können aus (8.30) zu einer über die k-Abhängigkeit gemittelten Wahrscheinlichkeit gelangen, indem wir über die Fermi-Kugel integrieren. Wir führen dazu die Relativkoordinate zwischen den Elektronen i und j mit r = ri – rj ein. Wir nehmen weiter das Aufelektron bei r = 0 an und fragen nach der Wahrscheinlichkeit, dass ein zweites mit gleichem Spin im Abstand r im Volumenelement dr zu finden ist. Diese Wahrscheinlichkeit ist dann P
r"" dr n" dr1
cos
ki
kj r
8:31
mit n: der Elektronenkonzentration der gleichen Spinorientierung, welche halb so groß ist wie die Gesamtkonzentration n der Elektronen. Statt der Wahrscheinlichkeit können wir auch von einer für das Aufelektron wirksamen Elektronendichte sprechen, die wir wegen ihrer Herkunft von der Austauschwechselwirkung mit Rex (r) bezeichnen, en Rex
r 1 cos
ki kj r mit n" n=2 :
8:32 2 Führen wir nun die Mittelung über die Fermi-Kugel aus, so erhalten wir Rex
r
en 1 2 2
en6 6 61 2 4
cos
ki
kj r
3
1 1 i
k 2 dki dkj
e i 2 4p 3 kF 3
kj r
e
i
ki kj r
7 7 7 : 5
8:33 a 1
0 enB B Rex
r B1 2 @
1
dki e 4p 3 2 k 3 F
i ki r
C C dkj ei kj r C : A
Diese Integrale sind analog zu (3.40) lösbar ! en
sin kF r kF r cos kF r2 Rex
r 1 9 : 2
kF r6
8:33 b
8:34
Die Gesamtladungsdichte, die ein freies Elektron sieht, ist diese Summe aus der Ladungsdichte der Elektronen mit gleichem Spin und der homogenen Ladungsdichte e n/2 der Elektronen mit umgekehrtem Spin, für die der Ortsteil der Wellenfunktion symmetrisch, also unverändert bleibt, d. h.
200
8. Magnetismus
Abb. 8.4. Effektive Ladungsdichte, die ein Elektron in einem Elektronengas „sieht“. Durch Austauschwechselwirkung ist die Dichte von Elektronen gleicher Spinorientierung in der Nähe des Aufelektrons reduziert („Austauschloch“). Bewegt sich das Aufelektron, so muß es das Austauschloch mitschleppen, wodurch sich seine effektive Masse (s. Abschn. 9.1) erhöht. Außerdem aber bedeutet die Existenz des Austauschloches eine positive Austauschkopplung. Dadurch erhalten wir ein Modell für den Ferromagnetismus von Bandelektronen
Reff
r e n 1
9
sin kF r kF r cos kF r2 2
kF r6
! :
8:35
Diese Ladungsdichte ist in Abb. 8.4 aufgetragen. Die Elektronendichte ist um r = 0 reduziert als Folge der Austauschwechselwirkung. Dadurch entsteht ein „Austauschloch“, dessen Größe etwa durch den zweifachen reziproken Fermi-Vektor gegeben ist. Nach Ta˚ . Wir können die effektive belle 6.1 ist der Radius also etwa 1–2 A Ladungsdichte Reff (r) dazu benutzen, eine neue („renormierte“) Schrödinger-Gleichung für das freie Elektronengas aufzustellen und würden damit zur Hartree-Fock-Näherung gelangen. Wir bedenken aber, dass die Elektron-Elektron-Korrelation durch (8.35) nicht richtig wiedergegeben wird, da die Coulomb-Wechselwirkung eigentlich auch den Aufenthalt zweier Elektronen mit verschiedenem Spin am gleichen Ort verbietet. Auch ist die durch (8.30) ausgedrückte Korrelation von zwei Elektronen, die beliebig weit voneinander entfernt sind, ein unrealistisches Ergebnis des Ansatzes ebener Wellen.
8.4 Das Bandmodell für den Ferromagnetismus Wir wollen nun mit der qualitativ festgestellten Renormierung der Einelektronenterme durch die Korrelation von Elektronen mit gleichem Spin ein einfaches Bandmodell des Ferromagnetismus aufbauen. Das Modell geht auf Stoner und Wohlfarth zurück. Wir machen für die renormierten Einelektronenenergien den Ansatz E"
k E
k E#
k E
k
I n" =N ; I n# =N ;
(8.36)
8.4 Das Bandmodell für den Ferromagnetismus
201
E (k) sind die Energiewerte einer normalen Einelektronenbandstruktur, n: und n; die Anzahl der Elektronen mit entsprechendem Spin und N ist die Zahl der Atome. Der nach Stoner benannte Parameter I beschreibt die durch die Elektronenkorrelation bewirkte Energieabsenkung. Die Abhängigkeit vom Wellenzahlvektor sei in diesem Modell vernachlässigt. Wir führen jetzt den relativen Überschuss der Elektronen einer Spinsorte mit R
n"
n#
8:37
N
ein. Diese Größe ist bis auf den Faktor lB (N/ V) gleich der Magnetisierung M (8.3). Ferner ziehen wir von den Einelektronenenergien zwecks einer bequemen Schreibweise I (n:+n;)/2 N ab und erhalten statt (8.36) ) E"
k E~
k I R=2 mit E~
k E
k I
n" n# =2N : E#
k E~
k I R=2
8:38 Das Gleichungspaar (8.38) demonstriert eine k-unabhängige Aufspaltung der Energiebänder mit verschiedenem Spin. Die Unabhängigkeit der Austauschaufspaltung ist natürlich nur eine Näherung. Sie ist aber auch nach neueren Theorien etwa innerhalb eines Faktors zwei gegeben. Die Größe der Aufspaltung hängt von R, also von der relativen Besetzung der Subbänder ab. Die Besetzungswahrscheinlichkeit wird aber durch die Fermi-Statistik vorgegeben. So gelangen wir zu einer Selbstkonsistenzbedingung: R
1X f"
k N k 1X N
k
e
f#
k 1
1
k
E~
k I R=2 EF = T
1
e
k
E~
kI R=2 EF = T
1
:
8:39
Diese Gleichung hat unter bestimmten Bedingungen eine nicht verschwindende Lösung für R, d. h. es existiert ein magnetisches Moment ohne angelegtes Feld und damit Ferromagnetismus. Man kann ein Kriterium für das Auftreten von Ferromagnetismus angeben. Dazu entwickeln wir die rechte Seite der Gleichung nach kleinen R unter Beachtung, dass Dx Dx 2 Dx 3 000 0 f x f x f
xDx f
x
8:40 2 2 3! 2 ist, d. h. R
1 X @f
k IR N k @E~
k
1 1 X @ 3 f
k
I R3 : 3 ~ 24 N k @E
k
8:41
202
8. Magnetismus
Dabei ist die erste Ableitung der Fermi-Funktion kleiner als Null, während die dritte Ableitung größer als Null ist. Die Bedingung für Ferromagnetismus (R > 0) ist also I X @f
k 1 >0:
8:42 N k @E~
k Die Ableitung der Fermi-Funktion @f =@E~ hat offensichtlich (Abb. 6.6) ihren größten Wert bei T ? 0. Wenn die Bedingung (8.42) also überhaupt erfüllt wird, dann am leichtesten bei T = 0. Für den Fall T = 0 können wir aber den Wert der Summe über alle k-Werte einfach berechnen
1 X @f
k V @f dk N k @E~
k
2 p3 N @E~
V 1 1V D
EF :
8:43 dk d
E~ EF 3 N 2N
2 p Hierbei wurde berücksichtigt, dass bei T = 0 die Fermi-Funktion eine Stufenfunktion ist und deshalb die Ableitung @f =@E~ gleich der d-Funktion d
E~ EF ist. Der Faktor 1/2 rührt daher, dass gemäß (8.39) und (8.41) die Summe über k und also auch das Integral sich nur über die Elektronen einer Spinsorte erstreckt, während mit der üblichen Definition der Zustandsdichte die Zahl der Elektronen mit positivem und negativem Spin pro Volumen gemeint ist. Die Summe ist also gleich der halben Zustandsdichte für Elektronen am Fermi-Niveau, wenn diese nicht auf das Volumen, sondern auf die Zahl der Atome bezogen ist. Wir führen die Zustandsdichte pro Atom und Spinsorte ein durch V D~
EF D
EF
8:44 2N Die Bedingung, dass überhaupt Ferromagnetismus auftritt, bedeutet dann einfach ID~
EF > 1 :
8:45
Dies ist das sog. Stoner-Kriterium für das Auftreten von Ferromagnetismus. Unter der Voraussetzung, dass dieses Kriterium erfüllt ist, liefert (8.42) auch die Temperatur, bei der das magnetische Moment verschwindet (Curie-Temperatur), wenn man (8.42) als Gleichung statt als Ungleichung liest. Damit werden wir uns im nächsten Abschnitt befassen. Die Abb. 8.5 zeigt den Stoner-Parameter, die Zustandsdichte und das Produkt aus beiden nach einer theoretischen Behandlung durch Janak [8.2]. Die Theorie sagt richtig nur für die Elemente Fe, Co, Ni ferromagnetisches Verhalten voraus. Für die Elemente der 4 d-Reihe sind sowohl die Zustandsdichte als auch der Stoner-Parameter zu klein, um einen ferromagnetischen Zustand zu erreichen. Trotzdem kommt es zu einer nicht unerheblichen Verstärkung der magnetischen Suszeptibilität durch
8.4 Das Bandmodell für den Ferromagnetismus
203
Abb. 8.5. (a) Integral der Austauschkorrelation (Stoner-Parameter) I als Funktion der Ordnungszahl (nach Janak [8.2]). (b) Zustandsdichte pro Atom D~ (EF); (c) das Produkt aus Zustandsdichte D~ (EF) und Stoner-Parameter I. Die Elemente Fe, Co und Ni mit Werten von ID~ (EF > 1) zeigen Ferromagnetismus. Die Elemente Ca, Sc und Pd kommen einer ferromagnetischen Kopplung schon recht nahe
die positive Austauschwechselwirkung zwischen den Bandelektronen. Bei äußerem Magnetfeld B0 hat man in (8.39) zusätzlich zur Austauschaufspaltung um IR/2 eine Aufspaltung um lB B0. Aus (8.41) wird dann in erster Näherung für R bei T = 0 R D~
EF
I R 2lB B0 : Somit erhält man für die Magnetisierung M N N M lB R D~
EF I M 2l2B B0 V V N D~
EF B0 : M 2l2B V 1 I D~
EF
8:46
8:47
Der Zähler ist gerade die normale Pauli-Suszeptibilität von Bandelektronen (8.15), die aber nun durch den Nenner erheblich verstärkt ist. Bezeichnen wir die Pauli-Suszeptibilität mit v0, so erhält man
204
8. Magnetismus
v
v0 : I D~
EF
1
8:48
Janak [8.2] berechnete für den Faktor v/v0 Werte bis zu ca. 4,5 (Ca), 6,1 (Sc) oder 4,5 (Pd). Zusammen mit der an sich schon hohen Zustandsdichte ergeben sich also vergleichsweise große Werte für die Suszeptibilität dieser Elemente. Ein direkter Vergleich mit dem Experiment müsste allerdings den Magnetismus durch Bahnmomente mit berücksichtigen. In jedem Fall gilt aber, was schon vorher gesagt wurde, nämlich dass v1 ist.
8.5 Das Temperaturverhalten eines Ferromagneten im Bandmodell Wir wollen uns jetzt der Temperaturabhängigkeit der Sättigungsmagnetisierung eines Ferromagneten zuwenden. Dazu könnte man (8.39) unter Zuhilfenahme einer Einelektronen-Bandstrukturrechnung auswerten. Der damit verbundene mathematische Aufwand lohnt allerdings nicht: Die k-unabhängige und delokale Berücksichtigung der Austauschwechselwirkung liefert keine Aussagen von quantitativem Wert. Ein qualitatives Bild des Temperaturverhaltens lässt sich aber auch mit einer stark vereinfachten Zustandsdichte gewinnen, die die Rechnungen auf ein Minimum beschränkt. Werfen wir einen Blick auf die Zustandsdichte von Ni (Abb. 8.6 a) gemäß einer Bandstrukturrechnung von Callaway und Wang [8.3]: Der größte Beitrag zur Zustandsdichte am Fermi-Niveau wird von den d-Elektronen geliefert, einmal wegen ihrer großen Zahl (9,46 pro Atom, s. u.), zum anderen, weil das d-Band nur ca. 4 eV breit ist (im Gegensatz zum sBand). Hinzu kommt, dass die Austauschaufspaltung für s-Elektronen klein ist. Die unterschiedliche Besetzung der d-Bänder für Majoritätsspin und Minoritätsspin führt also zur Magnetisierung. Bei T = 0 ist diese bei Nickel einfach durch die Zahl der nichtbesetzten d-Zustände des Minoritätsbandes gegeben. Aus der gemessenen Magnetisierung bei T = 0 errechnet sich so die Zahl der d-Löcher zu 0,54 pro Atom für das Beispiel Nickel, also ein effektives magnetisches Moment von lBeff*0,54 lB pro Atom. Der Verlauf der Magnetisierung mit der Temperatur und der Curie-Punkt, an dem die Magnetisierung verschwindet, ergibt sich aus dem Zusammenspiel von Austauschaufspaltung, Fermi-Statistik und der Zustandsdichte in der Nähe des Fermi-Niveaus gemäß (8.39). Für eine qualitative Diskussion von (8.39) brauchen wir nicht den tatsächlichen Verlauf der Zustandsdichte zu verwenden, sondern es genügt, die scharfen Spitzen der Zustandsdichte an der oberen Kante des d-Bandes durch eine dFunktion in der Energie zu symbolisieren (Abb. 8.6 b). Wenn wir zusätzlich zur Austauschaufspaltung noch eine Feldaufspaltung wie in (8.46) mitnehmen, wäre unsere Modellzustandsdichte also
8.5 Das Temperaturverhalten eines Ferromagneten im Bandmodell
205
Abb. 8.6. (a) Errechnete Zustandsdichte von Nickel (nach Callaway und Wang [8.3]). Die Austauschaufspaltung beträgt nach diesen Rechnungen etwa 0,6 eV. In der Photoelektronenspektroskopie wurde ein Wert von ca. 0,3 eV bestimmt. Allerdings sind beide Werte nur bedingt vergleichbar, da ein photoemittiertes Elektron ein Loch hinterläßt, der Festkörper also in einem angeregten Zustand verbleibt. Der Abstand D zwischen der Oberkante des d-Bandes der Majoritätsspin-Elektronen und der Fermi-Energie heißt auch Stoner-Energielücke. Im Bild der Bandstruktur ist dies die minimale Energie für einen SpinUmklapp-Prozeß (die s-Elektronen werden in dieser Betrachtung nicht mit berücksichtigt). (b) Modellzustandsdichte zur Beschreibung des thermischen Verhaltens eines Ferromagneten
D~
E
lBeff d
E lB
EF
lB B0
IR=2d
E
EF lB B0 IR=2 :
8:49
Da die Zustände für Majoritätsspin und Minoritätsspin in diesem Modell gleiches Gewicht haben, liegt das Fermi-Niveau immer auf der Mitte zwischen beiden Termen, was wir durch den Ansatz bereits zum Ausdruck gebracht haben. Anstelle von (8.39) erhalten wir ! lBeff 1 1 R :
8:50 lB
l B IR=2=k T
l B IR=2=k T e B 0 1 e B 0 1 Für diese Gleichung suchen wir zunächst ferromagnetische Lösungen, also Lösungen mit R = 0 bei B0 = 0. Mit den Abkürzungen Tc = I lBeff /lB 4 k und R~ = lB /lBeff R wird aus (8.50) 1 1 R~Tc
8:51 tanh R~ 2R~ T =T ~ c T: 1 e2R Tc =T 1 e Grenzlösungen dieser Gleichung sind R~ = 1 für T = 0 und R~ = 0 für T = Tc. Tc ist also die schon eingeführte Curie-Temperatur, oberhalb der die spontane Magnetisierung verschwindet. Den Verlauf im ganzen Temperaturbereich zeigt Abb. 8.7. Da die Magnetisierung M pro-
206
8. Magnetismus
Abb. 8.7. Verlauf der Magnetisierung eines Ferromagneten unterhalb der Curie-Temperatur Tc. Experimentelle Werte für Nickel nach Weiss [8.4, 8.5]
portional zu R ist, sollte Abb. 8.7 den Temperaturverlauf der spontanen Magnetisierung eines Ferromagneten wiedergeben. Die Übereinstimmung mit dem experimentellen Verlauf ist auch ganz passabel (Abb. 8.7). Für die Grenzfälle T Tc und T*Tc lassen sich durch Entwicklung der rechten Seite von (8.51) Grenzverläufe angeben: R~ 1
2e p R~ 3 1
2Tc =T
T Tc
1=2
T Tc ; T Tc ; R~ 1 mit
8:52 tanh x x
1 3 x ... : 3
8:53
Beide Gleichungen werden vom Experiment jedoch nicht bestätigt. Der kritische Exponent in der Nähe des Curie-Punktes ist 1/3 (Abb. 8.8) und nicht 1/2. Der Verlauf bei tiefen Temperaturen wird auch durch (8.52) nicht korrekt wiedergegeben. Das liegt daran, dass es neben dem Umklappen eines Spins durch Umbesetzung in den Bändern im Ferromagneten noch andere elementare Anregungen mit kleinerer Quantenenergie gibt, die ebenfalls einen Spin umklappen (Abschn. 8.8). Oberhalb der Curie-Temperatur erhält man aus (8.50) eine Magnetisierung nur, wenn das B0-Feld ungleich Null ist. Wir können die Fermi-Funktion für kleine R und B0 entwickeln l Tc R~ B B0 R~ bzw: T kT
8:54
l R~ B
8:55
k
1 T
Tc
B0 :
8.5 Das Temperaturverhalten eines Ferromagneten im Bandmodell
207
Abb. 8.8. Verlauf der Magnetisierung in der Nähe des Curiepunktes. Experimentelle Werte für Nickel nach Weiss [8.4, 8.5]. Der kritische Exponent in der Nähe des Übergangs in die paramagnetische Phase oberhalb des Curie-Punktes beträgt 1/3 und nicht 1/2 wie unser einfaches Modell vorhersagt
Die paramagnetische Suszeptibilität oberhalb von Tc sollte also mit Annäherung an Tc entsprechend dem Gesetz v
C T
Tc
8:56
divergieren. Dies ist das sog. Curie-Weiss-Gesetz mit C der CurieWeiss-Konstanten. Das Curie-Weiss-Gesetz ist experimentell für T Tc erfüllt. Mit Annäherung an Tc ergeben sich aber Abweichungen, die besser durch eine Zunahme proportional mit (T–Tc)–4/3 beschrieben werden. Nach unserem Modell ist die Curie-WeissKonstante C mit der Sättigungsmagnetisierung bei T = 0 verknüpft. Dieser Zusammenhang würde aber zu kleine Werte für C liefern. Ferner könnten wir versuchen, die Verknüpfungen zwischen dem Stoner-Parameter I und der Curie-Temperatur Tc (im Modell hier: Tc = I lBeff /4 lB k ) zu benutzen, um Tc aus einem gemessenen Wert der Austauschaufspaltung abzuschätzen. Dieses Verfahren würde viel zu große Werte von Tc liefern. Das Versagen unseres einfachen Modells in diesem Punkt liegt jedoch nicht an der hier verwendeten einfachen Bandstruktur sondern ist darin begründet, dass unser Modell die Anregungszustände nicht korrekt behandelt. Das Curie-Weiss-Gesetz, ebenso wie die Abhängigkeit der spontanen Magnetisierung von der Temperatur, wird auch häufig in einer Molekularfeld-Näherung hergeleitet, bei der die Austauschwechselwirkung durch ein mittleres „inneres“ Feld ersetzt wird. Die hier gewählte Herleitung, die im Prinzip auf E. C. Stoner zurückgeht, ist der Molekularfeld-Näherung insoweit äquivalent, als sie örtliche Variationen der Spinverteilung nicht zulässt. Deutlicher als die Molekularfeld-Näherung beleuchtet unsere Betrachtung aber den Zusammenhang mit der Bandstruktur.
208
8. Magnetismus
8.6 Ferromagnetische Kopplung bei lokalisierten Elektronen Während das magnetische Verhalten von d-Übergangs-Metallen im Bandmodell beschrieben wird, ist das in Abschn. 8.2 entwickelte Bild der Austauschwechselwirkung zwischen lokalisierten Elektronen besonders für die seltenen Erden mit ihren partiell gefüllten fSchalen und für die vielen ionischen Verbindungen der d- und fÜbergangselemente geeigneter. Ausgangspunkt ist der in (8.28) für die Austauschwechselwirkung zwischen zwei Elektronen eingeführte Heisenbergsche Hamilton-Operator. Der folgenden modellmäßigen Behandlung des Ferromagnetismus wollen wir eine primitive Struktur von Atomen mit je einem ungepaarten Elektron mit Bahndrehimpuls Null zugrunde legen. Dieses Modell eines Spingitters zeigt die wesentlichen Konsequenzen der Austauschkopplung. Unter Berücksichtigung eines zusätzlichen äußeren Magnetfeldes B0 erhält man dann für den Hamilton-Operator X XX H J i d Si Si d g lB B0 Si :
8:57 i
i
d
Dabei läuft der Index i über alle Atome und der Index d jeweils über alle Nachbarn, mit denen Austauschwechselwirkung besteht. Leider ist der Heisenberg-Operator ein nicht-linearer Operator. Lösungen lassen sich deshalb nur in speziellen Fällen oder bei Einführung einer linearisierenden Näherung angeben. Eine solche Näherung ist die Molekularfeldnäherung, die jetzt besprochen werden soll. In der Molekularfeldnäherung ersetzt man das Operatorprodukt in (8.57) durch das Produkt des Spinoperators Si mit dem Erwartungswert des Spinoperators der Nachbarn h Si di. Der HamiltonOperator in der Molekularfeldnäherung lautet also ! X X H MF
8:58 Si J i d hSi d i g lB B0 : i
d
Die Austauschwechselwirkung erhält damit den Charakter eines inneren Feldes 1 X BMF J i d hSi d i :
8:59 g lB d Für homogene Systeme (ohne Oberfläche) ist h Si di für alle Atome gleich. Der Mittelwert h Si di hSi lässt sich durch die Magnetisierung ausdrücken N hSi
8:60 V mit N/V der Anzahl der Atome pro Volumen. Wir erhalten damit für das Molekularfeld BMF
M g lB
8.6 Ferromagnetische Kopplung bei lokalisierten Elektronen
BMF
V mJ M ; Ng2 l2B
209
8:61
wobei wir uns noch zusätzlich auf die Austauschkopplung zwischen den m nächsten Nachbarn beschränkt haben. Der HamiltonOperator in der Molekularfeldnäherung (8.58) ist jetzt mathematisch identisch mit dem Hamilton-Operator von N unabhängigen Spins in einem effektiven Magnetfeld Beff = BMF+B0. Seine Energieeigenwerte sind E 12 g lB Beff
8:62
für jeden Elektronenspin. Wir bezeichnen die Anzahl der Elektronen in den beiden Zuständen mit dem Spin parallel bzw. antiparallel zum B-Feld mit N : und N ;. Im thermischen Gleichgewicht ist dann N# e N"
k
g lB Beff = T
8:63
und damit die Magnetisierung
1 N" N# 1 N 1 g lB tanh g lB Beff =k T : M g lB 2 V 2 V 2
8:64
Diese Gleichung zusammen mit (8.61) hat Lösungen mit von Null verschiedener Magnetisierung auch ohne äußeres Magnetfeld, wenn J > 0 ist, also bei ferromagnetischer Kopplung der Elektronenspins. Mit den Abkürzungen Ms
N1 gl V 2 B
8:65
und
Tc 14 m J=k
8:66
erhalten wir ohne äußeres Magnetfeld B0 aus (8.61 und 8.64) Tc M :
8:67 M
T=Ms tanh T Ms Diese Gleichung ist äquivalent zu (8.51). Das bedeutet, dass der Temperaturverlauf der Magnetisierung im Bandmodell und im Modell lokalisierter Elektronen gleich ist. Für T ? 0 und T & Tc ergeben sich aber wiederum M
T Ms
1
2e
p M
T=Ms 3 1
2Tc =T
T Tc
;
T Tc
8:68
T Tc :
8:69
1=2 ;
Tc hängt nur von der Stärke der Austauschkopplung und der Zahl der nächsten Nachbarn ab. Der kritische Exponent in (8.69) hängt interessanterweise nicht von der Dimension ab. Ein ebenes Gitter hätte
210
8. Magnetismus
den gleichen kritischen Exponenten in der Molekularfeldnäherung. Allerdings wäre wegen der geringeren Zahl der nächsten Nachbarn Tc kleiner. Das führt zu einem interessanten Verhalten der Magnetisierung in der Nähe der Oberfläche eines Ferromagneten (Tafel VII). In der Molekularfeldnäherung verschwindet bei Tc sowohl die Magnetisierung als auch die lokale Ordnung der magnetischen Momente. In Wirklichkeit bleibt jedoch eine gewisse lokale Ordnung erhalten. Die Curie-Temperatur ist lediglich diejenige Temperatur, bei der die magnetische Ordnung auf einer großen Längenskala verschwindet. Für Temperaturen oberhalb von Tc können wir wiederum das Curie-Weiss-Gesetz für die Suszeptibilität herleiten. Mit einem äußeren Feld B0 erhalten wir aus (8.64) mit der Entwicklung (8.68) M
T
g2 l2B N 1 B0 : 4 V k T Tc
8:70
8.7 Antiferromagnetismus Bislang haben wir ferromagnetische Kopplung der Elektronenspins, also J > 0, vorausgesetzt. Eine Reihe von Verbindungen, z. B. die Oxide von Fe, Co und Ni, weisen eine antiferromagnetische Kopplung zwischen den d-Elektronen der Übergangsmetalle auf. Sie besitzen die Struktur von NaCl, d. h. die paramagnetischen dMetallionen und die O2–-Ionen bilden je für sich eine kubisch flächenzentrierte Struktur. Im Zustand einer antiferromagnetischen Ordnung der Metallionen bildet die magnetische Elementarzelle allerdings keine flächenzentrierte Struktur mehr, sondern es stellen sich komplizierte magnetische Überstrukturen ein. Wir betrachten im Rahmen der Molekularfeldnäherung das magnetische Verhalten eines Antiferromagneten mit einer einfachen magnetischen Überstruktur. Die Überstruktur soll so beschaffen sein, dass nächste Nachbarn jeweils einen antiparallelen Spin haben (Abb. 8.9). In einer modellmäßigen Behandlung mit antiferromagnetischer Kopplung (J < 0) können wir (8.60–8.64) jetzt für beide magnetischen Untergitter getrennt wiederverwenden. Wir beachten dabei, dass das Molekularfeld für das Untergitter mit positiver Spinorientierung vom Untergitter der negativen Spins erzeugt wird. Für den antiferromagnetischen Ordnungszustand erhält man dann das Gleichungspaar ! 1 N V M g lB tanh ;
8:71 mJ M V 2 2 k TN g lB ! 1 N V tanh
8:72 m J M ; M g lB V 2 2 k TN g lB
8.7 Antiferromagnetismus
211
Abb. 8.9. (a) Modellkristall mit antiferromagnetischer Orientierung des Spins nächster Nachbarn. (b) Eine ähnlich einfache Spinstruktur, aber mit einem tetragonalen Gitter, wird von den Verbindungen MnF2, FeF2 und CoF2 realisiert. In diesem Fall sind die Atome entlang der c-Achse die nächsten Nachbarn. Wenn die Übergangsmetallionen eine flächenzentrierte Struktur bilden, ist es topologisch nicht möglich, nur antiferromagnetische Orientierung zwischen nächsten Nachbarn zu haben. Entsprechend müssen sich komplexere magnetische Überstrukturen einstellen
wobei M +, M – die Magnetisierung der beiden Spinuntergitter und N + = N – die Anzahl der Metallionen in den jeweiligen Spinuntergittern ist. Im antiferromagnetischen Zustand ist M + = –M – und wir erhalten analog zu (8.67) ! 1 N V
8:73 m J M M g lB tanh V 2 2 k TN g lB und eine entsprechende Gleichung für M –. Die Magnetisierung der Untergitter verschwindet oberhalb einer kritischen Temperatur, die Néel-Temperatur genannt wird. Sie ist analog zum ferromagnetischen Fall TN
1 mJ : 4 k
8:74
Die Néel-Temperatur ist positiv, da jetzt J < 0 ist. Bei der Berechnung der Suszeptibilität müssen wir unterscheiden zwischen den Fällen paralleler und senkrechter Orientierung des äußeren Feldes relativ zur Ausrichtung der Spins, jedenfalls für Temperaturen kleiner als TN. Wir behandeln zunächst den Fall, dass das äußere Feld B0 parallel bzw. antiparallel zu den Spins orientiert ist. Das äußere Feld bewirkt eine geringfügige Abweichung in der Magnetisierung der beiden Spinuntergitter, die wir mit D M+ und D M – bezeichnen wollen. Anstatt (8.71 bzw. 8.72) erhalten wir dann mit zusätzlichem Feld B0 1 N 1 1 tanh g lB M DM g lB V 2 2 kT Vm J ;
8:75
M DM B 0 N g2 l2B
212
8. Magnetismus
1 N 1 1 tanh gl M DM g lB V 2 2 B kT Vm J 2 2
M DM B0 : N g lB
8:76
Wir berücksichtigen, dass M + = –M – und N + = N –:N/2 ist und erhalten durch Entwicklung von (8.75 und 8.76) für kleine DL ±, B0: ! 1 l2B g2 N TN B0 DM DM DM DM mit T cosh2
f 4 k T V
8:77 f
TN M
T T Ms
8:78
und
1 N Ms g lB V 2
8:79
der Sättigungsmagnetisierung eines Spinuntergitters. Für Temperaturen oberhalb der Néel-Temperatur verschwindet die Magnetisierung der Untergitter und f ist gleich Null. Es wird dann auch keine Richtung im Kristall mehr ausgezeichnet, und die Suszeptibilität ist isotrop v
T l0
g2 l2B N 1 : 4 V k T TN
8:80
Wir erhalten also eine Temperaturabhängigkeit ähnlich wie beim Curie-Weiss-Gesetz (8.70), nur dass die kritische Temperatur jetzt mit umgekehrten Vorzeichen erscheint. Bei der Néel-Temperatur selbst bleibt die Suszeptibilität endlich. Für Temperaturen genügend unterhalb der Néel-Temperatur ist M + (T) = M +s und wir erhalten vk
T l0
g2 l2B N 1 ; 2 4 V k T cosh
TN =T TN
8:81
was wir für tiefe Temperaturen weiter nähern können durch vk
T l0
g2 l2B N e V kT
2TN =T
T TN :
8:82
Dieser Ausdruck für die Suszeptibilität gilt jetzt nur noch wie die Gleichungen (8.75, 8.76) für die Orientierung des äußeren Feldes parallel zur Polarisation der Spinuntergitter. Für die Richtung senkrecht dazu bietet sich an, den Hamilton-Operator (8.58) als klassische Energiegleichung zu interpretieren. In einem äußeren Feld dreht jedes der Untergitter seine magnetischen Momente um den
8.7 Antiferromagnetismus
213
Winkel a in Richtung des Feldes B0. Die Energie eines Elementarmagneten im Feld B0 ist dann Er
1 2 g l B B0
sin 12 m J cos :
8:83
Die Größe des zweiten Terms ergibt sich aus der Überlegung, dass der Energieaufwand zum Umklappen eines Elementarmagneten m J ist (8.27). Die Gleichgewichtsbedingung @Er =@ 0
8:84
führt für kleine Winkel auf g lB B0 : mJ Mit der Magnetisierung
8:85
8:86 M M M 12 g lB N=V erhält man für die Suszeptibilität unterhalb TN den (näherungsweise) temperaturunabhängigen Wert v?
g2 l2B N g2 l2B N ; 2 m J V 2 mjJjV
8:87
der gleich dem Wert von v bei der Néel-Temperatur ist. Insgesamt ergibt sich damit das in Abb. 8.10 skizzierte Verhalten. Es sei darauf hingewiesen, dass der Unterschied zwischen v|| und v^ experimentell nur messbar ist, wenn eine magnetische Domäne vorliegt. Dies wird bei Gittern mit mehreren kristallografisch äquivalenten Richtungen für die mögliche magnetische Orientierung i.a. nicht der Fall sein. Weiterhin ist die charakteristische Temperatur in der Suszeptibilität (8.80) nur dann gleich der Néel-Temperatur, wenn nur die Austauschkopplung J1 zwischen den nächstbenachbarten Metallionen berücksichtigt wird. Beachtet man eine zusätzliche Kopplung J2 zwischen den übernächsten Nachbarn, so ist TN in
Abb. 8.10. Schematische Darstellung der magnetischen Suszeptibilität für einen Antiferromagneten. Unterhalb der Néel-Temperatur TN im antiferromagnetisch geordneten Zustand sind die Suszeptibilitäten für parallele und senkrechte Orientierung des Magnetfeldes relativ zur Spinachse verschieden
214
8. Magnetismus
(8.80) durch eine charakteristische Temperatur h j TN zu ersetzen. Für ein einfaches Gitter vom NaCl-Typ erhält man h TN
J1 J2 : J1 J2
8:88
h ist also größer als TN, wenn auch die Kopplung zwischen übernächsten Nachbarn antiferromagnetisch ist. h wird kleiner als TN, wenn die Kopplung zu den übernächsten Nachbarn ferromagnetisch ist. Beide Fälle kommen vor. Es sei noch darauf hingewiesen, dass in Gittern mit mehreren Arten von Übergangsmetallionen oder mit Übergangsmetallionen in verschiedenen Wertigkeitszuständen die magnetischen Momente derselben nicht gleich sind. Auch bei antiferromagnetischer Kopplung zwischen den Spins verbleibt dann eine Restmagnetisierung. Diese Art Magnetismus wird als Ferrimagnetismus bezeichnet, da sie zuerst bei Ferriten gefunden wurde.
8.8 Spinwellen Die Energie, die notwendig ist, um den Spin eines bestimmten Elektrons umzuklappen, ist gegeben durch die Austauschwechselwirkung. Dies gilt sowohl im Modell der lokalisierten Elektronen als auch im Bandmodell. Im Bandmodell bedeutet das Umklappen eines Spins einen Interbandübergang von einem Elektron in das zugehörige, um die Austauschaufspaltung verschobene Band. Die minimale Energie für das Umklappen eines Spins im Bandmodell ist der Abstand der Oberkante des Bandes der Majoritätsspins von der Fermi-Kante, die sog. Stoner-Lücke (D in Abb. 8.6). Wir werden jetzt einen anderen Anregungszustand kennenlernen, bei dem ebenfalls ein Spin umgeklappt wird, jedoch nur im Mittel über den ganzen Kristall, d. h. es handelt sich hier um eine kollektive Anregung aller Spins. Die dafür aufzuwendende Energie ist erheblich kleiner und kann sogar gegen Null gehen. Zur Herleitung dieser Anregungszustände können wir wieder von dem Spin-Hamilton-Operator (8.57) ausgehen, müssen nunmehr aber die Operatoreigenschaften der Spinoperatoren in (8.57) explizit verwenden. Die x-, y- und z-Komponenten der Spinoperatoren lassen sich durch die Pauli-Matrizen darstellen 1 1 0 1 0 1 1 0 i z x y S ; S ; S :
8:89 1 2 0 2 1 0 2 i 0 Statt der kartesischen Komponenten S x und S y ist es besser, die Spinumklappoperatoren 0 1 x y und
8:90 S S iS 0 0
8.8 Spinwellen
S Sx
i Sy
0 0 1 0
215
8:91
zu verwenden. Die Wirkung dieser Operatoren auf die Spinzustände 1 0 ji und jbi ist
8:92 0 1 S ji 0 ; S jbi ji ; S jbi 0 ; S ji jbi : +
8:93
–
S und S sind also Operatoren, die den Spin nach „+“ bzw. nach „–“ klappen und Null ergeben, wenn der Spin schon im Zustand „+“ bzw. „–“ ist. Die Operatoren S z „präparieren“ in gewohnter Weise den Eigenwert heraus Sz ji 12 ji ; Sz jbi
1 2 jbi
:
8:94
Mit diesem Rüstzeug versehen können wir uns daran machen, den Hamilton-Operator eines Spingitters auf die neuen Operatoren umzuschreiben. Man erhält aus (8.57) durch Einsetzen von (8.90, 8.91) ohne äußeres Feld und mit Austauschkopplung J nur zwischen nächsten Nachbarn XX H J Szi Szid 12
S
8:95 i Sid Si Sid : i
d
Wir wollen ferromagnetische Kopplung zwischen den Elektronenspins (J > 0) annehmen. Im Grundzustand sind dann alle Spins ausgerichtet. Ein solcher Zustand wird beschrieben durch das Produkt der Spinzustände aller Atome Q j0i jii :
8:96 i
Man sieht gleich, dass dieser Zustand ein Eigenzustand zum Hamilton-Operator (8.95) ist, denn die S +, S –-Anteile ergeben Null, und die S z-Komponenten lassen den Zustand jedes Atoms unverändert, mit den jeweiligen Eigenwerten von S z als Vorfaktoren PP H j0i 14 Jj0i 1 14 m J Nj0i :
8:97 i
d
Ein Zustand mit einem umgeklappten Spin am Atom j lässt sich durch Anwendung von Sj– auf den Grundzustand gewinnen Q j#j i Sj jin :
8:98 n
Dieser Zustand ist aber kein Eigenzustand zu H , da die Anwendung der Operatoren S +j S –j + d in H den umgeklappten Spin auf das Atom j+d verschöbe und mithin einen verschiedenen Zustand erzeugte. Ein Eigenzustand dagegen ist die Linearkombination
216
8. Magnetismus
Abb. 8.11. Schematische Darstellung einer Spinwelle
1 X i k rj jki p e j#j i : N j
8:99
Der Zustand stellt eine Spinwelle dar. Die Eigenwerte von S zi und (S xi )2+(S yi )2 sind Erhaltungsgrößen mit einem vom Aufatom i unabhängigen Erwartungswert. Dagegen verschwinden die Erwartungswerte von S xi und S yi . Der Spin präzediert also um die z-Achse mit einer Phasenverschiebung zwischen den Atomen, die durch den Wellenvektor k gegeben ist (Abb. 8.11). Wir wenden jetzt H auf den Spinwellen-Zustand an und erhalten " 1 X i k rj 1 1 H jki p e m J
N 2j#j i m Jj#j i 4 2 N j # 1 X J j# i j#j d i :
8:100 2 d jd Durch Verschieben des Index j in den letzten beiden Beiträgen lässt sich dieses Ergebnis auch so schreiben " # 1 1 X i k rd H jki mJ N J m J
e ei k rd 4 2 d 1 X i k rj e j#j i :
8:101 p N j Der Zustand | ki ist also Eigenzustand mit dem Eigenwert ! 1 X i k rd i k rd e e :
8:102 E E0 J m 2 d E0 ist die Energie im ferromagnetischen Grundzustand. Wie wir gleich sehen werden, hat dieses Ergebnis vor allem für kleine kWerte Bedeutung. Dort lässt sich (8.102) nähern durch P
8:103 E E0 12 J d
k rd 2 : Dies ist die charakteristische Dispersionsbeziehung für ferromagnetische Spinwellen. Für kleine k-Werte verschwindet demnach die zum Umklappen eines Spins notwendige Energie. In Abb. 8.12 a ist die Dispersionsbeziehung für Spinwellen zusammen mit dem Spektrum von Einelektronenanregungen, die ebenfalls einen Spin umklappen, dargestellt. Für diese sog. Stoner-Anregungen muss die Energie m J aufgewandt werden, wenn k = 0 ist. Für k j 0 ergibt
8.8 Spinwellen
217
Abb. 8.12. (a) Dispersionsbeziehung der Spinwellen und Spektrum der Einelektronenanregung mit Spinumklappung in einem Modellferromagneten. (b) Modellmäßige Einelektronen-Bandstruktur mit Austauschaufspaltung I = m J und Stoner-Lücke D
sich infolge der Dispersion der Einelektronenzustände (Abb. 8.12 b) ein Spektrum von Möglichkeiten. Im Bereich der Einelektronenanregungen können Spinwellen in Elektronenanregungen zerfallen. Dies verkürzt die Lebensdauer eines Spinwellenzustandes und beeinflusst auch die Dispersion. Spinwellen lassen sich sowohl thermisch als auch durch Energie- und Impulsaustausch mit Neutronen anregen. Die Neutronenstreuung erlaubt deshalb die experimentelle Bestimmung der Dispersionskurven von Spinwellen. Das Ergebnis für Nickel ist in Abb. 8.13 dargestellt. Die thermische Anregung von Spinwellen hat Einfluss auf den Verlauf der Magnetisierung bei tiefen Temperaturen. Wir erinnern uns, dass die Anregung einer Spinwelle im Mittel einen Spin um-
Abb. 8.13. Experimentelle Werte für die Dispersion von Spinwellen an Nickel in [111]-Richtung nach Mook und Paul [8.6]. Die Messungen erfolgten bei T = 295 K. Die gestrichelte Linie zeigt eine Abhängigkeit der Quantenenergie proportional zu k 2. Abweichungen davon ergeben sich infolge der Austauschwechselwirkung auch zwischen entfernteren Nachbarn und bei Eintritt in den Bereich der Einelektronenanregungen. Die verkürzte Lebensdauer der Spinwellen führt dann zu einer Lebensdauerverbreiterung der Spektren (schraffierter Bereich )
218
8. Magnetismus
klappt, also das magnetische Moment reduziert. Die Magnetisierung eines Spingitters wäre demnach 1 1X g lB M Ms n
k ;
8:104 2 V k wenn n (k) die Zahl der angeregten Spinwellen mit einem Wellenvektor k ist. Wenn wir vernachlässigen, dass der Heisenberg-Operator eigentlich nichtlinear ist und so tun, als ob die Spinwellen superponierbar wären, so wären die Energieterme wie bei einem harmonischen Oszillator P
8:105 E
k n
k 12 J d
k rd 2 und die Besetzungsstatistik wie bei einem harmonischen Oszillator. Die Temperaturabhängigkeit der Magnetisierung bei tiefen Temperaturen lässt sich analog zu Abschn. 5.3 leicht berechnen und man erhält M
T
M
0
T 3=2 :
8:106 3/2
Dies ist das Blochsche T Gesetz, welches an die Stelle einer exponentiellen Abhängigkeit (8.52) tritt, die sich für einen Ferromagneten ohne Spinwellenanregung ergäbe. Die Spinwellenanregung ist auch in der spez. Wärme sichtbar, wo sie zu einem T 3/2-Term neben dem T 3-Term durch Phononanregung führt.
8.9 Kristallanisotropie Makroskopische Auswirkungen In den bisherigen Betrachtungen zum Magnetismus konnte die kristalline Struktur des Festkörpers vernachlässigt werden. Sie spielt jedoch eine entscheidende Rolle für die augenfälligsten Manifestationen des Magnetismus. Zum Beispiel basiert die stabile Orientierung der Magnetisierung in einem Permanentmagneten fast ausschließlich auf der Kristallanisotropie. Auch eröffnet erst die Kristallanisotropie die Möglichkeit, binäre Information in magnetischen Strukturen zu speichern, indem sie die Magnetisierung parallel oder antiparallel zu einer durch die Kristallstruktur vorgegebenen Richtung festhält. Verursacht wird die magnetokristalline Anisotropie durch die Spin-Bahn-Kopplung. Die Orientierung der Bahnmomente richtet sich nach der Kristallstruktur und wegen der Spin-Bahn-Kopplung hängt die Gesamtenenergie des Systems von der Orientierung des Spins relativ zu den Kristallachsen ab. Die Orientierung mit der niedrigsten Energie wird als leichte Orientierung bezeichnet, die entsprechende Achse als leichte Achse. Für Cobalt in der hcp Struktur ist dies die c-Achse. Ohne externes Feld liegt die Magnetisierung deshalb entlang der c-Achse. Ein makroskopischer Kristall besteht aus Domänen der beiden mögli-
8.9 Kristallanisotropie
219
Abb. 8.14. Schematische Darstellung der mittleren Magnetisierung M(H) eines Ferromagneten mit einer einzigen leichten Achse (hcp Cobalt). Die gestrichelte Linie zeigt die anfängliche Magnetisierung angefangen bei der Magnetisierung Null. Die ausgezogene Linie zeigt den Magnetisierungszyklus, wenn das äußere Feld H parallel zur leichten Achse liegt. Es ergibt sich eine ausgeprägte Hysterese. Die strichpunktierte Linie zeigt den Magnetisierungszyklus, wenn H senkrecht zur leichten Achse liegt. Es gibt dann keine ausgeprägte Hysterese
chen Orientierungen entlang dieser Achse. Erwärmt man einen Cobaltkristall über die Curie-Temperatur und lässt ihn langsam abkühlen, sind Anzahl und Größe beider Domänen in etwa gleich, so dass die mittlere Magnetisierung und das Magnetfeld im Außenraum weitgehend verschwinden. In einem äußeren Magnetfeld, das entlang der c-Achse orientiert ist, steigt die gemittelte Magnetisierung durch Verschiebung der Domänenwände schnell an (Abb. 8.14) und sättigt sich bei vergleichsweise kleinen Feldern, da in diesem Fall das äußere Feld nicht gegen die magnetokristalline Anisotropie anarbeiten muss (gestrichelte Linie in Abb. 8.14). Nur eine einzige Domäne überlebt schließlich. Diese bleibt auch überwiegend erhalten, wenn das äußere Feld entfernt wird. Die verbleibende Magnetisierung Mr heißt Remanenz. Die Magnetisierung wird zum Verschwinden gebracht durch ein Feld in umgekehrter Richtung der Stärke –Hc. Hc wird als Koerzitivfeldstärke bezeichnet. Mit steigendem Feld in negativer Richtung wird Sättigung in umgekehrter Polarität erreicht. Durch Reduktion des äußeren Feldes und schließlich seine Umpolung wird die komplette Magnetisierungskurve durchlaufen (ausgezogene Linie in Abb. 8.14). Für eine Magnetisierung senkrecht zur c-Achse als Antwort auf ein entsprechendes äußeres Feld muss die Magnetisierung in den Domänen aus der leichten Richtung herausgedreht werden (rechte Skizze in Abb. 8.14). Da dies Energie kostet, steigt die Magnetisierung nur langsam an und eine Sättigung wird erst bei sehr hohen Feldern erreicht. Auch gibt es in diesem Fall keine Remanenz. Die Magnetisierung fällt auf Null zurück sobald das externe Feld abgeschaltet wird. Die Größe der Remanenz hängt davon ab wie leicht sich Domänenwände verschieben lassen. Perfekte Kristalle sowie bestimmte Legierungen wie l-Metall und Permalloy oder Ferrite haben eine kleine oder gar keine Remanenz. Solche Materialien werden für
220
8. Magnetismus
Transformatorkerne verwendet, damit die Energieverluste beim Ummagnetisieren klein sind. Für die Datenspeicherung bevorzugt man hingegen Werkstoffe, deren Remanenz in der Nähe der Sättigung liegt. Hohe Remanenz wird erzeugt, indem man die Lage von Domänenwänden durch Defekte fixiert.
Anisotropie kubischer und hexagonaler Kristalle Die magnetische Anisotropie ist spezifisch für die Kristallstruktur. Zur quantitativen Beschreibung der Anisotropie enwickelt man die Änderung der Energie pro Volumen u nach Potenzen der Kosinusse der betrachteten Richtung j mit den Achsen i, i cos
j; i :
8:107
Typischerweise beschränkt man sich auf die niedrigsten und zweitniedrigsten nichtverschwindenden Potenzen. Nur die geraden Potenzen treten auf, denn die Energie muss invariant gegen die Zeitumkehr sein. Eine Zeitumkehr entspricht einer Inversion der Spinrichtung (d. h. der Magnetisierung), also einer Ersetzung von i durch i. Für einen kubischen Kristall wäre die entsprechende Entwicklung formal ucub u2
21 22 23 u4
41 42 43 :
8:108
Wegen der Identität X 2i 1
8:109
i
ist der erste Term konstant und kann deshalb wegfallen. Der zweite Term kann unter Benutzung von (8.109) umgeschrieben werden zu ucub
2u4
21 22 21 23 22 23 :
8:110
An dieser Form sieht man, das es nicht erforderlich war, in (8.108) gemischte Terme des Typs 12 zu berücksichtigen. Mit der Entwicklung bis zur vierten Ordnung in (8.110) ist das Verhältnis der Energien für eine Magnetisierung entlang der Raum- und Flächendiagonalen fixiert auf 4/3. Um Abweichungen von diesem Verhältnis zuzulassen, muss man Terme sechster Ordung einführen. Die einfachste Möglichkeit dafür ist ucub K1
21 22 21 23 22 23 K2 21 22 23 :
8:111
K1 und K2 sind die Anisotropiekonstanten für kubische Kristalle. Für Eisen bei 300K ist K1 = 4,2 ´ 104 Jm–3 und K2 = 1,5 ´ 104 Jm–3. Die leichten Richtungen sind deshalb die h100i Richtungen, die harten Richtungen die h111i Richtungen. Die Differenz zwischen den harten und leichten Richtungen beträgt 1,5 ´ 104 Jm–3. Für Nickel sind die Konstanten K1 und K2 negativ (K1 = –5,7 ´ 103 Jm–3, K2 = –2,3 ´ 103 Jm–3), was h111i zu leichten Richtungen macht.
8.9 Kristallanisotropie
221
Für hexagonale Kristalle (Beispiel hcp Cobalt) verschwindet der Term zweiter Ordnung nicht. Bezeichnet man die hexagonale Achse mit dem Index 3, dann ist die Entwicklung bis zur vierten Ordnung formal uhex u2k 23 u2?
21 22 u4 43 :
8:112
Wegen der hexagonalen Symmetrie gibt es keinen Term vierter Ordnung in 1 und 2. Der zweite Term ist wegen (8.109) gleich u2?
1 23 und kann deshalb mit dem ersten zusammengefasst werden. Die Anisotropie kann deshalb durch einen einzigen Winkel, den Winkel h mit der c-Achse ausgedrückt werden uhex u2 23 u4 43
K2 cos2 h
K4 cos4 h ;
8:113
mit K2 und K4 den Anisotropiekonstanten. Die negativen Vorzeichen sind eingeführt, um in Übereinstimmung mit der gebräuchlichen Notation zu sein. Für Cobalt ist K2 = 4,1 ´ 105 Jm–3 und K4 = 1,0 ´ 105 Jm–3. Die c-Achse ist deshalb die leichte Achse. Die Rotation der Magnetisierung von der leichten in die harte Richtung kostet mit 5 ´ 105 Jm–3, 33mal mehr Energie als bei Eisen. Der Grund ist, dass für hexagonale Kristalle der Term zweiter Ordnung nicht verschwindet.
Domänenwände Wie schon in Abb. 8.14 dargestellt, besteht ein Ferromagnet aus Domänen, innerhalb derer die Magnetisierung entlang einer leichten Achse liegt. Der Übergangsbereich von einer Orientierung der Magnetisierung in eine andere wird als Domänenwand bezeichnet. Je nach Orientierung der Magnetisierung innerhalb der Wand unterscheidet man verschiedene Wandarten. Abb. 8.15 zeigt im rechten und linken Bereich Domänen, in denen sich die Magnetisierung um 1808 unterscheidet. In Abb. 8.15 a erfolgt der Übergang von einer Domäne in die andere durch eine Rotation um eine Achse senkrecht zur Domänenwand. Eine solche Wand heißt BlochWand (hier eine 1808-Bloch-Wand). Eine andere Möglichkeit besteht darin, im Übergangsbereich die Magnetisierung planar zur Magnetisierung in den Domänen zu drehen, so wie im oberen Bereich von Abb. 8.15 b gezeigt. Eine solche Wand heißt Néel-Wand (hier 1808 Néel-Wand). In einer Néel-Wand hat man eine nichtverschwindende Divergenz der Magnetisierung rM, während in einer Bloch-Wand rM 0 ist. Eine nichtverschwindende Divergenz erzeugt ein Magnetfeld und die Wechselwirkungsenergie dieses Magnetfeldes mit der Magnetisierung trägt zur Wandenergie bei. Dadurch ist die Bloch-Wand im Volumen eines Materials energetisch günstiger als die Néel-Wand. Die Situation ändert sich, wenn eine Bloch-Wand auf eine Oberfläche trifft. Dann kann die Néel-Wand energetisch günstiger sein, da bei einer Bloch-Wand eine Divergenz an der Oberfläche auftritt
222
8. Magnetismus
Abb. 8.15. (a) 1808-Bloch-Wand: innerhalb der Wand rotiert die Magnetisierung um eine Achse senkrecht zur Wand. Zur Minimierung der Depolarisationsenergie wandelt sich eine BlochWand an der Oberfläche in eine NéelWand (b) um, bei der die Rotation der Magnetisierung in der Ebene erfolgt, die durch die Polarisation im Volumen der Domänen und die Normale zur Wandrichtung aufgespannt wird
(Abb. 8.15 a), die Depolarisationsenergie kostet. An der Oberfläche gehen deshalb häufig Bloch-Wände in Néel-Wände über (Abb. 8.15 b). Die Stärke einer Domänenwand ergibt sich aus dem Wechselspiel zwischen Anisotropie und ferromagnetischer Austauschkopplung. Die Austauschenergie wird minimiert, wenn der Drehwinkel der Magnetisierung von einer Atomlage zur nächsten möglichst klein, die Wandstärke also möglichst groß ist. Die Anisotropieenergie wird minimiert, wenn der Bereich, in dem die Magnetisierung nicht entlang der leichten Achse liegt, möglichst klein, die Wandstärke also möglichst klein ist. Wir berechnen jetzt die Rotation der Magnetisierung in einer 1808 Bloch-Wand in einem einfachen Modell. Damit man sich auf die Kopplung der Spins zwischen benachbarten Atomebenen beschränken kann, betrachten wir eine tetragonal primitive Struktur mit der c-Achse als leichte Achse. Da die Wandstärke groß gegen die Abstände atomarer Ebenen ist, ändert sich die Magnetisierung von Ebene zu Ebene nur wenig. In diesem Fall kann man den Heisenberg-Operator (8.57) klassisch interpretieren. Aus den Spinoperatoren werden dann gewöhnliche Vektoren und aus dem Operatorprodukt ein Skalarprodukt. Da alle Spins innerhalb der Atomebenen n parallel zur Wandebene gleich orientiert sind, genügt zur Beschreibung eine Größe, der Winkel yn des Spins mit der c-Achse (vgl. Abb. 8.14). Beim Durchtritt durch die Wand ändert sich dieser Winkel y von 0 nach p. In dieser Notation lautet die klassische Heisenberg-Gleichung X X cos
yn1 yn KS2 cos2 yn ;
8:114 H JS2 n
n
mit S, dem skalaren Wert des Spinoperators und K der Anisotropiekonstanten. Die Terme in (8.114) entsprechen der Energie einer Elementarzelle. Wegen der Kleinheit der Winkeländerungen von einer Atomebenene zur nächsten können wir H schreiben als X 1 1 2X KS H JS2
yn1 yn 2 cos 2yn const :
8:115 2 2 n n Die Blochwand ist im Gleichgewicht, wenn für alle Ebenen n @H=@yn 0 ist,
8.9 Kristallanisotropie
@H=@yn / J
2yn
yn1
yn 1 K sin 2yn 0 :
223
8:116
Wir können yn als eine kontinuierliche Variable y(n) betrachten. Der Term in Klammern wird dann gleich der negativen zweiten Ableitung von y nach n, @2y K sin 2y : @n2 J
8:117
Dies ist die sog. Sine-Gordon-Gleichung. Zu ihrer Lösung multipliziert man zunächst mit @y=@n ( ) ( !2 ) @y @ 2 y K @ 1 @y K cos 2y 0 ; sin 2y @n @n2 J @n 2 @n J
8:118 wodurch sich die lösbare Differentialgleichung erster Ordnung !2 @y K
8:119 cos 2y const @n J ergibt. Die Konstante wird dadurch festgelegt, dass innerhalb der Domänen @y=@n 0 sein muss. Daraus folgt !2 @y K 2K 2 sin y :
1 cos 2y
8:120 @n J J Durch radizieren und integrieren ergibt sich n
y r Z r J dy J ln
tan
y=2 ; n
y 2K sin y 2K
8:121
bzw.
p y 2 tan 1
exp
n 2K=J :
8:122
In Experimenten mißt man üblicherweise die Komponenten der Magnetisierung parallel oder senkrecht zur Wand. Diese Komponenten sind p p Mk / cos y cosf2 tan 1
exp
n 2K=J g tanh
n 2K=J ;
8:123 p p M? / sin y sinf2 tan 1
exp
n 2K=J g 1= cosh
n 2K=J : Der Verlauf von Mk und M? als Funktion von n ist in Abb. 8.16 gezeigt, zusammen mit der üblichen Definition der Wandstärke p w
8J=K :
8:124
224
8. Magnetismus
Abb. 8.16. Verlauf der Magnetisierung in einer Blochwand. Die ausgezogene Linie zeigt die Komponente parallel zur Magnetisierung innerhalb der Domänen, die gestrichelte Linie die Komponente senkrecht dazu (8.123). Gleichfalls eingezeichnet ist die konventionelle Definition der Wandstärke w
Der mathematische Formalismus lässt sich ohne Änderung auf Néel-Wände übertragen. Der Winkel y ist dann die Rotation um die Achse senkrecht zur Magnetisierung in den Domänen und parallel zur Néel-Wand (Abb. 8.15 b). 908-Wände erhält man, indem man das Argument des Kosinus 2yn in (8.115) durch 4yn ersetzt. Generell beschreibt der oben ausgeführte Formalismus Übergänge zwischen Phasen, die sich durch einen skalaren Parameter darstellen lassen. Das bekannteste Beispiel ist das sog. Frenkel-Kontorova Modell für Wände zwischen Strukturdomänen.
Übungen zu Kapitel 8
8.1 Man berechne die diamagnetische Suszeptibilität des Wasserstoffatoms unter Benutzung von (8.12) und der Wellenfunktion für den Grundzustand w
a3o p 1=2 e r=ao , mit dem Bohrschen Radius ao 4p h2 e0 =
me2 0;529 Å. 8.2 Man berechne die Entropie von N Spins in einem magnetischen Feld gemäß den Prinzipien der statistischen Thermodynamik. Beschreiben Sie den Prozess der adiabatischen Entmagnetisierung und diskutieren Sie diese Methode zur Kühlung eines paramagnetischen Salzes (vgl. Tafel IV)! Wieviel Wärme kann man den Schwingungen eines Kristalls durch adiabatische Entmagnetisierung des Spinsystems entziehen? 8.3 Unter Verwendung von Gleichung (8.111) berechne man die Anisotropieenergiedichte u für Eisen und Nickel in den [001], [011] und [111] Richtungen bei 300 K und skizziere den Verlauf als Funktion des Winkels gegen die [001]-Achse in der [011] Zone. Für Eisen und Nickel sind die Anisotropiekonstanten
K1(Fe) = 4,2 ´ 104 Jm–3, K2(Fe) = 1,5 ´ 104 Jm–3, K1(Ni) = –5,7 ´ 103 Jm–3, K2(Ni) = –2,3 ´ 103 Jm–3. Was sind jeweils die leichten und schweren Achsen und wieviele gibt es davon? 8.4 a) Unter Vernachlässigung der Depolarisationsenergie berechne man den Verlauf der Magnetisierung in einer 908 Néel-Wand. Vergleichen Sie die Dicke der Wand mit der einer 1808 Néel-Wand und erläutern Sie das Ergebnis! b) Man berechne die Depolarisationsenergie in einer Néel-Wand! Hängt das Ergebnis von der Wanddicke ab? Welchen Einfluss hat demnach die Depolarisationsenergie auf die Wanddicke? 8.5 Warum ist die senkrechte Magnetisierung der Eisendoppellagen in Abb. VII.1 abwechselnd in den Kristall hinein und hinaus gerichtet?
Tafel VI
Tafel VI Magnetostatische Spinwellen
Ohne äußeres Magnetfeld verschwindet die Quantenenergie für Spinwellen in einem Ferromagneten für kleine k, weil sich die Spinorientierung von Atom zu Atom mit zunehmender Wellenlänge immer weniger unterscheidet, und deshalb die Austauschkopplung einen immer geringeren Energiebeitrag liefert. Die Austauschkopplung wird dann schließlich vergleichbar mit der Energie magnetischer Dipole in einem äußeren Feld, d. h. die Dispersion von Spinwellen wird abhängig vom Magnetfeld. Wir wollen im folgenden solche Spinwellen mit kleinem k-Wert in einem äußeren Feld betrachten. Der k-Wert soll klein gegen einen reziproken Gittervektor aber andererseits auch groß gegen x/c sein, wenn x die Spinwellenfrequenz ist. Dies erlaubt es, die explizite Wechselwirkung mit dem elektromagnetischen Lichtfeld zu vernachlässigen (Abschn. 11.4) und anzunehmen, dass r H 0
VI:1
und erhalten aus (VI.3) unter Verwendung von mx, my M bzw. hx, hy H0 das Gleichungspaar. hx mx j im
VI:5 i m j my hy mit
und ferner natürlich r
H M 0
die lokale Magnetisierung M (r, t) ersetzen. Die Magnetisierung ist im wesentlichen die Sättigungsmagnetisierung Ms des Ferromagneten, welche durch das äußere Feld H0 entlang der z-Achse orientiert sein soll, mit kleinen orts- und zeitabhängigen Abweichungen mx, my in den x- und yKomponenten. Wir machen also den Ansatz 0 1 mx
re ixt M
r; t @ my
re ixt A ; Ms 0 1
hx mx e ixt
VI:4 B
r; t l0 @
hy my e ixt A
H0 Ms
VI:2
ist. Spinwellen dieser Art heißen magnetostatische Spinwellen. Sie können mit Hilfe der klassischen Bewegungsgleichung behandelt werden, die die zeitliche Änderung des Drehimpulses eines Elektrons mit dem Drehmoment verknüpft. Bezeichnen wir das magnetische Dipolmoment des Elektrons mit pi, so ist dpi gl c
pi B mit c B :
VI:3 dt h Für das folgende ist es zweckmäßig, statt der Dipolmomente einzelner Elektronen eine orts- und zeitabhängige Magnetisierung M (r, t) einzuführen, die man sich durch eine (lokale) Mittelung über die Dipolmomente pro Volumeneinheit herstellen kann. In (VI.3) kann man dann pi durch
j l0 c2 Ms B0 =
c2 B20 m l0 xcMs =
c2 B20
x2 ; x2 ; B0 l0 H0 :
Wegen (VI.1) lässt sich der zweikomponentige Vektor h als Gradient eines Potentials schreiben h ru ;
VI:6
wobei wir für u einen Wellensatz für die y-Richtung versuchen, d. h. u w
xei ky y :
VI:7
Die Anwendung von (VI.2) führt uns dann auf r
h m Du r m 0 ;
VI:8
woraus man unter Verwendung von (VI.5) und (VI.7) eine Art Wellengleichung für das Potential herleitet
@2
1 j @x2
ky2
u0:
227
Tafel VI
Tafel VI Magnetostatische Spinwellen
VI:9
Eine Lösung dieser Gleichung ist offensichtlich gegeben, wenn j = –1 ist. Diese Bedingung ergibt die Frequenz für Spinwellen q x c B20 l0 Ms B0 :
VI:10 Die Frequenz ist unabhängig von k, wenn die Austauschkopplung ganz vernachlässigt wird, wie es hier der Fall war. Interessant ist es, Lösungen zu speziellen Geometrien der Probe zu suchen. Der Ansatz (VI.7) lässt sich auch für den Fall einer Platte im B-Feld oder noch einfacher für einen Halbraum x < 0 verwenden. Dann ergibt (VI.9) auch Lösungen mit j j –1, wenn w00
x ky2 w
x
VI:11
ist, also w (x) die Form w
x A ejky jx
VI:12
hat. Die Lösung ist offenbar an der Oberfläche des Halbraumes lokalisiert, also eine Oberflächen-Spinwelle. Die Bedingung der Stetigkeit der Normalkomponente von B liefert die Eigenfrequenz dieser Schwingung hx mx jx<0 hx jx>0 ;
1 jjky j
m ky
VI:13 jky j :
VI:14
Wir können die beiden Fälle ky jky j, also zwei verschiedene Laufrichtungen der Welle unterscheiden: Fall 1: ky jky j
Abb. VI.1. Momentaufnahme der Magnetisierung in einer Damon-Eshbach-Spinwelle an den beiden Oberflächen einer (dicken) Platte. Das äußere Magnetfeld B0 zeigt in Richtung des Betrachters. Die Laufrichtung der Damon-Eshbach-Wellen ist dann im Sinne eines Rechtsumlaufes. Bei kleiner werdender Plattenstärke d bzw. größerer Wellenlänge koppeln die Wellen der beiden Oberflächen, und man erhält eine Kopplungsdispersion x = x (ky d)
Fall 2: ky jky j
mj2; m
j 2 ;
VI:15 1 x1 c
2 l0 Ms B0 ; x2 c
12 l0 Ms B0 :
VI:16 Offensichtlich liefert nur der zweite Fall eine positive Frequenz. Wir haben also den eigenartigen Fall, dass eine Welle in einer Laufrichtung existiert, nicht aber in der Gegenrichtung. Eine besonders interessante Demonstration der Aufhebung der Zeitumkehrinvarianz durch ein Magnetfeld! Entsprechende Oberflächenwellen ergeben
sich auch, wenn die Probe die Form einer dünnen Platte mit dem B0-Feld in der Plattenebene hat, wobei die Oberflächenwellen auf beiden Oberflächen in entgegengesetzter Richtung laufen (Abb. VI.1). Durch die Kopplung zwischen beiden Oberflächen wird die Frequenz abhängig vom ky-Wert, wenn ky d91 ist. Diese magnetischen Oberflächenwellen heißen nach ihren Entdeckern auch „Damon-Eshbach-Wellen“ [VI.1]. Sie wurden zuerst in der Absorption von Mikrowellen nachgewiesen [VI.2]. Eine sehr schöne Demonstration der Unidirektionalität der Damon-Eshbach-Wellen und zugleich des Wellenzahlerhaltungssatzes bei der Streuung, einschließlich der Vorzeichen (4.28), gelingt mit Hilfe des Raman-Effektes (Tafel III). Die Ankopplung des Lichtes erfolgt dabei über den (schwachen) magneto-optischen Effekt. Ab-
Tafel VI Magnetostatische Spinwellen
Tafel VI
228
Abb. VI.2. Experimenteller Aufbau zum Nachweis der Raman-Streuung an Spinwellen [VI.2]. Der mehrfache Durchgang des Lichtes durch das Fabry-Pérot-Spektrometer reduziert den Untergrund, so daß auch sehr schwache inelastische Signale beobachtet werden können
bildung VI.2 zeigt einen experimentellen Aufbau nach Grünberg und Zinn [VI.3]. Die Probe wird von einem Laser beleuchtet und der Raman-Effekt in Rückstreuung beobachtet. Die Frequenz von Damon-Eshbach-Wellen liegt im GHz-Bereich. Man benötigt also Spektrometer mit großer Auflösung, wie sie z. B. von einem Fabry-PérotInterferometer erreicht wird. Zur Reduzierung des Untergrundes, verursacht durch die elastisch diffuse Streuung an der Probe, wird das Interferometer mehrfach (zweifach in Abb. VI.2) durchlaufen. Ein Frequenzspektrum erhält man durch Bewegung der Fabry-Pérot-Spiegel gegeneinander. Abbildung VI.3 zeigt Raman-Spektren für zwei unterschiedliche Stellungen der EuO-Probe relativ zum Lichtstrahl. Die Oberflächenspinwelle kann nur in der durch qk bezeichneten Richtung laufen. In der oben gezeichneten Streugeometrie ist also
k0
kk qk :
Dazu gehört der Energiesatz (4.28) x0
x x
qk :
Die zugehörige Ramanlinie ist zu kleineren x verschoben. Wir erhalten also die „Stokes“-Linie M S2, während die Anti-Stokes-Linie für die Oberflächenwelle nicht existiert. Für die unten gezeichnete Streugeometrie gilt
Abb. VI.3. Raman-Spektrum von EuO [VI.2]. Je nach Orientierung der Probe beobachtet man die Damon-Eshbach-Spinwelle M2 als Stokes-Linie (oben ) oder als Anti-Stokes-Linie (unten), während die Volumenspinwellen M1 in beiden Geometrien mit gleicher Intensität erscheinen, allerdings überraschenderweise mit höherer Intensität in der Anti-Stokes-Linie [VI.3]
k0
kk
qk
und damit auch x0
x
x
qk :
Entsprechend sieht man nur die Anti-Stokes-Linie MAS 2 für die Oberflächenwelle. Die Volumenwelle ist sowohl als Stokes- wie als Anti-StokesLinie sichtbar, bemerkenswerterweise aber mit höherer Intensität in der Anti-Stokes-Linie: Die Zahl der beitragenden Volumenwellen gleicher Frequenz ist für beide Streugeometrien nicht gleich.
229
Literatur VI.1 R. W. Damon, J. R. Eshbach: J. Phys. Chem. Solids 19, 308 (1961) VI.2 P. Grünberg, W. Zinn: IFF Bulletin 22 (KFA, Jülich 1983), p. 3 VI.3 R. E. Camley, P. Grünberg, C. M. Mayer: Phys. Rev. B 26, 2609 (1982)
Tafel VI
Literatur
Tafel VII
Tafel VII Magnetismus in Schichtsystemen und GMR-Effekt
Magnetische Anisotropie in Dünnschichtsystemen Magnetische Dünnschichtsysteme haben große Bedeutung für die Technik der Datenverarbeitung und Sensorik. Aber auch dem Grundlagenforscher bieten sie eine faszinierende Spielwiese, auf der es erstaunliche Effekte zu entdecken gibt. Die Vielgestaltigkeit magnetischer Phänomene in Dünnschichtsystemen beruht in erster Linie auf der großen Zahl verschiedener, miteinander konkurrierender Anisotropien. Eine erste Quelle der Anisotropie ist die spezifische Form. Betrachten wir z. B. einen homogen polarisierten Film. Liegt die Magnetisierung senkrecht zur Schicht, so erzeugt der Sprung in der Magnetisierung M an der Grenzfläche ein Depolarisationsfeld der Stärke Hd = –M (in S.I. Einheiten *). Ist die Magnetisierung hingegen parallel zur Schicht, so gibt es kein Depolarisationsfeld. Eine Drehung der Magnetisierung in die senkrechte Richtung führt zum Aufbau einer senkrechten Komponente der Magnetisierung und damit eines Depolarisationsfeldes. Dies bewirkt eine Änderung der magnetischen Energie. Sie kann aus der differentiellen Form der Energiedichte u du
l0 M? dH?
VII:1
berechnet werden. Mit dem Winkel h zwischen der Magnetisierung und der Filmsenkrechten erhält man nach Integration
* Das magnetische Depolarisationsfeld ist das Analogon zum elektrostatischen Depolarisationsfeld. Im elektrostatischen Fall entsteht durch den Sprung in der elektrischen Polarisation eine Flächenladung, die ein elektrisches Feld erzeugt (vgl. Kap. 11.7)
1 u l0 M 2 cos2 h :
VII:2 2 In Originalarbeiten auf dem Gebiet des Magnetismus werden in der Regel cgs-Einheiten benutzt. Im cgs-System nimmt (VII.2) die Form u 2pM 2 cos2 h an. Für Cobalt ist die Depolarisationsenergie 1,23 ´ 106 Jm–3 bei 300 K und damit um einen Faktor zwei größer als die magnetokristalline Anisotropie-Energie von 5,1 ´ 105 Jm–3. Ein Ni(100) Film hätte eine magnetokristalline Anisotropie-Energie von –2 ´ 103 Jm–3 zugunsten der h111i-Richtung. Die Depolarisationenergie ist 1,5 ´ 105 Jm–3. Die leichte Achse läge deshalb in beiden Fällen stets parallel zur Oberfläche, gäbe es nicht noch weitere Quellen der Anisotropie. Diese sind die elastische Verspannung in Dünnschichtsystemen und die Oberflächen- bzw. Grenzflächenanisotropie. Elastische Verspannungen brechen häufig die Symmetrie, indem z. B. eine kubische Struktur zu einer tetragonalen Struktur verzerrt wird. Durch die Symmetriebrechung wird die quantitative Beschreibung der magnetokristallinen Anisotropie etwas komplex und soll hier nicht behandelt werden (für Details siehe [VII.1]). Die grenzflächenspezifische Anisotropie beruht auf der veränderten Austauschwechselwirkung und der veränderten Spin-Bahnkopplung an Grenzflächen. Die mit der Grenzflächenanisotropie verbundene Energie ist proportional zur Fläche des Films, nicht proportional zum Volumen. Betrachtet man die Energie pro Volumen, so ist der Grenzflächenanteil umgekehrt proportional zur Schichtdicke d. Für das einfache Beispiel eines Films mit kubischer Kristallstruktur mit der (100)-Fläche parallel zur Schichtebene ist die Energiedichte bei Rotation der Magnetisierung in einer [010] Zone
231
Tafel VII
Austausch-Anisotropie (exchange bias)
Abb. VII.1. Epitaktische Mono- und Doppellagen von Eisenfilmen auf W(110). Die Orientierung der Magnetisierung wechselt zwischen parallel und senkrecht zur Oberfläche [VII.2]
(
1 l M2 u 2 0
Ko Kg d
K1 cos2 h sin2 h :
)
Austausch-Anisotropie (exchange bias)
cos2 h
VII:3
Dabei ist h der Winkel mit der [100] Richtung senkrecht zur Filmebene und Ko and Kg sind Konstanten, welche die Oberflächen- bzw. Grenzflächenanisotropie beschreiben. Positive Werte der Konstanten bewirken, dass die bevorzugte Orientierung bei kleinen Schichtdicken d senkrecht zur Filmebene liegt. Oberhalb einer kritischen Dicke dc überwiegt die Formanisotropie und die Magnetisierung dreht in die Filmebene: dc 2
Ko Kg =l0 M 2 :
VII:4
Dies ist ein häufig auftretender Fall. Die in der Regel gegebene elastische Verzerrung epitaktisch aufgewachsener Filme und die dadurch hervorgerufene Anisotropie kann auch das Umgekehrte bewirken, die Drehung in die Filmsenkrechte bei größeren Dicken. Ein Beispiel ist die Drehung der Magnetisierung in Eisenfilmen auf W(110) beim Übergang von einer zu zwei Monolagen Dicke. Auf einer gestuften Fe(110) Oberfläche, bei der das Wachstum der Eisenschicht von den Stufenkanten her erfolgt, führt dies bei einer mittleren Bedeckung von 1,5 Monolagen zu einer abwechselnd vertikalen und parallelen Orientierung der Magnetisierung (Abb. VII.1). Da die Magnetisierung M von der Temperatur abhängt, ist auch die Energiebilanz, z. B. in (VII.3) temperaturabhängig. Auch als Funktion der Temperatur kann sich deshalb eine Drehung der Richtung der Magnetisierung ergeben.
Im Jahr 1956 entdeckten Meiklejohn and Bean, dass die magnetische Hysteresekurve von Cobaltnanopartikeln, die mit einer Cobaltoxidschicht überzogen waren, nach Abkühlung in einem Magnetfeld bei 77 K auf der H-Achse verschoben war [VII.3]. Das Phänomen wurde der Austauschkopplung an der Grenzschicht zwischen dem antiferromagnetischen Cobaltoxid und dem ferromagnetischen Cobalt zugeschrieben und als Austausch-Anisotropie bezeichnet. In der englischen Literatur ist heute der Ausdruck exchange bias gebräuchlich. Der Effekt wird hier am Beispiel einer ferromagnetischen Eisenschicht auf einem antiferromagnetischen NiO-Substrat erläutert. Durch Abkühlen in einem starken Magnetfeld unter die Curie-Temperatur der Eisenschicht wird zunächst ein eindomäniger Zustand der Eisenschicht erzeugt. Bei weiterer Abkühlung unter die Néel-Temperatur des NiO-Substrats entsteht eine geordnete antiferromagnetische Phase im NiO (Bild oben rechts in Abb. VII.2). Wegen der Austauschkopplung an der Grenzschicht zwischen Ferro- und Antiferromagnet bedarf es jetzt eines höheren Magnetfeldes in umgekehrter Richtung, um die Magnetisierung in der Eisenschicht umzudrehen: die Hysteresekurve ist dadurch nach links verschoben (ausgezogene Linie in Abb. VII.2). Oberhalb der Néel-Temperatur sind die Spins in NiO ungeordnet und die Magnetisierungskurve der Eisenschicht ist symmetrisch um den Punkt H = 0 (gestrichelte Linie in Abb. VII.2). Die Austauschanisotropie ermöglicht es, die Hysteresekurve auf der Magnetfeldachse hin und
Tafel VII Magnetismus in Schichtsystemen und GMR-Effekt
Tafel VII
232
Abb. VII.2. Magnetisierung eines ferromagnetischen Eisenfilms, der über die Austauschkopplung an der Grenze zu einem antiferromagnetischen NiO-Substrat an die geordnete (ausgezogene Linie) oder die ungeordnete (gestrichelte Linie) antiferromagnetische Phase ankoppelt. Durch die Austauschkopplung ist die Hysteresekurve nach links verschoben, wenn der antiferromagnetische Zustand geordnet ist
her zu schieben. Betrachten wir zum Beispiel das Vierschichtensystem in Abb. VII.3. Das System besteht aus einer austauschgekoppelten ferromagnetischen Schicht (AKFM) auf einem antiferromagnetischen Substrat (AF), einer nichtmagnetischen Schicht (NM) und einer zweiten ferromagnetischen Schicht (FM). Bei kleinen Feldern ist die Magnetisierung der AKFM-Schicht fixiert durch die Austauschkopplung und es wird die punktierte Hysteresekurve durchlaufen. In dieser Konfiguration stellt das System einen binären Speicher dar. Ersetzt man die ferromagnetische Deckschicht durch eine Schicht aus weichmagnetischem Material wie. z. B. Permalloy (NiFe) oder l-Metall, so ergibt sich der strichpunktierte Verlauf der Magnetisierung. Für positive und negative Felder ist also die Magnetisierung beidseits der nichtmagnetischen Schicht (NM) gleichbzw. entgegengesetzt gerichtet. Im Zusammenhang mit dem jetzt zu besprechenden Magnetowiderstandseffekt ergibt sich so ein Sensor für Magnetfelder.
Abb. VII.3. Verlauf der Magnetisierung eines Vierschichtensystems bestehend aus einer austauschgekoppelten ferromagnetischen Schicht (AKFM) auf einem antiferromagnetischen Substrat (AF), einer nichtmagnetischen Schicht (NM) und einer zweiten ferromagnetischen Schicht (FM). Für große Felder wird die ausgezogene Hysterese durchlaufen, für kleine Felder die punktierte. Der strichpunktierte Verlauf ergibt sich, wenn die FM-Deckschicht aus einem weichmagnetischen Material besteht
Der Riesenmagnetowiderstandseffekt (GMR-Effekt) Der Riesenmagnetowiderstand (englisch: Giant Magneto-Resistance, GMR) wurde im Jahre 1988 von zwei Gruppen unabhängig voneinander entdeckt. Die Entdeckung wurde 2007 mit der Verleihung des Nobelpreises an Albert Fert und Peter Grünberg gewürdigt. Beide Gruppen fanden, dass der elektrische Widerstand eines Schichtsystems bestehend aus ferromagnetischen und nichtmagnetische Schichten davon abhängt, ob die Magnetisierung in benachbarten Schichten parallel (::) oder antiparallel (:;) ausgerichtet ist. Der Magnetowiderstand ist definiert als DR=R
R:;
R:: =R :
VII:5
Er betrug 1,5% für ein Dreischichtensystem [VII.4] und 50% für ein Vielschichtsystem bei tiefen Temperaturen [VII.5]. Das Dreischichtensystem von Binasch et al. [VII.4] besteht aus einem Fe-Cr-Fe-Sandwich (Abb. VII.4), welches auf einem GaAs(110)-Substrat epitaktisch gewachsen war. Die 12 nm dik-
ken Eisenfilme wachsen ebenfalls in (110)-Orientierung, so dass die leichte [100]-Achse und die harte [110]-Achse beide in der Schichtebene liegen. Die Dicke der Chromschicht betrug 1 nm. Ohne äußeres Feld ist die Magnetisierung der Eisenschichten durch die Kopplung über die antiferromagnetische Chromschicht antiparallel zueinander. In einem starken Magnetfeld parallel zur [100] Richtung und zur Schichtebene richten sich die Magnetisierungen parallel zueinander aus (Abb. VII.4 rechts bzw. links). Der parallel zur Schichtebene gemessene Widerstand ist in diesem Fall um 1,5% kleiner. Der Grund für den kleineren Widerstand ist, dass Elektronen aus einer der beiden Eisenschichten beim Durchtritt durch die Chromschicht in die andere Eisenschicht ihren Spin mitnehmen. Ist die Magnetisierungsrichtung der Eisenschichten gleich, findet z. B. ein Spin-up Elektron aus der ersten Schicht einen bezüglich k-Vektor und Energie gleichartigen Zustand in der zweiten Schicht. Es erfährt deshalb nur eine geringfügige Streuung an den Grenzflächen. Bei antiparalleler Magnetisierung sind die Spin-up Zustände der zweiten Eisenschicht auf der Energieskala um die Austauschaufspaltung verschoben (Abb. 8.6). Das Elektron findet in der Regel in der zweiten Eisenschicht keinen passenden Zustand und wird deshalb an der Grenzfläche unter Verlust seiner Vorzugsrich-
Abb. VII.4. Magnetowiderstand in einem Dreischichtensystem nach Binasch et al. [VII.4]. Durch die Kopplung über die antiferromagnetische Chromschicht wird in Abwesenheit eines äußeren Feldes die Magnetisierung der Eisenschichten antiparallel zueinander gehalten. Durch ein äußeres Feld kann eine parallele Magnetisierung der Eisenschichten erzwungen werden. Der elektrische Widerstand ist in diesem Fall um 1,5% geringer
233
tung gestreut, was den elektrischen Widerstand erhöht (siehe auch Kap. 9). Das Schichtsystem in Abb. VII.4 ist noch nicht als Sensor für kleine Magnetfelder geeignet, da der Effekt der Widerstandsänderung bei H = 0 verschwindet. Ein empfindlicher Sensor entsteht durch Kombination mit der Austauschanisotropie. Abb. VII.5 zeigt eine technische Realisierung nach Paul et al. [VII.6]. Die Magnetisierung in der obersten Permalloyschicht ist leicht rotierbar. Darunter befindet sich die beidseitig durch Cobalt begrenzte Kupferschicht für den Magnetowiderstandseffekt. Die Cobaltschichten dienen der Erhöhung des Magnetowiderstands. Eine solche Anordnung wird auch als Spinventil bezeichnet. Die Richtung der Magnetisierung in der unteren NiFe-Schicht ist durch Austauschkopplung an die antiferromagnetische FeMn-Schicht gekoppelt. Abb. VII.5 zeigt die Magnetisierung der gesamten Anordnung (ausgezogene Linie) zusammen mit der Änderung des Widerstands (gestrichelte Linie). Durch die Austauschkopplung ist jetzt der Zusammenhang zwischem äußerem Feld und der Widerstandänderung linear mit sehr steiler Kennlinie. Bereits kleine Feldänderungen führen zu messbaren Widerstandsänderungen. Die Empfindlichkeit des Sensors und die Tatsache, dass er sehr klein gefertigt werden kann, machen
Tafel VII
Der Riesenmagnetowiderstandseffekt (GMR-Effekt)
Tafel VII Magnetismus in Schichtsystemen und GMR-Effekt
Tafel VII
234
Abb. VII.5. Magnetisierung (ausgezogene Linie) und Magnetowiderstand (gestrichelte Linie) eines Sensorsystems nach Paul et al. [VII. 6]). Das Magnetfeld ist in Oestedt angegeben (1 Oe für H ist 1000/4p Am–1)
ihn zum derzeit bevorzugten Sensor in magnetischen Festplattenspeichern.
Literatur VII.1 H. Ibach: Physics of Surfaces and Interfaces (Springer, Berlin Heidelberg New York 2006), p. 445 ff.
VII.2 H. J. Elmers, J. Haunschild, U. Gradmann: Phys. Rev. B 59, 3688 (1999) VII.3 W. H. Meiklejohn, C. P. Bean: Phys. Rev. 102, 1413 (1956) VII.4 G. Binasch, P. Grünberg, F. Saurenbach, W. Zinn: Phys. Rev. B 39, 4828 (1989) VII.5 M. N. Baibich, J. M. Broto, A. Fert, F. Nguyen van Dau, F. Petroff, P. Eitenne, G. Creuzet, A. Friederich, J. Chazelas: Phys. Rev. Lett. 61, 2475 (1988) VII. 6 A. Paul, M. Buchmeier, D. Bürgler, P. Grünberg: J. Appl. Phys. 97, 023910 (2005)
9. Bewegung von Ladungsträgern und Transportphänomene
Wichtige Phänomene, wie die elektrische Leitfähigkeit und die Wärmeleitfähigkeit durch Elektronen, beruhen auf der Bewegung von Ladungsträgern im Festkörper. Die Beschreibung dieser Effekte geht über das bisher Betrachtete hinaus, da wir es mit zeitabhängigen Problemen zu tun haben, bisher aber nur Lösungen der zeitunabhängigen Schrödinger-Gleichung bzw. Aussagen über das thermodynamische Gleichgewicht (Besetzung nach der Fermi-Statistik etc.) betrachtet wurden. Das vorliegende Kapitel beschäftigt sich mit der Fragestellung, wie sich Ladungsträger in Bandstrukturen verhalten, wenn wir z. B. ein äußeres elektrisches Feld anlegen und so das System aus dem thermodynamischen Gleichgewicht herauszwingen. Hierbei ist natürlich der einfachste Fall der des stationären Zustandes, wo die äußeren Einflüsse, z. B. elektrisches Feld oder Temperaturgradient, zeitunabhängig sind.
9.1 Bewegung von Ladungsträgern in Bändern – die effektive Masse Will man die Bewegung von Elektronen im Festkörper beschreiben, so ist man mit dem gleichen Problem konfrontiert, das sich ergibt, wenn die Bewegung eines mehr oder weniger lokalisierten freien Teilchens im Bild einer Wellentheorie dargestellt werden soll: Die Bewegung eines freien Elektrons mit festem Impuls p wird z. B. durch eine unendlich ausgedehnte ebene Welle beschrieben, hierbei bedeutet die Angabe eines scharfen Wellenzahlvektors k das Inkaufnehmen einer totalen Unschärfe im Raum: Die ebene Welle ist längs der gesamten x-Achse definiert. Ist infolge einer Ortsmessung eine Lokalisierung des Elektrons längs einer Strecke Dx gegeben, so bedeutet dies, dass der Impuls bzw. der Wellenvektor über einen bestimmten Bereich Dk unbestimmt ist. Lokalisierung bedeutet, dass der Zustand des Elektrons durch ein Wellenpaket, d. h. eine lineare Superposition von ebenen Wellen mit Wellenzahlen aus einem Bereich {k–Dk/2, k+Dk/2} beschrieben wird, d. h. kDk=2
w
x; t
a
keikx k Dk=2
x
kt
dk ;
9:1
236
9. Bewegung von Ladungsträgern und Transportphänomene
Abb. 9.1. Schematische Ortsdarstellung eines Wellenpaketes (Re {w}: durchgezogene Linie, jwj: gestrichelt), das die Bewegung eines räumlich lokalisierten, freien Elektrons beschreibt, für verschiedene Zeiten t = 0, t0, 2 t0 . . . . Das Zentrum des Wellenpaketes, d. h. im Teilchenbild das Elektron selbst, wandert mit der Gruppengeschwindigkeit v @x=@k, wobei sich die Halbwertsbreite von jwj mit der Zeit vergrößert. Die Wellenlänge der Oszillationen von Re {w} wird beim „Auseinanderlaufen“ des Paketes auf der „Vorderseite“ kleiner und sie wächst auf der „Rückseite“
wobei x (k) im allgemeinen über spezielle Dispersionsbeziehungen gegeben ist. Als Beispiel ist in Abb. 9.1 ein Wellenpaket in seiner Ortsdarstellung gezeichnet. Aus der Fourier-Darstellung (9.1) folgt in der Wellenmechanik die Unschärferelation Dp Dx hDk Dx h :
9:2
Die translatorische Bewegung eines solchen Wellenpaketes lässt sich durch die Angabe der sog. Gruppengeschwindigkeit v
@x ; @k
9:3
d. h. der Geschwindigkeit des Schwerpunktes des räumlich lokalisierten Wellenpaketes beschreiben (zu unterscheiden von der Phasengeschwindigkeit c = x/k einer ebenen Welle!). Hierbei ist zu beachten, dass infolge der Dispersion x = c (k) k, die innerhalb der Schrödingerschen Wellenmechanik schon für das freie Elektron gegeben ist, ein solches Wellenpaket mit der Zeit „auseinanderläuft“, d. h. seine Gestalt verändert. Dies ist in Abb. 9.1 dargestellt. Im Kristall werden Elektronen durch Bloch-Wellen beschrieben, die räumlich modulierte, unendlich ausgedehnte Wellen (Wellenzahlvektor k) darstellen. Ein lokalisiertes Kristallelektron wird also zweckmäßig auch durch die Superposition von Bloch-Wellen zu einem Wellenpaket beschrieben, d. h. die Lokalisierung in einem Raumbereich beinhaltet eine gewisse k-, bzw. Impulsunschärfe, die über die Unschärferelation mit der Ortsunschärfe in Beziehung steht. Die Geschwindigkeit v eines Kristallelektrons ist in dieser semiklassischen Darstellung als Gruppengeschwindigkeit des Wellenpaketes aus Bloch-Wellen gegeben: 1 v rk x
k rk E
k : h
9:4
9.1 Bewegung von Ladungsträgern in Bändern – die effektive Masse
237
Hierbei ist die Energie-Wellenvektorabhängigkeit E (k) desjenigen Bandes einzusetzen, aus dem das Elektron stammt. Diese Darstellung beinhaltet natürlich den Fall des freien Elektrons, wo E = h 2 k 2/2 m ist; dort folgt aus (9.4): v = k h/m = p/m. Folgende Korrespondenzbetrachtung führt uns nun zur semiklassischen Bewegungsgleichung eines Kristallelektrons: Ein Wellenpaket, das ein Kristallelektron mit mittlerem Wellenzahlvektor k beschreibt, erfährt während der Zeit dt in einem äußeren elektrischen Feld E einen Energiezuwachs eE v d t ;
dE
9:5
wobei v die Gruppengeschwindigkeit des Wellenpaketes (9.4) darstellt. Aus (9.4) und (9.5) folgt sofort: dE rk E
k dk hv dk ; h dk h k_
9:6 a
e E dt ;
9:6 b
eE :
9:6 c
Diese Bewegungsgleichung, die für freie Elektronen unmittelbar aus dem Korrespondenzprinzip folgt, besagt also, dass ein äußeres elektrisches Feld den Wellenzahlvektor k eines Kristallelektrons nach Maßgabe von (9.6 c) ändert. Es lässt sich allgemein durch Behandlung der zeitabhängigen Schrödinger-Gleichung im Kristall zeigen, dass (9.6 c) für Wellenpakete von Bloch-Zuständen gilt, wenn nur die betrachteten äußeren elektromagnetischen Felder nicht zu groß (gemessen an atomaren Feldern) sind und nicht zu stark räumlich und zeitlich variieren (gemessen an atomaren Abständen). Die Gln. (9.6) gestatten das Aufstellen einer semiklassischen Bewegungsgleichung für Kristallelektronen in äußeren Feldern, wobei der Einfluss der atomaren Kristallfelder nur noch phänomenologisch in Gestalt der Bandstruktur E (k) erscheint: Aus (9.4) und (9.6) folgt für die Änderung der Gruppengeschwindigkeitskomponente v i eines Kristallelektrons: v_ i
1 d 1 X @2E _
r rk Ei kj ; h dt j @ki @kj h
9:7 a
v_ i
1 X @2E
e E j : h2 j @ki @kj
9:7 b
Diese Bewegungsgleichung ist völlig analog der klassischen Bewegungsgleichung v_ m 1
e E einer punktförmigen Ladung (– e) im Feld E , man hat nur formal die skalare Masse m durch eine tensorielle sog. effektive Masse mij zu ersetzen. Hierbei ist
1 1 @ 2 E
k m ij h2 @ki @kj
9:8
238
9. Bewegung von Ladungsträgern und Transportphänomene
der inverse Massentensor gerade durch die Krümmung des E (k)Verlaufes gegeben. Da der Massentensor mij wie auch (mij)–1 symmetrisch sind, lassen sie sich auf Hauptachsen transformieren. Im einfachen Falle, dass die drei effektiven Massen im Hauptachsensystem gleich m sind, gilt h2 m d 2 E=dk2 :
9:9
Dieser Fall ist gegeben, wenn wir uns im Minimum oder Maximum eines „parabolischen“ Bandes befinden, wo die E (k )-Abhängigkeit in guter Näherung beschrieben werden kann durch h2
9:10
k2 ky2 kz2 : 2 m x In der Umgebung eines solchen kritischen Punktes ist die sog. effektive Massennäherung besonders nützlich, weil hier m eine Konstante darstellt. Außerhalb solcher kritischer Punkte wird wegen der Abweichung der E (k)-Fläche von der Parabelgestalt (9.10) m natürlich von k abhängen. In Abb. 9.2 sind zwei eindimensionale Bandverläufe E (k) mit starker (a) und schwacher Krümmung (b) an den Bandrändern dargestellt. Entsprechend ergeben sich kleine (a) und große (b) effektive Massen an den Bandrändern. Am Brillouin-Zonenrand (obere E
k E0
Abb. 9.2 a, b. Schematische Darstellung der effektiven Masse m
k für ein eindimensionales Bandschema E (k): (a) bei starken Bandkrümmungen, d. h. kleinen effektiven Massen; (b) bei schwachen Bandkrümmungen, d. h. großen effektiven Massen. Die gestrichelten Linien bezeichnen die Lage der Wendepunkte in E (k)
9.2 Ströme in Bändern und Defektelektronen
239
Bandkante), wo die Krümmung negativ ist, ist auch die effektive Masse negativ. Hier zeigt sich ganz klar, dass im effektiven Massenkonzept die Wirkung des periodischen Potentials summarisch in die Größe m hineingesteckt wurde. Es sei noch vermerkt, dass nach dem eben Ausgeführten alle Aussagen in Kap. 6 über das freie Elektronengas in Metallen erhalten bleiben, wenn man nur Elektronen in solchen Bereichen der Energiebänder betrachten muss, wo E (k) durch die Parabelnäherung (9.10) beschrieben werden kann. Man hat also in der Nähe solcher Bandextrema nur die Masse m des freien Elektrons durch die dort konstante effektive Masse m zu ersetzen.
9.2 Ströme in Bändern und Defektelektronen Wegen der in einem Band stark veränderlichen effektiven Masse – am oberen Bandrand bewegen sich Elektronen entgegengesetzt zu denen am unteren – stellt sich unmittelbar die Frage, wie tragen Elektronen mit verschiedenen k-Vektoren, also auf verschiedenen Zuständen im Band, zum elektrischen Strom bei? Ein Volumenelement dk bei k trägt zur Teilchenstromdichte jn djn v
k
dk 1 3 rk E
k dk 3 8p 8p h
9:11
bei, denn die Dichte der Zustände im k-Raum beträgt V/(2 p )3 bzw. 1/(2 p )3, falls man sie auf das Volumen V des Kristalls bezieht. Wir beachten dabei, dass spinentartete Zustände doppelt gezählt werden müssen. Damit tragen alle Elektronen eines voll besetzten Bandes zur elektrischen Stromdichte j wie folgt bei:
e rk E
k dk :
9:12 j 3 8p h 1: Brill: Z:
Da das Band voll besetzt ist, erstreckt sich das Integral über die gesamte erste Brillouin-Zone, d. h., neben jeder Geschwindigkeit v
k rk E
k=h trägt auch v
k zum Integral bei. Da das reziproke Gitter die Punktsymmetrie des Realgitters besitzt (Abschn. 3.2), gilt für Kristallstrukturen mit Inversionszentrum E
k E
k :
9:13
Bezeichnen wir die beiden möglichen Spinzustände eines Elektrons formal mit zwei Pfeilen (: bzw. ;), so lässt sich (9.13) auch auf allgemeine Kristallstrukturen ohne Inversionszentrum verallgemeinern zu E
k" E
k# :
9:14
240
9. Bewegung von Ladungsträgern und Transportphänomene
Der Beweis von (9.14) folgt aus der Zeitumkehrinvarianz der Schrödinger-Gleichung bei Berücksichtigung des Spins. Ohne Berücksichtigung des Spins, d. h. bei Annahme von Spinentartung, gilt also (9.13) allgemein und wir erhalten für die zu k gehörenden Elektronengeschwindigkeiten 1 1 rk E
k v
k : v
k r k E
k
9:15 h h Damit folgt allgemein aus (9.12) für die Stromdichte, die von einem vollen Band getragen wird: j (volles Band) 0 :
9:16
Stellen wir uns jetzt ein Band vor, das nur partiell mit Elektronen besetzt ist, dann wird ein äußeres elektrisches Feld E wegen der Bewegungsgleichung (9.6 c) Elektronen von den symmetrisch um k = 0 verteilten, besetzten Zuständen auf Zustände bewegen, die jetzt nicht mehr symmetrisch um k = 0 liegen. Die Verteilung der besetzten Zustände wird wegen der Auszeichnung einer Richtung durch E nicht mehr inversionssymmetrisch sein, und es folgt j (nicht volles Band) j 0:
9:17
Da jetzt statt über die gesamte Brillouin-Zone wie in (9.12) nur über die besetzten Zustände integriert wird, folgt unter Zuhilfenahme von (9.12) und (9.16):
e j 3 v
k dk 8p k besetzt
e e v
k dk v
k dk ;
9:18 3 8p 8p3 1: Brill: Z: k leer
e j 3 v
k dk : 8p k leer
Die Tatsache, dass bei einem partiell gefüllten Band nur über die besetzten Zustände integriert wird, äußert sich so, dass der Gesamtstrom der Elektronen in diesem Band formal durch einen Strom positiver Teilchen beschrieben werden kann, die den unbesetzten Zuständen (k leer) in diesem Band zugeordnet sind. Man nennt diese Quasiteilchen, für die analoge dynamische Gesetze wie im Abschn. 9.1 für Elektronen hergeleitet werden können, Defektelektronen oder Löcher. Auch bezüglich ihrer Dynamik in einem äußeren Feld zeigen Löcher das Verhalten positiver Teilchen: Ein Band sei fast ganz gefüllt, so dass nur der energetisch höchste Teil in der Nähe eines Maximums ungefüllte Zustände aufweist: im thermodynamischen Gleichgewicht werden natürlich Elektronen immer die energetisch niedrigsten Zustände einnehmen, Löcher sich somit an der Oberkante des Bandes befinden. In der Nähe des Maximums gelte für E (k) die parabolische Näherung
9.3 Streuung von Elektronen in Bändern
E
k E0
h2 k2 : 2jm^j
241
9:19
m^ soll anzeigen, dass es sich um die elektronische effektive Masse an der oberen Bandkante handelt, die dort negativ ist. Für die Beschleunigung, die ein Loch in diesen Zuständen unter dem Einfluss eines elektrischen Feldes erfährt, gilt, wenn man (9.6 c) benutzt: 1 _ e h k E :
9:20 jm^ j jm^j Hierbei ist gemäß (9.18) rk E und _k dem unbesetzten elektronischen Zustand zuzuordnen. Die Bewegungsgleichung (9.20) ist die eines positiv geladenen Teilchens mit positiver effektiver Masse jm^j, d. h., Löchern an der oberen Bandkante muss man eine positive effektive Masse zuordnen. Aus der Tatsache, dass ein vollbesetztes elektronisches Band keinen Strom führen kann, folgt sofort, dass ein Kristall, bei dem eine absolute Bandlücke zwischen dem höchsten besetzten und dem niedrigsten unbesetzten Band existiert, ein Isolator ist. Diese Aussage ist allerdings nur richtig für Temperaturen am absoluten Nullpunkt. Wegen der Endlichkeit der Fermi-Funktion E EF auch für die niedrigsten von Null verschiedenen Temperaturen T gibt es für Tj 0 K immer einige wenige thermisch angeregte Elektronen, die in dem niedrigsten fast unbesetzten Band (genannt Leitungsband) bei Anlegen eines elektrischen Feldes einen Strom führen. Desgleichen werden die durch die thermische Anregung erzeugten Löcher im höchsten besetzten Band, dem sog. Valenzband, einen Strom führen. Bei höheren Temperaturen wird der Strom also sowohl durch Elektronen als auch durch Löcher getragen. Dieses Verhalten ist charakteristisch für Halbleiter und Isolatoren, wobei der Unterschied zwischen Halbleiter und Isolator nur ein gradueller ist. Wie gut ein Material zum Beispiel bei Zimmertemperatur leitet, ist im wesentlichen von der energetischen Breite des verbotenen Bandes abhängig, über das die Elektronen thermisch angeregt werden müssen (Kap. 12). Ein Metall, das bei allen Temperaturen eine im wesentlichen konstante Anzahl freier Ladungsträger besitzt, liegt nach dem vorher Gesagten immer dann vor, wenn ein elektronisches Band nur zum Teil gefüllt ist. Die in diesem partiell gefüllten Band vorhandenen Elektronen sind jene, die wir im Rahmen des Potentialtopfmodells (Kap. 6) betrachtet haben. v_
1 d r rk E
k h dt
9.3 Streuung von Elektronen in Bändern In der bisherigen Betrachtung wurde eine wesentliche Tatsache außer acht gelassen, nämlich die, dass Elektronen, die sich unter dem Einfluss äußerer Felder im Kristall bewegen, Stöße erleiden, die
242
9. Bewegung von Ladungsträgern und Transportphänomene
auf ihre Bewegung hemmend wirken. Wäre dies nicht der Fall, so gäbe es keinen elektrischen Widerstand; ein Strom, der einmal durch ein vorübergehend angelegtes elektrisches Feld hervorgerufen würde, bliebe für immer bestehen wegen der Gültigkeit der semiklassischen Bewegungsgleichung (9.7 b bzw. 9.20). Dieses Phänomen wird als „Supraleitung“ bei vielen Materialien beobachtet (Kap. 10). Normalleiter haben dagegen einen endlichen, oft hohen elektrischen Widerstand. Was sind also die entscheidenden Stoßprozesse, die Elektronen erleiden, wenn sie durch äußere Felder beschleunigt werden? Drude (1900) [9.1] hatte noch angenommen, dass die Elektronen an die im Gitter periodisch angeordneten, positiven Rümpfe stoßen. Daraus müsste man auf eine mittlere freie Weglänge zwi˚ schließen. Dies schen zwei Stößen von der Größenordnung 1–5 A steht aber im krassen Widerspruch dazu, dass bei Zimmertemperatur für die meisten Metalle freie Weglängen gefunden werden, die um etwa zwei Größenordnungen höher liegen (Abschn. 9.5). Die Erklärung der Diskrepanz gelang erst, als man erkannte, dass ein exakt periodisches Gitter, bestehend aus positiven Rümpfen, keinen Anlass zur Elektronenstreuung gibt. Diese Tatsache folgt unmittelbar im Rahmen der Einelektronennäherung, weil durch das Gitter laufende Bloch-Wellen stationäre Lösungen der Schrödinger-Gleichung sind. Diese Lösungen beschreiben also wegen der Zeitunabhängigkeit von ww die ungestörte Ausbreitung von Elektronenwellen. Diese Aussagen gelten natürlich ebenso für Wellenpakete aus Bloch-Wellen, die lokalisierte Elektronen beschreiben. Abweichungen von dieser ungestörten Ausbreitung, d. h. Störungen der stationären Bloch-Zustände, können nur auf zweierlei Art zustande kommen: I) Im Rahmen der Einelektronennäherung, wo Wechselwirkungen der Elektronen untereinander vernachlässigt werden, sind Abweichungen von der strengen Periodizität des Gitters die Ursache für Elektronenstreuung, dies können sein: a) zeitlich und räumlich fest eingebaute Störstellen im Gitter (Lücken, Versetzungen, Fremdatome usw.), b) zeitlich veränderliche Abweichungen von der Periodizität, d. h. Gitterschwingungen. II) Die Einelektronennäherung vernachlässigt Wechselwirkungen zwischen den Elektronen. Elektron-Elektron-Stöße, die also im Konzept des nicht wechselwirkenden Fermi-Gases nicht enthalten sind, können sehr wohl zu einer Störung der stationären Bloch-Zustände führen. Wie wir sehen werden, ist dieser Effekt von weitaus geringerer Bedeutung als die unter I) angeführten Störungen der Gitterperiodizität. Die entscheidende Größe für die Beschreibung eines Elektronenstreuprozesses ist die Übergangswahrscheinlichkeit wk' k, mit der ein Elektron aus einem Bloch-Zustand wk (r) in einen Zustand wk' (r) übergeht durch die Wirkung einer der vorher beschriebenen
9.3 Streuung von Elektronen in Bändern
243
Störungen. Diese Übergangswahrscheinlichkeit ist nach der quantenmechanischen Störungsrechnung (die Störung des HamiltonOperators sei H 0 ):
wk0 k jhk0 jH 0 jkij2 j drwr0
rH 0 wk
rj2 ;
9:21 d. h., wegen der „Bloch-Gestalt“ von wk (r) gilt
0 0 0 hk jH jki druk0 e i k r H 0 uk ei k r :
9:22
Läßt sich das Störpotential H 0 als Ortsfunktion schreiben, so ist (9.22) zu vergleichen mit dem Fourier-Integral (3.6), das bei der Beugungstheorie an periodischen Strukturen die Beugungsamplitude beschrieb. Man muss nur
uk0 H 0 uk mit der streuenden Elektronendichte R (r) nach (3.6) vergleichen. Durch Vergleich mit den Rechnungen der Beugung an ortsfesten und sich bewegenden Streuzentren (Kap. 3 und Abschn. 4.4) können wir sofort folgern: Wenn H 0 (r) ein zeitlich unveränderliches Potential wie das einer raumfesten Störstelle ist, dann erwarten wir nur elastische Streuung der Bloch-Wellen mit Erhaltung der Energien. Ist H 0 (r, t) ein zeitlich veränderliches Potential, so wie wir es bei der Störung der Periodizität durch eine Gitterwelle (Phonon) haben, dann ist die Streuung inelastisch (Abschn. 4.4). Analog zu den Ergebnissen im Abschn. 4.4 gilt also bei der inelastischen Streuung von Leitungselektronen an Phononen der Energiesatz: E
k0
E
k hx
q :
9:23
Für Streuung an einem im Kristall angeregten Phonon der Wellenzahl q hat zu einem festen Zeitpunkt dies Störpotential H 0 natürlich eine Ortsabhängigkeit exp (i q·r ), d. h., die Streuwahrscheinlichkeit (9.21) enthält ein Matrixelement (9.22) der Gestalt:
0 hk0 jei q r jki druk0 uk ei
k k q r :
9:24 Da
uk0 uk gitterperiodisch ist und sich deshalb in eine FourierReihe nach reziproken Gittervektoren entwickeln lässt, ergibt sich genau wie im Abschn. 4.3, dass das Matrixelement in (9.24) von Null verschieden ist, wenn gilt: k0
kqG:
9:25
Bis auf den reziproken Gittervektor G ähnelt diese Beziehung einem Impulserhaltungssatz. Man beachte jedoch, dass k nichts anderes als der Wellenvektor eines Bloch-Zustandes, d. h. eine Quantenzahl, ist. Nur für das freie Elektron ist h k der wirkliche Impuls. Nimmt man jedoch die Energieerhaltung (9.23) mit der k-Erhaltung (9.25) zusammen, so lässt sich genau wie im Abschn. 4.3 einsehen, dass die Stöße von Elektronen in Bloch-Zuständen gut im Teilchenbild beschrieben werden können.
244
9. Bewegung von Ladungsträgern und Transportphänomene
Verlässt man die Einelektronennäherung und betrachtet ElektronElektron-Stöße, dann lässt sich in einer Vielteilchenbeschreibung auch zeigen, dass der Energieerhaltungssatz sowie der Wellenzahlerhaltungssatz (Quasiimpulssatz) gelten, d. h., für einen Zweierstoß (1) + (2) ? (3) + (4) von Elektronen muss gelten: E1 E2 E 3 E 4 ;
9:26
wo Ei = E (ki) die Einteilchenenergie eines Elektrons im nichtwechselwirkenden Fermi-Gas bezeichnet. Ferner muss für die entsprechenden k-Vektoren gelten: k1 k2 k3 k4 G :
9:27
Man würde naiverweise erwarten, dass bei einer Packungsdichte der Größenordnung eines Elektrons pro Elementarzelle und der Stärke der Coulomb-Abstoßung eine hohe Wahrscheinlichkeit für Stöße [beschrieben durch (9.26 u. 9.27)] besteht. Das Pauli-Ausschließungsprinzip verbietet jedoch in hohem Maße Stöße dieser Art: Nehmen wir an, ein Elektron besetze den Zustand E1 > EF , also einen angeregten Zustand knapp oberhalb der Fermi-Energie; das zweite, damit stoßende Elektron befinde sich energetisch innerhalb der Fermi-Kugel: E2 < EF . Damit ein Stoß nach E3 und E4 erfolgen kann, verlangt das Pauli-Prinzip, dass E3 und E4 nicht besetzt sind, d. h., für das Zustandekommen des Stoßes muss neben (9.26) gelten: E1 > EF ; E 2 < E F ; E3 > EF ; E 4 > E F :
9:28 a
Damit folgt aus dem Energiesatz (9.26): E1 E2 E3 E4 > 2EF
9:28 b
bzw.
E1
EF
E2
EF > 0 :
9:28 c
Wenn (E1–EF) < e1 (e1EF), d. h. E1 nur wenig oberhalb der FermiFläche liegt (Abb. 9.3), dann muss wegen (9.28 c) |E2 –EF| =|e2| < e1 sein, d. h., E2 darf nur wenig (*e1) unterhalb von EF liegen. Deshalb
Abb. 9.3. Veranschaulichung eines Elektronen-Zweierstoßes im k-Raum (EF ist die Fermi-Kugel): Zwei Elektronen (1) und (2) mit den Wellenvektoren k1 und k2 stoßen und ändern dabei ihre Wellenvektoren in k3 und k4. Energie und Wellenzahlvektoren bleiben erhalten; ferner können wegen des Pauli-Prinzips nur k3, k4-Vektoren nach dem Stoß erreicht werden, die zu unbesetzten Zuständen (E3 > EF , E4 > EF) gehören
9.4 Boltzmann-Gleichung und Relaxationszeit
245
stellt nur der Bruchteil *e1/EF aller Elektronen Stoßpartner für ein Elektron auf E1 dar. Wenn E1 und E2 in einer Schale ± e1 um EF liegen, müssen wegen (9.28 b, c) sowie wegen der k-Erhaltung (9.27) auch E3 und E4 in der Schale ± e1 um EF liegen. Die k-Erhaltung in der Form k1– k3 = k4– k2 bedeutet, dass in Abb. 9.3 die Verbindungsstrecken (1) – (3) und (2) – (4) gleich lang sind. Da als Endzustände also auch nur der Bruchteil *e1/EF aller besetzten Zustände infrage kommt, verringert die Gültigkeit des Pauli-Prinzips die Stoßwahrscheinlichkeit noch einmal um einen Faktor e1/EF. Die „Temperaturaufweichung“ der Fermi-Funktion ist von der Größenordnung k T, so dass der Zustand E1 in diesem Bereich oberhalb von EF liegt, d. h. e1*k T. In Abhängigkeit von der Temperatur T lässt sich also die Verringerung des Streuquerschnittes für Elektron-Elektron-Stöße durch das Pauli-Prinzip wie folgt abschätzen: !2 kT R/ R0 :
9:29 EF Hierbei ist R0 der Streuquerschnitt, der ohne Gültigkeit des PauliPrinzips für ein klassisches Gas von abgeschirmten Punktladungen gelten würde. Nehmen wir an, dass der Streuquerschnitt für Streuung eines Elektrons an einer im Gitter eingebauten Störstelle (z. B. geladener Rumpf eines Fremdatoms) von der Größenordnung dieses R0 ist – in beiden Fällen handelt es sich um abgeschirmte CoulombFelder –, so muss für die Elektron-Elektron-Streuung die Streuwahrscheinlichkeit bei der Temperatur von 1 K um einen Faktor *10–10 unter der für Elektron-Störstellenstreuung liegen (EF/k wurde zu etwa 105 K angenommen, Abschn. 6.2, Tabelle 6.1). Diese einfachen Überlegungen zeigen einmal von einer anderen Seite her, wie das Pauli-Prinzip dafür verantwortlich ist, dass wir trotz der hohen Elektronendichte im Festkörper in vielen Fällen die Elektronen als nicht miteinander wechselwirkend beschreiben können. Zum anderen folgt, dass wir im weiteren bei der Behandlung der elektrischen Leitfähigkeit von Festkörpern im wesentlichen nur noch Streuung der Elektronen an Störstellen und an Phononen berücksichtigen müssen. Im Kapitel „Supraleitung“ (10.3) werden wir die Diskussion der Elektron-Elektron-Streuung erneut aufnehmen.
9.4 Boltzmann-Gleichung und Relaxationszeit Transportphänomene, wie z. B. elektrischer Stromfluss im Festkörper, beinhalten zwei charakteristische, entgegengesetzt wirkende Mechanismen: treibender Einfluss von äußeren Feldern und hemmende Wirkung von Stößen der den Strom tragenden Ladungsträger an Phononen und Störstellen. Das Zusammenspiel beider Mechanis-
246
9. Bewegung von Ladungsträgern und Transportphänomene
men wird durch die sog. Boltzmann-Gleichung beschrieben. Mit Hilfe dieser Gleichung lässt sich ermitteln, wie sich die Verteilung der Ladungsträger im thermischen Gleichgewicht dadurch ändert, dass äußere Kräfte wirken und Stöße der Elektronen stattfinden. Im thermischen Gleichgewicht, d. h. bei homogenen Temperaturverhältnissen und ohne äußere Felder, ist diese Verteilungsfunktion nichts anderes als die im Abschn. 6.3 abgeleitete Fermi-Verteilung 1
f0 E
k e
k
E
k EF = T
1
:
9:30
Wir bezeichnen hier diese Gleichgewichtsverteilung, die natürlich wegen der im thermischen Gleichgewicht gegebenen Homogenität nicht vom Ort r abhängt, mit f0. Außerhalb des Gleichgewichts, wo wir nur noch lokales Gleichgewicht über Bereiche groß gegen die atomaren Dimensionen voraussetzen, kann die gesuchte Nichtgleichgewichtsverteilung f (r, k, t) auch von Ort und Zeit abhängen; r und k für ein Elektron ändern sich durch äußere Felder und Stöße. Zur Ableitung von f berücksichtigen wir zuerst einmal die Wirkung äußerer Felder, um dann Stöße im Nachhinein als Korrektur einzuführen. Wir betrachten, wie sich f im Laufe der Zeit von t–dt nach t ändert. Falls nur ein elektrisches Feld E anliegt, war zur Zeit t–dt die r und k Koordinate (e positiv): r
v
kdt
bzw:
k
eE dt=h
9:31
Ohne Stöße muss jedes Elektron von r– v dt und k+e E dt/h bei t–dt auch bei r, k zur Zeit t erscheinen, d. h. f
r; k; t f
r
v dt; k e E dt=h; t
dt :
9:32
Diese Beziehung muss ergänzt werden, weil zusätzlich zu den durch die Bewegungsgleichungen (9.31) beschriebenen Änderungen berücksichtigt werden muss, dass Elektronen innerhalb von dt durch Stöße nach r und k kommen können bzw. von dort weggestoßen werden können. Beschreiben wir die Änderung von f durch Stöße summarisch in Form von (@f =@t)St, so lautet die richtige Bilanzgleichung: @f f
r; k; t f
r v dt; k e E dt=h; t dt dt :
9:33 @t St Entwicklung bis zu linearen Gliedern in dt ergibt: @f e @f E rk f v rr f : @t h @t St
9:34
Dies ist die Boltzmann-Gleichung, die den Ausgangspunkt zur Behandlung von Transportproblemen im Festkörper darstellt. Man bezeichnet die Terme auf der linken Seite als Driftterme und den bisher nicht näher spezifizierten Term auf der rechten als Stoßterm. In diesem Term ist die gesamte Atomistik der im Abschn. 9.3 kurz angedeuteten Streumechanismen enthalten.
9.4 Boltzmann-Gleichung und Relaxationszeit
247
Mit den in Abschn. 9.3 allgemein betrachteten quantenmechanischen Übergangswahrscheinlichkeiten wk'k!jhk 'jH 'j kij2 vom Bloch-Zustand wk nach wk ' lässt sich der Stoßterm in voller Allgemeinheit sofort angeben:
@f
k V dk0 f1 f
kwkk0 f
k0 1 f
k0 wk0 k f
kg : @t St
2p3
9:35 Hierbei werden im ersten Summanden des Integranden alle Stöße von besetzten k '-Zuständen auf den unbesetzten Zustand k betrachtet, während im zweiten Summanden alle Stöße berücksichtigt werden, die ein Elektron von k weg auf irgendeinen anderen Zustand k ' befördern. Denkt man sich (9.35) in (9.34) eingesetzt, so sieht man, dass die Boltzmann-Gleichung in ihrer allgemeinsten Form eine komplizierte Integro-Differentialgleichung zur Bestimmung der Nichtgleichgewichtsverteilung f (r, k, t) darstellt. Bei sehr vielen Problemen macht man deshalb für den Stoßterm (9.35) einen plausiblen Ansatz, den sog. Relaxationszeitansatz: Hier wird summarisch angenommen, dass die zeitliche Rate, mit der sich f durch Stöße in die Gleichgewichtsverteilung f0 zurückbewegt, umso größer ist, je stärker die Abweichung von f von der Gleichgewichtsverteilung f0 ist, d. h. @f f
k f0
k :
9:36 @t St s
k Die sog. Relaxationszeit s (k) ist dabei nur noch von den Zustandspunkten im k-Raum abhängig, die im Bild lokalisierter Elektronen den Zentren der Wellenpakete entsprechen. Im Falle nichthomogener Verhältnisse muss in (9.36) die Relaxationszeit s (k, r) auch als abhängig vom Ort r angenommen werden. Die Verteilung f (r, k, t) ist dann jeweils in Volumenelementen dr definiert, die groß gegenüber atomaren Dimensionen, aber klein gegenüber Längen sind, längs derer sich die makroskopischen Größen wie Strom, Wärmestrom etc. merklich ändern. Die Annahme des Relaxationszeitansatzes beinhaltet, dass Stöße nichts anderes machen, als eine Nichtgleichgewichtsverteilung ins thermische Gleichgewicht zurückzutreiben. Die Bedeutung der sog. Relaxationszeit wird noch klarer, wenn wir den Fall betrachten, dass ein äußeres Feld abgeschaltet wird: Ein äußeres Feld sei also für eine stationäre Nichtgleichgewichtsverteilung fstat (k) verantwortlich, denken wir uns das äußere Feld abgeschaltet, dann gilt vom Augenblick t des Abschaltens an: @f @t
f
f0 s
:
9:37
Mit der Anfangsbedingung f (t = 0, k) = fstat hat die Boltzmann-Gleichung (9.37) die Lösung
248
f
9. Bewegung von Ladungsträgern und Transportphänomene
f0
fstat
f0 e
t=s
:
9:38
Die Abweichung der Verteilung f von der Gleichgewichtsverteilung f0 (k) klingt also exponentiell mit der Abklingzeit s (Relaxationszeit) ab. Die Relaxationszeit ist also die Zeitkonstante, mit der eine Nichtgleichgewichtsverteilung bei Abschalten der äußeren Störung durch Stöße ins Gleichgewicht relaxiert. Weiter gestattet die Boltzmann-Gleichung die näherungsweise Berechnung einer stationären Nichtgleichgewichtsverteilung, die sich unter dem Einfluss eines äußeren Feldes, z. B. des elektrischen Feldes E , einstellt. Aus (9.34) und (9.36) folgt für den stationären Zustand (d. h. @f =@t 0), wenn f nicht mehr vom Ort abhängt (d. h. rr f = 0): e E rk f f
k f0
k=s
k ;
9:39 h e
9:40 f
k f0
k s
k E rk f
k : h Diese Differentialgleichung für f (k) lässt sich näherungsweise durch ein Iterationsverfahren lösen, bei dem auf der rechten Seite im
r rk f -Term f im ersten Schritt durch die Gleichgewichtsverteilung f0 angenähert wird. Das ergäbe eine in E lineare Lösung für f, die, wiederum in (9.40) eingesetzt, zu einer in E quadratischen Lösung führen würde. Sukzessives Einsetzen der Lösungen führt dann zu einer Entwicklung der Nichtgleichgewichtsverteilung f (k) nach Potenzen des äußeren Feldes E . Ist man nur an Phänomenen interessiert, die linear vom äußeren Feld abhängen, wie z. B. dem Ohmschen Strom in einem Festkörper, so beschränkt man sich auf die Ermittlung der ersten Näherung, wo f linear von E abhängt, d. h., wo in rk f nur die Gleichgewichtsverteilung f0 berücksichtigt wird. So ergibt sich die sog. linearisierte Boltzmann-Gleichung zur Bestimmung der Nichtgleichgewichtsverteilung e
9:41 a f
k ' f0
k s
k E rk f0
k : h In der betrachteten Näherung für kleine elektrische Felder, d. h. geringer Abweichung vom thermischen Gleichgewicht (linearisiertes Problem), lässt sich (9.41 a) als Entwicklung von f0 (k) um den Punkt k wie folgt auffassen: e f
k ' f0 k s
k E :
9:41 b h Die sich unter dem Einfluss eines äußeren Feldes E und der Wirkung von Stößen (beschrieben durch s) einstellende stationäre Verteilung lässt sich somit als eine um e s E =h verschobene Gleichgewichts-Fermi-Verteilung darstellen, wie es in Abb. 9.4 gezeigt ist. Es ist interessant, sich die Wirkung elastischer sowie inelastischer Elektronenstreuung auf die Einstellung des Gleichgewichtes im k-Raum zu veranschaulichen: Der stationäre Zustand der Ver-
9.4 Boltzmann-Gleichung und Relaxationszeit
249
Abb. 9.4 a, b. Schematische Darstellung der Wirkung eines konstanten elektrischen Feldes Ex auf die Verteilung „quasifreier“ Elektronen im k-Raum. (a) Die FermiKugel der Gleichgewichtsverteilung [gestrichelt, zentriert um (0, 0, 0)] erscheint im stationären Zustand um dkx = – e sEx/ h verschoben (in durchgezogener Linie). (b) Die Änderung der Fermi-Verteilung f [ E (k)] gegenüber der Gleichgewichtsverteilung f0 (gestrichelte Linie) ist nur merklich in der Umgebung der Fermi-Energie bzw. des Fermi-Radius kF
Abb. 9.5 a, b. Schematische Darstellung von Elektronenstreuprozessen im k-Raum: Die Fermi-Fläche im thermodynamischen Gleichgewicht (E = 0) ist gestrichelt gezeichnet. Die durch das elektrische Feld Ex verschobene Fermi-Kugel bei stationärem Stromfluss ist in durchgezogener Linie dargestellt. (a) Bei Abschalten des Feldes relaxiert die verschobene Fermi-Kugel in die Gleichgewichtsverteilung dadurch, dass Elektronen von den besetzten Zuständen (*) in unbesetzte Zustände (*) gestreut werden. Da die Zustände A und B verschiedene Abstände vom Nullpunkt des k-Raumes haben, handelt es sich bei den das Gleichgewicht einstellenden Stößen um inelastische Stöße (z. B. an Phononen). (b) Bei nur elastischen Stößen (von Zustand A nach B ) würde sich die Fermi-Kugel „aufblähen“. Nach Abschalten des Feldes kann sich das Gleichgewicht (gestrichelte Fermi-Kugel) nur durch inelastische Stöße (B nach C ) einstellen
250
9. Bewegung von Ladungsträgern und Transportphänomene
teilung ist in Abb. 9.5 (durchgezogen) als verschobene Fermi-Kugel dargestellt. Denkt man sich das äußere Feld abgeschaltet, so relaxiert die verschobene Kugel in die Gleichgewichtsverteilung (gestrichelt) zurück. Nur inelastische Stöße (Abb. 9.5 a) können diese Wiedereinstellung des Gleichgewichtes bewirken. Gäbe es nur elastische Stöße, z. B. bei Störstellenstreuung, so würde sich niemals mehr das Gleichgewicht einstellen, die Fermi-Kugel würde sich unter der Wirkung nur elastischer Stöße aufblähen (Abb. 9.5 b).
9.5 Die elektrische Leitfähigkeit von Metallen Lange bevor eine genauere Theorie des Festkörpers vorlag, hatte Drude [9.1] um 1900 herum die metallische Leitfähigkeit durch die Annahme eines idealen Elektronengases im Festkörper beschrieben. Unter dem Einfluss eines äußeren Feldes E gilt hierbei für ein Elektron die klassische Bewegungsgleichung: m mv_ v D e E :
9:42 s Der hemmenden Wirkung von Stößen wurde durch den Reibungsterm m·v D/s Rechnung getragen, wo v D = v–v therm die sog. Driftgeschwindigkeit, d. h. die zusätzlich zur thermischen Geschwindigkeit v therm durch das Feld erzeugte Geschwindigkeit, bedeutet. Da bei Abschalten des Feldes in (9.42) v mit der Abklingzeit s exponentiell gegen die thermische Geschwindigkeit relaxiert, hat auch hier s die Bedeutung einer Relaxationszeit. Für den stationären Fall (v_ = 0) folgt es E vD
9:43 m und damit für die Stromdichte j in Feldrichtung: e2 sn E :
9:44 m Hierbei ist n die Volumendichte aller freien Elektronen und die Beweglichkeit l ist definiert als Faktor zwischen Driftgeschwindigkeit und äußerer Feldstärke. Im Drudeschen Modell ergibt sich damit für die elektrische Leitfähigkeit j
env D nel E
e2 ns
9:45 m und für die Beweglichkeit der Elektronen es l :
9:46 m Zu bemerken ist, dass in dieser einfachen Modellvorstellung alle freien Elektronen den Strom tragen. Diese Vorstellung steht im Widerspruch zu den Aussagen des Pauli-Prinzips, das für das Fermi-Gas der Elektronen verbietet, dass Elektronen weit unterhalb der Fer-
r j= E
9.5 Die elektrische Leitfähigkeit von Metallen
251
mi-Energie durch das Feld Energie aufnehmen können, da alle benachbarten, energetisch höheren Zustände besetzt sind. Um die materialspezifische elektrische Leitfähigkeit auf atomistische Größen der Bandstruktur zurückzuführen, müssen wir wiederum wie im Abschn. 9.2 den Strom betrachten, der von Elektronen getragen wird, die auf Zuständen im k-Raumelement dk sitzen. In (9.11 u. 9.12) für die Teilchen- bzw. elektrische Stromdichte war von vornherein angenommen worden, dass nur über besetzte Zustände des k-Raumes summiert, d. h. integriert wurde. Allgemein möchte man über alle Zustände der ersten Brillouin-Zone aufsummieren, ungeachtet der Tatsache, ob sie besetzt oder unbesetzt sind. Um nur die wirklich besetzten Zustände zu erfassen, muss deshalb noch die Besetzungswahrscheinlichkeit f (k) des Zustandes k berücksichtigt werden, um die Teilchenstromdichte jn analog zu (9.11) anzugeben:
1 v
kf
kdk :
9:47 jn 3 8p 1: Brill: Z:
Da wir uns auf lineare Effekte im äußeren Feld, d. h. Ohmsches Gesetz, beschränken, genügt es, f (k) in der linearisierten Form (9.41 a) einzusetzen. Für ein elektrisches Feld E x in x-Richtung folgt damit für die elektrische Stromdichte:
e dk v
kf
k ; j 8p3
e es
k @f0 Ex dk v
k f0
k :
9:48 @kx 8p3 h Für ein isotropes Medium und für kubische Gitter verschwinden die y- und z-Komponenten von j, wenn das elektrische Feld in x-Richtung weist. Mit anderen Worten: der i. allg. tensorielle Zusammenhang zwischen Stromdichte j und elektrischem Feld E wird ein skalarer. jy jz 0 :
9:49
Da über die gesamte Brillouin-Zone integriert wird und f0 (k) inversionssymmetrisch um k = 0 ist, fällt das Integral über v x f0 weg. Weiter gilt mit @f0 @f0 hv x ; @kx @E
e2 @f0 2 E : jx x dkv x
ks
k 8p3 @E Für die spezifische elektrische Leitfähigkeit folgt deshalb:
e2 @f0 r jx = E x : dkv 2x
ks
k 3 8p @E
9:50
9:51
9:52
Da die „Aufweichungszone“ der Fermi-Funktion von der Größenordnung 4 k T (Abschn. 6.3) ist und f0 (E) außerhalb fast Null oder
252
9. Bewegung von Ladungsträgern und Transportphänomene
eins ist mit einem Verlauf um EF , der inversionssymmetrisch um den Punkt (EF , f0 (EF) = 1/2) ist, gilt in guter Näherung @f0 @E
d
E
EF :
9:53
Diese Näherungsbeziehung ist anschaulich evident, die Ableitung soll hier nicht gezeigt werden. Mit Hilfe von (9.53) folgt aus (9.52) unmittelbar mit dk dfE dk? dfE r'
dE dE dfE ; jr rk Ej hv
k
9:54
EF ;
9:55
e2 v 2
k dfE dE x s
kd
E 3 8p h v
k
und wegen der Eigenschaft der d-Funktion:
2 e2 v x
k r' 3 s
kdfE : 8p h v
k
9:56
EEF
Im allgemeinen Fall variieren natürlich v (k) und s (k) noch auf der Fermi-Fläche. In (9.56) kann aber ein Mittelwert hv 2x
ks
k=v
kiEF über die Fermi-Fläche aus dem Integral herausgezogen werden. Im Falle einer „Fermi-Kugel“, d. h. für quasifreie Elektronen mit konstanter effektiver Masse m (siehe unten), ist dieser Mittelwert gleich dem Wert v
EF s
EF =3 selbst. Die elektrische Leitfähigkeit r eines Metalls lässt sich also zurückführen auf ein Flächenintegral über die Fermi-Fläche E (k) = EF im k-Raum und es treten nur noch Elektronengeschwindigkeiten v
EF und Relaxationszeiten s (EF) von Elektronen auf der Fermi-Fläche in der atomistischen Formel auf. Der Ausdruck (9.56) drückt also genau die Tatsache aus, dass infolge des PauliPrinzips nur Elektronen in der Nähe der Fermi-Energie für den Stromtransport in Metallen relevant sind. Anschaulich lässt sich dies auch aus Abb. 9.4 u. 9.5 schließen. Elektronen weit unterhalb der Fermi-Energie merken von der geringfügigen stationären Verschiebung der Fermi-Kugel im k-Raum um
es= h E x nichts. Für den einfachen Fall, dass das Leitungsband eines Metalles (Näherung: k T EF ) nur Elektronen in einem Energiebereich enthält, wo die Parabelnäherung mit einer konstanten effektiven Masse m gültig ist, lässt sich (9.56) weiter auswerten: Für Elektronen in einem exakt parabolischen Band (quasifreie Elektronen) gilt
9:57 a v
EF hkF =m und
dfE 2
4pkF2 : EF
9:57 b
9.5 Die elektrische Leitfähigkeit von Metallen
Ferner gilt wegen
253
k T EF :
2
4=3p kF3 ; d: h: kF3 3p2 n :
9:57 c 8p3 Damit folgt für die elektrische Leitfähigkeit r und für die Beweglichkeit l : n
r'
e2 s
EF n m
9:58 a
und es
EF :
9:58 b m Die Beziehungen gleichen formal den im Drude-Modell (9.45, 9.46) ermittelten, nur dass die dort nicht näher spezifizierte Relaxationszeit in Wirklichkeit die der Elektronen an der Fermi-Kante ist und dass statt der freien Elektronenmasse m die effektive Masse m eingeht. Die im Drude-Modell auftretende Gesamtelektronenkonzentration n der Elektronen im Leitungsband erscheint in den richtigen Formeln (9.58 a u. b) aufgrund der formalen Integration über den k-Raum (9.52) und nicht, wie man im Drude-Modell annimmt, weil alle Elektronen am Stromtransport teilnehmen. Die Ähnlichkeit der Formeln (9.58 a u. b) mit (9.45 u. 9.46) erklärt jedoch, warum für viele Zwekke das Drude-Modell zu befriedigenden Ergebnissen führt. Es sei noch vermerkt, dass für Halbleiter, wo eine stark temperaturabhängige Ladungsträgerkonzentration n im Leitungsband (Abschn. 9.2 und Kap. 12) den Strom trägt, eine Auswertung von Formel (9.52) natürlich zu komplizierten Mittelwerten über s (k) – statt zu (9.58 a u. b) – führt. Um die Temperaturabhängigkeit des metallischen Widerstands zu verstehen, ist nur eine Betrachtung der Temperaturabhängigkeit von s (EF) bzw. l erforderlich, denn für ein Metall ist die Elektronenkonzentration n temperaturunabhängig. Statt einer rigorosen quantenmechanischen Berechnung der Streuwahrscheinlichkeiten wk'k (Abschn. 9.3) soll im folgenden eine qualitative Diskussion der beiden Streumechanismen – Phononenstreuung und Störstellenstreuung – durchgeführt werden. Unter der Voraussetzung, dass beide Streumechanismen voneinander unabhängig sind, ergibt die Summe beider Streuwahrscheinlichkeiten die Gesamtstreuwahrscheinlichkeit. Die Streuwahrscheinlichkeit ist umgekehrt proportional zur mittleren freien Flugzeit sFZ eines Ladungsträgers und damit umgekehrt proportional zur Relaxationszeit; deshalb gilt l'
1 1 1 s sPh sSt
9:59
mit sPh der mittleren freien Flugzeit für Phononenstreuung bzw. sSt der Flugzeit für Störstellenstreuung. Diese Betrachtung liefert uns schon den wesentlichen Temperaturverlauf des spezifischen Widerstandes eines Metalls. Es gilt
254
9. Bewegung von Ladungsträgern und Transportphänomene
nämlich, dass die Zahl der Stöße pro Zeiteinheit proportional zum Streuquerschnitt R und der Geschwindigkeit v der Teilchen ist: 1/s!Rv. Für Metalle ist v einfach die Geschwindigkeit auf der Fermi-Fläche v
EF und damit also temperaturunabhängig. Für Störstellenstreuung ist der Wirkungsquerschnitt R ebenfalls temperaturunabhängig. Die Störstellenstreuung führt also zu einem temperaturunabhängigen Anteil des spezifischen Widerstandes RSt. Für Phononenstreuung kann man den Streuquerschnitt für die Streuung an einem Phonon als proportional zum mittleren Quadrat der Schwingungsamplitude hs2
qi des betreffenden Phonons (Wellenvektor: q, Frequenz: xq ) ansetzen (Kap. 5). Im klassischen Grenzfall höherer Temperaturen gilt nach dem Gleichverteilungssatz Mx2q hs2
qi k T ;
T H
9:60
wobei M die schwere Masse der Rümpfe darstellt. Damit folgt:
kT 1 hs2
qi : Mx2q sPh
9:61 a
Die Phononenfrequenzen xq enthalten im wesentlichen Information über die elastischen Eigenschaften des Materials. Eine grobe Abschätzung ergibt sich, wenn man xq durch die Debyesche Abschneidefrequenz xD = k H/ h (Abschn. 5.3) ersetzt. Mit H als Debye-Temperatur folgt dann: MH2 fur T H :
9:61 b T Für Temperaturen T < H hat man mit einer stark abnehmenden Phononanregung und wegen der abnehmenden Phononenergie bevorzugt mit Kleinwinkelstreuung zu rechnen. Mittels einer exakteren Theorie konnte Grüneisen [9.2] für T < H einen für alle Metalle universellen Ausdruck für den spezifischen Widerstand RPh (T)*1/rPh infolge von Phononenstreuung angeben
sPh
H=T
5
RPh
T A
T=H
0
ex
x5 dx ; 1
1 e x
9:62
der für tiefe Temperaturen wie T 5 mit der Temperatur geht. Wir können also nach (9.59) den spezifischen Widerstand R = 1/r *1/s eines Metalls als Summe eines temperaturunabhängigen sog. Restwiderstandes RSt (durch Störstellen) und eines für höhere Temperaturen in T linearen Anteils RPh (T) (durch Phononenstreuung) angeben: R RPh
T RSt :
9:63
Dieser zuerst experimentell gefundene Sachverhalt wird als Matthiesensche Regel bezeichnet. Diese Regel (9.63) gilt aber nur näherungsweise.
9.5 Die elektrische Leitfähigkeit von Metallen
255
Abb. 9.6. Elektrischer Widerstand R von Natrium bezogen auf den Wert R290 K bei Raumtemperatur in Abhängigkeit von der Temperatur T. Die Messpunkte (*, *, `) entstammen Messungen an drei verschiedenen Proben mit verschieden hoher Störstellenkonzentration. (Nach McDonald u. Mendelssohn [9.3])
Abbildung 9.6 zeigt den experimentell gemessenen elektrischen Widerstand von Na bei tiefen Temperaturen: Unterhalb von etwa 8 K ist der temperaturunabhängige Restwiderstand zu erkennen, der von den Störstellenkonzentrationen in den betreffenden Proben abhängt. Bei höheren Temperaturen erscheint der durch die Grüneisen-Formel (9.62) beschriebene Phononenanteil, der schließlich oberhalb von etwa 18 K in einen linearen Zusammenhang RPh*T einmündet. In Abb. 9.7 ist für nicht zu tiefe Temperaturen der additive Einfluss der Störstellenkonzentration (Ni-Verunreinigungen) auf den Widerstand von Kupfer dargestellt.
Abb. 9.7. Spezifischer Widerstand R von „reinem“ Kupfer und von KupferNickel-Legierungen verschiedener Zusammensetzung. (Nach Linde [9.4])
256
9. Bewegung von Ladungsträgern und Transportphänomene
Abb. 9.8. Universelle Auftragung des reduzierten Widerstandes (R/RH) über der auf die Debye-Temperatur H bezogenen Temperatur für verschiedene Metalle
Abbildung 9.8 zeigt, dass die universelle Grüneisen-Formel (9.62), bei der der Widerstand zweckmäßigerweise über einer reduzierten Temperatur T/H (bezogen auf Debye-Temperatur) aufgetragen wird, für eine Reihe von Metallen gut erfüllt ist. Außerdem ist der lineare Anstieg des Widerstandes R mit T für höhere Temperaturen gut zu erkennen. Der Vollständigkeit halber soll noch erwähnt werden, dass magnetische Störstellen infolge der Spinwechselwirkung zusätzlich einen ganz besonderen Streumechanismus in Metallen verursachen können, der bei kleinen Temperaturen (T < 20 K) statt eines konstanten Restwiderstandes ein Minimum in R (T) verursacht. Dieses Phänomen trägt den Namen Kondo-Effekt.
9.6 Thermoelektrische Effekte Bei der Berechnung der elektrischen Leitfähigkeit (9.56) mit Hilfe der Boltzmann-Gleichung (9.34) in der Relaxationszeit-Näherung (9.36) hatten wir der Einfachheit halber eine homogene Temperatur T über den Leiter (d. h. rr T = 0) vorausgesetzt. Lassen wir diese Voraussetzung fallen, so ändert sich die Verteilungsfunktion f (k) sowohl durch ein äußeres elektrisches Feld E wie auch durch den vorhandenen Temperaturgradienten rr T j 0; die Einstellung der Gleichgewichtsverteilung f0 (k) durch Stöße werde wieder durch den Relaxationszeit-Ansatz (9.36) beschrieben. Für den stationären Zustand E_ 0; @
r rr T=@t 0; @f =@t 0 folgt dann aus (9.34 u. 9.36) für die Nichtgleichgewichtsverteilung:
9.6 Thermoelektrische Effekte
257
e f
k f0
k s E rk f sv rr f :
9:64 h rr T und unter der Annahme kleiner Es gilt rr f k; T
r
@f =@Tr Störungen lässt sich (9.64) analog zu (9.41 a) linearisieren, d. h. es folgt: e @f0
9:65 f
k f0
k s E rk f0 s v rr T : @T h Um die in x-Richtung resultierende elektrische Stromdichte zu berechnen, setzen wir diesen Ausdruck (9.65) in die Beziehung für die Stromdichte (9.48) ein. Die beiden ersten Terme in (9.65), insbesondere der in E x lineare, ergeben analog zur Rechnung in Abschn. 9.5 (9.49–9.52) das Ohmsche Gesetz, so dass die Stromdichte sich schreiben lässt als
e @f0 @T jx r E x 3 dk s v 2x :
9:66 @T @x 8p Es ist ganz instruktiv, das Integral unter den Annahmen einer kugelförmigen Fermifläche und einer Abhängigkeit der Relaxationszeit nur von der Energie auszuwerten. Unter Verwendung der Definition der Zustandsdichte (7.41) erhält man:
1 @f0 @T E :
9:67 jx r x e dEs
Ev 2
ED
E @T @x 3 Da die Ableitung @f0 =@T nur in der Nähe der Fermi-Energie von Null verschieden ist, kann man s (E) und v 2 (E) als Mittelwert sF und v 2F aus dem Integral herausziehen. Das verbleibende Integral ist proportional zur Ableitung der Zustandsdichte nach der Energie D0
EF , wie man durch Entwicklung um E EF und Verwendung von (6.43–6.45) zeigen kann p2 2 @T ev F sF k 2 TD0
EF :
9:68 9 @x Bei der Ableitung von (9.66) wurde stillschweigend vorausgesetzt, dass die Fermi-Energie EF als konstant angenommen werden kann. Dies ist bei Metallen in guter Näherung der Fall (s. Kap. 6). Bei Halbleitern (s. Kap. 12) ist jedoch mit einem Temperaturgradienten @T=@x eine beträchtliche Abhängigkeit der Fermi-Energie EF (r) vom Ort gegeben. Durch die Ortsableitung der Verteilung f in (9.34) kommt deshalb i. allg. auch eine Ableitung der Fermi-Energie nach dem Ort @EF =@x ins Spiel und wir müssen (9.66) ganz allgemein schreiben: @T 0 12 jx r E x L xx ;
9:69 @x
jx r E x
wobei E 0 E e 1rr EF
r eine verallgemeinerte elektrische Feldstärke ist, die der ortsabhängigen Fermi-Energie Rechnung trägt. L 12 xx ist ein sog. Transportkoeffizient [Definition durch (9.66)], der
258
9. Bewegung von Ladungsträgern und Transportphänomene
dafür verantwortlich ist, dass mit einem Temperaturgradienten i. allg. ein elektrischer Stromfluss verknüpft ist. Neben der Berechnung des elektrischen Stromes gestattet die Boltzmann-Gleichung auch die Berechnung des Wärmestromes durch Elektronen, der in einem Festkörper bei Anliegen eines elektrischen Feldes E und bei gegebenem Temperaturgradienten rr T fließt. Die transportierte Wärmemenge dQ hängt über folgende thermodynamische Relation mit der Entropieänderung dS bzw. der Änderung der inneren Energie dU und der Teilchenzahl dn zusammen (EF: chemisches Potential, d. h. Fermi-Energie): dQ TdS dU
EF dn :
9:70
Mit jE als Energie- bzw. jn als Teilchenstromdichte folgt für die Wärmestromdichte: jQ jE
EF j n ;
9:71
–1
dk E (k) v (k) f (k, r) gilt. Analoges Einsetzen der wobei jE = (8 p3) linearisierten Nichtgleichgewichtsverteilung (9.65) führt auch hier zu einer linearen Beziehung zwischen jQ , E 0 (bzw. E ) und rr T wie in (9.69). Allgemein lassen sich also folgende Gleichungssysteme für den elektrischen und den Wärmestrom in Abhängigkeit von ihren Ursachen, verallgemeinerte Feldstärke E 0 und Temperaturgradienten rr T, angeben: j L
11
jQ L
E 0 L
21
12
E 0 L
rr T ;
22
rr T :
9:72 a
9:72 b
Für allgemeine nicht-kubische Kristalle sind die Transportkoeffizienten L ij natürlich Tensoren und ihre allgemeine Darstellung [z. B. (9.66) für L 12 xx ] führt zu interessanten Relationen dieser Koeffizienten untereinander, auf die hier nicht eingegangen wird. Wir wollen nur den durch (9.72 a u. b) ausgedrückten physikalischen Sachverhalt noch einmal zusammenfassen: Ein elektrisches Feld sowie ein Temperaturgradient rufen sowohl einen elektrischen Strom wie auch einen Wärmestrom hervor; insbesondere lässt sich auch durch einen Temperaturgradienten ein elektrisches Feld erzeugen. Eine Leiterschleife, bestehend aus zwei verschiedenen Metallen A und B, sei offen bzw. nur über ein sehr hochohmiges Voltmeter geschlossen (Abb. 9.9 a). Die beiden Lötstellen, wo die Metalle zusammenstoßen, befinden sich auf verschiedener Temperatur T1 j T2 j T0. Wegen j = 0 folgt aus (9.72 a) (wir setzen innerhalb eines Metalls E 0 E ):
E x
L
11
1
L
12
@T=@x K@T=@x :
9:73
K heißt absolute Thermokraft und ist eine materialspezifische Größe. Wir betrachten also ein eindimensionales Problem, wo x längs des Drahtes läuft. Die Umlaufspannung, die vom Voltmeter in Abb. 9.9 a gemessen wird, ist:
9.6 Thermoelektrische Effekte
259
Abb. 9.9. (a) Schematische Anordnung zur Messung des Seebeck-Effektes: Falls die Lötstellen zwischen den beiden Metallen A and B auf verschiedener Temperatur T1 j T2 j T0 sind, tritt an den Enden der Leiterschleife eine sog. Thermospannung auf. (b) Schematische Anordnung zur Messung des Peltier-Effektes: Stromfluss durch die auf homogener Temperatur sich befindende Leiterschleife führt zu einem Wärmetransport von der Lötstelle (1) zur Lötstelle (2) zwischen den Metallen A und B
1 U
2
0
E B dx E A dx E B dx
0
1
2
2
1
@T @T dx KA dx KB @x @x 2
1
T
2
KA
KB dT :
9:74
T1
Die sog. Thermospannung, die bei diesem thermoelektrischen Effekt (auch Seebeck-Effekt genannt) gemessen wird, hängt also von der Temperaturdifferenz T2–T1 sowie vom Unterschied der absoluten Thermokräfte KA und KB ab. Dieser Effekt wird beim Thermoelement (aufgebaut nach dem Schema der Abb. 9.9 a) zur Messung von Temperaturen benutzt. Es gibt auch den inversen Effekt, den sog. Peltier-Effekt, der sich aus (9.72 b) herleitet. In Abb. 9.9 b sei längs der Leiterschleife die Temperatur konstant, d. h. @T=@x 0, dann gilt: j Q L
21
E
und
j L
11
E
;
9:75
und somit j Q L
21
L
11
1 j Pj :
9:76
P heißt Peltier-Koeffizient. Legen wir wie in Abb. 9.9 b eine Batterie an die Leiterschleife, so wird die elektrische Stromdichte j nach (9.76) von einer Wärmestromdichte begleitet, und es fließt in A gerade PA j, während in B aber PB j transportiert wird. An der einen Lötstelle (1) muss also die Wärme (PA–PB) j zuströmen, die dann bei der Lötstelle (2) wieder abgeführt wird. Punkt (1) wird kälter, während Punkt (2) wärmer wird. Man benutzt diesen Peltier-Effekt zur einfachen und gut regelbaren Kühlung.
260
9. Bewegung von Ladungsträgern und Transportphänomene
9.7 Das Wiedemann-Franz-Gesetz Wie in Abschn. 9.6 angedeutet, lassen sich aus der expliziten Darstellung der Transportkoeffizienten L ij als Integrale über die linearisierte Nichtgleichgewichtsverteilung f (k, r) nach (9.65) Beziehungen zwischen diesen Koeffizienten herleiten. Insbesondere lässt sich eine Beziehung zwischen der elektrischen Leitfähigkeit r und dem Anteil der Wärmeleitfähigkeit kE, der durch Leitungselektronen (wie auch r ) getragen wird, herleiten. r ist im wesentlichen durch L 11 und kE durch L 22 gegeben. Unter Verwendung von (9.65, 9.71) erhält man die Wärmestromdichte @f0 @T 2 :
9:77 jQx dk
E EF v x
ks
k @T @x Für eine kugelförmige Fermi-Fläche und unter der Annahme, dass s nur von der Energie abhängt, können wir wie in den Gleichungen (9.66–9.68) das Integral auf die elektronische spezifische Wärme zurückführen und man erhält für die Wärmeleitfähigkeit kE: kE 13 v 2F s
EF cv :
9:78
Für das freie Elektronengas wird daraus (6.50) p2 s
EF n k 2 T=m :
9:79 3 Die elektrische Leitfähigkeit stellte sich nach (9.58 a) als r = e 2 s (EF) n/m dar, so dass der Quotient !2 p2 k kE =r T
9:80 3 e kE
linear von der Temperatur abhängt. Dieses Gesetz heißt Wiedemann-Franz-Gesetz und der Faktor p 2 k 2/3 e 2 Lorenz-Zahl L. Der theoretische Wert – nach (9.80) – für die Lorenz-Zahl ist L 2;45 10 8 W X K
2
:
9:81
Tabelle 9.1 zeigt einige experimentell ermittelte Werte der LorenzZahl bei 0 °C, die eine relativ gute Übereinstimmung mit dem Wert in (9.81) selbst für Übergangsmetalle zeigen. Bei tiefen Temperaturen (T H; H: Debye-Temperatur) nimmt der Wert für L i. allg. stark ab. Für Cu z. B. ist L bei 15 K um eine Größenordnung kleiner als in Tabelle 9.1 für 0 °C angegeben. Der Grund für die Abweichungen ist darin zu sehen, dass bei tiefen Temperaturen elektrische und thermische Relaxationszeiten nicht mehr übereinstimmen. Wir können uns diesen Unterschied beider Relaxationszeiten in einem einfachen Bild klarmachen: Ein elektrischer Strom entsteht durch Verschiebung der Fermi-Kugel um einen Betrag dk (Abb. 9.4), ein Wärmestrom dagegen dadurch, dass Elektronen mit
9.8 Elektrische Leitfähigkeit durch lokalisierte Elektronen
261
Tabelle 9.1. Experimentell ermittelte Werte für die Lorenz-Zahl L = kE /rS bei 0 °C. Die Werte stammen aus publizierten Daten für elektrische und Wärmeleitfähigkeit Metall
L (10–8 WX/K2)
Na Ag Au Cu Pb Pt
2,10 2,31 2,35 2,23 2,47 2,51
dem Wellenzahlvektor +kF im Mittel eine andere Temperatur als Elektronen mit –kF haben. Für die Relaxation eines elektrischen Stromes sind deshalb Streuprozesse mit Wellenzahlvektoren von der Größenordnung q = 2 kF erforderlich, für die Relaxation des Wärmestromes genügen dagegen q-Vektoren von der Größenordnung q & k T/hv F , die die Elektronen in der Nähe der Fermi-Kante von Zuständen höherer Energie in Zustände niedrigerer Energie bzw. umgekehrt bringen. Bei genügend hohen Temperaturen ist der Unterschied beider Streuprozesse nicht so wichtig. Bei tiefen Temperaturen aber stehen für Phononenstreuung vorzugsweise Phononen mit kleinen q zur Verfügung. Also wird bei tiefen Temperaturen die Wärmeleitfähigkeit im Verhältnis kleiner sein: die LorenzZahl L nimmt mit der Temperatur ab.
9.8 Elektrische Leitfähigkeit durch lokalisierte Elektronen In diesem Kapitel wurden bislang ausschließlich Transportphänomene betrachtet, die auf der Bewegung von delokalisierten Elektronen in Bändern beruhen. Die vollständige Delokalisation von Elektronen ist eine Folge der Translationsinvarianz kristalliner Festkörper. In Abschn. 7.6 war gezeigt worden, dass in amorphen Festkörpern Elektronen sowohl delokalisiert als auch lokalisiert sein können. Für amorphes Silizium und Germanium hatten wir begründet, warum insbesondere die Elektronen in den Ausläufern von Valenzund Leitungsband lokalisiert sind, während die Elektronen in Zuständen weiter entfernt von der Energielücke delokalisiert bleiben. In diesem Abschnitt diskutieren wir den möglichen Beitrag lokalisierter Elektronen zur elektrischen Leitfähigkeit. Wir betrachten dazu ein einfaches Modell einer Zustandsdichte mit lokalisierten Zuständen unterhalb einer „Beweglichkeitskante“ Eb und delokalisierten Zuständen darüber (Abb. 9.10). Die Zustände sind umso stärker lokalisiert und örtlich umso mehr voneinander entfernt, je niedriger die
262
9. Bewegung von Ladungsträgern und Transportphänomene Energie E
E
Abb. 9.10. Elektronische Zustände eines amorphen Festkörpers (schematisch). In der linken Hälfte ist die Zustandsdichte dargestellt und rechts die Energieterme im Ortsraum. Unterhalb von Eb sind die Zustände lokalisiert, oberhalb delokalisiert. Die Ausdehnung der Wellenfunktion einzelner Zustände nimmt mit Annäherung an die Beweglichkeitskante zu
E
Zustandsdichte D(E)
b
F
Ortskoordinate x
Energie ist. Die Leitfähigkeit in einem solchen System hängt von der Lage des Fermi-Niveaus relativ zur Beweglichkeitskante ab. Wenn das Fermi-Niveau oberhalb der Beweglichkeitskante liegt, dann ist die Leitfähigkeit so wie bei einem kristallinen Metall mit hoher Defektkonzentration. Liegt das Fermi-Niveau nur wenige k T unterhalb der Beweglichkeitskante, dann gibt es genügend viele Ladungsträger in den delokalisierten Zuständen oberhalb der Beweglichkeitskante und die Leitfähigkeit wird von diesen Elektronen dominiert. Die Leitfähigkeit ist dann proportional zur Besetzungswahrscheinlichkeit der Zustände oberhalb der Beweglichkeitskante also r r0 e
k
Eb EF = T
:
9:82
Liegt das Fermi-Niveau mehr als einige k T unterhalb der Beweglichkeitskante, dann wird die Leitfähigkeit von den lokalisierten Elektronen getragen. Die Elektronenbewegung beruht in diesem Fall auf dem Tunnelprozess, d. h. Elektronen tunneln von einem lokalisierten Zustand zu einem benachbarten Zustand. Häufig wird der Prozess auch als ein Hüpfen der Elektronen von einem Platz zum nächsten beschrieben (engl. hopping conduction). Voraussetzung für den Tunnelprozess eines lokalisierten Elektrons und damit für einen Beitrag zur elektrischen Leitfähigkeit ist, dass sich die Wellenfunktionen eines besetzten Zustandes und eines unbesetzten Zustandes überlappen. Die Amplitude lokalisierter Wellenfunktionen fällt in größerer Entfernung vom Zentrum exponentiell mit der Entfernung vom Zentrum. Die Wahrscheinlichkeit p für ein Hüpfbzw. Tunnelprozess eines Elektrons von einem Platz i zum nächsten Platz j im Abstand rij ist deshalb proportional zu p
rij / e
rij
:
9:83
Die Größe ist ein Parameter, der das Abklingen der Wellenfunktion beschreibt. Notwendigerweise muss die Energie des Ausgangs-
9.8 Elektrische Leitfähigkeit durch lokalisierte Elektronen
263
zustands Ei unterhalb des Fermi-Niveaus und die Energie des Endzustands Ej oberhalb des Fermi-Niveaus liegen. Es gilt also Ej > Ei. Die Sprungwahrscheinlichkeit ist deshalb auch proportional einem Boltzmann-Faktor, der die Differenz zwischen Ej und Ei berücksichtigt. Damit wird die Wahrscheinlichkeit für einen Sprung zwischen den Zuständen i und j p
rij ; Ej ; Ei / e
rij
e
k
Ej Ei = T
:
9:84
Die Leitfähigkeit ist proportional zur Summe über alle möglichen Sprungwahrscheinlichkeiten p (rij, Ej, Ei). Wir betrachten die möglichen Sprünge zu einem festen Zustand j mit definierter Endenergie Ej aus einem Kontinuum von Anfangszuständen Ei, die innerhalb einer Kugel vom Radius rij < R um den Zustand j herum liegen. Ein Sprung ist nur möglich, wenn innerhalb der Kugel mit dem Radius R wenigstens ein Zustand mit der Energie Ei < Ej liegt. Zur Vereinfachung der Rechnung wird jetzt zusätzlich angenommen, dass die Zustandsdichte in dem Energiebereich um die Fermi-Energie konstant ist. Diese Bedingung ist tatsächlich nicht gut erfüllt (Abb. 9.10). Die Bedingung für die Existenz eines Anfangszustands, aus dem heraus ein Sprung erfolgen kann, ist damit 4p 3 R D
EF
Ej Ei > 1 : 3 Alle Sprünge mit E < Emax Ej
9:85
3 4pR3 D
EF
9:86
sind also erlaubt. Die gesamte Sprungrate und damit die Leitfähigkeit ist proportional zu r/e
R
E
max
e
k
Ej E= T
dE / e
R
e
k
3=
4pR3 D
EF T
:
9:87
1
Diese Funktion verschwindet für große R, da dann der Tunnelprozess beliebig unwahrscheinlich wird. Sie verschwindet auch für R ? 0, da es dann keine Energieterme in der Umgebung gibt. Zwischendurch hat die Funktion ein Maximum und zwar dort, wo der Wert des Exponenten minimal wird: ! d 3 0:
9:88 R dR 4pR3 D
EF k T Das Minimum liegt bei einem Radius Rm
9 4pD
EF k T
!1=4 :
9:89
264
9. Bewegung von Ladungsträgern und Transportphänomene -6
Abb. 9.11. Abhängigkeit der Leitfähigkeit von amorphem Silizium von der Temperatur (offene Kreise, nach [9.7]). Die experimentellen Daten werden einigermaßen durch das Mottsche Gesetz mit einen Exponenten von 1/4 wiedergegeben. Ein Exponent von 1/2 würde eine noch bessere Anpassung an die experimentellen Werte ermöglichen
-1
-1
ln(σ (Ω cm ))
-8 -10 -12 -14
experimentelle Daten
-16
1/4
σ=σ0exp(-(T0/T) )
-18 50
100
150
200
250
300
Temperatur (K)
Für T = 300 K, eine Zustandsdichte von 5·105 cm–3 und ein von 107 cm–1 ergibt sich z. B. eine optimale Sprungweite von 5·10–6 cm. Setzt man diesen Wert für Rm in (9.87) ein, erhält man für die Leitfähigkeit folgende Abhängigkeit von der Temperatur: r/e
T0 =T1=4
mit
T0
43 : 9pD
EF k
9:90
Diese Temperaturabhängigkeit der Leitfähigkeit lokalisierter Elektronen wurde zuerst von Mott hergeleitet [9.6]. Experimentelle Werte für die Leitfähigkeit von amorphem Si werden durch (9.90) recht annehmbar beschrieben (Abb. 9.11). Eine noch bessere Anpassung an die experimentellen Daten ergibt sich allerdings, wenn als Wert des Exponenten etwa 1/2 statt 1/4 angenommen wird. Der wesentliche Grund dafür ist, dass die Zustandsdichte für amorphes Si im Bereich des Fermi-Niveaus nicht konstant ist, sondern mit der Energie ansteigt (Abb. 9.10, 7.15).
9.9 Quantentransport in Nanostrukturen In den vorangegangenen Abschnitten haben wir den Elektronentransport beim Stromfluss in makroskopisch ausgedehnten Festkörpern betrachtet. Der Wellencharakter des Elektrons bei der Propagation durch den Kristall trat abgesehen von der Beschreibung der Streuprozesse nicht in Erscheinung. Er geht auf dem Weg von einem elektrischen Kontakt zum anderen verloren, weil inelastische Streuprozesse die Phasen der Elektronenwellen statistisch verändern. Dies wird anders, wenn man elektronischen Transport in mesoskopischen Strukturen oder Nanostrukturen, insbesondere bei tiefen Temperaturen betrachtet. Nanostrukturen lassen sich heute mit
9.9 Quantentransport in Nanostrukturen
265
lithographischen Methoden (Tafel XVIII) herstellen; sie begegnen uns überdies in Halbleiterbauelementen. In Metall- und Halbleiterproben mit typischen Dimensionen zwischen fünf und einigen hundert Nanometern beobachtet man Quantenkorrekturen zum elektrischen Leitwert, die auf Phasenbeziehungen zwischen den propagierenden Elektronenwellen zurückzuführen sind. Die Beobachtbarkeit solcher Effekte hängt stark von den Dimensionen des betrachteten Leiters ab. Es ist entscheidend, wie viele Streuprozesse, elastisch wie inelastisch, im betrachteten leitenden Volumen stattfinden. Hierbei sind verschiedene, einem propagierenden Elektron zuzuordnende charakteristische Längen im Vergleich zu den Leiterdimensionen zu betrachten. Die elastische freie Weglänge le beschreibt den mittleren freien Abstand zwischen zwei elastischen Streuprozessen, bei denen das Elektron seine kinetische Energie nicht ändert. Die Phase der Elektronenwelle kann dabei zwar um einen festen, wohldefinierten Betrag verschoben werden, unterliegt jedoch nicht statistischen Schwankungen, sodass feste Phasenbeziehungen zwischen verschiedenen Teilwellen erhalten bleiben. Solche elastischen Streuprozesse ereignen sich an Störungen des Gitters wie Fremdatomen, Versetzungen und Oberflächen (Abschn. 9.3). Da nur Elektronen in der Nähe der Fermi-Kante zum Stromtransport beitragen, ergibt sich die elastische freie Weglänge zu le v F se ;
9:91
wo se die mittlere freiepFlugzeit zwischen zwei elastischen Streu prozessen und v F h 2pn=m die Fermi-Geschwindigkeit ist (Abschn. 6.2). In zweidimensionalen Elektronengasen mit metallischem Charakter und extrem hohen Elektronenbeweglichkeiten in Halbleiterheterostrukturen (Abschn. 6.2) kann le bei tiefen Temperaturen Werte bis zu 10 lm erreichen. Die Streuung von Elektronen an Phononen oder die ElektronElektron-Streuung sind inelastisch, also mit Energieübertrag verknüpft. Das Elektron trifft auf ein sich in der Zeit änderndes Streuzentrum. Die Phase der elektronischen Wellenfunktion ändert sich deshalb beim Streuprozess in statistischer Weise. Inelastische Streuung ist deshalb phasenbrechend. Diesen Streuprozessen ist die inelastische freie Weglänge lin als charakteristische Größe zugeordnet. Hiervon zu unterscheiden ist die Phasenkohärenzlänge lU, die angibt, welche Distanz ein Elektron zurücklegen kann, ohne seine Phase statistisch geändert zu haben. Wenn Spin-Flip (Spin-Umklapp) Prozesse bei der Streuung vernachlässigt werden können, ist lU gleich der inelastischen freien Weglänge lin. Spin-Flip Streuung ändert ebenfalls die Phase in statistisch schwankender Weise, sie kann jedoch elastisch sein. Deshalb können lU und lin verschieden sein. Bei tiefen Temperaturen, wo inelastische Phononstreuung gegenüber Streuung an Störstellen eine geringere Rolle spielt, gibt es meist viele elastische, phasenerhaltende Streuprozesse, bevor die
266
9. Bewegung von Ladungsträgern und Transportphänomene
Phase gebrochen wird. Hier gilt also lU le. Das Transportregime mit nur elastischer, phasenerhaltender Streuung nennt man diffusiv. Eine weitere wesentliche Länge ist die Wellenlänge der Elektronen, die den Stromtransport tragen, also die Fermi-Wellenlänge kF = 2p/kF. Sie ist durch die Fermi-Energie EF bzw. die FermiWellenzahl kF gegeben (Abschn. 6.2). Bei Metallen mit ihrer hohen Elektronenkonzentration liegt kF unterhalb eines Nanometers, während in quasimetallischen zweidimensionalen Elektronengasen (2DEG) in einer Halbleiterheterostruktur (Abschn. 12.7) Werte zwischen 50 und 100 nm erreicht werden. Wie in der Lichtwellenoptik tritt der Wellencharakter der Elektronen erst in Erscheinung, wenn die Strukturgrößen der Leiterbahnen im Bereich von kF liegen. Eindimensionaler Transport Stellen wir uns einen quasi-eindimensionalen Draht mit einem Durchmesser von der Größenordnung der Fermi-Wellenlänge kF und einer Länge Lz le vor, dann sind die Dimensionen der leitenden Struktur kleiner als alle freien Weglängen le, lin und lU. Der Elektronentransport durch diesen Draht wird als ballistisch bezeichnet, da ein Elektron auf seinem Weg von einem Kontakt zum anderen keinen Streuprozess erleidet (Abb. 9.12 a). Man könnte denken, dass der Draht in diesem Fall keinen Widerstand aufweist. Das ist aber nicht so!
Abb. 9.12. Elektronentransport zwischen zwei Kontakten längs eines Nanodrahtes. (a) Ballistischer Transport, bei dem innerhalb des Transportkanals (eingegrenzt durch schraffierte Bereiche) kein Streuprozess stattfindet. (b) Diffusiver Transport, bei dem im Leitungskanal nur elastische Streuprozesse an Störstellen erfolgen, die eine feste Phasenbeziehung vor und hinter dem Kanal gewährleisten. (c) Zustandspunkte in der reziproken kxky-Ebene eines ballistischen eindimensionalen Leitungskanals, die im Realraum dem Querschnitt des Kanals zugeordnet ist. Die Punkte bezeichnen erlaubte k-Vektoren; ihr lateraler Abstand ist durch die Breiten Lx und Ly des als rechteckig angenommenen Leiters bestimmt. Die durchgezogene Linie stellt den Fermi-Kreis für das zweidimensionale Problem dar. Die Anzahl von eindimensionalen (1D) Subbändern, die am ballistischen 1D-Transport teilnehmen, ist durch die Anzahl der Punkte im Fermi-Kreis gegeben
9.9 Quantentransport in Nanostrukturen
267
Um den Widerstand zu ermitteln, berechnen wir zuerst, wie viele elektronische Zustände in den Draht hineinpassen, also den Strom tragen können. Entlang des Drahtes in z-Richtung sind die Eigenzustände Blochwellen, unterliegen also allenfalls den üblichen periodischen Randbedingungen. Die Berandung in der xyEbene hingegen setzt die feste Randbedingung, dass die Wellenfunktion am Rand Null sein muss. Zur Berechnung der Zahl der Zustände betrachten wir einen Fermi-Kreis in der kx,ky-Ebene des reziproken Raumes. Wegen der festen Randbedingungen, ist nur ein Viertelsektor (kx > 0, ky > 0) des Fermi-Kreises relevant (Abschn. 6.1). Die Zustandspunkte auf den kx- und ky-Achsen sind ausgeschlossen, da sie zu verschwindenden Wellenfunktionen führen (Abschn. 6.1). Mittels Abb. 9.12 c lässt sich die Anzahl der erlaubten Zustände N als das Verhältnis des Fermi-Kreissektors zur Fläche p2/LxLy eines Zustandes (mit Spinentartung) ermitteln: ( ) Lx Ly 1 2 1 p 1p 1p p pk N 2 kF kF p 4 F 2 Lx 2 Ly 4 Lx Ly kF2 kF 1 Lx Ly
Lx Ly :
9:92 4p 2p 4 Der Produktterm mit LxLy entspricht der Fläche des Kreissegments in Abb. 9.12c, während die anderen Terme aus dem Ausschluss der achsennahen Bereiche bei der Zählung resultieren. Für kleine Drahtquerschnitte (Lx, LyLz) wird die Zahl der Zustände N eine diskrete Funktion von Lx und Ly. Bei einem minimalen Durchmesser passt schließlich nur noch ein Zustand der kxky-Ebene in den Draht hinein, nämlich dann, wenn der Punkt kx = p/Lx, ky =p/Ly gerade noch in den Fermikreis passt, der Punkt kx = 2p/Lx, ky =p/Ly bzw. kx = p/Lx, ky =2p/Ly jedoch nicht. Für den Fall Lx = Ly heißt das, dass p p p 2 p 5 < Lx;y <
9:93 KF kF
sein muss. Da das Elektron bezüglich der z-Richtung eine BlochWelle bleibt, haben wir es mit einem eindimensionalen Band zu tun. Sind mehrere Werte von kx, ky möglich, so gehört zu jedem Wertepaar ein eindimensionales Band. Diese Bänder werden Subbänder genannt. Für den Fall freier Elektronen stellt sich die Energie im Subband dar als h2 kz2 ;
9:94 3m wo ei die aus der kx,ky-Quantisierung folgenden diskreten Energieniveaus sind und der zweite Term die kinetische Energie resultierend aus der freien Bewegung längs z beschreibt. Die Energien der Subbänder sind also eine Abfolge von Parabeln, die jeweils einen Transportkanal beschreiben (Abb. 9.13 a). Ei ei
kx ; ky
268
9. Bewegung von Ladungsträgern und Transportphänomene
E
Abb. 9.13. Eindimensionaler ballistischer Transport: (a) Energiezustände E als Funktion des Wellenvektors kz in Richtung des eindimensionalen Leiters. Die verschiedenen Parabeln (Subbänder) resultieren aus der Quantisierung in x,y-Richtung senkrecht zum Leiter. (b) Schema des eindimensionalen Leiters, der durch zwei Kontakte links und rechts begrenzt wird, in denen thermodynamisches Gleichgewicht angenommen wird. (c) Darstellung im Bänderschema: Die metallischen Kontakte links und rechts sind durch eine Besetzung der elektronischen Zustände bis zu den jeweiligen chemischen Potentialen (Fermi-Niveaus) lL und lR beschrieben. Für den ballistischen Stromtransport im Draht sind nur die Zustände relevant, die energetisch zwischen lL und lR liegen. Die Differenz von lL und lR ist durch die elektrische Spannung zwischen den Kontakten gegeben
Wir rechnen jetzt den Strom aus, der durch ein einzelnes Subband zwischen zwei Kontakten (links und rechts, Abb. 9.13 b) getragen wird. Die Kontakte stellen Elektronenreservoire dar, die jeweils in sich im thermodynamischen Gleichgewicht sind und deren Elektronen die unterschiedlichen chemischen Potentiale lL und lR besitzen. Der Potentialunterschied ist durch die elektrische Spannung U gegeben. lL
lR eU :
9:95
Nur die Zustände zwischen lL und lR können Elektronen von links nach rechts tragen (Abb. 9.13). Der Strom in einem Subband i ist dann (vgl. 9.47) ZlL Ii e
1
Di
Ev i
EdE :
9:96
lR
Hierbei ist v i
E
1 @Ei h @kz
9:97
die Gruppengeschwindigkeit der Elektronen im i-ten Subband
1 (Abb. 9.13a) und Di die eindimensionale Zustandsdichte des Subbandes i. Letztere ist gemäß Abschn. 6.1 oder (7.41)
9.9 Quantentransport in Nanostrukturen
D
1
E
1 : p@E=@kz
269
9:98
Durch Einsetzen von (9.97) und (9.98) in (9.96) folgt mit (9.95) 2e2 U:
9:99 h Jeder Leitfähigkeitskanal oder jedes Subband besitzt unter der Voraussetzung von Spinentartung bei ballistischem Transport also den gleichen und deshalb universellen Leitwert
Ii
2e2 7;74809 10 5 X 1 1=
129064 X :
9:100 h Bei Aufhebung der Spinentartung, z. B. durch ein starkes Magnetfeld (Quanten-Hall-Effekt, Tafel XVI) hat dieses sogenannte Leitfähigkeitsquantum den halben Wert e2/h. Passen mehrere Transportkanäle oder Subbänder in den ballistischen Draht, dann trägt jeder Kanal mit dem Wert (9.100) zum Gesamtleitwert bei. Die experimentelle Beobachtung der Quantisierung des Leitwertes ist in 1D-Strukturen möglich. Die Bedingung (9.93) bedeutet, dass bei metallischen Proben mit kF 1Å–1 (Tabelle 6.1) der Drahtdurchmesser von der Größe eines Atoms sein muss. In speziellen Halbleiterstrukturen lassen sich metallische Elektronengase auch mit deutlich kleinerem Fermi-Vektor herstellen (Abschn. 12.7). Entsprechend größer können die Strukturen sein, in denen sich ballistischer Quantentransport realisieren lässt. Die Beobachtung erfordert dann aber auch tiefe Temperaturen [9.8]. Metallischer Quantentransport ist schon bei Zimmertemperatur beobachtbar. Dabei ist es nicht unbedingt notwendig, die erforderlichen atomaren Strukturen explizit herzustellen. Der Effekt kann auch beim Brechen eines Metallkontaktes in einem konventionellen mechanischen Relais beobachtet werden [9.9]. In Abb. 9.14 ist die gemessene Zeitabhängigkeit des Leitwertes beim Brechen eines AuCo-Kontaktes in einem solchen Relais aufgetragen. Die beobachteten Stufen sind auf atomare 1D-Leitfähigkeitskanäle (N = 6–0) zurückzuführen, die sich G0
Abb. 9.14. Leitwertsprünge in einem konventionellen Relais mit AuCo-Kontakten, gemessen bei Zimmertemperatur (nach Hansen et al. [9.9])
270
9. Bewegung von Ladungsträgern und Transportphänomene
kurz vor dem endgültigen Bruch des Kontaktes in Form von Atomketten ausbilden und dann sukzessive auseinanderreißen. Aharonov-Bohm und Altshuler-Aronov-Spivak Oszillationen Der Wellencharakter von Elektronen tritt am deutlichsten bei Interferenzen in Erscheinung, so wie sie uns in der Elektronenbeugung an Kristalloberflächen oder beim Durchgang eines Elektrons durch einen Doppelspalt begegnen. Ein zur Doppelspaltbeugung analoges Experiment kann an Nanostrukturen durchgeführt werden, in denen der Transport phasenerhaltend über zwei räumlich getrennte Transportkanäle geschieht, die anschließend wieder zusammengeführt werden (Abb. 9.15). Die einfachste Anordnung ist eine Ringstruktur aus einem metallischen Leiter oder ein lithographisch präpariertes Ringmuster in einem metallisch leitendem, zweidimensionalen Elektronengas (2DEG) einer Halbleiter-Heterostruktur (Abschn. 12.7). Ein Elektron, das aus dem linken Kontakt in die Ringstruktur eintritt, hat die Möglichkeit, über einen der Wege (1) oder (2) zum Kontakt rechts zu gelangen. Wird längs der beiden Wege die Phase erhalten, dann erwarten wir hinter dem Ring elektronische Interferenzen, wenn die Phase der Elektronenwelle auf dem Weg (1) gegenüber der auf Weg (2) verschoben wird. Die Interferenz würde dann in einem periodisch sich mit der Phase änderndem Strom am rechten Kontakt messbar sein. Der Effekt wird nach seinen Entdeckern Aharonov-Bohm-Effekt [9.10] genannt. Damit Interferenzen auftreten, müssen die Elektronen eine feste, wohldefinierte Wellenlänge haben, d. h. sie müssen in einem einzigen Transportkanal oder Subband des 1D-Drahtes propagieren. Dies verlangt Drahtdicken in der Größenordnung der Fermi-Wellenlänge kF . Weiterhin muss der Transport zwischen den Kontakten phasenerhaltend sein. Deshalb muss die Strecke L zwischen den Kontakten einen ballistischen Transport mit L le, lU, lin ermöglichen oder es wird zumindest diffusiver Transport verlangt, bei dem die Länge L deutlich kleiner ist als die inelastische freie Weglänge lin und die Phasenkohärenzlänge lU
Abb. 9.15. Aharonov-Bohm-Effekt: Der elektronische Transport zwischen zwei Kontakten, links und rechts erfolgt über einen leitenden Ring mit den möglichen Wegen (1) und (2). Der Transport ist entweder ballistisch oder diffusiv, d. h. phasenerhaltend mit nur elastischer Streuung (schematisch durch punktförmige Streuzentren angedeutet).
9.9 Quantentransport in Nanostrukturen
le < L < lin ; ly ;
271
9:101
sodass die Phase längs der Wege (1) und (2) erhalten bleibt (diffusiver Quantentransportbereich). Die Bedingung (9.101), aber erst recht ein ballistischer Transport verlangen genügend kleine Dimensionen der Struktur und tiefe Temperaturen bei der Messung, um durch Herabsetzung der Phononstreuung ein genügende große inelastische freie Weglänge lin zu erhalten. Wie können die Phasen der Elektronenwellen auf den beiden Wegen (1) und (2) gegeneinander verschoben werden? Wir beschreiben im einfachsten Fall des ballistischen Transports die Elektronenpropagation durch ebene Wellen der Form exp (ik·r) = exp (ip·r)/ h und erinnern uns, dass im Hamilton-Operator für ein freies Elektron im Magnetfeld der Impuls p durch den sog. kinetischen Impuls p–eA ersetzt werden muss, mit A als dem Vektorpotential des Magnetfeldes. Dadurch schreibt sich die Elektronenwelle im Magnetfeld als ! e W
r / exp i A r exp
i
k r xt :
9:102 h Das Magnetfeld bewirkt über das Vektorpotential A eine Phasenverschiebung. Bewegt sich das Elektron eine infinitesimale Strecke ds weiter, dann beläuft sich die Phasenverschiebung auf e du A ds :
9:103 h Für endliche Strecken müssen diese Verschiebungen du aufintegriert werden. Bei der in Abb. 9.15 a gezeigten Anordnung mit einem Magnetfeld, das durch den Ring durchgreift, ergibt sich für die Wellenfunktion an einem Ort r hinter dem Ring durch Superposition der Teillösungen über Weg (1) und (2): ! ! Z Z ie ie W
r W 1 exp A ds W 2 exp A ds :
9:104 h h 1
2
Hierbei sind W 1 und W 2 die Wellenfunktionen für verschwindendes Vektorpotential; sie werden sich trotz gleicher Weglängen jedoch um einen feste Phase unterscheiden, weil auf den beiden Wegen verschiedene raumfeste Störstellenmuster vorliegen können, die entsprechend verschiedene elastische Streuprozesse verursachen. Wege (1) und (2) werden bezüglich des Magnetfelds B, bzw. des Vektorpotentials A in entgegengesetzter Richtung durchlaufen; damit ergibt sich unter Benutzung des Stokesschen Satzes für die Gesamtphasenänderung Z Z I ZZ ZZ A ds A ds A ds df rot A df B UB : 1
2
Ring
(9.105)
272
9. Bewegung von Ladungsträgern und Transportphänomene
UB ist der magnetische Fluss durch die Ringschleife. Ausklammern des zweiten Terms in (9.104) ergibt damit ! ! ! Z ie ie UB W 2 W
r / exp
9:106 A ds W 1 exp h h 2
und unter Berücksichtigung des festen Phasenunterschieds d zwischen Weg (1) und Weg (2) W
r / e h UB eid ie
9:107
Der bei einer anliegenden Spannung zwischen den Kontakten gemessene Strom ist proportional zu |W|2, d. h. es folgt für den Strom I als Funktion des magnetischen Flusses UB I / je h UB eid j2 22 cos
2pUB =U0 ie
d
9:108
worin U0 das für einzelne Elektronen definierte Flussquantum h/e ist (im Unterschied zu Cooper-Paaren in der Supraleitung, wo y0 = h/2e ist, Abschn. 10.9). Der Wert von h/e beträgt U0 h=e 4; 1357 10
15
Vs :
9:109
Der Strom zwischen den beiden Kontakten ändert sich also bei Variation des magnetischen Flusses U durch den Ring periodisch mit einer Oszillationsperiode eines Flussquants U0 . Dieser Effekt wurde vielfach an ringförmigen metallischen und Halbleiter-2DEGStrukturen beobachtet. In Abb. 9.16 ist die klassische Messung von Webb et al. [9.11] an einem Goldring mit etwa 0,8 lm Durchmesser dargestellt. Neben der Originalmesskurve des oszillierenden Widerstandes ist auch das daraus errechnete Fourier-Spektrum gezeigt, das eine her-
Abb. 9.16. Aharonov-Bohm-Oszillationen gemessen an einem nanoskaligen Goldring: (a) Originalmesskurve des Magnetowiderstandes als Funktion des magnetischen Feldes, das den Ring durchdringt. Die Oszillationsperiode ist DB U0 =FR mit FR der Ringfläche. (b) Fourier-Transformierte der Messkurve in (a). Neben der Hauptbande bei etwa 130 T–1 werden mit geringerer Intensität bei etwa 260 T–1 Altshuler-Aronov-Spivak-Oszillationen mit der doppelten Frequenz gefunden (nach Webb et al. [9.11])
9.9 Quantentransport in Nanostrukturen
273
ausgehobene Bande bei der Frequenz 1/DB von etwa 130 T–1 aufweist. Jedoch wird auch eine schwächere Bande bei der doppelten Frequenz von etwa 260 T–1 beobachtet. Diese ist darauf zurückzuführen, dass die in den Ring eintretenden Partialwellen bei genügend großer Phasenkohärenzlänge lU den Ring einmal im Uhrzeigersinn und zum anderen im Gegenuhrzeigersinn durchlaufen können und dann am Eintrittspunkt in den Ring miteinander konstruktiv interferieren. Dies führt zu einer erhöhten Rückstreuung des Elektrons in den Einleitungskanal. Diese sogenannten Altshuler-Aronov-Spivak-Oszillationen sind robuster in ihrem Erscheinungsbild als die Aharonov-Bohm-Oszillationen, denn beide interferierenden Teilwellen durchlaufen das gleiche Störstellenmuster in entgegengesetzter Richtung und sind in ihrer relativen Phase deshalb besser bestimmt (d = 0 in 9.108). Weiterhin muss in der Superpositionswellenfunktion W(r) (9.104) dem Rechnung getragen werden, dass der Ring von beiden Teilwellen in entgegengesetzter Richtung ganz durchlaufen wird. Für einen Ort am Eingang zum Ring gilt also ! ! I I ie ie W
r W 1 exp ds A W 1 exp ds A : h h
9:110 Mit (9.105) folgt daraus " ! ie UB exp W
r / W 1 exp h
ie UB h
!#
9:111
bzw. für die Aufenthaltswahrscheinlichkeit des Elektrons am Ringeingang jWj2 2jW 1 j2
1 cos
4pUB =U0 :
9:112
Die Oszillationsperiode für den rückgestreuten und damit auch die des durch den Ring transmittierten Stroms ist jetzt U0 /2, also die Hälfte der Aharonov-Bohm-Periode (9.107). Damit ist die in Abb. 9.15b bei der doppelten Frequenz auftretende Fourier-Bande erklärt. Altshuler-Aronov-Spivak-Oszillationen werden auch in Halbleiter-Nanosäulen aus InAs beobachtet, wenn man bei tiefen Temperaturen in einem Magnetfeld B parallel zur Nanosäule einen Strom durch die Säule schickt [9.12]. InAs hat die spezielle Eigenschaft, dass an seiner Oberfläche immer ein zweidimensionales Elektronengas (2DEG) mit quasi-metallischen Eigenschaften existiert, ähnlich wie in Halbleiterheterostrukturen (Abschn. 12.7). Bei lithographisch präparierten InAs-Nanosäulen mit Kontakten oben und unten (Abb. 9.17) hat der stromtragende Bereich also eine Zylindertopologie. Der Strom fließt weitgehend in diesem Zylinder und Elektronen können neben ihrem direkten kürzesten Weg zwischen den Kontakten auch Wege nehmen, die einmal um die Säule her-
274
9. Bewegung von Ladungsträgern und Transportphänomene
Magnetfeld B (T)
Abb. 9.17. Altshuler-Aronov-Spivak-Oszillationen in InAs-Nanosäulen, die mittels Elektronenstrahl-Lithographie (Tafel XVIII) präpariert wurden. (a) Rasterelektronenmikroskopisches Bild einer InAs-Nanosäule mit (111)-Wachstumsrichtung. Der obere Teil der Säule besteht aus Photolack, herrührend von der Präparation. (b) Schema des stromtragenden zylinderförmigen Leitungskanals des zweidimensionalen Elektronengases (2DEG) mit Magnetfeld B; darüber Schema des elektronischen Bandverlaufs innerhalb der Säule, EF Fermi-Energie, EL Leitungsbandkante, EV Valenzbandkante. (c) Oszillationen des zwischen oberem und unterem Kontakt gemessenen Magnetowiderstands. (d) Fourier-Transformierte des Magnetowiderstands. Die Hauptbande entspricht einer Oszillationsfrequenz von 2F/U0 = 2eF/h mit F der Basisfläche der Säule (nach Wensorra et al. [9.12])
umführen und somit einen magnetischen Fluss umschließen. Für diese Wege existieren dann ähnlich wie in den betrachteten Ringstrukturen beide Umlaufrichtungen, im Uhrzeigersinn und entgegengesetzt. Die Elektronenwellen interferieren am Ende der Säule gemäß (9.112). Die entsprechenden Stromoszillationen mit der Periode U0/2 werden als kleine Korrekturen tatsächlich im Leitwert beobachtet (Abb. 9.17). Schwache Lokalisierung Bei den bisher betrachteten Elektroneninterferenz-Phänomenen mussten die Dimensionen der Strukturen, d. h. die entscheidenden Wegstrecken kleiner als die Phasenkohärenzlänge lU sein. Interferenzeffekte sind jedoch auch schon beobachtbar in Proben mit Dimensionen L > lU. Der Effekt der schwachen Lokalisierung ist bei
9.9 Quantentransport in Nanostrukturen
275
Abb. 9.18. Schematische Darstellung des phasenerhaltenden diffusiven Elektronentransports, bei dem elastische Streuprozesse die Phase der Elektronenwelle jeweils wohldefiniert verändern. (a) Mögliche Trajektorien zwischen verschiedenen Streuzentren von Punkt P nach Q. Die Trajektorie 3a beschreibt eine geschlossene Schleife am Punkt O, die von der Elektronenwelle sowohl im Uhrzeigersinn als auch im Gegenuhrzeigersinn durchlaufen werden kann. (b) Detail des geschlossenen Umlaufs 3a: Ein magnetischer Fluss U durch die Schleife verschiebt die Phasen der rechts und links herumlaufenden Elektronenwellen gegeneinander
genügend tiefen Temperaturen als Quantenkorrektur zum Widerstand bei ausgedehnten Proben zu beobachten, wenn die Phasenkohärenzlänge lU (durch inelastische Phononenstreuung) größer ist als die elastische freie Weglänge le (durch Störstellenstreuung). Bei diesem Effekt handelt es sich um Interferenzen zwischen Elektronenwellen, die infolge phasenerhaltender elastischer Mehrfachstreuung an Störstellen geschlossene Bahnen durchlaufen (Abb. 9.18). Genauso wie bei Altshuler-Aronov-Spivak-Interferenzen kann eine Elektronenwelle eine solche geschlossene Bahn im Uhrzeigersinn und entgegengesetzt durchlaufen. Dadurch kommt es am Ausgangspunkt der geschlossenen Bahn zu konstruktiver Interferenz, also einer erhöhten Aufenthaltswahrscheinlichkeit für das Elektron. Dies bedeutet, dass das Elektron verglichen mit dem gedachten Fall der Nicht-Interferenz stärker rückwärts gestreut wird. Eine Erhöhung des Widerstandes ist die Folge. Zu dieser Erhöhung trägt eine Vielzahl gleichartiger Prozesse, jedoch mit statistisch variierenden geschlossenen Bahnen bei. Wir haben es also mit einer statistischen, mittleren Erhöhung des Widerstandes im Vergleich zum klassischen Wert ohne Quanteninterferenzen zu tun. Dieser durch „schwache Lokalisierung“ erhöhte Widerstandswert lässt sich ausschalten, indem man die Bedingung für konstruktive Interferenz am Ausgangspunkt eines geschlossenen Weges des Elektrons stört. Dies geschieht wie bei den Experimenten zu Altshuler-Aronov-Spivak-Oszillationen durch Anlegen eines Magnetfeldes. Dieses verschiebt die Phasen der Elektronenwellen, die im Uhrzeigersinn und entgegengesetzt längs des geschlossenen Weges propagieren, gegeneinander. Die konstruktive Interferenz bei allen geschlossenen Wegen bricht zusammen und der elektrische Widerstand sinkt mit wachsender Magnetfeldstärke auf den klassischen Wert.
276
9. Bewegung von Ladungsträgern und Transportphänomene
Abb. 9.19. Magnetowiderstand DR/R eines Lithium-Drahtes (21 nm dick, 55 nm breit) gemessen bei 0,13 K als Funktion eines senkrecht dazu orientierten Magnetfeldes H (nach Dolan et al. [9.13]). Anmerkung: Ein Magnetfeld von 1 Oe entspricht 1000/4p Am–1 und damit einem B-Feld von 10–3 Vs/m2
Dies wird in der Tat beobachtet, wie die Widerstandsmessung an einem langen Li-Draht mit Querschnittdimensionen im Nanometerbereich in Abb. 9.19 zeigt. Mittlerweile ist der Effekt für eine Vielzahl metallischer und halbleitender Systeme gezeigt. Der Effekt der schwachen Lokalisierung ist natürlich stark temperaturabhängig. Bei höheren Temperaturen nimmt wegen stärkerer Phononstreuung die Phasenkohärenzlänge lU ab. Längs der geschlossenen Umläufe verliert das Elektron seine feste Phase und konstruktive Interferenz ist nicht mehr möglich. In nanostrukturierten Proben mit wenig Defekten, wo ballistischer Transport vorherrscht, sind nur wenige geschlossene Elektronenpfade möglich. Elastische Streuung geschieht meist an den Berandungen. Damit wird der Effekt der schwachen Lokalisierung unterdrückt und wegen des Einflusses der Berandung dimensions- und strukturabhängig. Universelle Leitfähigkeitsfluktuationen In den bisher beschriebenen Magnetotransportmessungen, vom Aharonov-Bohm-Effekt bis zur schwachen Lokalisation, treten bei genauerer Analyse der Messdaten irreguläre Fluktuationen des Leitwertes auf, die beim ersten Hinsehen den Eindruck von Rauschen erwecken. Diese Fluktuationen als Funktion des B-Feldes sind jedoch reproduzierbar für eine spezielle Probe, solange sie bei tiefer Temperatur gehalten wurde. Je tiefer die Temperatur umso stärker ist die Amplitude der Fluktuationen. Erhöht man die Temperatur langsam, so bleiben die Fluktuationen als Funktion des Magnetfeldes B in ihrer Struktur erhalten, nehmen jedoch wegen erhöhter inelastischer Streuung in ihrer Amplitude ab (Abb. 9.20). An verschiedenen Proben desselben Materials werden nach gleichen Präparationsschritten verschiedene Fluktuationsmuster gemessen. Diese Fluktuationsmuster sind also ein „Fingerabdruck“ der
9.9 Quantentransport in Nanostrukturen
277
Magnetfeld B (T)
speziellen Probe. Sie rühren her von der jeweils besonderen Störstellenkonfiguration, die der Probe zueigen ist. Die theoretische Beschreibung dieser sogenannten universellen Leitfähigkeitsfluktuationen basiert wiederum auf dem diffusiven Transport von Elektronen, deren Wellenfunktionen eine Phasenverschiebung bei der Streuung an räumlich festen Störungen im Leiter erfahren. Wir denken uns den Leiter der Länge L in Abschnitte der Phasenkohärenzlänge lU zerlegt, in denen jeweils diffusiver, aber phasenerhaltender Transport stattfindet (Abb. 9.21). In einem solchen Abschnitt finden elastische Streuprozesse mit fester Phasenänderung statt. Unter allen möglichen quasiklassischen Trajektorien gibt es viele, die nach einigen Streuprozessen wieder zum gleichen Ort führen. Bei einem anliegenden Magnetfeld B sind die entsprechenden Wegschleifen einem magnetischen Fluss ausgesetzt, d. h., bei Variation von B werden die Phasen der Wellenfunktionen wie beim Aharonov-Bohm-Effekt gegeneinander verschoben und die Transmission dieses Bereiches ändert sich. Im Gegensatz zu einer wohldefinierten Ringstruktur erzeugen die räumlich stark variierenden umschlossenen Raumbereiche dieser Trajektorien unterschiedliche Aharonov-Bohm-Perioden. Die Überlagerung all dieser verschiedenen Phasenverschiebungen führt zu stark variierenden Änderungen des Leitwertes, die durch das im jeweiligen Raumbereich wohldefinierte Störstellenmuster vorgegeben sind. Aufeinander folgende Bereiche der Länge lU im Leiter der Länge L unterscheiden sich in ihrer Störstellenkonfiguration.
Abb. 9.20. Universelle Leitfähigkeitsfluktuationen, gemessen in Zweipunktanordnung an einem in der Molekularstrahlepitaxie (Tafel XVII) durch selbstorganisiertes Wachstum (Tafel XVIII) hergestellten InN-Whisker (Nanosäule mit 67 nm Durchmesser, Kontaktabstand 410 nm). (a) Magnetowiderstand als Funktion eines Magnetfeldes senkrecht zur Nanosäule, gemessen bei den Temperaturen 0,8 und 5 K. Ein typischer Kontaktwiderstand von etwa 300 X ist im gemessenen Widerstand enthalten. (b) Auf das Leitfähigkeitsquantum e2/h normierte Leitfähigkeitsfluktuationen bei 0,8 K, berechnet aus der Messkurve in (a) (nach Blömers et al. [9.14])
278
9. Bewegung von Ladungsträgern und Transportphänomene
Abb. 9.21. Schematische Darstellung universeller Leitfähigkeitsfluktuationen in einem langen Draht, dessen Länge L um ein Mehrfaches die Phasenkohärenzlänge lU überschreitet. (a) In Drahtbereichen der Länge lU ist der Transport phasenkohärent. (b) Durch elastische Streuung (Streuzentren als Punkte eingezeichnet) können geschlossene Schleifen entstehen. In diesen Schleifen werden durch die magnetischen Flüsse U1, U2, U3 jeweils die Phasen der linksund rechtsherum laufenden Elektronenwellen gegeneinander verschoben
Die Fluktuationen in diesen Bereichen als Funktion des Magnetfeldes B sind deshalb nicht miteinander korreliert. Die Addition der Fluktuation einzelner Bereiche zur am makroskopischen Leiter gemessenen Gesamtfluktuation ist deshalb wie bei der Addition von stochastischem Rauschen proportional zur Wurzel aus der Anzahl N der hintereinander geschalteten Bereiche der Länge lU r p h L :
9:113 DR / N / 2 e lU Der Gesamtwiderstand R hingegen ist proportional zur Anzahl N. Damit ergibt sich für die Abhängigkeit der Leitfähigkeitsfluktuationen von der Länge L die Relation !3=2 DR lU 3=2 / :
9:114 jDGj 2 / N L R Sehr gut bestätigt wird die Längenabhängigkeit der universellen Leitfähigkeitsfluktuationen (9.114) für eine in Serie angeordnete Reihe von Leiterschleifen (Proben mit N = 1, 3, 10 und 30 Ringen) aus Silber (Abb. 9.22). Die Leiterbahn, die auch die Ringschleifen untereinander verbindet, hat eine Breite von 75 nm und eine Schichtdicke von 20 nm. Während die in den Ringen durch ein Magnetfeld erzeugte oszillatorische Widerstandsänderung durch Altshuler-Aronov-Spivak-Oszillationen der Frequenz h/2e unabhängig von der Anzahl der Ringe ist, nimmt die Amplitude der Leitfähigkeitsfluktuationen mit der Ringanzahl, d. h. der Länge des Drahtes, gemäß (9.114) ab.
9.9 Quantentransport in Nanostrukturen
279
Abb. 9.22. Mittlere Amplitudenhöhe (RMS) der universellen Leitfähigkeitsfluktuationen DGRMS (gestrichelte Linie) und der Altshuler-Aronov-Spivak(AAS)Oszillationen (durchgezogene Linie), gemessen an Ag-Drahtproben mit jeweils einer in Serie angeordneten Reihe von Leiterschleifen (siehe Einschub). Die verschiedenen Proben enthalten jeweils N = 1, 3, 10, 30 Ringe. Drahtdimensionen: Dicke = 20 nm, Breite = 75 nm. Die Messungen wurden in Magnetfeldern zwischen 0,2 und 0,3 T bei einer Temperatur von 0,32 K durchgeführt (nach Umbach et al. [9.15]).
Abschließend sei betont, dass die hier betrachteten Leitfähigkeitsfluktuationen ein beträchtliches Problem für die Reproduzierbarkeit der Bauelementeigenschaften von nanoskalierten Quantenbauelementen bei tiefen Temperaturen darstellen können.
Übungen zu Kapitel 9
9.1 Der Unterschied zwischen Relaxationszeit und freier Flugzeit soll am Beispiel der elektrischen Leitung in einem klassischen Gas diskutiert werden. Dazu sei angenommen, dass die geladenen Teilchen zur Zeit t = 0 sich mit einer Geschwindigkeit v 0 x in xRichtung bewegen. Nach Abschalten des elektrischen Stromes sollen die Teilchen nach einer Zeit sc elastisch gestreut werden mit einer richtungsabhängigen Streuwahrscheinlichkeit p (H), wobei H der Winkel um die xAchse ist. Zeigen Sie, dass die durchschnittliche Geschwindigkeit der Teilchen in x-Richsc tung mit einer Relaxationszeit s = 1 hcos Hi abnimmt mit hcos Hi, dem über die Verteilung p (H) gemittelten Wert von cos H! Vergleichen Sie die freie Flugzeit sc und die Relaxationszeit! Unter welcher Bedingung sind sie gleich? Im Festkörper werden Elektronen an Defekten gestreut. Diskutieren Sie verschiedene Arten von Defekten im Hinblick auf das zu erwartende Verhältnis s und sc! 9.2 Zeigen Sie, dass unter Benutzung der stationären Boltzmann-Gleichung die Beweglichkeit geladener Teilchen in einem klassischen Gas gegeben ist durch l
ehv 2 s
ki mhv 2 i
!
9.3 Man berechne die Feldabhängigkeit der elektrischen Leitfähigkeit r(E ) unter Benutzung der zweiten Iteration der Boltzmann-Gleichung! Im zweiten Iterationsschritt verwende man wie im ersten, dass die Verteilung f0 feldunabhängig ist. Diskutieren Sie interessante technische Anwendungen von Materialien,
die eine starke Feldabhängigkeit der Leitfähigkeit aufweisen! 9.4 Man betrachte einen metallischen Halbraum mit zwei Punktkontakten. Parallel zur Oberfläche und senkrecht zur Verbindungslinie sei ein Magnetfeld B angelegt. Über einen Punktkontakt werden Elektronen in das Metall injiziert, die mit Hilfe des zweiten Punktkontaktes nachgewiesen werden. Zeichnen Sie die Elektronenbahnen für den Fall ballistischen Transports! – Für welche Werte von B erwarten Sie ein maximales Signal am zweiten Punktkontakt? – Berechnen Sie das Signal als Funktion von B! 9.5 Man betrachte ein semiklassisches Modell der Zyklotronresonanz, in dem die Bewegung eines quasi-freien Teilchens durch eine effektive Masse m und eine Relaxationszeit s beschrieben wird. (a) Berechnen Sie die Zyklotronfrequenz xc! (b) Stellen Sie die Differentialgleichung für die Bewegung eines Elektrons in einem statischen Magnetfeld B = (0, 0, B) und einem elektrischen Hochfrequenzfeld E = (A ei x t, A ei (x t+p/2), 0) auf! Streuprozesse sollen durch einen Reibungsterm mv/s berücksichtigt werden. (c) Berechnen Sie die Leitfähigkeit aus r = jx /E x! Der Realteil von r beschreibt die Dämpfung des elektrischen Feldes. (d) Zeichnen Sie Re {r} als Funktion von x/ xc für Werte von xc s = 0,2, 1, 3 und diskutieren Sie die erhaltenen Kurven! (e) Wie lassen sich Elektronen- und Löcherresonanz voneinander unterscheiden?
Übungen zu Kapitel 9
(f) In einem Klystron werde Hochfrequenzstrahlung mit einer Frequenz von 24 GHz erzeugt. Das Absorptionsmaximum wird bei B = 8,6 ´ 10–2 T beobachtet. Man bestimme die effektive Masse der Ladungsträger! Über welchen Bereich der Relaxationszeit und der Mobilität l kann man eine Resonanz beobachten? 9.6 (a) Man berechne gemäß Abschn. 7.5 die elektronische Zustandsdichte D
1
E für ein elektronisches Subband eines eindimensionalen Leiters. Man zeichne die Zustandsdichte als Funktion der Elektronenenergie E für eine Folge von Subbändern, wie sie im leitenden Draht existieren. (b) Welche elektronischen Streuprozesse sind beim Transport möglich, wenn nur ein Subband besetzt ist? Was ändert sich, wenn ein zweites Subband mitbesetzt wird, das Fermi-Niveau also zwei Subbänder schneidet (Zeichnung)? 9.7 Man betrachte ballistischen Elektronentransport durch ein zweidimensionales Oberflächen-Elektronengas (2DEG) längs einer Nanosäule (Abb. 9.17 b) in einem Magnetfeld B parallel zur Säule. Elektronentrajektorien können die Kontakte oben und unten an der Säule direkt verbinden oder Umläufe um die Säule im 2DEG ohne Streuprozesse beinhalten. Letztere Bewegung lässt sich in eine Propagation längs der Säule (parallel z) und eine Kreisbewegung senkrecht zur Säule (parallel x, y) zerlegen. (a) Man ermittle den Hamilton-Operator H für die Bewegung eines Elektrons zwischen den beiden Kontakten im Magnetfeld B, indem man das Magnetfeld durch sein Vektorpotential A im kinetischen Impuls p–eA berücksichtigt. Zweckmäßigerweise wähle man eine Darstellung in Zylinderkoordinaten (Einheitsvektoren eu,
281
ez), in denen sich das Vektorpotential als A 12 Breu darstellt (Beweis?). Weiter benutze man die Darstellung des Drehimpulses Lz mr2 u_ für die Kreisbewegung um die Säule herum, mit r als fest vorgegebenem Säulenradius. (b) Mittels des Produktansatzes W
r; uv
z für die Wellenfunktion, der die Bewegung um die Säule und in z-Richtung längs der Säule entkoppelt, zeige man, dass die Eigenlösungen der SchrödingerGleichung sich darstellen als !2 h2 kz2 h2 U ; El l 2m 2mr2 U0
(c) (d)
(e)
(f)
mit kz dem Wellenzahlvektor für die Bewegung in z-Richtung längs der Säule, l der Drehimpulsquantenzahl zum Drehimpuls Lz, U dem magnetischen Fluss durch den Säulenquerschnitt und U0 h=e dem magnetischen Flussquant. Man zeichne und diskutiere die Energieeigenwerte El als Funktion des magnetischen Flusses U. Unter Benutzung des Modells des eindimensionalen Transports über 1D-Subbänder diskutiere man, dass der Transport längs der Säule über Subbänder, gebildet aus Drehimpuls-Eigenzuständen jli, erfolgt und im Magnetowiderstand Oszillationen mit der Periode U0 als Funktion des Flusses U auftreten. Worin unterscheiden sich die hier betrachteten Oszillationen mit der Periode U0 von Aharonov-Bohm(AB)- oder Altshuler-Aronov-Spivak(AAS)-Oszillationen im Magnetowiderstand? Welche durch Elektroneninterferenz verursachten Magneto-Oszillationen können zusätzlich zu den hier betrachteten Oszillationen noch als Überlagerung auftreten?
Tafel VIII
Tafel VIII Quantenoszillationen und die Topologie von Fermi-Flächen
Die Fermi-Fläche eines Metalls ist eine Fläche im k-Raum, die durch die Bedingung E (k) = EF festgelegt wird. Elektronen auf Fermi-Flächen sind besonders wichtig, weil nur sie Energie in infinitesimal kleinen Portionen aufnehmen können. Sie bestimmen deshalb alle Transportgrößen wie z. B. die elektrische Leitfähigkeit (Abschn. 9.5), die ja durch ein Integral über die Fermi-Fläche bestimmt ist. Fermi-Flächen lassen sich bei bekannter Bandstruktur aus der Bedingung E (k) = EF berechnen. Doch kennt man auch experimentelle Methoden, die eine sehr genaue direkte Vermessung der Fermi-Flächen erlauben. Diese Methoden beruhen auf der Beobachtung von Quantenoszillationen bei Anlegen eines Magnetfeldes. Ursache und Erscheinungsbild der Quantenoszillationen sind nicht ganz leicht zu verstehen und wir müssen zur Erklärung etwas weiter ausholen. Freie Elektronen im Magnetfeld erfahren eine zusätzliche Kraft, die sog. Lorentz-Kraft. Sie steht senkrecht auf den Richtungen des Magnetfeldes und der Bahngeschwindigkeit und gibt Anlass zu einer zeitlichen Änderung des Impulses nach mv_ e
v B :
Dabei haben wir mit [r rk E (k)]^ die Komponente des Gradienten senkrecht zum B-Feld eingeführt. Diese Komponente können wir auch als dE/dk^ schreiben mit k^ dem k-Vektor senkrecht zum BFeld und der Konturlinie auf der Energiefläche, auf welcher das Elektron läuft (Abb. VIII.1). An Hand von Abb. VIII.1 sehen wir auch, dass das Umlaufintegral nichts anderes als die Ableitung der Querschnittsfläche S nach der Energie ist dk? dS dk :
VIII:4 dE dE Die Umlaufzeit h2 dS
VIII:5 eB dE ist damit verknüpft mit der Energieabhängigkeit der von der Elektronenbahn im k-Raum eingeschlossenen Fläche. Im allgemeinen sind diese Umlaufzeiten für die verschiedenen Elektronen im k-Raum verschieden. Für das freie Elektronengas allerdings sind sie alle gleich. Wie man T
VIII:1
Für Festkörperelektronen konnten wir nach (9.4) mv hk und v h 1rk E
k setzen. Aus der zeitlichen Änderung des Impulses wird damit die zeitliche Änderung des Wellenzahlvektors dk e r rk E
k B : dt h2
VIII:2
Die Elektronen laufen also im k-Raum tangential zu den Flächen konstanter Energien um das Magnetfeld herum. Wir wollen die Umlaufzeit berechnen. h2 1 dk
VIII:3 T dt e B r rk E
k? :
Abb. VIII.1. Umlaufbahn eines Elektrons um die Fermi-Fläche im Magnetfeld. Die Umlaufzeit ist proportional der Ableitung der Querschnittsfläche nach der Energie
sich leicht überzeugen kann, gilt dann wegen S = pk 2 dS m
VIII:6 2p 2 dE h bzw. 2pm T :
VIII:7 eB Dabei ist m die effektive Masse (siehe Abschn. 9.1). Für ein Magnetfeld von 1 T (104 G) erhalten wir z. B. so als Umlaufzeit T = 3,6·10–11 s. Diese Umlaufzeit im k-Raum ist auch die Umlaufzeit im Ortsraum und wir hätten für freie Elektronen das Resultat auch direkt klassisch aus der Gleichheit von Zentrifugalkraft und Lorentz-Kraft (e v B = m v xc, s. a. Tafel XV) herleiten können. Die Elektronenbahn ist dann eine Kreisbahn. Die Umlauffrequenz xc = 2 p/T wird auch Zyklotronfrequenz genannt. Gemäß unserer Herleitung bewegen sich Elektronen unter dem Einfluss eines Magnetfeldes im k-Raum auf kontinuierlichen Bahnen. Wie ist das in Übereinstimmung mit diskreten k-Vektoren zu bringen, die wir bisher angesetzt hatten? Diskrete k-Werte und die Möglichkeit, Energien nach kWerten zu klassifizieren, sind eine Folge der Translationsinvarianz. Die Schrödinger-Gleichung mit Magnetfeld ist aber senkrecht zur Richtung des Magnetfeldes nicht mehr translationsinvariant! Das ergibt sich daraus, dass wir in der Schrödinger-Gleichung mit Magnetfeld p durch p+e A, mit B = rot A, zu ersetzen haben. Die kVektoren senkrecht zur Magnetfeldachse (kx , ky) sind dann also keine Quantenzahlen mehr und damit bricht unser ganzes schönes Bändermodell erst einmal zusammen. Glücklicherweise können wir doch eine Aussage über die Energieterme machen, wenn die Magnetfelder nicht zu groß sind. Nach dem Korrespondenzprinzip muss im Grenzfall großer Quantenzahlen n die durch das Magnetfeld verursachte Aufspaltung benachbarter Terme En+1–En 2ph
VIII:8 hxc T sein, mit T der Umlaufzeit um die Querschnittsfläche bzw. xc der Umlauffrequenz [VIII.1]. Die En1
En
283
Abschätzung der Umlaufzeit von 3,6·10–11 s erlaubt uns dann, den Abstand der Energieniveaus mit 1,1·10–4 eV bei einem Magnetfeld von 1 T abzuschätzen. Die Existenz dieser Terme lässt sich durch Absorption elektromagnetischer Strahlung nachweisen, wobei Übergänge natürlich nur zwischen besetzten Termen unterhalb des FermiNiveaus und unbesetzten oberhalb des Fermi-Niveaus erfolgen können („Zyklotron-Resonanz “, vgl. Tafel XV). Die Interpretation der ZyklotronResonanz bei Metallen ist allerdings schwierig, da die Umlaufzeit T ja i. allg. von der Lage der Querschnittsfläche S abhängt, um die das Elektron im k-Raum läuft. Wir fragen uns nun, wie denn eigentlich mit Magnetfeld der k-Raum gequantelt ist, wenn kx, ky keine guten Quantenzahlen mehr sind? Setzen wir (VIII.5) in (VIII.8) ein und ersetzen wir den Differentialquotienten dS/dE entsprechend der Energiequantelung durch den Differenzquotienten (Sn+1–Sn)/(En+1–En), so erhalten wir eB :
VIII:9 h Im Magnetfeld sind also die Flächen, um die das Elektron im k-Raum läuft, gequantelt. Die Zustände auf den Umlaufbahnen sind dagegen entartet. Interessanterweise ist (für große Quantenzahlen) die Differenz der Flächen Sn+1–Sn konstant und unabhängig von kz. Die Elektronen sitzen also auf Röhren, den sog. Landau-Röhren (Abb. VIII.2). Die erlaubten Zustände im k-Raum „kondensieren“ gewissermaßen auf diese Röhren, sobald ein Magnetfeld, und sei es noch so klein, eingeschaltet wird. Wir überlegen uns leicht, dass die Distanz der Röhren voneinander allerdings für übliche Magnetfelder sehr klein ist. Die Zahl der Zustände insgesamt wird bei der „Kondensation“ natürlich nicht geändert. Auf jeder Röhre müssen zu jedem erlaubten kz-Wert also die Zustände sitzen, die sonst zwischen den Röhren waren. Soweit haben wir ein konstantes Magnetfeld betrachtet. Was geschieht, wenn wir B langsam steigern? Gleichung (VIII.9) sagt uns, dass sich die Landau-Röhren aufblähen. Dadurch treten sie entlang einer Kontaktkontur (Abb. VIII.2) nacheinander aus der Fermi-Fläche E (k) = EF aus. Wenn das Fermi-Niveau gerade zwischen zwei Landau-Röhren entlang der Kontaktkontur ist, liegen die höchSn1
Sn 2p
Tafel VIII
Tafel VIII Quantenoszillationen und die Topologie von Fermi-Flächen
Tafel VIII Quantenoszillationen und die Topologie von Fermi-Flächen
Tafel VIII
284
Abb. VIII.2. Die erlaubten Zustände von Elektronen im Magnetfeld liegen auf den sog. Landau-Röhren. Diese sind durch zwei Eigenschaften charakterisiert: 1) Der Umlauf (eines Elektrons) senkrecht zu B erfolgt auf einer Fläche konstanter Energie. 2) Die zwischen aufeinanderfolgenden Röhren eingeschlossene Fläche ist konstant. Nur wenn das Magnetfeld entlang einer Hauptsymmetrieachse läuft, ist die Röhrenachse parallel zum B-Feld. Um die Vorstellung hier nicht zu sehr zu strapazieren, zeichnen wir nur die Landau-Röhren mit kreisförmigem Querschnitt für den Fall des freien Elektronengases sowie eine Fermi-Kugel, die die Besetzungsgrenze ohne Magnetfeld angibt. Mit Magnetfeld liegen die besetzten Zustände auf den Flächen der Landau-Röhren innerhalb der Kugel
netischen Suszeptibilität bezeichnet. Als Beispiel für eine solche Messung zeigen wir Messungen an Gold. In Gold sind (in Analogie zu Cu, vgl. Abb. 7.12) die d-Zustände besetzt und das Fermi-Niveau fällt in den Bereich des sp-Bandes. Die Fermi-Fläche hat also näherungsweise Kugelgestalt. Allerdings ist sie so ausgedehnt, dass sie entlang der [111]Richtung Kontakt mit der Zonengrenze hat. Dadurch entsteht eine Aufstülpung der Fläche und die Fermi-Fläche geht direkt in die Fermi-Fläche der angrenzenden Zonen über (Abb. VIII.3). Für ein Magnetfeld entlang der [111]-Richtung gibt es damit zwei geschlossene Umlaufbahnen, entlang derer sich bei steigendem Magnetfeld die Landau-Röhren von der Fermi-Fläche ablösen. Dies sind die sog. Halsbahn und die Bauchbahn. Ihre Querschnittsflächen bestimmen die Periode der de Haas-van Alphen-Oszillationen. Abbildung VIII.4 a zeigt ein Originalspektrum für diesen Fall. Das Verhältnis der Querschnittsflächen ist direkt aus dem Vergleich der Perioden abzulesen (1 : 29). Nach Gl. (VIII.9) berechnen wir fer-
sten besetzten Zustände unterhalb des Fermi-Niveaus. Die mittlere Energie ist also niedriger als in dem Moment, wo die Landau-Röhre gerade die Fermi-Fläche entlang der Kontur verlässt. Dadurch oszilliert die mittlere Energie. Diese periodischen Quantenoszillationen machen sich im Prinzip in allen Festkörpereigenschaften bemerkbar und sind tatsächlich auch bei vielen nachgewiesen worden. Die Periode dieser Oszillation in B ist nach (VIII.9) DB
2pe 2 B : hSF
VIII:10
Mit der Periode DB mißt man also direkt die Querschnittsflächen der Fermi-Flächen. Darauf beruht die große Bedeutung der Quantenoszillationen für die Erforschung der Topologie der Fermi-Flächen. Besondere praktische Bedeutung hat dabei vor allem der sog. de Haas-van Alphen-Effekt [VIII.2] erlangt, der die periodische Oszillation der mag-
Abb. VIII.3. Die Fermi-Flächen der Edelmetalle Cu, Ag, Au haben Kontakt zur Zonengrenze beim Punkt L. Dadurch gibt es z. B. senkrecht zur [111]-Richtung zwei Umlaufbahnen mit extremalem Querschnitt. Senkrecht zur [110]- bzw. [100]Richtung gibt es auch geschlossene Umlaufbahnen, die zwischen den Fermi-Kugeln benachbarte Brillouin-Zonen umlaufen und dabei leere Zustände einschließen („Lochbahnen“). Ferner gibt es offene Bahnen, bei denen die Elektronen durch das ausgedehnte Zonenschema laufen. Für solche offenen Bahnen gibt es keine Umlaufzeit und die Überlegungen, die auf der Geschlossenheit der Bahnen beruhen, finden keine Anwendung
285
Tafel VIII
Literatur
Abb. VIII.4 a, b. Original-Schreiberkurven, die die Oszillationen in der magnetischen Suszeptibilität von Gold bei Variation des Feldes (a) bzw. bei Variation der Richtung des Mag-
netfeldes (b) zeigen (nach Lengeler [VIII.3]). Die Quantenoszillationen lassen sich natürlich nur bei genügend scharfer Fermi-Verteilung
k T < hxc beobachten
ner aus den Daten die Querschnittsflächen zu 1,5·1015 cm–2 bzw. 4,3·1016 cm–2. Mit diesen Angaben lässt sich ein Abbild der Fermi-Fläche wie Abb. VIII.3 bereits weitgehend konstruieren. Variiert man den Winkel der Magnetfeldachse bei konstantem Feld, so beobachtet man ebenfalls Oszillationen, weil nunmehr die LandauRöhren durch die Drehung die Fermi-Fläche entlang der Kontaktkontur einmal berühren, einmal nicht (Abb. VIII.4 b). Die Oszillationen verschwinden aber für Winkel, wo die Umlaufbahnen nicht geschlossen sind. Geschlossene Bahnen
mit definierter Umlaufzeit waren die Voraussetzung für die Herleitung der Relationen (VIII.3– VIII.10).
Literatur VIII.1 L. Onsager: Philos. Mag. 43, 1006 (1952) VIII.2 W. J. de Haas, P. M. van Alphen: Leiden Comm. 208 d, 212 a (1930) VIII.3 B. Lengeler: Springer Tracts Mod. Phys. Vol. 82 (Springer, Berlin Heidelberg 1978), p. 1
10. Supraleitung
In Kap. 9 wurden die Grundzüge des Phänomens der elektrischen Leitfähigkeit in Metallen vorgestellt und erklärt. Der endliche Widerstand der Materialien rührt im wesentlichen von Abweichungen des Realkristalls von der Gitterperiodizität her: Phononen und Störstellen. Eine unendlich hohe elektrische Leitfähigkeit ist im Rahmen einer solchen Beschreibung undenkbar, denn (1) ist aus Gründen des 2. Hauptsatzes der Thermodynamik ein Kristall ohne ein gewisses Maß an Unordnung nicht vorstellbar, (2) müsste bei Ausfallen der Phonon- und Störstellenstreuung zumindest ElektronElektron-Streuung als Widerstandsursache (s. Abschn. 9.3) in Erscheinung treten. Im Jahre 1911 entdeckte jedoch Onnes [10.1], dass der elektrische Widerstand von Quecksilber beim Abkühlen unter 4,2 K unmessbar kleine Werte annimmt. Dieses Phänomen, das in der Folgezeit an vielen weiteren Materialien beim Abkühlen unter eine gewisse kritische Temperatur Tc gefunden wurde, trägt den Namen „Supraleitung“. Eine atomistische Erklärung, die nach dem in Kap. 9 Gesagten nicht mehr im Rahmen einer Einelektronennäherung erfolgen kann, ließ dann fast ein halbes Jahrhundert auf sich warten. Erst kurz vor 1960 gelang Bardeen, Cooper und Schrieffer [10.2] der entscheidende Durchbruch mit einer nach ihnen benannten Theorie (BCS-Theorie). Nach einer kurzen Schilderung der Grundphänomene der Supraleitung soll in diesem Kapitel etwas vereinfacht gezeigt werden, wie wesentliche Eigenschaften der Supraleitung sich im Rahmen dieser BCS-Theorie verstehen lassen.
10.1 Einige Grundphänomene der Supraleitung Die namengebende Grundeigenschaft der Supraleitung wurde von Onnes [10.1] an Quecksilber entdeckt. Abbildung 10.1 zeigt die historische Messkurve: Beim Abkühlen unter etwa 4,2 K bricht der elektrische Widerstand der Quecksilberprobe zusammen. Er musste zu damaliger Zeit als unterhalb von 10–5 X angenommen werden. Es ist prinzipiell unmöglich, experimentell die Aussage zu überprüfen, ob der Widerstand Null ist; deshalb ist man natürlich auch heute nach Anwendung verfeinerter Messtechniken nur in der Lage, eine obere Grenze für den elektrischen Widerstand anzugeben. Die beste experimentelle Methode, die auch schon von Onnes neben Strom-Spannungsmessungen angewendet wurde, um kleinste
288
10. Supraleitung
Abb. 10.1. Originalmesskurve, mit der zum erstenmal 1911 das Phänomen der Supraleitung an Hg entdeckt wurde. Bei Abkühlung unter 4,2 K fällt der elektrische Widerstand unter die Messbarkeitsgrenze (damals *10–5 X). (Nach Onnes [10.1])
Widerstände zu messen, besteht darin, das Abklingen eines Stromes in einem geschlossenen supraleitenden Kreis zu messen: Mittels eines Magneten wird ein magnetischer Fluss durch eine Leiterschleife erzeugt, und dann wird der Ring unter die kritische Temperatur Tc abgekühlt, so dass er supraleitend wird. Wegziehen des Magneten ändert den Fluss durch den Ring und ein Ringstrom wird induziert. Wäre der Ring mit einem endlichen Widerstand R behaftet, so würde der Suprastrom gemäß I
t I0 exp
Rt=L
10:1
abklingen; L ist die Selbstinduktion der Schleife. Mit solchen und ähnlichen Versuchsanordnungen kann heute gezeigt werden, dass der Widerstand eines Metalls, das in den supraleitenden Zustand eintritt, mindestens um 14 Zehnerpotenzen abnimmt. Supraleitung ist nicht auf einige wenige chemische Elemente beschränkt; die Darstellung des Periodensystems in Abb. 10.2 zeigt, dass diese Eigenschaft bei vielen Elementen bekannt ist. Sowohl Nichtübergangsmetalle wie Be und Al als auch Übergangsmetalle wie Nb, Mo und Zn zeigen den Effekt. Halbleiter wie Si, Ge, Se und Te nehmen bei hohen Drücken eine metallische Phase an und werden dann bei tiefen Temperaturen auch supraleitend. Supraleitung kann also von der Kristallstruktur abhängen. Dies zeigt auch der Fall des Bi, wo mehrere Modifikationen Supraleitung von verschiedenen Sprungtemperaturen ab zeigen, während eine andere Modifikation bis zu 10–2 K hinab den Effekt nicht zeigt. Auch der kristalline Aufbau ist keine notwendige Voraussetzung. Gerade „amorphe“ und polykristalline supraleitende Proben, die durch abschrekkende Kondensation auf gekühlten Substraten hergestellt werden, spielen in der aktuellen Forschung eine große Rolle. Hinzu kommt, dass eine große Anzahl von Legierungen Supraleitung zeigt, wobei z. B. Nb3Al0,75Ge0,25 eine relativ hohe Übergangstemperatur von 20,7 K besitzt. Am faszinierendsten erscheinen zur Zeit oxidische
10.1 Einige Grundphänomene der Supraleitung
289
Abb. 10.2. Überblick über das Periodensystem der Elemente. Bis jetzt bekannte Supraleiter sind mit Angabe der Sprungtemperatur Tc (in K) getönt dargestellt. Dunkle Tönung bedeutet, dass das entsprechende Element nur in einer Hochdruckphase supraleitend ist
Supraleiter, bestehend z. B. aus den Komponenten Ba-Y-Cu-O, die extrem hohe Sprungtemperaturen im Bereich von 100 K haben (Abschn. 10.10). Es fällt weiter auf, dass bei ferromagnetischen Materialien wie Fe, Co, Ni (Abb. 10.2) keine Supraleitung gefunden wurde. Der starke Ferromagnetismus wird heute dafür als Ursache angesehen und wir werden in Abschn. 10.6 sehen, dass starke Magnetfelder zerstörend auf die Supraleitung wirken. Es sei noch einmal betont, dass im allgemeinen der Übergang eines Metalls von seinem normalleitenden Zustand in den eines Supraleiters nichts mit einer kristallografischen Strukturänderung zu tun hat; auch geht keine ferromagnetische, ferrimagnetische oder antiferromagnetische Umordnung damit einher. Dies lässt sich z. B. durch Streuexperimente mit Röntgenstrahlen, Elektronen und Neutronen (Tafel I) beweisen. Andererseits findet beim Übergang vom Normalzustand in den Supraleitungszustand eine thermodynamische Zustandsänderung, eine Phasenänderung, statt, die sich auch in anderen physikalischen Größen klar zeigt. Die Abhängigkeit der spezifischen Wärme von der Temperatur z. B. ändert sich sprunghaft bei der Übergangstemperatur Tc. Abbildung 10.3 zeigt dies für das Beispiel des Al mit einer Übergangstemperatur von 1,19 K. Die spezifische Wärme cn eines normalleitenden Metalls setzt sich aus einem gitterdynamischen Anteil cng und einem elektronischen Anteil cne zusammen. Nach (6.51) gilt cn cne cng cT bT 3 :
10:2
Im normalleitenden Zustand (n) ergibt sich deshalb bei tiefen Temperaturen ein stetiger Verlauf von cn ähnlich wie in Abb. 6.8. Beim Übergang in den supraleitenden Zustand (bei Tc ) nimmt die spezifische Wärme sprunghaft zu, um dann bei sehr niedrigen Temperaturen unter den Wert der Normalphase abzusinken. Üblicherweise
290
10. Supraleitung
Abb. 10.3. Spezifische Wärme von normalleitendem (cn) und supraleitendem (cs) Aluminium. Unterhalb der Sprungtemperatur Tc ist die normalleitende Phase durch Anlegen eines schwachen Magnetfeldes von 300 G erzeugt worden. (Nach Phillips [10.3])
nimmt man an, dass beim Übergang in den supraleitenden Zustand der gitterdynamische Anteil cng unverändert bleibt. Eine genauere Analyse zeigt dann, dass der elektronische Anteil cne * T im Supraleiter durch einen Anteil zu ersetzen ist, der weit unterhalb der kritischen Temperatur exponentiell abklingt: cse exp
A=k T :
10:3
Eine weitere, markante Besonderheit zeigt sich in den magnetischen Eigenschaften eines Supraleiters. Das magnetische Verhalten eines Materials, das in den supraleitenden Zustand eintritt, lässt sich nicht allein aus den Maxwell-Gleichungen mit der zusätzlichen Forderung eines verschwindenden elektrischen Widerstandes (R ? 0) erklären: Dazu ist in Abb. 10.4 a schematisch angedeutet, wie sich ein idealer Leiter, bei dem nur R = 0 unterhalb einer kritischen Sprungtemperatur Tc gefordert wird, verhalten würde, wenn er in einem äußeren Magnetfeld Ba abgekühlt wird, d. h. wenn er im Magnetfeld seinen Widerstand verliert. Für einen gedachten, geschlossenen Umlauf (Fläche F ) im Material muss gelten
_ F: i R U< rot E df B
10:4 F
Verschwindender Widerstand bedeutet dann, dass der magnetische Fluss B·F durch den geschlossenen Umlauf sich nicht ändern darf, dass also das Magnetfeld im Inneren des Materials sowohl beim Abkühlen als auch beim Abschalten des äußeren Feldes Ba bestehen bleibt. Beim Abschalten von Ba im gekühlten Zustand geschieht dies deshalb, weil durch den Abschaltvorgang im Inneren des Materials Dauerströme induziert werden, die das Magnetfeld im Inneren aufrechterhalten. Würde ein solcher Leiter im feldfreien Raum (Ba = 0) unter Tc abgekühlt und dann das äußere Feld Ba angeschaltet, so müsste wegen R = 0 das Innere des Materials feldfrei bleiben – wiederum durch die Wirkung von abschirmenden, in-
10.1 Einige Grundphänomene der Supraleitung
291 Abb. 10.4. Magnetisches Verhalten eines idealen Leiters (A) und eines Supraleiters (B). (a) Beim idealen Leiter hängt der Endzustand (d) oder (g) davon ab, ob die Probe zuerst unter Tc abgekühlt und dann das Magnetfeld Ba eingeschaltet wurde oder ob umgekehrt im Ba-Feld abgekühlt wurde: (a ? b )-Probe verliert Widerstand durch Abkühlen bei abgeschaltetem Magnetfeld. (c) Anlegen des Ba-Feldes an widerstandslose Probe. (d) Ba-Feld abgeschaltet. (e ? f)-Probe verliert Widerstand im Magnetfeld. (g) Magnetfeld Ba abgeschaltet. (b) Beim Supraleiter ergeben sich gleiche Endzustände (d) und (g) unabhängig von der Reihenfolge zwischen Anlegen des Magnetfeldes Ba und Abkühlen der Probe: (a ? b)-Probe verliert Widerstand bei abgeschaltetem Magnetfeld. (c) Anlegen des Ba-Feldes an supraleitende Probe. (d) Ba-Feld abgeschaltet. (e ? f)-Probe wird supraleitend im angelegten Magnetfeld Ba . (g) Magnetfeld Ba abgeschaltet
duzierten Dauerströmen. Nach Abschalten von Ba im gekühlten Zustand bleibt das Innere des Materials nun feldfrei. Ein idealer Leiter im Sinne von (10.4) könnte also für Ba = 0 und T < Tc zwei verschiedene Zustände, mit und ohne Feld im Inneren, einnehmen, je nachdem wie der Weg war, auf dem dieser Zustand erreicht wurde. Wäre ein Supraleiter nur ein „idealer Leiter“, so wäre also der supraleitende Zustand kein Zustand im Sinne der Thermodynamik. Tatsächlich gilt für den Supraleiter nicht nur B_ = 0 sondern auch B = 0 unabhängig vom Weg, auf dem der Zustand erreicht wurde. Ein Supraleiter verhält sich, wie in Abb. 10.4 b angedeutet ist. Dieser Effekt, der eine vom verschwindenden Widerstand (R = 0) unabhängige Eigenschaft des Supraleiters darstellt, heißt nach ihren Entdeckern „Meissner-Ochsenfeld-Effekt“ [10.4]. Der magnetische Zustand eines Supraleiters kann wegen des Meissner-Ochsenfeld-Effektes als idealer Diamagnetismus beschrieben werden, bei dem permanente Oberflächenströme im Inneren eine Magnetisierung M = –Ha aufrechterhalten, die dem außen anliegenden Magnetfeld Ha genau entgegengesetzt ist. Wenn an einem Supraleiter bei einer Temperatur T < Tc ein äußeres Magnetfeld angeschaltet wird, so wird ein gewisser Energieanteil verbraucht, um diese Supraströme zu induzieren, die das Innere der Probe magnetisch feldfrei halten. Steigert man die Magnetfeldstärke Ha, so wird es von einer kritischen Feldstärke Hc an energetisch günstiger für das Material, in die normalleitende Phase überzugehen, bei der das Magnetfeld dann in das Material eindringt. Dieser Übergang ist zwar mit einer Erhöhung der freien Energie (siehe spezifische Wärme in Abb. 10.3) verbunden, aber eine zu
292
10. Supraleitung
Abb. 10.5. Qualitative Darstellung des Phasendiagramms eines Supraleiters. Die Phasengrenze zwischen supraleitendem und normalleitendem Zustand ist durch die kritische Magnetfeldstärke Hc (T) gegeben
starke Erhöhung des Feldes Ha würde zu einem noch höheren Energieaufwand bei der Induktion der Abschirmströme führen. Es existiert also eine obere kritische magnetische Feldstärke Hc, die wiederum von der Temperatur abhängt, über die hinaus die supraleitende Phase nicht mehr existiert. Qualitativ stellt sich also das Phasendiagramm eines Supraleiters in Abhängigkeit von der Temperatur T und äußerem Magnetfeld wie in Abb. 10.5 dar.
10.2 Phänomenologische Beschreibung durch London-Gleichungen Eine rein phänomenologische Beschreibung der Supraleitung, d. h. insbesondere der in Abschn. 10.1 geschilderten Erscheinungen, zwingt zu einer Abänderung der bekannten Materialgleichungen der Elektrodynamik. Diese Beschreibung, die keine atomistische Erklärung der Supraleitung darstellt, wurde zum erstenmal von London und London [10.5] vorgeschlagen. Die Eigenschaft eines Supraleiters, einen verschwindenden spezifischen Widerstand R = 0 zu haben, wird im Rahmen der klassischen Bewegungsgleichung von Elektronen in einem äußeren Feld E (9.42) durch Weglassen des „Reibungsterms“ m mD/s erzielt, so dass für supraleitende Elektronen gilt mv_
eE :
10:5
Für die Stromdichte js = –e ns v der supraleitenden Elektronen (Dichte ns) folgt damit die sog. 1. Londonsche Gleichung 2
ns e E :
10:6 j_s m Damit folgt aus der Maxwellschen Gleichung rot E = – B_ die Beziehung @ m rot j B 0:
10:7 s @t ns e2
10.2 Phänomenologische Beschreibung durch London-Gleichungen
293
Diese Gleichung beschreibt zwar das Verhalten eines idealen Leiters
R 0, aber noch nicht den im Meissner-Ochsenfeld-Effekt gefundenen idealen Diamagnetismus eines Supraleiters, d. h. das „Hinausdrücken“ eines Magnetfeldes. Aus (10.7) folgt nämlich lediglich wie aus (10.4), dass der magnetische Fluss durch eine Leiterschleife konstant bleibt. Integration von (10.7) liefert eine Integrationskonstante. Setzt man diese gleich Null, dann folgt die zweite Londonsche Gleichung, mit deren Hilfe der Meissner-Ochsenfeld-Effekt richtig beschrieben wird. ns e2 B: m
rot js
10:8
Es sei noch einmal betont, dass (10.8) unter zwei Voraussetzungen abgeleitet wurde: (1) R verschwindet und (2) Integrationskonstante von (10.7) verschwindet. Zur Beschreibung eines Supraleiters im Magnetfeld haben wir nun mit der Abkürzung m
10:9 kL ns e2 folgendes Gleichungssystem zur Verfügung: 1) Die beiden London-Gleichungen
E
kL j_s ;
B
10:10 a
kL rot js ;
10:10 b
und 2) zusätzlich die Maxwell-Gleichung rot H js
bzw:
rot B l0 js :
10:11
(10.10) ersetzt für den Supraleiter das Ohmsche Gesetz des Normalleiters. Aus der Kombination von (10.11) mit (10.10) folgen l0 B
10:12 a rot rot B l0 rot js kL 1 l0 rot rot js rot B j ; bzw:
10:12 b kL s kL l0 B0;
10:13 a DB kL l0 j 0:
10:13 b D js kL s Für das zweidimensionale Problem eines halbunendlichen Supraleiters in einem im Vakuum homogenen Magnetfeld B = (Bx, 0, 0), wie in Abb. 10.6 dargestellt, gilt dann @ 2 Bx @z2
l0 Bx 0 ; kL
10:14 a
294
10. Supraleitung
Abb. 10.6. Halbunendlicher Supraleiter (z > 0) in einem Magnetfeld, das im Vakuum (z < 0) homogen ist
@ 2 js y @z2
l0 js y 0 : kL
Wegen (10.11) hat js die Darstellung (0, js y , 0). Die Lösungen dieser Gleichungen p Bx B0x exp l0 =kL z B0x exp
z=KL ; p js y j 0s y exp l0 =kL z j 0s y exp
z=KL
10:14 b
10:15 a
10:15 b
zeigen, dass einmal das Magnetfeld in den Supraleiter eindringt, ins Innere hinein jedoch über die sog. London-Eindringtiefe p KL m= l0 ns e2
10:16 exponentiell abklingt. Zum anderen klingen auch die supraleitenden Ströme, die das Innere des Supraleiters gegen das äußere Magnetfeld abschirmen, in den Supraleiter hinein exponentiell ab. Für eine größenordnungsmäßige Abschätzung der Londonschen Eindringtiefe setzt man für m die Elektronen-Elementarmasse und für ns die Atomdichte, d. h. jedes Atom liefert dann ein supraleitendes Elektron. Für Sn z. B. wird damit KL = 260 Å. Es ist ein wesentliches Element der atomistischen Theorie der Supraleitung, dass nicht einzelne Elektronen, sondern Elektronenpaare, sog. Cooper-Paare, den Stromtransport tragen. Dem könnte man in den Londonschen Gleichungen Rechnung tragen, indem man statt auf ns auf ns/2, die halbe Elektronendichte, bezieht. Da die London-Gleichungen insbesondere den Meissner-Ochsenfeld-Effekt gut beschreiben, sollte eine atomistische Theorie der Supraleitung in der Lage sein, u. a. eine Gleichung des Typs (10.10 b) zu liefern; dies und eine Erklärung des verschwindenden Widerstandes bei genügend kleinen Temperaturen (T < Tc) ist das zentrale Anliegen der schon erwähnten BCS-Theorie. Da es sich bei der Supraleitung offenbar um ein weitverbreitetes Phänomen handelt, muss auch die Theorie genügend allgemein sein; sie darf also nicht an spezielle Eigenschaften eines Metalls geknüpft sein. In den beiden folgenden Abschnitten werden wesentliche Grundzüge der atomistischen Theorie der Supraleitung in einer etwas vereinfachten Darstellung behandelt.
10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare
295
10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare Aus den besprochenen, grundlegenden Experimenten zum Phänomen der Supraleitung folgt, dass es sich um eine neue Phase des Elektronengases im Metall handeln muss, der die ungewöhnliche Eigenschaft „unendlich hoher“ Leitfähigkeit zukommt. Wesentlich zum Verständnis dieser neuen Phase trug bei, dass Cooper [10.6] 1956 erkannte, dass der in Abschn. 6.2 beschriebene Grundzustand (T = 0 K) eines Elektronengases zusammenbricht, wenn eine auch noch so schwache attraktive Wechselwirkung zwischen je zwei Elektronen zugelassen wird. Als eine solche Wechselwirkung war schon von Fröhlich [10.7] die Wechselwirkung über Phononen diskutiert worden. Auf seinem Weg durch den Festkörper hinterlässt ein Elektron aufgrund seiner negativen Ladung eine Deformationsspur der Ionenrümpfe. Diese Spur mit einer Anhäufung positiver Ladung der Ionenrümpfe wirkt auf ein zweites Elektron attraktiv, so dass über die Gitterdeformation eine schwache Anziehung zwischen je zwei Elektronen zustande kommt (Abb. 10.7 a). Die hierdurch gegebene attraktive Elektron-Elektron-Wechselwirkung ist wegen der langsameren Bewegung der Ionen gegenüber der Coulomb-Abstoßung zwischen den Elektronen retardiert; im Moment des Vorbeifliegens eines Elektrons erhalten die Ionen einen Kraftstoß, der erst nach
Abb. 10.7 a, b. Schematische Veranschaulichung der phononinduzierten ElektronElektron-Wechselwirkung, die zur Bildung von Cooper-Paaren führt. (a) Ein durch das Kristallgitter fliegendes Elektron (e–) hinterlässt eine Deformationsspur, die sich (stark übertrieben) als Verdichtung der positiv geladenen Rümpfe, d. h. also der Netzebenen beschreiben lässt. Dies bedeutet, dass hinter dem Elektron ein Gebiet mit erhöhter positiver Ladung (im Vergleich zum sonst neutralen Kristall) auftritt, das anziehend auf ein zweites Elektron wirkt. (b) Qualitative Entwicklung der Auslenkung der Rümpfe, die hinter dem 1. Elektron die Gitterdeformation bilden. Gegenüber der hohen Elektronengeschwindigkeit v F (*108 cm/s) folgt das Gitter nur sehr langsam, es erreicht seine maximale Deformation bei einer Entfernung v F 2 p/xD hinter dem Elektron, die gegeben ist durch die typische Phononenfrequenz xD (Debye-Frequenz). Die Kopplung der beiden Elektronen im Cooper-Paar geschieht also über Entfernungen von mehr als 1000 Å, über die die Coulomb-Abstoßung weitgehend abgeschirmt ist
296
10. Supraleitung
dem Passieren des Elektrons zu einer Bewegung der Ionen und damit zu einer Polarisation des Gitters führt (Abb. 10.7 b). Die Gitterdeformation erreicht ihr Maximum bei einer Entfernung vom Aufelektron, die durch die Elektronengeschwindigkeit (Fermi-Geschwindigkeit v F*108 cm/s) und die Phonon-Schwingungsdauer (2p/xD*10–13 s) abgeschätzt werden kann. Die beiden über die Gitterdeformation korrelierten Elektronen haben so einen größenordnungsmäßigen Abstand von 1000 Å. Dies entspricht natürlich der geometrischen Ausdehnung eines Cooper-Paares, die in Abschn. 10.7 auf andere Weise abgeschätzt wird. Die enorm hohe Reichweite der über Gitterdeformation vermittelten Elektronenkorrelation erklärt weiter, warum die Coulomb-Abstoßung keine merkliche Rolle mehr spielt; sie wird über Entfernungen von einigen Ångström abgeschirmt. Quantenmechanisch lässt sich die Gitterdeformation als die Überlagerung der Phononen verstehen, die das Elektron durch seine Wechselwirkung mit dem Gitter ständig emittiert und absorbiert. Damit der Energiesatz nicht verletzt wird, dürfen die die Gitterdeformation konstituierenden Phononen nur während einer durch die Unschärferelation bestimmten Zeitspanne s = 2p/x existieren, um danach wieder von Elektronen „eingefangen“ zu werden. Man spricht deshalb auch von „virtuellen“ Phononen. Der Grundzustand des nicht wechselwirkenden Fermi-Gases der Elektronen im Potentialtopf (Kap. 6) ist dadurch gegeben, dass alle Einelektronenzustände mit Wellenvektor k bis zur Fermi-Kante E 0F (T = 0 K) = h 2 k 2F/2 m aufgefüllt sind und alle Zustände mit E > E 0F unbesetzt sind. Wir machen jetzt ein Gedankenexperiment und fügen diesem System zwei Elektronen [k1, E (k1)] und [k2, E (k2)] auf Zuständen gerade oberhalb von E 0F hinzu. Zwischen diesen beiden Elektronen soll die beschriebene schwache attraktive Wechselwirkung vermöge Phononenaustausch „eingeschaltet“ sein. Alle anderen Elektronen im Fermi-See sollen weiterhin als nicht wechselwirkend angenommen werden; sie sollen wegen des Ausschließungsprinzips eine weitere Besetzung der Zustände mit
Abb. 10.8. Veranschaulichung von Elektron-Paarstößen (im reziproken Raum der Wellenzahlen), bei denen k1 k2 k01 k02 K konstant bleibt. Zwei Kugelschalen mit Fermi-Radius kF und Dicke Dk beschreiben die Paare von Wellenvektoren k1 und k2. Alle Paare, für die k1+k2 = K gilt, enden im schattierten Volumen (rotationssymmetrisch um K ). Die Zahl dieser Paare k1, k2 ist proportional zu diesem Volumen im k-Raum. Ein Maximum ergibt sich für K = 0
10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare
297
jkj < kF verhindern. Beim Phononenaustausch wechseln die beiden Elektronen beständig ihre Wellenzahlvektoren, wobei der Erhaltungssatz k1 k2 k01 k02 K
10:17
gelten muss. Wegen der Beschränkung der Wechselwirkung im kRaum auf eine Schale der Energiebreite h xD (mit xD = Debye-Frequenz) oberhalb von E 0F sind alle möglichen k-Zustände durch die schattierte Fläche in Abb. 10.8 gegeben. Diese Fläche und damit die Anzahl der die Energie absenkenden Phononenaustauschprozesse – d. h. die Stärke der anziehenden Wechselwirkung – wird maximal für K = 0. Es genügt also, im weiteren nur den Fall k1 = –k2= k, d. h. Elektronenpaare mit entgegengesetztem Wellenzahlvektor, zu betrachten. Die zugehörige Zweiteilchen-Wellenfunktion w (r1, r2) muss der Schrödinger-Gleichung h2
D1 D2 w
r1 ; r2 V
r1 ; r2 w
r1 ; r2 2m Ew
r1 ; r2
e 2EF0 w
r1 ; r2 :
10:18
gehorchen. e ist die Energie des Elektronenpaares, bezogen auf den wechselwirkungsfreien Zustand
V 0, bei dem jedes der beiden Elektronen an der Fermi-Kante eine Energie E 0F = h 2 k 2F/2 m besitzen würde. Die Zweiteilchenwellenfunktion setzt sich in diesem Fall aus zwei ebenen Wellen zusammen: 1 i k1 r1 1 i k2 r2 1 p e p e 3 ei k
r1 r2 :
10:19 3 3 L L L Die allgemeinste Darstellung der Zweiteilchenfunktion für den Fall nichtverschwindender Wechselwirkung (V j 0) lässt sich als Entwicklung darstellen: 1X g
kei k
r1 r2 :
10:20 w
r1 r2 3 L k Sie hängt nur noch von der Relativkoordinate r = r1– r2 ab. Hierbei läuft die Summe nur über solche Paare k = k1 = – k2, die wegen der Beschränkung der Wechselwirkung auf das Gebiet h xD (Abb. 10.9) der Bedingung h2 k2 < EF0 hxD
10:21 a 2m gehorchen. In Abb. 10.9 ist anders als in der hier benutzten Einschränkung (10.21 a) die Wechselwirkung in einer Schale 2 h xD symmetrisch um EF herum angenommen, so wie es in der Vielteilchenbeschreibung des BCS-Grundzustandes (Abschn. 10.4) erforderlich ist. jg
kj2 ist die Wahrscheinlichkeit, ein Elektron im Zustand k und das andere in –k, – d. h. das Elektronenpaar in (k, –k) – zu finden. Wegen des Pauli-Prinzips und wegen der Bedingung (10.21 a) gilt EF0 <
298
10. Supraleitung
Abb. 10.9. Veranschaulichung der einfachsten in der BCS-Theorie angenommenen anziehenden Wechselwirkung zwischen zwei Elektronen, die zur Cooper-Paarung führt: Das Wechselwirkungspotential ist im schattierten Bereich des k-Raumes, d. h. zwischen den Energieschalen E 0F + h xD und E 0F – h xD als konstant (= –V0) angenommen. xD ist die Debye-Frequenz des Materials
( g
k 0 fur
k < kq F k > 2m
EF0 hxD =h2 :
10:21 b
Einsetzen von (10.20) in (10.18), Multiplikation mit exp (–i k '·r ) und Integration über das Normierungsvolumen ergibt h2 k2 1X g
k 3 g
k0 Vkk0
e 2EF0 g
k :
10:22 m L k0 Hierbei beschreibt das Wechselwirkungsmatrixelement 0 Vkk0 V
re i
k k r dr
10:23
Stöße des Elektronenpaares von
k; k nach
k0 ; k0 und umgekehrt. Im einfachsten Modell wird dieses Matrixelement Vkk0 als unabhängig von k und attraktiv angenommen, also Vkk0 < 0: 8 2 2 < h k h2 k02 0 < EF0 hxD : V
V > 0 f u r E < ; 0 0 F Vkk0 2m 2m : 0 sonst: (10.24) Damit folgt aus (10.22) 2 2 h k 0 e 2EF g
k A ; wo
10:25 a m V0 X A 3 g
k0
10:25 b L k0 unabhängig von k ist. Nach Summation von (10.25 a) über k folgt durch Vergleich mit (10.25 b) aus Konsistenzgründen V0 X 1 :
10:26 1 3 L k e h2 k2 =m 2EF0 Wir nennen n = h 2 k 2/2 m–E 0F und ersetzen die Summe über die Paarzustände k durch ein Integral über den k-Raum (L –3 åk )
10.3 Instabilität des „Fermi-Sees“ und Cooper-Paare
299
dk/4 p 3); hierbei berücksichtigen wir, dass nur über eine Energieschale der Dicke h xD E 0F integriert wird, in der die Zustandsdichte des freien Elektronengases (6.11)
2m3=2 0
EF n1=2 D
EF0
10:27 2p2 h3 als fast konstant [& D (E0F)] angenommen werden kann. Da wir über Paarzustände (k, –k) integrieren, muss die halbe Zustandsdichte Z (E0F) = D (E0F)/2 an der Fermi-Kante genommen werden, d. h. aus (10.26) folgt
D
EF0 n
h
xD
1
V0 Z
EF0
1 2n
0
e
10:28
dn
und nach Integration 1 e 2 hxD 1 V0 Z
EF0 ln e 2 2hxD e : 1 exp2=V0 Z
EF0
bzw:
10:29 a
10:29 b
Für den Fall schwacher Wechselwirkung V0 Z
EF0 1 folgt so e
2hxD e
2=V0 Z
EF0
:
10:30
Es existiert also ein gebundener Zweielektronenzustand, dessen Energie gegenüber dem voll besetzten Fermi-See (T = 0) um e = E–2 E 0F < 0 abgesenkt ist. Der Grundzustand des in Abschn. 6.2 behandelten nicht-wechselwirkenden freien Elektronengases wird also instabil bei „Einschalten“ einer noch so kleinen attraktiven Wechselwirkung zwischen den Elektronen. Es sei noch einmal darauf hingewiesen, dass die Energieabsenkung e (10.30) aus einem Gedankenexperiment resultiert, bei dem der Fermi-See für Zustände mit h 2 k 2/2 m < E 0F als fixiert angenommen wurde und nur die Wirkung der Attraktion auf zwei zusätzliche Elektronen in Gegenwart des Fermi-Sees betrachtet wurde. In Wirklichkeit wird die Instabilität dazu führen, dass sich eine hohe Dichte solcher Elektronenpaare, sog. Cooper-Paare (k, –k), bildet und das System einem neuen Grundzustand niedrigerer Energie zustrebt. Dieser neue Grundzustand ist identisch mit der supraleitenden Phase, wie sich zeigen wird. Für die vorangehende Betrachtung war wesentlich, dass für beide Elektronen in bezug auf die Zustände in der Fermi-Kugel das Pauli-Prinzip gilt. Da der Ansatz für die Zweiteilchenwellenfunktion (10.19) in den Ortskoordinaten (r1, r2) symmetrisch gegenüber einer Vertauschung der Elektronen 1 und 2 war, die Gesamtwellenfunktion einschließlich der Spins aber antisymmetrisch sein muss (allgemeinste Formulierung des Pauli-Prinzips), ist der in (10.19) nicht dargestellte Spinanteil antisymmetrisch. Das Cooper-Paar besteht also aus zwei Elektronen mit entgegengesetztem Wellenvek-
300
10. Supraleitung
tor und entgegengesetztem Spin
k "; k #. Die Pfeile bezeichnen dabei die entgegengesetzten Spineinstellungen. Man spricht in diesem Zusammenhang auch oft von Singulett-Paaren. Es sei darauf hingewiesen, dass die Annahme komplizierterer Elektron-ElektronKopplungen auch zu spinparalleler Paarbildung, sog. Tripletts, führen könnte. Solche Modelle werden diskutiert. Experimentelle Belege für die Existenz stehen jedoch aus. Triplett-Paare sind jedoch in flüssigem 3He gefunden worden. Bei tiefen Temperaturen verhält sich dieses System wie ein entartetes Fermi-Gas.
10.4 Der BCS-Grundzustand In Abschn. 10.3 haben wir gesehen, dass durch die schwache attraktive Wechselwirkung, die aus der Elektron-Phonon-Wechselwirkung resultiert, eine Paarung zu „Cooper-Paaren“ erfolgt. Die Energieabsenkung, die der Fermi-See durch Bildung eines einzigen Paares erfährt, wurde in (10.29) ausgerechnet. Ein solches CooperPaar muss man sich vorstellen als ein Elektronenpaar, in dem die beiden Elektronen andauernd Zustände
k "; k #,
k0"; k0#, usw. mit entgegengesetztem k-Vektor und Spin besetzen. Das Matrixelement Vkk0 (10.23) vermittelt diese Art der Wechselwirkung, beschreibt also Paarstöße von
k "; k # nach
k0"; k0#, die zu der Energieabsenkung bei Bildung eines Cooper-Paares führen (Abb. 10.10). Infolge der Energieabsenkung werden sich immer mehr Cooper-Paare bilden. Da jedoch eine Anregung über E 0F hinaus erforderlich ist, ist mit der Paarung auch eine Zunahme an kinetischer Energie verbunden. Der neue Grundzustand des FermiSees, der sich bei der Paarbildung einstellt, wird demnach durch ein kompliziertes Wechselspiel zwischen den Elektronen erreicht. Die Gesamtenergieabsenkung ergibt sich nicht durch einfache Summation von Beiträgen (10.29) einzelner Cooper-Paare. Der Effekt jedes einzelnen Cooper-Paares hängt von den schon vorhande-
Abb. 10.10. Veranschaulichung eines Stoßes eines Elektronenpaares mit den Wellenvektoren (k, –k) nach (k', –k')
10.4 Der BCS-Grundzustand
301
nen ab. Es muss also für die Gesamtheit aller möglichen Paarbildungen das Minimum der Gesamtenergie (Grenzfall T = 0 K) des Systems unter Berücksichtigung des kinetischen Einelektronenanteils und der durch die „Paarstöße“, d. h. die Elektron-PhononWechselwirkung, vermittelten Energieabsenkung aufgesucht werden. Der kinetische Anteil lässt sich sofort angeben: Es sei wk die Wahrscheinlichkeit, dass der Paarzustand
k "; k # besetzt ist, und wie in Abschn. 10.3 seien alle Einteilchenenergien nk auf das Fermi-Niveau bezogen, d. h. nk = E (k)–E 0F = (h2 k2/2 m)–E 0F. Dann gilt für den kinetischen Anteil Ekin X Ekin 2 wk nk :
10:31 k
Die totale Energieabsenkung, die durch Paarstöße
k "; k # !
k0"; k0# zustande kommt, errechnen wir am einfachsten über einen Hamilton-Operator H , der explizit der Tatsache Rechnung trägt, dass bei „Vernichtung“ eines Paares
k "; k # und „gleichzeitiger Erzeugung“ eines Paares
k0"; k0#, d. h. einer Streuung von
k "; k # nach
k0"; k0#, eine Energieabsenkung um Vkk0 eintritt (Abschn. 10.3). Da ein Paarzustand k entweder besetzt oder unbesetzt sein kann, wählen wir eine Darstellung durch zwei zueinander orthogonale Zustände j1ik und j0ik: j1ik ist der Zustand, bei dem
k "; k # besetzt ist, j0ik der Zustand der Nichtbesetzung. Der allgemeinste Zustand des Paares
k "; k # ist also gegeben durch jwk i uk j0ik v k j1ik :
10:32
Dies ist eine andere Darstellung der Cooper-Paar-Wellenfunktion (10.19). wk = v 2k ist hierbei die Wahrscheinlichkeit, dass der Paarzustand besetzt ist und 1–wk = u 2k die Nichtbesetzungswahrscheinlichkeit. Die Wahrscheinlichkeitsamplituden v k und uk werden als reell angenommen. Wie in ausführlicheren theoretischen Darstellungen gezeigt wird, ist diese Einschränkung unwesentlich. In der Darstellung (10.32) ergibt sich näherungsweise für den Grundzustand des Vielteilchensystems aller Cooper-Paare der Gesamtzustandsvektor als Produkt der Zustandsvektoren der einzelnen Paare Y jyBCS i '
uk j0ik v k j1ik :
10:33 k
Die Näherung besteht darin, dass der Vielteilchenzustand durch nichtwechselwirkende Paare beschrieben wird, Wechselwirkungen zwischen den Paaren im Zustandsvektor also vernachlässigt werden. Das „Erzeugen“ oder „Vernichten“ eines Cooper-Paares k in der zweidimensionalen Darstellung 1 0 j1ik ; j0ik
10:34 0 k 1 k lässt sich durch die Pauli-Matrizen
302
1
rk
10. Supraleitung
0 1 1 0
k
;
2
rk
0 i
i 0
k
10:35
wie folgt darstellen: Der Operator
1
2
1 r k 2
rk i rk
10:36 a
verwandelt den Zustand der Nichtbesetzung j0ik in den der Besetzung j1ik , während
1
rk 12
rk
2
i rk
10:36 b
den Zustand j1ik in j0ik überführt; d. h. aus den Darstellungen (10.34–10.36) folgen die Eigenschaften r k j1ik 0 ; rk j1ik j0ik ;
r k j0ik j1ik ;
10:37 a
rk j0ik 0 :
10:37 b
Die Matrizen r +k und r–k sind formal identisch mit den in Abschn. 8.7 eingeführten Spinoperatoren. Ihre physikalische Interpretation als „Erzeuger“ und „Vernichter“ von Cooper-Paaren ist jedoch völlig verschieden von der in Abschn. 8.7, wo das Umklappen eines Spins beschrieben wurde. Bei Streuung von
k "; k # nach
k0"; k0# tritt nun eine Energieabsenkung um Vkk0 auf. Dieses Wechselwirkungsmatrixelement Vkk0 wird im einfachen BCS-Modell der Supraleitung wie in Abschn. 10.3 als unabhängig von k, k ', d. h. als konstant, angenommen. Die Wechselwirkung soll nur in einer Kugelschale der Dicke 2 h xD symmetrisch um E 0F herum, d. h. in [E 0F –h xD, E 0F +h xD] existieren. Bezogen auf das Normierungsvolumen L 3 des Kristalls setzen wir die Wechselwirkung gleich V0 /L 3. Der Streuprozess wird in der zweidimensionalen Darstellung als Vernichtung von k und Erzeugung von k ' beschrieben. Damit ergibt sich für den Operator, der die entsprechende Energieabsenkung beschreibt, ein Term –(V0 /L 3) r +k ' r –k. Die gesamte Energieabsenkung, die aus Paarstößen k ? k ' und k ' ? k resultiert, ergibt sich somit in Operatorschreibweise durch Summation über alle Stöße X1 1 V0 X H 3 V0 r r0:
10:38
r 0 rk rk rk0 k L3 kk0 k k L 2 kk0 Wegen der Beschränkung von V0 auf die Kugelschale ±h xD um E 0F herum erfaßt die Summe über k, k ' auch nur Paarzustände aus dieser Schale. In der Summe sind Stöße in beiden Richtungen berücksichtigt; durch Indexvertauschung folgt die rechte Seite von (10.38). Die durch Stöße bewirkte Energieabsenkung folgt störungstheoretisch als Erwartungswert des Operators H (10.38) im Zustand jyBCS i (10.33) des Vielteilchensystems
10.4 Der BCS-Grundzustand
303
hyBCS jH jyBCS i " # Y X V0 Y
up h0j v p h1j r
uq j0iq v q j1iq : k rk0 L3 p 0 q kk (10.39) Beim Ausrechnen von (10.39) beachte man, dass ein Operator r +k oder r–k nur auf Zustände j1ik und j0ik wirkt. Die Rechenvorschriften sind in (10.37) gegeben. Weiter folgen aus (10.34) die Orthonormalitätsrelationen k h1j1ik
1;
k h0j0ik
1;
k h1j0ik
0:
10:40
Damit ergibt sich hyBCS jH jyBCS i
V0 X v k uk0 uk v k0 : L3 kk0
10:41
Die Gesamtenergie des Systems der Cooper-Paare stellt sich damit nach (10.31 und 10.41) dar als X V0 X WBCS 2 v 2k nk v k uk v k0 uk0 :
10:42 L3 kk0 k Der sich bei T = 0 K einstellende BCS-Grundzustand des Systems der Cooper-Paare ist durch das Minimum W 0BCS der Energiedichte WBCS gegeben. Durch Minimieren von (10.42) nach den Wahrscheinlichkeitsamplituden uk und v k ergeben sich die Energie des Grundzustandes W 0BCS und die im Grundzustand vorliegenden Besetzungs- bzw. Nichtbesetzungswahrscheinlichkeiten wk = v 2k bzw. (1–wk ) = u 2k. Die Rechnung lässt sich wegen der Verknüpfung von v k und uk einfach durchführen, wenn man setzt p
10:43 a v k wk cos hk ; p uk 1 wk sin hk ; d: h:
10:43 b u2k v 2k cos2 hk sin2 hk 1
10:43 c
und nach hk minimalisiert. Damit schreibt sich die zu minimierende Größe X V0 X WBCS 2nk cos2 hk cos hk sin hk0 cos hk0 sin hk L3 kk0 k X 1 V0 X 2nk cos2 hk sin 2hk sin 2hk0 : 4 L3 kk0 k
10:44
Die Bedingung für das Minimum von WBCS lautet dann @WBCS @hk
2nk sin 2hk
V0 X cos 2hk sin 2hk0 0 ; L3 k0
bzw:
10:45 a
304
10. Supraleitung
nk tan 2hk
1 V0 X sin 2hk0 : 2 L3 k0
Man setzt V0 X V0 X uk0 v k0 3 sin hk0 cos hk0 ; D 3 L k0 L k0 q Ek n2k D2
10:45 b
10:46
10:47
und erhält über trigonometrische Beziehungen sin 2hk tan 2hk D=nk ; cos 2hk 2uk v k sin 2hk D=Ek ; v 2k
u2k
nk =Ek :
10:48
10:49
10:50
Damit ergibt sich für die Besetzungswahrscheinlichkeit wk = v 2k eines Paarzustandes
k "; k # im BCS-Grundzustand bei T = 0 K 0 1 1 nk 1B nk C A : 1 @1 q
10:51 wk v 2k Ek 2 2 2 2 nk D Die Funktion ist in Abb. 10.11 abgebildet. Sie hat bei T = 0 K (!) einen ähnlichen Verlauf wie die Fermi-Funktion bei einer endlichen Temperatur; eine genauere Analyse zeigt, wie die Fermi-Verteilung bei der endlichen Sprungtemperatur Tc. Man beachte, dass diese Darstellung von v 2k über Einteilchenzustände, d. h. mit scharfen Quantenzahlen k von Einteilchenzuständen, geschieht. Diese Darstellung ist dem Vielteilchenproblem nicht unbedingt angemessen, z. B. erkennt man in dieser Darstellung nicht die Energielücke, die sich im Anregungsspektrum des Supraleiters ergibt (siehe unten). Auf der anderen Seite erkennt man am Verlauf von v 2k, dass die Cooper-Paare, die zur Energieerniedrigung des Grundzustandes beitragen, aus Einteilchenwellenfunktionen eines k-Bereiches aufgebaut
Abb. 10.11. Darstellung der BCS-Besetzungswahrscheinlichkeit v 2k für CooperPaare in der Umgebung der Fermi-Energie E 0F. In der Darstellung der Energien als nk = E (k)–E 0F dient die Fermi-Energie als Referenzpunkt. Zum Vergleich ist auch die Fermi-Dirac-Verteilungsfunktion für normalleitende Elektronen bei einer Temperatur Tc (kritische Temperatur) gestrichelt eingezeichnet. Der Bezug wird über die BCS-Beziehung zwischen D (0) und Tc (10.67) hergestellt
10.4 Der BCS-Grundzustand
305
sind, der einer Energieschale von ±D um die Fermi-Energiefläche herum entspricht. Die Energie des supraleitenden BCS-Grundzustandes W 0BCS ergibt sich, indem man in WBCS – (10.42 bzw. 10.44) – die aus der Minimierung folgenden Beziehungen (10.48–10.51) einsetzt, d. h. es folgt X D2 0 WBCS nk
1 nk =Ek L3 :
10:52 a V0 k Die Kondensationsenergie der supraleitenden Phase ergibt sich, indem man von W 0BCS die Energie der normalleitenden Phase, d. h. 0 die P des Fermi-Sees ohne attraktive Wechselwirkung Wn abzieht. Die Rechnung lässt sich z. B. durchführen, jkj
k F
2
X k
F
nk
2
X k
u2k nk 2
X k>kF
v 2k nk
L3
D2 : V0
10:52 b
Hierbei stellt der erste Term gerade W 0n dar. Geht von der P man Summe im k-Raum zu einem Integral über
L 3 k ) dk=4p3 , so folgt nach Integration und bei Verwendung von (10.46–10.50) nach einiger Rechnung schließlich (Übung 10.6) 1 Z
EF0 D2 :
10:53 2 Es tritt also bei endlichem D immer eine Energieabsenkung beim Eintritt in den supraleitenden Zustand ein. D ist hierbei ein Maß für die Größe dieser Absenkung. Anschaulich lässt sich (10.53) so interpretieren, als ob die Z (E0F) D Elektronenpaare pro Volumen aus einem Bereich von D unterhalb der Fermi-Kante in einen Zustand bei D unterhalb von E 0F „kondensieren“. Hierbei gewinnen sie im Mittel eine Energie von D/2. Die entscheidende Bedeutung des Parameters D wird aus folgendem klar: Der erste Anregungszustand über dem BCS-Grundzustand besteht darin, dass ein Cooper-Paar durch äußeren Einfluss aufgebrochen wird. Hierbei wird ein Elektron aus
k " herausgestreut und es bleibt ein ungepaartes Elektron in
k # zurück. Um die hierzu nötige Anregungsenergie auszurechnen, schreiben wir die Grundzustandsenergie W 0BCS (10.52 a) um 0
WBCS
Wn0 =L3
306
10. Supraleitung
0 WBCS
X k
X k
2
nk
1
nk =Ek
Ek
u2k
v 2k
X k
D
Ek u2k v 2k
X
uk v k
k
2
X k
L3 D2 V0 X
X k
k
Ek
u2k
Ek u2k
1
u2k
L3 D2 X Ek v 2k
u2k V0 k
Ek v 4k :
L3 D2 V0
v 2k 2
v 2k
1 v 2k 1
L3 D2 V0
v 2k
10:54
Wenn
k0"; k0# durch ein Cooper-Paar besetzt ist, d. h. v 2k ' = 1 ist, dann erreicht man den ersten angeregten Zustand W 1BCS durch Aufbrechen des Paares, d. h. v 2k ' = 0, und damit X 1 2 Ek v 4k :
10:55 WBCS k j k0
Die nötige Anregungsenergie ergibt sich als Differenz der Energien des Anfangs- und Endzustandes zu q 1 0 0 DE WBCS WBCS 2Ek 2 n2k0 D2 :
10:56 Der erste Term n 2k ' unter der Wurzel beschreibt die kinetische Energie der beiden aus der Cooper-Paarung „herausgestreuten“ Elektronen. Er kann wegen nk0 h2 k02 =2m EF0 beliebig klein sein, d. h. die Anregung erfordert eine minimale endliche Energie DEmin 2D :
10:57
Das Anregungsspektrum des supraleitenden Zustandes besitzt also eine Lücke 2D, die dem „Aufbrechen“ eines Cooper-Paares entspricht. In (10.56) handelt es sich um die Anregungsenergie zweier Elektronen, die aus dem Aufbrechen des Cooper-Paares resultieren. Stellen wir uns vor, dass wir zum BCS-Grundzustand ein einziges Elektron hinzufügen, das natürlich dann keinen Partner zur Cooper-Paarung findet. Welche Energiezustände kann dieses Elektron einnehmen? Aufgrund von (10.56) schließen wir, dass die möglichen Zustände des so angeregten Systems durch Ek = (n2k+D2)1/2 gegeben sind. Das ungepaarte Elektron wird also bei nk = 0 mindestens auf einem Energieniveau sein, das um D über dem des BCSGrundzustandes liegt (Abb. 10.12). Es kann jedoch auch Zustände mit endlichem nk einnehmen; für n 2k D2 werden dann die Einelektronen-Energieniveaus q h2 k2 EF0
10:58 Ek n2k D2 nk 2m
10.4 Der BCS-Grundzustand
307
eingenommen, die genau die des freien Elektronengases (wie beim Normalleiter) sind. Für Energien weit oberhalb der Fermi-Energie (n2k D2 ) ergibt sich also das Zustandskontinuum des Normalleiters. Um in der Umgebung D um das Fermi-Niveau herum die Zustandsdichte für angeregte Elektronen Ds (Ek) im Supraleiter mit der des Normalleiters Dn (nk) (Abschn. 6.1) zu vergleichen, beachten wir, dass beim Phasenübergang keine Zustände verloren gehen dürfen, d. h. Ds
Ek dEk Dn
nk dnk :
10:59 a
Da nur eine Umgebung D um E 0F herum betrachtet wird, genügt es, Dn (nk) & Dn (E0F) = const anzunehmen, d. h. nach (10.56) folgt 8 Ek > dnk < q fur Ek > D 0
10:59 b Ds
Ek =Dn
EF Ek2 D2 dEk > : 0 fur Ek < D : Diese Funktion, die bei D einen Pol besitzt und, wie erwartet, für Ek D in die Zustandsdichte des Normalleiters übergeht, ist in Abb. 10.12 a dargestellt. Es sei noch einmal betont, dass die Darstellung in Abb. 10.12 nicht zum Ausdruck bringt, dass das Aufbrechen eines CooperPaares die Mindestenergie 2D beansprucht, sondern nur, dass das „Hinzufügen“ eines ungepaarten Elektrons zum BCS-Grundzustand die Besetzung von Einteilchenzuständen ermöglicht, die mindestens um D oberhalb der BCS-Grundzustandsenergie (bezogen auf
Abb. 10.12. (a) Zustandsdichte für angeregte Elektronen im Supraleiter Ds bezogen auf die im Normalleiter. Ek = 0 entspricht in der üblichen Auftragung dem FermiNiveau E 0F . (b) Vereinfachte Darstellung des Anregungsspektrums eines Supraleiters. Aufgetragen sind Einelektronenenergien Ek. Beim BCS-Grundzustand bricht das Einelektronenbild zusammen: Alle Cooper-Paare besitzen bei T = 0 ähnlich wie Bosonen ein- und denselben Grundzustand, der damit auch energetisch identisch mit dem chemischen Potential, d. h. der Fermi-Energie E 0F, ist. Das eingezeichnete Energieniveau ist somit formal als Vielteilchenenergie bezogen auf ein Elektron zu interpretieren (Gesamtenergie aller Teilchen geteilt durch Anzahl der Elektronen). Man beachte, dass zum Aufbrechen eines Cooper-Paares die Minimalenergie 2 D erforderlich ist
308
10. Supraleitung
ein Elektron) liegen. Die Zustandsdichte in der Nähe der Zustände minimaler Einteilchenenergien ist singulär (Abb. 10.12 b). Das „Hinzufügen“ von Elektronen zum BCS-Grundzustand kann im Experiment durch Injektion von Elektronen über eine nichtleitende Tunnelbarriere realisiert werden (Tafel IX). Solche Tunnelexperimente sind heute in der Supraleitungsforschung weit verbreitet. Ihre Beschreibung geschieht zweckmäßigerweise mit Hilfe der Darstellung in Abb. 10.12 b. Wir wollen jetzt die Lücke D bzw. 2D im Anregungsspektrum bestimmen. Dazu kombinieren wir (10.49) mit (10.46–10.47) und erhalten 1 V0 X D 1 V0 X D q : D
10:60 3 3 2 L k Ek 2 L k n2k D2 Wir ersetzen wie P in (10.26 bzw. 10.28) die Summe im k-Raum durch ein Integral (L 3 k ) dk=4p3 ), beachten jedoch, dass über Paarzustände aufsummiert wird, d. h. dass statt der Einteilchenzustandsdichte D (E0F+n) die Paarzustandsdichte Z
EF0 n 12 D
EF0 n zu nehmen ist. Ferner wird, anders als in Abschn. 10.3, über eine Kugelschale ± h xD symmetrisch um E 0F herum aufsummiert. Damit gilt V0 1 2
h
xD
hxD
Z
EF0 n dn : p n2 D2
10:61 a
Im Bereich [E 0F – h xD, E 0F + h xD], wo V0 nicht verschwindet, ändert sich Z (E0F+n) nur schwach, so dass wegen der Symmetrie um E 0F herum folgt
hxD 1 dn p ; oder
10:61 b 0 V0 Z
EF 0 n2 D2 1 hxD :
10:62 arc sinh D V0 Z
EF0 Im Falle schwacher Wechselwirkung, d. h. V0 Z (E0F) 1, folgt damit für die Lückenenergie xD h 0
10:63 2hxD e 1=V0 Z
EF : 0 sinh1=V0 Z
EF Bei diesem Ergebnis fällt die Ähnlichkeit zu (10.30), d. h. zur Bindungsenergie e zweier Elektronen in einem Cooper-Paar in Gegenwart des vollbesetzten Fermi-Sees, auf. Wie in (10.30) erkennt man, dass eine auch noch so kleine attraktive Wechselwirkung, d. h. ein noch so kleines positives V0 eine endliche Lückenenergie ergibt, dass jedoch D sich nicht in eine Reihe entwickeln lässt für kleine V0. Eine Störungsrechnung wäre also nicht in der Lage gewesen, das Ergebnis (10.63) zu liefern. Es sei der Vollständigkeit halber erwähnt, dass mittlerweile auch Supraleiter mit verschwindender Lückenenergie bekannt sind.
D
10.5 Das Anregungsspektrum des Supraleiters
309
10.5 Das Anregungsspektrum des Supraleiters Injektion eines freien Elektrons in einen Supraleiter im BCSGrundzustand führt zur Einteilchenbesetzung von Zuständen, die nach (10.58) mindestens um die Lückenenergie D energetisch höher liegen als das Ferminiveau EF bzw. die auf die Elektronendichte bezogene Energie W 0BCS des sog. „Cooper-Paar-Kondensats“ (Abb. 10.12). Nur für Einteilchenenergien jnk j D gleicht das Einteilchenspektrum dem des Normalleiters. Was lässt sich über Anregungszustände knapp oberhalb der Lücke sagen, dort, wo die Zustandsdichte des Supraleiters singulär wird (Abb. 10.12a)? Wie verhalten sich nicht-gepaarte Elektronen dort? Vergleichen wir noch einmal die Besetzungswahrscheinlichkeit eines Normalleiters (Metalls) mit der eines Supraleiters bei T = 0 (Abb. 10.13). Beim Normalleiter ist die Fermi-Einteilchenbesetzungswahrscheinlichkeit f (k) eine Kastenfunktion, die sich längs einer Achse k im reziproken Raum symmetrisch um den Nullpunkt bis zum Fermi-Radius kF bzw. –kF erstreckt. Die Besetzungswahrscheinlichkeit wk = v 2k für einen Cooper-Paarzustand
k "; k # hingegen ist, auch bei T = 0, eine um ±kF „aufgeweichte“ Funktion. Es gibt auch bei T = 0 knapp unterhalb jkF j noch unbesetzte elektronische Zustände wegen wk (T = 0) < 1 für jkj < kF (Abb. 10.11, 10.13 b), diese können sowohl mit Cooper-Paaren als auch mit Einzelelektronen besetzt werden. Der physikalische Grund für die Existenz leerer Cooper-Paarzustände knapp unterhalb jkF j ist darin zu sehen, dass auf diese Weise Elektronenstreuprozesse ermöglicht werden, die zu Cooper-Paarung und damit insgesamt zu einer Energieabsenkung führen. Bei einem Normalleiter lässt sich die Anregung eines Elektrons aus einem Zustand E0
k0 < EF in einen vorher unbesetzten Zustand E ''(k '') beschreiben durch (s. Abb. 10.13 a, 10.14 a)
Abb. 10.13. Vergleich der längs einer Wellenzahlachse k aufgetragenen Besetzungswahrscheinlichkeiten f (k) für Elektronen in einem Normalleiter (Fermi-Verteilung) bei T = 0 K (a) und wk für Cooper-Paare (k:, –k;) in einem Supraleiter bei T = 0 K (b). ±kF sind die Fermi-Wellenvektoren. Anregungszustände durch Besetzung leerer Zustände mit Elektronen bei k'' bzw. k1 und k2 sowie durch Nichtbesetzung von im Grundzustand besetzter Zustände bei k' bzw. –k1 und –k2 sind qualitativ angedeutet
310
10. Supraleitung
DE E00
E0
E00
EF
EF
E0 :
10:64
Die Anregungsenergie DE lässt sich also formal aufteilen in einen Anteil
E00 EF , der zur Besetzung eines elektronischen Zustandes E00 oberhalb von EF dient und einen Anteil
EF E00 , der die Erzeugung eines leeren Zustandes E0 unterhalb von EF bewirkt. Dies ist schematisch in Abb. 10.13 dargestellt. Das Anregungsspektrum eines Normalleiters lässt sich also durch die Bildung von angeregten Elektronen (Energie bezogen auf EF) und von sog. Löchern der Energie
E0 EF beschreiben. Diese Beschreibung ist analog zu der, die wir mittels nk
h2 k2 =2m EF schon bei der Darstellung der BCS-Theorie benutzt haben. Löcher, also leere elektronische Zustände im Grundzustand des Normalleiters (Fermi-See) sind somit Anregungszustände; sie verhalten sich im Stromtransport wie positive Ladungsträger, wie sich leicht aus der damit verbundenen Stromdichte ergibt: Im Gegensatz zum Grundzustand, wo
e
10:65 a j 3 v
k f
kdk 0 8p ist, trägt der in Abb. 10.13 a dargestellte angeregte Zustand einen Strom
e j ev
k00 v
kf
kdk ev
k0 :
10:65 b 8p3 1: Brill: Z:
Der letzte Term trägt dem bei jk0 j < kF fehlenden Elektron Rechnung; er lässt sich als der Strom eines positiv geladenen Teilchens, des Loches im Fermi-See, auffassen. Die Definition des Loches ist völlig analog zu der in Abschn. 9.2 im Zusammenhang mit Strömen in nicht vollständig besetzten elektronischen Bändern. Derartige Lochzustände werden uns bei der Behandlung des Halbleiters in Kap. 12 weiterbeschäftigen. Im Supraleiter treffen wir auf ein neues interessantes Phänomen, nämlich dass solche Anregungszustände, bestehend aus angeregten Elektronen und Lochzuständen, gekoppelt sind. Die Anregung eines Einzelelektrons im Supraleiter auf einen Zustand k bedeutet, dass das Cooper-Paar
k "; k # nicht mehr existieren darf, dass also –k; nicht mehr besetzt sein darf. Eine Anregung wird also beschrieben durch (k: besetzt, –k; leer). Die Definition einer Anregung macht also gleichzeitig eine Aussage über die Besetzung von +k und –k; von daher ist die Darstellung der Paarbesetzungswahrscheinlichkeit wk für positive und negative k-Werte wie in Abb. 10.13b nützlich. Im Gegensatz zum Normalleiter (Abb. 10.13a) können wegen des Verlaufs von wk auch bei T = 0 elektronische Zustände, beispielsweise k1 in Abb. 10.13b, deren k-Vektoren innerhalb der Fermi-Fläche liegen
jk1 j < kF , mit einem Elektron besetzt werden. Eine Anregung bei k1 bedeutet dann wk(k = k1) = 1 (s. Abb. 10.13 b), aber auch zugleich das Fehlen eines Elektrons bei –k1. Analog hat eine Anregung bei k2 > kF auch das Fehlen eines Elektrons bei –k2 zur Folge.
10.5 Das Anregungsspektrum des Supraleiters
311
Im Falle der Anregung k1 wird dem System im Vergleich zur Verteilung des BCS-Grundzustandes wk etwa 25% „Elektronencharakter“ zugefügt, während bei –k1 etwa 75% Elektronencharakter fehlen; der Lochcharakter der Anregung k1 überwiegt. Analog hat die Anregung k2 > kF in Abb. 10.13 b überwiegend Elektronencharakter, der damit verbundene Lochcharakter bei –k2 ist geringfügig. Anregungen des beschriebenen Typs im Supraleiter haben also nicht vollständigen Elektronen- bzw. Lochcharakter. Die Anregungszustände werden deshalb als Quasiteilchen bezeichnet und je nach ihrer überwiegenden Natur Quasielektronen oder Quasilöcher genannt. Aus Abb. 10.13 b folgt unmittelbar, dass wk = v 2k die Wahrscheinlichkeit für die Existenz eines Quasiloches, jedoch 1–wk = u2k die Verteilungsfunktion für Quasielektronen angibt. Man beachte hierbei die ursprüngliche Definition von v 2k als Wahrscheinlichkeit für die Besetzung von k mit einem Cooper-Paar
k "; k #. Des weiteren sieht man unmittelbar, auch unter Zuhilfenahme von Abb. 10.13b, dass man einem Quasiteilchen im Zustand k eine Ladung zuordnen kann, die sich mit (10.50) ergibt als qk
e
u2k
v 2k
enk =Ek :
10:66
Wie schon bei der Behandlung des BCS-Grundzustandes in (10.56, 10.58) gezeigt, lässt sich die Anregungsenergie Ek eines Elektrons, das über den Grundzustand hinaus angeregt wird, darstellen als Ek2 n2k D2 ;
mit
n2k
h2 k2 =2m
EF0 2 :
10:67
Diese Gleichung enthält schon implizit die hier vorgestellte Darstellung der Anregungen eines Supraleiters in Form von Quasielektronen und Quasilöchern. n2k beschreibt mit seiner positiven Wurzel elektronartige Anregungen, mit seiner negativen Wurzel lochartige Anregungen (Abb. 10.14b). Beide Typen von Anregungen treten sowohl in der Umgebung von +kF wie auch bei –kF auf (Abb. 10.14). Beim Supraleiter existiert eine Lücke im Anregungsspektrum zwischen D (Lückenenergie) und EF, während beim Normalleiter diese Lücke nicht existiert (Abb. 10.14, gestrichelt). Für viele Anwendungen empfiehlt sich eine erweiterte Darstellung des Anregungsspektrums Ek(k) (Abb. 10.14 c), bei der die Anregung von lochartigen Zuständen wegen Ek (Elektron) = –Ek (Loch) zu negativen Energiewerten hin aufgetragen wird. Damit ergibt sich ein Spektrum der Anregungen, das mit einer Lücke von 2D dem Bänderschema eines Halbleiters (Kap. 12) gleicht. Sowohl die Zustandsdichte für Quasielektronen als auch die für Quasilöcher wird entsprechend (10.59 b) singulär nahe der Supraleiterlücke 2D (Abb. 10.14 c). Da angeregte Quasielektronen und Quasilöcher in einem Supraleiter miteinander gekoppelt sind, mit uk als Wahrscheinlichkeitsamplitude für elektronenartige und v k als Wahrscheinlichkeitsamplitude für lochartige Zustände, liegt es nahe, die Gesamtanregung aus beiden Quasiteilchen durch einen Zustandsvektor
312
10. Supraleitung
Abb. 10.14. Dispersion von Elektronenund Lochzuständen (a) in einem Normalleiter (Anregung eines Elektrons von E' nach E'' lässt sich als Besetzung von E'' und Bildung eines Loches bei E' auffassen). (b) In einem Supraleiter nahe der Fermi-Kante ±kF (durchgezogen) im Vergleich zum Normalleiter (gestrichelt). (c) In einem Supraleiter nahe der Fermi-Kante ±kF; Lochzustände sind spiegelbildlich zur Fermi-Energie EF nach unten hin aufgetragen. Im rechten Teilbild ist die resultierende Zustandsdichte Ds für (Quasi) Elektronen und Löcher qualitativ angegeben
D EF
Ek
u~k
r; t v~k
r; k
uk g
r; t vk
10:68
zu beschreiben, der einer gemeinsamen Zeit- und Ortsabhängigkeit Rechnung trägt. Gelänge es für diesen Zustand, eine SchrödingerGleichung zu finden, die sowohl das Verhalten freier Elektronen und Löcher in einem Normalleiter wie auch das gekoppelter Quasielektronen und Quasilöcher in einem Supraleiter beschreibt, so wären wir in der Lage, die Dynamik von Elektronen und Löchern in inhomogenen Systemen bestehend aus normal- und aus supraleitenden Bereichen zu behandeln, und dies im Prinzip in einer Zweiteilchenbeschreibung. Für den Normalleiter ergibt sich die Lösung sehr einfach, indem man in einem üblichen Hamiltonoperator H mit äußerem Potential V (r) die Energien auf EF bezieht und für Löcher den entsprechenden negativen Operator verwendet. Für den Supraleiter muss ein zusätzlicher Kopplungsterm eingeführt werden, der uk mit v k verkoppelt. Betrachten wir die Darstellung der Energie des Systems der Cooper-Paare (10.42) und die Formel für die Lückenenergie D (10.46), so werden in (10.42) die Amplituden uk und v k durch folgenden Term gekoppelt: X V0 X v k uk v k0 uk0 D uk v k :
10:69 3 L kk0 k Hier wirkt die Lückenenergie D = D({uk, v k}) wie ein Kopplungspotential. Ihr Wert hängt dabei von dem gesamten Ensemble der uk und v k ab. Folgender Ansatz für die gesuchte Schrödinger-Gleichung erscheint damit sinnvoll:
10.5 Das Anregungsspektrum des Supraleiters
@ ih u~k @t
@ ih v~k @t
h2 2 r 2m h2 2 r 2m
EF V
r u~k D~ vk ;
313
10:70 a
EF V
r v~k D~ uk :
10:70 b
Man beachte, dass D ({uk, v k}) bei der Lösung eines Problems im Prinzip selbstkonsistent bestimmt werden muss. Andererseits lässt (10.70) im Gegensatz zur klassischen BCS-Theorie auch zeit- und ortsabhängige Lückenenergien D (r, t) zu. Darüber hinaus kann D auch als komplex angenommen werden, was, wie weiter unten gezeigt wird, zu physikalisch sinnvollen Lösungen führt. Damit die Energielücke in der Form
DD1=2 eine reelle Größe bleibt, muss in (10.70 b) D durch D ersetzt werden. In Matrixschreibweise stellt sich dann (10.70) dar als ! H D u~k @ u~k :
10:71 ih H v~k @t v~k D Für einen Normalleiter mit verschwindender Lücke D entkoppeln in (10.70, 10.71) die Funktionen u~k und v~k und liefern, wie erwünscht, das Verhalten freier Elektronen und Löcher. Im einfachsten Fall eines homogenen Supraleiters (D = const, EF = const) ohne äußeres Feld (V = 0) machen wir als Lösungsansatz für g (r, t) den ebener Wellen: u~k uk eik r
iEt=h
v~k v k eik r
iEt=h
;
h2 k2 und erhalten mit der Einteilchenenergie nk 2m setzen in (10.71) uk uk nk D : E D nk vk vk
10:72 a
10:72 b EF durch Ein
10:73
Die Lösung dieser Eigenwertgleichung ergibt für E die beiden Energieeigenwerte q
10:74 Ek n2k D2 ; d. h. genau die aus der klassischen BCS-Theorie folgenden Anregungsenergien (10.58) für Elektronen (+) und Löcher (–). Durch Einsetzen der Eigenwerte (10.74) in (10.73) lassen sich bei Normierung der Eigenvektoren u2k v 2k 1
10:75
für die Elektron- und Lochwahrscheinlichkeitsamplituden uk und v k genau die in der BCS-Theorie gültigen Beziehungen (10.48–10.51) für die analogen Cooper-Paar-Amplituden erhalten. Die Schrödinger Gleichungen (10.70, 10.71) beschreiben also die Dynamik von angeregten (Quasi) Elektronen und (Quasi) Löchern in Normallei-
314
10. Supraleitung
tern und homogenen Supraleitern (beschrieben durch BCS-Theorie) richtig. Die Gleichungen (10.70, 10.71) wurden von Bogoliubov [10.8] mit feldtheoretischen Methoden in allgemeinerer Form hergeleitet; sie werden deshalb als Bogoliubov-Gleichungen bezeichnet. Mit (10.74) bzw. (10.47) folgt aus (10.50) q3 2 Ek2 D2 1 5: u2k 1 v 2k 41
10:76 2 Ek Lassen wir also Einteilchenenergien jEk j < D zu, so ergeben sich anders als in der BCS-Theorie auch komplexwertige Wahrscheinlichkeitsamplituden uk und v k, was ebenfalls zu einem komplexen Kopplungspotential D führt (siehe oben). In inhomogenen Systemen, wo normalleitende Bereiche an supraleitende Bereiche angrenzen, kann dieser Fall auftreten, wenn Elektronen mit einer Energie E < D aus dem Normalleiter auf die Grenzflächen zum Supraleiter treffen. Die hier vorgestellte Beschreibung von Anregungszuständen des Supraleiters, insbesondere auch unter Berücksichtigung räumlich inhomogener Systeme, ist die Grundlage zur Behandlung von Nichtgleichgewichtszuständen des Supraleiters, wo neben dem „Kondensat“ der Cooper-Paare Quasiteilchen eine wichtige Rolle spielen. Zur Beschreibung der Leitfähigkeit eines Supraleiters bei endlicher Temperatur wurde so das stark vereinfachte Zweiflüssigkeitsmodell entwickelt, in dem ein Suprastrom vom „Kondensat“ der CooperPaare getragen wird (s. Abschn. 10.6), während parallel dazu angeregte Quasiteilchen einen Normalstrom verursachen. Die theoretische Behandlung von Supraleiterbauelementen erfordert ein Verständnis solcher Nichtgleichgewichtszustände (hierfür sei auf weiterführende Literatur verwiesen [10.9, 10.10]). Im folgenden wenden wir uns wieder dem BCS-Modell des Supraleiters zu.
10.6 Konsequenzen der BCS-Theorie und Vergleich mit experimentellen Befunden Eine wesentliche Aussage der BCS-Theorie ist die über die Existenz einer Lücke D bzw. 2D im Anregungsspektrum eines Supraleiters. Direkte experimentelle Evidenz für die Lücke erbringen zum einen die in Tafel IX vorgestellten Tunnelexperimente. Hinweise auf die Existenz einer Lücke wurden auch aus dem Verlauf der elektronischen spezifischen Wärme eines Supraleiters bei sehr tiefen Temperaturen gezogen. Der exponentielle Verlauf (10.3) ergibt sich zwanglos, wenn der angeregte Zustand eines Systems durch Anregung über eine Energielücke erreicht wird; die Wahrscheinlichkeit für die Besetzung des angeregten Zustandes ist dann nämlich einem exponentiellen „Boltzmann-Term“ proportional, und dieser Term wird in der spezifischen Wärme (Ableitung der inneren Energie) als entscheidende Temperaturabhängigkeit wiedergefunden.
10.6 Konsequenzen der BCS-Theorie
315
Eine weitere direkte Bestimmung der Lückenenergie 2D ist über Spektroskopie mit elektromagnetischer Strahlung (optische Spektroskopie) möglich. Elektromagnetische Strahlung wird erst ab einer Photonenenergie h x absorbiert, die ausreicht, Cooper-Paare aufzubrechen, d. h. h x muss die Lückenenergie 2D überschreiten. Typische Lückenenergien für klassische Supraleiter liegen im Bereich von einigen meV. Einschlägige Experimente müssen also mit Mikrowellenstrahlung durchgeführt werden. Die Messkurven in Abb. 10.15 resultieren aus einem Experiment, bei dem mittels eines Bolometers die Mikrowellenintensität I nach Vielfachreflexion in einem Hohlraum aus dem zu untersuchenden Material gemessen wurde. Durch ein äußeres Magnetfeld konnte das Material aus dem supraleitenden Zustand (Intensität IS) in den Normalzustand (Intensität IN) gebracht werden. Dadurch ist die Messung der Differenzgröße (IS–IN)/IN möglich. Ab der der Lückenenergie 2D entsprechenden Photonenenergie nimmt diese Größe sprunghaft ab; dies entspricht einer abrupten Abnahme des Reflexionsvermögens des Materials im supraleitenden Zustand für h x > 2D, während für Energien unterhalb 2D der Supraleiter total reflektiert, da es keine Anregungsmöglichkeiten gibt. Bei jeder von T = 0 verschiedenen Temperatur besteht eine endliche Wahrscheinlichkeit dafür, einige Elektronen im Normalzustand zu finden. Mit zunehmender Temperatur werden immer mehr Cooper-Paare aufbrechen, d. h. eine Temperaturerhöhung hat zerstörende Wirkung auf die supraleitende Phase. Die kritische Temperatur Tc (Sprungpunkt) ist gerade so definiert, dass dort der Supraleiter in den normalleitenden Zustand übergeht, also keine Cooper-Paare mehr existieren. Damit muss aber auch die Lücke D bzw. 2D sich geschlossen haben, denn der normalleitende Zustand hat ein kontinuierliches Anregungsspektrum (Kap. 6). Die Lückenenergie D muss deshalb eine Funktion der Temperatur mit D (T) = 0 für T = Tc sein. Die Lücke D bzw. 2D eines Supraleiters lässt sich also nicht mit dem näherungsweise konstanten verbotenen Band eines Halbleiters
Abb. 10.15. Infrarot-Reflexion verschiedener Materialien, gemessen als Intensität I vielfach reflektierter Mikrowellenstrahlung. Die Intensitäten IS und IN resultieren aus Messungen, bei denen die Materialien supraleitend bzw. normalleitend waren. Die dargestellten Messkurven beschreiben also den Unterschied der Infrarot-Reflexion zwischen supraleitendem und normalleitendem Zustand. (Nach Richards und Tinkham [10.11])
316
10. Supraleitung
(Kap. 12) vergleichen. Im Rahmen der BCS-Theorie lässt sich die Temperaturabhängigkeit von D berechnen. Bei endlicher Temperatur regelt sich die Besetzung der angeregten Einelektronenzustände Ek = (n2k+D2)1/2 (10.58) gemäß der Fermi-Statistik f (Ek,T) (Abschn. 6.3). In der Bestimmungsgleichung für D (10.61) wird dieser Tatsache Rechnung getragen, indem die Nichtbesetzung entsprechender Paarzustände eingeht. Statt (10.61) gilt deshalb 1 V0 Z
EF0
h
xD
0
dn p 1 2 n D2
q 2f
n2 D2 EF0 ; T :
10:77
Der doppelte Wert der Fermi-Funktion tritt auf, weil entweder der Zustand bei k oder der bei –k besetzt werden kann. Weil f (Ek > E 0F , T ? 0) für T ? 0 verschwindet, enthält die allgemeinere Formel (10.77) den Grenzfall (10.61). Die zu (10.61–10.63) analoge Integration von (10.77) ergibt die Lückenenergie D als Funktion der Temperatur T. In einer normierten Auftragung D (T)/D (T = 0) gegen T/Tc ergibt dies eine universelle Kurve für alle Supraleiter. Diese Kurve ist in Abb. 10.16 zusammen mit Messdaten für die drei Supraleiter In, Sn und Pb gezeigt. Abweichungen vom theoretischen Verlauf sind vor allem darauf zurückzuführen, dass die in der BCS-Theorie gemachte Annahme eines konstanten Wechselwirkungsmatrixelementes V0/L 3 zu einfach ist. Da Phononen die Ursache für die Kopplung sind, wird sich in Vkk' auch die Phononenstruktur des speziellen Materials zeigen. Verbesserungen der BCS-Theorie in diese Richtung erlauben heute eine sehr gute Beschreibung einfacherer Supraleiter. Aus (10.77) lässt sich auch eine Bestimmungsgleichung für die kritische Sprungtemperatur Tc herleiten, man braucht nur D gleich Null zu setzen. Damit ergibt sich
Abb. 10.16. Temperaturabhängigkeit der Lückenenergie D (T) bezogen auf den Wert D (0) bei T = 0 für In, Sn und Pb. Experimentell aus Tunnelexperimenten (Tafel IX) bestimmte Werte sind verglichen mit der errechneten Vorhersage der BCS-Theorie (gestrichelt ). (Nach Giaever und Megerle [10.12])
10.6 Konsequenzen der BCS-Theorie
1 V0 Z
EF0
h
xD
0
dn n tanh : n 2 k Tc
317
10:78
Eine numerische Behandlung des Integrals (10.78) ergibt 1 V0 Z
EF0 ln k Tc 1;14hxD e
1;14hxD k Tc 1=V0 Z
EF0
10:79 a
oder
:
10:79 b
Diese Formel für die Sprungtemperatur Tc ist bis auf konstante Faktoren identisch mit der für die Lückenenergie D (0) bei T = 0 K (10.63). Ein Vergleich von (10.79 b) mit (10.63) liefert die im Rahmen der BCS-Theorie gültige Beziehung zwischen der Lückenenergie D (0) und der Sprungtemperatur D
0=k Tc 2=1;14 1;764 :
10:80
k Tc entspricht also etwa der halben Lückenenergie bei T = 0 K. Wie gut diese Beziehung für einige Supraleiter erfüllt ist, geht aus Tabelle 10.1 hervor. Weiter gestattet die experimentelle Bestimmung von Tc bzw. D (0) die Berechnung der sog. Kopplungskonstanten Z (E0F) V0 nach (10.79 b bzw. 10.63). Nach Tabelle 10.1 liegen die Werte für übliche Supraleiter zwischen 0,18 und 0,4. Nach (10.63 u. 10.79 b) sind sowohl die Lückenenergie D (0) als auch die Sprungtemperatur Tc proportional zur Phonon-Abschneidefrequenz xD (Debye-Frequenz). Nach Abschn. 4.3 und 5.3 variieren bei gleichen interatomaren Rückstellkräften die Phononfrequenzen, insbesondere also auch xD mit der Atommasse M wie M –1/2. Für zwei verschiedene Isotope des gleichen Materials sind die elektronischen Eigenschaften, d. h. also auch die chemischen Bindungskräfte, gleich. Wegen der unterschiedlichen Atommasse sollte dann jedoch sowohl Tc als auch D (0) proportional zu M –1/2 sein. Man nennt diese Aussage „Isotopeneffekt“. Abbildung 10.17 zeigt experimentelle Ergebnisse für Sn [10.13], die von verschiedenen Autoren stammen. Tabelle 10.1. Debye-Temperatur hD, Sprungtemperatur Tc, Supraleitungs-Kopplungskonstante Z (E0F) V0 und Lückenenergie D bezogen auf Sprungtemperatur Tc für einige Supraleiter Metall
hD [K]
Tc [K]
Z (E0F) V0
D (0)/k Tc
Zn Cd Hg Al In Tl Sn Pb
235 164 70 375 109 100 195 96
0,9 0,56 4,16 1,2 3,4 2,4 3,75 7,22
0,18 0,18 0,35 0,18 0,29 0,27 0,25 0,39
1,6 1,6 2,3 1,7 1,8 1,8 1,75 2,15
318
10. Supraleitung
Abb. 10.17. Isotopeneffekt für Zinn (Sn). Es sind Ergebnisse mehrerer Autoren zusammengestellt [10.13]: Maxwell (*); Lock, Pippard, Shoenberg (n); Serin, Reynolds und Lohman (~)
Die Übereinstimmung zwischen der erwarteten M –1/2 Abhängigkeit und dem Experiment ist für diesen Fall des Sn sehr gut. Man findet jedoch insbesondere bei Übergangsmetallen erhebliche Abweichungen des Massenexponenten von 0,5 z. B.: 0,33 für Mo oder 0,2 für Os. Diese Abweichungen sind nicht erstaunlich, wenn man an die stark vereinfachenden Annahmen für das Wechselwirkungsmatrixelement V0 (10.24 bzw. 10.38) denkt. Im Rahmen der einfachen BCS-Theorie ist die Debye-Frequenz xD die einzige Größe, die noch Aussagen über das spezielle Phonon-Spektrum enthält. Andererseits beweist das Auftreten des Isotopeneffektes den wesentlichen Einfluss der Phononen auf das Zustandekommen der attraktiven Elektronenwechselwirkung, wie sie in der BCS-Theorie zur Erklärung der Supraleitung herangezogen wird.
10.7 Suprastrom und kritischer Strom Das Hauptziel einer Theorie der Supraleitung besteht natürlich darin, die beiden Fundamentaleigenschaften der supraleitenden Phase, das Verschwinden des elektrischen Widerstandes für T < Tc und den idealen Diamagnetismus, der sich im Meissner-Ochsenfeld-Effekt zeigt, zu erklären. Wie folgt also aus der Existenz von Cooper-Paaren bzw. aus den Eigenschaften des BCS-Grundzustandes, dass Streuprozesse nicht zu einem endlichen Widerstand führen? Betrachten wir dazu, welchen Einfluss Stromfluss auf den BCSGrundzustand, insbesondere auf die Existenz der Lücke 2D im Anregungsspektrum hat. Nach Abschn. 9.5 lässt sich eine Stromdichte j durch eine Erhöhung des Impulses oder des k-Vektors der den Strom tragenden Ladungsträger beschreiben: Sei wiederum ns die Dichte der einzelnen Elektronen, die in Form von Cooper-Paaren die Suprastromdichte js tragen, dann gilt
10.7 Suprastrom und kritischer Strom
js
ns e v
319
10:81
und
m v hk :
10:82
Jedes einzelne Elektron in einem Cooper-Paar erfährt damit bei Stromfluss eine Änderung seines k-Vektors um 1 K 2
m j : ns e h s
10:83
Dem Cooper-Paar als Ganzem kommt also ein zusätzlicher Impuls P = h K zu, so dass das Paar (k:, –k;) bei Stromfluss durch
k1"; k2#
k 12 K "; k 12 K #
10:84
beschrieben werden muss. Die Wellenfunktion eines Cooper-Paares (10.20) schreibt sich bei Stromfluss ohne Berücksichtigung des Spin somit als 1X g
kei k1 r1 i k2 r2 w
r1 ; r2 3 L k 1X 3 g
kei K
r1 r2 =2 ei k
r1 r2 :
10:85 L k Mit R = (r1+r2)/2 als Schwerpunktskoordinate und r = r1– r2 als Relativkoordinate des Cooper-Paares folgt für die Wellenfunktion bei Stromfluss (K j 0): 1X g
kei kr ei KR w
K 0; r1 r2 :
10:86 w
r1 ; r2 ei KR 3 L k Stromfluss ändert die Cooper-Paar-Wellenfunktionen also nur um einen Phasenfaktor, der sich in der messbaren Wahrscheinlichkeitsdichte nicht mehr bemerkbar macht jw
K j 0; rj2 jw
K 0; rj2 :
10:87
Da die attraktive Wechselwirkung V (r1–r2) nur vom Relativabstand der beiden das Cooper-Paar konstituierenden Elektronen abhängt, folgt mit (10.86) für das Wechselwirkungsmatrixelement (10.23) bei Stromfluss Vk k0
K j 0 drw
K j 0; r V
rw
K j 0; r drw
K 0; r V
rw
K 0; r V 0
K 0 : kk
(10.88) Wegen der Invarianz von Vk k ' gegenüber Stromfluss kann in der BCS-Grundzustandsenergie (10.42) ein und derselbe Wechselwirkungsparameter V0 /L 3 für den stromlosen wie für den stromführenden Zustand genommen werden. Wegen (10.84) bedeutet deshalb Stromfluss im Rahmen der BCS-Theorie nur eine Verschiebung des k-Koordinatensystems um K/2 (10.83). Alle Gleichungen von (10.42) ab bleiben im verscho-
320
10. Supraleitung
benen reziproken Raum gleich; insbesondere ergibt sich bei Stromfluss die gleiche Lückenenergie D (10.60 bzw. 10.63), da für ihre Berechnung die Integration (10.61) über das gleiche Gebiet des kRaums wie im stromlosen Fall – nur in einem verschobenen Koordinatensystem – durchgeführt werden muss. Dementsprechend ist der Endwert für D (10.62) auch unabhängig von k. Ist also in einem Supraleiter ein Suprastrom angeregt (z. B. durch einen sich ändernden magnetischen Fluss), so existiert die Lücke im Anregungsspektrum weiter. Eine Änderung des Zustandes, zumindest durch inelastische Elektronenstreuung (z. B. Phononen, Abschn. 9.3–9.5) kann nur durch Anregung über die Lücke 2D hinaus, d. h. durch Aufbrechen mindestens eines Cooper-Paares zustande kommen. Was inelastische Elektronenstöße angeht, so sind diese als Ursache für Ladungsträgerrelaxation, d. h. Stromabnahme, also solange ausgeschlossen, wie der Gesamtimpuls der Cooper-Paare P nicht mit einer Energiezunahme verknüpft ist, die Anregungen über 2D hinaus ermöglicht. Elastische Stöße ändern jedoch auch die Richtung der Elektronengeschwindigkeit, d. h. also den Strom. In Abschn. 10.9 werden wir jedoch sehen, dass aus den Eigenschaften des BCS-Grundzustandes folgt, dass sich in einer Leiterschleife, die einen Suprastrom führt, der magnetische Fluss nur in festen „Quantensprüngen“ ändern kann. Ein elastischer Stoß müsste also, damit er wirksam zur Stromrelaxation beitragen kann, eine Stromänderung gerade entsprechend einem solchen „Flussquant“ zur Folge haben. Für das Eintreten eines solchen Falles ist die Wahrscheinlichkeit verschwindend gering. Ein Strom-tragender Supraleiter befindet sich also in einem stabilen Zustand. Wird durch den Stromfluss selbst, d. h. durch die Zunahme des Schwerpunktimpulses P der Cooper-Paare die Energie 2D erreicht, dann brechen Cooper-Paare auf und die Supraleitung bricht zusammen. Bezogen auf ein Elektron eines Cooper-Paares beträgt die Energie, die mit der Zunahme des Wellenzahlvektors k um K/2 (10.83) verbunden ist, E
k K=22 h2 h2 k2 h2 k K=2 K 2 h2 : 2m 2m 8m m
10:89
Wir betrachten die Energie eines einzelnen Elektrons, weil beim Aufbrechen das zweite Elektron des Cooper-Paares sich nicht kohärent verhält. In linearer Näherung ist wegen jKj kF die Zunahme der Energie pro Teilchen bei Stromfluss gegenüber dem stromlosen Zustand somit dE
1 h2 kF K : 2 m
10:90
Hierbei wurde vorausgesetzt, dass wir entsprechend dem Vorhergesagten nur Elektronen in der Nähe der Fermi-Energie, d. h. mit k & kF betrachten müssen. Damit die Supraleitung zusammenbricht, muss die von einem Cooper-Paar aufgenommene Energie
10.7 Suprastrom und kritischer Strom
321
2 dE die Lückenenergie 2D, die zum Aufbrechen erforderlich ist, übersteigen; d. h. nach (10.83 u. 10.90) muss gelten 2 dE
h2 kF K 2hkF js 2D : e ns m
10:91
Daraus lässt sich eine kritische obere Stromdichte jc für die Existenz der supraleitenden Phase abschätzen jc
e ns D : hkF
10:92
Für Sn ergibt sich experimentell im Grenzfall kleiner Temperaturen T ? 0 K eine kritische Stromdichte jc = 2·107 A/cm2, von der ab die Supraleitung zusammenbricht. Aus den Werten von Tabelle 10.1 und einer Geschwindigkeit der Elektronen an der FermiKante v F = h kF/m von 6,9·107 cm/s ergibt sich für die Konzentration ns der die Supraleitung tragenden Elektronen etwa 8·1021 cm–3. Über die Maxwell-Gleichung rot H j bzw: rot H df H ds j df
10:93 a
10:93 b
ist ein Magnetfeld längs eines geschlossenen Umlaufes eindeutig mit der diesen Umlauf durchdringenden elektrischen Stromdichte verknüpft. Diese Verknüpfung sollte auch für den Suprastrom durch einen langen Draht und das magnetische Feld an der Oberfläche gelten. Denken wir uns den Umlauf unmittelbar auf der Oberfläche des Drahtes (Radius r ), so folgt für die Magnetfeldstärke H an der Oberfläche des Drahtes aus (10.93) 2p r H j df :
10:94 Der Suprastrom in einem „dicken, langen“ Draht ist nun nach Abschn. 10.2 nur auf eine Oberflächenzone der typischen Dicke 100 bis 1000 Å verteilt (Londonsche Eindringtiefe KL). Beschreiben wir die exponentiell ins Innere des Drahtes hinein abklingende Stromdichte durch eine Gleichung der Form j = j 0 exp (–z /KL ), so ergibt sich aus (10.94) 2p r H 2p r KL j 0 :
10:95
Der kritischen Stromdichte jc, (10.92), an der Oberfläche des Supraleiters entspricht also ein oberes kritisches Magnetfeld Hc an der Oberfläche, oberhalb dessen die Supraleitung zusammenbricht: Hc KL jc KL
e ns D : h kF
10:96
Damit haben wir, basierend auf Aussagen der BCS-Theorie, auch die Existenz einer kritischen Magnetfeldstärke erkannt, oberhalb derer Supraleitung nicht möglich ist.
322
10. Supraleitung
Es sei noch bemerkt, dass (10.96) für die kritische Magnetfeldstärke auch dadurch hergeleitet werden kann, dass man die Kondensationsenergiedichte für die supraleitende Phase (10.53) der magnetischen Felddichte beim kritischen Feld Hc Bc gleichsetzt. Übersteigt die magnetische Feldenergie die Kondensationsenergie für die supraleitende Phase, so brechen Cooper-Paare auf. Da nach Abschn. 10.6, insbesondere nach (10.77), die Lückenenergie D eine temperaturabhängige Größe D (T) ist, die bei der kritischen Temperatur Tc auf Null zusammenschrumpft, muss dasselbe nach (10.92) bzw. nach (10.96) auch für die kritische Stromdichte jc (T) und für die kritische Magnetfeldstärke Hc (T) gelten. Der in Abb. 10.5 gezeigte qualitative Verlauf von Hc (T) lässt sich also zurückführen auf die Temperaturabhängigkeit der Lückenenergie D (T) (Abb. 10.16).
10.8 Kohärenz des BCS-Grundzustandes und Meissner-Ochsenfeld-Effekt Nach der erfolgreichen Beschreibung eines Zustandes mit verschwindendem elektrischen Widerstand ist unser weiteres Ziel, den Meissner-Ochsenfeld-Effekt, d. h. den idealen Diamagnetismus, bzw. die Verdrängung eines Magnetfeldes aus dem Supraleiter im Rahmen der mikroskopischen BCS-Theorie zu verstehen. Nach Abschn. 10.2 genügt es dazu in erster Näherung, aus den Eigenschaften von Cooper-Paaren bzw. dem Verhalten des BCS-Grundzustandes in Gegenwart eines Magnetfeldes die 2. Londonsche Gleichung (10.10 b) herzuleiten. Diese Gleichung beschreibt ja als Materialgleichung zusammen mit den Maxwell-Gleichungen das Verhalten eines Supraleiters im Magnetfeld. Wir betrachten also etwas näher die Struktur von Cooper-Paaren und die Wellenfunktion des Grundzustandes. Im Rahmen der BCSNäherung stellt sich die Wellenfunktion des BCS-Grundzustandes als ein Produkt aus gleichartigen Zweiteilchen-Wellenfunktionen von Cooper-Paaren w
r1 r2 ; "# dar. Nach (10.20) können diese Paar-Wellenfunktionen durch Einteilchenwellenfunktionen dargestellt werden, die zu jeweils entgegengesetztem Wellenzahlvektor k und Spin
"# gehören. Aus welchem k bzw. Energiebereich von Einteilchenzuständen diese Wellenfunktionen aufgebaut sind, erkennt man am Verlauf der Besetzungswahrscheinlichkeit wk für den Paarzustand (k:, –k;) (Abb. 10.11): Nur in einem ungefähren Bereich von ±D um die Fermikante E 0F herum ist im Supraleiter eine Modifikation der Einteilchen-Besetzung gegenüber der eines Normalleiters festzustellen. Aus diesem Bereich stammen also die Einteilchenwellenfunktionen, die die Cooper-Paare konstituieren. Aus der Energieunschärfe 2D lässt sich damit der Bereich der Impulsunschärfe d p für Elektronen in einem Cooper-Paar angeben:
10.8 Kohärenz des BCS-Grundzustandes und Meissner-Ochsenfeld-Effekt
2 p pF ' dp : 2D d 2m m
323
10:97
Nach der Unschärferelation entspricht dieser Impulsverteilung eine räumliche „Ausdehnung“ der Cooper-Paar-Wellenfunktion von nCP dx
h hpF h2 kF : dp m2D m2D
10:98
h 2 kF folgt somit Wegen kF = 2 m E 0F/ nCP
EF0 : kF D
10:99
Da E 0F /D typischerweise in der Größenordnung 103 bis 104 ist und kF etwa 108 cm–1 beträgt, ist die Cooper-Paar-Wellenfunktion über Raumbereiche der Größenordnung von typisch 103 bis 104 Å ausgedehnt. Diese Ausdehnung eines Cooper-Paares hatten wir auch schon größenordnungsmäßig aus der räumlich-zeitlichen Verteilung der mit dem Cooper-Paar verbundenen Gitterdeformation abgeschätzt (Abb. 10.7). Räumliche Änderungen des supraleitenden Zustandes beanspruchen also mindestens einen Raumbereich von 103 bis 104 Å. Bezeichnet man mit nkoh die Kohärenzlänge, also die Entfernung, über die sich an der Grenze zwischen einem Normalund einem Supraleiter die Dichte der Cooper-Paare von Null auf ihren Maximalwert einstellt, so gilt immer nkoh > nCP. Nehmen wir wegen E 0F/D&104 an, dass von etwa 1023 Elektronen pro cm–3 etwa 1019 cm–3 in Cooper-Paaren gepaart sind, so folgt daraus, dass innerhalb eines Volumens von etwa 10–12 cm3, das von einem Cooper-Paar eingenommen wird, noch etwa 106 bis 107 weitere Cooper-Paare ihr Zentrum, d. h. ihren Schwerpunkt, haben. Die Paare sind also nicht als unabhängig voneinander anzusehen, sie sind räumlich „miteinander verankert“. Man ist geneigt, diese hohe Kohärenz des Vielteilchenzustandes mit der Photonenkohärenz in einem Laser-Strahl zu vergleichen. In dieser hohen Kohärenz des BCS-Grundzustandes ist seine hohe Stabilität begründet. Wegen des „gleichgeschalteten“ Verhaltens so vieler einzelner CooperPaare kann man erwarten, dass im supraleitenden Zustand quantenmechanische Effekte im makroskopischen Bereich beobachtbar werden. Dies werden wir bei der Behandlung des Einflusses von Magnetfeldern sehen (Abschn. 10.9, 10.10). Die Tatsache, dass bei einem Cooper-Paar zwei Elektronen mit entgegengesetztem Spin gepaart sind, der Gesamtspin eines Cooper-Paares also verschwindet, hat zur Folge, dass die Statistik von Cooper-Paaren sich näherungsweise wie die von Bosonen (Teilchen mit ganzzahligem Spin) darstellt, d. h. für Cooper-Paare gilt näherungsweise kein Pauli-Prinzip: Cooper-Paare befinden sich alle im gleichen BCS-Grundzustand, d. h. die zeitabhängige Darstellung ihrer Wellenfunktion enthält im Exponenten ein und dieselbe Energie, die des BCS-Grundzustandes. Man sollte jedoch Cooper-Paare
324
10. Supraleitung
wegen der hohen Kohärenz des Grundzustandes nur sehr bedingt als ein nichtwechselwirkendes Bose-Gas auffassen. Angemessener ist die Bezeichnung des BCS-Grundzustandes als ein „Kondensat“ von Cooper-Paaren. Im folgenden wollen wir die Stromdichte js des von Cooper-Paaren getragenen Stromes dieses Kondensats in Gegenwart eines Magnetfeldes B = rot A ausrechnen. Dazu gehen wir von der Zweiteilchenwellenfunktion eines Cooper-Paares (10.86) aus und bilden die Vielteilchenwellenfunktion im Rahmen der Näherung nichtwechselwirkender Cooper-Paare als Produkt der Zweiteilchenwellenfunktionen w (r1, r2) (10.86). Die exakte Vielteilchenwellenfunktion lässt sich immer als Entwicklung nach solchen Produktwellenfunktionen darstellen. Wegen (10.86) lässt sich im Falle des Stromflusses die Wellenfunktion eines einzigen Cooper-Paares leicht auf die ohne Stromfluss (K = 0) zurückführen: w
r1 ; r2 eiKR w
K 0; r1
r2 :
10:100
h K ist hierbei der mit Stromfluss verbundene Zusatzimpuls des Cooper-Paares und R die Schwerpunktskoordinate des Paares. Die Wellenfunktion ohne Stromfluss w (K = 0, r1–r2) hängt nur noch von der „internen“ Relativkoordinate r = r1– r2 beider das Cooper-Paar konstituierenden Elektronen, nicht mehr von der Lage des Paares als Ganzes ab. Die genäherte Grundzustandswellenfunktion des Cooper-Paar-Kondensats schreibt sich in der Ortsdarstellung also UBCS ' A eiK R1 eiK R2 . . . eiK Rm . . . U
K 0; . . . rm . . . :
10:101
Alle Cooper-Paare, die mit ihren Schwerpunkten bei R1, R2, . . . Rm . . . liegen, haben durch den Stromfluss dieselbe Änderung ihres Schwerpunktswellenvektors um K erfahren. U (K = 0, . . . rm . . .) = U (0) ist das Produkt der Wellenfunktionen w (K = 0, rm) der einzelnen Cooper-Paare ohne Stromfluss, die nur noch von der internen Relativkoordinate rm (m zählt die Paare) abhängen. A ist ein sog. Antisymmetrisierungsoperator, der wie in der Slater-Determinanten-Darstellung die gesamte Funktion antisymmetrisiert, d. h. jeweils Ausdrücke des Typs (10.101) mit verschiedenem Vorzeichen aufsummiert, so dass UBCS gegen Vertauschung von Einteilchenzuständen antisymmetrisch wird. In der Darstellung (10.33) der Grundzustandswellenfunktion ist die Wirkung von A in den Eigenschaften der zweidimensionalen Zustandsvektoren j0i und j1i bzw. der Spinmatrizen explizit enthalten. A hat in (10.101) im wesentlichen summierende Wirkung und kann für die folgenden Überlegungen unterschlagen werden. Wir wählen also statt (10.101) die vereinfachende Darstellung UBCS ' eiK
R1 R2 ...Rm ... U
0
10:102
für die Wellenfunktion des Cooper-Paar-Kondensats. Hier nun ist die spezifische Eigenart des supraleitenden Grundzustandes UBCS, im Vergleich zu einem normalen Fermi-Gas zu berücksichtigen.
10.8 Kohärenz des BCS-Grundzustandes und Meissner-Ochsenfeld-Effekt
325
Wegen der hohen Kohärenz dieses Vielteilchenzustandes (106 bis 107 Cooper-Paarwellenfunktionen überlappen) können wir die Wellenfunktion des Cooper-Paar-Kondensats (10.102) als „in sich ~ starr“ auffassen und ihr insgesamt eine Schwerpunktskoordinate R, nämlich die der einzelnen Cooper-Paare bei Rm zuordnen: X X 1 X ~ R 2m Rm 2m Rm ;
10:103 NCP m m m wo NCP die Anzahl der Cooper-Paare ist. Diese Näherung ist auch deshalb möglich, weil im supraleitenden Zustand wegen der Existenz der Lücke D im Anregungsspektrum Streuprozesse einzelner Elektronen an Phononen und Störstellen weit unterhalb der kritischen Temperatur Tc ausgeschlossen sind. Der Anteil U (0) in (10.102) enthält hierbei noch die internen Relativkoordinaten rm der einzelnen Cooper-Paare (durchnummeriert mit m), die den Abstand der sie konstituierenden Einzelelektronen angeben. Im Rahmen der Näherung eines starren Kondensats der Cooper-Paare wird diese Ortsabhängigkeit von (10.102) vernachlässigt. Damit können natürlich solche Effekte nicht beschrieben werden, bei denen sich die Cooper-Paar-Wellenfunktion zu stark, d.h. innerhalb der Kohärenzlänge nkoh (³ 104 Å) stark ändert. Für relativ homogene Verhältnisse, wie wir sie in „einfachen“ Supraleitern (sog. Supraleitern 1. Art, Abschn. 10.9) antreffen, besteht die wesentliche Ortsabhängigkeit von UBCS (10.102) dann nur noch in der Abhängigkeit der Phase von der Schwerpunkts~ (10.103) des gesamten Kondensats der Cooper-Paare. koordinate R Aus (10.102) und (10.103) folgt die Darstellung ~
~ ~
UBCS ' eiNCP KR U
0 eiKR U
0
10:104 ~ = NCPK für die Wellenfunktion des Cooper-Paar-Kondensats, wo K der an das gesamte Kondensat durch Stromfluss übertragene Wellenzahlvektor (Quasi-Impuls) darstellt. In der hier beschriebenen Modellvorstellung fassen wir nun das in sich kohärente, „starre“ Cooper-Paar-Kondensat als ein „Hyperteilchen“ der Masse NCPm mit der Ladung 2eNCP auf und wenden die Einteilchen-Formel für den quantenmechanischen Stromdichteoperator zur Berechnung des Stromes an: j
p
p
2eNCP U U :
UBCS UBCS BCS BCS 4mNCP
p
10:105
Hierbei wirkt der Impulsoperator auf das gesamte Cooper-Paar~ und Gesamtladung Kondensat mit Schwerpunktskoordinate R 2NCPe:
p hi r
~ R
2eNCP A :
10:106
Da wir weiter das Cooper-Paar-Kondensat als ein „Hyperteilchen“ bestehend aus allen Cooper-Paaren auffassen, fordern wir die Normierung
326
10. Supraleitung
jU
0j2 dV 1
10:106 a
d. h. jU
0j2 1=L3 ;
10:106 b
3
wobei L das Volumen der betrachteten supraleitenden Probe ist. Damit folgt aus (10.104, 10.105, 10.106): 2eNCP h js UBCS rR 2eNCP A UBCS 4mNCP i h UBCS
10:107 a rR 2eNCP A UBCS ; i i e h 2 ~ 4eNCP AjU
0j2 2hKjU
0j :
10:107 b js 2m ~ selbst nicht mehr ortsabhängig ist, gilt rot K ~ = 0 und nach Weil K Anwendung des rot-Operators auf (10.107 b) folgt 2e2
10:108 NCP jU
0j2 rot A : m Wegen der Normierungsbedingung (10.106 b) folgt mit B = rot A und NCP/L3 als Dichte der Cooper-Paare sowie ns = 2NCP/L3 als Dichte der supraleitenden Elektronen rot js
rot js
ns e2 B; m
10:109
was nach (10.8) genau der 2. Londonschen Gleichung entspricht. Damit ist nach Abschn. 10.2 im Rahmen der Näherung räumlich nicht zu stark veränderlicher Cooper-Paar-Dichten der MeissnerOchsenfeld-Effekt abgeleitet. Man erkennt weiter, dass die London-Gleichung eben auch nur unter dieser Voraussetzung gilt. Für räumlich stark variierende, d. h. über Dimensionen der Ausdehnung eines Cooper-Paares (Kohärenzlänge) veränderliche, Cooper-PaarDichten wurden schon vor Entstehen der BCS-Theorie nichtlokale phänomenologische Erweiterungen der Londonschen Theorie angegeben [10.14]. Experimentell zeigt sich der Meissner-Ochsenfeld-Effekt besonders anschaulich bei Messungen des mittleren magnetischen Innenfeldes in einem Supraleiter. Abbildung 10.18 zeigt die gemessene durchdringende Flussdichte B als Funktion des außen anliegenden Magnetfeldes Ha für Ta. Das äußere Magnetfeld Ha wurde über eine lange Spule erzeugt, innerhalb derer sich die Ta-Probe umgeben von einem kleineren Solenoid befindet. Dieses Solenoid dient zur Bestimmung der die Probe durchdringenden magnetischen Flussdichte B. Man erkennt die Existenz einer kritischen magnetischen Feldstärke Hc (10.96), oberhalb der keine Supraleitung vorliegt. Die im Material erzeugte Flussdichte B wächst hier proportional zum außen anliegenden Feld Ha. Unterhalb von Hc, d. h. in
327
Induzierte Flussdichte B (willkürl. Einheiten)
10.9 Quantisierung des magnetischen Flusses
der supraleitenden Phase, ist gemäß dem Meissner-Ochsenfeld-Effekt die magnetische Flussdichte aus der Ta-Probe „herausgedrängt“. Das geringe Hintergrundsignal (Steigung h ) ist auf eine Magnetisierung der Wicklung des Messsolenoids zurückzuführen.
10.9 Quantisierung des magnetischen Flusses Wir wollen weiter den Einfluss eines äußeren Magnetfeldes B = rot A auf einen Supraleiter betrachten. Dies soll wie in Abschn. 10.8 im Rahmen der Näherung nicht zu stark räumlich variierender Cooper-Paar-Dichte geschehen (Supraleiter 1. Art). Die Wellenfunktion bei Vorliegen einer Suprastromdichte js soll also die Gestalt (10.104) haben, wobei die Ortsabhängigkeit nur in der ~R ~ NCP K R ~ und nicht in der Amplitude enthalPhase u K ten sein soll. Damit folgt nach (10.106 u. 10.107) für die Suprastromdichte 2 e ns e hns A K :
10:110 js m 2m Betrachten wir einen geschlossenen Weg innerhalb eines supraleitenden Ringes, der von einem äußeren Magnetfeld durchdrungen wird (Abb. 10.19), so folgt für das Umlaufintegral über die Suprastromdichte nach (10.110) ns e2 ehns 1 ~ ds : A ds rR~ u
R js ds
10:111 m 2m NCP Die Vielteilchen-Wellenfunktion der Cooper-Paare ist nun in den Koordinaten der einzelnen Paare eindeutig längs des gesamten Ringes
Abb. 10.18. Induzierte magnetische Flussdichte B durch eine Ta-Probe, gemessen bei 3,7 K als Funktion eines äußeren Magnetfeldes Ha. Die Probe befindet sich in einer großen Spule, durch die Ha erzeugt wird. B wird über eine kleine Messspule (angeschlossen an ballistisches Galvanometer) gemessen, die die Ta-Probe unmittelbar umschließt. Das geringfügige Hintergrundsignal h rührt von einem in den Drahtwindungen der Messspule induzierten Fluss her. (Nach Rose-Innes [10.15])
328
10. Supraleitung
Abb. 10.19. Supraleitender Ring (punktiert), der von einer magnetischen Flussdichte B durchsetzt ist. Gestrichelt sind die Zonen angedeutet, in denen SupraDauerströme fließen. Ein gedachter Umlauf im Innern des Rings (durchgezogen) berührt im wesentlichen stromloses Gebiet
definiert, d. h. für einen stationären Zustand darf sich die Phase nach einem geschlossenen Umlauf nur um ganzzahlige Vielfache von 2p geändert haben. Es muss also gelten ~ ds 2 p N : rR~ u
R
10:112 Damit folgt aus (10.111)
m h : js ds B df N 2 ns e 2e
10:113
Die zweite Londonsche Gleichung (10.10 b, 10.109) ergibt sich hieraus als Spezialfall für einen Umlauf in einem einfach zusammenhängenden Gebiet, durch das beim Supraleiter ja kein magnetischer Fluss dringen kann (N = 0). Der Ausdruck auf der linken Seite von (10.113) heißt Fluxoid; dieses Fluxoid kann also nur in ganzzahligen Vielfachen von h/2 e auftreten. Üblicherweise würde man erwarten, dass mittels eines geeigneten Magnetfeldes jeder beliebige Suprastrom in einem geschlossenen Kreis „angeworfen“ werden kann. Bedingung (10.113) jedoch schreibt vor, dass Stromdichte und magnetischer Fluss durch den Ring einer „Quantenbedingung“ gehorchen müssen. Beachten wir, dass der Suprastrom nur innerhalb einer dünnen Schale mit der Londonschen Eindringtiefe von einigen hundert Ångström fließt, der geschlossene Umlauf in (10.113) somit in einem Bereich liegt, wo im wesentlichen js verschwindet (Abb. 10.19), so vereinfacht sich (10.113) zu
h B df N :
10:114 2e Diese Bedingung besagt, dass ein geschlossener Suprastromkreis nur magnetische Flüsse umschließen kann, die sich als ein ganzzahliges Vielfaches eines sog. Flussquants y0
h 2;0679 10 7 G cm2 2;0679 10 2e
15
Vs
10:115
10.9 Quantisierung des magnetischen Flusses
329
darstellen lassen. Man beachte, dass das Flussquant für CooperPaare halb so groß wie das für Einzelelektronen ist (Abschn. 9.9). Um sich eine anschauliche Vorstellung von der Größe von y0 zu machen, stelle man sich einen winzigen Zylinder mit einem Durchmesser von etwa 1/10 mm vor. Das Flussquant y0 durchdringt diesen Zylinder, wenn das Magnetfeld im Innern eine Stärke von etwa 1% des Erdfeldes hat. Beziehung (10.113 bzw. 10.114) lässt sich formal auch herleiten, wenn man dem makroskopischen, ringförmigen Suprastrom die Bohr-Sommerfeldsche Quantisierungsbedingung auferlegt. Nehmen wir Teilchen der Ladung q und der Dichte n an, die die Stromdichte tragen, so gilt für den Impuls eines Teilchens p mv qA : Wegen j = n q v folgt daraus m p j qA : nq
10:116
10:117
Die Quantisierungsbedingung verlangt, dass das geschlossene Wegintegral über p ein Vielfaches des Planckschen-Wirkungsquantums h ist m j ds q A ds Nh ;
10:118 a p ds nq
m j ds B df Nh=q :
10:118 b n q2 Bei dieser Ableitung haben wir den stromführenden Kreis wie ein Riesenmolekül behandelt, Quantenbedingungen also für ein makroskopisches System gefordert. Dies zeigt wiederum von einer anderen Seite her, wie aufgrund der hohen Kohärenz der Cooper-Paare die supraleitende Phase durch eine makroskopische VielteilchenWellenfunktion beschrieben werden muss. Typisch quantenmechanisch mikroskopische Eigenschaften setzen sich bei einem Supraleiter in makroskopisch beobachtbare Quantenphänomene fort. In einem nicht-supraleitenden Ring dürfte für einen Ringstrom die Quantenbedingung (10.118) nicht angewendet werden, da es für einzelne Elektronen außerhalb einer Cooper-Paarbindung keine den Ring umschließende Wellenfunktion gibt. Stoßprozesse zerstören hier die Kohärenz über große Entfernungen. Durch Vergleich von (10.118 b) mit (10.113) stellen wir fest, dass aus der BCS-Herleitung der Flussquantisierung eine Aussage über die Ladung der den Suprastrom tragenden Teilchen folgt, nämlich dass die Teilchen gerade die doppelte Elektronenladung (q = 2 e, Cooper-Paare) tragen. Der experimentelle Nachweis der Flussquantisierung und insbesondere die Messung des Flussquants (10.115) bedeutet also eine der wichtigsten Bestätigungen der BCS-Theorie. Diese Experimente wurden etwa gleichzeitig und mit gleichem Ergebnis von Doll und Näbauer [10.16] und von Deaver und Fairbank [10.17] durchge-
Abb. 10.20. Experimentelle Ergebnisse zur Flussquantisierung in einem Pb-Zylinder. Der Fluss durch den kleinen PbZylinder, der auf einem Quarzstab aufgedampft ist (Einschub) wird über Schwingungen oder Anordnung im Messfeld BM bestimmt. (Nach Doll und Näbauer [10.16])
Resonanz-Amplitude/Messfeld MM (mm/Gauss)
330
10. Supraleitung
Einfrier-Magnetfeld Be (Gauss)
führt. Doll und Näbauer verwendeten winzige Bleizylinder, die durch Aufdampfen auf Quarzröhrchen eines Durchmessers von etwa 10 lm hergestellt waren. Bei diesem Durchmesser entspricht ein Flussquant einer magnetischen Flussdichte im Innern des Pb-Zylinders von etwa 0,25 G. Im Bleizylinder wurde nun ein Supra-Dauerstrom durch Abkühlen (unter Tc) in einem „Einfrier“-Magnetfeld Be und nachfolgendes Abschalten von Be erzeugt (Abb. 10.20, Einschub). Der Bleizylinder wirkt damit in einem Messfeld BM als magnetischer Dipol, auf den ein Drehmoment ausgeübt wird. Dieses ließe sich im Prinzip statisch über die Auslenkung eines Lichtzeigers nachweisen und der magnetische Fluss durch den Zylinder wäre damit bestimmt. Wegen der Kleinheit des Effektes benutzten Doll und Näbauer jedoch eine dynamische Methode, bei der Torsionsschwingungen des Systems angeregt wurden. Die Resonanzamplitude ist dann proportional zum erregenden magnetischen Moment des Bleizylinders. Abbildung 10.20 zeigt eine Auftragung der Resonanzamplitude bezogen auf die Messfeldstärke BM (proportional zum Fluss durch Zylinder) in Abhängigkeit vom „Einfrierfeld“ Be. Ohne Flussquantisierung wäre die gestrichelt gezeichnete Proportionalität zu erwarten. Die Messpunkte zeigen klar, dass nur Flussquanten bestimmter Größe y0 N im Bleizylinder „eingefroren“ werden können. Das experimentell bestimmte y0 entspricht dem in (10.115) auf der Basis von Cooper-Paaren errechneten Wert. Damit wurde einwandfrei gezeigt, dass Elektronenpaare und nicht Einzelelektronen den Suprastrom tragen.
10.10 Supraleiter 2. Art
331
10.10 Supraleiter 2. Art Das Verhalten von Supraleitern im Magnetfeld war dadurch bestimmt, dass ein äußeres Magnetfeld B 0 exponentiell mit der Londonschen Eindringtiefe KL (10.16) ins Innere eines supraleitenden Halbraumes hinein abklingt (Abb. 10.21 a). In der Abklingzone fließt der Suprastrom, der das Innere des Supraleiters feldfrei hält (Abschn. 10.2). Die Supraleitung bricht zusammen, wenn das äußere Magnetfeld B 0 einen kritischen Wert Bc = l0 lGc (10.96) übersteigt, bei dem die magnetische Feldenergiedichte 12 Hc Bc die Kondensationsenergiedichte für Cooper-Paare (10.53) übersteigt. Von da ab werden Cooper-Paare aufgebrochen, und der Zustand der Normalleitung stellt sich ein. Betrachten wir statt eines supraleitenden Halbraumes (Abb. 10.21 a) eine supraleitende Schicht der Dicke d (Abb. 10.21 b), so kann bei genügend geringer Schichtdicke das Magnetfeld nicht mehr voll abklingen; im Inneren der Schicht (z = 0) bleibt ein beträchtliches Feld erhalten bzw. die abschirmende Wirkung der supraleitenden Ströme in dieser Abklingschicht kann nicht voll aufgebaut werden. Mathematisch ergibt sich dieser Sachverhalt, wenn wir die Differentialgleichungen (10.14) für die Schichtgeometrie lösen. Die allgemeine Lösung setzt sich aus den beiden Teillösungen auf beiden Rändern B1
z B1 e
z=KL
;
B2
z B2 ez=KL
10:119
zusammen. Aus der Randbedingung B1 ed=2KL B2 e
d=2KL
B0
10:120
und aus der Symmetrie des Problems (B1 = B2 = B ) folgt dann B B0 =2 cosh
d=2KL :
10:121
Damit ergibt sich die Magnetfeldstärke in der supraleitenden Schicht (Abb. 10.21 b) zu B
z B0 cosh
z=KL = cosh
d=2KL :
10:122
Abb. 10.21. Abklingen eines Magnetfeldes beim Eindringen: (a) in einen supraleitenden Halbraum (z > 0); (b) in eine supraleitende Schicht der Dicke d. An den Oberflächen liegen jeweils die Feldstärken B 0 an, KL ist die Londonsche Eindringtiefe, die für den Halbraum die exponentielle Abklinglänge darstellt
332
10. Supraleitung
Die Variation des magnetischen Feldes über der Schicht wird bei kleiner Schichtdicke nicht mehr sehr signifikant; das Feld durchdringt die supraleitende Schicht fast vollständig. Dies ist Ausdruck dafür, dass die Magnetfeld-abschirmende Wirkung der supraleitenden Ströme in der Schicht nicht voll aufgebaut werden kann. Wenn in dieser Situation das kritische magnetische Feld Bc (10.96) an der Oberfläche der Schicht anläge, so würde die damit gegebene magnetische Feldenergie nicht ausreichen, um im gesamten Raumbereich Cooper-Paare aufzubrechen und die Supraleitung zu zerstören. Dementsprechend muss für eine genügend dünne supraleitende Schicht das kritische Magnetfeld Bc höher liegen als für einen Halbraum. Das kritische Feld wird mit abnehmender Schichtdicke immer weiter zunehmen. Es kann für Dicken d KL um mehr als einen Faktor 10 über dem Feld liegen, das man für einen supraleitenden Halbraum im thermodynamischen Gleichgewicht hat. Mit abnehmender Schichtdicke wird also die Reaktion des Supraleiters auf ein angelegtes Magnetfeld immer kleiner. Die unmittelbare Konsequenz dieser Ergebnisse wäre, dass bei Anlegen eines überkritischen Magnetfeldes (> Bc) an einen massiven Supraleiter dieser in kleine zum Magnetfeld parallele Bereiche aus abwechselnd supraleitender und normalleitender Phase zerfiele. Wenn die supraleitenden Bereiche dünn genug wären, könnten sie ein wesentlich höheres Magnetfeld aushalten, ohne dabei instabil zu werden. Dass dies bei den üblichen Supraleitern (Supraleiter 1. Art) nicht geschieht, hängt damit zusammen, dass die Schaffung von Grenzflächen zwischen normal- und supraleitender Phase hier Energie kostet. Die Verhältnisse an einer solchen Grenzschicht sind in Abb. 10.22 qualitativ dargestellt. Der normalleitende Zustand gehe bei z = 0 in den supraleitenden Zustand über. Es liege parallel zur Grenzschicht (^ z ) das kritische Magnetfeld Bc an, das über die Londonsche Abklinglänge KL (10.16) exponentiell in den Supraleiter hinein abfalle. Im Supraleiter steige die Dichte der Cooper-Paare nc = ns /2 innerhalb der Kohärenzlänge nkoh von Null auf ihren thermodynamischen Gleichgewichtswert nc (T). nkoh ist dabei größer als KL angenommen; die Kohärenzlänge muss immer die räumliche Ausdehnung eines Cooper-Paares nCP (10.99) übersteigen, da die CooperPaardichte sich niemals auf einer kleineren Distanz als der eines Cooper-Paares ändern kann. In der Randzone um z = 0 sind nun zwei Energiedichtebeträge zu vergleichen, nämlich die mit der Verdrängung des Magnetfeldes verknüpfte Energiedichte E˜B (z) und die durch die Kondensation der Cooper-Paare (10.53) freiwerdende Energiedichte E˜Kon (z). Im Normalleiter verschwinden beide Beiträge; tief im Innern des Supraleiters kompensieren sich beide, d. h. für z ? ? gilt bei außen anliegendem kritischen Feld Bc E~B
1
1 2 E~Kon BV: 2l0 c
10:123
Innerhalb der Grenzschicht jedoch (Abb. 10.22 b) bleibt wegen der verschiedenen charakteristischen Abklinglängen KL und nkoh ein endlicher Differenzbetrag übrig
10.10 Supraleiter 2. Art
333
Abb. 10.22 a, b. Örtliche Variationen wichtiger Supraleitungsparameter nahe der Grenzfläche zwischen einem normalleitenden Bereich (schraffiert) und einem Supraleiter (z > 0). (a) Parallel zur Grenzschicht liege im normalleitenden Bereich das kritische Magnetfeld Bc an; im Supraleiter klingt B (z) (durchgezogene Kurve) exponentiell mit der Londonschen Abklinglänge KL ab. Der Anstieg der Dichte der Cooper-Paare nc ist durch die Kohärenzlänge nkoh bestimmt. (b) Räumliche Variation der Energiedichte E˜B, die mit der Verdrängung des Magnetfeldes zusammenhängt und der mit der Cooper-Paar-Kondensation verknüpften Energiedichte E˜Kon (durchgezogene Kurve). Der Differenzbetrag (gestrichelte Kurve) bestimmt die Grenzflächenenergie zwischen normalund supraleitender Phase
~ E~Kon E~B 1 B2c
1 DE
z 2l0
e
z=nkoh
1
e
z=KL
:
10:124
Integration über die gesamte Randschicht ergibt den Grenzflächenenergiebetrag (pro Flächeneinheit) cn/s, der zur Schaffung einer solchen Grenzschicht zwischen normal- und supraleitender Phase aufgewandt werden muss 1
cn=s 0
~ DE
zdz
nkoh
KL
1 2 B : 2l0 c
10:125
Für den hier betrachteten Fall nkoh > KL ist der Verlust an Kondensationsenergie größer als der Gewinn an Verdrängungsenergie. Pro Flächeneinheit muss dem System zur Erzeugung der Grenzfläche eine Grenzflächenenergiedichte cn/s (10.125) zugeführt werden. So wie man es für einen „normalen“ Supraleiter (Supraleiter 1. Art) erwartet, kostet die Entstehung von abwechselnd normalleitenden und supraleitenden Bezirken Energie, sie wird vermieden. Ganz anders verhält sich ein Supraleiter, bei dem das Magnetfeld tiefer eindringen kann als die Distanz, auf der der supraleitende Zustand „anschwingt“, d. h. bei dem nkoh < KL gilt. Bei einem solchen Supraleiter 2. Art wird beim Aufbau von Grenzflächen zwischen normal- und supraleitenden Bezirken Energie gewonnen, es stellt sich für gewisse äußere Magnetfelder ein sog. „gemischter
334
10. Supraleitung
Zustand“ (mixed state) ein, bei dem abwechselnd normalleitende und supraleitende Bezirke aneinander grenzen. Die beiden wichtigen Längen, die für das Vorliegen eines Supraleiters 2. Art entscheidend sind, sind die Abklinglänge des Magnetfeldes KL (10.16) und die Kohärenzlänge nkoh (größer als Ausdehnung nCP (10.99) eines Cooper-Paares), die das „Anschwingen“ des supraleitenden Zustandes bestimmt. Beide Längen hängen nach (10.16 u. 10.99) verschieden von den für die Supraleitung entscheidenden Parametern ns (Dichte der supraleitenden Elektronen) und D (Lükkenenergie) ab. Sowohl ns als auch D sind unter anderem durch die Stärke der Elektron-Phonon-Wechselwirkung bestimmt. Diese Wechselwirkung bestimmt auch die mittlere freie Weglänge K (EF) für Elektron-Phonon-Streuung im betreffenden Material. Es ist also einsichtig, dass die Suche nach Supraleitern 2. Art mit einer Variation der freien Weglänge für Elektron-Phonon-Stöße einhergeht. Hierbei hat sich gezeigt, dass eine Verringerung der freien Weglänge die Tendenz nkoh < KL zur Folge hat. Diese Aussage wird durch die Ginzburg-Landau-Theorie [10.14] für Supraleiter 2. Art gewonnen. Eine Verkleinerung der freien Weglänge ist leicht dadurch zu erhalten, dass man dem betrachteten Supraleiter eine gewisse Menge Fremdmetall zulegiert. Supraleiter 2. Art sind, wie die Erfahrung zeigt, im allgemeinen metallische Legierungen mit relativ kurzer freier Weglänge für Elektron-Phonon-Stöße. Blei-WismutLegierungen z. B. bleiben in Magnetfeldern bis zu etwa 20 kG noch supraleitend, in Feldern also, die um mehr als 20mal größer sind als das kritische Feld von reinem Blei. Der Unterschied zwischen Supraleitern 1. und 2. Art wird besonders deutlich in den Magnetisierungskurven M (B) sichtbar (Abb. 10.23). In einem Supraleiter 1. Art (nkoh > KL) wird in der supraleitenden Phase das Magnetfeld B = l0 l H = l0 (H+M) vollständig aus dem Innern verdrängt (B = 0). Die supraleitenden Ringströme in der äußeren „Hülle“ bauen eine Magnetisierung M auf, die dem äußeren Feld entgegengesetzt gleich ist (M = – H). Bis zur kritischen Feldstärke Bc = l0 lGc wächst also die Magnetisierung des Materials proportional zum Außenfeld und bricht dann beim Übergang in den normalleitenden Zustand ab (Abb. 10.23 a). Beim Supraleiter 2. Art – es sei eine lange stabförmige Probe in Abb. 10.23 b betrachtet – wird der Gewinn an Verdrängungsenergie beim Eindringen des Feldes größer als der Verlust an Kondensationsenergie durch die dabei auftretende örtliche Variation der Cooper-Paardichte. Dieses Eindringen geschieht von einem unteren kritischen Feld Bc 1 ab; die Magnetisierung M sinkt mit wachsendem Magnetfeld monoton, bis sie bei einem oberen kritischen Feld Bc 2 völlig verschwindet. Das äußere Feld ist hier voll eingedrungen und hat die Supraleitung zerstört. Ein analoges Verhalten zeigt sich bei der Messung der den Supraleiter 2. Art durchdringenden Flussdichte B (mittleres inneres Magnetfeld). Anders als in Abb. 10.18 bei einem Supraleiter 1. Art ist der Übergang von verschwindendem Innenfeld (< Hc) zum linear anwachsenden Feld (> Hc) nicht scharf. Das Innenfeld beginnt sich
10.10 Supraleiter 2. Art
335
Abb. 10.23. Magnetisierungskurven für einen Supraleiter 1. Art (a) und einen Supraleiter 2. Art (b). Beim Supraleiter 1. Art gibt es nur ein kritisches Magnetfeld Bc, während beim Supraleiter 2. Art ein unteres und ein oberes kritisches Feld Bc 1 und Bc 2 existieren
schon bei einer unteren kritischen Feldstärke Hc 1 (< Hc) langsam aufzubauen, um dann bei einer oberen Grenze Hc 2 (> Hc) den linearen Verlauf wie in Abb. 10.18 anzunehmen. Wie im Falle des Supraleiters 1. Art, wo die kritischen Magnetfelder Hc bzw. Bc Funktionen der Temperatur sind (Abb. 10.5), hängen auch die unteren und oberen kritischen Feldstärken Bc 1 (T) bzw. Bc 2 (T) von der Temperatur ab. Es ergeben sich auf diese Weise für einen Supraleiter 2. Art drei thermodynamisch stabile Phasen, die übliche supraleitende („Meissner-Phase“) unterhalb Bc 1 (T), die normalleitende oberhalb von Bc 2 (T) und die Zwischenphase des gemischten Zustandes, auch Shubnikov-Phase genannt, zwischen den kritischen Zustandskurven Bc 1 (T) und Bc 2 (T). Ein experimentelles Beispiel ist in Abb. 10.24 dargestellt. Reines In als Supraleiter 1. Art hat nur eine supraleitende und eine normalleitende Phase unter- bzw. oberhalb von Bc (T). Einlegierung von 4% Bi erzeugt einen Supraleiter 2. Art, dessen obere und untere kritische Magnetfeldkurven Bc 1 (T) und Bc 2 (T) die Phasengebiete der Meissner-, der Shubnikov- und der normalleitenden Phase voneinander abtrennen. Während die Meissner-Phase eine homogene Phase wie bei einem Supraleiter 1. Art darstellt, enthält die Shubnikov-Phase abwechselnd supraleitende und normalleitende Gebiete. Magnetischer Fluss dringt in den Supraleiter 2. Art ein, aber die supraleitenden Gebiete mit lokal verdrängtem Magnetfeld sind von abschirmenden
336
10. Supraleitung
Abb. 10.24. Temperaturabhängigkeit der kritischen Magnetfelder einer IndiumWismut-Legierung (In+4 at.% Bi). (Nach Kinsel et al. [10.18])
Supraströmen umgeben. Diese Ströme müssen natürlich geschlossene Stromlinien haben, weil sie nur dann stationär sein können. In der Shubnikov-Phase liegt also eine stationäre, räumlich variierende Verteilung von magnetischer Feldstärke und Suprastromdichte vor. Wie aus den Überlegungen in Abschn. 10.9 folgt, kann ein geschlossener Suprastromkreis nur magnetische Flüsse umschließen, die sich als ganzzahliges Vielfaches eines sog. Flussquants y0 = h/2 e ^2´10–7 G cm2 darstellen. Man könnte also erwarten, dass in der Shubnikov-Phase die supraleitenden Bezirke gerade aus Supra-Ringströmen bestehen, die ein einziges Flussquant y0 umschließen. Höhere und niedrigere Dichte an supraleitenden Elektronen in dieser Phase würde sich dann in einer Variation der Dichte dieser einzelnen sog. Flussschläuche widerspiegeln. Wie eine Lösung der Ginzburg-Landau-Theorie [10.14] zeigt, ist dies tatsächlich der Fall. Die qualitative Darstellung in Abb. 10.25 zeigt, dass jedes Flussquant aus einem System von Ringströmen besteht, die den magnetischen Fluss durch den Schlauch erzeugen. Mit wachsendem Außenfeld Ba wird der Abstand der Flussschläuche (Flusswirbel) kleiner. Da zwischen den einzelnen Flussschläuchen zumindest für kleine Abstände eine abstoßende Wechselwirkung existiert, ist es offensichtlich, dass der Zustand niedrigster Enthalpie sich für eine regelmäßige Anordnung der Flusswirbel in einem zweidimensionalen hexagonalen Gitter ergibt. Diese Verteilung wird tatsächlich experimentell gefunden [10.19]. Mittels elastischer Neutronenstreuung konnte das mikroskopische Magnetfeld an dem Typ 2-Supraleiter Niob in der Shubnikov-Phase gemessen werden. Die Feldverteilung (Abb. 10.26) zeigt klar das Vorliegen einer hexagonalen Anordnung von Flussschläuchen. Die bisherigen Betrachtungen zur Shubnikov-Phase setzen die freie Verschiebbarkeit der Flussschläuche voraus. Dies ist jedoch in der Realität nur als Grenzfall denkbar. Störungen im Gitteraufbau, Versetzungen, Korngrenzen, Ausscheidungen u. ä. beschränken die freie Verschiebbarkeit. Wegen aller möglichen Wechselwirkungen
10.10 Supraleiter 2. Art
337
Abb. 10.25. Schematische Darstellung der Shubnikov-Phase eines Supraleiters 2. Art. Sog. Flussschläuche, angeordnet in einem zweidimensionalen Translationsgitter, lassen das Magnetfeld „durchdringen“. Ein solcher Flussschlauch ist von Supraringströmen umgeben, die jeweils ein magnetisches Flussquant einschließen
Abb. 10.26 a, b. Ergebnisse eines Neutronen-Beugungsexperimentes am zweidimensionalen Gitter der Flussschläuche des Typ 2-Supraleiters Niob in der Shubnikov-Phase (4,2 K). Die detaillierte Auswertung des Beugungsbildes ergibt die hier dargestellte Verteilung des mikroskopischen Magnetfeldes in der Umgebung der Flusswirbel. (a) Makroskopische Feldstärke B = 0,056 T. (b) B = 0,220 T. In (a) beträgt der nächste Nachbarabstand im hexagonalen Flussliniengitter 206 nm, das maximale Feld im Flusslinienzentrum ist 0,227 T. Die entsprechenden Werte für (b) sind 104 nm bzw. 0,255 T (das obere kritische Feld Bc 2 beträgt hier 0,314 T). (Nach Schelten et al. [10.19])
mit solchen Störstellen existieren energetisch bevorzugte Plätze, die zu einem räumlichen „pinning“ der Flusswirbel führen. Deformationen der Magnetisierungskurven (Abb. 10.23) und HystereseEffekte, die von der Vorbehandlung des Materials (Tempern usw.) abhängen, sind die Folge. Auf der anderen Seite bietet das „Festlegen“ oder „pinnen“ von Flusswirbeln durch Kristallstörungen in der Shubnikov-Phase technische Vorteile. Falls ein Supraleiter 2. Art in der Shubnikov-Phase einen Transportstrom führt, so wirkt auf die Flussschläuche senkrecht zur Stromdichte und senkrecht zum Magnetfeld die LorentzKraft. Das dadurch verursachte Wandern der Flussschläuche bedingt Verluste, d. h. Umwandlung von elektrischer in Wärmeenergie. Diese Energie kann nur dem Belastungsstrom entnommen werden, indem eine elektrische Spannung an der Probe auftritt; ein elektrischer Widerstand erscheint. Dieser Effekt wird durch das
338
10. Supraleitung
„pinnen“ der Flussschläuche herabgesetzt. Beim Supraleiter 2. Art sind also nicht wie im Supraleiter 1. Art kritischer Strom und kritisches Magnetfeld an der Oberfläche des Leiters auf einfache Art (10.93) miteinander verknüpft. Die stark inhomogene Struktur der Shubnikov-Phase eines solchen Leiters verlagert Magnetfeld und stromführende Bereiche in das Innere des Materials. Kritischer Strom und kritisches Magnetfeld hängen nun in komplizierter Weise und zwar verschieden von einer Reihe von Materialparametern, wie Kohärenzlänge, freie Weglänge, Grad der Kristallstörung u. ä., ab. Schließlich sei betont, dass technisch wichtige Anwendungen der Supraleitung vor allem auf der Möglichkeit beruhen, mittels verlustfreier starker Supra-Ringströme sehr hohe Magnetfelder zu erzeugen. Ist das Magnetfeld erst einmal aufgebaut, so ist zu seiner Aufrechterhaltung im Prinzip keine elektrische Leistung mehr erforderlich. Eine Bedingung für die Funktion eines solchen Hochleistungs-Supraleitungsmagneten ist natürlich an die Existenz von Materialien mit genügend hohen kritischen Magnetfeldern Bc 2 (T) geknüpft. Dies ist nur im Falle von Supraleitern 2. Art gegeben. Es werden zur Zeit z. B. Nb-Ti-Legierungen als Wicklungsmaterial verwendet, die bei T^0 ein kritisches Feld von etwa 130 kG haben. Noch höhere Felder können mit Nb3Sn erzeugt werden. Das maximale kritische Feld (T = 0) liegt hier über 200 kG. Während des Betriebs muss die Wicklung des Magneten natürlich unterhalb der kritischen Temperatur Tc, d. h. im allgemeinen auf der Temperatur des flüssigen Heliums (4,2 K), gehalten werden.
10.11 Neuartige „Hochtemperatur“-Supraleiter Großtechnische Anwendungen der Supraleitung, insbesondere ihre Nutzung beim Transport hoher elektrischer Leistung über große Entfernung, wurden bisher durch die Notwendigkeit verhindert, das Material zur Erreichung des supraleitenden Zustandes unter die kritische Temperatur Tc abzukühlen. Wegen der im allgemeinen sehr niedrig liegenden Tc-Werte bedeutete dies Abkühlung auf 4,2 K, die Temperatur des flüssigen Heliums. Technisch interessante Lösungen lassen sich jedoch erst vorstellen, wenn eine Kühlung nur auf etwa 70 K, die Temperatur flüssigen Stickstoffs, erfolgen muss. Seit also Supraleitung untersucht wird, besteht ein Hauptziel darin, Supraleiter mit möglichst hoher Sprungtemperatur Tc, sogar möglichst nahe bei Zimmertemperatur, zu finden. Basierend auf den allgemeinen Ansätzen und Schlussfolgerungen der BCS-Theorie bieten sich hierbei insbesondere zwei Möglichkeiten: i) Eine besonders starke Elektron-Phonon-Wechselwirkung V0 , eventuell zusammenhängend mit einer Tendenz zu Gitterinstabilitäten, könnte über eine Beziehung des Typs (10.79) zu einer
10.11 Neuartige „Hochtemperatur“-Supraleiter
339
hohen Sprungtemperatur führen. Günstig würde sich hierbei noch eine besonders große elektronische Zustandsdichte Z (E0F) am Fermi-Niveau auswirken (10.79). ii) Eine neuartige Vielelektron-Wechselwirkung, nicht unbedingt vermittelt über Phononen, könnte eine „Kondensation“ des Fermi-Sees zu Cooper-Paaren ermöglichen. Geschähe diese Wechselwirkung über (Quasi-) Teilchen (z. B. Elektronen selbst) mit wesentlich geringerer Masse als der der Gitterbausteine (Phonon), so könnte man ebenfalls aufgrund von (10.79) zumindest qualitativ über ein stark angewachsenes xD eine wesentlich höhere Übergangstemperatur Tc erwarten. Ein entscheidender Durchbruch in der Supraleitungsforschung geschah um 1986, als Bednorz und Müller [10.20] entdeckten, dass metallische, sauerstoffarme Kupferoxidverbindungen des Ba-La-Cu-OMischsystems Sprungtemperaturen um 30 K herum zeigen. Die erste Originalmessung des Widerstandes an dem bei Zimmertemperatur quasi-metallischen, polykristallinen Oxid Ba0,75La4,25Cu5O5 (3–y ) (y > 0, unbekannt) ist in Abb. 10.27 dargestellt. Abhängig von der transportierten Stromdichte wird ein signifikantes Abknicken des spezifischen Widerstandes zwischen 20 K und 30 K gefunden. Der Abbruch des Widerstandes ist nicht scharf, wie für normale Supraleiter verlangt (Abb. 10.1). Eine Interpretation der Ergebnisse durch das Vorhandensein einer Mischung aus verschiedenen supraleitenden und normalleitenden Phasen ist jedoch möglich. Mit dieser Arbeit haben Bednorz und Müller das Tor zur Erforschung einer neuen Materialklasse aufgestoßen und möglicherweise zur Ent-
Abb. 10.27. Temperaturabhängigkeit des spezifischen elektrischen Widerstandes einer polykristallinen Oxidkeramik des Typs Ba0,75La4,25Cu5O5 (3–y ), gemessen bei verschiedenen Stromdichten. (Nach Bednorz und Müller [10.20])
340
10. Supraleitung
Abb. 10.28. Spezifischer Widerstand gesinterter YBa2Cu3O7–x-Proben mit variierender Sauerstoffverarmung x = 0 . . . 0,3. Der Sauerstoffgehalt wurde durch Anlassen im Sauerstoffstrom bei verschiedenen Temperaturen und anschließendes Abschrecken in flüssigem Stickstoff eingestellt. (Nach Cooper et al. [10.22])
deckung eines neuen Mechanismus der Supraleitung (Nobelpreis 1987). Bald darauf gelang es Chu und Mitarbeitern, an Keramiken des Systems Ba1–xYx CuO3–y Sprungtemperaturen um 90 K zu erreichen [10.21]. Mit der Entwicklung verbesserter Präparationsmethoden für Einkristalle und Schichten sowie nach Anwendung besserer Analysemethoden stellte sich eine YBa2Cu3O7–x, manchmal YBCO genannte, Legierung als die interessanteste Materialkomponente heraus. Das Y-Atom kann durch andere Seltene Erden wie Eu, Gd u. ä. substituiert werden. Hierdurch ergibt sich eine ganze Klasse von nach der Stöchiometrie benannten 123 Materialien mit kritischen Temperaturen von bis zu 95 K. Typische Ergebnisse von Messungen des temperaturabhängigen elektrischen Widerstandes und des magnetischen Verhaltens, wie sie von zahlreichen Gruppen weltweit an diesen Materialien gefunden werden, sind in Abb. 10.28 und 10.29 dargestellt. Für eine Sauerstoffverarmung von x = 0 bis 0,1 fällt der spezifische elektrische Widerstand bei etwa 90 K zu unmessbar kleinen Werten, während er zu höheren
Abb. 10.29. Magnetisierung als Funktion der Temperatur, gemessen an einer durch Sputtern hergestellten YBCOSchicht. Die Probe wurde ohne äußeres Magnetfeld abgekühlt (ZFC). Die dann angelegten Magnetfelder (B jjc-Achse) variierten zwischen 1 mT und 10 mT. (Nach Wördenweber [10.23])
10.11 Neuartige „Hochtemperatur“-Supraleiter
341
Temperaturen wie bei einem Metall ansteigt (Abb. 10.28). Mit weiter wachsender Sauerstoffverarmung x verschiebt sich der Sprungpunkt zu niedrigeren Temperaturen, während im Bereich der Normalleitung der Widerstand weiter zunimmt. In Abb. 10.29 sind temperaturabhängige Messungen der Magnetisierung an einem durch Ionenzerstäubung hergestellten YBCO-Film dargestellt. Die Messungen wurden mittels eines Vibrationsmagnetometers durchgeführt, bei dem die Probe in einem durch Spulen erzeugten äußeren Magnetfeld Ba schwingt und die von der Probenmagnetisierung M abhängige Schwingungsfrequenz gemessen wird. Die Ergebnisse wurden erzielt, indem die Probe ohne äußeres Feld abgekühlt wurde (ZFC: Zero Field Cooled). Für idealen Diamagnetismus müsste wegen B = l0 M+Ba die Magnetisierung l0 M unterhalb des Sprungpunktes den Wert des äußeren Feldes erreichen. Wie aus Abb. 10.29 zu ersehen ist, werden für kleinere Temperaturen T Tc , d. h. unterhalb von 10 K, aber l0 M-Werte erreicht, die um das etwa Tausendfache über dem Wert des äußeren Feldes Ba (angegeben an den Messkurven) liegen. Dies liegt am Entmagnetisierungsfaktor, der für den Fall dünner Schichten stark von dem einer langen Probe abweicht. Außerdem würde man im Idealfall einen abrupten Übergang von l0 M bei der Sprungtemperatur Tc erwarten. Der „schleppende“ Übergang für T < Tc wird zum Teil auf Inhomogenitäten in der Probe zurückgeführt. Des weiteren wird das „Festhaken“ von Flussfäden an Kristallstörungen und eine thermische Aktivierung der Flussfadenbewegung dafür verantwortlich gemacht. Ergebnisse wie in Abb. 10.29 sind typisch für keramische, sog. Hochtemperatursupraleiter des YBCO-Typs. Eine weitere Klasse von Supraleitern, die noch höhere Sprungtemperaturen aufweisen, wurde 1988 mit den Bi- und Tl-haltigen Materialien entdeckt. Ihre typische Stöchiometrie ist Bi2Sr2Ca2Cu3O10 [10.24] und Tl2Ba2Ca2Cu3O10 [10.25]. In Tabelle 10.2 sind die Hauptklassen keramischer Supraleiter mit Sprungtemperaturen oberhalb von 90 K zusammengestellt [10.26]. Für die Bi- und Tl-haltigen Materialien haben sich Bezeichnungen wie 2212, 2223 u. ä. nach ihrer Stöchiometrie eingebürgert. Obwohl die Kristallstruktur der YBCO und der (Bi, Tl)-Keramiken im Detail verschieden ist, weisen beide Materialklassen einen charakteristischen Schichtaufbau auf, der für den Mechanismus der Supraleitung wichtig ist (Abb. 10.30). Dieser Schichtaufbau offenbart sich sehr klar in hochaufgelösten elektronenmikroskopischen Aufnahmen der Materialien. Abbildung 10.31 zeigt Ergebnisse der Untersuchung einer Bi2Sr2CaCu2O8+x-Schicht mittels hochauflösender TransmissionsElektronenMikroskopie (TEM). Nach Abb. 10.30 a sind die YBCO-Materialien axiale Kristalle mit abwechselnd CuO2-Ebenen [Cu(2), O(2)] und Sauerstoffatomen in pyramidenartiger sowie rechteckig-planarer Koordination entlang der c-Achse. Diese rechteckigplanaren Strukturelemente bilden Sauerstoff-Ketten längs der b-Achse des Kristalls. Entscheidend für die Supraleitung sind die Sauerstofflücken, die immer innerhalb dieser Ketten auftreten. Bei den
342
10. Supraleitung
Tabelle 10.2. Wichtige Familien von Hochtemperatur-Supraleitern. Entsprechend ihrer Stöchiometrie haben sich Kurzbezeichnungen wie Tl-2212 u. ä. eingebürgert. (Nach Hott et al. [10.26]) Formel
Kurzbezeichnung
SEBa2Cu3O7 SE ,,Seltene Erden`` Y; Eu; Gd; . . . Bi2Sr2Can–1CunO2 n+4 (+Pb-Dotierung)
„SE BCO“ oder „123“ „BSCCO“ oder „Bi-22 (n–1) n“
Tl2Ba2Can–1CunO2 n+4
„TBCCO“ oder „Tl-22 (n–1) n“
Tl2A2Can–1CunO2 n+3 (A = Sr, Ba)
„Tl-12 (n–1) n“
HgBa2Can–1CunO2 n+2
„Hg-12 (n–1) n “
Bisher maximal erreichtes Tc/K 92 (YBCO)
90 122 90 110 127 119 90 122 122 110 96 128 135
(Bi-2212) (Bi-2223) (Bi-2234) (Tl-2212) (Tl-2223) (Tl-2234) (Tl-1212) (Tl-1223) (Tl-1234) (Tl-1245) (Hg-1201) (Hg-1212) (Hg-1223)
(Bi, Tl)-Keramiken liegt ein ähnlicher Schichtaufbau entlang der cAchse vor, jedoch in einer wesentlich größeren Elementarzelle (Abb. 10.30 b). Deutlich sind hier zwei Bereiche der Elementarzelle zu erkennen, bei denen die Cu-Atome zentriert (oben) oder an den Ecken der Cu-O-Ebenen (unten) liegen. Beide Teile der Zelle sind
Abb. 10.30 a, b. Kristallstruktur der YBCO und (Bi, Tl)-Supraleiterkeramiken. (a) Einheitszelle eines YBa2Cu3O7Kristalls; die rechteckig-planare und pyramidenartige Koordination der O-Atome entlang der c-Achse ist eingezeichnet. Weiter sind spezielle Lagen von O- und Cu-Atomen in den CuO2-Ebenen durch eingeklammerte Zahlen gekennzeichnet. (b) Einheitszelle der Bi2Sr2Ca2Cu3O10bzw. Tl2Ba2Ca2Cu3O10-Keramiken (2223 Phasen)
10.11 Neuartige „Hochtemperatur“-Supraleiter
343
Abb. 10.31. Hochaufgelöstes elektronenmikroskopisches (TEM)-Bild einer Bi2Sr2CaCu2O8+x-Schicht in Transmission. Bei Durchstrahlung senkrecht zur cAchse des Kristalls zeigt sich der Schichtaufbau des Supraleiters. Helle und dunkle Punkte zeigen die Lage von Atomreihen an. (Nach Kabius [10.27])
durch zwei Bi-O- bzw. Tl-O-Ebenen voneinander getrennt. Verschiedene Bi- oder Tl-Keramiken (Tabelle 10.2) unterscheiden sich durch die Anzahl der „eingeschobenen“ CuO2-Ebenen. Dies wiederum beeinflusst entscheidend die Sprungtemperatur für die Supraleitung. Entsprechend dem hoch anisotropen Kristallaufbau sind bei den keramischen Supraleitern alle elektronischen Eigenschaften, insbesondere auch die Supraleitung stark anisotrop. Temperaturabhängige Widerstandskurven für YBCO-Schichten (Abb. 10.32) zeigen starke Unterschiede im spezifischen Widerstand Rc und Rab, gemessen entlang der c-Achse und senkrecht dazu, d. h. parallel zu den ab-Ebenen. Der Widerstand Rc zeigt bei etwa 150 K ein flaches Minimum, dessen Ausprägung wahrscheinlich mit dem Grad des Sauerstoffmangels zusammenhängt. Weiterhin zeigen die keramischen Hochtemperatursupraleiter sehr interessante Eigenschaften bezüglich ihrer kritischen Magnetfelder. Alle bisher bekannten Materialien sind Typ II-Supraleiter (Abschn. 10.10), die eine Shubnikov-Phase zwischen einem unte-
Abb. 10.32. Spezifischer Widerstand von YBCO-Schichten als Funktion der Temperatur, gemessen parallel zur cAchse (Rc, linke Ordinate) und in der a–b-Ebene (Rab, rechte Ordinate). (Nach Hagen et al. [10.28])
344
10. Supraleitung
ren kritischen Feld Bc 1 bzw. Hc 1 und einem oberen kritischen Feld Bc 2 bzw. Hc 2 aufweisen. Obwohl das untere Feld Bc 1 unterhalb von 10 mT liegt, übersteigt das obere kritische Feld Bc 2 (senkrecht zur c-Achse) von YBa2Cu3O7–x mit einer abgeschätzten Höhe von 340 T das aller bisher bekannten Supraleiter. Hierbei tritt weiterhin die hohe Anisotropie der keramischen Supraleiter in Erscheinung. Für äußere magnetische Felder parallel zur kristallographischen cAchse werden Bc 2-Werte abgeschätzt, die um etwa einen Faktor 5– 7 unterhalb der Werte für eine Feldorientierung senkrecht zur cAchse liegen. Die kritischen Magnetfeldstärken erlauben eine Abschätzung der Kohärenzlänge nc in c-Richtung von etwa 3–5 Å, während in der Basisebene ein Wert von nab von etwa 20–30 Å gefunden wird. An YBCO-Schichten, die mit guter kristalliner Qualität orientiert auf einem entsprechenden Substratmaterial aufgewachsen sind, werden ohne Magnetfeld bei 77 K kritische Stromdichten von 106–107 A/cm2 gemessen. Eine eindeutige theoretische Erklärung des Supraleitungsmechanismus in diesen keramischen Materialien ist bisher nicht möglich. Jedoch gibt es eine Reihe von Befunden, die mittlerweile zu der Hoffnung Anlass geben, bald eine geschlossene theoretische Beschreibung zu finden. Aus der Beobachtung der Flussquantisierung (Abschn. 10.9) weiß man, dass Cooper-Paare ähnlich wie in BCSSupraleitern die Supraleitung tragen. Für die meisten Hochtemperatursupraleiter werden diese Cooper-Paare nicht aus zwei Elektronen, sondern aus zwei Defektelektronen oder Löchern gebildet. Ähnlich wie bei Halbleitern (Abschn. 9.2, 12.2) wirkt ein in einer chemischen Bindung fehlendes Elektron bzw. ein in einem fast voll besetzten Band leerer elektronischer Zustand, im Leitungsprozess wie ein positiver Ladungsträger, ein sog. Defektelektron oder Loch. Man spricht von Löcherleitung oder p-Leitung. Die positive Ladung der Cooper-Paare, d. h. die p-Typ-Supraleitung wird aus dem Vorzeichen der Hall-Konstanten (Tafel XIV) geschlossen. In Entsprechung zu den hohen kritischen Übergangstemperaturen Tc werden mit verschiedenen experimentellen Methoden, u. a. der Tunnelspektroskopie (Tafel IX), Lückenenergien D zwischen 20 und 30 meV gefunden. Der charakteristische Quotient D (0)/kTc (10.67) erreicht so Werte zwischen 3 und 4, vergleichsweise hoch zum BCS-Wert von 1,764. Für die Entwicklung einer geschlossenen Theorie der Hochtemperatursupraleitung wird sicherlich auch die Abhängigkeit der Sprungtemperatur Tc vom Sauerstoffmangel x in der Stöchiometrie YBa2Cu3O7–x , wie sie sich in Abb. 10.28 andeutet, von Bedeutung sein. Mit wachsendem Sauerstoffverlust x in der Bindung nimmt die Sprungtemperatur stufenartig von 90 K auf etwa 30 K ab (Abb. 10.33). Oberhalb von x^0,7 verlieren die YBCO-Keramiken ihre Supraleitfähigkeit und zeigen isolierendes, antiferromagnetisches Verhalten. Diese Beobachtungen und eine Reihe theoretischer Untersuchungen [10.29, 10.30] legen folgende Schlussfolgerungen nahe, die für ein Verständnis wichtig sind: Sauerstoffatome
10.11 Neuartige „Hochtemperatur“-Supraleiter
345
Abb. 10.33. Experimentell bestimmtes Phasendiagramm der YBa2Cu3O7–x-Keramik, d. h. Abhängigkeit der Sprungtemperatur Tc von der Sauerstoffverarmung x. Im Bereich SC liegt Supraleitung vor, während AF eine antiferromagnetische Phase bezeichnet. (Nach Zaanen et al. [10.29])
mit ihrer hohen Elektronegativität dienen im YBCO-Gitter als Elektronenakzeptoren. Die Y- und Ba-Metallionen geben in der chemischen Bindung jeweils zwei Elektronen an die CuO2-Ebenen ab. Die Sauerstoffatome „schlucken“ diese Elektronen. Geringer Sauerstoffmangel, d. h. kleineres x, bewirkt, dass mehr Sauerstoff als Elektronenakzeptor zur Verfügung steht. Mehr Löcher als Partner für Defektelektronen-Cooper-Paare in den CuO2-Ebenen werden geliefert. Hieraus ergibt sich eine allgemeine Vorstellung, die auch auf die Tl- und Bi-Supraleiter übertragen wird: CuO2-Schichten sind verantwortlich für einen quasi-zweidimensionalen Ladungstransport über Löcher oder Defektelektronen, die sich zu Cooper-Paaren paaren. Dazwischen liegen Schichten bestehend aus Alkalimetall- bzw. Seltenen Erdionen und Sauerstoff oder Halogenen, die als Ladungsträgerreservoire dienen. Diese Schichten können Elektronen von den CuO2-Ebenen aufnehmen und so CooperPaare aus Löchern in den sog. Leitungsebenen erzeugen. Mittlerweile wurde auch Hochtemperatursupraleitung mit elektronischen Cooper-Paaren, herkömmliche n-Typ-Supraleitung, in Nd2CuO4- und Nd2–xCexCuO4-Materialien entdeckt [10.31]. Obwohl eine allgemeine, übergreifende theoretische Beschreibung für die Supraleitung der keramischen Kupferoxidmaterialien bisher nicht existiert, sind hochinteressante technische Anwendungen bereits im Stadium der Erprobung. So ist es bereits gelungen, mittels „Hochtemperatur“ SQUIDs (Tafel X) bei Messtemperaturen von 77 K im Detektorsystem Herz- und Gehirnströme von Menschen aufzuzeichnen und für medizinische Diagnostik anwendbar zu machen [10.32]. Seit 1991 gibt es eine weitere Neuigkeit auf dem Gebiet der Supraleiter: Die erst um 1985 entdeckten Fullerene (Abschn. 1.2) zeigen unter gewissen Bedingungen auch Supraleitung mit Sprungtemperaturen oberhalb von 15 K [10.33]. Einzelne Fulleren-Moleküle bestehen aus 60 Kohlenstoffatomen (C60), die einen geschlossenen Ball mit einem Durchmesser von 7,1 Å zwischen den C-Kernen formen (Abb. 1.5). Die C-Atome bilden dabei eine leicht gewölbte Struktur mit 20 Hexagons und 12 Pentagons, ähnlich wie in Graphit, Benzol und anderen organischen Molekülen. Wie schon
346
10. Supraleitung
Abb. 10.34. Temperaturabhängigkeit der magnetischen Suszeptibilität von Rb3C60. Die Messung wurde in einem äußeren Magnetfeld von 10 Oe durchgeführt. ZFC: ohne Magnetfeld abgekühlt; FC: im Magnetfeld abgekühlt. (Nach Politis et al. [10.34])
ausgeführt, liegt der Kohlenstoff in einer sp 2-Hybridisierung vor, bei der die nicht im sp 2-Hybrid beteiligten pz-Orbitale besetzte pund unbesetzte p-Orbitale bilden, die über die gesamte Kugeloberfläche delokalisiert sind. Schon bei Raumtemperatur kristallisieren die C60-Moleküle in einem flächenzentrierten kubischen Gitter mit einer Gitterkonstanten von 14,16 Å. Bei dieser Kristallisation wechselwirken die äußeren Valenzelektronen der C60-Moleküle, d. h. die p- und p-Orbitale, am stärksten miteinander. Es bilden sich ein relativ schmales vollbesetztes p- und ein leeres p*Band aus. Beide elektronischen Bänder sind etwa 1,5 eV voneinander entfernt, so dass der C60-Kristall halbleitend ist. Setzt man eine kristalline C60-Schicht Kaliumdampf aus, so wird die Schicht metallisch. Kaliumatome werden in Zwischenräume zwischen den C60-Kugeln eingebaut. Eine maximale Leitfähigkeit von etwa 500 S/cm wird bei einer Stöchiometrie von K3C60 erreicht, während eine „volle Dotierung“ K6C60 wieder zum Verschwinden der Leitfähigkeit führt. Der optimale metallische Charakter von K3C60 wird darauf zurückgeführt, dass die ursprünglich leeren p*-Zustände in C60 dreifach entartet sind und somit maximal 6 Elektronen pro Molekül aufnehmen können. Die eingebauten drei K-Atome pro C60-Molekül geben ähnlich wie in einem Alkalisalz ihr Valenzelektron in das C60-Molekül und füllen das elektronische p-Band zur Hälfte. Ein metallisches Leitungsband ist entstanden. Das metallische Material K3C60 zeigt nun Supraleitung mit einer Sprungtemperatur Tc = 19,3 K. Noch höhere kritische Temperaturen wurden bei ähnlichen Fulleren-Kristallen gefunden: Rb3C60 (Tc^28 K), RbCs2C60 (Tc^33 K) und Rb2,7Tl2,2C60 (Tc^48 K). Wegen der hohen Reaktivität mit atmosphärischem Sauerstoff wurden bisher meist magnetische Messungen an den Materialien durchgeführt. In Abb. 10.34 ist die gemessene Temperaturabhängigkeit der magnetischen Suszeptibilität von Rb3C60 dargestellt [10.34]. Wie in Abb. 10.29 wurde die Probe ohne äußeres Magnetfeld abgekühlt (ZFC). Ähnlich wie bei den keramischen Hochtemperatursupraleitern wird ein gradueller Einsatz des diamagnetischen Verhaltens unterhalb von Tc beobachtet.
Übungen zu Kapitel 10
10.1 Supraleitung ist ein thermodynamischer Zustand, der bei konstantem Druck durch zwei Zustandsvariablen, Temperatur T und magnetisches Feld H oder B, beschrieben wird. (a) Aus der Darstellung der Gibbsschen Freien Energie dG = –SdT–MdB (S: Entropie, M: Magnetisierung) leite man die folgende Beziehung dHc Sn Ss dT l0
Ms Mn für die Temperaturabhängigkeit des kritischen magnetischen Feldes Hc (T) her! Man benutze die Stetigkeit von G (T) an der Phasengrenze zwischen normal (n) und supraleitendem (s) Zustand (l0 magnetische Permeabilität). (b) Man benutze die Tatsache, dass der supraleitende Zustand perfekten Diamagnetismus (B = 0), der Normalzustand jedoch vernachlässigbaren Diamagnetismus (M%0) zeigt, und leite ab, dass sich die Entropie an der Phasengrenze um Sn
Ss
V dHc Hc dT l0
ändert. Aus dieser Beziehung leite man weiter einen Ausdruck für die latente Wärme des Phasenüberganges von Supraleitung zu Normalleitung im magnetischen Feld ab! 10.2 Diskutieren Sie das Hochfrequenzverhalten eines Supraleiters mit Hilfe einer komplexen Leitfähigkeit rª (x) = r1–ir2 (Abschn. 11.1); rª beschreibt zeitabhängige Transportphänomene!
(a) Zeigen Sie mittels der London-Gleichungen, dass ein Supraleiter für endliche Frequenzen x eine rein imaginäre Leitfähigkeit bei Temperaturen T Tc zeigt! Was ist der physikalische Grund? Welche Konsequenzen ergeben sich für Schaltkreise mit supraleitenden Bauelementen? (b) Leiten Sie die Frequenzabhängigkeit der imaginären Leitfähigkeit r2 (x) eines Supraleiters ab und schätzen Sie r2 bei einer Frequenz von 10 GHz für ein Material mit ns = 1020 cm–3 supraleitenden Elektronen ab. 10.3 Diskutieren Sie die Temperaturabhängigkeit der spezifischen Wärmeleitfähigkeit für ein Material, das vom Normalzustand in den supraleitenden Zustand übergeht! Man betrachte sowohl das „freie“ Elektronengas beim Übergang in den BCS-Grundzustand als auch das Phononensystem. 10.4 Der BCS-Grundzustand eines stark vereinfachten Supraleiters bestehe aus nur zwei Cooper-Paaren (Abschn. 10.4): jyBCS i
uk j0ik v k j1ik
uk0 j0ik0 v k0 j1ik0 : Berechnen Sie den Energiegewinn hyBCS jH jyBCS i mittels des Hamilton-Operators H , in dem Streuprozesse k ! k ' mittels Spin-Matrizen beschrieben werden! Vergleichen Sie das Ergebnis mit dem allgemeinen Ausdruck (10.41) für viele CooperPaare! 10.5 Es gibt eine enge Analogie zwischen der BCS-Theorie und der Theorie des Ferromagnetismus.
348
Übungen zu Kapitel 10
(a) Man zeige, dass die Energie WBCS (10.42) des BCS-Grundzustandes als Erwartungswert hyBCS jH BCS jyBCS i eines BCS-Hamilton-Operators H BCS abgeleitet werden kann, mit X H BCS2 nk r
3 k k
V0 X
1
1
2
2
r r rk0 rk0 4L3 kk0 k k
und
1
rk
3
rk
0 1 1 0 1 0
0 1
k
;
2
rk
0 i
i 0
k
;
k
als Pauli-Spinmatrizen in x, y, z- bzw. 1, 2, 3-Richtung! (b) Der Hamilton-Operator H BCS gleicht formal dem Heisenberg-Hamilton-Operator (8.57) für wechselwirkende Spins in einem äußeren Magnetfeld. Man konstruiere in Analogie zur Theorie des Ferromagnetismus (Abschn. 8.6) den linearisierten Hamilton-Operator X rk Hk ; H BCS k
bei dem das Modell-Feld Hk eine Komponente parallel zur z-Richtung (3) und ein verallgemeinertes „Mittleres Feld“ (Mittel über Nachbarspins) in der x, yEbene (2,3) besitzt! Zeigen Sie, dass sich der Formalismus der BCS-Theorie ergibt, wenn man die „Mittlere Feld“Komponente mit der Lückenenergie D
des Supraleiters identifiziert und 2Hk in (10.48, 10.49) dem Winkel zwischen effektivem Feld Hk und der z (3)-Richtung entspricht! (c) Leiten Sie unter Zuhilfenahme der „Mittleren Feld“-Näherung (Abschn. 8.6) für die Temperaturabhängigkeit der Magnetisierung eine SelbstkonsistenzBeziehung für die Temperaturabhängigkeit der Supraleiter-Lückenenergie D (T) ab! 10.6 Berechnen Sie die beim Übergang in den supraleitenden Zustand auftretende Energieabsenkung mit (W0BCS–W 0n) (10.53) mit W0n als Energie des normalleitenden Zustandes! Hinweis: Man benutze die Darstellung (10.52 a) für die Energie W 0BCS des BCSGrundzustandes und schreibe dieP auftreten den Summen als Integrale (L –3 ) dk/ 4 p 3) um. Für die Integrationsgrenzen ist zu beachten: u2k 0 fur E < EF0
hxD ;
v 2k 0 fur E > EF0 hxD : Weiter gilt D xD EF0 , und die Zustandsdichte Z (E) in der Nähe der FermiKante wird als konstant angenommen. Man benutze ferner folgende Darstellung der Lückenenergie-Gleichung V0 D 3 Z
EF0 L
h
xD
hxD
D de p ; e2 D2
die aus (10.46 u. 10.49) folgt.
Tafel IX
Tafel IX Einelektronen-Tunneln an Supraleitern
In der Supraleitungsforschung spielen Tunnelexperimente eine wichtige Rolle. Einmal sind sie ein bedeutendes Hilfsmittel zur Bestimmung der Lücke D bzw. 2D im Anregungsspektrum eines Supraleiters, zum anderen liefern inelastische Beiträge zum Tunnelstrom Information über charakteristische Anregungen in der isolierenden Barriere selbst. Tunneln ist ein allgemeines quantenmechanisches Phänomen: Ein atomares Teilchen, z. B. ein Elektron (Masse m ) durchläuft eine Potentialbarriere (Höhe V^ 0, Breite d, Abb. IX.1), obwohl klassisch seine kinetische Energie E nicht ausreichend groß wäre, die Barriere zu überwinden (E < V^ 0). Wellenmechanisch jedoch besteht eine endliche Wahrscheinlichkeit, ein Teilchen im Bereich c hinter der Barriere zu finden, wenn es im Bereich a gegen diese Barriere anläuft (Abb. IX.1). Eine quantitative Beschreibung des Phänomens ergibt sich aus der Lösung der Schrödinger-Gleichung d 2 w 2m 2 Ew 0 dx2 h
IX:1 a
Abb. IX.1. Wellenmechanische Beschreibung des Tunnelpro^0 und der Breizesses durch eine Potentialbarriere der Höhe V te d. Es läuft in Bereich a eine Welle der Amplitude B1 ein, von der ein Teil reflektiert wird (Amplitude A1); ein anderer Teil der Welle (Amplitude B2) dringt in den Bereich b der Potentialbarriere ein und wird dort am anderen Ende zum Teil wieder reflektiert (Amplitude A2) und zum Teil als Tunnelstrom durchgelassen
im Raumbereich a und c sowie d 2 w 2m 2
E V^0 w 0
IX:1 b dx2 h im Raumbereich b. In Bereich a läuft eine Welle ein, die teilweise an der Barriere reflektiert wird, ähnliches gilt für Bereich b. Damit ergeben sich in den verschiedenen Bereichen folgende Lösungen der Schrödinger-Gleichungen (IX.1) wa A1 ei kx B1 e
i kx
mit 1 p 2mE ; h 0 wb A2 ei k x B2 e
IX:2 a
k
mit 1 h wc e k0
i k0 x
q 2m
E V^0 ; i kx
:
IX:2 b
IX:2 c
Die Wellenamplituden sind auf den Bereich c normiert, da dies der interessante Bereich ist. An den Grenzen der Potentialbarriere x = 0 und x = d müssen die Wellenfunktionen (IX.2) und deren Ableitungen stetig ineinander übergehen, weil der Strom insgesamt erhalten bleiben muss. Damit folgen die Bedingungen 1 k0 1 k0 A1 A2 B2 ; 1 1
IX:3 a k k 2 2 1 k0 1 k0 A2 B2 1 1 B1
IX:3 b k k 2 2 für x = 0 und analog für x = d
Tafel IX
350
1 k e 1 2 k0 1 k B2 1 0 e 2 k
A2
Tafel IX Einelektronen-Tunneln an Supraleitern
i
kk0 d
;
IX:4 a
i
k k0 d
:
IX:4 b
Im Hinblick auf ein Tunneln von a nach c interessiert vor allem das Verhältnis der Wellenamplituden in a und c. Durch Einsetzen von A2 und B2 aus (IX.4) in (IX.3) ergibt sich die Amplitude der einlaufenden Welle in a (bezogen auf Bereich c ) zu 1 k0 k 0 1 1 e i
kk d B1 0 k 4 k 0 1 k k 0 1 0 e i
k k d : 1
IX:5 k 4 k Für den bei einem Tunnelexperiment interessierenden Fall E < V^ 0 setzen wir in (IX.2 b) k ' = i j, so dass gilt q 1 0 k ij
IX:6 2m
V^0 E : h Damit folgt für die Aufenthaltswahrscheinlichkeitsdichte des einlaufenden Teilchens in Bereich a bezogen auf die in Bereich c 1 1 k j 2 1 k j 2 B1 B1 cosh 2jd : 2 8 j k 8 j k
IX:7 Die Aufenthaltswahrscheinlichkeit des Teilchens im Bereich a nimmt also annähernd exponentiell (für große jd ) zu mit der im Bereich c vorhandenen. Umgekehrt folgt, dass bei gegebener Intensität der einlaufenden Welle B1 B1 die durch die Barriere hindurchlaufende Welle eine Intensität hat, die annähernd exponentiell mit der Dicke d und der Höhe der Barriere V^0 abklingt wie q 2 d 2m
V^0 E :
IX:8 wc wc exp h Elektronen sind also in der Lage, eine Isolatorschicht zwischen zwei Leitern zu durchtunneln, wenn diese Schicht nur eine genügend geringe Dicke d hat. Der Tunnelstrom durch eine solche Schicht hängt exponentiell von der energetischen Höhe V^0 der Barriere und der kinetischen Ener-
Abb. IX.2 a–e. Schematische Darstellung der Tunnelprozesse von einzelnen Elektronen durch eine isolierende Schicht (Barriere) der Dicke d. Für die normalleitenden Metalle ist jeweils das besetzte Leitungsband mit Fermi-Energie EF schattiert gezeichnet. Supraleiter sind jeweils durch ihren BCS-Grundzustand (einfache Linie auf der Energieachse E ) und die Zustandsdichte der Einteilchenzustände (E > EF+D) charakterisiert. (a) Tunneln einzelner Elektronen zwischen zwei normalleitenden Metallen über eine isolierende Schicht, über die eine äußere Spannung U anliegt. (b) Schematische I–U-Kennlinie für Einelektronen-Tunneln zwischen zwei Normalleitern. (c) Tunnelkontakt zwischen Supraleiter (links) und Normalleiter (rechts) im thermischen Gleichgewicht (U = 0). Ein Cooper-Paar ist im BCS-Grundzustand schematisch angedeutet. (d) Aufbrechen eines Cooper-Paares und elastisches Tunneln eines Einzelelektrons vom Supraleiter in den Normalleiter bei Anliegen einer äußeren Spannung U = D/e. (e) Schematische I–U-Kennlinie für elastisches Tunneln von Einzelelektronen zwischen Supra- und Normalleiter
gie der Teilchen E, d. h. von der anliegenden Spannung am Tunnelübergang ab (IX.8). In realistischen Tunnelexperimenten handelt es sich um zwei elektrische Leiter (z. B. Metalle), die durch eine Isolatorschicht (typisch eine Metalloxidschicht einer Dicke 10–100 Å) voneinander getrennt sind; eine Spannung U zwischen den beiden leitenden Metallen verursacht den Tunnelstrom I (U) , der über große Spannungsbereiche
exponentiell von U abhängt (IX.8). Tunnelexperimente lassen sich sehr gut im Bild des Potentialtopfes (Abb. 6.13) für Metalle (normalleitender Zustand) bzw. bei Supraleitern im Bild der elektronischen Zustandsdichte des Anregungsspektrums eines Supraleiters (Abb. 10.11) diskutieren. Legt man an zwei normalleitende Metalle, die durch eine isolierende Barriere der Dicke d getrennt sind, eine Spannung U, so werden die Fermi-Niveaus um den Betrag e U gegeneinander verschoben. Besetzte elektronische Zustände im negativ vorgespannten Metall stehen leeren Zuständen des anderen Metalls auf gleicher Energie gegenüber, und es kann ein Tunnelstrom über die Barriere fließen (Abb. IX.2 a). Dieser Stromtransport ist weitgehend „elastisch“, da die Elektronen keine Veränderung ihrer Energie beim Übergang erfahren. Für kleine U ist die exponentielle Spannungsabhängigkeit I (U) fast linear (Abb. IX.2 b). Ist das negativ vorgespannte Metall im supraleitenden Zustand (Abb. IX.2 d), so existiert eine Lücke D im Anregungsspektrum zwischen dem BCS-Vielteilchengrundzustand (besetzt mit Cooper-Paaren) und dem Kontinuum der Einteilchenzustände. Bei U = 0 stehen sich nur vollbesetzte Zustände gegenüber, elastisches Tunneln ist nicht möglich (Abb. IX.2 c), da das Aufbrechen eines Cooper-Paares mit einer Energieänderung verbunden ist. Für kleine Spannungen U < D/e ist damit kein Stromfluss möglich. Die Situation ändert sich, wenn die Vorspannung den Wert D/e erreicht, wo das Fermi-Niveau im normalleitenden Metall um D unterhalb des BCS-Grundzustandsniveaus liegt (Abb. IX.2 d). Jetzt wird das Aufbrechen eines Cooper-Paares bei gleichzeitigem Fließen eines Tunnelstromes möglich. Ein Elektron des Cooper-Paares wird in das Kontinuum der Einelektronenzustände im Supraleiter angeregt, während das andere die entsprechende Energie gewinnt, indem es in einen entsprechend tiefer liegenden leeren Zustand des normalleitenden Metalls hinübertunnelt. Von dieser Schwelle an nimmt der Tunnelstrom sprunghaft zu, um dann quasi-linear mit U weiter anzuwachsen (Abb. IX.2 e). Für U > D/e werden immer mehr solcher Aufbrechprozesse von Cooper-Paaren mit kombiniertem Tunneln möglich. Die Messung der Kennlinie I (U) wie in Abb. IX.2 e gibt unmittelbar die Lückenenergie D
351
Tafel IX
Tafel IX Einelektronen-Tunneln an Supraleitern
Abb. IX.3 a–d. Schematische Darstellung der Tunnelprozesse von Einzelelektronen zwischen zwei verschiedenen Supraleitern (D1>D2) , die durch eine Tunnelbarriere der Dicke d getrennt sind. Die Supraleiter sind durch ihre BCS-Grundzustände (einfache Linie auf der Energieachse) und durch die Zustandsdichte der Einteilchenzustände (E > EF+Di) charakterisiert. (a) Tunnelanordnung im thermischen Gleichgewicht (U = 0). (b) Es liegt die äußere Spannung U = (D1–D2)/e an, so dass bei endlicher Temperatur (0 < T < Tc) Einzelelektronen tunneln können. Cooper-Paare können noch nicht aufbrechen. (c) Es liegt die äußere Spannung U = (D1+D2)/e an, so dass im rechten Supraleiter Cooper-Paare aufbrechen können und Tunneln von Einzelelektronen nach links erfolgen kann, unter gleichzeitiger Anregung von Einzelelektronen über die Lücke D2. (d) Schematische I–U-Kennlinien für elastisches Tunneln von Einzelelektronen zwischen zwei Supraleitern. Bei verschwindender Temperatur (T& 0) existieren nur Prozesse des Typs (c) mit einem Einsatz bei (D1+D2)/e, während bei endlichen Temperaturen (0 < T < Tc) zusätzliche Prozesse des Typs (b) möglich sind (gestrichelte Kennlinie)
des Anregungsspektrums des Supraleiters. Ähnlich lässt sich „elastisches“ Tunneln zwischen zwei Supraleitern diskutieren, die durch eine Isolatorschicht getrennt sind (Abb. IX.3). Für kleine Spannungen U (z. B. U = 0 in Abb. IX.3) stehen sich bei gleicher elektronischer Energie E nur entweder leere oder besetzte Zustände (T^0) gegenüber; ein Tunnelstrom kann nicht fließen. Erreicht die Vorspannung U bei T ^ 0 den Wert (D1+D2)/e, so können Cooper-Paare in einem der beiden Supraleiter aufbrechen und Einelektronenzustände in beiden Supraleitern besetzen unter Überwindung der Tunnelbarriere (Abb. IX.3 c); der Tunnelstrom setzt sprunghaft ein (Abb. IX.3 d). Befindet sich der Tunnelübergang bei endlicher Temperatur T, jedoch unterhalb der Sprungpunkte Tc bei-
Tafel IX
352
Tafel IX Einelektronen-Tunneln an Supraleitern
der Supraleiter, so sind die Einelektronenzustände zu einem gewissen Teil besetzt, und oberhalb einer Vorspannung U = (D1–D2) /e kann ein „elastischer“ Tunnelstrom normalleitender Elektronen fließen (Abb. IX.3 b). Die Tunnelcharakteristik I (U) zeigt bei U = (D1–D2)/e ein Maximum (Abb. IX.3 d), weil sich dann die Singularitätspunkte der Einelektronenzustandsdichte auf gleichem Energieniveau gegenüberstehen. Mit wachsender Vorspannung U verschieben sich diese Punkte gegeneinander, der „elastische“ Tunnelstrom nimmt wieder ab bis zur Schwelle (D1+D2)/e. Aus der Messung der Tunnelcharakteristik zwischen zwei Supraleitern bei T j 0 lassen sich gemäß Abb. IX.3 d also die Lückenenergien D1 und D2 bestimmen. Eine einfache Überlegung schließlich zeigt, dass die Tunnelcharakteristiken (Abb. IX.3 d und IX.2 e) symmetrisch um U = 0 sind. Wegen der Wichtigkeit solcher Tunnelexperimente zur Bestimmung der Lückenenergie D sei an dieser Stelle etwas über die experimentelle Realisierung gesagt. Tunnelübergänge werden im allgemeinen durch kreuzweises Aufdampfen zweier Metallfilme erzeugt. Ein erster Aluminiumfilm wird durch eine Maske als Streifen auf eine isolierende Unterlage (Quarz etc.) aufgedampft (Druck < 10–4 Pa). Dann wird die Tunnelbarriere durch oberflächliche Oxidation dieses Films hergestellt. Dazu wird Sauerstoff in die Aufdampfkammer eingelassen (103–104 Pa) oder die Oxidation wird durch eine Glimmentladung bei etwa 10–100 Pa Sauerstoffatmosphäre durchgeführt. Durch eine zweite Maske wird ein zweites Metall als Streifen aufgedampft, diesmal senkrecht zum ersten Metallstreifen orientiert. Typische Widerstände einer solchen Tunnelanordnung liegen im Bereich von 100–1000 X. Die eigentliche Tunnelbarriere zwischen den beiden senkrecht zueinander liegenden Metallstreifen hat eine Fläche von etwa 0,1 bis 0,2 mm2. Nach Fertigstellung dieser „Sandwich“-Anordnung in einem Aufdampfpumpstand wird das kontaktierte „Tunnelpaket“ in einem Kryostaten ähnlich wie in Abb. IV.1 eingebaut und bei tiefen Temperaturen (T < 4 K) die Strom-Spannungscharakteristik I (U) gemessen. Für das Studium neuer oxidischer Supraleiter (Abschn. 9.10) reichen natürlich Temperaturen im Bereich 20–70 K aus. Um die für die Lückenenergien charakteristischen
Schwellen der I (U) Kennlinie (Abb. IX.2 e, IX.3 d) mit höherer Präzision zu ermitteln, empfiehlt sich die Messung der ersten Ableitung dI/ dU oder dU/dI. Dazu kann eine Schaltung wie in Abb. IX.4 a verwendet werden. Der Tunneldiode (TD) wird über eine Gleichspannungsquelle die Vorspannung U aufgeprägt, die über einen Gleichspannungsverstärker auf der x-Achse eines Schreibers registriert wird. Der Gleichspannung U wird eine kleine Wechselspannung v cos x t überlagert (Oszillator x ) und über einen „LockIn“-Verstärker wird die durch den Tunnelkontakt fließende Stromkomponente mit der Frequenz x detektiert und auf der y-Achse des Schreibers registriert. Weil der Gesamtstrom (Überlagerung von Gleich (dc)- und Wechsel (ac)-Komponente) sich darstellt als I
U v cos xt I
U
dI v cos xt dU
1 d2 I 2 v
1 cos 2xt . . . ; 2 dU 2
IX:9
ist das bei der Frequenz x detektierte Signal der Ableitung dI/dU proportional. Im Experiment werden Frequenzen im kHz-Bereich bei Spannungsamplituden von 20 bis 50 lV (bestimmt energetische Auflösung) verwendet. Abbildung IX.5 zeigt als typisches Beispiel die um U = 0 symmetrische Tunnelcharakteristik dI/ dU einer Hg/Al2O3/Al-Tunneldiode, aufgenommen bei 1,21 K [XI.1]. Das abschreckend kondensierte Al liegt in feinkristalliner Form vor, wobei seine Übergangstemperatur Tc je nach Grad der Kristallstörung zwischen etwa 2,5 und 1,8 K liegt (für kompaktes Al ist Tc = 1,18 K). Auf das oxidierte Al, d. h. auf die Al2O3-Isolatorschicht wurde Hg abschreckend kondensiert. Je nach Grad der Kristallstörungen schwankt seine Sprungtemperatur zwischen etwa 4 und 4,15 K. In Abb. IX.5 sind also beide Partner in der Tunneldiode supraleitend. Man sieht qualitativ, dass die Messkurve für U > 0 die 1. Ableitung einer I (U)-Kurve des Typs wie in Abb. IX.3 d (T j 0) darstellt. Die in Abb. IX.5 mit a und b markierten Abstände liefern also unmittelbar die Informationen 2 (DHg+DAl)/e bzw. 2 (DHg–DAl)/e über die Lückenenergien der beiden Supraleiter.
353
Tafel IX
Tafel IX Einelektronen-Tunneln an Supraleitern Abb. IX.4 a, b. Blockschaltbilder zur Messung von Tunnel-Kennlinien. (a) Messanordnung zur Aufnahme der dI/ dU-Kurven (Gap-Kurven) in Abhängigkeit von der Tunnelspannung U im Bereich kleiner Energien e U. Der Tunnelstrom I ist proportional zu der über RV abfallenden Spannung. TD bezeichnet die Tunneldiode. (b) Brückenschaltung zur Aufnahme der dU/dI- und der d 2 U/ dI 2-Kurven in Abhängigkeit von der Tunnelspannung U im Energiebereich e U > D. Die Anordnung eignet sich insbesondere zur Messung kleiner inelastischer Zusatzbeiträge vor dem Hintergrund eines stärkeren elastischen Tunnelstromes. Rd bezeichnet die Widerstandsdekade für den Brückenabgleich, TD die Tunneldiode. (Nach Roll [IX.1])
Neben dem bisher beschriebenen elastischen Tunneln, das zur Bestimmung von Lückenenergien besonders wichtig ist, gibt es sog. inelastische Prozesse, die in höherer Ordnung den Tunnelstrom im Spannungsbereich U > D/e beeinflussen (Abb. IX.6). In der Isolatorbarriere eines Tunnelüberganges gibt es vielfältige Möglichkeiten für das tunnelnde Elektron, Anregungen zu erzeugen. Neben Erzeugung von Gitterschwingungen können Schwingungen eingelagerter Atome oder Fremdstoffmoleküle angeregt werden. Sei h x0 die Anregungsenergie eines solchen eingelagerten Moleküls, so existiert neben dem elastischen „Tunnelpfad“ (1) in Abb. IX.6 a auch der inelastische „Pfad“ (2) für ein Elektron, das nach Aufbrechen eines Cooper-Paares von Supraleiter I nach Normalleiter II hinübergelangt. Dieses inelastische Tunneln (2) unter Anregung einer Molekülschwingung h x0 wird möglich, wenn die angelegte Spannung U den Wert ( hx0 D)/e überschreitet. Die Tunnelcharakteri-
Abb. IX.5. Typische Ableitung dI/dU einer Tunnelcharakteristik für elastisches Einelektronentunneln zwischen zwei Supraleitern (Gap-Kurve), gemessen mit einer Anordnung nach Abb. IX.4 a. Die Messung geschah an einer Hg/Al2O3/AlTunneldiode bei einer Messtemperatur von 1,21 K nach Tempern auf 150 K. Die Pfeile a und b markieren die Abstände 2 (DHg+DAl)/e bzw. 2 (DHg–DAl) /e auf der Spannungsachse. (Nach Roll [IX.1])
Tafel IX Einelektronen-Tunneln an Supraleitern
Tafel IX
354
stik I (U) zeigt von diesem Spannungswert ab eine geringfügige Zunahme ihrer Steigung (Abb. IX.6 b). In der ersten Ableitung dI/dU tritt ein Sprung auf (Abb. IX.6 c), der jedoch erst in der zweiten Ableitung (Abb. IX.6 d) deutlich als scharfe Bande messbar wird. Die experimentelle Erforschung solcher inelastischer Prozesse geschieht also durch Messung der zweiten Ableitung d 2I/dU 2 oder d 2 U/dI 2 der Tunnelcharakteristik oberhalb der Lückenschwelle D/e. Da sich im interessanten Spannungsbereich der elastische Untergrund gegenüber den inelastischen Beiträgen nur wenig ändert, kann die Messempfindlichkeit gesteigert werden, indem die Tunneldiode in den Mittelzweig einer Wheatstone-Brücke geschaltet wird, die die Grundspannung unterdrückt (Abb. IX.4 b). Die Messung der zweiten Ableitung d 2 U/dI 2 erfolgt gemäß (IX.9) durch Überlagerung einer kleinen Wechselspannung (Frequenz x ) und Detektion auf der doppelten Frequenz 2x mittels „Lock-In“-Technik (Abb. IX.4 b). Abbildung IX.7 zeigt ein inelastisches Tunnelspektrum, das an einer Al/Al2O3/PbTunneldiode aufgenommen wurde, bei der nach
Abb. IX.6 a–d. Schematische Darstellung eines inelastischen Tunnelprozesses zwischen einem Supraleiter I und einem Normalleiter II. (a) Darstellung im Bänderschema; der Supraleiter ist gekennzeichnet durch seinen BCS-Grundzustand (fette Linie) und durch die Einteilchenzustandsdichte (E >EF+D), während für den Normalleiter das besetzte Leitungsband (E < EF) schattiert dargestellt ist. Neben dem elastischen Prozess (1) sind inelastische Prozesse (2) möglich, wenn die Tunnelspannung U den Wert D+ h x0 überschreitet. h x0 ist die Quantenenergie einer charakteristischen Anregung in der Barriere (Molekülschwingung, Phononen usw.). (b) Schematische I–U-Kennlinie für Einelektronen-Tunneln zwischen einem Supraleiter und einem Normalleiter. Bei der Tunnelspannung D/e brechen Cooper-Paare auf und elastische Tunnelprozesse setzen ein, bei ( hxD+D)/e setzen inelastische Prozesse ein. (c) Schematische Darstellung der 1. Ableitung dI/dU der I–U-Kennlinie aus (b). (d) Schematische Darstellung der 2. Ableitung d 2 I/dU 2 der I–U-Kennlinie aus (b)
Abb. IX.7. Inelastisches Tunnelspektrum (2. Ableitung d 2 U/ dI 2) gemessen bei einer Temperatur von 2 K an einem Al/ Oxid/Pb-Tunnelkontakt, bei dem die Al2O3-Schicht vor der Deposition des Pb mit Ameisensäure (HCOOH) aus der Dampfphase „dotiert“ wurde. Der Vergleich mit InfrarotSchwingungsbanden zeigt, dass bei der Adsorption von HCOOH ein Formiat-Ion HCOO– gebildet wird, dessen Schwingungen das Tunnelspektrum erklären. Charakteristisch sind die symmetrische (s) und asymmetrische (a) Streckschwingung der COO–-Gruppe. (Nach Klein et al. [IX.2])
der Oxidation des Al, d. h. auf die Al2O3-Isolatorschicht-Ameisensäure (HCOOH) adsorbiert wurde [XI.2]. Danach wurde die Deckelektrode aus Pb aufgedampft. In der gemessenen d 2 U/dI 2-Kurve werden scharfe Banden beobachtet, die auf inelastische Streuung der tunnelnden Elektronen an Anregungen in oder nahe der Al2O3-Barriere hervorgerufen werden. Neben einer durch Phononenanregung verursachten Bande bei etwa 35 meV werden Schwingungsbanden gefunden, die durch dissoziativ adsorbierte Ameisensäure erklärt werden müssen. Ein Vergleich mit den von unzersetzter Ameisensäure (HCOOH) und mit den von Na-Formiat (HCOONa) her bekannten Infrarot-Banden zeigt deutlich, dass die aus der Dampfphase aufgelassene Ameisensäure auf dem Al2O3 zersetzt wird und als Formiat adsorbiert. Experimente dieser Art werden manchmal zum Studium von Adsorptionsprozessen eingesetzt. Hierbei werden die Tunnelbarrieren jeweils
355
aus dem Material (Isolator) erzeugt, dessen Adsorptionseigenschaften studiert werden sollen. Es sei betont, dass in diesem Zusammenhang die Eigenschaft der Supraleitung von mindestens einer der beiden Tunnelelektroden nur die Rolle spielt, dass der Supraleiter in der Nähe der Lücke (e 0 D) eine starke Singularität in der Zustandsdichte liefert. Dies ermöglicht eine hohe energetische Auflösung (*2 meV) der Schwingungsspektren adsorbierter oder eingelagerter Moleküle.
Literatur IX.1 U. Roll: Diplomarbeit. RWTH Aachen (1976) IX.2 J. Klein, A. Léger, M. Belin, D. Defourneau, M. J. L. Sangster: Phys. Rev. B 7, 2336 (1973)
Tafel IX
Literatur
Tafel X
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
In Tafel IX wurden Tunnelexperimente an Supraleitern vorgestellt, bei denen jeweils einzelne Elektronen durch die Tunnelbarriere hindurchtunneln. Josephson zeigte 1962 zum erstenmal theoretisch, dass auch Cooper-Paare tunneln [X.1]. Bei diesen sog. Josephson-Effekten tritt die für Cooper-Paare, bzw. den BCS-Grundzustand, charakteristische hohe Kohärenz deutlich zu Tage. Die Experimente werden an sehr dünnen Tunnel˚ ) durchgeführt, die zwei Subarrieren (d < 30 A praleiter aneinander koppeln. Hierbei muss die Kopplung genügend schwach sein, d. h. es darf die Aufenthaltswahrscheinlichkeit eines CooperPaares in der Barriere nur sehr gering sein. Experimentell wird dies z. B. in Tunnel-,Sandwich‘Anordnung erreicht, wo eine dünne Oxidbarriere ˚ ) oder auch eine dünne normalleitende (10–20 A Schicht zwei supraleitende Metallfilme trennt (Abb. X.1 a). Auch Mikrobrücken (Abb. X.1 b), d. h. sehr dünne Verbindungen zwischen zwei supraleitenden Materialien, werden verwendet. Eine
Abb. X.1 a, b. Mögliche Ausführungsformen zur Herstellung einer schwachen Kopplung zwischen zwei Supraleitern. (a) Tunnelkontakt, bei dem zwei senkrecht zueinander orientierte supraleitende Streifen durch eine dünne Oxidbarriere (10– ˚ ) oder durch eine dünne normalleitende Metallschicht 20 A ˚ ) voneinander getrennt sind. (b) Mikrobrücke, bei (100–100 A der beispielsweise über lithographische Prozesse und Ätzschritte ein dünner Steg von etwa 1 lm zwischen zwei supraleitenden Schichten herausgearbeitet wird
weitere einfache Realisierung einer solchen Mikrobrücke besteht in einem Punktkontakt, bei dem eine Spitze eines Supraleiters gegen eine Fläche des anderen gedrückt wird. In der Grundschaltung zur Beobachtung der Josephson-Effekte in Abb. X.2 wird eine äußere Spannung Uext über einen äußeren Widerstand R an den „Tunnelkontakt“ S 1/S 2 gelegt. Es kann sowohl der Strom I durch den Kontakt wie auch die über der Tunnelbarriere abfallende Spannung U gemessen werden. Wegen des starken Einflusses von Magnetfeldern auf die hoch kohärenten Cooper-Paar-Zustände (Abschn. 10.7, 10.8) müssen unkontrollierte Magnetfelder im Bereich der Tunnelbarriere stark abgeschirmt werden. Schon das Erdmagnetfeld macht die Beobachtung von Josephson-Effekten unmöglich. In einer Anordnung wie in Abb. X.2 könnten ohne magnetische Abschirmung nur die in Tafel IX diskutierten Einteilchen-Tunneleffekte (Abb. IX.3) beobachtet werden. Für die theoretische Beschreibung der an einem Josephson-Kontakt sich abspielenden Effekte nehmen wir ein vereinfachtes Modell wie in Abb. X.2 a an. Zwei Supraleiter 1 und 2 aus ein und demselben Material seien über eine dünne
Abb. X.2 a, b. Schematische Darstellung einer Anordnung zur Messung des Josephson-Tunneleffektes an einem Kontakt bestehend aus zwei Supraleitern 1 und 2 mit isolierender Barriere (a). Die Schaltung (b) erlaubt die Messung des Tunnelstromes I und der Spannung U, die direkt über der Tunneldiode abfällt (Tunnel-Diodenspannung)
357
Zur Vereinfachung betrachten wir in (X.1) gleiche Supraleiter. Im Sinne einer störungstheoretischen Behandlung nehmen wir an, dass U1 näherungsweise eine Eigenlösung zu H 1 ist. Wir ersetzen also H 1 durch die Energie des supraleitenden Zustandes. Eine Spannung U über der Diode verschiebt die Energien in beiden Supraleitern um q U gegeneinander (q = –2 e). Wenn der Nullpunkt der Energieskala symmetrisch zwischen die beiden Supraleiter in die Barriere gelegt wird, reduziert sich (X.1) auf qU U1 TU2 ; 2 qU ih U_ 2 U2 TU1 : 2
ih U_ 1 Abb. X.3. Strom-Spannungs-Charakteristik einer Pb/PbOx/PbJosephson-Tunneldiode, gemessen in einer Anordnung wie in Abb. X.2. Der aufgeprägte Cooper-Paar-Tunnelstrom ICP steigt mit wachsender externer Spannung Uext bei verschwindender Diodenspannung U bis zu einem Maximalwert I max CP an, um dann in die Einteilchencharakteristik mit endlichem Spannungsabfall über der Diode überzukippen. (Nach Langenberg et al. [X.2])
Tunnelbarriere miteinander verbunden. Die Temperatur sei so niedrig, dass wir nur die Elektronen in ihrem gemeinsamen supraleitenden (BCS)Grundzustand betrachten müssen. In beiden Supraleitern beschreiben dann die Vielteilchenwellenfunktionen U1 und U2 die entsprechenden Cooper-Paar-Zustände. Seien H 1 und H 2 die GesamtHamilton-Operatoren (Energien) der jeweils getrennten Supraleiter, so gilt für das über die Barriere gekoppelte System: @U1 H 1 U1 TU2 ;
X:1 a @t @U2 H 2 U2 TU1 : ih
X:1 b @t Hierbei drückt T die für den Tunnelübergang charakteristische Kopplungskonstante aus. Durch T U2 bzw. T U1 werden die Energiebeiträge in den einzelnen Supraleitern beschrieben, die dadurch zustande kommen, dass die Vielteilchenwellenfunktionen U2 bzw. U1 im jeweils anderen Supraleiter nicht völlig verschwinden (Tunneln des BCS-Zustandes bzw. der Cooper-Paare). Für eine total undurchlässige Barriere (T = 0) ergeben (X.1) zwei ungekoppelte, zeitabhängige Vielteilchen-Schrödinger-Gleichungen für die getrennten Supraleiter. ih
X:2 a
X:2 b
Weil jUj2 = ns/2 = nc die Dichte der Cooper-Paare ist (ns: Dichte der Einzelelektroden), lassen sich die Zustandsfunktionen U1 und U2 (Abschn. 10.8) darstellen als p
X:3 a U1 nc1 ei u1 ; Uz
p i u2 nc2 e ;
X:3 b
wobei u1 und u2 die Phasen der VielteilchenBCS-Wellenfunktionen in den beiden Supraleitern sind. Einsetzen von (X.3) in (X.2 a) ergibt nach Auftrennen und Gleichsetzen von Real- und Imaginärteil die Beziehungen h qU n_ c1 sin u1 nc1 cos u1 hu_ 1 2 2 p T nc1 nc2 cos u2 ;
X:4 a h qU nc1 sin u1 hu_ 1 n_ c1 cos u1 2 2 p T nc1 nc2 sin u2 :
X:4 b Analoge Gleichungen folgen durch Einsetzen von (X.3) in (X.2 b). Multiplikation von (X.4 a und X.4 b) mit cos u1 und sin u1 bzw. mit sin u1 und cos u1 und anschließender Subtraktion beider Gleichungen voneinander liefert zusammen mit den beiden analogen Gleichungen aus (X.2 b) 2 p n_ c1 T nc1 nc2 sin
u2 h
u1 ;
X:5 a
Tafel X
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
Tafel X
358
n_ c2
2 p T nc1 nc2 sin
u2 h
u1 ;
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
X:5 b
bzw. r nc2 cos
u2 nc1 r 1 nc1 cos
u2 u_ 2 T nc2 h 1 u_ 1 T h
u1
qU ; 2h
X:6 a
u1
qU : 2h
X:6 b
Für eine symmetrische Anordnung aus zwei gleichen Supraleitern wie in Abb. X.2 ergibt sich einfach mit nc 1 = nc 2 = nc n_ c1
2T=hnc sin
u2 h
u_ 2
u_ 1
qU :
u1
n_ c2 ;
X:7 a
X:7 b
Diese Gleichungen haben auch bei verschwindender Spannung (U = 0) über der Tunnelbarriere als Lösung einen Stromfluss (n_ c j 0) zur Folge. Experimentell heißt das, unmittelbar nach Schließen des Kontaktes in Abb. X.2 b setzt ein Tunnelstrom von Cooper-Paaren ein, dessen Richtung von sin
u2 u1 (X.7 a), d. h. von der Phasendifferenz der BCS-Vielteilchenzustände in den Supraleitern abhängt. Hierbei fällt keine Spannung U über der Diode ab, obwohl im äußeren Stromkreis die externe Spannung Uext anliegt. Im Kreis wird als Strom der Tunnelstrom ICP gemessen. Durch den Strom entsteht eine Ladungsasymmetrie, die den Strom verhindern würde, wenn nicht die überfließenden Ladungen durch die äußere Batterie auf der einen Seite ersetzt und auf der anderen Seite abgeführt würden. Dadurch bleibt der Tunnelstrom stationär (nc1 = nc2 = nc). Aufgetragen über der Tunneldioden-Spannung U (Abb. X.2 b) hat dieser Josephson-Gleichstrom ICP zunächst nur einen Wert bei U = 0 (Abb. X.3). Mit der äußeren Spannung Uext wächst ICP an bis max zu einem Maximalwert I max CP . Unterhalb von I CP wird er durch Zulieferung über den äußeren Stromkreis eingestellt. Wird dieser maximale Josephson-Strom I max CP bei weiterem Vergrößern von Uext überschritten, so wird der Zustand instabil und es tritt eine Spannung U j 0 an der Tunneldiode auf. Der Strom I stellt sich dann auf den Wert I (R) ein, der aufgrund von Uext , U und dem äußeren Widerstand R aus der Tunnelcharakteristik für Einteilchen-Tunneln zwischen
zwei Supraleitern folgt (Abb. IX.3). Dieser Strom I rührt nicht mehr von tunnelnden Cooper-Paaren her, er resultiert aus tunnelnden Einzelelektronen, die beim Aufbrechen von Cooper-Paaren entstehen. Im Falle einer Mikrobrücke ergibt sich bei Überschreiten von I max CP nicht die in Abb. X.3 dargestellte Tunnelcharakteristik, sondern die I–UKennlinie zeigt dann quasi-ohmsches Verhalten mit einem endlichen Strom auch bei kleinen Spannungen U > 0. Der Maximalstrom I max CP ist nach (X.7 a) so lange stabil, wie sich die Phasenverschiebung (u2 u1 ) zeitlich nicht ändert. Nach (X.7 b) ist dies gegeben, solange keine Spannung U über der Diode abfällt. Beim Zusammenbrechen des Stromes I max CP , d. h. dem Aufbau einer Spannung U, beginnt die Phasenverschiebung zwischen den beiden Zuständen der Supraleiter mit der Zeit t anzuwachsen. Integration von (X.7 b) ergibt mit q = –2 e 1 u1 2eUt Duinit :
X:8 h Dies eingesetzt in (X.7 a) liefert einen Wechselstrom I& CP in der Tunneldiode, der dem Gleichstrom resultierend aus Einelektronen-Tunneln überlagert ist
u2
1 ICP n_ c1 2Tnc sin
xCP t Duinit ; h mit
X:9 a
1 xCP 2eU :
X:9 b h Bei einem typischen Spannungsabfall von etwa 1 mV über der Tunneldiode ergibt (X.9 b) eine Kreisfrequenz xCP für diesen Josephson-Wechselstrom von etwa 3´1012 s–1, d. h. Schwingungen im Bereich von Infrarotlicht-Frequenzen. Josephson-Tunneln von Cooper-Paaren im Zusammenhang mit Magnetfeldern ermöglicht Experimente, die die hohe Kohärenz des supraleitenden Zustands ähnlich wie bei der Interferenz von kohärentem Licht zeigen. Die experimentelle Realisierung der Experimente beruht darauf, dass ein hochkohärenter Suprastrom auf zwei Wege aufgeteilt wird (Abb. X.4), die Josephson-Tunneldioden (a und b ) enthalten. Vereinigung der beiden Stromwege dahinter führt zu einem geschlosse-
359
Y
DujYX
Y 2e ru ds A ds : h X
Abb. X.4. Schema zweier parallel geschalteter Cooper-PaarTunnelbarrieren a und b, durch die die Supraleiter I und II schwach aneinander gekoppelt sind. Die Phasendifferenz zwischen den Gesamt-Cooper-Paar-Wellenfunktionen in I und II, d. h. über dem Ring, kann durch den den Ring durchdringenden magnetischen Fluss (Flussdichte B ) gesteuert werden. Die im Suprastrom (I nach II) gemessenen Oszillationen (Interferenzen) können zur Messung schwacher Magnetfelder benutzt werden (Superconducting Quantum Interferometer Device, SQUID)
nen Umlauf im Suprastromkreis, der nur durch die Tunnelbarriere a und b getrennt ist. An diesen Stellen erfährt gemäß (X.8) die Gesamtwellenfunktion des supraleitenden Zustandes im Bereich I einen Phasensprung gegenüber der im Bereich II. Ohne ein die supraleitende Schleife in Abb. X.4 durchdringendes Magnetfeld (B = 0) seien diese Phasensprünge da bzw. db, d. h. nach (X.7 a bzw. X.9 a) sind die Ströme über die Tunnelbarrieren a und b darstellbar als Ia I0 sin da ;
X:10 a
Ib I0 sin db :
X:10 b
Bei eingeschaltetem Magnetfeld B hingegen bestimmt dieses, bzw. sein Vektorpotential A, auch die Phasendifferenz in den beiden Supraleitern. Dies sieht man leicht, wenn man in der Gleichung für den Suprastrom (10.97) eine Linienintegration längs eines Weges zwischen zwei Punkten X und Y durchführt, der tief im Innern des Supraleiters liegt, d. h. wo js = 0 ist. In diesem Fall gilt für die durch ein magnetisches Vektorpotential A erzeugte Phasendifferenz (Abschn. 9.9):
X:11
X
Damit ergeben sich die Gesamtphasenänderungen der supraleitenden Zustandsfunktion von I nach II auf den beiden Wegen über a bzw. b zu
2e II DujI da A ds ;
X:12 a h a
2e DujIII db A ds :
X:12 b h b
Wegen der Eindeutigkeit der Zustandsfunktion an einem Punkt müssen die beiden Phasensprünge identisch sein und Subtraktion ergibt
2e 2e A ds B df :
X:13 db da h h Hierbei ergeben die in verschiedenem Sinn durchlaufenen Linienintegrale in (X.12) ein Integral über einen geschlossenen Umlauf und schließlich den magnetischen Fluss B·df durch den Ring. Die gesamte Phasendifferenz über dem Ring kann also durch den magnetischen Fluss gesteuert werden. Die Situation ist ähnlich der, dass zwei kohärente Lichtstrahlen (über Wege a und b ) zur Interferenz gebracht werden und ihre relative Phase zueinander durch Verändern der Wegdifferenz gesteuert wird. Das zu erwartende Interferenzphänomen der Supraströme wird offensichtlich, wenn wir den Gesamtstrom I betrachten, der sich aus der Summe der Ströme Ia und Ib unter Berücksichtigung des Magnetfeldes ergibt. Mit der aus (X.13) folgenden willkürlichen Definition von d0 (abhängig von der Natur der Tunnelbarrieren und der anliegenden Spannung) durch
e B df ;
X:14 a da d0 h
e db d0 B df
X:14 b h folgt für den Gesamtstrom
Tafel X
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
Tafel X Cooper-Paar-Tunneln – Josephson-Effekte
Tafel X
360
Abb. X.5. Auftragung des Cooper-Paar-Tunnelstromes durch eine Parallelschaltung von zwei Josephson-Tunnelbarrieren gegen die den Ring durchdringende Magnetflussdichte B (Schaltung nach Abb. X.4). (Nach Jaklevic et al. [X.3])
e I I0 sin d0 B df h
e B df ; sin d0 h
e I 2I0 sin d0 cos B df : h
X:15
Der Suprastrom durch die Parallelschaltung zweier Josephson-Tunnelbarrieren variiert also mit dem durch die supraleitende Schleife dringenden magnetischen Fluss wie der Cosinus des Flusses (X.15). Maxima des Stromes werden erreicht für
ph h N ; N 1; 2; 3 . . . ; (X.16) B df N e 2e
d. h. jeweils wenn ein magnetisches Flussquant (10.101) umschlossen wird. Abbildung X.5 zeigt den experimentell ermittelten Strom durch ein Paar von Josephson-Kontakten in Abhängigkeit vom Magnetfeld zwischen den beiden Kontakten. Die Oszillationen zeigen jeweils ein Flussquant an, sie resultieren aus dem Cosinus-Interferenzterm in (X.15). Anwendungen der hier diskutierten JosephsonEffekte sind naheliegend. Die beiden stabilen Zustände eines Josephson-Kontaktes (ICP j 0 bei U = 0) und Einelektron-Tunnelstrom bei U j 0, Abb. X.3) erlauben den Aufbau von binären Schaltelementen in der Mikroelektronik, z. B. in Rechnerspeichern. Diese Bauelemente sind extrem schnell, müssen jedoch gekühlt werden. Die Möglichkeit der Interferenz zweier Cooper-PaarTunnelströme in zwei parallel geschalteten Josephson-Kontakten (Abb. X.4) hat zum Bau von extrem empfindlichen Magnetometern, sog. SQUID’s (Superconducting Quantum Interferometer Devices), geführt. Selbst Magnetfelder, die mit Hirnströmen verbunden sind, können nachgewiesen werden.
Literatur X.1 B. D. Josephson: Phys. Lett. 1, 251 (1962) X.2 D. N. Langenberg, D. J. Scalapino, B. N. Taylor: Proc. IEEE 54, 560 (1966) X.3 R. C. Jaklevic, J. Lambe, J. E. Mercereau, A. H. Silver: Phys. Rev. 140, A 1628 (1965)
11. Dielektrische Eigenschaften der Materie
Zur Beschreibung der Wechselwirkung elektromagnetischer Strahlung mit dem Festkörper kann man sich, je nach den Erfordernissen, eines mikroskopischen oder makroskopischen Bildes bedienen. Im mikroskopischen Bild würde man z. B. von der Absorption eines Photons durch Erzeugung eines Phonons oder eines ElektronLoch-Paares sprechen. Makroskopisch ist dagegen das Bild der Maxwellschen Theorie, in der der Festkörper durch Materialkonstanten beschrieben wird. Die Verknüpfung beider Beschreibungsweisen wird in diesem Kapitel hergestellt, wobei die Darstellung auf lineare Phänomene beschränkt ist.
11.1 Die dielektrische Funktion Eine spezielle Art der Wechselwirkung eines elektrischen Feldes mit dem Festkörper besteht darin, dass das Feld „quasi-freie“ elektrische Ladungen zum Fließen bringt. Der einfachste Fall eines solchen Transportvorganges, d. h. das Fließen eines Ohmschen Stromes im Metall, wurde in Kap. 9 behandelt. Phänomenologisch führt die Beschreibung auf die Angabe einer materialspezifischen elektrischen Leitfähigkeit r. Eine andere Art der Wechselwirkung des Festkörpers mit elektromagnetischen Feldern besteht darin, dass lokalisierte Ladungen (z. B. stärker gebundene Valenzelektronen im Feld der positiven Kernladung) Dipolmomente ausbilden können. Dem trägt schon die klassische Schreibweise der makroskopischen Maxwell-Gleichungen Rechnung, indem zwei Terme als Ursache von rot H auftreten: rot E
B_ ;
rot H j D_ :
11:1 a
11:1 b
Im Rahmen der Gültigkeit des Ohmschen Gesetzes (Kap. 9) gilt hierbei für Materialien, in denen quasifreie Ladungsträger, d. h. Elektronen oder Löcher, in partiell gefüllten Bändern auftreten: j rE :
11:2
Alle in (11.1) auftretenden Feldgrößen sind i. a. zeitabhängige Größen. Eine Zerlegung nach Frequenzen wird durch die Fourier-Darstellung gewonnen, d. h. für die elektrische Feldstärke E und die dielektrische Verschiebung D gilt:
362
E
t
11. Dielektrische Eigenschaften der Materie 1
E
xe
i xt
D
xe
i xt
dx ;
11:3
1 1
D
t
dx :
11:4
1
Da E (t) und D (t) reelle Funktionen sind, ist
E
x E
x
bzw:
D
x D
x :
11:5
Die Fourier-Koeffizienten D (x) und E (x) sind durch eine frequenzabhängige Dielektrizitätskonstante e0 e (x) verknüpft. Genau wie r ist e (x) im allgemeinen Fall ein Tensor zweiter Stufe, der für isotrope Medien und kubische Kristalle einfach als Skalar darstellbar ist, d. h. D
x e0 e
x E
x :
11:6
In ähnlicher Weise wie wir die Eigenschaften des Festkörpers, die mit r zusammenhängen, als Leitfähigkeitsphänomene bezeichnen, wollen wir die Eigenschaften, die durch die Angabe der Dielektrizitätskonstanten e beschrieben werden, als dielektrische Eigenschaften bezeichnen. Das vorliegende Kapitel behandelt also im wesentlichen atomistische Vorgänge, die die spektrale Abhängigkeit e (x) bestimmen. Formal lassen sich in Wechselfeldern die einen auf die anderen Eigenschaften umschreiben, denn für harmonische Felder (11.3, 11.4) wird aus (11.1 b) rot H
x r E
x
i x e0 e
x E
x :
11:7
Wir können eine frequenzabhängige, verallgemeinerte Leitfähigkeit ~r r
i x e0 e
11:8
definieren, die die dielektrischen Effekte noch mitberücksichtigt. Andererseits lässt sich auch (11.7) auffassen als rot H
x
i e0~e
xx E
x
i x D
x ;
11:9
wobei dann die verallgemeinerte Dielektrizitätskonstante [vgl. (11.9) mit (11.7)] ~e
x e
x i r=e0 x
11:10
Leitfähigkeitsphänomene über den r-Term mitberücksichtigt. Dies wird z. B. explizit im Abschn. 11.9 für das freie Elektronengas im Metall durchgeführt. Der wechselseitigen Austauschbarkeit einer Beschreibung des dielektrischen Verhaltens durch (11.8) oder (11.10) liegt der physikalische Sachverhalt zugrunde, dass sich der Unterschied in der Bewegung von freien und gebundenen Ladungsträgern in Wechselfeldern (x j 0 verwischt. In beiden Fällen ha-
11.1 Die dielektrische Funktion
363
ben wir es mit periodischen Bewegungen zu tun. In einem Gleichfeld (x = 0) ist das Verhalten von freien und gebundenen Ladungsträgern natürlich verschieden, und hier tritt der wesentliche Unterschied von r und e zutage. Wenn wir neben der Zeitabhängigkeit auch noch eine Ortsabhängigkeit von E und D zulassen, so tritt an die Stelle der Fourier-Zerlegung (11.3) bzw. (11.4) eine Zerlegung nach ebenen Wellen. Die dielektrische Funktion e hängt dann von x und dem Wellenzahlvektor k ab. Wir wollen in diesem Kapitel stets nur solche Ortsabhängigkeiten von E und D zulassen, bei denen die Veränderungen von Elementarzelle zu Elementarzelle klein sind. Diese Näherung gilt für die Wechselwirkung mit Licht bis weit in das Ultraviolette hinein, aber natürlich nicht für Röntgenlicht. In der Fourier-Zerlegung treten dann nur lange Wellen auf, d. h. Wellen, für die k G ist. Eine Abhängigkeit der dielektrischen Funktion vom Wellenzahlvektor k braucht dann nicht berücksichtigt zu werden. Die Schreibweise von (11.6) entspricht dem S.I. Maßsystem mit e0 als der Dielektrizitätskonstanten des Vakuums. e (x) ist dann eine i. a. komplexe Funktion ohne Dimension. Sie ist im ganzen Intervall –? < x < ? definiert. Wegen (11.5, 11.6) ist allerdings auch e
x e
x :
11:11 Anstelle der dielektrischen Verschiebung kann man auch die Polarisation P betrachten und eine dielektrische Suszeptibilität v
x e
x
1
11:12
einführen. Die komplexe Funktion v (x) ist analytisch und hat ihre Pole alle in der negativ-imaginären Halbebene (siehe Übung 11.1). Wählt man den in Abb. 11.1 gezeichneten Integrationsweg, so verschwindet das Integral v
x0 dx0 0 :
11:13 x0 x Für sehr große x geht v (x) gegen Null, da die Polarisation dem Feld nicht mehr zu folgen vermag. Zieht man deshalb in der komplexen Ebene den Halbkreis auseinander, so verbleiben nur der
Abb. 11.1. Integrationswege in der komplexen x-Ebene
364
11. Dielektrische Eigenschaften der Materie
Beitrag auf der reellen Achse und das Integral um die Polstelle und man erhält
v
x0 dx0 0 :
11:14 i p v
x P x0 x Hierbei bedeutet P den Hauptwert des Integrals. Zerlegt man e (x) in Real- und Imaginärteil e
x e1
x i e2
x ; so wird aus (11.14) das Gleichungspaar 1
1 e2
x0 dx0 ; e1
x 1 P p x0 x
11:15
11:16
1
e2
x
1 P p
1
1
e1
x0 1 0 dx : x0 x
11:17
Dies sind die sog. Kramers-Kronig-Relationen, die Real- und Imaginärteil der dielektrischen Funktion miteinander verknüpfen. Sie lassen sich verwenden, um aus einer (genauen) Messung des Real- oder Imaginärteils von e (x) in einem weiten Spektralbereich den jeweils anderen Teil der dielektrischen Funktion zu berechnen. Restwerte der Integrale für sehr hohe und sehr niedrige Frequenzen lassen sich meist durch Näherungslösungen für e (x) abschätzen.
11.2 Absorption elektromagnetischer Strahlung Wir wollen die Absorption elektromagnetischer Wellen beim Durchgang durch eine dielektrische Schicht betrachten. Auf diese Weise stellen wir eine Beziehung zwischen den dielektrischen Eigenschaften und einem typischen Absorptionsexperiment her. Die elektromagnetische Welle in einem Dielektrikum werde beschrieben durch ein elektrisches Feld
E E0 e
~ i x
t nx=c
mit der komplexen Brechzahl p ~ n
x n ij e
x ; n2
j2 e1 ;
2 n j e2 :
11:18
11:19
11:20
11:21
Die Vorzeichen des Exponenten in der Fourier-Zerlegung (11.3) und in der Zerlegung von e (x) und ñ (x) sind hier so gewählt, dass e2 und j positive Vorzeichen haben und die Welle beim Fortschreiten in +xRichtung abklingt. Hätten wir die Fourier-Zerlegung mit positiven
11.2 Absorption elektromagnetischer Strahlung
365
Abb. 11.2. Strahlengang beim Durchgang durch eine planparallele Platte
Exponenten eingeführt, so hätte die Brechzahl nach ñ = n–i j mit j > 0 zerlegt werden müssen. Beide Darstellungen sind üblich. Beim Durchgang durch eine planparallele Platte (Abb. 11.2) wird an jeder Grenzschicht ein Teil der elektromagnetischen Welle reflektiert und transmittiert. Für den hier interessierenden Spezialfall senkrechter Inzidenz sind die Transmissions- bzw. Reflexionskoeffizienten für die Amplitude von E : n~ 1 2 2n~ : ; T2 ; R2 n~ 1 n~ 1 n~ 1 Damit wird die Feldstärke im transmittierten Strahl
T1
E
E 0 T1 T2 ei
~nx=cd
1 R22 e2i
~nx=cd . . . ;
E
E 0 T1 T2
ei
~nx=cd : R22 e2i
~nx=cd
1
11:22
(11.23)
Wir diskutieren zwei Grenzfälle. Der erste soll darin bestehen, dass n nur wenig von 1 verschieden ist, wir es also mit einem optisch dünnen Medium zu tun haben: n~ 1 D ;
jDj 1 :
11:24
Dann ist in linearer Näherung T1 T2 * 1 und R 22 * 0, und wir erhalten
E E 0 ei
~nx=cd
11:25
und für die transmittierte Intensität
E E / I I0 e
2jx=cd
11:26
Wegen jDj 1 ist 2 j*e2 I I0 e
e2 x=cd
:
11:27
Für optisch dichte Medien kann (11.23) genähert werden für den Fall der Durchstrahlung einer genügend dünnen Schicht:
366
11. Dielektrische Eigenschaften der Materie
Abb. 11.3. Infrarot-Absorptionsspektrum für 1,2-trans-Dichlorethen [11.1]. Bei nicht zu starker Absorption entsprechen die Absorptionskurven dem spektralen Verlauf von x·e2 (x) an den Eigenresonanzen des Moleküls
nx ~ d 1 : c
11:28
Nach Einsetzen von (11.28) in (11.23) erhält man nach einiger Zwischenrechnung in linearer Näherung e2 x d... :
11:29 I I0 1 c Die Größe xe2
x
11:30 c wird auch Absorptionskonstante genannt. Sie bestimmt den spektralen Verlauf der absorbierten Intensität und enthält als frequenzabhängigen Faktor im wesentlichen den Imaginärteil von e (x). Abbildung 11.3 zeigt ein typisches Absorptionsspektrum für Dichlorethen [11.1]. Die Absorptionsmaxima entsprechen Maxima in e2 (x) bei den Frequenzen der Eigenschwingungen von Dichlorethen. In den folgenden Kapiteln sollen nun die spektralen Eigenschaften der dielektrischen Funktion mit den atomistischen Eigenschaften des Systems verknüpft werden. Die Gln. (11.27) bzw. (11.29) stellen eine besonders einfache Verknüpfung von Experiment und dielektrischen Eigenschaften des Systems dar. Im Prinzip ist natürlich auch die spektrale Abhängigkeit des Reflexionsvermögens eines Festkörpers durch e (x) bestimmt. Die mathematischen Zusammenhänge sind hier aber komplizierter, da in das Reflexionsvermögen e1 und e2 eingehen. Eine Berechnung von e1 und e2 aus dem Reflexionsvermögen ist deshalb nicht möglich, es sei denn, man kennt den Verlauf im ganzen Spektralbereich und kann die Kramers-Kronig-Relationen (11.16 und 11.17) verwenden. K
x
11.3 Die dielektrische Funktion für harmonische Oszillatoren
367
11.3 Die dielektrische Funktion für harmonische Oszillatoren Wir wollen die dielektrischen Eigenschaften von einem harmonischen Oszillator studieren, bei dem die Auslenkung u aus der Gleichgewichtslage zu einem Dipolmoment p eu
11:31
führt. Man bezeichnet e als die effektive Ionenladung, die nicht notwendigerweise gleich der Ladung ist, die das statische Dipolmoment des Oszillators ausmacht. Ein solches Dipolmoment tritt z. B. auf, wenn man die aus positiven und negativen Ionen gebildeten Untergitter eines Ionenkristalls (z. B. CsCl, s. Abb. 1.6) gegeneinander verschiebt, also beim transversal und longitudinal optischen Phonon bei q = 0. Ein anderes Beispiel sind Eigenschwingungen von Molekülen, soweit sie ein Dipolmoment haben. Die Bewegungsgleichung für den Oszillator mit äußerem Feld E lautet dann u cu_
x20 u
e E : l
11:32
Außerdem gilt für die Polarisation P : N N e u e0 E :
11:33 V V Dabei ist l die reduzierte Masse, N/V die Anzahldichte, die elektronische Polarisierbarkeit und c eine Dämpfungskonstante, die die endliche Lebensdauer der Eigenschwingung beschreiben soll. Streng genommen muss an Stelle des äußeren Feldes E das lokale Feld E loc genommen werden. Dies ist vom äußeren Feld deshalb verschieden, weil die vom Feld erzeugten Dipole ihrerseits einen Feldbeitrag liefern, der zu einer Verstärkung des äußeren Feldes führt (s. Abschn. 11.7). Dies ist besonders bei dichten Medien, also Festkörpern und Flüssigkeiten nicht zu vernachlässigen. Allerdings wird der prinzipielle spektrale Verlauf von e (x) hiervon nicht berührt, weshalb wir die Feldverstärkung zunächst außer acht lassen wollen. Gehen wir in (11.32, 11.33) zur Fourier-Darstellung über, so erhalten wir P
u
x
x20 P
x
x2
i c x
e E
x ; l
N N e u
x e0 E
x : V V
11:34
11:35
Dabei ist die elektronische Polarisierbarkeit im Bereich der Eigenschwingungen des Gitters frequenzunabhängig. Aus (11.34, 11.35) ergibt sich für e (x)
368
11. Dielektrische Eigenschaften der Materie
e
x 1
N 2 V x0
N e2 V e0 l : x2 i c x
11:36
Führen wir die statische Dielektrizitätskonstante est = e (x = 0) und den hochfrequenten Grenzwert e? ein, so erhält man für e (x) die Form e
x e1
x20
est e1 : x20 x2 i c x
11:37
Die Dämpfungskonstante c ist positiv. Andernfalls hätte die Dämpfungskraft in (11.32) das gleiche Vorzeichen wie die Bewegungsrichtung, was zu einem zeitlichen Anstieg der Amplitude führen würde. Durch das Vorzeichen von c ist dafür gesorgt, dass e (x) keine Pole in der positiv imaginären Halbebene aufweist, wovon wir bei der Herleitung der Kramers-Kronig-Relationen schon Gebrauch gemacht hatten (siehe Übung 11.1). Es sei nochmals erwähnt, dass alle Aussagen über Vorzeichen von den gewählten Vorzeichen in der Fourier-Darstellung (11.3) abhängen! Für die weitere Diskussion zerlegen wir e (x) nach Real- und Imaginärteil e1
x e1 e2
x
est
x20
est
x20
e1 x20
x20
x2
x2 2 c2 x2
e1 x20 cx x2 2 c2 x2
;
11:38
:
11:39
ε(ω) !
Der Verlauf von e1 und e2 ist in Abb. 11.4 dargestellt. e2 hat die Form einer gedämpften Resonanzkurve mit der Halbwertsbreite c. Für den praktisch bedeutsamen Fall kleiner Dämpfung c x0 kann noch eine bequeme Näherungsformel für e (x) angegeben werden. Mathematisch gilt die Identität
ε2(ω) γ
ε1(ω)
εst 0
Abb. 11.4. Spektraler Verlauf von e1 (x) und e2 (x) für einen Dipoloszillator
ε∞ ω0
Frequenz ω
ωL
!
11.3 Die dielektrische Funktion für harmonische Oszillatoren
lim
c!0
1 z
ic
P
1 i p d
z : z
369
11:40
Wir wenden dies auf die beiden Pole x = x0 und x = –x0 in (11.37) an und erhalten e
x e1
x20
est e1 p i x0
est e1 d
x x0 2 2 2 x0 x
d
xx0 :
11:41
Man kann sich überzeugen, dass auch diese spezielle Form von e (x) die Kramers-Kronig-Relationen erfüllt, wenn e? = 1 ist und damit die Funktion e (x)–1 für x ? ? verschwindet. Mit dieser Näherung lässt sich die über den Bereich einer Absorptionsbande (s. Abb. 11.3) integrierte Absorption leicht ausrechnen. Für optisch dünne Medien (E loc E ) gilt:
I0 x2 dx d K
xdx pd 0
est e1 :
11:42 ln I
x c Wegen (11.36) ist dies gleich 1
K
xdx 1
N p e2 : v e0 c l
11:43
Für die Anwendung in der Spektroskopie muss berücksichtigt werden, dass in der Regel die Oszillatoren nicht parallel zum E -Feld ausgerichtet sind, sondern im Mittel nur ein Drittel. Integriert man ferner nur über positive Frequenzen, so erhält man 1
1 N p f 2 e2
11:44 K
xdx 6 V e0 c l 0
mit f 2 e 2 = e 2. Der Faktor f gibt das Verhältnis der Oszillatorladung zur Elementarladung e an. In der Spektroskopie wird anstelle der Frequenz häufig die Wellenzahl 1/k benutzt. Dann wird aus (11.43)
1 1 1 N f 2 e2
11:45 K d k k 12e0 c2 V l Dies ist die quantitative Formulierung des Beerschen Gesetzes. Die integrierte Absorption ist also proportional der Anzahldichte der Oszillatoren.
370
11. Dielektrische Eigenschaften der Materie
11.4 Longitudinale und transversale Eigenschwingungen In diesem Abschnitt wollen wir die longitudinalen und transversalen Eigenschwingungen der Polarisation in einem Dielektrikum mit einer Resonanzstelle bei x0, jedoch ohne Dämpfung betrachten. Anstelle der Polarisation P können wir bei einem System von Oszillatoren natürlich auch die Auslenkung u betrachten. Wenn die Laufrichtungen der Wellen mit der positiven x-Richtung angesetzt werden, so stellt Px Px0 e
11:46
i
xt qx
eine longitudinale Welle dar und Py Py0 e
11:47
i
xt qx
eine transversale Welle. Die longitudinale Welle erfüllt also die Bedingungen j 0; rot PL 0 div PL
11:48
während für die transversalen Wellen j 0 div PT 0 rot PT
11:49
gilt. Wir können (11.48 u. 11.49) auch als verallgemeinerte Definition von Longitudinal- und Transversalwellen auffassen. Wir wollen zunächst die longitudinalen Wellen näher betrachten. In einem Dielektrikum ohne Ladungsträger oder anderweitige Raumladung R muss die Divergenz der dielektrischen Verschiebung verschwinden: div D R 0 e0 e
x div E e
x
div P : e
x 1
11:50
Daraus folgt wegen (11.48), dass eine longitudinale Welle als Eigenlösung für die Frequenz existiert, für die e
xL 0
11:51
ist. Ferner ist
EL
1 PL : e0
11:52
Der Feld- und der Polarisationsvektor sind also gerade um 180 ° phasenverschoben. Solche Longitudinalwellen können nicht mit der transversalen Lichtwelle wechselwirken, wohl aber mit Elektronen (s. Abschn. 11.12). Die Eigenlösungen für transversale Wellen müssen im Zusammenhang mit dem vollständigen Satz der Maxwellschen Gleichungen gefunden werden, da sie mit elektromagnetischen Wellen (rot E j 0 ) koppeln
11.4 Longitudinale und transversale Eigenschwingungen
rot E
l0 H_ ;
l 1 ;
rot H D_ :
371
11:53
11:54
Mit einem Wellenansatz gemäß (11.47) erhalten wir nach Ersetzen von E und D durch P mittels der Dielektrizitätskonstanten q Py0 x
xe0 l0 e
x
1Hz0 0 ;
e
x Py0 q Hz0 0 : e
x 1
11:55
11:56
Das Gleichungssystem hat Eigenlösungen für solche Frequenzen x, für die die Determinante verschwindet: x2
1 2 2 cq : e
x
11:57
Diese Eigenlösungen stellen eine Kopplung von elektromagnetischen und mechanischen Wellen dar. Sie tragen die Bezeichnung Polaritonen. Der Verlauf der Polariton-Dispersionsbeziehung (11.57) hängt von der Gestalt von e (x) ab. Wir wollen die Dispersionsbeziehung für den Fall der Ionenstrukturen bzw. für ein System harmonischer Oszillatoren mit der Eigenfrequenz x0 näher diskutieren. Wir setzen also in (11.57) den Ausdruck für e (x) nach (11.37) ohne Dämpfung ein. Es ergeben sich die in Abb. 11.5 gezeichneten Lösungen, die alle transversalen Charakter haben. Für große q strebt der untere Zweig gegen den Grenzwert x0, d. h. die Eigenfrequenz des harmonischen Oszillators entspricht der Frequenz der transversalen Welle für große q und wird deshalb im folgenden xT genannt. Wegen des großen Wertes der Lichtgeschwindigkeit wird allerdings der Wert xT schon in guter Näherung für solche q-Werte erreicht, die immer noch sehr klein (10–4 G) gegen einen reziproken
Abb. 11.5. Dispersionskurven für ein Phonon-Polariton. Der gezeichnete Bereich der q-Werte ist klein gegenüber einem reziproken Gittervektor. Die Gitterdispersion kann deshalb vernachlässigt werden
372
11. Dielektrische Eigenschaften der Materie
Gittervektor G sind (Abb. 11.5). Wäre die Lichtgeschwindigkeit unendlich, so ergäbe sich nur xT als Lösung. Die Dispersion entsteht also durch die verzögernde Wirkung der endlichen Signalgeschwindigkeit elektromagnetischer Wellen. Die Lösung xT = x0 heißt deshalb auch die „unretardierte“ Lösung. Zwischen xT und xL hat (11.57) keine Lösung, aber ein zweiter Zweig existiert für x = xL. Die in Abb. 11.5 gezeigten Phonon-Polaritonen sind Eigenlösungen des Dielektrikums. Sie lassen sich durch Raman-Streuung beobachten (Tafel III). Die korrekte Interpretation eines Absorptionsexperimentes setzt dagegen die Berücksichtigung der Maxwellschen Gleichungen im Innen- und Außenraum und der Grenzbedingungen voraus. Die Grenzbedingungen haben zur Folge, dass sich auch andersartige Polaritonen (siehe auch Abschn. 11.5 und Tafel XIII) als die bisher betrachteten ergeben. Das Problem der Absorption einer dünnen Schicht wurde bereits ohne explizite Berechnung der Eigenlösungen in Abschn. 11.2 gelöst. Dort wurde gezeigt, dass die Absorption einer dünnen Schicht im wesentlichen durch den Verlauf von e2 (x) bestimmt ist. Das Maximum der Absorption liegt dann also bei der Frequenz xT der transversal optischen Phononen. Wir hatten gesehen, dass für nicht zu kleine q-Werte die Frequenz der transversalen Welle gleich der Resonanzfrequenz x0 ist, während die Frequenz der longitudinalen Welle durch die Nullstelle von e1 (x) gegeben ist. Unter Benutzung von (11.37) (c x0) erhalten wir daraus eine wichtige Beziehung x2L est x2T e1
(Lyddane-Sachs-Teller-Relation) ;
11:58
die die Aufspaltung der Frequenz zwischen longitudinaler und transversaler Welle angibt. Die physikalische Ursache für die Verschiebung der longitudinalen Frequenz zu höheren Werten ist die Verstärkung der wirksamen Federkonstante durch das die Longitudinalwellen begleitende Feld (11.52). Ein Kristall, der zwar optische Phononendispersionszweige besitzt (mehr als ein Atom pro Elementarzelle), jedoch wegen des Fehlens einer dynamischen effektiven Ionenladung nicht infrarot-aktiv ist, muss also bei q = 0 eine Entartung der Frequenzen xL und xT aufweisen. Dies ist z. B. für Silizium der Fall (Abb. 4.4).
11.5 Oberflächenwellen eines Dielektrikums Im letzten Abschnitt hatten wir Eigenschwingungen mit Wellencharakter in einem unendlich ausgedehnten Gitter kennengelernt. Wir wollen als Modell für einen endlichen Festkörper den dielektrischen Halbraum betrachten, dessen Begrenzungsfläche die x, yEbene sei. Zusätzlich zu den Volumenwellen gibt es dann spezielle Eigenschwingungen, die bezüglich der x, y-Koordinate Wellencha-
11.5 Oberflächenwellen eines Dielektrikums
373
Abb. 11.6. Feldlinienbild einer Oberflächenwelle an der ebenen Oberfläche eines Dielektrikums
rakter haben, jedoch senkrecht zur Grenzfläche exponentiell abklingen. Wir wollen zur Vereinfachung nur die unretardierten Lösungen suchen, die man formal durch c ? ? erhält. Dann ist also stets rot E 0 :
11:59
Da wir nicht wieder die schon bekannten longitudinalen Volumenlösungen erhalten wollen, setzen wir abweichend von (11.48) auch div E 0 ;
z j 0:
fur
11:60
Die beiden Bedingungen (11.59 u. 11.60) sind erfüllt, wenn sich E als Gradient eines Potentials u schreiben lässt, für das die LaplaceGleichung gilt Du 0 ;
fur
z j 0:
11:61
Offenbar wird die Laplace-Gleichung im Außen- und Innenraum durch Oberflächenwellen der Form u u0 e
qjzj i
qx xt
e
11:62
erfüllt. Das zugehörige Feldlinienbild ist in Abb. 11.6 gezeichnet. Im Innern des Dielektrikums (z < 0) ist das Feld mit einer Polarisation verknüpft. Für die Existenz der Lösung muss (11.62) zusätzlich noch die Randbedingung der Stetigkeit der Normalkomponente der dielektrischen Verschiebung erfüllen. @u @u Dz e0 e
x e0
11:63 @z z 5 0 @z z = 0 : Daraus folgt, dass e
x
1
11:64
sein muss. Die Frequenz der Oberflächenwelle liegt also unterhalb der longitudinalen Frequenz xL (Abb. 11.4). Für den harmonischen Oszillator und für Ionengitter ergibt sich est 1 1=2 xS xT :
11:65 e1 1
374
11. Dielektrische Eigenschaften der Materie
Abb. 11.7. Infrarot-Absorptionsspektrum eines dünnen NaCl-Films und von kleinen NaCl-Würfeln von 10 lm Kantenlänge nach Martin [11.3]. Die dünne Schicht absorbiert bei xT = 175 cm–1 (vgl. (11.30, 11.41)). Die zusätzliche Absorption bei 220 cm–1 wird durch ZweiPhononen-Prozesse verursacht. Das Maximum der Absorption bei kleinen Teilchen ist deutlich zu höheren Frequenzen verschoben
Auch für andere Geometrien als den Halbraum (kleine Kugeln, Ellipsoide, dünne Schichten) lassen sich Oberflächenwellen berechnen. Ihre Frequenz liegt immer zwischen xT und xL. Bei Teilchen, deren Abmessungen klein gegen die Wellenlänge sind, macht sich die Existenz von Oberflächenwellen durch eine Lichtabsorption bemerkbar (Abb. 11.7). Die hier berechnete Oberflächenwelle der Ebene ist eine nichtstrahlende Lösung an der Grenzfläche, koppelt also im Fall des dielektrischen Halbraums nicht mit dem Lichtfeld. Eine genaue Diskussion unter Berücksichtigung der Retardierung zeigt, dass die Oberflächenwellen nur für q-Werte rechts der Lichtgeraden existieren. Eine Beobachtung der Oberflächenwelle ermöglicht die Methode der „frustrierten“ Totalreflexion (Tafel XIII). Auch geladene Teilchen (Elektronen) wechselwirken mit den Oberflächenwellen des Dielektrikums (s. Abschn. 11.12).
11.6 Das Reflexionsvermögen des dielektrischen Halbraums Während die Absorption bei Durchstrahlung einer genügend dünnen Schicht nur vom Imaginärteil von e (x) bestimmt wird, gehen in das Reflexionsvermögen sowohl Real- als auch Imaginärteil ein. Der Intensitätsreflexionskoeffizient ist – vgl. auch (11.22) – R
n
12 j2
n 12 j2
:
11:66
Wir wollen den Verlauf des Reflexionskoeffizienten mit der Frequenz für das Ionengitter diskutieren und betrachten dazu zur Vereinfachung zunächst den Fall kleiner Dämpfung. Dann ist für x < xT e (x) reell, und das Reflexionsvermögen steigt mit Annäherung an den Wert xT an bis auf den Grenzwert R = 1 (Abb. 11.8).
11.7 Das lokale Feld
375
Abb. 11.8. Reflexionsvermögen im ungedämpften Fall (theoretisch). Die gestrichelte Linie gibt den experimentell ermittelten Verlauf für einen realen Ionenkristall (InAs) an. (Nach Haas u. Henri [11.4])
Zwischen xT und xL ist e1 reell aber negativ. Deswegen ist der Realteil n der komplexen Brechzahl Null (vgl. (11.19)). Das Reflexionsvermögen bleibt also 1. Oberhalb von xL wird eL > 0. Das Reflexionsvermögen fällt deshalb ab und erreicht bei e1 = +1 den Wert Null. Bei höheren Frequenzen steigt es wieder auf den Grenzwert 2 1/2 2 (e1/2 ? –1) /(e? +1) . Im Bereich, wo e1 < 0 ist, kann die Welle also von außen nicht in das Dielektrikum eindringen. Diese Aussage wird etwas entschärft im Falle endlicher Dämpfung. Trotzdem bleibt das Reflexionsvermögen zwischen xT und xL hoch. Der gemessene Verlauf für das InAs-Gitter in Abb. 11.8 zeigt dieses Verhalten. Bei Vielfachreflexion an Oberflächen bleibt schließlich nur der Bereich zwischen xT und xL übrig. Daher rührt die Bezeichnung „Reststrahlen“, die zur Bezeichnung des Frequenzbandes im Bereich der Phononabsorption auch in der englischsprachigen Literatur verwendet wird.
11.7 Das lokale Feld Nur für einen einzelnen Dipol ist das am Ort des Dipols wirksame Feld gleich dem von außen angelegten. Für viele Dipol-Oszillatoren liefern die von den Nachbar-Dipolen ihrerseits erzeugten Felder einen Zusatzbeitrag, der nur im Grenzfall großer Verdünnung, also gerade nicht bei Festkörpern, vernachlässigt werden kann. Wählen wir das Feld entlang der z-Achse, so ist das lokal wirksame Feld
376
11. Dielektrische Eigenschaften der Materie
E loc E
1 X 3z2i ri2 pi : 4p e0 i ri5
11:67
Die Summe ist dabei über alle Nachbar-Dipole zu erstrecken. Ist pi das Dipolmoment pro Elementarzelle in einem Ionenkristall, so summiert i alle Nachbarzellen. Die Summe in (11.67) ist nur scheinbar kompliziert. Für eine kugelförmige Gestalt und homogene Polarisierung ist nämlich (Aufpunkt im Kugelmittelpunkt) X
pi
i
X x2 X y2 X z2 1 X r2 x2i i i i i p p p p : 5 5 5 5 3 ri5 r r r r i i i i i i i i
11:68
Die Summe in (11.67) verschwindet also in diesem Falle und das lokale Feld im Kugelmittelpunkt ist gleich dem äußeren. Leider entspricht dieser einfache Fall nicht den typisch experimentellen Bedingungen; denn für die Absorption elektromagnetischer Wellen ist die Voraussetzung homogener Polarisation nur für Kugeln mit einem Durchmesser klein gegen die Lichtwellenlänge gegeben. Aber auch bei der Beschreibung transversaler und longitudinaler Wellen ist die Kugelbetrachtung nützlich. Wir können uns nämlich aus dem Festkörper eine Kugel ausgeschnitten denken, innerhalb der die Polarisation näherungsweise homogen ist und die trotzdem noch viele Elementarzellen umfaßt. Voraussetzung ist dann lediglich, dass die Wellenlänge groß gegen die Elementarzelle ist, was für den Bereich der Wechselwirkung mit Licht zutrifft. Innerhalb der gedachten Kugel verschwindet der Beitrag zum lokalen Feld. Außerhalb der Kugel sind die Abstände zum Zentrum schon so groß, dass man mit einer kontinuierlichen Verteilung der Dipole, also mit einer makroskopischen Polarisation P, rechnen kann. Das von dieser Polarisation ausgehende Feld wird durch das Feld der Polarisationsladungen an der Oberfläche der Kugel beschrieben, deren Flächenladungsdichte gleich der Normalkomponente von P ist. RP
11:69
Pn
Die Ladung in einem Breitenring (Abb. 11.9) ist dann dq
P cos h 2p a sin h a d h
11:70
und deren Feldbeitrag im Zentrum der Kugel dE
1 dq cos h : 4p e0 a2
Das gesamte Zusatzfeld
11:71
E P wird damit
p P 1 EP cos2 h sin h dh P 2 e0 3 e0 0
und das lokale Feld
11:72
11.7 Das lokale Feld
377
Abb. 11.9. Polarisation und lokales Feld
E loc E
1 P: 3 e0
11:73
Dieses lokale Feld ist für Ionenkristalle in die Bewegungsgleichung (11.32 u. 11.33) einzusetzen. Anstelle von (11.34 u. 11.35) erhält man damit nach einer Umformung 0 1 1 N 2 e B 2 1 3 e0 V C e 1 2 C E
x u
xB x i c x x ; 0 @ A N 1 N l l 1 1 V 3 3V
11:74 N N e e0 V E
x : u
x
11:75 P
x V 1N 1N 1 1 3V 3V Die sich hieraus berechnende dielektrische Funktion e (x) hat die gleiche Gestalt wie in (11.37), nur die Verknüpfung der makroskopischen Größen xT, est und e? mit den mikroskopischen Eigenschaften des Systems x0, e ist eine andere. Betrachten wir als Beispiel den hochfrequenten Grenzfall (x xT ), so ist offenbar wegen u (x) ? 0 N V e1 1 1N 1 3V oder
11:76
378
11. Dielektrische Eigenschaften der Materie
e1 1 1 N : e1 2 3 V
11:77
Diese nach Clausius-Mossotti benannte Formel verknüpft also die Dielektrizitätskonstante e? mit der elektronischen Polarisierbarkeit.
11.8 Polarisationskatastrophe und Ferroelektrika Durch die Wirkung des lokalen Feldes vermindert sich die transversale Eigenfrequenz des Gitters – s. (11.74) – 1 N 2 e 1 3 e0 V :
11:78 x2T x20 1N l 1 3V Für genügend große effektive Ionenladung e, hohe elektronische Polarisierbarkeit bzw. relativ schwache Kopplung zu den nächsten Nachbarn (kleines x0) kann die transversale Frequenz sogar Null werden. Das mit einer Bewegung eines Ions im Gitter erzeugte lokale Feld ist dann so stark, dass die Kräfte zu den nächsten Nachbarn kleiner sind als die durch das lokale Feld hervorgerufenen Kräfte. Diese treiben das Ion weiter, bis es eine neue Gleichgewichtslage findet. Die dabei auftretenden Kräfte sind in der von uns betrachteten harmonischen Näherung nicht erfaßt. Der neue Zustand des Festkörpers ist durch Zerfallen in Kristallbereiche mit permanenter Polarisation gekennzeichnet. Dieser Effekt wird als Polarisationskatastrophe bezeichnet und der dann eintretende neue Zustand in Analogie zum ferromagnetischen Zustand als der „ferroelektrische“ (obgleich er mit Eisen nichts zu tun hat). Ferroelektrische Stoffe sind die Perowskite (z. B. BaTiO3, SrTiO3) und Hydrogenphosphate oder Arsenate (z. B. KH2PO4). Der ferroelektrische Zustand kann als ein „eingefrorenes“ Transversalphonon aufgefaßt werden. Dieses Einfrieren setzt allerdings voraus, dass die thermische Bewegung des Gitters klein ist. Mit zunehmender Temperatur werden die thermischen Fluktuationen immer größer. Dadurch wird das am Ort eines Ions wirksame Feld immer mehr verkleinert, bis schließlich oberhalb einer kritischen Temperatur Tc die rechte Seite von (11.78) positiv wird. Mit zunehmendem Abstand von der kritischen Temperatur steigt die transversale Frequenz x2T / T
Tc :
11:79
Aufgrund der Lyddane-Sachs-Teller-Relation (11.58) gilt in diesem Bereich für die statische Dielektrizitätskonstante näherungsweise est 1 / T
Tc :
11:80
11.9 Das freie Elektronengas
379
Abb. 11.10. Temperaturverlauf der permanenten Polarisation P, der reziproken statischen Dielektrizitätskonstante e –1 st und des Quadrats der transversalen Fre2 quenz x T für ein Ferroelektrikum (schematisch)
Allerdings bleibt in der Praxis die Dielektrizitätskonstante bei Annäherung an Tc endlich. Eine schematische Darstellung dieser Zusammenhänge ist in Abb. 11.10 gegeben. Wegen ihrer hohen Dielektrizitätskonstanten oberhalb des Curiepunktes haben ferroelektrische Materialien, insbesondere ferroelektrische Keramiken eine große technische Bedeutung als Dielektrika in Kondensatoren. Unterhalb des Curiepunktes haben ferroelektrische Keramiken eine große piezoelektrische Konstante (Übung 5.3). Entsprechende Keramiken mit geeignetem Curiepunkt werden als piezoelektrische Aktuatoren eingesetzt.
11.9 Das freie Elektronengas Das dielektrische Verhalten von Metallen, aber auch von Halbleitern mit höherer Elektronenkonzentration, für Frequenzen um den Bereich des sichtbaren Lichtes wird von den kollektiven Anregungen der freien Ladungsträger maßgeblich bestimmt. Die dielektrische Funktion lässt sich ähnlich wie beim Ionenkristall aus einer Bewegungsgleichung herleiten. Bezeichnen wir mit u eine homogene Verschiebung des gesamten Elektronengases gegen die Ionenrümpfe, so gilt als Bewegungsgleichung n m u c u_
neE ;
11:81
wobei n die Elektronenkonzentration und m die Elektronenmasse ist. Im Gegensatz zu (11.32) enthält (11.81) keine mechanische Rückstellkraft. Die Dämpfungskonstante c ist jetzt mit der Leitfähigkeit r verknüpft, denn für einen stationären Fluss (u 0) gilt j
e n u_
n2 e2 E c
also r j= E
n2 e2 : c
11:82
Aus (11.81) wird damit n m u
n2 e2 u_ r
neE :
11:83
380
11. Dielektrische Eigenschaften der Materie
Nach Übergang zur Fourier-Transformierten folgt daraus n2 e2 2 x u
x n e E
x : nmx i r
x
11:84
Dabei muss auch die Leitfähigkeit als eine Funktion der Frequenz betrachtet werden. Ersetzen wir die Verschiebung u (x) durch die Polarisation P
x
e n u
x ;
11:85
so folgt für die dielektrische Funktion e
x 1
x2p x2p e0 2 x x i r
x
11:86
mit x2p
n e2 : m e0
11:87
Bei schwacher Dämpfung ist xp gerade die Frequenz, wo e (x) = 0 wird. Sie bezeichnet also die Frequenz einer longitudinalen Eigenschwingung des freien Elektronengases. Diese Eigenschwingungen werden Plasmonen genannt. Eine transversale Eigenschwingung gibt es wegen der fehlenden Rückstellkraft nicht, d. h. xT ist gleich Null. Typische Werte für die Plasmon-Energien liegen zwischen 3 und 20 eV. Sie lassen sich aus der Elektronendichte (und einer angenommenen effektiven Masse der Elektronen, Abschn. 9.1) berechnen. Allerdings haben solche Berechnungen nicht viel Wert. In sehr vielen Metallen sind die longitudinalen Eigenschwingungen durch Interbandanregungen (Abschn. 11.10) so stark gedämpft, dass die Plasmonen als Anregung gar nicht mehr definierbar sind. Dort wo sie sich beobachten lassen, ist der Nulldurchgang von e1 (x) durch Interbandübergänge gegenüber dem freien Elektronen-
Abb. 11.11. Reflexionsvermögen im Modell des freien Elektronengases ( h xp = 15,2 eV, r = 3,6 ·105 X–1 cm–1) und für Aluminium (gestrichelte Linie )
11.9 Das freie Elektronengas
381
Abb. 11.12. Reflexion R und Durchlässigkeit D als Funktion der Wellenlänge für eine Sn-dotierte In2O3-Schicht. Die Schichtdicke beträgt 0,3 lm, und die Elektronenkonzentration ist 1,3 ·1021cm–3. kp gibt die Lage der Plasmawellenlänge an. (Nach Frank et al. [11.5])
gasmodell stark verschoben. Immerhin erlaubt der funktionale Verlauf von e (x), so wie er sich aus dem Modell des freien Elektronengases ergibt, eine wichtige universelle Eigenschaft der Metalle qualitativ zu verstehen, nämlich das große Reflexionsvermögen. In Abb. 11.11 ist das Reflexionsvermögen für hxp = 15,2 eV und r = r (x = 0) = 3,6´105 (X cm)–1 aufgetragen. Diese Werte gelten für Aluminium, für das das Modell des freien Elektronengases noch am ehesten zutrifft. Zum Vergleich ist die gemessene Reflexionskurve eingetragen. Der Einbruch bei 1,5 eV wird durch einen Interbandübergang verursacht. Er ist auch die Ursache für eine stärkere Dämpfung, wodurch das Reflexionsvermögen im Bereich des sichtbaren Lichtes und bei höheren Frequenzen nur etwa 90% erreicht. Eine interessante Anwendungsmöglichkeit der Modellvorstellungen des freien Elektronengases ergibt sich bei Halbleitern (s. a. Tafel III). Hier lässt sich die Konzentration freier Elektronen durch Zusätze (s. Kap. 12) in weiten Grenzen einstellen. Dadurch lässt sich die Plasmakante des Reflexionsvermögens variieren. In Abb. 11.12 ist das Reflexionsvermögen für eine dünne In2O3Schicht mit Sn-Zusatz aufgetragen. Eine solche Schicht lässt das sichtbare Licht nahezu ungehindert durch, bietet aber eine wirksame Sperre für infrarote Strahlung. Solche Beschichtungen werden in Na-Dampflampen und für Wärmeschutzfenster eingesetzt [11.5]. Die Beschreibung des Reflexionsvermögens durch das Modell des freien Elektronengases ist hier sehr gut, wenn man die 1 in (11.86) durch das tatsächliche e? im Sichtbaren ersetzt. Der Grund ist, dass In2O3 im Sichtbaren (ohne freie Ladungsträger) keine Absorption aufweist. Die Interbandübergänge beginnen erst bei *2,8 eV. Es sei darauf hingewiesen, dass bei Halbleitern neben den Plasmaschwingungen freier Elektronen auch Plasmaschwingungen der Valenzelektronen existieren. Die Anregungsenergie liegt wie bei vielen Metallen zwischen 10 und 20 eV.
382
11. Dielektrische Eigenschaften der Materie
11.10 Interband-Übergänge Die im Abschn. 11.9 behandelte kollektive Anregung des freien Elektronengases wurde in einer klassischen Weise behandelt. Dies ist auch in dem einfachen Modell des freien Elektronengases nur möglich, solange man sich nicht für die sog. räumliche Dispersion, d. h. die k-Abhängigkeit von e (x, k), interessiert. Andernfalls treten die Anregungen von Elektronen innerhalb eines nicht vollständig aufgefüllten Bandes hinzu. Man spricht auch von IntrabandÜbergängen, die das e (x, k) des freien Elektronengases bedingen. Bei genügend hohen x können Übergänge zwischen Zuständen verschiedener Bänder stattfinden. In diesem Fall spricht man von Interband-Übergängen. Entsprechend der diskreten Natur der erlaubten und verbotenen Energiebänder muss man eine energetisch diskrete Struktur dieser Anregungsprozesse und des daraus resultierenden e (x)-Verlaufes erwarten. Im Rahmen der Näherung des stark gebundenen Elektrons (Abschn. 7.3) sind diese InterbandÜbergänge nichts anderes als Anregungen zwischen besetzten und unbesetzten Energietermen der Kristallatome, wobei infolge der interatomaren Wechselwirkung die diskreten Energieniveaus des Einzelatoms zu Bändern aufgespalten sind. Eine adäquate Beschreibung der daraus resultierenden Funktion e (x) ergibt sich also durch Summation über alle möglichen Einzelanregungen. Eine Einzelanregung wäre beispielsweise ein Übergang aus einem besetzten 1 s- in ein unbesetztes 2 p-Energieniveau eines Na-Atoms. Die Modifikation durch die Kristallstruktur drückt sich dann aus in der Aufspaltung der 1 s- und 2 p-Niveaus. Der Zusammenhang zwischen der makroskopischen dielektrischen Funktion e (x) und dem Elektronen-Anregungsspektrum soll jetzt anhand einer quantenmechanischen Rechnung näher verdeutlicht werden. Wie in diesem ganzen Kapitel wollen wir auch hier die Wellenlänge des anregenden Lichtes als groß gegen die atomaren Dimensionen (Gitterkonstante) betrachten. Dann kann in der Schrödinger-Gleichung die Ortsabhängigkeit des elektromagnetischen Feldes vernachlässigt werden. Leider ist auch dann eine direkte störungstheoretische Behandlung der Absorption nicht möglich, da ja der „Störung“, nämlich der elektromagnetischen Welle, Energie entzogen wird. Außerhalb der eigentlichen Absorption ist es dagegen erlaubt, die Eigenschaften des quantenmechanischen Systems im Feld störungstheoretisch zu ermitteln. Wir nehmen dazu an, dass das elektrische Feld die Form
E x E 0x ex cos xt
11:88
habe. Mit einer solchen Störung ist die zeitabhängige SchrödingerGleichung für ein Einelektronenproblem
11.10 Interband-Übergänge
h2 D V
r 2m
1 e E 0x x
eixt e 2
ixt
383
_ t : w
r; t ihw
r;
11:89
Es seien w0 i (r, t) = exp [(–i/h) Ei t ] ui (r) die ungestörten Lösungen, nach denen wir entwickeln können durch den Ansatz X ai
te
i=hEi t ui
r
11:90 w
r; t i
mit zeitabhängigen Koeffizienten ai (t). Wir können jetzt leicht die Zeitableitung von w (r, t) bilden und in (11.89) zusammen mit dem Ansatz (11.90) einsetzen. Wir bilden ferner noch mit einem beliebigen Zustand e
i=hEj t uj
r ein Matrixelement aus der ganzen Schrödinger-Gleichung und erhalten unter Benutzung der Orthonormalität der Lösungen des ungestörten Problems P i h a_j
t 12 e E 0x i h jj jiiai
t
eixt e ixt ei
Ej Ei t=h ;
11:91
x
mit hjj jii uj
rxui
r dr :
x
Wir nehmen an, dass zum Zeitpunkt t = 0 ein bestimmter Zustand i eingenommen war, so dass ai (t = 0) = 1 ist, alle anderen Koeffizienten dagegen Null sind. Dann ist
t i aj
t e E 0x h jj jii
eixt e ixt ei
Ej Ei t=h dt 2h 0 i
xji xt e e 1 ei
xji xt 1 ; E 0x h jj jii 2h xji x xji x
x
x
11:92
wobei wir xji = (Ej –Ei) /h eingeführt haben. Mit diesem Ausdruck für die zeitabhängigen Entwicklungskoeffizienten können wir den Erwartungswert des Dipolmomentes in dem gestörten Zustand w (r, t) berechnen, unter Vernachlässigung von quadratischen Termen in den Koeffizienten aj (t) he i dr w
r; te x w
r; t X aj
txij e ixji t aj
txij eixji t exii e
x
j
exii
e E 0x =h
X j
mit
jxij j2
xij ui
rxuj
r dr :
2xji
cos xt x20
x2ji
cos xji t ;
11:93
Der erste Term in dieser Gleichung beschreibt einen feldunabhängigen Anteil des Dipolmomentes, der bei inversionssymmetrischen Systemen verschwindet. Der zweite Term ist linear im Feld und enthält
384
11. Dielektrische Eigenschaften der Materie
einen Anteil, der im Takte des anregenden Feldes schwingt. Er beschreibt also die Polarisierbarkeit des Mediums. Ein weiterer Anteil linear im Feld schwingt mit „atomarer“ Frequenz und tritt deshalb bei einer makroskopischen Messung, die über atomare Frequenzen mittelt, nicht in Erscheinung. Gleichung (11.93) gibt uns also den Realteil der Polarisierbarkeit bzw. e1 (x) –1 für alle Frequenzen, mit Ausnahme der Polstellen selbst, wo die Störungsrechnung auch für beliebig kleine Felder zusammenbricht (vgl. 11.92). Es ist jedoch erlaubt, nunmehr von den analytischen Eigenschaften der komplexen Dielektrizitätskonstanten Gebrauch zu machen und die zugehörigen Imaginärteile, welche die Absorption beschreiben, nach der Kramers-Kronig-Relation (11.17) zu ermitteln. Ziehen wir z. B. die Gleichung (11.41) heran, die bezüglich der Pole dieselbe Struktur wie (11.93) aufweist, so können wir e2 (x) direkt angeben. e2
x
p e2 X jxij j2 fd
hx e0 V ij
Ej
Ei
d
hx
Ej
Ei g :
11:94
Die Summe über i ist dabei die Summe über alle Anfangszustände des Systems im Volumen V und die Summe über j die Summe über alle Endzustände. Aus (11.94) lässt sich für ein Ensemble von Oszillatoren, die sich in Zuständen mit der Quantenzahl n befinden, der n-unabhängige Wert von e2 (x) in Übereinstimmung mit dem klassischen Wert (11.41) herleiten. Dazu muss man lediglich die Werte für die Matrixelemente eines harmonischen Oszillators jxn;n1 j2
n 1 h=2mx0 bzw. jxn;n 1 j2 nh=2mx0 einsetzen (s. Übung 11.7). Wir merken an, dass anstelle des Matrixelementes der Ortskoordinate xij häufig das Matrixelement des Impulsoperators pij = imxxij verwendet wird. Dieser wäre auch direkt in unserer Herleitung erschienen, wenn wir anstelle des elektrischen Feldes E das dazugehörige Vektorpotential A˙ = – E verwendet hätten und den Operator h=i@=@x in der Ortsdarstellung) in der Schrödinger-Gleix
chung durch x +Ax ersetzt hätten. Der Ausdruck für e2 (x) gilt für jedes quantenmechanische System. Speziell für den periodischen Festkörper können wir das Matrixelement des Impulsoperators in (11.94) noch weiter auswerten. Dann können wir nämlich die Zustände (vgl. Abschn. 7.1) durch Bloch-Wellen beschreiben. Zustände werden dann durch die Angabe des Bandes und des k-Vektors charakterisiert. Für die Indizierung der Bänder wollen wir die Indizes i, j beibehalten. Die Blochzustände in der Ortsdarstellung lauten damit
p
p
1 hrji; ki i p uki
rei ki r ; V 1 hrj j; kj i p ukj
rei kj r : V
(11.95)
11.10 Interband-Übergänge
385
Bei der Berechnung des Matrixelements als Integral über den ganzen Raum können wir dann wie im Abschn. 3.6 die Integration aufspalten in ein Integral über die Zelle und eine Summation über alle Zellen 1 X i
kj ki rn hi; ki j j j; kj i hi; ki j j j; kj iZelle e :
11:96 N n
p
p
Wie schon in Kap. 3 diskutiert, liefert die Summe nur Beiträge für kj = ki. Dies ist eine spezielle Form des Wellenzahl- oder Quasiimpulserhaltungssatzes, der uns schon mehrfach als Folge der Gitterperiodizität begegnet ist. Er gilt, wenn man den Wellenzahlvektor des Lichts kL als klein betrachten kann, d. h. aber für Licht bis weit in den ultravioletten Bereich (vgl. Abschn. 4.4). Optische Übergänge, dargestellt im k-Raum, sind also „senkrechte Übergänge“ (Abb. 11.13). Mit dem Quasiimpulssatz können wir e2 (x) weiter auswerten. Die Summation über alle Zustände wird nun als Summation über alle k und alle Bänder ausgeführt p e2 1 X e2
x jhi; kj j j; kij2 d
Ej Ei hx :
11:97 2 2 e0 m x V ijk
p
Ersetzen wir wieder die Summe über k durch ein Integral, so wird daraus
1X 1 ) dk ;
11:98 V k
2p3
p e2 1 X jhi; kj j j; kij2 d
Ej
k Ei
k hx dk : e2
x 3 2 2 e0 m x
2p ij (11.99)
p
Die d-Funktion macht aus dem Raumintegral im k-Raum ein Flächenintegral über eine Fläche konstanter Energiedifferenz Ej (k)–Ei ( k) = h x (vgl. (7.41))
p e2 1 X e2
x jhi; kj j j; kij2 e0 m2 x2
2p3 ij
p
hxEj Ei
dfx jgradk Ej
k
Ei
kj
:
11:100
Der Imaginärteil der dielektrischen Funktion – soweit er von Interband-Übergängen bestimmt ist – setzt sich also aus zwei „Anteilen“ zusammen, einem Matrixelementeffekt und einer „kombinierten Zustandsdichte“
Abb. 11.13. Schematische Darstellung direkter (d) und indirekter (i) Übergänge in einem Bänderschema E (k), das aus zwei atomaren Niveaus E1 und E2 des freien Atoms hervorgegangen ist. E1 (k) sei ein besetztes und E2 (k) ein unbesetztes Band. Die mit ausgezogener Linie gezeichneten Übergänge gehören zu Punkten hoher kombinierter Zustandsdichte. Die Energien der bei den indirekten Übergängen beteiligten Phononen sind vernachlässigt
386
11. Dielektrische Eigenschaften der Materie
Zij
hx
1 3
2p
hxEj Ei
dfx jgradk Ej
k
Ei
kj
:
11:101
Diese Unterteilung ist dann sinnvoll, wenn, wie häufig angenommen, hi; kj j j; ki keine signifikante k-Abhängigkeit zeigt. Die kombinierte Zustandsdichte ist hoch für Energien h x, bei denen die Differenz aus den Energieflächen bei ein- und demselben kWert flach verläuft. An diesen Punkten liegen also, wie auch im Abschn. 5.1 für Phonon-Dispersionszweige und im Abschn. 7.5 für elektronische Bänder gezeigt wurde, sog. kritische Punkte oder Van Hove-Singularitäten. Diese kritischen Punkte verursachen die markanten Strukturen im Verlauf von e2(x) und damit im optischen Absorptionsspektrum. Als Beispiel ist in Abb. 11.14 das aus experimentellen Daten ermittelte e2 (x)-Spektrum für Ge gezeigt. Ähnlich wie bei elektronischen Übergängen am freien Atom unterscheiden wir zwischen erlaubten und verbotenen Übergängen. Erlaubt ist ein Übergang, wenn das Matrixelement (11.96) nicht verschwindet. Nehmen wir z. B. an, dass bei einem Halbleiter das Minimum des Leitungsbandes und das Maximum des Valenzbandes im k-Raum übereinander liegen, dann gilt für die Energie im Leitungsband EL und im Valenzband EV die Entwicklung
p
EL Eg
h2 2 k ; 2 mL
Ev
h2 2 k ; 2 mV
11:102
wobei mV die effektive Masse der Defektelektronen bzw. die negative elektronische effektive Masse im Valenzband ist. Es ergibt sich für die kombinierte Zustandsdichte Ej
Abb. 11.14. Experimentell ermitteltes Spektrum der dielektrischen Funktion e2 (x) für Germanium. C, X und L bezeichnen Punkte der Brillouin-Zone, denen die entsprechenden kritischen Punkte der kombinierten Zustandsdichte zugeordnet werden. Ein großer Beitrag stammt auch von Übergängen entlang der K-Richtung (entspricht [111]). (Vergl. dazu Abb. 7.13). (Nach Phillips [11.6])
E i EL
EV Eg
h2
mL 2
1
1 mV k2
11:103
11.10 Interband-Übergänge
387
und analog zur Berechnung der Zustandsdichte eines freien Elektronengases (Abschn. 6.1) ein Term, der proportional zu (hx Eg 1/2 ist. Dieser Term bestimmt den Verlauf von e2 (x) in der Nähe der Bandkante Eg für den Fall eines erlaubten Überganges. Verschwindet bei einem verbotenen Übergang das Matrixelement an der Bandkante, so lässt sich in der Nähe das Matrixelement nach (hx Eg ) entwickeln; Abbruch nach dem linearen Glied führt also für verbotene Übergänge wegen der wurzelförmigen Abhängigkeit der kombinierten Zustandsdichte zu einer charakteristischen Abhängigkeit e2 (x) * (hx Eg )3/2. Wie Abb. 11.15 zeigt, muss man im allgemeinen jedoch auch k-Abhängigkeiten des Matrixelementes berücksichtigen, so dass die Diskussion mit der kombinierten Zustandsdichte nur einen qualitativen Anhaltspunkt liefern kann. Bislang haben wir die Elektron-Phonon-Wechselwirkung außer acht gelassen. In besserer Näherung kann jedoch das Phonon-System des Kristalls bei einem optischen Übergang nicht als entkoppelt betrachtet werden. Die Matrixelemente (11.96) enthalten dann statt der reinen elektronischen Wellenfunktionen hEi ; ki j die Gesamtwellenfunktion hEi ; ki ; xq ; qj des gekoppelten Elektron-Phonon-Systems, und die Störung muss neben dem Lichtfeld A (x) auch die Wechselwirkung mit dem Phononensystem berücksichtigen. Im Teilchenbild veranschaulicht, haben wir es also mit einer 3-Teilchen-Wechselwirkung zwischen Photon, Elektron und Phonon zu tun. Übergänge dieser Art liefern wesentlich geringere Beiträge als die bisher betrachteten „Zwei-Teilchenstöße“. Sie verlangen auch wieder Erhaltung der Wellenzahl k und Energieerhaltung: Ej
Ei hx hxq ;
11:104
kj
ki kL q :
11:105
Abb. 11.15. Produkt aus Photonenenergie h x und Absorptionskonstante über der Photonenenergie für InSb. Die experimentell ermittelten Punkte (nach Gobeli u. Fan [11.7]) sind verglichen mit Rechnungen für einen direkten erlaubten bzw. verbotenen Übergang. Die beste Beschreibung ergibt sich, wenn bei einem erlaubten Übergang das Matrixelement korrigiert wird (k-Abhängigkeit) und Nicht-Parabolizität des Leitungsbandes berücksichtigt wird. (Nach Johnson [11.8])
388
11. Dielektrische Eigenschaften der Materie
Abb. 11.16. Experimentell bestimmtes Spektrum von e1 (x) (– – –) und e2 (x) (——) von Silber. (Nach Ehrenreich und Philipp [11.9])
Abb. 11.17. Mathematische Zerlegung des experimentell bestimmten e1 (x)Spektrums von Ag aus Abb. 11.16 in einen Anteil e (f) 1 , der auf das freie Elektronengas zurückzuführen ist, und einen Anteil e (d) 1 , der von Interband-Übergängen aus d-Zuständen herrührt
Die Energieerhaltung (11.104) bedeutet nur eine geringfügige Modifikation gegenüber direkten Übergängen, da für Phononen h xq typischerweise um etwa zwei Größenordnungen kleiner ist als die elektronischen Übergangsenergien (Ej–Ei) an kritischen Punkten. Da jedoch Phononen q-Vektoren aus der gesamten Brillouin-Zone beisteuern können, sind indirekte Übergänge wegen (11.105) zwischen beliebigen Anfangs- und Endzuständen der Brillouin-Zone möglich. In Abb. 11.13 sind solche indirekten Übergänge (bezeichnet mit (i)) ohne Berücksichtigung der vernachlässigbar kleinen Phononenenergien h xq eingezeichnet. Markant können solche Übergänge – natürlich nur bei nicht überlagerten direkten Übergängen – zum e2 (x)-Spektrum beitragen, wenn sie zwischen kritischen Punkten des Valenz- bzw. Leitungsbandes stattfinden. Bei Ge handelt es sich beim Einsatz der Interband-Absorption um eine sog. „indirekte Bandkante“, da das Minimum des Leitungsbandes bei L (Abb. 7.13) und das Maximum des Valenzbandes bei C liegt. Allerdings liegt der erste direkte Übergang C25' ? C2 ' bei Ge energetisch nur wenig höher. Dass Interband-Übergänge auch bei Metallen einen wesentlichen Beitrag zu den optischen Spektren liefern, zeigt das Beispiel des Silbers in Abb. 11.16 u. 11.17. Ähnlich wie im Falle des Kupfers liegen bei Silber die energetisch relativ scharfen d-Bänder unterhalb des Fermi-Niveaus. Übergänge aus diesen d-Bändern in Bereiche hoher Zustandsdichte oberhalb des Fermi-Niveaus sind verantwortlich für die Strukturen in Abb. 11.16, die dem Beitrag des freien Elektronengases e f1 (x) (Abb. 11.17) überlagert sind. Auf diese Übergänge ist die charakteristische Farbe einiger „Edelmetalle“ (Ag, Cu, Au) zurückzuführen. Man beachte ferner, dass durch den überlagerten Interband-Übergang der Nulldurchgang von e1 (x) und damit die „Plasmafrequenz“ stark verschoben wird.
11.11 Exzitonen
389
11.11 Exzitonen Bei tiefen Temperaturen findet man an Halbleitern beim Einsatz der optischen Absorption in der Nähe der Bandkantenenergie Eg nur in Ausnahmefällen einen Verlauf von e2 (x), wie er in Abb. 11.14 dargestellt ist. Häufig beobachtet man einen scharf strukturierten Einsatz der optischen Absorption, so wie in Abb. 11.18 für GaAs gezeigt. Diese Strukturen beruhen auf der Anregung sog. Exzitonen. Exzitonen sind Elektron-Loch-Paare, die sich durch die anziehende Coulomb-Wechselwirkung zwischen einem Elektron, das aus einem Valenzbandzustand angeregt wurde, und dem im Valenzband zurückbleibenden Loch bilden können. Die einfachste mathematische Beschreibung eines solchen exzitonischen Zustandes wird durch das sog. Wasserstoffmodell geliefert, in dem sich die möglichen Energiezustände En, K des aneinandergebundenen Elektron-Loch-Paares im wesentlichen durch die Bohrschen Eigenzustände ergeben: le4 1 h2 K 2
11:106 En;K Eg 32p2 h2 e2 e2 n2 2
m m : 0
L
V
Eg tritt als Summand auf, weil der Energienullpunkt üblicherweise an die Valenzbandoberkante gelegt wird. Im Gegensatz zu den Eigenwerten des Wasserstoffatoms muss in (11.106) statt der Elektronenmasse natürlich die reduzierte effektive Masse l * der effektiven Massen von Elektronen (mL) und Löchern (mV) auftreten. Ferner muss die Dielektrizitätskonstante e0 des Vakuums durch die Dielektrizitätskonstante e des Halbleitermaterials modifiziert werden, um der Abschirmung durch die Umgebung Rechnung zu tragen. Da ein solches Elektron-Loch-Paar sich quasi-frei im Kristall
Abb. 11.18. Absorptionskonstante von GaAs gemessen bei 21 K (durchgezogene Kurve ) in der Nähe der Bandlükkenenergie Eg. Der gestrichelte geschätzte Verlauf ergäbe sich ohne das Vorhandensein von Exzitonenanregungen. (Nach Sturge [11.10])
390
11. Dielektrische Eigenschaften der Materie
bewegen kann, muss in der Gesamtenergie dieses Zweiteilchensystems auch die kinetische Energie des Schwerpunktes – dritter Term in (11.106) – auftreten, wobei K der der Schwerpunktsbewegung beider Teilchen entsprechende Wellenvektor ist. Man beachte, dass es sich in (11.106) um Zweiteilchen-Energieniveaus handelt, die nicht ohne weiteres in ein Bänderschema eingezeichnet werden dürfen, in dem ja Einteilchenenergien aufgetragen sind. Jedoch können bei der Anregung eines Elektrons die Energieterme En, K , die knapp unterhalb der Bandkante einsetzen, erreicht werden, ehe die Anregung ins Leitungsband, d. h. die Ionisierung des Exzitons (Abtrennung von Elektron und Loch), stattfindet. Da e bei Halbleitern von der Größenordnung 10 ist, ist das Exzitonenspektrum für K = 0 ein stark komprimiertes Wasserstoffspektrum, dessen Bindungsenergien unterhalb von 0,1 eV liegen. Die räumliche Ausdehnung der Elektronen- und Lochwellenfunktion dieses Exzitons ist aus demselben Grunde weitaus größer als beim Wasserstoffatom (etwa 10 Bohr-Radien). Dies rechtfertigt im nachhinein die Anwendung des einfachen Wasserstoffmodells mit einer makroskopischen Dielektrizitätskonstanten. Im Germanium berechnet man für den niedrigsten direkten Übergang bei C und K = 0 eine exzitonische Bindungsenergie EEX von EEX
le4 32p2 h2 e2 e20
0;0017 eV
11:107
und einen Bohrschen Exzitonenradius von 47´10–8 cm. Der experimentelle Wert für die Bindungsenergie ist –0,0025 eV. In einem optischen Absorptionsexperiment können natürlich nur exzitonische Zustände, mit K % 0 (11.107), angeregt werden, da, wie schon oben angeführt, Lichtquanten nur einen vernachlässigbar kleinen Wellenzahlvektor übertragen können. Wegen des geringen Energieabstandes der Exzitonenzustände von der Bandkante Eg nach (11.107) müssen Messungen, die den exzitonischen Charakter der optischen Absorption zeigen sollen, bei tiefen Temperaturen geschehen. Die hier besprochenen, sog. schwach-gebundenen Exzitonen werden auch als Mott-Wannier-Exzitonen bezeichnet. Der Vollständigkeit halber sei erwähnt, dass in Molekül-, Edelgas- und Ionenkristallen sog. Frenkel-Exzitonen beobachtet werden. Ihre Bindungsenergie liegt im Bereich von 1 eV und im Gegensatz zu den Mott-Wannier-Exzitonen ist die Wellenfunktion des ElektronLoch-Paares an einem Atom bzw. Molekül lokalisiert.
11.12 Dielektrische Energieverluste von Elektronen Zur Untersuchung dielektrischer Eigenschaften hat sich neben optischen Methoden die inelastische Streuung von Elektronen etabliert. Beim Durchgang durch Materie erleiden Elektronen charakteristi-
11.12 Dielektrische Energieverluste von Elektronen
391
sche Energieverluste. Sie können durch Stöße und Resonanzanregungen mit den einzelnen Atomen zustande kommen. Dieser Anteil ist beim Festkörper jedoch klein gegenüber den sog. dielektrischen Energieverlusten. Ihre Beschreibung kann in einem quasiklassischen Modell erfolgen. Sie entstehen nämlich durch die Dämpfung des elektrischen Feldes, welches das Elektron begleitet. Von einem festen Punkt im Festkörper aus betrachtet ist das Feld eines vorbeifliegenden Elektrons zeitabhängig und enthält deshalb in der Fourier-Analyse ein breites Frequenzspektrum. Die einzelnen FourierKomponenten erfahren im Dielektrikum eine Dämpfung und der Energieverlust pro Volumen ist mit E und D aus (11.3 u. 11.4) 8 9 81 9 1
< = <
= _ E E Re x
x D
x dx :
11:108 Ddt Re 2pi : ; : ; 1
1
Diese Energie kann nur aus der kinetischen Energie der Elektronen bezogen werden. Das Elektron wirkt als Quelle einer dielektrischen Verschiebung. Deren Fourierkomponenten lassen sich aus den Bahndaten des Elektrons bestimmen. Die entsprechende Berechnung wollen wir hier nicht durchführen [11.11]. Der Einfluss des Festkörpers auf die Verluste zeigt sich aber schon, wenn wir in (11.108) E (x) durch D (x)/e0e (x) ersetzen 81 9 1
<
= 1 jD
xj2 _ E Ddt 2p x Im dx :
11:109 Re : ; e0 e
x 1
1
In diesem klassischen Bild gibt es zunächst noch keine diskreten Energieverluste. Wir können aber jeder Frequenz x einen diskreten Energieverlust h x zuschreiben. Die Spektralfunktion 1 ; x>0
11:110 I
x / x Im e
x beschreibt dann die Verteilung der Energieverluste. Diese Verlustfunktion hat für den Fall des freien Elektronengases eine sehr einfache und anschauliche Interpretation. Setzen wir nämlich die Dielektrizitätskonstante des freien Elektronengases nach (11.86) ein, so erhalten wir 8 9 x2 e0 > > > < x2 i p x > = r I
x / x Im :
11:111 > x2 e > > :x2 x2 i p 0 x> ; p r Machen wir wieder für den Fall schwacher Dämpfung von der Darstellung durch eine d-Funktion Gebrauch nach (11.41), so erhalten wir p I
x /
d
x 2
xp
d
x xp ;
11:112
392
11. Dielektrische Eigenschaften der Materie
Abb. 11.19. Energieverlustspektrum von 25 keV-Elektronen nach Durchtritt durch eine 500 Å-dicke Aluminiumschicht (nach Geiger u. Wittmaack [11.12]). Der Volumenplasmonverlust ist mit h xp bezeichnet, h x± bezeichnet die Oberflächenplasmonverluste an den beiden (mit einer Oxidschicht bedeckten) Grenzflächen der Folie. Für eine nähere Beschreibung der experimentellen Anordnung s. Tafel XI
d. h. einen Pol bei der Frequenz der longitudinalen Plasmawelle. Wir hatten schon gesehen, dass für Aluminium die Beschreibung als freies Elektronengas besonders gut zutrifft. Deshalb sind die Plasmaverluste in diesem Fall besonders schön ausgeprägt (s. Abb. 11.19). Aber auch bei vielen anderen Materialien hat die Verlustfunktion ein deutliches Maximum, welches dann in Gedanken an das Modell des freien Elektronengases als „Plasmonverlust“ bezeichnet wird. Man kann leicht einsehen, dass eine maximale Wechselwirkung zwischen Elektron und Plasmawelle dann gegeben ist, wenn die Geschwindigkeit des Elektrons mit der Phasengeschwindigkeit der longitudinalen Wellen übereinstimmt. Wie ein Wellenreiter gibt dann das Elektron kontinuierlich Energie ab. Eine quantitative Betrachtung der Resonanzbedingung x=k v el
11:113
führt zum Ergebnis, dass für h xp = 15 eV und eine Elektronen-Primärenergie von 20 keV k*2,7·10–2 Å–1 ist, also klein gegen die Abmessungen der Brillouin-Zone. Das ist auch die Rechtfertigung für die Vernachlässigung der k-Abhängigkeit in e (x). Durch eine Messung der Energieverluste ist es also möglich „optische“ Daten von Festkörpern zu ermitteln. Diese Methode der Energieverlustspektroskopie hat den Vorteil, dass ein breiter Spektralbereich zugänglich ist (vgl. Tafel XI). Elektrische Felder im Festkörper werden nicht nur von Elektronen im Festkörper, sondern auch von Elektronen außerhalb des Festkörpers in der Nähe der Oberfläche desselben erzeugt. Der Abschirmfaktor für das Feld ist dann allerdings nicht 1/e (x), sondern 1/(e (x)+1). Entsprechend wird die Verlustfunktion 1 I
x / x Im :
11:114 e
x 1 Die Verluste werden als Oberflächenverluste bezeichnet. Die Polstelle der Verlustfunktion im Falle schwacher Dämpfung liegt jetzt bei e1 (x) = –1. Dies war aber gerade die Existenzbedingung für
11.12 Dielektrische Energieverluste von Elektronen
393
Abb. 11.20. Energieverluste von 7,5 eVElektronen nach Reflexion an einem Zinkoxidkristall [11.13]. Die Anregungen sind Oberflächenphononen, wie wir sie in Abschn. 11.5 kennengelernt haben. Man kann zeigen, dass die q-Werte der mit Elektronen angeregten Phononen zwar klein gegen die Ausdehnung der Brillouin-Zone, aber groß gegen die q-Werte von Licht sind. Polariton-Dispersion (Abb. 11.5) wird deshalb nicht beobachtet (vgl. auch Tafel XIII)
eine Oberflächenwelle des Dielektrikums. Außerhalb des Mediums regen Elektronen also die in Abb. 11.6 dargestellten Oberflächenwellen (Phononen und Plasmonen) an. Auch solche Verluste lassen sich beobachten. In Abb. 11.19 sind z. B. Oberflächenplasmonen für den Fall einer dünnen (Oxid-bedeckten) Schicht sichtbar. In Abb. 11.20 ist das Verlustspektrum durch Anregung von Oberflächenphononen dargestellt. Das Elektron kann auch Energie aufnehmen, wenn die Temperatur ausreicht, den ersten angeregten Zustand des Phonons mit ausreichender Wahrscheinlichkeit zu besetzen. Der Wellenzahlvektor der angeregten Oberflächenphononen ist bei Anregung durch Elektronen viel größer als bei der Anregung durch Licht (Tafel XIII), allerdings immer noch klein gegen einen reziproken Gittervektor. Das ergibt sich hier aus der Bedingung, dass für optimale Anregung die Phasengeschwindigkeit der Oberflächenwelle x/q gleich der Komponente der Elektronengeschwindigkeit parallel zur Oberfläche v jj sein sollte. Für 5 eV-Elektronen und 45 °-Einfallswinkel errechnet sich z. B. qjj & 1·10–2 Å–1.
Übungen zu Kapitel 11
11.1 Das Kausalitätsprinzip verlangt, dass die elektrische Polarisation eines Mediums zur Zeit t nur von elektrischen Feldern E (t') der Zeit t ' £ t stammen kann. Man zeige, dass dieses Kausalitätsprinzip zur Folge hat, dass die Suszeptibilität v (x) nur Pole in der negativ imaginären Halbebene haben kann. Zum Beweis zeige man durch geeignete Wahl des Integrationsweges, dass P (t): 0 für t ' ³ t ist, wenn v (x) keine Pole in der positiven Halbebene hat. Man beachte, dass als Folge der Trägheit jedes physikalischen Systems v (x) gegen Null geht, wenn x gegen ? strebt. Bei der Betrachtung sei die Fourierdarstellung
E
t
1
E
xe
ixt
11.2 Man zeige, dass die speziellen Formen (11.38) und (11.39) für den Real- und Imaginärteil der dielektrischen Funktion die Kramers-Kronig-Relationen erfüllen. Für die Integration zerlege man x2
u
x; z; t ei
qk x
A x
x1
B x
x2
:
11.3 Berechnen Sie den Realteil von e (x) unter der Annahme, dass die Absorption durch eine Summe von d-Funktionen pX fi
d
x xi d
x xi 2 i dargestellt werden kann!
xt
A e
qk jz d=2j
B eqk jzd=2j :
vorausgesetzt. Wählt man die Fourierdarstellung mit positivem Vorzeichen im Exponenten, so liegen die Pole von v (x) in der positiven imaginären Halbebene.
1 x1
x
11.5 Man berechne die dielektrischen Eigenschwingungen x (qk) einer Schicht der Dicke d, die auf beiden Seiten von Vakuum begrenzt wird! Für das Potential wähle man den Ansatz
dx
1
x
11.4 Berechnen Sie das Reflexionsvermögen bei senkrechtem Einfall für ein freies Elektronengas unter der Annahme starker und schwacher (frequenzunabhängiger) Dämpfung! Wiederholen Sie die Rechnung unter der Annahme einer zusätzlichen Absorptionslinie im Frequenzbereich x xp , d. h. unterhalb der Plasmafrequenz!
Man zeige, dass dieses Potential die Laplace-Gleichung erfüllt! Warum ist das erforderlich? Man beachte, dass E k und D^ für jzj= d/2 stetig sind. Dies führt auf ein Gleichungssystem, das nur eine Lösung für den Fall hat, dass die Determinante verschwindet. Aus dieser Bedingung leite man x (qk ) her! Erklären Sie, warum die Eigenfrequenz gegen Null geht, wenn qk d 1 ist! Diskutieren Sie auch die anderen Grenzfälle! Zeichnen Sie die Äquipotentiallinien für die zwei Lösungszweige für die Fälle qk d1, qk d&1 und qk d 1! 11.6 Der Realteil der Polarisierbarkeit eines Elektronensystems kann geschrieben werden als
x
e2 X fij ; m e0 V i; j x2ij x2
Übungen zu Kapitel 11
wobei xij = (Ei –Ej)/h die Absorptionsfrequenzen und fij die Oszillatorstärken sind (11.93). Im Limes x ? ? können alle Elektronen als frei betrachtet werden. Durch Vergleich mit der Polarisierbarkeit
x eines freien Elektronengases zeige man, dass åj fij = 1 ist! Dies ist der sog. f-Summensatz. Er lässt sich allgemein aus der Vertauschungsregel für Orts- und Impulsoperator [x, p ] = i h beweisen. 11.7 Man berechne e2 (x) für ein Ensemble harmonischer Oszillatoren der Dichte N/V unter Benutzung der Gl. (11.94) p e2 X e2
x jxij j2 e0 V ij fd
hx
Ej Ei d
hx
Ej Ei g ! Man benutze die Operatordarstellung 1=2 h
a a x 2mx0
395
11.9 Man betrachte die dielektrische Funktion e1
x 1
e2 X fij 2 e0 V ij xij x2
und versuche die statische Dielektrizitätskonstante für einen Isolator mit einer Energielücke Eg abzuschätzen! Man nehme dazu an, dass die ganze Oszillatorstärke bei h x = Eg liegt. Abgesehen von einem Faktor von der Größenordnung eins ist das Ergebnis äquivalent dem sog. Penn-Modell, bei dem eine sphärische „Brillouin-Zone“ angenommen wird. Berechnen Sie e1 für Silizium (Eg = 3,4 eV) und Germanium (Eg = 0,85 eV)! Warum ist das Ergebnis für e1 aus diesem Modell höher als der experimentelle Wert? Warum muss man den Wert der direkten Energielücke verwenden? 11.10 Durch komplexe Integration zeige man
e kTF r e 1 y
r e 2 2 e iq r dq ! 2 r 2p q kTF
mit den Erzeugungs- und Vernichtungsoperatoren a + und a. Diese wirken auf einen Zustand mit der Besetzungszahl n gemäß: p a jni n 1jn 1i ; p ajni njn 1i :
Dies ist die Fourierdarstellung eines abgeschirmten Coulomb-Potentials, mit kTF dem Thomas-Fermi-Wellenvektor. Man kann eine dielektrische Funktion im qRaum einführen über das durch ein externes Potential yext (q) induzierte, abgeschirmte Potential y (q):
Man zeige, dass das Ergebnis für e2 (x) unabhängig vom anfänglichen Besetzungszustand des harmonischen Oszillators ist! Warum muss das so sein? Vergleichen Sie das Resultat mit dem klassischen Ergebnis!
y
q
11.8 Man diskutiere e2 (x) für ein Zweiniveausystem mit den Besetzungswahrscheinlichkeiten P0 und P1 für den Grundzustand und angeregten Zustand! Was ist das Ergebnis für P1 > P0? Warum benötigt man mindestens drei Energieniveaus für einen Laser? Welche Bedingungen müssen bei einem Laser für die spontanen Übergänge zwischen den Energieniveaus erfüllt sein?
e 1 1 y
q : 2 2 2 2p q kTF e
q ext
Berechnen Sie e (q)! 11.11 Die Plasmafrequenz einer homogenen Verteilung von positiven Ionen der Masse M ist X2p
ne2 ; Me0
wobei e die Ladung der Ionen und n die Dichte ist. Die rücktreibende Kraft für Plasmawellen (Ladungsdichtewellen) ist gegeben durch das bei Ladungsdichtewellen auftretende elektrische Feld. Dieses sei
396
Übungen zu Kapitel 11
durch die dielektrische Funktion eines freien Elektronengases e (q) abgeschirmt. Berechnen Sie X (q) unter Verwendung der Lösung von Übung 11.10 für e (q) (BohmStaver-Modell)! Diskutieren und zeichnen Sie den Verlauf von X (q)! Welche Bedeutung hat X (q) für q ? 0? Man berechne die Geschwindigkeit longitudinaler Schallwellen für Na, K und Al und vergleiche mit experimentellen Werten! 11.12 Berechnen Sie die Energieverlustfunktion für Elektronenstreuung im Volumen (–Im {1/e}) und an der Oberfläche (–Im {1/(e+1)}) für ein freies Elektronengas und ein Ensemble von harmonischen Oszillatoren der Frequenz x0! Interpretieren Sie das Ergebnis im Zusammenhang mit Abschn. 11.5!
11.13 Als einfaches Modell für einen infrarotaktiven Kristall betrachte man eine zweiatomige lineare Kette aus Atomen mit zwei verschiedenen Massen und entgegengesetzter Ladung. Die Abstände der beiden Atome und die Federkonstanten seien gleich. Elektrostatische Wechselwirkungen zwischen den Ionen sollen vernachlässigt werden. Berechnen Sie die Schwingungsamplitude unter der Wirkung eines elektrischen Feldes E = E 0 e –ixt! Warum ist es erlaubt, die Berechnung auf den Bereich der Brillouin-Zone um q&0 zu beschränken? (a) Man berechne die frequenzabhängige Polarisation P (x) und die dielektrische Funktion e (x) mit und ohne Dämpfung! (b) Leiten Sie die Lyddane-Sachs-TellerRelation für diesen Fall her!
Tafel XI
Tafel XI Spektroskopie mit Photonen und Elektronen
Die weitaus meisten Informationen über den Festkörper hat man aus spektroskopischen Methoden erhalten. Dabei ist die Spektroskopie mit Photonen von besonderer Bedeutung. In Abb. XI.1 werden Intensität und Spektralbereich verschiedener Lichtquellen miteinander verglichen. Aufgetragen ist der typischerweise zur Verfügung stehende Photonenfluss pro eV Spektralbreite. Bei einem solchen Vergleich müssen allerdings die sehr verschiedenen Eigenschaften der Strahlungsquellen berücksichtigt werden. Bei der Kurve für den Schwarzkörperstrahler wurde angenommen, dass Winkelauflösung bezüglich der Einfallsrichtung der Strahlung nicht erforderlich ist bzw. genügend große Proben zur Verfügung stehen. Die Synchrotronstrahlung ist extrem gerichtet. In Abb. XI.1 ist der Photonenfluss für den Speicherring „Doris“ angegeben, der eine nutzbare Winkelapertur von ca. 1 mrad ´ 1 mrad hat. Bei kleineren Maschinen ist die nutzbare Winkelapertur größer. Dann kann die Verwendung der Synchrotronstrahlung auch im fernen Infrarot vorteilhaft sein. Im UV-Bereich haben die Monochromatoren je nach Auslegung und Spektralbereich eine stark schwankende und insgesamt nicht sehr gute Effizienz. Dies soll durch die schraffierte Kurve angedeutet werden. Manche Experimente können auch mit Festfrequenzquellen, Gasentladungslampen und charakteristischer Röntgenstrahlung betrieben werden. Als Beispiel ist in Abb. XI.1 der Photonenfluss der He I-Linie einer Gasentladungslampe aufgeführt. Diese Linie wird bei Photoemissionsexperimenten häufig eingesetzt (vgl. Tafel V). Die Lichtausbeuten sind dann der Synchrotronquelle vergleichbar. Die sehr intensitätsstarken Farbstofflaser stehen leider nur für den Bereich 1–3,6 eV zur Verfügung. Beim Vergleich von Farbstofflasern mit anderen Lichtquellen muss beachtet werden, dass ihre relative Linienbreite (abge-
Abb. XI.1. Typischer Photonenfluss pro eV am Probenort bei verschiedenen Lichtquellen. Dabei wurde eine Probenoberfläche von etwa 1 cm2 zugrunde gelegt. Bei einem Vergleich muss die sehr unterschiedliche Charakteristik der Strahlungsarten beachtet werden. Die Abbildung dient deshalb nur zur qualitativen Orientierung. Synchrotronstrahlung und Laserstrahlung sind sehr stark gerichtet. Sie sind bei Experimenten, in denen hohe Winkelauflösung verlangt wird, besonders vorteilhaft. Bei gewöhnlichen Absorptionsuntersuchungen, die weder Winkelauflösung noch große Auflösung in der Quantenenergie verlangen, kann auch die Verwendung des schwarzen Strahlers günstig sein
Tafel XI Spektroskopie mit Photonen und Elektronen
Tafel XI
398
Abb. XI.2. Elektronenspektrometer für die Transmissionsspektroskopie. (Nach Raether [XI.4])
ments ist in Abb. XI.2 angegeben. Die Energieauflösung ist hier durch die thermische Breite der Kathodenemission (* 0,5 eV) begrenzt, doch sind auch Anordnungen mit Vormonochromatisierung und Gesamtauflösung bis 2 meV realisiert worden [XI.3]. Um die Probe durchstrahlen zu können, muss sie als dünne Folie vorliegen und die Elektronenenergie muss genügend hoch liegen (20–100 keV). Abbildung XI.3 zeigt einen Vergleich des Frequenzverlaufs von e2 (x), wie er aus der Kramers-Kronig-Analyse der Verlustfunktion (Abschn. 11.1) bzw. der lichtoptischen Reflexion erhalten wurde.
Abb. XI.3. Vergleich von e2 (x) für Gold aus Elektronenspektroskopie (ausgezogene Linie) und aus Messungen des optischen Reflexionsvermögens. (Nach Daniels et al. [XI.5])
stimmt) nur etwa 10–6 eV beträgt. Nutzt man diese Energieauflösung nicht, geht der Vorteil hohen Photonenflusses pro eV zum großen Teil verloren (Daten aus [XI.1, XI.2]). Wie in Abschn. 11.12 beschrieben, lassen sich Informationen über das Absorptionsverhalten auch durch Elektronen-Energieverlustspektroskopie gewinnen. Das Schema eines solchen Experi-
Literatur XI.1 C. Kunz: In Photoemission in Solids II, herausgegeben von L. Ley, M. Cardona, Topics Appl. Phys., Vol. 27 (Springer, Berlin Heidelberg 1979) S. 299 ff. XI.2 F. P. Schäfer (Hrsg.): Dye Lasers, 2nd edn. Topics Appl. Phys., Vol. 1 (Springer, Berlin Heidelberg 1973) XI.3 H. Boersch, J. Geiger, W. Stickel: Z. Phys. 212, 130 (1968) XI.4 M. Raether: In Springer Tracts Mod. Phys., Vol. 38 (Springer, Berlin Heidelberg 1965) S. 84 XI.5 J. Daniels, C. v. Festenberg, M. Raether, K. Zeppenfeld: In Springer Tracts Mod. Phys., Vol. 54 (Springer, Berlin Heidelberg 1970) S. 77
Tafel XII
Tafel XII Infrarot-Spektroskopie
Für die Spektroskopie im Infrarot (IR)-Spektralbereich hat sich eine besondere experimentelle Technik herausgebildet. Wegen der weitgehenden Undurchlässigkeit von Glas und Quarz für größere Wellenlängen (k > 4 lm) werden optische Strahlengänge bevorzugt mit Spiegeln aufgebaut. Bis ins mittlere IR (10 lm < k < 100 lm) können in Monochromatoren als dispersive Elemente Prismen aus Alkalihalogeniden (NaF, KCl, KJ usw.) verwendet werden. Ansonsten wird mit metallisch beschichteten Reflexionsgittern gearbeitet. Als Strahlungsquellen dienen bis ins mittlere IR Stäbe aus Siliziumkarbid („Globar“) oder aus Zirkon- und Yttriumoxid („Nernststift“), die elektrisch auf Gelbglut beheizt werden. Im fernen IR (k > 200 lm), wo Quarz wieder durchlässig wird, finden Hg-Hochdrucklampen Anwendung. Auch die Synchrotronstrahlung ist – je nach Maschinenauslegung – etwa ab 50 lm vorteilhaft. Als Detektoren werden Thermoelemente, tiefgekühlte Halbleiter-Photowiderstände und pneumatische Detektoren („Golay-Zelle“: thermische Ausdehnung eines Gasvolumens) verwendet. Das Maximum der thermischen Strahlung bei Zimmertemperatur liegt ungefähr bei k = 10 lm. Abb. XII.1. Schema eines GitterDoppelstrahl-IR-Spektrometers. Der Referenzstrahl (– – –) durchläuft hinter dem sich drehenden Sektorspiegel (Chopper) den gleichen Strahlengang wie der Messstrahl (——) durch die Probe, deren Absorption gemessen werden soll. Für Reflexionsmessungen muss mittels Spiegel der Messstrahl an der Probe zur Reflexion gebracht werden. Wegen der atmosphärischen Wasserdampfabsorption durch Molekülschwingungen muss der gesamte Strahlengang mit getrockneter Luft gespült werden
Diese Hintergrundstrahlung würde jede Messung mit Gleichlicht stören. In IR-Spektrometern (Abb. XII.1) wird deshalb der Strahlengang periodisch unterbrochen („gechoppert“) und das so modulierte elektrische Signal am Empfänger mit einem schmalbandigen und/oder phasenempfindlichen Verstärker („Lock-In“-Verstärker) auf der betreffenden Modulationsfrequenz nachgewiesen. Häufig werden Zweistrahl-Spektrometer verwendet, bei denen ein Referenzstrahl mit dem Messstrahl, der durch die Probe geht, verglichen wird. In Abb. XII.1 werden beide Strahlen über einen Sektorspiegel, der abwechselnd den Referenzstrahl durchlässt und über einen Spiegelsektor den Messstrahl reflektiert, phasenverschoben auf den Detektor gebracht. Die den Intensitäten entsprechenden, zueinander phasenverschobenen elektrischen Signale werden elektronisch getrennt und verglichen. Da im IR nur relativ intensitätsschwache Strahlungsquellen zur Verfügung stehen, hat sich neben der konventionellen Spektroskopie, wo unmittelbar eine Intensitätsverteilung I (x) gemessen wird, die Fourier-Spektroskopie durchgesetzt. Ihr Vorteil beruht darauf, dass während der
Tafel XII Infrarot-Spektroskopie
Tafel XII
400
Vom Empfänger wird also in Abhängigkeit von x im Zeitmittel die Intensität dI
x; x /
jE 1 E 2 j2 dx ;
(XII.2) dI
x; x / I0 T
x I0 T
x cos 2xx=cdx
Abb. XII.2. Schema eines Fourier-Spektrometers nach dem Michelson-Prinzip
Messzeit das gesamte Spektrum – und nicht nur jeweils ein durch die Auflösung begrenzter Bereich innerhalb von Dx – datenmäßig erfaßt und verarbeitet wird. Häufig werden, wie in Abb. XII.2 angedeutet, Michelson-Anordnungen verwendet, um das Messlicht in seine FourierKomponenten zu zerlegen. Hierbei kann ein Spiegel des Michelson-Interferometers mit hoher Präzision parallel um einen Maximalbetrag x0 verschoben werden. Beim Durchstrahlen der Probe soll deren Transmission T (x), d. h. bei wellenlängenunabhängiger Intensität I0 von der Quelle her, dI T
xI0 dx
XII:1
gemessen werden. In Abhängigkeit von der Spiegelverschiebung x sind die elektrischen Feldstärken der beiden miteinander interferierenden monochromap E tischen Lichtbündel I T
x sin xt und 1 0 p E 2 I0 T
x sin
xt 2xx=c.
gemessen. Da die Lichtfrequenzen gleichzeitig verarbeitet werden, empfängt der Detektor bei Beleuchtung mit einem weißen Spektrum I0 in Abhängigkeit von der Spiegelverschiebung x : 1
I
x dI I0
T
xdx 0
1
T
x cos
2xx=cdx :
I0
XII:3
0
Der erste Term ergibt eine Konstante I (?) und der zweite stellt die Fourier-Transformierte der Transmission T (x) dar. Die Messung besteht also darin, den einen Spiegel um x (bis maximal x0) zu verschieben und I (x) zu messen. Die Fourier-Transformation von I (x)–I (?), die auf Computern durchgeführt wird, ergibt dann unmittelbar das Transmissionsspektrum T (x) der Probe. Die Fourier-Transformation wird nur exakt für unendlich große Verschiebungen x. Die Ungenauigkeit, d. h. schließlich die Auflösung Dx dieser Spektroskopie, ist also gegeben durch die maximale Spiegelverschiebung x0 (Dx / c % x –1 0 ).
Bei der Absorption elektromagnetischer Wellen durch einen (kristallinen) Festkörper gilt Wellenzahlerhaltung, d. h. eine Lichtwelle der Frequenz x kann nur durch solche Festkörperanregungen absorbiert werden, die einen Wellenzahlvektor q = x/c haben. Die in Abschn. 11.5 besprochenen Oberflächenwellen existieren z. B. nur für q > x/c. Sie lassen sich also in einem gewöhnlichen Absorptionsexperiment nicht nachweisen, wohl aber mit Hilfe der „frustrierten Totalreflexion“. Abbildung XIII.1 zeigt eine experimentelle Anordnung nach MarAbb. XIII.3. Dispersion von Oberflächenpolaritonen von GaP. xL und xT sind die Frequenzen des longitudinalen bzw. transversalen optischen Phonons, xs die Frequenz des Oberflächenphonons
Abb. XIII.1. Experimentelle Anordnung zur Beobachtung der frustrierten Totalreflexion
Abb. XIII.2. Reflektierte Intensität in der Anordnung nach Abb. XIII.1 als Funktion der Frequenz bei einer GaP-Probe. Der Variationsparameter ist der Einfallswinkel a. Er bestimmt – zusammen mit der Frequenz – die Parallelkomponente des Wellenzahlvektors qk. Die Minima entstehen durch Ankopplung an Oberflächenpolaritonen. Zur optimalen Beobachtung muss die Stärke der Kopplung durch Variation des Luftspaltes d an den Wert von qk angepaßt werden
schall u. Fischer [XIII.1]. Licht wird an der inneren Grenzfläche eines Prismas (hier aus Si) total reflektiert. Parallel zur Oberfläche ist jetzt der Wellenzahlvektor qk = (x/c) n sin (mit n = 3,42). Bei sehr kleinem Luftspalt d kann das exponentiell abklingende Feld im Außenraum des Prismas zur Anregung von Oberflächenwellen in einem GaP-Kristall verwendet werden. Diese Anregung zeigt sich dann als Einbruch der im Prisma reflektierten Intensität (Abb. XIII.2). Je nach dem gewählten Winkel , also je nach qk, treten die Minima bei verschiedenen Frequenzen auf. So kann man die vollständige Dispersionskurve eines Oberflächenpolaritons ausmessen (Abb. XIII.3). Der theoretische Verlauf der Dispersionskurve lässt sich nach den Überlegungen in Abschn. 11.5 bei vollständiger Berücksichtigung der Maxwell-Gleichungen (retardierte Lösungen) ermitteln.
Literatur XIII.1 N. Marschall, B. Fischer: Phys. Rev. Lett. 28, 811 (1972)
Tafel XIII
Tafel XIII Die Methode der frustrierten Totalreflexion
12. Halbleiter
Im Abschn. 9.2 hatten wir gelernt, dass nur ein partiell gefülltes elektronisches Band zum elektrischen Strom beitragen kann. Vollständig gefüllte Bänder leisten ebensowenig einen Beitrag zur elektrischen Leitfähigkeit wie vollständig leere und ein Material, das nur vollständig gefüllte und vollständig leere Bänder aufweist, ist demnach ein Isolator. Ist der Abstand zwischen der Oberkante des höchsten gefüllten Bandes (Valenzband) und der Unterkante des niedrigsten leeren Bandes (Leitungsband) nicht zu groß (z. B. * 1 eV), so macht sich bei nicht zu niedrigen Temperaturen die Aufweichung der Fermi-Verteilung bemerkbar: Ein kleiner Bruchteil der Zustände in der Nähe der Oberkante des Valenzbandes bleibt unbesetzt und die entsprechenden Elektronen befinden sich im Leitungsband. Sowohl diese Elektronen als auch die im Valenzband entstandenen Löcher können elektrischen Strom tragen. In diesem Fall spricht man von einem Halbleiter. In Abb. 12.1 sind die Unterschiede zwischen Metall, Halbleiter und Isolator noch einmal schematisch dargestellt. Die Besonderheit halbleitender Materialien gegenüber Metallen liegt darin, dass die elektrische Leitfähigkeit durch geringfügige Materialzusätze um viele Größenordnungen variiert werden kann. Auch lässt sich durch solche Zusätze der Elektronen- oder Löchercharakter der Leitfähigkeit bestimmen. Auf dieser Besonderheit basiert die gesamte Festkörperelektronik. Wegen ihrer Wichtigkeit wollen wir deshalb den Halbleitern ein besonderes Kapitel widmen.
Abb. 12.1. Termschema für Metall, Halbleiter und Isolator. Metalle haben auch bei T = 0 K ein teilweise besetztes Band (schraffiert). Bei Halbleitern bzw. Isolatoren liegt das Fermi-Niveau zwischen dem besetzten Valenzband und dem unbesetzten Leitungsband
404
12. Halbleiter
12.1 Daten einiger wichtiger Halbleiter Die Ausbildung der Bandstruktur der typischen Elementhalbleiter Diamant (C), Si und Ge hatten wir uns schon im Abschn. 7.3 veranschaulicht: Durch Mischung der s- und p-Wellenfunktionen ergibt sich ein tetraedrisches Bindungsorbital (sp3), das im Bereich des Gleichgewichts-Bindungsabstandes zu einer Aufspaltung in ein bindendes und ein antibindendes Orbital führt. Die bindenden Orbitale bilden das Valenzband, die antibindenden das Leitungsband (Abb. 7.9). Die Aufteilung der insgesamt vier s- und p-Elektronen auf bindende und antibindende Orbitale führt zur vollständigen Auffüllung des Valenzbandes bei vollständig leerem Leitungsband. Das Ergebnis ist also ein Isolator wie Diamant bzw. bei kleinerer Energielücke zwischen Valenz- und Leitungsband ein Halbleiter wie Silizium oder Germanium (Tabelle 12.1). Aus der Darstellung in Abb. 7.9 lässt sich sofort ein wichtiger Sachverhalt für die Energielücke zwischen Valenz- und Leitungsband ablesen: Die Größe der Energielücke muss eine Temperaturabhängigkeit zeigen. Mit wachsender Temperatur vergrößert sich wegen der thermischen Ausdehnung der Gitterabstand. Dann muss sich auch die Aufspaltung zwischen bindenden und antibindenden Zuständen verringern, also die Bandlücke verkleinern. Bei genauerer Betrachtung muss allerdings neben diesem Effekt auch der Einfluss der Gitterschwingungen auf Eg berücksichtigt werden. Insgesamt ergibt sich bei Zimmertemperatur eine lineare Abhängigkeit der Bandlücke von der Temperatur und bei sehr niedrigen Temperaturen eine quadratische Abhängigkeit. Während in der Darstellung der Abb. 7.9 die wichtigen Halbleiter Si und Ge ein qualitativ ähnliches Bild liefern, sind in der E (k)-Darstellung, d. h. im reziproken Raum, die elektronischen Bänder aufgrund der verschiedenen atomaren Eigenschaften (3 s, 3 p- bzw. 4 s, 4 p-Wellenfunktionen) durchaus verschieden. Die Unterschiede lassen sich aus Abb. 12.2 erkennen. Die Kurven entstammen Rechnungen, die an experimentelle Größen wie Bandabstand, Lage der kritischen Punkte und effektive Masse (Bandkrümmung) angepaßt wurden. Aus diesen E (k)-Darstellungen längs Richtungen hoher Symmetrie im k-Raum folgt, dass beide Halbleiter sog. indirekte Halbleiter sind: Der minimale Abstand (Bandlücke Eg) zwischen Leitungs- und Valenzband ist für Zustände mit verschiedenen k-Vek-
Tabelle 12.1. Energiebreite der Lücke (verbotenes Band) zwischen Valenz- und Leitungsband bei Germanium und Silizium
Si Ge
Eg (T = 0 K) [eV]
Eg (T = 300 K) [eV]
1,17 0,75
1,12 0,67
12.1 Daten einiger wichtiger Halbleiter
405
Abb. 12.2. Die Bandstrukturen von Silizium und Germanium. Für Ge ist auch die Spin-Bahnaufspaltung berücksichtigt. (Nach Chelikowsky u. Cohen [12.1]). Beide Halbleiter sind sog. indirekte Halbleiter, d. h., das Maximum des Valenzbandes und das Minimum des Leitungsbandes liegen an verschiedenen Stellen der Brillouin-Zone. Das Minimum des Leitungsbandes liegt bei Silizium auf der C X=[100]-Richtung und bei Germanium auf der C L = [111]Richtung. Man beachte die Ähnlichkeit der Bandverläufe für Ge mit denen aus Abb. 7.13, die aus andersartigen Rechnungen stammen
toren gegeben (C, d. h. k = (0, 0, 0), im Valenzband und k auf [111] bei Ge bzw. k auf [100] bei Si im Leitungsband). Leitungselektronen im Leitungsband, die sich auf den energetisch niedrigsten Zuständen befinden, haben also bei Si k-Vektoren auf den [100]-Richtungen und bei Ge solche auf den [111]-Richtungen. Diese Bereiche des k-Raumes, in denen sich also Leitungselektronen bei Si und Ge befinden, sind in Abb. XV.2 dargestellt. Die Flächen konstanter Energie in diesem Bereich sind Ellipsoide um die [111] bzw. [100]-Richtung, falls man E (k) nur bis
406
12. Halbleiter
zur parabolischen Näherung, d. h. bis zu quadratischen Gliedern in k betrachtet. In der Hauptachsendarstellung (große Hauptachsen sind [100] bei Si und [111] bei Ge) sind die Energieflächen der Leitungselektronen also ! kx2 ky2 kz2 2
12:1 E
k h const : 2mt 2ml Hierbei heißen m t und m l die „transversale“ bzw. „longitudinale“ effektive Masse. Der Nullpunkt der Energieskala ist in das Minimum des Leitungsbandes gelegt worden. Tabelle 12.2. Verhältnisse der transversalen
mt und longitudinalen
ml effektiven Masse zur Masse m des freien Elektrons für Silizium und Germanium
Si Ge
mt =m
ml =m
0,19 0,082
0,92 1,57
Bezogen auf die Elementarmasse m des Elektrons folgen aus Messungen der Zyklotronresonanz die Werte in Tabelle 12.2. Ein detailliertes Studium (s. Tafel XV „Zyklotronresonanz“) der Eigenschaften von Löchern in Si und Ge zeigt, dass die Struktur des Valenzbandmaximums in der Nähe von C (k = 0) komplizierter ist, als aus Abb. 12.2 zu ersehen ist: Neben den auch in Abb. 12.2 zu erkennenden zwei Valenzbändern mit verschieden starker Krümmung bei C existiert ein weiteres Valenzband, das von den beiden anderen nur um einen kleinen Betrag D = 0,29 eV bei Ge bzw. D = 0,044 eV bei Si abgespalten ist. Diese Aufspaltung zweier Bänder rührt her von der Spin-Bahn-Wechselwirkung, die in den Rechnungen für Si in Abb. 12.2 a nicht berücksichtigt ist. Es ergibt sich also für Si und Ge in der Nähe von C der in Abb. 12.3 qualitativ dargestellte Verlauf der Valenzbänder. In „parabolischer“ Näherung
Abb. 12.3. Bandstruktur von Silizium bzw. Germanium in der Nähe der Oberkante des Valenzbandes unter Berücksichtigung der Spin-Bahnaufspaltung D (qualitativ)
12.1 Daten einiger wichtiger Halbleiter
407
lassen sich drei verschiedene effektive Massen von Löchern bei C angeben, die zum Ladungstransport beitragen. Entsprechend den verschiedenen Bandkrümmungen spricht man von schweren und leichten Defektelektronen mit den Massen mSD bzw. mLD. Die Defektelektronen (Löcher) des abgespaltenen Bandes werden oft als „split-off“-Löcher mit der Masse mSOD bezeichnet. Da offenbar die Ausbildung des sp3-Hybrids in der chemischen Bindung von Si und Ge wesentlich für die halbleitenden Eigenschaften ist, liegt es nahe, halbleitende Eigenschaften auch bei anderen Materialien mit tetraedrischer Kristallstruktur, d. h. mit sp3-Hybridisierung, zu vermuten. Aufgrund dieser Überlegung kommt man dann folgerichtig zu einer anderen wichtigen Klasse von Halbleitern, den III–V-Halbleitern, die als Verbindungshalbleiter aus Elementen der III. und der V. Gruppe des Periodensystems aufgebaut sind. Vertreter sind InSb, InAs, InP, GaP, GaAs, GaSb und AlSb. Bei diesen Verbindungskristallen liegt eine gemischt ionogen-kovalente Bindung vor (vgl. Kap. 1). Die Mischbindung kann man sich vorstellen als Überlagerung zweier Grenzstrukturen, der ionischen, bei der durch Elektronenübertritt vom Ga zum As eine Ionenstruktur Ga+ As– entsteht, und der kovalenten, bei der infolge Elektronenverschiebung vom As zum Ga sowohl Ga als auch As nun vier Elektronen in der äußeren Schale haben und somit genau wie Si und Ge einen sp3-Hybrid ausbilden können. Letztere kovalente Struktur ist offenbar stärker in der Mischbindung vertreten, denn sonst läge kein tetraedrisch gebundener Kristall mit ZnS-Struktur vor. Im Gegensatz zu den Elementhalbleitern haben die wichtigsten Vertreter der III–V-Halbleiter eine sog. direkte Bandlücke, d. h. Va-
Abb. 12.4. Bandstruktur von GaAs als eines typischen III–V-Halbleiters. (Nach Chelikowsky u. Cohen [12.1])
408
12. Halbleiter
Tabelle 12.3. Bandlücke Eg, effektive Masse m und Spin-Bahnaufspaltung D für einige III–V Halbleiter: m Masse des freien Elektrons, m n effektive Masse der Elektronen, m LD effektive Masse der leichten Löcher, mSD der schweren Löcher, mSOD der „split-off“-Löcher. Die Werte hängen etwas von der Meßmethode ab
GaAs GaSb InSb InAs InP
Eg (0 K) [eV]
Eg (300 K) [eV]
1,52 0,81 0,24 0,43 1,42
1,43 0,7 0,18 0,35 1,35
m n/m
mLD /m
mSD /m
mSOD /m
D [eV]
0,07 0,047 0,015 0,026 0,073
0,08 0,05 0,02 0,025 0,12
0,5 0,3 0,4 0,4 0,6
0,15 0,14 0,11 0,14 0,12
0,34 0,8 0,8 0,4 0,11
lenzbandmaximum und Leitungsbandminimum liegen beide bei C (Abb. 12.4). Ebenso wie bei den tetraedrischen Elementhalbleitern gibt es auch hier drei verschiedene Valenzbänder mit einer qualitativ ähnlichen Gestalt bei C (Abb. 12.3). Wichtige Daten einiger III–VHalbleiter mit direkter Bandlücke sind in Tabelle 12.3 zusammengestellt. Der Vollständigkeit halber sei erwähnt, dass GaP und AlSb eine indirekte Bandlücke (ähnlich Si und Ge) von 2,32 eV bzw. 1,65 eV bei T = 0 K haben. Ähnliche Überlegungen wie im Fall der III–V-Verbindungen führen auch zu einem Verständnis der sog. II–VI-Halbleiter, zu denen z. B. ZnO (3,2 eV), ZnS (3,6 eV), CdS (2,42 eV), CdSe (1,74 eV) und CdTe (1,45 eV) gehören. In Klammern sind jeweils die direkten Bandlücken Eg bei 300 K angegeben. Auch hier liegt eine gemischt ionogen-kovalente Bindung vor, jedoch mit mehr ionischem Anteil als bei den III–V-Halbleitern. Die Kristallstruktur ist entweder die der III–V-Halbleiter (ZnS) oder die des Wurtzits (Abschn. 2.5). In beiden Fällen liegt eine tetraedrische Nahordnung vor, die auf die sp3-Hybridisierung der Bindungspartner zurückzuführen ist.
12.2 Ladungsträgerdichte im intrinsischen Halbleiter Gemäß der Definition der Beweglichkeit im Abschn. 9.5 lässt sich die elektrische Leitfähigkeit r eines Halbleiters, in dem Elektronen und Löcher den Stromtransport tragen, schreiben als r jej
nln plp :
12:2
Hierbei sind ln und lp die Beweglichkeiten der Elektronen bzw. Löcher und n bzw. p die entsprechenden Volumenkonzentrationen der Ladungsträger. Die Schreibweise in (12.2) trägt bereits der Tatsache Rechnung, dass man in erster Näherung eine k- bzw. Energieabhängigkeit der Größen ln und lp vernachlässigt, weil man im allgemeinen nur Ladungsträger betrachten muss, die sich im para-
12.2 Ladungsträgerdichte im intrinsischen Halbleiter
409
bolischen Teil der Bänder befinden, wo die effektive Massennäherung (d. h. m n und m p konstant) gilt. Wegen des verschiedenen Vorzeichens der Driftgeschwindigkeit v und der elektrischen Ladung e von Löchern und Elektronen tragen beide Ladungsträgersorten gleichsinnig zu r bei. Im Gegensatz zur metallischen Leitfähigkeit bewirkt die bei Halbleitern vorhandene Bandlücke Eg, die zur Erzeugung „freier“ Ladungsträger thermisch „übersprungen“ werden muss, eine starke Abhängigkeit der Ladungsträgerkonzentration n und p von der Temperatur T. Als intrinsisch bezeichnet man einen Halbleiter, bei dem „freie“ Elektronen und Löcher nur durch elektronische Anregungen aus dem Valenzband ins Leitungsband zustande kommen. (In Abschn. 12.3 werden zusätzlich Anregungen aus Störstellen betrachtet.) Wie in jedem Festkörper muss natürlich auch im Halbleiter die Besetzung der Energieniveaus der Fermi-Statistik f (E, T) (Abschn. 6.3) gehorchen, d. h. 1
n DL
Ef
E; TdE ;
12:3 a EL
und für Löcher E
V
p
DV
E1
f
E; TdE :
12:3 b
1
Eigentlich sollten die Integrale bis zur oberen bzw. unteren Kante der Bänder laufen. Da jedoch die Fermi-Funktion f (E, T) genügend stark abfällt, können die Integrale bis ins Unendliche durchgeführt werden. DL (E) und DV (E) sind die Zustandsdichten im Leitungsbzw. Valenzband, für die im Bereich der parabolischen Näherung (m konstant) gilt [vgl. (6.11)]:
2mn3=2 p E EL ;
E > EL ;
12:4 a 2p2 h3
2mp3=2 p EV E ;
E < EV : DV
E
12:4 b 2p2 h3 Die Dichte im Bereich des verbotenen Bandes EV < E < EL ist natürlich gleich Null. Da im intrinsischen Halbleiter alle „freien“ Elektronen im Leitungsband aus Zuständen im Valenzband stammen, muss die Konzentration der Löcher p gleich der Zahl der Elektronen n sein. Es ergeben sich also Verhältnisse wie in Abb. 12.5. Wenn die effektiven Massen m n und m p und damit die Zustandsdichten DL und DV gleich sind, muss das Fermi-Niveau EF in der Mitte des verbotenen Bandes liegen. Für voneinander verschiedene DL und DV verschiebt sich EF geringfügig zu der einen oder anderen Bandkante hin, damit die Besetzungsintegrale (12.3) gleich werden.
DL
E
410
12. Halbleiter
Abb. 12.5. (a) Fermi-Funktion f (E). Zustandsdichte D (E) und Elektronen- (n) bzw. Löcherkonzentration (p) in Leitungs- und Valenzband für den Fall, dass die Zustandsdichten in Leitungsund Valenzband gleich sind (schematisch). (b) Die gleiche Figur für den Fall ungleicher Zustandsdichten in Leitungs- und Valenzband. Wieder muss die Zahl der Löcher gleich der Zahl der Elektronen sein. Deswegen liegt jetzt das Fermi-Niveau nicht mehr in der Mitte zwischen Leitungs- und Valenzband und seine Lage ist temperaturabhängig
Da die „Aufweichungszone“ der Fermi-Funktion (*2 k T ) bei üblichen Temperaturen klein ist gegen den Bandabstand (*1 eV), lässt sich innerhalb der Bänder (E > EL bzw. E < EV ) die FermiFunktion f (E, T) durch die Boltzmann-Besetzungswahrscheinlichkeit annähern; d. h., für das Leitungsband gilt: ! 1 E EF ! exp 1 fur E EF 2 k T : kT E EF 1 exp kT (12.5) Damit folgt für die Elektronenkonzentration n im Leitungsband nach (12.3 a) und (12.4 a) 1
2mn3=2 EF =k T p E=k T E EL e e dE :
12:6 n 2p2 h3 EL
Mittels der Substitution XL = (E–EL)/k T ergibt sich die Darstellung: !1
2mn3=2 E L EF 1=2 3=2 k n
T exp XL e XL dXL :
12:7 kT 2p2 h3 0
Über eine analoge Rechnung für das Valenzband folgen schließlich die Darstellungen: ! ! !3=2 2 p mnk T EL E F E E L F L Neff ; exp exp n2 h2 kT kT
12:8 a
12.2 Ladungsträgerdichte im intrinsischen Halbleiter
2 p mpk T p2 h2
!3=2
EV
exp
kT
EF
! V Neff exp
EV
kT
EF
411
! :
12:8 b
Man sieht, dass geringe Konzentrationen freier Ladungsträger im Halbleiter näherungsweise die Beschreibung mit der BoltzmannStatistik [Näherung der Fermi-Statistik für
E EF 2 k T ] zulassen. Vergleicht man Abb. 12.5 mit den Darstellungen des Potentialtopfmodells in Kap. 6, so lässt sich das Leitungsband formal als ein Potentialtopf auffassen, bei dem das Fermi-Niveau EF weit (k T ) unterhalb des Potentialtopfbodens EL liegt. Die Schreibweise der Gln. (12.8 a u. b) mit Hilfe der sog. effekV tiven Zustandsdichten N Leff bzw. N eff lässt weiter die formale Interpretation zu, dass man sich das gesamte Leitungsband bzw. Valenzband durch ein einziges Energieniveau EL bzw. EV (BandkanV ten) mit der Zustandsdichte N Leff bzw. N eff (temperaturabhängig!) charakterisiert denkt, dessen Besetzungsdichte n bzw. p mittels Boltzmann-Faktoren (Energie jeweils von EF gezählt) geregelt wird. Diese Näherung, die häufig für Halbleiter Gültigkeit hat, nennt man die Näherung der Nichtentartung. Durch hohe Konzentration von Störstellen (Abschn. 12.3) kann man auch in Halbleitern sehr hohe Ladungsträgerdichten erzeugen. Dann bricht diese Näherung zusammen und man spricht von entarteten Halbleitern. Aus (12.8 a, b) lässt sich folgende allgemeingültige Beziehung ableiten (Eg = EL–EV): np
k
E = T L V Neff e g Neff
kT
4
2 p h2
!3
mnmp3=2 e
k
Eg = T
:
12:9
Diese Gleichung besagt, dass für einen speziellen Halbleiter, der vollständig charakterisiert ist durch seine absolute Bandlücke Eg und die effektiven Massen m n und m p im Leitungs- und Valenzband, Elektronen- und Löcherkonzentration sich in Abhängigkeit von der Temperatur nach Art eines „Massenwirkungsgesetzes“ einstellen. Nehmen wir weiter an, dass wir es mit einem intrinsischen Halbleiter (n = p) zu tun haben, dann hängt die sog. intrinsische Ladungsträgerkonzentration ni wie folgt von der Temperatur ab: q L NV e ni pi Neff eff
k
Eg =2 T
2
!3=2
kT 2 p h
2
mnmp3=4 e
Eg =2
kT :
12:10 Für die wichtigen Materialien Ge, Si und GaAs sind die Werte für ni und Eg in Tabelle 12.4 zusammengestellt.
412
12. Halbleiter
Tabelle 12.4. Bandlücke Eg und Eigenleitungskonzentration ni für Germanium, Silizium und Galliumarsenid bei 300 K
Ge Si GaAs
Eg [eV]
ni [cm–3]
0,67 1,1 1,43
2,4´1013 1,5´1010 5´107
Nach (12.8 a u. b) stellt sich bei gegebener Temperatur das Fermi-Niveau in einem intrinsischen Halbleiter so ein, dass Ladungsneutralität gegeben ist, d. h. L n p Neff e
e
k
2EF = T
EF
k
k
EL = T EF = T
e
V Neff e
k
EV = T
V Neff
E E =k T e V L ; L Neff
e
k
EF = T
;
12:11
12:12
EL EV k T E L EV 3 V L ln
Neff k T ln
mp=mn : =Neff 2 2 2 4
12:13
Falls effektive Zustandsdichten bzw. effektive Massen, d. h. also auch Bandkrümmungen von Leitungs- und Valenzband, gleich wären, läge im intrinsischen Halbleiter das Fermi-Niveau genau mitten im verbotenen Band, und dies für alle Temperaturen. Sind die effektiven Zustandsdichten in Leitungsband und Valenzband verschieden, so liegt die Fermi-Funktion asymmetrisch zu den Bandkanten EL und EV (Abb. 12.5) und das Fermi-Niveau zeigt eine schwache Temperaturabhängigkeit gemäß (12.13).
12.3 Dotierung von Halbleitern Die intrinsische Ladungsträgerkonzentration ni von 1,5´1010 cm–3 (bei 300 K) für Si reicht bei weitem nicht aus, um die in der Praxis erforderlichen Stromdichten in Halbleiterbauelementen zu erzeugen. Über Größenordnungen höhere Konzentrationen als ni lassen sich durch Dotieren, d. h. Einbau von elektrisch aktiven Störstellen, in einem Halbleiter erzeugen. Die meisten Halbleiter lassen sich als Einkristalle überhaupt nicht so rein züchten, dass man intrinsische Leitfähigkeit bei Raumtemperatur beobachten könnte. Unbeabsichtigte Dotierung erzeugt bei den reinsten, heute käuflichen GaAs-Einkristallen z. B. Ladungsträgerdichten im Bereich von 1016 cm–3 (bei 300 K) im Vergleich zur entsprechenden intrinsischen Konzentration von ni = 5´107 cm–3. Elektrisch aktive Störstellen in einem Halbleiter erhöhen entweder die Konzentration „freier“ Elektronen oder „freier“ Löcher, in-
12.3 Dotierung von Halbleitern
413
dem sie Elektronen an das Leitungsband abgeben oder aus dem Valenzband aufnehmen. Man nennt diese Störstellen dann Donatoren bzw. Akzeptoren. Ein Donator in einem Si-Gitter entsteht z. B., wenn man in ein Si-Gitter statt eines IV-wertigen Si-Atoms ein fünfwertiges Atom wie P bzw. As oder Sb einbaut. Bei diesen Fremdatomen liegt statt der 3 s 2 3 p 2-Si-Konfiguration eine s 2 p 3Konfiguration in der äußeren Schale vor. Um die tetraedrische Bindungsstruktur eines sp 3-Hybrids im Gitter anzunehmen, sind beim fünfwertigen Atom nur die Elektronen s 2 p 2 erforderlich; ein überschüssiges Elektron der p-Schale findet „keinen Platz“ in der kovalenten sp 3-Hybridbindung. Man kann sich dieses Elektron als schwach gebunden an den positiv geladenen Donator-Rumpf, der – tetraedrisch gebunden – ein Si-Atom im Gitter vertritt, vorstellen (Abb. 12.6 a). Näherungsweise lässt sich eine solche fünfwertige Donatorstörstelle im Si-Gitter als ein einwertiger, positiver Rumpf vorstellen, an den ein Elektron gebunden ist, das abgetrennt werden kann und sich dann „frei“ im Gitter bewegen kann; d. h., bei Ionisation wird dieses Elektron aus einem Störstellenniveau ins Leitungsband angeregt. Die Donatorstörstelle lässt sich also als wasserstoffartiges Zentrum beschreiben, bei dem die Coulomb-Anziehung zwischen Kern und Valenzelektron durch das Vorhandensein der Si-Elektronen in der Umgebung abgeschirmt wird. Um die Anregungs- und Ionisationsenergie des überschüssigen Phosphor-Elektrons abzuschätzen, kann man die Abschirmung durch das umgebende Si in grober Näherung durch Einsetzen der Dielektrizitätskonstante des Si (eSi = 11,7) in die Energieterme des
Abb. 12.6 a, b. Schematische Darstellung der Wirkung eines Donators (a) bzw. eines Akzeptors (b) in einem Silizium-Gitter. Das fünfwertige Phosphor-Atom wird anstelle eines Silizium-Atoms im Gitter eingebaut. Das fünfte Elektron des Phosphor-Atoms wird zur Bindung nicht benötigt und ist nur schwach an das Phosphor-Atom gebunden. Die Bindungsenergie lässt sich abschätzen, wenn man das System als ein in ein Dielektrikum eingebettetes Wasserstoff-Modell behandelt. Der Fall des Akzeptors (b) lässt sich analog beschreiben: Das dreiwertige Bor nimmt ein zusätzliches Elektron aus dem Silizium-Gitter auf. Dadurch entsteht ein Loch im Valenzband, das um das negativ geladene Fremdatom kreist. Gitterabstand und Ausdehnung des Störzentrums sind nicht maßstabgetreu. In Wirklichkeit ist der Durchmesser des 1. Bohrschen Radius der „Störstellenbahn“ etwa zehnmal so groß wie der Gitterabstand
414
12. Halbleiter
Wasserstoffatoms berücksichtigen. Die Energieterme des Wasserstoff-Leuchtelektrons EnH
me e4
1 2
4 p e0 h n2 2
12:14
ergeben mit n = 1 eine Ionisierungsenergie von 13,6 eV. Für das PDonatorzentrum muss die Masse me des freien Elektrons durch die effektive Masse m n = 0,3 me eines Si-Leitungselektrons und die Dielektrizitätskonstante e0 des Vakuums durch e0·eSi ersetzt werden. Damit folgt für die Ionisierungsenergie des Donators Ed ein Wert von *30 meV. Das Energieniveau ED des Donatorelektrons im gebundenen Zustand sollte also etwa 30 meV unter der Leitungsbandkante EL liegen. Einen noch kleineren Wert erhält man für Germanium. Dort ist eGe = 15,8 und m n *0,12 me. Es ergibt sich hier die Abschätzung (EL–ED)&6 meV. Die Situation ist im Bänderschema der Abb. 12.7 dargestellt. Eingezeichnet ist nur der Grundzustand des Donators. Zwischen diesem Grundzustand und der Leitungsbandkante existieren noch angeregte Zustände [n > 1 in (12.14)], die, immer dichter liegend, in das Kontinuum des Leitungsbandes übergehen. Die Situation ist sehr ähnlich der des H-Atoms, wo dem Leitungsbandkontinuum die ungebundenen Zustände oberhalb des Vakuumniveaus entsprechen. Die energetische Lage dieser angeregten Zustände lässt sich z. B. aus optischen Spektren erschließen. Abbildung 12.8 zeigt ein Absorptionsspektrum des Sb-Donators in Ge. Die Banden unterhalb von 9,6 meV entsprechen Anregungen aus dem Grundzustand in höhere, angeregte Zustände. Das Spektrum ist komplizierter, als aus dem beschriebenen Wasserstoffmodell folgen würde, da durch die Kristallumgebung teilweise Entartungen von Wasserstofftermen aufgehoben werden. Oberhalb von 9,6 meV geht die Anregung in das Kontinuum des Leitungsbandes. Wie aus dem experimentellen Beispiel der Abb. 12.8 zu entnehmen ist, gestattet die einfache Beschreibung eines Donatorzentrums durch das H-Atommodell die Abschätzung der Größenordnung der Ionisierungsenergie Ed. Im Rahmen dieses Modells müss-
Abb. 12.7. Qualitative Lage der Grundzustandsniveaus von Donatoren und Akzeptoren in bezug auf die Unterkante des Leitungsbandes EL bzw. die Oberkante des Valenzbandes EV. Ed und Ea sind die Ionisierungsenergien der Donatoren bzw. Akzeptoren
12.3 Dotierung von Halbleitern
415
Abb. 12.8. Optisches Absorptionsspektrum eines Sb-Donators in Germanium, gemessen bei T = 9 K. (Nach Reuszer u. Fischer [12.2])
ten alle Donatorstörstellen P, As, Sb usw. in ein und demselben Halbleitermaterial die gleiche Ionisierungsenergie Ed ergeben. Die experimentell ermittelten Werte Ed in Tabelle 12.5 zeigen jedoch, dass Abweichungen von Donator zu Donator gefunden werden. Es verwundert nicht, dass die summarische Beschreibung der abschirmenden Wirkung der Halbleiterelektronen durch eine Dielektrizitätskonstante zu einfach ist, um die Feinheiten der Atomistik zu verstehen. Dass die Beschreibung durch eine makroskopische Dielektrizitätskonstante dennoch so gut an die wirklichen Werte für Ed heranführt, liegt daran, dass durch die Abschirmung die Wellenfunktion des gebundenen Valenzelektrons des Donators über sehr viele Gitterkonstanten „verschmiert“ wird. Einsetzen der Halbleiterdielektrizitätskonstanten eHL in die Formel für den Bohrschen Radius r e0 eHL
h2 p mne2
12:15
bläht diesen um eHL (*12 für Si) im Vergleich zum (Wasserstoff) Bohr-Radius auf. Das gebundene Valenzelektron der Donatorstörstelle ist also über größenordnungsmäßig 103 Gitteratome „verschmiert“. Tabelle 12.5. Energetischer Abstand Ed einiger Donatorenniveaus vom Leitungsband für Silizium und Germanium
Si Ge
P [meV]
As [meV]
Sb [meV]
45 13
54 14
43 10
416
12. Halbleiter
Tabelle 12.6. Energetischer Abstand Ea einiger Akzeptorenniveaus vom Valenzband für Silizium und Germanium
Si Ge
B [meV]
Al [meV]
Ga [meV]
In [meV]
45 11
67 11
74 11
153 12
Baut man in das Gitter eines IV-wertigen Elementhalbleiters (Si, Ge) ein dreiwertiges Fremdatom (B, Al, Ga, In) ein, so kann der für die tetraedrische Bindung verantwortliche sp 3-Hybrid leicht ein Elektron aus dem Valenzband unter Zurücklassung eines Defektelektrons aufnehmen (Abb. 12.6). Solche Störstellen heißen Akzeptoren. Ein Akzeptor ist bei sehr tiefen Temperaturen neutral. Er wird ionisiert, indem bei genügender Energiezufuhr ein Elektron energetisch aus dem Valenzband in das sog. Akzeptorenniveau angehoben wird. Akzeptoren haben also den Ladungscharakter „von neutral nach negativ“, während Donatoren von neutral nach positiv ionisiert werden. Das in der Nähe eines ionisierten Akzeptors entstandene Defektelektron befindet sich im abgeschirmten CoulombFeld der ortsfesten, negativen Störstelle und die Abtrennenergie, die zur Erzeugung eines „freien“ Loches im Valenzband aufgewendet werden muss, kann wie beim Donator mit Hilfe des Wasserstoffmodells abgeschätzt werden. Die Verhältnisse bei Donatoren und Akzeptoren entsprechen sich bis auf das Vorzeichen der Ladung grundsätzlich. Tabelle 12.6 zeigt, dass die Ionisierungsenergien Ea für Akzeptoren in der Realität ähnlich denen für Donatoren sind. Mit Donatoren dotierte Halbleiter heißen n- und mit Akzeptoren dotierte Materialien p-Halbleiter. Die niedrigsten Verunreinigungskonzentrationen, die man heute bei Halbleitereinkristallen erreichen kann, liegen in der Größenordnung von 1012 cm–3. Ge mit einer intrinsischen Ladungsträgerkonzentration ni von 2,4´1013 cm–3 (bei 300 K) ist also als bei Zimmertemperatur intrinsisches Material erhältlich, während Si (ni = 1,5´1010 cm–3 bei 300 K) bei Zimmertemperatur nicht intrinsische Leitfähigkeit zeigt. Neben den hier besprochenen, elektrisch aktiven Störstellen kann ein Halbleiter natürlich noch eine Vielzahl von Fremdatomen und Defekten besitzen, die nicht so leicht ionisiert werden können und sich deshalb in der elektrischen Leitfähigkeit nicht zeigen.
12.4 Ladungsträgerdichte in dotierten Halbleitern Im dotierten Halbleiter kann ein Elektron im Leitungsband entweder aus dem Valenzband oder aus einer ionisierten Donatorstörstelle stammen. Entsprechend kann ein Loch im Valenzband zu einem Elektron in einer negativ geladenen (ionisierten) Akzeptorstörstelle
12.4 Ladungsträgerdichte in dotierten Halbleitern
417
Abb. 12.9. Erklärung der in n- und p-Halbleitern üblichen Bezeichnungen für Ladungsträger- und Störstellenkonzentrationen: n und p sind die Konzentrationen von „freien“ Elektronen und Löchern. Die Gesamtkonzentration ND und NA von Donatoren und Akzeptoren setzt sich zusammen aus den Dichten von neutralen N 0D bzw. N 0A und ionisierten Donatoren N +D bzw. Akzeptoren N –A . Elektronen im Leitungsband (n) und Löcher im Valenzband (p) rühren entweder von Band-Band-Anregungen oder aus Störstellen her
oder zu einem Elektron im Leitungsband gehören. Für einen nichtentarteten Halbleiter muss trotzdem die Besetzung im Leitungsbzw. Valenzband nach der Boltzmann-Näherung (12.8 a u. b) geregelt sein. Es gilt deshalb auch für den dotierten Halbleiter das sog. „Massenwirkungsgesetz“ L V n p Neff Neff e
k
Eg = T
;
12:9
in dem die Lage des Fermi-Niveaus EF nicht mehr auftritt. Im Vergleich zum intrinsischen Halbleiter regelt sich die Lage von EF nach einer nun etwas komplizierteren „Neutralitätsbedingung“, die auch der Ladung in den Störstellen Rechnung trägt: Die im folgenden verwendeten Bezeichnungen sind in Abb. 12.9 schematisch dargestellt. Die Dichte aller vorhandenen Donatoren ND bzw. aller Akzeptoren NA setzt sich zusammen aus der Dichte N 0D bzw. N 0A der Donatoren bzw. Akzeptoren, die neutral sind, und der Dichte – N +D der ionisierten Donatoren (dann positiv geladen) bzw. N A der ionisierten Akzeptoren (negativ geladen). Im homogenen Halbleiter – muss die negative Ladungsdichte n+N A durch eine gleichgroße po+ sitive Ladungsdichte p+N D (s. Abb. 12.9) kompensiert sein. Folgende Neutralitätsbedingung regelt also die Lage des Fermi-Niveaus EF im homogen dotierten Halbleiter: n NA p ND ;
12:16
wobei gilt ND ND0 ND ;
12:17 a
NA NA0 NA :
12:17 b
418
12. Halbleiter
Für übliche Störstellenkonzentrationen (1013–1017 cm–3), bei denen sich die einzelnen Donatoren oder Akzeptoren noch nicht beeinflussen, gilt in guter Näherung für die Besetzung der Donatoren mit Elektronen (nD) bzw. der Akzeptoren mit Löchern (pA): nD ND0 ND 1 exp
ED
EF =k T
1
;
12:18 a
pA NA0 NA 1 exp
EF
EA =k T
1
:
12:18 b
Eine geringfügige Modifikation der Fermi-Funktion (Multiplikation des Exponentialterms mit 1/2), die der Möglichkeit des Einfangs nur eines Elektrons, jedoch unabhängig von seiner Spinstellung, Rechnung trägt, wird hier nicht betrachtet. Der allgemeine Fall, der sowohl Donatoren als auch Akzeptoren gleichzeitig berücksichtigt, kann nur numerisch behandelt werden. Im folgenden beschränken wir uns deshalb auf die Behandlung eines reinen n-Halbleiters, in dem nur Donatoren vorhanden sind; es müssen dann die Gln. (12.8 a, 12.17 a, 12.18 a) zur Berechnung der Ladungsträgerkonzentration herangezogen werden. Zur besseren Übersichtlichkeit sind sie hier noch einmal zusammengestellt: L n Neff e
k
EL EF = T
;
12:8 a
ND ND0 ND ; ND0
12:17 a EF =k T
ND 1 exp
ED
1
:
12:18 a
„Freie“ Elektronen im Leitungsband können nur aus Donatoren oder aus dem Valenzband stammen, d. h. n ND p :
12:19
Als weitere Vereinfachung nehmen wir an, dass der Hauptbeitrag zur Leitfähigkeit von den Donatoren herrührt, d. h., dass N +D ni (n p = n 2i ) angenommen werden kann. Dies ist z. B. für Si (ni = 1,5´1010 cm–3 bei 300 K) schon bei relativ geringen Dotierungen gegeben. Für diesen einfachen Fall gilt statt (12.19) n ND ND
ND0 ;
12:20
d. h. mit (12.18 a):
!
1
n ND 1
1 exp
ED
EF =k T
:
12:21
EF lässt sich hier mit Hilfe von (12.8 a) ausdrücken durch L e
n=Neff
k
EL = T
e
k
EF = T
;
12:22
d. h. n
ND 1e
k
Ed = T
; L n=Neff
12:23
12.4 Ladungsträgerdichte in dotierten Halbleitern
419
wobei Ed = EL–ED der energetische Abstand des Donatorenniveaus von der Leitungsbandkante ist. Auflösen von (12.23) nach n ergibt: n
n2 Ed =k T e ND : L Neff
Die physikalisch sinnvolle Lösung ist s! 1 ND E =k T : n 2ND 1 1 4 L e d Neff
12:24
12:25
Diese Beziehung für die Leitungselektronenkonzentration im nHalbleiter ergibt folgende Grenzfälle: I) Wenn die Temperatur T so klein wird, dass L 4
ND =Neff e
k
Ed = T
1
ist, dann ergibt sich q L e Ed =2 k T : n ND Neff
12:26
12:27
In diesem Bereich, wo noch genügend viele Donatoren ihr Valenzelektron enthalten, d. h. nicht ionisiert sind, spricht man von Störstellenreserve. Man beachte die Ähnlichkeit von V und EV (12.27) mit (12.10): Statt der Valenzbandgrößen N eff sind nur die entsprechenden Donatorgrößen ND und ED (d. h. statt Eg hier Ed) einzusetzen. In diesem Temperaturbereich hängt die Elektronenkonzentration wie bei einem intrinsischen Halbleiter exponentiell von der Temperatur T ab, wobei nur statt Eg die wesentlich kleinere Donator-Ionisationsenergie Ed eingeht. Der hier abgehandelte Grenzfall reiner n-Dotierung wird in der Praxis kaum realisiert. Meistens sind auch geringere Mengen von Akzeptoren vorhanden, was zur Folge hat, dass das Fermi-Niveau unterhalb ED liegt. Die Aktivierungsenergie wird deshalb meistens als Ed gemessen. II) Für Temperaturen T, bei denen gilt L e 4
ND =Neff
k
Ed = T
1;
12:28
ergibt (12.25) n ND const ;
12:29
d. h., die Konzentration von Elektronen im Leitungsband hat die maximal erreichbare Konzentration erreicht; alle Donatoren sind ionisiert, man spricht vom Erschöpfungszustand. In erster Näherung spielen Elektronen, die aus dem Valenzband angeregt sind, noch keine Rolle. III) Erst bei weiterer Steigerung der Temperatur nimmt die Konzentration der über die Lücke Eg angeregten Elektronen zu und wird irgendwann die aus Störstellen freigesetzte Elektronen-
420
12. Halbleiter
dichte überwiegen. Der n-Halbleiter verhält sich jetzt wie ein intrinsischer Halbleiter und man spricht in diesem Temperaturbereich vom intrinsischen Bereich der Trägerkonzentration. Die verschiedenen Bereiche der Ladungsträgerkonzentration sind mit der entsprechenden Lage des Fermi-Niveaus EF in Abb. 12.10 dargestellt. Für die Lage des Fermi-Niveaus EF in Abhängigkeit von der Temperatur, die hier nicht explizit ausgerechnet wurde, gilt eine analoge Diskussion wie im Fall des intrinsischen Halbleiters. Im Bereich der Störstellenreserve stelle man sich nur die Valenzbandkante durch das Donatorenniveau repräsentiert vor. Im Bereich sehr hoher Temperaturen, d. h. im intrinsischen Bereich, gelten die Gesetzmäßigkeiten des intrinsischen Halbleiters. Bei n-dotiertem Si mit einer Phosphor-Donatorenkonzentration von 3´1014 cm–3 erstreckt sich der Erschöpfungsbereich zwischen etwa 45 K und 500 K, d. h., bei Zimmertemperatur sind unter diesen Umständen schon alle Donatoren ionisiert. Abbildung 12.11 zeigt als
Abb. 12.10. (a) Qualitative Abhängigkeit der Elektronenkonzentration n im Leitungsband eines n-Halbleiters von der Temperatur für zwei verschiedene Donatorkonzentrationen ND ' > ND . Eg ist die Breite des verbotenen Bandes und Ed die Ionisierungsenergie der Donatorstörstelle. (b) Qualitative Lage der Fermi-Energie EF (T) bei demselben Halbleiter in Abhängigkeit von der Temperatur. EL und EV sind die Unterkante bzw. Oberkante von Leitungs- bzw. Valenzband, ED die Lage des Donatorniveaus und Ei die intrinsische Energie, wo das Fermi-Niveau im intrinsischen Halbleiter liegt
12.5 Leitfähigkeit von Halbleitern
421
Abb. 12.11. Durch Hall-Effekt (s. Tafel XIV) gemessene Konzentration n freier Elektronen in n-Germanium. Für die Proben (1) bis (6) variiert die Donatorkonzentration ND zwischen 1018 und 1013 cm–3. Die im intrinsischen Bereich vorliegende Elektronenkonzentration als Funktion der Temperatur ist gestrichelt eingezeichnet. (Nach Conwell [12.3])
experimentelles Beispiel die aus Hall-Effekt-Messungen bestimmten Elektronenkonzentrationen n (T) in n-dotiertem Ge für Störstellenkonzentration zwischen 1013 cm–3 und 1018 cm–3. Die in Abb. 12.10 qualitativ gezeigten Zusammenhänge sind klar zu erkennen.
12.5 Leitfähigkeit von Halbleitern Wie schon im Abschn. 9.5 genauer diskutiert, ist für die Berechnung der elektrischen Leitfähigkeit r als Funktion der Temperatur T eine zusätzliche Betrachtung der Beweglichkeit erforderlich. Für einen Halbleiter müssen dabei sowohl die Elektronen im unteren
422
12. Halbleiter
Leitungsbandbereich (Konzentration: n, Beweglichkeit: ln) als auch die Löcher nahe der oberen Valenzbandkante (p, lp) berücksichtigt werden. Die Stromdichte j im isotropen Halbleiter (nichttensorielle Leitfähigkeit r ) ist also j e
n ln p lp E :
12:30
Im Gegensatz zum Metall, wo nur Elektronen an der Fermi-Kante berücksichtigt werden müssen, d. h. l = l (EF) (s. Abschn. 9.5), sind die Beweglichkeiten ln und lp beim Halbleiter als Mittelwerte über die von Elektronen bzw. Löchern besetzten Zustände im unteren Leitungsband bzw. oberen Valenzband aufzufassen. In nichtentarteten Halbleitern kann in diesen Bereichen die Fermi-Statistik durch die Boltzmann-Statistik angenähert werden. Im Rahmen dieser Näherung liefert diese Mittelung, die im vorliegenden Zusammenhang nicht näher ausgeführt wird, ln
1 hs
kv 2
ki e: mn hv 2
ki
12:31
Hierbei ist v
k die im elektrischen Feld E vorliegende Geschwindigkeit eines Elektrons im Punkt k des reziproken Raumes und s (k) seine zugehörige Relaxationszeit (genauere Definition im Abschn. 9.4). Für Defektelektronen sind in (12.31) diese Größen an entsprechenden Stellen des Valenzbandes zu nehmen und die effektive Masse m n der Elektronen durch die der Löcher zu ersetzen. Statt einer rigorosen Lösung der Boltzmann-Gleichung und einer exakten weiteren Betrachtung von (12.31) beschränken wir uns im vorliegenden Zusammenhang ähnlich wie für Metalle (Abschn. 9.5) auf eine mehr qualitative Diskussion der Streuprozesse, die Elektronen bzw. Löcher im Halbleiter erleiden. Elektronen und Löcher verhalten sich hierbei qualitativ gleichwertig. Stark vereinfacht folgt aus (12.31) eine Proportionalität der Beweglichkeit zur Relaxationszeit (l ! s), die für Metalle nach (9.58 b) exakt gegeben ist. Da s auch proportional zur mittleren freien Flugzeit zwischen zwei Stößen ist, folgt 1 / hviR ; s
12:32
wobei R den Streuquerschnitt für Elektronen bzw. Löcher an einem Streuzentrum darstellt. hvi ist im Gegensatz zu Metallen (Abschn. 9.5) als thermischer Mittelwert (nach Boltzmann-Statistik) über alle Elektronen- bzw. Löchergeschwindigkeiten im unteren Leitungsband- bzw. oberen Valenzbandbereich zu betrachten. Gleichung (12.32) gibt im wesentlichen die Stoßwahrscheinlichkeit für Elektronen bzw. Löcher an. Wegen der Gültigkeit der Boltzmann-Statistik gilt im Halbleiter p hvi / T :
12:33
12.5 Leitfähigkeit von Halbleitern
423
Betrachten wir nun Streuung an akustischen Phononen, so kann man wie bei Metallen (Abschn. 9.5) den Streuquerschnitt RPh durch das Quadrat der mittleren Schwingungsamplitude hs2
qi eines Phonons (q, xq) abschätzen, d. h., für Temperaturen T H, der Debye-Temperatur, folgt (Abschn. 9.5) M x2q hs2
qi k T ;
12:34 a
RPh T :
12:34 b
Wegen (12.32, 12.33) folgt somit die Abschätzung lPh T
3=2
:
12:35
Zusätzlich zur hier betrachteten üblichen Streuung an Phononen können in piezoelektrischen Halbleitern (z. B. III–V- und II–VIVerbindungen) markante Beiträge von Streuung an Phononen herrühren, die mit einer Polarisation behaftet sind (piezoelektrische Streuung). Ferner können Ladungsträger an optischen Phononen höherer Energie gestreut werden. In diesem Fall wird die Beschreibung außerordentlich kompliziert, da die Relaxationszeitnäherung (Abschn. 9.4) weitgehend zusammenbricht. In Halbleitern spielt insbesondere die Streuung an geladenen Störstellen (ionisierte Donatoren oder Akzeptoren) eine wichtige Rolle. Ein an einer punktförmigen, geladenen Störstelle „vorbeifliegender“ Ladungsträger unterliegt dabei der Coulomb-Wechselwirkung und der Streuquerschnitt RSt für diese „Rutherford-Streuung“ ist RSt / hvi
4
;
12:36
wobei pfür seine Geschwindigkeit der thermische Mittelwert hvi / T angenommen wird. Gleichung (12.36) folgt aus einer klassischen oder quantenmechanischen Berechnung des Streuprozesses (siehe einschlägige Lehrbücher der Mechanik oder Quantenmechanik). Da die Gesamtstreuwahrscheinlichkeit ferner proportional zur Konzentration NSt der Störstellen sein muss, folgt mit (12.32, 12.33 und 12.36) 1 / NSt =T 3=2 sSt
12:37
Abb. 12.12. Schematische Abhängigkeit der Beweglichkeit l in einem Halbleiter von der Temperatur bei Streuung an Phononen und an geladenen Störstellen
424
12. Halbleiter
Abb. 12.13. Experimentell ermittelte Abhängigkeit der Beweglichkeit l freier Elektronen von der Temperatur. Für die Proben (1) bis (6) variiert die Donatorkonzentration ND zwischen 1018 und 1013 cm–3. Es handelt sich um die Proben, die auch für die Messungen in Abb. 12.11 verwendet wurden. (Nach Conwell [12.3])
bzw. für die Beweglichkeit, sofern nur Streuung an geladenen Störstellen vorliegt, lSt / T 3=2 :
12:38
Die reziproke Gesamtbeweglichkeit bei Vorliegen von Störstellenund Phononenstreuung ergibt sich durch Summation der reziproken Beweglichkeit aus (12.35) und (12.38), d. h., qualitativ ergibt sich ein Verlauf wie in Abb. 12.12 dargestellt. Abbildung 12.13 zeigt die aus Hall-Effekt- und Leitfähigkeitsmessungen ermittelte experimentelle Abhängigkeit l (T) der Elektronenbeweglichkeit für n-Ge; für die reinsten Kristalle (ND^1013 cm–3) liegt l (T) nahe bei der theoretisch erwarteten Abhängigkeit (12.35) für reine Phononenstreuung. Mit wachsender Donatorenkonzentration ND ist der durch (12.38) hinzukommende Störstellenbeitrag (s. a. Abb. 12.12) zu erkennen. Abbildung 12.14 zeigt, dass der charakteristische Beweglichkeitsverlauf aus Abb. 12.12 in der Abhängigkeit der Leitfähigkeit von der Temperatur T im Bereich der Störstellenerschöpfung, wo n (T) nahezu konstant ist (Abb. 12.10, 12.11), durchschlägt. Dort zeigt r (T) ein Maximum, während im Bereich der intrinsischen Leitfähigkeit und der Störstellenreserve (kleine T) die exponentiellen Abhängigkeiten der Ladungsträgerkonzentration n (T) (Abb. 12.11) die schwache Abhängigkeit der Beweglichkeit l von der Temperatur T überdecken. Die experimentellen Ergebnisse der Abb. 12.11, 12.13 und 12.14 wurden jeweils an den gleichen GeProben [durchnummeriert mit (1) bis (6)] gewonnen, so dass die
12.5 Leitfähigkeit von Halbleitern
425
Abb. 12.14. Experimentell ermittelte Leitfähigkeit r von n-Germanium in Abhängigkeit von der Temperatur. Für die Proben (1) bis (6), die auch für die Messungen in den Abb. 12.11 u. 12.13 verwendet wurden, variiert die Donatorkonzentration ND zwischen 1018 und 1013 cm–3. (Nach Conwell [12.3])
Leitfähigkeit r sich unmittelbar aus n (T) und l (T) ausrechnen lässt. Die bisherigen Betrachtungen zur Leitfähigkeit von Halbleitern betreffen das ohmsche Verhalten für relativ niedrige elektrische Felder E , wo die Stromdichte j proportional zu E ist und somit die Leitfähigkeit r durch eine Beweglichkeit l beschrieben wird. In modernen Halbleiterbauelementen mit Dimensionen im Submikrometerbereich erreicht die Feldstärke Werte oberhalb von 105 V/cm; in diesem Hochfeldbereich gilt das Ohmsche Gesetz nicht mehr. Die mittlere Driftgeschwindigkeit der Ladungsträger v D ist nicht mehr proportional zur Feldstärke. Wie Messungen und theoretische Rechnungen ergeben, gilt die Proportionalität v D!E bei den wichtigen Halbleitern Si, Ge, GaAs u.a. bis zu Feldstärken von etwa
426
12. Halbleiter
2´103 V/cm (Abb. 12.15). Für höhere Feldstärken sättigt sich v D für den indirekten Halbleiter Si (ähnlich für Ge) bei einem Wert von v D&107 cm/s. Die Energie, die den Ladungsträgern durch das äußere Feld zugeführt wird, geht durch Phononstreuprozesse weitgehend wieder verloren, sie wird an Schwingungen des Kristallgitters abgegeben. Besonders wirksam sind in diesem Energiebereich Stöße an optischen Phononen. Die Ladungsträger werden also im äußeren Feld entlang der Energiebänder E (k) beschleunigt, bis sie die Energie (bezogen auf EF) optischer Phononen mit hoher Zustandsdichte (etwa 60 meV bei Si, 36 meV bei GaAs) erreichen. Durch Anregung dieser Phononen und weitere Thermalisierung durch niederenergetische akustische Phononen wird die Energieaufnahme begrenzt und die Driftgeschwindigkeit strebt einem Sättigungswert zu. Eine Besonderheit ist bei direkten Halbleitern wie GaAs, InP, GaN zu beobachten, die neben dem C-Minimum des Leitungsbandes energetisch höher liegende Seitenminima bei L und X in der Bandstruktur besitzen (Abb. 12.4). In diesem Fall durchläuft die Driftgeschwindigkeit v D mit wachsender Feldstärke ein Maximum, bevor sie sich bei einem niedrigeren Wert ähnlich wie bei Si sättigt. Die Erklärung für dieses Phänomen, das bei GaAs für Feldstärken zwischen 3´103 V/cm und 105 V/cm zu einem negativen differentiellen Widerstand Anlass gibt, beruht auf der Streuung von Elektronen aus dem niedrigsten C-Leitungsbandminimum in die flachen Seitenminima bei X und L (Abb. 12.4). Solche Streuprozesse setzen ein, wenn die im äußeren Feld aufgenommene Energie ausreicht, die Schwelle bis zum Erreichen der Seitenminima zu überwinden. Während bei GaAs die kleine effektive Masse von 0,068 m0 im C-Minimum zu recht hohen Beweglichkeiten im Niederfeldbereich (< 103 V/cm) Anlass gibt, werden bei Einsetzen der Streuprozesse in die Seitenminima immer mehr Elektronen die wesentlich größere effektive Masse (> m0) der flachen Seitentäler bei X bzw. L annehmen; die Driftgeschwindigkeit v D der Elektronen nimmt ab (Abb. 12.15). Bei weiterer Zunahme der äußeren Feldstärke über 3´105 V/cm hinaus werden dann Elektronen in den Seitentälern der Bandstruktur mit ihrer weitaus höheren effektiven Masse als im C-Tal weiter beschleunigt. Dementsprechend würde v D wieder proportional zur Feldstärke mit einer weitaus geringeren Beweglichkeit als im Niederfeldbereich (< 103 V/cm) zunehmen. In diesem Bereich extrem hoher Felder wird dieses Verhalten jedoch überdeckt durch den Effekt des Lawinendurchbruchs: die beschleunigten Elektronen gewinnen soviel Energie, dass sie weitere Elektronen aus dem Valenzband ins Leitungsband anregen. Die Leitfähigkeit des Halbleiters nimmt lawinenartig durch die Multiplikation freier Ladungsträger zu. Auch dieser Effekt findet Anwendung in Bauelementen. Bemerkenswert an Abb. 12.15 ist, dass der indirekte Halbleiter Si eine ähnliche Sättigungsgeschwindigkeit bei Feldstärken oberhalb von 3´104 V/cm hat wie der direkte Halbleiter GaAs. Bei kleinen Bauelementdimensionen, wo solche Feldstärken auftreten,
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
427
Abb. 12.15. Ladungsträger-Driftgeschwindigkeit vD als Funktion der elektrischen Feldstärke E bei Zimmertemperatur 300 K. Die Kurven für Si und GaAs sind Messdaten an hochreinen kristallinen Proben, die einer Literaturzusammenstellung entnommen wurden. (Nach Sze [12.4]). Die Kurve für GaN entstammt einer Monte Carlo-Simulation. (Nach Gelmont et al. [12.5])
geht also der Geschwindigkeitsvorteil, den das GaAs gegenüber dem Si bei kleineren Feldstärken hat, verloren. Des weiteren sind die hohen Driftgeschwindigkeiten von Halbleitern mit großen Bandlücken wie GaN auffallend. Wegen seiner zusätzlichen hohen thermischen Stabilität eignet sich GaN also grundsätzlich sehr gut für die Verwendung in schnellen Hochtemperaturbauelementen.
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt Die moderne Festkörperphysik ist eng verknüpft mit der Entwicklung der Halbleiterbauelemente, d. h. der Festkörperelektronik. Die Wirkungsweise fast aller Halbleiterbauelemente beruht dabei auf Phänomenen, die auf Inhomogenitäten im Halbleiter zurückzuführen sind. Vor allem inhomogene Konzentrationen von Donator- und Akzeptorstörstellen bewirken interessante Leitfähigkeitsphänomene, die die Konstruktion von Halbleiterbauelementen ermöglichen. Die wichtigsten Grundstrukturen zur Realisierung von Bauelementen sind der sog. p-n-Übergang und der in seiner Funktionsweise ähnliche Metall/Halbleiter-Schottky-Kontakt. Bei einem p-nÜbergang handelt es sich um einen Halbleiterkristall, der auf der einen Seite p-, auf der anderen Seite n-leitend dotiert ist (s. Abb. 12.16). Im einfachsten (in der Realität natürlich nicht zu verwirklichenden) Fall wird der Übergang von der einen in die andere Zone als abrupt angenommen.
428
12. Halbleiter
Abb. 12.16 a–e. Qualitatives Schema eines p-n-Übergangs im thermischen Gleichgewicht. (a) Halbleiterkristall, der auf der einen Seite mit Akzeptoren (NA) und auf der anderen mit Donatoren (ND) dotiert ist. (b) Bänderschema der p- und n-Seite für den gedachten Fall einer totalen Entkopplung beider Seiten. EA und ED bezeichnen die Grundzustände der Akzeptoren bzw. Donatoren; EF ist das Fermi-Niveau. (c) Bänderschema des p-n-Übergangs, wenn beide Seiten im thermischen Gleichgewicht miteinander sind. Der Übergang der p- in die nDotierung ist abrupt angenommen. Die Lagen der Leitungs- bzw. Valenzbandkanten tief im p-Gebiet werden mit E pL bzw. E pV und mit E nL bzw. E nV tief im nGebiet bezeichnet. VD heißt Diffusionsspannung. Im Bereich des p-n-Übergangs stellt sich ein sog. Makropotential V (x) ein. (d) Die aus den ionisierten Störstellen sich ergebende ortsfeste Raumbeladung R
x im Bereich des pn-Übergangs. (e) Qualitativer Verlauf der Konzentrationen von Akzeptoren NA, Donatoren ND, Löchern p und freien Elektronen n; ni ist die intrinsische Ladungsträgerkonzentration; pp und pn bezeichnen die Löcherkonzentration tief im p- bzw. tief im n-Gebiet (entsprechend np, nn). Es ist der häufig auftretende Fall betrachtet, dass im Kristallinnern Donatoren und Akzeptoren fast völlig ionisiert sind
In der Praxis werden solche Dotierungsinhomogenitäten mit einer Vielzahl technologischer Prozesse erzeugt. Zum Beispiel können durch Diffusion Akzeptor- und in einen anderen Raumbereich Donatorstörstellen eingebracht werden. Dieses Einbringen von Dotierungsatomen kann ebenfalls über sog. Ionenimplantation geschehen, bei der mit hoher kinetischer Energie (durch hohe elektrische Felder) die entsprechenden Ionen der Dotierungsatome in das Halbleitermaterial „eingeschossen“ werden. Im folgenden soll das Leitfähigkeitsverhalten eines solchen p-nÜbergangs, bestehend z. B. aus einem Si-Kristall, der in seiner linken Hälfte mit Akzeptoren (z. B. B, Al, Ga) und in seiner rechten Hälfte mit Donatoren (z. B. P, As, Sb) dotiert ist, betrachtet werden. Dazu muss ein solcher inhomogen dotierter Halbleiter erst einmal im thermischen Gleichgewicht, d. h. ohne äußere anliegende Spannung (s. Abb. 12.16), behandelt werden.
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
429
Der p-n-Übergang im thermischen Gleichgewicht Stellen wir uns in einem rein gedanklichen Schritt die beiden Kristallhälften mit p- und n-Dotierung einmal als nicht verbunden vor (Abb. 12.16 b), so liegen die Fermi-Niveaus in beiden Gebieten verschieden hoch auf ein und derselben Energieskala. In Wirklichkeit handelt es sich jedoch um ein und denselben Kristall, der nur einen abrupten Dotierungsübergang aufweist. Das Fermi-Niveau als elektrochemisches Potential muss deshalb beiden Kristallhälften im thermischen Gleichgewicht gemeinsam sein. Im Bereich der Übergangszone zwischen n- und p-Gebiet muss sich deshalb eine sog. Bandverbiegung, wie in Abb. 12.16 c gezeigt, einstellen. Im Rahmen dieser hier durchgeführten quasiklassischen Beschreibung werden die Verhältnisse in der Übergangsschicht also durch ein ortsabhängiges sog. Makropotential V (x) beschrieben, was die Verbiegung der Bandstruktur wiedergibt. Diese Beschreibung ist zulässig, weil sich das Potential V (x) nur schwach über einen Kristallatomabstand ändert. Der Krümmung des Makropotentials V (x) entspricht über die Poisson-Gleichung @ 2 V
x @x2
R
x e e0
12:39
eine Raumladung R (x). Wie diese Raumladung zustande kommt, ist für den Grenzfall T^0, wo EF tief im Innern des Kristalls in der Nähe des Akzeptor- bzw. Donatorniveaus liegt, qualitativ so zu verstehen: Die Verbiegung der Bänder hat zur Folge, dass in der Übergangszone im Bereich des p-Gebietes Akzeptoren unter das Fermi-Niveau gedrückt, d. h. mit Elektronen besetzt werden, während im n-Gebiet Donatoren über das Fermi-Niveau hinausgehoben werden und somit entleert, d. h. positiv geladen werden. Die aus (12.39) sich ergebende Raumladung besteht also aus ortsfesten ionisierten Akzeptoren bzw. Donatoren, die eine geladene Doppelschicht zu beiden Seiten des Dotierungssprunges zur Folge haben. Im Fall der in Abb. 12.16 gezeigten Störstellenerschöpfung (T&300 K, EF zwischen Störstellenniveaus und Mitte des verbotenen Bandes) rührt die Raumladung daher, dass die Ladung der ortsfesten Akzeptor- und Donatorstörstellen um den Dotierungssprung herum nicht mehr durch die beweglichen Löcher und Elektronen in Valenz- und Leitungsband kompensiert wird. Man spricht deshalb vom sog. Raumladungsbereich oder der sog. Raumladungszone, wo R
x j 0 ist. Die mit dieser Raumladungszone zusammenhängenden Konzentrationen der Ladungsträger und Störstellen sind in Abb. 12.16 e dargestellt. Weit außerhalb des Raumladungsbereiches sind die Donator- (N +D falls geladen) bzw. Akzep– tor-(NA )-Störstellen durch gleichgroße Elektronen- (nn) bzw. Löcherkonzentrationen (pp) ladungsmäßig kompensiert. Die Indizes n und p besagen, dass es sich um Elektronen bzw. Löcher im nbzw. p-Gebiet handelt. Diese Ladungsträger entsprechen den in diesen Gebieten vorgegebenen Dotierungen und sie werden als Ma-
430
12. Halbleiter
joritätsladungsträger bezeichnet. Da Elektronen und Löcher „frei“ beweglich sind, diffundieren Elektronen ins p-Gebiet und Löcher ins n-Gebiet hinein. Dort heißen sie Minoritätsladungsträger und ihre Konzentrationen werden mit np (Elektronen) und pn (Löcher) bezeichnet. Im thermischen Gleichgewicht muss dabei in jedem Punkt das sog. Massenwirkungsgesetz (n 2i = n p) erfüllt sein. Für die Konzentration der Majoritätsladungsträger (Elektronen im n-Gebiet: nn bzw. Löcher im p-Gebiet: pp ) gilt nach den Betrachtungen im Abschn. 12.3 ! n E E F L L ;
12:40 a exp nn Neff kT ! p E E F V V :
12:40 b exp pp Neff kT Weiterhin gilt n2i
nn pn
V L Neff Neff
exp
ELn
EVn kT
! :
12:41
Die sich im thermischen Gleichgewicht einstellende Diffusionsspannung VD – die Maximaldifferenz des Makropotentials V (x) (s. Abb. 12.16 c) – hängt somit wie folgt mit den Ladungsträgerdichten zusammen: pp nn eVD
EVn EVp k T ln 2 :
12:42 ni Für niedrige Temperaturen im Bereich der Störstellenreserve ist offenbar jeVDj*Eg (Abb. 12.16 c). Hierbei sind E nV und E pV die Valenzbandkanten im n- und p-Gebiet. Ein Zustand des Halbleiters, wie er in Abb. 12.16 b–e dargestellt ist, muss als dynamisches Gleichgewicht aufgefaßt werden, denn Konzentrationsprofile von „freien“ Ladungsträgern wie in Abb. 12.16 e haben Diffusionsströme (Elektronen von rechts nach links, Löcher von links nach rechts) zur Folge. Auf der anderen Seite ist eine Raumladung wie in Abb. 12.16 d mit einem elektrischen Feld E (x) und deshalb mit Feldströmen von Elektronen und Löchern verknüpft. Die entsprechenden (Ladungs-!) Stromdichten stellen sich wie folgt dar: @n @p Diff Diff Diff j Dp ;
12:43 j n j p e Dn @x @x mit Dn und Dp den Diffusionskonstanten für Elektronen bzw. Löcher, j Feld e
n ln plp E x : j Feld j Feld n p
12:44
Im thermischen (dynamischen) Gleichgewicht kompensieren sich diese Ströme gerade. Im p- bzw. n-Gebiet werden beständig auf-
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
431
grund der endlichen Temperatur Elektronen-Loch-Paare erzeugt, die wieder rekombinieren. Es gilt j Diff j Feld 0
12:45
und damit verschwinden auch die Beiträge der Elektronen und Löcher einzeln, d. h., für Elektronen gilt somit nach (12.43–12.45): @n @V
x nln ;
12:46 @x @x wobei E x @V=@x benutzt wurde. Betrachtet man nicht wie in (12.40) die Ladungsträgerkonzentrationen weit außerhalb der Raumladungsschicht, wo E nL bzw. E pV konstant sind, sondern in der Raumladungszone, so wird natürlich die Leitungsbandkante beschrieben durch [ E pL– e V (x)] und die Konzentration der Elektronen ist ortsabhängig mit ! p E eV
x E F L L ;
12:47 exp n
x Neff kT Dn
damit folgt @n e @V n @x k T @x
12:48
bzw. durch Einsetzen in (12.46) Dn
kT
12:49 l : e n Diese sog. Einstein-Beziehung zwischen Trägerdiffusionskonstante und Beweglichkeit gilt immer dann, wenn Diffusionsstrom und Feldstrom von ein und derselben Ladungsträgersorte getragen werden. Die analoge Beziehung zu (12.49) folgt natürlich für Löcher wegen des Verschwindens des Gesamtlöcherstromes. Eine rigorose mathematische Behandlung des p-n-Übergangs ist nicht einfach, weil in der Poisson-Gleichung (12.39) der genaue Verlauf der Raumladungsdichte R (x) vom Wechselspiel zwischen Diffusions- und Feldstrom [und dieser wiederum von V (x)] abhängt. Für einen „abrupten“ p-n-Übergang, wie er hier betrachtet wird, lässt sich folgende Näherungslösung angeben, die unter dem Namen „Schottky-Modell “ der Raumladungszone bekannt ist. Denken wir uns den Nullpunkt der x-Achse in Abb. 12.16 in den Übergang zwischen n- und p-Gebiet gelegt, dort wo die Donatoren (ND)- und die Akzeptorenkonzentrationen (NA) abrupt aufeinander stoßen, so gilt für die Raumladung allgemein: R
x > 0 e
ND R
x < 0
n p
e
NA n
p
im n-Gebiet ;
12:50 a
im p-Gebiet :
12:50 b
Die ortsabhängigen Konzentrationen n (x), p (x) der „freien“ Ladungsträger stellen sich natürlich nach Maßgabe des Abstandes der
432
12. Halbleiter
Leitungsband- bzw. Valenzbandkante zum Fermi-Niveau ein (s. Abb. 12.16 c). Obwohl dieser Abstand sich in der gesamten Raumladungszone allmählich und monoton ändert, ändert sich die FermiFunktion und damit die Besetzung in einem Energiebereich von *2 k T (300 K)^0,05 eV, der klein ist gegen den Bandabstand, von annähernd Null auf ihren Maximalwert. Vernachlässigt man also die sog. „Aufweichungszone“ der Fermi-Verteilung, so lässt sich die Konzentration N +D der geladenen, nicht durch freie Elektronen kompensierten Donatoren bzw. die Konzentration der geladenen Ak– zeptoren N A durch Kastenfunktionen annähern (s. Abb. 12.16 d), d. h., die Raumladungsdichte wird damit 8 0 fur x < dp > < eNA fur dp < x < 0 R
x
12:51 eN f u r 0 < x < dn > : D 0 fur x > dn . Mit dieser stückweise konstanten Raumladungsdichte lässt sich die Poisson-Gleichung z. B. fürs n-Gebiet (0 < x < dn ) d 2 V
x eND '
12:52 2 e e0 dx sehr einfach integrieren. Die Rechnung fürs p-Gebiet verläuft natürlich völlig analog. Für elektrisches Feld E x (x) und Potential V (x) im n-Gebiet der Raumladungszone ergeben sich e E x
x ND
dn x
12:53 e e0 bzw. eND
dn x2 :
12:54 2e e0 Außerhalb der „Schottky-Raumladungszone“ liegen die Potentiale Vn (?) im n-Gebiet bzw. Vp (–?) im p-Gebiet vor (s. Abb. 12.17 c). Man beachte den inversen Verlauf der Energiebandkanten EV (x) und EL (x) (Abb. 12.15 c) im Vergleich zu dem des Potentials [E (x) = – eV (x)]. Die Längen dn bzw. dp geben im Rahmen des Schottky-Modells die Ausdehnung der Raumladungszone ins n- bzw. p-Gebiet an. Aus der Ladungsneutralität folgt: V
x Vn
1
ND dn NA dp ; und die Kontinuität von V (x) bei x = 0 verlangt: e
ND dn2 NA dp2 Vn
1 VP
1 VD : 2 e e0
12:55
12:56
Aus der Diffusionsspannung VD, dem Unterschied zwischen den Lagen der Bandkanten im p- und n-Gebiet, lässt sich also bei bekannten Störstellenkonzentrationen die Ausdehnung der Raumladungsschicht ausrechnen.
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
Aus (12.55) und (12.56) folgt: 2 e e0 VD NA =ND 1=2 dn ; e NA ND 2 e e0 VD ND =NA 1=2 dp : e NA ND
433
12:57 a
12:57 b
Da Diffusionspotentiale typischerweise in der Größenordnung von Eg, also bei ca. 1 V liegen, ergeben sich bei Störstellenkonzentrationen zwischen 1014 und 1018 cm–3 Ausdehnungen der Raumladungszonen dn bzw. dp zwischen 104 und 102 Å, d. h., es herrschen elektrische Feldstärken zwischen 104 und 106 V/cm in solchen Raumladungszonen. Der vorgespannte p-n-Übergang – Gleichrichtung Wenn eine zeitlich konstante, äußere elektrische Spannung U an den p-n-Übergang gelegt wird, so wird das thermische Gleichgewicht gestört, und die Verhältnisse im p-n-Übergang können als stationärer Zustand nahe am thermischen Gleichgewicht beschrieben werden. Da aufgrund der Verarmung an freien Ladungsträgern (Verarmungszone) die Raumladungszone zwischen –dp und dn einen wesentlich höheren elektrischen Widerstand besitzt als die Gebiete außerhalb des p-n-Übergangs, fällt bei außen anliegender Spannung U fast der ganze Betrag von U über der Raumladungszone ab, d. h., das Bänderschema der Abb. 12.16 bzw. der Potentialverlauf der Abb. 12.17 c ändert sich nur im Bereich der Raumladungszone; außerhalb bleiben EL (x), EV (x) und V (x) konstant, also weiterhin waagerecht. Über der Raumladungszone fällt statt der Diffusionsspannung VD (im Gleichgewicht: U = 0 V) nun der Wert Vn
1
Vp
1 VD
U
12:58
ab. Hierbei wird U positiv gezählt, wenn das Potential auf der pSeite gegenüber der n-Seite angehoben wird. Die außen anliegende Spannung ändert nun die Ausdehnung der Raumladungszone, denn in (12.57) muss statt VD die um U verringerte Diffusionsspannung eingesetzt werden, d. h., es folgt: dn
U dn
U 0
1
U=VD 1=2 ;
12:59 a
dp
U dp
U 0
1
U=VD 1=2 :
12:59 b
Im thermischen Gleichgewicht sind Feld- und Diffusionsstrom von Elektronen entgegengesetzt und gleich, dasselbe gilt für die Löcherströme. Legt man eine äußere Spannung U an, so wird dieses Gleichgewicht gestört. Betrachten wir z. B. die Strombilanz der Elektronen: Hier handelt es sich einerseits um den Feldstrom der Minoritätsladungsträger, der, aus dem p-Gebiet (wo Elektronen Minoritätsladungsträger sind) kommend, durch die Diffusionsspan-
434
12. Halbleiter
Abb. 12.17. Das Schottky-Modell der Raumladungszone eines p-n-Übergangs (bei x = 0). (a) Ortsabhängigkeit der Raumladungsdichte R
x, die aus ionisierten Akzeptoren (NA) bzw. Donatoren (ND) gebildet wird. Der reale Verlauf (gestrichelt) wird durch den rechteckigen Verlauf (durchgezogen) angenähert. (b) Verlauf der elektrischen Feldstärke Ex (x). (c) Potentialverlauf V (x) im Bereich des p-n-Übergangs
nung VD in das n-Gebiet hinübergezogen wird. Weil diese Minoritätsträger im p-Gebiet durch fortwährende thermische Generation entstehen, heißt dieser Strom Generationsstrom I gen n . Bei genügend dünner Raumladungszone und genügend geringer Rekombination in dieser wird jedes Elektron, das, vom p-Gebiet her kommend, in das Feld der Raumladungszone gerät, von diesem in das n-Gebiet hinübergezogen. Dieser Effekt ist weitgehend unabhängig von der Größe der Diffusionsspannung und somit auch von einer äußeren Spannung. Anders verhält es sich mit dem Diffusionsstrom der Elektronen aus dem n-Gebiet, wo die Elektronen Majoritätsladungsträger sind, in das p-Gebiet (genannt Rekombinationsstrom I rec n ). In dieser Richtung müssen die Elektronen gegen die Potentialschwelle der Diffusionsspannung anlaufen. Der Bruchteil der Elektronen, der die Potentialschwelle überwindet, bestimmt sich nach dem Boltzmann-Faktor exp [– e (VD–U)/k T ] und ist somit stark abhängig von der außen anliegenden Spannung U. Es gelten also bei einer äußeren Spannung U folgende Beziehungen für die Elektronenströme In durch den p-n-Übergang: Inrec
U 0 Ingen
U j 0 ; Inrec / e
k
e
VD U= T
;
12:60
12:61
d. h. mit (12.60) Inrec Ingen e
k
e U= T
;
und damit für den Gesamtelektronenstrom
12:62
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
Sperrrichtung
435
Durchlassrichtung
Abb. 12.18. Schema der Strom-Spannungs (I–U)-Kennlinie eines p-n-Übergangs mit entsprechendem Schaltbild. Der maximale Sperrstrom ist durch die Summe der Generationsströme für Elektronen und Löcher gegeben
In Inrec
Ingen Ingen
e
k
eU= T
1 :
12:63
Die gleiche Analyse folgt für die Löcherströme Ip, so dass sich für die Kennlinie eines p-n-Übergangs ergibt ! eU gen gen 1 :
12:64 I
U
In Ip exp kT Der extrem asymmetrische Verlauf dieser typischen GleichrichterKennlinie für beide Polungsrichtungen ist aus Abb. 12.18 zu ersehen. gen Um den Sättigungsstrom in Sperrrichtung –(I gen n +I p ) quantitativ zu ermitteln, ist eine etwas genauere Betrachtung des stationären Zustandes bei Anlegen einer Gleichspannung U erforderlich. Wie aus dem Vorherigen folgt, ist für die Störung des thermischen Gleichgewichts vor allem eine Änderung der Diffusionsströme verantwortlich, während in guter Näherung der Einfluss der äußeren Spannung U auf die Feldströme vernachlässigt werden kann. Im Rahmen dieser sog. Diffusionsstrom-Näherung genügt es also, nur die Diffusionsströme unter dem Einfluss der Spannung U zu betrachten. Betrachten wir den p-n-Übergang in Durchlassrichtung gepolt (Abb. 12.19), so erhöht sich, wie aus Abb. 12.19 b ersichtlich, im Raumladungsgebiet die Trägerkonzentration, wobei nicht mehr das Massenwirkungsgesetz n p = n 2i erfüllt ist. Die Fermi-Niveaus weit außerhalb der Raumladungszone unterscheiden sich gerade um die der außen angelegten Spannung U entsprechende Energie –eU (Abb. 12.19 a). In der Raumladungszone, wo kein thermisches Gleichgewicht mehr herrscht, kann im Grunde genommen kein Fermi-Niveau mehr definiert werden. Befindet sich der stationäre Zustand, wie hier angenommen, jedoch nahe am thermischen Gleichgewicht, so ist näherungsweise weiterhin eine Beschreibung mit Hilfe der Boltzmann-Statistik möglich, nur müssen statt eines einzigen Fermi-Niveaus jetzt formal zwei sog. Quasi-Fermi-Niveaus für Elektronen (in Abb. 12.19 a punktiert) und für Löcher (in Abb. 12.19 a gestrichelt) eingeführt werden. Auf weitere Details soll hier nicht eingegangen werden. Mit der Näherungsannahme, dass innerhalb der Raumladungszone Rekombinationsprozesse von Elektronen mit Löchern vernach-
436
12. Halbleiter
Durchlassrichtung
Sperrrichtung
Abb. 12.19 a, b. Schema eines p-n-Übergangs, der in Durchlass- bzw. Sperrrichtung gepolt ist (Nichtgleichgewichtszustände). (a) Bänderschema bei Anliegen einer äußeren Spannung –U bzw. +U. Um entsprechende Potentialbeträge e U sind die Fermi-Niveaus E pF bzw. E nF im p- bzw. n-Gebiet gegeneinander verschoben. Im Bereich des p-n-Übergangs spaltet das Fermi-Niveau des Gleichgewichts (– · – · –) in sog. Quasi-Fermi-Niveaus für Elektronen (· · ·) und Löcher (– – –) auf. (b) Ortsabhängigkeit der Konzentration der Löcher p und der Elektronen n im vorgespannten p-nÜbergang (durchgezogen) und ohne Vorspannung im thermischen Gleichgewicht (– – –). – dp und dn geben die Ausdehnung der Raumladungszone im thermischen Gleichgewicht, d. h. ohne Vorspannung, an. pp und pn wie auch np und nn bezeichnen die Konzentrationen tief im p- bzw. n-Gebiet
Abb. 12.19 c. Ortsabhängigkeit der Löcherkonzentration p(x) im vorgespannten p-n-Übergang außerhalb der Raumladungszone des thermischen Gleichgewichts (x > dn); Ausschnittsvergrößerung der Darstellung in Abb. 12.19 b für Polung in Durchlassrichtung
lässigt werden können, genügt es, die Änderung der Diffusionsstromdichten am Rande der Raumladungszone, d. h. bei x = –dp und x = dn, zu betrachten. In diesem nach Shockley benannten Modell für den Fall geringer Ladungsträgerinjektion werden dn und dp als konstant angenommen [nicht wie in (12.57) als Funktion von VD]; für dn und dp werden die Werte des stromlosen Falles benutzt, wie in Abb. 12.18 angedeutet ist. Die Rechnung gestaltet sich dann besonders einfach. Wir beschränken uns auf die Betrachtung der Löcher-Diffusionsstromdichte j Diff p , da für Elektronen die Rechnung analog verläuft. Für den Diffusionsstrom bei x = dn gilt nach (12.43)
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
j Diff p
x dn
e Dp
@p : @x xdn
437
12:65
Der Konzentrationsgradient @p=@x kann über die Diffusionstheorie, wie folgt, leicht auf die Erhöhung der Löcherkonzentration bei x = dn zurückgeführt werden. Die bei x = dn aufgrund der anliegenden Durchlassspannung U sich ergebende Löcherkonzentration p (x = dn) (s. Abb. 12.19 b) folgt nach der Boltzmann-Statistik zu ! VD U ;
12:66 e p
x dp pp exp kT p
x dn pn exp
e U=k T :
12:67
Hierbei sind dn bzw. dp die Ausdehnungen der Raumladungszone im thermischen Gleichgewicht (U = 0 V). Diese erhöhte Löcherkonzentration führt zu erhöhter Rekombination im n-Gebiet, was einen erhöhten Elektronenzustrom zur Folge hat. Weit im n-Gebiet wird der Strom also durch Elektronen und weit im p-Gebiet durch Löcher getragen. Aufgrund der Kontinuitätsbeziehung kann sich die Löcherkonzentration in einem Volumenelement nur dadurch ändern, dass Löcher hinein- oder hinausfließen bzw. rekombinieren oder thermisch erzeugt werden. Die Rekombinationsrate ist umso höher, je mehr Löcher über die Gleichgewichtskonzentration pn hinaus angeregt sind. Mit einer mittleren Lebensdauer sp eines Loches lautet deshalb die Kontinuitätsbeziehung für die Nichtgleichgewichtsladungsträger: @p @t
1 div j Diff p e
p
pn sp
:
12:68
Im hier betrachteten stationären Fall muss @p=@t 0 sein, und es folgt aus (12.65 und 12.68) @p @2p Dp 2 @t @x
p
pn sp
0;
12:69 a
d. h. weiter @2p 1
p @x2 Dp sp
pn :
12:69 b
Diese Diffusionsdifferentialgleichung liefert als Lösung ein Diffusionsprofil p
12:70 p
x exp
x= Dp sp : p Hierbei ist Lp = Dp sp die Diffusionslänge für Löcher, längs der die Löcherkonzentration von einem bestimmten Wert, z. B. p (x = dn) in Abb. 12.19 b auf 1/e abgenommen hat. Aus (12.70) folgt mittels Abb. 12.19 c
438
12. Halbleiter
Abb. 12.20. Beispiel einer an einem Sip-n-Übergang gemessenen Strom-Spannungs-Kennlinie. Sperrspannungen und -ströme sind negativ angegeben. (Aus dem Praktikum des 2. Physikalischen Instituts der RWTH Aachen)
Flussspannung (V)
@p p
x dn Lp @x xdn
pn
;
12:71
wobei weiter aus (12.67) für den Fall einer von außen angelegten Spannung p
x dn
pn pn exp
e U=k T
1
12:72
folgt. Aus (12.65, 12.71 und 12.72) ergibt sich die durch die äußere Spannung U erzeugte Löcher-Diffusionsstromdichte zu e Dp Diff jp pn exp
e U=k T 1 :
12:73 Lp xdn
Analoge Rechnungen folgen für den von Elektronen getragenen Diffusionsstrom und die gesamte über den p-n-Übergang fließende Stromdichte ergibt sich als Summation über diese beiden Anteile. Die Feldströme brauchen, wie oben ausgeführt, nicht berücksichtigt
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
439
zu werden. Ihre Anteile aus dem p- und n-Gebiet sind im Rahmen der Näherung gleich groß wie im thermischen Gleichgewicht und kompensieren den Gleichgewichtsanteil der Diffusionsströme, d. h.: ! e Dp e Dn eU 1 :
12:74 exp pn np j
U Lp Ln kT Damit sind die in (12.64) auftretenden Generationsströme zurückgeführt auf die Diffusionskonstanten und Diffusionslängen für Elektronen und Löcher, sowie auf die Minoritätsladungsträgerkonzentrationen pn und np. Abbildung 12.20 zeigt eine experimentell ermittelte Strom-Spannungskennlinie I (U) eines p-n-Übergangs. Der schon in Abb. 12.18 gezeigte qualitative Verlauf einer Gleichrichterkennlinie ist klar zu erkennen. Legt man eine äußere Spannung U an einen p-n-Übergang, so ändert sich die räumliche Ausdehnung der Raumladungszone dn nach (12.59) und damit ändert sich auch die gesamte in der Raumladungszone gespeicherte Ladung Qsc ' e ND dn
UA :
12:75
Diese Beziehung gilt im Rahmen der oben besprochenen „Schottky-Näherung“ für den p-n-Übergang, wobei A die Querschnittsfläche des Überganges (senkrecht zum Stromfluss) und ND wie oben die Konzentration der Donatoren ist. Mit dem p-n-Übergang ist deshalb eine spannungsabhängige Raumladungskapazität Csc gegeben: dQsc d Csc e ND A dn
U :
12:76 dU dU Aus (12.59 a) und (12.57 a) folgt:
Abb. 12.21. Experimentell ermittelte Abhängigkeit der Raumladungskapazität von der Sperrspannung (negativ gewählt) für die in Abb. 12.19 betrachtete Si-p-n-Diode. (Aus dem Fortgeschrittenen Praktikum des 2. Physikalischen Instituts der RWTH Aachen)
440
12. Halbleiter
d 1 2 e e0 VD NA =ND dU dn
U 2V e
NA ND 1 D
1 U=VD
1=2 ;
12:77
und damit ergibt sich für die Raumladungskapazität (12.76) A NA ND 2 e e e0 1=2 :
12:78 Csc 2 NA ND
VD U Wegen dieses Zusammenhanges (12.78), d. h. also 1 2 ;
12:79 Csc VD U dient die Messung der Raumladungskapazität in Abhängigkeit von der äußeren Spannung häufig zur Bestimmung von Störstellenkonzentrationen. Abbildung 12.21 zeigt eine experimentell ermittelte Abhängigkeit der Raumladungskapazität von der äußeren Spannung. Der Metall/Halbleiter-Schottky-Kontakt In seiner Funktionsweise mit dem p-n-Übergang verwandt ist der Metall/Halbleiter-Kontakt, der als gleichrichtendes Bauelement bereits Anfang des 20. Jahrhunderts am Beginn der Entwicklung der Halbleiterelektronik stand („Kristalldetektor“). Dampft man bei guten Vakuumbedingungen auf eine saubere Halbleiteroberfläche ein Metall auf, so stellt sich im Fall eines n-dotierten Halbleiters zumeist ein elektronisches Bänderschema wie in Abb. 12.22 ein. Der Grund liegt darin, dass sich am Metall/Halbleiterübergang elektronische Grenzflächenzustände ausbilden [12.6], deren räumliche Ausdehnung auf wenige Atomlagen begrenzt ist und deren energetische Lage in bezug auf die Leitungs- und Valenzbandkante des Halbleiters festgelegt ist. Die Existenz dieser Grenzflächenzustände an einem Metall/Halbleiterübergang hängt damit zusammen, dass die ausgedehnten BlochZustände des Metalls beim Übergang in den Halbleiter nicht abrupt abbrechen können, sondern in den Halbleiter hinein abklingen und deshalb dort durch eine Überlagerung von Wellenfunktionen des Leitungs- bzw. Valenzbandes dargestellt werden müssen. Je nachdem, ob die Zustände mehr „Leitungsband-“ oder mehr „Valenzbandcharakter“ haben, sind sie im mit Elektronen besetzten Zustand negativ aufgeladen (leitungsbandartig) oder neutral (valenzbandartig). Die im besetzten Zustand neutralen Zustände sind positiv geladen, wenn sie unbesetzt sind. Anders ausgedrückt, die valenzbandartigen Zustände haben Donatorcharakter, die leitungsbandartigen Zustände Akzeptorcharakter. Die Ladung in den Oberflächenzuständen wird durch die Lage des Fermi-Niveaus bestimmt. Verschwindet die Ladung, so liegt das Fermi-Niveau am sog. Neutralitätsniveau. Die sich einstellende Bandverbiegung in Abb. 12.22 a ist also durch die Bedingung der Ladungsneutralität in dem Sinne gegeben, dass die aus entleerten Donatoren in der Verarmungsrandschicht stammende Raumladung Qsc durch die Ladung in den Grenzflächenzuständen Qis kompensiert wird.
12.6 Der p-n-Übergang und der Metall/Halbleiter-Schottky-Kontakt
eUSB
eUSB
: ;
441
: ;– eVD
: ; ejUj Abb. 12.22. Elektronisches Bänderschema eines Metall/Halbleiter (n-dotiert)Übergangs, bei dem sich durch „pinning“ des Fermi-Niveaus EF in Grenzflächenzuständen eine Schottky-Barriere eySB und eine Verarmungsrandschicht im Halbleiter ausbildet; VD Diffusionsspannung (a) im thermischen Gleichgewicht, (b) bei außen anliegender Spannung U
Bei Atomdichten an der Grenzfläche von einigen 1014 cm–2 können elektronische Grenzflächenzustandsdichten von vergleichbarer Größenordnung erreicht werden. Diese verteilen sich typischerweise über Energiebereiche von 0,1 bis 1 eV im Bereich des verbotenen Bandes. Grenzflächenzustandsdichten pro Energie können also Werte um 1015 (eV)–1 cm–2 erreichen. Durch diese hohe Zustandsdichte wird das Fermi-Niveau praktisch am Neutralitätsniveau festgehalten („gepinnt“). Eine größere Abweichung vom Neutralitätsniveau würde zu sehr großen Ladungsdichten in den Grenzflächen führen, die nicht durch die Raumladungszone kompensiert werden könnten. Raumladungsänderungen durch Variation der Dotierung oder äußere angelegte Felder führen damit nur zu sehr kleinen Verschiebungen des Fermi-Niveaus von 10–2 bis 10–3eV im Band der Grenzflächenzustände. Von daher ist die sog. Schottky-Barriere eySB (Abb. 12.22) eine für den speziellen Metall-Halbleiterübergang charakteristische Größe. Sie ist natürlich in gewissen Grenzen von Details der Grenzflächenstruktur abhängig. Vergleicht man Abb. 12.22 a mit Abb. 12.16 b, so ist unmittelbar evident, dass eine Schottky-Barriere an einem Metall/Halbleiterübergang bezüglich ihrer Raumladungseigenschaften vereinfachend als die „Hälfte eines p-n-Übergangs“ aufgefaßt werden kann, wobei der p-Halbleiter durch das Metall ersetzt ist. Es ist klar, dass
442
12. Halbleiter
man die Verhältnisse auch umkehren kann; die n-Seite des p-nÜbergangs kann man sich durch ein Metall ersetzt denken, und es ergibt sich eine Schottky-Barriere in einem p-Halbleiter mit Löcherverarmung. Beim p-dotierten Halbleiter liegt EF tief im Volumen nahe der Valenzbandoberkante EV (Abb. 12.22); die Krümmung der Bänder in der Raumladungszone des Schottky-Kontakts bei p-Dotierung ist also invers zu der beim n-Halbleiter. Bei vollständig „gepinntem“ Fermi-Niveau ist die Summe aus der Schottky-Barriere für Elektronen und der Schottky-Barriere für Löcher gleich der Bandlücke. Wie bei einem p-n-Übergang liegt im Bereich der Verarmungszone einer Schottky-Randschicht ein hoher Widerstand vor. Eine von außen angelegte Spannung U fällt im Wesentlichen über der Raumladungszone ab (Abb. 12.22 b); außerhalb dieses Bereiches, d. h. im Metall und tief im Halbleiter, hat man vernachlässigbare Spannungsabfälle und damit fast thermisches Gleichgewicht. Dort können Fermi-Energien EF definiert werden, deren Differenz der außen anliegenden Spannung entspricht. Im Bereich der SchottkyBarriere können wie im Fall des p-n-Übergangs Quasi-Fermi-Niveaus definiert werden. Die formale Beschreibung der Schottky-Barriere am MetallHalbleiterübergang ist völlig analog zum p-n-Übergang. Beispielsweise ergibt sich die „Dicke“ der Metall/Halbleiter-Schottky-Randschicht im Gleichgewicht aus der Formel für den p-n-Übergang (12.57 a) mit NDNA (höhere Leitfähigkeit des Metalls als des pHalbleiters) zu: 2 e e0 VD 1=2 d :
12:80 e ND Ähnlich kann man die Kapazität einer Metall/Halbleiter-SchottkyBarriere als Funktion der außen anliegenden Spannung aus (12.78) ermitteln zu A 2 e e e0 ND 1=2 C ;
12:81 2 VD U wobei A die Fläche des Kontaktes ist. Die gleichrichtenden Eigenschaften der p-n-Diode werden in gleicher Form beim Metall/Halbleiter-Schottky-Kontakt wiedergefunden. Dies ist unmittelbar einleuchtend aus Abb. 12.22. Elektronentransport vom Metall in den Halbleiter verlangt immer das Überwinden der Schottky-Barriere eySB, während umgekehrt für Elektronen, die vom Halbleiter in das Metall fließen sollen, im Fall jUj > ySB keine Barriere auftritt.
12.7 Halbleiterheterostrukturen und Übergitter
443
12.7 Halbleiterheterostrukturen und Übergitter Mittels moderner Epitaxiemethoden für Halbleiterschichten wie Molekularstrahlepitaxie (MBE, Tafel XVII) oder metallorganischer Gasphasenepitaxie (MOCVD, Tafel XVII) ist es heute möglich, zwei verschiedene Halbleiter mit unterschiedlichen elektronischen Eigenschaften, insbesondere Bandlücken, aufeinander kristallin abzuscheiden. Besonders für Bauelemente aus III–V-Halbleitern, wie GaAs, InP u. ä. spielen solche Schichtstrukturen heute eine wichtige Rolle. Hierbei ist weiterhin von Bedeutung, dass mit diesen Epitaxieverfahren auch ternäre oder quaternäre Legierungen des Typs AlxGa1–x As oder GaxIn1–xAsy P1–y abgeschieden werden können, deren Bandlücken dann zwischen denen der entsprechenden binären Verbindungen liegen. Durch gezielte Variation der Komposition x in AlxGa1–xAs kann so die elektronische Bandstruktur kontinuierlich zwischen der des GaAs und der des AlAs „eingestellt“ werden. Bei der Komposition x = 0,45 geht hierbei die Legierung von einem direkten Halbleiter (wie GaAs) in einen indirekten Halbleiter (wie AlAs) über (Abb. 11.13). Für die wichtigsten binären Halbleiter und Elementhalbleiter sind in Abb. 12.23 die Bandlückenenergien bei 300 K gegen den Gitterabstand aufgetragen. Diese Auftragung ist deshalb von besonderem Interesse, weil erwartungsgemäß solche Halbleiter besonders gut und störungsfrei epitaktisch aufeinander aufwachsen, bei denen der Gitterabstand gut übereinstimmt. Aus Abb. 12.21 lässt sich auch entnehmen, wie sich sowohl Bandlücke als auch Gitterabstand ändern, wenn man bei der Epitaxie eine ternäre Komposition zwischen je zwei binären Halbleitern einstellt. Man erkennt leicht, dass die Epitaxie von Ge auf GaAs, und umgekehrt, zu besonders guter Gitteranpassung führt, und dass das Legierungssystem GaAlAs eine Variation der Bandlücke zwischen etwa 1,4 und 2,2 eV gestattet, wobei wegen
Abb. 12.23. Bandlücke Eg wichtiger Element- und binärer Verbindungshalbleiter, aufgetragen gegen die Gitterkonstante bei 300 K. Auf der rechten Abszisse ist die der Bandlückenenergie entsprechende Lichtwellenlänge k angegeben. Die Verbindungslinien zeigen die Verhältnisse bei ternären Verbindungen an, die sich aus Mischung der entsprechenden binären Komponenten ergeben
444
Abb. 12.24 a–c. Bänderschemata (Einelektronenenergie gegen Ortskoordinate), die sich bei der Bildung einer Heterostruktur aus den Halbleitern I und II ergeben. (a) Halbleiter I und II sind als getrennt gedacht. vI und vII sind die Elektronenaffinitäten, d. h. die energetischen Abstände zwischen der Vakuumenergie EVac und der unteren Leitungsbandkante EL. (b) Halbleiter I und II sind in Kontakt, jedoch besteht kein thermisches Gleichgewicht, da die Fermi-Niveaus EF auf beiden Seiten nicht übereinstimmen. DEL bzw. DEV sind die Banddiskontinuitäten im Leitungs- und im Valenzband. (c) Im thermischen Gleichgewicht müssen die Fermi-Energien EF im Halbleiter I und II übereinstimmen. Wegen der festvorgegebenen Banddiskontinuitäten DEL und DEV müssen sich Bandverbiegungen in Halbleiter I und II ausbilden
12. Halbleiter
EL
der extrem guten Gitteranpassung der beiden Komponenten GaAs und AlAs hervorragende kristalline Qualität beim Aufwachsen eines Halbleiters auf dem anderen zu erwarten ist. CdTe und HgTe sind auch ausgezeichnete Paare von Halbleitern, die weitgehend störungsfrei aufeinander aufwachsen können. Die Kombination zweier verschiedener epitaktisch aufeinander aufgewachsener Halbleiter nennt man eine Halbleiterheterostruktur. Die Schärfe des Übergangs kann bei geeigneten Epitaxieverfahren (MBE, MOCVD) im Bereich von einer Atomlage liegen. Die Bandlücke ändert sich bei einer solchen Heterostruktur also über Distanzen von atomaren Dimensionen. Wie sieht das elektronische Bänderschema einer Halbleiterheterostruktur somit aus (Abb. 12.24)? Zwei verschiedene Fragen sind zu beantworten: (a) Wie müssen Valenzbandkante EV bzw. Leitungsbandkante EL beider Halbleiter „aneinander gelegt“ werden? Dies ist die Frage nach der sog. Banddiskontinuität DEV (Abb. 12.24 b). (b) Welche Bandverbiegungen stellen sich in den beiden Halbleitern I und II links und rechts des Halbleiterübergangs ein (Abb. 12.24 c)? In den weitaus meisten Fällen können beide Fragestellungen getrennt und unabhängig voneinander behandelt werden, weil die relevanten Phänomene auf verschiedenen Energie- und Längenskalen zu betrachten sind. Die Anpassung der beiden Bandstrukturen aneinander findet innerhalb eines Atomabstandes statt. Interatomare Kräfte und Energien sind hierfür entscheidend und die elektrischen Felder sind in der Größenordnung atomarer Felder (0108 V/cm). Die Bandverbiegung hingegen stellt sich über hunderte von Ångström so ein, dass im thermischen Gleichgewicht das Fermi-Niveau, das tief im Innern beider Halbleiter jeweils durch die Dotierung bestimmt ist, auf beiden Seiten der Halbleitergrenzschicht denselben Wert hat (Abb. 12.24 c). Die
12.7 Halbleiterheterostrukturen und Übergitter
445
entscheidende Bedingung ist genau wie beim p-n-Übergang, dass die gesamte Heterostruktur im thermischen Gleichgewicht stromlos ist (s. (12.45)). Die Bandverbiegungen in Halbleiter I und II sind wie beim p-n-Übergang mit Raumladungen verknüpft und die Raumladungs-Feldstärken sind in der Größenordnung von 105 V/cm. Die wichtigste materialbezogene Kenngröße einer Halbleiterheterostruktur ist also die Valenz- oder Leitungsband-Diskontinuität DEV oder DEL. Die klassische, jedoch mittlerweile revidierte, Annahme war die, dass im Idealfall beide Bänderschemata der Halbleiter so aneinander zu legen sind, dass die Vakuum-Energieniveaus EVac übereinstimmen. Damit ergäbe sich die Leitungsbanddiskontinuität DEL als die Differenz der Elektronenaffinitäten Dv (Abb. 12.24) DEL vI
vII Dv :
12:82
Die Elektronenaffinität v, die Differenz zwischen Vakuumenergie und unterer Leitungsbandkante, ist eine für das Volumen eines Materials theoretisch wohl definierte Größe. Ihre experimentelle Bestimmung aber geschieht über Oberflächenexperimente, bei denen das im Volumen definierte v durch Grenzflächendipole (z. B. durch geänderte Atomkoordinaten an der Oberfläche) stark verändert sein kann. Erst recht für die Grenzschicht zwischen zwei Halbleitern kann v nicht ohne weiteres von Volumengrößen her abgeleitet werden. Es werden deshalb heute Modelle diskutiert, bei denen in einer idealen, abrupten Halbleiterheterostruktur die elektronischen Bänder so „aneinander gelegt“ werden, dass keine atomaren Dipole entstehen, z. B. durch elektronische Grenzflächenzustände oder Ladungstransfer in den chemischen Bindungen an der Grenzschicht. Eine detaillierte theoretische Behandlung dieser Modelle verlangt eine atomistische Beschreibung der elektronischen Eigenschaften der wenigen Atomlagen am Halbleiterheteroübergang. Dies geht über den Rahmen des vorliegenden Buches hinaus. Wir betrachten deshalb die Banddiskontinuität DEL oder DEV als phänomenologische Größe, die sich experimentell bestimmen lässt. Einige zur Zeit weitgehend anerkannte Werte sind in Tabelle 12.7 [12.7] aufgelistet. Aus der Kenntnis der Valenzbanddiskontinuität DEV und der Energie der verbotenen Bänder der beiden Halbleiter lässt sich natürlich sofort die Leitungsbanddiskontinuität DEL bestimmen. Die Berechnung der Raumladungszonen geschieht völlig analog zu den Rechnungen am einfachen p-n-Übergang (Abschn. 12.6), nur dass sich jetzt positive und negative Raumladungen in zwei verschiedenen Halbleitermaterialien I und II mit verschiedenen Dielektrizitätskonstanten e I und e II befinden. Die entsprechenden Bezeichnungen für einen p-n-Heteroübergang sind in Abb. 12.25 dargestellt. Die einfachste Beschreibung ist wiederum im Rahmen des Schottky-Modells möglich, bei dem die Raumladungsdichten – e N IA bzw. e N IID über die Ausdehnung der Raumladungszonen d I und d II als konstant angenommen werden. Die Poisson-Gleichung (12.39 bzw. 12.52) kann dann wieder stückweise in Halbleiter I
446
12. Halbleiter
Abb. 12.25. Bänderschema eines Halbleiter-Heteroübergangs: Halbleiter I mit dielektrischer Funktion e I ist p-dotiert mit einer Akzeptorkonzentration N IA, Halbleiter II mit dielektrischer Funktion e II ist n-dotiert mit einer Donatorkonzentration N IID. Die Raumladungszonen haben die Ausdehnungen d I bzw. d II; die mit den Raumladungszonen verbundenen Diffusionsspannungen sind V ID bzw. V IID. DEV ist die Valenzband-Diskontinuität. Ein solcher Heteroübergang bestehend aus einem p-Halbleiter mit kleinerer und einem n-Halbleiter mit größerer Bandlücke wird auch als p-NHeteroübergang bezeichnet (klein p wegen kleiner Bandlücke, groß N wegen großer Bandlücke)
und II integriert werden. Man muss nur berücksichtigen, dass sich die gesamte Diffusionsspannung VD jetzt auf zwei verschiedene Halbleiter, d. h. auf V ID und V IID, aufteilt: VD VDI VDII :
12:83
Gleiches gilt auch für eine von außen an den p-n-Heteroübergang angelegte Spannung U U I U II :
12:84
Um die beiden Lösungen der Poissongleichung am Heteroübergang (x = 0) aneinander anzuschließen, ist die Kontinuität der dielektrischen Verschiebung e0 eI E I
x 0 e0 eII E II
x 0
12:85
Tabelle 12.7. Zusammenstellung einiger experimentell bestimmter Valenzband-Diskontinuitäten DEV. Der zuerst genannte Halbleiter ist das Substrat, auf das der als zweiter genannte Halbleiter i. a. als dünne verspannte Schicht deponiert wurde. (Nach Margaritondo und Perfetti [12.7]) Heterostruktur
ValenzbandDiskontinuität DEV [eV]
Heterostruktur
ValenzbandDiskontinuität DEV [eV]
Heterostruktur
ValenzbandDiskontinuität DEV [eV]
Si-Ge AlAs-Ge AlAs-GaAs AlSb-GaSb GaAs-Ge GaAs-Si GaAs-InAs GaP-Ge GaP-Si GaSb-Ge GaSb-Si
0,28 0,86 0,34 0,4 0,49 0,05 0,17 0,80 0,80 0,20 0,05
InAs-Ge InAs-Si InP-Ge InP-Si InSb-Ge InSb-Si CdS-Ge CdS-Si CdSe-Ge CdSe-Si CdTe-Ge
0,33 0,15 0,64 0,57 0,0 0,0 1,75 1,55 1,30 1,20 0,85
CdTe-a-Sn ZnSe-Ge ZnSe-Si ZnSe-GaAs ZnTe-Ge ZnTe-Si GaSe-Ge GaSe-Si CuBr-GaAs CuBr-Ge
1,1 1,40 1,25 1,03 0,95 0,85 0,83 0,74 0,85 0,7
12.7 Halbleiterheterostrukturen und Übergitter
447
zu berücksichtigen. Für die Dicken der Raumladungszonen in Halbleiter I und II ergeben sich zu (12.57) analoge Formeln: II I II 1=2 2ND e0 e e
VD U dI ;
12:86 a eNAI
eI NAI eII NDII I 1=2 2NA e0 eI eII
VD U d II :
12:86 b eNDII
eI NAI eII NDII Hierbei wurde ergänzend zu (12.57) noch eine außen anliegende Spannung U berücksichtigt. Die Verteilung der Gesamtspannung auf die beiden Halbleiter ergibt sich zu VDI VDII
UI NDII eII : U II NAI eI
12:87
Für den Fall eines einfachen p-n-Übergangs (eI eII ) ergibt sich natürlich im thermischen Gleichgewicht (U = 0) gerade wieder (12.57). Von besonderem Interesse sind Heteroübergänge zwischen verschiedenen Halbleitern mit gleicher Dotierung, sog. isotype Heteroübergänge (z. B. n-n in Abb. 12.24 c). In diesem Fall stellt sich wegen der Kontinuitätsbedingung für das Fermi-Niveau auf der Seite des Halbleiters mit geringerem verbotenen Band eine AnreicherungsRaumladungszone für Elektronen ein, die zu einer lokal sehr starken Anhebung der Elektronenkonzentration führt. Dies gilt auch, wenn diese Seite der Heterostruktur nur sehr schwach dotiert, d. h. nahezu intrinsisch ist (Abb. 12.26 a). Die hohe Konzentration von freien Elektronen in dieser Raumladungszone (Halbleiter II) wird dann ladungsmäßig kompensiert durch die ihr in Halbleiter I gegenüberstehende Verarmungs-Raumladungszone, die infolge der hohen Konzentration ionisierter Donatoren eine starke positive Raumladung trägt. Diese Donatorstörstellen haben ihr Valenzelektron in den energetisch günstigeren Potentialtopf der Anreicherungszone in Halbleiter II abgegeben. Auf diese Weise ist die hohe Dichte von freien Elektronen räumlich von den ionisierten Störstellen getrennt, von denen sie stammen. Störstellenstreuung als wichtige Ursache für den elektrischen Widerstand bei tiefen Temperaturen ist deshalb stark unterdrückt für dieses freie Elektronengas. Im homogen dotierten Halbleiter verlangt eine Steigerung der Ladungsträgerkonzentration gleichzeitig eine Erhöhung des Dotierungsgrades und damit verstärkte Störstellenstreuung, was zu einer Erniedrigung der Leitfähigkeit führt. Diese notwendige Verknüpfung von erhöhter Störstellenstreuung mit wachsender Ladungsträgerkonzentration ist nicht gegeben für solche Heterostrukturen wie in Abb. 12.26. Man nennt diese Art der einseitigen Dotierung einer Heterostruktur „Modulationsdotierung“. Elektronenbeweglichkeiten einer modulationsdotierten AlxxAs/GaAs-Heterostruktur sind in Abb. 12.27 dargestellt. Wäre die Elektronenbeweglichkeit durch Streuung an ionisierten Störstellen (IS) und Phononen (P) so wie in homogen dotiertem GaAs be-
448
12. Halbleiter
Abb. 12.26. (a) Modulationsdotierter Heteroübergang, bestehend aus einem hoch n-dotierten Halbleiter I mit großer Bandlücke und einem schwach (oder nahezu intrinsisch) n-dotierten Halbleiter II mit kleiner Bandlücke (N–n-Heteroübergang). (b) Bänderschema eines modulationsdotierten KompositionsÜbergitters; die Halbleiterschichten I sind jeweils hoch n-dotiert, während die Schichten des Typs II schwach dotiert oder nahezu intrinsisch sind
stimmt, dann ergäbe sich eine durch diese Prozesse charakteristische Begrenzung, abfallend zu hohen und zu tiefen Temperaturen. Ein Maximum der Beweglichkeit von etwa 4´103 cm2/Vs würde bei einer Donatorkonzentration ND von 1017 cm–3 bei etwa 150 K erreicht. Die experimentell ermittelten Beweglichkeiten von modulationsdotierten Strukturen (schattierter Bereich) zeigen jedoch keinen Abfall der Beweglichkeit zu tiefen Temperaturen hin. Die Variation der Beweglichkeiten im schattierten Bereich ist wesentlich durch die von verschiedenen Autoren erreichte Perfektion des Heteroübergangs bedingt. Bei Temperaturen unterhalb von 10 K werden extrem hohe Beweglichkeiten bis zu 2´106 cm2/Vs erreicht. Die Beweglichkeitserhöhung bei tiefen Temperaturen kann noch verstärkt werden, wenn eine undotierte AlxGa1–xAs-Schicht einer Dicke von etwa 100 Å zwischen dem hoch n-dotierten AlGaAs und dem sehr schwach dotierten GaAs bei der Epitaxie eingeschoben wird. Auf diese Weise werden Streuprozesse an Störstellen unmittelbar am Halbleiterübergang ausgeschaltet. Für n-Dotierungen des AlGaAs im Bereich von 1018 cm–3 liegen typische Dicken der Elektronen-Anreicherungsschicht im Bereich von 50 bzw. 100 Å. Die freien Elektronen sind hierbei in z-Richtung (senkrecht zum Heteroübergang) in einen schmalen, dreieckigen Potentialtopf eingesperrt (Abb. 12.26 a). Sie können sich nur parallel zur Heterostruktur frei bewegen. Die Wellenfunktion eines solchen Elektrons hat also nur parallel zur Heterostruktur Blochwellen-Charakter, senkrecht dazu (längs z ) erwartet man Quantisierungseffekte wie für Elektronen in einem Potentialkasten (Abschn. 6.1). Man spricht von einem zweidimensionalen Elektronengas (2 DEG). Gleichartige Effekte wie die an der einfachen modulationsdotierten Heterostruktur (Abb. 12.26 a) treten auf, wenn man epitaktisch zwei spiegelbildlich zueinander liegende Heterostrukturen oder gar eine ganze Serie von Schichten aus Halbleitern I und II mit unterschiedlicher Bandlücke aufeinander aufwachsen lässt (Abb. 12.26 b). Es bildet sich dann in der Bandstruktur eine Serie von sog. „Quantentöpfen“ aus, in denen sich die freien Elektronen des Leitungsbandes ansammeln. Man nennt eine solche Struktur wie in
12.7 Halbleiterheterostrukturen und Übergitter
449
Abb. 12.27. Temperaturabhängigkeit der elektronischen Beweglichkeit von quasi2 D-Elektronengasen in modulationsdotierten AlGaAs/GaAs-Strukturen; der schattierte Bereich umfaßt eine Vielzahl experimenteller Daten. Zum Vergleich sind Beweglichkeitskurven für homogen dotiertes GaAs mit Donatorkonzentrationen ND 4´1013 cm–3 und ND = 1017 cm–3 angegeben (gestrichelt). Die Begrenzung der Beweglichkeiten ist durch folgende Mechanismen gegeben: Streuung an ionisierten Störstellen (IS) (· · ·); Phonon-Streuung (P) (– · –); piezoelektrische Streuung (PE) (– ·· –). (Nach Morkoç [12.8])
Abb. 12.26 b ein Kompositionsübergitter, da dem Kristallgitter eine künstlich erzeugte größere periodische Struktur von Potentialtöpfen überlagert ist. Man spricht weiter von einem modulationsdotierten Übergitter, wenn wie in Abb. 12.26 b nur der Halbleiter I mit der größeren Bandlücke hoch n-dotiert ist, der Halbleiter II mit der kleineren Lücke hingegen sehr schwach dotiert ist. Die freien Elektronen in den Quantentöpfen des Halbleiters II sind wiederum von den Donatorstörstellen in Halbleiter I, von denen sie stammen, räumlich getrennt. Störstellenstreuung wird stark herabgesetzt und es werden senkrecht zur Übergittertranslation (z-Achse) extrem hohe Tieftemperaturbeweglichkeiten wie in Abb. 12.27 gefunden. Die in Abb. 12.26 b eingezeichneten Bandkrümmungen, positiv in Halbleiter I und negativ in Halbleiter II, entsprechen dem Vorzeichen der Raumladung im jeweiligen Gebiet. Eine eindeutige Verknüpfung ist über die Poisson-Gleichung (12.39) gegeben. Sind die Quantentöpfe in Abb. 12.26 b genügend eng, d. h. ist ihre Ausdehnung in z-Richtung kleiner oder in der Größenordnung von 100 Å, so treten wiederum wie in engen Raumladungszonen (Abb. 12.26 a) Quantisierungseffekte in z-Richtung deutlich in Erscheinung. Diese sog. z-Quantisierung wird unmittelbar klar, wenn wir die zeitunabhängige Schrödinger-Gleichung für ein Kristallelektron betrachten, das wie in Abb. 12.26 a und b in einer Richtung ( zAchse) „eingesperrt“ ist, während senkrecht dazu fast freie Beweglichkeit gegeben ist. Das Potential V ist dann nur eine Funktion von z und mit den drei effektiven Massenkomponenten mx , my , mz ergibt sich
450
12. Halbleiter
h2 1 @ 2 1 @2 1 @2 2 mx @x2 my @y2 mz @z2
e V
z w
r E
w
r :
12:88
Durch einen Ansatz der Form w
r uj
zei kx xi ky y uj
zei kk r ;
12:89
der der freien Beweglichkeit parallel zu den Schichten (mit Wellenvektor kk) Rechnung trägt, separiert sich (12.88) in zwei getrennte Differentialgleichungen h2 @ 2 e V
z uj
z ej uj
z ; und
12:90 2 mz @z2 h2 @ 2 h2 @ 2 i kx xi ky y e Exy ei kx xi ky y :
12:91 2 mx @x2 2 my @y2 Gleichung (12.91) liefert als Lösungen Energieeigenwerte, die der freien Bewegung eines Elektrons senkrecht zu z entsprechen Exy
h2 2 h2 2 h2 2 k k k : 2 mx x 2 my y 2 mk k
12:92
Für die Bestimmung von ej muss in (12.90) der genaue Potentialverlauf V (z) bekannt sein. Unter Berücksichtigung der Raumladung hängt V (z) natürlich von der Dichte der freien Elektronen und der ionisierten Donatorrümpfe ab, d. h. über die Elektronendichte gehen die Aufenthaltswahrscheinlichkeitsdichten juj
zj2 mit ins Potential ein. Gleichung (12.90) müsste also selbstkonsistent gelöst werden. In einfacher Näherung jedoch beschreibt man V (z) durch ein starres Rechteck-Kastenpotential (wie in Abschn. 6.1) im Fall der Quantentöpfe (Abb. 12.26 b) oder durch ein Dreieckpotential im Fall einer einfachen modulationsdotierten Heterostruktur (Abb. 12.26 a). Nimmt man im Fall des Kastenpotentials auch noch unendlich hohe „Potentialwände“ an, d. h. einfache stehende Elektronenwellen längs z in diesem Kasten, so folgt gemäß Abschn. 6.1 für die Energieeigenwerte ej ej '
h2 p2 j2 ; 2 mz dz2
j 1; 2; 3 . . . ;
12:93
wenn dz die Ausdehnung des Potentialtopfes in z-Richtung ist. Die Gesamtenergieeigenwerte eines solchen in z-Richtung gequantelten Elektronenzustandes Ej
kk
h2 kk2 ej 2 m k
12:94
werden durch eine Schar diskreter Energieparabeln längs kx und ky , sog. Subbändern, beschrieben (Abb. 12.28 b). Diese zweidimen-
12.7 Halbleiterheterostrukturen und Übergitter
451
sionalen (2 D)-Subbänder besitzen eine konstante Zustandsdichte D
E dZ=dE, wie leicht zu sehen ist: Analog zu Abschn. 6.1 schließt man, dass im 2 D-reziproken Raum der Wellenzahlen kx, ky die Anzahl der Zustände dZ in einem Ring mit der Dicke dk und Radius k gerade durch dZ
2pk dk
12:95
2p2
gegeben ist. Wegen dE = h 2 k dk/mk erhält man für die Zustandsdichte
12:96 D dZ=dE mk =ph2 const ; wenn die Spinentartung durch einen Faktor 2 berücksichtigt wird. Die Gesamtzustandsdichte D (E) aller Subbänder ist somit eine Superposition von konstanten Beiträgen, eine Treppenfunktion wie in Abb. 12.28 c. Scharfe parabelförmige Subbänder wie in Abb. 12.28 b werden nur dann auftreten, wenn die Energieeigenwerte ej (12.93) scharfe Energieniveaus sind. Dies ist der Fall, falls es sich um einen einzelnen Potentialtopf im Leitungsband handelt, oder wenn in einem Übergitter die benachbarten Potentialtöpfe so weit voneinander entfernt sind, dass die entsprechenden Wellenfunktionen aus den ein-
a
b
c Abb. 12.28 a–c. Quantisierung eines quasi-2 D-Elektronengases in einem dreieckigen Potentialwall, der sich in einer starken Anreicherungsrandschicht an einem Heteroübergang bei z = 0 ergibt. (a) Verlauf der Leitungsbandkante EL (z); EF ist das Fermi-Niveau. e1, e2, . . . sind die Energieniveaus, die sich aus der Quantisierung der Einelektronenzustände längs z ergeben. (b) Energieparabeln der Subbänder, aufgetragen längs kx einem Wellenvektor in der Ebene der freien Beweglichkeit senkrecht zu z. (c) Zustandsdichte des in Subbändern gequantelten quasi-2-DElektronengases
452
12. Halbleiter
zelnen Potentialtöpfen sich nicht überlappen. Wird der Abstand zwischen den Potentialtöpfen so gering (kleiner als 50 bis 100 Å), dass ein merklicher Überlapp zwischen den Wellenfunktionen auftritt, dann führt dies zu einer Aufspaltung in Bänder. Diese Aufspaltung ist völlig analog zu der einzelner atomarer Energieniveaus bei Atomen, die sich in einem Kristallverband befinden (Abschn. 7.3). Abbildung 12.29 zeigt die theoretisch erwartete Aufspaltung der Subbandenergien e1, e2, . . . für den Fall eines Rechteck-Übergitters, bei dem die Breite der Potentialtöpfe dz der räumlichen Entfernung zweier Heteroübergänge entspricht. Man sieht, dass das energetisch tiefste Subband e1 unterhalb eines Periodizitätsabstandes von etwa 50 Å merklich verbreitert wird und in ein Band aufspaltet. Für höhere Subbänder tritt die Aufspaltung schon bei größeren Abständen der Potentialtöpfe auf. Der Effekt der Subbandaufspaltung, insbesondere die Abhängigkeit der Subbandenergien von der räumlichen Breite der Potentialtöpfe wird in Photolumineszenzexperimenten deutlich. Photolumineszenzspektroskopie ist eine wichtige optische Charakterisierungsmethode für Halbleiterheterostrukturen und Übergitter. Es handelt sich hierbei um die Umkehrung eines optischen Absorptionsexperimentes: Die Halbleiterstruktur wird mit monochromatischem Laser-Licht einer Photonenenergie oberhalb der Bandkante bestrahlt, d. h. es werden Elektron-Loch-Paare erzeugt, die die Subbänder des Leistungs- bzw. Valenzbandes des Halbleiters bzw. die entsprechenden exzitonischen Zustände (Abschn. 11.11) besetzen. Im Fall von direkten Halbleitern (Abschn. 12.1) ist die Rekombination der freien Elektronen mit den Defektelektronen mit einer starken Lumineszenzstrahlung verbunden, die im Fall scharfer Subbänder monochromatisch ist und bis auf exzitonische Bindungsenergien (Abschn. 11.11) dem energetischen Abstand der Subbänder für Elektronen und Löcher entspricht. Das Experiment muss bei tiefen Temperaturen durchgeführt werden, um die geringe energetische
Abb. 12.29. Energiezustände von Elektronen, die in rechteckigen Potentialtöpfen des Leitungsbandes eines Kompositionsübergitters „eingesperrt“ sind (Einschub); die Potentialtöpfe haben eine Weite dz, die auch ihrem Abstand voneinander entspricht. Für die Rechnung wurde eine elektronische effektive Masse von m = 0,1 m0 angenommen. Die scharfen Kurven im schraffierten Gebiet folgen für einzelne Potentialtöpfe mit den entsprechenden Weiten dz; Potentialtöpfe in einem Übergitter führen bei genügend geringem Abstand zu einem Überlapp und damit zu einer Aufspaltung in Bänder (schraffierte Gebiete). (Nach Esaki [12.9])
12.7 Halbleiterheterostrukturen und Übergitter
453
Aufspaltung der Subbandstruktur (e1, e2, . . . ) beobachten zu können. Die Beobachtung bei tiefer Temperatur ist auch der Grund dafür, dass Subband-Exzitonen stabil sind und die Rekombinationsstrahlung aus den exzitonischen Elektron-Loch-Zuständen erfolgt. Abbildung 12.30 zeigt ein Photolumineszenzspektrum, das an einer AlGaAs/GaAs-Vielfachschichtstruktur bei einer Temperatur von 2,7 K aufgenommen wurde. Die Schichtstruktur besteht aus vier GaAs-Quantentöpfen verschiedener Dicke (20, 30, 60, 100 Å), die zwischen Al0,3Ga0,7As-Barrieren eingebettet sind. Entsprechend den verschiedenen Dicken der Quantentöpfe werden vier scharfe unterschiedliche Lumineszenzlinien bei Photonenenergien zwischen 1,55 und etwa 1,75 eV beobachtet. Da die Subbänder dadurch gekennzeichnet sind, dass jeweils ein Vielfaches der halben Elektronenwelle in etwa in den Quantentopf hineinpassen muss, liefern dünnere Quantentöpfe weiter auseinander liegende Subbänder im Valenz- bzw. Leitungsband und damit energetisch höhere Übergangsenergien in der Photolumineszenz. Für eine genaue theoretische Auswertung der Beziehung zwischen Photonenenergie der Lumineszenzbande und der Quantentopfdicke muss natürlich noch berücksichtigt werden, dass die angeregten Elektron-Loch-Paare einer Coulombanziehung unterliegen und daher die Differenz der Elektronen- und Lochsubbänder nur bis auf eine Exzitonenbindungsenergie mit der ausgesandten Photonenenergie übereinstimmt. Da lokal variierende Dicken von Quantentöpfen verschiedene spektrale Lagen der ausgesandten Photolumineszenzlinien zur Folge haben, eignet sich hochaufgelöste Photolumineszenzspektroskopie sehr gut, um räumliche Schichtdickenschwankungen von Quantentopfschichten zu untersuchen. Neben den bisher betrachteten Kompositionsübergittern existiert ein zweiter Typ von Halbleiter-Übergittern, sog. Dotierungsübergitter. Hierbei besteht die Übergitterstruktur aus ein und demselben Halbleitermaterial, jedoch ist das Material in periodischer Abfolge abwechselnd n- und p-dotiert. Im Prinzip handelt es sich also um eine periodische Sequenz von p-n-Übergängen (Abschn. 12.6). Weil jeweils zwischen den n- und p-Zonen quasi-intrinsische (i)
Abb. 12.30. Photolumineszenzspektrum, aufgenommen bei 2,7 K an einer Mehrfachquantentopfstruktur aus Al0, 3Ga0,7As/GaAs, die mittels MBE hergestellt wurde. Die verschiedenen Emissionslinien resultieren aus Elektron-Loch-Rekombinationsprozessen in den verschieden dicken Quantentöpfen ˚ ). Das entsprechende Bän(20 bis 100 A derschema (EL, EV) der Schichtstruktur mit Zuordnung der Quantentöpfe zu den Emissionslinien ist angedeutet. (Nach Förster [12.10])
454
12. Halbleiter
Bereiche vorhanden sind, haben diese Strukturen auch den Namen „ nipi-Strukturen “. Die Herstellung dieser Gitter geschieht auch in Epitaxieanlagen (MOCVD, MBE etc., Tafel XVII). Während des Wachstums werden abwechselnd p- und n-Dotierungsquellen angeschaltet. Die interessanten Eigenschaften von nipi-Übergittern zeigen sich in der ortsabhängigen elektronischen Bandstruktur (Abb. 12.31). Wegen der periodischen Abfolge von n- und p-dotierten Gebieten muss einmal die Leitungsband- und dann die Valenzbandkante nahe am Fermi-Niveau liegen. Dies führt zu einer räumlich periodischen Modulation der Bandkanten. Angeregte freie Elektronen (thermisch wie im Nichtgleichgewicht) befinden sich dann in den Leitungsbandminima, während angeregte Defektelektronen sich räumlich getrennt in den Maxima des Valenzbandes ansammeln. Diese räumliche Trennung von Elektronen und Löchern ist verantwortlich dafür, dass die Stoßrate zwischen diesen beiden Teilchen drastisch herabgesetzt wird. Als interessante Eigenschaft resultiert eine extrem hohe Lebensdauer von Elektronen und Löchern gegen Rekombination. Dies wird vor allem deutlich, wenn ElektronLoch-Paare durch Einstrahlen von Licht erzeugt werden. Ein Photostrom kann in solchen nipi-Strukturen wesentlich länger existieren als in homogen dotierten Halbleitern. Eine andere interessante Eigenschaft von Dotierungsübergittern betrifft die Bandlücke. Trotz weitgehender räumlicher Trennung von Elektronen- und Lochzuständen besteht ein gewisser Überlapp der Wellenfunktionen im Übergangsbereich (i-Bereich). Daraus resultiert die Möglichkeit optischer Übergänge sowohl in Absorption wie in Emission. Optische Übergänge erscheinen also infolge der Bandmodulation bei Quantenenergien unterhalb der Bandkante des homogen dotierten Halbleiters (Abb. 12.31). nipi-Strukturen haben eine effektive Bandlücke E eff g , die durch die jeweilige n- und p-Dotierung gezielt eingestellt werden kann. In einfachster Näherung geht man in der theoretischen Beschreibung wie beim p-n-Übergang (Abschn. 12.6) von vollständig ionisierten Störstellen aus und
Abb. 12.31 a–c. Bänderschema eines Dotierungs-(nipi)-Übergitters, bei dem ein und dasselbe Halbleitermaterial (z. B. GaAs) abwechselnd n- und p-dotiert wird. (a) Qualitative räumliche Darstellung der Struktur. (b) Bänderschema im thermischen Gleichgewicht. (c) Bänderschema bei starker Anregung von Elektron-Loch-Paaren über das thermische Gleichgewicht hinaus
12.7 Halbleiterheterostrukturen und Übergitter
455
verwendet die Schottky-Näherung mit „ rechteckigen“ Raumladungsverteilungen. Wegen der Verknüpfung von Bandkrümmung mit Raumladungsdichte über die Poisson-Gleichung (12.39) ist unmittelbar einsichtig, dass eine Verringerung der Raumladung eine Abnahme der Bandkrümmung und damit ein Abflachen der Bandmodulation zur Folge hat. Die effektive Bandlücke wird größer (Abb. 12.31). Die Raumladung setzt sich zusammen aus ionisierten Donatoren (positiv) und Elektronen im n-Gebiet sowie aus ionisierten Akzeptoren (negativ) und Defektelektronen im p-Gebiet. Genügend hohe Anregung von Elektronen und Löchern, z. B. durch Lichteinstrahlung, verringert also die Raumladung und schwächt die Bandmodulation ab. Bei nipi-Übergittern wird die effektive Bandlücke abhängig von der Anregungsdichte optisch erzeugter Nichtgleichgewichtsladungsträger. Die effektive Bandlücke kann optisch verändert werden. Dies lässt sich leicht in einem Photolumineszenzexperiment (Abb. 12.32) zeigen, bei dem die Rekombinationsstrahlung von optisch angeregten Elektronen und Löchern in Abhängigkeit von der Laser-Anregungsleistung beobachtet wird [12.11]. An einem GaAs-nipi-Übergitter mit einer p- und n-Dotierung von etwa 1018 cm–3 und einer Translationsperiode von etwa 800 Å erscheint die Bandkantenlumineszenzlinie bei niedriger Anregungsleistung knapp oberhalb von 1,2 eV (Abb. 12.32), während homogen dotiertes GaAs bei 2 K eine Bandlücke von etwa 1,5 eV hat. Mit wachsender Anregungsleistung verschiebt sich die Lumineszenzlinie zu höheren Energien bis in den Bereich der GaAs-Bandkante, so wie man bei Abnahme der Bandmodulation erwarten würde. Halbleiterheterostrukturen und Übergitter haben wegen ihrer völlig neuen Eigenschaften, die bei homogenen Halbleitern nicht auftreten, eine „neue Dimension“ im Bereich der Mikroelektronik geöffnet. Neue Bauelementkonzepte sowohl im Bereich sehr schneller Schaltungen wie auch in der Optoelektronik werden möglich. Die Entwicklung auf diesem Gebiet ist erst am Anfang [12.12].
Abb. 12.32. Photolumineszenzspektren, gemessen an einem GaAs-nipi-Übergitter, das mittels metallorganischer MBE (MOMBE) auf einem GaAs-Wafer mit (100)-Orientierung abgeschieden wurde; p-Dotierung durch Kohlenstoff. n-Dotierung durch Si. Die Spektren wurden mit verschiedenen Anregungsleistungsdichten und einer Photonenenergie von 1,92 eV bei 2 K aufgenommen. (Nach Heinecke et al. [12.11])
456
12. Halbleiter
12.8 Wichtige Halbleiterbauelemente Moderne Informationstechnik basiert auf integrierten Halbleiterschaltkreisen (IC) für Datenverarbeitung (Logik) und Speicherung und, soweit der Datentransfer wie z. B. in Netzwerken mittels Glasfaser erfolgt, auf optoelektronischen Bauelementen, wie Detektoren, optischen Emittern, lichtemittierenden Dioden (LEDs) und Halbleiterlasern. Während über 90% aller Halbleiter-ICs auf Siliziumwafern hergestellt werden, sind die wichtigsten Ausgangsmaterialien für optoelektronische Bauelemente III–V-Halbleiter, vor allem GaAs. Der Grund ist, dass höchste Integrationsdichte, d. h. kleinste Strukturgrößen, einfacher auf dem Elementhalbleiter Silizium zu erreichen sind, während für optoelektronische Bauelemente die weitaus stärkere Ankopplung des elektromagnetischen Feldes an elektronische Bandübergänge bei direkten III–V-Halbleitern wesentlich ist. Für Logik- und Speicherschaltkreise in der Informationstechnik wie auch für Leistungselektronik sind Transistoren die wichtigsten aktiven Bauelemente. Transistoren sind sog. Dreitorbauelemente, d. h. Schalter, bei denen ein Eingangssignal an einem Kontakt Ströme oder Spannungen zwischen zwei anderen Kontakten schaltet. Transistoren sind gleichzeitig Verstärker für Strom und/oder Spannung. Die wesentlichen optoelektronischen Bauelemente, Detektoren, lichtemittierende Dioden und Laser sind demgegenüber Zweitorbauelemente (Dioden), bei denen nur Stromfluss über zwei Kontakte erforderlich ist. Bauelemente lassen sich nach einem weiteren Kriterium unterscheiden: je nachdem, ob nur eine Ladungsträgersorte die wesentliche Bauelementfunktion trägt, oder ob beide Ladungsträgerarten, Elektronen und Löcher, beteiligt sind, spricht man von unipolaren oder bipolaren Bauelementen. Mit Hilfe dieses Kriteriums können wir die beiden wichtigen Klassen von Transistoren unterscheiden, nämlich Bipolartransistoren und Feldeffekt-Transistoren (FETs), die unipolaren Charakter haben. Laser, bei denen die Lichtemission aus der Rekombination von Elektronen und Löchern resultiert, sind in diesem Sinne auch bipolare Bauelemente. Der Bipolartransistor Der klassische Bipolartransistor, der 1947 von Bardeen, Brattain und Shockley in den Bell-Laboratorien (USA) erfunden wurde, besteht aus zwei gegeneinander geschalteten pn-Übergängen (Abb. 12.33a). Dementsprechend gibt es npn- und pnp-Transistoren, die sich dadurch voneinander unterscheiden, dass im ersten Fall (npn) Elektronen, im zweiten Fall (pnp) Löcher den Hauptstrom tragen, obwohl, wie der Begriff „bipolar“ ausdrückt, beide Ladungsträgersorten an der Funktion des Bauelementes mitwirken. In Abb. 12.33 a ist die Verschaltung eines npn-Transistors schematisch dargestellt: Der erste n+p-Übergang (hohe n-Dotierung,
12.8 Wichtige Halbleiterbauelemente
457
Elektronenfluss
mäßige p-Dotierung) ist in Durchlassrichtung gepolt, so dass über eine enge Raumladungszone mit niedrigem Widerstand eine hohe Konzentration von Elektronen aus dem sog. n+-Emittergebiet in die p-dotierte Basiszone „hinüberflutet“. Diese aus der Emitterzone emittierten Elektronen sind in der Basis Minoritätsladungsträger. Ihre Tendenz, mit den dort in hoher Zahl vorhandenen Löchern zu rekombinieren, ist groß. Ist jedoch, wie bei einem effizienten Transistor, diese Basiszone räumlich sehr kurz (im Vergleich zur Rekombinationslänge), so gelangt ein Großteil der Elektronen ohne Rekombination in den angrenzenden p(Basis)-n(Kollektor)-Übergang, der in Sperrrichtung gepolt ist. Wie aus dem Bänderschema in Abb. 12.33 c ersichtlich ist, geraten diese Überschusselektronen in das starke, beschleunigende Feld dieser ausgedehnten pn-Raumladungszone und werden in das Kollektor-Gebiet hineingezogen. Bei genügend schmaler Basiszone ist der Kollektorstrom IC nur geringfügig kleiner als der Emitterstrom IE, nämlich gerade um den Anteil IBn, der in der Basis durch Rekombination mit zufließenden Löchern (Majoritätsladungsträger) verloren geht (Abb. 12.33 b). Der Kollektorstrom ist im wesentlichen durch die an Emitter und Basis anliegende Durchlassspannung UEB und deshalb auch durch
Abb. 12.33. Schema und Funktionsweise eines npn-Bipolartransistors. (a) Schematischer Aufbau des Transistors mit Verschaltungsskizze in der sog. Basisschaltung; die Raumladungszonen der in Flussrichtung geschalteten Emitter (E)-Basis (B) und in Sperrrichtung gepolten Basis (B)-Kollektor (C)-Übergänge sind schattiert angedeutet. (b) Schematische Darstellung der bei der Transistorfunktion mitwirkenden Ströme. Der für die Funktion des npn-Transistors wichtige Elektronenfluss von der Basis zum Kollektor ist schraffiert eingezeichnet. Stromrichtungen sind in technischer Konvention angegeben (IE, IC, IB etc.). (c) Elektronisches Bänderschema E (x) längs einer Raumrichtung x von Emitter über Basis zum Kollektor hin, bei anliegender Emitter-Basisspannung UEB und Basis-Kollektorspannung UBC; ELE, EVE und ELC, EVC sind Leitungs- bzw. Valenzbandkante in der Emitter (E)- bzw. Kollektor (C)-Region; EFE, EFC sind die Quasi-Fermi-Niveaus in der Emitterbzw. Kollektorregion. In der Basisregion ist ein unerwünschter Elektron-LochRekombinationsprozess angedeutet (gestrichelte Pfeile)
458
12. Halbleiter
den Basisstrom IB bestimmt. Man kann also den Kollektorstrom IC als durch den Basisstrom IB kontrolliert auffassen. Die Sperrspannung UBC am Basis-Kollektor-Übergang hat dagegen nur geringen Einfluss auf IC. Der von außen in die Basis fließende Strom IB setzt sich aus drei Anteilen zusammen. Der Anteil IBn entsteht durch Rekombination von Löchern mit aus dem Emitter fließenden Elektronen. Der Löcherstrom IEp (Majoritätsladungsträger in der Basis) diffundiert über die Valenzbandbarriere in den Emitter. Einen dritten Anteil ICp bilden die im Kollektor thermisch erzeugten Löcher (dort Minoritätsladungsträger), die über das zwischen Basis und Kollektor bestehende Sperrfeld in die Basis hinein beschleunigt werden (Abb. 12.33b). Damit ergeben sich folgende Beziehungen zwischen den verschiedenen Stromanteilen: IE IEn IEp ;
12:97 a
IC ICn ICp
12:97 b
IB IE
IC IEp IBn
ICp :
12:97 c
Da der Basisstrom IB typisch unterhalb von 1% des Kollektorstromes liegt, lässt sich der Kollektorstrom, der als Emitter-Basisstrom über die Basis in den Kollektor hineingezogen wird, vereinfachend aus der Beziehung für den p-n-Übergang (12.74) hinschreiben [12.4]: IC IE A
eDn nB exp
eUEB =k T Ln
1 ;
12:98
wo A die stromführende Fläche des Transistors, Dn die Diffusionskonstante der Elektronen in der Basis, nB deren Gleichgewichtskonzentration dort und Ln die elektronische Diffusionslänge in der p-dotierten Basis sind. Da die Diffusionslänge Ln mit der Diffusionslebensdauer sn bzw. Diffusionszeit zusammenhängt über p Ln = Dn sn , kann man Dn/Ln als eine Diffusionsgeschwindigkeit der Elektronen in der Basis auffassen, so dass der Strom (12.98) als ein Produkt aus der Zahl der in die Basis injizierten Elektronen und der Diffusionsgeschwindigkeit aufgefaßt werden kann. Letztere bestimmt also maßgeblich die Geschwindigkeit des Transistors. Der exponentielle Anstieg des Kollektorstromes mit der BasisEmitterspannung UEB ist in Abb. 12.34 b dargestellt. Diese Darstellung wird als Übertragungskennlinie bezeichnet. Die sog. Ausgangskennlinien IC (UCE) sind in Abb. 12.34 c dargestellt. Sie zeigen im wesentlichen das Verhalten des gesperrten Basis-Kollektorpn-Übergangs, da der Emitter-Basis-Widerstand sehr klein ist. Die Ausgangskennlinien stellen also Sperrströme einer pn-Diode dar, bei der die Höhe des Sperrstroms durch die Emitter-Basis-Spannung UEB gesteuert wird. Bipolartransistoren können entsprechend verschiedener Anwendungsbereiche in drei verschiedenen Grundschaltungen betrieben werden [12.13], benannt danach, welcher Kontakt auf Erdpotential liegt. In der Basisschaltung (Basis auf Erdpotential), die auch
12.8 Wichtige Halbleiterbauelemente
459
Abb. 12.34. (a) Aufbau eines planar hergestellten Bipolartransistors. Verschieden dotierte Emitter-, Basis- und Kollektorregionen sowie die dazwischen liegenden Raumladungszonen (E/B und B/C, unschattiert) sind verschieden stark schattiert angedeutet. Die dargestellte Schnittrichtung durch die Struktur längs AA ist in der Aufsicht auf die metallischen Kontakte (E, B) angegeben (Einschub). (b) Übertragungskennlinie eines Bipolartransistors (Nach Tietze und Schenk [12.13]). (c) Ausgangskennlinienfeld eines Bipolartransistors mit der Emitter-Basisspannung UEB als Parameter. Änderungen im Kollektorstrom DIC als Funktion von DUEB werden durch die Steilheit gm = @IC/@UEB beschrieben. (Nach Tietze und Schenk [12.13])
schon den Überlegungen zur Abb. 12.33 zugrunde lag, ist der Kollektor-Ausgangsstrom IC immer um den Basisstromanteil IBn (IBnIC) kleiner als der Eingangsstrom IE. Jedoch können signifikante Spannungs- und Leistungsverstärkungen erzielt werden, weil im Eingangskreis des Transistors der niederohmige, in Durchlassrichtung gespannte, Emitter-Basis-pn-Übergang liegt, während der Ausgangsstrom IC (&IE) über den hochohmigen, gesperrten BasisKollektor-pn-Übergang fließt und damit einen großen Lastwiderstand mit hohem Spannungsabfall im Ausgangskreis ermöglicht. In der häufiger verwendeten Emitterschaltung liegt der Emitteranschluss des Transistors auf Erdpotential und der im Verhältnis zum Kollektorstrom geringe Basisstrom IB steuert als Eingangsstrom den Kollektorstrom. In dieser Schaltungsart zeigt der Transistor offensichtlich Stromverstärkung. Neben der Stromverstärkung sind die in Abb. 12.34 c erklärte Steilheit gm @IC =@UEB und die sog. Emittereffizienz c = @IEn/@IE wichtige Charakterisierungsgrößen eines Bipolartransistors. Die Emittereffizienz gibt an, welcher Bruchteil des gesamten Emitterstromes IE wirklich von den Majoritätsladungsträgern und nicht von Löchern aus der Basisregion getragen wird. Zwecks Steigerung der Schnelligkeit möchte man den Leitwert der Basis erhöhen; dies verlangt höhere Basisdotierungen, was wiederum den Rückstrom IEp von Löchern in den Emitter erhöht und damit die Emittereffizienz c verringert. Einen Ausweg aus diesem Problem bieten moderne Hetero-Bipolartransistoren (HBT), bei denen die Emitterzone in Form einer Heterostruktur aus einem Halbleiter mit
460
12. Halbleiter
größerer Bandlücke (z. B. AlGaAs auf GaAs) epitaktisch auf die Basis-Kollektorschichten abgeschieden wird. Bei einer merklichen Banddiskontinuität im Valenzband (Abschn. 12.7) verhindert die Valenzbandbarriere den erhöhten Rückstrom von Löchern aus der Basis in den Emitter trotz hoher p-Dotierung der Basis. Ähnliche Konzepte sind möglich, indem als Basismaterial Halbleiter mit geringerer Bandlücke als beim Emittermaterial eingesetzt werden. Feldeffekt-Transistoren (FET) Feldeffekt-Transistoren sind prinzipiell Widerstände, die durch eine äußere Spannung gesteuert werden. Von daher ist ihr Aufbau einfacher. Da nur eine einzige Ladungsträgersorte gesteuert wird, handelt es sich um unipolare Bauelemente. Ein FET besteht also prinzipiell aus einem Stromkanal mit zwei Kontakten, „Source“ (Quelle) und „Drain“ (Abfluss). Ein dritter Steuerkontakt, das „Gate“ (Tor), ist über eine hochohmige Barriere vom leitenden Kanal getrennt und gestattet das Anlegen einer Steuerspannung gegenüber dem Kanalpotential. Über diese Steuerspannung kann mehr oder weniger Ladung im Kanal influenziert und dadurch der Kanalwiderstand modifiziert werden. Es gibt drei Haupttypen von FETs (Abb. 12.35), die sich im wesentlichen durch die Art des Kanals und durch die Gatebarriere unterscheiden. Der wichtigste Transistor, der die Basis für alle hochintegrierten Silizium-Logik- und Speicherschaltkreise darstellt, ist der MOSFET (metal oxide semiconductor FET) (Abb. 12.35 a). In der Aufsicht sind für FETs jeweils drei längliche, fingerartige Metallkontakte (S, G, D) charakteristisch (Abb. 12.35 a). Der schematische Querschnitt des MOSFET zeigt den Aufbau darunter: Source und Drain-Gebiet unter den Metallkontakten bestehen aus hochdotierten n+-Wannen, die durch Ionenimplantation in einem pdotierten Siliziumwafer erzeugt werden. Zwischen den beiden n+Wannen liegt also ein p-dotiertes Gebiet. Beim Anlegen einer Source-Drainspannung ist einer der pn-Übergänge gesperrt, so dass zwischen Source und Drain nur ein sehr geringer Strom fließt. Durch eine Oxidschicht (SiO2) ist das p-Gebiet zwischen den n+Wannen von der metallischen Gateelektrode getrennt. Wird nun eine genügend hohe positive Gatespannung UG (bezogen auf SourcePotential) angelegt, so fällt diese natürlich über der SiO2-Isolatorschicht ab und das elektronische Bänderschema unterhalb des Gates verbiegt sich (Abb. 12.35a), so dass aus der anfänglichen (UG = O) p-Randzone im Silizium durch Inversion (Ei < EF) eine starke n-Anreicherungsrandschicht unterhalb des Gateoxids wird. Die beiden n+-Wannen des Source- und Draingebietes sind dann leitend miteinander über den n-Anreicherungskanal verbunden. Der Transistor ist durch die positive Gatespannung von „zu“ nach „auf“ geschaltet worden. Die Funktion des MOSFET hängt ganz wesentlich von der Perfektion der SiO2-Schicht und deren Grenzfläche zum darunter liegenden Si-Kanal ab. Störstellen im Oxid oder an der Grenzfläche
12.8 Wichtige Halbleiterbauelemente
461
n-GaAs
Abb. 12.35. Schematischer Aufbau und elektronische Bänderschemata längs einer Achse senkrecht zur Waferoberfläche unterhalb der metallischen Gate-Elektrode für die drei wichtigsten Typen von Feldeffekt-Transistoren (FET): (a) MOSFET (metal-oxide-semiconductor FET) nur auf Si-Basis mit SiO2 als Oxid realisierbar; ch leitender Kanal, L Kanallänge. Aus technologischen Gründen wird die metallische Gate-Elektrode aus hoch in die Entartung dotiertem polykristallinen Silizium (polySi) gefertigt. (b) MESFET (metal-semiconductor FET), bevorzugt auf III–V-Halbleiterbasis, z. B. GaAs; (c) HEMT (high electron mobility transistor), bevorzugt auf III–V-Halbleiterheterostrukturen, z. B. AlGaAs/GaAs; der leitende Kanal wird durch ein 2-dimensionales Elektronengas (2DEG) gebildet, das über hoch n+-dotierte Zonen leitend an die Source- und Drainkontakte angeschlossen ist. Die Bänderschemata sind gezeichnet für den spannungslosen Fall (Gate-Spannung UG = 0, oben) und darunter für positive Gatespannung UG (MOSFET) bzw. negative Gatespannung (MESFET, HEMT); EF (Quasi) Fermi-Niveau, EL Leitungsbandkante, EV Valenzbandkante, Ei intrinsisches Energieniveau
würden bei Veränderung der Gatespannung gleichfalls umgeladen, so dass dann nur ein geringer Teil der Gatespannung für die Steuerung der Inversionsschicht wirksam würde. Die Möglichkeit, dünne geschlossene Oxidschichten der gewünschten hohen Volumen- und Grenzflächenqualität herzustellen, bietet aber nur Silizium. MOSFETs können also nur auf Siliziumwafern hergestellt werden. Insbesondere III–V-Halbleiter wie GaAs, die wegen ihrer höheren Elektronenbeweglichkeit dem Silizium an Schnelligkeit überlegen sind, können nicht mit perfekten Oxidschichten bedeckt werden. Selbst bei hervorragenden Volu-
462
12. Halbleiter
meneigenschaften einer Isolatorschicht würde die Grenzfläche zwischen dem GaAs und dem Gate-Isolator hohe Defektdichten aufweisen, die zum Teil durch Nichtstöchiometrie zustande kommen. Von daher ist bei III–V-Halbleitern der MESFET (metal semiconductor FET) (Abb. 12.35 b) der gängigste FET. Auf ein intrinsisches (i) oder sog. semi-isolierendes GaAs-Substrat (Cr-dotiert), wo das Fermi-Niveau EF nahe der Mitte des verbotenen Bandes liegt, wird n-dotiertes GaAs als dünne kristalline Schicht abgeschieden, oder durch Ionenimplantation erzeugt. Da in dieser Schicht freie Elektronen von den Donatoren herrührend in hoher Zahl vorhanden sind, liegt die Leitungsbandkante hier nahe an EF, so dass sich ein leitender n-Kanal ausbildet, der nach oben hin durch die Schottky-Verarmungsrandschicht unter der unmittelbar auf das GaAs aufgedampften metallischen Gateelektrode begrenzt ist. Wie in Abschn. 12.6 ausgeführt, ist in einer solchen MetallGaAs-Schottky-Barriere das Fermi-Niveau an der Grenzfläche nahe der Mitte des verbotenen Bandes „gepinnt“, so dass sich unterhalb der Gate-Metallelektrode die elektronischen Bänder vom leitenden n-Gebiet zur Metallelektrode hin wieder aufwärts biegen. Das metallische Gate ist also vom n-Kanal über eine Zone hohen Widerstands getrennt. Source- und Drain-Kontakte sind demgegenüber als niederohmige leitende Kontakte ausgebildet, was durch eine lokale, sehr hohe n+-Dotierung unter der Metallisierung geschehen kann. In der Anordnung in Abb. 12.35 b besteht also bei UG = O zwischen Source und Drain ein leitender n-Kanal, der durch Anlegen einer negativen Spannung UG ans Gate abgeschnürt wird, indem das Fermi-Niveau des metallischen Gate gegenüber dem Fermi-Niveau EF im i-GaAs angehoben wird. Da wegen des „pinning“ des Fermi-Niveaus nahe der Bandmitte (UB = const) auch das gesamte Bandschema dabei „angehoben“ wird, verarmt die Kanalzone an Elektronen, sie wird nichtleitend. Der Transistor schaltet bei Anlegen einer genügend hohen negativen Gatespannung von „auf“ nach „zu“. Die Funktion hängt natürlich empfindlich von der Dicke der n-dotierten Schicht im Vergleich zur Ausdehnung der Schottky-Verarmungsrandschicht (typisch 50 nm) unter der Gate-Metallelektrode ab. Komplementär zu diesem beschriebenen „Normal-Auf“ („Normally-On“)-MESFET führt ein dünnerer n-GaAs-Kanal mit einer zur Schottky-Verarmungsrandschicht vergleichbaren Kanaldicke zu einem „Normal-Zu“ („Normally-Off“)-Transistor, bei dem durch Anlegen einer genügend großen positiven Gatespannung eine unter dem Gate abwärts weisende Bandverbiegung den Kanal öffnet und den Transistor nach „auf“ schaltet. Seit man Halbleiterheterostrukturen hoher Qualität mittels moderner Epitaxieverfahren (MBE, MOCVD, Tafel XVII) herstellen kann, hat sich für extrem hohe Frequenzen (20–100 GHz) der besonders schnelle und rauscharme HEMT (high electron mobility transistor) als eine Weiterentwicklung des MESFET, insbesondere für Radaranwendungen und Satellitenkommunikation etabliert
12.8 Wichtige Halbleiterbauelemente
463
(Abb. 12.35 c). Der HEMT ist ein Heterostruktur-FET, der genau wie ein MESFET über eine Schottky-Barriere unter dem metallischen Gate geschaltet wird, bei dem der n-Kanal jedoch durch ein modulationsdotiertes 2DEG an der Grenzfläche zwischen einer AlGaAs/GaAs-Heterostruktur gebildet wird (Abschn. 12.7). Die hohe Elektronenkonzentration von typisch 2´1012 cm–2 im 2DEG rührt von Donatoren in der n+-AlGaAs-Barriere her, so dass der Kanal weitgehend frei von Streuzentren ist, was die hohe KanalBeweglichkeit und Rauscharmut des Transistors bewirkt. Eine Variationsmöglichkeit, die bei allen drei Typen von FETs gegeben ist, besteht darin, die jeweiligen Dotierungen zu invertieren (p nach n). Man erhält dann gleichartige Funktionen der Transistoren, die aber bei invertierten anliegenden Potentialen (plus nach minus) jeweils durch Löcher statt durch Elektronen getragen werden. Löcher haben größere effektive Massen als Elektronen. Ihre Beweglichkeit ist daher geringer und die p-Kanal-FETs sind langsamer als ihre n-Kanal-Analoga. Dennoch beruhen fast alle modernen digitalen Siliziumschaltkreise heute auf Kombinationen aus jeweils einem p- und einem n-Kanal MOSFET (CMOS = complementary MOS). Die Gegeneinanderschaltung dieser beiden Transistoren ermöglicht den Aufbau logischer Gatter, die wegen der entgegengesetzten Spannungspolaritäten an den Transistoren nur Strom führen, wenn der Schaltvorgang zwischen verschiedenen Bit-Operationen stattfindet. CMOS-Schaltungen sind deshalb extrem leistungsarm, ein großer Vorteil bei immer höherer Integrationsdichte. Die verstärkende Wirkung von FETs rührt daher, dass sehr kleine Gateströme bereits genügend Ladung auf das Gate bringen, um wesentlich größere Source-Drain-Ströme zu schalten. Wegen des wesentlich höheren Widerstandes der dünnen SiO2-Gate-Isolation beim MOSFET im Vergleich zum Widerstand der SchottkyBarriere bei MESFET und HEMT fließen beim MOSFET natürlich kleinere Gateströme. Wichtige Kenngrößen eines FET sind die Steilheit g (Änderung des Drainstroms mit der Gatespannung) und die Gatekapazität Cg. Das Verhältnis von Steilheit zu Kapazität bestimmt die maximale Frequenz f = g/Cg, bei der der FET noch effektiv arbeitet. Um die Hochfrequenzeigenschaften eines FET zu verbessern, gilt es also, seine Gatekapazität möglichst klein und seine Steilheit möglichst groß zu machen. Sehr schnelle HEMTs im Materialsystem GaInAs/InP erreichen bei Kanallängen von 0,10 lm heute Steilheiten von etwa 600 mS/mm und obere Grenzfrequenzen fmax&300 GHz, bei denen die Leistungsverstärkung gerade auf 1 abfällt [12.14]. Typische Source-Drain-Strom-Spannungskennlinien ISD (USD) von FETs, in diesem Fall von MOSFETs, sind in Abb. 12.36 dargestellt, mit der Gatespannung UG als Parameter. Für kleine USD, wo die Inversionsrandschicht entlang des Kanals fast nicht von USD abhängt, ist der Strom ISD näherungsweise proportional zur anliegenden Spannung USD (quasi-Ohmsches Verhalten). Wachsen-
464
12. Halbleiter
Abb. 12.36. Kennlinienfelder von SiMOS-Feldeffekttransistoren (MOSFET): Source/Drain-Strom ISD als Funktion der Source/Drain-Spannung USD mit Gate-Spannung UG als Parameter (a) für einen Kurzkanal-MOSFET (GateLänge Lg = 0,6 lm, Gate-Weite 5 lm); (b) für einen Langkanal-MOSFET (Gate-Länge Lg = 10 lm, Gate-Weite 5 lm). (Nach Mühlhoff und McCaughan [12.15])
de Source-Drain-Spannung USD führt zu einem merklichen Potentialgefälle längs des Kanals auf der Halbleiterseite, während das Potential auf der Gateseite durch das metallische Gate konstant gehalten wird. Entlang des Kanals erhöht sich also die Spannung, die quer zum Kanal abfällt. Dies führt zu einer längs des Kanals abnehmenden Kanaldicke (12.80), wodurch die Sättigung des Stroms ISD oberhalb von Spannungen USD > 2 V bewirkt wird. Die Abhängigkeit des Sättigungsstroms ISD vom Parameter Gatespannung UG ist für Kurzkanaltransistoren und Langkanaltransistoren verschieden. In kurzen Kanälen (Abb. 12.36 a) erreichen die Ladungsträger wegen der hohen Feldstärke zwischen Source und Drain die konstante Sättigungsgeschwindigkeit v s (Abb. 12.15). Der Strom ISD wächst proportional zur influenzierten Ladung und damit proportional zur Gatespannung UG (Abb. 12.36 a). Im Fall langer Kanäle muss man in Betracht ziehen, dass die Potentialdifferenz zwischen Gate und Kanal längs des Kanals variiert. Im Sättigungsbereich bei hohen Source-Drain-Spannungen kann das Gate in der Nähe des Source-Kontaktes gegenüber dem Kanal positiv geladen sein, während es nahe am Drain in Bezug auf den Kanal noch negativ ist. Folglich ist der Kanal in der Nähe des Drain-Kontaktes verengt und damit hochohmig. Eine höhere positive Gate-Spannung ändert somit nicht nur die lokale Ladungsträgerkonzentration sondern auch die Länge, längs der der Kanal hochohmig ist. In diesem Fall ergibt sich eine quadratische Abhängigkeit des Source-Drain-Stromes ISD von der Gate-Spannung UG (Abb. 12.36 b). Ähnliche Kennlinien wie hier für den MOSFET diskutiert, werden auch für MESFET und HEMT gefunden.
12.8 Wichtige Halbleiterbauelemente
465
Halbleiterlaser Optoelektronische Bauelemente, wie Photodetektoren, Solarzellen, lichtemittierende Dioden (LED) und Laser, beruhen auf der Wechselwirkung eines Lichtfeldes mit elektronischen Anregungen im Halbleiter. Diese Wechselwirkung beinhaltet drei Prozesse: Absorption von Lichtquanten durch Anregung von Elektronen aus dem Valenzband ins Leitungsband (oder zwischen Störstellen im verbotenen Band), der dazu inverse Prozess, die stimulierte Emission, bei der durch das einfallende Photon ein Elektron aus dem angeregten Zustand in den Grundzustand übergeht, und die spontane Emission. Absorption und stimulierte Emission sind abhängig von der Feldstärke E
x des Lichtfeldes (Abschn. 11.10). Anregung und Aussendung des Photons sind kohärent mit dem Lichtfeld gekoppelt, anregende und emittierte Lichtwellen stehen in fester Phasenbeziehung. Im Unterschied dazu gibt es bei der spontanen Emission keine kohärente Kopplung an das Lichtfeld. Für Photodetektoren und Solarzellen ist die Absorption der entscheidende Prozess. Lichtemittierende Dioden (LED) beruhen im wesentlichen auf spontaner Emission, während bei Lasern die stimulierte kohärente Emission der entscheidende Prozess ist. Für alle drei Prozesse gilt die Energieerhaltung hx E2
E1 ;
12:99
mit hx der Photonenergie und E2 und E1 den Energien des angeregten bzw. Grundzustandes. Im stationären Zustand unter Einstrahlung von Licht müssen die Übergangsraten sich kompensieren. Bezeichnet man mit A21 die Wahrscheinlichkeit für spontane Emission und mit B21 und B12 die Wahrscheinlichkeit für stimulierte Emission und Absorption und ferner mit n1 und n2 die Besetzungszahlen im Grund- und Endzustand, so gilt im stationären Zustand für die Raten n_ 2
B21 n2 jE
xj2
A21 n2 B12 n1 jE
xj2
n_ 1 0 :
12:100
Die Koeffizienten B21 und B12 entsprechen bis auf Faktoren den Quadraten der Matrixelemente xij für stimulierte Emission bzw. Absorption (11.93). Die beiden Koeffizienten B21 und B12 sind deswegen einander gleich (11.93); n1 und n2 sind die Besetzungszahlen für Grund- und Endzustand der Anregung. Das Verhältnis von stimulierter zu spontaner Emissionsrate ist n_ 2stim =n_ 2spon
B21 jE
xj2 : A21
12:101
Da die Laserfunktion ein Überwiegen der stimulierten Rate verlangt, wird der Laser als optischer Resonator für stehende Lichtwellen mit der auszusendenden Wellenlänge ausgebildet, wodurch eine hohe Feldstärke erzeugt wird. Beim Laser muss weiter die sti-
466
12. Halbleiter
mulierte Emissionsrate die Absorptionsrate überwiegen. Unter Vernachlässigung der spontanen Emission und unter Berücksichtigung von B21 = B12 erhält man aus (12.100) die Laserbedingung n_ 2
n2
n1 B21 jE
xj2 < 0 d: h:
n2 > n1 :
12:102
Diese Bedingung wird als Besetzungsinversion (vgl. Übung 11.8) bezeichnet, da unter Gleichgewichtsbedingungen das Umgekehrte gilt. Besetzungsinversion wird durch „Pumpen“ in den angeregten Zustand erreicht. Beim Halbleiterlaser speziell wird hierzu ein pnÜbergang in Durchlassrichtung gepolt und mit Nichtgleichgewichtselektronen und -löchern überflutet. In (12.100–12.102) war vorausgesetzt, dass die Endzustände der Übergänge jeweils unbesetzt waren, dass also die Wahrscheinlichkeit für Nicht-Besetzung gleich „eins“ war. Dies ist für ein Ensemble von einzelnen Atomen gegeben, bei denen jeweils die Besetzung des angeregten Zustandes aus der Nicht-Besetzung des Grundzustandes resultiert. Für die Zustände an der Valenz-(EV) bzw. Leitungsbandkante (EL) eines Halbleiterlasers, die durch Stromfluss besetzt werden, gilt dies nicht und die Übergangsraten müssen proportional zur Anzahl der besetzten Anfangszustände und zur Anzahl der unbesetzten Endzustände angenommen werden. Damit ergibt sich die Bedingung für Besetzungsinversion in einem pn-Übergang, der in Durchlassrichtung gepolt ist. B21 DL
EL DV
EV f
EL 1 f
EV B12 DV
EV D
EL f
EV 1 f
EL < 0 :
12:103
Hierbei werden die besetzten und unbesetzten Bereiche des Leitungs- bzw. Valenzbandes näherungsweise als scharfe Niveaus bei EL bzw. EV beschrieben und die Integrale über die jeweiligen Energiebereiche (*kT) durch konstante Zustandsdichten DL (EL) bzw. DV (EV) genähert. f (E) ist die Fermi-Besetzungswahrscheinlichkeit, die bei hohen Dotierungen nicht durch die BoltzmannVerteilung genähert werden darf. Wegen B21 = B12 folgt aus (12.103): f
EL 1
f
EV > f
EV 1
f
EL
f
EL > f
EV :
12:104 a
12:104 b
Mit der Fermi-Funktion als Näherung in der Nähe des Gleichgewichts und E nF , E pF als Quasi-Fermi-Niveaus im n- bzw. p-Gebiet (Abb. 12.37) f
EL 1 exp
EL
EFn =kT
1
;
12:105 a
f
EV 1 exp
EV
EFp =kT 1
;
12:105 b
folgt damit als Bedingung für die Besetzungsinversion E nF
E pF > EL
EV Eg ;
12:106
12.8 Wichtige Halbleiterbauelemente
467
Abb. 12.37. Elektronische Bänderschemata E (x) von pn-Halbleiter-Laserstrukturen längs einer Achse x senkrecht zur Schichtstruktur: (a) in die Entartung dotierter p++n– –-Übergang ohne äußere Spannung (thermisches Gleichgewicht); (b) gleicher p++n– –-Übergang mit maximaler Vorspannung U in Flussrichtung; (c) Doppelheterostruktur-pin-Übergang aus p-AlGaAs/i-GaAs/n-AlGaAs mit maximaler Vorspannung U in Flussrichtung. EnF , EpF bezeichnen die Quasi-Fermi-Niveaus im n- bzw. p-Gebiet, EL, EV Leitungs- bzw. Valenzbandkanten
d. h. die Quasi-Fermi-Niveaus im n- und p-Gebiet müssen energetisch weiter voneinander entfernt sein als die Breite des verbotenen Bandes. p- und n-Gebiete müssen also weit in die Entartung dotiert sein, damit durch eine außen anliegende Durchlassspannung U = (E nF –E pF)/e Besetzungsinversion erreicht werden kann (Abb. 12.37 a, b). Damit bestimmt der durch den pn-Übergang fließende Strom das Einsetzen der Lasertätigkeit. Die emittierte Lichtleistung aufgetragen über der Stromdichte durch den pn-Übergang steigt infolge von spontaner Emission langsam an, bis bei einer bestimmten sog. Schwellstromdichte die Besetzungsinversion erreicht wird und durch Überwiegen der induzierten Emission die Lasertätigkeit einsetzt (Abb. 12.38). Die Schwellstromdichte ist somit das entscheidende Qualitätskriterium eines Halbleiterlasers: je niedriger sie ist, um so effektiver arbeitet der Laser, wobei insbesondere zu hohe Schwellstromdichten wegen der damit verbundenen Joule’schen Wärme die Lebensdauer des Lasers begrenzen. Ein entscheidender Durchbruch, der zu kommerziell einsetzbaren Lasern führte, war die Verwendung von Halbleiterheterostrukturen im Doppelheterostrukturlaser, dargestellt in Abb. 12.37 c in Form einer AlGaAs/GaAs/AlGaAs-Schichtstruktur. Zwischen den p- und n-dotierten AlGaAs-Gebieten (p-n-Übergang) mit größerer Bandlücke ist eine schwach dotierte oder intrinsische (i) GaAsSchicht eingebettet, die als aktive Zone im p-n-Übergang dient.
468
12. Halbleiter
Abb. 12.38. Emissions-Kennlinie eines AlGaAs/GaAs/AlGaAs-Doppelheterostrukturlasers als Funktion des aufgeprägten Stromes I, gemessen bei Zimmertemperatur T = 300 K; Ith Schwellstromstärke. Einschub: Schema der Laserstruktur mit Andeutung der emittierten Strahlung (hm). (Nach Kressel und Ackley [12.16])
Emittierte Leistung
Trotz mäßiger Dotierung im p- und n-AlGaAs-Gebiet beidseits dieser Schicht liegen bei Polung in Flussrichtung die Quasi-Fermi-Niveaus im aktiven i-GaAs-Gebiet innerhalb des Leitungs- bzw. Valenzbandes und gewährleisten das Erreichen der Besetzungsinversion (12.106). Die aktive i-GaAs-Zone wird mit Elektronen und Löchern überflutet, die wegen der im Leitungs- und Valenzband vorhandenen Banddiskontinuitäten „eingesperrt“ sind und damit eine erhöhte strahlende Rekombination gewährleisten. Dieser Effekt der Doppelheterostruktur wird als „electrical confinement“ bezeichnet. Zusätzlich tritt ein „optical confinement“ dadurch auf, dass für die emittierte Lichtwellenlänge (dem GaAs-Bandabstand entsprechend) der Brechungsindex der aktiven GaAs-Zone höher ist als der der angrenzenden AlGaAs-Schichten (vgl. Übung 11.9). Das bei der stimulierten Emission erzeugte Licht wird zum großen Teil an den AlGaAs-Schichten totalreflektiert; es wird im aktiven GaAs-Kanal gebündelt und konzentriert. Wie die schematische Darstellung des Aufbaus eines Doppelheterostruktur-Lasers (Abb. 12.38) zeigt, wird der aktive Kanal (Resonator) begrenzt durch die oben und unten an den GaAs-Kanal angrenzenden AlGaAs-Schichten sowie lateral durch einen in die SiO2-Maske eingeätzten Streifen, wo die aufgedampfte Metallisierung Kontakt zum Halbleiter hat und somit das elektrische Feld und den Stromfluss lateral auf diesen Bereich begrenzt.
12.8 Wichtige Halbleiterbauelemente
469
Die für den optischen Resonator (Fabry-Pérot-Interferometer) wichtigen halbdurchlässigen Spiegel, durch die an der Vorder- und Rückseite des Kanals das Licht austritt bzw. reflektiert wird, werden im einfachsten Fall durch Spalten des GaAs-Wafers entlang (110) erzeugt. Typischerweise hat ein solcher aktiver Kanal Längen zwischen 100 und 1000 lm. Die emittierte Lichtleistung als Funktion der aufgeprägten Stromstärke durch die Laserdiode (Abb. 12.38) zeigt bei geringeren Strömen ein schwaches Ansteigen der Leistung, das im wesentlichen durch spontane Emission verursacht wird. In diesem Bereich ist die Verstärkung zu niedrig, um die Verluste im Resonator zu übertreffen. Bei einer gewissen Schwellstromstärke Ith entspricht die Verstärkung des Bauelementes den Resonatorverlusten, der Laser-Prozess setzt ein und die optische Ausgangsleistung steigt sprungartig an. Ein entscheidendes Qualitätskriterium eines solchen Halbleiterlasers ist also eine möglichst geringe Schwellstromstärke (oder Schwellstromdichte) durch geringe Verluste im Resonator. Bei steigender Betriebstemperatur eines Lasers wird insbesondere das elektrische „Confinement“ schlechter, da sich die Ladungsträger wegen des „Aufweichens“ der Fermi-Kante über größere Energiebereiche verteilen; die Schwellstromstärke nimmt zu und der Laser arbeitet weniger effizient. Wegen der näherungsweisen Gültigkeit der Boltzmann-Statistik gilt eine exponentielle Abhängigkeit des Schwellstroms von der Betriebstemperatur T Ith / exp
T=T0 :
12:107
Ein weiteres Qualitätskriterium eines Halbleiterlasers ist also eine möglichst große kritische Temperatur T0, d. h. ein möglichst geringer Anstieg der Schwellstromstärke mit der Betriebstemperatur. Typische Werte von T0 liegen bei Doppelheterostrukturlasern um etwa 100 8C. In den bisher betrachteten Doppelheterostruktur-Lasern (DHL) ist die vertikale Ausdehnung des aktiven Kanals, d. h. die Dicke der eingebetteten GaAs-Schicht, weitaus größer als 200 Å. Ladungsträger in der aktiven Zone nehmen Quantenzustände eines makroskopischen 3D-Kristalls ein. Eine weitere Verbesserung der Lasereigenschaften wird erzielt, wenn man in diese aktive Zone des Lasers noch dünne Schichten (Dicke £ 100 Å) eines Halbleiters mit geringerem Bandabstand als dem von GaAs, z. B. InGaAs, einbaut. Da InxGa1-xAs nicht gitterangepasst an GaAs ist, können diese hochverspannten Schichten nur unterhalb einer gewissen kritischen Schichtdicke versetzungsfrei eingebaut werden. Wegen ihres kleineren Bandabstandes, d. h. ihrer Band-Diskontinuitäten zu GaAs, sowohl im Leitungs- wie im Valenzband, wirken die dünnen InGaAs-Schichten für Elektronen wie für Löcher als Quantentöpfe. Die elektronischen Zustände im Leitungs- und im Valenzband sind senkrecht zur Schichtenfolge quantisiert und die Zustandsdichte ist für jedes Subband konstant und in der Überlagerung mehrerer Sub-
470
12. Halbleiter
bänder treppenartig (Abb. 12.28 c). Die Ladungsträger, die sich natürlich in den energetisch günstigeren Bereichen, also in den Quantentöpfen sammeln, werden noch stärker als im Doppelheterostruktur-Laser räumlich und energetisch eingeschränkt. Solche sog. Quantentopf-Laser zeigen ein noch besseres „Confinement“, damit noch niedrigere Schwellstromstärken und größere kritische Temperaturen T0.
Übungen zu Kapitel 12
12.1 Silizium kristallisiert in der Diamantstruktur mit einer Gitterkonstanten von 5,43 Å. (a) Wieviele Atome enthält die kubische Einheitszelle? (b) Phosphoratome, die anstelle von Siliziumatomen eingebaut werden, wirken als Donatoren. Man berechne die Ionisierungsenergie eines Donators im Rahmen des Wasserstoffmodells (eSi = 12)! (c) Man berechne den Bohrschen Radius r0 für den tiefsten gebundenen Zustand! Wie groß ist die Wahrscheinlichkeit, das Elektron innerhalb einer Kugel mit dem Radius r0 zu finden? Wieviele Siliziumatome liegen innerhalb dieser Kugel! (d) Diskutieren Sie auf der Basis dieser Ergebnisse die Gültigkeit und Grenzen des Wasserstoffmodells für Donatoren! (e) Bei welcher Konzentration wird die Wechselwirkung zwischen Donatoren entscheidend? 12.2 Die effektive Masse von Elektronen im Minimum des Leitungsbandes betrage ein Drittel der effektiven Masse von Löchern im Maximum des Valenzbandes. Wo liegt das Fermi-Niveau im Falle der Eigenleitung? Die Bandlücke Eg sei größer als 8 kT. 12.3 Ein Halbleiter habe eine Bandlücke von Eg = 1 eV. Elektronen und Löcher sollen eine effektive Masse gleich der freien Elektronenmasse haben. Der Halbleiter sei p-dotiert mit einer Akzeptorkonzentration von p = 1018 cm–3. Das Akzeptorniveau liege 0,2 eV über dem Valenzband. (a) Man zeige, dass die Eigenleitung bei 300 K vernachlässigbar ist!
(b) Man berechne die Leitfähigkeit r bei 300 K unter der Annahme einer Löcherbeweglichkeit von lp = 100 cm2/Vs! (c) Man erstelle einen Graphen für den Logarithmus der Löcherkonzentration ln p über der reziproken Temperatur im Bereich von 100–1000 K! 12.4 Man betrachte die elektronische Bandstruktur eines direkten III–V-Halbleiters wie z. B. GaAs. Das Leitungsband habe ein scharf ausgeprägtes Minimum im C-Punkt und ein zusätzliches breiteres Minimum bei höherer Energie außerhalb von C (vgl. Abb. 12.4). (a) Diskutieren Sie qualitativ die Abhängigkeit der Driftgeschwindigkeit von Elektronen vom elektrischen Feld unter Berücksichtigung von Streuprozessen! (b) Diskutieren Sie auch den Fall eines indirekten Halbleiters (Abb. 7.13)! 12.5 Man berechne die Hall-Konstante RH für einen Eigenhalbleiter, bei dem sowohl Elektronen als auch Löcher zum Strom beitragen. (a) Diskutieren Sie die Temperaturabhängigkeit von RH für den Fall, dass die Beweglichkeiten für Elektronen und Löcher gleich sind! (b) Experimentell findet man, dass die gemessenen Hallspannungen bei Umkehrung des Magnetfeldes gewöhnlich nicht dem Betrag nach gleich sind. Erklären Sie den Grund dafür! 12.6 Man betrachte den Prozess der Photoleitung in Halbleitern. Elektronen und Löcher entstehen dabei über die thermische Gleichgewichtskonzentration hinaus durch Photoionisation aus Störstellen oder dem Valenzband.
472
Übungen zu Kapitel 12
Man stelle die Ratengleichungen bei direkter Rekombination von Elektron-Loch-Paaren für den Fall (a) der Eigenleitung und (b) für n- oder p-Dotierung auf! Man berechne den stationären Photostrom bei konstanter Beleuchtung sowie die Zeitabhängigkeit des Photostroms nach Abschalten der Beleuchtung! 12.7 Erklären Sie die Wirkungsweise einer Solarzelle, bei der die Zone eines p-n-Übergangs beleuchtet wird! Nehmen Sie dazu an, dass der Stromkreis durch einen äußeren Widerstand R geschlossen wird! Zeichnen Sie qualitativ den Strom-Spannungsverlauf mit und ohne Lichteinstrahlung! Welche Frequenz muss das Licht mindestens haben? Wie sieht der theoretische Wirkungsgrad als Funktion der Lichtfrequenz aus? Wie erhält man die photoelektrisch erzeugte Leistung aus der Strom-Spannungskennlinie? Diskutieren Sie die verschiedenen Parameter, die den Wirkungsgrad beeinflussen! Warum ist es günstig, mehrere p-n-Übergänge von Halbleitern mit verschiedener Bandlücke in Dünnschichttechnik zu kombinieren? 12.8 Halbleiter mit niedrigem Bandabstand wie InAs (Eg = 0,35 eV) und InSb (Eg = 0,18 eV) zeigen üblicherweise „pinning“ des FermiNiveaus im Leitungsband (ca. 100 meV oberhalb der Leitungsbandkante EL bei
InSb). Zeichnen Sie qualitativ das Bänderschema (Bandenergien gegen Ortskoordinate) in der Nähe eines Metallkontaktes auf einem solchen Halbleiter, der hoch n-dotiert ist. Wie ist das Widerstandsverhalten für angelegte Spannungen beider Vorzeichen? 12.9 Berechnen Sie für einen Feldeffekttransistor (MOSFET, MESFET oder HEMT, Abschn. 12.8) die Steilheit gm =
@I SD/@UG als Funktion der Gatekapazität Cg und der Gatelänge Lg. Man beachte, dass ohne anliegende Gatespannung (UG = 0) im allgemeinen schon eine Bandverbiegung unter dem Gate mit einer Einsatzspannung U0 vorhanden ist. In einfacher Näherung mache man die für Kurzkanal-Transistoren angemessene Annahme, dass die Geschwindigkeit der Ladungsträger im Kanal konstant und gleich der Sättigungsgeschwindigkeit v s für hohe elektrische Feldstärken (Abb. 12.15) ist. Der Source-Drain-Strom ISD resultiert aus der als zweidimensional (2D) angenommenen, über das Gate in den Kanal influenzierten, Ladungsträgerdichte n2D. (a) Schätzen Sie mittels Abb. 12.15 für einen Kurzkanal – AlGaAs/GaAs-HEMT – mit Lg = 100 nm die Transitzeit (Laufzeit) für Ladungsträger unter dem Gate ab. (b) Wie hoch sind Gate-Kapazitäten solcher Transistoren bei Steilheiten von gm = 150 mS?
Tafel XIV
Tafel XIV Hall-Effekt
Um in der Leitfähigkeit r = n e l Trägerkonzentration n und Beweglichkeit l getrennt bestimmen zu können, wird neben der Messung der Leitfähigkeit r als zweite Messung die des Hall-Effektes durchgeführt. Hierbei wird durch eine Kristallprobe ein Strom I geschickt und senkrecht zum Strom ein Magnetfeld (magnetische Induktion B ) angelegt. An zwei gegenüberliegenden Kontakten (senkrecht zu I und B ) kann dann stromlos (IH = 0), d. h. über eine Kompensationsschaltung, eine sog. Hallspannung UH gemessen werden. Dies ist schematisch in Abb. XIV.1 dargestellt. Weil UH stromlos gemessen wird, kompensiert die sich an der Probe in y-Richtung aufbauende Hallspannung UH gerade die auch in y-Richtung wirkende Lorentz-Kraft auf ein Elektron, das sich in x-Richtung mit der Geschwindigkeit v x bewegt:
Fy
e
v By
eE y ev x B
eE y 0 :
XIV:1
Hierbei ist E y = UH/b das sog. Hall-Feld. Unter der Annahme, dass nur Elektronen den Strom tragen (n-Halbleiter oder Metall), gilt jx I=
b d
n ev x
XIV:2
IH = 0
I
Abb. XIV.1. Schema einer Hall-Effekt-Messung. Messgrößen: B: magnetische Induktion; I: Strom durch die Probe; UH: Hallspannung. Gestrichelt sind Bahnen von Elektronen (Konzentration n) und Löchern (Konzentration p) angegeben, die durchlaufen würden, falls ohne Kompensationsschaltung für UH ein Strom IH j 0 fließen würde. Bei IH = 0 werden die Ladungsträger durch die sich aufbauende Hallspannung UH auf ihrer geradlinigen Bahn (parallel zu x ) gehalten
(10–3 K–1) Abb. XIV.2 a, b. Temperaturabhängigkeit der Hall-Konstanten RH für p-Silizium (a) und n-Silizium (b). Für Temperaturen im Bereich von 1300 K setzt bei p-Silizium mit einer BorStörstellenkonzentration von 2´1017 cm–3 (a) intrinsische Leitfähigkeit ein, die Kurve in Teil (a) würde dort einen Nulldurchgang haben und schließlich in den intrinsischen Ast der Abb. XIV.2 b einmünden [XIV.1]
Tafel XIV
474
Tafel XIV Hall-Effekt
und damit folgt UH 1 1 IB jx B :
XIV:3 b ne n e bd Die Größe RH = – (ne)–1 heißt Hallkonstante. Sie kann also durch Messung von UH, I und B gemäß
E y
UH R I B=d
XIV:4
bestimmt werden. Ihr Vorzeichen gibt die Art der Ladungsträger (negativ für Elektronen) und ihre Absolutgröße die Ladungsträgerkonzentration n an. Wird in einem Halbleiter der Strom sowohl durch Elektronen (Konzentration n, Beweglichkeit ln) als auch durch Löcher (Konzentration p, Beweglichkeit lp) getragen, so ergibt eine analoge Rechnung folgenden Wert für die Hallkonstante: RH
pl2p
nl2n
e
plp nln 2
:
XIV:5
Abbildung XIV.2 zeigt experimentell ermittelte Hallkonstanten RH für Bor-dotiertes p-Silizium
(a) bzw. Arsen-dotiertes n-Silizium (b). Da die Hallkonstante bis auf die Elementarladung e die reziproke Ladungsträgerkonzentration wiedergibt, ähnelt der Kurvenverlauf in logarithmischer Auftragung zumindest im Temperaturbereich 33 bis 500 K dem typischen Verlauf der Ladungsträgerdichtekurven für Halbleiter (s. z. B. Abb. 12.10). Die Steigungen im Bereich 33 bis 50 K sind durch die Ionisierungsenergien der Akzeptoren bzw. Donatoren festgelegt (12.27). Der steil verlaufende Kurvenabschnitt in Abb. XIV.2 b bei etwa 103 K zeigt intrinsische Leitfähigkeit durch Elektron-Loch-Paarerzeugung an. Die verschiedenen Vorzeichen von RH in Abb. XIV.2 a, b entsprechen den verschieden geladenen Trägersorten in p- und n-dotiertem Material.
Literatur XIV.1 F. J. Morin, J. P. Maita: Phys. Rev. 96, 29 (1954)
Effektive Massen von Elektronen
mn und Löchern
mp in Halbleitern werden in einem Zyklotron-Resonanz-Experiment bestimmt, bei dem die Kristallprobe in ein variables statisches Magnetfeld B gebracht wird und in Abhängigkeit von B die Absorption eines Hochfrequenz-Wechselfeldes gemessen wird. Elektronen im statischen Magnetfeld bewegen sich im k-Raum (Tafel VIII) auf Flächen konstanter Energie in einer Ebene senkrecht zu B um die Magnetfeldachse. Auch im Ortsraum ergibt sich eine geschlossene Bahn, die allerdings, wie die Bahn im k-Raum, für Kristallelektronen nicht einfach eine Kreisbahn ist (Abb. XV.1). Absorption des Hochfrequenz-Wechselfeldes tritt ein, wenn die Kreisfrequenz gerade gleich der Umlauffrequenz xc ist
xc eB=mn. Hierbei sind insbesondere solche Bahnen im k-Raum wichtig, bei denen die eingeschlossene Fläche gerade einen extremalen (maximalen oder minimalen) Querschnitt hat. Von solchen Zuständen gibt es nämlich pro Frequenzintervall besonders viele. Die HF-Absorption hat dann also ein deutliches Maximum und man braucht für die Interpretation deshalb nur die „Extremalbahnen“ zu diskutieren.
Abb. XV.1. Klassische Beschreibung der Zyklotron-Resonanz von Elektronen mit einer effektiven Masse mn . Auf einer stabilen Umlaufbahn um das Magnetfeld B halten sich Zentrifugalkraft und Lorentz-Kraft das Gleichgewicht. Im allgemeinen wird das Hochfrequenzfeld E HF in seiner Frequenz konstant gehalten und das Magnetfeld B variiert
Wir wollen als Beispiel die Zyklotronresonanz an den Halbleitern Si und Ge betrachten. Elektronen und Löcher befinden sich bei einem Halbleiter in der Nähe der Kanten des Leitungsbandes bzw. Valenzbandes. Wie wir in Abschn. 12 gezeigt hatten, haben die Flächen konstanter Energie um das Leitungsband-Minimum die Form von Ellipsoiden mit Rotationssymmetrie um die [100]- bzw. [111]-Richtungen. Bei beliebiger Orientierung des Magnetfeldes gibt es für jedes Ellipsoidpaar entlang der [100]- bzw. [111]-Achsen eine verschiedene Extremalbahn, also eine verschiedene Zyklotronfrequenz. Für Silizium sind das drei verschiedene Werte entsprechend den drei verschiedenen [100]-Achsen und für Germanium vier für die vier [111]-Richtungen im Raum (Abb. XV.2 a). Bei Orientierung des Magnetfeldes in einer Symmetrieebene reduziert sich diese Zahl. In Abb. XV.2 b sind die Zyklotron-Resonanz-Spektren von Dresselhaus et al. [XV.1] gezeigt. Das Magnetfeld lag dabei in der (110)-Ebene. Dann ist die relative Lage zum Magnetfeld für je zwei Ellipsoidpaare gleich und die Zahl der Absorptionsmaxima für Elektronen erniedrigt sich auf zwei bzw. drei. Zyklotron-Resonanz wird auch für Löcher beobachtet. Ihr Umlaufsinn um das Feld ist umgekehrt. Elektronen und Löcher lassen sich also unterscheiden, wenn man ein zirkular polarisiertes HF-Feld mit Einstrahlrichtung entlang der Richtung des B-Feldes verwendet. Elektronen und Löcher absorbieren dann entsprechend ihrem Umlaufsinn nur rechts bzw. links zirkulare HF-Strahlung. In den Absorptionsspektren (Abb. XV.2 b) sehen wir, dass zwei Maxima Löchern zugeschrieben werden. Die Interpretation ist hier aber anders als bei den Elektronen. Löcher gibt es im Valenzband-Maximum im Punkt C der Brillouin-Zone. In einer (vereinfachten) Betrachtung würde man aufgrund der Symmetrie der Brillouin-Zone kugelförmige Energieflä-
Tafel XV
Tafel XV Zyklotron-Resonanz bei Halbleitern
Tafel XV Zyklotron-Resonanz bei Halbleitern
Tafel XV
476
Abb. XV.2. (a) Flächen konstanter Energie um das Minimum des Leitungsbandes für Si (links) und Ge (rechts). Elektronen bewegen sich senkrecht zum Magnetfeld in geschlossenen Bahnen auf diesen Flächen. Die Umlauffrequenzen für die verschiedenen Bahnen bei gegebenem Magnetfeld sind i. allg. verschieden. Für die spezielle Gestalt der Energieflächen in der Form von Ellipsoiden sind sie allerdings gleich für alle Elektronen eines Ellipsoids. Das ist für die Beobachtbarkeit der Zyklotron-Resonanz jedoch nicht wichtig, da in jedem Fall die Extremalbahn (hier Bahn um den größten Querschnitt) zu einem deutlichen Maximum der HF-Absorption führt. Bei allgemeiner Orientierung des Magnetfeldes gäbe es für Si drei und
für Ge vier verschiedene Extremalbahnen. (b) Zyklotron-Resonanzabsorption für Si und Ge bei einer Orientierung des Magnetfeldes in der (110)-Ebene und einem Winkel von 30 ° bzw. 60 ° zur [100]-Richtung (magnetische Flussdichte in Gauß: 1 G = 10–4 Tesla = 10–4 kg s–2 A–1 oder Vs/m2). In beiden Fällen sind für Elektronen zwei der Extremalbahnen aus Symmetriegründen gleich, und es bleiben 2 bzw. 3 übrig. Die zwei Valenzbänder in C mit verschiedener Krümmung machen sich durch zwei Löcher, „leichte“ und „schwere“, bemerkbar. Für die Beobachtung der Zyklotron-Resonanz sind tiefe Temperaturen erforderlich. Elektron-Loch-Paare werden durch Lichteinstrahlung erzeugt. (Nach Dresselhaus et al. [XV.1])
chen, also nur eine Zyklotronfrequenz, erwarten. Wie wir in Abschn. 12.1 besprochen haben (s. auch Abb. 12.3 u. 12.4), ist die Bandstruktur am Valenzbandmaximum jedoch komplizierter: es gibt „leichte“ und „schwere“ Löcher. Zyklotron-Resonanz kann nur dann beobachtet werden, wenn die Ladungsträger geschlossene Umläufe um das Magnetfeld ohne Stöße mit Phononen oder Störstellen durchlaufen können. Dies ist erfüllt, falls die Relaxationszeit (von der
Größenordnung der freien Flugzeit) s groß gegen die inverse Zyklotronfrequenz x –1 ist. Zykloc tron-Resonanz wird deshalb nur an reinen, möglichst ungestörten Kristallen bei tiefer Temperatur (flüssiges He) beobachtet.
Literatur XV.1 G. Dresselhaus, A. F. Kip, C. Kittel: Phys. Rev. 98, 368 (1955)
Tafel XVI
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
Durch die kontrollierte Epitaxie von atomar scharfen Halbleiterheterostrukturen und Übergittern (Abschn. 12.7) ist es möglich geworden, freie Leitungsbandelektronen in quasi-zweidimensionalen (2 D)-Quantentopfstrukturen von ˚ (typische Ausdehnung in einer Rich50–100 A tung) „einzusperren“. Die hierbei erzeugten quasi-2 D-Elektronengase zeigen hochinteressante physikalische Effekte, vor allem in einem von außen anliegenden starken Magnetfeld. Ein Elektronengas, das sich in einem quasi-2 D-Quantentopf befindet, ist längs einer Koordinate (z, senkrecht zur Heterozwischenschicht oder zur Schichtenfolge in einem Übergitter) in seiner Bewegung stark eingeschränkt, während in der x, yEbene senkrecht dazu freie Bewegung möglich ist. Dementsprechend stellen sich die Energieeigenwerte eines Elektrons dar als (Abschn. 12.7): Ej
kk
h2 2 h2 2 k k ej ; 2mx x 2my y
j 1; 2; . . .
XVI:1
wobei mx und my die effektiven Massenkomponenten in der Ebene der freien Beweglichkeit sind. ej ist ein Spektrum diskreter Energieeigenwerte, das aus der Quantisierung in z-Richtung resultiert (12.90). Für einen tiefen, rechteckigen Quantentopf der Dicke dz nimmt ej z. B. näherungsweise die Werte an, die eindimensionalen, stehenden Elektronenwellen in einem Potentialkasten (Abschn. 6.1) entsprechen (12.93) ej '
h2 p2 j2 ; 2mz dz2
j 1; 2; 3; . . . :
XVI:2
(XVI.1) beschreibt also ein Spektrum diskreter Energieparabeln längs kx und ky, sog. Subbänder (Abschn. 12.7). Legt man nun ein starkes Magnetfeld B senkrecht zur x, y-Ebene der freien Beweglichkeit an, so wird die Dimensionalität des Elek-
tronengases weiter eingeschränkt. Die Elektronen werden senkrecht zum B-Feld auf sog. Zyklotron-Kreisbahnen gezwungen (Tafel XV), auf denen die Umlauffrequenz (Zyklotronfrequenz) eB xc
XVI:3 mk durch das Gleichgewicht zwischen Lorentz-Kraft und Zentrifugalkraft bestimmt ist. mk ist die effektive Masse der Elektronen parallel zur Kreisbewegung (speziell für Isotropie in der Ebene: mx =my = mk ). Da eine Kreisbahn in zwei senkrecht zueinander liegende harmonische Schwingungen zerlegt werden kann, sind die quantenmechanischen Energieeigenwerte der ZyklotronBewegung die eines harmonischen Oszillators der Eigenfrequenz xc. Somit bewirkt das Magnetfeld B eine weitere Quantisierung der Subbänder (XVI.1), die auf Einteilchenenergien Ej;n;s ej
n 12hxc sglB B
XVI:4
führt. Der letzte Term trägt den beiden möglichen Spineinstellungen im Magnetfeld Rechnung; s = ±1 ist die Spinquantenzahl, lB das Bohrsche Magneton und g der Landé-Faktor der Elektronen. Die in (XVI.1) dargestellte Quantisierung durch das Magnetfeld wurde in Tafel VIII für das Elektronengas eines Metalles schon auf etwas andere Weise hergeleitet. Hier wie dort führt die durch das B-Feld erzeugte Quantisierung in sog. Landau-Niveaus (Energieabstand h xc) zu einer Aufspaltung der kontinuierlichen Energieparabeln (Subbänder) in diskrete Energieeigenwerte (Abb. XVI.1 b). Für ein spezielles Subband ist ohne Magnetfeld (B = 0) die Zustandsdichte wegen der Zweidimensionalität eine Stufenfunktion (Abb. 12.28 c). Diese kontinuierliche Funktion spaltet bei endlichem B-Feld in eine Reihe von d-funktionsartigen Spitzen auf, die auf der Energieskala um h xc voneinander entfernt sind. Die
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
Tafel XVI
478
Damit ergibt sich für den Entartungsgrad eines Landau-Niveaus NL eB=h 2;42 1010 cm 2 T
1
B:
XVI:7
Abb. XVI.1 a–c. Qualitative Darstellung der Quantelung eines 2 D-Elektronengases in einem äußeren Magnetfeld B (senkrecht zur x, y-Ebene freier Beweglichkeit). (a) Energieparabel des 1. Subbandes (12.92) eines freien 2 D-Elektronengases längs kx (gestrichelt). Bei Anlegen eines äußeren Magnetfeldes tritt eine weitere Quantisierung in Form von Landau-Zuständen auf (Punkte). (b) Zustandsdichte D im 1. Subband des 2 D-Elektronengases, ohne Magnetfeld (gestrichelt) und mit äußerem Magnetfeld (durchgezogen). xc = –e B / mk ist die Zyklotronfrequenz der elektronischen Kreisbahnen senkrecht zum Magnetfeld B. (c) Darstellung der Landau Aufspaltung n 12 h xc in der kx, ky-Ebene des reziproken Raumes
Zustände „kondensieren“ in scharfe Landau-Niveaus. Weil keine Zustände verloren gehen, müssen soviele Zustände in einem solchen d-funktionsartigen Landau-Niveau enthalten sein, wie ursprünglich bei B = 0 in der Fläche zwischen je zwei Landau-Niveaus vorhanden waren, d. h., der Entartungsgrad NL eines Landau-Niveaus beträgt NL hxc D0 ;
XVI:5
wo D0 die Dichte des Subbands bei B = 0 ist. Im Vergleich zu (12.96) muss die Aufhebung der Spinentartung im Magnetfeld berücksichtigt werden, d. h. es folgt aus (12.96) D0 mk =2ph2 :
XVI:6
Wenn der Landau-Zustand energetisch unterhalb des Fermi-Niveaus liegt, ist er bei genügend tiefer Temperatur gerade mit NL Elektronen besetzt. Eine Variation des äußeren Magnetfeldes ändert nun die energetische Aufspaltung h xc der Landau-Niveaus wie auch den Entartungsgrad (XVI.5) jedes Niveaus. Mit wachsender Magnetfeldstärke verschieben sich die Landau-Zustände zu höheren Energien und durchlaufen schließlich das Fermi-Niveau EF. Dabei werden sie entleert, wobei die überzähligen Elektronen jeweils auf dem darunterliegenden Landau-Niveau Platz finden (wegen der angestiegenen Zustandsdichte). Wenn bei genügend tiefer Temperatur die FermiKante scharf ist, hat das Gesamtsystem seine tiefste freie Energie, wenn gerade ein Landau-Niveau das Fermi-Niveau gekreuzt hat. Mit wachsendem B-Feld steigt die freie Energie an, bis der nächste Landau-Zustand entleert wird. Dies führt zu Oszillationen der freien Energie als Funktion des äußeren Magnetfeldes. Daraus resultieren verschiedene oszillatorische Effekte, z. B. der de Haas-van Alphen-Effekt, der besondere Bedeutung bei der Ausmessung der Topologie von Fermi-Flächen erlangte (Tafel VIII). Vor allem aber der Quanten-Hall-Effekt [XVI.1] liefert heute nicht nur eine wichtige Methode zur Charakterisierung von 2D-Elektronengasen (2DEG) in Halbleiterheterostrukturen, sondern er hat nach seiner Entdeckung durch von Klitzing (Nobelpreis 1985) neue wissenschaftliche Impulse bei der Entwicklung einer Halbleiter-Nanostrukturphysik gegeben. Zur Beobachtung des Quanten-Hall-Effekts wird wie beim klassischen Hall-Effekt (Tafel XIV) eine Spannung UH stromlos an zwei gegenüberliegenden Kontakten senkrecht zum Stromfluss gemessen. Der Strom wird jedoch anders als beim klassischen Hall-Effekt (Tafel XIV) durch ein 2DEG in einer Halbleiterheterostruktur, z. B. aus AlGaAs/GaAs, getragen. Das variable Magnetfeld B liegt senkrecht zur Stromrichtung und damit normal zur Ebene des 2DEG an (Abb.
rH
XVI.2, Einschub, und Abb. XVI.5 c). Die Messung geschieht bei tiefen Temperaturen, um eine scharfe Fermi-Kante im hoch entarteten 2DEG zu gewährleisten. Wird nun das Magnetfeld sukzessive erhöht, so ändert sich der Hall-Widerstand rH = UH/I sprunghaft, jeweils mit Stufen bei den Magnetfeldern, bei denen ein scharfes Landau-Niveau das Fermi-Niveau durchkreuzt (Abb. XVI.2a). Wird gleichzeitig der Magnetowiderstand Rxx (!UL/I) (Abb. XVI.2b) parallel zur Strombahn über entsprechende hintereinander liegende Kontakte (Abb. XVI.5b) gemessen, so erscheint eine Folge von Banden jeweils dort, wo im Quanten-Hall-Effekt Stufen zwischen zwei aufeinanderfolgenden Plateaus auftreten, d. h.
479
dort, wo ein Landau-Niveau das Fermi-Niveau durchkreuzt. Diese Widerstandsoszillationen heißen nach ihrem Entdecker Shubnikov-de HaasOszillationen. Die experimentell gefundenen Hall-Widerstandswerte bei den Magnetfeldern, wo jeweils ein Landau-Niveau das Fermi-Niveau EF kreuzt, ergeben sich unmittelbar aus der Formel für den klassischen Hall-Effekt (Tafel XIV). Aus (XIV.3) folgt für den Hall-Widerstand rH
UH B B ; I nde eN2D
XVI:8 a
wobei N2D die zweidimensionale Dichte des 2DEG ist, die im Magnetfeld B natürlich nur Vielfache des Entartungsgrades NL (XVI.7) annehmen kann. Damit folgen die Widerstandswerte, bei denen Landau-Niveaus EF kreuzen, zu rH
B mNL e
h 1 ; e2 m
m 1; 2; 3; . . .
XVI:8 b
Abb. XVI.2. (a) Quanten-Hall-Effekt, gemessen bei 4 K am quasi-2 D-Elektronengas einer modulationsdotierten AlGaAs/ GaAs-Heterostruktur; 2 D-Elektronendichte N = 4´1011 cm–2, elektronische Beweglichkeit l = 8,6´104 cm2/Vs. Der HallWiderstand rH = UH/I wird in Abhängigkeit vom Magnetfeld B mit einer Messanordnung wie im Einschub gezeigt gemessen. (b) Shubnikov-de Haas-Oszillationen im Magnetowiderstand Rxx, gemessen wie angedeutet im Einschub durch UL/I als Funktion des äußeren Magnetfeldes B. Die angegebenen Zahlen nummerieren die Subbänder, wobei die Pfeile entsprechende Spin-Einstellungen zum B-Feld andeuten. (Nach Paalonen et al. [XVI.2])
Mit (XVI.8 b) sind zwar einzelne diskrete Werte des Kurvenverlaufs in Abb. XVI.2 a richtig beschrieben, jedoch wird in keiner Weise das Auftreten der charakteristischen Plateaus erklärt. Hierzu ist eine genauere Betrachtung der Bewegung von Ladungsträgern in Gegenwart starker Magnetfelder erforderlich. In einem starken magnetischen Feld können nur Elektronen im Innern der Probe, d. h. des 2DEG, ungestörte Zyklotronorbits ausführen (Abb. XVI.3). Ihre Energiezustände entsprechen den ungestörten LandauNiveaus (XVI.4). Am Rand der Probe jedoch stoßen die Elektronen auf die Probenbegrenzung, sie können keine geschlossenen Kreisbahnen mehr ausführen. Im einfachsten Fall elastischer Reflexion ergeben sich als Bahnkurven Teilkreise mit stark gekrümmten Verläufen bei der Reflexion. Die starke Krümmung, die sich auch in den Wellenfunktionen widerspiegelt, führt zu einer Zunahme der kinetischen Energie und damit zu einer „Aufbiegung“ der Landau-Niveaus am Rand der Probe. In der Nähe der Probenberandung y1 und y2 schneiden die Landau-Zustände das Fermi-Niveau EF. Auch wenn im Innern der Probe die Landau-Zustände weit unter EF liegen,
Tafel XVI
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
Tafel XVI
480
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
findet dennoch elektrische Leitung am Rande statt, da dort die Landau-Zustände EF schneiden, also besetzte und unbesetzte Zustände infinitesimal nahe beieinander liegen. Diese sog. Randkanäle (edge channels) besitzen eine weitere interessante Eigenart: sie leiten widerstandsfrei, selbst im Fall makroskopischer Probendimensionen, wo Störstellenstreuung auch bei tiefer Temperatur nicht vernachlässigbar ist. Bei Störstellenstreu-
ung an einem Defekt S auf einer Randbahn (Abb. XVI. 4) wird das Elektron durch das starke Magnetfeld wieder in Vorwärtsrichtung gezwungen; der Gesamtstrom in Vorwärtsrichtung wird nicht reduziert, so dass der Stromtransport in einer solchen Randbahn widerstandsfrei, d. h. quasi-ballistisch, ist. Falls die Landau-Zustände bei geeignetem Magnetfeld energetisch genügend weit vom Fermi-Niveau EF entfernt sind, gibt es keine Zustände im Innern der Probe nahe EF , über die Elektronen im rechten Randkanal mit Zuständen im linken Kanal über Streuung kommunizieren können. Bei Elektronenfluss von links nach rechts befinden sich Elektronen im linken Randkanal auf dem elektrochemischen Potential lL des linken Kontaktes, während Elektronen im rechten „Rückkanal“ sich auf dem Potential des rechten Kontaktes lR befinden (Abb. XVI.5). lL
lR eV :
XVI:9
Der Strom zwischen linkem und rechtem Kontakt wird also im Fall vernachlässigbarer Streuung zwischen Hin- und Rückkanälen als ballistischer Strom in den eindimensionalen (1D) Randkanälen getragen. Die Differenz zwischen beiden Kontakten ergibt den Nettostrom: I
l nc
L X n1
Abb. XVI.3. Erklärung der sog. Randkanäle (edge channels) für Elektronen bei Anliegen eines Magnetfeldes B senkrecht zur Ebene des 2-dimensionalen Elektronengases (2DEG). (a) Ein starkes Magnetfeld B senkrecht zum 2DEG bewirkt Quantisierung der elektronischen Zustände in Landau-Niveaus (n = 1, 2, 3, . . .), die im Innern der Probe geschlossenen Zyklotronbahnen entsprechen. An den beiden Probenrändern y1 und y2 sind geschlossene Bahnen nicht mehr möglich, die stark gekrümmten Randbahnen (durch elastische Reflexion) führen zu einem Anwachsen der Energie der Landau-Zustände, die schließlich die Fermi-Energie EF kreuzen. (b) Bei Stromfluss sind die chemischen Potentiale lR und lL der rechten und linken Randkanäle verschieden, wobei lL–lR der Potentialunterschied zwischen den entsprechenden Kontakten ist. (c) Mit wachsendem Magnetfeld B nimmt die Aufspaltung der Landau-Niveaus zu, wobei das oberste Niveau sich an die Fermi-Energie EF heranschiebt. Im Innern der Probe stehen dann elektronische Zustände nahe EF für Streuung zur Verfügung; linke und rechte Randkanäle kommunizieren
eD
1 n
Ev n
EdE :
XVI:10
lR
Hierbei läuft die Summe über alle besetzten Landau-Niveaus n (bis zu einem maximal besetzten nc), die als Randkanäle EF schneiden. –1 –1 D(1) ist die 1D-Zustandsn = (2p) (dEn/dkx) dichte, die dem n-ten Randkanal zukommt, wäh-
Abb. XVI.4. Schematische Trajektorie eines Ladungsträgers auf einer Randbahn (edge channel), der an einem Streuzentrum S einen elastischen Streuprozess erleidet. Das Magnetfeld ist senkrecht zum 2DEG orientiert, das am Probenrand endet. Dort ist die Streuung als elastisch angenommen
rend v n = h 1 (dEn/dkx) die Elektronengeschwindigkeit in diesem Zustand ist. Damit folgt für den n-ten Randkanal ein Strombeitrag e e2
XVI:11 In
lL lR V : h h Bei der Messung des Quanten-Hall-Effekts wird über zwei Kontakte senkrecht zum Stromfluss (Abb. XVI.5 c) der Widerstand zwischen linken und rechten (hin und zurück) Randkanälen gemessen. Mit (XVI.11) trägt jeder Randkanal den Betrag e2/h zur Leitfähigkeit, d. h. h/e2 zum Hall-Wi-
derstand, bei, genau das Quantum (XVI.8 b), um das der Widerstand sprunghaft zunimmt, wenn bei Vergrößerung des Magnetfeldes ein weiteres Landau-Niveau die Fermi-Energie kreuzt und von Elektronen entleert wird. Die Erklärung des Shubnikov-de Haas-Effektes ist ähnlich zwanglos. Hier wird der Magnetowiderstand mittels zweier Kontakte entlang der Strombahn, also entlang von Randkanälen auf ein und demselben Potential, gemessen (Abb. XVI.5 b). Solange die Landau-Niveaus im Innern der Probe sich energetisch genügend weit von EF befinden, fällt keine Spannung ab. Bei Änderung des Magnetfeldes erreicht einer der Randkanäle im Innern der Probe EF . Es stehen dann Zustände für Streuung zwischen den Hin- und Rückkanälen (links und rechts) zur Verfügung. Streuung zwischen den sonst entkoppelten Hin- und Rückkanälen tritt auf, was einen Widerstand längs der Kanäle bewirkt. Für diese Magnetfelder, wo ein Landau-Niveau im Innern der Probe EF durchdringt, wird eine bandenartige Widerstandszunahme wie im Experiment (Abb. XVI.2 b) gemessen. Quanten-Hall-Effekt und Shubnikov-de Haas-Oszillationen werden in dieser Interpretation also auf quasi-eindimensionalen Transport in Randkanälen zurückgeführt [XVI.4]. Die sprunghaften Änderungen des Hall-Widerstandes rH konnten experimentell mit einer Genauigkeit von 10–7 an realen Proben verschiedenster Herkunft und Struktur gefunden werden [XVI.1]. Man benutzt deshalb mittlerweile die Messung des Quanten-Hall-Effektes zur Präzisionsbestimmung der Feinstrukturkonstanten e2 l0 c 1 :
XVI:12 h 2 137 Nimmt man auf der anderen Seite als bekannt an (bestimmt durch eine Vielzahl von Präzisionsmessungen), so lässt sich der Quanten-Hall-Effekt mittels (XVI.8 b) zur Einführung eines Eichnormals für die Widerstandseinheit „Ohm“ verwenden. Weiterhin sei bemerkt, dass der Quanten-HallEffekt mit einer Reihe anderer Phänomene in der Physik mesoskopischer Systeme oder Nanostrukturen verwandt ist. Die Tatsache, dass Randkanäle (durch das hohe B-Feld verursachte 1D-Leitungskanäle) jeweils einen Betrag e2/h zur Leitfähigkeit beitragen, lässt sich sofort auf 1D-Leitungska-
Abb. XVI.5. (a) Ballistischer Elektronentransport in Randkanälen (edge channels), die durch Quantisierung in einem starken Magnetfeld B senkrecht zum räumlich begrenzten 2DEG erzeugt werden. Unter Vernachlässigung inelastischer Streuung zwischen linken (L) und rechten (R) Kanälen entsprechen die chemischen Potentiale lL und lR denen des linken und rechten elektrischen Kontaktes. (b) Leitung durch Randkanäle in einem 2DEG bei Vorhandensein zweier Kontakte 1) und 2) zur Messung von Shubnikov-de-Haas-Oszillationen in einem starken Magnetfeld B. Inelastische Streuung (i.s.) zwischen linken und rechten Kanälen verursacht einen Spannungsabfall zwischen den Kontakten. (c) Leitung durch Randkanäle in einem 2DEG mit Kontakten 1) und 2) zur Messung des Quanten-Hall-Effektes
481
Tafel XVI
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
Tafel XVI
482
Tafel XVI Shubnikov-de Haas-Oszillationen und Quanten-Hall-Effekt
näle allgemeinerer Art übertragen, sofern die Breite der Kanäle mit der Fermi-Wellenlänge der Elektronen kF vergleichbar ist und die elektrische Leitung quasi-ballistisch, d. h. bei Leiterdimensionen kleiner als der freien Weglänge der Ladungsträger erfolgt. So konnte gezeigt werden, dass die Leitfähigkeit kurzer 1D-Kanäle, die mittels aufgedampfter Metallelektroden in einem 2D-Elektronengas an einer modulationsdotierten AlGaAs/GaAs-Heterostruktur (Abschn. 12.7) erzeugt werden, in Quanten von 2 e2/h zunimmt, wenn die Kanalweite durch Variation einer an den Metallelektroden anliegenden Spannung sukzessive vergrößert wird [XVI.5]. Das Leitfähigkeitsquantum pro „ballistischem“ Kanal beträgt hier 2 e2/h, der doppelte Wert wie beim Quanten-Hall-Effekt. Der Grund ist die Spin-Entartung, die beim QuantenHall-Effekt durch das Magnetfeld aufgehoben ist. Selbst beim elektrischen Schalten makroskopischer metallischer Relais aus Au, Ag und Cu wurden Leitfähigkeitssprünge des Betrages 2 e2/h bei Zimmertemperatur gefunden, die auf mesoskopi-
sche Verengungen der Leitfähigkeitskanäle in den aufgedampften polykristallinen Metallfilmen zurückgeführt werden [XVI.6].
Literatur XVI.1 K. von Klitzing, G. Dorda, M. Pepper: Phys. Rev. B 28, 4886 (1983) XVI.2 M. A. Paalonen, D. C. Tsui, A. C. Gossard: Phys. Rev. B 25, 5566 (1982) XVI.3 H. Lüth: Solid Surfaces, Interfaces and Thin Films (Springer, Berlin Heidelberg 2001) 4th edition, S. 419 XVI.4 M. Janßen, O. Viehweger, U. Fastenrath, J. Hajdu: Introduction to the Theory of the Integer Quantum Hall Effect (VCH, Weinheim 1994) XVI.5 B. J. van Wees, H. van Houten, C. W. J. Beenakker, J. W. Williamson, L. P. Kouwenhoven, D. van der Marel, C. T. Foxon: Phys. Rev. Let. 60, 848 (1988) XVI.6 K. Hansen, E. Laegsgaard, I. Stensgaard, F. Besenbacher: Phys. Rev. B56, 2208 (1997)
Tafel XVII
Tafel XVII Halbleiterepitaxie
In der modernen Halbleiterphysik wie auch in der Bauelementtechnologie spielen in immer stärkerem Maße dünne kristalline Schichten eine wichtige Rolle. Insbesondere Mehrschichtenstrukturen, z. B. Vielfachschichtsysteme von GaAlAs- und GaAs- oder GaInAs-Schichten auf InP sind von Interesse, sowohl um neuartige Phänomene wie den Quanten-Hall-Effekt (Tafel XVI) zu studieren als auch um schnelle Transistoren und Halbleiter-Laser herzustellen. Zur Erzeugung solcher Halbleiterschichtstrukturen werden Epitaxieverfahren verwendet, die eine präzise Abscheidung bis in atomare Bereiche ermöglichen. Im Bereich der Grundlagenforschung wird vor allem die sog. Molekularstrahlepitaxie (Molecular Beam Epitaxy, MBE) angewendet, bei der die Halbleiterschichtstrukturen in einer Ultrahochvakuumkammer epitaktisch wachsen [XVII.1, 2] (Abb. XVII.1). Die Epitaxie besteht prinzipiell im Verdampfen von Materialien wie Ga, Al und
Abb. XVII.1. Schema einer UHVKammer für Molekularstrahlepitaxie (MBE) von III–V-Halbleiterschichten (Schnitt, von oben gesehen). (Nach Cho und Cheng [XVII.3])
As und der Deposition auf Substraten, z. B. GaAs. Ultrahochvakuum (UHV)-Anlagen mit Ausgangsdrücken im Bereich von 10–8 Pa werden benutzt, um möglichst reine und wohldefinierte Bedingungen sowohl im Molekularstrahl als auch auf der Substratoberfläche zu erreichen. Man schätzt ab, dass es bei 10–8 Pa einige Stunden dauert, bis eine als rein präparierte Oberfläche eine Monolagen-Adsorbatbedeckung aus dem Restgas hat, wenn jedes auftreffende Atom oder Molekül haften bleibt. Solche UHV-Kammern sind Edelstahlgefäße, in denen die extrem niedrigen Drücke von weniger als 10–8 Pa (freie Weglänge der Gasmoleküle in der Größenordnung von Metern) durch Ionengetterpumpen oder Turbomolekularpumpen aufrechterhalten werden. Bei Ionengetterpumpen werden die Restgasatome durch hohe elektrische Felder ionisiert und an den entsprechend elektrisch geladenen Elektroden durch aktive Metallfilme (z. B. Ti) chemisorbiert („gegettert“). Bei
PumpenAnschluss
Tafel XVII
484
Tafel XVII Halbleiterepitaxie
Turbomolekularpumpen beruht die Pumpwirkung auf dem Impulsaustausch von Gasmolekülen mit schnell rotierenden Turbinenrädern. Die UHV-Kammer, der Hauptteil einer MBEAnlage (Abb. XVII.1), ist im Innern mit einem Stickstoff-gekühlten Kryoschild ausgekleidet, um Fremdatome und Moleküle „auszufrieren“ und den Restgasdruck weiter herabzusetzen. Das Substratmaterial, z. B. ein GaAs-Wafer, auf dem eine GaAlAs-Schicht abgeschieden werden soll, ist auf einem rotierenden Substrathalter aufgeklemmt. Während des Wachstums muss das Substrat auf etwa 500 bis 600 °C geheizt werden, um eine genügend hohe Oberflächenbeweglichkeit für die auftreffenden Atome bzw. Moleküle (Ga, As4, Si u. ä.) zu erzielen. Die Zulieferung der Atome bzw. Moleküle für den wachsenden Kristall geschieht aus sog. Effusionszellen, in denen die Ausgangsmaterialien, z. B. festes Ga und As bei der GaAs-Epitaxie, durch elektrisches Heizen aus Bornitrid-Tiegeln verdampft werden. Sog. Shutter, mechanisch betriebene Klappen, können von außen gesteuert die einzelnen Effusionszellen schließen und öffnen und so die entsprechenden Molekularstrahlen aus- und einschalten. Die Wachstumsgeschwindigkeit der Epitaxieschicht wird durch den Teilchenfluss im Molekularstrahl, d. h. also durch die Tiegeltemperatur, gesteuert. Um gezielt wohldefinierte Schichtenfolgen wie bei einem Kompositionsübergitter (Abschn. 12.7) mit atomarer Schärfe abzuscheiden, müssen die Tiegeltemperaturen wie auch die Shutter-Öffnungs- und Schließungszeiten durch Rechnerprogramme gesteuert und kontrolliert werden. Dies ist insbesondere dann erforderlich, wenn eine ternäre oder quaternäre Legierung wie Ga0,45Al0,55As mit fester Zusammensetzung abgeschieden werden soll. Die Homoepitaxie von GaAs-Schichten auf GaAs erfordert keine besonders genaue Steuerung der Molekularstrahlflüsse. Hier kommt die Natur zu Hilfe; stöchiometrisches Wachstum von GaAs ist möglich mit nichtstöchiometrischer Strahlzusammensetzung. Das Wachstum ist begrenzt durch die Ga-Auftreffrate. Bei einer Wachstumstemperatur zwischen 500 und 600 °C bleibt Arsen nur dann an der wachsenden Oberfläche haften, wenn genügend GaAtome auf der wachsenden Oberfläche vorhanden sind; der Haftkoeffizient für As ist nahe eins
bei Ga-Überschuss auf der Oberfläche und verschwindend gering bei Ga-Mangel. GaAs-Epitaxie geschieht also optimal bei Arsen-Überschuss. Für ein tieferes Verständnis des GaAs-Wachstums in MBE ist weiter von Bedeutung, dass der Arsenmolekularstrahl beim Verdampfen von festem Arsen im wesentlichen aus As4-Molekülen besteht, die vor dem Einbau in die wachsende Schicht erst durch die thermische Energie der heißen Substratoberfläche in As gespalten werden müssen. Dieser Spaltungsprozess wird manchmal auch durch thermische Zersetzung an heißem Graphit in sog. Cracker-Zellen vorher ausgeführt, was zu besserer Schichtqualität führt. Wichtige Dotierstoffe in der III–V-MBE sind Si für n- und Be für p-Dotierung. Beide Materialien werden ebenfalls aus Effusionszellen verdampft, die gezielt während des Wachstums über Shutter ein- und ausgeschaltet werden können. Wie in Abb. XVII.1 dargestellt, ist eine MBEAnlage üblicherweise mit einer Elektronenkanone und einem Fluoreszenzschirm zur Beobachtung von Elektronenbeugungsbildern (Reflection High Energy Electron Diffraction, RHEED) ausgestattet. Beugungsbilder geben Aufschluss über die kristallographische Struktur der wachsenden Oberfläche. Des weiteren ist natürlich eine Ionisationsmanometerröhre vorhanden, die sowohl eine Messung des Kammerdrucks wie auch der Drücke in den Molekularstrahlen gestattet. Die in Abb. XVII.1 dargestellte MBE-Anlage ist typisch für die Epitaxie von III–V- und II–VIHalbleitern. Si-MBE [XVII.4] wird in ähnlichen Anlagen durchgeführt, nur wird der Si-Molekularstrahl nicht durch thermisches Verdampfen aus Effusionszellen erzeugt, sondern ein festes SiTarget wird durch Elektronenbeschuss so stark erhitzt, dass es verdampft. Der entscheidende Vorteil von MBE gegenüber Epitaxieverfahren, die bei höherem Druck arbeiten, besteht in der schnellen Umschaltzeit zwischen verschiedenen Quellen und damit in der Möglichkeit, atomar scharfe Dotierungs- und Kompositionsprofile auf einfache Weise zu erzeugen. Eine typische Wachstumsrate von 1 lm/h entspricht etwa 0,3 nm/s und somit dem Wachstum einer Monolage in einer Sekunde. Schaltzeiten zwischen verschiedenen Quellen sollten also merklich unterhalb einer Sekunde liegen.
Solch kurze Umschaltzeiten sind bei dem zweiten wichtigen Epitaxieverfahren der metallorganischen Gasphasenepitaxie [XVII.5] (Metal Organic Chemical Vapour Deposition, MOCVD oder Metal Organic Vapour Phase Epitaxy, MOVPE) schwerer zu erreichen, da hier das Wachstum in einem Flussreaktor stattfindet, dessen gesamtes Gasvolumen beim Umschalten von einer Quelle auf eine andere ausgetauscht werden muss. Gegenüber MBE besitzt MOCVD den besonders für industrielle Anwendungen interessanten Vorteil einer leichten Steuerbarkeit der Quellen über Gasflussregler. Weiterhin erlauben die gasförmigen Quellen einen weithin kontinuierlichen Betrieb der Anlage. Das Prinzip des MOCVD-Prozesses sei am Beispiel der Epitaxie von GaAs erklärt. Es handelt sich hierbei um die Abscheidung von festem GaAs aus gasförmigen Materialien, die Ga und As enthalten. Häufig werden AsH3 und das metallorganische Gas Trimethylgallium [TMG = Ga(CH3)3] verwendet. Die Gesamtreaktion, die
Abb. XVII.2 a, b. Schema einer Epitaxie-Apparatur zur metallorganischen Abscheidung (MOCVD) von III–V-Halbleiterschichten. (a) Gesamtübersicht. (b) Reaktor aus Quarzglas (typische Länge 50 cm); der Suszeptor zur Aufnahme des zu beschichtenden Wafers wird während des Wachstums auf 700–1200 K geheizt. (Nach Heinecke et al. [XVII.6])
485
über komplizierte schreibt sich
Zwischenschritte
abläuft,
Ga
CH3 3 gas AsH3 gas ! GaAsfest 3CH4 gas :
XVII:1
AsH3 wird hierbei unmittelbar aus der Gasflasche über ein geregeltes Gasflussventil in den aus Quarz bestehenden Reaktor geleitet (Abb. XVII.2 a). Die metallorganische Komponente TMG befindet sich in einem Kolben, in dem der TMG-Dampfdruck durch ein Temperaturbad eingestellt wird. Wasserstoff (H2) wird als Trägergas durch diesen Kolben geleitet und transportiert das TMG zum Reaktor. Des weiteren erlaubt eine Spülgasleitung das Spülen der gesamten Anordnung mit H2. Die bei der Reaktion nicht verbrauchten Komponenten, bzw. die Reaktionsprodukte, werden am Ende des Reaktors abgepumpt, wobei ein Zerlegungsofen das gefährliche, überschüssige AsH3 zerlegt. Das Pumpsystem erlaubt auch den Betrieb des Reaktors bei niedrigen
Gaseinlass
Gasauslass
Tafel XVII
Tafel XVII Halbleiterepitaxie
Tafel XVII
486
Tafel XVII Halbleiterepitaxie
Drücken (sog. Niedrigdruck MOCVD). Hierdurch können z. B. die Umschaltzeiten zwischen verschiedenen Quellen verringert werden und Vorteile der MBE gewonnen werden. Außer den eigentlichen Quellen für das Wachstum des Grundmaterials (AsH3 und TMG) werden natürlich Gasleitungen für Dotiergase wie SiH4, (C2H5)2 Te, (C5H5)2 Mg zwecks Si-, Te- bzw. Mg-Dotierung benötigt. Für das Wachstum von ternären und quaternären III–V-Legierungen sind außerdem weitere Gaszufuhrleitungen erforderlich. Gebräuchliche Metallorganika sind hier z. B. Trimethylaluminium (CH3)3Al, Trimethylantimon (CH3)3Sb, Trimethylindium (CH3)3In u. ä. Für das Wachstum von Phosphorkomponenten wie InP, GaP wird als Hydrid Phosphin PH3 verwendet. Abbildung XVII.2 b zeigt eine mögliche Bauform für einen Flussreaktor. Der zu beschichtende Wafer ruht auf dem sog. Graphitsuszeptor, der während der Epitaxie eine Wachstumstemperatur zwischen 600 und 800 °C haben muss. Die Heizung erfolgt über Strahlung, über direkten elektrischen Stromfluss oder über Mikrowellenverluste. Verglichen mit MBE stellt der Wachstumsprozess bei MOCVD ein wesentlich komplexeres Geschehen dar. Oberhalb der wachsenden Schicht strömt Gas vorbei. Aus dieser strömenden Schicht diffundieren die Reaktionskomponenten zur Oberfläche. Dort und in der Gasphase geschehen Zersetzungsreaktionen, z. B. wird AsH3 sowohl durch Stöße in der Gasphase wie auch an der Oberfläche selbst zersetzt. Nachdem die nötigen Oberflächenreaktionen, u. a. Einbau des abgespaltenen As in das wachsende Kristallgitter, abgelaufen sind, werden die Reaktionsprodukte, z. B. CH4, wieder durch Diffusion von der Oberfläche weg in den abfließenden Gasstrom transportiert. MOCVDWachstum wird also maßgeblich bestimmt durch Transport hin und weg von der Oberfläche und durch Oberflächenreaktionen, sog. Oberflächenkinetik. Dies zeigt sich sehr klar, wenn man im MOCVD-Prozess die Wachstumsrate als Funktion der Substrattemperatur aufträgt (Abb. XVII.3). Es ergeben sich typische Abhängigkeiten, die zu niedrigen Temperaturen hin einen exponentiellen Abfall wie exp (–Eact/k T) zeigen, der durch Oberflächenreaktionen kinetisch begrenzt ist. Typische Aktivierungsenergien Eact in diesem Bereich lie-
Abb. XVII.3. Wachstumsraten für GaAs-Schichten bei der metallorganischen Gasphasen (MOCVD)-Abscheidung aus AsH3 und Trimethylgallium (TMG) bzw. Triethylgallium (TEG); GaAs-Wafer-Orientierung (100). Es sind jeweils die Gasstromgeschwindigkeiten v und die Partialdrücke pTEG, pTMG bzw. pAsH3 mitangegeben. Der Totaldruck ist in beiden Experimenten 104 Pa. (Nach Plass et al. [XVII.7])
gen bei etwa 1 eV pro Atom. Bei welchen Temperaturen dieser kinetisch begrenzte Bereich liegt, hängt von den verwendeten Quellenmaterialien ab. Während für das thermisch stabilere TMG der exponentielle Abfall unterhalb von 850 K beobachtet wird, tritt er bei Verwendung des leichter zerfallenden Triethylgalliums [TEG, (C2H5)3 Ga] erst unterhalb von 700 K auf. Oberhalb des kinetisch begrenzten Bereiches zeigt die Wachstumsrate ein Plateau, dessen Höhe von den Bedingungen der Hin- und Wegdiffusion abhängt (z. B. Strömungsgeschwindigkeit im Reaktor). Hier ist das Wachstum durch die Transportprozesse in der Gasphase begrenzt. Zu noch höheren Temperaturen hin wird wieder ein Abfall der Wachstumsrate beobachtet (Abb. XVII.3). Für diesen Abfall liegt vermutlich kein prozessinhärenter Grund vor. Ein Verlust von Reaktanten aus dem Gasstrom durch Abscheidung an den Reaktorwänden wird angenommen. Durch geschickte Prozessführung in der Niedrigdruck-MOCVD und durch besondere Ventilkonstruktionen werden heute so kurze Umschaltzeiten erreicht, dass auch in MOCVD atomar scharfe Heteroübergänge von einem Halbleiter zu einem anderen erzeugt werden können.
Eine dritte moderne Epitaxiemethode, die sog. metallorganische MBE (MOMBE) oder auch manchmal CBE (Chemical Beam Epitaxy) genannt, vereinigt Vorteile von MBE und MOCVD in sich [XVII.8]. Wie in MBE dient ein UHV-System (Abb. XVII.1) als Wachstumskammer. Als Quellenmaterialien werden jedoch wie in MOCVD Gase verwendet, die über Leitungen und gesteuerte Ventile von außen in die UHVKammer eingelassen werden. Im Innern dienen speziell konstruierte Einlasssysteme (Kapillaren) dazu, Molekularstrahlen zu formen, die auf die zu beschichtende Substratfläche gerichtet sind. Für das Wachstum von GaAs werden z. B. AsH3 und Triethylgallium [(C2H5)3 Ga, TEG] verwendet. Während jedoch im MOCVD-Reaktor Stöße im Gasraum oberhalb der heißen Substratfläche zu einer signifikanten Vorzerlegung des AsH3 führen, fällt dieser Mechanismus wegen des verschwindend geringen Hintergrunddruckes aus. In MOMBE muss deshalb das AsH3 in der Einlasskapillare selbst thermisch vorzerlegt werden. Bei allen metallorganischen Epitaxieprozessen ist Kohlenstoff, der aus der Zerlegung der Metallorganika stammt, eine markante Verunreinigung, die meist als Akzeptor auf As-Plätzen eingebaut zu p-Leitung führt (obwohl C auch als Donator auf Ga-Plätzen eingebaut werden kann). Dieser C-Einbau wird umso stärker, je niedriger
487
die verwendeten Drücke bei der Epitaxie sind. In MOMBE können niedrigdotierte p-GaAs-Schichten deshalb nur mit TEG und nicht wie in MOCVD auch mit TMG abgeschieden werden.
Literatur XVII.1 M. A. Herman, H. Sitter: Molecular Beam Epitaxy, Springer Ser. Mater. Sci., Vol. 7 (Springer, Berlin Heidelberg 1988) XVII.2 E. H. C. Parker (Hrsg.): The Technology and Physics of Molecular Beam Epitaxy (Plenum, New York 1985) XVII.3 A. Y. Cho, K. Y. Cheng: Appl. Phys. Lett. 38, 360 (1981) XVII.4 E. Kasper, H.-J. Herzog, H. Dämbkes, Th. Richter: Growth Mode and Interface Structure of MBE Grown SiGe Structures, in Two-Dimensional Systems: Physics and New Devices, ed. by G. Bauer, F. Kuchar, H. Heinrich, Springer Ser. Solid-State Sci., Vol. 67 (Springer, Berlin Heidelberg 1986) XVII.5 Proc. ICMOVPE I, J. Crystal Growth 55 (1981) Proc. ICMOVPE II, J. Crystal Growth 68 (1984) W. Richter: Physics of Metal Organic Chemical Vapour Deposition, in Festkörperprobleme XXVI (Adv. Solid State Phys. 26) ed. by P. Grosse (Vieweg, Braunschweig 1986) p. 335 XVII.6 H. Heinecke, E. Veuhoff, N. Pütz, M. Heyen, P. Balk: J. Electron. Mater. 13, 815 (1984) XVII.7 C. Plass, H. Heinecke, O. Kayser, H. Lüth, P. Balk: J. Crystal Growth 88, 455 (1988) XVII.8 H. Lüth: Surf. Science 299/300, 867 (1994)
Tafel XVII
Literatur
Tafel XVIII
Tafel XVIII Präparation von Nanostrukturen
Untersuchungen des elektronischen Transports in Nanostrukturen mit Leiterquerschnitten zwischen 10 und einigen 100 nm benötigen entsprechend strukturierte Proben. Dies gilt insbesondere für Untersuchungen des Quantentransports bei tiefen Temperaturen, so wie er in Abschn. 9.9 beschrieben wurde. Geeignete Strukturierungsmethoden sowohl für Metalle als auch für Halbleitermaterialien wurden im Zusammenhang mit der Halbleiter-Mikroelektronik entwickelt. Im Wesentlichen handelt es sich dabei um Techniken, die auch zur Herstellung hochintegrierter Schaltkreise auf Silizium-Wafern Verwendung finden. Eine häufig angewandte Methode zur Präparation von dreidimensionalen (3D) Nanostrukturen auf einem Substrat beginnt mit der flächenhaften Beschichtung des Substrats, z. B. einem Silizium-, GaAs-, oder Saphir (Al2O3)-Wafer mit dem erwünschten Nanostrukturmaterial. Metalle werden aus einem elektrisch beheizten Wolfram- oder Graphittiegel verdampft und auf dem Substrat deponiert. Bei hochschmelzenden Materialien geschieht das Verdampfen auch häufig durch Elektronenbeschuss des im Tiegel vorhandenen Ausgangsmaterials. Wenn das Substrat zum aufwachsenden Film gut gitterangepasst ist, lässt sich bei höheren Substrattemperaturen, bei denen die Oberflächenbeweglichkeit der auftreffenden Atome genügend hoch ist, auch kristallines Wachstum der Epischicht erzielen. Man spricht dann von Epitaxie (Tafel XVII). Besonders kristalline Halbleiterschichten und Mehrschichtsysteme, z. B. aus GaAs/AlGaAs, InGaAs/InP oder Si/Ge werden mittels Epitaxieverfahren wie Molecular Beam Epitaxy (MBE) oder Metal Organic Vapour Phase Epitaxy (MOVPE) auf geeigneten Substraten abgeschieden (siehe Tafel XVII). Mittels Deposition von polykristallinen bzw. amorphen Schichten oder Epitaxie von kristallinen Epischichten und
Schichtsystemen wird so eine Nanostrukturierung in einer, nämlich der z-Richtung senkrecht zur Substratoberfläche erreicht. Bei Schichtwachstumsraten von 1mm/h, d. h. 0.3 nm/s können Schichtdicken unterhalb von 1nm und atomar scharfe Übergänge zwischen verschiedenen Materialien erzielt werden. Um 3D-Nanostrukturen durch “maschinelle” Strukturierung herzustellen, ist Lithographie (griech. kiho& = Stein, cqueim = schreiben) erforderlich. Laterale Strukturierung bis in den 100 nm Bereich wird mittels optischer Lithographie, d. h. unter Verwendung von Belichtungsmethoden mit sichtbarem und UV-Licht durchgeführt. Nanostrukturierung bis auf die 5–10 nmSkala wird mittels Elektronenstrahl-Lithographie (engl. e-beam-lithography), also unter Verwendung von Elektronenstrahlschreibern erreicht. Beide Prozesse sind darin ähnlich, dass ein Photolack (engl. photoresist) entweder durch Licht oder durch einen Elektronenstrahl belichtet und dadurch chemisch und strukturell bezüglich seiner Löslichkeit in einem organischen Lösungsmittel verändert wird. Bei der optischen Lithographie geschieht die Belichtung durch eine Maske (entweder als Kontaktdurchleuchtung oder durch optische Projektion), d. h. das gewünschte Muster wird in seiner Gesamtheit parallel, in einem einzigen Beleuchtungsschritt auf den Lack übertragen. Bei der Elektronenstrahl-Lithographie erfolgt die Belichtung seriell, indem ein fokussierter Elektronenstrahl rechnergesteuert über den Lack geführt wird. Dies geschieht in einer elektronenmikroskopischen Säule wie bei einem Rasterelektronenmikroskop. Verglichen mit der optischen Lithographie ist die Elektronenstrahl-Lithographie zeit- und kostenintensiver. Für industrielle Anwendung zielt deshalb die Forschung darauf ab, die Elektronenstrahl-Lithographie durch parallele Belichtungsverfahren mit extrem
489
Tafel XVIII
Tafel XVIII Präparation von Nanostrukturen
Abb. XVIII.1. Schematische Darstellung wichtiger lithographischer Strukturierungsverfahren. Die Belichtungsschritte (3) bei der Metall-Ätzung bzw. (2) beim Lift-off-Prozess werden in der optischen Lithographie durch Masken (wie dargestellt) bzw. durch optische Projektion parallel oder in der Elektronenstrahl-Lithographie seriell durchgeführt. Ein Negativlack wird an den belichteten Stellen unlöslich, ein Positivlack löslich für die nachfolgende Lack-Entwicklung
kurzwelligem Licht zu ersetzen, z. B. durch extreme UV (EUV)-Lithographie mit einer Lichtwellenlänge von 13,5 nm (entsprechend einer Photonenenergie von 91,82 eV). Um laterale Strukturen im belichteten Photolack auf Halbleiterschichtsysteme oder Wafer zu übertragen, werden verschieden Ätzverfahren eingesetzt. Die wichtigsten Übertragungsverfahren sind in Abb. XVIII.1 zusammengestellt. Im Fall der Metallstrukturierung auf dem Wafer sind zwei Wege möglich, die Metallätzung und das sog. Lift-off Verfahren. Bei der Metallätzung (linke Kolumne in Abb. XVIII.1) wird eine durch Verdampfung deponierte Metallschicht (Schritt 1) strukturiert geätzt. Dazu wird die Metallschicht (typische Dicke 100 nm) mit dem organischen Photolack, häufig mit Poly-Methyl-Meta-Acrylat (PMMA) in einer Lackschleuder durch Aufsprühen bedeckt (Schritt 2). Im hier beschriebenen Prozess wird ein sog. Negativlack benutzt, bei dem die nachfolgende Belichtung (Schritt 3) durch eine Maske oder durch einen Elektronenstrahl lokal in den beleuchteten Arealen zu einer Verfestigung der chemischen Struktur des Lackes (Polymerbildung), d. h. zu einer geringeren Lös-
lichkeit führt. Bei der nachfolgenden Entwicklung (Schritt 4) werden durch ein organisches Lösungsmittel die nichtbelichteten Areale des Lacks entfernt. Die verbleibenden Lackstrukturen schützen nun die darunter liegende Metallschicht davor, beim Ätzen entfernt zu werden. Ätzen von Strukturen kann je nach verlangten Anforderungen nasschemisch in Lösungen (HCL, H2O2 u.a.) erfolgen oder in einer Plasmaentladung in O2 durch Ionenbeschuss mit mehr oder weniger chemisch aktiven Beimischungen (HF, HBr). Letztere Methode, die in Ionenätzanlagen erfolgt, heißt Reaktives Ionenätzen (engl. Reactive Ion Etching, RIE, Abb. XVIII.2). Die Metallätzung (Schritt 5) hinterlässt nun auf dem Wafer die Nanostrukturen, bestehend aus Metall und der darüber liegenden Lackschicht. In Schritt 6 wird der Lack in einem Ofen durch Veraschung entfernt und die gewünschten Metall-Nanostrukturen verbleiben auf dem Wafer. Da III–V Halbleiter und Metalle sehr ähnliches Ätzverhalten zeigen, eignet sich die beschriebene Methode nur sehr begrenzt zur Erzeugung metallischer Nanostrukturen auf III–V Halbleitern. Hier wird der sogenannte Lift-off-
Tafel XVIII Präparation von Nanostrukturen
Tafel XVIII
490
Abb. XVIII.2. Schema einer Apparatur für Reaktives Ionenätzen (RIE). Zur Aufrechterhaltung der Plasmaentladung mit reaktiven Ionen werden üblicherweise Niedrigdruck-Vakuumkammern als Reaktor eingesetzt
Prozess bevorzugt angewendet. Die III–V-WaferOberfläche wird mit einem Positivlack bedeckt (Schritt 1). Ein solcher Lack wird durch Belichtung, optisch oder durch Elektronenstrahl, chemisch so verändert, dass er in den belichteten Bereichen leichter löslich wird (Aufbrechen von Polymer-Bindungen). Danach wird der Positivlack belichtet, optisch oder durch Elektronenstrahl (Schritt 2). Nach der Entwicklung, dem Entfernen des Lacks an den belichteten Stellen (Schritt 3), ist der Wafer dann mit einer strukturierten Lackschicht bedeckt. Eine nachfolgende Deposition von Metall bedeckt sowohl Lack und Waferbereiche mit Metall (Schritt 4). Im Lift-offProzess werden nun im fünften Schritt die verbliebenen metallbedeckten Lackstrukturen entfernt und nur die auf dem Wafer angeordneten Metallstrukturen bleiben übrig, genauso wie in der vorher beschriebenen Metallätzung. Diesen mit Positivlack durchgeführten Prozess kann man auch einsetzen, um Strukturen direkt in den Halbleiter-Wafer zu übertragen. Nach der Belichtung (Schritt 2) muss man nur einen Ätzschritt, meist RIE, anschließen, der direkt das Halbleitersubstrat angreift (Schritt 4). Hierbei entstehen entsprechende Vertiefungen im Halbleiter, bzw. entsprechende 3D-Nanostrukturen, die erhaben aus dem Halbleiter-Wafer herausragen. Diese Strukturierungsmethode eignet sich also hervorragend, um Halbleiter-Heterostrukturen, die schon in ihrer Schichtstruktur zwei energetische Barrieren für Elektronen, z. B. aus AlAs eingebettet in GaAs (Abschn. 12.7) aufweisen, weiter
in 3D-Quantenpunkte zu überführen, indem die laterale Einschränkung durch lithographische Herausformung von Säulenstrukturen erreicht wird. In einem letzten fünften Schritt wird dann nur noch der übrig gebliebene Photolack entfernt. Alle bisher vorgestellten Methoden der Herstellung von Nanostrukturen gehen von makroskopischen Festkörpern aus und verwenden lithographische Techniken zur Verkleinerung bis in den Nanometerbereich (sog. top-down Verfahren). In den letzten Jahren sind mit wachsender Bedeutung sog. bottom-up Verfahren ins Blickfeld gerückt, bei denen man das Selbstorganisationsprinzip der Natur einsetzt, wie wir es vom Kristallwachstum her kennen. Wenn man die richtigen physikalischen und chemischen Voraussetzungen schafft, bilden sich Nanostrukturen von selbst aus, ohne den Einsatz komplexer und kostenintensiver Lithographietechniken. Ein Beispiel ist die Selbstorganisation organisch-chemischer Nanopartikel und Fadenstrukturen. Speziell für die Halbleiterphysik hat das epitaktische Wachstum von Halbleiterwhiskern (HalbleiterNanosäulen) enorme Bedeutung gewonnen. Deponiert man auf einem Halbleiter-Wafer metallische Tröpfchen mit Durchmessern von 10– 100 nm, so wirken diese als Nukleationskeime und als Katalysatoren beim Kristallwachstum in der Epitaxie, sowohl in der MBE wie auch in der MOVPE bzw. MOCVD (Tafel XVII). Bei der MOVPE bewirken diese metallischen Keime eine gesteigerte katalytische Zersetzung der gasförmi-
491
Tafel XVIII
Tafel XVIII Präparation von Nanostrukturen
Abb. XVIII.3. Rasterelektronenmikroskopische Aufnahmen einer in der Molekularstrahlepitaxie hergestellten Ansammlung von GaN-Whiskern auf einem Si(111)-Substrat (a) und eines einzelnen vom Si-Substrat abgelösten Whiskers, der auf einem mit metallischen Markern (helle Punkte) elektronenlithographisch vorstrukturiertem Si/SiO2-Substrat deponiert wurde und anschließend mit metallischen ohmschen Kontakten überdeckt wurde (b). Die ohmschen Kontakte (großflächige helle Bereiche) wurden auch mittels Elektronenstrahl-Lithographie präpariert. (Nach Calarco et al. [XVIII.1])
gen Ausgangsmaterialien und lassen bei geeigneten Wachstumsparametern nur Wachstum an der Stelle des Metallkeims zu. Dies führt zu Whisker-Wachstum; 10 bis 100 nm dicke Nanosäulen wachsen bis zu Längen von Mikrometern und können nach Abtrennung vom Substrat und elektrischer Kontaktierung, meist mit lithographisch präparierten Metallkontakten (Abb. XVIII.3), zur Untersuchung von Quanteneffekten benutzt werden. Denkt man an Anwendungen in der Quantenelektronik, dann wäre ein geordnetes Wachstum dieser Halbleiter-Nanosäulen, sowohl bezüglich ihrer Dicke und Länge als auch in ihrer räumlichen Anordnung wünschenswert. Dies kann man erreichen, indem man die Metallkeime mit einheitlicher Dicke an wohlbestimmten Plätzen deponiert. Als erfolgreich hat sich aber auch ein geordnetes selektives Wachstum mittels vorher auf dem Wafer abgeschiedener Masken herausgestellt. In Abb. XVIII.4 ist als Beispiel das geordnete
Abb. XVIII.4. Geordnetes selektives Wachstum von GaAs-Nanosäulen auf einem maskierten GaAs(111)-Substrat (rasterelektronenmikroskopische Aufnahmen). (a) Elektronenlithographisch hergestellte Maske aus HSQ (Hydrogen Silesquioxane) auf einem GaAs(111)-Wafer; (b) Mittels metallorganischer Gasphasenepitaxie (MOVPE, Tafel XVII) hergestellte GaAs-Nanosäulen (Durchmesser etwa 150 nm) unter Benutzung der HSQ-Maske aus (a). (Nach Klinger et al. [XVIII.2])
Wachstum von GaAs-Säulen auf GaAs(111) mit Durchmessern von etwa 150 nm dargestellt. Die Maske aus einem anorganischen Negativ-Photolack (HSQ = Hydrogen Silesquioxane) wurde mittels Elektronenstrahl-Lithographie hergestellt (Abb. XVIII.4a). Die GaAs-Säulen wurden in der MOVPE mit den Ausgangsmaterialien AsH3 und TMGa (Trimethylgallium) bei einer Wachstumstemperatur von 750 8C hergestellt. Es sei noch einmal betont, dass für die Herstellung dieser wohlgeordneten Säulen das in der MOVPE mögliche selektive Wachstum entscheidend ist, bei dem die nicht-reaktive Maskenoberfläche wegen ihrer fehlenden Fähigkeit zur oberflächenkatalytischen Zersetzung der Ausgangsgase kein GaAs-Wachstum zulässt. Das Wachstum von Halbleiter-Nanosäulen in MBE und MOVPE bzw. MOCVD wurde mittlerweile für die Halbleitersysteme Si, SiGe, GaAs, InAs, GaN, InN, ZnO gezeigt und lässt interessante neue Entwicklungen im Hinblick auf eine zukünftige Quantenelektronik erwarten.
Tafel XVIII
492
Tafel XVIII Präparation von Nanostrukturen
Literatur XVIII.1 R. Calarco, M. Marso, R. Meijers, Th. Richter, N. Aykanat, T. Thillosen, T. Stoica, H. Lüth: NanoLetters 5, 981 (2005) XVIII.2 V. Klinger, J. Wensorra (Forschungszentrum Jülich 2007): private Mitteilung
Literatur
Zu Kapitel 1 Spezielle Literatur 1.1 L. Pauling: The Nature of the Chemical Bond, 3rd edn. (Cornell Univ. Press, Ithaca, NY 1960) 1.2 S. Göttlicher: Acta Cryst. B 24, 122 (1968) 1.3 Y. W. Yang, P. Coppens: Solid State Commun. 15, 1555 (1974) 1.4 S. P. Walch, W. A. Goddard, III: Surf. Sci. 72, 645 (1978) Weiterführende Literatur Ballhausen, C. J., Gray, H. B.: Molecular Orbital Theory (Benjamin, New York 1964) Cartmell, E., Fowles, G. W. A.: Valency and Molecular Structure, 2nd edn. (Butterworths, London 1961) Coulson, C. A.: Valence, 2nd edn. (Oxford Univ. Press, Oxford 1961) Hartmann, H.: Theorie der chemischen Bindung (Springer, Berlin Heidelberg 1954) Pauling, L.: Die Natur der chemischen Bindung (Chemie-Verlag, Weinheim 1964) Philips, J. C.: Covalent Bonding in Crystals, Molecules and Polymers (The Univ. of Chicago Press, Chicago 1969) Slater, J. C.: Quantum Theory of Molecules and Solids (McGrawHill, New York 1963) Vinogradov, S. N., Linell, R. H.: Hydrogen Bonding (Van NostrandReinhold, New York 1971)
Zu Kapitel 2 Spezielle Literatur 2.1 K. Urban, P. Kramer, M. Wilkens: Phys. Bl. 42, 373 (1986) 2.2 T. B. Massalski (ed.): Binary Alloy Phase Diagrams, American Society for Metals, Metals Park, Ohio 44073, 2nd ed. 1990 Eine Datenbank ist verfügbar unter dem Namen TAPP von ES Microwave, 2234 Wade Court, Hamilton, OH 45013, USA
494
Literatur
Weiterführende Literatur Burzlaff, H., Thiele, G. (Hrsg.): Kristallographie – Grundlagen und Anwendungen (Thieme, Stuttgart 1977), insbesondere: Burzlaff, H., Zimmermann, H.: „Symmetrielehre“, Bd. I Hamermesh, M.: Group Theory and Its Application to Physical Problems (Addison-Wesley/Pergamon, London Paris 1962) Heine, V.: Group Theory in Quantum Mechanics (Pergamon, London 1960) Koster, G. F., Dimmock, J. O., Wheeler, R. G., Statz, H.: Properties of the 42 Point Groups (MIT Press, Cambridge, MA 1963) Streitwolf, H.: Gruppentheorie in der Festkörperphysik (Akademische Verlagsges., Leipzig 1967) Tinkham, M.: Group Theory and Quantum Mechanics (McGrawHill, New York 1964) Vainshtein, B. K.: Modern Crystallography I, Springer Ser. SolidState Sci., Vol. 15 (Springer, Berlin Heidelberg 1981)
Zu Kapitel 3 Spezielle Literatur 3.1 W. Marshall, S. W. Lovesey: Theory of Thermal Neutron Scattering (Clarendon, Oxford 1971) 3.2 L. D. Landau, E. M. Lifschitz: Lehrbuch der theoretischen Physik, Bd. VIII: „Elektrodynamik der Kontinua“ (Akademie Verlag, Berlin 1874) S. 436 ff. 3.3 J. B. Pendry: Low Energy Electron Diffraction (Academic, London 1974) 3.4 S. Kugler, L. Pusztai, L. Rosta, P. Chieux, R. Bellissent: Phys. Rev. B48, 7685 (1993) 3.5 Y. Waseda: The Structure of Non-Crystalline Materials (McGraw-Hill, New York 1981) Weiterführende Literatur Bacon, G. F.: Neutron Diffraction, 2nd edn. (Oxford Univ. Press, Oxford 1962) Dachs, H. (ed.): Neutron Diffraction, Topics Curr. Phys., Vol. 6 (Springer, Berlin Heidelberg 1978) Kleber, W.: Einführung in die Kristallographie, 10. Aufl. (VEB, Berlin 1972) Lovesey, S., Springer, T. (eds.): Dynamics of Solids and Liquids by Neutron Scattering. Topics Curr. Phys., Vol. 3 (Springer, Berlin Heidelberg 1977) Pinsker, Z. G.: Dynamical Scattering of X-Rays in Crystals, Springer Ser. Solid-State Sci., Vol. 3 (Springer, Berlin Heidelberg 1978)
Literatur
495
Sellin, A. (ed.): Structure and Collisions of Ions and Atoms, Topics Curr. Phys., Vol. 5 (Springer, Berlin Heidelberg 1978) Summer Course on Material Science, Antwerp 1969: Modern Diffraction and Imaging Techniques in Material Science, ed. by S. Amelinckx, R. Gevers, G. Remaut, J. van Landuyt (North Holland, Amsterdam 1970)
Zu Kapitel 4 Spezielle Literatur 4.1 M. Born, R. Oppenheimer: Ann. Phys. (Leipzig) 84, 457 (1927) 4.2 G. Leibfried: In Handbuch der Physik, Vol. 7/1 (Springer, Berlin Heidelberg 1955) S. 104 4.3 G. Dolling: In Inelastic Scattering of Neutrons in Solids and Liquids, Vol. II (Intern. Atomic Energy Agency, Vienna 1963) p. 37 4.4 R. F. S. Hearman: Advances in Physics 5, 323 (1956) 4.5 W. A. Brantley: J. App. Phys. 44, 534 (1973) 4.6 G. Simmons, H. Wang: Single crystal elastic constants and calculated aggregate properties; A Handbook, 2nd ed., Cambridge, USA (MIT Press, Cambridge 1971) Weiterführende Literatur Bak, T. A.: Phonons and Phonon Interactions (Benjamin, New York 1964) Bilz, H., Kress, W.: Phonon Dispersion Relations in Insulators, Springer Ser. Solid-State Sci., Vol. 10 (Springer, Berlin Heidelberg 1979) Born, M., Huang, K. H.: Dynamical Theory of Crystal Lattices (Clarendon, Oxford 1954) Leibfried, G., Breuer, N.: Point Defects in Metals I, Introduction to the Theory, Springer Tracts Mod. Phys. Vol. 81 (Springer, Berlin Heidelberg 1977) Ludwig, W.: Recent Developments in Lattice Theory, Springer Tracts Mod. Phys., Vol. 43 (Springer, Berlin Heidelberg 1967) Maradudin, A. A., Montroll, E. W., Weiss, G. H.: “Theory of Lattice Dynamics in the Harmonic Approximation” in Solid State Physics, Advances and Applications, ed. by H. Ehrenreich, F. Seitz, D. Turnbull (Academic, New York, 1971) Suppl. 3 Wallis, R. F. (ed.): Lattice Dynamics (Plenum, New York 1965)
496
Literatur
Zu Kapitel 5 Spezielle Literatur 5.1 G. Dolling, R. A. Cowley: Proc. R. Soc. London 88, 463 (1966) 5.2 American Institute of Physics Handbook, 3rd edn. (McGrawHill, New York 1972) pp. 4–115 5.3 Wei Chen, D. L., Mills: Phys. Rev. B 36, 6269 (1987) 5.4 H. Ibach: Phys. Status Solidi 31, 625 (1969) 5.5 R. W. Powell, C. Y. Ho, P. E. Liley: NSRDS-N 13S8 (1966) 5.6 R. Berman, P. G. Klemens, F. E. Simon, T. M. Fry: Nature 166, 865 (1950) Weiterführende Literatur Rosenberg, H. M.: Low Temperature Solid-State Physics (Clarendon, Oxford 1963)
Zu Kapitel 6 Spezielle Literatur 6.1 A. Sommerfeld, H. Bethe: Elektronentheorie der Metalle, Heidelberger Taschenbuch, Bd. 19 (Springer, Berlin Heidelberg 1967) 6.2 Landolt Börnstein, Neue Serie III/6 (Springer, Berlin Heidelberg 1971) 6.3 C. A. Bailey, P. L. Smith: Phys. Rev. 114, 1010 (1959) 6.4 N. F. Mott: Cdn. J. Phys. 34, 1356 (1956); Nuovo Cimento 7 (Suppl.), 312 (1958) 6.5 H. B. Michaelson: J. Appl. Phys. 48, 4729 (1977) Weiterführende Literatur Grosse, P.: Freie Elektronen in Festkörpern (Springer, Berlin Heidelberg 1979)
Zu Kapitel 7 Spezielle Literatur 7.1 W. Shockley: Electrons and Holes in Semiconductors (Van Nostrand, New York 1950) 7.2 L. P. Howard: Phys. Rev. 109, 1927 (1958) 7.3 B. Segall: Phys. Rev. 124, 1797 (1961)
Literatur
497
7.4 R. Courths, S. Hüfner: Phys. Rep. 112, 55 (1984) 7.5 H. Eckhardt, L. Fritsche, J. Noffke: J. Phys. F 14, 97 (1984) 7.6 F. Herman, R. L. Kortum, C. D. Kuglin, J. L. Shay: In II–VI Semiconducting Compounds, ed. by D. G. Thomas (Benjamin, New York 1967) 7.7 T. H. Upton, W. A. Goddard, C. F. Melius: J. Vac. Sci. Technol. 16, 531 (1979) 7.8 H. Haberland (ed.): Clusters of Atoms and Molecules I and II, Springer Series in Chem. Phys. 52, 56 (Springer Berlin Heidelberg 1994) Weiterführende Literatur Brillouin, L.: Wave Propagation in Periodic Structures (Academic, New York 1960) Callaway, J.: Energy Band Theory (Academic, New York 1964) Harrison, W. A.: Pseudopotentials in the Theory of Metals (Benjamin, New York 1966) Herrmann, R., Preppernau, U.: Elektronen im Kristall (Springer, Berlin Heidelberg 1979) Jones, H.: The Theory of Brillouin-Zones and Electronic States in Crystals (North-Holland, Amsterdam 1962) Loucks, T. L.: Augmented Plane Wave Method (Benjamin, New York 1967) Madelung, O.: Introduction to Solid-State Theory, Springer Ser. Solid State Sci., Vol. 2 (Springer, Berlin Heidelberg 1978) Skriver, H. L.: The LMTO Method, Springer Ser. Solid-State Sci., Vol. 41 (Springer, Berlin Heidelberg 1984) Wilson, A. H.: The Theory of Metals, 2nd edn. (Cambridge Univ. Press, London 1965)
Zu Kapitel 8 Spezielle Literatur 8.1 A. S. Arrot, in J. A. C. Bland, B. Heinrich (eds.): Ultrathin Magnetic Structures, Vol. I, Springer, Berlin 1994, p. 7 8.2 J. F. Janak: Phys. Rev. B 16, 255 (1977) 8.3 J. Callaway, C. S. Wang: Phys. Rev. B 7, 1096 (1973) 8.4 P. Weiss, G. Foex: Arch. Sci. Natl. 31, 89 (1911) 8.5 P. Weiss, R. Porrer: Ann. Phys. 5, 153 (1926) 8.6 H. A. Mook, D. McK. Paul: Phys. Rev. Lett. 54, 227 (1985)
498
Literatur
Weiterführende Literatur Chakravarty, A. S.: Introduction to the Magnetic Properties of Solids (Wiley, New York 1980) Crangle, J.: The Magnetic Properties of Solids (Arnold, London 1977) Ibach, H.: Physics of Surfaces and Interfaces (Springer, Berlin Heidelberg New York 2006) Moriya, T.: Spin Fluctuations in Itinerant Electron Magnetism, Springer Ser. Solid-State Sci., Vol. 56 (Springer, Berlin Heidelberg 1985) White, R. M.: Quantum Theory of Magnetism, Springer Ser. SolidState Sci., Vol. 32 (Springer, Berlin Heidelberg 1983) siehe auch D. C. Mattis: The Theory of Magnetism I and II, Springer Ser. Solid-State Sci., Vols. 17, 55 (Springer, Berlin Heidelberg 1985, 1988)
Zu Kapitel 9 Spezielle Literatur 9.1 P. Drude: Ann. Phys. (Leipzig) 1, 566 (1900) 9.2 E. Grüneisen: Ann. Phys. (Leipzig) (5) 16, 530 (1933) 9.3 D. K. C. McDonald, K. Mendelssohn: Proc. R. Soc. Edinburgh, Sect. A 202, 103 (1950) 9.4 J. Linde: Ann. Phys. (Leipzig) 5, 15 (1932) 9.5 J. M. Ziman: Principles of the Theory of Solids (Cambridge Univ. Press, London 1964) 9.6 N. F. Mott: Phil. Mag. B19, 835 (1984) N. F. Mott: in The Physics of Hydrogenated Amorphous Silicon Vol. II, ed. by J. D. Joannopoulos and G. Luckowsky, Topics in Applied Physics, Vol. 56 (Springer, Berlin Heidelberg 1984) p. 169 9.7 B. Ruttensperger, G. Müller, G. Krötz: Phil. Mag. B68 203 (1993) 9.8 B. J. van Wees, H. van Houten, C. W. J. Beenacker, J. W. Williamson, L. P. Kouwenhoven, D. van der Marel, C. T. Foxon: Phys. Rev. Lett. 60, 848 (1988) 9.9 K. Hansen, E. Laegsgaard, I. Stensgaard, F. Besenbacher: Phys. Rev. B56, 2208 (1997) 9.10 Y. Aharonov and D. Bohm: Phys. Rev. 115, 485 (1959) 9.11 R. A. Webb, S. Washburn, C. P. Umbach, R. B. Laibowitz: Phys. Rev. Lett. 54, 2696 (1985) 9.12 J. Wesorra, M. Lepsa, M. Indlekofer, Ch. Blömers, S. Heiderich, Th. Schäpers, H. Lüth: unveröffentlicht 9.13 G. J. Dolan, J. C. Licini, D. J. Bishop: Phys. Rev. Lett. 56, 1493 (1986)
Literatur
499
9.14 Ch. Blömers, Th. Schäpers, T. Richter, R. Calarco, H. Lüth, M. Marso: Appl. Phys. Lett. 92, 132101 (2008) 9.15 C. P. Umbach, C. Van Haesendonck, R. B. Laibowitz, S. Washburn, R. A. Webb: Phys. Rev. Lett. 56, 386 (1986) Weiterführende Literatur Blatt, F. J.: Physics of Electronic Conduction in Solids (McGrawHill, New York 1968) Buckel, W.: Supraleitung – Grundlagen und Anwendung (Physik Verlag, Weinheim 1972) Busch, G., Schade, H.: Vorlesungen über Festkörperphysik (Birkhäuser, Basel 1973) Heinzel, Th.: Mesosopic Electronics in Solid State Nanostructures (Wiley-VCH, Weinheim 2003) Madelung, O.: Introduction to Solid-State Theory, Springer Ser. Solid-State Sci., Vol. 2 (Springer, Berlin Heidelberg 1978) Nag, B. R.: Electron Transport in Compound Semiconductors, Springer Ser. Solid-State Sci., Vol. 11 (Springer, Berlin Heidelberg 1980) Smith, A. C., Janak, J. F., Adler, R. B.: Electronic Conduction in Solids (McGraw-Hill, New York 1967) Ziman, J. M.: Electrons and Phonons (Clarendon, Oxford 1960)
Zu Kapitel 10 Spezielle Literatur 10.1 H. K. Onnes: Akad. van Wetenschappen (Amsterdam) 14, 113, 818 (1911) 10.2 J. Bardeen, L. N. Cooper, J. R. Schrieffer: Phys. Rev. 108, 1175 (1957) 10.3 N. E. Phillips: Phys. Rev. 114, 676 (1959) 10.4 W. Meissner, R. Ochsenfeld: Naturwissensch. 21, 787 (1933) 10.5 F. London, H. London: Z. Phys. 96, 359 (1935) 10.6 L. N. Cooper: Phys. Rev. 104, 1189 (1956) 10.7 H. Fröhlich: Phys. Rev. 79, 845 (1950) 10.8 N. N. Bogoliubov: Nuovo Cimento 7, 794 (1958) 10.9 J. Hinken: Supraleiter-Elektronik (Springer, Berlin Heidelberg 1988) 10.10 V. V. Schmidt (eds. P. Müller, A. V. Ustinov): The Physics of Superconductors (Springer, Berlin Heidelberg 1997) 10.11 P. L. Richards, M. Tinkham: Phys. Rev. 119, 575 (1960) 10.12 I. Giaever, K. Megerle: Phys. Rev. 122, 1101 (1961)
500
Literatur
10.13 E. Maxwell: Phys. Rev. 86, 235 (1952); B. Serin, C. A. Reynolds, C. Lohman: Phys. Rev. 86, 162 (1952); J. M. Lock, A. B. Pippard, D. Schoenberg: Proc. Cambridge Phil. Soc. 47, 811 (1951) 10.14 V. L. Ginzburg, L. D. Landau: Soviet Phys.-JETP (USSR) 20, 1064 (1950) siehe auch V. L. Ginzburg: Nuovo Cimento 2, 1234 (1955) 10.15 A. C. Rose-Innes, E. H. Rhoderick: Introduction to Superconductivity (Pergamon, Oxford 1969) p. 52 10.16 R. Doll, M. Näbauer: Phys. Rev. Lett. 7, 51 (1961) 10.17 B. S. Deaver Jr., W. M. Fairbank: Phys. Rev. Lett. 7, 43 (1961) 10.18 T. Kinsel, E. A. Lynton, B. Serin: Rev. Mod. Phys. 36, 105 (1964) 10.19 J. Schelten, H. Ullmeier, G. Lippmann, W. Schmatz: in Low Temperature Physics – LT 13, Vol. 3, ed. by K. D. Timmerhaus, W. J. O’Sullivan, E. F. Hammel (Plenum, New York 1972) p. 54 10.20 J. G. Bednorz, K. A. Müller: Z. Phys. B 64, 189 (1986) 10.21 M. K. Wu, J. R. Ashburn, C. J. Tornq, P. H. Hor, R. L. Meng, L. Gao, Z. J. Huang, Y. Q. Wang, C. W. Chu: Phys. Rev. Lett. 58, 908 (1987) 10.22 J. R. Cooper, S. D. Obertelli, A. Carrington, J. W. Loran: Phys. Rev. B 44, 12 086 (1991) 10.23 R. Wördenweber: Private Mitteilung (ISI, Forschungszentrum Jülich) 10.24 H. Maeda, Y. Tanaka, M. Fukutomi, T. Asano: Jpn. J. Appl. Phys. Lett. 27, L 209 (1988) 10.25 Z. Z. Sheng, A. M. Hermann: Nature 332, 55 (1988) 10.26 R. Hott, H. Rietschel, M. Sander: Phys. Bl. 48, 355 (1992) 10.27 B. Kabius: Private Mitteilung (IFF, Forschungszentrum Jülich) 10.28 S. J. Hagen, T. W. Jing, Z. Z. Wang, J. Horvath, N. P. Ong: Phys. Rev. B 37, 7928 (1988) 10.29 J. Zaanen, A. T. Paxton, O. Jepsen, O. K. Anderson: Phys. Rev. Lett. 60, 2685 (1988) 10.30 Ching-ping S. Wang: Electronic Structure, Lattice Dynamics, and Magnetic Interactions, in High Temperature Superconductivity, ed. by J. W. Lynn, Graduate Texts Contemp. Phys. (Springer, Berlin Heidelberg 1990) p. 122 10.31 H. Takagi, S. Uchida, Y. Tokura: Phys. Rev. Lett. 62, 1197 (1989) 10.32 Y. Zhang, Y. Tavrin, M. Mück, A. I. Braginski, C. Heiden, T. Elbert, S. Hampson: Physiol. Meas. 14, 113 (1993) 10.33 J. Fink, E. Sohmen: Phys. Bl. 48, 11 (1992) 10.34 C. Politis, V. Buntar, W. Krauss, A. Gurevich: Europhys. Lett. 17, 175 (1992)
Literatur
501
Weiterführende Literatur Buckel, W.: Supraleitung, 4. Aufl. (VCH, Weinheim 1990) De Gennes, P. G.: Superconductivity of Metals and Alloys (Benjamin, New York 1966) Huebener, R. P.: Magnetic Flux Structures in Superconductors, Springer Ser. Solid-State Sci., Vol. 6 (Springer, Berlin Heidelberg 1979) Kuper, Ch. G.: An Introduction to the Theory of Superconductivity (Clarendon, Oxford 1968) Lynn, J. W. (ed.): High Temperature Superconductivity, Graduate Texts Contemp. Phys. (Springer, Berlin Heidelberg 1990) Lynton, E. A.: Superconductivity (Methuen’s Monographs on Physical Subjects, London 1964). (Deutsche Übersetzung: Bibliographisches Institut, Mannheim 1966) Rickayzen, G.: Theory of Superconductivity (Wiley, New York 1965) Rose-Innes, A. C., Rhoderick, E. H.: Introduction to Superconductivity (Pergamon, Braunschweig 1969) Schmidt, V. V. (eds. P. Müller and A. V. Ustinov): The Physics of Superconductors (Springer, Berlin Heidelberg 1997) Stolz, H.: Supraleitung (Vieweg, Braunschweig 1979) Tinkham, M.: Introduction to Superconductivity (McGraw-Hill, New York 1975)
Zu Kapitel 11 Spezielle Literatur 11.1 B. Schrader, W. Meier: Raman/IR Atlas organischer Verbindungen, Bd. 1 (VCH, Weinheim 1974) 11.2 L. H. Henry, J. J. Hopfield: Phys. Rev. Lett. 15, 964 (1965) 11.3 T. P. Martin: Phys. Rev. B 1, 3480 (1970) 11.4 M. Hass, B. W. Henri: J. Phys. Chem. Sol. 23, 1099 (1962) 11.5 G. Frank, E. Kauer, H. Köstlin: Phys. Bl. 34, 106 (1978) 11.6 J. C. Phillips: in Solid State Physics, Vol. 18, ed. by F. Seitz, P. Turnbull (Academic, New York 1966) 11.7 G. W. Gobeli, H. Y. Fan: in Semiconductor Research, 2nd Quarterly Report, Purdue Univ. (1956) 11.8 E. J. Johnson: in Semiconductors and Semimetals, Vol. 3, ed. by R. K. Willardson, A. C. Beer (Academic, New York 1967) p. 171 11.9 H. Ehrenreich, H. R. Philipp: Phys. Rev. 128, 1622 (1962) 11.10 M. D. Sturge: Phys. Rev. 127, 768 (1962) 11.11 H. Lüth: Solid Surfaces, Interfaces and Thin Films, 4th edn. (Springer, Berlin Heidelberg New York 2001) 11.12 J. Geiger, K. Wittmaack: Z. Phys. 195, 44 (1966) 11.13 H. Ibach: Phys. Rev. Lett. 24, 1416 (1970)
502
Literatur
Weiterführende Literatur Abeles, F. (ed.): International Colloquium on Optical Properties and Electronic Structure of Metals and Alloys (North-Holland, Amsterdam 1966) Cho, K. (ed.): Excitons, Topics Curr. Phys., Vol. 14 (Springer, Berlin Heidelberg 1979) Fröhlich, H.: Theory of Dielectrics (Clarendon, Oxford 1958) Geiger, J.: Elektronen und Festkörper (Vieweg, Braunschweig 1968) Greenaway, D. L., Harbeke, G.: Optical Properties and Band Structure of Semiconductors (Pergamon, Oxford 1968) Haken, H., Nikitine, S. (eds.): Excitons at High Densities, Springer Tracts Mod. Phys., Vol. 73 (Springer, Berlin Heidelberg 1975) Mitra, S. S., Nudelman, S. (eds.): Far Infrared Properties of Solids (Plenum, New York London 1970) Nakajima, S., Toyozawa, Y., Abe, R.: The Physics of Elementary Excitations, Springer Ser. Solid-State Sci., Vol. 12 (Springer, Berlin Heidelberg 1980) Nudelman, S., Mitra, S. S. (eds.): Optical Properties of Solids (Plenum, New York 1969) Willardson, R. K., Beer, A. C. (eds.): Semiconductors and Semimetals, Vol. 3, Optical Properties of III–V-Compounds (Academic, New York 1968)
Zu Kapitel 12 Spezielle Literatur 12.1 J. R. Chelikowsky, M. L. Cohen: Phys. Rev. B 14, 556 (1976) 12.2 J. H. Reuszer, P. Fischer: Phys. Rev. 135, A 1125 (1964) 12.3 E. M. Conwell: Proc. IRE 40, 1327 (1952) 12.4 S. M. Sze: Physics of Semiconductor Devices, 2nd edn. (Wiley, New York 1969) 12.5 B. Gelmont, K. Kim, M. Shur: J. Appl. Phys. 74, 1818 (1993) 12.6 H. Lüth: Solid Surfaces, Interfaces and Thin Films, 4th edn. (Springer, Berlin Heidelberg 2001) 12.7 G. Margaritondo, P. Perfetti: The Problem of Heterojunction Band Discontinuities, in Heterojunction Band Discontinuities, Physics and Device Applications, ed. by F. Capasso, G. Margaritondo (North-Holland, Amsterdam 1987) p. 59 12.8 H. Morkoç: Modulation-doped AlxGa1–xAs/GaAs Heterostructures, in The Technology and Physics of Molecular Beam Epitaxy, ed. by E. H. C. Parker (Plenum, New York 1985) p. 185
Literatur
12.9 12.10 12.11 12.12 12.13 12.14 12.15
12.16
503
L. Esaki: Compositional Superlattices, in The Technology and Physics of Molecular Beam Epitaxy, ed. by E. H. C. Parker (Plenum, New York 1985) p. 185 A. Förster: Private Mitteilung (ISI, Forschungszentrum Jülich) H. Heinecke, K. Werner, M. Weyers, H. Lüth, P. Balk: J. Crystal Growth 81, 270 (1987) F. Capasso (ed.): Physics of Quantum Electron Devices, Springer Ser. Electron. Photon., Vol. 28 (Springer, Berlin Heidelberg 1989) U. Tietze, Ch. Schenk: Halbleiterschaltungstechnik (Springer, Berlin Heidelberg 1983) K. Schimpf, M. Sommer, M. Horstmann, M. Hollfelder, A. van der Hart, M. Marso, P. Kordos, H. Lüth: IEEE Electron Device Letters 18, 144 (1997) H.-M. Mühlhoff, D.V. McCaughan: MOS Transistors and Memories, in Handbook of Semiconductors, Vol. 4, ed. by T.S. Moss, C. Hilsum (North-Holland, Amsterdam 1993) p. 265 H. Kressel, D.E. Ackley: Semiconductor Lasers, in Handbook of Semiconductors, Vol. 4, ed. by T.S. Moss, C. Hilsum (North Holland, Amsterdam 1993) p. 725
Weiterführende Literatur Allan, G., Bastard, G., Boccara, N., Lanoo, M., Voos, M. (eds.): Heterojunctions and Semiconductor Superlattices (Springer, Berlin Heidelberg 1986) Bauer, G., Kuchar, F., Heinrich, H. (eds.): Two-dimensional Systems: Physics and New Devices, Springer Ser. Solid-State Sci., Vol. 67 (Springer, Berlin Heidelberg 1986) Brauer, W., Streitwolf, H. W.: Theoretische Grundlagen der Halbleiterphysik (Akademie-Verlag, Berlin 1976) Buchreihe: Halbleiter-Elektronik, Bd. 1–20, ed. by W. v. Heywang, R. Müller (Springer, Berlin Heidelberg) Capasso, F., Margaritondo, G. (eds.): Heterojunction Band Discontinuities, Physics and Device Applications (North-Holland, Amsterdam 1987) Chang, L. L., Ploog, K. (eds.): Molecular Beam Epitaxy and Heterostructures, NATO ASI Ser. E, No. 87 (Martinus Nijhoff, Dordrecht 1985) Kelly, M.J.: Low-Dimensional Semiconductors, Materials, Physics, Technology, Devices (Clarendon Press, Oxford 1995) Lanoo, M., Bourgoin, J.: Point Defects in Semiconductors I and II, Springer Ser. Solid-State Sci., Vols. 22, 35 (Springer, Berlin Heidelberg 1981, 1983) Madelung, O.: Grundlagen der Halbleiterphysik, Heidelberger Taschenbuch, Bd. 71 (Springer, Berlin Heidelberg 1970)
504
Literatur
Nizzoli, F., Rieder, K.-H., Willis, R. F. (eds.): Dynamical Phenomena at Surfaces, Interfaces and Superlattices, Springer Ser. Surf. Sci., Vol 3 (Springer, Berlin Heidelberg 1985) Parker, E. H. C. (ed.): The Technology and Physics of Molecular Beam Epitaxy (Plenum, New York 1985) Reggiani, L. (ed.) Hot-Electron Transport in Semiconductors, Topics Appl. Phys., Vol. 58 (Springer, Berlin Heidelberg 1985) Seeger, K.: Semiconductor Physics, 4th edn., Springer Ser. SolidState Sci., Vol. 40 (Springer, Berlin Heidelberg 1988) Shklovskii, B., Efros, A. L.: Electronic Properties of Doped Semiconductors, Springer Ser. Solid-State Sci., Vol. 45 (Springer, Berlin Heidelberg 1984) Shockley, W.: Electrons and Holes in Semiconductors (Van Nostrand, Princeton 1950) Spenke, E.: Elektronische Halbleiter (Springer, Berlin Heidelberg 1965) Sze, S. M.: Physics of Semiconductor Devices, 2nd edn. (Wiley, New York 1969) Ueta, M., Kanzaki, H., Kobayashi, K., Toyozawa, Y., Hanamura, E.: Excitonic Processes in Solids, Springer Ser. Solid-State Sci., Vol. 60 (Springer, Berlin Heidelberg 1986)
Sachverzeichnis
Absolute Thermokraft 258 Absorption elektromagnetischer Strahlung 364 ff. Absorptionskonstante 366 Adiabatische Entmagnetisierung 130 – Näherung 81, 135 Aharonov-Bohm-Effekt 270 Akustischer Zweig 86 Akzeptoren 413 ff. Altshuler-Aronov-Spivak-Oszillationen 273 Amorphe Materialien, elektrische Leitfähigkeit 261 – Paarkoorelationsfunktion 55 – Wärmeleitfähigkeit 127 – Zustandsdichte 179 Anharmonische Effekte 119 Anisotropie, magnetische 230 Anomale Absorption 77 – Transmission 77 Anregungsspektrum, Ferromagnet 217 – Supraleiter 309 Antibindendes Orbital 6 Antiferromagnetismus 210 ff. Anti-Stokes-Linien 106, 230 Antisymmetrisierung 198 ARUPS (Angle Resolved Ultraviolett Photoemission Spectroscopy) 185 Atomfaktor (Atomformfaktor) 55, 65 Atomstrahlen 67, 73 Ausgangskennlinie 458 Austauschanisotropie 231 Austauschaufspaltung 201 Austauschloch 200 Austauschwechselwirkung 195 ff Austrittsarbeit 152 – Tabelle 155 Bahndrehimpuls 191 Ballistischer Transport 266 Bandaufspaltung 167 Banddiskontinuität 444 Bänderschema 163 ff Bandlücken von Halbleitern 412, 443 Bandstrukturen 173, 405 Basis, Kristallstruktur 25 – Transistor 457 Basisvektoren 23 Baugruppe (Basis) 25
BCS-Anregungsspektrum 309 ff. BCS-Grundzustand 299 ff. – Kohärenz 322 ff. BCS-Theorie 299 ff. Beersches Gesetz 366, 369 Besetzungsinversion 466 Beugungsexperimente 72 Beugungstheorie 51 ff. Beweglichkeit, Halbleiter 422 – Metalle 250 Beweglichkeitskante 261 Bewegung von Ladungsträgern und Transportphänomene 233 ff. Bewegungsgleichungen, Atome 85 ff. – Elektronen 237 Bindendes Orbital 6 Bipolartransistor 456 ff. Blochsches Theorem 161 Blochsches T2/3-Gesetz 218 Bloch-Wand 221 Bloch-Wellen 161 ff. Bogoliubov-Gleichungen 312 ff. Bohrsches Magneton 190 Boltzmann-Gleichung 124, 246 Bose-Statistik 116 Bottom-up Verfahren 490 Braggsche Gleichung 62 Bragg-Williams Näherung 40 Bravais-Gitter 24 Brechzahl 366 Brillouin-Streuung 91, 108 Brillouin-Zone 63, 88, 163 Burgersvektor 47 C60 8 Cäsiumchlorid-Struktur 9 Chemische Bindung 4 ff. Chemisches Potential, Elektronen 143 – Legierungen 42 Clausius-Mossotti-Beziehung 378 Cluster (Clusterrechnungen) 181 Cooper-Paare 294 ff. – Tunneln 356 – Wellenfunktion 294 ff. Coulomb-Potential 10 – abgeschirmtes 151 Curie-Temperatur 202, 206, 379 Curie-Weiss Gesetz 207
Damon-Eshbach Wellen 227 Darstellung einer Gruppe 29 De Broglie Wellenlänge, Teilchen 67 De Haas-van Alphen-Effekt 284 Debyesche Abschneidefrequenz 117 Debye-Scherrer Verfahren 69 Debyesches Modell der spez. Wärme 117 Debye-Temperaturen, Tabelle 118 Debye-Waller Faktor 104 Defekte 46 Defektelektronen, Löcher 238, 406 Dehnungstensor 94 d-Elektronen 13, 34, 149, 176, 305 Depolarisationsfeld 230 Diamagnetismus 190, 194 Diamantstruktur 35 Dielektrische Eigenschaften 361 ff. – Energieverluste von Elektronen 390 ff. – Funktion 361 ff – Suszeptibilität 363 Diffusionslänge 437 Diffusionsspannung 432 Diffusionsstromnäherung 436 Diffusiver Transport 266 Dipolwechselwirkung 16, 376 Direkte Übergänge 365, 367 Dispersionsrelation 85 f. Domänen, magnetische 218, 221 Donatoren 413 Doppelheterostrukturlaser 468 Dotierte Halbleiter 412 ff. Dotierungsübergitter 453 Drain (Abflusskontakt) 460 Drehachse 25 Drehinversionsachse 26 Drehkristallverfahren 69 Dreiachsenspektrometer 75 III-V-Halbleiter 407 Driftgeschwindigkeit 425 ff. Drude-Leitfähigkeit 248, 251 Dynamik von Atomen 81 ff. Dynamische Matrix 84 – Streutheorie 52 Effektive Bandlücke 454 – Ionenladung 367 – Masse, Definition 237
506 – – Tabellen für Halbleiter 406, 408 – Zustandsdichte 411 Eigenschwingungen eines Moleküls 30 Einelektronennäherung 136 ff., 242 Einstein-Beziehung 431 Elastische Energiedichte 95, 104 Elastische Isotropie 101 Elastische Konstanten 98 – Module 95 – – Tabelle für kubische Kristalle 101 Elastische Streuung, Kinematik 53 – – von Elektronen in Bändern 243 Electrical confinement 469 Elektrische Leitfähigkeit, amorphe Materialien 261 – – Halbleiter 421 ff. – – Metalle 250 ff. Elektrische Suszeptibilität 105, 363 Elektronen, de Broglie Wellenlänge 67 Elektronenaffinität 9, 444 Elektronen-Energieverlustspektroskopie 390 ff. Elektronennegativität 11 Elektronische Bandstruktur 159 ff. Elektronisches Bänderschema, quasifreie Elektronen 166 – – stark gebundene Elektronen 168 Elementarzelle 22, 73 Emitter 457 Emittereffizienz 459 Energielücke, amorphe Materialien 180 – Halbleiter 176, 403 ff. – – Tabellen 386, 404, 410 Entartung und Gruppentheorie 29 Entropie einer Mischung 40 Epitaxie 443, 454, 482 Erschöpfung von Akzeptoren und Donatoren 419 ESCA (Electron Spectroscopy for Chemical Analysis) 185 Ewald-Kugel (Konstruktion) 60 Exchange bias 231 Exzitonen 389 Fabry-Pérot-Interferometer 108, 228 Feinstrukturkonstante 480 Feldeffekt Transistor 460 ff. Fermi-Energie, Definition 140 Fermi-Fläche 177, 284 Fermi-Gas 140 ff. Fermi-Kugel 141, 242, 249, 299 Fermi-Niveau, Definition 140 – Bauelemente 451, 467 – Funktion der Temperatur 420 – Heterostrukturen 436, 441, 444 – pinning 431, 462
Sachverzeichnis
– p-n Übergang 436 – verschiedene Dotierung 414 Fermi-Verteilung 144 Ferroelektrika 378 Ferromagnetismus 200 ff. Feste Randbedingungen 137 FET (Field Effect Transistor) 460 ff. Flussquant 272 Flussquantisierung 327 ff. Flussschläuche 336 Flusswirbel 336 ff. Fluxoid 328 Formanisotropie 230 Fourier-Spektroskopie 400 Fourier-Transformation 53, 400 Freie Energie, harmonischer Oszillator 121 – – Legierungen 40 – – Punktdefekte 47 Freie Weglänge 265 Freies Elektronengas 136 ff., 379 – zweidimensionales 448, 451 Frenkel-Defekt 46 – Exzitonen 390 Friedelsche Regel 59 Fröhlich-Wechselwirkung 294 Frustrierte Totalreflexion 401 Gate (Tor) 460 Gemischter Zustand 335 Generationsstrom 434 Ginzburg-Landau-Theorie 334 Gitterdeformation 48, 294 Gitterdynamik 81 ff. Glühemission 152 GMR-Effekt 232 Grenzflächenanisotropie 231 Grenzflächenenergie (Supraleitung) 333 Grenzflächenzustände 441 Grüneisen-Formel 254 Grüneisen-Zahl 122 Gruppengeschwindigkeit 103, 124, 236 Halbleiter 7, 176, 403 ff. – Bauelemente 456 ff. – Epitaxie 482 – Heterostrukturen 443 ff. – Heteroübergang 446 ff. – Laser 464 ff. – Übergitter 448 Hall-Effekt 421, 473 ff. – Quanten 477 Harmonische Näherung 84 Harmonischer Oszillator 111, 367 Hebelgesetz der Zustandsdiagramme 43 Heisenberg Operator 197, 215, 222 HEMT (High Electron Mobility Transistor) 461 ff.
He-Streuung 74 Heterobipolartransistor 459 Heterostruktur-FET 460 ff. Hexagonal dichteste Kugelpackung 32 H+2 , H2 Molekül 4, 195 Hochfeldbeweglichkeit 425 ff. Hochtemperatur-Supraleiter 338 ff. Hopping Leitfähigkeit 262 Hysteres 219, 232 Idealer Leiter 290 Impulserhaltung, Lichtabsorption 385 – Photoemission 186 – Raman Effekt 105 – Streuung 90 – Unschärfe eines Cooper-Paares 323 Indirekte Halbleiter 404 – Übergänge 385 Inelastische Streuung 90 – – von Elektronen in Bändern 249 Inelastisches Tunneln 354 Infrarot-aktives Phonon 89, 367 Infrarot-Spektroskopie 373, 399 Innere Energie, freies Elektronengas 142 – – harmonischer Festkörper 116 – – Legierungen 40 Instabilität des Fermi-Sees 294 Interband-Übergänge 382 ff. Intrinsische Halbleiter 408 ff. Inversion 25 – Ladungsträger 395, 466 Ionenbindung 9 ff. Ionisierungsenergie 9 – Akzeptoren, Donatoren 414 – – Tabellen 415, 416 irreduzible Darstellung 29 Isotopeneffekt, Supraleiter 318 Isotropie, elastische 101 Josephson-Effekt 356 ff. Josephson-Kontakt 356 Kanal 460 Kennlinie, Diode 153, 435 Kinematische Beugungstheorie (Streutheorie) 52 Koerzitivfeldstärke 219 Kohärenz, BCS-Grundzustand 322 ff. Kohärenzlänge, Cooper-Paar 322 ff. Kollektor 457 Kombinierte Zustandsdichte 385 Kompositionsübergitter 449 Kondensationsenergiedichte (Supraleitung) 305 Kondo-Effekt 256 Koordinationszahl 32 Kopplungskonstante 83 Kopplungspotential des Supraleiters 312
Sachverzeichnis Kovalente Bindung 4 ff. Kramers-Kronig-Relationen 364 Kristallanisotropie 218 ff. Kristallklassen 27 Kristallstrukturen 21 ff. Kritische Magnetfeldstärke 292, 321, 326, 335 Kritische Punkte, Bandstruktur 178, 386 Kritischer Exponent 206 Kritischer Strom, Supraleitung 318 ff. Kubisch flächenzentrierte Struktur 32 – raumzentrierte Struktur 33 Ladungsträgerkonzentration, Halbleiter 408 ff., 416 ff. Landau-Niveaus 283 Laserbedingung 466 Laue-Bedingung 52 Laue-Verfahren 69 Lawinendurchbruch 426 LCAO-Methode 168 LEED (Low Energy Electron Diffraction) 72 Leitfähigkeit (elektrisch), amorphe Materialien 261 – Halbleiter 408, 421 ff. – Metalle 250 Leitfähigkeit (Wärme), Elektronen 260 – Phononen 123 ff. Leitfähigkeitsquantum 269, 277, 481 Leitungsband 403 Lichtquellen 397 Lift-off Verfahren 489 f. Lineare zweiatomige Kette 85 Linearer Ausdehnungskoeffizient 120 Liniendefekte 47 Liquidus Kurve 38 Lithografie 488 Löcher 240, 406 Lokales Feld 375 ff. London-Gleichungen 292 – Eindringtiefe 293 Longitudinale effektive Masse – Wellen, elastische 93 – Wellen, dielektrische 370 Lorenz-Zahl 260 Lücke 2D 306 Lückenenergie (Supraleitung) 304, 314 ff. Lyddane-Sachs-Teller-Relation 372 Madelung-Konstante 11 Magnetische Anisotropie 230 Magnetische Flussquanten 328 – Flussschläuche 336 ff. Magnetische Suszeptibilität, Atome 192
507
– – Antiferromagnet 212 – – freies Elektronengas 194 – – von Supraleitern 336 Magnetisches Dipolmoment 190 Magnetisierung, Definition 190 – Antiferromagnet 210 – Ferromagnet 206 ff., 219 Magnetisierungskurve (Supraleitung) 335 Magnetismus 189 ff. Majoritätsladungsträger 429 Massentensor, effektive Masse 237 Massenwirkungsgesetz, Ladungsträger 411, 417 Matthiesensche Regel 254 MBE (Molecular Beam Epitaxy) 443, 483 Meissner-Ochsenfeld Effekt 291, 293, 322 ff. Meissner-Phase 335 ff. MESFET (Metal Semiconductor Field Effect Transistor) 461 ff. Metall-Halbleiter Kontakt 440 ff. Metallische Bindung 13 Metallorganische Gasphasenepitaxie (MOCVD) 485 Metallorganische Molekularstrahlepitaxie (MOMBE) 487 Mikrobrücke 356 Millersche Indizes 60 Minoritätsladungsträger 430 Mischungsentropie 40 Mischungslücke 38 MOCVD (Metal Organic Chemical Vapor Deposition) 485 Modulationsdotierung 447 Moiré-Topographie 78 Molekularfeldnäherung, Legierungen 40 –, Magnetismus 208 Molekularstrahlepitaxie (MBE) 483 Molekülorbital 5 MOSFET (Metal Oxide Semiconductor Field Effect Transistor) 460 ff. Mott-Relation (Leitfähigkeit amorpher Festkörper) 264 Mott-Übergang 151 Mott-Wannier-Exzitonen 390 Multiphononprozesse 119, 126 Natriumchloridstruktur 9 Néel-Temperatur 211 Neél-Wand 221 Nernst-Kalorimeter 130 Netzebenen 60 Neutralitätsbedingung 417 Neutralitätsniveau 440 Neutronen, Broglie Wellenlänge Neutronenbeugung 74
67
Nichtentartete Halbleiter nipi-Übergitter 454 Normalprozess 126
411
Oberflächenphononen 104 Oberflächenstrukturanalyse 72 ff. Oberflächenwellen, dielektrische 372 Optical confinement 468 Optischer Zweig 87 Orbital 4 ff. Oszillationen, de Haas-van Alphen 285 –, Shubnikov-de Haas 477 Oszillator, harmonischer 111, 367 Paarkorrelationsfunktion 55 Paarwellenfunktion von Cooper-Paaren 324 Paramagnetismus, freie Elektronen 194 Parität 29 Partialversetzung 48 Patterson-Funktion 54 Pauli-Matrizen 214 – Paramagnetismus 194 – Prinzip 136, 195 Peltier-Effekt 259 Periodensystem 1 ff. Periodische Randbedingungen 112, 139 – Strukturen 21 ff. Permalloy 219 Phasen 36 Phasendiagramme 38 Phasenkohärenzlänge 265 Phononen 81 ff., 88, – Austausch 295 – -Elektron Streuung 254 – Spektroskopie 89 – Zerfall 124 Photoemissionsspektroskopie 185 Photolack 488 f. Photolumineszenz 452 Plasmonen 380, 392 p-n Übergang 427 ff. Poisson-Gleichung 432 – -Zahl 102 Polarisation, dielektrische 367, 370 Polarisationskatastrophe 378 Polaritonen 371 Potentialkastenmodell, Metalle 136 Pulvermethode 68 Punktdefekte 46 Punktgruppen 27 Punktgruppensymbole nach Schönflies 28 Punktsymmetrie 25
508 Quanten-Hall-Effekt 477 Quantenoszillationen 270 ff, 277, 477 Quantentöpfe 448 Quantentopf-Laser 469 Quantentransport 264 Quantisierung des magnetischen Flusses 327 ff. Quasielektronen 311 Quasi-Ferminiveau 436 Quasiharmonische Näherung 121 Quasiimpuls 90 –, Erhaltung 90 Quasilöcher 311 Quasiteilchen 311 Raman-aktives Phonon 107 – Spektroskopie 105 f. – Streuung 91 – Streuung an Spinwellen 228 Randkanal (edge channel) 479 Raumladungskapazität 439 Raumladungszone 429 Rayleigh-Streuung 106 Reaktives Ionenätzen (RIE) 489 Reduktion auf 1. Brillouin-Zone 163 Reflexionsvermögen 365, 374 f. Rehybridisierung 7 Rekombination, Elektronen und Löcher 453 –, induzierte 465 –, spontane 465 Rekombinationsstrom 434 Relaxationszeit 125, 247 Remanenz 219 Resonanzfrequenz 367 Resonanz-Raman-Streuung 108 Reststrahlen (Reststrahlbande) 375 Restwiderstand 255 Reziprokes Gitter 56 ff. RHEED (Reflection High Energy Electron Diffraction) 484 Richardson-Dushman-Formel 154 Riesenmagnetowiderstand 232 Ritzsches Verfahren 169 Röntgenbeugung 66 Röntgeninterferometer 77 Röntgentopographie 78 Sättigungsgeschwindigkeit 426 ff. Schalen 2 Schallwellen 93, 98 Schönflies-Symbole 28 Schottky-Barriere 441 ff. Schottky-Kontakt 440 ff. Schottky-Modell der Raumladungszone 427 ff., 434 Schraubenversetzung 47 Schwache Lokalisierung 274 ff. Schwellstromdichte 467
Sachverzeichnis
Seebeck-Effekt 259 Shubnikov-de Haas Oszillationen 477 Shubnikov-Phase 335 Sine-Gordon Gleichung 223 Singulett-Zustand 196 Slater-Determinante 324 Solidus Kurve 38 Source (Quellkontakt) 460 Spannungen, mechanische 96 Sperrrichtung (Sperrstrom) 435 Spezifische Wärme, freies Elektronengas 145 ff. – – , Phononenbeitrag 116 ff. – – von Supraleitern 288 sp2-Hybridisierung 7 ff. sp3-Hybridisierung 7 Spiegelung 25 Spin-Bahnaufspaltung 406 Spin-Bahn Kopplung 218, 230 Spinoperator 197, 208, 213, 401 Spinventil 233 Spinwellen 214 –, magnetostatische 226 ff. Spontane Emission 465 Sprungtemperatur (Supraleitung) 281, 317, 339, 341 SQUID (Superconducting Quantum Interference Device) 359 Steilheit 459, 463 Stereographische Projektion 27 Stimulierte Emission 465 Stokes-Linien 106, 228 Stoner-Kriterium 202 – Lücke 205, 217 – Wohlfarth Modell 200 ff. Störstellen in Halbleitern 412 ff. Störstellenerschöpfung 419 Störstellenreserve 419 Strahlungsarten 66 Streubedingung, Kristalle 58 Streudichte 53 Streukinematik 52 Streuung, Elektron-Elektron 242 – Elektron-Phonon 242, 253, 423 – Elektron-Störstellen 242, 253, 423 – in Bändern 242 Streuvektor 53 Stromverstärkung 459 Strukturanalyse 51 ff., 68 Strukturfaktor – amorphe Materialien 55 – flüssige Phasen 55 – Kristalle 64 ff. Stufenversetzung 47 Subbänder 267, 451 Substitutionslegierung 37 Supraleiter 286 ff. – Elemente 288 – oxidische 338 ff.
– zweiter Art 330 ff. Supraleitung 286 ff. – Kopplungskonstante 317 Suprastrom 287, 318 ff. Symmetrie 28 Symmetriepunkte, Brillouinzone Synchrotronstrahlung 407
53
T 3-Gesetz, spez. Wärme 118 T 3/2-Gesetz, Magnetisierung 218 Thermische Ausdehnung 120 ff. – Eigenschaften des Festkörpers 111 ff. – Energie des Festkörpers 116 Thermoelektrische Effekte 256 ff. Thomas-Fermi-Abschirmlänge 151 Tieftemperaturexperimente 130 Totalreflexion 375, 401 Transistor, bipolarer 456 – Feldeffekt 460 Translationsgitter 22 ff. Tranlationsinvarianz 160 Transportkoeffizienten, allgemeine 258 Transportphänomene 235 ff. Transversale effektive Masse 416 – Wellen, elastische 98 – Wellen, dielektrische 370 Triplett-Zustand 196 Tunnelbarriere 351 – Prozesse 262, 349 – Spektroskopie 354 Tunneln, Cooper-Paare 356 – Einzelelektronen 349 Übergitter 443 ff. Überlapp, Wellenfunktion 5, 171, 196 Überstruktur 72 Übertragungskennlinie 458 UHV-Technik (Ultrahochvakuum) 72, 483 – Anlage 483 Umklappprozesse 127 Universelle Leitfähigkeitsfluktuationen 276 UPS (Ultraviolett Photoemission Spectroscopy) 185 Valenzband 403 Van der Waals-Bindung 15 Van Hove-Singularität 114, 178, 386 Verbotenes Band 167, 172, 176, 404 Versetzungen 47 Vielelektronentheorie 189 Virtuelle Phononen 295 Voigtsche Notation 96 Volumenausdehnungskoeffizient 120
Sachverzeichnis Wärmeleitfähigkeit, Elektronen 260 – Phononen 123 ff. Wärmeschutzfenster 381 Wasserstoffbrückenbindung 14 Wasserstoffmodell 413 Wasserstoffmolekülion 4 Weissenberg-Verfahren 69 Wellenpaket 124, 236 Wiedemann-Franz-Gesetz 260 Wigner-Seitz-Zelle 63 Wurtzitstruktur 35
509
XPS (X-ray Photoemission Spectroscopy) 185 Young Modul
102
Zähligkeit einer Drehachse 25 Zinkblendegitter 35 Zonenreinigung 45 Zustandsdichte (Elektronen), amorphe Materialien 180 – Ferromagnete 205
– freies Elektronengas 138 – lokalisierte Elektronen 262 – Kristalle 170 Zustandsdichte (Phononen) 113 Zweidimensionales Elektronengas 450 Zweiflüssigkeitsmodell des Supraleiters 314 Zyklotronfrequenz 283, 475 Zyklotronresonanz 475