de Gruyter Lehrbuch Walter · Einführung in die Analysis 1
Rolf Walter
Einführung in die Analysis 1
≥
Walter de Gruyter Berlin · New York
Prof. Dr. Rolf Walter Fachbereich Mathematik Institut für Analysis Universität Dortmund Vogelpothsweg 87 44227 Dortmund E-Mail:
[email protected]
" Gedruckt auf säurefreiem Papier, das die US-ANSI-Norm über Haltbarkeit erfüllt. ISBN 978-3-11-019539-2 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. " Copyright 2007 by Walter de Gruyter GmbH & Co. KG, 10785 Berlin. Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Konvertierung von LaTeX-Dateien des Autors: M. Pfizenmaier, Berlin. Einbandgestaltung: Martin Zech, Bremen. Druck und Bindung: Druckhaus »Thomas Müntzer«, Bad Langensalza.
Vorwort Der Start in die Analysis ist für viele Studenten eine besondere Erfahrung. Sie lernen dabei die Kraft der Mathematik kennen, werden aber auch konfrontiert mit den Mühen und Anstrengungen dieses Fachs. Beiden Polen sollte ein Analysisbuch Rechnung tragen: Es soll dem Leser ein guter Leitfaden sein und zugleich sein Interesse für dieses Gebiet fördern. Unter Beachtung dieser Aspekte bietet das vorliegende Buch eine Einführung in die Analysis mit den zentralen Themen der Differential- und Integralrechnung. Der Text beruht auf vielfältigen Vorlesungserfahrungen an den Universitäten Freiburg i.Br. und Dortmund. Das Grundthema der Analysis ist die Frage, wie man Veränderungen in Prozessen mathematisch in den Griff bekommt. Prozesse können sehr umfassend verstanden werden, soweit sie kontinuierlicher Art sind. Die Zahl der Beispiele ist unübersehbar (einfache Fallgesetze in der Physik, komplizierte Vorgänge des Wettergeschehens, wirtschaftliche Entwicklungen, usw.). Die Analysis gibt fundierte Antworten darauf, was eine Veränderung im Kleinen ist (Stichwort: Differentialrechnung), wie globale Umwandlungen zu verstehen sind, oder welche Beziehungen eigentlich zwischen lokalen und globalen Veränderungen bestehen können (Stichwort: Integralrechnung). All diese Fragen spielen in der Entwicklung der exakten Wissenschaften eine herausragende Rolle. Das unterstreicht die Bedeutung der Analysis als einer umfassenden Modellierung für solche Probleme. Die Mathematik ist kein abgeschlossenes Gebiet, und selbst ihre Grundthemen können immer wieder neu gesehen werden. Das hängt auch damit zusammen, dass die Mathematik die Brücke schlagen muss zwischen anschaulichen oder neu aufkommenden Vorstellungen auf der einen Seite und präzisen Beschreibungen auf der anderen. In diesem Buch wird versucht, die Begriffe auf möglichst natürliche Weise einzuführen. Das geschieht traditionell dadurch, dass an die anschauliche Bedeutung angeknüpft wird, z.B. beim Begriff der Ableitung. Es kann aber auch dadurch erfolgen, dass die Begriffe durch möglichst einfache Eigenschaften charakterisiert werden, auf denen alles folgende aufgebaut ist. Diese Methode der Definition durch Eigenschaften wird hier als ein tragendes Prinzip angesehen und nach Möglichkeit realisiert, z.B. bei der Definition der Exponentialfunktion (Abschnitt 2.4) oder bei der Einführung des bestimmten Integrals (Abschnitt 5.1). All das bedingt zu einem gewissen Teil eine neue Sichtweise, die dem Verständnis der Dinge sehr entgegenkommt.
vi Ein Blick auf das Inhaltsverzeichnis lehrt, welche „großen“ Themen behandelt werden. Dazu zählen neben der Differential- und Integralrechnung die verschiedenen Ausformungen des Grenzwertbegriffs, z.B. bei Folgen und Reihen, die Einordnung der Limesprozesse in einen angemessenen allgemeinen Rahmen und nicht zuletzt die Einführung „kanonischer“ klassischer Objekte (Exponentialfunktion, trigonometrische Funktionen, die „mathematischen Naturkonstanten“ e und &, usw.). Das meiste hiervon gehört der Substanz nach zum üblichen und bewährten Standard. Darüber hinaus gibt es Fragestellungen von Interesse, die jedoch (aus Zeitgründen) im Rahmen einer Vorlesung nicht behandelt werden können. Solche „optionalen“ Themen sind durch Sterne markiert und können bei der ersten Lektüre übergangen werden. Sie eignen sich sehr für ergänzende Veranstaltungen, z.B. für Proseminare. Am Ende der meisten Abschnitte befinden sich Übungsaufgaben und zusätzliche Kommentare unter der Überschrift „Aufgaben und Anmerkungen“. Der Schwierigkeitsgrad ist dabei gestaffelt, ausgehend von einfachen Rechenübungen bis hin zu anspruchsvolleren Überlegungen, die dann vielfach mit Lösungshinweisen versehen sind. Die Beschäftigung mit Aufgaben ist ein ganz wesentlicher Teil der Aneignung von Mathematik und dringend zu empfehlen. Der eigentliche Text ist in sich abgeschlossen, d.h. in ihm wird von den Aufgaben und Anmerkungen kein Gebrauch gemacht. Ich hoffe, dass durch diese Gesichtspunkte und die Art und Weise der Darstellung das Interesse des Lesers geweckt wird und er in reichem Maße profitiert von dem Schatz der Erkenntnisse, die in einer langen und anhaltenden Entwicklung der Mathematik gefunden wurden. Die Analysis ist voller Glanzstücke an Ideen, die hier wie in der Parallel-Literatur zum Tragen kommen. Die Kommunikation ist gerade auch in der Mathematik ein wesentliches Element; niemand ist alleine auf der Welt. So wie die Noten in der Musik erst mal leblos wirken und durch das Spielen auferweckt werden, so geht es auch mit mathematischen Inhalten: Texte und Formeln sind die Noten, und man kann sie durch Lesen, Verständnis, Austausch und Anwendung zum Klingen bringen. Der Austausch geschieht oft auch ganz persönlich und im fruchtbaren Wechselspiel. In diesem Sinne sei gedankt: meinen Freunden und Kollegen Prof. Dr. Wolfgang Kühnel und Prof. Dr. Helmut Reckziegel für Kritik und Anregungen; den Herren Privatdozent Dr. Peter Kohlmann und Dr. Ilijas Selimovic für viele gute Diskussionen und fürs Zuhören. Besonders danken möchte ich Herrn Dr. Günter Skoruppa sowohl in mathematischer Hinsicht wie auch für unermüdlichen und kompetenten Einsatz bei der „Elektronik“. Vielen Dank auch dem Verlag de Gruyter, insbesondere Herrn Dr. Robert Plato, für angenehme, kundige und zuverlässige Zusammenarbeit! Dortmund, im April 2007
Rolf Walter
Zum Gebrauch des Buches Teil 1 umfasst die Kapitel 1 bis 9, Teil 2 die Kapitel 10 bis 14. Alle Kapitel sind in Abschnitte mit zweistelligen Unternummern gegliedert. In jedem Abschnitt fängt die Nummerierung von Definitionen, Formeln usw. neu an, wobei Sätze, Definitionen, Beispiele und Bemerkungen gemeinsam mit großen lateinischen Buchstaben durchgezählt sind. Verweise erfolgen im gleichen Abschnitt ohne dessen Nennung, an anderen Stellen unter Anfügung des zitierten Abschnitts in eckigen Klammern; z.B. verweist „Satz E[5.1]“ auf Satz E des Abschnitts 5.1. Bei einem Zusatz werden stets die Voraussetzungen beibehalten. Das Ende eines Beweises wird durch das Symbol „"“ angedeutet, die Zeichen „´“ und „µ“ signalisieren eine Definitionsgleichung, wobei der Doppelpunkt auf der Seite der neu eingeführten Größe steht. Generalvoraussetzungen eines Kapitels oder Abschnitts gelten auch für die zugehörigen Aufgaben und Anmerkungen. Die $-Teile sind nützliche, aber optionale Ergänzungen. Von ihnen wird im „ungesternten“ Haupttext kein Gebrauch gemacht (wohl aber in anderen $-Teilen). Bei den Aufgaben signalisiert der Stern den Bezug zu einem $-Teil oder einen etwas höheren Schwierigkeitsgrad. Von der Sprechweise der Mengenlehre wird zunächst sehr sparsam, später ausführlicher Gebrauch gemacht. Die nötigen mengentheoretischen Begriffe sind in einem Anhang zusammengestellt. Dieser ist zur Zeit in Kurzfassung elektronisch verfügbar unter der Adresse http://www.mathematik.uni-dortmund.de/lsvii/Preprints/mengen.pdf Folgende dort getroffene Konvention sei hier hervorgehoben: Sind A.x/; B.x/ Aussageformen auf der Menge M , so ist die Formel: A.x/ H) B.x/ eine Kurznotation für die Formel: 8 x 2 M W A.x/ H) B.x/. Von dieser Verabredung wird gelegentlich Gebrauch gemacht, um lange formelmäßige Sequenzen etwas abzukürzen. Dabei ist die Menge M meistens aus dem Zusammenhang klar. Im Übrigen sei dem Leser empfohlen, diesen mengentheoretischen Anhang wie eine Grammatik zu benützen, d.h. ohne Hemmungen im Haupttext voranzuschreiten und nur bei Bedarf dort nachzusehen.
viii Die Standardmengen der Mathematik sind folgendermaßen bezeichnet: N Z Q R C
Menge der natürlichen Zahlen (ohne 0) Menge der ganzen Zahlen Menge der rationalen Zahlen Menge der reellen Zahlen Menge der komplexen Zahlen.
Das Anhängen des Indexes 0 bedeutet hier die Hinzunahme der Null; z.B. ist N0 die Menge der natürlichen Zahlen zusammen mit 0. Die Marken „C“ und „&“ bezeichnen entsprechende Vorzeichenbeschränkungen; z.B. ist RC die Menge aller positiven, RC 0 die Menge aller nichtnegativen reellen Zahlen. Die Darstellung der Analysis ist vollständig und in sich abgeschlossen. Aber die Mathematik ist immer offen für neue Probleme, Lösungen und Entwicklungen. Wer weitere Publikationen kennen lernen möchte, sei auf die Literaturliste am Ende hingewiesen. Dort findet sich auch ein ausführliches Stichwortverzeichnis für auftretende Begriffe. Hinweise auf die Literaturliste erfolgen durch Nennung der Autoren zusammen mit dem entsprechenden Erscheinungsjahr in eckigen Klammern (Beispiel: Hilbert[1999]). Das Stichwortverzeichnis ist ein nützliches Hilfsmittel zur Ergänzung der im Text reichlich angegebenen Bezüge; es enthält auch die Lebensdaten der zitierten Wissenschaftler.
Inhaltsverzeichnis Vorwort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Zum Gebrauch des Buches . . . . . . . . . . . . . . . . . . . . . . . . . . .
v vii
1 Die Zahlmengen der Analysis . . . . . . . . . . 1.1 Die reellen Zahlen . . . . . . . . . . . . . . . 1.2 Natürliche Zahlen und vollständige Induktion 1.3 Anwendungen des Induktionsprinzips . . . . 1.4 Zur Vollständigkeit . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
1 1 15 23 37
2
Reelle Zahlenfolgen . . . . . . . . . . . . . . . . . 2.1 Konvergenz . . . . . . . . . . . . . . . . . . . 2.2 Anwendung auf die Wurzelfunktion . . . . . . 2.3 Intervallschachtelungen . . . . . . . . . . . . . 2.4 Anwendung auf die Exponentialfunktion und e 2.5 Anwendung auf den Arkustangens und & . . . 2.6 Teilfolgen und das Kriterium von Cauchy . . . 2.7 $ Limes superior und Limes inferior . . . . . . 2.8 $ Dezimaldarstellung . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
49 49 61 66 68 75 82 88 92
3
Reelle Funktionen und ihre Grenzwerte . . . . . . 3.1 Reelle Funktionen . . . . . . . . . . . . . . . . 3.2 Grenzwerte . . . . . . . . . . . . . . . . . . . 3.3 Stetigkeit . . . . . . . . . . . . . . . . . . . . 3.4 Extrema und Zwischenwertsatz . . . . . . . . . 3.5 Uneigentliche Konvergenz und die Rolle von 1 3.6 Monotonie und Injektivität . . . . . . . . . . . 3.7 Exponentialfunktionen, Logarithmen, Potenzen
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
99 99 116 126 135 141 152 159
4
Differentialrechnung . . . . . . . . . . . . . . . . . . 4.1 Differenzierbarkeit . . . . . . . . . . . . . . . . . 4.2 Ableitungsregeln . . . . . . . . . . . . . . . . . . 4.3 Extrema und Mittelwertsatz . . . . . . . . . . . . . 4.4 Trigonometrische Funktionen und der Einheitskreis 4.5 $ Grenzwerte nach de l’Hospital . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
167 167 173 179 189 212
5
Integralrechnung . . . . . . . . . . . . . . . . . . . . . 5.1 Das bestimmte Integral . . . . . . . . . . . . . . . . 5.2 Der Hauptsatz der Differential-und Integralrechnung 5.3 Produktintegration und Transformationsformel . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
220 220 237 245
x
Inhaltsverzeichnis
5.4 5.5
Das unbestimmte Integral . . . . . . . . . . . . . . . . . . . . . . . . 253 Gliedweise Integration und Differentiation . . . . . . . . . . . . . . . 261
6
Metrische Räume . . . . . . . . . . 6.1 Grundbegriffe für Mengen . . . 6.2 Grundbegriffe für Abbildungen . 6.3 Kompaktheit und Vollständigkeit 6.4 Kartesische Produkte . . . . . . 6.5 Gleichmäßigkeit . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
270 270 286 298 309 318
7
Die komplexen Zahlen . . . . . . . . . . . . . . . . . . 7.1 Der Körper der komplexen Zahlen . . . . . . . . . . 7.2 Komplexe Exponentialfunktion und Polardarstellung 7.3 Konvergenz bei komplexen Zahlen . . . . . . . . . . 7.4 Komplexe Polynome . . . . . . . . . . . . . . . . . 7.5 $ Der Fundamentalsatz der Algebra nach Argand . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
328 328 334 342 358 367
8
Weiterführung der Analysis . . . . . . . . . . . . . . . . . . . . 8.1 Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Funktionenreihen . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Höhere Ableitungen und die Taylor-Entwicklung . . . . . . . 8.4 Extrema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.5 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . 8.6 Konvexe Funktionen . . . . . . . . . . . . . . . . . . . . . . 8.7 $ Stammfunktionen rationaler Funktionen und weiterer Typen . 8.8 $ Spezielle Konvergenzkriterien für Reihen . . . . . . . . . . 8.9 $ Andere Zugänge zu den elementaren Funktionen . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
370 370 388 394 413 416 437 448 461 476
9
Elementare Analysis im Rn . . . 9.1 Abbildungen vom Wegtypus 9.2 Funktionen vom Skalartypus 9.3 $ Holomorphie . . . . . . .
. . . .
. . . .
. . . .
. . . .
485 486 512 524
. . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541 Wichtige Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543 Sachregister . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550
1
Die Zahlmengen der Analysis
1.1 Die reellen Zahlen Die reellen Zahlen sind der Stoff, aus dem die Analysis aufgebaut ist. Anschaulich kann man die reellen Zahlen als eine Verfeinerung der rationalen Zahlen betrachten, also derjenigen Zahlen, die sich als Brüche ganzer Zahlen darstellen lassen. Die reellen Zahlen umfassen die rationalen Zahlen und füllen außerdem die Lücken zwischen diesen aus. So entsteht das, was man als ein Kontinuum bezeichnen kann. Historisch hat es eine ganze Weile gedauert, die reellen Zahlen zu konstruieren und schließlich herauszufinden, welche Strukturen eigentlich für sie maßgeblich sind. Heutzutage ist die strukturelle Klärung abgeschlossen, so dass man nicht unbedingt den mühsamen Prozess der Konstruktion durchlaufen muss, sondern die reellen Zahlen durch geeignete Eigenschaften, also durch Axiome, kennzeichnen kann. Das ist der Weg, den wir hier einschlagen werden. Wir stellen zunächst die Axiome zusammen, die dem bloßen Rechnen mit reellen Zahlen zugrunde liegen. Diese Axiome regulieren also algebraische Eigenschaften. In ihrer Gesamtheit nennt man sie die Körperaxiome. A. Definition (Körperaxiome). Eine Menge K heißt ein Körper, wenn zu je zwei Elementen a; b in K die Summe a C b und das Produkt a ( b D ab als Elemente von K jeweils eindeutig definiert sind und dabei folgende Eigenschaften gelten:
(S.1) a C b D b C a + (S.2)
a C .b C c/ D .a C b/ C c µaCbCc
Kommutativgesetz Assoziativgesetz
(S.3) Es gibt genau ein Element in K, genannt 0, sodass für alle a 2 K gilt: a C 0 D a.
Eindeutige Existenz eines Neutralelements 0 (bzgl. C)
(S.4) Zu jedem a 2 K gibt es genau ein Element in K, genannt &a, sodass gilt: a C .&a/ D 0.
Eindeutige Existenz eines Inversen &a (bzgl. C)
2
Kapitel 1 Die Zahlmengen der Analysis
(P.1) a ( b D b ( a
Kommutativgesetz
(P.2) a ( .b ( c/ D .a ( b/ ( c µ a ( b ( c
Assoziativgesetz
(P.3) Es gibt genau ein Element in K n f0g, genannt 1, sodass für alle a 2 K gilt: a ( 1 D a:
Eindeutige Existenz eines Neutralelements 1 in K n f0g (bzgl. ()
(P.4) Zu jedem a 2 K n f0g gibt es genau ein Element in K n f0g, genannt a&1 , sodass gilt: a ( a&1 D 1.
Eindeutige Existenz eines Inversen a&1 in K n f0g (bzgl. ()
(D) a ( .b C c/ D a ( b C a ( c
Distributivgesetz.
Das Rechnen mit Summen und Produkten nach den Körperaxiomen kennzeichnet die reellen Zahlen noch nicht vollständig. Es gibt viele weitere Zahlbereiche, die ebenfalls diese Axiome befolgen (z.B. die rationalen Zahlen). Es müssen also weitere Eigenschaften hinzukommen, mit denen wir die reellen Zahlen wirklich charakterisieren können. Solche Eigenschaften sind die Gesetze, die den Größenvergleich betreffen, die so genannten Anordnungsaxiome und schließlich das Vollständigkeitsaxiom. Darauf kommen wir bald zurück. Zunächst wollen wir uns mit den Körperaxiomen beschäftigen und das tun, was man in solchen Situationen immer tun muss, nämlich aus den Axiomen möglichst viele Folgerungen ziehen. Schließlich gibt es viele weitere Regeln, die man beim praktischen Rechnen braucht. Das Wort „Körper“ ist historisch bedingt und hat in diesem Zusammenhang keine anschauliche Bedeutung. Alle Eigenschaften, die später verwendet werden, sollten eine logische Konsequenz der Axiome sein. An diesem Grundsatz muss man schon deswegen festhalten, um eine wirklich tragfähiges Fundament zu gewährleisten. Kurz gesagt, nur die Axiome und ihre Folgerungen dürfen in Beweisen verwendet werden. Wir werden deswegen am Anfang auch eine Reihe von Dingen ableiten, die aus sich selber heraus einleuchten. Jedoch werden wir diese Grundlagendinge nicht übertreiben, sondern rasch zu interessanten Fragestellungen vorstoßen, z.B. zur Definition der Eulerschen Zahl e und der Kreiszahl &, den beiden mathematischen Naturkonstanten, die ziemlich direkt aus dieser Grundlegung entspringen werden. Einfache Folgerungen aus den Körperaxiomen Zunächst einige Kommentare zu den Axiomen der Definition A selbst: Die Axiomengruppe (S.1) bis (S.4) bezieht sich auf die Bildung der Summe, die Addition, die Axiomengruppe (P.1) bis (P.4) bezieht sich auf die Bildung des Produkts,
Abschnitt 1.1 Die reellen Zahlen
3
die Multiplikation, während das Axiom (D) die beiden Operationen miteinander verbindet. Wie allgemein üblich, werden die auftretenden Symbole so gesprochen: a C b als a plus b; a ( b als a mal b; 0 als Null; &a als minus a; 1 als Eins; a&1 als a hoch &1. Ist a D 0, so sagt man dafür auch: a verschwindet. In a C b (bzw. a ( b) wird a oder b als Summand (bzw. Faktor) bezeichnet. Soweit mengentheoretische Symbole verwendet werden, kann der Leser den Anhang zur Mengenlehre konsultieren. Das ist allerdings nur in geringem Umfang nötig. Hier z.B. ist K n f0g die Menge K ohne das Element 0. Das Axiom (P.3) besagt also z.B., dass es genau ein von 0 verschiedenes Element in K gibt (genannt 1), sodass die Neutraleigenschaft a ( 1 D a für alle a 2 K gilt. (Dieser Anhang existiert derzeit in einer elektronischen Kurzfassung unter der Adresse: „http://www.mathematik.unidortmund.de/lsvii/Preprints/mengen.pdf“.) In (S.1), (S.2), (P.1), (P.2) wird die Gültigkeit für alle a; b; c 2 K gefordert. Solche Gleichungen, die für alle vorkommenden Objekte gelten, werden oft mit dem Wort Regel oder Gesetz oder Identität bezeichnet. Im Gegensatz hierzu gibt es die so genannten Bestimmungsgleichungen, die eine unbekannte Größe enthalten, wobei dann gefragt ist, ob es tatsächlich Elemente gibt, die anstelle der Unbekannten eingesetzt, die Gleichung erfüllen. Solche Elemente werden Lösungen der Gleichung genannt. Ein Beispiel hierfür ist die Gleichung a C x D 0, wobei a 2 K vorgegeben und x (als Element von K) gesucht ist. Das Axiom (S.4) besagt gerade, dass diese Bestimmungsgleichung in K genau eine Lösung für x besitzt, die dann (zunächst als reine Bezeichnung) &a genannt wird. Analog fordert das Axiom (P.4) die eindeutige Lösbarkeit der Gleichung a(x D 1, sofern a in K gegeben, aber nicht gleich 0 ist. Im Axiom (D) wären strenggenommen a ( b und a ( c einzuklammern; man müsste also eigentlich schreiben: a ( .b C c/ D .a ( b/ C .a ( c/. Solche Klammern regulieren die Reihenfolge, in der die Operationen abzuarbeiten sind. Hier heißt das, dass man bei der rechten Seite zuerst a ( b und a ( c bilden soll und danach die Summe dieser beiden Resultate. Bei dem Ausdruck .a ( b/ C .a ( c/ werden allerdings die Klammern zwar gemeint, aber meistens weggelassen. Man folgt also der Konvention: „Punktrechnung geht vor Strichrechnung“. Wir bringen jetzt einige Musterbeispiele dafür, wie man aus den Axiomen weitere Folgerungen ziehen kann. Der leichteste Einstieg geschieht so, dass man in den allgemeinen Eigenschaften Spezialisierungen vornimmt. Bis auf weiteres sei K ein Körper, und die vorkommenden Buchstaben seien Elemente von K. B. Satz. Es gilt: (i)
0 C 0 D 0.
(ii)
Für alle a 2 K ist a ( 0 D 0.
4
Kapitel 1 Die Zahlmengen der Analysis
(iii) Aus ab D 0 folgt a D 0 oder b D 0. (Diese Eigenschaft wird als Nullteilerfreiheit in K bezeichnet.) Beweis. Zu (i): Man setzt in (S.3) einfach a D 0. Zu (ii): Da in der Behauptung sowohl addiert wie auch multipliziert wird, liegt es nahe, das beide Operationen verbindende Gesetz (D) heranzuziehen: Wir spezialisieren in (D) b D c D 0. Dies ergibt a ( .0 C 0/ D a ( 0 C a ( 0: Dann können wir auf der linken Seite 0 C 0 D 0 einsetzen, was gerade bewiesen wurde, und erhalten a ( 0 D a ( 0 C a ( 0: Mit der Abkürzung d ´ a ( 0 bedeutet dies d D d C d: Addieren wir auf beiden Seiten dieser Gleichung &d , so folgt d C .&d / D .d C d / C .&d /: Dass dies erlaubt ist, folgt aus der eindeutigen Definition der Summe. Mit den Axiomen (S.2) und (S.4) folgt hieraus 0 D d C 0; also mit dem Axiom (S.3)
0 D d:
Gehen wir auf die Bedeutung von d zurück, so ergibt sich die Behauptung 0 D a ( 0: Zu (iii): Wir machen die Fallunterscheidung (u): b ¤ 0 bzw. (g): b D 0. Im Fall (g) ist nichts zu beweisen. Im Fall (u) schließen wir so: Aus ab D 0 folgt durch Multiplikation beider Seiten mit b &1 : abb &1 D 0 ( b &1 . Daraus folgt mit (P.4): a ( 1 D 0, also mit (P.3): a D 0. " C. Definition und Satz. Man definiert: (a) die Differenz b & a ´ b C .&a/; (b) die Zwei 2 ´ 1 C 1 und damit das Doppelte 2a D a C a;
Abschnitt 1.1 Die reellen Zahlen
5
b 1 1 ´ a&1 , ´ b ( , falls a ¤ 0; a a a (d) das Quadrat a2 ´ a ( a.
(c)
die Quotienten
Hierfür gilt: (i)
b & a ist die eindeutig bestimmte Lösung der Gleichung a C x D b. b (ii) Ist a ¤ 0, so ist die eindeutig bestimmte Lösung der Gleichung a ( x D b. a Beweis. Zu (i): Der Beweis zerfällt in die zwei Teile der Existenz und Eindeutigkeit: Existenz: Dass b & a Lösung ist, sieht man anhand der Probe: a C .b & a/ D a C .b C .&a// D a C ..&a/ C b/ D .a C .&a// C b D 0 C b D b: Eindeutigkeit: Dass die Lösung eindeutig ist, ergibt sich aus den Schlüssen: aCx Db
impliziert .a C x/ C .&a/ D b C .&a/ impliziert x D b & a:
Die Schritte in diesen Rechnungen erklären sich selbst. Der Leser sollte sich aber klar machen, was jeweils vom bereits Bekannten verwendet wird. Zu (ii): Der Beweis dieses „multiplikativen Gegenstücks“ verläuft ganz analog, wobei man die Voraussetzung a ¤ 0 benötigt, damit ab bzw. a&1 gebildet werden kann. " Ist a D 0, so ist die Gleichung 0 ( x D b nicht lösbar, wenn b ¤ 0; denn die linke Seite ist ja immer gleich 0. Ist aber auch noch b D 0, so ist die Gleichung 0 ( x D 0 lösbar, jedoch nicht eindeutig; denn jedes x 2 K erfüllt diese Gleichung. Die Bildung von b & a wird Subtraktion genannt. Den Übergang von a zu a2 nennt man Quadrieren. Ein Ausdruck der Form ab (gelesen: „b durch a“) wird auch als Bruch bezeichnet, wobei b der Zähler und a der Nenner ist. Die Bildung von ab wird Division genannt. Der Nenner eines Bruchs muss aus den vorgenannten Gründen immer ¤ 0 sein: „Durch Null darf man nicht dividieren.“ Um Platz zu sparen, wird manchmal ab als b=a geschrieben, jedoch sollte diese Schreibweise die Ausnahme sein. Man nennt 1=a den Kehrwert oder das Reziproke von a. Sind Zähler oder Nenner eines Bruchs zusammengesetzte Ausdrücke, so ist die Division zum Schluss durchzuführen. Kommt ein Bruch in einem Ausdruck vor, so gilt er als eingeklammert. Z.B. ist 3aa . / aCb .a C b/ b b b ´ 3b- : ´ ; aC ´aC ; c c c(d .c ( d / c c d d
6
Kapitel 1 Die Zahlmengen der Analysis
Die obigen Herleitungen mögen als Muster dafür reichen, wie man aus den Axiomen weitere gewohnte Rechenregeln ableiten kann. Details zum algebraische Rechnen werden auch in den Vorlesungen über lineare Algebra behandelt. Es gibt natürlich weitere solche Regeln, die man ähnlich beweisen kann, z.B. die Vorzeichenregeln: &.&a/ D a;
&.a Cb/ D &a &b;
.&a/(b D &.ab/ µ &ab;
.&a/(.&b/ D ab
und die multiplikativen Gegenstücke zu den ersten beiden Regeln für a ¤ 0; b ¤ 0: .a&1 /&1 D a;
.ab/&1 D a&1 b &1 :
Oft gebraucht werden auch folgende Umrechnungen (1) (2)
.a C b/2 D .a C b/.a C b/ D aa C ab C ba C bb D aa C ab C ab C bb D a2 C 2ab C b 2 .a C b/.a & b/ D aa & ab C ba & bb D aa & ab C ab & bb D a2 & b 2 ;
bei denen man mehrfach das Distributivgesetz sowie die Definitionen in C verwendet. Anordnungseigenschaften Wir kommen zur nächsten Gruppe von Eigenschaften. Diese beziehen sich auf den Größenvergleich, der für reelle Zahlen möglich sein wird. D. Definition. Ein Körper K heißt angeordnet durch eine Relation < (kleiner), wenn gilt: (O.1) Für a; b 2 K ist jeweils genau eine der Beziehungen a < b; a D b; b < a richtig (Trichotomie); (O.2)
aus a < b und b < c folgt a < c
(Transitivität);
(O.3)
aus a < b folgt a C c < b C c
(Monotonie der Addition);
(O.4)
aus a < b und 0 < c folgt ac < bc
(Monotonie der Multiplikation).
Von jetzt an sei K in diesem Abschnitt ein angeordneter Körper, und die vorkommenden Buchstaben seien Elemente von K. Auch hier gibt es eine Reihe von Sprechweisen und Symbolen, die im Folgenden gebraucht werden: Gilt a < b, so nennt man a kleiner (als) b. Äquivalent wird dies auch durch b > a symbolisiert, und man sagt dafür: b ist größer (als) a. (Gedächtnisstütze: die Spitze des Zeichens < bzw. > weist zum kleineren, die Öffnung zum größeren der beiden Elemente.) Zwei Relationen der Art a < b und b < c werden zu a < b < c oder zu c > b > a zusammengefasst, und man sagt dafür: b liegt zwischen a und c. Ein a heißt positiv, wenn a > 0 gilt, und negativ, wenn a < 0 gilt.
7
Abschnitt 1.1 Die reellen Zahlen
E. Satz. Es gilt: (i)
aus a < b und c < d folgt a C c < b C d („gleichsinnige Ungleichungen darf man addieren“);
(ii)
aus a < b und c < 0 folgt ac > bc;
(iii) aus a ¤ 0 folgt a2 > 0 (speziell ist 1 D 12 > 0); 1 > 0; a
(iv)
aus a > 0 folgt
(v)
aus a < b und ab > 0 folgt
1 1 < . b a
Wir haben bislang mathematische Schlüsse verbal ausgedrückt, also z.B. in (O.3) gesagt: „aus a < b folgt a C c < b C c“. Das ist eine optimale Art der Darstellung, wie sie in fortgeschrittenen mathematischen Texten gepflegt wird (vgl. z.B. Dieudonné[1976/1987]). Trotzdem ist es manchmal praktischer, das Gleiche mit etwas mehr Symbolik auszudrücken, also z.B. mit Hilfe des Folgerungspfeils zu schreiben: „a < b H) a C c < b C c“. Den folgenden Beweis von Satz E formulieren wir jetzt einmal mit einer solchen abgekürzten Symbolik. Dabei werden die verwendeten Hilfsmittel jeweils mit notiert. Außerdem stellen wir zwei weitere Handwerkszeuge der Beweisführung vor. Zum einen handelt es sich um die Zerlegung in einzelne Teilschritte, die man als Zwischenbehauptungen mit entsprechenden Zwischenbeweisen bezeichnen kann. Zum Zweiten geht es um die Beweisfigur des Widerspruchsbeweises, die hier in einer konkreten Situation demonstriert wird. Beweis von E. Zu (i): In symbolischer Form lautet die Behauptung: a < b; c < d H) a C c < b C d . Ihr Beweis geht so: 9 a < b H) a C c < b C c = (O.2) (O.3) H) a C c < d C b: ; c < d H) c C b < d C b Zu (ii): In symbolischer Form lautet die Behauptung a < b; c < 0 H) ac > bc. Wir beweisen zunächst als Zwischenbehauptung: (3) Zwischenbeweis:
c < 0 () &c > 0
(speziell &1 < 0):
(O.3) Zu H) : c < 0 H) c C .&c/ < 0 C .&c/ H) 0 < &c: (O.3) Zu (H : &c > 0 H) 0 < &c H) c C 0 < c C .&c/ H) c < 0:
8
Kapitel 1 Die Zahlmengen der Analysis
Eigentlicher Beweis: (3) (O.4) a < b; c < 0 H) a < b; &c > 0 H) a ( .&c/ < b ( .&c/ (O.3) H) &ac < &bc H) bc < ac: Beim letzten Schritt addiert man auf beiden Seiten ac C bc. Zu (iii): In symbolischer Form lautet die Behauptung: a ¤ 0 H) a2 > 0. Zu ihrem Beweis machen wir die Fallunterscheidung (p) a > 0; (n) a < 0. Diese Fallunterscheidung ist vollständig; denn nach (O.1) gibt es nur diese beiden Fälle, da ja a ¤ 0 vorausgesetzt ist. Bei (p): a > 0 H) a2 > 0 ( a D 0. (Beim Folgerungspfeil werden beide Seiten mit a multipliziert.) (p) (3) Bei (n): a < 0 H) &a > 0 H) .&a/2 > 0 H) a2 > 0: (O.1) (P.4) Zu (iv): Zunächst gilt: a > 0 H) a ¤ 0 H) a&1 6D 0. Die endgültige Behauptung wird in Form eines Widerspruchsbeweises nachgewiesen. Man nimmt an, die Behauptung sei falsch und leitet hieraus einen Widerspruch ab. Hier geht dies so: Angenommen a&1 < 0, so folgt nach (O.4) a&1 ( a < 0 ( a, also 1 < 0. Dies widerspricht (iii). Somit ist die Annahme nicht haltbar; es muss a&1 > 0 sein. Zu (v): (iv)
a < b; ab > 0 H) a < b;
(O.4) 1 1 1 1 1 > 0 H) a (
Damit sind alle Punkte bearbeitet.
"
Wie hier ist es empfehlenswert, längere Beweise in einzelne Teilbeweise zu zerlegen, um eine bessere Übersicht zu bewahren. Anstelle der hier verwendeten Gliederungselemente „Zwischenbehauptung, Zwischenbeweis“ kann man die eine oder andere Teilbehauptung als einen Hilfssatz (oft Lemma genannt) vorausschicken. So hätte man z.B. die Aussage in (3) zuvor als Lemma herausstellen können. Die Kleinergleich- und Größergleichrelationen Dabei handelt es sich um „oder-Kombinationen“ der Relationen „<“ und „>“ mit der Gleichheit: a . b (gesprochen: a kleiner gleich b) bedeutet: a < b oder a D b; a % b (gesprochen: a größer gleich b) bedeutet: a > b oder a D b. „Aneinander
9
Abschnitt 1.1 Die reellen Zahlen
anschließende“ Relationen können wieder zusammengezogen werden; z.B. bedeutet a < b . c, dass a < b und b . c gilt. Ein a heißt nichtnegativ, wenn a % 0 gilt, und nichtpositiv, wenn a . 0 gilt. Eine Beziehung, die mit den Zeichen <; >; .; % ausgedrückt ist, wird allgemein als Ungleichung oder Abschätzung bezeichnet. F. Satz. (i)
Aus a2 D b 2 folgt a D b oder a D &b.
(ii) Aus a2 D b 2 und a % 0; b % 0 folgt a D b. Beweis. Zu (i): Aus a2 D b 2 folgt a2 & b 2 D 0, also nach (2) .a C b/.a & b/ D 0 und damit wegen der Nullteilerfreiheit a C b D 0 oder a & b D 0, also a D &b oder a D b. Zu (ii): Wird zusätzlich a % 0; b % 0 vorausgesetzt, und wäre a ¤ b, also a & b ¤ 0, so folgte nach (i) a D &b und damit nach (3) a % 0 und a . 0, also a D 0 und b D 0, im Widerspruch zu a ¤ b. Also muss a D b sein. " G. Definition. Der Betrag oder Absolutbetrag eines Elements a 2 K ist definiert als ( a; falls a % 0 jaj ´ &a; falls a < 0. In Verbindung mit E(iii) und (3) sieht man aus dieser Definition, dass stets gilt jaj2 D a2 ;
(4)
&jaj . a . jaj:
H. Satz. Es gelten die Regeln: (i)
jaj D j & aj % 0
(ii)
jaj D 0 () a D 0
(iii) ja ( bj D jaj ( jbj ˇaˇ jaj ˇ ˇ (iv) b ¤ 0 H) ˇ ˇ D b jbj (v)
ja C bj . jaj C jbj
(Dreiecksungleichung).
Beweis. Zu (i), (ii): Auch dies ist klar aus der Definition G und (3). Zu (iii): Man betrachtet erst mal das Quadrat und schließt dann so: jabj2 D .ab/2 D a2 b 2 D jaj2 ( jbj2 D .jaj ( jbj/2 H) jabj D jaj ( jbj:
10
Kapitel 1 Die Zahlmengen der Analysis
Dabei wurde zunächst zweimal (4) verwendet und dann F(ii). ˇaˇ ˇa ˇ ˇ ˇ ˇ ˇ Zu (iv): Nach (iii) gilt ˇ ˇ ( jbj D ˇ ( b ˇ D jaj: Hieraus folgt die Behauptung durch b b Division mit jbj. Zu (v): Im Falle a C b ¤ 0 hat man jaj C jbj jaj jbj a b aCb D C % C D D 1: ja C bj ja C bj ja C bj aCb aCb aCb Dabei wurde zum Abschätzen (iv) und (i) benutzt. Multipliziert man Anfang und Ende der Kette mit ja C bj > 0 durch, so folgt die Behauptung. Im Falle a C b D 0 ist die Behauptung von vorn herein klar nach (i) und (ii). " I. Folgerung. Es gelten die modifizierten Dreiecksungleichungen ˇ ˇ ˇ ˇ ja C bj % ˇjaj & jbjˇ; ja & bj % ˇjaj & jbjˇ: Beweis. Die erste Ungleichung ergibt sich aus jaj D j.a C b/ C .&b/j . ja C bj C j & bj D ja C bj C jbj: Hieraus folgt jaj & jbj . ja C bj. Vertauschung von a und b liefert jbj & jaj . ja C bj, und aus beidem zusammen folgt die Behauptung. Die zweite Ungleichung folgt aus der ersten, indem man b durch &b ersetzt und beachtet, dass jbj D j & bj gilt. " Die obigen Schlüsse machen deutlich, dass man mit Ungleichungen in mancher Hinsicht umgehen kann wie mit Gleichungen. Man kann z.B. auf beiden Seiten das Gleiche addieren oder, als Spezialfall hiervon, einen Term mit geändertem Vorzeichen auf die andere Seite schaffen. Natürlich muss man eine gewisse Vorsicht walten lassen, d.h. die aufgestellten Regeln beachten. Z.B. dreht sich der „Richtungssinn“ einer Ungleichung um, wenn man mit etwas Negativem durchmultipliziert, entsprechend E(ii). Enthält eine Ungleichung eine Unbekannte, so kann man mit diesen Regeln manchmal die Unbekannte auf einer Seite isolieren. Falls die Umformungen in Äquivalenzschritten erfolgen, hat man dann die Lösungsmenge bestimmt, genau wie bei Gleichungen. Mehr von theoretischem Interesse ist die folgende Aussage: J. Satz (Nichtexistenz einer kleinsten positiven Zahl). In einem angeordneten Körper K gibt es kein a > 0 mit: a . b für alle b > 0. Beweis. Angenommen, ein solches a > 0 würde existieren. Dann ist auch a=2 > 0, also a . a=2, also a . 0, Widerspruch. " Wichtige Teilmengen eines angeordneten Körpers sind die Intervalle:
11
Abschnitt 1.1 Die reellen Zahlen
K. Definition. Sei a < b. Dann nennt man:
(5)
Œa; b/ /a; bŒ Œa; bŒ /a; b/
´ ´ ´ ´
fx fx fx fx
2K 2K 2K 2K
ja.x ja<x ja.x ja<x
. bg < bg < bg . bg
ein abgeschlossenes Intervall ein offenes Intervall halboffene Intervalle.
Auch die Mengen (6)
fx 2 K j x % ag;
fx 2 K j x . bg;
fx 2 K j x > ag;
fx 2 K j x < bg
sind Intervalle ebenso wie (7)
fag µ Œa; a/ ;
¿ µ /a; aŒ µ Œa; aŒ µ /a; a/ ;
K:
Als abgeschlossene Intervalle gelten auch die ersten beiden in (6) und alle in (7). Als offene Intervalle gelten auch die letzten beiden in (6) sowie ¿ und K in (7). (¿ ist also zugleich abgeschlossen und offen, ebenso K.) Es wird jeweils a als linker, b als rechter Endpunkt bezeichnet. Statt „Endpunkt“ sagt man auch Randpunkt. Die Verwendung eines der „eckigen Klammersymbole“ soll beinhalten, dass der erste Eintrag kleiner gleich dem zweiten ist. Bei den Typen (5) wird b &a die Länge des Intervalls genannt. (Bei der einelementigen Menge fag in (7) ist a zugleich linker und rechter Endpunkt, und ihre Länge wird als 0 festgesetzt.)
Zur Vollständigkeit Auch die Hinzunahme der Anordnungsregeln reicht noch nicht zur Charakterisierung der reellen Zahlen; denn die rationalen Zahlen bilden ebenfalls einen angeordneten Körper. Es muss noch etwas hinzugefügt werden, was die „Reichhaltigkeit“ oder „Vollständigkeit“ des neuen Zahlbereichs sichert. Nach wie vor sei K ein angeordneter Körper. L. Definition. Eine Teilmenge M , K heißt nach oben beschränkt, wenn es ein s 2 K gibt, sodass für alle x 2 M gilt x . s. Ein solches s heißt dann eine obere Schranke von M . Ist s obere Schranke von M und s1 > s (z.B. s1 ´ s C1), so ist auch s1 obere Schranke von M . Eine obere Schranke ist also, falls existent, niemals eindeutig bestimmt.
12
Kapitel 1 Die Zahlmengen der Analysis
M. Beispiele. (i) Jedes Intervall der Typen Œa; b/ ; /a; bŒ ; Œa; bŒ ; /a; b/ ist nach oben beschränkt; eine obere Schranke ist b, aber z.B. auch b C 1. (ii) K selbst ist nicht nach oben beschränkt: Angenommen, es wäre x . s für alle x 2 K. Dann wäre auch s C 1 . s, also 1 . 0, Widerspruch! (iii) Die leere Teilmenge ¿ von K gilt als nach oben beschränkt; denn sie erfüllt formal die Definition L mit beliebigem s 2 K (d.h. jedes Element von K ist eine obere Schranke für ¿). N. Definition. Sei M , K nach oben beschränkt. Eine obere Schranke s0 von M heißt kleinste obere Schranke oder Supremum von M , wenn für jede obere Schranke s von M gilt: s0 . s. Man schreibt dann s0 µ sup M . O. Bemerkung. Ein solches Supremum braucht nicht zu existieren (vgl. C[2.3] und p die Ausführungen zu 2 am Ende von 2.2), aber wenn es existiert, ist es eindeutig bestimmt: Ist neben s0 sei auch s00 Supremum von M , so gilt: s0 . s00 (da s00 obere Schranke), aber auch s00 . s0 (da s0 obere Schranke). Es folgt s0 D s00 . P. Beispiele. (i) Hat M eine obere Schranke s, die in M enthalten ist, so ist s zugleich das Supremum von M : Ist nämlich s1 irgendeine obere Schranke von M , so gilt x . s1 für alle x 2 M , also speziell für x ´ s: s . s1 . Somit ist s die kleinste obere Schranke von M . (ii)
Für die folgenden Intervalltypen ergibt sich damit sofort sup Œa; b/ D b;
sup /a; b/ D b;
wobei im zweiten Fall a < b sein soll (damit das Intervall nicht leer ist). (iii) Bei einem offenen Intervall gilt sup /a; bŒ D b; falls a < b: Das ist nicht ganz so einfach zu sehen. Man argumentiert so: Jedenfalls ist b eine obere Schranke von M ´ /a; bŒ. Um weiter zu kommen, benutzen wir die folgende allgemeine Aussage: (8)
a < b () a <
aCb < b: 2
13
Abschnitt 1.1 Die reellen Zahlen
Diese ist richtig; denn es gelten die Schlüsse a<
aCb < b () 2a < a C b < 2b () a < b; a < b: 2
Insbesondere ist aCb 2 /a; bŒ : 2
(9)
Ist nun s irgendeine obere Schranke von M , so ist zu zeigen: s % b. Angenommen, es wäre s < b, so folgte mit (8) und (9) a< Somit wäre s <
sCb aCb .s< < b: 2 2
sCb 2 M , also s nicht obere Schranke von M , Widerspruch! 2
Dieses letzte Beispiel zeigt, dass sup M im Falle der Existenz nicht Element von M zu sein braucht. Q. Definition. Ein angeordneter Körper heißt vollständig, wenn jede nichtleere nach oben beschränkte Teilmenge M , K ein Supremum sup M in K besitzt. Hauptaxiom. Die reellen Zahlen bilden einen angeordneten vollständigen Körper, genannt R. In dieser Formulierung sind alle nötigen Eigenschaften der reellen Zahlen enthalten. Andere Strukturelemente sind nicht erforderlich, sodass wir auf dieser Grundlage rasch zu wesentlichen Erkenntnissen der Analysis gelangen können. Offen bleiben im Augenblick die Fragen der Existenz und Eindeutigkeit: (a) Existenzfrage: Gibt es überhaupt einen angeordneten vollständigen Körper? (b) Eindeutigkeitsfrage: Gibt es angeordnete vollständige Körper, die (strukturell) verschieden sind? Die Antwort bei (a) ist im Prinzip „ja“: Tatsächlich kann man die Existenz auf sehr viel einfachere Strukturen der Logik und Mengenlehre zurückführen. Nur, anfangen bzgl. der Existenz muss man irgendwo; ganz aus dem Nichts lässt es sich nicht machen. Der klassische Weg ist die Konstruktion der reellen Zahlen aus den natürlichen Zahlen. Die Antwort bei (b) ist „nein“: Je zwei angeordnete vollständige Körper sind zueinander
14
Kapitel 1 Die Zahlmengen der Analysis
„isomorph“. Vorläufig ausgedrückt: sie unterscheiden sich nur in der Bezeichnung ihrer Elemente. In diesem Sinne herrscht also Eindeutigkeit. Die Erörterung dieser Grundlagenfragen erfordert eine gewisse mathematische Reife und ein großes Durchhaltevermögen, das dem Anfänger nicht abverlangt werden sollte. Wir verschieben deshalb diese Diskussion in Analysis 2, wo sie sich in einem allgemeineren Rahmen leichter durchführen lässt. Vgl. auch Ebbinghaus et al.[1992]. Für den Aufbau der Analysis ist jedenfalls mit dem obigen Hauptaxiom ein präzises und praktikables Fundament geschaffen, auf dem wir nun zügig aufbauen können. Im weiteren Verlauf, insbesondere auch in der mehrdimensionalen Analysis, wird in erstaunlicher Weise klar werden, was für ein reicher Inhalt in den wenigen Axiomen steckt. Aufgaben und Anmerkungen 1. Man beweise die Vorzeichenregeln aus den Körperaxiomen. Lösungshinweis: Um z.B. die Regel .&a/b D &.ab/ abzuleiten, geht man so vor: Laut Axiom (S.4) ist &.ab/ die eindeutig bestimmte Lösung der Gleichung ab C x D 0. Es genügt also zu zeigen, dass auch .&a/b diese Gleichung löst. Dies bestätigt man direkt: ab C .&a/b D .a C .&a//b D 0 ( b D 0: 2. Auch die Regeln der Bruchrechnung folgen aus den Körperaxiomen, wobei die Nenner immer ¤ 0 vorausgesetzt sind: a c D () ad D bc. b d ac a D (gelesen von links nach rechts, nennt man dies Erweitern mit c, gelesen b) b bc von rechts nach links, nennt man dies Kürzen mit c). ac a c c) ( D . b d bd . / c aCc a a a a C D aber i. Allg. C ¤ . d) b b b b c bCc a)
e) f)
a c ad C cb C D . b d bd a b D ad . c bc d
Man beweise diese Regeln. 3. Sei K ein angeordneter Körper. Für a; b; c 2 K beweise man die Regeln:
Abschnitt 1.2 Natürliche Zahlen und vollständige Induktion
15
a) Aus a . b und b . c folgt a . c. b) Aus a . b folgt a C c . b C c. c) Aus a . b und c % 0 folgt ac . bc. d) Aus a C b D 0 und a % 0; b % 0 folgt a D b D 0. aCb e) Ist a ¤ b, so liegt das arithmetische Mittel stets zwischen a und b. 2 4. Die Unsymmetrie in den Körperaxiomen A bzgl. Addition und Multiplikation kann nicht beseitigt werden: Würde man in (P.3) und (P.4) K nf0g durch K ersetzen, so gäbe es ein multiplikatives Inverses 0&1 von 0, also mit 0 ( 0&1 D 1. Da die Regel in B(ii) allein aus den Gesetzen (S.1) bis (S.4) und (D) folgt, wäre dann 0 D 1 und damit a D a ( 1 D a ( 0 D 0 für alle a 2 K. Eine solche Struktur enthielte also nur ein einziges Element 0 und wäre damit ohne Interesse. 5. In den Körperaxiomen „verschränken“ sich zwei Gruppenstrukturen (für Plus und Mal). Es sei daran erinnert, dass eine Gruppe aus einer Menge G und einer Abbildung .a; b/ 7! a > b von G )G in G besteht derart, dass das Assoziativgesetz .a > b/ > c D a > .b > c/ gilt und es genau ein Neutralelement e 2 G gibt sowie zu jedem a 2 G genau ein Inverses a$ (mit den jeweiligen Eigenschaften a > e D e > a D a und a > a$ D a$ > a D e). Die Gruppe .G; >/ heißt kommutativ oder Abelsch, wenn außerdem die Regel a > b D b > a erfüllt ist. Man drücke die Axiome für einen Körper K durch Gruppeneigenschaften von .K; C/ und .K n f0g; (/ und die Distributivgesetze aus.
1.2 Natürliche Zahlen und vollständige Induktion Hier soll gezeigt werden, wie man im Körper der reellen Zahlen besonders einfache Zahltypen aussondern kann. Vor allem geht es dabei um die natürlichen Zahlen, die historisch gesehen, am Anfang allen Rechnens standen. Ganz leicht kann man dann die nahen Verwandten der natürlichen Zahlen einführen: die ganzen und die rationalen Zahlen. Die natürlichen Zahlen lassen sich innerhalb unseres angeordneten vollständigen Körpers R durch das so genannte Induktionsprinzip kennzeichnen. Das wollen wir genau beschreiben. Was aber die vielen einfachen Eigenschaften der natürlichen Zahlen angeht, so ist deren Herleitung aus dem Induktionsprinzip zwar möglich, aber insgesamt doch recht mühselig. Wir machen deshalb ausnahmsweise einige Abstriche von der strengen Deduktion, die uns zu sehr von der Analysis wegführen würde. So begnügen wir uns in einigen Fällen mit einer präzisen Formulierung des Ergebnisses. Schließlich wollen wir uns mehr um die typisch analytischen Aspekte kümmern, die nicht so offen zu Tage liegen.
16
Kapitel 1 Die Zahlmengen der Analysis
A. Definition. Eine Teilmenge M , R heißt induktiv, wenn gilt: (Ind.1) 1 2 M . (Ind.2) Ist x 2 M , so ist auch x C 1 2 M . B. Beispiele. (i)
R selbst ist induktiv.
(ii) Die Menge fx 2 R j x % 1g ist induktiv. Offenbar sind wir auf dem richtigen Weg, wenn wir die „kleinste“ induktive Menge finden können. Das machen wir mit der Durchschnittsbildung induktiver Mengen und stellen zunächst fest: C. Satz. Der Durchschnitt einer beliebigen Familie F induktiver Teilmengen von R ist induktiv. T Beweis. Sei D ´ M ein solcher Durchschnitt. Zu zeigen ist, dass D die M 2F Eigenschaften (Ind.1), (Ind.2) erfüllt, wenn jede zur Familie F gehörende Menge dies tut. Das ist aber leicht einzusehen: Zu (Ind.1): Da die 1 in jeder Menge M 2 F enthalten ist, so ist sie auch in D enthalten. Zu (Ind.2): Ist x 2 D, so ist x 2 M für alle M 2 F , also x C 1 2 M für alle M 2 F , also x C 1 2 D. " D. Definition. Die Menge N der natürlichen Zahlen ist definiert als der Durchschnitt aller induktiven Teilmengen von R: N´
\
fM , R j M ist induktivg:
E. Bemerkungen. (i)
Da die 1 in jeder induktiven Menge liegt, ist 1 2 N. Weiter gilt N , fx 2 R j x % 1g. Ist also n 2 N gegeben, so folgt daraus n % 1. Mit anderen Worten: 1 ist die kleinste natürliche Zahl.
(ii) Es gibt keine größte natürliche Zahl. Wäre n0 eine solche, so gälte n0 C 1 . n0 , Widerspruch!
Abschnitt 1.2 Natürliche Zahlen und vollständige Induktion
17
Da N die „kleinste“ induktive Teilmenge von R ist, versteht sich die folgende Aussage fast von selbst. Wir formulieren sie trotzdem explizit, da sie die Grundlage für das Beweisverfahren der so genannten vollständigen Induktion darstellt: F. Satz (Induktionssatz). Gegeben sei eine Menge W natürlicher Zahlen, d.h. es sei W , N. Besitzt W die Eigenschaften: (i)
12W,
(ii) aus w 2 W folgt w C 1 2 W , so gilt W D N. Hierin nennt man die Eigenschaft (i) den Induktionsanfang oder die Induktionsverankerung und die Eigenschaft (ii) den Induktionsschluss. Die Voraussetzung w 2 W in (ii) heißt die Induktionsvoraussetzung. Beweis von F. Nach (i) und (ii) ist die Menge W induktiv, also N , W . Da nach Voraussetzung W , N gilt, folgt W D N. " Der Induktionssatz ist die Grundlage für die Beweismethode der vollständigen Induktion. Diese dient dazu, Aussagen zu beweisen, die von einer natürlichen Zahl abhängen. G. Folgerung (Methode der vollständigen Induktion). Zu jeder natürlichen Zahl n 2 N sei eine Aussage A.n/ vorgelegt, die in Abhängigkeit von n zunächst wahr oder falsch sein kann. Sie ist für alle n 2 N richtig, wenn die folgenden zwei Forderungen erfüllt sind: (a)
Induktionsanfang: A.1/ ist richtig.
(b)
Induktionsschluss: Für jedes n 2 N gilt: Aus A.n/ folgt A.n C 1/.
In (b) wird A.n/ wiederum als Induktionsvoraussetzung bezeichnet. Allgemein sagt man statt „Induktionsschluss“ auch Induktionsschritt. Beweis von G. Man betrachtet die Erfüllungsmenge W ´ fn 2 N j A.n/ ist richtigg. Diese ist wegen (a), (b) induktiv, also folgt W D N nach Satz F. Somit ist A.n/ für alle n 2 N richtig. " Für das Umgehen mit natürlichen Zahlen ist es enorm wichtig, dass man der begrifflichen Definition D eine konstruktive Erzeugung von N gegenüberstellen kann. Dazu beachten wir, dass zu jedem n 2 N der Nachfolger n C 1, der wiederum in N liegt, gebildet werden kann. Tut man dies, startend mit der 1, immer wieder, so erhält man
18
Kapitel 1 Die Zahlmengen der Analysis
schrittweise neue Elemente von N, die nichts anderes sind, als das was man üblicherweise mit 2; 3; 4; : : : bezeichnet: 1 1C1µ2 .1 C 1/ C 1 µ 1 C 1 C 1 µ 3 .1 C 1 C 1/ C 1 µ 1 C 1 C 1 C 1 µ 4 :: : Die Menge der so erzeugten natürlichen Zahlen ist offensichtlich induktiv, also gleich N: (1) und es gilt
N D f1; 1 C 1; 1 C 1 C 1; 1 C 1 C 1 C 1 : : :g D f1; 2; 3; 4 : : :g; 1 < 2 < 3 < 4 < ((( ;
insbesondere sind diese Elemente paarweise verschieden. Wie man diesen Einsersummen n D 1 C 1 C ( ( ( C 1 die üblichen Namen, z.B. im Dezimalsystem, geben kann, setzen wir im Augenblick als bekannt voraus (vgl. jedoch F[2.8]). Außerdem akzeptieren wir, dass zur Darstellung eines n 2 N in Gestalt einer solchen Einsersumme eine ganz bestimmte Anzahl von Einsen zu verwenden ist, nämlich n. Das ist letzten Endes eine Definition des Anzahlbegriffs. Entsprechend kann der Anzahlbegriff für „endliche“ Mengen gefasst werden. Dazu bilden wir für jedes p 2 N die folgende Teilmenge von N, die aus einem Anfangsstück der Liste in (1) besteht: N.p/ ´ f1; 2; : : : ; pg: Eine solche Menge wird als Abschnitt in N bezeichnet. H. Definition. Eine nichtleere Menge X heißt endlich, wenn es ein p 2 N und eine bijektive Abbildung h W N.p/ ! X gibt. Die natürliche Zahl p heißt die Anzahl von X , geschrieben: jM j ´ p. Auch die leere Menge ¿ gilt als endlich mit der Anzahl j¿j ´ 0. Ist jM j D p, so sagt man dafür auch, M sei eine Menge mit p Elementen. Eine Menge heißt unendlich, wenn sie nicht endlich ist. Ist X eine endliche Menge ¤ ¿, so wird eine bijektive Abbildung h W N.p/ ! X eine Durchnummerierung von X genannt. Zur Rechtfertigung der obigen Begriffe ist Folgendes zu sagen: Zunächst einmal sind Summen von mehr als zwei Körperelementen erst dann definiert, wenn eine bestimmte Beklammerung, die jeweils nur zwei Elemente erfasst, vorgegeben ist. Allerdings
Abschnitt 1.2 Natürliche Zahlen und vollständige Induktion
19
kann man (wiederum mit dem Induktionsprinzip) nachweisen, dass der Wert bei gleichen Summanden unabhängig von der Art und Weise der Beklammerung ist. Bei den Einsersummen gilt z.B. nicht nur wie oben .1C1C1/C1 D ..1C1/C1/C1, sondern auch ..1C1/C1/C1 D .1C1/C.1C1/ oder ..1C1/C1/C1 D .1C.1C.1C1///, usw. Diese Unabhängigkeit hat zur Folge, dass man auf die Angabe einer Beklammerung überhaupt verzichten kann. (Analoges ist für mehrfache Produkte richtig.) Im Hinblick auf die Anzahldefinition in H verbleibt der Nachweis, dass die Zahl p eindeutig bestimmt ist. Es könnte ja zunächst passieren, dass zwei Bijektionen h W N.p/ ! X und g W N.q/ ! X mit p ¤ q existieren. Dann gäbe es auch eine Bijektion von N.p/ auf N.q/, nämlich g &1 ı h. Das ist aber in der Tat unmöglich (außer für p D q). Tatsächlich ist Folgendes anschaulich klar und auch streng deduktiv beweisbar: I. Satz. Ist p < q, so gibt es keine surjektive Abbildung von N.p/ auf N.q/ und auch keine injektive Abbildung von N.q/ in N.p/. " Aufgrund von Definition H überträgt sich dies sofort auf endliche Mengen. D.h. Satz I bleibt genauso gültig, wenn N.p/ durch eine beliebige Menge X mit p Elementen und N.q/ durch eine beliebige Menge Y mit q Elementen ersetzt wird. Insbesondere gibt es unter der Voraussetzung p < q keine injektive Abbildung von Y in X, d.h. bei jeder Abbildung f W Y ! X existieren j ¤ k in Y mit f .j / D f .k/. Anschaulich ausgedrückt: Legt man q Gegenstände in weniger als q Schubfächer, so liegen in wenigstens einem Schubfach mindestens zwei Gegenstände. Das ist das so genannte Schubfachprinzip. Auch der folgende Satz leuchtet anschaulich ein, soll aber ebenfalls nicht formal bewiesen werden. J. Satz. Ist die Menge X endlich und A , X, so ist auch A endlich und jAj . jXj. Hierbei gilt jAj D jXj genau dann, wenn A D X. " Eine weitere Konsequenz des Induktionsprinzips ist der folgende Satz, den wir formal beweisen werden: K. Satz (Wohlordnungssatz in N). In jeder nichtleeren Teilmenge M von N existiert ein kleinstes Element. Beweis. In Bemerkung E(i) haben wir schon gesehen, dass 1 die kleinste natürliche Zahl ist. Enthält also M die 1, so ist sie auch das kleinste Element von M . Gilt 1 … M , so sei eine Hilfsmenge H definiert durch H ´ fp 2 N j N.p/ \ M D ¿g. Dann ist 1 2 H . Wäre nun stets der Schluss richtig, dass aus p 2 H folgt p C 1 2 H , so folgte nach dem Induktionssatz F: H D N, also M D ¿ im Widerspruch zur Voraussetzung. Folglich gibt es ein p 2 H mit p C 1 … H , also p C 1 2 M . Beides zusammen besagt, dass p C 1 kleinstes Element von M ist. "
20
Kapitel 1 Die Zahlmengen der Analysis
Weiter bietet das Induktionsprinzip die Möglichkeit zur rekursiven Definition von Objekten, die von einer natürlichen Zahl abhängen. Das beruht auf Folgendem: L. Satz (Rekursionssatz). Gegeben sei eine Menge X und ein Element a 2 X. Ferner sei zu jeder natürlichen Zahl n 2 N eine Abbildung gn W X ! X vorgegeben. Dann existiert genau eine Abbildung f W N ! X mit ( f .1/ D a (2) f .n C 1/ D gn .f .n// für alle n 2 N: Diese Formeln werden als ein Rekursionsschema bezeichnet, wobei die erste Startbedingung und die zweite Rekursionsschritt genannt wird. Statt von „Rekursion“ " spricht man auch von Iteration. Trotz der etwas komplizierten Formulierung ist das wieder anschaulich klar: Schaut man sich die ersten Fälle der zweiten Forderung in (2) an: f .2/ D g1 .f .1//;
f .3/ D g2 .f .2//; : : : ;
so sieht man, dass sukzessive aus f .1/ D a unter Verwendung von g1 der Wert f .2/ zu berechnen ist, dann aus f .2/ unter Verwendung von g2 der Wert f .3/, usw. Insgesamt gilt für allgemeines n 2 N f .n C 1/ D gn .f .n// D gn .gn&1 .f .n & 1/// D ( ( ( D gn .( ( ( .g2 .g1 .a/// ( ( ( /; was letzten Endes auf eine explizite (allerdings stets sich ausdehnende) Vorschrift zur Berechnung von f .n C 1/ aus a hinausläuft. Den formalen Beweis auf der Basis des Induktionsprinzips wollen wir auch in diesem Fall übergehen. Meistens sind alle Abbildungen gn gleich einer einzigen Abbildung g W X ! X. Das Rekursionsschema vereinfacht sich dann zu ( f .1/ D a (3) f .n C 1/ D g.f .n// für alle n 2 N: Hierbei berechnen sich die Werte von f durch eine immer gleiche Vorschrift aus den jeweils vorhergehenden. Den anschaulichen Gehalt kann man auch so ausdrücken: Der Rekursionsschritt sagt, wie es weiter geht, das Rekursionsprinzip garantiert, dass es weitergeht. Schließlich benennen wir einige elementare Tatsachen über natürlichen Zahlen, die aus dem Bisherigen oder aus dem Induktionsprinzip gefolgert werden können.
Abschnitt 1.2 Natürliche Zahlen und vollständige Induktion
21
M. Satz. (i)
m; n 2 N H) m C n; m ( n 2 N.
(ii) m; n 2 N; m > n H) m & n 2 N.
"
Diese Regeln bedeuten die Abgeschlossenheit von N gegenüber der Addition und Multiplikation und (unter der genannten Voraussetzung) auch gegenüber der Subtraktion. Der Unterschied zu den bisherigen Fällen besteht darin, dass die Aussagen von zwei natürlichen Zahlen abhängen. Will man solche Aussagen mittels des Induktionsprinzips beweisen, so hält man eine der Zahlen fest und wendet die vollständige Induktion bezüglich der anderen an. Aus den natürlichen Zahlen, die ja spezielle Elemente von R sind, kann man nun leicht durch Anwendung der Körperoperationen neue Zahltypen gewinnen: N. Definition. Es sei (i)
N0 ´ N [ f0g.
(ii)
Z ´ fx 2 R j x 2 N0 oder &x 2 N0 g, die Menge der ganzen Zahlen. n ˇ mo , die Menge der rationalen (iii) Q ´ x 2 R ˇ es gibt m 2 Z; n 2 N mit x D n Zahlen. (iv)
R n Q die Menge der irrationalen Zahlen.
Eine ganze Zahl ist also entweder eine natürliche Zahl oder die 0 oder das Negative einer natürlichen Zahl. Eine rationale Zahl ist eine ganze Zahl oder ein Quotient einer ganzen Zahl und einer natürlichen Zahl. In aufzählender Schreibweise hat man N D f1; 2; : : :g N0 D f0; 1; 2; : : :g Z D f0; 1; &1; 2; &2; : : :g D f: : : ; &2; &1; 0; 1; 2; : : :g; wobei die letzte Notation nicht ganz dem vorgeschriebenen Muster entspricht (dafür aber sehr anschaulich ist). Wir werden bald sehen, dass man auch die rationalen Zahlen „aufzählen“ kann. Ergänzend zum Symbol N.p/ seien allgemeiner für p; q 2 Z die folgenden Bezeichnungen eingeführt: Z.p; q/ ´ fm 2 Z j p . m . qg (4)
Z.p; 1/ ´ fm 2 Z j p . mg Z.&1; q/ ´ fm 2 Z j m . qg:
22
Kapitel 1 Die Zahlmengen der Analysis
Speziell ist N.p/ D Z.1; p/, falls p 2 N. Im Fall p . q ist Z.p; q/ die endliche Menge der ganzen Zahlen von p bis q (einschließlich) mit der Anzahl jZ.p; q/j D q & p C 1. Im Fall p > q ist Z.p; q/ leer. Das Zeichen „1“ (gesprochen: unendlich) hat hier keine tiefere Bedeutung. Es dient lediglich zur Abkürzung der Schreibweise, die allerdings recht suggestiv ist. Im Augenblick ist es noch offen, ob der Körper R Zahlen enthält, die nicht als Quotient ganzer Zahlen darstellbar sind. Die Existenz solcher irrationaler Zahlen hängt stark an der Vollständigkeit von R. Tatsächlich gibt es sogar „sehr viel mehr“ irrationale reelle Zahlen als rationale. Q ist nämlich „abzählbar“, und R selbst ist „überabzählbar“. Darauf kommen wir in J[1.4] und C[2.3] zurück. Konkrete irrationale Zahlen sind p ebenfalls leicht mittels der Vollständigkeit zu konstruieren, z.B. 2, wie wir am Ende des Abschnitts 2.2 sehen werden. Die Eigenschaften in Satz M übertragen sich von N auf Z, wobei man im dritten Teil auf die Voraussetzung m > n verzichten kann. O. Satz. Die Menge Q der rationalen Zahlen ist ein angeordneter Körper. Beweis. Q besteht aus allen Brüchen m=n ganzer Zahlen mit n ¤ 0. Summe und Produkt zweier solcher ist wieder von dieser Form, wie man mit den Regeln der Bruchrechnung sieht. Die Körperaxiome aus A[1.1] sind damit für K D Q leicht nachprüfbar, ebenso die Anordnungsaxiome aus D[1.1]. " Für die Standardmengen R, Q, Z, N seien noch folgende Schreibweisen eingeführt: Die oberen Marken „C“ bzw. „&“ bezeichnen entsprechende Einschränkungen aufs Positive bzw. Negative, die untere Marke „0“ die Hinzunahme der Null, also z.B. RC ´ fx 2 R j x > 0g;
RC 0 ´ fx 2 R j x % 0g;
Z& 0 ´ fn 2 Z j n . 0g; etc:
Zum Abschluss sei noch angemerkt, dass das Wort „vollständige Induktion“ nichts zu tun hat mit der „Vollständigkeit“ der reellen Zahlen, wie in Q[1.1] definiert. Die Namengebung ist historisch bedingt. Aufgaben und Anmerkungen 1. Man bestimme alle x 2 R, für die gilt: a)
x2 & x < 6
b) jx & 2j C jx C 1j < 4. Hinweis: Bestimmen heißt hier: Man stelle die betreffende Punktmenge als Vereinigung von möglichst wenigen Intervallen dar.
Abschnitt 1.3 Anwendungen des Induktionsprinzips
23
Lösungshinweis: Bei a) kann man quadratisch ergänzen, d.h. einen Ausdruck umformen gemäß 3 p p p2 p2 p -2 p2 x 2 Cpx Cq D x 2 C2( x Cq D x 2 C2( x C & Cq D x C Cq & : 2 2 4 4 2 4
1.3 Anwendungen des Induktionsprinzips Nach den grundsätzlichen Überlegungen zur Induktion wollen wir nun eine Reihe von konkreten Anwendungen besprechen. Es besteht also reichlich Gelegenheit, dieses Prinzip in der Beweispraxis kennen zu lernen. Die einzelnen Themen werden in Form von Beispielen oder Sätzen formuliert. Selbstverständlich gibt es auch Aussagen über natürliche Zahlen, die ohne vollständige Induktion beweisbar sind. Ein simples Beispiel ist die Gleichung .n C 1/.n & 1/ D n2 &1 für n 2 N. Ihre Richtigkeit ist von vornherein klar, da diese Umformung für alle reellen Zahlen gültig ist; vgl. (2)[1.1]. Bei einigen (weniger trivialen) Gelegenheiten gehen wir auf solche Alternativen ein. Ganz allgemein können für ein und dieselbe Tatsache durchaus verschiedene gültige Beweise existieren. Insofern ist in der Mathematik keineswegs „alles eindeutig“. A. Beispiele. (i) Fakultät: Für n 2 N ist die Fakultät in expliziter Weise definiert als Produkt aller natürlichen Zahlen von 1 bis n. nŠ ´ 1 ( 2 ( ( ( n: Die induktive Definition lautet (1)
1Š ´ 1;
.n C 1/Š ´ nŠ ( .n C 1/:
Üblicherweise definiert man zusätzlich 0Š ´ 1: Man spricht nŠ als n-Fakultät. (ii) Potenzen: Für n 2 N und a 2 R ist die n-te Potenz von a explizit definiert als n-faches Produkt von a mit sich selbst; an ´ a ( ( ( a
(n Faktoren):
24
Kapitel 1 Die Zahlmengen der Analysis
Die induktive Definition lautet a1 ´ a;
(2)
anC1 ´ an ( a:
An die Stelle der natürlichen Zahl n kann auch eine ganze Zahl treten, indem man festsetzt: a0 ´ 1;
00 ´ 1;
a&n ´ .a&1 /n D .an /&1
für n 2 N und a ¤ 0:
Man spricht am als: a hoch m und nennt den Ausdruck am eine Potenz mit der Basis a und dem Exponenten m. (iii) Summen- und Produktzeichen: Für n 2 N und a1 ; a2 ; : : : ; an 2 R sind explizit definiert: (3)
n X
n Y
aj ´ a1 C a2 C ( ( ( C an ;
aj ´ a1 ( a2 ( ( ( an :
j D1
j D1
Die Symbole mit den großen griechischen Buchstaben werden gesprochen als: „Summe (bzw. Produkt) aj von 1 bis n“ (wobei aj einfach als „aj “ gesprochen wird). Die induktive Definition lautet z.B. im Fall der Summe: 1 X
aj ´ a1 ;
nC1 X
aj ´
.X n
j D1
j D1
/ aj
C anC1 :
j D1
Als Rechenanweisung kann man (3) so aussprechen (im Fall der Summe): Ersetze in dem Ausdruck nach dem Summenzeichen den Laufindex j der Reihe nach durch 1; 2; : : : ; n und addiere diese Auswertungen alle auf. Die Grenzen für den Laufbereich sind gerade die, die unten bzw. oben am Summenzeichen angegeben sind. Genauso kann man Summen- und Produktzeichen mit anderen ganzzahligen Laufbereichen definieren, z.B. n X
aj ´ a&2 C a&1 C a0 C a1 C ( ( ( C an ;
j D&2
wobei natürlich die Summanden für alle Werte des Laufindexes definiert sein müssen. Ist der Laufbereich leer, d.h. die unten angeschriebene Grenze größer als die oben angeschriebene, so wird ein solches Symbol immer als 0 gerechnet (beim Produkt als 1), z.B. 3 3 Y X aj ´ 1: aj ´ 0; j D5
j D5
Beim Gebrauch des Summen- und Produktzeichens ist zu beachten, dass der Laufindex (hier j ) frei gewählt werden kann, soweit er im betreffenden Zusammenhang
Abschnitt 1.3 Anwendungen des Induktionsprinzips
25
nicht schon verbraucht ist. Es ist also z.B. n X
aj D
j D1
n X
ak :
kD1
Schließlich kann man die Summanden oder Faktoren in irgendeiner anderen Reihenfolge aufaddieren bzw. aufmultiplizieren. Das bedeutet, dass man am Laufindex eine so genannte Indextransformation vornehmen kann. Z.B. gilt (4)
n X
aj D
j D1
n&1 X
an&k :
kD0
Denn ausgeschrieben besagt dies a1 C a2 C ( ( ( C an D an C an&1 C ( ( ( C a1 : Die zugehörige Transformation der Laufindizes ist hier beschrieben durch j D n & k (oder äquivalent k D n & j ). Diese Formeln stellen eine bijektive Beziehung zwischen dem „j -Laufbereich“ von 1 bis n und dem „k-Laufbereich“ von 0 bis n & 1 her (wenn auch unter Umkehrung der Reihenfolge). Man spricht kurz von der Indextransformation j D n & k. Formal kommt man in (4) von links nach rechts durch die Substitution bei den Summanden j Dn&k und durch die Umrechnung der Grenzen: j D 1 () k D n & 1 j D n () k D 0; wobei natürlich 0 als neue untere und n & 1 als neue obere Grenze beim Summenzeichen zu nennen sind. Entsprechend verfährt man allgemein, wenn der eine Laufbereich bijektiv auf den anderen abgebildet ist. Z.B. gilt mit der Indextransformation j D k & 9 n X j D1
aj D
9Cn X
ak&9 :
kD10
Ist J eine endliche Menge mit p > 0 Elementen und ist für jedes j 2 J ein aj 2 R gegeben, so definiert man p X X ah.i/ ; aj ´ j 2J
iD1
26
Kapitel 1 Die Zahlmengen der Analysis
wobei h W N.p/ ! J irgendeine Durchnummerierung von J ist. Welche ist egal (aufgrund des Assoziativ- und Kommutativgesetzes der Addition). Wird die Indexmenge P J durch eine einfachePEigenschaft beschrieben, so schreibt man anstelle von j 2J das Summenzeichen und hängt an dieses die betreffende Eigenschaft an. So gilt z.B. im Falle J ´ f1; 2; : : : ; pg: X X j2 µ j 2: 1#j #p
j 2J
B. Satz (Bernoullische Ungleichung). Für n 2 N und a 2 R mit a > &1 gilt: .1 C a/n % 1 C na: Beweis durch vollständige Induktion. Induktionsanfang für n D 1: Die Behauptung ist im Fall n D 1 richtig (mit Gleichheit); denn sie lautet einfach .1 C a/1 D 1 C 1 ( a. Induktionsschluss von n auf n C 1: Es ist zu zeigen: Aus .1 C a/n % 1 C na folgt .1Ca/nC1 % 1C.nC1/a. Dazu multipliziert man die Voraussetzung mit der positiven Zahl 1 C a und erhält .1 C a/nC1 % .1 C na/.1 C a/ D 1 C .n C 1/a C na2 % 1 C .n C 1/a; da na2 % 0, also wirklich die Behauptung.
"
C. Satz und Definition (binomische Formel, Binomialkoeffizienten). Für n 2 N und a; b 2 R gilt: (5)
0 ! n X n n&k k a b : .a C b/n D k kD0
Darin sind die so genannten Binomialkoeffizienten definiert: 0 ! n n.n & 1/ ( ( ( .n & k C 1/ ´ k kŠ
(n) k
– gelesen „n über k“ – so
für 1 . k . n;
0 ! n ´ 1: 0
Wenn bei dem Zähler des letzten Bruchs der letzte Faktor als .n&.k &1// geschrieben wird, kann man sich die Definition besser merken: Zähler und Nenner haben gleichviele Faktoren.
27
Abschnitt 1.3 Anwendungen des Induktionsprinzips
Beweis von C. Wir beweisen zunächst als Zwischenbehauptung auf direkte Weise: ! ! 0 ! 0 nC1 n n D C k k k&1
0 (6)
für 1 . k . n:
Zwischenbeweis: Für k D 1 besagt die Behauptung: 1Cn D nC1, ist also in Ordnung. Für k > 1 startet man mit der linken Seite und formt solange um, bis man zur rechten Seite gelangt: ! 0 ! n.n & 1/ ( ( ( .n & k C 2/ n n n.n & 1/ ( ( ( .n & k C 1/ D C C .k & 1/Š kŠ k k&1
0
n.n & 1/ ( ( ( .n & k C 2/ n.n & 1/ ( ( ( .n & k C 2/ (kC ( .n & k C 1/ kŠ kŠ n.n & 1/ ( ( ( .n & k C 2/ ( .n C 1/ D kŠ 0 ! nC1 D : k D
Damit ist die Zwischenbehauptung (6) bewiesen. Beweis von (5) durch vollständige Induktion: Induktionsanfang für n D 1: Die Behauptung lautet für n D 1 0 ! 1 X 1 1&k k 1 a b : .a C b/ D k kD0
Da die rechte Seite laut Definition gleich 0 ! 0 ! 1 1 a(1C 1(b DaCb 0 1 ist, stimmt der Induktionsanfang. Induktionsschluss von n auf n C 1: Es ist zu zeigen: Aus 0 ! n X n n&k k n A.n/ .a C b/ D a b k kD0
28
Kapitel 1 Die Zahlmengen der Analysis
folgt .a C b/nC1 D
A.n C 1/
nC1 X kD0
! 0 n C 1 nC1&k k a b : k
Dazu multipliziert man A.n/ mit a C b und formt solange um, bis man A.n C 1/ erreicht: 0 ! n X n n&k k nC1 a b .a C b/ .a C b/ D k kD0 0 ! 0 ! n n X n n&kC1 k X n n&k kC1 a b C a b D k k kD0 kD0 0 ! 0 ! n&1 n X X n n n&k kC1 an&kC1 b k C a b C b nC1 D anC1 C k k kD1
kD0
Indextransformation k D j & 1 in der zweiten Summe: 0 ! 0 ! n n X n n&kC1 k X n nC1 Da C an&j C1 b j C b nC1 a b C j &1 k kD1
j D1
Umbenennung j D k: 0 ! 0 ! n n X X n n D anC1 C an&kC1 b k C an&kC1 b k C b nC1 k k&1 kD1 kD1 00 ! 0 !! n X n n C an&kC1 b k C b nC1 D anC1 C k k&1 kD1
(6) W
0 ! n X n C 1 D anC1 C an&kC1 b k C b nC1 k kD1 0 ! nC1 X nC1 anC1&k b k : D k kD0
An wichtigen Stationen dieser Rechnung ist der nächste durchzuführende Schritt mit angegeben. Der Induktionsschluss funktioniert also, und damit ist die binomische Formel bewiesen. " Bei diesem Vorgehen wird ein Phänomen sehr deutlich: Man muss die Behauptung schon kennen oder zumindest vermuten, um die vollständige Induktion ansetzen zu
29
Abschnitt 1.3 Anwendungen des Induktionsprinzips
können. Vermutungen hervorbringen kann man in vielen Fällen dadurch, dass man einige niedrige Fälle (z.B. für n D 1; n D 2; n D 3) explizit ausschreibt. Manchmal kann man daran schon sehen, wie die allgemeine Behauptung aussehen wird. Beim binomischen Satz würde diese „unvollständige Induktion“ entsprechend den folgenden Formeln (7) und (8) laufen. Die Definition der Binomialkoeffizienten in C kann durch Erweitern mit .n & k/Š so geschrieben werden: 0 ! nŠ n D kŠ.n & k/Š k
für 0 . k . n:
Daraus liest man unmittelbar die Spiegelungseigenschaft bei Vertauschen von k mit n & k ab: 0 ! 0 ! n n D : k n&k Die Zwischenbehauptung (6) entspricht der Erzeugungsweise der Binomialkoeffizienten am so genannten Pascalschen Dreieck: nD0W nD1W nD2W nD3W nD4W (((
(7)
1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 ((((((((((((((((((
Dabei stehen an der Spitze und in den beiden Schenkeln lauter Einsen, und jede innere Zahl ergibt sich durch Addition der beiden darüber stehenden Zahlen, z.B. 4 D 3 C 1 oder 6 D 3 C 3, usw. (Der Fall n D 0 ist gleich miterfasst.) Dementsprechend lauten die Spezialfälle der binomischen Formel für n D 1 bis 4:
(8)
.a C b/1 .a C b/2 .a C b/3 .a C b/4
D aCb D a2 C 2ab C b 2 D a3 C 3a2 b C 3ab 2 C b 3 4 D a C 4a3 b C 6a2 b 2 C 4ab 3 C b 4 :
In den folgenden Fällen wollen wir zuerst einmal versuchen, die richtige Behauptung auf anderem Wege zu finden, und sie dann erst mittels vollständiger Induktion beweisen.
30
Kapitel 1 Die Zahlmengen der Analysis
Sei n 2 N und q 2 R. Kann man die Summe der fortlaufenden Potenzen 1 C q C q2 C ( ( ( C qn irgendwie geschlossen ausdrücken? „Geschlossen“ bedeutet dabei, dass eine Formel angegeben wird, die ohne Pünktchen auskommt, sich also mit wachsendem n nicht weiter ausdehnt. Manchmal reicht das „Spielen“ mit den Voraussetzungen, um ein Resultat zu finden: Wir nennen hier die gesuchte Summe einmal S S ´ 1 C q C q2 C ( ( ( C qn und multiplizieren mit q durch: qS ´ q C q 2 C q 3 C ( ( ( C q nC1 : Subtrahiert man die beiden Formeln, so fällt rechts das meiste heraus. Es verbleibt S & qS D 1 & q nC1 : Somit folgt durch Isolieren von S (falls q ¤ 1) die nachstehende Formel (9). D. Satz (geometrische Summenformel). Für n 2 N und q 2 R mit q ¤ 1 gilt: (9)
1 C q C q2 C ( ( ( C qn D
1 & q nC1 : 1&q
Die linke Seite in (9) wird als eine geometrische Summe mit dem Quotienten q bezeichnet. Obwohl dies bereits durch die Vorüberlegung „induktionsfrei“ bewiesen ist, folgt hier der Beweis von D mittels vollständiger Induktion. Induktionsanfang n D 1: Aufgrund der Formel 1 & q 2 D .1 & q/.1 C q/ gilt (9) für n D 1. Induktionsschluss von n auf n C 1: Man addiert auf beiden Seiten der Induktionsvoraussetzung (9) die Potenz q nC1 und erhält so 1 & q nC1 1 & q nC1 C .1 & q/q nC1 1 & q nC2 C q nC1 D D : 1&q 1&q 1&q Das ist die Behauptung für n C 1 anstelle n. Sei wieder n 2 N. Kann man die Summe der ersten n natürlichen Zahlen 1 C 2 C 3 C ((( C n
"
31
Abschnitt 1.3 Anwendungen des Induktionsprinzips
irgendwie „geschlossen“ ausdrücken? Wiederum durch „Spielen“ kann man auf das Ergebnis kommen, wie es Gauß in der Grundschule getan haben soll: Man nennt die Summe S, schreibt sie zweimal auf, beim zweiten Mal in umgekehrter Reihenfolge S ´ 1 C 2 C 3 C ( ( ( C .n & 2/ C .n & 1/ C n S D n C .n & 1/ C .n & 2/ C ( ( ( C 3 C 2 C 1 und addiert gliedweise: 2S D .1 C n/ C .1 C n/ C ( ( ( C .1 C n/: Die letzt Summe hat n gleiche Summanden n C 1, ist also gleich n ( .n C 1/. Damit folgt für S der nachstehende Ausdruck (10). E. Satz (arithmetische Summenformel). Für n 2 N gilt: (10)
1 C 2 C 3 C ((( C n D
1 n.n C 1/: 2
Die linke Seite in (10) wird als eine arithmetische Summe bezeichnet, da zwei aufeinander folgende Summanden eine feste Differenz 1 haben. Beweis von E mittels vollständiger Induktion. Induktionsanfang n D 1: Hier geht die Behauptung über in 1 D sichtlich stimmt.
1 2
( 1 ( 2, was offen-
Induktionsschluss von n auf n C 1: Man addiert auf beiden Seiten der Induktionsvoraussetzung (10) den Summanden n C 1 und erhält so 1 C 2 C 3 C ( ( ( C n C .n C 1/ D
1 1 n.n C 1/ C .n C 1/ D .n C 1/.n C 2/: 2 2
Das ist die Behauptung für n C 1 anstelle n.
"
F. Bemerkung. An vielen Stellen werden in der Mathematik rechnerische Umformungen eingesetzt, um komplizierte Ausdrücke auf eine einfache Gestalt zu bringen. Beispiele sind die obigen Formeln (9) und (10) für geometrische und arithmetische Summen. Es gibt aber auch die umgekehrte Notwendigkeit, nämlich einfache Terme anders, eventuell komplizierter, zu schreiben, um daran gewisse Eigenschaften besser zu erkennen. So kann man etwa die Formel (9) von rechts nach links lesen und sehen, dass 1 & q nC1 den Faktor 1 & q „enthält“. Damit ist z.B. klar, dass 81000 & 1 durch 7 teilbar ist, was ansonsten nicht so leicht herauszufinden ist.
32
Kapitel 1 Die Zahlmengen der Analysis
Eine andere Situation dieser Art entsteht, wenn a1 ; a2 ; : : : ; an für n 2 N gegeben sind und die Differenz an & a1 aus den sukzessiven Differenzen aufgebaut wird: (11)
an & a1 D .a2 & a1 / C .a3 & a2 / C ( ( ( C .an & an&1 / D
n&1 X
.akC1 & ak /:
kD1
Das ist sicher richtig, da sich rechts alles heraushebt bis auf &a1 und an . Eine solcher Ausdruck wie auf der rechten Seite von (11) wird als Teleskopsumme bezeichnet. Diese Verwandlung einer einfachen Differenz in eine Teleskopsumme wird im weiteren Verlauf ab und zu gebraucht und sollte vom Leser in seine „Trick-Kiste“ aufgenommen werden. G. Definition. Besitzt eine Teilmenge M von R ein größtes Element, d.h. existiert ein K 2 M mit: K % x für alle x 2 M , so heißt K das Maximum von M , geschrieben K µ max M . Besitzt eine Teilmenge M von R ein kleinstes Element, d.h. existiert ein k 2 M mit: k . x für alle x 2 M , so heißt k das Minimum von M , geschrieben k µ min M . Wenn das zutrifft, so sagt man auch, das Maximum bzw. das Minimum von M existiert. Im Fall der Existenz sind natürlich Maximum bzw. Minimum eindeutig bestimmt. Oberbegriff für „Maximum“ und „Minimum“ ist Extremum. Bei den nichtleeren Intervallen haben wir bereits in P[1.1] gesehen, dass ein Maximum existieren kann (etwa bei Œa; b/ und /a; b// oder auch nicht (etwa bei Œa; bŒ und /a; bŒ). Entsprechendes gilt natürlich für das Minimum. Für endliche Mengen zeigen wir nun: H. Satz. Jede nichtleere endliche Menge M , R besitzt ein Maximum und ein Minimum. Genauer: Im Fall von ein oder zwei Elementen gilt: (12)
max fa; bg D
1 .a C b C ja & bj/; 2
min fa; bg D
1 .a C b & ja & bj/: 2
Für n 2 N mit n % 2 gelten die Rekursionsformeln: (13)
max fa1 ; : : : ; an ; anC1 g D max fmax fa1 ; : : : ; an g; anC1 g min fa1 ; : : : ; an ; anC1 g D min fmin fa1 ; : : : ; an g; anC1 g:
Beweis. Vollständige Induktion nach der Anzahl der Elemente n ´ jM j: Induktionsanfang: Für n D 1, d.h. für eine einelementige Menge M D fag, ist max fag D min fag D a. Die Formeln (12) enthalten dies im Fall a D b.
Abschnitt 1.3 Anwendungen des Induktionsprinzips
33
Für n D 2, d.h. für eine zweielementige Menge M D fa; bg, ist das Maximum natürlich das größere der beiden Elemente, das Minimum das kleinere. Äquivalent hiermit hat man die Darstellungen in (12). Ohne Beschränkung der Allgemeinheit sei nämlich a < b angenommen. Dann ist ja & bj D b & a, also geben die rechten Seiten in (12) gerade b bzw. a. Induktionsschluss: Die Formeln (13) sind offensichtlich richtig, und damit ist alles bewiesen. " Wie sehr oft bei rekursiven Bestimmungen eignen sich die Gleichungen (12), (13) hervorragend zur programmierten Bestimmung der Extrema endlich vieler Zahlen. „Ohne Beschränkung der Allgemeinheit“ Ein Wort zu dieser Wendung, die oben im Beweis gebraucht wurde: Damit schränkt man sich auf Unterfälle ein, was natürlich nur geht, wenn die anderen Fälle trivial einsichtig sind oder leicht aus den behandelten Unterfällen folgen. In der obigen Situation ist der Unterfall a < b behandelt. Der verbleibende Fall a > b (es war ja a ¤ b) beruht einfach darauf, dass beide Seiten der Gleichungen (12) symmetrisch in a; b sind, d.h. bei Vertauschung von a und b keine Änderung erleiden. Die Wendung „ohne Beschränkung der Allgemeinheit“ wird öfters in Beweisen im genannten Sinne gebraucht und kann durch o.B.d.A abgekürzt werden. Zwei Anwendungen in der Kombinatorik In der Kombinatorik untersucht man die Anzahlregeln für endliche Mengen, z.B. in der folgenden Situation: I. Satz. Sei p 2 N gegeben. Die Anzahl der bijektiven Abbildungen der p-elementigen Menge N.p/ D f1; 2; : : : ; pg auf eine beliebige p-elementige Menge Gp D fa1 ; a2 ; : : : ; ap g ist genau pŠ. Beweis. Vollständige Induktion nach p: Induktionsanfang für p D 1: Für p D 1 gibt es genau eine (automatisch bijektive) Abbildung f1g ! fa1 g. Induktionsschluss von p & 1 auf p für p % 2: Voraussetzung ist also, dass es genau .p & 1/Š bijektive Abbildungen von N.p & 1/ auf jede .p & 1/-elementige Menge gibt. Bei einer bijektive Abbildung f W N.p/ ! Gp existieren genau p Möglichkeiten für f .p/, nämlich a1 ; a2 ; : : : ; ap . Bei jeder dieser Möglichkeiten definiert die Einschränkung von f auf N.p & 1/ eine bijektive Abbildung von N.p & 1/ auf eine .p & 1/-elementige Teilmenge von Gp , wofür nach
34
Kapitel 1 Die Zahlmengen der Analysis
Induktionsvoraussetzung .p & 1/Š Möglichkeiten existieren. Also bestehen für f insgesamt p ( .p & 1/Š D pŠ Möglichkeiten. " Beim Induktionsschluss haben wir diesmal von p & 1 auf p geschlossen, allerdings für p % 2. Das ist natürlich genauso gut, wie von p auf p C 1 für p % 1 zu schließen. Der einzige Grund für diese (rein äußerliche) Abänderung ist, dass sich der Induktionsschluss dadurch etwas einfacher formulieren lässt. Es gibt noch weitere Modifikationen bei der Anwendung des Induktionsprinzips, auf die wir gleich zu sprechen kommen. Satz I gilt speziell für Gp ´ N.p/. Eine bijektive Abbildung ' W N.p/ ! N.p/ wird eine Permutation (der Ziffern von 1 bis p) genannt. Eine solche Permutation entspricht einer Umstellung der Elemente 1; 2; : : : ; p von N.p/ auf eine andere Reihenfolge ' .1/; ' .2/; : : : ; ' .p/ dieser Elemente. Es gibt also genau pŠ Permutationen der Ziffern von 1 bis p. Eine noch anschaulichere Deutung einer solchen Permutation ' erhält man in der Situation, dass p Kästen mit den Nummern 1; : : : ; p gegeben sind und p Gegenstände, ebenfalls durch die Zahlen 1; : : : ; p repräsentiert, in diese Kästen verteilt werden sollen (so dass in jeden Kasten genau ein Gegenstand kommt). Gelangt der Gegenstand p in den Kasten mit der Nummer ' .p/, so ist die Abbildung ' injektiv, da ein Gegenstand nicht in mehr als einen Kasten kommt, und sie ist surjektiv, da jeder Kasten einen Gegenstand erhält. Eine solche Realisierung einer Verteilung wird eine Belegung von 1; : : : ; p genannt. Insgesamt existieren also pŠ dieser Belegungen. J. Satz. Seien p 2 N und k 2 N0 mit 0 . k . p gegeben. Die Anzahl der k( ) elementigen Teilmengen von N.p/ D f1; : : : ; pg ist genau pk . Beweis. Dies überlegt man sehr kurz anhand der binomischen Formel 0 ! n X p p&k k p a b : .a C b/ D k kD0
Wenn man sich nämlich den Ausdruck .aCb/p einzeln distributiv ausgerechnet denkt, so hat man, um bei festem k alle Glieder mit ap&k b k zu sammeln, aus den p Faktoren .a C b/ ( ( ( .a C b/ jeweils p & k mal a und k mal b auszuwählen. Das geht genauso oft, wie es k-elementige Teilmengen von N.p/ gibt. " Eine Auswahl einer k-elementigen Teilmenge aus N.p/ ( ) wird eine Kombination von k Elementen aus p Elementen genannt. Es gibt also pk solcher Kombinationen. K. Beispiel. Die bekannteste Anwendung ist die Auswahl von sechs Ziffern aus den ersten 49 natürlichen Zahlen, wie sie beim deutschen Zahlenlotto „6 aus 49“ auftritt. ( ) Dafür gibt es 49 Möglichkeiten; das sind ausgerechnet 6 0 ! 49 49 ( 48 ( 47 ( 46 ( 45 ( 44 D D 49 ( 8 ( 47 ( 23 ( 3 ( 11 D 13:983:816 6 1(2(3(4(5(6
Abschnitt 1.3 Anwendungen des Induktionsprinzips
35
Möglichkeiten. Beachte: Der vorletzte Ausdruck entsteht durch nahe liegendes Kürzen. Die Gewinnchance ist also rund 1 zu 14 Millionen. Wenn also rund 14 Millionen Lottoscheine ausgefüllt werden, so ist dabei ungefähr ein Hauptgewinn zu erwarten. Aus der binomischen Formel folgt für a D b D 1: 0 ! 0 ! 0 ! 0 ! p p p p p : 2 D C C C ((( C p 0 1 2 L. Folgerung. Es gibt insgesamt 2p Teilmengen von N.p/ D f1; : : : ; pg (die leere Menge und N.p/ selbst mitgezählt.) " M. Bemerkung. Der Induktionssatz F[1.2] wird auch in verschiedenen anderen Varianten angewendet. Z.B. dürfen anstelle von N Mengen der Form N ´ Z.n1 ; 1/ D fn 2 Z j n1 . ng oder auch N ´ Z.n1 ; n2 / D fn 2 Z j n1 . n . n2 g treten, wobei n1 < n2 aus Z fest gegeben sind. Ist dann W , N , so sind Induktionsanfang und Induktionsschluss folgendermaßen abzuändern: Induktionsanfang: n1 2 W Induktionsschluss: w 2 W H) w C 1 2 W (falls w C 1 2 N ). Sind diese erfüllt, so kann man wieder auf W D N schließen. Auch kann der Induktionsschluss so ersetzt werden: Verdickter Induktionsschluss: Z.n1 ; w/ , W H) w C 1 2 W (falls w C 1 2 N ). Diese verdickte Variante ist manchmal von Vorteil, da man beim Induktionsschluss mehr an Voraussetzungen zur Verfügung hat. Man kann die verdickte Variante auf die vorhergehende zurückführen, indem man diese auf W 0 ´ fw 2 N j Z.n1 ; w/ , W g anwendet. Aufgaben und Anmerkungen 1. Manche Regeln, die zunächst für zwei oder drei Operanden gelten, lassen sich mit vollständiger Induktion auf n Operanden mit n 2 N ausdehnen. Man verallgemeinere z.B. die Dreiecksungleichung H(v)[1.1] zu (14)
ˇ X ˇX n ˇ ˇ n ˇ. ˇ jak j; a k ˇ ˇ kD1
gültig für alle n 2 N und a1 ; : : : ; an 2 R.
kD1
36
Kapitel 1 Die Zahlmengen der Analysis
2. Analog verallgemeinere man die Assoziativ-, Kommutativ- und Distributivgesetze aus den Körperaxiomen A[1.1] auf n Operanden. 3. Man zeige: In der Dreiecksungleichung (14) steht dann und nur dann das Gleichheitszeichen, wenn alle ak % 0 oder alle ak . 0 sind. Lösungshinweis: Aus
ˇ ˇX n ˇ X ˇ n ˇD ˇ a jak j k ˇ ˇ kD1
folgt
n X
kD1
jak j D "
n X
ak
kD1
kD1
für ein " 2 f1; &1g, also
n X
.jak j & "ak / D 0:
kD1
Da hierin alle Summanden nichtnegativ sind, folgt für alle k: jak j & "ak D 0, also jak j D "ak . 4. Man beweise durch vollständige Induktion für n 2 N: a)
n X kD1
1 k D n.n C 1/.2n C 1/, 6 2
b)
n X
k3 D
kD1
1 2 n .n C 1/2 . 4
5. Man beweise durch vollständige Induktion für n 2 N0 : a)
2n X
kC1
.&1/
n X 1 1 D , k nCk kD1
kD1
nC1
n 2 X&1 Y ( k ) ak : b) 1 C a.2 / D
6. Für welche n 2 N gilt a) 2n > n3 ,
b) 3n > n3 ,
kD0
kD0
c) nŠ .
3 n -n 2
?
7. Für n % m in N beweise man durch vollständige Induktion 0 ! 0 ! n X k nC1 D : m mC1 kDm
8. Man beweise die folgende Formel für eine allgemeine arithmetische Summe: 1 .a C b/ C .a C 2b/ C ( ( ( C .a C nb/ D na C n.n C 1/b: 2
Abschnitt 1.4 Zur Vollständigkeit
1.4
37
Zur Vollständigkeit
In der Analysis spielen Grenzwerte eine zentrale Rolle. Das gilt insbesondere für das Kernstück der Analysis, die Differential- und Integralrechnung. Praktisch gibt es keinen Begriff der Analysis, in dem nicht irgendeine Art von Grenzwert vorkommt. Die wichtigste Grundlage für Grenzwerte im Bereich der reellen Zahlen ist die Vollständigkeit. Sie sichert, dass die „Lücken“ zwischen den rationalen Zahlen ausgefüllt werden, sodass wirklich das entsteht, was man als „Kontinuum“ bezeichnet. Das Vollständigkeitsaxiom wurde bereits in Q[1.1] formuliert. In diesem Abschnitt ziehen wir zunächst weitere Folgerungen aus diesem Axiom, bevor wir dann im nächsten Kapitel zu den Grenzwerten übergehen, Wir haben schon gesehen, dass es keine größte natürliche Zahl geben kann; vgl. E(ii)[1.2]. Tatsächlich gilt noch mehr: A. Satz. Die Menge N der natürlichen Zahlen ist nicht nach oben beschränkt. Beweis. Wäre N nach oben beschränkt, so sei s0 ´ sup N 2 R. Dann kann s0 & 1 nicht auch obere Schranke von N sein. Also existierte ein n0 2 N mit n0 > s0 & 1, d.h. mit n0 C 1 > s0 . Wegen n0 C 1 2 N, widerspricht dies der Eigenschaft von s0 , obere Schranke von N zu sein. " B. Folgerung (Archimedische Eigenschaft von R). Zu jedem a > 0 und b aus R gibt es ein n 2 N mit na > b. Anschaulich gesprochen: Durch wiederholtes aneinander Fügen einer (noch so kleinen) Strecke a > 0 kann jede (noch so große) Strecke b > 0 übertroffen werden. (Für b . 0 ist die Behauptung trivial.) Beweis von B. Angenommen, n existierte nicht. Dann gälte für alle n 2 N: na . b, also auch n . b=a. Das ist aber ein Widerspruch zu Satz A. " C. Folgerung. Aus 0 . a .
1 für alle n 2 N folgt a D 0. n
Beweis. Sonst wäre 0 < a und n . 1=a für alle n 2 N. Widerspruch zu A!
"
Auf den ersten Blick könnte man meinen, dass die Eigenschaften A bis C in jedem angeordneten Körper richtig sind. Das ist allerdings ein Irrglaube. Denn nach Hilbert kann man einen angeordneten Körper konstruieren, in dem alle drei Eigenschaften nicht zutreffen. Vgl. Hilbert[1999], §12. Für eine Teilmenge M , R kann man analog zu L[1.1] und N[1.1] die Begriffe „untere Schranke“ und „größte untere Schranke“ einführen. Tatsächlich lässt sich dies
38
Kapitel 1 Die Zahlmengen der Analysis
mittels „Vorzeichenumkehr“ auf die frühere Situation reduzieren. Dazu definieren wir die zu M gespiegelte Menge &M ´ f&x j x 2 M g: Man sagt auch, &M geht durch Spiegelung aus M hervor. Natürlich gilt &.&M / D M . Gilt M D &M , so nennt man M spiegelbildlich oder spiegelsymmetrisch bzgl. 0. Dies bedeutet, dass M mit x auch jeweils &x als Element enthält. D. Definition und Satz. Eine Teilmenge M , R heißt nach unten beschränkt, wenn es ein t 2 R gibt, sodass für alle x 2 M gilt x % t. Ein solches t heißt dann eine untere Schranke von M . Eine untere Schranke t0 von M heißt größte untere Schranke oder Infimum von M , wenn für jede untere Schranke t von M gilt: t0 % t. Man schreibt dann für das eindeutig bestimmte t0 t0 µ inf M: Es gilt (i)
Ist s eine obere Schranke von M , so ist &s eine untere Schranke von &M .
(ii)
Ist t eine untere Schranke von M , so ist &t eine obere Schranke von &M .
(iii) Zu jeder nichtleeren nach unten beschränkten Teilmenge M , R existiert das Infimum inf M in R. (iv)
Ist M nach unten beschränkt, so ist &M nach oben beschränkt, und es gilt sup.&M / D & inf M .
(v)
Ist M nach oben beschränkt, so ist &M nach unten beschränkt, und es gilt inf.&M / D & sup M .
Beweis. Dies beruht in einfacher Weise auf dem Vorzeichenschluss bei Ungleichungen: a < b () &a > &b: Unmittelbar klar sind damit (i) und (ii). Für (iii) und (iv) überlegt man so: Die Gesamtheit der unteren Schranken von M entsteht aufgrund von (i), (ii) durch Vorzeichenumkehr aus der Gesamtheit der oberen Schranken von &M . Ist also s0 die kleinste obere Schranke von &M , so ist &s0 die größte untere Schranke von M , diese also existent in R und & sup.&M / D inf M . (v) geht durch die Ersetzung von M durch &M aus (iv) hervor.
"
Wir haben schon in P(i)[1.1] gesehen, dass das Maximum einer Menge M * R, wenn es existiert, zugleich das Supremum von M ist. Umgekehrt folgt aus sup M 2 M ,
Abschnitt 1.4 Zur Vollständigkeit
39
dass sup M das Maximum von M ist. Entsprechendes gilt für das Infimum. Maxima und Minima sind also dasselbe wie angenommene (d.h. in der Menge enthaltene) Suprema und Infima. Die leere Teilmenge von R besitzt kein Supremum und auch kein Infimum in R. E. Satz. (i)
Jede nichtleere nach unten beschränkte Teilmenge M , Z besitzt ein Minimum.
(ii) Jede nichtleere nach oben beschränkte Teilmenge M , Z besitzt ein Maximum. Beweis. Zu (i): Sei a eine untere Schranke von M und n 2 N so gewählt, dass n > &a also nCa > 0 (das geht nach Satz A). Wir „verschieben M um n in N hinein“, d.h. wir betrachten die Menge M 0 ´ fz C n j z 2 M g und rechnen später zurück. Zunächst ist wirklich M 0 , N; denn für z 2 M haben wir Z 3 z C n % a C n > 0. Sei m0 ´ min M 0 2 M 0 (die Existenz ist klar aus dem Wohlordnungssatz K[1.2]). Es ist m0 D m C n für ein m 2 M . Aus z C n % m0 D m C n für alle z 2 M folgt z % m für alle z 2 M . Somit ist m D min M . Zu (ii): Dies reduziert man wieder durch Spiegelung auf (i), analog zu D.
"
F. Beispiel. Zu einer gegebenen reellen Zahl a betrachten wir die Menge aller ganzen Zahlen k mit k . a. Diese Menge hat die oberen Schranke a, besitzt also ein Maximum k0 . Offensichtlich ist k0 die größte ganze Zahl . a. Man bezeichnet sie durch Œa/ und nennt sie das Größteganze von a. G. Definition und Satz. Die Menge M , R heißt beschränkt, wenn M sowohl nach oben wie nach unten beschränkt ist. Äquivalent damit ist: Es gibt ein c 2 R mit: jxj . c für alle x 2 M . Beweis. Zunächst erkennt man mittels (4)[1.1] die Äquivalenz: jxj . c () &c . x . c: Ist nun jxj . c für alle x 2 M vorausgesetzt, so folgt damit &c . x . c für alle x 2 M , also hat M eine obere und untere Schranke. – Ist umgekehrt a . x . b für alle x 2 M vorausgesetzt, so setzt man c ´ max fjaj; jbjg und sieht: jxj . c für alle x 2 M. " Die leere Menge gilt ebenfalls als beschränkt. Alle Intervalle der Form Œa; b/; Œa; bŒ, /a; b/ ; /a; bŒ mit a < b sind beschränkt; a ist jeweils das Infimum, b das Supremum. Nur bei Œa; b/ existieren beide Extrema.
40
Kapitel 1 Die Zahlmengen der Analysis
Die beiden Begriffe „endlich“ und „beschränkt“ sind wohl zu unterscheiden. Die Eigenschaft „endlich“ bezieht sich auf beliebige Mengen und die Anzahl ihrer Elemente. Die Eigenschaft „beschränkt“ bezieht sich (nach unserem augenblicklichen Stand) auf Teilmengen von R und zwar darauf, dass die Elemente dem Betrage nach unter einer festen (nichtnegativen) Zahl liegen. Eine endliche Teilmenge von R ist stets beschränkt (H[1.3]), aber nicht notwendig umgekehrt. So ist die Menge aller Brüche 1=n mit n 2 N zwar beschränkt, da diese alle im Intervall Œ0; 1/ liegen, aber nicht endlich. Aus den Sätzen H[1.3] und A folgt insbesondere, dass N nicht endlich ist. Jedoch ist N gewissermaßen die „kleinste“ unendliche Menge. Ist nämlich M irgendeine unendliche Menge, so kann man induktiv paarweise verschiedene Elemente a1 ; a2 ; : : : aus M auswählen, und diese sind vermöge n 7! an bijektiv auf N bezogen. Solch eine Menge fa1 ; a2 ; : : :g unterscheidet sich „größenmäßig“ nicht von N. Man wird also N als ein Modell für die einfachsten unendlichen Mengen ansehen: H. Definition. Eine Menge M heißt (i)
abzählbar unendlich, wenn sie bijektiv auf N abgebildet werden kann;
(ii)
abzählbar, wenn sie endlich oder abzählbar unendlich ist;
(iii) überabzählbar, wenn sie nicht abzählbar ist. Die Forderung in (i) kann äquivalent dadurch ausgedrückt werden, dass N bijektiv auf M abgebildet werden kann. Ist ' W N ! M bijektiv, so sind '.1/; '.2/; : : : die Elemente von M , wobei jedes genau einmal vorkommt. Eine solche Bijektion heißt deswegen eine Durchnummerierung von M . Neben Durchnummerierungen werden bei abzählbaren Mengen auch Aufzählungen verwendet. Bei diesen verzichtet man auf die Forderung der Injektivität. Eine Aufzählung einer abzählbaren Menge M ¤ ¿ ist also eine surjektive Abbildung der Art ˛ W N.q/ ! M oder ˛ W N ! M . Die Menge M kann dann in der Gestalt M D f˛.1/; : : : ; ˛.q/g bzw. M D f˛.1/; ˛.2/; : : :g geschrieben werden (aufzählende Mengenschreibweise). Dabei brauchen (im Gegensatz zur Durchnummerierung) die ˛.i/ nicht paarweise verschieden zu sein. Statt ˛.i/ schreibt man oft auch ˛i (Indexschreibweise), und gelegentlich werden anstelle der Mengen N.q/ bzw. N auch andere endliche oder unendliche Teilmengen von N als Definitionsmengen verwendet. Aus der Vorüberlegung ist bereits der folgende Satz I klar geworden. Recht überraschend ist die Tatsache über die rationalen Zahlen, die in Satz J ausgedrückt ist: I. Satz. Jede unendliche Menge enthält eine abzählbar unendliche Teilmenge. J. Satz. Die Menge Q der rationalen Zahlen ist abzählbar unendlich.
"
41
Abschnitt 1.4 Zur Vollständigkeit
Beweis. Zunächst ist Q unendlich, da N , Q. Das klassische Verfahren, Q durchzunummerieren, läuft folgendermaßen: Man betrachtet zunächst den „positiven Teil“ o nm ˇ ˇ QC ´ fx 2 Q j x > 0g D ˇ m; n 2 N n und konstruiert eine Bijektion von N auf QC nach dem folgenden Schema: 1 1+ 1 3 1+
2 # 4 1+ 3 9 1+
! . % .
2 2+ 1
2 2 8 2+ 3
% .
5 3+ 1
6 4+ 1
(((
2
4 2
(((
3 3
4 3
((( (((
7 3+
! .
4
2 4
3 4
4 4
:: :
:: :
:: :
:: :
Die Durchnummerierung erfolgt mit dem so genannten Diagonalverfahren: Man beginnt links oben und durchläuft das Schema in der Reihenfolge der Pfeile. Tritt eine rationale Zahl mehrfach auf, so bekommt sie nur beim ersten Mal eine Nummer. Dies sind die eingekreisten Zahlen. Die Bijektion ordnet dieser Nummer j die dabeistehende rationale Zahl rj zu. (Abänderungen sind möglich, indem der „Anschluss“ der Diagonalen anders gemacht wird.)
Damit wird durchnummeriert: QC D fr1 ; r2 ; r3 ; : : :g, und Q selbst ergibt sich durchnummeriert nach dem Reißverschlusssystem: Q D f0; r1 ; &r1 ; r2 ; &r2 ; : : :g D fs1 ; s2 ; s3 ; : : :g mit j 7! sj als Bijektion von N auf Q.
"
Am Ende dieses Abschnitts werden wir dieses Diagonalverfahren etwas systematischer beschreiben. K. Lemma. Jedes offene Intervall /a; bŒ der Länge b & a > 1 enthält eine ganze Zahl. Beweis. Wir führen einen Widerspruchsbeweis: Angenommen, das Intervall /a; bŒ ist frei von ganzen Zahlen. Dann bilden wir die beiden Mengen A ´ fj 2 Z j j . ag;
B ´ fk 2 Z j k % bg
$ und wissen: Z ist disjunkte Vereinigung von A und B (Z D A [ B). Beide Mengen sind nichtleer. Bei B ist dies klar nach Satz A, da N * Z. Bzgl. A wählt man nach Satz A ein i 2 N mit i % &a. Dann ist Z 3 &i . a. Da A nach oben und B nach unten beschränkt ist, existieren j0 ´ max A 2 A, k0 ´ min B 2 B (Satz E), und $ es gilt j0 . a < b . k0 . Wegen Z D A [ B liegt zwischen j0 und k0 keine ganze Zahl, also ist k0 D j0 C 1. Hieraus folgt 1 D k0 & j0 % b & a > 1, ein Widerspruch. Somit muss /a; bŒ mindestens eine ganze Zahl enthalten. "
42
Kapitel 1 Die Zahlmengen der Analysis
L. Satz. Zwischen je zwei verschiedenen reellen Zahlen liegt stets eine rationale Zahl. Beweis. Sind a; b 2 R mit a < b gegeben, so wählt man zunächst ein n 2 N mit 1=n < b & a. Das ist möglich nach Folgerung B. Dann gilt nb & na > 1. Also gibt es nach Lemma K ein k 2 Z mit na < k < nb. Die rationale Zahl k=n liegt dann zwischen a und b. " Die Überabzählbarkeit von R, die in C[2.3] bewiesen werden wird, beinhaltet insbesondere, dass es „sehr viel mehr“ irrationale Zahlen gibt als rationale. Auch unter dem Gesichtspunkt des Maßes wird sich das später so darstellen; vgl. Analysis 2. M. Lemma. (i)
Ist B , R nach oben beschränkt und ¿ ¤ A , B, so ist auch A nach oben beschränkt und sup A . sup B.
(ii) Ist B , R nach unten beschränkt und ¿ ¤ A , B, so ist auch A nach unten beschränkt und inf A % inf B. Beweis. Zu (i): Jede obere Schranke von B ist auch obere Schranke von A. Also ist A nach oben beschränkt. Insbesondere ist sup B obere Schranke von A, also sup A . sup B. Zu (ii): „Spiegelbildlich“ schließt man: Jede untere Schranke von B ist auch untere Schranke von A. Also ist A nach unten beschränkt. Insbesondere ist inf B untere Schranke von A, also inf A % inf B. " Konventionen Neue Mengen werden oft als Bildmengen gegebener Mengen konstruiert. In der Mengenlehre hat man dafür folgende Schreibweise: Ist eine Abbildung f W X ! Y sowie eine Teilmenge M , X gegeben, so bezeichnet f .M / das Bild von M unter f (definiert als Menge aller f .x/ mit x 2 M ). Diese Symbolik wird nun auch dann angewendet, wenn das Funktionszeichen f nicht benannt ist, sondern nur die Funktionsvorschrift x 7! f .x/. So haben wir oben, wenn M eine Teilmenge von R ist, das Symbol &M eingeführt als die Menge f&x j x 2 M g; die Abbildungsvorschrift ist hierbei x 7! &x. Im gleichen Sinne bezeichnet 2M die Menge f2x j x 2 M g; die Abbildungsvorschrift ist hierbei x 7! 2x. Oder es bezeichnet N1 die Menge aller Reziproken n1 natürlicher Zahlen; die Abbildungsvorschrift ist hierbei n 7! n1 . Dass eine Menge M , R nach oben (bzw. nach unten) beschränkt ist, wird oft so ausgedrückt, dass man sagt sup M (bzw. inf M ) existiert in R. Ähnlich wie früher in (4)[1.2] bei den ganzen Zahlen benutzt man das Zeichen 1 (Unendlich) zur formelmäßigen Kennzeichnung der Unbeschränktheit:
43
Abschnitt 1.4 Zur Vollständigkeit
(1)
M nicht nach oben beschränkt
() W sup M D 1
M nicht nach unten beschränkt
() W inf M D &1:
Wie gesagt, die Symbole 1 und &1 haben hier keine tiefere Bedeutung. Auch sind 1 und &1 keineswegs reelle Zahlen. Beziehungen, in denen 1 und &1 vorkommen, beschreiben einfach die Unbeschränktheit gewisser Objekte. Zum Diagonalverfahren Das obige Diagonalverfahren kann man systematischer aufbauen, indem man es in zwei Teile zerlegt: in die Durchnummerierung eines kartesischen Produkts und die Abzählung von Teilmengen. Der erste Teil (Durchnummerierung eines kartesischen Produkts) beruht auf Folgendem N. Satz. Sind X und Y abzählbar unendliche Mengen, so ist auch ihr kartesisches Produkt X ) Y abzählbar unendlich. Beweis. Man kann o.B.d.A. annehmen, dass X und Y beide gleich N sind. Bezeichnen nämlich ' W N ! X und 4 W N ! Y Durchnummerierungen von X und Y , so ist die Abbildung ' ) 4 W N ) N ! X ) Y mit .' ) 4/.j; k/ ´ .'.j /; 4.k// bijektiv. Aus einer Durchnummerierung f W N ! N)N erhält man dann in Gestalt von .' )4/ıf eine Durchnummerierung von X ) Y . Die Elemente von N)N lassen sich nun wieder in einem Schema der folgenden Gestalt anordnen: .1; 1/ .1; 2/ .1; 3/ .1; 4/ ( ( ( .2; 1/ .2; 2/ .2; 3/ .2; 4/
(((
.3; 1/
.3; 4/
(((
.4; 1/ .4; 2/ .4; 3/ .4; 4/
(((
:: :
.3; 2/ :: :
.3; 3/ :: :
:: :
Dann kann man die Schrägzeilen der Reihe nach durchlaufen, etwa so: (2)
.1; 1/; .1; 2/; .2; 1/; .1; 3/; .2; 2/; .3; 1/; .1; 4/; .2; 3/; .3; 2/; .4; 1/; : : : ;
und erhält dadurch eine Durchnummerierung von N ) N. Man nennt ein solches Vorgehen ein Diagonalverfahren.
"
44
Kapitel 1 Die Zahlmengen der Analysis
Das konkrete Diagonalverfahren, das zur Liste aller Paare in (2) führt, ließe sich auch formelmäßig beschreiben (was aber die ohnehin bestehende Klarheit dieses Vorgehens nicht erhöhen würde). Jedenfalls erhält man so eine bijektive Abbildung ' W N ! N ) N, mit '.1/ D .1; 1/, '.2/ D .1; 2/, '.3/ D .2; 1/, '.4/ D .1; 3/, usw. Durch eine leichte Abänderung des Diagonalverfahrens sieht man, dass X ) Y immer noch abzählbar unendlich bleibt, falls einer der kartesischen Faktoren X oder Y endlich und der andere abzählbar unendlich ist. Im Falle, dass beide kartesische Faktoren endlich sind, ist auch X ) Y endlich und jX ) Y j D jX j ( jY j: Zur Durchnummerierung von Teilmengen gilt ähnlich wie bei Satz J[1.2]: O. Satz. Ist X abzählbar unendlich und A , X, so ist A abzählbar. Beweis. Wiederum dürfen wir o.B.d.A. annehmen, dass X D N, also A , N gilt. Dann streichen wir in der Liste 1; 2; 3; : : : alle Zahlen, die nicht zu A gehören. Übrig bleiben gewisse natürliche Zahlen a1 < a2 < a3 < ( ( ( , nämlich die von A. Bricht diese Liste ab, so ist A endlich, im anderen Fall liefert die Abbildung f W N ! A mit f .j / ´ aj eine Durchnummerierung von A. Das Streichen entspricht dem folgenden Rekursionsschema für die verbleibenden Elemente f .1/ ´ min fk j k 2 Ag;
f .nC1/ ´ min fk j k 2 Anff .1/; f .2/; : : : ; f .n/gg;
und ist damit präzisiert. Die einzelnen Schritte beruhen hierbei auf dem Wohlordnungssatz K[1.2]. " P. Folgerung. Gegeben sei eine Abbildung g W X ! Y . Ist X abzählbar unendlich, so ist das Bild g.X/ abzählbar. Beweis. O.B.d.A. kann wieder X D N angenommen werden. Zu jedem y 2 g.N/ ist die Urbildmenge g &1 .y/ eine nichtleere Teilmenge von N. Somit existiert k.y/ ´ min g &1 .y/ (Wohlordnungssatz). Dann ist g.k.y// D y, die Abbildung k W g.N/ ! N also injektiv und, betrachtet als Abbildung k W g.N/ ! k.g.N//, auch bijektiv. Als Teilmenge von N ist k.g.N// abzählbar (Satz O). Also ist auch g.N/ abzählbar. " Q. Satz. Ist .Xj /j 2J eine abzählbar unendliche Familie von abzählbar unendlichen S Mengen Xj , so ist auch die Vereinigung X WD j 2J Xj abzählbar unendlich.
45
Abschnitt 1.4 Zur Vollständigkeit
Beweis. Wieder kann o.B.d.A. J D N angenommen werden. Die Mengen Xj lassen sich dann in der Form aufschreiben X1 D fx11 ; x12 ; x13 ; : : :g X2 D fx21 ; x22 ; x23 ; : : :g X3 D fx31 ; x32 ; x33 ; : : :g :: : was wiederum eine Form des Diagonalverfahrens nahe legt. Tatsächlich ist dann die Vereinigung darstellbar als X D fx11 ; x12 ; x21 ; x13 ; x22 ; x32 ; : : :g; also X D F .N ) N/, wobei die Abbildung F W N ) N ! A definiert ist durch F .j; k/ ´ xj k . Da X z.B X1 als Teilmenge enthält, ist X unendlich. Nach N und P folgt, dass X abzählbar unendlich ist. " Mit leichten Abänderungen dieses Vorgehens kann man auch die Fälle behandeln, in denen die Mengenfamilie endlich ist oder unter den einzelnen Mengen auch endliche Mengen vorkommen. In all diesen Fällen resultiert immer eine abzählbare Vereinigung. Diese ist endlich, wenn sowohl die Familie wie auch alle Einzelmengen endlich sind. Neuer Beweis für die Abzählbarkeit von Q Will man die Abzählbarkeit von QC nochmals mittels dieser Sätze beweisen, so geht dies ganz einfach so: Man definiert eine Abbildung F W N)N ! QC durch F .j; k/ ´ j=k. Diese ist surjektiv, und N ) N ist abzählbar unendlich. Also ist QC abzählbar nach Folgerung P und unendlich, da N * QC . Die Abzählbarkeit von Q selbst ergibt sich jetzt z.B aus den vorangehenden Überlegungen aufgrund der Vereinigung Q D QC [ .&QC / [ f0g. Ein Wort zur Veranschaulichung Wir haben bisher ganz bewusst keine Bilder zur Veranschaulichung herangezogen, um darzutun, dass mathematische Schlüsse auf logischem Wege zustande kommen und nicht etwa aufgrund vager Vorstellungen. Diese „Strenge“ oder „Exaktheit“ gehört gewissermaßen zum Berufsethos der Mathematik. Trotzdem ist es vielfach hilfreich, exakte Argumente durch Figuren zu illustrieren. Die Anschauung soll ja nicht ausgesperrt werden, nur ist sie eben als Beweismittel nicht zugelassen. In diesem Sinne wird der reelle Zahlkörper durch die so genannte Zahlgerade veranschaulicht, eine (meistens) horizontale Gerade, auf der vielleicht einige ganze und
46
Kapitel 1 Die Zahlmengen der Analysis
reelle Zahlen in Gestalt von kleinen Marken (Striche oder Pfeile o.ä.) hervorgehoben sind. x -3
-2
-1
0
1
2
R 3
Aufgaben und Anmerkungen 1. Man beweise: Jede reelle Zahl x ist als Supremum einer Menge rationaler Zahlen darstellbar. Lösungshinweis: Man nehme die Menge M ´ fr 2 Q j r < xg und wende Satz L an. 2. Es ist eine wichtige Frage, wie viele ganze Zahlen in einem gegebenen Intervall liegen. Genauer: Kann man die Anzahl ganzer Zahlen in einem beschränkten Intervall durch die Länge des Intervalls abschätzen? Im höherdimensionalen Fall (den wir im Augenblick nur andeutungsweise beschreiben können) verallgemeinert sich dies zum Problem, wie viele Gitterpunkte in einem konvexen Körper liegen, möglichst ausgedrückt durch das Volumen des Körpers. Dazu hat Minkowski[1925] in dem von ihm begründeten Gebiet Geometrie der Zahlen bedeutsame Beiträge geliefert; vgl. auch Aufgabe 6. Wir bleiben aber hier im Eindimensionalen. Eine erste Feststellung ist in Lemma K getroffen: Bei b & a > 1 liegt im Intervall /a; bŒ mindestens eine ganze Zahl. Es ist aber klar, dass in einem „langen“ Intervall ungefähr b &a ganze Zahlen liegen werden. Dazu beweise man genauer: a) Bezeichnet n die Anzahl ganzer Zahlen im Intervall Œa; bŒ, so gilt b & a & 1 < n < b & a C 1: b) Ist a 2 R und m 2 N, so liegen im Intervall Œa; a C mŒ genau m ganze Zahlen. c) Bezeichnet n$ die Anzahl der Intervalle der Form Œk; k C 1Œ , Œa; bŒ mit k 2 Z, so gilt
b & a & 2 < n$ . b & a:
Lösungshinweis: Bei a) sei A0 ´ fk 2 Z j k 2 Œa; bŒ g, also n D jA0 j, und km ´ min A0 , kM ´ max A0 . Dann gilt km % a, aber km & 1 < a und kM < b, aber kM C 1 % b. Daraus folgt die Behauptung unter Beachtung von n D kM & km C 1. b) ist ein Spezialfall von a), und bei c) schließe man ähnlich wie in a).
47
Abschnitt 1.4 Zur Vollständigkeit
3. In dieser Aufgabe wird die obige Durchnummerierung (2) von N)N hergeleitet. a) Man beweise folgende Zerlegung von N ) N in „Diagonalschichten“: 1 [ N ) N D ' f.p; q/ 2 N ) N j p C q D rg: rD2
Die Marken am Vereinigungszeichen besagen, dass die Vereinigung für alle r 2 N mit r % 2 gebildet werden soll. Der Punkt bedeutet, dass die Mengen paarweise disjunkt sind. Was ist die anschauliche Bedeutung dieser Formel? b) Mittels E[1.3] zeige man damit, dass die Abbildung f W N ) N &! N;
f .p; q/ D
.p C q & 1/.p C q & 2/ Cp 2
bijektiv, also f &1 W N &! N ) N eine Durchnummerierung von N ) N ist. In Aufgabe 6[2.2] wird eine explizite Formel für die Umkehrfunktion f &1 W N ! N ) N aufgestellt werden. 4. $ Die Tatsache, dass N bijektiv auf N ) N abgebildet werden kann, ist stark verallgemeinerungsfähig. Es gilt nämlich der Multiplikationssatz der Mengenlehre: Ist X eine unendliche Menge, so existiert eine bijektive Abbildung von X auf X ) X. Zur Geschichte dieses merkwürdigen Satzes und den verschiedenen Beweismethoden sehe man Deiser[2005]. 5. Seien A; B nichtleere Teilmengen von R. Neben A [ B und A \ B betrachte man auch die Menge aller Summen C ´ fa C b j a 2 A und b 2 Bg: Man beweise a) Sind A; B beide nach oben beschränkt, so sind es auch A [ B, A \ B und C , und es gilt sup.A [ B/ D max fsup A; sup Bg sup C D sup A C sup B: b) Sind A; B beide nach unten beschränkt, so sind es auch A [ B, A \ B und C , und es gilt inf.A [ B/ D min finf A; inf Bg inf C D inf A C inf B:
48
Kapitel 1 Die Zahlmengen der Analysis
6. $ Lemma K kann nach dem ersten Hauptsatz von Minkowskis Geometrie der Zahlen auf folgende Weise in höhere Dimensionen übertragen werden: Wenn ein konvexer Körper mit dem Mittelpunkt 0 ein Volumen > 2n besitzt, so enthält er mindestens einen Gitterpunkt ¤ 0 im Inneren. Die eingehenden Begriffe können erst später eingeführt werden. Vgl. z.B. Weyl[1966], Kap. IV, 6.
2
Reelle Zahlenfolgen
Für viele Konstruktionen sind Folgen ein wichtiges Werkzeug. Sie dienen allgemein dazu, abzählbare Prozesse zu beschreiben. In der Analysis sind Folgen vor allem dann brauchbar, wenn sie konvergieren. Die Konvergenz ist ein fundamentaler Begriff, mit dem die Analysis erst richtig in Gang kommt. Wir erklären den Begriff einer Folge zunächst in beliebigen Mengen, gehen dann aber rasch zu Folgen in R und ihrer Konvergenz über.
2.1 Konvergenz Sei X eine beliebige Menge. Eine Folge in X stellt man sich anschaulich so vor, dass man in diskreten Schritten in der Menge X herum springt, und zwar beliebig lange. Hier die mathematische Präzisierung: A. Definition. Eine Folge in einer Menge X ist eine Abbildung a W N ! X. Jedem Element n 2 N ist also ein Element an 2 X zugeordnet. Die Elemente an heißen die Glieder der Folge und n jeweils der Index. Weitere gebräuchliche Symbole für eine Folge sind n 7! an
oder .an /n2N
oder a1 ; a2 ; a3 ; : : :
kurz auch .an / oder sogar an : X
Die anschauliche Vorstellung ist die, dass man in diskreten Schritten in der Menge X herum springt, und zwar beliebig lange. Zum „Zeitpunkt“ n befindet man sich am „Ort“ an 2 X.
a3 a1 a2
ˇ Anstelle von N kann als Indexmenge auch eine Teilmenge von Z der Form fj 2 Z ˇ j % j0 g verwendet werden. Die nötigen Abänderungen sind leicht und offensichtlich. Z.B. zählt man oft von 0 an, d.h. man betrachtet eine Folge a0 ; a1 ; a2 ; a3 ; : : : . Von jetzt an geht es um Folgen in R; es ist also X D R.
50
Kapitel 2 Reelle Zahlenfolgen
B. Beispiele. (i)
an D ˛, die konstante Abbildung mit Wert ˛; 1 (ii) bn D , die Folge der Kehrwerte natürlicher Zahlen; n (iii) cn D .&1/n , die Eins mit abwechselnden Vorzeichen;
(iv)
dn D n, die Folge der natürlichen Zahlen.
C. Definition. Die Folge .an /n2N heißt (i)
nach oben beschränkt bzw. nach unten beschränkt bzw. beschränkt, wenn ihre Bildmenge fa1 ; a2 ; a3 ; : : :g diese Eigenschaft hat;
(ii)
monoton wachsend, wenn für alle n 2 N gilt: an . anC1 ;
(iii) streng monoton wachsend, wenn für alle n 2 N gilt: an < anC1 ; Entsprechend zu (ii), (iii) sind die Begriffe monoton fallend bzw. streng monoton fallend definiert. Oberbegriff zu „monoton wachsend“, „monoton fallend“ ist monoton und entsprechend bei den strengen Varianten streng monoton. D. Beispiele. Von den Folgen aus B sind: an ; bn ; cn beschränkt; dn nicht nach oben beschränkt; an monoton wachsend und monoton fallend; bn streng monoton fallend; cn nicht monoton; dn streng monoton wachsend. Die Veranschaulichung einer reellen Zahlenfolge .an / kann auf zwei Arten erfolgen: Entweder markiert man (einige) Glieder an auf der Zahlgeraden, oder man bedient sich wie bei Funktionen einer Graphendarstellung, bei der über dem Abszissenwert n (auf der horizontalen Achse) als Ordinatenwert das zugehörige an (in Richtung der vertikalen Achse) aufgetragen wird. Den „asymptotischen“ Verlauf kann man aber so allenfalls erahnen.
R a4
a5
a3 (5,a5)
0
R
R 1
2
3
4
5
6
51
Abschnitt 2.1 Konvergenz
Die Konvergenz einer Folge .an / bedeutet, dass es eine feste reelle Zahl a gibt, der alle Glieder mit genügend großem Index beliebig nahe kommen. Dieses a ist dann der Grenzwert. Natürlich muss man präzisieren, was die Kombination „genügend großer Index – beliebig nahe“ bedeuten soll. Das geschieht auf folgende Weise: E. Definition (Konvergenz). Die Folge .an / heißt konvergent, wenn es ein a 2 R gibt mit folgender Eigenschaft: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass für alle n > N gilt: jan & aj < ". Ist dies der Fall, so heißt a der Grenzwert der Folge .an /, und man schreibt lim an D a
n!1
oder
an &! a
(für n &! 1):
Wir werden gleich sehen, dass der Grenzwert im Falle der Existenz eindeutig bestimmt ist. D.h. ein und dieselbe Folge kann nicht zwei verschiedene Grenzwerte besitzen. Die eingerahmte Eigenschaft nennen wir den ."; N /-Test. Will man die Konvergenz einer Folge mit dieser Definition nachweisen, so muss man den ."; N /-Test explizit durchführen. Dass in ihm diverse Ungleichungen vorkommen, ist der Grund, weswegen Abschätzungen in der Analysis so wichtig sind. Beispiele, wie der ."; N /-Test konkret ausgeführt werden kann, folgen in H. Besteht die Konvergenz an ! a, so weichen die Folgenglieder an vom Grenzwert a beliebig wenig ab, wenn nur der Index n hinreichend groß ist. Der Grenzwertbegriff realisiert also gleichzeitig den für die angewandte Mathematik zentralen Begriff der (beliebig genauen) Annäherung (= Approximation). Der Konvergenzbegriff ist absolut zentral für die Analysis und muss unbedingt verstanden werden. Es sei nochmals betont, was der eingerahmte Teil in der Definition E verlangt: Bei beliebig vorgegebener „Fehlerschranke“ " > 0 muss es möglich sein, einen (davon abhängenden) Index N zu finden, jenseits dessen die Folgenglieder an alle von a um weniger als " abweichen. Da der Index N i. Allg. von " abhängen wird, ist er in Definition E auch mit N."/ bezeichnet worden. Äquivalent kann man den ."; N /-Test auch so formulieren: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass gilt: n > N H) jan & aj < ". E. Zusatz. Gilt limn!1 an D a, so sagt man auch: .an / konvergiert (oder geht oder strebt) gegen a oder auch: a D limn!1 an existiert (in R). Gilt limn!1 an D 0, so nennt man .an / eine Nullfolge. Die Verneinung von „konvergent“ ist divergent.
52
Kapitel 2 Reelle Zahlenfolgen
Das Zeichen lim wird als „Limes“ ausgesprochen, die Verbindung n ! 1 als „n gegen Unendlich“, die Verbindung an ! a als „an gegen a“. Divergenz bedeutet, dass der ."; N /-Test für keine reelle Zahl a erfüllt ist. F. Bemerkung. Beim ."; N /-Test „kommt es nur auf kleine " > 0 an“. Das soll heißen: Ist "0 > 0 fest gegeben und gilt der ."; N /-Test in der Form ($) Zu jedem " > 0 mit " < "0 existiert ein N D N."/ 2 N, sodass für alle n > N gilt: jan & aj < ", so gilt er auch in der ursprünglichen Form (ohne den Zusatz " < "0 ). Ist nämlich ein " > 0 beliebig gegeben, so kann man ($) auf "0 ´ min f"; "0 =2g anwenden. Dafür ist dann 0 < "0 < "0 , und es gibt ein N 2 N mit: jan & aj < "0 für alle n > N . Für diese gilt erst recht jan & aj < ", da "0 . ". G. Satz. Eine konvergente Folge hat genau einen Grenzwert. Viele Limesüberlegungen beruhen auf geeigneten Vorausabschätzungen, das sind Ungleichungen, die es erlauben, das Kleinwerden des Ausdrucks jan & aj besser als auf direktem Wege zu erkennen. Letzten Endes muss man ja in der Lage sein, jan & aj „klein zu kriegen“. Das gelingt oft dadurch, dass man den Ausdruck jan &aj nach oben abschätzt, aber so, dass die Schranke selbst klein wird. Solche Vorausabschätzungen sollten unabhängig von eventuellen „"-Überlegungen“ sein, diese aber geeignet vorbereiten. Beweis von G. Sei a D limn!1 an und auch b D limn!1 an . Zu zeigen ist a D b. Hier ist eine mögliche Vorausabschätzung: (1)
ja & bj D ja & an C an & bj . ja & an j C jan & bj:
Gestützt auf (1) argumentiert man nun so: Ist ein " > 0 vorgegeben, so existieren gemäß E natürliche Zahlen N1 ; N2 mit (2)
jan & aj <
" 2
für n > N1 ;
jan & bj <
" 2
für n > N2 :
Hier ist also E auf 2" angewandt: Was für alle " > 0 geht, geht auch für mit neuen Schranken für n).
" 2
(natürlich
Sei N3 ´ max fN1 ; N2 g. Dann gilt in (2) beides, wenn n > N3 , also nach (1): (3)
ja & bj <
" " C D" 2 2
für jedes " > 0:
Da es nach J[1.1] keine kleinste positive Zahl gibt , ist ja & bj D 0, also a D b. Direkt kann man auch so schließen: Wäre ja&bj > 0, so ergäbe sich aus (3) ein Widerspruch, indem man " ´ ja & bj setzt. "
53
Abschnitt 2.1 Konvergenz
H. Beispiele. (i)
Für eine konstante Folge gilt lim ˛ D ˛:
n!1
Klar: Der Unterschied von an D ˛ zu ˛ ist stets 0, also beliebig klein für alle n. Hier tut es also N."/ ´ 1. (ii)
Für die Kehrwertfolge der natürlichen Zahlen gilt lim
n!1
1 D 0I n
sie ist also eine Nullfolge.
ˇ ˇ Zum Nachweis sei " > 0 gegeben. Wann wird ˇ n1 & 0ˇ D n1 < "? Umrechnung gibt äquivalent: 1" < n. Einmal können wir das schaffen: Da N nicht nach oben beschränkt ist (A[1.4]), gibt es eine natürliche Zahl N."/ > 1" . Dann aber gilt für alle n > N."/: n > 1" , somit n1 < ". Hier tut es also N."/ ´ 1" . Beachte: Ohne A[1.4] käme man hier nicht weiter! (iii) Zu jeder reellen Zahl x existiert eine Folge rationaler Zahlen rn mit limn!1 rn D x: Zu jedem n 2 N wähle man nämlich ein rn 2 Q mit x & n1 < rn < x C n1 . Solch ein rn gibt es nach L[1.4]. Dann gilt jrn & xj < n1 für alle n 2 N. Die gleiche Wahl von N."/ wie bei (ii) führt dann zur Erfüllung des ."; N /-Tests für rn ! x. Man drückt dieses Ergebnis auch so aus: Jeder reelle Zahl lässt sich beliebig genau durch rationale Zahlen annähern (approximieren). (iv) Ist M , R eine nichtleere, nach oben beschränkte Menge und s ´ sup M , so existiert eine Folge .sn / in M mit lim sn D s: n!1
Zu jedem n 2 N wähle man nämlich ein sn 2 M mit s & n1 < sn . s. Solch ein sn gibt es, da sonst s & n1 eine obere Schranke von M wäre. Dann gilt & n1 < sn & s . 0, also jsn & sj < n1 für alle n 2 N. Die gleiche Wahl von N."/ wie bei (ii) führt dann zur Erfüllung des ."; N /-Tests für sn ! s. Eine solche Folge kann sogar monoton wachsend gewählt werden. Denn für tn ´ max fs1 ; : : : ; sn g gilt tn 2 M und nach (13)[1.3] tnC1 % tn sowie s & n1 < sn . tn . s, also tn ! s (genau wie bei sn ). Ist eine Folge .an / gegeben und soll sie auf Konvergenz untersucht werden, so sind eigentlich zwei Dinge zu erledigen: Erstens muss der Grenzwert ermittelt oder zumindest vermutet werden. Zweitens muss der ."; N /-Test durchgeführt werden. Leider gibt es für beide Aufgaben kein universelles Rezept. Selbst wenn der Grenzwert bekannt ist, kann sich die Konvergenzprüfung mit Hilfe von " und N."/, die so genannte Epsilontik, schwierig gestalten. Glücklicherweise gibt es aber ein paar Methoden, mit
54
Kapitel 2 Reelle Zahlenfolgen
denen man die Konvergenz (oder auch die Divergenz) ohne Epsilontik erkennen kann. Dazu gehören die folgenden Aussagen I, K, N, O und Q. Unmittelbar klar aus der Definition der Konvergenz ist die Äquivalenz: (4)
an &! a () jan & aj &! 0;
insbesondere für a D 0: (5)
an &! 0 () jan j &! 0:
I. Satz. (i)
Ist die Folge .an / konvergent, so ist sie auch beschränkt.
(ii)
Majorantenkriterium für Folgen: Gilt jan & aj . bn für alle n und ist .bn / eine Nullfolge, so folgt lim an D a. n!1
(iii) Ist die Folge .an / beschränkt und .bn / eine Nullfolge, so ist auch .an bn / eine Nullfolge. Eine Ungleichung wie in (ii): jan & aj . bn mit bn ! 0 wird oft auch Fehlerabschätzung genannt. Die Umkehrung von (i) gilt nicht, wie man an der Folge cn D .&1/n sieht. Diese ist beschränkt, aber nicht konvergent. Die Aussage (i) dient hauptsächlich zur Erkennung der Divergenz. Denn sie besagt äquivalent: Ist die Folge .an / nicht beschränkt, so ist sie nicht konvergent. Beweis von I. Zu (i): Zu " ´ 1 wähle man N 2 N derart, dass für alle n > N gilt: jan & aj < 1. Dann folgt für diese n jan j D jan & a C aj . jan & aj C jaj < 1 C jaj: Somit ist jan j . max fja1 j; : : : ; jaN j; 1 C jajg für alle n 2 N. Zu (ii): Zu " > 0 wähle man N 2 N derart, dass für alle n > N gilt: jbn j < ". Dafür gilt dann auch jan & aj < ". Zu (iii): Sei jan j < c für alle n 2 N. Dann gilt: jan bn j . cjbn j. Wähle zu " > 0 " ein N 2 N, sodass für alle n > N gilt: jbn j < cC1 . Dafür ist dann auch jan bn j . c " < ". " cC1 J . Lemma (Meidungsprinzip). Die Folge .an / sei konvergent zum Grenzwert a. Dann gilt (i)
Ist b > a, so existiert ein n0 2 N, sodass für alle n % n0 gilt: an < b.
55
Abschnitt 2.1 Konvergenz
(ii) Ist c < a, so existiert ein n0 2 N, sodass für alle n % n0 gilt: an > c. Anschaulich gesprochen: Nach Voraussetzung nähern sich die Folgenglieder an für große n dem festen Wert a mit beliebiger Genauigkeit. Deshalb meiden sie für große n den Bereich der Zahlen x % b und auch der Zahlen x . c. Beweis von J. Zu (i): Zu " ´ b&a wähle man ein n0 2 N derart, dass jan & aj < b&a für alle 2 2 b&a bCa , also a < C a D < b; vgl. n > n0 . Dann gilt dafür auch: an & a < b&a n 2 2 2 (8)[1.1]. Zu (ii): Analog zu (i).
"
Das Meidungsprinzip gilt entsprechend für weitere Grenzwertbegriffe, die im Folgenden entwickelt werden. Den allgemeinen Hintergrund für seine Gültigkeit werden wir in H[6.2] kennen lernen. K. Satz (Rechenregeln für Grenzwerte). Aus an &! a und bn &! b folgt: (i)
jan j &! jaj
(ii)
an C bn &! a C b
(iii)
an ( bn &! a ( b an a &! ; falls b ¤ 0: bn b
(iv)
Dafür sagt man auch, die Grenzwertbildung sei kompatibel mit der Betragsbildung und den Körperoperationen. Beweis von K.
ˇ ˇ Zu (i): Es gilt die Vorausabschätzung ˇjan j&jajˇ . jan &aj als Folge der modifizierten Dreiecksungleichung I[1.1]. Daraus ergibt sich sofort die Behauptung, z.B. mittels (4). Zu (ii): Eine passende Vorausabschätzung ist hier: (6)
j.an C bn / & .a C b/j D jan & a C bn & bj . jan & aj C jbn & bj:
Wir versuchen, die Summanden ganz rechts „klein zu kriegen“. Das gelingt so: Zu einem gegebenen " > 0 gibt es natürliche Zahlen N1 ; N2 , sodass für n > N1 gilt: jan & aj < 2" und für n > N2 analog: jbn & bj < 2" . Für n > N3 ´ max fN1 ; N2 g wird also die linke Seite von (6) kleiner als 2" C 2" D ". Zu (iii): Eine Vorausabschätzung ist hier: jan bn & abj D jan bn & an b C an b & abj D jan .bn & b/ C b.an & a/j . jan j ( jbn & bj C jbj ( jan & aj:
56
Kapitel 2 Reelle Zahlenfolgen
Schaut man auf die Schranke ganz rechts, so ist diese eine Nullfolge. Dazu hat man lediglich einiges zu kombinieren, nämlich (4), die Aussagen von I und den vorhergehenden Punkt (ii). Mittels des Majorantenkriteriums folgt dann aus der Vorausabschätzung die Behauptung. an 1 Zu (iv): Es gilt D an ( . Mit Rücksicht auf (iii) reicht es also zu zeigen: bn bn bn &! b ¤ 0 H)
1 1 &! : bn b
Hierzu überlegen wir: Nach dem Meidungsprinzip, angewandt auf jbn j ! jbj, existiert ein N1 2 N, so dass jbn j >
jbj 2
für alle n > N1 :
Nun könnte allerdings b1 D ( ( ( D bN1 D 0 sein. Dann ist statt der Folge 3 nur die Folge b1n zu betrachten. Damit wird für alle n > N1 :
3
1 bn
n2N
n>N1
ˇ ˇ ˇ ˇ ˇ1 2 1 ˇˇ ˇˇ b & bn ˇˇ jb & bn j jb & bn j ˇ (7) D 2 ( jb & bn j: ˇ b & b ˇ D ˇ b b ˇ D jb j ( jbj . 1 b n n n jbj ( jbj 2 1 1 ! . Hierin geht die rechte Seite nach (iii) gegen 0, und es folgt bn b
"
L. Bemerkungen. (i)
In anderer Schreibweise lauten die Regeln aus Satz K: ˇ ˇ lim jan j D ˇ lim an ˇ n!1
n!1
lim .an C bn / D lim an C lim bn
n!1
n!1
n!1
lim .an ( bn / D lim an ( lim bn
n!1
n!1
lim an an n!1 D ; n!1 bn lim bn lim
n!1
n!1
falls
lim bn ¤ 0;
n!1
vorausgesetzt, die Einzellimites auf den rechten Seiten existieren jeweils. Wir nennen das die operative Schreibweise. (ii) Auf ein festes „Anfangsstück“ a1 ; : : : ; aK einer Folge a1 ; a2 ; a3 ; : : : kommt es bei Konvergenzbetrachtungen nicht an. Denn N."/ in Definition E kann durch max fK C 1; N."/g ersetzt werden. Dies ist generell so, ohne dass es jeweils explizit formuliert wird.
Abschnitt 2.1 Konvergenz
57
M. Satz. Sei q 2 R fest gewählt. Für die Folge der Potenzen q n gilt: (i)
q n ! 0, falls jqj < 1.
(ii) .q n / ist nicht beschränkt (also divergent), falls jqj > 1. Beweis. Zu (i): Im Falle q D 0 ist die Behauptung trivial. Sei also 0 < jqj < 1. Dann ist 1 D 1 C h mit h > 0. Es folgt mittels der Bernoullischen Ungleichung B[1.3] der jqj Reihe nach: 1 D .1 C h/n % 1 C nh jqjn 1 0 1 n n &! jqj . D D 0: 1 1 C nh 0Ch Ch n Dabei wurden beim letzten Konvergenzpfeil die Regeln aus K angewendet. Damit dies möglich ist, musste die davor stehende Umformung vorgenommen werden. Solche Umformungen sind auch in vielen anderen Fällen nützlich. Zu (ii): Diesmal gilt jqj D 1 C k mit k > 0. Wäre die Folge .q n / beschränkt, so wäre es auch die Folge .jq n j/, etwa mit der Schranke s. Aus jq n j . s folgte dann .1 C k/n . s, also 1 C nk . s, also n . s&1 für alle n 2 N. Dies ist ein Widerspruch k zur Unbeschränktheit von N; vgl. A[1.4]. " N. Satz (Hauptsatz über monoton wachsende Folgen). Eine monoton wachsende Folge .an / ist dann und nur dann konvergent, wenn sie nach oben beschränkt ist. Beweis. Zu „dann“: Sei also .an / nach oben beschränkt. Das Wesentliche ist die Konstruktion des Grenzwertes: Wir betrachten die Bildmenge der Folge, A ´ fa1 ; a2 ; a3 ; : : :g, setzen s ´ sup A und zeigen: s D limn!1 an . Zunächst wissen wir: Für alle n 2 N gilt: an . s. Denn s ist obere Schranke von A. Andererseits: Gegeben ein " > 0, so existiert ein N 2 N mit aN > s & " (da s kleinste obere Schranke von A ist). Wegen der Monotonie gilt für die n % N erst recht an > s & ". Zusammengenommen gilt für alle n % N : jan & sj D s & an < ". Zu „nur dann“: Das ist die „triviale Richtung“. Sie folgt unmittelbar aus I(i).
"
N. Zusatz. Im Konvergenzfall gilt limn!1 an D sup fa1 ; a2 ; a3 ; : : :g.
"
Analog hat man:
58
Kapitel 2 Reelle Zahlenfolgen
O. Satz (Hauptsatz über monoton fallende Folgen). Eine monoton fallende Folge .an / ist dann und nur dann konvergent, wenn sie nach unten beschränkt ist. Im Konvergenzfall gilt limn!1 an D inf fa1 ; a2 ; a3 ; : : :g.
"
Die nächsten zwei Sätze liefern zusätzliche Hilfsmittel über Folgen im Zusammenhang mit Ungleichungen. P . Satz. In Ungleichungen darf man „unscharf“ zur Grenze übergehen. Das soll heißen: Hat man zwei konvergente Folgen an ! a und bn ! b und gilt an . bn für alle n 2 N, so ist a . b. Beweis. Mittels K folgt: bn & an ! b & a. Wäre b < a, also b & a < 0, so existierte nach dem Meidungsprinzip J ein N1 2 N mit: bn & an < 0 für alle n > N1 , also bn < an für alle n > N1 . Das ist ein Widerspruch zur Voraussetzung. " Warnung: Aus an < bn folgt zwar an . bn , also hiernach im Falle der Konvergenz: a . b, aber i. Allg. nicht a < b. Ein einfaches Gegenbeispiel erhält man für an ´ 1=.2n/ und bn ´ 1=n. Hier ist stets an < bn , aber lim an D lim bn D 0. n!1
n!1
Q. Satz (Einschnürung). Gilt für drei Folgen: an . cn . bn für alle n und ist außerdem limn!1 an D limn!1 bn D a, so gilt auch limn!1 cn D a. Beweis. Aus &jan & aj . an & a . cn & a . bn & a . jbn & aj ergibt sich die Vorausabschätzung: jcn & aj . max fjan & aj; jbn & ajg: Zum gegebenen " > 0 wählen wir N1 ; N2 2 N mit jan & aj < " für alle n > N1 ;
jbn & aj < " für alle n > N2 :
Dann wird: jcn & aj < " für alle n > N ´ max fN1 ; N2 g.
"
Wir berechnen noch einen konkreten Grenzwert, der uns bei der Exponentialfunktion helfen wird. Dabei benötigen wir das folgende Hilfsmittel, das auch für „Bankleute“ von Interesse ist: Angenommen, eine Aktie steigt von C – 100 auf C – 125, also um 25%, fällt dann aber wieder auf C – 100. Quizfrage: Wie groß ist dieser Verlust, ausgedrückt in Prozent? – Die Antwort 25% wäre falsch; denn 25% von C – 125 sind C – 31,25! Rechnet man in richtigen Bruchteilen statt in Prozent (sodass z.B. 25% dem Bruchteil 0;25 entspricht), so reduziert sich die Frage auf die Gleichung (8)
.1 C x/.1 & y/ D 1:
Dabei ist x der Bruchteil der Wertsteigerung und y der Bruchteil des Verlusts, um den alten Wert zu erhalten. Die Auflösung dieser Gleichung nach y ist ganz einfach:
59
Abschnitt 2.1 Konvergenz
R. Lemma. Zu jedem x ¤ &1 gibt es genau ein y mit (8), nämlich y D
x . 1Cx
"
Ist also im obigen Beispiel x D 0;25 (entsprechend 25%), so ist y D 0;25=1;25 D 0;2 (entsprechend 20%). Der obige Verlust beträgt also 20%. S. Lemma. Ist .cn / eine Nullfolge, so gilt: 3 cn -n 1C D 1: n!1 n lim
Beweis. Vorausabschätzung nach unten: Mittels der Ungleichung von Bernoulli B[1.3] sieht man: 3 cn -n cn cn 1C %1Cn( D 1 C cn ; falls 1 C > 0: n n n Das letzte gilt aufgrund des Meidungsprinzips nach einem gewissen n1 . Vorausabschätzung nach oben: Für n > n1 setzen wir xn WD cnn , und es sei yn WD xn der nach Lemma R zugehörige y-Wert. Dann gilt wieder unter Verwendung der 1Cxn Ungleichung von Bernoulli: /n . 1 1 .1 C xn /n D . ; falls 1 & nyn > 0: 1 & yn 1 & nyn Beachte: Aus 1 & nyn > 0 folgt von alleine 1 & yn > 0. Es gilt xn ! 0, yn ! cn ! 0, sodass die vorstehende Bedingung aufgrund des 0 und sogar nyn D 1Cx n Meidungsprinzips nach einem gewissen n2 > n1 erfüllt ist. Zusammengenommen gilt: 3 cn -n 1 1 C cn . 1 C . ; n 1 & nyn Durch Einschnürung (Q) folgt daraus die Behauptung.
falls n > n2 : "
T. Bemerkungen. (i) Wir schauen nochmals auf die Formulierung des ."; N /-Tests in Definition E. Dort erscheint die eigentliche Behauptung „jan & aj < "“ ganz am Schluss. Das ist logisch angemessen, da zuerst etwas über die in ihr vorkommenden Objekte n und " verfügt werden muss (und zwar mit Hilfe der Quantoren „es gibt“ und „für alle“). Andererseits ist diese Anordnung sprachlich etwas umständlich. Um hier flexibler zu werden, setzen wir gelegentlich die Verfügung „für alle n > N “ hinter die eigentlichen Behauptung, insbesondere dann, wenn diese beiden Dinge in einer Formelzeile
60
Kapitel 2 Reelle Zahlenfolgen
erscheinen, z.B. in (7). Manchmal wird dann der Kürze halber das Wort „alle“ weggelassen, wie z.B. in (2). Gemeint ist aber immer die logisch präzise Form mit Voranstellung der Quantoren-Verfügungen. (ii) Rein inhaltlich wird der ."; N /-Test aus Definition E häufig in leicht abgewandelter Form gebraucht, indem nämlich die Wendung „n > N “ durch „n % N “ ersetzt wird oder die Wendung „jan & aj < "“ durch „jan & aj . "“. Alle diese Umformu0 lierungen sind aber äquivalent. Aus ( )jan & aj . " für alle n >0 (N" )."/ folgt nämlich " 0 " jan & aj . 2 < " für alle n > N 2 , also auch für alle n % N 2 C 1. (iii) Als Formel aufgeschrieben lautet die komplette Definition E: (9) .an / konvergent W ()
9 a 2 R 8 " > 0 9 N 2 N 8 n > N W jan & aj < ":
Bei solchen formelmäßigen Formulierungen sollte die Reihenfolge der QuantorenVerfügungen genau eingehalten und auch die eigentliche Behauptung erst an den Schluss gesetzt werden. Dies hat den Vorteil, dass Verneinungen leicht formal zu bilden sind, indem die Quantoren 8 und 9 vertauscht und die eigentliche Behauptung negiert wird (Verneinungsmechanik). Z.B. ergibt sich so aus der Konvergenzdefinition (9) die Divergenzdefinition: (10) .an / divergent W ()
8 a 2 R 9 " > 0 8 N 2 N 9 n > N W jan & aj % ":
Das kann natürlich wieder sprachlich zurückformuliert werden als: Die Folge .an / ist divergent, wenn für alle a 2 R ein " > 0 existiert, sodass für alle N 2 N ein n > N existiert mit: jan & aj % ". Konvergente Folgen sind (neben den Körper- und Anordnungsoperationen) die wichtigsten Hilfsmittel, um Objekte der Analysis zu konstruieren. Soll eine reelle Zahl a wirklich konstruktiv erfasst werden (über ihre bloße Existenz hinaus), so wird dies i. Allg. nur möglich sein, indem man eine Folge .an / angibt, die gegen a konvergiert. Insbesondere ist die Dezimalbruch-Entwicklung einer reellen Zahl a nichts anderes als eine Folge rationaler Zahlen mit dem Grenzwert a; vgl. Abschnitt 2.8. Aufgaben und Anmerkungen 1. Man berechne
n7 C 3n C 4 : n!1 2n7 C 11 Lösungshinweis: Bei Ausdrücken dieser Art ist es günstig, mit einer geeigneten Potenz von n zu kürzen und dann die Rechenregeln aus Satz K anzuwenden: lim
4 3 1C 6 C 7 n7 C 3n C 4 n n &! 1 C 0 C 0 D 1 : D 11 2n7 C 11 2C0 2 2C 7 n
61
Abschnitt 2.2 Anwendung auf die Wurzelfunktion
2. Gegeben sei die Folge an D a)
1 C 3.&1/n n2 C 13n3 ; n D 1; 2 : : : . n3
Man zeige (wie in Aufgabe 1): lim an D 13. n!1
&5
b) Man gebe zu " D 10 ein N an, sodass gilt: jan & 13j < 10&5 für alle n > N . Dasselbe für " D 10&10 . 3. In Ergänzung der Rechenregeln aus Satz K beweise man: Gilt für zwei Folgen an &! a;
bn &! b;
so folgt max fan ; bn g &! max fa; bg min fan ; bn g &! min fa; bg: Lösungshinweis: Formel (12)[1.3]. 4. Für eine Folge .an / und ein q 2 Œ0; 1Œ gelte janC1 j . q ( jan j für alle n: Man zeige: lim an D 0. n!1
5. Das Resultat der Aufgabe 4 kann angewendet werden, um Nullfolgen zu erkennen: Man bildet den Quotienten ˇ ˇ ˇ anC1 ˇ ˇ ˇ ˇ a ˇ n und schaut, ob er durch eine Zahl q 2 Œ0; 1Œ nach oben beschränkt ist (eventuell ab einem festen Index n1 ). Ist dies der Fall, so folgt limn!1 an D 0 (Quotientenkriterium für Folgen). Damit zeige man z.B. für feste p 2 N und a 2 R: a)
lim np an D 0,
n!1
falls jaj < 1,
b)
an D 0, n!1 nŠ lim
c)
nŠ D 0. n!1 nn lim
2.2 Anwendung auf die Wurzelfunktion Wir haben früher schon betont, wie wichtig Folgen für Konstruktionen in der Analysis sind. Konstruktive Prozesse haben gegenüber abstrakten Überlegungen den Vorzug, dass sie komplett (oder zumindest ansatzweise) praktische Anweisungen enthalten. Sie stellen also eine wichtige Brücke zu den Anwendungen dar. Natürlich wird man
62
Kapitel 2 Reelle Zahlenfolgen
versuchen, Konstruktionen zugleich als Existenzbeweise zu gestalten. Diesem Prinzip folgen wir hier, zunächst für die Existenz der Quadratwurzel, in Kürze auch für die Existenz weiterer Grundobjekte wie der natürlichen Exponentialfunktion und der mathematischen Naturkonstanten e und &. Sei c eine positive reelle Zahl. Wenn man die Quadratwurzel von c einführen will, so geht es um die Frage nach den positiven Lösungen der Gleichung y 2 D c (c gegeben, y gesucht). Wir geben zunächst eine (unpräzise) Motivierung, wie man eine Lösung konstruieren kann, indem man Näherungslösungen weiter verbessert: Ist ˇ eine näherungsweise Lösung, also ˇ 2 ungefähr gleich c, so suchen wir eine exakte Lösung in der Form ˇ 0 ´ ˇ C d . Es soll also gelten: ˇ 02 D c, d.h. ˇ 2 C 2ˇd C d 2 D c. Da d klein sein wird, vernachlässigen wir hierin d 2 , bestimmen also d aus ˇ 2 C 2ˇd D c, 1 .c & ˇ 2 /. Wir vermuten, dass das zugehörige ˇ 0 eine bessere Näherung d.h. d D 2ˇ der Lösung ist als ˇ, wobei . / 1 c 1 2 0 .c & ˇ / D ˇC : ˇ ´ˇCd DˇC 2ˇ 2 ˇ Diese Vermutung wird sich bald bewahrheiten. Wendet man dann auf dies Näherungslösung das gleiche Verfahren erneut an u.s.w, so kann man hoffen, eventuell in der Grenze eine exakte Lösung zu erhalten. Auch dies wird sich gleich bestätigen. A. Satz. Zu jedem c > 0 existiert genau ein w > 0 mit w 2 D c. Beweis. Eindeutigkeit: Angenommen, es sei w 2 D c und v 2 D c. Aus w 2 D v 2 folgt w 2 & v 2 D 0, also .w & v/.w C v/ D 0. Wegen w C v > 0 folgt daraus w & v D 0, also w D v. Existenz: Dies erfolgt mit dem so genannten Heron-Verfahren, das durch die obige Vorüberlegung motiviert ist: Wir starten mit einer frei gewählten Zahl b > 0 und definieren eine Folge .bn /n%0 über das Rekursionsschema 8 ˆ < b0 ´ b (1) c 13 ˆ bn C ; für n % 0: : bnC1 ´ 2 bn Es handelt sich also um ein Iterationsverfahren. Klar ist, dass alle bn positiv und wohldefiniert sind (vollständige Induktion). Das Wichtigste ist der Nachweis, dass die so definierte Folge .bn / konvergiert. Ist dies getan, so kann man ihren Grenzwert g % 0 allein aus dem Rekursionsschema berechnen. Hiernach gilt ja durch Umstellen 2bn bnC1 D bn2 C c, woraus durch Grenzübergang
Abschnitt 2.2 Anwendung auf die Wurzelfunktion
63
n ! 1 folgt 2g 2 D g 2 C c. Dabei wurden die Regeln aus K[2.1] angewendet. Damit ist g 2 D c, insbesondere g > 0. Somit ist g die gesuchte Lösung w. Zur Konvergenz von .bn /: Zunächst ist die Folge .bn /n%1 monoton fallend. Um dies zu sehen, rechnet man mit Hilfe von (1) so: . / 1 c 1 1 c bn & bnC1 D bn & bn C D bn & 2 bn 2 2 bn . /2 c 1 bn&1 C &c 2 bn & c 4 bn&1 D D 2bn 2bn . /2 2 c c 2 bn&1 C 2c C 2 & 4c bn&1 & bn&1 bn&1 D % 0: D 8bn 8bn Zusammen mit bn > 0 ergibt sich nach O[2.1] die Konvergenz.
"
Im trivialen Fall c D 0 hat die Gleichung y 2 D 0 genau eine Lösung, nämlich 0, wie aus der Nullteilerfreiheit folgt. p 0 mit B. Definition. Für x > p 0 sei x die nach Satz A eindeutig bestimmte Zahl pw > C W R0 ! w 2 D x. Für x D 0 sei 0 ´ 0. Damit ist die Quadratwurzelfunktion R wohldefiniert. Das Symbol
p x wird als Wurzel x gesprochen.
C. Bemerkungen. (i) Da der Startwert b beim Heron-Verfahren beliebig ist, kann jedes der auftretenden bn als Startwert betrachtet werden, selbst wenn es zuvor falsch berechnet wurde (allerdings > 0 ist): Das Heron-Verfahren korrigiert sich also nach Rechenfehlern während der Iteration von selbst! (ii)
Allein aus der eindeutigen Existenz der Wurzel folgen die Regeln: r p p p p c1 c1 c1 ( c2 D c1 ( c2 ; Dp ; c2 c2
soweit die Argumente der Wurzelausdrücke, die so genannten Radikanden, nichtnegativ bzw. im Nenner positiv sind. Zum Nachweis überprüft man einfach, dass beide Seiten nichtnegativ sind und derselben Gleichung vom Typ y 2 D c genügen. Z.B. sind bei der zweiten Behauptung beide Seiten offensichtlich % 0, und das Quadrat der rechten Seite gleich . p /2 p c1 . c1 /2 c1 D D ; p p c2 . c2 /2 c2
64
Kapitel 2 Reelle Zahlenfolgen
sodass diese rechte Seite die definierenden Eigenschaften der linken Seite besitzt, also mit dieser übereinstimmt. (iii) Nach dem obigen Schluss bei der Eindeutigkeit pist die pLösungsmenge der Gleichung y 2 D x (x % 0 gegeben, y gesucht) gerade: f x; & xg, also bei x > 0 zweielementig.pMan unterscheide also scharf zwischen dem eindeutig definierten Wurzelausdruck x und der (i.Allg. zweielementigen) Lösungsmenge der Gleichung y 2 D x. (iv) Bei Brüchen, die im Zähler oder Nenner Quadratwurzeln enthalten, wird zur Umformung häufig der so genannte Wurzeltrick verwendet. Dieser besteht in Umformungen des Typs p a aD p ; a p p 1 aC b ; p D p a&b a& b
p a&b bDp p a Cpb p 1 a& b D p p a&b aC b p
a&
für a; b > 0 für a; b > 0; a ¤ b:
Gemeinsam ist diesen Formeln, dass mit der Summe bzw. der Differenz der Wurzeln erweitert wird, wenn ursprünglich die Differenz der Wurzeln vorhanpbzw.pdie Summe p p den war, und anschließend die Formel . a C b/. a & b/ D a & b Verwendung findet. Solche Umformungen sind oftmals sehr hilfreich. Beim Rechnen mit Wurzelausdrücken wird man sich an die definierende Eigenschaft und an die aufgestellten Regeln halten, wie sie in B und C(ii) formuliert sind. Das Heron-Verfahren (oder ein damit äquivalentes Verfahren) dient dem erforderlichen Existenzbeweis, bleibt aber später usw. im Hintergrund: Niemand pbei Umformungen p p denkt bei Rechnungen wie z.B. . 2 & 1/. 2 C 1/ D 1 daran, dass 2 mittels eines Iterationsverfahrens definierbar ist! Entsprechendes gilt allgemein, z.B. für die später zu behandelnde Exponentialfunktion: Mathematische Objekte sollten vor ihrer Verwendung sauber eingeführt, insbesondere existenzmäßig abgesichert werden. Bei der weiteren Handhabung gibt man aber den zugehörigen Regeln und Eigenschaften den Vorzug, besonders dann, wenn diese einfacher sind als der zuvor erbrachte Existenzbeweis. Trotzdem ist der Existenzbeweis nötig und sinnvoll, einmal vom Grundsätzlichen her, aber auch weil er u.U. konstruktive Elemente enthält, die für die Anwendung interessant sein können. Irrationalität von
p 2
Die Quadratwurzel liefert in unserem p Aufbau die ersten konkreten Beispiele für irrationale Zahlen. Der Beweis, dass 2 keine rationale Zahl sein kann, wurde bereits von Euklid geführt. Er stützt sich auf folgende einfache Tatsache: Jede natürliche Zahl n ist entweder gerade, d.h. von der Form n D 2m für ein m 2 N, oder aber ungerade, d.h. von der Form n D 2m & 1 für ein m 2 N. Euklids Beweis kann folgendermaßen beschrieben werden:
65
Abschnitt 2.2 Anwendung auf die Wurzelfunktion
p Angenommen, es wäre 2 D p=q mit p; q 2 N möglich. Dann können wir es einrichten, dass p und q nicht beide gerade sind, weil man sonst sukzessive durch 2 kürzen kann. Da beim Kürzen Zähler und Nenner p kleiner werden, endet dieses Kürzen nach endlich vielen Schritten. Nun folgt aus 2 D p=q durch Quadrieren und Multiplizieren 2q 2 D p 2 , also ist p 2 gerade, und damit auch p selbst. Denn aus p D 2m & 1 würde folgen p 2 D 2.2m2 & 2m/ C 1, also p ungerade. Somit ist p D 2p1 mit einem p1 2 N. Eintragen in 2q 2 D p 2 gibt 2q 2 D 4p12 , also q 2 D 2p12 . Dann ist nach dem gleichen Schluss auch q gerade, im Widerspruch zu der getroffenen Wahl von p; q. p Aus der Existenz der konkreten Irrationalzahl 2 in R folgt die Unvollständigkeit des rationalen Zahlkörpers Q: Wäre der Körper Q vollständig, so enthielte er nach dem gleichen Schluss wie für R die positive Lösung der Gleichung y 2 D 2, was ja gerade nicht möglich ist. Aufgaben und Anmerkungen p p p 1. Ist die Gleichung 4 C 2 3 D 1 C 3 richtig oder falsch?
p das arithmetische Mittel und ab das 2. Für nichtnegative Zahlen a; b heißt aCb 2 geometrische Mittel. Man beweise die Ungleichung vom arithmetischen und geometrischen Mittel p aCb ab . 2 p p durch Betrachtung des Ausdrucks . a & b/2 . Weiter zeige man, dass in dieser Ungleichung genau dann das Gleichheitszeichen steht, wenn a D b ist. r nC1 . Man zeige: lim wn D 1: 3. Sei wn ´ n!1 n Lösungshinweis: Die Differenz zum vermuteten Grenzwert 1 kann mit dem Wurzeltrick umgeformt werden: r p p nC1 nC1& n .n C 1/ & n Dp p &1D p p : n n n. n C 1 C n/ Hieraus folgt 0 < wn & 1 D p
1 n.n C 1/ C n
<
1 ; n
woraus man die Behauptung abliest. 4. Zum Heron-Verfahren (1) soll gezeigt werden: p p a) Für den Fehler dn WD bn & c bzw. den relativen Fehler rn WD dn = c bestehen für n % 1 die Abschätzungen: 1 ˇˇ 1 c 1 ˇˇ c ˇˇ c ˇˇ 0 . rnC1 . rn2 : 0 . dn . bn & . ( ˇbn&1 & ˇ . n ( ˇb & ˇ; bn 2 bn&1 2 b 2
66
Kapitel 2 Reelle Zahlenfolgen
Die zweite Formel zeigt die überaus rasche „quadratische“ Konvergenz des HeronVerfahrens, sobald man „nahe genug dran“ ist, was mit der ersten Formel entschieden werden kann. p b) Für c D 2 und b D 1 entsteht eine Folge p rationaler Zahlen rn WD 2=bn mit 2 D limn!1 rn D sup fr1 ; r2 ; r3 ; : : : g. Da 2 irrational ist, besitzt die Teilmenge fr1 ; r2 ; r3 ; : : : g von Q kein Supremum in Q. Daraus ergibt sich erneut, dass Q nicht vollständig ist. 5. Liefert das Heron-Verfahren (1) auch für c D 0 das richtige Ergebnis? 6. Diese Aufgabe knüpft an Aufgabe 3[1.4] an, in der eine bijektive Abbildung f W N ) N ! N explizit (über die Diagonalschichten in N ) N) angegeben wurde. Man beweise nun folgende formelmäßige Darstellung der Umkehrabbildung ' ´ f &1 W N ! N ) N: '.n/ D .p; q/ mit 0 ! p ' 1 m&1 1 C 8n C 1 ; q ´ m & p: ; p ´n& m´& & 2 2 Die Abbildung ' liefert also eine Formel zur Durchnummerierung von N ) N (die auch leicht programmierbar ist).
2.3
Intervallschachtelungen
Die Annäherung einer reellen Zahl durch eine Folge wird noch effektiver, wenn man zwei Folgen verwendet, die die reelle Zahl gleichzeitig von unten und oben approximieren. Diese Situation wird durch den Begriff der Intervallschachtelung erfasst: A. Definition. Eine Intervallschachtelung in R ist eine Folge .Œan ; bn //n2N von Intervallen mit: (i) (ii)
Œan ; bn / - ŒanC1 ; bnC1 / für alle n 2 N; lim .bn & an / D 0.
n!1
Es handelt sich also um aufeinander folgende Intervalle, bei denen das nächste jeweils im vorhergehenden enthalten ist und die Interval-Längen eine Nullfolge bilden. Die anschauliche Situation ist wie folgt:
a1
a2
a3
....
b3
b2
b1
R
67
Abschnitt 2.3 Intervallschachtelungen
Äquivalent mit (i) ist offensichtlich: (i*) an . bn für alle n 2 N;
.an / monoton wachsend;
.bn / monoton fallend:
B. Satz (Hauptsatz zur Intervallschachtelung). Ist .Œan ; bn //n2N eine Intervallschachtelung in R, so existiert der gemeinsame GrenzT wert s ´ limn!1 an D limn!1 bn , und der Durchschnitt D ´ n2N Œan ; bn / ist die einelementige Menge D D fsg. Man sagt auch, die Intervallschachtelung zieht sich auf diesen gemeinsamen Grenzwert s zusammen. Beweis. Nach (i*) und den Hauptsätzen über monotone Folgen N,O[2.1] existieren die Grenzwerte a ´ lim an ; b D lim bn ; n!1
n!1
wobei stets an . a und b . bn ist. Daraus folgt bn &an D .bn &b/C.b&a/C.a&an /, also mit den Regeln aus K[2.1]: 0 D 0 C .b & a/ C 0, d.h. b D a. Somit ist an . a D b . bn für alle n, also a D b 2 D. Kann der Durchschnitt D mehr als das Element a D b enthalten? Angenommen, c 2 D. Dann ist an . c . bn für alle n, also a . c . b; denn a war die kleinste obere Schranke der an und b die größte untere Schranke der bn . Es folgt c D a D b. " Mit Hilfe von Intervallschachtelungen können wir zwei sehr grundlegende Dinge beweisen: C. Satz. Der Körper R der reellen Zahlen ist überabzählbar. Der Körper Q der rationalen Zahlen ist nicht vollständig. Beweis. Zum Körper R: Angenommen, j 7! xj wäre eine Bijektion von N auf R, d.h. wir hätten die Durchnummerierung R D fx1 ; x2 ; x3 ; : : :g mit paarweise verschiedenen xj . Wir wählen dann abgeschlossene Intervalle In induktiv folgendermaßen: I1
D Œa; b/
mit x1 … I1 ; a < b
I1
0
I2
mit x2 … I2
I2
0 :: :
I3
mit x3 … I3
a
b
Dabei sei InC1 ab n D 1 jeweils eines der drei gleich langen Teilintervalle von In , und zwar ein solches, in dem xnC1 nicht enthalten ist. Die In bilden offensichtlich eine
68
Kapitel 2 Reelle Zahlenfolgen
T Intervallschachtelung. Sei n2N In D fsg. Dann ist s ¤ xn für alle n 2 N (da s 2 In , aber xn … In ). Also käme s in der Durchnummerierung nicht vor. Widerspruch! Zum Körper Q: Wäre Q vollständig, so könnten wir auf Q die gleichen Schlüsse anwenden wie auf R. Also wäre Q überabzählbar, was laut J[1.4] nicht zutrifft. " Eine einfache Konsequenz ist: Q ¤ R. Es gibt also auf jeden Fall irrationale Zahlen. Tatsächlich sind es sogar überabzählbar viele. Wäre nämlich R n Q abzählbar, so auch R D Q [ .R n Q/. Die Vereinigung zweier abzählbarer Mengen ist nämlich wiederum abzählbar; vgl. Q[1.4]. Auch jedes Intervall ist überabzählbar (wenn es nicht leer und nicht einelementig ist). Das sieht man durch eine leichte Abänderung des Beweises bei Satz C. Daraus folgt wie eben, dass auch in jedem solchen Intervall überabzählbar viele irrationale Zahlen liegen. Erstaunlicherweise kann man also die Existenz „vieler“ irrationaler Zahlen auf diesem begrifflichen Weg nachweisen. Aufgaben und Anmerkungen 1. Es sei .an / eine monoton fallende Nullfolge und .bn / eine monoton fallende nach unten beschränkte Folge. Man zeige, dass die Folge der Intervalle Œ&an ; an =.1 & bn an // ab einem gewissen Index eine Intervallschachtelung definiert, die sich auf 0 zusammenzieht. 2. Wird in der Definition A einer Intervallschachtelung die Bedingung (ii) weggeT lassen, so kann der Durchschnitt D ´ Œan ; bn / auch mehr als einen Punkt n2N enthalten. Man überlege hierzu: a)
Ist an ´ &1 & 1=n; bn ´ 1 C 1=n, so ist A(i) erfüllt und D D Œ&1; 1/.
b) Aus A(i) alleine folgt generell, dass D ein Intervall ist, nämlich D D Œa; b/ mit a ´ lim an , b ´ lim bn . n!1
2.4
n!1
Anwendung auf die Exponentialfunktion und e
Die natürliche Exponentialfunktion gehört zu den wichtigsten Funktionen der Analysis. Wir wollen sie möglichst frühzeitig zur Verfügung haben. Deshalb konstruieren wir sie bereits hier, ohne weitreichende Hilfsmittel heranzuziehen. Tatsächlich ist dies möglich, indem wir uns auf die bisherigen Aussagen über Folgen und Intervallschachtelungen stützen. Der Einstieg erfolgt hier nicht durch eine Verbesserung von Näherungswerten wie bei der Wurzelfunktion, sondern über eine strukturelle Überlegung. Wir fragen nämlich, ob es eine Abbildung von R in R gibt, die „Summen in Produkte überführt“, präzise
Abschnitt 2.4 Anwendung auf die Exponentialfunktion und e
69
ausgedrückt in der folgenden Regel (F). Nimmt man zu dieser Grundregel noch eine gewisse Schrankenbedingung (U) hinzu, so kann man die Exponentialfunktion in der Tat damit charakterisieren und sogar konstruieren.
1 -1
0
Die Schrankenbedingung sagt anschaulich, dass der Graph der Exponentialfunktion über der Geraden mit der Steigung 1 durch den Punkt .0; 1/ liegt. A. Satz. Es gibt genau eine Funktion f W R ! R mit: (F) (U)
f .a C b/ D f .a/ ( f .b/ f .a/ % 1 C a
für alle a; b 2 R für alle a 2 R:
Eine Eigenschaft einer Funktion f wie in (F) wird allgemein als Funktionalgleichung bezeichnet. Eindeutigkeitsbeweis für A. Das Beweismuster ist hier so, dass möglichst viele Folgerungen aus der Funktionalgleichung (F) und der Ungleichung (U) gezogen werden. Gelingt es, so viele Konsequenzen abzuleiten, dass das gesuchte Objekt f eindeutig festgelegt wird, so ist seine Eindeutigkeit bewiesen, und man erhält gleichzeitig einen Hinweis zum Existenzbeweis. Konsequenzen aus (F), (U) (unter Voraussetzung der Existenz von f ): Dieses Vorgehen startet ganz einfach, indem man spezielle Argumente wählt: ' Setze in (F): a D b D 0: Das liefert f .0/ D f .0/f .0/. Setze in (U): a D 0: Das ergibt f .0/ % 1. Aus beidem folgt: f .0/ D 1:
70
Kapitel 2 Reelle Zahlenfolgen
' Setze in (F): b D &a: Das gibt 1 D f .0/ D f .a/f .&a/. Da nach (U) f .a/ % 1 für a % 0 gilt, folgt f .&a/ > 0 für a % 0, also f .a/ > 0
und
f .&a/ D
1 f .a/
für alle a 2 R:
' Ersetze in (U) a durch &a: Das gibt f .&a/ % 1 & a. Also ist somit f .a/ .
1 1&a
1 % 1 & a und f .a/
für alle a < 1:
' Vollständige Induktion liefert aus (F) für n 2 N und beliebige reelle Argumente ai : f .a1 C ( ( ( C an / D f .a1 / ( ( ( f .an /; speziell f .a/ D f
3a n
C ((( C
3 a -n aDf n n
für alle a 2 R; n 2 N;
wobei das Argument von f im zweiten Term aus n gleichen Summanden besteht. a 1 (das zweite für a < 1) das a durch und ' Ersetze in 1 C a . f .a/ . 1&a n schließe der Reihe nach: 3aa a 1 1C . f für < 1 . a n n n 1& n 3 a -n 3 1 jaj a -n . f . 3 für < 1: 1C -n a n n n 1& n Beim Übergang zur zweiten Zeile durch Potenzieren musste die neue Bedingung hinzugefügt werden, damit alle Terme positiv werden. Zusammen mit dem vorangehenden Punkt ergibt sich also: 3 a -n 1 1C . f .a/ . 3 a -n n 1& n
für n > jaj:
Der Funktionswert f .a/ ist damit in zwei Schranken eingeschlossen. Diese sind so gut, dass sie bei festem a in Abhängigkeit von n 2 N den Funktionswert beliebig genau annähern. Denn wir zeigen nun (unabhängig von der augenblicklichen Folgerungsserie):
Abschnitt 2.4 Anwendung auf die Exponentialfunktion und e
B. Lemma. Ist a 2 R, so bilden die Intervalle vallschachtelung für die n 2 N mit n > jaj.
71
h3 a -&n i a -n 3 eine Inter; 1& 1C n n
Beweis. 1) Es handelt sich wirklich um Intervalle; denn es bestehen die Äquivalenzen 3
1C
3 3 a -n 3 a -&n a -n 3 a -n a 2 -n . 1& () 1 C 1& . 1 () 1 & 2 . 1; n n n n n
und die letzte Ungleichung ist gewiss richtig. 2) Die linken Enden sind monoton wachsend für n > jaj: Um dies zu sehen, bildet man den Quotienten 3 0 a -nC1 a 1n 1C 1C 3 B nC1 nC1C 1C a Qn ´ D 3 @ A a a n nC1 1C 1C n n und macht die Umformung a a a a a a 1C & 1C C & 1 a n n.n C 1/ nC1 D n nC1 n D D 1& : a a a n.n C 1/ 1 C a 1C 1C 1C n n n n
1C
Dann folgt mittels der Bernoullischen Ungleichung 0 1 a a2 1 1 C3 a B Qn % @1 & D 1 C ( % 1; 1 C A a 2 nC1 1C nC1 .n C 1/ a C n n wobei zuletzt sogar > 1 steht, falls a ¤ 0. Die letzte Umformung ist etwas kunstvoll. Man kann sie aber durch eine elementare Rechnung bestätigen, indem man mit .n C 1/2 ( .a C n/ durchmultipliziert. Aus Qn % 1 folgt die Behauptung aufgrund der Definition von Qn . 3) ( Daa2) )nauch bei Ersatz von a durch( &a gilt )&n(immer n > jaj angenommen), ist auch 1 & n monoton wachsend, somit 1 & na monoton fallend für n > jaj. 4) Zur letzten Eigenschaft einer Intervallschachtelung: Die Differenz der Intervallenden geht für n ! 1 wirklich gegen 0; denn es gilt
3
1 1&
3
a -n
a -n & 1 C n n
3 a2 -n 1& 1& 2 n D 3 &! 0; a -n 1& n
72 3 da 1 & ist.
Kapitel 2 Reelle Zahlenfolgen a2 n2
-n
nach S[2.1] gegen 1 konvergiert und
1
n
.1& na /
nach 1) und 3) beschränkt "
Kombiniert man dieses Lemma mit dem Ergebnis der obigen Folgerungsserie, so ergibt sich: C. Folgerung. Es gibt höchstens eine Funktion f W R ! R mit den Eigenschaften (F) und (U) aus Satz A; denn für eine solche Funktion gilt notwendig: 3 a -n f .a/ D lim 1 C für alle a 2 R: " n!1 n Existenzbeweis für A. Wir definieren, angeregt durch den Eindeutigkeitsteil: 3 a -n f .a/ ´ lim 1 C n!1 n und haben zu bestätigen, dass für dieses f die Eigenschaften (F), (U) erfüllt sind. Der Grenzwert existiert jedenfalls nach Lemma B und ist > 0. Zu (F): Wir betrachten den
Dann wird:
f .a/f .b/ entsprechenden Quotienten der Folgenglieder f .a C 3b/ b -n a -n 3 1C 1C n n : cn ´ 3 a C b -n 1C n
1n ab 1n 0 aCb C 2 1 C B n n C D B1 C ab cn D @ A @ A &! 1; aCb aCb n2 1C 1C n n wobei wieder S[2.1] angewendet wurde. 0
1C
f .a/f .b/ f .a/f .b/ . Somit folgt D 1. f .a C b/ f .a C b/ ( )n Zu (U): Aufgrund der Bernoullischen Ungleichung gilt 1 C na % 1 C a, falls 1 C a > 0. Der Grenzübergang n ! 1 liefert hieraus sofort f .a/ % 1 C a. " n Andererseits gilt: cn !
D. Definition. Die durch Satz A festgelegte Funktion heißt die (natürliche) Exponentialfunktion exp W R ! R. Der Wert exp.a/ wird durch die Intervallschachtelung von Lemma B erfasst. Insbesondere gilt: 3 a -n exp.a/ D lim 1 C : n!1 n
Abschnitt 2.4 Anwendung auf die Exponentialfunktion und e
73
Die Eulersche Zahl e ist definiert als 3 1 -n e ´ exp.1/ D lim 1 C : n!1 n 46656 Hinweis: Für n D 6 liefert Lemma B die Abschätzung 2;5 < 11649 < e < 15625 < 46656 3;0. Eine genauere Berechnung erfolgt später mit feineren Hilfsmitteln; vgl. L(i)[8.3].
Aus (F) folgt für n 2 N: exp.n/ D exp.1 C ( ( ( C 1/ D .exp.1//n D e n , wobei im zweiten Argument n Summanden 1 stehen. Die Gleichung exp.n/ D e n gilt auch für 1 1 n D 0 (beide Seiten sind 1) und für &n 2 N, da exp.n/ D exp.&n/ D e#n D e n . Somit ist (1)
exp.n/ D e n
für n 2 Z:
Man schreibt deshalb als reine Konvention für alle x 2 R: exp.x/ µ e x : Dies ist zunächst eine andere Schreibweise; sie bedeutet an dieser Stelle noch nicht, dass e x irgendetwas mit dem Potenzieren von e zu tun hat – außer für x 2 Z gemäß (1). E. Definition (und Zusammenfassung). Man nennt exp auch e-Funktion. Diese hat alle Eigenschaften, die wir bisher für f aus Satz A festgestellt haben, insbesondere: (i)
e aCb D e a ( e b
(ii)
ea % 1 C a
(iii)
ea > 0
(iv)
ea .
1 1&a
(Additionstheorem)
für a < 1:
"
Auch die expliziten Konstruktionen gelten natürlich: (2)
3 1 x -n . ex . 3 1C x -n n 1& n
für n > jxj;
wobei die Schranken eine Intervallschachtelung bilden, die sich auf e x zusammenzieht. Bei der weiteren Behandlung werden wir uns nach Möglichkeit auf die Eigenschaften stützen (und weniger auf die expliziten Formeln). Dies entspricht dem modernen Trend in der Mathematik, möglichst nur die Eigenschaften der Objekte heranzuziehen.
74
Kapitel 2 Reelle Zahlenfolgen
Merkregel: Formal entsteht die obere Schranke in (2) aus der unteren, indem n durch &n ersetzt wird, und umgekehrt. Hinweis: Bei den klassischen Funktionen wie exp (später sin etc.) wird oft die Argumentklammer weggelassen. Man schreibt also exp.x/ µ exp x. Bei „größeren“ Argumenten, z.B. exp.a C b/, geht dies natürlich nicht! Eine andere Motivierung für die e-Funktion. Den strukturellen Zugang mittels Funktionalgleichung und Schrankenfunktion ergänzen wir durch folgende Motivierung, die wieder für „Bankleute“ von Interesse ist. Sei K0 ein Kapital zu Beginn einer Verzinsung, und sei ˛ der Zinssatz pro Jahr als richtiger Bruchteil (sodass z.B. 5% dem Wert ˛ D 0;05 entspricht). Die Vermehrung des Kapitals per Zinseszinsen erfolgt dann nach folgendem Schema, wobei immer mehr Zinstermine pro Jahr angenommen werden: Vermehrung von K0 nach t Jahren auf: K0 C ˛K0 t D K0 .1 C ˛t/ Bei 2 Zinsterminen nach t Jahren auf: . /. / / . ˛t 2 t t 1C˛ D K0 1 C K0 1 C ˛ 2 2 2 Bei 3 Zinsterminen nach t Jahren auf: . /. /. / . / t t t ˛t 3 1C˛ 1C˛ D K0 1 C K0 1 C ˛ 3 3 3 3 :: : Bei n Zinsterminen nach t Jahren auf: / . ˛t n . K0 1 C n Es ist anschaulich klar, dass die Verzinsung umso günstiger ist, je mehr Zinstermine pro Jahr erfolgen, da ja der Zinsgewinn immer früher bereits selbst wieder verzinst wird. Das monotone Anwachsen mit der Anzahl n der Zinstermine pro Jahr entspricht genau der obigen Monotonieaussage im Beweis von Lemma B. Die Frage ist natürlich, ob allein durch Vermehrung der Zinstermine beliebig hohe Gewinne zu machen sind.
75
Abschnitt 2.5 Anwendung auf den Arkustangens und &
Dem ist aber nicht so, wie der Grenzwert in D lehrt. Bei der stetigen Verzinsung, dem Grenzwert für n ! 1, hat das Endkapital nach t Jahren eben den endlichen Wert / . ˛t n D K0 e ˛t : lim K0 1 C n!1 n Bei Steigerung von t ist natürlich in allen Verzinsungsfällen ein beliebig großes Wachstum möglich. Aufgaben und Anmerkungen 1. Man zeige: a)
.13 '/ 1 -n 3 1 -nC1 Auch durch 1C wird eine Intervallschachtelung ; 1C n n n%1 definiert, die sich auf die Eulersche Zahl e zusammenzieht.
b) Für die zugehörigen Intervall-Längen `n gilt die Ungleichung `n . e=n und damit die Fehlerabschätzung 3 1 -n e 3 0<e& 1C . < n n n
für n % 1:
Diese kann nicht wesentlich verbessert werden, wie in einer späteren Aufgabe gezeigt wird (7[8.5]): Der Fehler ist „asymptotisch proportional“ zu 1=n. 2. Mittels Aufgabe 1a) beweise man für alle natürlichen Zahlen n die Abschätzung nŠ % 4
3 n -n 4
:
2.5 Anwendung auf den Arkustangens und & Was die e-Funktion für die Analysis ist, sind die trigonometrischen Funktionen für die Geometrie. Allerdings werden wir die trigonometrischen Funktionen (Sinus, Kosinus, etc.) zunächst nicht als geometrische Objekte behandeln, sondern mit den Mitteln der Analysis. Erst später wird sich der Zusammenhang mit der geometrischen Bedeutung herausschälen. Das wird jedoch ein wenig dauern, da hierfür der Begriff der Bogenlänge gebraucht wird; vgl. F[9.1]. Den Einstieg gestalten wir nach dem gleichen Muster wie bei der Exponentialfunktion, d.h. mit einer Funktionalgleichung und Schrankenbedingungen. Dazu muss man
76
Kapitel 2 Reelle Zahlenfolgen
eine dieser Funktionen auswählen, die nur mit sich selbst gekoppelt ist und keine „Singularitäten“ aufweist. Am besten eignet sich dafür die Umkehrfunktion des Tangens, der Arkustangens. Die elementare Additionsformel beim Tangens lautet tan.˛ C ˇ/ D
tan ˛ C tan ˇ : 1 & tan ˛ tan ˇ
Umgeschrieben auf die inverse Funktion, entspricht dies der folgende Funktionalgleichung (F). Auch die Schranken in (U) ließen sich anschaulich motivieren; vgl. K[9.1]. Im Augenblick stellen wir dies zurück und zeigen rein analytisch: A. Satz. Es gibt genau eine Funktion f W R ! R mit: (F) (U)
f
3 aCb D f .a/ C f .b/ 1 & ab a . f .a/ . a p 1 C a2
für alle a; b 2 R mit ab < 1 für alle a % 0:
Das Vorgehen ist das gleiche wie bei der e-Funktion, die rechnerischen Einzelheiten sind aber etwas komplizierter. Dafür hat dieser Beweis den Vorteil, ganz elementar zu sein und damit den Arkustangens frühzeitig bereitzustellen. Sobald man stetige Umkehrfunktionen handhaben kann, was in 3.6 gelehrt wird, steht dann auch der Tangens und mittels einfacher Umrechnungsformeln der Rest an trigonometrischen Funktionen zur Verfügung. Der folgende Existenzbeweis geht auf Hurwitz[1911] zurück. Wem dieser Beweis zu kompliziert erscheint, der kann sich zunächst auf einfache Folgerungen beschränken und Eindeutigkeit sowie Existenz später mit den Hilfsmitteln der Differential- und Integralrechnung erledigen, wie dies in 4.4 und 8.9 geschildert wird. In jedem Fall werden für das bloße Umgehen mit den trigonometrischen Funktionen nur simple Konsequenzen aus den Grundeigenschaften (hier bis (1)) und die Definition D benötigt. Eindeutigkeitsbeweis für A. Man zieht wieder genügend viele Schlüsse aus (F) und (U), solange bis f eindeutig festgelegt ist. Dabei startet man wieder ganz einfach, indem man spezielle Argumente wählt: ' Setze in (F): a D b D 0. Das liefert f .0/ D f .0/ C f .0/, also f .0/ D 0:
Abschnitt 2.5 Anwendung auf den Arkustangens und &
77
' Setze in (F): b D &a W . Dann ist ab D &a2 . 0 < 1 und 0 D f .0/ D f .a/ C f .&a/, also f .&a/ D &f .a/I d.h. f ist eine ungerade Funktion. ' Setze in (F): b D a: (1)
f
3 2a D 2f .a/ für a2 < 1: 1 & a2
Das ist eine „ungefähre Verdopplungsformel“: Sie erlaubt es, den Funktionswert an der Stelle 2a=.1 & a2 / (die für kleine a näherungsweise mit 2a übereinstimmt) aus dem Funktionswert an der Stelle a zu berechnen. ' Für das folgende ist es allerdings wichtiger, das umgekehrte zu tun, nämlich den Funktionswert an einer Stelle c aus dem bei der ungefähren Hälfte zu ermitteln. Dann kann man hoffen, durch Wiederholen dieses Schrittes in die Nähe von 0 zu kommen, und dort hat man Information aus den Ungleichungen (U). Die erforderliche Umschreibung von (1) lautet f .c/ D 2f
(2)
3
c für c 2 R: p 1 C 1 C c2
Um dies nachzuweisen, setzt man bei gegebenem c 2 R a´
c : p 1 C 1 C c2
Dann ist offensichtlich jaj < 1, also a2 < 1 und p c2 1 C 2 1 C c2 C 1 C c2 & c2 1&a D1& 3 -2 D -2 3 p p 2 1C 1Cc 1 C 1 C c2 2
D also
2 ; p 1 C 1 C c2 p 2c 1 C 1 C c2 2a D c; D p 2 1 & a2 1 C 1 C c2
sodass (2) aus (1) folgt. (Das Argument rechts in (2) fällt nicht vom Himmel. Es ergibt sich zwangsläufig, wenn man in (1) c ´ .2a/=.1 & a2 / setzt und diese Gleichung nach a auflöst. Dabei muss man beachten, dass wegen a2 < 1 genau ein Vorzeichen im Lösungsausdruck in Frage kommt.)
78
Kapitel 2 Reelle Zahlenfolgen
' Hierdurch motiviert, definieren wir zu gegebenem c 2 R rekursiv eine Folge .cn /n%0 durch das Schema
(3)
8 ˆ <
c0 ´ c
ˆ : cnC1 ´
cn p 1 C 1 C cn2
für n % 0:
Dann ergibt sich durch vollständige Induktion aus (2) und (3): f .c/ D 2n f .cn /: Der Funktionswert f .c/ wird damit auf Funktionswerte mit (wie wir sehen werden) immer dichter bei 0 liegenden Argumenten zurückgeführt. Aus (U) folgt p
cn 1 C cn2
. f .cn / . cn ;
falls c % 0:
Zusammen mit der vorangehenden Gleichung ergibt dies (4)
2n cn . f .c/ . 2n cn p 1 C cn2
für c % 0:
Hierdurch ist der Funktionswert f .c/ für c % 0 wieder eindeutig bestimmt, wenn die folgende Behauptung richtig ist. (Für c < 0 erfolgt die Festlegung aufgrund von f .c/ D &f .&c/.) B. Lemma. Wird zu c % 0 eine Folge .cn /n%0 rekursiv durch (3) definiert und (5)
2n cn ; an ´ p 1 C cn2
bn ´ 2n cn
gesetzt, so ist .Œan ; bn //n%0 eine Intervallschachtelung. Beweis. Im Fall c D 0 sind alle cn , an und bn gleich 0, die Behauptung also erfüllt. Daher dürfen wir jetzt c > 0 annehmen. Daraus folgt leicht durch vollständige Induktion, dass auch alle cn positiv sind. Weiter können wir feststellen: 1) Es handelt sich wirklich um Intervalle; denn es ist bn D an
q 1 C cn2 % 1;
Abschnitt 2.5 Anwendung auf den Arkustangens und &
79
also bn % an . 2) Klar ist auch bnC1 . bn ; denn dies kürzt sich zu 2cnC1 . cn , was aus (3) folgt. Daher ist die Folge bn konvergent. Hiermit folgt weiter q 1 C cn2 &! 1; cn &! 0 und das erste wegen cn D 2&n bn , das zweite aufgrund der Abschätzung (mittels Wurzeltrick): q cn2 1 1 C cn2 & 1 D p . cn2 : 2 2 1 C cn C 1 3) Wir zeigen anC1 % an : Ausgedrückt in den cn , reduziert sich dies auf cn 2cnC1 %p : q 2 1 C cn2 1 C cnC1 Durch Einsetzen von cnC1 links im Zähler gemäß (3), Herauskürzen von cn auf beiden Seiten sowie Reziprokenbildung und Quadrieren führt dies äquivalent auf . /2 q ( ) 1 2 2 1 C 1 C cn 1 C cnC1 . 1 C cn2 : 4 Einsetzen von cnC1 links gemäß (3) ergibt äquivalent /2 .. / q 1 2 2 1 C 1 C cn C cn . 1 C cn2 ; 4 p was sich schließlich auf 1 C cn2 . 1 C cn2 umstellen lässt, und dies ist sicher richtig, p da für alle y % 1 gilt y . y. 4) Für die Intervall-Längen gilt
.
bn & an D an
/ bn & 1 &! 0; an
wie aus 1) und 2) folgt.
"
Kombiniert man dieses Lemma mit (4), so ergibt sich: C. Folgerung. Es gibt höchstens eine Funktion f W R ! R mit den Eigenschaften (F) und (U) aus Satz A; denn für eine solche Funktion gilt notwendig: (6)
f .c/ D lim an D lim bn n!1
n!1
für alle c 2 R;
wobei die Folgen .an /n%0 und .bn /n%0 gemäß (3) und (5) gebildet sind.
80
Kapitel 2 Reelle Zahlenfolgen
Beweis. Aufgrund der Herleitung ist die Darstellung (6) zunächst nur für c % 0 gültig. Tatsächlich gilt sie für alle c 2 R. Denn beim Übergang von c > 0 zu c < 0 wechseln die Folgenglieder cn , an und bn einfach das Vorzeichen, und das gilt dann auch für ihre Grenzwerte. " Existenzbeweis für A. Angeregt durch den Eindeutigkeitsteil, setzen wir f .c/ ´ lim 2n cn ; n!1
wobei die cn nach (3) gebildet sind. Für das so definierte f müssen wir nun die Eigenschaften (F) und (U) bestätigen. Nach Lemma B existiert jedenfalls der Grenzwert in R. Insbesondere ist cn eine Nullfolge. Zu (F): ˛Cˇ . Ferner sei zu ˛; ˇ; 0 jeweils die 1 & ˛ˇ Folge .˛n /; .ˇn /; .0n / so bestimmt wie .cn / zu c. Zu ˛; ˇ 2 R mit ˛ˇ < 1 sei gesetzt 0 ´
Wir zeigen zunächst, dass sich die Eigenschaften von ˛, ˇ und 0 analog auf ˛n , ˇn , 0n übertragen: (7)
˛n ˇn < 1;
und
0n D
˛n C ˇn 1 & ˛n ˇn
für alle n % 0:
Der Nachweis erfolgt induktiv, wobei der Induktionsanfang (n D 0) unmittelbar klar ist. Der Induktionsschluss beruht auf der Funktion (8)
h W R &! R;
h.x/ ´
x ; p 1 C 1 C x2
die im Iterationsverfahren (3) die zentrale Rolle spielt, und ihren Invarianzeigenschaften (9)
ab < 1
H)
h.a/h.b/ < 1
3 aCb h.a/ C h.b/ D : und h 1 & ab 1 & h.a/h.b/
Die Ungleichung in (9) ist klar. Die Funktionalgleichung für h in (9) kann man durch Einsetzen von (8) und Umstellen beweisen, wobei man verwendet r p p 3 a C b -2 1 C a2 1 C b 2 D 1C ; 1 & ab 1 & ab was seinerseits durch Quadrieren bestätigt werden kann.
Abschnitt 2.5 Anwendung auf den Arkustangens und &
81
˛n C ˇn wegen (3) sofort das Gleiche mit n C 1 1 & ˛n ˇn anstelle n, sodass der gewünschte Induktionsschluss erbracht ist. Damit folgt aus ˛n ˇn < 1; 0n D
Die Gleichung in (7) impliziert nun durch Multiplikation mit 2n : 2n 0n D
2n ˛n 2 n ˇn C ; 1 & ˛n ˇ n 1 & ˛n ˇn
also durch Grenzübergang n ! 1: f .0/ D
f .ˇ/ f .˛/ C : 1&0 1&0
Hierin gilt nämlich ˛n D 2&n .2n ˛n / ! 0 und analog ˇn ! 0. Aufgrund der Definition von 0 besagt die letzte Formelzeile gerade, dass die Funktionalgleichung (F) erfüllt ist. Zu (U): Die Behauptung folgt direkt aus den für c % 0 bestehenden Ungleichungen a0 . c f .c/ . b0 , indem man a0 D p und b0 D c einsetzt. " 1 C c2 Von jetzt an verwenden wir die klassische Funktionsbezeichnung (wobei auch hier die Argumentklammern manchmal gespart werden): D. Definition (und Zusammenfassung). Die durch Satz A festgelegte Funktion heißt der Arkustangens arctan W R ! R. Dieser hat folgende Eigenschaften: aCb D arctan a C arctan b für alle a; b mit ab < 1 (Additionstheoarctan 1 & ab rem). a (ii) p . arctan a . a für alle a % 0. 1 C a2
(i)
Die Kreiszahl & sei definiert durch & ´ 4 ( arctan 1: p Aus (ii) folgt für a D 1 die (grobe) Abschätzung 2;8 < 2 2 . & . 4. Eine genauere Berechnung erfolgt später in S[8.5], wäre aber auch hier mittels der Abschätzung (4) möglich. Die Konstruktion und die Formeln aus dem Beweis von Satz A werden für den weiteren Aufbau nicht mehr benötigt: Alles weitere wird aus den in D festgehaltenen Eigenschaften folgen. Trotzdem war eine solche Konstruktion nötig, um die Existenz
82
Kapitel 2 Reelle Zahlenfolgen
des Objekts arctan zu sichern. Die endgültige Rechtfertigung für die erfolgten Definitionen der Exponentialfunktion und des Arkustangens wird sich später ergeben. Wir werden nämlich auf dieser Grundlage den Nachweis führen, dass diese Funktionen die gewohnten Eigenschaften und Bedeutungen haben. Vgl. die Abschnitte 3.7 und 4.4 sowie I(ii)[9.1]. Der obige Existenzbeweis für den Arkustangens stammt von Hurwitz[1911]. Dort wird auf ähnliche Weise der natürliche Logarithmus konstruiert und dann die e-Funktion als dessen Umkehrfunktion eingeführt. Satz A[2.4] zeigt, dass die natürliche Exponentialfunktion direkt über die beiden in 2.4 genannten Eigenschaften hergeleitet werden kann. Aufgaben und Anmerkungen 1. Für die Intervall-Längen der Intervallschachtelung aus Satz B zeige man im Falle c % 0 für alle n % 0 c3 bn & an . 2nC1 2 und folgere daraus die Fehlerabschätzungen 0 . arctan c & an .
c3
; 22nC1
0 . bn & arctan c .
c3 22nC1
:
2. Allein aus dem Additionstheorem der arctan-Funktion und der Definition von & in D soll gefolgert werden: Für alle a > 0 gilt arctan a C arctan 3p & 3. Man zeige: arctan 2 & 1 D . 8
2.6
1 & D : a 2
Teilfolgen und das Kriterium von Cauchy
Nach den sehr konkreten Entwicklungen der Abschnitte 2.2, 2.4 und 2.5 kommen wir zu einem Hilfsmittel, das in der weiteren Theorie eine sehr bedeutsame Rolle spielen wird, der so genannten Cauchy-Eigenschaft. Zuvor werden einige Eigenschaften von Teilfolgen hergeleitet. Wir gehen dabei aus von einer Folge a1 ; a2 ; a3 ; : : :. Eine Teilfolge entsteht durch „Wegstreichen“ von Folgengliedern, sodass jedoch unendlich viele übrig bleiben, nämlich a'.1/ ; a'.2/ ; a'.3/ ; : : : mit '.1/ < '.2/ < '.3/ < ( ( ( . A. Definition. Sei .an /n2N eine Folge und ' W N ! N eine Abbildung mit '.k/ < '.k C 1/ für alle k 2 N. Dann heißt die Folge .a'.k/ /k2N eine Teilfolge von .an /n2N .
83
Abschnitt 2.6 Teilfolgen und das Kriterium von Cauchy
Aus der genannten Eigenschaft von ' ergibt sich leicht durch vollständige Induktion, dass für alle k 2 N gilt: '.k/ % k. Diese Begriffsbildung gilt ganz allgemein für Folgen in einer beliebigen Menge. Wir diskutieren sie jetzt weiter für reelle Folgen: B. Beispiele. (i)
Eine Teilfolge von 1; 1=2; 1=3; : : : (die Kehrwerte der natürlichen Zahlen) ist z.B. 1; 1=4; 1=9; : : : (die Kehrwerte der natürlichen Quadratzahlen). Hier ist '.k/ D k 2 .
(ii)
Eine Teilfolge von 1; 2; 3; : : : (die natürlichen Zahlen) ist z.B. 2; 4; 6; : : : (die geraden natürlichen Zahlen). Hier ist '.k/ D 2k.
(iii) Die Folge 10; 1; 1000; 100; : : : ist keine Teilfolge von 1; 10; 100; 1000; : : :. Als Erstes stellen wir fest, dass die Konvergenz auf Teilfolgen vererbt wird: C . Satz. Ist lim an D a und .a'.k/ /k2N eine Teilfolge von .an /, so ist auch n!1 lim a'.k/ D a. k!1
Beweis. Sei " > 0 gegeben. Nach Voraussetzung existiert ein N 2 N, sodass für alle ˇ n > N gilt: jan & aj. Wähle N1 ´ min fk 2 N ˇ '.k/ > N g (diese Menge ist ¤ ¿, da stets '.k/ % k). Dann folgt aus ` > N1 zunächst '.`/ > '.N1 / > N , also ja'.`/ & aj < ". " D. Satz. Jede reelle Folge .an / besitzt eine monotone Teilfolge. Beweis. Wir nennen einen Index s 2 N eine Spitzenstelle der Folge .an /, wenn für alle j % s gilt: as % aj . Dies bedeutet anschaulich am Graphen, dass man vom Punkt .s; as / aus ungehindert nach rechts über alle Werte hinwegblicken kann; vgl. folgendes Bild:
R 1
2
3
4
5
6
84
Kapitel 2 Reelle Zahlenfolgen
Wir treffen folgende Fallunterscheidung (a), (b): (a) Es gibt unendlich viele Spitzenstellen, etwa s1 < s2 < ( ( ( . Dann ist .ask / eine monoton fallende Teilfolge von .an /. (b) Es gibt nur endlich viele Spitzenstellen (bzw. gar keine). Sei s0 die größte Spitzenstelle (bzw. s0 ´ 0). Dann existiert zu jedem k > s0 ein 4.k/ 2 N mit ak < a..k/ und 4.k/ > k. Definiere nun '.1/ ´ s0 C 1 sowie induktiv: '.k C 1/ ´ 4.'.k// für k % 1. Dann ist .a'.k/ / eine streng monoton wachsende Teilfolge von .an /, da '.k C 1/ D 4.'.k// > '.k/ und a'.kC1/ D a..'.k// > a'.k/ . " Durch Kombination dieses merkwürdigen Sachverhalts mit den Hauptsätzen über monotone Folgen N,O[2.1] ergibt sich sofort: E. Folgerung (Satz von Bolzano/Weierstraß). Jede beschränkte Folge besitzt eine (monotone und damit) konvergente Teilfolge. " Ein Problem bei Grenzübergängen ist, dass man den Grenzwert oft nicht kennt und auch nicht vermutet, sodass der ."; N /-Test aus E[2.1] nicht angesetzt werden kann. Der einzige universelle Ausweg ist das folgende Cauchy-Kriterium. F. Definition. Eine Folge .an / heißt konzentriert oder Cauchy-Folge, wenn gilt: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass für alle m; n > N gilt: jan & am j < ". Die eingerahmte Eigenschaft nennen wir den ."; N /-Test für Cauchy-Folgen. Dieser ist ganz ähnlich gebaut wie der ."; N /-Test für die Konvergenz. Der wesentliche Unterschied ist, dass hier die Folgenglieder beliebig nahe beieinander liegen, bei der Konvergenz aber beliebig nahe beim Grenzwert, wenn nur die Indizes hinreichend groß sind. Eine äquivalente Umformulierung des ."; N /-Test für Cauchy-Folgen lautet: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass gilt: n > N und m > N H) jan & am j < ": In formalisierter Form lautet der ."; N /-Test für Cauchy-Folgen: 8 " > 0 9 N 2 N 8 m; n > N W jan & am j < ": G. Lemma. Besitzt eine Cauchy-Folge .an / eine konvergente Teilfolge .a'.k/ /, so ist sie selbst konvergent (mit dem gleichen Grenzwert).
Abschnitt 2.6 Teilfolgen und das Kriterium von Cauchy
85
Beweis. Sei a'.k/ ! a. Wir zeigen an ! a: Dazu stellen wir folgende Vorausabschätzung mit zunächst freiem '.k/ auf jan & aj D jan & a'.k/ C a'.k/ & aj . jan & a'.k/ j C ja'.k/ & aj: Ist nun " > 0 gegeben, so existiert wegen der Konzentriertheit der Folge .an / ein N1 2 N mit " jan & a'.k/ j < ; falls n > N1 und '.k/ > N1 : 2 Außerdem gibt es wegen der Konvergenz der Teilfolge ein N2 2 N mit ja'.k/ & aj <
" ; 2
falls k > N2 :
Beide Indizes N1 ; N2 sind allein durch " bestimmt. Sei nun ein Index k > max fN1 , N2 g fest gewählt. Dann gilt '.k/ % k > N1 und k > N2 . Also wird aufgrund der Vorausabschätzung die Größe jan & aj < "=2 C "=2 D ", falls n > N1 . " H. Satz (Cauchy-Kriterium). Eine reelle Folge konvergiert genau dann, wenn sie eine Cauchy-Folge ist. Beweis. Dieser zerfällt wie bei jedem „genau-dann-Satz“ in zwei Teile 1) und 2): 1) Sei an ! a vorausgesetzt. Zu zeigen ist die Gültigkeit des ."; N /-Tests. Wir verwenden als Vorausabschätzung: jan & am j D jan & a C a & am j . jan & aj C jam & aj: Zu gegebenem " > 0 existiert ein N 2 N, sodass für alle n > N gilt: jan & aj < "=2. Aus der Vorausabschätzung folgt also jan & am j < "=2 C "=2 D ", falls n; m > N . 2) Sei .an / als Cauchy-Folge vorausgesetzt. Das wichtigste ist die Konstruktion des Grenzwertes. Diese erfolgt, indem mittels Bolzano/Weierstraß (Satz E) eine konvergente Teilfolge konstruiert und dann Lemma G angewandt wird: Zunächst ist .an / beschränkt: Hierzu wählen wir " D 1. Dann existiert ein N 2 N mit: jan & am j < 1 für n; m > N . Für n > N erhalten wir daraus jan j . jan & aN C1 j C jaN C1 j < 1 C jaN C1 j, also jan j . max f1 C jaN C1 j; ja1 j; : : : ; jaN jg für alle n 2 N. Nach Bolzano/Weierstraß existiert also eine konvergente Teilfolge von .an /, und Lemma G führt direkt zum Ziel. " I. Bemerkung. Eine Variante der Cauchy-Eigenschaft in Definition F entsteht, wenn man in dem Ausdruck jan & am j das n als den kleineren der beiden Indizes ansieht und m als den größeren. Das geht, da dieser Ausdruck symmetrisch bzgl. n; m ist. Dann kann m in der Form m D n C p dargestellt werden, wobei es reicht, p 2 N zu
86
Kapitel 2 Reelle Zahlenfolgen
betrachten, da jan & an j D 0. Damit nimmt der ."; N /-Test für eine Cauchy-Folge die äquivalente Gestalt an: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodass für alle n > N; p > 0 gilt: jan & anCp j < ". Solche „"-Definitionen“ haben wir bisher für die zwei grundlegenden Eigenschaften „konvergent“ und „konzentriert“ kennen gelernt. In ähnlicher Weise werden sie noch öfter auftauchen. Historisch gesehen, stehen sie am Ende einer langen Entwicklung und eines Ringens um die präzise Fassung von wichtigen und typischen Begriffen der Analysis. Auch die Begriffe des Supremums und Infimums, die wir im axiomatischen Aufbau der reellen Zahlen verwendet haben, lassen sich so formulieren, was gelegentlich gebraucht wird: J. Satz. Die Menge M , R sei nach oben beschränkt. Eine Zahl s 2 R ist dann und nur dann das Supremum von M , wenn sie die folgenden zwei Eigenschaften besitzt: (i) s ist eine obere Schranke von M ; (ii) Zu jedem " > 0 gibt es ein x 2 M mit x > s & ". Beweis. Es ist zu zeigen, dass (ii) mit der Eigenschaft: „s ist kleinste obere Schranke von M “ äquivalent ist. 1) Sei (ii) vorausgesetzt. Ist dann s 0 eine obere Schranke von M so gilt s . s 0 . Wäre nämlich s > s 0 , so gäbe es zu " ´ s & s 0 ein x 2 M mit x > s & " D s & .s & s 0 / D s 0 – im Widerspruch zur Schrankeneigenschaft von s 0 . Wegen s . s 0 ist s kleinste obere Schranke von M . 2) Sei s als kleinste obere Schranke von M vorausgesetzt und " > 0 gegeben. Wäre x . s & " für alle x 2 M , so wäre s & " eine obere Schranke von M , also s . s & ", was nicht stimmt. Somit ist (ii) erfüllt. " Spiegelbildlich gilt natürlich bzgl. des Infimums: K. Satz. Die Menge M , R sei nach unten beschränkt. Eine Zahl t 2 R ist dann und nur dann das Infimum von M , wenn sie die folgenden zwei Eigenschaften besitzt: (i) t ist eine untere Schranke von M ; (ii) Zu jedem " > 0 gibt es ein x 2 M mit x < t C ".
"
Wir nennen (ii) jeweils die Puffereigenschaft, weil durch sie ausgedrückt wird, was passiert, wenn man „von s aus ein wenig nach links rückt“ bzw. von „t aus ein wenig nach rechts rückt“.
Abschnitt 2.6 Teilfolgen und das Kriterium von Cauchy
87
$ Ein anderer Beweis für den Satz von Bolzano/Weierstraß Mittels Intervallschachtelungen kann der Satz von Bolzano/Weierstraß E neu bewiesen werden. Dabei verwenden wir die so genannte Halbierungsmethode. Bei dieser teilt man ein gegebenes abgeschlossenes Intervall I D Œa; b/ in die zwei gleich langen Teile I 0 ´ Œa; .a C b/=2/ und I 00 ´ Œ.a C b/=2; b/ und sucht nach einer Vererbungsstrategie von I auf eines der Teilintervalle I 0 oder I 00 . Dies wird dann rekursiv wiederholt. Ist .an / die gegebene beschränkte Folge, so gelingt das hier wie folgt: Es sei I0 ein abgeschlossenes Intervall, in dem alle Folgenglieder an enthalten sind. In mindestens einem der Intervalle I00 ; I000 liegen dann unendlich viele Folgenglieder. Dieses Intervall heiße I1 . Das „unendlich“ bezieht sich dabei auf die Indizes; d.h. die Menge der n 2 N mit an 2 I1 ist nicht endlich. Es sei ein a'.1/ % 1 in I1 gewählt. Diese Vererbung wird genauso induktiv weitergeführt: Ist das Intervall Ik mit a'.k/ 2 Ik schon gewählt, so sei IkC1 eines der beiden Intervalle Ik0 ; Ik00 , indem unendliche viele Folgenglieder liegen und ein a'.kC1/ 2 IkC1 mit '.k C1/ > '.k/ gewählt. Die Intervalle I0 ; I1 ; I2 ; : : : bilden dann wegen der jeweils halbierten Länge eine Intervallschachtelung, wobei stets a'.k/ 2 Ik gilt. Hieraus folgt nach dem Einschnürungsprinzip, dass die Folge .a'.k/ / konvergiert. Aufgaben und Anmerkungen 1. Folgt aus anC1 & an ! 0, dass die Folge .an / konvergiert? 2. Für zwei Teilfolgen .a'.k/ / und .a..k/ / der reellen Zahlenfolge .an /n2N sei bekannt lim a'.k/ D a; lim a..k/ D a k!1
k!1
sowie N D .Bild '/ [ .Bild 4/, d.h. jedes n 2 N kommt als ein '.k/ oder ein 4.k/ vor. Man zeige lim an D a: n!1
3. Sei .an / eine reelle Zahlenfolge, sodass mit festen c % 0 und q 2 Œ0; 1Œ gilt: janC1 & an j . c ( q n
für alle n 2 N:
Man beweise: Die Folge .an / konvergiert, und gegenüber dem Grenzwert a gilt die Fehlerabschätzung qn : jan & aj . c ( 1&q Lösungshinweis: Man schreibe an & anCp als Teleskopsumme und wende die geometrische Summenformel (9)[1.3] sowie das Cauchy-Kriterium in der Variante I an.
88
2.7
Kapitel 2 Reelle Zahlenfolgen
$ Limes superior und Limes inferior
Eine beschränkte Folge kann unter Umständen sehr viele konvergente Teilfolgen enthalten. Die im Titel genannten Begriffe bringen etwas Ordnung in diese Vielfalt, indem sie den größten und den kleinsten der dabei auftretenden Grenzwerte aussondern. In diesem Abschnitt werden ausschließlich reelle Zahlenfolgen betrachtet, da stark von der Anordnung in R Gebrauch gemacht wird. Erfahrungsgemäß stoßen die genannten Begriffe beim Anfänger auf gewisse Verständnisprobleme. Allerdings werden sie im ganzen Kurs auch nur an einer Stelle benötigt, nämlich beim Konvergenzradius von Potenzreihen, und sie können selbst dort durch einfachere Konstruktionen ersetzt werden. Daher ist es möglich, vom vorliegenden Abschnitt nur die folgende Definition eines Häufungswerts zu lernen und den Rest später nachzuholen. A. Definition. Eine Stelle b 2 R heißt Häufungswert der Folge .an /, wenn es eine Teilfolge .a'.k/ / gibt mit lim a'.k/ D b. k!1
B. Beispiele. (i)
Ist die Folge .an / konvergent mit dem Grenzwert a so ist a Häufungswert der Folge. Tatsächlich ist a ihr einziger Häufungswert; denn nach C[2.6] besitzt jede Teilfolge von .an / den Grenzwert a. . / 1 n (ii) Betrachte die Folge an ´ .&1/ 1 C . n n ungerade
n gerade
-1
0
1
Hier ist 1 ein Häufungswert, ebenso &1, und das sind bei dieser Folge auch die einzigen Häufungswerte. C. Satz und Definition. Die reelle Folge .an / sei nach oben beschränkt und habe mindestens einen Häufungswert. Dann besitzt die Menge H aller Häufungswerte von .an / ein Maximum, genannt Limes superior von .an /, geschrieben: lim an ´ max H:
n!1
Außerdem gilt: (C $ ) Zu jedem " > 0 existiert ein N 2 N, sodass für alle n > N gilt: an < max H C ".
Abschnitt 2.7
$ Limes superior und Limes inferior
89
Beweis. Sei c eine obere Schranke von .an /. Ist .a'.k/ / eine Teilfolge von .an /, so ist c auch obere Schranke von .a'.k/ /. Somit gilt b . c für jeden Häufungswert b. Also ist c obere Schranke für H , also existiert s ´ sup H 2 R. 1) Wir beweisen zunächst (C $ ) mit s anstelle max H : (C $$ ) Zu jedem " > 0 existiert ein N 2 N, sodass für alle n > N gilt: an < s C ". Wäre dies falsch, so existierte ein " > 0 und eine Teilfolge .a'.k/ / mit a'.k/ % s C ", also mit s C " . a'.k/ . c für alle k. Nach Bolzano/Weierstraß besäße dann .a'.k/ / eine Teilfolge mit Grenzwert g 2 Œs C "; c/. Da diese Teilfolge auch Teilfolge von .an / ist, wäre g Häufungswert von .an / und g > s, Widerspruch! 2) s ist Häufungswert von .an / (also s 2 H ): Setze k1 .0/ ´ 0 und definiere induktiv natürliche Zahlen k1 .1/; k1 .2/; : : : auf folgende Weise: Zu n 2 N setze man in (C $$ ): " D n1 . Dann existiert ein k0 .n/ 2 N mit 1 für alle k > k0 .n/: ak < s C n Unter den k mit k > k0 .n/ und k > k1 .n & 1/ existiert ein k1 .n/ 2 N mit s & n1 < ak1 .n/ (sonst wäre s & n1 obere Schranke von H). Es gilt dann k1 .n/ > k1 .n & 1/ und s&
1 1 < ak1 .n/ < s C n n
für alle n 2 N:
Somit ist .ak1 .n/ / eine Teilfolge mit ak1 .n/ ! s. Also ist s Häufungswert von .an /, somit s 2 H und s D max H . " Spiegelbildlich gilt analog: D. Satz und Definition. Die reelle Folge .an / sei nach unten beschränkt und habe mindestens einen Häufungswert. Dann besitzt die Menge H aller Häufungswerte von .an / ein Minimum, genannt Limes inferior von .an /, geschrieben: lim an ´ min H:
n!1
Außerdem gilt: (D $ ) Zu jedem " > 0 existiert ein N 2 N, sodass für alle n > N gilt: an > min H & ". " Wir nennen (C $ ) bzw. (D $ ) wieder die Puffereigenschaft, weil damit ausgedrückt ist, was die Folgenglieder tun, wenn man vom Limes superior „ein wenig“ nach rechts bzw. vom Limes inferior „ein wenig“ nach links rückt.
90
Kapitel 2 Reelle Zahlenfolgen
E. Satz. Für jede reelle Folge .an / gilt die Äquivalenz: .an / konvergent () .an / beschränkt und lim an D lim an : n!1
n!1
Ist .an / konvergent, so gilt lim an D lim an D lim an : n!1
n!1
n!1
Beweis. Zu H) : Ist die Folge .an / konvergent, so ist sie beschränkt und besitzt nach Bolzano/Weierstraß mindestens einen Häufungswert. Da alle Teilfolgen den gleichen Grenzwert haben, stimmen maximaler und minimaler Häufungswert überein. Zu (H : Nach Voraussetzung und Bolzano/Weierstraß ist die Menge H der Häufungspunkte nichtleer. Nimmt man (C $ ) und (D $ ) zusammen, so sieht man, dass .an / gegen den gemeinsamen Wert max H D min H konvergiert. " ( ) F. Beispiel. Für die Folge an ´ .&1/n 1 C n1 aus B(ii) ist die Menge H der Häufungspunkte zweielementig und limn!1 an D 1 sowie limn!1 an D &1. Hieran erkennt man auch, dass die Eigenschaft (C $ ) zwar für max H erfüllt, dafür aber nicht kennzeichnend ist; denn z.B. gilt auch: Zu jedem " > 0 existiert ein N 2 N (nämlich N D 1), sodass für alle n > N gilt: an < 2 C ". Analoges kann man über die Eigenschaft (D $ ) sagen. Charakterisierende "-Bedingungen werden in den nachstehenden Aufgaben 1 und 2 formuliert; sie werden aber im Folgenden nicht gebraucht. An dieser Stelle sollen die Begriffe Limes superior und Limes inferior nicht weiter ausgebaut werden, da das Bisherige ausreicht. Dem Anfänger sei empfohlen, sich zunächst an die Maximumdefinition des Limes superior in C und die Minimumdefinition des Limes inferior in D zu halten. Übrigens sind die Begriffe Limes superior und Limes inferior deutlich zu trennen von den Begriffen Supremum und Infimum: Limes superior und Limes inferior beziehen sich auf Folgen, Supremum und Infimum auf Teilmengen in R. Auch beim Supremum bzw. Infimum von Mengen scheint das einfachste Verständnis in den ursprünglichen Definitionen (als kleinste obere bzw. größte untere Schranke) zu liegen. Aufgaben und Anmerkungen 1. Für eine beschränkte Folge .an /n2N gilt stets inf an . lim an . lim an . sup an : n!1
n!1
Hier bezeichnet inf an bzw. sup an das Infimum bzw. Supremum der Bildmenge fan j n % 1g. Man gebe eine beschränkte Folge an, für die in der obigen Ungleichungskette überall das Kleinerzeichen steht.
Abschnitt 2.7
$ Limes superior und Limes inferior
91
2. Die Folge .an / sei nach oben beschränkt. Die Zahl s 2 R ist dann und nur dann der Limes superior von .an /, wenn für jedes " > 0 folgende zwei Bedingungen erfüllt sind: (i)
die Menge fn 2 N j an > s & "g ist unendlich;
(ii) die Menge fn 2 N j an > s C "g ist endlich. 3. Die Folge .an / sei nach unten beschränkt. Die Zahl t 2 R ist dann und nur dann der Limes inferior von .an /, wenn für jedes " > 0 folgende zwei Bedingungen erfüllt sind: (i)
die Menge fn 2 N j an < t C "g ist unendlich;
(ii) die Menge fn 2 N j an < t & "g ist endlich. 4. $ Für eine nach oben beschränkte Folge .an / sei sk ´ sup fakC1 ; akC2 ; : : :g: Für eine nach unten beschränkte Folge .an / sei tk ´ inf fakC1 ; akC2 ; : : :g; jeweils für k 2 N. Man zeige: a) Die Folge .sk / ist monoton fallend und genau dann konvergent, wenn .an / einen Häufungswert hat. In diesem Fall gilt lim sk D lim an :
k!1
n!1
b) Die Folge .tk / ist monoton wachsend und genau dann konvergent, wenn .an / einen Häufungswert hat. In diesem Fall gilt lim tk D lim an :
k!1
n!1
5. Für eine beschränkte Folge .an / gilt das „Spiegelungsprinzip“ lim .&an / D & lim an ;
n!1
n!1
lim .&an / D & lim an :
n!1
n!1
92
2.8
Kapitel 2 Reelle Zahlenfolgen
$ Dezimaldarstellung
Wir wollen mit Intervallschachtelungen diskutieren, wie reelle Zahlen durch Dezimaldarstellungen erfasst werden können. Zunächst betrachten wir reelle Zahlen im Intervall Œ0; 1Œ. Ein Dezimalbruch in Œ0; 1Œ ist nichts anderes als eine gewisse Summe aus Vielfachen der Potenzen 10&j ; z.B. 0;3402 ´
4 0 2 3 C C C D 3 ( 10&1 C 4 ( 10&2 C 0 ( 10&3 C 2 ( 10&4 : 10 100 1000 10000
A. Definition. Ein Dezimalbruch in Œ0; 1Œ ist eine reelle Zahl der Form k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n mit n 2 N und kj 2 f0; 1; : : : ; 9g. Die Zahlen 0; 1; : : : ; 9 heißen in diesem Zusammenhang Ziffern. Tatsächlich liegt jede reelle Zahl dieser Form in Œ0; 1Œ; denn sie ist offensichtlich nichtnegativ und nach oben beschränkt durch 9 ( 10&1 C 9 ( 10&2 C ( ( ( C 9 ( 10&n D 9 ( 10&1 .1 C 10&1 C 10&2 C ( ( ( C 10&.n&1/ / D 9 ( 10&1 (
1 1 & 10&n < 9 ( 10&1 ( D 1: &1 1 & 10 1 & 10&1
Hierbei wurde die geometrische Summenformel D[1.3] angewendet. Natürlich ist nicht jede reelle Zahl in Œ0; 1Œ gleich einem Dezimalbruch; denn ein solcher ist ja eine (spezielle) rationale Zahl. Aber mit Dezimalbrüchen kann jede reelle Zahl in Œ0; 1Œ beliebig genau approximiert werden: B . Satz (Dezimalbruch-Entwicklung). Zu jeder reellen Zahl a 2 Œ0; 1Œ existiert genau eine Folge k1 ; k2 ; : : : in f0; 1; : : : ; 9g, sodass für die Dezimalbrüche an ´ k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n T gilt: .Œan ; an C 10&n //n2N ist eine Intervallschachtelung mit n2N Œan ; an C 10&n Œ D fag.
(1)
Beweis. Existenz: Die gesuchten Ziffern werden induktiv erzeugt. Im ersten Schritt * * * &1 * &1 Œ0; teilt man das Intervall 1Œ in 10 gleich lange Teile: 0; 10 ; 10 ; 2 ( 10&1 ; : : : ; * * &1 in*genau einem dieser Intervalle der Länge 10&1 etwa a 2 *9 ( 10 &1; 1 . Dann&1liegt a &1 k1 ( 10 ; k1 ( 10 C 10 . Dadurch ist k1 2 f0; 1; : : : ; 9g bestimmt. Man setzt a1 ´ k1 ( 10&1 . Seien nun k1 ; : : : ; kn 2 f0; 1; : : : ; 9g bereits fixiert, sodass für an ´ k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n
gilt: a 2 Œan ; an C 10&n Œ :
Abschnitt 2.8
$ Dezimaldarstellung
93
Dann wird das letztgenannte Intervall der Länge 10&n wiederum in 10 gleich lange Teile geteilt, und man erhält auf dieselbe Weise wie im ersten Schritt die Existenz einer wohlbestimmten Ziffer knC1 , sodass h h für anC1 ´ an C knC1 ( 10&.nC1/ gilt: a 2 anC1 ; anC1 C 10&.nC1/ : Die Intervalle Œan ; an C 10&n /, n D 1; 2; : : :, bilden eine Intervallschachtelung mit (2)
an . a < an C 10&n :
Tatsächlich ist die Folge der linken Enden an aufgrund der Konstruktion monoton wachsend und die Folge der rechten Enden bn ´ an C 10&n monoton fallend; denn es ist bn & bnC1 D an C 10&n & anC1 & 10&.nC1/ D &knC1 ( 10&.nC1/ C 10&n & 10&.nC1/ D 10&n & .knC1 C 1/10&.nC1/ % 0: Aufgrund von (2) zieht sich die Intervallschachtelung auf a zusammen, wobei wegen des echten Kleinerzeichens in der zweiten Ungleichung a auch im Durchschnitt der zugehörigen halboffenen Intervalle liegt. Eindeutigkeit: Gilt für das gleiche a mit weiteren Ziffern kj0 und aus diesen analog * * T gebauten an0 : n2N an0 ; an0 C 10&n D fag, so erkennt man die gleichen Monotonieaussagen wie für die obigen ungestrichenen Größen. Die zugehörigen abgeschlossenen Intervalle bilden dann wiederum eine Intervallschachtelung. Wegen an0 . a < an0 C 10&n haben die kj0 die gleiche Eigenschaft wie die kj bezüglich der jeweiligen " Zerlegung in 10 gleich lange Teilintervalle, sodass stets kj D kj0 folgt. Die Ziffern k1 ; k2 ; k3 : : :, die der reellen Zahl a 2 Œ0; 1Œ nach B zugeordnet sind, bestimmen rückwärts das a eindeutig (vermöge der obigen Intervallschachtelung). Man schreibt üblicherweise: (3)
a D 0;k1 k2 k3 : : :
und nennt das die Dezimalbruch-Entwicklung von a. Wenn alle Ziffern nach einem Index m % 1 verschwinden: kj D 0 für j > m, so schreibt man statt (3) (4)
a D 0;k1 k2 k3 : : : km :
In diesem Fall stimmt a mit am überein, da sich die aj ab m nicht mehr ändern und andererseits gegen a konvergieren. Somit ist eine abbrechende DezimalbruchEntwicklung wie in (4) wertemäßig dasselbe wie ein Dezimalbruch. Natürlich können in einem solchen Endziffern, die gleich 0 sind weggelassen oder auch hinzugefügt werden. Wenn alle Ziffern verschwinden, so sind alle an D 0 und ebenso a D 0, und anstelle von (4) kann man einfach a D 0 schreiben.
94
Kapitel 2 Reelle Zahlenfolgen
Als Dezimaldarstellung gemäß Satz B kommt nicht jede Ziffernfolge vor. Es fehlen diejenigen Folgen .kj /, bei denen ab einem Index ` % 1 alle Ziffern gleich 9 sind: kj D 9 für j % `. Für eine solche Folge würde nämlich gelten an D a`&1 C
n X
9 ( 10&j
für alle n % `;
j D`
wobei im Falle ` D 1: a&1 ´ 0 gesetzt ist. Mittels der geometrischen Summenformel folgte hieraus an D a`&1 C 9 ( 10&` (
n&` X
10&j D a`&1 C 9 ( 10&` (
j D0
1 & 10&.n&`C1/ ; 1 & 10&1
also durch Grenzübergang n ! 1 a D a`&1 C 9 ( 10&` (
1 D a`&1 C 10&.`&1/ ; 1 & 10&1
im Widerspruch zu a < a`&1 C 10&.`&1/ . Diese Folgen mit „Neunerschwanz“ sind allerdings die einzigen Ausnahmen. Wir zeigen nämlich C. Satz. Sei k1 ; k2 ; : : : eine Folge in f0; 1; : : : ; 9g, sodass zu jedem ` 2 N ein j > ` existiert mit kj < 9. Dann existiert genau eine reelle Zahl a 2 Œ0; 1Œ mit a D 0;k1 k2 k3 : : :. Beweis. Existenz: Um a zu konstruieren setzen wir zunächst für n 2 N an ´ k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n : Die Folge .an / ist offensichtlich monoton wachsend. Sie ist auch nach oben beschränkt. Das sieht man, indem man die kj durch 9 ersetzt und wieder die geometrische Summenformel D[1.3] anwendet. Tatsächlich kann man etwas genauer abschätzen, indem man bei gegebenem n einen Summanden, etwa den zum Index `, stehen lässt und nur in den übrigen Summanden kj durch 9 ersetzt. Das gibt dann an . 1 & .9 & k` /10&`
(5)
für n % `:
Somit existiert (6)
a WD lim an : n!1
Aus an % 0 und (5) folgt durch Grenzübergang n ! 1: a % 0;
a . 1 & .9 & k` /10&`
für alle ` 2 N;
Abschnitt 2.8
$ Dezimaldarstellung
95
insbesondere a 2 Œ0; 1Œ, da mindestens ein k` < 9 ist. Genau wie oben überprüft man, dass die Intervalle Œan ; an C 10&n / eine Intervallschachtelung bilden, die sich wegen (6) auf a zusammenzieht. Es gilt also an . a . an C 10&n für alle n 2 N. Tatsächlich steht in der zweiten Ungleichung niemals das Gleichheitszeichen. Wäre nämlich a D a` C 10&` für ein ` 2 N, so wäre die Folge der an C 10&n ab ` konstant, da sie monoton fallend gegen a konvergiert. Aus aj C 10&j D aj C1 C 10&.j C1/ für j % ` folgte dann durch Einsetzen von aj C1 D aj C kj C1 ( 10&.j C1/ und leichtes Umstellen: kj C1 D 9 für alle j % `, im Widerspruch zur Voraussetzung. Damit gilt an . a < an C 10&n für alle n 2 N, und die gleichen Argumente wie oben beim Eindeutigkeitsbeweis von B zeigen, dass das so konstruierte a tatsächlich die Dezimalbruch-Entwicklung 0; k1 k2 k3 : : : besitzt. Eindeutigkeit: Nach dem zuvor Gesagten ist die Eindeutigkeit von a klar.
"
D. Bemerkungen (algorithmische Fassungen). (i) Das induktive Verfahren vom Beginn des Beweises zu B kann als Rekursionsschema ausgesprochen werden: ( k1 D Œ10a/; a1 D k1 ( 10&1 (7) knC1 D Œ10nC1 .a & an //; anC1 D an C knC1 ( 10&.nC1/ ; n D 1; 2; : : : Dies folgt unmittelbar aus den dortigen Bedingungen, die die kn und an bestimmen. Dieses Schema dient also zur Bestimmung der Ziffernfolge k1 ; k2 ; : : : für eine Zahl a 2 Œ0; 1Œ, wobei die an mitgeliefert werden. (Die eckige Klammer bezeichnet das Größteganze.) (ii) Führt man „Reste“ rn ein in Gestalt von (8)
a µ r1 ( 10&1 ;
a & an µ rnC1 ( 10&.nC1/ ;
n D 1; 2; : : :
so kann man das Rekursionsschema (7) auf die kn , rn (anstelle der kn , an ) umschreiben: ( r1 D 10a; k1 D Œr1 / (9) rnC1 D 10.rn & kn /; knC1 D ŒrnC1 /; n D 1; 2; : : : Die ersten beiden Gleichungen von (7) gehen gerade in die ersten beiden Gleichungen von (9) über. Die vierte Gleichung von (7) verwandelt sich in rnC2 D 10.rnC1 &knC1 / für n % 1, also in rnC1 D 10.rn & kn / für n % 2, und für n D 1 ist dies ebenfalls richtig. Das liefert die dritte Gleichung von (9). Schließlich ist die vierte Gleichung von (9) nichts anderes als die dritte Gleichung von (7). Das Schema (9) dient also ebenfalls zur Bestimmung der Ziffernfolge k1 ; k2 ; : : : für a 2 Œ0; 1Œ, wobei diesmal die rn mitgeliefert werden. Wegen kn D Œrn / für n % 1
96
Kapitel 2 Reelle Zahlenfolgen
liegen die reellen Zahlen rn alle im Intervall Œ0; 10Œ. Mittels (8) kann man natürlich die rn und die an stets ineinander umrechnen. Im Fall, dass a rational ist, entspricht die Rekursion (9) übrigens genau den Schritten, die beim „Schulverfahren“ der Division zweier natürlicher Zahlen auftreten. Ist statt a 2 Œ0; 1Œ eine natürliche Zahl Z gegeben, so kann deren Dezimaldarstellung aus der obigen Dezimalbruch-Entwicklung hergeleitet werden. Dazu stellt man zunächst die kleinste Zehnerpotenz fest, die Z übertrifft: n ´ min fj 2 N j Z < 10j g: Dann gilt 10n&1 . Z < 10n , also 10&1 . Z ( 10&n < 1. Auf a ´ Z ( 10&n kann dann Satz B angewandt werden und liefert a D Z ( 10&n D 0;k1 k2 : : : kn knC1 : : : : E. Lemma. In dieser Situation gilt knC1 D knC2 D ( ( ( D 0;
k1 > 0:
Beweis. Nach (2) gilt für p % 1: anCp . a D Z ( 10&n < anCp C 10&.nCp/ , also nach Multiplikation mit 10n nCp X
eC Z
eC kj ( 10n&j . Z < Z
j DnC1
e´ Z
n X
nCp X
e C 1; kj ( 10n&j C 10&p . Z
j DnC1
kj ( 10&j ( 10n 2 N0 ;
j D1
wobei die letzte Abschätzung wieder dadurch entsteht, dass die betreffenden kj durch 9 ersetzt und die geometrische Summenformel angewandt wird. Wäre nun ein kj mit e
n gleich null und Z D Z, (10)
ZD
n X
kj ( 10n&j D k1 ( 10n&1 C k2 ( 10n&2 C ( ( ( C kn ( 1;
k1 > 1:
j D1
Dabei ist die Ziffer k1 ¤ 0, denn sonst wäre Z . 9 ( 10n&2 C ( ( ( C 9 ( 1 < 10n&1 , im Widerspruch zur minimalen Wahl von n. " F . Folgerung. Zu jeder natürlichen Zahl Z 2 N gibt es ein n 2 N und Ziffern k1 ; : : : ; kn mit (10). Sowohl n wie auch diese Ziffern sind durch Z eindeutig bestimmt. Man schreibt Z D k1 : : : kn und nennt dies die Dezimaldarstellung von Z (mit der Stellenzahl n).
Abschnitt 2.8
$ Dezimaldarstellung
97
Beweis. Die Existenz ist durch die Vorüberlegung gesichert. Die Eindeutigkeit überlegt man ganz leicht so: Aus (10) folgt durch die übliche Abschätzung: 10n&1 . Z < 10n , sodass n zwangsläufig das obige Minimum ist. Aus Z D k1 : : : kn D k10 : : : kn0 folgt 0;k1 : : : kn D 0;k10 : : : kn0 , also nach Satz B: k1 D k10 , . . . , kn D kn0 . " Ist eine positive reelle Zahl r D Z C a die Summe aus einer natürlichen Zahl Z mit der Dezimaldarstellung Z D k1 : : : kn , entsprechend F, und einem a 2 Œ0; 1Œ mit der Dezimalbruch-Entwicklung a D 0;k&1 k&2 : : : (in leicht geänderter Symbolik), so verwendet man als Dezimaldarstellung von r üblicherweise r D k1 : : : kn ;k&1 k&2 : : :, wobei in dem Teil nach dem Komma ggf. wie oben abgebrochen wird. Bei negativen reellen Zahlen s wird r ´ &s so dargestellt und dann davor ein Minuszeichen gesetzt. Z.B. ist & 54 D &1;25, da 45 D 1;25. Für die Null kann man als Dezimaldarstellung 0 (oder auch 0;00 : : : mit endlich oder unendlich vielen Nullen nach dem Komma) verwenden. (Im angelsächsischen Bereich wird das Komma durch einen Punkt ersetzt.) Im Abschnitt über Reihen 8.1 werden wir die Dezimaldarstellungen auch als Reihen schreiben und dann weitere Eigenschaften ableiten. Aufgaben und Anmerkungen 1. Man überlege, dass die Rekursion (9) im Falle a 2 Q \ Œ0; 1Œ dem üblichen elementaren Divisionsverfahren entspricht, etwa zunächst anhand des Beispiels a ´ 67 . „Schulmäßig“ startet das so, wie links gezeigt, während rechts die Werte aus der Rekursion stehen: 6 : 7 = 0,8571. . . 60 56 __ 40 35 __ 50 49 __ 10 :: :
60 ; 7 / . 40 60 r2 D 10 &8 D ; 7 7 / . 50 40 &5 D ; r3 D 10 7 7 . / 50 10 r4 D 10 &7 D ; 7 7 :: : r1 D
k1 D 8 k2 D 5 k3 D 7 k4 D 1 :: :
Dem schulmäßigen „Herunterholen“ oder „Hinzufügen“ der 0 entspricht die Multiplikation mit 10 in der linken Hälfte des Schemas (9). 2. Der Satz F über die Dezimaldarstellung einer natürlichen Zahl Z kann auch unabhängig von der Dezimalbruch-Entwicklung begründet werden.
98
Kapitel 2 Reelle Zahlenfolgen
Eine begrifflich Möglichkeit besteht darin, *die Existenz und Eindeutigkeit der Darstel* lung der Reihe nach für Z 2 10n&1 ; 10n zu betrachten und vollständige Induktion für n D 1; 2; : : : durchzuführen. Algorithmisch ergibt sich die Existenz, indem man wie oben n als n ´ min fj 2 N j Z < 10j g definiert und das (abbrechende) Rekursionsschema anwendet: 8 ˆ ˆ <
Z1 D Z;
ˆ ˆ :Z
j C1
D Zj & kj ( 10n&j ;
k1 D kj C1 D
h Z i 1 10n&1 h Z
j C1 n&.j C1/ 10
i
;
j D 0; : : : ; n:
Hierdurch ergeben sich monoton fallende Z1 % Z2 % ( ( ( % ZnC1 D 0 in N0 und k1 ; k2 ; : : : ; kn in f0; 1; : : : ; 9g, für die dann (wegen ZnC1 D 0) die behauptete Darstellung besteht. 3. Zeige: Die positive reelle Zahl hat genau dann eine abbrechende Dezimaldarstellung, wenn sie rational ist und auf die Form gebracht werden kann p=10q mit p 2 N und q 2 N0 . 4. Die Dezimaldarstellung lässt sich leicht auf eine andere Grundzahl g anstelle der 10 verallgemeinern. Dabei darf g eine beliebige natürliche Zahl % 2 sein. Man erhält so die g-adische Darstellung. Ist g > 10, so benötigt man allerdings zum Aufschreiben dieser Darstellung neue Zeichen für die Ziffern von 10 bis g & 1. Z.B. werden in der Informatik für g D 2 das Dualsystem mit den Ziffern 0; 1 und für g D 16 (dezimal) das Hexadezimalsystem mit den Ziffern 0; 1; 2; 3; 4; 5; 6; 7; 8; 9; A; B; C; D; E; F verwendet. Man übertrage die obigen Aussagen über die Dezimaldarstellung einschließlich Aufgabe 2 auf eine Grundzahl g > 1. Das kann fast automatisch geschehen, indem überall 10 durch g und dementsprechend 9 durch g & 1 ersetzt wird. Trotzdem überlege man bei jedem Schritt nochmals die Korrektheit.
3
Reelle Funktionen und ihre Grenzwerte
Funktionen sind aus dem täglichen Leben und aus unserem Weltbild nicht mehr wegzudenken. Sei es, dass man zu jedem Zeitpunkt t die Temperatur f .t/ an einer bestimmten Stelle (z.B. auf der Zugspitze) angeben möchte, sei es dass zu jedem Buch b sein Preis f .b/ bekanntgemacht werden soll, sei es, dass zu jeder Länge ` einer Feder ihre Zugkraft f .`/ bestimmt ist, usw. Diese Beispiele ließen sich beliebig vermehren. Es geht nun darum, solche Abhängigkeiten mathematisch zu erfassen und zu studieren. Die entsprechende Abstraktion ist der Begriff einer Abbildung f W X ! Y . Durch sie wird jedem Element x einer Menge X genau ein Element f .x/ einer Menge Y zugeordnet. Über die einschlägigen formalen Begriffe und Bezeichnungen kann sich der Leser im Anhang kundig machen, wobei im Augenblick davon nur ganz wenig gebraucht wird. In diesem Kapitel geht es vor allem um reelle Funktionen, das sind Abbildungen vom Typ f W A ! R, wobei A selbst eine Teilmenge von R ist. Jeder reellen Zahl x 2 A ist dann eine reelle Zahl f .x/ zugeordnet. Definitions- bzw. Zielmenge ist A bzw. R, und die Bildmenge (kurz: das Bild) ist f .A/.
3.1
Reelle Funktionen
Wir beschreiben hier einige grundlegende Eigenschaften einer reellen Funktion f W A ! R und führen wichtige Funktionstypen ein, bevor wir dann im nächsten Abschnitt zum zentralen Begriff des Grenzwertes übergehen. Die Definitionsmenge A wird in den meisten Fällen ein reelles Intervall sein. Es ist jedoch zweckmäßig, auch beliebige (nichtleere) Definitionsmengen A , R zuzulassen, wie das folgende Beispiel zeigt: A. Beispiel. Eine reelle Folge .an /n2N ist nichts anderes als eine Funktion f W N ! R, definiert durch f .n/ ´ an . Folgen sind also spezielle Funktionen. Die nachstehenden Eigenschaften haben wir auch schon bei Folgen kennengelernt: B. Definition. Wir nennen eine Funktion f W A ! R (i)
nach oben beschränkt bzw. nach unten beschränkt bzw. beschränkt, wenn das Bild f .A/ diese Eigenschaft hat;
100 (ii)
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
monoton wachsend, wenn für alle x1 ; x2 2 A mit x1 < x2 gilt: f .x1 / . f .x2 /.
(iii) streng monoton wachsend, wenn für alle x1 ; x2 2 A mit x1 < x2 gilt: f .x1 / < f .x2 /. Entsprechend zu (ii), (iii) sind die Begriffe monoton fallend bzw. streng monoton fallend definiert. Oberbegriff zu „monoton wachsend“, „monoton fallend“ ist monoton und entsprechend bei den strengen Varianten streng monoton. Eine streng monotone Funktion f W A ! R ist natürlich injektiv, also – aufgefasst als Abbildung f W A ! f .A/ – bijektiv. Es existiert dann die Umkehrfunktion f &1 W f .A/ ! A. An dieser Stelle sei auch an die folgenden elementaren Begriffe erinnert: Ist die Definitionsmenge A spiegelsymmetrisch bzgl. 0 (d.h. A D &A), so heißt die Funktion f W A ! R gerade bzw. ungerade, wenn für alle x 2 A gilt: f .&x/ D f .x/ bzw. f .&x/ D &f .x/. In der folgenden Beispielsammlung werden einige wichtige Funktionstypen vorgestellt. Viele weitere folgen später, weil die nötigen Hilfsmittel erst noch entwickelt werden müssen. Vgl. die Abschnitte 3.7 und 4.4. C. Beispiele. (i) Ein Polynom P ist eine Funktion P W R ! R mit einer Funktionsvorschrift der Gestalt: P .x/ D an x n C an&1 x n&1 C ( ( ( C a1 x C a0 :
(1)
Dabei sind n 2 N0 und an ; : : : ; a0 2 R gegebene Konstanten. Ist n > 0 und an ¤ 0, so ist ein solches Polynom P nicht beschränkt. Für jxj % 1 folgt nämlich aus (1) P .x/ an&1 1 a0 1 D1C ( C ((( C ( n an x an x an x n ˇ ˇ ˇ ˇ ˇ an&1 ˇ 1 ˇ a0 ˇ ˇ( % 1 & ˇˇ & ( ( ( & ˇˇ ˇˇ ( ˇ an jxj an ˇ ˇ ˇ ˇ ˇ an&1 ˇ 1 ˇ a0 ˇ ˇ( & ( ( ( & ˇˇ ˇˇ ( % 1 & ˇˇ ˇ an jxj an
1 jxjn 1 : jxj
Somit gilt (2)
P .x/ Q %1& n an x jxj
für jxj % 1;
wobei Q ´
jan&1 j C ( ( ( C ja0 j : jan j
101
Abschnitt 3.1 Reelle Funktionen
Hierin wird 1 & Q=jxj % 1=2, falls jxj % 2Q, also gilt 1 P .x/ % n an x 2 speziell
für jxj % max f1; 2Qg;
1 1 P .x/ % xn % x an 2 2
für x % max f1; 2Qg:
Daraus liest man ab: P ist auf RC nach oben unbeschränkt, falls an > 0, und nach unten unbeschränkt, falls an < 0. Monotonie wird man bei Polynomen i. Allg. nicht erwarten dürfen. Ein Spezialfall der Polynome sind die Potenzfunktionen: Pn .x/ ´ x n . Deren Monotonie lässt sich diskutieren, wenn man folgende Identität für n 2 N und a; b 2 R heranzieht: ( ) (3) an & b n D .a & b/ an&1 C an&2 b C ( ( ( C ab n&2 C b n&1 : Diese erhält man z.B. aus der geometrischen Summenformel (9)[1.3], indem man dort q D b=a substituiert (oder man bestätigt sie durch Ausmultiplizieren der rechten Seite). Ist n > 0 ungerade, so liest man aus (3) ab: 0 < a < b H) an & b n < 0 a < b < 0 H) an & b n < 0: Zusammen mit 0n D 0 impliziert dies, dass Pn für ungerades n 2 N streng monoton wächst (auf ganz R). Ist n > 0 gerade, so folgt analog aus (3), dass Pn auf RC 0 streng monoton wächst und auf R& streng monoton fällt. 0 (ii)
Eine rationale Funktion F hat eine Funktionsvorschrift der Form F .x/ ´
P .x/ ; Q.x/
P; Q Polynome:
Die Definitionsmenge ist A ´ R n Q&1 .0/. (Natürlich sei Q nicht das Nullpolynom, weil für dieses die Definitionsmenge von F leer wäre.) (iii)
Die Signumsfunktion sign W R ! R ist definiert durch 8 für x > 0 < 1 0 für x D 0 sign x ´ : &1 für x < 0:
Sie ist beschränkt und monoton wachsend, jedoch nicht streng monoton wachsend.
102
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
(iv) Die Größteganze-Funktion oder Gauß-Klammer Œ / W R ! R ist definiert durch Œx/ ´ max fk 2 Z j k . xg; d.h. Œx/ ist die größte ganze Zahl . x; vgl. Beispiel F[1.4]. Somit gilt x 2 Œk; k C 1Œ; k 2 Z () Œx/ D k; insbesondere stets
Œx/ . x < Œx/ C 1:
Diese Funktion ist also intervallweise konstant. Sie ist unbeschränkt und monoton wachsend. p (v) Die Quadratwurzelfunktionp W RC 0 ! R (B[2.2]) ist unbeschränkt und streng monoton wachsend: Wäre x . c für alle x % 0, so folgte durch p p Quadrieren x . c 2 für alle x % 0, ein Widerspruch. Wäre 0 . a < b, aber a % b, so folgte ebenso ein Widerspruch durch Quadrieren. D . Definition. Der Graph der Funktion f W A ! R ist die folgende Menge im kartesischen Produkt R2 D R ) R: ˇ , ˚ Gf ´ .x; y/ 2 R2 ˇ x 2 A und y D f .x/ : Der Graph dient üblicherweise zur Veranschaulichung von f . Es empfiehlt sich, zwischen einer Funktion (als einer Zuordnung) und ihrem Graphen (als Teilmenge eines kartesischen Produkts) zu unterscheiden. Eine Funktion ist sozusagen etwas Dynamisches, ein Graph etwas Statisches. Die folgenden Bilder zeigen die Graphen der Signumsfunktion und der Gauß-Klammer. 4 3 2 1
1 x 0 -1
x
-4
-3
-2
-1
0
1
2
3
4
-1 -2
Signumsfunktion
-3 -4
Gauß-Klammer
103
Abschnitt 3.1 Reelle Funktionen
Figuren sind als Beweismittel nicht zugelassen. Trotzdem sind sie oftmals sehr hilfreich, um Ideen zu finden oder zu veranschaulichen. Man mache ruhig von Schaubildern, Graphen, numerischen Experimenten usw. Gebrauch – allerdings mit der gebotenen Vorsicht für das präzise Schließen! E . Beispiel. Es gibt Funktionen, deren Graph man nicht zeichnen kann, etwa die Dirichlet-Funktion f W R ! R, definiert durch ( 1 für x 2 Q f .x/ ´ 0 für x 2 R n Q: F. Definition (Operationen für reelle Funktionen). Gegeben seien zwei Funktionen f W A ! R und g W A ! R mit der gleichen Definitionsmenge A. Dann sind definiert: ' der Betrag
jf j W A &! R
' die Summe
f C g W A &! R
' das Produkt
f ( g W A &! R
durch
jf j.x/ ´ jf .x/jI
durch .f C g/.x/ ´ f .x/ C g.x/I durch
.f ( g/.x/ ´ f .x/ ( g.x/I f f f .x/ ' der Quotient W A n g &1 .0/ &! R durch .x/ ´ : g g g.x/ Diese Festsetzungen werden als argumentweise Definitionen bezeichnet. (Beim Produkt schreibt man auch fg und beim Quotienten gelegentlich f =g.) G . Bemerkung. Oftmals ist von einer Funktion zunächst nur die Zuordnungsvorschrift gegeben, etwa in Gestalt eines formelmäßigen Ausdrucks. Üblicherweise wählt man in solchen Fällen als Definitionsmenge die maximal mögliche, für die die Vorschrift sinnvoll ist (es sei denn es wird etwas anderes dazugesagt). Bestimmungsgleichungen Ist eine Funktion f W A ! R gegeben, so ist damit oft das Problem einer Bestimmungsgleichung verbunden. Eine solche hat z.B. die Gestalt (4)
f .x/ D c;
wobei c 2 R ebenfalls vorgegeben ist. Man soll dann alle x 2 A finden, die diese Gleichung erfüllen, die so genannten Lösungen. Mit anderen Worten: Es sind die Urbilder von c unter der Abbildung f gesucht, oder äquivalent: Es soll die Urbildmenge f &1 .c/ bestimmt werden. In einigen Fällen kann dieses formelmäßig durch Umstellen und Isolieren der „Unbekannten“ x geschehen, z.B. bei linearen oder quadratischen Gleichungen. Man muss sich aber im Klaren darüber sein, dass das meistens nicht möglich ist. Es erhebt sich dann die Frage nach der Existenz bzw. der Eindeutigkeit der Lösung, d.h. danach, ob f &1 .c/ nichtleer bzw. einelementig ist. Schließlich soll die Lösung (oder ggf. die Lösungen) berechnet werden.
104
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
H. Beispiele. (i) Eine Gleichung, die nicht formelmäßig gelöst werden kann, ist z.B. x 7 C x D 1, eine andere e x D 3 & x, obwohl man mit den Hilfsmitteln der folgenden Kapitel nachweisen kann, dass beide Gleichungen Lösungen besitzen. (ii) Manchmal kann man durch Substitution auf eine formelmäßig lösbare Gleichung zurückkommen. Sei z.B. die Gleichung vorgelegt: e 2x C 2e x D 3: Durch die Substitution y D e x geht diese über in y 2 C 2y D 3: Diese quadratische Gleichung hat (nach der üblichen Lösungsformel) die beiden Lösungen y D 1 und y D &3. Die „Resubstitution“ führt auf die beiden Gleichungen e x D 1 (mit der Lösung x D 0) und e x D &3 (was nicht lösbar ist, da die e-Funktion nur positive Werte annimmt). Somit hat die Ausgangsgleichung genau die Lösung x D 0. Eine allgemeine Bestimmungsgleichung der Gestalt '.x/ D 4.x/ kann äquivalent in der Form '.x/ & 4.x/ D 0 geschrieben werden, d.h. es ist eine Zurückführung auf das Nullstellenproblem möglich. I. Definition. Ein ˛ 2 A heißt Nullstelle der Funktion f W A ! R, wenn f .˛/ D 0 gilt. Die Nullstellenmenge von f ist fx 2 A j f .x/ D 0g D f &1 .0/, die Urbildmenge von 0 unter f . Wenn 0 gar nicht zum Bild f .A/ gehört, so ist die Urbildmenge f &1 .0/ natürlich leer, d.h. die Gleichung f .x/ D 0 hat keine Lösung. Ansonsten ist die Urbildmenge entweder einelementig – d.h. die Gleichung f .x/ D 0 ist eindeutig lösbar – oder aber sie enthält mindestens zwei Elemente – d.h. die Gleichung f .x/ D 0 ist mehrdeutig lösbar. Zusammengefasst: Das Auffinden der Nullstellen einer Funktion ist dasselbe wie das Lösen der Bestimmungsgleichung f .x/ D 0: Das Lösen von Gleichungen ist eine der Grundaufgaben der Mathematik. Wichtig ist dabei immer das Existenzproblem: „Gibt es eine Lösung?“ und genauso das Eindeutigkeitsproblem: „Gibt es mehr als eine Lösung?“. Schließlich bleibt die Aufforderung: „Berechne die Lösung (oder die Lösungen)!“
Abschnitt 3.1 Reelle Funktionen
105
Einige Grundlagen über Polynome Wir betrachten ein Polynom P W R ! R mit der Darstellung wie in (1) (5)
P .x/ D an x n C an&1 x n&1 C ( ( ( C a1 x C a0 :
Ein Polynom braucht keine Nullstelle zu haben (zum Beispiel ist x 2 C 1 > 0 für alle x 2 R, also sicher niemals 0). Aber wenn es Nullstellen gibt, so liegen sie in einem angebbaren Intervall: J. Lemma. Ist ˛ Nullstelle des Polynoms P (5) mit n 2 N und an ¤ 0, so gilt + % jan&1 j C ( ( ( C ja0 j j˛j . max 1; : jan j Insbesondere kann nicht jede reelle Zahl Nullstelle von P sein. Beweis. Ist j˛j < 1, so ist die Behauptung trivial erfüllt. Sei jetzt j˛j % 1. Dann folgt aus (2) für x D ˛: 0 % 1 & Q=j˛j, also j˛j . Q. " K. Satz (Identitätssätze). Seien n; m 2 N0 . (i)
Gilt für alle x 2 R an x n C ( ( ( C a1 x C a0 D 0;
(6)
so folgt an D ( ( ( D a1 D a0 D 0. (ii) Gilt für alle x 2 R (7)
an x n C ( ( ( C a1 x C a0 D bm x m C ( ( ( C b1 x C b0
und ist an ¤ 0 und bm ¤ 0, so folgt n D m und aj D bj für alle j 2 f0; : : : ; ng. Beweis. Zu (i): Wäre eines der aj ungleich null, so sei ak dasjenige mit größtem Index. Dann hätte das Polynom Q mit Q.x/ ´ ak x k C ( ( ( a0 jede reelle Zahl zur Nullstelle, was nach Lemma J unmöglich ist. Zu (ii): Angenommen es wäre n < m. Dann folgte aus der Voraussetzung bm x m C ( ( ( C bnC1 x nC1 C .bn & an /x n C ( ( ( C .b0 & a0 / D 0 für alle x 2 R. Nach (i) implizierte dies (unter anderem) bm D 0 im Widerspruch zur Voraussetzung. Also ist n % m, und analog überlegt man n . m. Wegen n D m folgt aus der Voraussetzung nun .bn & an /x n C ( ( ( C .b0 & a0 / D 0 für alle x 2 R, also nach (i): bn & an D ( ( ( D b0 & a0 D 0.
"
106
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
K. Zusatz. Die Identitätssätze sind die Grundlage für die Methode des Koeffizientenvergleichs: Die aj und das n in (5) sind allein durch die Zuordnung P bestimmt, falls an ¤ 0. Man nennt dann n den Grad des Polynoms P und schreibt deg.P / ´ n. Die aj heißen die Koeffizienten von P , insbesondere an der Leitkoeffizient und a0 das konstante Glied. Ist der Leitkoeffizient gleich 1, so nennt man das Polynom normiert. Jedes Polynom der Form x 7! ax n heißt ein Monom. Das Nullpolynom 0 (0.x/ ´ 0 8 x 2 R) bekommt formal den Grad deg.0/ ´ &1. Polynome vom Grad . 1, P .x/ D ax C b, also auch das Nullpolynom, heißen affine Funktionen, speziell bei b D 0 lineare Funktionen. Die Identitätssätze dienen hier lediglich dazu, die Eindeutigkeit der im Zusatz genannten Begriffe zu sichern. Wir werden bald sehen, wie sich die Identitätssaussagen deutlich verbessern lassen. L. Lemma. Sind P; Q Polynome, so auch P C Q und P ( Q, und es gilt für die Grade deg.P C Q/ . max fdeg.P /; deg.Q/g deg.P ( Q/ D deg.P / C deg.Q/: Beweis. Summe und Produkt von Polynomen P; Q sind wiederum Polynome. Das liest man an den Darstellungen von P; Q ab und ebenso, wie sich dabei die Leitkoeffizienten verhalten: Bei der Summenbildung P C Q können sich die Leitkoeffizienten aufheben, wenn die Grade von P und Q gleich sind; ansonsten bleibt der Leitkoeffizient des Polynoms mit höherem Grad bei der Addition erhalten. Bei der Produktbildung P (Q entsteht als Leitkoeffizient das Produkt der Leitkoeffizienten von P und Q. Daraus ergeben sich die behaupteten Gradregeln. Diese bleiben auch richtig in den Fällen, wo P oder Q das Nullpolynom ist (wenn man die Terme sinngemäß interpretiert). " Polynome sind besonders wichtige Funktionen, da ihre Werte allein mit den Körperoperationen (ohne Division) berechnet werden können. Man versucht daher, allgemeinere Funktionen durch Polynome zu approximieren. Ein Beispiel dafür ist die Darstellung der e-Funktion aus D[2.4]. 3 x -n e x D lim 1 C : n!1 n Der Ausdruck rechts nach dem Limeszeichen ist ein Polynom vom Grad n. Weitere Beispiele zur Approximation durch Polynome werden bei der Taylor-Entwicklung in 8.3 auftreten. In Analysis 3 werden wir ganz allgemein sehen, wie stetige Funktionen durch Polynome beliebig genau angenähert werden können (Approximationssatz von Weierstraß). Ein einfacher algebraischer Aspekt bei Polynomen ist der folgende: Ist P wie in (5) ein Polynom vom Grad n % 1 und ˛ 2 R fest, so kann man P .x/ D P ..x & ˛/ C ˛/
107
Abschnitt 3.1 Reelle Funktionen
schreiben und bei der Bildung der rechten Seite in jedem Term den binomischen Satz auf das zweite Pluszeichen anwenden: Es gilt ja 0 ! k X k k k x D ..x & ˛/ C ˛/ D .x & ˛/k&j ˛ j : j j D0
Insgesamt entsteht so für das Polynom ein neuer Ausdruck der Form (8)
P .x/ D bn .x & ˛/n C bn&1 .x & ˛/n&1 C ( ( ( C b1 .x & ˛/ C b0 ;
mit gewissen neuen Koeffizienten bn ; : : : ; b0 2 R (Umentwicklung eines Polynoms mit Zentrum ˛). Dabei sind die neuen Koeffizienten wieder eindeutig bestimmt (da die Abbildung x 7! x & ˛ von R auf sich bijektiv ist), und es gilt bn D an . An dieser Umentwicklung sieht man Folgendes: Das Zentrum ˛ ist dann und nur dann Nullstelle von P , wenn P .x/ den Faktor x & ˛ abspaltet, d.h wenn es ein Polynom Q gibt, sodass stets (9)
P .x/ D .x & ˛/ ( Q.x/
gilt. In diesem Fall nennen wir Q.x/ den Kofaktor des Linearfaktors x & ˛. Ist dies so und hat Q erneut die Nullstelle ˛, so kann man auf das Polynom Q die gleiche Prozedur anwenden und ebenso den Faktor x & ˛ abspalten, etc. Es gibt dann eine größte natürliche Zahl ( . n, sodass P .x/ die Potenz .x & ˛/& abspaltet, also mit einem Polynom Q$ stets gilt: (10)
P .x/ D .x & ˛/& ( Q$ .x/ mit Q$ .˛/ ¤ 0:
Dieses ( heißt die Vielfachheit oder Multiplizität der Nullstelle ˛. Man spricht auch von einer (-fachen Nullstelle ˛ (bei ( D 1 bzw. ( D 2 von einer einfachen bzw. doppelten Nullstelle). In (10) wird Q$ .x/ der Kofaktor von .x & ˛/& genannt. Ist P .ˇ/ ¤ 0, so nennt man ˇ eine Nullstelle der Vielfachheit oder Multiplizität 0. Nullstellen der Vielfachheit 0 sind also gerade die Nichtnullstellen! Wendet man die Abspaltung auf jede weitere eventuell vorhandene Nullstelle von P an, so ergibt sich induktiv eine Darstellung (11)
e P .x/ D .x & ˛1 /&1 .x & ˛2 /&2 ( ( ( .x & ˛k /&k ( Q.x/;
e keine Nullstellen mehr in R besitzt und sein Grad nach Lemma in der das Polynom Q L gleich n & .(1 C ( ( ( C (k / ist. Die ˛1 ; : : : ; ˛k sind dann genau die reellen Nullstellen von P mit den jeweiligen Multiplizitäten (1 ; : : : ; (k . Man bezeichnet (11) als eine Produktdarstellung oder Faktorisierung von P . Ihre Kenntnis ist äquivalent mit der Kenntnis aller reellen Nullstellen von P einschließlich der Vielfachheiten. Die Ausdrücke x &˛j werden als Linearfaktoren der Produktdarstellung (11) bezeichnet.
108
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
e eine Konstante (nämlich gleich dem Ist (1 C ( ( ( C (k D n, also das Polynom Q Leitkoeffizienten), so heißt das Polynom zerfallend (in R). Aus diesen Überlegungen folgt insbesondere, dass ein Polynom vom Grad n % 1 höchstens n reelle Nullstellen haben kann. Damit lassen sich die Identitätssätze K deutlich verschärfen: Es brauchen als Voraussetzungen die Gleichungen (6), (7) keineswegs für alle x 2 R zu gelten. Vielmehr reicht es, wenn diese Gleichungen für N reelle Zahlen x erfüllt sind, wenn nur N größer als n und m ist. Ist P ein Polynom vom Grad n, so nennt man die Bestimmungsgleichung P .x/ D 0 eine algebraische Gleichung vom Grad n. Die obigen Feststellungen machen keine Aussage darüber, wie man eine algebraische Gleichung wirklich lösen kann. Tatsächlich ist dies ein nichttriviales Problem. Für algebraische Gleichungen vom Grad 2, 3 und 4 existieren allgemeine Lösungsformeln (für Grad 2 aus der Schulmathematik bekannt). Diese Lösungsausdrücke findet man in den Lehrbüchern der klassischen Algebra, z.B. bei Perron[1951]. Allerdings sind sie für die Grade 3 und 4 so kompliziert, dass sie für praktische Zwecke kaum in Frage kommen. Vom Grad n D 5 an gibt es keine allgemeinen Lösungsformeln mehr. Das ist ein berühmter Satz von Abel. In der numerischen Mathematik werden aber zahlreiche Näherungsverfahren zur Nullstellenberechnung entwickelt. Eine rationale Funktion F ist, wie gesagt, über eine Funktionsvorschrift der Form (12)
F .x/ ´
P .x/ ; Q.x/
P; Q Polynome
definiert, wobei Q nicht das Nullpolynom ist. Die Definitionsmenge ist A ´ R n Q&1 .0/. Da Q nur endlich viele Nullstellen hat, ist F überall in R bis auf endlich viele Stellen definiert. Bei einer Funktion, die über einen Ausdruck definiert ist, kann man diesen umformen, muss aber damit rechnen, dass hierdurch die Definitionsmenge verändert wird. Außerdem ist selbst bei unveränderter Definitionsmenge und gleicher Zuordnung der Ausdruck eventuell nicht eindeutig bestimmt. So auch hier: Ist z.B. a 2 R nicht Nullstelle von Q, so kann man den Bruch in (12) mit x & a erweitern, wodurch sich die Definitionsmenge um fag vermindert, aber die Zuordnungsvorschrift ansonsten unverändert bleibt. Ist a Nullstelle von Zähler und Nenner, so kann man den Bruch mit x &a erweitern, ohne die Definitionsmenge und die Zuordnung zu ändern, aber die Polynome im Zähler und Nenner sind danach andere. Entsprechende Effekte stellen sich ein beim Kürzen, wenn P und Q gemeinsame Nullstellen haben, wobei sich die Definitionsmenge vergrößern kann. Solches Kürzen wird man durchaus anstreben, zumal sich die Grade von Zähler und Nenner dabei verkleinern. Aber das Kürzen ist natürlich nicht zwingend. Aus diesen Gründen sollte eine rationale Funktion zusammen mit dem Paar von Zähler- und Nennerpolynom betrachtet werden, es sei denn, es ist im Einzelfall etwas anderes vereinbart.
109
Abschnitt 3.1 Reelle Funktionen
Wie bei ganzen Zahlen existiert auch bei Polynomen der Begriff der Teilbarkeit. Ein Polynom S heißt Teiler des Polynoms P , wenn ein Polynom S $ existiert mit P D S S $ . Man sagt dafür auch, P sei durch S teilbar. Ein solches S $ werde als Kofaktor von S bezeichnet. Zwei Polynome P; Q heißen teilerfremd, wenn sie keinen gemeinsamen Teiler vom Grad % 1 besitzen. Sind in der Darstellung (12) einer rationalen Funktion die Polynome P und Q teilerfremd, so heißt sie reduziert. Das Umgehen mit rationalen Funktionen wird oftmals durch den so genannten Divisionsalgorithmus erleichtert. Dieser betrifft hauptsächlich den Fall, dass der Zählergrad größer oder gleich dem Nennergrad ist und beide Polynome mindestens den Grad 1 haben. Dann kann man ein Polynom G „abdividieren“ derart, dass der „Rest“ die konträre Eigenschaft hat: R.x/ P .x/ D G.x/ C ; Q.x/ Q.x/
deg.R/ < deg.Q/:
Dies geht trivial auch, wenn deg.P / < deg.Q/, nämlich mit G ´ 0 und R ´ P . Wir beweisen diese Darstellung in der „durchmultiplizierten“ Gestalt: M. Satz und Definition (Division mit Rest). Seien P; Q Polynome mit Q ¤ 0. Dann gibt es genau ein Paar von Polynomen G; R mit (13)
P D GQ C R;
deg.R/ < deg.Q/:
Man nennt G den ganzen Anteil, R=P den gebrochenen Anteil und R den Rest der Division P =Q. Zugelassen ist auch deg.R/ D &1 (d.h. R D 0). Dies charakterisiert gerade den Fall, dass die Division P =Q aufgeht, also P =Q (außer an den Nullstellen von Q) mit einem Polynom G übereinstimmt oder m.a.W., dass P durch Q teilbar ist. Beweis von M. Sei q ´ deg.Q/ % 0. Eindeutigkeit: Sei neben (13) auch P D G1 Q C R1 ;
deg.R1 / < deg.Q/
mit Polynomen G1 ; R1 . Dann folgt durch Subtraktion R & R1 D .G1 & G/Q. Wäre R & R1 ¤ 0, so müsste auch G1 & G ¤ 0 sein. Daraus folgte für den Grad q > deg.R & R1 / D deg.G1 & G/ C q, ein Widerspruch. Somit ist R & R1 D 0, also auch G1 & G D 0. Existenz: Im Fall deg.P / < deg.Q/ leisten G ´ 0 und R ´ P das Gewünschte. Sei jetzt deg.P / % deg.Q/, also mit p ´ deg.P /: P .x/ D cp x p C ( ( ( C c1 x C c0 ;
cp ¤ 0
Q.x/ D bq x q C ( ( ( C b1 x C b0 ;
bq ¤ 0:
110
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Nun zieht man von P .x/ ein Vielfaches von x p&q Q.x/ ab, sodass das entstehende e einen niedrigeren Grad als P hat. Das richtige Vielfache ist offensichtPolynom R cp p&q e % q ist, kann man das Verfahren für R e anstelle P Q.x/. Falls deg. R/ lich bq x wiederholen. Nach höchstens q & p C 1 Schritten entsteht ein Polynom R D P & GQ mit deg.R/ < q. Das Paar G; R leistet also das Gewünschte. " Dieser Existenzbeweis ist konstruktiv geführt. Tatsächlich liegt er dem üblichen Divisionsschema zugrunde. N. Beispiel. Sei P .x/ ´ x 4 & 2x 3 C 3x 2 C 3x C 6;
Q.x/ ´ x 2 C x C 1:
Dann wird P .x/ & x 2 Q.x/ D &3x 3 C 2x 2 C 3x C 6 P .x/ & x 2 Q.x/ C 3xQ.x/ D 5x 2 C 6x C 6 P .x/ & x 2 Q.x/ C 3xQ.x/ & 5Q.x/ D x C 1; also
G.x/ D x 2 & 3x C 5;
R.x/ D x C 1:
Das gleiche Ergebnis erhält man schematisch in der Form . x 4 & 2x 3 x4 C x3 & 3x 3 & 3x 3
C 3x 2 C x2 C 2x 2 & 3x 2 5x 2 5x 2
C 3x ? y C 3x & 3x C 6x C 5x x
xC1 C 6ˇ / W . x 2 C x C 1 / D x 2 & 3x C 5 C 2 x CxC1 ˇ ˇ ˇ ? y C 6 C 5 C 1
Der ganze Anteil erscheint rechts oben, der Rest ganz unten. Im Fall ganzzahliger Koeffizienten kann man alle rationalen Nullstellen explizit bestimmen. Das beruht auf folgendem O. Lemma (von Gauß). Das Polynom P sei ganzzahlig, d.h. alle seine Koeffizienten seien ganze Zahlen: P .x/ D an x n C ( ( ( C a0 ;
aj 2 Z
für j D 0; : : : ; n;
und es sei hierbei n % 1, an ¤ 0 , a0 ¤ 0. Dann gilt: Ist die rationale Zahl pq mit teilerfremden Zahlen p; q 2 Z n f0g Nullstelle von P , so ist p Teiler von a0 und q Teiler von an .
111
Abschnitt 3.1 Reelle Funktionen
. / p Beweis. Es sei die Bedingung für q abgeleitet (bei p geht es analog): Aus P D0 q folgt der Reihe nach an
p n&1 p pn C a C ( ( ( C a1 C a0 D 0 n&1 qn q n&1 q
an p n C an&1 p n&1 q C ( ( ( C a1 pq n&1 C a0 q n D 0 &q.an&1 p n&1 C ( ( ( C a1 pq n&2 C a0 q n&1 / D an p n : Nach der letzten Zeile ist q Teiler von an p n . Wegen der Teilerfremdheit von q und p muss dann q Teiler von an sein. (Hierzu braucht man etwas elementare Zahlentheorie.) " Bei einem ganzzahligen Polynom kommen als rationale Nullstellen höchstens die rationalen Zahlen mit den im Lemma genannten Teilbarkeitseigenschaften in Frage. Das sind aber endlich viele, sodass man mit der Probe feststellen kann, welche davon wirklich Nullstellen sind. Weitere rationale Nullstellen kann es dann nicht mehr geben (wohl aber natürlich irrationale). Zusätzliche Eigenschaften von Polynomen werden wir bei den komplexen Zahlen in Abschnitt 7.4 besprechen. Aufgaben und Anmerkungen 1. Es seien f; g W R ! R beschränkte bzw. monoton wachsende Funktionen. Sind dann auch f C g, f ( g, f ı g beschränkt bzw. monoton wachsend? 2. Man beweise: Ist die Funktion f W Œa; b/ ! R monoton, so besitzt jf j ein Maximum, und dieses wird bei a oder b angenommen. (jf j ist definiert durch jf j .x/ ´ jf .x/j für alle x 2 Œa; b/.) 3. Die Menge A , R sei spiegelbildlich bzgl. 0. Man beweise: Jede Funktion f W A ! R kann auf genau eine Weise als Summe f D g C u einer geraden Funktion g W A ! R und einer ungeraden Funktion u W A ! R dargestellt werden. Es gilt g.x/ D
1 .f .x/ C f .&x//; 2
u.x/ D
1 .f .x/ & f .&x//: 2
4. Für zwei vom Nullpolynom verschieden Polynome P; Q gilt stets deg.P ı Q/ D deg.P / ( deg.Q/: 5. Für ein Polynom P W R ! R, P .x/ D an x n C ( ( ( C a0 , zeige man: a) P ist dann und nur dann eine gerade Funktion, wenn alle Koeffizienten ak mit ungeradem Index k verschwinden,
112
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
b) P ist dann und nur dann eine ungerade Funktion, wenn alle Koeffizienten ak mit geradem Index k verschwinden, 6. Gegeben sei das folgende Polynom vom Grad 4: P .x/ ´ x 4 & 5x 3 C 7x 2 & 5x C 6: Man bestimme alle reellen Nullstellen sowie die Faktorisierung von P entsprechend (11). Lösung: Da das Polynom ganzzahlige Koeffizienten hat, wird man zunächst alle rationalen Nullstellen bestimmen: Für p; q in Lemma O bestehen die Möglichkeiten p D ˙1; ˙2; ˙3
(die Teiler von 6)
qD1
(der einzige positive Teiler von 1),
wobei nur bei einer Sorte beide Vorzeichen zu berücksichtigen sind (hier beim Nenner). Also kommen als rationale Nullstellen höchstens in Betracht: p D ˙1; ˙2; ˙3: q Durch die Probe findet man, dass davon lediglich 2 und 3 Nullstellen sind. Das Divisionsschema zur Abspaltung des Linearfaktors x & 3 liefert .x 4 & 5x 3 C 7x 2 & 5x C 6/ W .x & 3/ D x 3 & 2x 2 C x & 2: (Das Divisionsverfahren zur Abspaltung eines Linearfaktors ist wie viele der älteren Algorithmen auf die Handrechnung abgestimmt. Ein anderes iteratives Verfahren, das den gleichen Zweck besser erfüllt, wird in Aufgabe 8 vorgestellt.) Das Resultat ist also zunächst P .x/ D x 4 & 5x 3 C 7x 2 & 5x C 6 D .x & 3/ ( .x 3 & 2x 2 C x & 2/: Das Polynom Q.x/ ´ x 3 & 2x 2 C x & 2 hat (natürlich) die Nullstelle x D 2, was man auch direkt bestätigt: Q.2/ D 0. Es muss also den Linearfaktor x & 2 abspalten. Tatsächlich findet man durch erneute Anwendung des Divisionsschemas Q.x/ D x 3 & 2x 2 C x & 2 D .x & 2/.x 2 C 1/: Da der letzte Faktor keine Nullstelle in R besitzt, lautet also die gewünschte Produktdarstellung e P .x/ D x 4 & 5x 3 C 7x 2 & 5x C 6 D .x & 3/ ( .x & 2/ ( Q.x/ mit
e Q.x/ ´ x 2 C 1;
und 2; 3 sind die einzigen reellen Nullstellen von P . Beide besitzen die Vielfachheit 1.
113
Abschnitt 3.1 Reelle Funktionen
7. Man betrachte ein zerfallendes normiertes Polynom P vom Grad n % 1 einerseits in der additiven Darstellung (5) P .x/ D x n C an&1 x n&1 C ( ( ( C a1 x C a0 ;
(14)
andererseits in der multiplikativen Darstellung (15)
P .x/ D .x & ,1 /.x & ,2 / ( ( ( .x & ,n /;
die aus (11) entsteht, indem die Potenzen der Linearfaktoren ausgeschrieben werden; d.h. die Liste ,1 ; ,2 ; : : : ; ,n besteht aus allen Nullstellen von P , wobei jede so oft genannt ist, wie ihre Vielfachheit angibt. Durch Vergleich von (14) und (15) beweise man den Wurzelsatz von Vieta X j D 1; : : : ; n; ,k1 ,k2 ( ( ( ,kj ; (16) .&1/j an&j D 1#k1
speziell
&an&1 D ,1 C ,2 C ( ( ( C ,n ;
.&1/n a0 D ,1 ,2 ( ( ( ,n :
Man nennt die rechten Seiten von (16) die elementarsymmetrischen Funktionen von ,1 ; ,2 ; : : : ; ,n . 8. Horner-Schema. Die ursprüngliche Polynomdarstellung in (1) ist zur Berechnung der Funktionswerte schlecht geeignet, da unnötig viele Operationen (Multiplikationen) gebraucht werden. Man kann dem abhelfen, indem man (1) folgendermaßen umformt: P .x/ D an x n C an&1 x n&1 C ( ( ( C a0 D x.( ( ( .x.x.xan C an&1 / C an&2 / C an&3 / ( ( ( / C a0 : Die Klammern werden von innen nach außen abgearbeitet. Demgemäß erhält man die Zwischenresultate und das Endergebnis aus dem (endlichen) Rekursionsschema: H0 .x/ ´ an Hk .x/ ´ xHk&1 .x/ C an&k ;
k D 1; : : : ; n:
Das ist das so genannte Horner-Schema. Man zeige: a) P .x/ D Hn .x/; b) Ist ˛ 2 R fest, so gilt (17)
3 P .x/ D .x & ˛/ ( H0 .˛/x n&1 C H1 .˛/x n&2 C ( ( (
C Hn&2 .˛/x C Hn&1 .˛/ C Hn .˛/:
114
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Das kann man für x ¤ ˛ in der Form schreiben Hn .˛/ P .x/ 2 D H0 .˛/x n&1 C H1 .˛/x n& C ( ( ( C Hn&2 .˛/x C Hn&1 .˛/ C : x&˛ x&˛ Das ist also eine spezielle Form der Division mit Rest. c) Ist ˛ eine Nullstelle von P , P .˛/ D 0, so geht (17) über in 3 P .x/ D .x & ˛/ ( H0 .˛/x n&1 C H1 .˛/x n&2 C ( ( ( C Hn&2 .˛/x C Hn&1 .˛/ : Somit sind die Zahlen H0 .˛/; : : : ; Hn&1 .˛/ zugleich die Koeffizienten des Kofaktors von x & ˛. Dieser ist also aus dem Horner-Schema ablesbar. d) Man setze das Horner-Schema für das Polynom P aus Aufgabe 6 mit ˛ D 3 an und berechne so erneut den Kofaktor von x & 3. Das Horner-Schema erfordert deutlich weniger Multiplikationen als die ursprüngliche Polynomdarstellung und ist wegen seiner rekursiven Gestalt hervorragend für die Rechnerimplementation geeignet. Seine weitere Ausgestaltung erfolgt in der numerischen Mathematik. Dort wird auch eine bei niedrigen n geeignete Tabellenvariante beschrieben. 9. Seien P ¤ 0 und Q ¤ 0 Polynome. Zeige: Ist P Teiler von Q und Q Teiler von P , so existiert ein c ¤ 0 mit P D c ( Q. Polynome mit dieser letzten Eigenschaft nennt man zueinander assoziiert. 10. Es gibt ein endliches Verfahren, mit dem man feststellen kann, ob zwei gegebene Polynome teilerfremd sind, den so genannten Euklidischen Algorithmus. Dieser verläuft so: Gegeben seien Polynome P ¤ 0 und Q ¤ 0. Man setzt P1 ´ P;
P2 ´ Q
und wendet sukzessive Division mit Rest an, bis schließlich ein Rest verschwindet: P1 D G 1 P2 C P3 ;
deg.P3 / < deg.P2 /
P2 D G 2 P3 C P4 ;
deg.P4 / < deg.P3 /
:: : Pr&1 D Gr&1 Pr C PrC1 ;
deg.PrC1 / < deg.Pr /
Pr D Gr PrC1 : Alle Symbole in Großbuchstaben sind dabei Polynome, und in den ersten r & 1 Gleichungen verschwinde der Rest noch nicht, d.h. die Polynome P3 ; : : : ; PrC1 sind alle ¤ 0. Die restfreie Division der letzten Zeile muss sich nach endlich vielen Schritten ergeben, weil die Grade, wie rechts angemerkt, monoton fallen.
115
Abschnitt 3.1 Reelle Funktionen
a) Indem man die Gleichungen von unten nach oben verfolgt, zeige man: Das Polynom PrC1 ist Teiler von P2 D Q und von P1 D P . b) Indem man die Gleichungen von oben nach unten bis zur vorletzten Gleichung verfolgt, zeige man dass alle Reste P3 ; : : : ; PrC1 durch P1 ; P2 ausgedrückt werden können, sodass sich schließlich eine Darstellung von PrC1 der Gestalt PrC1 D P c P C Qc Q mit Polynomen c P ;c Q ergibt. c) Aus b) deduziere man, dass jeder gemeinsame Teiler von P und Q auch Teiler von PrC1 ist. Das Polynom PrC1 ist also ein gemeinsamer Teiler von P und Q, mit maximalem Grad. Als solcher ist er bis auf Assoziiertheit eindeutig bestimmt und heißt deswegen ein größter gemeinsamer Teiler von P; Q. d) Zeige: P; Q sind teilerfremd, genau wenn es Polynome c P ;c Q gibt mit 1 D Pc P C Qc Q: e) Ist die Darstellung einer rationalen Funktion F wie in (12) gegeben, so kann man den Bruch rechts mit einem größten gemeinsamen Teiler kürzen und erhält dadurch eine reduzierte Darstellung einer rationalen Funktion R1 D P1 =Q1 . Das ist aber auch die einzige Art und Weise, wie eine reduzierte Darstellung entstehen kann. Man zeige nämlich: Gilt für teilerfremde Polynome P1 ; Q1 außerhalb der Nullstellen von Q und Q1 P .x/ P1 .x/ D ; Q.x/ Q1 .x/ so entsteht P =Q durch Erweitern von P1 =Q1 mit einem Polynom. Jede Nullstelle von Q1 ist dann auch Nullstelle von Q (aber i. Allg. nicht umgekehrt). Außerhalb der Nullstellen von Q stimmen die Werte von F D P =Q und F1 ´ P1 =Q1 überein. Ist Q1 .a/ ¤ 0, aber Q.a/ D 0, so bietet es sich an, die Funktion F in a durch die Festsetzung F .a/ ´ F1 .a/ zu ergänzen. f)
Aus e) folgere man, dass reduzierte Darstellungen im Wesentlichen eindeutig bestimmt sind, d.h. sind P; Q bereits teilerfremd und ebenso P1 ; Q1 und gilt außerhalb der Nullstellen von Q und Q1 P1 .x/ P .x/ D ; Q.x/ Q1 .x/ so existiert eine Konstante c ¤ 0 mit P1 D cP
und
Q1 D cQ:
116
3.2
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Grenzwerte
Ein zentrales Interesse der Analysis gilt dem Änderungsverhalten von Funktionen. Wir studieren hier die Entwicklung der Funktionswerte f .x/ bei Annäherung des Arguments x an eine feste Stelle a. Es geht dabei nicht um einzelne Funktionswerte, sondern um das „asymptotische“ Verhalten aller Funktionswerte „nahe“ a. Natürlich muss eine Annäherung von x an a überhaupt möglich sein. Daher wird zuvor Folgendes definiert: A. Definition. Gegeben sei ein a 2 R und ein ı > 0. Man definiert ˇ ˚ , (i) die ı-Umgebung von a als U.a; ı/ ´ x 2 R ˇ jx & aj < ı . ˇ , ˚ (ii) die punktierte ı-Umgebung von a als U $ .a; ı/ ´ x 2 R ˇ 0 < jx & aj < ı . Die erste Punktmenge ist ein Intervall, die zweite eines, bei dem die Mitte herausgestochen ist, nämlich U.a; ı/ D/a & ı; a C ıŒ U $ .a; ı/ D U.a; ı/ n fag:
a-δ
a
a+δ
B. Definition. Gegeben sei eine nichtleere Teilmenge A , R. Ein a 2 R heißt Häufungspunkt von A, wenn für alle ı > 0 gilt: A \ U $ .a; ı/ ¤ ¿. Dies bedeutet, dass in jeder punktierten ı-Umgebung von a mindestens ein Element von A liegt. Ein a 2 A, das nicht Häufungspunkt von A ist, heißt isolierter Punkt von A. Bei einem isolierten Punkt a 2 A existiert also eine ı-Umgebung von a, in der a das einzige Element von A ist. Enthält die Menge A nur isolierte Punkte, so nennt man sie diskret. C. Beispiele. (i) Sei A ´ 1=N, die Menge der Kehrwerte natürlicher Zahlen. Dann ist 0 Häufungspunkt von A: Zu gegebener punktierter Umgebung U $ .0; ı/ sei nämlich ein N 2 N so gewählt, dass für n > N gilt: 1=n < ı. Diese Zahlen 1=n liegen dann in der Menge A \ U $ .0; ı/, die also nichtleer ist. (ii) Bei A ´ N ist jedes Element ein isolierter Punkt; denn in der 1-Umgebung /n & 1; n C 1Œ von n 2 N ist n das einzige Element von A. Die natürlichen Zahlen bilden also eine diskrete Teilmenge von R. (iii) Die Menge A , R sei nichtleer und nach oben beschränkt. Ist sup A … A, so ist sup A Häufungspunkt von A: Sei s ´ sup A. Angenommen, es gäbe ein ı > 0 mit A \ U $ .s; ı/ D ¿. Dann wäre auch A \ U.s; ı/ D ¿ (da
117
Abschnitt 3.2 Grenzwerte
s … A), also s & ı obere Schranke von A. Denn in /s & ı; s/ liegt kein Element von A und ebenso wenig in fx j x > sg (da s obere Schranke von A). Somit wäre s & ı eine kleinere obere Schranke von A als s, Widerspruch! Auch im Falle sup A 2 A kann sup A Häufungspunkt von A sein. In jedem Fall gilt: Ist sup A Häufungspunkt von A, so ist sup A der größte Häufungspunkt von A. Denn sonst gäbe es Elemente von A, die größer als s sind. (iv) Entsprechendes gilt bei einer nichtleeren nach unten beschränkten Menge bzgl. des Infimums. Ein Häufungspunkt von A braucht nicht Element von A zu sein, wie das Beispiel (i) zeigt. Man beachte auch den Unterschied zwischen dem Begriff „Häufungswert“, der sich auf eine Folge bezieht, und dem Begriff „Häufungspunkt“, der sich auf eine Menge bezieht. D. Beispiel. Die Folge .an / mit an D 1 für alle n 2 N hat den Häufungswert 1, aber 1 ist nicht Häufungspunkt der zugehörigen Bildmenge f1g. E. Definition. Gegeben sei die Funktion f W A ! R und ein Häufungspunkt a von A. Wir nennen f konvergent für x gegen a, wenn es ein b 2 R gibt mit folgender Eigenschaft: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit 0 < jx & aj < ı gilt: jf .x/ & bj < ". Ist dies der Fall, so heißt b der Grenzwert von f für x gegen a (symbolisch: x ! a), und man schreibt lim f .x/ D b
x!a
oder
f .x/ &! b
(für x &! a):
Wir werden gleich sehen, dass auch hier der Grenzwert im Falle der Existenz eindeutig bestimmt ist. Die eingerahmte Eigenschaft nennen wir den ."; ı/-Test. Eine äquivalente Umformulierung des ."; ı/-Tests lautet: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass der Schluss gilt: x 2 A; 0 < jx & aj < ı H) jf .x/ & bj < ": Nach der in der Mengenlehre getroffenen Vereinbarung bedeutet diese Zeile, dass die Implikation für alle x zutrifft, die die Prämisse erfüllen. Ohne „Variable“ x formuliert, lautet diese Zeile äquivalent: f .A \ U $ .a; ı// , U.b; "/. Ähnlich wie bei Folgen besagt die Konvergenz: f .x/ weicht vom Grenzwert b beliebig wenig ab, wenn nur x hinreichend nahe bei a (jedoch ¤ a) ist. Beachte: f .a/ ist eventuell nicht definiert und spielt auch keine Rolle!
118
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
E. Zusatz. Gilt limx!a f .x/ D b, so sagt man auch: f .x/ konvergiert (oder geht oder strebt) für x gegen a gegen b oder auch: b D limx!a f .x/ existiert (in R). Die Verneinung von „konvergent“ ist divergent. Die direkte Überprüfung des ."; ı/-Tests geschieht wie bei den Folgen in Abschnitt 2.1 durch Angabe eines ı."/, das mittels geeigneter Abschätzungen gewonnen werden kann. Indirekte, aber oft sehr wirksame Methoden zur Grenzwertbestimmung werden sich im weiteren Verlauf ergeben. Zunächst einige Beispiele, die nur die obige Definition verwenden: F. Beispiele. (i)
Es gilt:
lim
x!0
p x D 0:
p Zum Nachweis gibt p sei " > 0 gegeben. Wann wird j x & 0j < "? Umrechnung äquivalent: x < " oder auch (da alle Argumente % 0 sind): x < "2 . Somit leistet ı."/ ´ "2 das Verlangte. (ii)
Es gilt:
lim x 2 D 0:
x!0
Man könnte genauso vorgehen wie eben. Eine andere Methode ist wieder die Aufstellung einer Vorausabschätzung. Hier ist eine solche: jx 2 j . jxj für jxj < 1. Somit wird jx 2 & 0j < ", falls jxj < min f1; "g, also leistet ı."/ ´ min f1; "g das Verlangte. (iii) Ist die Funktion f W A ! R in einer punktierten Umgebung von a konstant gleich c, so gilt lim f .x/ D c: x!a
Ist diese Umgebung gleich U .a; ı0 /, so gilt ja jf .x/ & cj D 0 für x 2 A \ U $ .a; ı0 /, also leistet das konstante ı."/ ´ ı0 das Verlangte. $
Wie bei den Folgen kommt es darauf an, den Unterschied zum vermuteten Grenzwert kleiner als " > 0 zu bekommen, indem hier nun der Unterschied von x zu a kleiner als ein geeignetes ı > 0 gemacht wird – und das für jedes vorgegebene " > 0, wobei ı > 0 von " abhängen darf. Die Diskussion der Funktionenkonvergenz geschieht in weitgehender Analogie zu der bei den Folgen, und zwar sowohl bei den Aussagen wie bei den Beweisen. Die Argumente sollen hier nicht im Einzelnen wiederholt werden. Als Muster für eine analoge Beweisführung sei die folgende notwendige Bedingung für die Konvergenz behandelt. Vgl. dazu bei den Folgen I(i)[2.1]. G. Satz. Existiert der Grenzwert b D limx!a f .x/ in R, so gibt es ein ı1 > 0, sodass f in A \ U.a; ı1 / beschränkt ist.
119
Abschnitt 3.2 Grenzwerte
Beweis. Man nehme als ı1 eines, das laut Definition zu " D 1 gehört. Dann gilt für x 2 A \ U $ .a; ı1 /: jf .x/ & bj < 1, also jf .x/j < jbj C 1. In A \ U.a; ı1 / gilt dann die gleiche Schranke, falls a … A, bzw. jf .x/j . max fjbj C 1; f .a/g, falls a 2 A. " H. Bemerkung. Ähnlich wie hier erkennt man die Analoga für das Meidungsprinzip in J[2.1], die Einschnürung in Q[2.1] und die restlichen Punkte in I[2.1] sowie P[2.1]. Auf den Zusammenhang mit der Monotonie (Analogon zu N[2.1]) gehen wir in Abschnitt 3.6 ein. Darüber hinaus existiert ein Übertragungsprinzip, das die Konvergenz bei Funktionen unmittelbar auf die Konvergenz bei Folgen zurückführt (Satz K). Zuvor sei noch Begriff des Häufungspunkts mit Folgen charakterisiert: I. Satz. Gegeben sei eine Teilmenge A , R und ein a 2 R. Dann sind äquivalent: (i)
a ist Häufungspunkt von A.
(ii) Es gibt eine Folge .xn / in A n fag mit xn ! a. Beweis. (i) H) (ii): Zu ı D 1=n (n eine natürliche Zahl) existiert ein xn 2 A \ U $ .a; 1=n/. Die Folge .xn / liegt dann in A n fag und konvergiert wegen jxn & aj < 1=n gegen a. (ii) H) (i): Zu gegebener punktierter Umgebung U $ .a; ı/ sei ein N 2 N so gewählt, dass für n > N gilt: jxn & aj < ı. Für diese n ist dann xn Element der Menge A \ U $ .a; ı/, diese also nichtleer. " J. Beispiel. Bei einem Intervall A ´ Œ˛; ˇŒ mit ˛ < ˇ ist jedes Element a 2 A Häufungspunkt von A. Dazu betrachtet man die Folge xn ´ a C .1=n/. Diese konvergiert gegen a, und nach dem Meidungsprinzip erfüllen ihre Elemente nach einem gewissen Index alle xn < ˇ, liegen also in A n fag. Nach der obigen Äquivalenz ist a Häufungspunkt von A. Auch ˇ ist Häufungspunkt von A (aber nicht Element von A). Das folgt genau wie eben, indem man die Folge ˇ & .1=n/ betrachtet. Die Punkte außerhalb von Œ˛; ˇ/ sind keine Häufungspunkte von A; denn jede konvergente Folge in A hat ihren Grenzwert in Œ˛; ˇ/. K. Satz. Gegeben sei die Funktion f W A ! R und ein Häufungspunkt a von A. Dann sind äquivalent: (i) (ii)
lim f .x/ existiert in R.
x!a
Für jede Folge .xn / in A n fag mit xn ! a existiert lim f .xn / in R. n!1
120
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
(iii) Für jede Folge .xn / in A n fag mit xn ! a existiert lim f .xn / in R, und alle n!1 diese Limites sind untereinander gleich. Ist dies erfüllt, so gilt für jede solche Folge .xn /: lim f .x/ D lim f .xn /:
x!a
n!1
Beweis. Soll wie hier die Äquivalenz von mehr als zwei Aussagen nachgewiesen werden, so ist es zweckmäßig, statt der paarweisen Äquivalenzen einen Ringschluss durchzuführen. Hier ist ein solcher: H)
(ii)
H (
( H
(i)
(iii)
Der Ringschluss umfasst drei Implikationen, im Gegensatz zu den sechs Implikationen (i) () (ii), (ii) () (iii), (i) () (iii) bei der paarweisen Äquivalenz. Trotzdem liefern die drei Implikationen des Ringschlusses insgesamt die paarweisen Äquivalenzen. Denn man kommt in dem Ring von jedem Punkt zu jedem anderen (ggf. mit „Umweg“). (i) H) (ii): Sei limx!a f .x/ D b; xn 2 A; xn ¤ a für alle n und xn ! a. Zu zeigen ist: limn!1 f .xn / D b. Dies geht so: Zu " > 0 existiert nach Voraussetzung ein ı > 0, sodass für alle x 2 A \ U $ .a; ı/ gilt: jf .x/ & bj < " . Zu diesem ı existiert nach Voraussetzung ein N 2 N, sodass für alle n > N gilt: jxn & aj < ı. Durch Aneinanderfügen dieser Schlüsse erhält man: n > N H) xn 2 A \ U $ .a; ı/ H) jf .xn / & bj < ". Dies impliziert limn!1 f .xn / D b. (ii) H) (iii): Sei für zwei solche Folgen .xn / und .xn0 / vorausgesetzt: limn!1 f .xn / D b und limn!1 f .xn0 / D b 0 . Zu zeigen ist b D b 0 . Hierzu betrachtet man die „gemischte Folge“ nach dem „Reißverschluss-System“: x1 ; x10 ; x2 ; x20 ; x3 ; x30 ; : : : &! a: Diese konvergiert ebenfalls gegen a (man nehme aus den beiden ."; N /-Bedingungen der Einzelfolgen jeweils das maximale N und verdopple dieses). Nach Voraussetzung besteht eine Konvergenz f .x1 /; f .x10 /; f .x2 /; f .x20 /; f .x3 /; f .x30 /; : : : &! b 00 : Für die ungestrichenen und gestrichenen Teilfolgen hiervon gilt nach C[2.6] limn!1 f .xn / D b 00 und limn!1 f .xn0 / ! b 00 , somit b D b 0 D b 00 .
121
Abschnitt 3.2 Grenzwerte
(iii) H) (i): Sei b der gemeinsame Grenzwert der Folgen .f .xn //, und sei " > 0 gegeben. Zu zeigen ist: Es gibt ein ı > 0, sodass gilt: x 2 A \ U $ .a; ı/ H) jf .x/ & bj < ". Angenommen, ı existiert nicht. Dann gibt es zu jedem ı > 0 ein x 2 U $ .a; ı/ mit jf .x/ & bj % ". Speziell existiert zu ı D 1=n (n eine natürliche Zahl) ein xn 2 A \ U $ .a; 1=n/, sodass jf .xn / & bj % ". Dann gilt xn 2 A n fag; xn ! a, jedoch nicht f .xn / ! b, im Widerspruch zu (iii). Die restliche Behauptung ist enthalten zu Beginn des Schlusses (i) H) (ii).
"
L. Beispiele. (i) Existiert limx!0 Œx/? (Die eckige Klammer bezeichnet das Größteganze.) Die Antwort lautet „nein“. Ist nämlich .xn / eine Folge in /&1; 0Œ mit xn ! 0, so gilt f .xn / D &1 ! &1. Ist aber .xn0 / eine Folge in /0; 1Œ mit xn0 ! 0, so gilt f .xn0 / D 0 ! 0. Daraus folgt die Divergenz laut K(iii). So wie hier kann die Bedingung K(iii) oft genutzt werden, um Divergenzen zu erkennen. (ii) Die Äquivalenz zwischen (i) und (ii) in Satz K kann man heranziehen, um die p Konvergenz von Folgen zu diskutieren. Z.B. ergibt sich aus limx!0 x D 0 laut F(i), p dass für jede Nullfolge .xn / in RC gilt: limn!1 xn D 0. Mit dem Übertragungsprinzip von Satz K kann man vieles aus der Konvergenz für Folgen auf die Konvergenz für Funktionen übernehmen, z.B. die folgenden drei Sätze. Dabei sei stets a als Häufungspunkt von A vorausgesetzt. M. Satz. Gilt lim f .x/ D b, so ist b eindeutig bestimmt.
"
x!a
N. Satz (Rechenregeln für Grenzwerte). Gegeben seien zwei Funktionen f W A ! R und g W A ! R. Dann folgt aus der Existenz von lim f .x/ und lim g.x/ in R x!a
(i) (ii) (iii) (iv)
x!a
ˇ ˇ lim jf .x/j D ˇ lim f .x/ˇ
x!a
x!a
lim .f .x/ C g.x// D lim f .x/ C lim g.x/
x!a
x!a
x!a
lim .f .x/ ( g.x// D lim f .x/ ( lim g.x/
x!a
x!a
lim
x!a
lim f .x/ f .x/ x!a D ; g.x/ lim g.x/ x!a
x!a
falls
lim g.x/ ¤ 0
x!a
einschließlich der Existenz der Grenzwerte auf den linken Seiten in R.
"
122
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Diese Regeln erlauben es, aus bekannten Grenzwerten viele neue zu erzeugen, einfach durch Anwendung der Operationen: Betrag, Addition, Multiplikation und Division. So folgt aus limx!a x D a sofort limx!a x p D ap für Exponenten p 2 N und allgemeiner für jedes Polynom P W R ! R lim P .x/ D P .a/:
x!a
In (iv) wird keine Aussage gemacht, wenn der „Nennerlimes“ gleich null ist. Tatsächlich ist in diesem Fall das Verhalten individuell verschieden: O. Bemerkungen. Es mögen b ´ lim f .x/ und c ´ lim g.x/ x!a
x!a
in R existieren. Dann gibt es bei c D 0 folgende Möglichkeiten: (i) Es ist c D 0 und b ¤ 0. In diesem Fall ist die Funktion f =g in jeder punktierten Umgebung von a (geschnitten mit A) unbeschränkt, also ihr Grenzwert nicht existent in R. Wäre nämlich f =g in A \ U $ .a; ı1 / beschränkt, so könnten wir dort schreiben f .x/ ( g.x/; f .x/ D g.x/ und das Analogon zu I(iii)[2.1] würde zeigen, dass b D 0 ist, im Widerspruch zur Voraussetzung. (ii) Es ist c D 0 und b D 0. In diesem Fall kann f =g sowohl konvergieren (auch gegen 0) als auch divergieren: (ii.a)
Es gilt x2 & 1 .x & 1/.x C 1/ D lim D lim .x C 1/ D 2: x!1 x & 1 x!1 x!1 x&1 lim
Hier ist a D 1, b D limx!1 .x 2 & 1/ D 0 und c D limx!1 .x & 1/ D 0. In solchen Fällen hilft oft geeignetes Kürzen, insbesondere bei Polynomen, wie in (9)[3.1] oder (10)[3.1] ausgedrückt. Hier ist das Kürzen mit x & 1 erlaubt, da im ."; ı/-Test der Konvergenz x D a ausgeschlossen ist. (ii.b) Es gilt x 2 & 2x C 1 .x & 1/2 D lim D lim .x & 1/ D 0: x!1 x!1 x & 1 x!1 x&1 lim
Hier ist ebenfalls a D 1, b D limx!1 .x 2 &2x C1/ D 0 und c D limx!1 .x &1/ D 0.
123
Abschnitt 3.2 Grenzwerte
(ii.c)
Es existiert nicht in R lim
x!1 x 2
x&1 : & 2x C 1
Auch hier ist a D 1, b D limx!1 .x 2 & 2x C 1/ D 0 und c D limx!1 .x & 1/ D 0. Das Kürzen ergibt für x ¤ 1 x&1 1 D ; x 2 & 2x C 1 x&1 und dies kann nach (i) nicht konvergieren. P. Satz (Cauchy-Kriterium). Der Grenzwert limx!a f .x/ existiert dann und nur dann in R, wenn gilt: Zu jedem " > 0 gibt es ein ı D ı."/ > 0, sodass für alle x1 ; x2 2 A \ U $ .a; ı/ gilt: jf .x1 / & f .x2 /j < ": " Neben den mehr algebraischen Rechenregeln für Grenzwerte von Satz N besteht auch ein Substitutionsprinzip für die Komposition: f g Q. Satz (Substitutionsprinzip). Seien A; B Teilmengen von R und A &! B & !R zwei Abbildungen. Weiter sei a Häufungspunkt von A und b Häufungspunkt von B sowie c 2 R und f .x/ ¤ b für alle x ¤ a in A. Dann gilt der Schluss lim f .x/ D b;
x!a
lim g.y/ D c
y!b
H)
lim g.f .x// D c:
x!a
Beweis. Im Grunde hat man lediglich die beiden Konvergenztests für f und g „aneinander zu setzen“: Sei ıf ."/ zu jedem " > 0 dasjenige ı, das zur Konvergenz limx!a f .x/ D b gehört. Ebenso sei ıg ."/ zu jedem " > 0 dasjenige ı, das zur Konvergenz limy!b g.y/ D c gehört. Dann gilt bei gegebenem " > 0 g.f .x// 2 U $ .c; "/;
falls f .x/ 2 U $ .b; ıg ."//;
und weiter f .x/ 2 U $ .b; ıg ."//;
falls x 2 U $ .a; ıf .ıg ."///; x 2 A;
wobei f .x/ ¤ b abgedeckt ist durch die Voraussetzung f .x/ ¤ b für alle x ¤ a. Insgesamt ergibt sich der ."; ı/-Test für lim g.f .x// D c, nämlich mit ı."/ ´ ıf .ıg ."//.
x!a
"
Wie bei den Teilfolgen existieren auch hier Grenzübergänge eingeschränkter Funktionen:
124
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
R. Definition (eingeschränkte Grenzübergänge). Gegeben sei eine Funktion f W A ! R, eine Teilmenge C , A sowie ein Häufungspunkt c von C . Existiert für die Einschränkung b D lim .f jC /.x/ in R, so schreiben wir: x!c
b D lim f .x/; x!c x2C
speziell für den rechtsseitigen Grenzwert im Fall C D A \ fx 2 R j x > cg: b D lim f .x/; x#c
bzw. für den linksseitigen Grenzwert im Fall C D A \ fx 2 R j x < cg: b D lim f .x/: x"c
S. Satz. Gegeben seien f , C und c wie in Definition R. (i) Aus der Existenz von b D limx!c f .x/ folgt die von b D limx!c f .x/. x2C
(ii) Aus der Existenz von b D limx#c f .x/ und b D limx"c f .x/ (einschließlich ihrer Gleichheit!) folgt die von b D limx!c f .x/. Beweis. Zu (i): Der ."; ı/-Test für „x ! c“ enthält den für „x ! c; x 2 C “. Zu (ii): Man nimmt aus den beiden ."; ı/-Tests der einseitigen Grenzübergänge das minimale ı für den Gesamtgrenzwert. " T. Beispiel. Für die Signumsfunktion gilt limx"0 sign.x/ D &1, limx#0 sign.x/ D 1, aber limx!0 sign.x/ existiert nicht, da im Falle der Existenz die beiden einseitigen Grenzwerte nach (i) übereinstimmen müssten. Aufgaben und Anmerkungen 1. Beim ."; ı/-Test „kommt es nur auf kleine " > 0 an“. Das soll heißen: Ist "0 > 0 fest gegeben und gilt der ."; ı/-Test in der Form ($) Zu jedem " > 0 mit " < "0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit 0 < jx & aj < ı gilt: jf .x/ & bj < ", so gilt er auch in der ursprünglichen Form (ohne den Zusatz " < "0 ). Man beweise dies in Analogie zu F[2.1].
125
Abschnitt 3.2 Grenzwerte
2. Man untersuche auf Konvergenz bzw. Divergenz a) lim .1=Œ1=x//;
b) lim jxj ( Œ1=x/.
x!0
x!0
3. Es besteht die Aussage zur Einschnürung: Gilt für drei Funktionen f W A ! R, g W A ! R und h W A ! R stets f .x/ . g.x/ . h.x/ und ist für einen Häufungspunkt a von A: limx!a f .x/ D limx!a h.x/ D b, so gilt auch limx!a g.x/ D b. Man beweise dies in Analogie zu Q[2.1]. 4. Es besteht das Majorantenkriterium für Funktionen: Gilt für zwei Funktionen f W A ! R, g W A ! R, ein b 2 R und einen Häufungspunkt a von A stets jf .x/&bj . g.x/ und ist limx!a g.x/ D 0, so folgt limx!a f .x/ D b. Man beweise dies in Analogie zu I(ii)[2.1]. 5. Ist die Funktion f W A ! R beschränkt und gilt für einen Häufungspunkt a von A und eine weitere Funktion g W A ! R: limx!a g.x/ D 0, so gilt auch limx!a f .x/g.x/ D 0. Man beweise dies in Analogie zu I(iii)[2.1]. 6. In Ungleichungen darf man „unscharf“ zur Grenze übergehen. Das soll heißen: Gilt für zwei Funktionen f W A ! R, g W A ! R stets f .x/ . h.x/ und existieren für einen Häufungspunkt a 2 A die Grenzwerte b D limx!a f .x/ und c D limx!a g.x/, so ist b . c. Man beweise dies in Analogie zu P[2.1]. 7. Seien P; Q W R ! R Polynome und a 2 R mit Q.a/ ¤ 0. Zeige: lim
x!a
P .x/ P .a/ D : Q.x/ Q.a/
8. Seien P; Q W R ! R Polynome und a 2 R mit P .a/ ¤ 0 und Q.a/ D 0. Zeige, dass f .x/ ´ P .x/=Q.x/ in jeder punktierten Umgebung von a unbeschränkt ist, also für x ! a divergiert. Lösungshinweis: Antithese mittels der Gleichung P .x/ D f .x/Q.x/. 9. Seien P; Q W R ! R nicht identisch verschwindende Polynome, und es sei a 2 R mit P .a/ D Q.a/ D 0. Die Vielfachheit der Nullstelle a bzgl. P bzw. Q sei p bzw. q. Dann gilt P .x/ D .x & a/p ( P $ .x/ und Q.x/ D .x & a/q ( Q$ .x/ mit Polynomen P $ ; Q$ , wobei P $ .a/ ¤ 0 und Q$ .a/ ¤ 0. Vgl. (10)3.1. Aufgrund der für x ¤ a gültigen Darstellung der rationalen Funktion f .x/ ´
P .x/ P $ .x/ D .x & a/p&q $ Q.x/ Q .x/
zeige man a) Ist p > q, so gilt lim f .x/ D 0. x!a
b) Ist p D q, so gilt lim f .x/ D x!a
P $ .a/ . Q$ .a/
126
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
c) Ist p < q, so ist f in jeder punktierten Umgebung von a unbeschränkt, divergiert also für x ! a. Lösungshinweis zu c): Ähnlich wie bei Aufgabe 8.
3.3
Stetigkeit
Stetige Funktionen sollen das beschreiben, was man von einer vernünftigen Entwicklung erwartet. Eine stetige Funktion sollte z.B. keine Sprünge machen. Die Diskussion, wie das präzise zu fassen ist, war in der Mathematik ein längerer Prozess, der schließlich auf folgende Begriffsbildung führte. Eine anschauliche Motivierung wird am Ende dieses Abschnitts beschrieben. Wir betrachten eine reelle Funktion f W A ! R, definiert auf einer (nichtleeren) Teilmenge A , R, eine feste Stelle a 2 A sowie den Funktionswert f .a/. Die Forderung ist, dass die anderen Funktionswerte f .x/ beliebig wenig von f .a/ abweichen, wenn nur x hinreichend nahe bei a liegt. Das bedeutet in der ."; ı/-Sprache: A. Definition. Die Funktion f W A ! R heißt stetig in a 2 A, wenn gilt: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit jx&aj < ı gilt: jf .x/ & f .a/j < ". Es handelt sich hierbei um die Stetigkeit an einer festen Stelle a 2 A. Die eingerahmte Eigenschaft nennen wir den ."; ı/-Test für die Stetigkeit.
gegeben
f(a) + ε f(a) f(a) - ε gesucht
a-δ
a
a+δ
127
Abschnitt 3.3 Stetigkeit
Der ."; ı/-Test ist im obigen Bild veranschaulicht. Er besagt für den Graphen: Gegeben ein waagrechter Streifen der Dicke 2" um f .a/, so muss es möglich sein, einen senkrechten Streifen um a der Dicke 2ı zu finden, derart dass die Punkte .x; f .x// alle in dem „Fenster“ landen, das vom Durchschnitt der beiden Streifen gebildet wird, wenn nur x im Intervall /a & ı; a C ıŒ (geschnitten mit A) variiert. Das muss für jedes " > 0 erreichbar sein, wobei natürlich ı von " abhängen darf. Eine äquivalente Umformulierung des ."; ı/-Tests lautet: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass gilt: x 2 A; jx & aj < ı H) jf .x/ & f .a/j < ": Mit dem Umgebungsbegriff lautet diese Zeile äquivalent x 2 A \ U.a; ı/ H) f .x/ 2 U.f .a/; "/: Beachte: Hier steht U.a; ı/ (nicht U $ .a; ı/ wie beim Grenzwert!). p p B. Beispiel. Die Wurzelfunktion W RC 0 ! R ist in a D 0 stetig: Um j x & p p 0j D x < " für x > 0 zu erreichen, muss offensichtlich x < "2 gemacht werden. Mit ı."/ ´ "2 ist also der ."; ı/-Test erfüllt. Das läuft praktisch genauso wie beim entsprechenden Grenzwert in F(i)[3.2]. Die Stetigkeit kann im Wesentlichen auf den Grenzwertbegriff zurückgeführt werden, was ja schon an der Gestalt des ."; ı/-Tests ablesbar ist: C. Satz. Gegeben sei f W A ! R und a 2 A. Dann gilt: (i)
Ist a isolierter Punkt von A, so ist f in a stetig.
(ii) Ist a Häufungspunkt von A, so besteht die Äquivalenz: f stetig in a ()
lim f .x/ D f .a/:
x!a
Beweis. Zu (i): Nach Voraussetzung existiert ein ı1 > 0 mit A \ U.a; ı1 / D fag. Zu gegebenem " > 0 sei ı ´ ı1 gewählt. Dann gilt für x 2 A \ U.a; ı/ notwendig x D a, also 0 D jf .x/ & f .a/j < ". Zu (ii): Wir schreiben auf, was die beiden Seiten der behaupteten Äquivalenz bedeuten: f stetig in a bedeutet: 8 " > 0 9 ı > 0 8 x 2 A \ U.a; ı/ W jf .x/ & f .a/j < ":
128
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
lim f .x/ D f .a/ bedeutet:
x!a
8 " > 0 9 ı > 0 8 x 2 A \ U $ .a; ı/ W jf .x/ & f .a/j < ": Da jf .a/ & f .a/j < ", verlangen beide Bedingungen dasselbe.
"
Hieraus ergibt sich die Folgencharakterisierung der Stetigkeit: D. Satz. Gegeben sei f W A ! R und a 2 A. Dann sind äquivalent: (i)
f ist stetig in a.
(ii) Für jede Folge .xn / in A mit xn ! a gilt f .xn / ! f .a/. Beweis. Wir machen eine Fallunterscheidung, je nachdem a isolierter Punkt oder Häufungspunkt von A ist: a ist isoliert: Dann ist (i) nach C(i) immer erfüllt. Aber auch (ii) ist immer erfüllt; denn zu ı1 > 0 mit A \ U.a; ı1 / D fag existiert ein N , sodass für alle n > N gilt: xn 2 A \ U.a; ı1 /. Für diese n ist dann xn D a. Also ist .f .xn //n>N die konstante Folge .f .a//n>N . a ist Häufungspunkt von A: Hier folgt die Äquivalenz von (i) und (ii) aus C(ii) und K[3.2]. " Die einfachsten Unstetigkeiten herrschen an den Sprungstellen; das sind Punkte, an denen zwar die einseitigen Grenzwerte von f .x/ existieren, aber untereinander verschieden sind. Die einschlägigen Begriffe für solche einseitigen Annäherungen sind die folgenden: E. Definition. Gegeben sei ein Intervall J , R, eine Funktion f W J ! R und eine Stelle a 2 J . Ist a nicht linker Endpunkt von J , so nennt man f linksseitig stetig in a, wenn limx"a D f .a/ gilt. Ist a nicht rechter Endpunkt von J , so nennt man f rechtsseitig stetig in a, wenn limx#a D f .a/ gilt. Ist a kein Endpunkt von J , so nennt man a eine Sprungstelle von f , wenn die einseitigen Grenzwerte limx"a f .x/ und limx#a f .x/ in R existieren, jedoch verschieden sind. Natürlich gilt über das Verhältnis zwischen diesen einseitigen Grenzwerten und dem Grenzwert limx!a f .x/ das in S(i)[3.2] Gesagte. In einer Sprungstelle a ist f nach C(ii) unstetig. Das folgende Bild veranschaulicht eine Sprungstelle und den negativen Ausgang des ."; ı/-Tests bei geeignetem ".
129
Abschnitt 3.3 Stetigkeit
f(a) + ε f(a) f(a) - ε
a-δ
a
a+δ
Sprungstelle und negativer Ausgang des ."; ı/-Tests Bezüglich der Operationen für Funktionen, wie sie in F[3.1] definiert wurden, verhält sich die Stetigkeit wie folgt: F. Satz. Gegeben seien zwei Funktionen f W A ! R und g W A ! R mit gleicher Definitionsmenge A sowie ein a 2 A. Dann folgt aus der Stetigkeit von f und g in a die Stetigkeit von f C g, f ( g und, falls g.a/ ¤ 0, auch die von f =g in a. Beweis. Kombination von D mit K[2.1].
"
G. Satz (Kettenregel für die Stetigkeit). Gegeben seien zwei Funktionen f W A ! R und g W B ! R mit f .A/ , B. Ist f stetig in a 2 A und g stetig in b ´ f .a/, so ist g ı f stetig in a. Beweis. Man hat die beiden ."; ı/-Tests für f und g „aneinander zu setzen“, wobei man mit g starten muss: Gegeben sei also " > 0. Dann gilt: 9 ı > 0 8 y 2 B mit jy & bj < ı W jg.y/ & g.b/j < ": Für dieses ı gilt: 9 ı1 > 0 8 x 2 A mit jx & aj < ı1 W jf .x/ & bj < ı: Hieraus ergibt sich: x 2 A; jx & aj < ı1 impliziert jg.f .x// & g.b/j < ". Wegen g.b/ D g.f .a// enthält dies den ."; ı/-Test für g ı f . " H. Definition. Man nennt f W A ! R stetig, wenn f in jedem a 2 A stetig ist.
130
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Die Sätze F und G enthalten eine Fülle von Konstruktionen, wie aus stetigen Funktionen neue stetige Funktionen zu gewinnen sind. In der folgenden Beispielsammlung machen wir hiervon reichlich Gebrauch:
I. Beispiele. (i) Die identische Abbildung von R; x 7! x, ist stetig: Der ."; ı/-Test geht in Ordnung mit ı ´ ". Dann gilt ja: jx & aj < ı H) jx & aj < ". (ii)
Jede konstante Abbildung, x 7! ˛, ist stetig: Wähle z.B. einfach ı ´ 1.
(iii) Aus (i), (ii) folgt durch mehrfache Anwendung von Satz F: Jedes Polynom P W R ! R ist stetig. Jede rationale Funktion R D P =Q W A ! R ist stetig, wobei A die Menge der Nichtnullstellen von Q ist. ˇ ˇ (iv) Die Betragsfunktion j j W R ! R ist stetig: Vorausabschätzung: ˇjxj & jajˇ . jx & aj (modifizierte Dreiecksungleichung). Also tut es ı ´ ". (v) Jede Einschränkung einer stetigen Funktion f W A ! R auf B , A ist wiederum stetig (gleiches ı). p (vi) Die Wurzelfunktion W RC 0 ! R ist stetig: Für die Stelle a D 0 wurde dies in Beispiel B gezeigt. Für eine Stelle a > 0 hat man die Vorausabschätzung: ˇ ˇp p ˇ ˇ ˇ x & a ˇ ˇ x & a ˇ jx & aj p p ˇ ˇ ˇ ˇ j x & aj D ˇ ˇ D ˇ px C pa ˇ . pa : 1 p p Dabei wurde der Wurzeltrick aus C(iv)[2.2] benützt. Hiernach ist j x & aj < ", p p p sobald jx&aj < ", d.h. jx & aj < a" gilt. Mit ı."/ ´ a" ist also der ."; ı/-Test a erfüllt. J. Definition und Satz. Ist f W A ! R gegeben, a Häufungspunkt von A und existiert der Grenzwert limx!a f .x/ µ b 2 R, so heißt a eine hebbare Unstetigkeit, wenn a … A oder a 2 A aber b ¤ f .a/ gilt. Setzt man nämlich neu f .a/ ´ b, so wird f in a stetig. "
131
Abschnitt 3.3 Stetigkeit
K. Beispiel. Sei f W A ! R mit A ´ R n f&1; 1g definiert durch f .x/ ´
x2 & x : jxj & 1
10 9
Nach Satz F ist f in allen x 2 A stetig, da dort jxj & 1 ¤ 0. Ist f in den „Ausnahmepunkten“ &1; 1 stetig fortsetzbar?
8 7
Lösung: Die Limites dort sind:
6
x2 & x lim f .x/ D lim x!1 x!1 x & 1 x.x & 1/ D lim x!1 x & 1 D lim x D 1
5 4
x!1
3
x2 & x D &1 x#&1 &x & 1
lim f .x/ D lim
x#&1
2
x2 & x lim f .x/ D lim D 1; x"&1 x"&1 &x & 1 wobei man die letzten beiden Grenzwerte durch Reziprokenbildung erkennt. Somit ist f durch die Zusatzdefinition f .1/ D 1 stetig in 1 fortsetzbar, 1 also eine hebbare Singularität. Dagegen ist f auf keine Weise in &1 stetig fortsetzbar. Beachte: Als Funktionswert ist 1 oder &1 niemals zugelassen! Das Bild zeigt den Graphen dieser Funktion in der entscheidenden Region.
1 0 -4
-3
-2
-1
1
2
3
-1 -2 -3 -4
L. Beispiel. Die Funktion f .x/ ´ x1 ist in R n f0g stetig. Im Häufungspunkt 0 von R n f0g gilt limx#0 x1 D 1, limx"0 x1 D &1. Es wäre trotzdem falsch zu sagen, f sei unstetig; denn f ist in 0 gar nicht definiert. Richtig ist es zu sagen: „f ist in 0 nicht stetig fortsetzbar“.
132
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
M . Bemerkung. In der Implikation (i) H) (ii) von Satz D steckt eine wichtige Methode, um Grenzwerte komplizierter Ausdrücke „f .xn /“ zu berechnen: Kennt man a ´ limn!1 xn , und weiß man, dass f in a stetig ist, so kennt man auch limn!1 f .xn / D f .a/. r nC1 N. Beispiel. Was ist lim ? n!1 n Lösung: Statt mit Abschätzungen den ."; N /-Test zu versuchen, kann man ) nach ( jetzt 1 Bemerkung M sehr einfach vorgehen: Es gilt limn!1 nC1 D lim D 1, 1 C n!1 n n und die Wurzelfunktion ist in 1 stetig. So ergibt sich r p nC1 D 1 D 1: lim n!1 n Eine „Verstärkung“ der Stetigkeit ist die folgende Eigenschaft: O. Definition. Die Funktion f W A ! R heißt dehnungsbeschränkt oder Lipschitzstetig, wenn ein c % 0 existiert, sodass gilt: (1)
jf .x1 / & f .x2 /j . c ( jx1 & x2 j
für alle x1 ; x2 2 A:
Das c heißt dann eine Lipschitz-Konstante von f , und (1) wird eine Lipschitz-Bedingung genannt. P. Satz. Ist f W A ! R Lipschitz-stetig, so ist f W A ! R erst recht stetig. Beweis. Gegeben a 2 A und " > 0, wählen wir ı ´ der Lipschitz-Bedingung (1) so:
" . Dann schließen wir mit cC1
x 2 A; jx & aj < ı H) jf .x/ & f .a/j . c ( jx & aj . cı D Das zeigt die Stetigkeit von f in a.
c " < ": cC1 "
Die Umkehrung von Satz P ist nicht richtig: p Q. Beispiel. Die Wurzelfunktion W RC 0 ! R ist stetig, aber nicht dehnungsbeschränkt: Wäre c > 0 eine Lipschitz-Konstante, also p p j x1 & x2 j . c ( jx1 & x2 j für alle x1 ; x2 2 RC 0; p so folgte speziell, wenn man x1 D x und x2 D 0 setzt: x . cx oder äquivalent x % c12 für alle x > 0. Dies widerspricht der Nichtexistenz einer kleinsten positiven Zahl (J[1.1]). Einen konkreten Widerspruch erhält man natürlich, indem man x D 2c12 setzt.
Abschnitt 3.3 Stetigkeit
133
Die Lipschitz-Stetigkeit ist somit echt stärker als die Stetigkeit. R. Bemerkung. Die folgende Situation aus dem täglichen Leben beleuchtet, wie sinnvoll die gegebene Definition der Stetigkeit ist: Angenommen, der Geschäftsmann Müller in Aachen muss um 12 Uhr am Bahnhof in Berlin sein, um dort zwischen 12:30 Uhr und 13 Uhr ein Geschäft abzuschließen. Der Zug vom Bahnhof Aachen zum Berliner Hauptbahnhof braucht 4 Stunden, und ein solcher Zug startet um 8 Uhr in Aachen. Es sei vorausgesetzt, dass diese Zeiten von der Bahn eingehalten werden. Das passt also alles gut. Leider verspätet sich Herr Müller etwas und kommt erst um 8:10 Uhr zum Bahnsteig in Aachen. Der Zug ist abgefahren, und der nächste geht erst wieder um 10 Uhr. Herr Müller ist enttäuscht, sein Geschäft in Berlin kommt nicht zustande. Wäre Herr Müller um 7:45 am Bahnsteig in Aachen gewesen, so hätte es geklappt, auch wenn er dies um 7:55 Uhr oder 7:59, ja selbst um 8:00 Uhr geschafft hätte, aber eben nicht mehr um 8:01 Uhr! Das ist eine typische Situation für eine Unstetigkeit. Betrachtet man die Funktion, die der Ankunftszeit x von Herrn Müller am Bahnsteig in Aachen die Ankunftszeit f .x/ am Bahnsteig in Berlin zuordnet, so gilt f .x/ D 12 für 7 . x . 8 und f .x/ D 14 für 8 < x . 10. Wenn Herr Müller noch so wenig nach 8 Uhr einsteigen will, es bringt nichts, die Verzögerung ist nach 8 Uhr immer 2 Stunden. Beheben könnte man dies (theoretisch), wenn es statt des Zuges eine Art „Förderband“ von Aachen nach Berlin gäbe, das ständig läuft und auf das man in Aachen jederzeit aufspringen kann. Dann könnte Herr Müller auch noch um 8:15 aufspringen, und seinen Termin in Berlin zwischen 12:30 Uhr und 13 Uhr wahrnehmen. Es käme bei seiner Abfahrtszeit nicht so genau darauf an. Bei einer Toleranz in der Zielvorgabe von einer halben Stunde könnte Herr Müller sich anstrengen, eine entsprechende Toleranz in der Abfahrtszeit einzuhalten, um doch noch rechtzeitig am Ziel zu sein. Stetigkeit bedeutet also, salopp formuliert: Bei Vorgabe einer Toleranz im Zielbereich kann man diese erfüllen durch Einhaltung einer Toleranz im Ausgangsbereich. Dieses Beispiel zeigt erneut: In der mathematischen Definition A der Stetigkeit ist es sehr sinnvoll, die Toleranz „"“ in der Zielmenge vorzugeben und zu fordern, dass es dazu immer eine Toleranz „ı."/“ in der Definitionsmenge gibt, die sie erfüllt. Die Zielvorgabe einer Leistung erfolgt zuerst, und danach richtet sich die Anstrengung, sie zu erreichen – nicht etwa umgekehrt! Aufgaben und Anmerkungen 1. Man untersuche die folgende Funktionen f auf die maximale Definitionsmenge, die Stetigkeit und die Existenz von Grenzwerten an den Häufungspunkten der Definitionsmenge, die dieser nicht angehören. Man fertige auch eine Skizze des Graphen an.
134 a) f .x/ D c) f .x/ D
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
x 2 & 5x C 6 ; x 2 & 3x C 2 ( x2 für x . 1 x
für x > 1
e) f .x/ D &Œ&x/;
b) f .x/ D
jx 2 C 3x & 4j ; xC4
d) f .x/ D
p x;
f)
f .x/ D Œ2x C 1/Œx* :
2. Die Funktion f W Œ0; 1/ ! R sei gegeben durch ( 1=Œ1=x/ für x ¤ 0 f .x/ D 0 für x D 0: An welchen Stellen ist f stetig, an welchen unstetig? 3. Die Sätze F und G erlauben, aus stetigen Funktionen eine Fülle neuer stetiger Funktionen aufzubauen, nämlich solche, die durch sinnvolle Verknüpfungen mit C; &; (; W und Komposition aus den gegebenen Funktionen entstehen. Vorsicht ist allerdings dort geboten, wo die Voraussetzungen der Sätze nicht erfüllt sind! Zum Beispiel ist ˇ ˇ ˇ 2 60 ˇˇ 1237 1297 ˇ g.x/ ´ x C ˇ.x C 1/ & 2 x C 1ˇ als Funktion g W R ! R stetig (da stets x 2 C 1 > 0). Der ."; ı/-Test wäre hier sehr umständlich! Dagegen folgt für f .x/ ´ x
1237
ˇ ˇ ˇ 2 60 ˇˇ 1297 ˇ & 2 C ˇ.x C 1/ x & 1ˇ
die Stetigkeit nur für x ¤ 1; &1, da der letzte Nenner bei 1; &1 null wird. 4. Zwei stetige Funktionen f W R ! R und g W R ! R mögen auf Q gleiche Werte annehmen, d.h. für alle x 2 Q sei f .x/ D g.x/. Folgt daraus f .x/ D g.x/ für alle x 2 R? 5. Ist die Dirichlet-Funktion (E[3.1]) irgendwo stetig? 6. $ Die Funktion f W /0; 1Œ ! R sei gegeben durch ( 0 für x … Q f .x/ D 1=q für x D p=q mit teilerfremden p; q 2 N: Ist f an den irrationalen Stellen in /0; 1Œ stetig? Ist f überall in /0; 1Œ stetig?
135
Abschnitt 3.4 Extrema und Zwischenwertsatz
p 7. Die Wurzelfunktion W RC 0 ! R ist auf jedem Intervall der Form fx 2 R j x % ag (a > 0 fest) dehnungsbeschränkt. (Die Lipschitz-Konstante hängt allerdings von a ab.) p 8. Man zeige, dass die auf ganz R definierte Funktion f .x/ ´ 5 C x 2 für alle x; y 2 R die Lipschitz-Bedingung jf .x/ & f .y/j . jx & yj erfüllt. 9. Die Funktionen f; g W A ! R seien dehnungsbeschränkt. Sind es dann auch die Funktionen jf j, f C g, f ( g, f =g, f ı g (bei geeigneter Festsetzung der Definitionsmenge)? Welche Zusatzforderungen muss man ggf. stellen?
3.4
Extrema und Zwischenwertsatz
Beide Dinge berühren zentrale Fragen der Analysis: einerseits die Existenz von Extrema reeller Funktionen, andererseits die Existenz von Lösungen (nichtlinearer) Gleichungen. Zur zweiten Frage haben wir bereits in Abschnitt 3.1 gesehen, dass es oft reicht, das Nullstellenproblem zu lösen. Zunächst zu den Extrema: Aus Abschnitt 1.4 wissen wir schon, dass Maxima und Minima von reellen Zahlmengen nichts anderes sind als angenommene (d.h. in der Menge enthaltene) Suprema und Infima. Wenn man von Extrema einer Funktion f W A ! R spricht, so sind damit die Extrema der Bildmenge f .A/ gemeint. In erster Linie interessiert uns hier der Fall, dass A ein abgeschlossenes und beschränktes Intervall ist. A. Satz und Definition. Die Funktion f W Œa; b/ ! R sei stetig. Dann gilt: (i)
f ist beschränkt, also existieren in R: m ´ inf f .Œa; b// und M ´ sup f .Œa; b//:
(ii) m und M werden angenommen, d.h. es gibt xm ; xM 2 Œa; b/ mit f .xm / D m und f .xM / D M: Man nennt m das Minimum, M das Maximum von f und xm bzw. xM eine zugehörige Minimal- bzw. Maximalstelle. Schreibweise: min f ´ m;
Œa;b*
max f ´ M: Œa;b*
136
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Während Minimum und Maximum jeweils eindeutig bestimmt sind, kann es mehrere Minimal- oder auch mehrere Maximalstellen geben. Beweis von A. Zu (i): Angenommen, f .Œa; b// ist nicht beschränkt. Wähle zu jedem n 2 N ein xn 2 Œa; b/mit jf .xn /j > n. Nach Bolzano/Weierstraß E[2.6] existiert eine konvergente Teilfolgexnk ! ˛ 2 Œa; b/. Dann gilt für alle k W jf .xnk /j > nk , also 1 ( jf .xnk /j > 1. Nun gilt n1k ! 0 und wegen der Stetigkeit von jf j: jf .xnk /j ! nk jf .˛/j (D[3.3]). So folgt 0 ( jf .˛/j % 1, ein Widerspruch! Zu (ii): Angenommen, es gilt f .x/ ¤ m für alle x 2 Œa; b/. Dann ist die Abbildung 1 1 stetig in Œa; b/ (F[3.3]), also nach (i) beschränkt, etwa 0 < f .x/&m <+ x 7! f .x/&m 1 für alle x 2 Œa; b/. Daraus folgt in Œa; b/: f .x/ & m > ( , also f .x/ > m C (1 . Somit ist m nicht die größte untere Schranke von f .Œa; b//, Widerspruch! Analog führt die Annahme: f .x/ ¤ M für alle x 2 Œa; b/ zum Widerspruch.
"
Dieser Satz erlaubt sehr starke Verallgemeinerungen, die für Theorie und Praxis von großer Bedeutung sind. Wir kommen hierauf in D[6.5] zurück. Weitere Aspekte ergeben sich in der Differentialrechnung. Während Satz A ein reiner Existenzsatz ist, kann man mittels Ableitungen Extremalstellen wirklich berechnen. Das wird in den Abschnitten 4.3 und 8.4 ausführlich diskutiert. B. Bemerkung. Für andere Intervalltypen ist der Satz falsch, ebenso ohne Stetigkeit. Das sieht man leicht an Funktionen des folgenden Typs: f f
-1 0
f W/0; 1/ &! R;
1
x
1
x
f .x/ D 1=x
f W Œ&1; 1/ &! R;
f .x/ D
8 <1=x;
x¤0
:0;
x D 0:
137
Abschnitt 3.4 Extrema und Zwischenwertsatz
Wir greifen nun einen anderen Gesichtspunkt auf, nämlich die Existenz von Lösungen reeller Gleichungen. Während die Begründung von Satz A ein reiner Existenzbeweis war, ist die Methode hier von konstruktiver Natur, nämlich ein Halbierungsverfahren: C. Satz (Nullstellensatz). Sei f W Œa; b/ ! R stetig und f .a/ ( f .b/ < 0. Dann existiert in /a; bŒ mindestens eine Nullstelle von f , d.h. eine Lösung der Gleichung f .x/ D 0.
f(b)
a
b
f(a)
Die Voraussetzung f .a/ ( f .b/ < 0 bedeutet einfach, dass die Funktion f an den Endpunkten Werte verschiedener Vorzeichen annimmt. Beweis von C. Wir definieren eine Intervallschachtelung .Œan ; bn //n%0 , bestehend aus Teilintervallen von Œa; b/ mit (1)
f .an / ( f .bn / . 0;
indem wir induktiv vorgehen: Sei Œa0 ; b0 / ´ Œa; b/. Falls Œan ; bn / schon definiert ist und (1) gilt, so betrachten wir den Mittelpunkt cn und die beiden zugehörigen Teilintervalle von Œan ; bn /: cn ´
an C bn ; 2
Œan ; bn / D Œan ; cn / [ Œcn ; bn / : „ ƒ‚ … „ ƒ‚ … I J
Dann gilt (i): f .an / ( f .cn / . 0 oder (ii): f .cn / ( f .bn / . 0: Aus f .an / ( f .cn/ > 0 und f .cn /(f .bn / > 0 würde nämlich folgen: f .an /(.f .cn //2 (f .bn / > 0, also f .an /( f .bn / > 0, im Widerspruch zur Induktionsvoraussetzung. Der „Vorzeichenwechsel“ f .an / ( f .bn / . 0 vererbt sich also auf mindestens ein Teilintervall. Gilt (i), so sei ŒanC1 ; bnC1 / ´ I , sonst ŒanC1 ; bnC1 / ´ J .
138
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Wegen bnC1 & anC1 D .bn & an /=2 D .bn&1 & an&1 /=4 D ( ( ( D .b0 & a0 /=2nC1 entsteht eine Intervallschachtelung. Sei s ´ lim an D lim bn : n!1
n!1
Dieses s ist die gesuchte Nullstelle. Denn aus (1) folgt für n ! 1 nach D[3.3] und P[2.1]: f .s/ ( f .s/ . 0, also f .s/ D 0. " Ist f .˛/f .ˇ/ . 0 für zwei Stellen ˛ ¤ ˇ aus dem Definitionsintervall, so sprechen wir von einem Vorzeichenwechsel und im Falle f .˛/f .ˇ/ < 0 von einem echten Vorzeichenwechsel von f . Nach dem Nullstellensatz induziert also jeder Vorzeichenwechsel einer stetigen, auf einem Intervall definierten Funktion eine Nullstelle. D. Folgerung (Zwischenwertsatz). Die Funktion f W Œa; b/ ! R sei stetig, und es gelte f .a/ ¤ f .b/. Dann existiert zu jedem w zwischen f .a/ und f .b/ ein z zwischen a und b mit f .z/ D w. Beweis. Sei z.B. f .a/ < f .b/ vorausgesetzt. Dann gilt f .a/ < w < f .b/, also f .a/ & w < 0 < f .b/ & w. Betrachte die Hilfsfunktion g W Œa; b/ ! R mit g.x/ ´ f .x/ & w. Diese ist stetig (F[3.3]) und erfüllt g.a/ < 0 < g.b/. Also existiert nach dem Nullstellensatz C ein z 2 /a; bŒ mit g.z/ D 0, d.h. mit f .z/ D w. Bei f .a/ > f .b/ schließt man analog. " E. Folgerung. Die Funktion f W Œa; b/ ! R sei stetig. Dann gilt: 1 ' (2) f .Œa; b// D min f; max f : Œa;b*
Œa;b*
Die Bildmenge von f ist also ein Intervall. Beweis. Wie bei A sei m ´ minŒa;b* f und M ´ maxŒa;b* f . Natürlich gilt f .Œa; b// , Œm; M /, sodass nur die Inklusion Œm; M / , f .Œa; b// bewiesen werden muss. Dass m bzw. M als Funktionswerte f .xm / bzw. f .xM / vorkommen, ist nach A klar. Im Fall m D M , ist die Funktion f konstant und die Behauptung trivial. Im Fall m < M , werden auch alle Zahlen zwischen m und M als Funktionswerte angenommen (Zwischenwertsatz D), und zwar bereits in dem offenen Teilintervall von Œa; b/, das zwischen xm und xM liegt. " Symbole: Ist f W X ! R irgendeine Funktion, so werden Supremum, Infimum, Maximum und Minimum der Bildmenge f .X/, falls existent, durch sup f; X
inf f; X
max f; X
min f X
139
Abschnitt 3.4 Extrema und Zwischenwertsatz
bezeichnet, wobei der „Index“ X weggelassen werden kann, wenn die Definitionsmenge aus dem Kontext klar ist. Auch entsprechende Symbole „mit Argumenten“ sind üblich, z.B.: sup f ´ sup f ´ sup f .x/ ´ sup f .X/; X
x2X
etc.
F. Bemerkungen. (i) Aus dem Nullstellensatz folgt, dass jedes Polynom P W R ! R von ungeradem Grad mindestens eine reelle Nullstelle besitzt. Das liegt daran, dass P .x/ für „stark positive“ bzw. „stark negative“ x unterschiedliche Vorzeichen besitzt. Ist nämlich an der Leitkoeffizient von P , so folgt aus (2)[3.1] für x % max f1; Qg: P .x/ > 0; an x n also wegen .&x/n D &x n :
P .&x/ > 0; an .&x/n
P .x/P .&x/ > 0: &an2 x 2n
Daher gibt es a; b 2 R mit P .a/ < 0, P .b/ > 0. Somit existiert ein c zwischen a und b mit P .c/ D 0. (ii) Sei I ¤ ¿ ein Intervall und f W I ! R stetig mit ganzzahligen Werten, d.h. f .I / , Z. Dann ist f notwendig konstant. Wäre nämlich f nicht konstant, so enthielte f .I / zwei verschiedene ganze Zahlen. Nach dem Zwischenwertsatz wäre dann das Intervall zwischen diesen beiden ganzzahligen Werten Teil von f .I /. Ein solches Intervall enthält aber auch reelle Zahlen, die nicht ganzzahlig sind, im Widerspruch zur Voraussetzung. G. Beispiele. Wir behandeln die Bestimmungsgleichungen aus H(i)[3.1]: (i) Die erste Gleichung war x 7 C x D 1 oder, als Nullstellenproblem formuliert, x 7 C x & 1 D 0. Hier ist sofort die obige Bemerkung F(i) zuständig, wonach das Polynom f .x/ ´ x 7 C x & 1 mindestens eine Nullstelle besitzt. Da f nach C(i)[3.1] streng monoton wächst, kann es nicht mehr als eine Nullstelle geben. Die Gleichung x 7 C x D 1 besitzt also genau eine reelle Lösung. (ii) Die zweite Gleichung war e x D 3 & x. Es geht also um die Nullstellen der Funktion f W R ! R mit f .x/ ´ e x C x & 3. Diese ist stetig (wobei wir die Stetigkeit der Exponentialfunktion vorwegnehmen; vgl. B[3.7]). Auch hier kann man wieder einen Vorzeichenwechsel erkennen. Oft geht dies, indem man „stark positive“ und „stark negative“ Argumente betrachtet: Mit der Ungleichung aus E(ii)[2.4] folgt
140
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
als Abschätzung nach unten f .x/ % x C 1 C x & 3 D 2x & 2, also f .x/ > 0 für x > 1. Mit der Ungleichung aus E(iv)[2.4] folgt als Abschätzung nach oben für x < 0 1 C x & 3 . 1 C x & 3 D x & 2; 1&x somit f .x/ < 0 für x < 0. Zwischen 0 und 1 liegt also mindestens eine Nullstelle von f . Aufgrund der strengen Monotonie von f (B[3.7]) kann es keine zwei verschiedenen Nullstellen geben. Die Gleichung e x D 3 & x ist also eindeutig lösbar. f .x/ .
Unter zusätzlichen Regularitätsannahmen hängen Extremalprobleme und Nullstellensuche eng zusammen, wie aus dem bald folgenden Satz A[4.3] hervorgeht und sich später auch mehrdimensional erweisen wird (vgl. Abschnitt 12.1 in Analysis 2). Aufgaben und Anmerkungen 1. Man zeige, dass die einzige Lösung c der Gleichung x 7 C x D 1 der Abschätzung jc & 0; 8j < 4 ( 10&3 genügt. Mit welcher Ziffer nach dem Komma startet die Dezimalbruch-Entwicklung von c? 2. Man zeige, dass die Gleichung x6 C 2 x2 C 6 C D0 xC1 x&1 zwischen &1 und 1 mindestens eine Lösung besitzt. Kann man diese Gleichung in der üblichen Art und Weise durch „Isolieren“ von x lösen? 3. Es sei a1 > 0, a2 > 0, a3 > 0 sowie b1 < b2 < b3 . Man zeige, dass die Gleichung a1 a2 a3 C C D0 x & b1 x & b2 x & b3 eine Lösung zwischen b1 und b2 und eine weitere Lösung zwischen b2 und b3 hat. 4. Man könnte denken, dass stetige Funktionen auf Intervallen durch die Zwischenwerteigenschaft gekennzeichnet werden. Dem ist aber nicht so. Es gibt nämlich sehr einfache Funktionen, die auf einem Intervall unstetig sind, jedoch als Bildmenge ein Intervall besitzen, also sicher mit je zwei verschiedenen Werten auch alle Zahlen dazwischen als Werte annehmen. Man gebe eine solche Funktion an. 5. Sei f W R ! RC 0 stetig und a eine Nullstelle von f , sodass f in keinem Intervall I 0 fag konstant null ist. Man beweise: Zu jedem ı > 0 existiert ein p0 > 0 mit folgender Eigenschaft: Ist 0 < p < p0 , so hat die Gleichung f .x/ D p mindestens zwei Lösungen b; c 2 U.a; ı/ mit b < a < c. Lösungshinweis: Man wähle ein " > 0 mit Œa & "; a C "/ * U.a; ı/ und setze + % p0 ´ min max f; max f : Œa&";a*
Œa;aC"*
Man veranschauliche die Situation in einer Skizze!
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
141
3.5 Uneigentliche Konvergenz und die Rolle von 1 Betrachtet wird immer eine Funktion f W A ! R, definiert auf einer (nichtleeren) Menge A , R. Neben der Annäherung des Arguments und des Funktionswerts an reelle Zahlen gibt es die uneigentliche Konvergenz, bei der das Argument oder der Funktionswert beliebig groß werden kann. „Beliebig groß“ soll bedeuten, dass die Werte entweder nach oben oder nach unten unbeschränkt sind. Die verschiedenen Möglichkeiten werden hier der Reihe nach behandelt. Es entstehen insgesamt acht Kombinationen, die wir zunächst ganz direkt formulieren. Dann aber besprechen wir eine Vereinheitlichung, die mit einem erweiterten Umgebungsbegriff möglich wird. Es sei stets a ein Häufungspunkt der Definitionsmenge A und ggf. b eine Zahl in R. Die definierenden Eigenschaften für die uneigentliche Konvergenz werden hier in formalisierter Form angegeben. (Der Leser sollte inzwischen genug Übung entwickelt haben, um zwischen der formalen und der verbalen Sprechweise einwandfrei hin- und herzuwechseln.) Wie verhält sich z.B. f .x/ ´ 1=x 2 bei Annäherung von x ¤ 0 an 0? – Offensichtlich sind die Werte f .x/ positiv und werden alle beliebig groß, wenn nur x nahe genug an 0 heranrückt. Man wird also in diesem Fall den „Grenzwert“ 1 erwarten. Die präzise Fassung dieses Verhaltens ist die folgende A. Definition. Ist a 2 R Häufungspunkt von A, so wird definiert: lim f .x/ D 1
x!a
W () 8 E 2 R 9 ı > 0 8 x 2 A mit 0 < jx & aj < ı W f .x/ > E lim f .x/ D &1
x!a
W () 8 E 2 R 9 ı > 0 8 x 2 A mit 0 < jx & aj < ı W f .x/ < E: Natürlich darf das ı von E abhängen: ı D ı.E/. Eingeschränkte Grenzübergänge sind genauso definiert wie in R[3.2]: sie beziehen sich einfach auf die Restriktion auf eine Teilmenge von A. Insbesondere bei den einseitigen Grenzwerten limx#c f .x/ bzw. limx"c f .x/ wird anstelle von f die Restriktion auf die Menge fx 2 A j x > cg bzw. fx 2 A j x < cg betrachtet (wobei natürlich c Häufungspunkt dieser Menge sein muss). B. Beispiele. (i)
Es gilt limx!0
1 x2
D 1.
Zuständig ist die erste Zeile der obigen Definition: Sei E 2 R vorgegeben. Um 1=x 2 > E für x ¤ 0 zu erzwingen, reicht es, E > 0 zu betrachten. Durch Ump 2 formung erhält man 1=x > E äquivalent: jxj < 1= E. Dann aus der Forderung p leistet ı.E/ ´ 1= E das Verlangte.
142 (ii)
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Analog erkennt man limx#0
1 x
D 1 und limx"0
1 x
D &1.
limx!0 x1 ;
(iii) Es existiert nicht denn die Forderung 1=x > E ist z.B. für E D 1 in keiner punktierten Umgebung von 0 erfüllbar und ebenso wenig für E D &1 die Forderung 1=x < E. Im übrigen ist leicht einzusehen, dass die Relationen zwischen eingeschränkten und nicht eingeschränkten Grenzübergängen aus Satz S[3.2] auch für die obige Variante gültig bleiben. Wie verhält sich f .x/ ´ 1=x, wenn x „über alle Grenzen wächst“? – Offensichtlich sind die Werte f .x/ positiv, werden aber alle beliebig klein, wenn nur x groß genug ist. Man wird also in diesem Fall für „x ! 1“ den „Grenzwert“ 0 erwarten. Bei f .x/ D x dagegen werden die Werte alle beliebig groß, wenn nur x groß genug ist. Man wird in diesem Fall für „x ! 1“ den „Grenzwert“ 1 erwarten. Hier die Präzisierung: C. Definition. Ist A nicht nach oben beschränkt, so wird definiert: lim f .x/ D b
W () 8 " > 0
lim f .x/ D 1
W () 8 E 2 R 9 D 2 R 8 x 2 A mit x > D W f .x/ > E
x!1
x!1
9 D 2 R 8 x 2 A mit x > D W jf .x/ & bj < "
lim f .x/ D &1 W () 8 E 2 R 9 D 2 R 8 x 2 A mit x > D W f .x/ < E:
x!1
Wiederum darf das D von " bzw. E abhängen: D D D."/ bzw. D D D.E/. Einseitige Varianten gibt es hier nicht („rechts von 1 ist kein Platz mehr“). D. Beispiele. (i)
Für festes p 2 N gilt limx!1
1 xp
D 0.
Wir verwenden die für jxj > 1 gültige Vorausabschätzung 1 1 . : p jxj jxj
ˇ ˇ ˇ 1 ˇ 1 ˇ Hiernach ist ˇ p & 0ˇˇ < ", falls jxj > 1 und < ". Somit leistet D."/ ´ x jxj max f1; 1="g das Verlangte. (ii)
Für festes p 2 N gilt limx!1 x p D 1.
Dazu verwendet man die gleiche für x > 1 gültige Vorausabschätzung in der „reziproken“ Form x p % x und sieht, dass die zweite Zeile der obigen Definition mit D.E/ ´ max f1; Eg erfüllt ist.
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
143
E. Bemerkungen (zum Fall A D N). (i) Ist A D N, so ist eine Abbildung f W N ! R dasselbe wie eine Folge: f .n/ D an für n 2 N. Die erste Zeile in der obigen Definition C bedeutet dann genau die Folgenkonvergenz lim an D b:
n!1
Denn zu D 2 R gibt es stets ein N 2 N mit N > D. Die Folgenkonvergenz ist also ein Spezialfall dieser ersten Zeile. Die zweite bzw. dritte Zeile in C definiert in diesem Fall die bestimmte Divergenz für Folgen: lim an D 1 bzw. lim an D &1. n!1
n!1
(ii) $ Bezüglich Limes superior und Limes inferior von Folgen trifft man bei uneigentlichen Werten folgende Konventionen: lim an D
n!1
1
W () .an / ist nicht nach oben beschränkt
lim an D &1 W () .an / ist nicht nach unten beschränkt
n!1
(1)
lim an D
n!1
1
W ()
lim an D &1 W ()
n!1
lim an D 1
n!1
lim an D &1:
n!1
Schließlich sei das Analogon der Definition C für x ! &1 formuliert, was natürlich nach dem gleichen Muster folgt: F. Definition. Ist A nicht nach unten beschränkt, so wird definiert: lim f .x/ D b
W () 8 " > 0
lim f .x/ D 1
W () 8 E 2 R 9 D 2 R 8 x 2 A mit x < D W f .x/ > E
lim f .x/ D &1
W () 8 E 2 R 9 D 2 R 8 x 2 A mit x < D W f .x/ < E:
x!&1
x!&1 x!&1
9 D 2 R 8 x 2 A mit x < D W jf .x/ & bj < "
Auch hierbei darf das D von " bzw. E abhängen: D D D."/ bzw. D D D.E/. Einseitige Varianten gibt es hier ebenfalls nicht („links von &1 ist kein Platz mehr“). Konventionen zur Bezeichnung: In der Bezeichnungsweise deutet das „n“ im Index der Limeszeichen auf eine Grenzübergang bei Folgen hin, das „x“ auf einen Grenzübergang im Sinne von Definition C. Statt n kommen auch andere Buchstaben aus der gleichen „Ecke“ des Alphabets vor, z.B. k; `; m; N , statt x auch solche wie y; z. Was gemeint ist, ergibt sich letztlich aus dem, was hinter dem Limeszeichen steht. Bei den Definitionen A, C, F laufen die Teile, in denen b vorkommt, unter Konvergenz; man sagt auch, der Grenzwert existiert (in R). Alle anderen Fälle laufen unter
144
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
dem Namen bestimmte Divergenz; hierbei sagt man auch, der Grenzwert existiert uneigentlich. Sinnvollerweise darf man auch schreiben: lim als lim ;
x!1
x"1
lim
x!&1
als lim : x#1
Statt der „lim“-Schreibweise wird auch die Pfeilschreibweise gebraucht. Besteht also z.B. die Aussage lim f .x/ D &1; x!1
so sagt man „f .x/ divergiert für x gegen 1 bestimmt gegen &1“, und man schreibt dafür auch f .x/ &! &1 (für x &! 1): G. Bemerkungen. (i) Wir haben schon in H[3.2] darauf hingewiesen, dass viele Aussagen über die Folgenkonvergenz sinngemäß auch für die Funktionenkonvergenz gelten, z.B. das Meidungsprinzip und die Einschnürung. Genauso gilt das für die obigen neuen Varianten der Konvergenz. Tatsächlich ist die Analogie zur Folgenkonvergenz gerade beim Typ limx!1 f .x/ sehr eng, da in beiden Fällen das Argument gegen 1 geht: Bei der Folgenkonvergenz limn!1 an durchläuft das Argument (hier n) über „diskrete“ Werte gegen 1, bei der Funktionenkonvergenz limx!1 f .x/ darf das Argument (hier x) auch „kontinuierlich“ gegen 1 streben. (ii) Die uneigentlichen Grenzübergänge „x ! ˙1“ bzw. „f .x/ ! ˙1“ können durch Reziprokenbildung auf die Nullkonvergenz zurückgeführt werden, z.B. gilt bei den „rein positiven“ Varianten aus A, C und F: lim f .x/ D 1 () lim
x!a
x!a
1 D0 f .x/
und 9 ı0 > 0 8 x 2 A mit 0 < jx & aj < ı0 W f .x/ > 0 . / 1 lim f .x/ D b () lim f Db x!1 y y#0 1 . / D0 1 y#0 f y
lim f .x/ D 1 () lim
x!1
und 9 D0 2 R 8 x 2 A mit x > D0 W f .x/ > 0; und analog bei den „negativen Varianten“ mit entsprechender Abänderung der Vorzeichenbedingungen. Man kann nämlich jeweils die Bedingungen aus den genannten
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
145
Definitionen für die uneigentlichen Grenzübergänge leicht in die ."; ı/-Tests für die Nullkonvergenz umrechnen. Z.B. geht dies bei der obigen ersten Zeile so: Zu H) : Ist " > 0 gegeben, so sei E ´ 1=" gesetzt. Dann existiert zu diesem E ein ı > 0, sodass für alle x 2 A mit 0 < jx&aj < ı gilt: f .x/ > E, also 0 < 1=f .x/ < ". Zu (H : Ist E 2 R gegeben, so sei " ´ 1=.jEj C 1/ gesetzt. Dann existiert zu diesem " ein ı1 > 0, sodass für alle x 2 A mit 0 < jx & aj < ı1 gilt: 1=jf .x/j < ", also für 0 < jx & aj < min fı1 ; ı0 g: f .x/ > jEj C 1 > jEj % E. Rein rechnerisch läuft die äquivalente Umformung der obigen zweiten Zeile darauf hinaus, dass man gemäß x D 1=y substituiert und anstelle des Grenzübergangs x ! 1 den Grenzübergang y # 0 durchführt. Bei der dritten Zeile ist außerdem der Kehrwert der Funktion zu betrachten und ihre Positivität für „große“ x zu prüfen. H. Beispiele. 3x 4 C 10x & 13 ? x!1 5x 4 C 1
(i)
Was ist lim
Lösung: Bei solchen Ausdrücken kürzt man mit einer geeigneten Potenz von x, hier mit der (gemeinsamen) höchsten Potenz von Zähler und Nenner, also x 4 : 1 1 3 ( 1 C 10 ( 3 & 13 ( 4 3x 4 C 10x & 13 x x : D 1 5x 4 C 1 5(1C 4 x Auf diese Darstellung können nun die obige Bemerkung G(ii) (zweite Zeile) und die auch hier analog gültigen Rechenregeln N[3.2] angewendet werden. Zusammen mit Beispiel D(i) folgt so 3x 4 C 10x & 13 3 ( 1 C 10 ( 0 & 13 ( 0 3 D D : x!1 5x 4 C 1 5(1C0 5 lim
Die oben empfohlene Substitution y D 1=x ist hierbei „im Sinn“ vorgenommen worden, ohne sie explizit hinzuschreiben (eben dadurch, dass man den ursprünglichen Bruch mittels 1=x ausgedrückt hat). (ii)
3x 4 C 10x & 13 ? x!1 5x 7 C 1
Was ist lim
Lösung: In einem solchen Fall (Zählergrad < Nennergrad) zieht man eine geeignete x-Potenz aus dem Nenner heraus und behandelt den verbleibenden zweiten Faktor wie in (i): 1 1 3 ( 1 C 10 ( 3 & 13 ( 4 3x 4 C 10x & 13 1 3x 4 C 10x & 13 1 x x : D 3 ( D 3 ( 1 1 5x 7 C 1 x x 4 5x C 3 5(1C 4 x x
146
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
An dieser Darstellung sieht man wieder mit den gleichen Hilfsmitteln wie in (i): 3x 4 C 10x & 13 3 ( 1 C 10 ( 0 & 13 ( 0 3 D0( D0( D 0: 7 x!1 5x C 1 5(1C0 5 lim
3x 4 C 10x & 13 ? x!1 5x C 1 Lösung: In einem solchen Fall (Zählergrad > Nennergrad) zieht man zuvor eine geeignete x-Potenz aus dem Zähler heraus, um für den verbleibenden Quotienten gleiche höchste Potenzen zu erreichen: (iii) Was ist lim
1 1 3x C 10 ( 2 & 13 ( 3 3x 4 C 10x & 13 x x : D x3 ( 5x C 1 5x C 1 Man wendet nun Reziprokenbildung gemäß Bemerkung G(ii)(dritte Zeile) an: Der große Bruch der letzten Darstellung strebt analog zu (i) für x ! 1 gegen 53 , ist also nach dem Meidungsprinzip > 0 für genügend große x. Der Vorfaktor x 3 ist dann ebenfalls positiv, also das ganze > 0 für x > x0 mit geeignetem x0 > 0. Dasselbe trifft für das Reziproke zu, und man hat dafür lim
x!1
also
3x 4
5x C 1 1 D lim 3 ( x!1 C 10x & 13 x
5x C 1 5 D 0 ( D 0; 1 1 3 3x C 10 ( 2 & 13 ( 3 x x
3x 4 C 10x & 13 D 1: x!1 5x C 1 lim
Die Methode dieser Beispiele (Herausziehen geeigneter x-Potenzen und Kürzen mit solchen) kann allgemein verwendet werden, um die Grenzwerte rationaler Funktionen für x ! 1 zu bestimmen. Es ergibt sich: I. Satz. Es seien P .x/ ´ an x n C ( ( ( C a0 und Q.x/ ´ bm x m C ( ( ( C b0 Polynome, wobei n; m 2 N0 und an ¤ 0, bm ¤ 0 sowie c´
an : bm
Dann gilt
(2)
8 0 ˆ ˆ ˆ
für m > n für m D n für m < n und c > 0 für m < n und c < 0:
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
147
Genau die gleichen Grenzwerte resultieren für den Grenzübergang im Sinne der Folgen: (3)
lim
n!1
P .n/ : Q.n/
Beweis. Für (2) ist die Methode vorab beschrieben. Bei (3) kann man genauso vorgehen wie oben (Herausziehen geeigneter n-Potenzen und Kürzen mit solchen). Jedoch kann man (3) auch direkt aus (2) ablesen, da es sich schlicht um eingeschränkte Grenz" übergänge handelt. Die Rolle von 1 Bisher haben wir das Symbol 1 nur verwendet, um gewisse unbeschränkte Situationen prägnant zu beschreiben; eine eigene Bedeutung sollte ihm nicht zukommen. Tatsächlich enthalten die präzisen Definitionen von Ausdrücken wie limn!1 an , limx!1 f .x/ etc. nur Verfügungen über reelle Zahlen. Manchmal kann man sich aber bequemer ausdrücken, indem man den Symbolen 1 und &1 nun doch eine eigene Bedeutung beimisst. Natürlich dürfen 1 und &1 auf keinen Fall reelle Zahlen sein. Das übliche Vorgehen besteht darin, zur Menge R der reellen Zahlen zwei neue Elemente 1 und &1 hinzuzufügen, die untereinander und auch von allen reellen Zahlen verschieden sind; dabei sei auch C1 ´ 1 geschrieben. Man bildet also eine neue Menge $ R´R [ f1; &1g
(4)
und verabredet gewisse Regeln zwischen den hinzukommenden Elemente und den reellen Zahlen selbst. Bzgl. der Anordnung auf R soll es sich um eine Fortsetzung der Anordnung auf R handeln, die die Eigenschaften der Trichotomie und Transitivität besitzt, wobei für alle a 2 R gilt (5)
&1 < a < 1:
Weiter sei für alle a 2 R &.˙1/ ´ #1 j ˙ 1j ´ 1 a ( ˙1 ´ ˙1 ( a ´ ˙1 für a > 0;
(6)
a ´ 0; ˙1
a ˙ 1 ´ ˙1 C a ´ ˙1 a ( ˙1 ´ ˙1 ( a ´ #1 für a < 0 1 ´1 0
˙1 C ˙1 ´ ˙1:
Dabei stehen in ein und derselben Gleichung entweder an allen Stellen die oberen oder an allen Stellen die unteren Vorzeichen. Dagegen sind Kombinationen wie 0 ( ˙1, 1 1 und 1 & 1 nicht definiert.
148
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Es ist natürlich die Frage, ob es solche Objekte 1, &1 überhaupt gibt. Das ist jedoch einfach zu beantworten: Z.B. leisten die Paare .R; 1/ bzw. .R; &1/ das Verlangte: Sie sind untereinander und von jeder reellen Zahl verschieden, und man hat lediglich (5) und (6) in nahe liegender Weise festzulegen, z.B. &.R; 1/ als .R; &1/ oder j&.R; 1/j als .R; 1/ usw. (Dieser Existenznachweis sollte allerdings nicht dazu verleiten, nun stur 1 mit .R; 1/ oder &1 mit .R; &1/ gleichzusetzen.) Die Relationen (5) drücken aus, was man anschaulich von dem Objekt 1 (bzw. &1) erwartet: es ist ein neu hinzukommendes Element, das rechts (bzw. links) von allen reellen Zahlen liegt. Die Menge R wird die erweiterte reelle Achse genannt. Es ist nun zweckmäßig, auch den Elementen 1, &1 Umgebungen zuzuordnen: J . Definition. Gegeben sei ein D 2 R. Dann sind die D-Umgebungen bzw. die punktierten D-Umgebungen von ˙1 definiert durch U.1; D/ ´ fx 2 R j x > Dg D fx 2 R j x > Dg [ f1g U $ .1; D/ ´ fx 2 R j x > Dg U.&1; D/ ´ fx 2 R j x < Dg D fx 2 R j x < Dg [ f&1g U $ .&1; D/ ´ fx 2 R j x < Dg: Offensichtlich ist eine Teilmenge A , R genau dann nach oben unbeschränkt, wenn für alle D 2 R gilt: A \ U $ .1; D/ ¤ ¿. Man sagt dafür auch: 1 ist (uneigentlicher) Häufungspunkt von A. Analog ist A genau dann nach unten unbeschränkt, wenn für alle D 2 R gilt: A \ U $ .&1; D/ ¤ ¿. Man sagt dafür auch: &1 ist (uneigentlicher) Häufungspunkt von A. Konvention: Wir studieren nur Funktionen, deren Definitions- und Bildmengen keine uneigentlichen Elemente enthalten (es sei denn, es ist etwas anderes dazugesagt).
Mit dem neuen Umgebungsbegriff lassen sich die eigentlichen Grenzübergänge in E[3.2] und die uneigentlichen Grenzübergänge in A, C, F vollständig unter einen Hut bringen: K. Satz. Gegeben sei eine Teilmenge A , R, eine Funktion f W A ! R, ein Häufungspunkt ˛ 2 R von A sowie ein Element ˇ 2 R. Dann gilt lim f .x/ D ˇ
x!˛
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
149
genau dann, wenn zu jedem " > 0 eine ı > 0 existiert mit der Eigenschaft: x 2 A \ U.˛; ı/ H) f .x/ 2 U $ .ˇ; "/: Bestimmte Divergenz bzgl. R kann somit als Konvergenz bzgl. R aufgefasst werden.
"
Diese Formulierung hat den Vorteil, dass Eigenschaften, die mittels (punktierter) Umgebungen ausgedrückt sind, leichter vom eigentlichen auf den uneigentlichen Fall übertragen werden können. So gilt z.B. das Substitutionsprinzip, das in Satz Q[3.2] in der Umgebungssprache bewiesen wurde, in analoger Weise auch für uneigentliche Grenzübergänge. Bei dieser Gelegenheit wollen wir noch die folgende Symbolik für die unbeschränkten Intervalle einführen:
Neue Schreibweise bei den uneigentlichen (d.h. unbeschränkten) Intervallen: R µ /&1; 1Œ ;
fx 2 R j x % ag µ Œa; 1Œ ; fx 2 R j x > ag µ /a; 1Œ ;
fx 2 R j x . ag µ /&1; a/ ˇ fx 2 R ˇ x < ag µ /&1; aŒ :
Hierbei ist a 2 R, und ˙1 werden ggf. als (uneigentliche) Endpunkte oder (uneigentliche) Randpunkte bezeichnet. Treten die Intervallsymbole Œa; b/, Œa; bŒ, /a; bŒ, /a; b/, Œa; 1Œ, /a; 1Œ, /&1; a/, /&1; aŒ auf, so soll dies einschließen, dass a; b reelle Zahlen sind, es sei denn, es wird ausdrücklich etwas anderes dazugesagt.
Vergleich von Größenordnungen Wenn zwei Funktionen beim gleichen Grenzübergang den gleichen Grenzwert 0 oder ˙1 haben, entsteht die Frage, welche der beiden sich diesem Grenzwert „schneller“ nähert. Ein Maß dafür ergibt sich, indem man den Quotienten der beiden Funktionen betrachtet. Das führt auf folgende Begriffsbildung, wobei wir gleich von der neuen einheitlichen Charakterisierung in Satz K Gebrauch machen können: L. Definition. Gegeben seien zwei Funktionen f; g W A ! R und ein Häufungspunkt ˛ 2 R von A. Gilt für ein c 2 R lim
x!˛
so nennt man
f .x/ D c; g.x/
150
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
(i)
f; g asymptotisch proportional (für x ! ˛), wenn c ¤ 0 ist;
(ii)
f; g asymptotisch gleich (für x ! ˛), wenn c D 1 ist; in diesem Fall schreibt man f .x/ Š g.x/ .für x &! ˛/:
(iii) Ist c D 0 und ist limx!˛ f .x/ D limx!˛ g.x/ D 1, so sagt man: f .x/ geht (für x ! ˛) langsamer gegen 1 als g.x/, oder auch: g.x/ geht (für x ! ˛) schneller gegen 1 als f .x/. (iv)
Ist c D 0 und ist limx!˛ f .x/ D limx!˛ g.x/ D 0, so sagt man: f .x/ geht (für x ! ˛) schneller gegen 0 als g.x/, oder auch: g.x/ geht (für x ! ˛) langsamer gegen 0 als f .x/.
Die Definitionen (i) und (ii) sind auch dann anwendbar, wenn f oder g einzeln keine Grenzwerte besitzen. M. Beispiele. (i) Seien P; Q Polynome wie in Satz I mit den Graden n; m 2 N0 . Dann kann man aus (2) Folgendes ablesen: Sind P; Q vom gleichen Grad n D m, so sind sie für x ! 1 asymptotisch proportional; haben sie außerdem gleiche Leitkoeffizienten, so sind sie für x ! 1 asymptotisch gleich. Gilt für die Grade: 1 . n < m und sind beide Leitkoeffizienten positiv, so geht P .x/ für x ! 1 langsamer gegen 1 als Q.x/. (ii) Für die Größteganze-Funktion gilt Œx/ Š x
.für x &! 1/;
wie man den Abschätzungen Œx/ . x < Œx/ C 1 entnehmen kann, indem man durch x > 0 durchdividiert.
Aufgaben und Anmerkungen 1. Man untersuche auf Konvergenz bzw. Divergenz: 3p 3p 2 a) lim x C5&x b) lim x2 C 5 & x x!1 x!&1 3 12x 9 C .&1/Œx* x n c) lim d) lim lim .1 & x/ x!1 n!1 x#0 &3x 9 C 17 3 n e) lim lim .1 & x/ x#0
n!1
Abschnitt 3.5 Uneigentliche Konvergenz und die Rolle von 1
151
2. Man untersuche auf Konvergenz bzw. Divergenz: 3p x2 C 5 & x : lim .&1/Œx* x!1
3. Die Funktion f W A ! R habe eine nach oben unbeschränkte Definitionsmenge A , R, und es sei ˇ 2 R. Man beweise die Äquivalenz: lim f .x/ D ˇ ()
x!1
lim f .&y/ D ˇ:
y!&1
4. Man berechne in der Situation von Satz I für eine rationale Funktion den Grenzwert P .x/ x!&1 Q.x/ lim
in Abhängigkeit von den Graden der Polynome P und Q. Insbesondere gilt für ein Polynom P vom Grad n % 1 mit dem Leitkoeffizienten an lim P .x/ D sign.an / ( .&1/n ( 1:
x!&1
5. Gegeben sei eine rationale Funktion F D P =Q wie in C(ii)[3.1]. Für ein b 2 R sei Q.b/ D 0. Die Stelle b gehört also nicht zur Definitionsmenge A von F , ist aber Häufungspunkt von A. Nach (10)[3.1] besitzen P und Q Faktorisierungen der Gestalt P .x/ D .x & b/k P $ .x/;
Q.x/ D .x & b/` Q$ .x/;
wobei k 2 N0 und ` 2 N die entsprechenden Vielfachheiten sind. Bei P ist der Fall k D 0 (d.h. P .b/ ¤ 0) zugelassen. Stets ist P $ .b/ ¤ 0 und Q$ .b/ ¤ 0. Man setze c´
P $ .b/ ; Q$ .b/
" ´ signc
und zeige a) für k > `: b) für k D `: c) für k < `:
lim F .x/ D 0
x!b
lim F .x/ D c
x!b
lim F .x/ D " ( 1,
x#b
lim F .x/ D .&1/`&k " ( 1.
x"b
In den Fällen k % ` kann also F in b stetig fortgesetzt werden. 6. Der Vergleichsaspekt von Definition L besitzt weitere Varianten, die oft in der so genannten Landau-Symbolik mit o („klein-o“) und O („groß-O“) beschrieben werden: Gilt limx!˛ f .x/=g.x/ D 0, so schreibt man dafür auch f .x/ D o.g.x// .x ! ˛/. Ist f .x/=g.x/ für geeignetes ı > 0 in A \ U $ .˛; ı/ beschränkt, so schreibt man
152
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
dafür auch f .x/ D O.g.x// .x ! ˛/. Die Symbolkombination „D o“ bzw. „D O“ bezeichnet dabei strenggenommen eine Relation (keine Gleichheit). Mit diesen Relationen kann man aber in einiger Hinsicht rechnen wie mit Gleichungen. Z.B. gilt der Schluss ) f .x/ D o.g.x// .x ! ˛/ e.x/ D o.g.x// .x ! ˛/: H) f .x/ C f e.x/ D o.g.x// .x ! ˛/ f 7. Das Übertragungsprinzip aus Satz K[3.2] gilt auch für uneigentliche Grenzübergänge. Man zeige nämlich: Gegeben sei die Funktion f W A ! R mit A , R und ein Häufungspunkt ˛ 2 R von A. Dann sind äquivalent: (i) (ii)
lim f .x/ existiert in R.
x!˛
Für jede Folge .xn / in A n f˛g mit xn ! ˛ existiert lim f .xn / in R. n!1
(iii) Für jede Folge .xn / in A n f˛g mit xn ! ˛ existiert lim f .xn / in R, und alle n!1 diese Limites sind untereinander gleich. Ist dies erfüllt, so gilt für jede solche Folge .xn /: limx!˛ f .x/ D limn!1 f .xn /: Lösungshinweis: Im Falle ˛; ˇ 2 R ist dies mit Satz K[3.2] vollständig bewiesen. Die verbleibenden Fälle ˛ 2 R oder ˇ 2 R müssen nach dem augenblicklichen Stand einzeln diskutiert werden, was aber im Großen und Ganzen wie in K[3.2] möglich ist. Eine einheitliche Behandlung wird am Ende von Abschnitt 6.3 beschrieben.
3.6 Monotonie und Injektivität Die Injektivität einer Funktion f W A ! R ist eine wichtige Eigenschaft, bestimmt sie doch, ob die Funktion umkehrbar ist, d.h. ob die Gleichungen f .x/ D y bei gegebenen y 2 f .A/ eindeutig nach x auflösbar sind. Man ist deshalb daran interessiert, Bedingungen zu finden, die die Injektivität garantieren. Im später zu behandelnden mehrdimensionalen Fall kann das eine schwierige Frage sein. Hier, bei unseren reellen Funktionen einer Veränderlichen, besteht jedoch eine einfache Charakterisierung der Injektivität, wenn die Funktion stetig und auf einem Intervall definiert ist: A. Satz. Sei J ein Intervall und f W J ! R stetig. Dann sind äquivalent: (i)
f ist streng monoton.
(ii) f ist injektiv.
153
Abschnitt 3.6 Monotonie und Injektivität
Beweis. Natürlich kann man annehmen, dass J ¤ ¿ und nicht einpunktig ist. Die Richtung (i) H) (ii) ist trivial. (ii) H) (i): Es werden drei Fälle betrachtet: 1. Fall: J D Œa; b/ und f .a/ < f .b/. Wir zeigen: f ist streng monoton wachsend. Zunächst liegt das Minimum bei a und das Maximum bei b. Wäre nämlich c 2 /a; bŒ Minimalstelle, so gälte f .c/ < f .a/ < f .b/, also existierte nach dem Zwischenwertsatz ein 0 2 Œc; b/ mit f .0/ D f .a/ im Widerspruch zur Injektivität. Analog schließt man für das Maximum.
a
c
b
x2
b
Angenommen, f wäre nicht streng monoton wachsend. Dann gäbe es x1 ; x2 2 Œa; b/ mit: x1 < x2 und f .x1 / > f .x2 /, also nach dem vorangehenden f .a/ < f .x2 / < f .x1 /: Laut Zwischenwertsatz existierte ein ˛ 2 /a; x1 Œ mit f .˛/ D f .x2 / im Widerspruch zur Injektivität.
a
x1
2. Fall: J D Œa; b/ und f .a/ > f .b/. Dann ist f streng monoton fallend, was analog zum 1. Fall gezeigt wird. 3. Fall: J beliebig. Nachdem die Behauptung für beschränkte abgeschlossene Intervalle schon feststeht, versucht man, den allgemeinen Fall darauf zurückzuführen. Das geschieht hier mit Hilfe einer so genannten Ausschöpfung, d.h. man stellt J als Vereinigung von immer größer werdenden, beschränkten und abgeschlossenen Intervallen dar, z.B. bei J D Œa; bŒ mit J D
[ a<x
Œa; x/: a
x
b
Falls in dieser Situation einmal f jŒa; x/ streng monoton wachsend ist, so immer; denn für x1 2 J mit x1 > x ist f jŒa; x1 / streng monoton wachsend oder streng monoton fallend, aber monoton fallend ist unmöglich (nach 1. Fall). Entsprechend gilt: Falls einmal f jŒa; x/ streng monoton fallend ist, so immer. Das geht so, wenn b 2 R ist, aber genau so gut, wenn b durch 1 ersetzt wird. Damit sind die Intervalltypen Œa; bŒ
154
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
mit b 2 R [ f1g erfasst. Analog behandelt man die Typen /a; b/ mit a 2 R [ f&1g. Beim Typ J D /a; bŒ wählt man ein c 2 J und sieht wiederum, dass f in beiden Teilen /a; c/, Œc; bŒ gleichsinnig streng monoton sein muss. " B. Satz. Sei f W Œa; b/ ! R stetig und streng monoton wachsend. Mit A ´ f .a/, B ´ f .b/ gilt dann: (i)
f .Œa; b// D ŒA; B/;
(ii)
f &1 W ŒA; B/ ! Œa; b/ ist streng monoton wachsend;
(iii) f &1 ist stetig.
B f(x0 + ε) y0 f(x0 - ε) A
ε a
ε x0
b
Beweis. Natürlich dürfen wir a < b annehmen. Zu (i): Dies ist klar aus E[3.4], da A D minŒa;b* f; B D maxŒa;b* f . Damit ist f , als Abbildung f W Œa; b/ ! ŒA; B/ betrachtet, bijektiv, sodass die Umkehrung f &1 W Œa; b/ ! ŒA; B/ wohldefiniert ist. Zu (ii): Wäre ˛ < ˇ in ŒA; B/ mit f &1 .˛/ % f &1 .ˇ/, so folgte aus der Monotonie von f : f .f &1 .˛// % f .f &1 .ˇ//, also ˛ % ˇ, Widerspruch! Zu (iii): Gegeben sei y0 D f .x0 / 2 ŒA; B/ und ein " > 0. Um den ."; ı/-Test für f &1 zu bestätigen, unterscheiden wir zwei Fälle: 1. Fall: x0 2 /a; bŒ. Sei o.B.d.A. Œx0 & "; x0 C "/ , Œa; b/. Das geeignete ı wird hier auf nahe liegende Weise aus den Funktionswerten an den Enden dieses Teilintervalls konstruiert (vgl. obiges Bild): ı ´ min fy0 & f .x0 & "/; f .x0 C "/ & y0 g:
155
Abschnitt 3.6 Monotonie und Injektivität
Dann gelten nämlich die Schlüsse: jy & y0 j < ı H) &ı < y & y0 < ı H) f .x0 & "/ & y0 < y & y0 < f .x0 C "/ & y0 H) f .x0 & "/ < y < f .x0 C "/ H) x0 & " < f &1 .y/ < x0 C " beachte: f &1 streng monoton wachsend H) jf &1 .y/ & x0 j < " H) jf &1 .y/ & f &1 .y0 /j < "
beachte: x0 D f &1 .y0 /:
Der ."; ı/-Test für f &1 ist also erfüllt. 2. Fall: x0 D a oder x0 D b. Dies läuft analog, aber es entfällt jeweils die „Hälfte“ der Ungleichungen, da links von a und rechts von b nichts zu diskutieren ist. " C. Beispiel. Ohne Stetigkeit folgt aus der Injektivität keineswegs die Monotonie. Das zeigt z.B. die Funktion f W Œ0; 1/ ! R mit ( x für x 2 Q f .x/ ´ 1&x für x … Q: f bildet das Intervall J ´ Œ0; 1/ bijektiv auf sich selbst ab. Dies folgt aus f .J / , J und der leicht zu bestätigenden Tatsache: f .f .x// D x für alle x 2 J (f ist also seine eigene Inverse!). Auf den rationalen Zahlen in J ist f streng monoton wachsend, auf den irrationalen Zahlen in J streng monoton fallend, also insgesamt nicht monoton. Nach Satz A kann f nicht stetig sein. Tatsächlich bestätigt man (z.B. mit Hilfe von D[3.3]), dass f an allen Stellen von J unstetig ist mit Ausnahme von x D 1=2. Satz B lässt sich auf alle anderen Intervalltypen übertragen, wobei an den Randpunkten, die nicht zum Definitionsintervall gehören, anstelle der Funktionswerte die Grenzwerte derselben zu nehmen sind. Über die Existenz der Grenzwerte gilt dabei in Analogie zum Hauptsatz über monoton wachsende Folgen N[2.1] auch ohne Stetigkeit Folgendes: D. Lemma. Die Funktion f W A ! R sei monoton wachsend. (i) Ist c eigentlicher oder uneigentlicher Häufungspunkt von A \ fx 2 R j x < & cg µ A& c , so gilt limx"c f .x/ D sup f .Ac / einschließlich der Existenz bzgl. R. (ii) Ist c eigentlicher oder uneigentlicher Häufungspunkt von A \ fx 2 R j x > C cg µ AC c , so gilt limx#c f .x/ D inf f .Ac / einschließlich der Existenz bzgl. R.
156
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Beweis. Wir beschränken uns auf den Fall (i) und dabei von den vier möglichen Kom& binationen c 2 R, c D 1 mit sup f .A& c / 2 R, sup f .Ac / D 1 als Muster auf die erste. Alle anderen Fälle, dann auch bei (ii), laufen mit geringfügigen Änderungen analog. Sei also c 2 R und s ´ sup f .A& c / 2 R angenommen. Gegeben ein " > 0, so & existiert ein x1 2 Ac mit f .x1 / > s & ", da s kleinste obere Schranke dieser Menge ist. Wegen der Monotonie gilt erst recht f .x/ > s & " für alle x 2 A& c mit x > x1 . Sei ı ´ c & x1 . Dann gilt insgesamt jf .x/ & sj D s & f .x/ < " für alle x 2 A& c mit jx & ˛j D ˛ & x < ı; denn die letzte Bedingung bedeutet gerade x > x1 . Man beachte sehr genau die Analogie zur Schlussweise bei N[2.1]! " Es folgt die angekündigte Verallgemeinerung von Satz B:: E . Satz. Sei f W J ! R stetig und streng monoton wachsend, J ein beliebiges Intervall mit evtl. uneigentlichen Endpunkten a; b. Dann gilt Satz B entsprechend, wobei A; B zu ersetzen sind durch die Grenzwerte A ´ lim f .x/; x!a
B ´ lim f .x/: x!b
Diese existieren in R oder uneigentlich. Ferner ist f .J / das Intervall mit den Endpunkten A; B, und zwar mit der gleichen Klammerstellung wie bei J (z.B. wenn J D Œa; bŒ, so f .J / D ŒA; BŒ, etc.). Beweis. Die Grundidee ist wiederum die Ausschöpfung. Wir betrachten als Muster den Fall J D Œa; bŒ mit a; b 2 R und nach oben nicht beschränktem Bild, d.h. sup f .J / D 1. (Alle anderen Fälle verlaufen im Großen und Ganzen genauso.) Wegen der Stetigkeit ist in diesem Fall am linken Ende: A ´ limx!a f .x/ D f .a/. Beim rechten Ende gilt nach Lemma D: B ´ limx!b f .x/ D 1 einschließlich der uneigentlichen Existenz. Die passende Ausschöpfung von J ist wie oben J D S S Œa; bŒ D Œa; x/, woraus mit Satz B folgt f .J / D ŒA; f .x//. Aufa<x y, da f .J / nicht nach oben beschränkt ist. Nach B gilt f .Œa; x// D ŒA; f .x//, also liegt y in der genannten Vereinigung. Damit folgt f .J / D ŒA; BŒ. Da jeweils das Intervall Œa; x/ durch f bijektiv auf das Intervall ŒA; f .x// abgebildet wird, ergibt sich weiter aus B, dass die Umkehrfunktion f &1 W ŒA; BŒ ! J streng monoton wachsend und stetig ist. " F. Bemerkung. Analoge Sachverhalte wie bei Lemma D und Satz E gelten bei einer streng monoton fallenden, stetigen Funktion f W J ! R auf einem Intervall J , wobei das Bildintervall sinngemäß berechnet wird, z.B. f .Œa; bŒ/ D/B; A/ etc.
Abschnitt 3.6 Monotonie und Injektivität
157
Zur Sicherung der Monotonie kann man die Randpunkte des Definitionsintervalls ignorieren, wenn die Funktion in diesen stetig ist: G. Lemma. Sei J ein Intervall. Ist f W J ! R stetig in den Randpunkten von J und (streng) monoton im Inneren, d.h. auf J ohne eventuelle Randpunkte, so ist f insgesamt (streng) monoton. Beweis. Sei z.B. J D Œa; bŒ und f j /a; bŒ monoton wachsend. Dann gilt für x1 < x2 aus /a; bŒ: f .x1 / . f .x2 /, also durch Grenzübergang x1 ! a: f .a/ . f .x2 /. Ist f j /a; bŒ sogar streng monoton wachsend, so gilt dasselbe: f .a/ . f .x2 / für x2 2 /a; bŒ. Wäre einmal f .a/ D f .x2 /, so folgte für x1 2 Œa; x2 /: f .a/ . f .x1 / . f .x2 / D f .a/, also wäre f auf /a; x2 Œ konstant, im Widerspruch zur vorausgesetzten strengen Monotonie von f j /a; bŒ. Analog schließt man bei den anderen für J möglichen Intervalltypen bzw. für „monoton fallend“ statt „monoton wachsend“. " Für beliebige monotone Funktionen auf Intervallen kann bzgl. der Unstetigkeiten nichts allzu Schlimmes passieren: H. Satz. Sei J ein Intervall (nichtleer, nicht einpunktig), und sei f W J ! R monoton. Dann gilt: (i)
Ist ˛ 2 J innerer Punkt (d.h. nicht einer der beiden möglichen Endpunkte von J ), so existieren lim f .x/ und lim f .x/ in R. x"˛
(ii)
x#˛
Ist ˛ eigentlicher oder uneigentlicher Endpunkt von J , so existiert lim f .x/ in x!˛ R oder uneigentlich.
(iii) Als innere Unstetigkeitsstellen von f kommen nur Sprungstellen in Frage. Die Menge dieser Sprungstellen ist abzählbar. (iv)
f ist dann und nur dann stetig, wenn f .J / ein Intervall ist.
Beweis. Sei etwa f monoton wachsend. Zu (i): Die genannten einseitigen Grenzwerte existieren nach Lemma D und zwar in R, da für x 2 J mit x < ˛ gilt: f .x/ . f .˛/ bzw. für x 2 J mit x > ˛: f .x/ % f .˛/. Zu (ii): Auch dies folgt unmittelbar aus D. Zu (iii): Für jede innere Stelle ˛ gilt nach dem vorhergehenden limx"˛ f .x/ . f .˛/ . limx#˛ f .x/, wobei die einseitigen Grenzwerte in R existieren. Die Stelle ˛ ist genau dann Unstetigkeitsstelle von f , wenn in dieser Ungleichung an mindestens einer Position statt des Kleinergleichzeichens „.“ das echte Kleinerzeichen „<“ steht, und dann ist ˛ Sprungstelle.
158
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Jeder Sprungstelle ˛ 2 J ordnen wir eine rationale Zahl i h r.˛/ 2 lim f .x/; lim f .x/ x"˛
x#˛
zu. Diese Abbildung ist injektiv. Denn zwei solche „Limesintervalle“, die zu Sprungstellen ˛ < ˇ gehören, haben leeren Durchschnitt, da limx#˛ f .x/ . limx"ˇ f .x/. (Dies sieht man, wenn man für ˛ < x < y < ˇ in der Ungleichung f .x/ . f .y/ zuerst den Grenzübergang x # ˛ durchführt, was auf limx#˛ f .x/ . f .y/ führt, und hierin sodann den Grenzübergang y " ˇ ausübt.) Das Bild von r ist Teilmenge von Q, somit abzählbar. Also ist die Menge der Sprungstellen selbst abzählbar. Zu (iv): Ist f stetig, so ist f .J / ein Intervall. Diese Richtung folgt aus Satz E. Es bleibt die Umkehrung zu zeigen: Sei also f .J / als Intervall vorausgesetzt. Angenommen, es existierte eine innere Unstetigkeitsstelle ˛ 2 J . Dann gälte für alle t < ˛ und T > ˛ in J : f .t/ . lim f .x/ . f .˛/ . lim f .x/ . f .T /; x"˛
x#˛
wobei an mindestens einer Position bei den mittleren Kleinergleichzeichen das echte Kleinerzeichen steht. Dann gäbe es in Œf .t/; f .T // ein nichtleeres offenes Teilintervall, das keine Werte von f enthält im Widerspruch dazu, dass f .J / ein Intervall ist. Bei einem Definitionsintervall, das einen Randpunkt enthält, etwa bei J ´ Œa; bŒ kann man etwas abgeändert so schließen: Angenommen, f ist in a unstetig. Dann gilt für T > a in J : f .a/ < lim f .x/ . f .T /: x#a
Zwischen f .a/ und f .T / lägen dann keine Werte von f , erneut im Widerspruch dazu, dass f .J / ein Intervall ist. " Aufgaben und Anmerkungen 1. Gibt es eine bijektive, nicht monotone Abbildung f W Œ0; 1/ ! Œ0; 1/ mit genau einer Unstetigkeitsstelle? 2. Die Funktion f W A ! R sei streng monoton. Man beweise die etwas überraschende Tatsache, dass dann f &1 W f .A/ ! A von alleine stetig ist. Lösungshinweis: Der Stetigkeitsbeweis zu B(iii) funktioniert auch ohne die Stetigkeit von f . 3. Die Funktion f W Œa; b/ ! R sei stetig und lokal injektiv, d.h. zu jedem x 2 Œa; b/ existiert eine Umgebung U.x; ı/, sodass die Restriktion f j.Œa; b/ \ U.x; ı// injektiv ist. Man beweise: Dann ist f selbst injektiv. Lösungshinweis: Man arbeite mit einem Widerspruchsbeweis und wende dabei Aufgabe 5[3.4] an.
Abschnitt 3.7 Exponentialfunktionen, Logarithmen, Potenzen
159
3.7 Exponentialfunktionen, Logarithmen, Potenzen Die „Mutter“ all dieser Funktionen ist die natürliche Exponentialfunktion exp W R &! R x 7&! exp.x/ µ e x ; die wir in Abschnitt 2.4 über eine Funktionalgleichung und eine Ungleichung eingeführt hatten: e aCb D e a ( e b
(F)
8 a; b 2 R
ea % 1 C a
(U)
8 a 2 R:
Leichte Konsequenzen hieraus waren: ' e 0 D 1;
' e &a D
1 > 0 8 a 2 R; ea
' e ka D .e a /k 8 a 2 R; k 2 Z:
Es ergab sich weiter, dass genau eine Funktion mit den Eigenschaften (F), (U) existiert. Nun soll die natürliche Exponentialfunktion auf Stetigkeit, Grenzwerte, etc. untersucht und darauf ihre Umkehrfunktion, der natürliche Logarithmus, eingeführt werden. Dann werden auch allgemeine Logarithmen und Potenzen leicht definierbar sein. A. Lemma. Für alle a; b 2 R gilt:
e a .b & a/ . e b & e a . e b .b & a/.
Beweis. Wir ersetzen in (U) das a durch b & a und schließen weiter so: eb D e b&a % 1 C b & a H) e b % e a C .b & a/e a : ea Hierbei besteht der Übergang in der Multiplikation mit e a > 0. Es resultiert der „linke“ Teil der Behauptung. Der „rechte“ Teil ergibt sich durch Vertauschung von a mit b. " B. Satz (Eigenschaften von exp). (i)
exp W R ! R ist streng monoton wachsend.
(ii)
Für jedes b 2 R ist exp auf /&1; b/ Lipschitz-stetig mit der Lipschitz-Konstanten e b . Somit ist exp auf ganz R stetig.
(iii) (iv)
lim e x D 1;
x!1
exp.R/ D RC .
lim e x D 0.
x!&1
160
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Beweis. Zu (i): Für a < b folgt aus Lemma A: 0 < e a .b & a/ . e b & e a , also e a < e b . Zu (ii): Für x1 < x2 . b folgt aus Lemma A und (i): 0 < e x2 & e x1 . e x2 .x2 & x1 / . e b .x2 & x1 /: Zu (iii): Man schließt der Reihe nach so: 1 D0 ex lim e y D 0:
e x % 1 C x H) lim e x D 1 H) lim x!1
H) lim e &x D 0 H) x!1
x!1
y!&1
Zu (iv): Dies ergibt sich aus dem Umkehrsatz E[3.6], dessen Voraussetzungen nach (i) – (iii) erfüllt sind. " C. Definition. Der natürliche Logarithmus ln W RC ! R ist die (nach E[3.6] existierende) Umkehrfunktion von exp W R ! RC . D. Satz (Eigenschaften von ln). ln.˛ ( ˇ/ D ln ˛ C ln ˇ 8 ˛; ˇ 2 RC ; 1 (ii) 1 & . ln ˛ . ˛ & 1 8 ˛ 2 RC ; ˛ (iii) ln ist streng monoton wachsend und stetig; (i)
(iv)
lim ln x D &1;
x!0
lim ln x D 1:
x!1
Beweis. Im Wesentlichen handelt es sich um eine Übersetzung der Eigenschaften einer Funktion zur Umkehrfunktion. Zu (i): Man setzt in (F): a ´ ln ˛; b ´ ln ˇ und schließt weiter so: e ln ˛Cln ˇ D e ln ˛ ( e ln ˇ D ˛ ( ˇ H) ln ˛ C ln ˇ D ln.˛ ( ˇ/: Der Schritt hierin besteht in der Anwendung von ln auf beide Seiten. Man nennt das Logarithmieren. Zu (ii): Man setzt in (U): a ´ ln ˛ und schließt so: e a % 1 C a H) ˛ % 1 C ln ˛ H) ln ˛ . ˛ & 1: Nun setzt man in Lemma A: b ´ 0 und dann wieder a ´ ln ˛: e a .&a/ . 1 & e a H) e a ( .1 & a/ . 1 H) ˛ ( .1 & ln ˛/ . 1 H) ln ˛ % 1 &
1 : ˛
161
Abschnitt 3.7 Exponentialfunktionen, Logarithmen, Potenzen
Zu (iii), (iv): Dies folgt, wie gesagt, aus dem Umkehrsatz E[3.6] zusammen mit Satz B. " Leichte Konsequenzen aus diesen Eigenschaften sind: ' ln 1 D 0;
' ln
˛ D ln ˛ & ln ˇ 8 ˛; ˇ 2 RC ; ˇ
' ln.˛ k / D k ( ln ˛ 8 ˛ 2 RC ; k 2 Z: In der Tat: Die erste und letzte Regel sind einfach die Übersetzungen der entsprechenden Regeln für exp. Weiter erhält man zunächst ln.1=ˇ/ D & ln ˇ, indem man in D(i) ˛ ´ 1=ˇ setzt, und daraus die zweite Regel durch Ersetzen von ˇ durch 1=ˇ in D(i). Das folgende Bild zeigt die Graphen der natürlichen Exponentialfunktion und des natürlichen Logarithmus. Bekanntlich erhält man den Graphen der Umkehrfunktion durch Spiegelung an der Winkelhalbierenden (d.h. dem Graphen der Identität x 7! x). 4 exp 3 2
ln
1
-3
-2
0
-1
1
2
3
4
-1 -2 -3
Mit Hilfe der natürlichen Exponentialfunktion und ihrer Umkehrung lassen sich nun leicht Potenzgleichungen lösen und damit Wurzelfunktionen einführen: E. Satz. Gegeben seien a 2 RC sowie p; q 2 Z mit q ¤ 0. Dann hat die Gleichung x q D ap genau eine Lösung in RC , nämlich . / p x D exp ln a : q
162
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
Beweis. Dies folgt aus der Äquivalenzkette: x q D ap () ln.x q / D ln.ap / () q ln x D p ln a 3p p () ln x D ln a () x D exp ln a ; q q deren Schritte unmittelbar klar sind.
"
F. Definition. Man definiert daher für a 2 RC 3p p ln a a q ´ ap=q ´ exp q
8 p; q 2 Z; q ¤ 0;
speziell die q-te Wurzel (1)
p q
31 1 a ´ a q ´ a1=q ´ exp ln a q
8 q 2 N;
ferner die allgemeine Potenz (2)
at ´ e t (ln a
8 t 2 R:
Bei mehrfachen Potenzen befolgt man die Schreibweise c
c
ab ´ a.b / :
(3) Äquivalent mit (2) ist natürlich: (4)
ln at D t ( ln a
8 t 2 R:
Obwohl die Schrägstrichschreibweise bei Brüchen i. Allg. vermieden werden sollte, ist sie bei Exponenten manchmal angebracht, um allzu „hochstockige“ Symbole zu vermeiden. Für p q D p 2 und p D 1 zeigt der Vergleich von Satz E mit Definition B[2.2], dass 2 a D a gilt. G. Bemerkung. Der obige Ausdruck ap=q ist mit einigem Recht als Potenz von a mit rationalem Exponenten p=q zu bezeichnen, ist er doch die Lösung der Gleichung x q D ap (besonders deutlich ist dies in den Fällen positiver p; q mit p D 1 oder q D 1). Darüber hinaus ist die Funktion x 7! ax , x 2 R, die einzige stetige Fortsetzung der Funktion p=q 7! ap=q von Q auf R. Dies folgt aus der Tatsache, dass zu jeder reellen Zahl x eine Folge rationaler Zahlen rn existiert mit rn ! x; vgl. Satz H[2.1]. Ist also f W R ! R irgendeine stetige Fortsetzung von p=q 7! ap=q , so folgt zwangsläufig f .x/ D f .limn!1 rn / D limn!1 f .rn / D limn!1 arn D ax . Die Existenz und eindeutige stetige Fortsetzbarkeit der Funktion p=q 7! ap=q von Q auf R durch x 7! ax , x 2 R, rechtfertigt bei weitem die Bezeichnung von ax als Potenz.
163
Abschnitt 3.7 Exponentialfunktionen, Logarithmen, Potenzen
H. Satz (Rechenregeln für Potenzen). Für a; b 2 RC und t; s 2 R gilt: a0 D 1; 1 (ii) a&t D t ; a (iii) atCs D at as ; (i)
(iv)
.at /s D a.ts/ µ ats ;
(v)
.ab/t D at b t .
Beweis. Die Regeln (i) – (iii) folgen unmittelbar aus den Spezialfällen für a D e unter Beachtung der Definition in (2). Auch den Rest rechnet man leicht nach: .at /s D exp.s ( ln at / D exp.s ( t ( ln a/ D a.st / .ab/t D exp.t ln.ab// D exp.t ln a C t ln b/ D exp.t ln a/ ( exp.t ln b/ D at ( b t : Die Umformungen sind anhand der genannten Definition klar. Bezeichnungen: x 7&! x a x 7&! ax t
in a p in q a
"
Potenzfunktionen Exponentialfunktionen a Basis; t Exponent a Radikand oder Hochzahl:
Analog führt die Lösung von Exponentialgleichungen auf die Logarithmen: I. Satz und Definition (Logarithmen). Gegeben seien a; b 2 RC mit a ¤ 1. Dann hat die Gleichung ax D b genau eine Lösung in R, nämlich xD
ln b : ln a
Diese Lösung heißt der Logarithmus von b zur Basis a, geschrieben loga b. Es gilt also (5)
loga b D
ln b : ln a
Für die Basis a D e erhält man den natürlichen Logarithmus zurück: loge b D ln b. Für a D 10 ergibt sich der so genannte dekadische Logarithmus log10 b. Beweis. Die eindeutige Lösbarkeit folgt aus der Äquivalenzkette: ax D b () ln ax D ln b () x ln a D ln b () x D
ln b ; ln a
164
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
deren Schritte wieder unmittelbar einleuchten.
"
Hinweis: In einfachen Fällen wird man nicht die allgemeinen Formeln (1), (5) verwenden, sondern direkt auf die p eindeutige Lösbarkeit der entsprechenden Gleichungen zurückgreifen. Z.B. ist 10 1024 D 2, da 210 D 1024, oder log10 1000 D 3, da 103 D 1000. J. Satz (Grenzwerte). (i)
lim x a D 1;
x!1
falls a > 0;
ln x D 0; falls a > 0; xa xa (iii) lim x D 0; falls a 2 R. x!1 e
(ii)
lim
x!1
In der Sprechweise von Definition L[3.5] bedeuten (ii) und (iii), dass für x ! 1 die Potenzfunktion x a schneller gegen 1 strebt als die Logarithmusfunktion ln x und die Exponentialfunktion e x wiederum schneller als die Potenzfunktion x a . Beweis von J. Zu (i): Dies ergibt sich aus der Definition x a D e a ln x , zusammen mit den bereits bekannten Grenzwerten ln x ! 1; e x ! 1 für x ! 1. Vgl. B(iii) und D(iv). Zu (ii): Wir wählen ein b mit 0 < b < a und erzielen auf folgendem Weg eine Vorausabschätzung für x > 0: ln x . x & 1 H) ln x b . x b & 1 H) b ln x . x b & 1 H) ln x . somit gilt
1 ln x 0. a . x b
.
1 x a&b
1 & a x
1 b .x & 1/I b
/ für x % 1:
Da die beiden letzten Brüche nach (i) für x ! 1 gegen 0 konvergieren, folgt die Behauptung. Zu (iii): Wir schreiben xa e a ln x 1 D D x&a ln x D x x e e e
1 // : . . ln x exp x 1 & a x
Nach (ii) und dem Meidungsprinzip existiert ein x0 > 0, sodass 1&a
ln x 1 % x 2
für x % x0 :
165
Abschnitt 3.7 Exponentialfunktionen, Logarithmen, Potenzen
Dafür wird also:
xa 1 . x=2 &! 0 für x &! 1; x e e wobei zuletzt das Substitutionsprinzip (auf e x=2 ) angewendet wurde. p K. Beispiel. Was ist lim n n ? 0<
"
n!1
p ln n Lösung: Für n ! 1 ist n n D e .ln n/=n ! e 0 D 1, da nach J(ii) gilt: ! 0 n und da exp stetig ist (wobei wiederum das Substitutionsprinzip angewendet wurde). Es folgt: p lim n n D 1: n!1
L. Bemerkung. Ist a > 0 und t 2 R, so gilt: ( für a ! 0, wenn t > 0 t t ln a ! 0 a De D 1; wenn t D 0: Daher legt man fest: 0t ´ 0 für t 2 RC ;
(6)
aber
00 ´ 1:
Bei den Wurzeln lässt man für ungerades q 2 N auch negative Radikanden zu, indem man definiert: p p (7) a1=q ´ q a ´ sign a ( q jaj 8 a 2 R: Aufgaben und Anmerkungen 1. Welche der folgenden Behauptungen sind richtig, welche falsch? p p p p p p p p 3 3 3 3 a) 9 C 4 5 C 9 & 4 5 D 3, b) 161 C 72 5 C 161 & 72 5 2 N. 2. Man untersuche auf Konvergenz und bestimme ggf. den Grenzwert bei: p a) lim x a ln x (a > 0 fest), b) lim x x , c) lim n a (a > 0 fest). x#0
n!1
x#0
3. Mittels Aufgabe 2[2.4] zeige man: lim
n!1
p n
nŠ D 1.
4. In Verallgemeinerung von Aufgabe 5a)[2.1] zeige man für feste p 2 R und a 2 Œ0; 1Œ: lim x p ax D 0 x!1
und folgere daraus durch Einschränkung lim np an D 0;
n!1
(dies dann auch für jaj < 1).
166
Kapitel 3 Reelle Funktionen und ihre Grenzwerte
5. Sei .an / eine reelle Zahlenfolge. a) Folgt aus lim an D 1 stets lim n!1
n!1
p n
an D 1?
b) Folgt aus lim an D 1 stets lim ann D 1? n!1
n!1
6. Sei .cn / eine reelle Zahlenfolge. Man beweise die folgende Umkehrung von Lemma S[2.1]: 3 cn -n D 1 H) lim cn D 0: lim 1 C n!1 n!1 n
4
Differentialrechnung
Wir hatten schon an früherer Stelle betont, wie stark man sich in der Analysis für das Änderungsverhalten von Funktionen interessiert. An begrifflichen Werkzeugen dafür haben wir bislang die Grenzwerte und die Stetigkeit kennen gelernt. Bei der Stetigkeit wird das Änderungsverhalten der Funktionswerte qualitativ erfasst. Bei der Differenzierbarkeit, die wir jetzt in Angriff nehmen, geht es um eine quantitative Behandlung des Änderungsverhaltens in Gestalt der Ableitung. Zur Motivierung betrachten wir bei einer Funktion f die Argumente x, die „benachbart“ zur festen Stelle a sind und die zugehörige Funktionswerte f .x/; f .a/: Entscheidend für die Änderung sind die Differenzen f .x/ & f .a/ und x & a, besser noch ihr Verhältnis, der so genannte Differenzenquotient V . Um sich von Zufälligkeiten zu befreien, die zwischen a und x passieren können, geht man mit V zur Grenze für immer kleinere Differenzen x & a über, d.h. man bildet den Grenzwert von V für x ! a, falls existent. Das ist dann die Ableitung v, die „momentane Änderungsrate“ von f an der Stelle a. Differenzenquotient V ´
f .x/ & f .a/ x&a ? ? y
f(x) - f(a)
Ableitung
x-a
v ´ lim V x!a
a
x
Unter den verschiedenen Gesichtspunkten erhält man durch diesen Grenzübergang geometrisch: analytisch: physikalisch:
aus der Sehnensteigung V : die Tangentensteigung v; aus dem Differenzenquotienten V : den Differentialquotienten v; aus der Änderungsrate V : die Momentanänderung v.
4.1 Differenzierbarkeit Betrachtet wird hier immer eine Funktion f W A ! R, definiert auf einer Teilmenge A , R, und ein Häufungspunkt a von A in A.
168
Kapitel 4 Differentialrechnung
A. Definition. Man nennt f differenzierbar in a, falls der Grenzwert f 0 .a/ ´ lim
x!a
f .x/ & f .a/ x&a
in R existiert. Dann heißt dieser Grenzwert die Ableitung von f in a. B. Beispiele. (i) Potenzfunktion f .x/ D x n ; f W R ! R .n 2 N fest). Für x ¤ a lautet der Differenzenquotient (1)
x n & an f .x/ & f .a/ D D x n&1 C x n&2 a C x n&3 a2 C ( ( ( C xan&2 C an&1 : x&a x&a
Das zweite Gleichheitszeichen folgt aus der Regel x n & an D .x & a/.x n&1 C x n&2 a C x n&3 a2 C ( ( ( C xan&2 C an&1 /: Diese bestätigt man durch Ausrechnen der rechten Seite: .x n C x n&1 a C x n&2 a2 C ( ( ( C x 2 an&2 C xan&1 / & .x n&1 a C x n&2 a2 C x n&3 a3 C ( ( ( C xan&1 C an /: Da sich die meisten Glieder herausheben, ist dies gleich x n & an . (Man könnte auch in der geometrischen Summenformel (9)[1.3] q D x=a setzen und etwas umstellen.) Aus (1) folgt lim
x!a
f .x/ & f .a/ D lim .x n&1 Cx n&2 aCx n&3 a2 C( ( (Cxan&2 Can&1 / D n(an&1 I x!a x&a
denn in der letzten großen Klammer kann man (wegen ihrer Stetigkeit bzgl. x) einfach x D a setzen (C(ii)[3.3]). Man erhält n gleiche Summanden an&1 . Somit ist f in jedem a 2 R differenzierbar und f 0 .a/ D nan&1 . (ii) Betragsfunktion f .x/ D jxj; f W R ! R. Diese ist in 0 stetig (I(iv)[3.3]), aber nicht differenzierbar! Es gilt nämlich für den Differenzenquotienten ( jxj & j0j jxj f .x/ & f .0/ 1; falls x > 0 D D D x&0 x&0 x &1; falls x < 0; sodass sein linksseitiger Grenzwert bei 0 gleich &1, sein rechtsseitiger Grenzwert aber gleich C1 ist, er also für x ! 0 nicht konvergiert. Der Differenzenquotient wird oft in einer leicht abgeänderten Gestalt gebraucht:
169
Abschnitt 4.1 Differenzierbarkeit
A. Zusatz. Äquivalent kann die Differenzierbarkeit so ausgedrückt werden: f .a C h/ & f .a/ h h!0
f 0 .a/ ´ lim
existiert in R. Dabei ist h natürlich so einzuschränken, dass a C h in A liegt. Beweis. Dies ergibt sich unmittelbar aus dem Substitutionsprinzip Q[3.2], indem man x D a C h setzt. (Man kann natürlich auch direkt bestätigen, dass der ."; ı/-Test für den Differenzenquotienten in Definition A für x ! a äquivalent ist mit dem ."; ı/Test für den obigen Differenzenquotienten für h ! 0.) " C. Beispiele (für die Variante im Zusatz A). (i) Konstante Funktion f .x/ ´ c für alle x 2 A. Hier ist f .a C h/ & f .a/ c&c D D 0 &! 0; h h somit f 0 .a/ D 0 existent. (ii) Kehrwertfunktion f .x/ ´ h¤0
1 ; f W R n f0g ! R: Hier ist für a ¤ 0, a C h ¤ 0, x
a & .a C h/ 1 1 & f .a C h/ & f .a/ 1 a.a C h/ D aCh a D D& : h h h a.a C h/ Daraus folgt einschließlich Existenz: 1 1 f .a C h/ & f .a/ D& D & 2: h a.a C 0/ a h!0
f 0 .a/ D lim
(iii) Exponentialfunktion exp W R ! R; x 7! exp x D e x : Hier wird der Differenzenquotient (2)
eh & 1 e aCh & e a D ea ( : h h
Wir zeigen: (3)
eh & 1 D 1: h h!0 lim
170
Kapitel 4 Differentialrechnung
Vorausabschätzung dafür: Nach E(ii),(iv)[2.4] gilt für h < 1: 1 C h . eh .
1 ; 1&h
also h . e h & 1 .
1 h &1D : 1&h 1&h
Hieraus folgt (3) durch Division (in beiden Fällen h > 0 bzw. h < 0) und per Einschnürung. Aus (2) und (3) folgt: exp0 a D exp a: Die e-Funktion reproduziert sich beim Ableiten! Weitere konkrete Funktionen werden im folgenden Abschnitt abgeleitet, indem statt der Differenzenquotienten die dann bewiesenen Rechenregeln herangezogen werden. D. Satz. Ist f differenzierbar in a, so ist f erst recht stetig in a. Beweis. Trivialerweise kann man für x 2 A n fag schreiben: (4)
f .x/ D f .a/ C
f .x/ & f .a/ ( .x & a/: x&a
Für x ! a gilt dann termweise anhand der rechten Seite: f .a/ &! f .a/;
f .x/ & f .a/ &! f 0 .a/ x&a
x & a &! 0;
somit nach Satz N[3.2]: f .x/ ! f .a/ C f 0 .a/ ( 0 D f .a/ für x ! a. E . Bemerkung. Die Umkehrung von Satz D ist nicht richtig. Dies sieht man schon bei der Betragsfunktion f W R ! R; f .x/ D jxj. Diese ist überall stetig (I(iv)[3.3]), aber in 0 nicht differenzierbar; vgl. B(ii). Man kann sogar (mit einigem Aufwand) eine Funktion f W R ! R konstruieren, die überall stetig, aber nirgends differenzierbar ist, indem man den „Zacken“, den die Betragsfunktion bei 0 an den Tag legt, vervielfacht und verdichtet.
"
f
x
Die Gleichung in (4) legt es nahe, den Differenzenquotienten als eigenständige Funktion einzuführen: (5)
f1 .x/ ´
f .x/ & f .a/ x&a
für x ¤ a;
171
Abschnitt 4.1 Differenzierbarkeit
wobei zusätzlich der Wert f1 .a/ irgendwie festgelegt werden kann, sodass also insgesamt f1 W A ! R definiert ist. Dann folgt aus der Differenzierbarkeit in a laut (4): f .x/ D f .a/ C f1 .x/ ( .x & a/ mit limx!a f1 .x/ D f 0 .a/. Dies lässt sich auch umkehren: F. Satz (Umformulierung der Differenzierbarkeit). Äquivalent sind (i) und (ii): (i)
f ist in a differenzierbar;
(ii) Es gibt eine Funktion f1 W A ! R mit: f .x/ D f .a/ C f1 .x/ ( .x & a/
8 x 2 A;
lim f1 .x/ µ * existiert in R:
x!a
Trifft (ii) zu, so ist f 0 .a/ D *. Beweis. (i) H) (ii): Dies war die Vorüberlegung. (ii) H) (i): Durch Auflösen der Gleichung in (ii) nach f1 .x/ ergibt sich notwendig die Gleichung (5). Also ist der Grenzwert von f1 .x/ für x ! a gerade die Ableitung. " G. Bemerkungen. (i) Wird F(ii) vorausgesetzt, so kann o.B.d.A. das f1 in a als stetig angenommen werden; denn man erreicht dies durch die „Umdefinition“ f1 .a/ ´ * D f 0 .a/: f1 hat in a eine hebbare Unstetigkeit. (ii) Schreibt man f1 .x/ D * C f2 .x/, so wird hierdurch eine Funktion f2 definiert, und limx!a f1 .x/ D * ist äquivalent mit limx!a f2 .x/ D 0. Somit kann die Forderung F(ii) in die weitere äquivalente Form gebracht werden: ($) Es gibt ein * 2 R und eine Funktion f2 W A ! R mit: f .x/ D f .a/ C * ( .x & a/ C f2 .x/ ( .x & a/
8 x 2 A;
lim f2 .x/ µ 0:
x!a
Die rechte Seite hierin ist eine Zerlegung des Funktionswertes f .x/ in einen konstanten Anteil f .a/, einen (in x & a) linearen Anteil * ( .x & a/ und in ein Restglied f2 .x/(.x &a/, das aufgrund seiner Bauart „stärker als linear“ gegen 0 geht für x ! a. Der Faktor des linearen Anteils * ist dann gerade die Ableitung. Setzt man hierin wie oben x D a C h, so erhält man äquivalent: ($$) Es gibt ein * 2 R und ein f3 .h/ mit: f .a C h/ D f .a/ C * ( h C f3 .h/ ( h
8 h mit a C h 2 A;
lim f3 .h/ D 0:
h!0
172
Kapitel 4 Differentialrechnung
Die Funktion f3 ist dabei definiert für alle h mit a C h 2 A. Die Varianten ($) und ($$) sind besonders geeignet, um später den Ableitungsbegriff aufs Mehrdimensionale auszudehnen. H. Beispiel. Bei der Kehrwertfunktion C(ii) gilt die (zunächst exotisch anmutende) Zerlegung (6)
1 1 h D & 2C aCh a a
. /2 h 1 a aCh
für a ¤ 0; a C h ¤ 0;
die man leicht nachrechnen kann. Es ist genau eine von der Form, wie sie in ($$) benötigt wird, nämlich mit *´&
1 ; a2
f3 .h/ ´
h 1 ; 2 a aCh
sodass erneut dieser Wert * als Ableitung an der Stelle a erkannt ist. Die Bauart der Zerlegung (6) wird später in Analysis 3 bei der Ableitung der Matrizeninversen nützlich sein. In manchen Situationen werden beim Ableiten nur einseitige Grenzwerte betrachtet. Bei der rechtsseitigen Ableitung handelt es sich um den Grenzwert fC0 .a/ ´ lim
x#a
f .x/ & f .a/ ; x&a
falls er in R existiert. Dazu muss natürlich a 2 A Häufungspunkt von A \ Œa; 1Œ sein. Bei der linksseitigen Ableitung handelt es sich um den Grenzwert f&0 .a/ ´ lim
x"a
f .x/ & f .a/ ; x&a
falls er in R existiert. Dazu muss natürlich a 2 A Häufungspunkt von A \ /&1 a/ sein. Aufgaben und Anmerkungen 1. Rechenaufgaben zur Ableitung folgen bei den nächsten Abschnitten. 2. Es gibt stetige Funktionen (z.B. auf ganz R), die an keiner Stelle differenzierbar sind. Eine solche Funktion wird in Aufgabe 6[8.2] konstruiert werden. 3. Die Funktion f W R ! R sei in a 2 R differenzierbar. Man zeige:
173
Abschnitt 4.2 Ableitungsregeln
a) Ist .an / eine Folge mit limn!1 an D a und gilt für alle n: an ¤ a, so ist f .an / & f .a/ D f 0 .a/: n!1 an & a lim
b) Sind .an / und .bn / zwei Folgen mit limn!1 an D limn!1 bn D a und gilt für alle n: an . a . bn sowie an ¤ bn , so ist lim
n!1
f .bn / & f .an / D f 0 .a/: bn & an
4.2 Ableitungsregeln Wollte man bei gegebener Funktion die Ableitung jedesmal nach der ursprünglichen Definition A[4.1] diskutieren, so wäre dies i. Allg. sehr umständlich. Glücklicherweise existiert aber ein Regelwerk, das es in vielen Fällen erlaubt, die Ableitung komplizierter Funktionen aus der Ableitung einfacher Funktion zu berechnen. Diese Regeln werden hier bewiesen. – Betrachtet werden immer reelle Funktion, die jeweils auf einer Teilmenge A , R definiert sind. Die Differenzierbarkeit an der Stelle a 2 A soll einschließen, dass a Häufungspunkt von A ist. A. Satz. Seien f; g W A ! R in a 2 A differenzierbar. Dann sind auch f C g und f ( g in a differenzierbar, und es gilt: .f C g/0 .a/ D f 0 .a/ C g 0 .a/
(Summenregel)
.f ( g/0 .a/ D f 0 .a/ ( g.a/ C f .a/ ( g 0 .a/
(Produktregel).
Beweis. Wir verwenden z.B. die Variante F(ii)[4.1] (es ginge auch mit A[4.1]). Hiernach ist vorausgesetzt (1)
f .x/ D f .a/ C f1 .x/ ( .x & a/;
f1 .x/ &! f 0 .a/
g.x/ D g.a/ C g1 .x/ ( .x & a/;
g1 .x/ &! g 0 .a/;
wobei sich die Grenzübergänge auf x ! a beziehen. Zur Summe: Durch Addition in (1) kommen wir an die Summenfunktion heran: f .x/ C g.x/ D f .a/ C g.a/ C .f1 .x/ C g1 .x// ( .x & a/:
174
Kapitel 4 Differentialrechnung
Hier konvergiert der Koeffizient von x & a nach Satz N[3.2] gegen f 0 .a/ C g 0 .a/. Also ist f C g in a differenzierbar mit der Ableitung f 0 .a/ C g 0 .a/. Zum Produkt: Durch Multiplikation in (1) kommen wir an die Produktfunktion heran: 3 f .x/(g.x/ D f .a/(g.a/C f1 .x/(g.a/Cg1 .x/(f .a/Cf1 .x/(g1 .x/(.x&a/ (.x&a//: Hier konvergiert der Koeffizient von x &a nach Satz N[3.2] gegen f 0 .a/(g.a/Cg 0 .a/( f .a/ C 0. Also ist f ( g in a differenzierbar mit der Ableitung wie behauptet. " B. Satz (Kettenregel). Gegeben seien Funktionen f W A &! R;
g W B &! R
mit
f .A/ , B:
Ist f in a 2 A differenzierbar und g in b ´ f .a/ differenzierbar, so ist g ı f in a differenzierbar und .g ı f /0 .a/ D g 0 .f .a// ( f 0 .a/: Beweis. Wir verwenden wieder F(ii)[4.1] (hier kommt man mit A[4.1] schlecht durch). Nach Voraussetzung ist f .x/ D b C f1 .x/ ( .x & a/;
f1 .x/ &! f 0 .a/
g.y/ D g.b/ C g1 .y/ ( .y & b/;
g1 .y/ &! g 0 .b/:
Durch Einsetzen kommen wir an die Komposition heran: 3 .g ı f /.x/ D g.f .x// D g.b/ C g1 b C f1 .x/ ( .x & a/ ( f1 .x/ ( .x & a/: Hier konvergiert der Koeffizient von x & a gegen g 0 .b/ ( f 0 .a/; denn das Argument von g1 in der großen Klammer strebt gegen b. Also geht der erste Faktor nach dem Substitutionsprinzip gegen g 0 .b/, und der zweite strebt gegen f 0 .a/, wobei insgesamt wiederum Satz N[3.2] zum Zuge kommt. " C. Folgerung. Seien f; g W A ! R in a 2 A differenzierbar und g.a/ ¤ 0. Dann ist f in a differenzierbar und: g .
f g
/0
.a/ D
g.a/ ( f 0 .a/ & f .a/ ( g 0 .a/ .g.a//2
(Quotientenregel):
175
Abschnitt 4.2 Ableitungsregeln
Beweis. 1) Man berechnet zunächst die Ableitung von 1=g, indem man dieses als Komposition auffasst: Sei R W R n f0g ! R die Kehrwertfunktion R.y/ ´ 1=y. Dann ist 1=g D R ı g, also folgt nach der Kettenregel, zusammen mit C(ii)[4.1], dass 1=g in a differenzierbar ist mit der Ableitung . /0 1 1 .a/ D R0 .g.a// ( g 0 .a/ D & ( g 0 .a/: g .g.a//2 2) Daraus folgt zusammen mit der Produktregel in Satz A / . /0 . f 1 0 .a/ D f ( .a/ g g . /0 1 1 .a/ D f 0 .a/ ( C f .a/ ( g.a/ g . / 1 1 0 0 D f .a/ ( C f .a/ ( & ( g .a/ g.a/ .g.a//2 D
g.a/ ( f 0 .a/ & f .a/ ( g 0 .a/ .g.a//2
einschließlich der Differenzierbarkeit, wie behauptet.
"
Bezüglich der Umkehrfunktion überlegen wir vorab: Die Funktion f W A ! R sei injektiv und in a differenzierbar. Dann ist die Umkehrfunktion vom Typ f &1 W f .A/ ! A. Wenn man wüßte, dass b ´ f .a/ Häufungspunkt von f .A/ ist, und auch, dass f &1 in b differenzierbar ist, so folgte aus der Identität f &1 .f .x// D x durch Ableiten beider Seiten mit der Kettenregel: .f &1 /0 .b/ ( f 0 .a/ D 1, also die folgende Regel (2). Leider sind das ziemlich starke Annahmen, die man der Ausgangsfunktion nicht ohne weiteres ansehen kann. Verbessern lässt sich die Situation folgendermaßen: D. Satz (Differenzierbarkeit der Umkehrfunktion). Für die Funktion f W A ! R sei vorausgesetzt: (i)
f ist injektiv;
(ii)
f ist in a 2 A differenzierbar und f 0 .a/ ¤ 0;
(iii) die Umkehrfunktion f &1 W f .A/ ! A ist in b ´ f .a/ stetig. Dann ist f &1 in b differenzierbar und (2)
.f &1 /0 .b/ D
1 1 D 0 &1 : f 0 .a/ f .f .b//
176
Kapitel 4 Differentialrechnung
Beweis. 1) b ist Häufungspunkt von f .A/: Angenommen, b wäre isolierter Punkt von f .A/. Dann gäbe es ein ı > 0, sodass für alle x 2 Anfag gilt jf .x/&bj % ı. Grenzübergang x ! a lieferte aus dieser Ungleichung wegen der Stetigkeit von f (enthalten in (ii)): jf .a/ & bj % ı: Dies widerspricht b D f .a/. 2) Nach Voraussetzung gilt mit der Variante F(ii)[4.1]: f .x/ D f .a/ C f1 .x/ ( .x & a/;
f1 stetig in a, f1 .a/ D f 0 .a/:
Wir lösen diese Gleichung (teilweise) nach dem Urbild auf, indem wir für gegebenes y 2 f .A/ setzen: y D f .x/, d.h. x D f &1 .y/. Das gibt zunächst ( ) y D b C f1 .f &1 .y// ( f &1 .y/ & f &1 .b/ 8 y 2 f .A/: Damit der zweite Term f &1 .y/ isoliert werden kann, braucht man f1 .f &1 .y// ¤ 0. 3) Dass dies für alle y 2 f .A/ der Fall ist überlegt man so: Wäre einmal f1 .f &1 .y// D 0, so folgte aus der letzten Gleichung in 2): y D b, also f1 .f &1 .y// D f1 .f &1 .b// D f1 .a/ D f 0 .a/ ¤ 0, ein Widerspruch! 4) Aus 2) folgt nun durch Isolieren von f &1 .y/: f &1 .y/ D f &1 .b/ C
1 f1 .f
&1 .y//
( .y & b/
8 y 2 f .A/;
wobei für den Koeffizienten von y & b wegen der Stetigkeit von f1 und f &1 gilt: 1 f1 .f
&1 .y//
&!
1 f1 .f
&1 .b//
D
1 1 D 0 f1 .a/ f .a/
Dies beinhaltet nach F(ii)[4.1] die Behauptung.
(für y &! b): "
Warnung: Man sollte in der Symbolik unterscheiden zwischen der Umkehrfunktion (Inversen) einer (injektiven) Funktion f , bezeichnet durch f &1 , und der Kehrwertfunktion einer (nullstellenfreien) Funktion, bezeichnet durch f1 (oder manchmal 1=f ). Für diese sollte die Potenzschreibweise vermieden werden! Satz D wird falsch ohne die Voraussetzung der Stetigkeit der Umkehrfunktion gemäß (iii). Gegenbeispiele sind allerdings mühsam zu konstruieren. Die Lage verbessert sich, wenn die Definitionsmenge ein Intervall A D J und die Funktion f injektiv und stetig ist. Denn dann ist die Injektivität äquivalent mit der strengen Monotonie und die Umkehrfunktion automatisch stetig; vgl. Satz E[3.6]. So ergibt sich: E. Folgerung (Umkehrsatz). Sei J ein Intervall und die Funktion f W J ! R streng monoton und stetig. Dann ist f .J / ein Intervall, und die Inverse f &1 W f .J / ! J ist ebenfalls streng monoton und stetig. Ist f in a 2 J differenzierbar und f 0 .a/ ¤ 0, so ist f &1 in b ´ f .a/ differenzierbar, und es gilt (2). "
177
Abschnitt 4.2 Ableitungsregeln
F . Bemerkung. Auf die Forderung f 0 .a/ ¤ 0 kann man keineswegs verzichten. Musterbeispiel hierfür ist die Potenzfunktion f W R ! R; f .x/ D x 3 . Diese ist bijektiv, nämlich streng monoton wachsend. Hier ist f 0 .0/ D 0. Die Umkehrfunktion p f &1 W R ! R; f &1 .y/ D 3 y ist zwar stetig, aber in 0 nicht differenzierbar; denn der Differenzenquotient hat bereits einseitig keinen Grenzwert in R: p 3 h 1 D 2=3 ! 1 .h # 0/: h h G. Definition. Ist die Funktion f W A ! R in jedem a 2 A differenzierbar, so heißt f differenzierbar. Dann ist die Ableitung als Funktion definierbar: f 0 W A &! R;
x 7! f 0 .x/:
H. Beispiele. P W R n Q&1 .0/ ! R ist differenzierbar, und ihre Q Ableitung ist nach der Quotientenregel wieder eine rationale Funktion.
(i)
Jede rationale Funktion
(ii)
Allgemeine Exponentialfunktion: f .x/ D c x ; f W R ! R (c > 0 fest): Hier ist f .x/ D c x D e x(ln c , also f 0 .x/ D e x(ln c ( .1 ( ln c/ D c x ( ln c:
(iii) Natürlicher Logarithmus: Ist f D exp W R ! RC , so ist f &1 D ln W RC ! R. Da f 0 .x/ D exp x > 0 und ln stetig ist, sind alle Voraussetzungen von D (oder wegen der Monotonie auch alle Voraussetzungen von E) erfüllt. Also gilt für b D f .a/ 2 RC : .f &1 /0 .b/ D
1 f
0 .f &1 .b//
D
1 1 D ; exp.ln b/ b
somit ln0 x D (iv)
1 x
8 x 2 RC :
Allgemeine Potenzfunktion: f .x/ D x c ; f W RC ! R (c fest): Hier ist f .x/ D x c D e c(ln x , also / . 1 1 f 0 .x/ D e c(ln x ( c ( D x c ( c ( D cx c&1 : x x Die elementare Ableitungsregel für Potenzfunktionen mit natürlichen Exponenten aus B(i)[4.1] bleibt also für reelle Exponenten in Kraft.
178
Kapitel 4 Differentialrechnung
I. Bemerkung. Aus Ableitungen kann man Grenzwertaussagen gewinnen, wenn man auf ihre ursprüngliche Bedeutung als Grenzwerte von Differenzenquotienten zurückgeht. Z.B. gewinnt man aus der Ableitung ln0 .1/ D 1 die Aussage ln.1 C h/ D 1: h h!0 lim
Schreibweisen: Die Ableitung wird auch so bezeichnet: ˇ df df df ˇˇ d f 0 .a/ µ ; f0 µ .a/ µ µ f: dx dx ˇa dx dx Die Symbole df heißen Differentialquotienten (obwohl sie zunächst keine Quotiendx ten sind). Sie sollen an die Entstehung als Grenzwert aus den Differenzenquotienten erinnern, die manchmal so bezeichnet werden: f .x/ & f .a/ .f ´ : .x x&a Etwas lasch schreibt man beim Rechnen gelegentlich: .f .x//0 ´ f 0 .x/. Bei grundsätzlichen Überlegungen sollte die Schreibweise .f .x//0 vermieden werden, da sie zu mehrdeutigen Ergebnissen führen kann. Aufgaben und Anmerkungen 1. Man bestimme die Ableitungen der folgenden Funktionen f in größtmöglichen Definitionsmengen von f bzw. f 0 : p x 2 & 5x C 6 b) f .x/ D ln.x C x 2 C 1/ x 2 & 3x C 2 p p c) f .x/ D ln.x C x 2 & 1/ d) f .x/ D jxj3
a) f .x/ D
( e) f .x/ D &Œ&x/
f) f .x/ D
x2 2x & 1
für x . 1 für x > 1:
2. Wo ist die Funktion f W RC ! R mit f .x/ D x x differenzierbar? Wie lautet dort ihre Ableitung? 3. $ Man konstruiere eine bijektive Abbildung f W R ! R, die in 0 differenzierbar ist mit einer Ableitung f 0 .0/ ¤ 0, sodass jedoch f &1 W R ! R in f .0/ unstetig ist.
179
Abschnitt 4.3 Extrema und Mittelwertsatz
4.3 Extrema und Mittelwertsatz Die Differentialrechnung erlaubt die Reduktion von Extremalproblemen auf Nullstellenprobleme. Das ist von Bedeutung, weil die tatsächliche Auffindung der Extrema schwierig sein kann, während Nullstellen oftmals konstruktiv erfassbar sind. Wir hatten darauf bereits in Abschnitt 3.4 hingewiesen. Natürlich gilt dies nur unter entsprechenden Regularitätsannahmen. Dann aber beruht die Reduktion auf einem sehr einfachen anschaulichen Argument:
xm
a
b
Sitzt man z.B. an einer inneren Minimalstelle einer differenzierbaren Funktion, so geht es nach allen Seiten aufwärts, die Ableitung muss null sein. Man erhält das bekannteste Kriterium für Extrema: Das Verschwinden der Ableitung ist eine notwendige Bedingung für eine Extremalstelle. Präzise: A. Satz (notwendiges Kriterium für innere Extrema). Gegeben sei eine Funktion f W Œa; b/ ! R. Ist x0 Extremalstelle von f und x0 2 /a; bŒ sowie f in x0 differenzierbar, so gilt f 0 .x0 / D 0. Beweis. Sei z.B. x0 D xm Minimalstelle und m D f .xm /, also f .x/ % f .xm / für alle x 2 Œa; b/. Daraus folgt für den Differenzenquotienten bei xm : ( für x 2 Œa; b/ mit x > xm f .x/ & f .xm / % 0 x & xm
.0
für x 2 Œa; b/ mit x < xm ;
da der Zähler stets % 0 ist. Führt man hier den Grenzübergang x ! xm durch, so folgt für die rechtsseitige Ableitung fC0 .xm / % 0, für die linksseitige Ableitung f&0 .xm / . 0. Da beide mit der Ableitung f 0 .xm / übereinstimmen, muss diese null sein. Analog schließt man bei einem Maximum.
"
Warnung: Bei dieser Schlussweise ist es wichtig, dass man von beiden Seiten an x0 herankommt. Tatsächlich ist die Behauptung falsch für Randextrema! Am Rande
180
Kapitel 4 Differentialrechnung
eines Intervalls können Extrema existieren, ohne dass die Ableitung null ist. Vgl. das folgende erste Bild. Mit hinreichenden Bedingungen für Extrema beschäftigen wir uns später in Abschnitt 8.4. Im Augenblick ziehen wir aus dem notwendigen Kriterium einige Folgerungen über die Ableitung selbst. Die erste bezieht sich auf den Fall, dass die Funktion am Rande Nullstellen besitzt. Vgl. das folgende zweite Bild.:
a = xm
b = xM
a
c
b
B. Satz (von Rolle). Die Funktion f W Œa; b/ ! R sei stetig und im offenen Intervall /a; bŒ differenzierbar. Gilt f .a/ D f .b/ D 0, so existiert ein c 2 /a; bŒ mit f 0 .c/ D 0. Kurz: Zwischen zwei Nullstellen von f liegt eine Nullstelle von f 0 . Beweis. Die Extremalstellen von f , die nach A[3.4] existieren, können nicht nur an den Intervallenden liegen. Sonst wäre das Maximum gleich dem Minimum gleich 0, also f .x/ D 0 auf ganz Œa; b/, also wären doch Extremalstellen in /a; bŒ vorhanden. Somit existiert eine Extremalstelle c 2 /a; bŒ. An dieser gilt nach Satz A: f 0 .c/ D 0. " In dieser Situation kann es natürlich mehrere Extremalstellen von f , also auch mehrere Nullstellen von f 0 geben. Der Satz von Rolle bleibt auch richtig, wenn anstelle von f .a/ D f .b/ D 0 nur vorausgesetzt wird: f .a/ D f .b/. Denn man kann die obige Fassung sofort auf die Hilfsfunktion mit g.x/ ´ f .x/ & f .a/ anwenden. Indem man die Hilfsfunktion ein wenig allgemeiner wählt, erhält man den fundamentalen Mittelwertsatz C . Folgerung (Mittelwertsatz). Die Funktion f W Œa; b/ ! R sei stetig und im offenen Intervall /a; bŒ differenzierbar. Dann existiert ein c 2 /a; bŒ mit f .b/ & f .a/ D f 0 .c/: b&a Anschaulich besagt dies: Irgendwo im Intervall /a; bŒ stellt sich die Tangente parallel zur Sehne:
181
Abschnitt 4.3 Extrema und Mittelwertsatz
g(x)
a
x
c
b
Natürlich kann auch dies an mehreren Stellen geschehen (vgl. das obige Bild), ja sogar unendlich oft oder auf einem ganzen Teilintervall. Für f .a/ D f .b/ kommt man wieder auf den Satz von Rolle zurück. Beweis von C. Wir betrachten die Hilfsfunktion g W Œa; b/ ! R, g.x/ ´ f .x/ &
f .b/ & f .a/ ( .x & a/ & f .a/; b&a
anschaulich „f minus Sehne“. Dann gilt g.a/ D g.b/ D 0, also sind die Voraussetzungen von Satz B für g (anstelle von f ) erfüllt. Somit gibt es ein c 2 /a; bŒ mit g 0 .c/ D 0. Dies bedeutet: g 0 .c/ D f 0 .c/ & woraus die Behauptung folgt.
f .b/ & f .a/ ( 1 D 0; b&a "
Der Mittelwertsatz beleuchtet die Rolle der Ableitung von einer neuen Seite: Zunächst entstand die Ableitung als Grenzwert der Differenzenquotienten. Aus Information über die Differenzenquotienten folgt also Information über die Ableitung. Beim Mittelwertsatz ist es umgekehrt: Aus Information über die Ableitung kann man Information über Differenzenquotienten bekommen. Tatsächlich entpuppt sich der Mittelwertsatz als ein grundlegendes Hilfsmittel, um aus der Ableitung auf die Funktion zurückzuschließen. Das wird z.B. in den folgenden Sätzen D und E deutlich. D. Satz. Sei J ein Intervall. (i)
Ist f W J ! R differenzierbar und f 0 .x/ D 0 für alle x 2 J , so ist f konstant (Konstanzkriterium).
(ii) Sind f; g W J ! R differenzierbar und f 0 .x/ D g 0 .x/ für alle x 2 J , so gibt es eine Konstante c 2 R mit: f .x/ D g.x/ C c für alle x 2 J . Ist außerdem f .a/ D g.a/ für ein a 2 J , so folgt f D g.
182
Kapitel 4 Differentialrechnung
Beweis. Zu (i): Zu zeigen ist der Schluss: ˛; ˇ 2 J; ˛ < ˇ H) f .˛/ D f .ˇ/. Da die Einschränkung f jŒ˛; ˇ/ die Voraussetzungen des Mittelwertsatzes erfüllt, gibt es ein 0 mit ˛ < 0 < ˇ und f .ˇ/ & f .˛/ D f 0 .0/ D 0: ˇ&˛ Somit folgt für solche ˛; ˇ: f .˛/ D f .ˇ/. Zu (ii): Aus f 0 .x/ D g 0 .x/ folgt .f & g/0 .x/ D 0, also ist f & g nach (i) konstant. Zusammen mit f .a/ D g.a/ folgt, dass die Konstante null ist, also f D g. " E. Satz (Monotoniekriterium). Sei J ein Intervall und f W J ! R differenzierbar. Dann gelten die Schlüsse: (i)
Für alle x 2 J ist f 0 .x/ % 0 () f ist monoton wachsend.
(ii) Für alle x 2 J ist f 0 .x/ > 0 H) f ist streng monoton wachsend. Beweis. Zu (i), Richtung H) : Zu zeigen ist der Schluss: ˛; ˇ 2 I; ˛ < ˇ H) f .˛/ . f .ˇ/. Wie oben gibt es nach dem Mittelwertsatz ein 0 mit ˛ < 0 < ˇ und (1)
f .ˇ/ & f .˛/ D f 0 .0/ % 0: ˇ&˛
Hieraus folgt f .ˇ/ % f .˛/. Zu (i), Richtung (H : Für x 2 J; h ¤ 0; x C h 2 J gilt stets f .x C h/ & f .x/ % 0: h Durch Grenzübergang h ! 0 folgt daraus f 0 .x/ % 0. Zu (ii): Zu zeigen ist der Schluss: ˛; ˇ 2 I; ˛ < ˇ H) f .˛/ < f .ˇ/. Das geht exakt wie beim obigen ersten Teil von (i), nur dass jetzt in (1) statt: f 0 .0/ % 0 steht: f 0 .0 / > 0. " Der Schluss in E(ii) lässt sich nicht umkehren. Das sieht man wieder an der Funktion f .x/ D x 3 mit J D R. Diese ist streng monoton wachsend, aber f 0 .x/ D 3x 2 , also f 0 .0/ D 0! Jedoch gilt folgender
Abschnitt 4.3 Extrema und Mittelwertsatz
183
E. Zusatz. Die Funktion f W J ! R ist dann und nur dann streng monoton wachsend, wenn für alle x 2 J gilt: f 0 .x/ % 0 und es kein Teilintervall Œ˛; ˇ/ , J mit ˛ < ˇ gibt, auf dem f 0 identisch null ist. Beweis. „Dann“: Nach E(i) ist f jedenfalls monoton wachsend. Angenommen, es wäre einmal f .˛/ D f .ˇ/ für ˛ < ˇ aus J . Dann gälte für x 2 Œ˛; ˇ/: f .˛/ . f .x/ . f .ˇ/. Somit wäre f auf Œ˛; ˇ/ konstant, also dort f 0 gleich null, im Widerspruch zur Voraussetzung. „Nur dann“: Nach E(i) folgt aus der Voraussetzung: f 0 .x/ % 0 für alle x 2 J . Wäre f 0 auf Œ˛; ˇ/ , J null, so gälte nach D(i): f .˛/ D f .ˇ/, im Widerspruch zur vorausgesetzten strengen Monotonie. " F. Bemerkung. Entsprechende Aussagen gelten für monoton fallende Funktionen f , wobei natürlich die Bedingung f 0 .x/ % 0 bzw. f 0 .x/ > 0 durch f 0 .x/ . 0 bzw. f 0 .x/ < 0 zu ersetzen ist. Man sieht dies analog wie oben oder (leichter) durch die Betrachtung von &f . G. Satz (Umformulierung des Mittelwertsatzes). Sei a 2 R; h ¤ 0, Ist die Funktion f auf dem abgeschlossenen Intervall mit Endpunkten a; a C h stetig und auf dem offenen Intervall mit Endpunkten a; a C h differenzierbar, so gibt es ein 2 mit 0 < 2 < 1, sodass f .a C h/ & f .a/ D f 0 .a C 2 ( h/: h
(2) Beweis.
Die Zurückführung auf die Fassung in C erfolgt nach der Fallunterscheidung h > 0, h < 0. Die Zwischenstelle c ist in beiden Fällen von der Form c D a C 2 ( h mit 0 < 2 < 1. " H. Folgerung. Gegeben sei ein Intervall J , eine Funktion f W J ! R und eine Stelle a 2 J mit folgenden Eigenschaften: (i)
f ist in a stetig;
(ii)
f ist differenzierbar in allen x 2 J n fag;
(iii) limx!a f 0 .x/ D * existiert in R. Dann ist f in a differenzierbar und f 0 .a/ D *.
184
Kapitel 4 Differentialrechnung
Beweis. Für a C h 2 J ist Satz G anwendbar. Dann folgt die Behauptung aus (2), wenn gezeigt werden kann, dass limh!0 f 0 .a C 2 ( h/ D * gilt. Dies folgt aber mit dem Substitutionsprinzip aus (iii) , da a C 2 ( h (wegen 0 < 2 < 1) für h ! 0 gegen a strebt. " I. Beispiele. p (i) Sei f W RC 0 ! R die Potenzfunktion f .x/ D x für festes reelles p > 1. 0 p&1 Dann gilt f .x/ D px für x > 0 laut H(iv)[4.2]. Nach H existiert auch f 0 .0/ D p&1 p&1 limx#0 px Dp(0 D 0; denn x 7! px p&1 ist stetig in 0. Es gilt also f 0 .x/ D C p&1 px in ganz R0 . (Für p D n 2 N0 ist natürlich x 7! x p in ganz R differenzierbar.)
(ii)
Welche Funktionen f W R ! R erfüllen f 0 D f ?
Lösung: Jedenfalls tut es f .x/ D e x . Allgemein schließt man der Reihe nach so: f0 Df .e &x f .x//0 D e &x ( .&1/ ( f .x/ C e &x ( f 0 .x/ D &e &x ( f .x/ C e &x ( f .x/ D 0 e &x f .x/ D c 2 R f .x/ D ce x : Antwort: Es sind genau die konstanten Vielfachen von exp. Damit haben wir eine Differentialgleichung gelöst, nämlich die Frage nach allen differenzierbaren Funktionen f mit f 0 D f beantwortet. (iii) Wenn k eine reelle Konstante ist, welche Funktionen f W R ! R erfüllen f 0 .x/ D k ( f .x/? Lösung: Das ist wiederum eine Differentialgleichung, die sich nur leicht von der vorhergehenden unterscheidet. Eine Lösung ist hier f .x/ D e kx ; denn dafür gilt f 0 .x/ D e kx ( k D k ( f .x/. Der allgemeine Schluss geht genauso wie in (ii), indem man e &kx f .x/ ableitet und sieht, dass dies konstant sein muss. Antwort: Es sind genau die konstanten Vielfachen der Funktion x 7! e kx . (Setzt man a ´ e k , so gilt natürlich auch die Darstellung e kx D ax .) Betrachtet man f als die zeitliche Entwicklung eines Vorganges (Bakterienkultur, Verzinsung eines Kapitals, radioaktiver Zerfall), so bedeutet die Forderung f 0 .x/ D k ( f .x/, dass in jedem Augenblick die Vermehrungsrate oder Vermehrungsgeschwindigkeit f 0 .x/ fest proportional zum gerade vorhandenen Bestand f .x/ ist. (Dabei ist beim radioaktiven Zerfall k < 0.) Das ist ein Wachstumsgesetz, das sehr häufig in den Anwendungen vorkommt, das so genannte exponentielle Wachstum. Daraus erklärt sich die große Bedeutung der e-Funktion innerhalb und außerhalb der Mathematik.
185
Abschnitt 4.3 Extrema und Mittelwertsatz
Eine Koppelung einer gesuchten Funktion f mit ihrer Ableitung f 0 und dem Argument x nennt man eine Differentialgleichung (erster Ordnung). Hierbei ist also die „Unbekannte“ nicht eine Zahl, sondern eine ganze Funktion. Wir haben oben die Differentialgleichung f 0 .x/ D kf .x/ gelöst und gesehen, dass die Lösung nicht eindeutig ist, die Lösungsgesamtheit vielmehr aus allen Funktionen der Gestalt f .x/ D c ( e kx mit festem c 2 R besteht. Im nächsten Abschnitt werden wir ein Differentialgleichungssystem mit elementaren Methoden behandeln. Im Allgemeinen erfordert die Lösung von Differentialgleichungen eine eigene Theorie. Das wird in Analysis 3 diskutiert. Der Mittelwertsatz hat eine Reihe weiterer wichtiger Anwendungen, von denen einige gleich hier behandelt werden. – Zunächst gilt die folgende „differenzierbare“ Formulierung der Umkehrsätze aus Abschnitt 4.2: J. Folgerung (zur Umkehrfunktion). Sei J ein Intervall und die differenzierbare Funktion f W J ! R erfülle f 0 .x/ ¤ 0 für alle x 2 J . Dann ist f injektiv, also streng monoton. Nach Folgerung E[4.2] ist f .J / ein Intervall, und die Umkehrfunktion f &1 W f .J / ! J ist streng monoton und differenzierbar mit der Ableitung .f &1 /0 .y/ D
1 f
0 .f &1 .y//
8 y 2 f .J /:
Beweis. f ist injektiv. Denn angenommen, es wäre f .˛/ D f .ˇ/ für ˛ < ˇ aus J , so folgte mit dem Mittelwertsatz die Existenz eines 0 2 /˛; ˇŒ mit f 0 .0/ D 0, im Widerspruch zur Voraussetzung. Nach E[3.6] ist f streng monoton, so dass alle Konsequenzen des Umkehrsatzes E[4.2] zutreffen. " K. Satz (Relation zur Lipschitz-Eigenschaft). Sei J ein Intervall und die Funktion f W J ! R differenzierbar. Dann sind äquivalent: (i)
f ist dehnungsbeschränkt;
(ii) f 0 ist beschränkt. Beweis. (i) H) (ii): Sei * eine Lipschitz-Konstante für f , somit jf .x1 / & f .x2 /j . *jx1 & x2 j für alle x1 ; x2 2 J . Dies ist äquivalent mit ˇ ˇ ˇ f .x1 / & f .x2 / ˇ ˇ ˇ . * 8 x1 ¤ x2 in J : ˇ ˇ x1 & x2 Der Grenzübergang x2 ! x1 liefert hieraus: jf 0 .x1 /j . * für alle x1 2 J .
186
Kapitel 4 Differentialrechnung
(ii) H) (i): Sei jf 0 .x/j . * in J . Zu x1 ¤ x2 in J gibt es nach dem Mittelwertsatz ein c zwischen x1 ; x2 mit f .x1 / & f .x2 / D f 0 .c/: x1 & x2 Hieraus folgt
ˇ ˇ ˇ f .x1 / & f .x2 / ˇ ˇ D jf 0 .c/j . *; ˇ ˇ ˇ x1 & x2
also: jf .x1 / & f .x2 /j . *jx1 & x2 j für alle x1 ; x2 2 J .
"
L. Bemerkung. Man beachte die enge Verwandtschaft zwischen dem Differenzenquotienten und der (durch jx1 &x2 j dividierten) Lipschitz-Bedingung. Wie der Beweis zeigt, folgt aus einer Lipschitz-Konstanten * für f die Beschränkung jf 0 j . * und umgekehrt! M . Satz (Zwischenwertsatz von Darboux). Die Funktion f W Œa; b/ ! R sei differenzierbar und f 0 .a/ ¤ f 0 .b/. Dann existiert zu jedem w zwischen f 0 .a/ und f 0 .b/ ein c 2 /a; bŒ mit f 0 .c/ D w. Beweis. Ist f 0 stetig, so ist dieser Satz klar nach dem Zwischenwertsatz, angewendet auf f 0 . Ohne die Stetigkeit von f 0 kann man mit folgendem Trick argumentieren: Anstelle von f betrachtet man die Hilfsfunktion g W Œa; b/ ! R mit g.x/ ´ f .x/ & wx und zeigt, dass g ein Extremum in einem Punkt c 2 /a; bŒ annimmt. Dann folgt g 0 .c/ D 0, also f 0 .c/ D w. Nach der Voraussetzung über w sind g 0 .a/ und g 0 .b/ von null verschieden und besitzen unterschiedliche Vorzeichen. Sei etwa g 0 .a/ < 0, g 0 .b/ > 0. Jedenfalls hat g in Œa; b/ eine Minimalstelle c. Dabei gilt c > a; denn aus g.x/ % g.a/ für a . x . b würde folgen: .g.x/ & g.a//=.x & a/ % 0 für a < x . b, also g 0 .a/ % 0 per Grenzübergang x # a. Analog folgt c < b. Genauso zeigt man im Falle g 0 .a/ > 0, g 0 .b/ < 0, dass in /a; bŒ eine Maximalstelle c von g liegt. " N. Bemerkungen. (i) Für einen mehr geometrischen Beweis dieses Satzes vgl. J[9.2].
187
Abschnitt 4.3 Extrema und Mittelwertsatz
(ii) Es gibt differenzierbare Funktionen mit unstetiger Ableitung; vgl. das spätere Beispiel V[4.4]. Somit zeigt Satz M, dass die Zwischenwerteigenschaft nicht zur Kennzeichnung der Stetigkeit dienen kann. Aufgaben und Anmerkungen 1. Man bestimme die folgenden Grenzwerte (durch Anwendung von Ableitungen oder des Mittelwertsatzes): (p p ) a) lim q x C a & q x für feste a > 0 und q 2 N n f1g. x!1
x ˛ & a˛ für feste a > 0 und ˇ ¤ 0. x!a x ˇ & aˇ ln.n C 1/ c) lim . n!1 ln n 3 -x für feste a > 0 und b > 1. d) lim a C b 1=x b)
lim
x#0
2. Sei f W R ! R differenzierbar und existiere der Grenzwert a ´ limx!1 f 0 .x/ in R oder uneigentlich. Man beweise oder widerlege: a)
lim .f .x C 1/ & f .x// D a.
x!1
b) Ist f beschränkt, so ist a D 0. c) Ist a D 0 und f beschränkt, so existiert lim f .x/ in R. x!1
3. Die Funktion f W Œ&˛; ˛/ ! R (mit ˛ > 0) sei differenzierbar. Man zeige: a) Ist f gerade, so ist f 0 ungerade. b) Ist f ungerade, so ist f 0 gerade. Gilt hiervon jeweils die Umkehrung? 4. Auf dem Konstanzkriterium beruhen einige einfache Methoden zur Lösung von Differentialgleichungen, wie oben in I(ii), (iii) bereits deutlich wurde. In diesem Sinne zeige man weiter: a)
Sind f; g W J ! R differenzierbare Funktionen auf dem Intervall J , ist g dort nullstellenfrei und gilt dort stets g.x/f 0 .x/ D g 0 .x/f .x/; so ist f konstant proportional zu f , d.h. es gibt eine Konstante c 2 R derart, dass für alle x 2 J gilt f .x/ D cg.x/:
188 b)
Kapitel 4 Differentialrechnung
Mittels a) löse man auf J ´ RC die Differentialgleichung xf 0 .x/ D pf .x/;
(p fest in R);
d.h. man gebe alle differenzierbaren Funktionen f W RC ! R an, die diese Gleichung erfüllen. c)
Ebenso für die Differentialgleichung x ( ln x ( f 0 .x/ D f .x/ auf J ´ /0; 1Œ bzw. J ´ /1; 1Œ.
5. Man zeige: Die differenzierbare Funktion f W J ! R (J ein Intervall) hat dann und nur dann eine konstante Ableitung f 0 .x/ D c, wenn sie von der Gestalt f .x/ D cx C a mit konstantem a ist. 6. Man beweise folgende Variante des Konstanzkriteriums: Für die differenzierbare Funktion f W J ! R, definiert auf dem Intervall J , gelte stets: f .x/ ¤ 0 H) f 0 .x/ D 0: Dann ist f konstant. 7. Im Mittelwertsatz: f .x C h/ & f .x/ D hf 0 .a C 2h/; h ¤ 0; 0 < 2 < 1, ermittle man die möglichen Größen 2 (in Abhängigkeit von x und h) für folgende Funktionen: a) f .x/ D x 2 ,
b) f .x/ D x 3 ,
c) f .x/ D ln x,
d) f .x/ D e x .
Ist 2 immer eindeutig bestimmt? – An den Beispielen b) – d) sieht man, dass 2 i. Allg. nicht gleich 1=2 ist: Die Zwischenstelle liegt zwar zwischen den beiden Argumenten von f aber i. Allg. nicht in deren Mitte (insofern ist der Name „Mittelwertsatz“ nicht ganz zutreffend). Mit etwas weitergehenden Werkzeugen kann man aber zeigen, dass 2 unter gewissen Voraussetzungen gegen 1=2 strebt, wenn h gegen 0 geht, und man kann auch die Funktionen f bestimmen, für die 2 konstant gleich 1=2 gewählt werden kann. Vgl. die Aufgaben 10 und 11 in Abschnitt 8.3. 8. $ Man beweise für feste positive a; b: 0p !n p n n p aC b lim D ab: n!1 2 9. Man zeige: a) Die Potenzfunktion f .x/ D x a mit Exponent a > 0, definiert auf RC , ist für a > 0 streng monoton wachsend, für a < 0 streng monoton fallend (und für a D 0 konstant).
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
189
b) Die Exponentialfunktion g.x/ D c x zur Basis c > 0, definiert auf R, ist für c > 1 streng monoton wachsend, für c < 1 streng monoton fallend (und für c D 1 konstant). c) Ist die Potenzfunktion f .x/ D x a mit Exponent a 2 /0; 1Œ Lipschitz-stetig auf /0; 1/ bzw. auf Œ1; 1Œ? 10. Man zeige, dass die Funktion f W R ! R mit f .x/ ´ x C e x umkehrbar ist und berechne die Ableitung .f &1 /0 der Umkehrfunktion in y D 1 sowie den Grenzwert von .f &1 /0 .y/ für y ! 1. 3 2x 11. Man zeige, dass die Gleichung .2 C x 2 / exp D 1 genau eine Lösung in R 3 hat. Lösungshinweis: Man zerlege R in möglichst große Intervalle, auf denen die linke Seite der Gleichung eine monotone Funktion darstellt.
4.4 Trigonometrische Funktionen und der Einheitskreis Zu den trigonometrischen Funktionen gehören die Funktionen Sinus, Kosinus, Tangens und Kotangens sowie im weiteren Sinne auch ihre Umkehrfunktionen. Oftmals werden Sinus und Kosinus auf anschauliche Eigenschaften „am Einheitskreis“ gegründet. Ein solches Vorgehen kommt im Rahmen der Analysis nicht in Frage, da es mit unpräzisen Begriffen behaftet ist. Hier werden wir diese Funktionen auf reelle Weise einführen, indem wir sie durch analytische Grundeigenschaften kennzeichnen, nämlich durch die Ableitungsregeln von Sinus und Kosinus und deren Werte bei 0; vgl. Satz E. Für den Existenzbeweis stützen wir uns dabei auf den Arkustangens, der bereits in Abschnitt 2.5 konstruiert worden war. Der Arkustangens hat den Vorteil, dass er streng monoton wachsend ist, sodass man seine Umkehrfunktion, den Tangens, gleich mitgeliefert bekommt. Aus dem Tangens lassen sich dann die übrigen trigonometrischen Funktionen konstruieren (mittels der zahlreichen Relationen zwischen diesen). Stehen diese Funktionen erst einmal zur Verfügung, so ist es auf präzise Weise möglich, ihre Beziehung zum Einheitskreis zu klären. Das kann dann entweder rein reell oder äquivalent mit komplexen Zahlen ausgedrückt werden. Beides werden wir ausführlich beleuchten. In Abschnitt 2.5 hatten wir den Arkustangens als Funktion von R in R charakterisiert durch die beiden Eigenschaften einer Funktionalgleichung (F) und zweier Schranken-
190
Kapitel 4 Differentialrechnung
funktionen (U): (F)
arctan
(U)
p
a
aCb D arctan a C arctan b für a; b 2 R mit ab < 1 (Additionstheorem) 1 & ab
1 C a2
. arctan a . a für a % 0:
Weiterhin hatten wir & definiert durch & ´ 4 ( arctan 1: Nur diese Eigenschaften werden wir jetzt verwenden; die Details des Existenzbeweises aus Abschnitt 2.5 werden nicht benötigt. Leichte Konsequenzen aus (F) waren: ' arctan 0 D 0 ' arctan.&x/ D & arctan x für x 2 R (arctan ist eine ungerade Funktion) 2x ' arctan D 2 arctan x für x 2 < 1 (Verdopplungsformel des Arku1 & x2 stangens). Diese ergeben sich in der Tat aus (F) mittels der Substitutionen a D b D 0 bzw. a D x; b D &x; bzw. a D b D x. Nunmehr starten wir mit der Differenzierbarkeit des Arkustangens und ziehen daraus sofort weitere Schlüsse: A. Satz. Der Arkustangens hat folgende Eigenschaften: (i)
p
1
.
arctan x . 1 für x ¤ 0; x
1 C x2 arctan x (ii) lim D 1; x!0 x (iii) arctan ist differenzierbar (also stetig), und es gilt für alle x 2 R arctan0 x D
(1) (iv) (v) (vi)
1 I 1 C x2
arctan ist streng monoton wachsend; lim arctan x D &=2;
x!1
arctan.R/ D /&&=2; &=2Œ.
lim arctan x D &&=2;
x!&1
191
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
Beweis. Zu (i): Für x > 0 folgt dies aus (U) durch Division mit x. Dann ist es auch richtig für x < 0, da die Glieder der Ungleichung beim Übergang von x zu &x unverändert bleiben Zu (ii): Dies ergibt sich durch Einschnürung aus (i). Zu (iii): Man bildet zunächst den Differenzenquotienten für h ¤ 0 und formt mit der Funktionalgleichung (F) um: 1 arctan.x C h/ & arctan x D .arctan.x C h/ C arctan.&x// h h 1 h D arctan : h 1 C x.x C h/ Dazu ist wegen der eingeschränkten Gültigkeit von (F) erforderlich: &x.x C h/ < 1. Bei gegebenem x ist dies nach dem Meidungsprinzip für alle genügend kleinen jhj erfüllt, sodass diese Einschränkung beim jetzt zu erfolgenden Grenzübergang h ! 0 nicht stört. Für diese Limesbildung bezeichnen wir das letzte Argument von arctan mit k und können damit den Differenzenquotienten in die Form bringen: 1 arctan k arctan.x C h/ & arctan x D ( : h 1 C x.x C h/ k Da k mit h gegen null strebt, folgt hieraus mit dem Substitutionsprinzip und (ii) als Grenzwert 1 ( 1: 1 C x2 Zu (iv): Dies folgt unmittelbar aus (iii) mittels des Monotoniekriteriums E(ii)[4.3]. Zu (v): Man führt in der obigen Verdopplungsformel den Grenzübergang x " 1durch: 2x Dafür gilt y ´ 1&x 2 ! 1, also nach dem Substitutionsprinzip lim arctan y D lim 2 arctan x D 2 ( arctan 1 D 2 (
y!1
x"1
& & D : 4 2
Der zweite Grenzwert in (v) folgt hieraus, da arctan ungerade ist. Zu (vi): Die Berechnung der Bildmenge erfolgt nach der Vorschrift in Satz E[3.6] mittels der vorhergehenden Eigenschaften (iii) – (v). " Aufgrund dieser Informationen sieht der Graph des Arkustangens samt Schrankenfunktionen so aus:
192
Kapitel 4 Differentialrechnung
2
x
arctan x
1 -6
-5
-4
-3
-2
-1
x / √ 1+x2 1
0
2
3
4
5
6
x
-1 -2
Übrigens folgt allein aus der Ableitung (1) und dem „Anfangswert“ arctan 0 D 0, dass der Arkustangens durch die Grundeigenschaften (F) und (U) eindeutig bestimmt ist; vgl. D(ii)[4.3]. B . Definition (des Tangens). Die Tangensfunktion tan ist auf dem Intervall /&&=2; &=2Œ die (nach E[3.6] existierende) Umkehrfunktion von arctan: R ! /&&=2; &=2Œ. Es gilt also tan.arctan x/ D x
für alle x 2 R:
Ansonsten wird die Tangensfunktion tan durch &-periodische Fortsetzung festgelegt: tan W T &! R;
wobei
T ´ R n P;
P ´
& C Z&; 2
d.h. derart, dass tan.x C k&/ D tan x für alle x 2 T und k 2 Z gilt. Ausnahmepunkte, an denen die Funktion nicht sinnvoll definiert werden kann, sind also die beiden Stellen ˙&=2 sowie alle Stellen, die durch Addition ganzzahliger Vielfacher von & daraus entstehen. Diese bilden die Menge P .
3 2 1 -5 -4 -3 -2 -1
π
π
2
3
2 0 1 -1 -2 -3
4
5
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
193
Die &-periodische Fortsetzung geschieht durch die Festsetzung i & &h ; k 2 N: tan.x C k&/ ´ tan x für x 2 & ; 2 2 Die Ausnahmemenge P ist spiegelsymmetrisch bzgl. 0, d.h. es gilt: p 2 P () &p 2 P . An den Stellen p 2 P ist der linksseitige Grenzwert von arctan gleich 1, der rechtsseitige &1. Natürlich ist auch die Definitionsmenge T des Tangens spiegelsymmetrisch bzgl. 0. Hinweis zur Symbolik: Wie bereits in Abschnitt 2.4 vermerkt, werden bei den klassischen Funktionen exp; tan etc. die Argumentklammern oft weggelassen. Z.B. schreibt man tan.x/ µ tan x. Bei „größeren“ Argumenten geht dies natürlich nicht immer, 3 z.B. muss man bei tan.˛ Cˇ/ die Klammern gebrauchen. Aber z.B. geht auch tan ˇ˛ µ tan ˇ˛ . Generell werden Potenzen direkt an das Funktionssymbol angehängt (außer bei &1, um Verwechslungen mit der Umkehrfunktion zu vermeiden). Z.B. bezeichnet f 2 die Funktion x 7! .f .x//2 µ f .x/2 . Kombination ist auch erlaubt: .tan.x//2 µ tan2 x, etc. Durch Übertragung vom Arkustangens auf den Tangens ergibt sich nun C. Satz. Der Tangens tan W R n P ! R hat folgende Eigenschaften: (i)
Die Einschränkung auf /&&=2; &=2Œ ist stetig, streng monoton wachsend und erfüllt: lim tan x D 1; lim tan x D &1: x"0=2
(ii)
tan .&=4/ D 1;
x#&0=2
tan.&&=4/ D &1.
(iii) Insgesamt ist die Funktion tan W R n P ! R ungerade sowie differenzierbar mit der Ableitung tan0 x D 1 C tan2 x: (iv)
An den Stellen p 2 P ist der linksseitige Grenzwert von tan gleich 1, der rechtsseitige gleich &1.
Beweis. Zu (i): Dies ergibt sich wiederum aus E[3.6]. Zu (ii): Dies ist klar aus den Werten von arctan bei ˙1. Zu (iii): Bei beidem genügt der Nachweis für x 2 /&&=2; &=2Œ (wegen der &-Periodizität). Die Eigenschaft tan.&x/ D & tan x ergibt sich aus arctan.&y/ D & arctan y
194
Kapitel 4 Differentialrechnung
durch Anwendung von tan und Substitution y D tan x. Die Ableitung folgt aus dem Umkehrsatz J[4.3] mittels (1): tan0 x D
1 arctan0 .tan
x/
D
1 D 1 C tan2 x: 1 1 C tan2 x
Zu (iv): Dies folgt aus den Grenzwerten in (i) aufgrund der &-Periodizität.
"
Das folgende Lemma wird den entscheidenden Schritt zur Eindeutigkeit von Kosinus und Sinus liefern: D. Lemma. Gilt für zwei differenzierbare Funktionen F; G W R ! R: F 0 D &G G 0 D F; so folgt
F 2 C G 2 D const.
Gibt es außerdem eine Stelle a 2 R mit F .a/ D G.a/ D 0, so folgt F D G D 0. Beweis. Betrachte die Hilfsfunktion H ´ F 2 C G 2 . Ihre Ableitung errechnet man als H 0 D 2FF 0 C 2GG 0 D 2F .&G/ C 2GF D 0: Somit ist H D const. Aus F .a/ D G.a/ D 0 folgt, dass die Konstante gleich 0 sein muss, also verschwinden F; G identisch. " E. Satz und Definition. Es gibt genau ein Paar von Funktionen f; g W R ! R mit: (2)
f 0 D &g g0 D f
und
f .0/ D 1 g.0/ D 0:
Diese Funktionen heißen Kosinus und Sinus: cos ´ f W R &! R;
sin ´ g W R &! R:
Beweis. e; e Eindeutigkeit: Gilt (2) für ein weiteres Funktionenpaar f g W R ! R, e0 D &e f g 0 e e g D f
und
e.0/ D 1 f e g .0/ D 0;
195
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
e; G ´ g & e so erfüllen die Differenzen F ´ f & f g die Voraussetzungen von Lemma D; denn e0 D &g C e F0 D f 0 & f g D &G 0 0 0 e D F G D g &e g D f &f
e.0/ D 0 F .0/ D f .0/ & f G.0/ D g.0/ & e g .0/ D 0:
und
e; g D e Somit folgt: F D 0, G D 0, also f D f g. Existenz: Mit N ´ 2P D & C Z2& definieren wir zwei Funktionen f; g W R ! R durch (3)
x 2; f .x/ ´ x 1 C tan2 2 1 & tan2
x 2 g.x/ ´ x 1 C tan2 2 2 tan
für x … N
sowie f .x/ ´ &1;
g.x/ ´ 0
für x 2 N
und zeigen: f; g leisten das Verlangte. Klar ist sofort f .0/ D 1; g.0/ D 0. Stetigkeit von f; g in a: In a ˇ… N ˇist die Stetigkeit klar, da die Nenner ¤ 0 sind. Für a 2 N setzt man t ´ ˇtan x2 ˇ. Damit wird mittels C(i) nach dem Substitutionsprinzip 1 & t2 D &1 D f .a/; t !1 1 C t 2
lim f .x/ D lim
x!a
2t D 0 D g.a/: t!1 1 C t 2
lim jg.x/j D lim
x!a
Die jetzige Ausnahmemenge ist also harmlos: Grenzwert und Funktionswert stimmen auf ihr überein. Ableitungen: x Fall 1: x … N : Nach den Differentiationsregeln hat man für f mit q ´ tan2 : 2 - 1 x 3 .1 C q/ ( .&1/ & .1 & q/ ( 1 2 x ( 2 tan ( 1 C tan ( .1 C q/2 2 2 2 x 2 tan &2 x 2 D &g.x/ D ( tan ( .1 C q/ D & 2 x .1 C q/2 2 1 C tan 2
f 0 .x/ D
196
Kapitel 4 Differentialrechnung
und für g mit w ´ tan
x : 2
- 1 .1 C w 2 / ( 2 & 2w ( 2w 3 2 x ( ( 1 C tan .1 C w 2 /2 2 2 x 1 & tan2 1 & w2 2 D f .x/: 2 D ( .1 C w / D 2 x .1 C w 2 /2 1 C tan 2
g 0 .x/ D
Fall 2: a 2 N : Hier ergibt sich aus Fall 1 und der Stetigkeit von f; g: lim f 0 .x/ D & lim g.x/ D &g.a/;
x!a
x!a
lim g 0 .x/ D lim f .x/ D f .a/;
x!a
x!a
also durch Anwendung von H[4.3]: f 0 .a/ D &g.a/ und g 0 .a/ D f .a/ einschließlich der Existenz der Ableitungen. " Der Existenzbeweis durch die Formeln (3) mag im Augenblick etwas eigenartig erscheinen. In Wirklichkeit hängen diese Gleichungen direkt mit der Parametrisierung des Einheitskreises zusammen, und sie liefern später ein nützliches Werkzeug zur Auswertung von Integralen. Vgl. Lemma N und Abschnitt 8.7. Vorerst machen wir aber von den Details des obigen Existenzbeweises keinen Gebrauch. Wir nennen den Kosinus öfters an erster Stelle vor dem Sinus, weil diese Funktionen später in dieser Reihenfolge bei der Parametrisierung des Einheitskreises auftreten. F. Satz. Für Kosinus und Sinus gilt: (i)
cos0 D & sin; sin0 D cos;
(ii)
cos 0 D 1; sin 0 D 0;
(iii) cos2 ˛ C sin2 ˛ D 1 für alle ˛ 2 R (iv)
(trigonometrischer „Pythagoras“);
Additionstheoreme: cos.˛ C ˇ/ D cos ˛ cos ˇ & sin ˛ sin ˇ sin.˛ C ˇ/ D sin ˛ cos ˇ C cos ˛ sin ˇ
(v)
für alle ˛; ˇ 2 RI
cos ist eine gerade, sin eine ungerade Funktion.
Beweis. (i) – (iii) ergeben sich unmittelbar aus der Definition in E und aus Lemma D. Zu (iv): Wir betrachten bei festem ˛ die Hilfsfunktionen F .x/ ´ cos.˛ C x/ & .cos ˛ cos x & sin ˛ sin x/ G.x/ ´ sin.˛ C x/ & .sin ˛ cos x C cos ˛ sin x/:
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
197
Wir wollen darauf Lemma D anwenden und berechnen dazu die Ableitungen: F 0 .x/ D & sin.˛ C x/ & .& cos ˛ sin x & sin ˛ cos x/ D &G.x/ G 0 .x/ D cos.˛ C x/ & .& sin ˛ sin x C cos ˛ cos x/ D F .x/: Aufgrund von F .0/ D G.0/ D 0 folgt: F D G D 0, also die Behauptung. Zu (v): Setze in (iv) ˇ D &˛: 1 D cos 0 D cos ˛ cos.&˛/ & sin ˛ sin.&˛/ 0 D sin 0 D sin ˛ cos.&˛/ C cos ˛ sin.&˛/: Dies ist ein lineares Gleichungssystem für cos.&˛/; sin.&˛/. Man kann es leicht nach diesen Größen auflösen. Dazu multipliziert man die erste Gleichung mit cos ˛, die zweite mit sin ˛ und addiert dann beide Gleichungen, bzw. man multipliziert die erste Gleichung mit & sin ˛, die zweite mit cos ˛ und addiert wiederum: cos ˛
D cos2 ˛ ( cos.&˛/ C sin2 ˛ ( cos.&˛/ D cos.&˛/
& sin ˛
D sin2 ˛ ( sin.&˛/ C cos2 ˛ ( sin.&˛/ D sin.&˛/:
Dabei wurde im letzten Schritt (iii) verwendet.
"
G. Bemerkung. Aus den Ableitungen cos0 .0/ D 0; sin0 .0/ D 1 gewinnt man durch Zurückgehen auf die Differenzenquotienten die Grenzwertformeln sin h D 1: h!0 h
1 & cos h D 0; h h!0
lim
lim
Da die Kosinusfunktion bei 0 den Wert 1 hat, sind ihre Werte aufgrund der Stetigkeit in einer ganzen Umgebung von 0 ungleich 0. Für solche Intervalle gilt nun: H. Lemma. Ist J ein offenes Intervall mit 0 2 J , in dem cos keine Nullstelle besitzt, so gilt in J (4)
arctan
sin x D x; cos x
also
sin x D tan x: cos x
Beweis. Wir betrachten in J die Hilfsfunktion h.x/ ´ h0 .x/ D
sin x . Ihre Ableitung lautet cos x
cos x ( cos x & .& sin x/ ( sin x D 1 C h.x/2 : cos2 x
198
Kapitel 4 Differentialrechnung
Betrachtet man in J die weitere Hilfsfunktion H.x/ ´ arctan h.x/ & x, so folgt H 0 .x/ D
h0 .x/ & 1 D 0; 1 C h.x/2
also H.x/ D const. D H.0/ D 0.
"
& & ist die kleinste positive Nullstelle von cos; außer cos D 0 gilt I . Satz. 2 2 & sin D 1. 2 Beweis. Die Kosinusfunktion besitzt in RC mindestens eine Nullstelle: Angenommen, cos wäre in RC nullstellenfrei, und damit wegen F(v) in ganz R. Dann gälte dort (4). Da arctan in R beschränkt ist, enthält dies einen Widerspruch. Sei x0 die kleinste positive Nullstelle von cos in RC . Diese existiert als Infimum t aller Nullstellen in RC . Ist nämlich .an / eine Folge in dieser Nullstellenmenge mit an ! t, so folgt aus cos an D 0 wegen der Stetigkeit auch cos t D 0. Das Infimum all dieser Nullstellen ist also selbst eine Nullstelle. Wegen cos 0 D 1 muss t D x0 > 0 sein. Somit ist cos x0 D 0 und cos x > 0 für x 2 Œ0; x0 Œ. Wegen sin0 D cos ist sin auf Œ0; x0 / streng monoton wachsend, also sin x0 > 0. Zusammen mit 1 D cos2 x0 C sin2 x0 D sin2 x0 folgt sin x0 D 1. Damit gilt (4) zunächst in Œ0; x0 Œ, also wegen F(v) in /&x0 ; x0 Œ. Daraus ergibt sich lim arctan
x"x0
sin x D x0 : cos x
Da der letzte Quotient für x " x0 gegen 1 strebt, folgt mittels A(v):
& D x0 . 2
"
J. Satz. (i)
Kosinus und Sinus sind beide 2&-periodisch, d.h. für alle x 2 R gilt cos.x C 2&/ D cos x;
(ii)
Kosinus besitzt die Nullstellenmenge
(iii) tan x D
sin.x C 2&/ D sin x: & C Z&, Sinus die Nullstellenmenge Z&. 2
sin x & für alle x … C Z&. cos x 2
Beim elementaren Zugang wird die Gleichung in (iii) als Definition für den Tangens genommen. Hier bedarf diese Gleichung eines Beweises, da die Tangensfunktion zuvor schon in B definiert war.
199
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
Beweis von J. Zu (i): Aus Satz I und den Additionstheoremen folgt: 3 & &D cos x cos & sin x sin cos x C 2 2 (5) 3 & & D sin x cos C cos x sin sin x C 2 2 Weitere zweimalige Anwendung liefert hieraus: 3 &D & cos x; cos.x C &/ D & sin x C 2 (6) 3 & sin.x C &/ D cos x C D & sin x; 2
& D & sin x 2 & D cos x: 2
cos.x C 2&/ D cos x sin.x C 2&/ D sin x:
Zu (ii): Zum cos: Wegen cos.xC&/ D & cos x sind die 02 Ck&; k 2 Z, jedenfalls Nullstellen & * von cos. Da das Intervall & 02 ; 02 nullstellenfrei ist, sind ˙ 02 die einzigen Nullstellen in Œ&&; &/ und die 02 C k&; k 2 Z die einzigen überhaupt. ( ) Zum sin: Hier kann man wegen sin x D cos x & 02 auf cos zurückrechnen. sin x stimmen nach Lemma H auf /&&=2; &=2Œ Zu (iii): Beide Funktionen tan x und cos x überein und haben nach B und (6) die Periode &. Daraus folgt ihre Gleichheit, wie behauptet. "
K. Folgerung. Zwischen zwei aufeinander folgenden Nullstellen von cos (bzw. sin) hat cos (bzw. sin) jeweils festes Vorzeichen ¤ 0, also ist wegen F(i) sin (bzw. cos) auf dem abgeschlossenen Intervall dazwischen jeweils streng monoton. " L. Definition. Man nennt cot x ´
cos x ; sin x
x … Z&
den Kotangens und die vier Funktionen cos; sin; tan; cot insgesamt die trigonometrischen Funktionen oder Winkelfunktionen. Es folgen die Graphen von Sinus und Kosinus, wie sie sich (zumindest qualitativ) aus den abgeleiteten Tatsachen ergeben: sin
1
cos
π -7
-6
-5
-4
-3
-2
0
-1 -1
1
2
3
2π 4
5
6
7
200
Kapitel 4 Differentialrechnung
M. Bemerkungen (zum Formelarsenal der trigonometrischen Funktionen). Zwischen den trigonometrischen Funktionen gibt es zahlreiche Relationen, die man in Formelsammlungen aufgelistet findet. Es handelt sich dabei aber nicht um neue, unabhängige Relationen, sondern um Folgerungen aus den obigen Eigenschaften, insbesondere aus den Additionstheoremen, den speziellen Werten bei 0 und &=2 und der Tatsache, dass cos eine gerade, sin eine ungerade Funktion ist. Wir wollen hier nicht alles aufzählen, sondern die Prinzipien zur Herleitung beschreiben. Die gewonnenen Formeln sind oft sehr nützlich, z.B. in der Integralrechnung. (i) Setzt man in den Additionstheoremen F(iv): ˛ D ˇ D x, so folgen die Verdopplungsformeln cos 2x D cos2 x & sin2 x; (ii)
sin 2x D 2 sin x cos x
für x 2 R:
Schreibt man die Verdopplungsformeln in der Gestalt cos 2x D
cos2 x & sin2 x ; cos2 x C sin2 x
sin 2x D
2 sin x cos x cos2 x C sin2 x
und kürzt rechts die Brüche mit cos2 x, so folgt außerhalb der Nullstellen von cos: cos 2x D
1 & tan2 x ; 1 C tan2 x
sin 2x D
2 tan x 1 C tan2 x
für x …
& C Z&: 2
(iii) Aus Verdopplungsformeln wie in (i) und (ii) erhält man durch die Substitution 2x D ' entsprechende Halbwinkelformeln: ' ' & sin2 ; 2 2 ' 1 & tan2 2 cos ' D '; 1 C tan2 2 cos ' D cos2
' ' cos 2 2 ' 2 tan 2 sin ' D ' 1 C tan2 2 sin ' D 2 sin
für ' 2 R für ' … & C Z2&:
Die ersten beiden könnte man nach cos '2 , sin '2 auflösen (allerdings mit Wurzeln). Die letzten beiden waren in E beim Existenzbeweis verwendet worden. (iv) Schreibt man die Additionstheoreme F(iv), indem man ˇ durch &ˇ ersetzt, und addiert bzw. subtrahiert man entsprechende Formeln, so ergibt sich für ˛; ˇ 2 R: cos.˛ C ˇ/ C cos.˛ & ˇ/ D 2 cos ˛ cos ˇ; sin.˛ C ˇ/ C sin.˛ & ˇ/ D 2 sin ˛ cos ˇ; cos.˛ C ˇ/ & cos.˛ & ˇ/ D 2 sin ˛ sin ˇ; sin.˛ C ˇ/ & sin.˛ & ˇ/ D 2 cos ˛ sin ˇ:
201
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
(v) Oftmals werden diese Gleichungen mit der Substitution ˛ C ˇ D ', ˛ & ˇ D 4 formuliert. Dann lauten sie: 'C4 '&4 cos ; 2 2 '&4 'C4 cos ; sin ' C sin 4 D 2 sin 2 2 '&4 'C4 cos ' & cos 4 D 2 sin sin ; 2 2 'C4 '&4 sin ' & sin 4 D 2 cos sin ; 2 2
cos ' C cos 4 D 2 cos
gültig für '; 4 2 R. Es ist nicht nötig, all diese Formeln parat zu haben. Aber es ist gut zu wissen, dass es sie gibt, und sich an ihre Herleitung zu erinnern. Beziehung zum Einheitskreis Bei der anschaulichen Behandlung werden die Winkelfunktionen am Einheitskreis motiviert. Wie fügt sich dies in den jetzigen präzisen Aufbau ein? – Der Einheitskreis ist als Punktmenge in R2 so definiert: ˇ , ˚ S1 ´ .a; b/ 2 R2 ˇ a2 C b 2 D 1 : Dies ist eine „statische“ Darstellung von S1 . Wir wollen nun die Punkte des Einheitskreises „dynamisch“ beschreiben, d.h. so, dass seine Punkte der Reihe nach durchlaufen werden. Dazu gibt es zwei natürliche Möglichkeiten, eine elementare und eine weitere, die durch Kosinus und Sinus vermittelt wird. Die elementare Möglichkeit nimmt Bezug auf das nebenstehende Bild. Man schneidet die Gerade durch .&1; 0/ und .0; t/ mit S1 . (a,b) Die Koordinaten a; b des Schnittpunkts er(0,t) geben sich durch einfache Rechnung wie in t den folgenden eingerahmten Formeln. Variiert man den „Parameter“ t, so durchläuft (-1,0) der Schnittpunkt .a; b/ den Einheitskreis bis S1 auf den Punkt .&1; 0/. Unabhängig von dieser Konstruktion zeigen wir nun auf exaktem Wege: N. Lemma (rationale Parametrisierung von S1 ). . (i)
Für alle t 2 R gilt:
1 & t2 1 C t2
/2
. C
2t 1 C t2
/2
D 1.
202
Kapitel 4 Differentialrechnung
(ii) Umgekehrt gibt es zu jedem Paar .a; b/ 2 R2 mit a2 C b 2 D 1 und a ¤ &1 genau ein t 2 R mit: aD
1 & t2 ; 1 C t2
nämlich tD
bD
2t ; 1 C t2
b : 1Ca
Beweis. Dieser ist völlig elementar. Zu (i): Diese Identität rechnet man einfach nach: /2 . /2 . 1 & 2t 2 C t 4 C 4t 2 1 & t2 2t 1 C 2t 2 C t 4 D C D D 1: 1 C t2 1 C t2 .1 C t 2 /2 .1 C t 2 /2 Zu (ii): Sind a; b gegeben, so muss man die zugehörigen t finden, d.h. die eingerahmten Gleichungen nach t auflösen. Dies läuft zunächst mit folgenden Schlüssen: 1 & t2 1 C t2 2t bD 1 C t2
.1 C t 2 /a D 1 & t 2
aD
H)
H) 2
.1 C t /b D 2t
1&a 1Ca 1 t D .1 C t 2 /b: 2
t2 D
Hieraus folgt weiter:
. / 1 1&a 1 1CaC1&a b tD 1C bD bD : 2 1Ca 2 1Ca 1Ca
Zu .a; b/ ist also t eindeutig bestimmt. Die Probe zeigt, dass das errechnete t die Ausgangsgleichungen wirklich löst: . /2 b 1& .1 C a/2 & b 2 1 C 2a C a2 & b 2 1Ca D . /2 D .1 C a/2 C b 2 1 C 2a C a2 C b 2 b 1C 1Ca D
2a.1 C a/ a2 C b 2 C 2a C a2 & b 2 D Da 1 C 2a C 1 2.1 C a/
b 2 2b.1 C a/ 2b.1 C a/ 1Ca D D b: . /2 D 2 2 .1 C a/ C b 2.1 C a/ b 1C 1Ca
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
Damit ist auch die Existenz von t gesichert.
203 "
Rationale Parametrisierungen treten auch bei anderen Gebilden auf und spielen so in verschiedenen Gebieten eine wichtige Rolle. Die obige rationale Parametrisierung wird jetzt in eine Parametrisierung mittels trigonometrischer Funktionen umgerechnet: O. Folgerung (transzendente Parametrisierung von S1 ). (i)
cos2 ' C sin2 ' D 1.
Für alle ' 2 R gilt:
(ii) Umgekehrt gibt es zu jedem Paar .a; b/ 2 R2 mit a2 C b 2 D 1 genau ein ' 2 /&&; &/ mit: a D cos ';
b D sin ':
Beweis. Zu (i): Dies ist einfach der trigonometrische Pythagoras F(iii). Zu (ii): Wir unterscheiden zwei Fälle: Fall 1: a ¤ &1: Setze (7)
t D tan
' : 2
Diese Gleichung vermittelt eine bijektive Abbildung von ' 2 /&&; &Œ auf t 2 R. Die Formeln in N(ii) vermitteln eine bijektive Abbildung von t 2 R auf die .a; b/ des Einheitskreises S1 mit a ¤ &1. Substituiert man das t aus (7) in die Formeln von N(ii), so erhält man insgesamt eine bijektive Abbildung von ' 2 /&&; &Œ auf diese Kreispunkte. Der Witz ist nun, dass bei diesem Einsetzen genau a D cos ', b D sin ' resultiert, wenn man die Halbwinkelformeln in M(iii) berücksichtigt. Fall 2: a D &1: Hier ist notwendigerweise b D 0. Für ' 2 /&&; &/ wird genau einmal &1 D cos '; 0 D sin ', nämlich für ' D &. Insgesamt vermitteln die eingerahmten Formeln in (ii) eine bijektive Abbildung des Intervalls /&&; &/ D /&&; &Œ [ f&g auf S1 " Bei der transzendenten Parametrisierung werden alle Punkte von S1 erfasst, bei der rationalen alle bis auf einen. Wegen dieser Zusammenhänge nennt man die trigonometrischen Funktionen auch Kreisfunktionen. Wenn ' nicht auf das Intervall /&&; &/ beschränkt wird, sondern frei in R läuft, so liefern die Formeln a D cos ', b D sin ' das gleiche Paar .a; b/ mehrfach, nämlich immer dann, wenn ' um ein ganzzahliges Vielfaches von 2& verschoben wird. Das ist dann aber auch die einzige Art der mehrfachen Erfassung; denn es gilt:
204
Kapitel 4 Differentialrechnung
P. Lemma. Für '; 4 2 R besteht die Äquivalenz cos ' D cos 4
)
sin ' D sin 4
() ' & 4 2 Z2&:
Beweis. Dieser beruht auf der Identität '&4 ; 2 die sich aus der zweiten Formelzeile in M(v) durch Quadrieren und Addieren ergibt. An dieser Identität erkennt man unmittelbar die Behauptung, da ihre rechte Seite nach J(ii) genau dann verschwindet, wenn '&. in Z&, also ' & 4 in Z2& liegt. " 2 .cos ' & cos 4/2 C .sin ' & sin 4/2 D 4 sin2
Q. Bemerkung. Anhand dieses Lemmas sieht man auch, dass in O(ii) anstelle des Intervalls / & &; &/ jedes halboffene Intervall der Länge 2& verwendet werden kann, z.B. Œ0; 2&Œ. Die Darstellung des Einheitskreises in Satz O ist die Basis für die Polarkoordinaten in R2 : R. Satz und Definition. Zu .x; y/ 2 R2 mit .x; y/ ¤ .0; 0/ existiert genau ein r > 0 sowie ein ' 2 R mit (8)
x D r cos ' y D r sin ':
Man nennt die beiden Zahlen r; ' Polarkoordinaten von .x; y/, genauer r den Betrag und ' ein (Winkel-)Argument von .x; y/. Es gilt (9)
rD
p x2 C y2:
Ein Argument ' ist durch .x; y/ bis auf die Addition ganzzahliger Vielfache von 2& eindeutig bestimmt, also in / & &; &/ eindeutig und heißt dann der Hauptwert Arg.x; y/. Dieser ist in der geschlitzten Ebene S ´ R2 n f.x; y/ 2 R2 j x . 0; y D 0g gegeben durch (10)
Arg.x; y/ D 2 arctan
y : p x C x2 C y2
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
205
Beweis. Die Eindeutigkeit von r ist klar, da aus (8) folgt: x 2 C y 2 D r 2 , also (9). Wir setzen nun bei gegebenem .x; y/ ¤ .0; 0/ y b´p : 2 x C y2
x ; a´ p 2 x C y2
Es gilt dann a2 C b 2 D 1. In der Sprechweise der linearen Algebra ist .a; b/ der zu .x; y/ gehörende Einheitsvektor. Auf .a; b/ 2 S1 kann man die Aussagen N, O und P anwenden, woraus die Behauptungen folgen. Dabei gilt für den Hauptwert ' nach (7) x ' b x tan D t D D r y D ; 2 1Ca yCr 1C r also folgt (10).
"
R. Zusatz. Der Nullpunkt .0; 0/ 2 R2 bekommt als Polarkoordinaten r D 0 und ' 2 R beliebig. Dafür ist dann (8) ebenfalls erfüllt.
S. Bemerkung. In der rechten Halbebene H ´ f.x; y/ 2 R2 j x > 0g kann zur Argumentberechnung statt (10) die einfachere Formel (11)
Arg.x; y/ D arctan
y x
dienen. Diese folgt aus (10) mittels der eingangs p genannten Verdopplungsformel des y arctan, indem man dort a ´ xCr mit r ´ x 2 C y 2 setzt. Für x > 0 bestätigt man nämlich durch Umrechnung für das so definierte a: a2 < 1; also 2 arctan
2a y D ; 1 & a2 x y y D arctan : xCr x
Für die Ungleichung a2 < 1 benötigt man die Voraussetzung x > 0. Tatsächlich ist (11) für x < 0 falsch; denn sonst ergäbe sich für .x; y/ und .&x; &y/ das gleiche Argument, was für y ¤ 0 der Eindeutigkeitsaussage von R widerspricht. Die Darstellung (10) hat somit einen viel größeren Geltungsbereich als (11).
206
Kapitel 4 Differentialrechnung
Halbebene
geschlitzte Ebene
T. Definition. Die zyklometrischen Funktionen sind als (teilweise) Umkehrfunktionen der trigonometrischen Funktionen folgendermaßen gegeben: ' arccos ´ .cos j Œ0; &//&1 W Œ&1; 1/ ! Œ0; &/ h & &i 3 ˇ h & & i-&1 ˇ W Œ&1; 1/ ! & ; ' arcsin ´ sin ˇ & ; 2 2 2 2 i & &h 3 ˇ i & & h-&1 ˇ WR! & ; ' arctan D tan ˇ & ; 2 2 2 2 &1 ' arccot ´ .cot j /0; &Œ / W R !/0; &Œ
(streng monoton fallend) (streng monoton wachsend) (streng monoton wachsend) (streng monoton fallend).
Die Vorsilbe „arc-“ wird als „Arkus-“ gesprochen. Die vier Funktionen heißen also Arkuskosinus, Arkussinus, Arkustangens und Arkuskotangens. Die Hochzahlen &1 bedeuten hier natürlich die Umkehrfunktionen. An Regeln für diese Funktionen seien die folgenden genannt: U. Satz. Es gilt: & 2 & (ii) arctan y C arccot y D 2 1 (iii) arcsin0 y D p 1 & y2 1 (iv) arccot0 y D & 1 C y2 (i)
arccos y C arcsin y D
für y 2 Œ&1; 1/ für y 2 R für y 2 /&1; 1Œ für y 2 R:
Beweis. Als Muster seien (i) und (iii) behandelt; (ii) und (iv) laufen analog. * & Zu (i): Für gegebenes y 2 Œ&1; 1/ setze man y D sin x mit einem x 2 & 02 ; 02 , also ( ) x D arcsin y. Nach dem Additionstheorem von cos ist y D cos 02 & x , wobei
207
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis 0 2
& x 2 Œ0; &/, somit Behauptung.
0 2
& x D arccos y. Zusammen mit x D arcsin y folgt die
* & Zu (iii): Die Ableitung von sin ist auf & 02 ; 02 positiv. Nach J[4.3] ist arcsin differenzierbar in /&1; 1Œ und dort (mit den gleichen Bezeichnungen wie bei (i)): arcsin0 y D
1 1 1 1 ; D Dp Dp 0 2 sin x cos x 1 & y2 1 & sin x
wobei beim dritten Gleichheitszeichen verwendet ist, dass cos x > 0.
"
V . Beispiel. Die folgenden Funktionen werden verschiedentlich für Beispiele und Gegenbeispiele herangezogen (dabei sei n 2 N0 ): 8 1 < n x ( sin für x ¤ 0 fn .x/ ´ x :0 für x D 0: Jede dieser Funktionen oszilliert umso stärker, je näher man an 0 herankommt. Andererseits werden die Ausschläge der Schwankungen nahe 0 mit wachsendem n durch x n mehr und mehr „niedergebügelt“.
n=1
n=0
n=2
Alle diese Funktionen sind stetig und differenzierbar außerhalb des Nullpunktes 0. Die Ableitung berechnet man als fn0 .x/ D nx n&1 sin
1 1 & x n&2 cos x x
für x ¤ 0:
Hieraus liest man ab: Für n D 0 ist f0 unstetig in 0; denn beliebig nahe bei 0 gibt es Funktionswerte 1 und 1 &1, nämlich für x 2 " CZ0 . Die Funktion f0 wird als Sinusoid bezeichnet. 2
Für n D 1 ist f1 stetig in 0, aber dort nicht differenzierbar; denn der Differenzenquotient dafür ist sin h1 . Für n D 2 ist f2 in 0 differenzierbar; denn der Differenzenquotient dafür ist h ( sin h1 , somit f20 .0/ D 0. Die Ableitung existiert also auf ganz R. Sie ist aber in 0 unstetig;
208
Kapitel 4 Differentialrechnung
denn in dem obigen Ausdruck für f20 .x/ konvergiert zwar der erste Summand gegen 0 für x ! 0, nicht aber der zweite, der wiederum beliebig nahe bei 0 Funktionswerte 1 und &1 annimmt. Eine auf einem Intervall Œa; b/ überall differenzierbare Funktion kann also sehr wohl eine unstetige Ableitung besitzen. Trotzdem hat die Ableitung nach Darboux immer die Zwischenwerteigenschaft M[4.3]. W. Bemerkungen (Weiteres zum Formelarsenal der trigonometrischen Funktionen). (i) Aus den Additionstheoremen für Kosinus und Sinus gewinnt man auch solche für Tangens und Kotangens, z.B. entsteht das Additionstheorem des Tangens tan.˛ C ˇ/ D
tan ˛ C tan ˇ 1 & tan ˛ tan ˇ
für ˛; ˇ; ˛ C ˇ …
& C Z& 2
aus F(iv) durch Division und Kürzen mit cos ˛ cos ˇ. (ii) Die Verdopplungsformeln aus M(i) kann man auf beliebige natürliche Vielfache ausdehnen, indem man die folgenden Rekursionsformeln verwendet cos.n C 1/˛ D cos n˛ cos ˛ & sin n˛ sin ˛ sin.n C 1/˛ D sin n˛ cos ˛ C cos n˛ sin ˛: Z.B. erhält man für n D 2 hieraus cos 3˛ D cos3 ˛ & 3 cos ˛ sin2 ˛ sin 3˛ D 3 sin ˛ & 4 sin3 ˛: Eine explizite (nicht rekursive) Darstellung für cos nx und sin nx wird sich mit Hilfe der so genannten Formeln von Moivre in der komplexen Behandlung ergeben; vgl. D[7.2]. (iii) Mit solchen Formeln kann man dann auch spezielle Werte berechnen, z.B. indem man in der letzten Gleichung ˛ D &=6 setzt und überlegt, dass die Gleichung 1 D 3x & 4x 3 die einzige positive Lösung 1=2 besitzt. So folgt (ohne Elementargeometrie!): p & 1 & 3 sin D ; cos D : 6 2 6 2 (iv) Ähnlich berechnet man die weiteren Werte der folgenden Tabelle: & & & & ˛! 0 6 4 3 2 p p p p 1 1 1 1 1p sin ˛ 0 D 0 1 2 3 1D 4 2 2 2 2 2 1p 1p 1p 1p 1p cos ˛ 1 D 4 3 2 1 0D 0 2 2 2 2 2
209
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
Die einzige Frage, die im Augenblick offen bleibt, nämlich die inhaltliche Bedeutung von ' im Paar .cos '; sin '/, wird in I(ii)[9.1] behandelt. Es ist dazu der Begriff „Bogenlänge“ erforderlich. Die Periodizität, die hier bei den trigonometrischen Funktionen eine Rolle spielt, kann allgemein so definiert werden: X. Definition (Periodizität). Eine Funktion f W R ! M in eine beliebige Menge M heißt periodisch, wenn es eine Zahl p ¤ 0 gibt, sodass für alle x 2 R gilt: f .x C p/ D f .x/. Man sagt dann auch, f sei p-periodisch, und man nennt p eine Periode von f . Da mit p auch &p eine Periode von f ist, kann o.B.d.A. p > 0 angenommen werden. Aufgaben und Anmerkungen 1. Man beweise mit den Additionstheoremen 3& 3& cos ˛ D sin & ˛ ; sin ˛ D cos &˛ 2 2 und folgere daraus: 3& &˛ cot ˛ D tan 2
für ˛ … Z&;
tan ˛ D cot
3& 2
&˛
für ˛ 2 R -
für ˛ …
& C Z&: 2
2. Man zeige für alle ˛; ˇ 2 R sin2 ˛ & sin2 ˇ D sin.˛ C ˇ/ ( sin.˛ & ˇ/; eine eigenartige Analogie zur elementaren Formel a2 & b 2 D .a C b/ ( .a & b/. 3. Man berechne die folgenden Grenzwerte: / . tan ˛x & tan ˇx 1 , b) lim (für ˛ ¤ ˇ), a) lim n 1 & cos n!1 x!0 sin ˛x & sin ˇx n 3& c) lim & x tan x. 2 x!0=2 4. Eine modulierte Sinusfunktion f W R ! R hat die Darstellung f .x/ D g.x/ ( sin x, wobei g W R ! R nullstellenfrei und differenzierbar sei. An Beispielen beobachtet man: Treffen sich die Graphen von f und g, so geschieht dies stets tangential. Wie lässt sich das mathematisch formulieren und beweisen? 5. $ Man beweise
s & D sin 5
p 5& 5 : 8
210
Kapitel 4 Differentialrechnung
6. Für welche x 2 R gilt: a) tan.arctan x/ D x,
b) arctan.tan x/ D x?
Dass b) nicht immer stimmt, ist der Grund dafür, dass man aus dem Additionstheorem des Tangens in W(i) nicht ohne weiteres das Additionstheorem des Arkustangens zurückgewinnen kann. Zwar erhält man aus W(i) vermöge der Substitution tan ˛ D a, tan ˇ D b und formales Anwenden von arctan auf beiden Seiten die Formel (F) vom Beginn dieses Abschnitts, aber ohne die nötige Einschränkung ab < 1. Ein Fehler bei diesem Vorgehen ist die blinde Anwendung von b), was eben nicht generell richtig ist. Allenfalls kann man diese formale Rechnung zur Gewinnung einer Vermutung verwenden, beweisen muss man das Ergebnis unabhängig. Das geht oft durch Differenzieren. In diesem Fall liefe das so: Vermutet man (12)
arctan
aCb D arctan a C arctan b; 1 & ab
und will Gewissheit erlangen, ob dies richtig ist, so hält man a fest und lässt b D x laufen, d.h. man betrachtet die Funktion f .x/ ´ arctan
aCx & arctan a & arctan x 1 & ax
etwa auf fx 2 R j 1&ax > 0g. Diese Menge ist in jedem Fall ein offenes Intervall, das 0 enthält (bei a D 0 z.B. gleich R). Sodann berechnet man die Ableitung f 0 .x/, was sich in diesem Fall als 0 herausstellt (man rechne selbst!). Damit folgt f .x/ D const. und wegen f .0/ D 0 in der Tat f .x/ D 0 für alle x mit ax < 1. Somit gilt (12) für ab < 1. Im Fall der Gleichung (12) wäre ein solcher Beweis eigentlich nicht nötig, da sie für ab < 1 ohnehin schon bekannt war. Aber daran kann man die Vorgehensweise gut erläutern. 7. Man beweise: 1 & D für a > 0; a 2 1 & b) arctan a C arctan D & für a < 0; a 2 3 p p c) arcsin a C arcsin b D arcsin a 1 & b 2 C b 1 & a2
a) arctan a C arctan
d) 2 arctan a D arcsin
für a2 C b 2 . 1.
2 für jaj . 1. 1 C a2
8. Was tritt anstelle der Gleichung (12), wenn ab > 1? 9. Seien a; b reelle Konstanten. Man zeige: Es gibt ein r % 0 und ein ' 2 R mit: a cos x C b sin x D r cos.x & '/
für alle x 2 R:
Abschnitt 4.4 Trigonometrische Funktionen und der Einheitskreis
211
p r ist hierbei eindeutig bestimmt, nämlich als r D a2 C b 2 , und ' ist für .a; b/ ¤ .0; 0/ bis auf ganze Vielfache von 2& bestimmt, z.B. als ' D Arg.a; b/. 10. Für n 2 N0 sei die Funktion Tn W Œ&1; 1/ ! R definiert durch Tn .x/ ´ cos.n ( arccos x/: a)
Man beweise durch vollständige Induktion: Tn ist ein Polynom vom Grad n (eingeschränkt auf Œ&1; 1/). Man nennt Tn das n-te Tschebyscheff-Polynom.
b) Man gebe die ersten fünf Tschebyscheff-Polynome T0 ; : : : ; T4 an. c)
Man berechne die Nullstellen von Tn und überlege, dass es genau n verschiedene sind, die alle im Intervall /&1; 1Œ liegen.
11. Sei ' W Œa; b/ ! R (a < b) eine Funktion mit übereinstimmenden Endwerten: '.a/ D '.b/. Man zeige: Es gibt genau eine Fortsetzung f W R ! R von ' mit der Periode b & a, d.h. derart, dass f jŒa; b/ D ' und f .x C b & a/ D f .x/ für alle x 2 R gilt (periodische Fortsetzung). Diese Fortsetzung ist gegeben durch 3 hx & ai ( .b & a/ : f .x/ D ' x & b&a Ist ' nur im offenen Intervall /a; bŒ gegeben, so gilt dies analog, wobei die periodische Fortsetzung nur in den Punkten außerhalb a C Z ( .b & a/ definiert ist. Insbesondere ist die &-periodische Fortsetzung des Tangens auf T D R n P explizit gegeben durch 3 hx 1i tan x D tan x & C (& ; x 2 R n P; & 2 wobei auf der rechten Seite nur Argumente des Tangens in /&&=2; &=2Œ vorkommen. 12. Die rationale Parametrisierung des Einheitskreises in Lemma N kann auch zur Auffindung rationaler oder ganzzahliger Lösungen entsprechender Gleichungen dienen. Man zeige nämlich: a) Die Paare .,; 1/ 2 Q ) Q mit , 2 C 12 D 1 und , ¤ &1 sind genau die, welche sich in der Form 1 & t2 2t ,D ; 1D 2 1Ct 1 C t2 mit t 2 Q darstellen lassen. b) Die Lösungen der Gleichung x2 C y2 D z2 in natürlichen Zahlen x; y; z nennt man pythagoräische Tripel. Das bekannteste pythagoräische Tripel ist das ägyptische Tripel x D 3; y D 4; z D 5; denn es gilt 32 C 42 D 52 . Es sollen nun alle pythagoräischen Tripel bestimmt werden:
212
Kapitel 4 Differentialrechnung
c) Setzt man in a) t D q=p mit natürlichen Zahlen p > q, so wird ,D
p2 & q2 ; p2 C q2
1D
2pq p2 C q2
und , 2 C 12 D 1; woraus nach Durchmultiplizieren mit .p 2 C q 2 /2 entsteht: .p 2 & q 2 /2 C .2pq/2 D .p 2 C q 2 /2 : Man erhält also bereits viele pythagoräische Tripel in der Gestalt (13)
x D p2 & q2;
y D 2pq;
z D p2 C q2
mit .p; q/ 2 N ) N und p > q. Selbstverständlich sind die natürlichen Vielfachen eines solchen Tripels wiederum pythagoräische Tripel. Z.B. liefert (13) für p D 2, q D 1 das ägyptische Tripel .3; 4; 5/ und für p D 3, q D 2 das Tripel .5; 12; 13/ mit 25 C 144 D 169. Auf diese Weise erhält man sogar alle pythagoräischen Tripel: c) Ist .x; y; z/ ein beliebiges pythagoräisches Tripel, so zeige man zunächst, dass mindestens eine der Zahlen x; y gerade sein muss, und dann weiter: d) $ Ist .x; y; z/ ein pythagoräisches Tripel und y gerade, so existieren natürliche Zahlen p; q; r gibt mit
x D .p 2 & q 2 / ( r;
y D 2pq ( r;
z D .p 2 C q 2 / ( r:
Das sind die so genannten indischen Formeln. Diese liefern also eine Parametrisierung aller natürlichen Lösungen der Gleichung x 2 C y 2 D z 2 . e) $ Gibt es unter allen pythagoräischen Tripeln .x; y; z/ eines, für das der „isoperimetrische Quotient“ U 2 =F (U der Umfang x C y C z, F der Flächeninhalt xy=2 des zugehörigen rechtwinkligen Dreiecks) minimal wird? 13. Für n 2 N mit n % 3 gibt es keine Lösungen der Gleichung x n C y n D z n in natürlichen Zahlen x; y; z. Das war um 1630 von Fermat ausgesprochen worden, sein Beweis konnte aber niemals aufgefunden werden. Nach vergeblichen Versuchen vieler Mathematiker gelang es schließlich Wiles[1995], diese Behauptung in einer umfangreichen Arbeit zu verifizieren. Dieser Satz musste also über 300 Jahre als Vermutung gelten; er wird heute als Fermats letzter Satz bezeichnet.
4.5
$ Grenzwerte nach de l’Hospital
Hier wird eine Methode vorgestellt, mit der viele Grenzwerte gleichsam automatisch bestimmt werden können. Hauptsächlich geht es um „unbestimmte Ausdrücke“, die
Abschnitt 4.5
$ Grenzwerte nach de l’Hospital
213
meistens in Form von Quotienten auftreten. Dabei streben Zähler und Nenner einem Grenzwert 0 oder ˙1 zu, und zwar so, dass man von vornherein nicht sehen kann, wer von den beiden „gewinnt“. A. Satz (Regel von de l’Hospital, einfache Variante). Sei A , R und f; g W A ! R differenzierbar in a 2 A sowie f .a/ D g.a/ D 0, g 0 .a/ ¤ 0. Dann gilt: lim
x!a
f 0 .a/ f .x/ D 0 : g.x/ g .a/
Beweis. Schreibe für x ¤ a:
f .x/ & f .a/ f .x/ & f .a/ f 0 .a/ f .x/ x&a D D &! 0 g.x/ & g.a/ g.x/ g.x/ & g.a/ g .a/ x&a
.x &! a/:
Man beachte, dass der Nenner des Doppelbruchs ¤ 0 ist, wenn x nahe genug bei a liegt, jedoch ¤ a ist (Meidungsprinzip). " ln x 3& - ? x!1 x cos 2 Lösung: Die Voraussetzungen von Satz A sind erfüllt für 3& x ; a´1W f .x/ ´ ln x; g.x/ ´ cos 2 1 f .1/ D g.1/ D 0; f 0 .x/ D ; f 0 .1/ D 1; x 3& - & & x ( ; g 0 .1/ D & ¤ 0: g 0 .x/ D & sin 2 2 2 B. Beispiel. Was ist lim
Damit wird lim
x!1
2 1 ln x 3& - D & D & : & cos x & 2 2
Die obige Regel ist stark verallgemeinerungsfähig. Man benötigt als wesentliches Hilfsmittel dafür: C. Satz (verallgemeinerter Mittelwertsatz). Die Funktionen f; g W Œa; b/ ! R seien stetig und im offenen Intervall /a; bŒ differenzierbar. Dann existiert ein c 2 /a; bŒ mit (1)
.f .b/ & f .a// ( g 0 .c/ D .g.b/ & g.a// ( f 0 .c/:
214
Kapitel 4 Differentialrechnung
Beweis. Wir definieren eine Hilfsfunktion ' W Œa; b/ ! R in Gestalt einer Linearkombination aus f und g: '.x/ ´ *f .x/ C +g.x/ und wählen die Konstanten *; + derart, dass '.a/ D '.b/ wird. Dann kann auf ' der gewöhnliche Mittelwertsatz C[4.3] angewandt werden: '.a/ D '.b/ () *f .a/ C +g.a/ D *f .b/ C +g.b/ () *.f .a/ & f .b// D +.g.b/ & g.a// (H * D g.b/ & g.a/; + D f .a/ & f .b/: Bei diesen Werten von *; + existiert ein c 2 /a; bŒ mit ' 0 .c/ D 0. Da ' 0 .c/ D *f 0 .c/ C +g 0 .c/ folgt .g.b/ & g.a// ( f 0 .c/ C .f .a/ & f .b// ( g 0 .c/ D 0; also die Behauptung.
"
C. Zusatz. Gilt g 0 .x/ ¤ 0 auf /a; bŒ, so kann man (1) umformen: f .b/ & f .a/ f 0 .c/ D 0 : g.b/ & g.a/ g .c/
(2)
Beweis. Nach dem gewöhnlichen Mittelwertsatz gilt wegen g 0 .x/ ¤ 0 in /a; bŒ auch g.b/ & g.a/ ¤ 0. Also ist (1) hierdurch dividierbar. " Der gewöhnliche Mittelwertsatz C[4.3] wird auch als erster Mittelwertsatz, der verallgemeinerte Mittelwertsatz C als zweiter Mittelwertsatz der Differentialrechnung bezeichnet. Für g.x/ D x geht dieser natürlich in C[4.3] über. D. Satz (Regel von de l’Hospital, allgemeine Variante). Seien f; g W /a; bŒ ! R differenzierbar (a bzw. b auch als &1 bzw. 1 zugelassen), g 0 .x/ ¤ 0 für alle x 2 /a; bŒ und eine der folgenden Bedingungen (i) oder (ii) erfüllt: (i) (ii)
lim f .x/ D lim g.x/ D 0;
x!b
x!b
lim g.x/ D 1 oder D &1.
x!b
Außerdem existiere der Grenzwert lim
x!b
gilt lim
x!b
f 0 .x/ (eigentlich oder uneigentlich). Dann g 0 .x/
f .x/ f 0 .x/ D lim 0 : g.x/ x!b g .x/
Die gleiche Aussage besteht für x ! a.
Abschnitt 4.5
$ Grenzwerte nach de l’Hospital
215
Beweis. Ein sehr einfacher Fall ist (i) mit a 2 R. Man kann nämlich so argumentieren: Durch f .b/ ´ 0, g.b/ ´ 0 werden f; g stetig auf /a; b/ fortgesetzt. Wendet man nun auf Œx; b/ für x 2 /a; bŒ den verallgemeinerten Mittelwertsatz an, so ergibt sich f .x/ f 0 .,/ D 0 g.x/ g .,/
für ein , D ,.x/ 2 /x; bŒ:
Daraus folgt die Behauptung, da mit x ! b auch , ! b gilt. Der allgemeine Beweis ist etwas detailreicher: Wir folgen wie bei Heuser[2003/2004] (Teil 1, Nr. 50) einer Fallunterscheidung, die nichts mit der von (i), (ii) zu tun hat. Fall 1: lim
x!b
f 0 .x/ 2 R [ f&1g. g 0 .x/
Wir geben uns ein y0 > limx!b bei b.
f 0 .x/ g 0 .x/
vor und zeigen:
f .x/ g.x/
. y0 für x nahe genug
Ein gutes Hilfsmittel ist wieder der verallgemeinerte Mittelwertsatz. Er liefert hier, angewandt auf ein Teilintervall: (3)
f 0 .,/ f .x/ & f .u/ D 0 für alle u ¤ x aus /a; bŒ mit einem , zwischen u und x: g.x/ & g.u/ g .,/
Weiter ist g.x/ & g.u/ ¤ 0 für diese x; u, da g 0 in /a; bŒ keine Nullstellen besitzt. Natürlich hängt , von x; u ab. Zu (i): Bei dieser Voraussetzung wählen wir ein x0 2 /a; bŒ mit f 0 .,/ < y0 g 0 .,/
für alle , 2 /x0 ; bŒ:
Dann gilt nach (3) f .x/ & f .u/ < y0 g.x/ & g.u/
für alle u ¤ x aus /x0 ; bŒ;
also beim Grenzübergang u ! b: f .x/ . y0 g.x/
für alle x 2 /x0 ; bŒ:
Zu (ii): Hier gibt es nach dem Meidungsprinzip ein x3 2 /a; bŒ mit: g.x/ ¤ 0 für alle x 2 /x3 ; bŒ. Wir schreiben dafür (3) in der mit g.x/ gekürzten Form f .x/ f .u/ & f 0 .,/ g.x/ g.x/ D 0 g.u/ g .,/ 1& g.x/
für alle u ¤ x aus /x3 ; bŒ mit einem , zwischen u und x:
216
Kapitel 4 Differentialrechnung
.x/ Die Auflösung dieses Ausdrucks nach fg.x/ ergibt unter den gleichen Bedingungen an u; x; ,: . / g.u/ f .u/ f 0 .,/ f .x/ 1& : D C 0 g.x/ g.x/ g .,/ g.x/
Der iPlan ist nun, xh gegen b streben zu lassen. Dazu wählen wir ein 0 .x/ y1 2 limx!b fg 0 .x/ ; y0 und bestimmen ein x2 2 /x3 ; bŒ mit f 0 .,/ < y1 g 0 .,/
für alle , 2 /x2 ; bŒ:
Dann gilt / . f .x/ f .u/ g.u/ < C y1 1 & g.x/ g.x/ g.x/
für alle u ¤ x aus /x2 ; bŒ mit
g.u/ ! g.x/ g.u/ mit: g.x/ <
g.u/ < 1: g.x/
Nun halten wir u so fest. Dann gilt
0 für x ! b. Also existiert nach dem
Meidungsprinzip ein x1 2 /x2 ; bŒ
1 für alle x 2 /x1 ; bŒ. Somit gilt
/ . f .x/ g.u/ f .u/ < C y1 1 & g.x/ g.x/ g.x/
für alle x 2 /x1 ; bŒ:
Hierin strebt die rechte Seite für x ! b gegen 0 C y1 ( 1 < y0 . Also existiert nach dem Meidungsprinzip ein x0 2 /x1 ; bŒ mit f .x/ . y0 g.x/
für alle x 2 /x0 ; bŒ:
Mit den beiden eingerahmten Aussagen ist die gemachte Behauptung im Fall 1 bewiesen. Fall 2: lim
x!b
f 0 .x/ 2 R [ f1g. g 0 .x/
Diesen Fall kann man behandeln, indem man den Fall 1 auf &f anstelle von f an0 .x/ wendet. So erhält man zu jedem e y 0 < limx!b fg 0 .x/ ein e x 0 2 /a; bŒ mit f .x/ %e y0 g.x/
für alle x 2 /e x 0 ; bŒ:
0
.x/ Als Konsequenz ergibt sich nun: Bei uneigentlichem limx!b fg 0 .x/ ist die Behauptung des Satzes in der eingerahmten Aussage des Falls 1 oder 2 enthalten. Bei eigentlichem
Abschnitt 4.5
$ Grenzwerte nach de l’Hospital
217
0
.x/ existieren zu jedem " > 0 nach den eingerahmten Aussagen des Falls 1 limx!b fg 0 .x/ und 2 Punkte x0 ; e x 0 2 /a; bŒ mit
e y 0 ´ lim
x!b
f 0 .x/ f 0 .x/ f .x/ &" . . y ´ lim C" für alle x 2 /max fx0 ; e x 0 g; bŒ: 0 g 0 .x/ g.x/ x!b g 0 .x/
Hieraus folgt dann ebenfalls die Behauptung des Satzes.
"
E. Bemerkungen. (i) Im Falle D(ii) ist es nicht nötig, etwas über limx!b f .x/ vorauszusetzen. Viel0 .x/ ¤ 0, dass mehr folgt aus den gemachten Annahmen, wenn außerdem limx!b fg 0 .x/ f .x/ von alleine gegen ˙1 strebt. Das liest man an der trivialen Gleichung f .x/ D 0 .x/ f .x/ ( g.x/ ab. Gilt dagegen zusätzlich, limx!b fg 0 .x/ D 0, so macht der Satz zwar die g.x/ Aussage über limx!b
f .x/ g.x/
D 0, aber nicht über lim f .x/. x!b
(ii) Man beachte, dass die Grenzwerte in Satz D einseitige Limites sind. Bei beidseitigen Limites (im Falle einer reellen Grenzwertstelle) können die Aussagen natürlich auf die zwei zugehörigen einseitigen Limites angewandt werden. Stimmen die Voraussetzungen auf beiden Seiten, ist insbesondere der Grenzwert von f 0 .x/=g 0 .x/ im beidseitigen Sinne vorhanden, so trifft die Behauptung ebenfalls für f .x/=g.x/ im beidseitigen Sinne zu. (iii) „Unbestimmte Ausdrücke“: Neben den Quotienten in den Sätzen A und D gibt es weitere Ausdrücke, bei denen etwas über die Konvergenz einzelner Bestandteile bekannt ist, man aber a priori nicht beurteilen kann, wie sich die Komponenten beim Grenzübergang gegenseitig beeinflussen, wer also „gewinnt“. Solchermaßen dargestellte Funktionen heißen unbestimmte Ausdrücke. Die wichtigsten Typen sind im Folgenden aufgelistet und dazu vermerkt, wie sie auf die Quotientenform zurückgeführt werden können: Typ „0=0“:
de l’Hospital D
Typ „1=1“:
de l’Hospital D
Typ „0 ( 1“:
schreibe z.B.:
Typ „1 & 1“:
schreibe z.B.:
f 1 g 1 1 & g f f &g D : 1 fg f (g D
Exponentialausdrücke kann man mittels Definition F[3.7] auf die vorgenannten Typen zurückführen: f g D e g(ln f :
218
Kapitel 4 Differentialrechnung
All dies sind Vorschläge, die man anwenden kann, aber nicht unbedingt anwenden muss. Oft gibt es andere Umformungen, die ebenfalls zum Ziel führen, z.B. das Kürzen oder Erweitern von Brüchen. Das hängt natürlich von der Bauart des vorgelegten Ausdrucks ab. Eine weitere Methode wird sich in Q[8.5] im Zusammenhang mit Potenzreihen ergeben. F. Beispiele. (i)
.
Was ist lim
x!0
1 1 & x x e &1
/ ?
Lösung: . / 1 1 ex & 1 & x lim D lim & x x!0 x x!0 x.e x & 1/ e &1
(E(iii) oder „Hauptnenner“)
ex & 1 D lim x x!0 e & 1 C xe x
. / 0 de l’Hospital D(i), Typ „ “ 0
ex D lim x x!0 e C xe x C e x
. / 0 de l’Hospital D(i), Typ „ “ 0
D
1 1 D : 1C0C1 2
Wenn man die Lösung so aufschreibt, bedarf sie eines Kommentars, da die de l’Hospitalschen Regeln an gewisse Bedingungen gebunden sind: Zunächst einmal wurden die Regeln wiederholt angewendet, was natürlich nur erlaubt ist, wenn jedesmal die genannten Voraussetzungen erfüllt sind. Dann aber ist zu beachten, dass alle Zwischenschritte zunächst „auf Verdacht“ gemacht wurden. Es muss ja immer erst der „Ableitungsquotient“ konvergieren, bevor man sagen kann, dass der „Funktionsquotient“ konvergiert. Daher ist in obiger Gleichungskette alles erst vom Ende her gerechtfertigt: Da der letzte Grenzwert existiert, tut es auch der vorletzte und dann schließlich der davor stehende. Man hat die Rechnung von unten her schrittweise zu überprüfen! Das ist im Folgenden genauso zu sehen, wird aber nicht nochmals betont. 1 (ii) Was ist lim cosn p ? n!1 n Lösung: Es handelt es sich um einen „diskreten“ Grenzübergang, d.h. einen Limes bei einer Folge (n durchläuft die natürlichen Zahlen). Von vornherein ist dafür de l’Hospital nicht zuständig. Man kann aber einen solchen diskreten Limes auf den entsprechenden „kontinuierlichen“ Limes zurückspielen, wenn dieser existiert.
Abschnitt 4.5
$ Grenzwerte nach de l’Hospital
219
Zunächst kann man gleich F[3.7] anwenden: p 1 cosn p D e n ln cos.1= n/ : n
(4)
Den entsprechenden kontinuierlichen Grenzübergang im letzten Exponenten behandelt man wie folgt: . / 1 ln cos t 1 1 Substitution p D t, d.h. x D 2 lim x ln cos p D lim x!1 t2 t t#0 x x & sin t D lim cos t 2t t#0 D lim & t#0
D&
. / 0 de l’Hospital D(i), Typ „ “ 0
sin t 1 ( 2 ( cos t t
1 (1 2(1
(Umformung) (G[4.4]):
Bei der Substitution beachtet man, dass mit x ! 1 gilt t # 0. Nach Anwendung von de l’Hospital gelangt man hier zu einem Quotienten, der auf bekannte Grenzwerte zurückgeführt werden kann. Will man darauf nicht zurückgreifen, so kann man natürlich nochmals de l’Hospital anwenden. Mit (4) folgt schließlich wegen der Stetigkeit der e-Funktion 1 1 lim cosn p D e &1=2 D p : n e
n!1
Aufgaben und Anmerkungen 1. Man bestimme folgende Grenzwerte: a) lim
x#0
ln x , cot x
b) lim
x!0
cos2 x & 1 C x 2 , x4
c)
lim
x!1
e x & e &x . e x C e &x
2. Sei a > 0 fest. Man bestimme folgende Grenzwerte: a)
lim
x!&1
axC1 & 1 , xC1
b)
lim n
n!1
(p n
) a&1 .
3. Man bestimme folgende Grenzwerte: / . 1 1 1=.x&1/ & , a) lim x , b) lim x!1 x!0 ln.1 C x/ x
. c) lim
x!0
sin x x
/1=x 2
.
5
Integralrechnung
Das Integral soll den Flächeninhalt unter einer Kurve messen. Sein Wert hängt also ab von der betreffenden Funktion wie auch von den Grenzen, zwischen denen das Flächenstück liegt. Aus dieser Vorstellung ziehen wir einfache Grundeigenschaften heraus und legen das Integral dann durch diese fest. Sei f W Œa; b/ ! R eine stetige Funktion mit (zunächst) nichtnegativen Werten. Der Flächeninhalt unter dem Graphen ist jedenfalls nichtnegativ, und er verhält sich bei zwei grundlegenden Operationen wie folgt: ' beim Unterteilen mit einem Zwischenpunkt c 2 Œa; b/ ist die Gesamtfläche F die Summe der Einzelflächen: F D F1 C F2 ;
f(x) a
F b
x
F1 a
F2 c
' beim Vervielfachen der Funktionswerte mit einer Konstanten ˛ % 0 multipliziert sich der Flächeninhalt mit der gleichen Konstanten.
b
α f(x)
a
x
b
Schließlich wird (was nicht so gut durch eine Figur zu motivieren ist) für die Summe zweier solcher Funktionen auch der Flächeninhalt die Summe aus den einzelnen Flächeninhalten sein, und man wird auch eine Normierung festlegen müssen. Wir werden sehen, dass die präzise Fassung dieser Grundsätze bereits das Integral charakterisiert.
5.1 Das bestimmte Integral Wir betrachten abgeschlossene Intervalle Œa; b/ * R mit a . b und darauf stetige Funktionen f W Œa; b/ ! R. Wir betrachten dafür eine Zuordnung .a; b; f / 7! Int.a; b; f / 2 R und verlangen für sie folgende Eigenschaften:
221
Abschnitt 5.1 Das bestimmte Integral
(I.1) Zerlegungsregel: Ist a . c . b, so gilt: Int.a; b; f / D Int.a; c; f / C Int.c; b; f /. (I.2) Positive Semidefinitheit: Ist f .x/ % 0 für alle x 2 Œa; b/, so gilt: Int.a; b; f / % 0. (I.3) Linearität: Für f; g W Œa; b/ ! R; ˛ 2 R gilt: Int.a; b; f C g/ D Int.a; b; f / C Int.a; b; g/ Int.a; b; ˛ ( f / D ˛ ( Int.a; b; f /
(Additivität) (Homogenität):
(I.4) Normierung: Für 0 2 R gilt: Int.a; b; 0 / D 0 ( .b & a/. In (I.1) ist rechts jeweils die Restriktion von f gemeint; in (I.4) bezeichnet 0 die konstante Funktion mit Wert 0 . Allgemeiner als bei der obigen Motivierung dürfen die betrachteten Funktionen auch negative Werte annehmen. Nun kann man natürlich viel verlangen. Die Frage ist, ob diese Regeln erfüllbar sind. Insofern ist die Situation ähnlich wie bei der Einführung der Exponentialfunktion in Abschnitt 2.4, wo wir ebenfalls gewisse Grundeigenschaften gefordert haben, aber dann zeigen konnten, dass sie von genau einer Funktion erfüllt werden. In der Tat werden wir hier analog beweisen, dass es genau eine Zuordnung mit den Eigenschaften (I.1) bis (I.4) gibt. D.h. der Integralbegriff für stetige Funktionen auf abgeschlossenen und beschränkten Intervallen ist hierdurch eindeutig bestimmt. Ausgehend von diesem Integral werden wir später in einem einzigen Approximationsschritt zu einem sehr allgemeinen Integralbegriff gelangen, dem so genannten LebesgueIntegral. Dieser wird dann eine sehr große Klasse auch unstetiger Funktionen erfassen. Der Aufbau ist jetzt so, dass wir zunächst viele Folgerungen aus den obigen Grundeigenschaften ziehen, und zwar solange, bis sich die Eindeutigkeit ergibt. Daraufhin wird die Existenz nachgewiesen. Diese Methode hat den Vorteil, dass wir uns in Zukunft (nachdem der Existenzbeweis erbracht sein wird) allein auf die wenigen Grundeigenschaften stützen und aus ihnen alles Nötige herausholen können. A. Satz (einfache Folgerungen aus (I.1) bis (I.4)). (i)
Int.a; a; f / D 0;
(ii)
Int.a; b; 0/ D 0;
(iii) Int.a; b; &f / D &Int.a; b; f /; (iv)
aus f .x/ . g.x/ für alle x 2 Œa; b/ folgt Int.a; b; f / . Int.a; b; g/ (Monotonie);
(v)
jInt.a; b; f /j . Int.a; b; jf j/
(Dreiecksungleichung).
222
Kapitel 5 Integralrechnung
In (v) bezeichnet jf j die Funktion x 7! jf .x/j. Beweis von A. Zu (i): Setze in (I.1) a D c D b. Dann entsteht an allen drei Plätzen Int.a; a; f /, und es folgt unmittelbar Int.a; a; f / D 0. Zu (ii): Setze in (I.3) ˛ D 0. Zu (iii): Setze in (I.3) ˛ D &1. Zu (iv): Aus f .x/ . g.x/ folgt g.x/ & f .x/ % 0. Daraus folgt mit (I.2): Int.a; b; g & f / % 0, also nach (I.3) und (iii): Int.a; b; g/ & Int.a; b; f / % 0 und daraus die Behauptung. Zu (v): Aus &jf .x/j . f .x/ . jf .x/j folgt mit (iii), (iv): &Int.a; b; jf j/ D Int.a; b; &jf j/ . Int.a; b; f / . Int.a; b; jf j/ und daraus die Behauptung.
"
B. Bemerkungen. (i)
Aus (v) folgt weiter mit (I.4): jInt.a; b; f /j . Int.a; b; jf j/ . Int.a; b; max jf j/ D max jf j ( .b & a/: Œa;b*
Œa;b*
(ii) Unter Beibehaltung von (I.1), (I.3), (I.4) kann (I.2) äquivalent ersetzt werden durch (I.2’)
jInt.a; b; f /j . Int.a; b; jf j/:
Denn daraus folgt rückwärts (I.2): f .x/ % 0 8 x 2 Œa; b/ H) f D jf j H) Int.a; b; f / D Int.a; b; jf j/ % jInt.a; b; f /j % 0: C. Satz (weitere Folgerung aus (I.1) bis (I.4)). Sei a < b. Wird F W Œa; b/ ! R definiert durch F .x/ ´ Int.a; x; f /; so ist F differenzierbar, und es gilt: F 0 .x/ D f .x/
für alle x 2 Œa; b/:
223
Abschnitt 5.1 Das bestimmte Integral
Beweis. Sei x0 2 Œa; bŒ fest und der Differenzenquotient von F (bei x0 ) zunächst gebildet für h > 0; x0 C h 2 Œa; b/ : Dann gilt nach (I.1): Int.a; x0 ; f / CInt.x0 ; x0 C h; f / D Int.a; x0 C h; f / ƒ‚ … „ „ ƒ‚ … F .x0 / F .x0 C h/ Hieraus folgt weiter der Reihe nach: F .x0 C h/ & F .x0 / D Int.x0 ; x0 C h; f / 1 F .x0 C h/ & F .x0 / D Int.x0 ; x0 C h; f / h h F .x0 C h/ & F .x0 / 13 & f .x0 / D Int.x0 ; x0 C h; f / & h ( f .x0 / h h 13 Int.x0 ; x0 C h; f / & Int.x0 ; x0 C h; f .x0 // D h D
1 Int.x0 ; x0 C h; f & f .x0 // h
ˇ ˇ ˇ F .x0 C h/ & F .x0 / ˇ 1 ˇ & f .x0 /ˇˇ . ( max jf & f .x0 /j ( h ˇ h h Œx0 ;x0 Ch* ˇ ˚ , D max jf .x/ & f .x0 /j ˇ x0 . x . x0 C h : Im letzten Term der vierten Zeile bezeichnet f .x0 / die konstante Funktion mit Wert f .x0 /. Ist nun ein " > 0 gegeben, so existiert wegen der Stetigkeit von f ein ı > 0 mit der Eigenschaft: jf .x/ & f .x0 /j < " für alle x 2 Œa; b/ mit jx & x0 j < ı. Damit gilt nach der letzten Rechnung ˇ ˇ ˇ F .x0 C h/ & F .x0 / ˇ ˇ & f .x0 /ˇˇ < "; wenn 0 < h < ı: ˇ h Dies zeigt: F .x0 C h/ & F .x0 / D f .x0 / h h#0
lim
für x0 2 Œa; bŒ:
Analog erkennt man das Gleiche für x0 2 /a; b/ bzgl. des Grenzübergangs h " 0, also die Behauptung insgesamt. " D. Satz. Es gibt höchstens eine Zuordnung mit den Eigenschaften (I.1) bis (I.4).
224
Kapitel 5 Integralrechnung
Beweis. Hat man neben Int eine zweite Zuordnung, If nt, so schließt man im Fall a < b e .x/ ´ If nt.a; x; f / die gleiche so: Nach Satz C haben F .x/ ´ Int.a; x; f / und F e .a/ D 0. Daraus folgt laut D(ii)[4.3]: F D F e , also Ableitung und erfüllen F .a/ D F e .b/, d.h. Int.a; b; f / D If speziell F .b/ D F nt.a; b; f /. Im Fall a D b ist sowieso Int.a; a; f / D 0 D If nt.a; a; f /. " Zum Existenzbeweis benötigen wir folgenden Hilfssatz: E. Lemma. Ist f W Œa; b/ ! R stetig, so existiert zu jedem " > 0 ein ı D ı."/ > 0 mit der Eigenschaft: Für alle x; x0 2 Œa; b/ mit jx & x0 j < ı gilt jf .x/ & f .x0 /j < ". Die Behauptung ist die so genannte gleichmäßige Stetigkeit von f . Das Attribut „gleichmäßig“ soll ausdrücken, dass das jetzige ı nur von " abhängt, während bei der bloßen Stetigkeit ı auch von x0 abhängen darf. Die gleichmäßige Stetigkeit wird in Abschnitt 6.5 allgemein diskutiert werden. Man beachte die völlige Gleichberechtigung von x und x0 in der Behauptung! Beweis von E. Sei ein " > 0 gegeben. Angenommen, ı existiert nicht. Dann gibt es zu jedem ı D n1 , wobei n 2 N, Punkte xn ; e x n 2 Œa; b/ mit: jf .xn / & f .e x n /j % " und jxn & e xnj <
1 : n
Wähle eine konvergente Teilfolge xnk ! c 2 Œa; b/, was nach Bolzano/Weierstraß E[2.6] möglich ist. Dann gelten für alle k 2 N die Ungleichungen jf .xnk / & f .e x nk /j % " und jxnk & e x nk j <
1 : nk
Aus der zweiten folgt wegen ( ) e x nk D xnk & xnk & e x nk e x nk ! c & 0 D c und damit aus der ersten jf .c/ & f .c/j % " aufgrund der Stetigkeit von f , Widerspruch! " Es sei nochmals auf den Unterschied zwischen gewöhnlicher Stetigkeit und gleichmäßiger Stetigkeit von f W Œa; b/ ! R hingewiesen, und zwar anhand der formalen Definition dieser Begriffe in den folgenden beiden Zeilen: (gew) (glm)
8 x0 2 Œa; b/; " > 0 9 ı > 0 8 x 2 Œa; b/ mit jx & x0 j < ı W jf .x/ & f .x0 /j < " 8 " > 0 9 ı > 0 8 x; x0 2 Œa; b/ mit jx & x0 j < ı W jf .x/ & f .x0 /j < ":
225
Abschnitt 5.1 Das bestimmte Integral
Die Größe ı darf von den Objekten abhängen, die zuvor mit dem Allquantor 8 eingeführt sind, also im ersten Fall von x0 und ", im zweiten Fall nur von ". Aus der gleichmäßigen Stetigkeit folgt allgemein die gewöhnliche Stetigkeit, nicht aber umgekehrt. Die Umkehrung gilt allerdings nach obigem Lemma, wenn die Definitionsmenge ein abgeschlossenes und beschränktes Intervall ist. Zurück zum Integral: Es fehlt bisher eine wesentliche Komponente, nämlich die Existenz einer Zuordnung mit den obigen Eigenschaften (I.1) bis (I.4). Das schaffen wir mittels Approximation stetiger Funktionen durch Funktionen, deren Integral unmittelbar angegeben werden kann. Die elementarste Annäherung an eine allgemeine Funktion erfolgt ohne Zweifel durch Funktionen, die stückweise konstant sind, die so genannten Treppenfunktionen. F. Definition. Eine Funktion f W Œa; b/ ! R wird Treppenfunktion genannt, wenn es endlich viele Stellen a D x0 < x1 < ( ( ( < xn D b gibt, sodass f auf allen offenen Teilintervallen /xk&1 ; xk Œ dazwischen konstant ist. Eine solche Punktmenge (1)
Z D fx0 ; x1 ; : : : ; xk g mit a D x0 < x1 < ( ( ( < xn D b;
wird als Zerlegung des Intervalls Œa; b/ bezeichnet, und die xk heißen die Teilpunkte und die Intervalle /xk&1 ; xk Œ die Teilintervalle von Z. Ist das Intervall Œa; b/ einpunktig (also gleich Œa; a/), so ist nur die leere Zerlegung Z D ¿ möglich, und jede Funktion auf Œa; a/ mit reellem Wert gilt als Treppenfunktion. Über die Funktionswerte f .xk / in den Teilpunkten wird nichts gefordert (außer dass es reelle Zahlen sind). Natürlich können zur gleichen Treppenfunktion verschiedene Zerlegungen von Œa; b/ gehören, z.B. dann wenn zu einer vorhandenen Zerlegung weitere Teilpunkte hinzugenommen werden. Das Integral einer Treppenfunktion sollte aber davon unabhängig sind. Dies ist auch so, wenn das Integral wie folgt definiert wird: G. Definition. Ist f W Œa; b/ ! R eine Treppenfunktion zur Zerlegung (1) und ist ck jeweils ihr Funktionswert auf dem Teilintervall /xk&1 ; xk Œ, so sei das Integral von f über Œa; b/ definiert als Z (2)
a
b
f ´
n X
ck ( .xk & xk&1 /:
kD1
Speziell im Fall a D b wird das Integral als 0 festgesetzt.
226
Kapitel 5 Integralrechnung
Beweis zur Rechtfertigung. Zur Rechtfertigung ist zu zeigen, dass für zwei Zerlegungen Z und Z 0 , die zur gleichen Funktion f gehören, die Summen in (2) den gleichen Wert haben. Dazu betrachtet man die Vereinigung Z [ Z 0 , deren Elemente (monoton angeordnet) wiederum eine zu f gehörende Zerlegung darstellen. Nun kann man schrittweise Z zu Z [ Z 0 auffüllen, indem man jeweils einen Teilpunkt von Z 0 hinzunimmt. Dabei ändert sich der Wert der Summe nicht. Liegt z.B. im ersten Schritt der hinzugenommene Punkt z 0 im Intervall /xk&1 ; xk Œ, so enthält die Summe zu Z [ fz 0 g anstelle des alten Summanden ck ( .xk & xk&1 / nunmehr die zwei neuen Summanden ck ( .z 0 & xk&1 / und ck ( .xk & z 0 /, die zusammen gerade den alten Summanden ergeben. So bleibt der Summenwert beim Übergang von Z zu Z [ Z 0 schrittweise immer konstant, also auch insgesamt. Dasselbe geschieht beim Übergang von Z 0 zu Z [ Z 0 . Also stimmen auch die Summenwerte für Z und Z 0 überein. " Das Integral für Treppenfunktionen hat schon mal die Grundeigenschaften, die man sinnvollerweise von einem Integralbegriff erwarten sollte: H. Lemma. Sind f; g Treppenfunktionen von Œa; b/ in R und ist ˛ 2 R, so sind auch f C g, ˛f und jf j Treppenfunktionen von Œa; b/ in R, und es gilt: (i) (ii)
Z b Z c Z b f .x/ C f. Zerlegungsregel: Für a . c . b ist f D a a c ˇ ˇZ ˇ b ˇ Z b ˇ ˇ Abschätzungsregel: ˇ jf j. fˇ. ˇ a ˇ a
(iii) Linearität: Z
b a
Z .f C g/ D
Z
b
a
Z (iv)
Normierung:
b
a
b a
˛(f D˛(
Z f C
Z a
b
a
b
g
f
(Additivität) (Homogenität):
˛ D ˛ ( .b & a/.
Wir hatten schon in B(ii) gesehen, dass aus der Abschätzungsregel sehr leicht die positive Semidefinitheit folgt: Z f .x/ % 0 8 x 2 Œa; b/ H)
b a
f % 0:
Umgekehrt impliziert die positive Semidefinitheit die Abschätzungsregel. Wir arbeiten lieber mit der Abschätzungsregel, da sie später für vektorwertige Funktionen ebenfalls Sinn macht.
227
Abschnitt 5.1 Das bestimmte Integral
Beweis von H. Dass mit f; g auch f C g wieder eine Treppenfunktion ist, sieht man wie oben, indem die Vereinigung der einzelnen Teilpunktmengen gebildet wird. Auf den zugehörigen offenen Teilintervallen ist dann f C g jeweils konstant. Noch einfacher ist es bei ˛f und jf j; hier kann die ursprüngliche Zerlegung beibehalten werden. Zu (i): Nimmt man zu der ursprünglichen Zerlegung von f noch den Teilpunkt c hinzu, so setzt sich diese aus einer Zerlegung von Œa; c/ und von Œc; b/ zusammen, und die Summe in (2) besteht gerade aus den entsprechenden zwei Einzelsummen. Zu (ii): Dies ergibt sich einfach, indem auf die Summe in (2) die Dreiecksungleichung angewandt wird. Zu (iii): Wie gesagt, als Zerlegung für f C g verwendet man die Vereinigung der gegebenen Zerlegungen von f und g. Auf den offenen Teilintervallen addieren sich dann die konstanten Werte von f und g zu denen von f C g. Die Summe in (2) für f C g entsteht daher durch Addition der entsprechenden Summen von f und g einzeln. Analog entsteht die Summe für ˛f aus der für f durch Multiplikation mit ˛. Zu (iv): Auch dies ist anhand der Summe in (2) unmittelbar klar.
"
Der entscheidende Schritt besteht jetzt darin, stetige Funktionen durch Treppenfunktionen zu approximieren und bei dieser Approximation das Integral einfach „mitzuziehen“. Das geht gut, weil die Approximation durch Treppenfunktionen sogar gleichmäßig erfolgen kann: I. Satz. Ist die Funktion f W Œa; b/ ! R stetig und ein " > 0 gegeben, so existiert eine Treppenfunktion g W Œa; b/ ! R derart, dass für alle x 2 Œa; b/ gilt: jf .x/ & g.x/j . ": Beweis. Da f gleichmäßig stetig ist, gibt es zum gegebenen " > 0 ein ı > 0 derart, dass jf .x/ & f .e x /j < " ausfällt, wenn nur jx & e x j < ı ist, egal wo x und e x im Intervall Œa; b/ liegen; vgl. Lemma E. Sei nun eine Zerlegung Z D fx0 ; : : : ; xN g von Œa; b/ so gewählt, dass xk & xk&1 < ı
für k D 1; : : : ; N :
Die gesuchte Treppenfunktion g W Œa; b/ ! R sei dadurch definiert, dass ihr konstanter Wert auf jedem Teilintervall Œxk&1 ; xk Œ gleich f .xk&1 / gesetzt wird (und g.b/ ´ f .b/). Dann gilt jf .x/ & g.x/j < "
228
Kapitel 5 Integralrechnung
zunächst auf jedem Intervall Œxk&1 ; xk Œ, weil dort je zwei Argumente einen Abstand " < ı haben, also schließlich für alle x 2 Œa; b/. Soll nun eine stetige Funktion f integriert werden, so approximiert man sie immer feiner durch Treppenfunktionen und bildet den Grenzwert ihrer Integrale: J. Definition. Zur stetigen Funktion f W Œa; b/ ! R wähle man eine Nullfolge ."k / in RC und zu jedem k eine Treppenfunktion fk mit: jf .x/ & fk .x/j < "k
für alle x 2 Œa; b/:
Dann sei das Integral von f über Œa; b/ definiert durch Z b Z b (3) f ´ lim fk : k!1 a
a
Beweis zur Rechtfertigung. Es ist zweierlei zu zeigen: Erstens dass der Grenzwert in (3) existiert und zweitens, dass er unabhängig von den getroffenen Wahlen ist. 1) Wir zeigen, dass die Integralwerte Z wk ´
a
b
fk
eine Cauchy-Folge in R bilden: Zunächst gilt jfk & f` j D j.fk & f / C .f & f` /j . jfk & f j C jf & f` j < "k C "` : Hieraus folgt aufgrund der Integrationsregeln für Treppenfunktionen die Vorausabschätzung: ˇ Z ˇZ Z b ˇ ˇ b b ˇ ˇ ."k C "` / D ."k C "` / ( .b & a/: jfk & f` j . jwk & w` j D ˇ .fk & f` /ˇ . ˇ ˇ a a a Wegen "k ! 0 kann die zuletzt erhaltene Schranke beliebig klein gemacht werden, wenn nur beide Indizes k; ` hinreichend groß gewählt werden. Das beweist die Cauchy-Eigenschaft der Folge .wk / und damit ihre Konvergenz. 2) Um die Unabhängigkeit von den getroffenen Wahlen zu beweisen, sei für f neben den Folgen ."k / und .fk / eine zweite Nullfolge .1k / in RC und eine zugehörige Folge .hk / von Treppenfunktionen mit jf .x/ & hk .x/j < 1k
für alle x 2 Œa; b/
betrachtet. Es ist zu zeigen: Z (4)
lim
k!1 a
b
Z fk D lim
k!1 a
b
hk :
229
Abschnitt 5.1 Das bestimmte Integral
Man startet wieder mit der Abschätzung der Funktionen: jfk & hk j . jfk & f j C jf & hk j < "k C 1k : Hieraus folgt analog wie bei 1) die Vorausabschätzung ˇZ Z b ˇˇ Z b ˇ b ˇ ˇ f & hk ˇ . jfk & hk j . ."k C 1k / ( .b & a/: ˇ ˇ ˇ a k a a Z Dies zeigt, dass die Differenzen die Behauptung (4).
Z
b
fk &
a
a
b
hk eine Nullfolge bilden. Dies impliziert "
Schließlich übertragen sich die Integrationsregeln von den Treppenfunktionen per Grenzübergang auf entsprechende Integrationsregeln für stetige Funktionen: K. Satz. Die Regeln von Lemma H gelten im gleichen Wortlaut auch für stetige Funktionen f; g W Œa; b/ ! R. Beweis. Wenn zur stetigen Funktion f die Objekte ."k / und .gk / wie in Definition J gewählt sind, so wollen wir vorübergehend die Sprechweise gebrauchen, die Treppenfunktionen gk seien approximierend für f . Die Eigenschaften (i) bis (iv) werden alle nach dem gleichen Muster behandelt. Dazu seien approximierende Treppenfunktionen fk für f und gk für g gewählt. Außerdem kann man annehmen, dass für jedes k die Treppenfunktionen fk und gk zur gleichen Zerlegung gehören, indem man nötigenfalls zur Vereinigung der Teilpunkte übergeht. Dann ergeben sich durch Grenzübergang k ! 1 direkt die folgenden Implikationen: Z b Z c Z b Z b Z c Z b f f C f D fk H) fk C fk D
Z a
b
a
a
c
a
a
ˇ ˇZ ˇ ˇZ ˇ b ˇ Z b ˇ b ˇ Z b ˇ ˇ ˇ ˇ fˇ. f ˇ. jf j jfk j H) ˇ ˇ ˇ a ˇ ˇ a kˇ a a Z
.fk C gk / D Z
b a
b
a
Z fk C
b
a
Z .˛fk / D ˛
a
b
Z gk H)
b a
Z fk H)
a
b
Z .f C g/ D
a
Z .˛f / D ˛
b
a
b
c
Z f C
a
b
g
f;
während die letzt Regel einfach beibehalten wird, da eine konstante Funktion sowohl stetig wie auch Treppenfunktion ist. Dabei hat man zu beachten:
230
Kapitel 5 Integralrechnung
Für die erste Zeile: Die Restriktionen gk jŒa; c/ und gk jŒc; b/ bilden approximierende Treppenfunktionen für f jŒa; c/ und f jŒc; b/. Für die zweite Zeile: Die Treppenfunktionen jf für jf j aufˇ k j sind approximierend ˇ ˇ ˇ grund der modifizierten Dreiecksungleichung: ˇ jf j & jfk j ˇ . jf & fk j. Für die dritte Zeile: Die Treppenfunktionen fk C gk sind approximierend für f C g aufgrund der Dreiecksungleichung: j.f C g/ & .fk C gk /j . jf & fk j C jg & gk j. Für die vierte Zeile: Die Treppenfunktionen ˛fk sind approximierend für ˛f aufgrund von j˛f & ˛fk j D j˛j jf & fk j. " Damit ist der Existenzbeweis für eine Zuordnung mit den Grundeigenschaften (I.1) – (I.4) erbracht, und wir können zusammenfassen: L. Satz. Es existiert genau eine Zuordnung, die jeder stetigen reellen Funktion f auf einem Intervall Œa; b/ eine reelle Zahl Int.a; b; f / zuweist und die Eigenschaften (I.1) bis (I.4) besitzt. Int(a,b,f) ist durch die Vorschrift (3) realisierbar: Z Z b Int.a; b; f / D f D lim a
k!1 a
b
fk :
"
Sehr oft wird die klassische Schreibweise mit Variablen gebraucht: Z b Z b f .x/ dx: f µ (5) a
a
In dem damit eingeführten Symbol ist das x eine „stumme“ Variable so wie ein Summationsindex, d.h. x ist austauschbar durch jede andere noch nicht verbrauchte Variable. Z.B. kann man auch schreiben Z b Z b f .t/ dt; etc. f .x/ dx D a
a
Das Symbol „dx“ hat vorerst keine inhaltliche Bedeutung. Wir werden es am Ende dieses Abschnitts motivieren. Man spricht auch vom bestimmten Integral (im Gegensatz zu der in 5.4 zu besprechenden Variante des „unbestimmten Integrals“). Die Abschätzungsregel kann in folgender Weise ergänzt werden: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ jf .x/j dx . max jf j ( .b & a/: f .x/ dx ˇ . ˇ ˇ ˇ a Œa;b* a Dabei ergibt sich die zweite Ungleichung aus der Monotonie zusammen mit der Normierung. Hierin heißt die erste Abschätzung auch Dreiecksungleichung, Anfang und Ende der Kette die Standard-Abschätzung des Integrals.
231
Abschnitt 5.1 Das bestimmte Integral
Weitere Schreibweisen und Namengebungen: Z
b a
Z
b a
Z 1 dx µ
b
a
g.x/ dx µ f .x/
Z dx; Z a
b
b
a
1 dx µ f .x/
g.x/ dx ; f .x/
Z
b a
Z
b
dx ; f .x/
a
Zb µ
: a
Hierin heißt: a die untere Grenze, b die obere Grenze, f oder f .x/ dx oder f .x/ der Integrand und dx das Differential. An dieser Stelle wäre es ein Irrtum zu glauben, man müsse nur das Integral oder den Flächeninhalt durch irgendwelche Verfahren beliebig genau annähern. Approximieren kann man nämlich nur Objekte, die zuvor definiert waren. Das trifft weder für das Integral noch für den Flächeninhalt zu. Es ist gerade umgekehrt so, dass wir das Integral durch die derzeitigen Überlegungen erst definieren und darauf fußend dann auch den Flächeninhalt erfassen können. M. Definition. Ist die stetige Funktion f W Œa; b/ ! R überall nichtnegativ, so ist der Flächeninhalt A unter dem Graphen von f der Wert des Integrals Z A´
a
b
f .x/ dx:
Die Punktmenge des R2 , auf die sich diese Definition bezieht, ist die so genannte Ordinatenmenge Of ´ f.x; y/ 2 R2 j a . x . b; 0 . y . f .x/g: Diese Definition erlaubt also die Inhaltsberechnung von krummlinig begrenzten Punktmengen des R2 . Allerdings ist dieser Inhaltsbegriff recht eng, da lediglich eine Seite der Punktmenge krumm sein darf (nämlich der Graph von f selbst) und weil die Punktmenge doch eine sehr spezielle Lage zum „Koordinatensystem“ hat. Wir werden später in Gestalt des Maßes eine viel allgemeinere Definition des Flächeninhalts und des Volumens finden, die dann auch invariant gegenüber Bewegungen der Punktmenge sein wird. Integralapproximation durch Riemann-Summen Das Integral einer Treppenfunktion, wie es in Definition J zur Integralapproximation stetiger Funktionen diente, ist im Grunde nichts anderes als eine klassische Näherungssumme. Solche Näherungssummen werden in verschiedenen Ausformungen immer wieder gebraucht. Wir wollen sie unabhängig von den Treppenfunktionen erneut
232
Kapitel 5 Integralrechnung
behandeln und zwar alleine aus den Grundeigenschaften heraus. Damit dies „"-frei“ formuliert werden kann, führen wir zuvor den Begriff des Stetigkeitsmoduls ein. Dieser ist ein Maß dafür, wie gut die gleichmäßige Stetigkeit einer Funktion ausgeprägt ist. N. Definition und Satz. Die Funktion f W Œa; b/ ! R sei stetig. Für jedes 1 > 0 heißt die Größe ˇ ˚ , !f .1/ ´ sup jf .x/ & f .e x /j ˇ x; e x 2 Œa; b/; jx & e xj < 1 der Stetigkeitsmodul von f (bzgl. 1). Dieser existiert in R. Es gilt die Monotonie 0 < 11 . 12 H) !f .11 / . !f .12 / sowie
lim !f .1/ D 0: ,#0
Beweis. Die Existenz des Supremums in R ergibt sich aus der Abschätzung jf .x/ & f .e x /j . 2 maxŒa;b* jf j, die Monotonie mittels M(i)[1.4]. Die gleichmäßige Stetigkeit, wie oben in Lemma E formuliert, impliziert: !f .ı."// . ". Daraus folgt mit der Monotonie: !f .1/ . " für alle 1 . ı."/ (" und 1 stets positiv). Somit gilt !f .1/ ! 0 (für 1 # 0). " O. Beispiele. (i) Ist f W Œa; b/ ! R dehnungsbeschränkt mit der Lipschitz-Konstanten * % 0, so gilt jf .x/ & f .e x /j . *jx & e x j. Hieraus liest man ab: !f .1/ . *1: Aus der Dehnungsbeschränktheit folgt also ein „sublineares“ Verhalten des Stetigkeitsmoduls. (ii) Ist f W Œa; b/ ! R differenzierbar mit beschränkter Ableitung f 0 , so ist f nach dem Mittelwertsatz dehnungsbeschränkt mit der Lipschitz-Konstanten maxŒa;b* jf 0 j; vgl. L[4.3]. Somit gilt hier !f .1/ . max jf 0 j ( 1: Œa;b*
(iii) Von (i) gilt auch die Umkehrung: Ist f W Œa; b/ ! R stetig und gilt mit einer Konstanten * % 0 stets !f .1/ . *1, so ist f dehnungsbeschränkt mit der LipschitzKonstanten *. Zu x; e x 2 Œa; b/ wähle man nämlich eine Folge 1n > jx & e x j mit 1n ! jx & e x j (für n ! 1). Dann gilt jf .x/ & f .e x /j . !f .1n / . *1n . Hieraus folgt durch Grenzübergang n ! 1: jf .x/ & f .e x /j . *jx & e x j.
233
Abschnitt 5.1 Das bestimmte Integral
Wir zeigen nun, wie die traditionelle Integraldarstellung durch Riemann-Summen allein aus den Grundeigenschaften gefolgert werden kann: P. Definition und Satz. Ist Z (1) eine Zerlegung des Intervalls Œa; b/, so ist ihr Feinheitsmaß ıZ definiert als maximaler Abstand benachbarter xk : ˇ ıZ ´ max fjxk & xk&1 j ˇ 1 . k . ng: Ist die Funktion f W Œa; b/ ! R stetig und Z eine Zerlegung von Œa; b/, so ist eine zugehörige Zerlegungssumme oder Riemann-Summe von der Form n X
f .2k / ( .xk & xk&1 /;
kD1
wobei die 2k 2 Œxk&1 ; xk / irgendwie gewählt sind. Dann gilt (6)
ˇZ ˇ ˇ ˇ
b a
f .x/ dx &
n X kD1
ˇ ˇ f .2k / ( .xk & xk&1 /ˇˇ . !f .ıZ / ( .b & a/:
In der Abschätzung (6) ist enthalten, dass das Integral beliebig genau durch RiemannSummen approximiert wird, nämlich durch solche, bei denen das Feinheitsmaß ıZ hinreichend klein ist (vgl. N). Beweis von P. Wir schätzen unter Verwendung der rechts genannten Grundeigenschaften ab: ˇZb ˇ n ˇ ˇ X ˇ ˇ f .2k / ( .xk & xk&1 /ˇ ˇ f .x/ dx & ˇ ˇ kD1 a ˇ n Zxk ˇ Zxk n ˇX ˇ X ˇ ˇ Dˇ f .x/ dx & f .2k / dx ˇ ˇ ˇ kD1xk#1 kD1xk#1 ˇ n 0 !ˇ Zxk Zxk ˇ ˇX ˇ ˇ Dˇ f .x/ dx & f .2k / dx ˇ ˇ ˇ kD1 xk#1 xk#1 ˇ n 0 Zxk !ˇ ˇ ˇX ˇ ˇ .f .x/ & f .2k // dx ˇ Dˇ ˇ ˇ kD1
xk#1
(I.1), (I.4)
(I.3)
234
Kapitel 5 Integralrechnung
. . D
Zxk n X
jf .x/ & f .2k /j dx
A(v)
!f .ıZ / dx
A(iv)
!f .ıZ / ( .xk & xk&1 /
(I.4)
kD1 xk#1 Zxk n X kD1 xk#1 n X kD1
D !f .ıZ / ( .b & a/: Anfang und Ende dieser Kette enthalten die Behauptung (6).
"
Die Approximierbarkeit des Integrals durch Riemann-Summen kann man auch so ausdrücken: Durchläuft man eine Folge .Zm / von Zerlegungen derart, dass die zugehörigen Feinheitsmaße ıZm gegen 0 konvergieren, so streben die zugehörigen RiemannSummen für m ! 1 gegen das Integral. Dabei hat man noch völlig freie Hand in der Wahl der Zwischenstellen 2k . Speziell kann man für 2k eine Minimal- bzw. Maximalstelle von f in Œxk&1 ; xk / nehmen. Die zugehörigen Riemann-Summen heißen dann Unter- bzw. Obersummen. Das Integral wird also speziell durch solche Unterbzw. Obersummen beliebig genau approximiert (und zwar von unten bzw. von oben her, wie man durch die entsprechende Abschätzung genau wie bei P sieht). f
f
a
xj-1 θj xj
b
x
a
b
x
Riemann- bzw. Unter- und Obersummen
Q. Beispiel. Ist f W Œa; b/ ! R dehnungsbeschränkt mit der Lipschitz-Konstanten * % 0 bzw. differenzierbar mit beschränkter Ableitung f 0 , so folgt aus (6) mittels der Beispiele O(i),(ii): 8 * ( ıZ ( .b & a/ ˇ ˆ ˇZ b n X ˇ < ˇ bzw. ˇ ˇ f .x/ dx & f .2k / ( .xk & xk&1 /ˇ . ˇ ˆ a : max jf 0 j ( ıZ ( .b & a/; kD1
Œa;b*
womit der Fehler zwischen Integral und Riemann-Summe direkt abschätzbar wird. In der numerischen Mathematik werden solche Integralnäherungen zu noch effektiveren Quadraturformeln ausgebaut.
235
Abschnitt 5.1 Das bestimmte Integral
R. Bemerkung. Das Integral kann in einfacher Weise auf Funktionen g W Œa; b/ ! R ausgedehnt werden, die stückweise stetig sind. Dies bedeutet, dass eine & Zerlegung * U D fa0 ; a1 ; : : : ; aN g von Œa; b/ existiert, sodass jede Restriktion gj aj &1 ; aj eine stetige Fortsetzung gj auf Œaj &1 ; aj / besitzt (j D 1; : : : ; N ). Unstetigkeiten von g liegen dann höchstens an den Teilpunkten der Zerlegung vor, und es handelt sich allenfalls um Sprungstellen. In diesem Fall setzt man Z (7)
a
b
f .x/ dx ´
N Z X
aj
j D1 aj #1
gj .x/ dx:
Diese Definition ist in Wirklichkeit unabhängig von der Wahl der Zerlegung, wie man mit Hilfe von (I.1) zeigen kann. Das soll hier nicht weiter ausgeführt werden, da wir später viel allgemeinere Zerlegungssätze beweisen werden. Genau wie in Definition M wird auch bei einer stückweise stetigen Funktion mit nichtnegativen Werten der Flächeninhalt A der Ordinatenmenge durch das Integral (7) definiert. In einfachen Fällen können Riemann-Summen auch zur exakten Berechnung bestimmter Integrale verwendet werden, nämlich dann, wenn der Grenzwert irgendeiner Folge von Riemann-Summen mit ıZm ! 0 bekannt ist. Zur Auffindung einer solchen Folge hat man einen ziemlichen Spielraum, da die Punkte der Zerlegung und auch die Zwischenstellen noch passend gewählt werden können. Oft nimmt man eine Zerlegung Zn in n 2 N gleich lange Teilintervalle: Zn ´ fx0 ; : : : ; xn g;
xk ´ a C
k .b & a/; n
k D 0; : : : ; n;
eine so genannte äquidistante Zerlegung. Hierbei gilt ıZn D .b & a/=n, sodass die Forderung ıZn ! 0 mit n ! 1 äquivalent ist. Die einfachste Wahl der Zwischenstellen 2k ist 2k D xk&1 oder 2k D xk . Aber es gibt auch Situationen, in denen man mit anderen Zerlegungspunkten oder Zwischenstellen besser fährt. S. Beispiel. Sei f .x/ D x und Œa; b/ D Œ0; 1/. Die Zerlegung sei äquidistant: Zn ´ fx0 ; : : : ; xn g mit xk ´
k ; k D 0; : : : ; n; n
und etwa 2k ´ xk . Dann wird die zugehörige Riemann-Summe unter Verwendung der arithmetischen Summenformel E[1.3] n X
(8)
n n X 1 X k 1 ( D 2 f .2k /.xk & xk&1 / D k n n n kD1 kD1 kD1 . / 1 1 1 1 1C : D 2 ( n.n C 1/ D n 2 2 n
236
Kapitel 5 Integralrechnung
Der Grenzwert hiervon für n ! 1 ist 1=2, somit Z 1 1 x dx D : 2 0 Die Fehlerschranke ist nach Q (wegen f 0 D 1 und ıZn D n1 ) gegeben durch 1 ( n1 ( 1 D 1 1 . Tatsächlich ist der Fehler exakt gleich 2n , wie man an (8) erkennt. n Solche direkten Integralauswertungen gelingen nur in wenigen Fällen exakt, weil die Riemann-Summen explizit berechnet und der Grenzübergang wirklich durchgeführt werden muss. Viel effektiver sind die Methoden, die auf dem Hauptsatz der Differential- und Integralrechnung beruhen. Dieser liegt im Kern schon in Satz C vor und wird im nächsten Abschnitt weiter ausgebaut Die Überlegungen zu den Riemann-Summen unterstreichen die Vorstellung, dass das Integral näherungsweise eine Summe von Inhalten kleiner Flächenstreifen unter der Kurve y D f .x/ ist, wobei im Limes für ıZ ! 0 exakt das Integral herauskommt. Man kann also sagen, das Integral sei eine „kontinuierliche“ oder „verschmierte“ Summe. Das drückt sich auch in dem klassischen Integralsymbol (5) aus. Dieses ist der Bauart einer Zerlegungssumme nachgebildet. Insbesondere soll das „dx“ an den Term xk & xk&1 in der Zerlegungssumme erinnern. Aus P folgt erneut die Eindeutigkeit des Integralbegriffs für stetige Funktionen mit den Eigenschaften (I.1) – (I.4). In Analysis 2 werden wir vom eindeutig bestimmten Integral stetiger Funktionen mittels eines einzigen Approximationsschrittes zum Lebesgue-Integral gelangen. Von diesem Standpunkt aus betrachtet sind weitere Zwischenstadien für Integrale, wie sie im Laufe der Zeit entwickelt wurden, für den Aufbau der Theorie entbehrlich. Aufgaben und Anmerkungen 1. Nach dem Muster von Beispiel S berechne man: Z 2. Analog zeige man Zerlegung.
a
b
Z a
b
x dx D
b 2 & a2 . 2
e x dx D e b & e a über Riemann-Summen mit äquidistanter
3. Für feste p 2 N und 0 < a < b berechne man Z b b pC1 & apC1 x p dx D pC1 a über die Riemann-Summen zu „geometrischen“ Zerlegungen. Eine solche ist für jedes n 2 N gegeben durch r n b 2 n&1 n Zn ´ fa; aq; aq ; : : : ; aq ; aq g; mit q ´ („Prinzip der Tonleiter“): a
Abschnitt 5.2 Der Hauptsatz der Differential-und Integralrechnung
237
4. $ Sei f W Œa; b/ ! R stetig und a < b. Bei äquidistanter Zerlegung von Œa; b/ in n Teilintervalle mit den Endpunkten xk ´ a C kn .b & a/, k D 0; : : : ; n gilt nach P Z b n b&a X lim f .xk / D f .x/ dx: n!1 n a kD1
Die Frage ist, wie „stark“ die Differenz Z b n b&a X f .xk / & f .x/ dx rn ´ n a kD1
gegen 0 konvergiert. Falls f eine stetige Ableitung f 0 W Œa; b/ ! R besitzt, so zeige man: . / ˇ ˇ .b & a/2 b&a b&a ˇ ˇ a) ˇrn & . .f .b/ & f .a//ˇ . !f 0 2n 2n n b&a b) lim nrn D .f .b/ & f .a//. n!1 2 c) Mit der Landau-Symbolik von Aufgabe 6[3.5] folgt aus a): . / Z b n b&a X b&a 1 f .x/ dx D f .xk / & : .f .b/ & f .a// C o n 2n n a kD1
Das ist eine Variante der so genannten Trapezregel, die zur näherungsweisen Berechnung von Integralen dienen kann; vgl. auch Aufgabe 8[11.1].
5.2
Der Hauptsatz der Differential-und Integralrechnung
Dieser Satz stellt eine starke Koppelung zwischen den Prozessen der Differentiation und Integration her. Er liefert das wichtigste Werkzeug, um bestimmte Integrale in expliziter Weise zu berechnen. Dazu sind dann keine Grenzübergänge erforderlich; die Berechnung erfolgt rein kalkülmäßig. Es gibt einen sehr anschaulichen Hintergrund für seine Gültigkeit, den wir im Laufe der Diskussion besprechen werden. Von diesem Hauptsatz existieren mehrere Varianten, die unterschiedliche Sachverhalte betreffen. Eine erste Form haben wir bereits kennen gelernt: es ist der Satz C[5.1], den wir bislang nur zum Eindeutigkeitsbeweis des Integrals verwendet haben. Wir sprechen diesen Satz einfach nochmals mit der neuen Symbolik aus: In diesem Abschnitt seien alle Intervalle nicht leer und nicht einpunktig.
238
Kapitel 5 Integralrechnung
A. Satz (HDI-1). Zu der stetigen Funktion f W Œa; b/ ! R sei die Funktion F W Œa; b/ ! R definiert durch Z x F .x/ ´ f .t/ dt; a
d.h. das Integral wird „als Funktion seiner oberen Grenze“ betrachtet. Dann ist F differenzierbar mit der Ableitung F 0 .x/ D f .x/
für alle x 2 Œa; b/:
Beweis. Es handelt sich, wie gesagt, um eine bloße Umformulierung von Satz C[5.1]. " Grob gesprochen macht also die Ableitung die Integration rückgängig. Obwohl wir i. Allg. keine Abkürzungen für Fachausdrücke verwenden wollen, ist hier bei der Bezeichnung „Hauptsatz der Differential- und Integralrechnung“ wegen der Länge dieses Wortes eine Ausnahme angebracht. Wir werden also dieses Wort gelegentlich durch HDI abkürzen und z.B. die verschiedenen Varianten dieses Satzes manchmal mit „HDI–1“ usw. ansprechen. Auf eine etwas überraschende Weise ziehen wir zunächst aus Satz A eine Folgerung über die „Definitheit“: B. Folgerung (positive Definitheit). Sei vorausgesetzt (i)
f W Œa; b/ ! R stetig;
(ii)
f .x/ % 0 für alle x 2 Œa; b/;
(iii) es gibt ein x0 2 Œa; b/ mit f .x0 / > 0. Dann folgt
Z
b a
f .x/ dx > 0:
Beweis. Man weiß nach der positiven Semidefinitheit (I.2) in 5.1 Z x f .t/ dt % 0 für alle x 2 Œa; b/: a
Z Angenommen, es wäre
a
Z 0D
b
a
b
f .t/ dt D 0. Dann gälte für x 2 Œa; b/: Z f .t/ dt D
a
x
Z f .t/ dt C
b x
f .t/ dt;
Abschnitt 5.2 Der Hauptsatz der Differential-und Integralrechnung
239
wobei im letzten Ausdruck beide Summanden % 0 sind. Da die Summe null ist, müssten beide Summanden verschwinden, speziell wäre Z x f .t/ dt D 0 für alle x 2 Œa; b/: a
Nach Satz A implizierte dies durch Ableiten nach x: f .x/ D 0 für alle x 2 Œa; b/, im Widerspruch zur Voraussetzung (iii). " Mit dem Integral als Funktion seiner oberen Grenze haben wir eine Funktion konstruiert, die abgeleitet, die Ausgangsfunktion liefert. Solch eine Funktion nennt man eine Stammfunktion. Die allgemeine Definition lautet: C. Definition. Sei f W J ! R eine Funktion, definiert auf einem Intervall J . Eine Funktion ˆ W J ! R heißt eine Stammfunktion von f , wenn ˆ differenzierbar ist und ˆ0 D f gilt. Wie gesagt, bei stetigen Funktionen des Typs f W Œa; b/ ! R existiert eine Stammfunktion. Dies gilt nun aber auch bei beliebigen Intervallen J : D. Satz. Sei J ein Intervall. Jede stetige Funktion f W J ! R besitzt eine Stammfunktion. Beweis. Wir wählen eine feste Stelle ˇ 2 J , die aber nicht Endpunkt von J sein soll, und definieren ˆ W J ! R durch „Integration von ˇ aus“: 8Z x ˆ ˆ f für x % ˇ < ˇ Z ˇ ˆ.x/ ´ ˆ ˆ :& f für x . ˇ: x
0
Für x % ˇ gilt laut Satz A: ˆ .x/ D f .x/, wobei an der Stelle ˇ die rechtsseitige Ableitung gemeint ist. Für x . ˇ sei ein ˛ 2 J mit ˛ < ˇ und ˛ . x . ˇ gewählt. Dann gilt Z ˇ Z x Z ˇ f; f C f D Z ˆ.x/ D
x
˛
˛
also
˛
x
Z f &
ˇ ˛
f
und somit wiederum nach Satz A: ˆ0 .x/ D f .x/, wobei an der Stelle ˛ die rechtsseitige und an der Stelle ˇ die linksseitige Ableitung gemeint ist. An der „Übergangsstelle“ ˇ ergibt sich beidemal die gleiche Ableitung ˆ0 .ˇ/ D f .ˇ/. Wegen der freien Wahl von ˛ folgt: ˆ0 .x/ D f .x/ für alle x 2 J . "
240
Kapitel 5 Integralrechnung
E. Satz (über die Gesamtheit der Stammfunktionen). Sei f W J ! R eine stetige Funktion auf dem Intervall J . (i)
Ist ˆ eine Stammfunktion von f und c 2 R, so ist auch ˆCc eine Stammfunktion von f .
(ii) Sind ˆ und ‰ Stammfunktionen von f , so existiert ein c 2 R mit ‰ D ˆ C c. Beweis. Zu (i): Dies ist klar, da ˆ und ˆ C c die gleiche Ableitung haben. Zu (ii): Aus ˆ0 D f und ‰ 0 D f folgt .ˆ & ‰/0 D 0, also ˆ & ‰ D const.
"
In der Sprache der linearen Algebra kann man das so ausdrücken: Die Menge aller Stammfunktionen einer stetigen Funktion f W J ! R ist ein affiner Unterraum, nämlich eine Gerade im Vektorraum aller differenzierbaren Funktionen J ! R: Man erhält alle Stammfunktionen von f aus einer fest gewählten, indem man zu dieser alle Vielfachen von 1 (d.h. alle konstanten Funktionen mit reellem Wert) hinzuaddiert. F. Satz (HDI–2). Sei f W Œa; b/ ! R stetig und ˆ eine Stammfunktion von f . Dann gilt: Z b f .x/ dx D ˆ.b/ & ˆ.a/: (1) a
Z Beweis. Sei wie oben F .x/ ´
x a
f .t/ dt . Dann ist F laut Satz A eine Stamm-
funktion von f , also gilt laut E(ii): F .b/ & F .a/ D ˆ.b/ & ˆ.a/. Wegen F .b/ D Z b f .t/ dt und F .a/ D 0 folgt die Behauptung. " a
Mit diesen Varianten des Hauptsatzes wird deutlich, wie fruchtbar er für die gegenseitige Beziehung zwischen Integral und Stammfunktion ist: HDI–1 sagt, was das Integral zur Auffindung einer Stammfunktion leisten kann; HDI–2 sagt, was eine Stammfunktion für die Berechnung eines Integrals leisten kann. Die Gleichung (1) ist wohl das am häufigsten verwendete Werkzeug zur expliziten Integralberechnung. Für ihre rechte Seite werden sehr oft die folgenden Schreibweisen gebraucht: ˇb ˇb h ib h ib ˇ ˇ : µ ˆ.x/ µ ˆ.x/ ˆ.b/ & ˆ.a/ µ ˆ.x/ˇ µ ˆ.x/ˇ a
Damit schreibt sich (1) z.B. so: Z a
b
a
xDa
ˇb ˇ f .x/ dx D ˆ.x/ˇ : a
xDa
Abschnitt 5.2 Der Hauptsatz der Differential-und Integralrechnung
241
G. Definition. Sei J ein Intervall. Eine Funktion f W J ! R heißt stetig differenzierbar, wenn f differenzierbar ist und die Ableitung f 0 W J ! R stetig ist. Aus der Differenzierbarkeit alleine folgt nicht die Stetigkeit der Ableitung, wie wir in Beispiel V[4.4] gesehen haben. „Stetig differenzierbar“ bedeutet nicht „stetig und differenzierbar“, was ohnehin ein Pleonasmus wäre, da die Differenzierbarkeit die Stetigkeit impliziert. In der Verbindung „stetig differenzierbar“ ist also das „stetig“ ein Adverb und kein Adjektiv! H. Satz (HDI–3). Sei ˆ W Œa; b/ ! R stetig differenzierbar. Dann gilt: Z
b
ˆ0 .x/ dx D ˆ.b/ & ˆ.a/:
a
Beweis. ˆ ist Stammfunktion von ˆ0 , also folgt die Behauptung aus Satz F.
"
Grob gesprochen, besagen HDI–1 bis HDI–3: Die Integration ist die Umkehrung der Differentiation, und wenn eine Stammfunktion einer stetigen Funktion bekannt ist, so ist die bestimmte Integration ein „Kinderspiel“. I. Beispiele. (i)
Weil x 7! x die Stammfunktion x 7! Z a
b
x dx D
x2 besitzt, gilt: 2
ˇb b 2 a2 x 2 ˇˇ D & : ˇ 2 a 2 2
Man beachte, wie viel einfacher diese Rechnung ist gegenüber der in S[5.1]! (ii)
Sei p 2 R, aber p ¤ &1. Weil x 7! x p in RC die Stammfunktion x 7!
besitzt, gilt für 0 < a . b: Z a
(iii) Weil x 7!
b
x p dx D
x pC1 pC1
ˇb b pC1 x pC1 ˇˇ apC1 D & : ˇ pC1 a pC1 pC1
1 auf RC die Stammfunktion x 7! ln x besitzt, gilt für 0 < a . b: x
Z a
b
1 dx D x
Z
b a
ˇb dx b ˇ D ln x ˇ D ln b & ln a D ln : a x a
242
Kapitel 5 Integralrechnung
Den intuitiven Hintergrund des HDI kann man sehr gut an folgender Analogie erfassen, die auch für „Bankleute“ von Interesse ist: Ein Konto werde täglich mit einer Einzahlung vergrößert, die jedoch von Tag zu Tag eine unterschiedliche Höhe haben kann. Hat man eine Liste, in der neben dem Datum das erreichte Guthaben steht, so kann man sehr leicht eine Liste der täglichen Eingänge erzeugen, indem man jeweils die Differenz des Guthabens zum vorhergehenden Tag bildet. Genau das sagt HDI–1 im kontinuierlichen Fall: Aus der Aufsummierung (sprich: Integration) kann man die Summanden (sprich: Integranden) durch Differenzbildung (sprich: Differenzieren) zurückgewinnen. Hat man eine Liste, in der neben dem Datum die zugehörige Einzahlung steht, so kann man sehr leicht eine Liste der erreichten Guthaben erzeugen, indem man (ausgehend vom Anfangsguthaben) jeweils die Eingänge hinzuaddiert. Genau das sagt HDI–3 im kontinuierlichen Fall: Aus den Summanden (sprich: Integranden) und dem Anfangswert kann man die Summe (sprich: das Integral) durch Addition (sprich: Integration) erzeugen. Eine andere anschauliche Motivierung für HDI–1 geht so: Man betrachtet eine positive Funktion f W Œa; b/ ! R, akzeptiert, dass das Integral den Flächeninhalt unter dem Graphen misst, und betrachtet den Flächenzuwachs von der Stelle x bis zur Stelle x C h für „kleines“ positives h. Der Flächenzuwachs ist ungefähr gleich dem Inhalt des rechteckigen Streifens mit der Basislänge h und der Höhe f .x/, also h ( f .x/:
f(x)
a
x x+h
b
Der Flächenzuwachs, dividiert durch h ist der Differenzenquotient der Flächeninhaltsfunktion von a bis x. Dieser Differenzenquotient ist also ungefähr h ( f .x/, dividiert durch h, was gerade f .x/ ergibt. In der Grenze h ! 0 wird daraus ein exaktes Übereinstimmen zwischen der Ableitung der Flächeninhaltsfunktion an der Stelle x einerseits und f .x/ andererseits.
243
Abschnitt 5.2 Der Hauptsatz der Differential-und Integralrechnung
Wie gesagt, ein Beweis ist dies nicht! Aber die Idee liegt sehr wohl dem präzisen Beweis in C[5.1] zugrunde. J. Bemerkung. Die positive Definitheit von Folgerung B kann man so aussprechen: Für eine stetige Funktion f W Œa; b/ ! R ist der Schluss erlaubt: Z f .x/ % 0 für alle x 2 Œa; b/; H)
a
b
f .x/ dx D 0
f .x/ D 0 für alle x 2 Œa; b/:
Dies ist eine wichtige Grundlage für die so genannte Integralformelmethode, bei der aus dem Verschwinden eines Integrals auf das identische Verschwinden des Integranden geschlossen wird. Ohne die Vorzeichenannahme über f ist das natürlich nicht richtig, wie man am Beispiel I(i) für a D &b sieht. Das Integral kann sehr wohl null sein, ohne dass der Integrand die Nullfunktion ist, nämlich dann, wenn – anschaulich gesprochen – genau so viel Flächeninhalt unterhalb der x-Achse liegt wie oberhalb. Hieraus können wir folgern: K. Satz. Die Dreiecksungleichung für das Integral einer stetigen Funktion f W Œa; b/ ! R geht genau dann in eine Gleichung über: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ jf .x/j dx; f .x/ dx ˇ D (2) ˇ ˇ ˇ a a wenn f keinen echten Vorzeichenwechsel hat, d.h. wenn die Funktionswerte von f auf dem ganzen Intervall Œa; b/ alle nichtnegativ oder alle nichtpositiv sind. Beweis. Wenn f keinen Vorzeichenwechsel besitzt, so ist klar, dass dann die Gleichung (2) besteht. Z b Z b f .x/ dx jf .x/j dx D " Umgekehrt folgt aus dem Bestehen der Gleichung (2): a
für ein " 2 f1; &1g, also Z a
b
a
.jf .x/j & "f .x// dx D 0:
Da hier der Integrand nichtnegativ und stetig ist, folgt für alle x 2 Œa; b/: jf .x/j & "f .x/ D 0, also jf .x/j D "f .x/. Dies impliziert f .x/ % 0 auf Œa; b/ (nämlich im Fall " D 1) oder f .x/ . 0 auf Œa; b/ (nämlich im Fall " D &1). "
244
Kapitel 5 Integralrechnung
Aufgaben und Anmerkungen 1. Zur stetigen Funktion f W Œa; b/ ! R sei die Funktion G W Œa; b/ ! R definiert Z b durch G.x/ ´ f .t/ dt. Man zeige: G ist differenzierbar mit x
G 0 .x/ D &f .x/: Lösungshinweis: Gleiche Idee wie bei D. 2. Die Funktion f W Œa; b/ ! R sei stetig, und es seien u; v W A ! R zwei Funktionen, die in x0 2 A differenzierbar sind. Ist u.x/ . v.x/ für alle x 2 A sowie u.A/ , Œa; b/, v.A/ , Œa; b/, so ist eine Funktion H W A ! R definiert durch Z H.x/ ´
v.x/
u.x/
f .t/ dt:
Man beweise, dass H in x0 differenzierbar ist mit der Ableitung H 0 .x0 / D f .v.x0 // ( v 0 .x0 / & f .u.x0 // ( u0 .x0 /: 3. Weil x 7!
1 die Stammfunktion x 7! arctan x besitzt, gilt 1 C x2 Z 1 ˇ1 dx & ˇ D arctan x ˇ D : 2 0 4 0 1Cx
a) Aus einer Riemann-Summe dieses Integrals mit äquidistanter Zerlegung von Œ0; 1/ in n Teilintervalle gewinne man den Grenzwert (3)
lim
n!1
n X kD1
& n D : n2 C k 2 4
Damit ergibt sich eine erste Möglichkeit, & durch rationale Zahlen beliebig genau zu approximieren (die Grenzwertformel (6)[2.5] liefert für c D 1 eine Approximation durch irrationale Zahlen). b) Mittels Q[5.1] erziele man eine Fehlerabschätzung für die Konvergenz (3). c) Wie groß muss hiernach n gewählt werden, damit der Fehler kleiner als 10&5 wird? 4. Sobald man den Wert eines Integrals kennt (z.B. mittels des HDI) kann man nach dem Muster der vorangehenden Aufgabe die Grenzwerte zugehöriger Riemann-Summen bestimmen. Man wende dies z.B. auf die Funktion x 7! 1=x an.
245
Abschnitt 5.3 Produktintegration und Transformationsformel
5. Als „verbindendes Glied“ zwischen den Integralen in den Beispielen I(ii),(iii) zeige man für 0 < a . b: 3 b pC1
lim
p!&1
pC1
&
apC1 D ln b & ln a: pC1 3
19x&x 6. Gegeben sei die Funktion f W RC . Wie muss t % 0 0 ! R mit f .x/ ´ e gewählt werden, damit der Flächeninhalt unter dem Graphen von f zwischen t und t C 1 maximal wird?
7. Die Funktion f W R ! R sei stetig und periodisch mit der positiven Periode p. Man zeige: Z a) Für alle ˛; ˇ 2 R gilt: Z b) Für alle a 2 R gilt
p
0
˛
ˇ
Z f .x/ dx D
f .x/ dx D
Z
ˇ Cp
˛Cp
aCp
a
f .x/ dx.
f .x/ dx.
Dieser Themenkreis wird in Aufgabe 5[6.1] fortgesetzt. 8. Sei J ein Intervall. Zeige: Jede stetig differenzierbare Funktion f W J ! R lässt sich als Differenz f D f1 & f2 zweier monoton wachsender, stetig differenzierbarer Funktionen f1 ; f2 darstellen. Lösungshinweis: Wähle ein festes a 2 J und betrachte die Identität / .Z x Z x ˇ 0 ˇ ˇ 0 ˇ ˇ ˇ ˇ ˇ f .t/ dt & f .x/ : f .t / dt & f .x/ D a
a
Hinweis: An späterer Stelle kann diese Darstellung auf allgemeinere Funktionen ausgedehnt werden; vgl. Aufgabe 22[9.1].
5.3
Produktintegration und Transformationsformel
Das am meisten verwendete Werkzeug zur expliziten Berechnung von Integralen ist der Hauptsatz der Differential- und Integralrechnung (HDI). Letztlich geht es dabei um die Auffindung von Stammfunktionen. Dazu gibt es eine Handvoll nützlicher Regeln, die neben die Grundeigenschaften in 5.1 treten. Wir starten hier diese Methodik mit der Produktintegration und der Transformationsformel für bestimmte Integrale. Im nächsten Abschnitt folgt die Behandlung mittels „unbestimmter“ Integrale.
246
Kapitel 5 Integralrechnung
A. Satz (Produkt- oder Teilintegration). Sind f; g W Œa; b/ ! R stetig differenzierbar, so gilt: Z (1)
b
a
ˇb Z ˇ f .x/g .x/ dx D f .x/g.x/ˇ &
b
0
a
a
f 0 .x/g.x/ dx:
Beweis. Setze ˆ.x/ ´ f .x/g.x/. Dann folgt der Reihe nach durch Differenzieren und Anwendung von HDI–3 (H[5.2]) ˆ0 .x/ D f 0 .x/g.x/ C f .x/g 0 .x/ Z b ˆ.b/ & ˆ.a/ D .f 0 .x/g.x/ C f .x/g 0 .x// dx a
ˇb Z ˇ f .x/g.x/ˇ D a
b
Z
0
f .x/g.x/ dx C
a
a
b
f .x/g 0 .x/ dx:
Umstellung liefert die Behauptung.
"
B. Beispiele. Z (i)
Berechne
2 &1
xe x dx.
Lösung: Setze f .x/ ´ x und g 0 .x/ ´ e x , also z.B. g.x/ ´ e x (g.x/ ´ e x C 5 täte es auch, aber man nimmt natürlich eine möglichst einfache Stammfunktion). Dann rechnet man mittels (1): Z
2
&1
Z ˇ2 x ( e dx D x ( e ˇ & xˇ
x
&1
&1
1 ( e x dx
ˇ2 ˇ2 2 ˇ ˇ D xe x ˇ & e x ˇ D 2e 2 & .&1/e &1 & .e 2 & e &1 / D e 2 C : &1 &1 e Z
(ii) Berechne
2
0=2 0
sin2 x dx.
Lösung: Manchmal führt die Produktintegration zu einer „impliziten“ Bestimmung eines Integrals, so hier: Setze f .x/ ´ sin x und g 0 .x/ ´ sin x, also z.B. g.x/ ´
247
Abschnitt 5.3 Produktintegration und Transformationsformel
& cos x. Dann rechnet man mittels (1): Z 0=2 Z 0=2 sin2 x dx D sin x ( sin x dx 0
0
ˇ0=2 Z ˇ & D sin x ( .& cos x/ˇ 0
Z D
0=2
0
Z D
0=2
0
cos2 x dx D Z dx &
0=2
0
0=2
0
Z
0=2 0
cos x ( .& cos x/ dx
.1 & sin2 x/ dx
sin2 x dx:
Durch Auflösen nach dem doppelt vorkommenden Integral am Anfang und Ende der Gleichungskette folgt Z 2
0=2 0
Z
2
sin x dx D
0=2
0
Z
& dx D ; 2
also
0=2 0
sin2 x dx D
& : 4
Es gibt auch bestimmte Integrale, bei denen „oben“ etwas kleineres steht als „unten“. Diese werden durch folgende Konvention auf den bisher stets behandelten Fall zurückgeführt: C. Definition (orientiertes Integral). Ist f W Œa; b/ ! R stetig, so setzt man Z
a b
Z f .x/ dx ´ &
a
b
f .x/ dx:
Wie zweckmäßig diese Definition ist, zeigt sich beim Transformieren von Integralen, was der Kettenregel der Differentialrechnung entspricht: D. Satz (Integration durch Substitution). Gegeben seien zwei Funktionen des Typs f h Œ˛; ˇ/ &&&&&! Œa; b/ &&&&&! R, wobei h stetig differenzierbar und f stetig ist. Dann gilt die Transformationsformel Z (T)
h.ˇ /
h.˛/
Z f .x/ dx D
ˇ ˛
f .h.t// ( h0 .t/ dt:
Die transformierende Funktion h braucht nicht injektiv zu sein. Es ist auch erlaubt, dass h.˛/ > h.ˇ/ ist (das ist z.B. der Fall, wenn h monoton fällt). Dass dieser Fall miterfasst werden kann, liegt an der zuvor gegebenen Definition.
248
Kapitel 5 Integralrechnung
Beweis von D. Definiere für x 2 Œa; b/ und t 2 Œ˛; ˇ/ Z x F .x/ ´ f .u/ du; ˆ.t/ ´ F .h.t //: a
Nach HDI–1 (A[5.2]) ist F auf Œa; b/ stetig differenzierbar, und nach der Kettenregel gilt auf Œ˛; ˇ/: ˆ0 .t / D F 0 .h.t// ( h0 .t / D f .h.t//h0 .t/I ˆ ist also auf Œ˛; ˇ/ stetig differenzierbar. Mittels HDI–3 (H[5.2]) folgt: Z ˇ Z ˇ f .h.t //h0 .t / dt D ˆ0 .t / dt ˛
˛
D ˆ.ˇ/ & ˆ.˛/
(2)
D F .h.ˇ// & F .h.˛// Z D
h.ˇ /
a
Z Ist h.˛/ . h.ˇ/, so gilt die Zerlegung Z
h.ˇ /
a
a h.˛/
a
Z Ist h.˛/ % h.ˇ/, so gilt die Zerlegung Verwendung von Definition C Z Z h.ˇ / f & a
a
h.˛/
f .u/ du &
h.ˇ /
Z f &
Z Z f D
Z
h.˛/
h.ˇ /
In beiden Fällen folgt somit aus (2): Z Z ˇ 0 f .h.t//h .t / dt D ˛
h.ˇ / h.˛/
f D
a
f D&
h.˛/
Z
h.˛/
f C
h.ˇ /
h.˛/
f , also
f:
h.ˇ /
a
f D
f .u/ du: Z
Z
h.ˇ /
h.˛/
a
a
Z f D
h.˛/
Z f C h.ˇ /
h.˛/
h.˛/
h.ˇ /
f , also unter
f:
f .u/ du;
was zu zeigen war.
"
E. Bemerkung (Merkregel für die Gleichung (T)). Schreibt man symbolisch (3) so entstehen
„x D h.t /;
dx D h0 .t /; dt
dx D h0 .t / dt“;
249
Abschnitt 5.3 Produktintegration und Transformationsformel
' der Integrand rechts, f .h.t //h0 .t / dt , durch formales Einsetzen in den Integranden links, und zwar sowohl bei der Funktion wie beim Differential; ' die Grenzen links, h.˛/; h.ˇ/, durch Anwendung von h auf die Grenzen rechts. Die symbolischen Gleichungen in (3) haben hier nur den Sinn einer Merkregel. Eine inhaltliche Deutung des Rechnens mit Differentialen erfolgt im Kalkül der Differentialformen, der in Analysis 3 behandelt wird. Z F. Beispiel. Berechne
3
&1
2
t e t dt:
Lösung: Wähle h.t/ D t 2 ; ˛ D &1; ˇ D 3 mit h.&1/ D 1; h.3/ D 9. Dann ist h.Œ&1; 3// D Œ0; 9/, also z.B. a D 0; b D 9 eine mögliche Wahl, damit in Satz D: h.Œ˛; ˇ// , Œa; b/ gilt. Die Abbildung h W Œ&1; 3/ ! Œ0; 9/ ist dann zwar surjektiv, aber nicht injektiv. Trotzdem gibt die Formel (T), gelesen von rechts nach links: Z
3
&1
2
te t dt D
Z
3
&1
1 1 0 h .t/e h.t/ dt D 2 2
Z
h.3/ h.&1/
e x dx D
1 2
Z 1
9
e x dx D
) 1( 9 e &e : 2
G. Bemerkungen. (i) Ist die Abbildung h in Satz D zusätzlich bijektiv und h.˛/ µ a, h.ˇ/ µ b, so schreibt sich die Gleichung (T) auch in der Form Z (T’)
b a
Z f .x/ dx D
h#1 .b/
h#1 .a/
f .h.t // ( h0 .t / dt:
(ii) Die meisten Integrationsregeln übertragen sich vermöge C auf orientierte Integrale, z.B. die drei Varianten HDI–1 bis HDI–3 des Hauptsatzes und die Sätze A, D sowie K[5.1], wobei die positive Definitheit oder auch die Dreiecksungleichung sinngemäß abzuändern sind, etwa wenn a . b: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ jf .x/j dx; f .x/ dx ˇ. ˇ ˇ ˇ a a
ˇZ ˇ ˇ ˇ
aber
b
a
ˇ Z ˇ f .x/ dx ˇˇ .
b a
jf .x/j dx:
H. Beispiele. Z (i)
Berechne für n 2 N0 die Integrale ˇn ´
0
0=2
sinn x dx.
Lösung: Man versucht es wie bei B(ii), diesmal mit f .x/ ´ sinn&1 x, g 0 .x/ ´
250
Kapitel 5 Integralrechnung
sin x, wobei zunächst n % 2 sei: Z 0
0=2
sinn x dx D
Z
0=2
0
sinn&1 x ( sin x dx
ˇ0=2 ˇ D sinn&1 x ( .& cos x/ˇ 0
Z &
0=2 0
.n & 1/ sinn&2 x cos x ( .& cos x/ dx
Z
D.n & 1/ Z D.n & 1/
0=2 0 0=2 0
sinn&2 x cos2 x dx; n&2
sin
cos2 x D 1 & sin2 x Z
x dx & .n & 1/
0=2 0
sinn x dx:
Wie bei B(ii) folgt durch Auflösen nach dem doppelt vorkommenden Integral am Anfang und Ende der Gleichungskette Z n
0=2
0
Z
n
sin x dx D .n & 1/
0
0=2
sinn&2 x dx;
n % 2:
Damit ist eine Rekursionsformel gefunden: ˇn D
n&1 ˇn&2 ; n
n D 2; 3; : : : :
Allerdings wird hierdurch jeweils die übernächste Größe geliefert. Das schadet nicht, da man zwei Startwerte leicht bekommen kann: ˇ0 D &=2 und ˇ1 D 1. Setzt man n D 2m bzw. n D 2mC1, so erhält man Rekursionsformeln für aufeinander folgende m 2 N0 ˇ2m D
2m & 1 ˇ2.m&1/ 2m
bzw.
ˇ2mC1 D
2m ˇ2.m&1/C1 ; 2m C 1
und mit den genannten Startwerten ergibt sich induktiv ˇ2m D bzw.
.2m & 1/.2m & 3/ ( ( ( 3 ( 1 & ( 2m ( .2m & 2/ ( ( ( 4 ( 2 2
ˇ2mC1 D
2m ( .2m & 2/ ( ( ( 4 ( 2 : .2m C 1/.2m & 1/ ( ( ( 5 ( 3
(ii) Anwendung auf das Wallissche Produkt. Dividiert man diese Formeln, so erhält man & 2(2 4(4 6(6 2m ( 2m ˇ2m D ( ( ( ( : 2 1 ( 3 3 ( 5 5 ( 7 .2m & 1/ ( .2m C 1/ ˇ2mC1
251
Abschnitt 5.3 Produktintegration und Transformationsformel
Hierin geht der letzte Bruch für m ! 1 gegen 1; denn aus den Ungleichungen für die Integranden: sin2mC1 x . sin2m x . sin2m&1 x folgt für die Integralwerte: ˇ2mC1 . ˇ2m . ˇ2m&1 ; also 1D
ˇ2mC1 1 ˇ2m ˇ2m&1 2m C 1 D1C : . . D ˇ2mC1 ˇ2mC1 ˇ2mC1 2m 2m
Somit ergibt sich das so genannte Wallissche Produkt: . / & 2(2 4(4 6(6 2m ( 2m D lim ( ( ( : m!1 1 ( 3 2 3 ( 5 5 ( 7 .2m & 1/ ( .2m C 1/ Damit wird & als Grenzwert einer Folge rationaler Zahlen dargestellt! Durch geeignetes Erweitern der zusammengefassten Brüche kann man das Wallissche Produkt auch schreiben als & 16m .mŠ/4 D lim m!1 ..2m/Š/2 .2m C 1/ 2 oder nach etwas „Kosmetik“ p & D lim
4m 4m .mŠ/2 : p D lim 0 ! m!1 m!1 .2m/Š/ m 2m p m m
Aufgaben und Anmerkungen 1. Man berechne mittels Produktintegration folgende Integrale: Z &3 Z 0 Z 0 xe x dx, x cos x dx, c) x sin x dx, b) a) &0
0
&1
Z d)
1
e
ln.x/ dx. x
2. Man berechne mittels Substitution folgende Integrale: Z u Z 3 Z 4 px x e x p ln x dx für p 2 R, u > 1. c) a) dx, b) p dx, 2 x &2 1 C x 1 1 3. Man zeige: Z 20 cos nx cos mx dx D 0 für n ¤ m in N0 a) 0
Z b)
0
20
sin nx sin mx dx D 0 für n ¤ m in N0
252
Kapitel 5 Integralrechnung
Z c)
20
0
Z d)
20
0
cos nx sin mx dx D 0 für n; m 2 N0 Z
2
cos nx dx D
20
0
sin2 nx dx D & für n 2 N.
Lösungshinweis: Man verwende die Formeln aus M[4.4]. 4. Zeige:
Z
a) Ist die Funktion f W Œ&a; a/ ! R stetig und ungerade, so gilt
a
&a
Z
b) Ist die Funktion f W Œ&a; a/ ! R stetig und gerade, so gilt Z a 2 f .x/ dx.
f .x/ dx D 0. a
&a
f .x/ dx D
0
5. Die Funktionen f; g W Œa; b/ ! R seien stetig. Man beweise oder widerlege: 0Z !2 Z a)
b
a
Z b)
a
b
b
f 2 .x/ dx %
a
Z f .x/ dx % 0;
a
b
f .x/ dx Z g.x/ dx % 0
H)
a
b
f .x/ ( g.x/ dx % 0.
6. Die Funktion f W Œa; b/ ! R sei stetig. Man beweise als Zerlegungsregel für orientierte Integrale Z + Z + Z ˇ f; f D f C ˛
ˇ
˛
für beliebige ˛; ˇ; 0 2 Œa; b/, unabhängig von deren gegenseitiger Anordnung. Lösungshinweis: Gleiche Idee wie bei Satz D. 7. Die Funktion f W RC 0 ! R sei stetig differenzierbar und streng monoton wachC send mit f .0/ D 0. Man beweise für alle x 2 RC 0 und y 2 f .R0 / die Youngsche Ungleichung Z y Z x f &1 .u/ du f .t/ dt C xy . 0
0
mit Gleichheit genau für y D f .x/. Lösungshinweis: Man beweise zunächst mit der Produkt- und Substitutionsregel die Gleichheit im Falle y D f .x/. Man deute die Situation auch anschaulich! 8. Seien p; q 2 RC 0 mit
1 1 C D 1. Aus Aufgabe 7 folgere man für alle x; y 2 RC 0: p q xy .
xp yq C p q
253
Abschnitt 5.4 Das unbestimmte Integral
mit Gleichheit genau für x p D y q . 9. Gegeben sei eine stetige Funktion f W Œ0; 2&/ ! R mit f .0/ D f .2&/ > 0 und Z 20 f .x/ dx D 0: 0
Man beweise: a) f hat mindestens zwei Nullstellen in /0; 2&Œ. b) Hat f genau zwei Nullstellen x1 < x2 in /0; 2&Œ, so sind die Vorzeichen von f in den Intervallen /0; x1 Œ, /x1 ; x2 Œ, /x2 ; 2&Œ abwechselnd, nämlich C; &; C. $ c) Gilt auch noch Z 20 Z 20 f .x/ cos x dx D f .x/ sin x dx D 0; 0
0
so hat f mindestens vier Nullstellen in /0; 2&Œ.
5.4 Das unbestimmte Integral Nach dem Hauptsatz der Differential- und Integralrechnung reduziert sich die Berechnung von Integralen stetiger Funktionen auf die Ermittlung von Stammfunktionen. Für eine Funktion, die als Ergebnis einer Differentiation erscheint, ist eine Stammfunktion unmittelbar gegeben: es ist die Ausgangsfunktion. Das liefert eine Reihe von Grundintegralen. Den Kreis solcher Stammfunktionen kann man nun erheblich ausweiten, indem man gewisse formale Regeln anwendet. Das wird hier besprochen. A. Definition (rechnerische Konvention). Als Symbol für eine beliebige StammfunkR tion von f schreibt man f .x/ dx und nennt diesen Ausdruck ein unbestimmtes Rb Integral. Ein Integral des bisher behandelten Typs a f .x/ dx heißt zur Verdeutlichung ein bestimmtes Integral. R Da das Symbol f .x/ dx eine beliebige Stammfunktion bezeichnet, sollte die Auswertung immer eine freie additive Konstante c enthalten. Die Gleichheit zwischen unbestimmten Integralen ist bis auf eine solche additive Konstante zu verstehen. R Formal kann man das Symbol f .x/ dx als die Gesamtheit aller Stammfunktionen von f betrachten. Wir haben diese Gesamtheit in E[5.2] genau bestimmt: Sie besteht eben gerade aus allen Funktionen, die aus einer festen Stammfunktion durch Addition einer beliebigen reellen Konstanten zu erzeugen sind. Wie gesagt, jeder Differentiationsregel entspricht eine Regel für unbestimmte Integrale.
254
Kapitel 5 Integralrechnung
B. Beispiele. n 0
.x / D nx
n&1
Z ()
.e x /0 D e x () 1 .ln x/ D x 0
dx D ln x C c; x
()
.sin x/0 D cos x () 1 .arctan x/ D 1 C x2 1 .arcsin x/0 D p 1 & x2
e x dx D e x C c
Z
.cos x/0 D & sin x ()
0
Z
nx n&1 dx D x n C c
Z
x>0
& sin x dx D cos x C c Z cos x dx D sin x C c Z
dx D arctan x C c 1 C x2 Z dx () D arcsin x C c; p 1 & x2 ()
jxj < 1:
C. Satz (Regeln für unbestimmte Integrale). Die Linearität aus K[5.1] sowie die Regeln der Produktintegration (A[5.3]) und Substitution (D[5.3]) besitzen Analoga für unbestimmte Integrale stetiger Funktionen auf Intervallen: Z (i) (ii) (iii) (iv)
Z .f .x/ C g.x// dx Z ˛f .x/ dx Z f .x/g 0 .x/ dx Z f .h.t //h0 .t / dt
Z
D
f .x/ dx C g.x/ dx Z D ˛ f .x/ dx Z D f .x/g.x/ & f 0 .x/g.x/ dx Z D f .x/ dx;
Letzteres mit x D h.t/ nach Integralauswertung (wobei h als stetig differenzierbar vorausgesetzt ist). Beweis. Differenzieren nach x (bzw. t bei der letzten Gleichung) liefert jeweils Gleichheit. Dabei ist es schon von Bedeutung, dass die Funktionen auf Intervallen betrachtet werden, da nur dann aus der Gleichheit der Ableitungen geschlossen werden kann, dass die Funktionen sich höchstens um eine additive Konstante unterscheiden. "
Abschnitt 5.4 Das unbestimmte Integral
255
D. Bemerkung (zur Substitutionsregel). Die ausführliche Schreibweise für die Gleichung (iv) lautet .Z / Z 0 (iv’) f .h.t//h .t / dt D f .x/ dx .h.t//; und in dieser Form bestätigt man sie durch Differenzieren auf beiden Seiten, was übereinstimmend f .h.t //h0 .t/ ergibt. Ist h injektiv, so folgt daraus für die x 2 Bild h: .Z / Z &1 0 f .h.t //h .t / dt .h .x// D f .x/ dx: Unter dieser Zusatzvoraussetzung wird also durch die Substitutionsregel wirklich das unbestimmten Integral von f berechnet. Natürlich muss die Komposition f ı h ausführbar sein. Beim praktischen Rechnen wir üblicherweise statt der ausführlichen Gleichung (iv’) die Kurzfassung (iv) aufgeschrieben und „im Sinn“ behalten, dass t und x durch die Gleichung x D h.t/ gekoppelt sind. Warnung: Die Vernachlässigung des Gültigkeitsintervalls ist einer der häufigsten Fehler bei der Berechnung von Integralen. Das richtige Intervall sollte daher immer mit angegeben werden, wenn es nicht ganz offensichtlich ist. Wir notieren jetzt eine Liste von unbestimmten Integralen, die sich alle durch Übersetzung der einfachsten Ableitungsformeln ergeben: E. Beispiele (für Grundintegrale). Z x pC1 C c, falls p 2 N0 (i) x p dx D pC1 Z x nC1 (ii) x n dx D C c, falls n D &2; &3; : : : (in RC oder R& ) nC1 Z x ˛C1 C c, falls ˛ 2 R n Z (in RC ) (iii) x ˛ dx D ˛C1 Z dx (iv) D ln jxj C c (in RC oder R& ) x Z (v) e x dx D e x C c Z (vi) cos x dx D sin x C c Z (vii) sin x dx D & cos x C c
256
Kapitel 5 Integralrechnung
Z (viii) (ix)
dx
D arcsin x C c (in /&1; 1Œ) 1 & x2 Z dx D arctan x C c. 1 C x2 p
Weitere Grundintegrale sind in Formelsammlungen verzeichnet. Als Spezialfall von (i) hat man Z Z dx ´ 1 dx D x C c: Beweis von E. Es handelt sich einfach um die Umschreibung von Differentiationsregeln, wie in den Beispielen B erläutert. Bei (iv) ist im Intervall R& zu beachten, dass dort gilt: ln jxj D ln.&x/, was bei der Ableitung mittels Kettenregel auf 1 1 ( .&1/ D &x x führt.
"
Hinweis: Die am häufigsten benutzte Methode zur Berechnung von bestimmten Integralen läuft über Stammfunktionen, d.h. über unbestimmte Integrale, entsprechend dem Schema: 1Z ' Z b
a
f .x/ dx D
f .x/ dx
b
a
:
Dabei kann rechts der Anteil in der eckigen Klammer irgend eine Stammfunktion von f sein (die aber dann während der Auswertung in a und b nicht mehr abgeändert werden darf). Die Schritte sind also: erst Ermittlung einer Stammfunktion, dann Einsetzen der Grenzen, schließlich Subtraktion. Man kann aber durchaus von diesem Schema abweichen. Z.B. ist es bei der Produktintegration oftmals von Vorteil, den „herausintegrierten“ Bestandteil gleich auszuwerten, wie dies in der Regel A[5.3] ausgedrückt ist. F. Beispiele (für kompliziertere Integrale). Z (i) Berechne ln jxj dx. Lösung: Da der Integrand nicht auf ganz R definiert ist, muss eine Zerlegung in möglichst große Gültigkeitsintervalle vorausgehen. Diese sind hier natürlich RC und R& . In RC rechnet man so: Man stellt künstlich ln x als Produkt 1 ( ln x dar und wendet Produktintegration mit g 0 .x/ ´ 1 und f .x/ ´ ln x an: Z Z Z Z 1 ln x dx D 1(ln x dx D x (ln x & x ( dx D x ln x & 1 dx D x ln x &x Cc: x
257
Abschnitt 5.4 Das unbestimmte Integral
Als Probe kann man den erhaltenen Ausdruck differenzieren und erhält tatsächlich ln x. In R& kann man ganz analog vorgehen. Man kann aber auch probeweise den Ausdruck x ln jxj & x D x ln.&x/ & x ableiten und sieht, dass ln.&x/ D ln jxj herauskommt. Damit gilt insgesamt Z ln jxj dx D x ln jxj & x C c in RC oder in R& ; aber eben nicht in R, da ln jxj in 0 nicht definiert (und auch nicht stetig fortsetzbar) ist. Damit gilt Z b ˇb jbjb ˇ ln jxj D x ln jxj & x ˇ D b ln jbj & b & .a ln jaj & a/ D ln a & b C a a jaj a entweder für 0 < a . b oder aber für a . b < 0. Z (ii) Berechne x cos.x 2 / dx. Lösung: Die Substitution y ´ x 2 liefert nach dem Schema E[5.3], das hier genauso gilt: dy D y 0 D 2x; dx
dy D 2x dx:
Damit wird Z Z 2 x cos x dx D cos.x 2 / x dx Z D 1 D 2
.cos y/ Z
1 dy 2
cos y dy
1 sin y C c 2 1 D sin.x 2 / C c 2 D
(Variable und Differential substituiert)
(neues Integral ausgewertet) (resubstituiert)
(iii) Weitere Beispiele, die noch zu den Grundintegralen gerechnet werden können, sind Z p 13 p x 1 & x 2 C arcsin x C c in Œ&1; 1/, 1 & x 2 dx D 2 Z p 3 -p 13 p 2 x 2 & 1 dx D x x & 1 & ln x C x 2 & 1 C c 2
258
Kapitel 5 Integralrechnung
in /&1; &1/ und Œ1; 1Œ, sowie Z p -3 p 13 p 1 C x 2 dx D x 1 C x 2 C ln x C 1 C x 2 C c: 2 Man kann sie durch die Substitutionen x D sin t bzw. x D cosh t bzw. x D sinh t gewinnen und natürlich auch durch Ableiten der rechten Seiten bestätigen. (Bei den ersten zwei Zeilen benötigt man an den Rändern die Aussage H[4.3].) Wie man solche Integraltypen durch algebraische Substitutionen berechnen kann, wird in Abschnitt 8.7 gelehrt. (iv)
Für stetig differenzierbare Funktionen f hat man als gute Tips Z Z 1 f 0 .x/ 0 2 f .x/f .x/ dx D f .x/ ; dx D ln jf .x/j C c; 2 f .x/
wobei im zweiten Fall f auf dem betrachteten Intervall nullstellenfrei sein muss. Beweis durch Differenzieren von f .x/2 bzw. ln jf .x/j in den Fällen f .x/ > 0 oder f .x/ < 0. Allgemeiner Ratschlag Ganz allgemein kann man Ausdrücke, die irgendwie im Integranden hervorstechen oder in ihm mehrfach vorkommen, zur Substitution probieren. Dies trifft insbesondere zu, wenn ein Integrand Umkehrfunktionen enthält. Man wird dann versuchen, diese zur Substitution heranzuziehen. Z G. Beispiel. Berechne das Integral
arcsin x dx.
Lösung: Setze t D arcsin x, also x D sin t und somit dx D cos t dt. Damit wird: Z Z arcsin x dx D t ( cos t dt Substitution x D sin t Z D t sin t & sin t dt Produktintegration D t sin t C cos t C c p D t sin t C 1 & sin2 t C c p D x arcsin x C 1 & x 2 C c
Stammfunktion cos trigonometrische Formel Resubstitution:
Die Ausgangsvariable x ist auf das Intervall Œ&1; 1/ beschränkt und steht dort in bijektiver Beziehung zur Variablen t, die in Œ&&=2; &=2/ läuft, wobei die Abbildung in der
259
Abschnitt 5.4 Das unbestimmte Integral
Richtung t 7! x stetig differenzierbar ist. Das reicht aber nach Satz C zur Gültigkeit der Transformation, sodass das Resultat Z p arcsin x dx D x arcsin x C 1 & x 2 C c für alle x 2 Œ&1; 1/ besteht. Hat man durch die obigen Methoden eine unbestimmtes Integral berechnet, so empfiehlt es sich immer, durch Differenzieren die Probe zu machen, um zu sehen, ob dabei wirklich der Integrand herauskommt. Spätestens bei dieser Probe sollte auch der Ausschluss von Singularitäten (z.B. Nullstellen von Nennern) erfolgen, und es sollten die Gültigkeitsintervalle überprüft werden. H. Bemerkungen. (i) Nicht jede aus Standardfunktionen mittels Körperoperationen und Komposition aufgebaute Funktion hat eine ebensolche Stammfunktion. Anders ausgedrückt: „Elementare“ Funktionen besitzen zwar immer eine Stammfunktion (wenn sie stetig sind), aber diese Stammfunktion braucht nicht„elementar“ darstellbar zu sein. Z.B. kann für 2 f .x/ D e &x keine elementare Stammfunktion angegeben werden. Es gibt eben keine generelle Erfolgsgarantie für die formelmäßige Berechnung von Integralen. Eine näherungsweise Berechnung bestimmter Integrale ist jedoch mit den Mitteln der numerischen Mathematik immer möglich. (ii) Ist ein unbestimmtes Integral nicht elementar auswertbar, so gibt es eventuell Anlass zur Definition einer neuen Grundfunktion. Z.B. definiert man auf ganz R Z x 2 2 e &t dt die Fehlerfunktion durch: erf.x/ ´ p & 0 Z x sin t den Integralsinus durch: Si.x/ ´ dt: t 0 Die Fehlerfunktion spielt in der Wahrscheinlichkeitstheorie eine wichtige Rolle. Im zweiten Fall hat der Integrand bei t D 0 eine hebbare Singularität, da er dort den Grenzwert 1 besitzt. Aufgaben und Anmerkungen 1. Man berechne die folgenden unbestimmten Integrale: Z Z Z p p 3 x 2 a) e dx; b) .x C x/ dx; c) .ln x/3 dx; Z
Z r
1&x dx; f) 1Cx Man gebe jeweils möglichst große Gültigkeitsintervalle an. d)
x
e sin.ax/ dx .a 2 R/; e)
Z
e 2x & e x dx: ex C 1
260
Kapitel 5 Integralrechnung
2. Man berechne die folgenden bestimmten Integrale: Z 0=4 Z 0=4 Z a) e x cos.2x/ dx; b) sin x cos x dx; c) &0=4
Z d)
1 0
Z
arctan x dx; 1 C x2
e)
3. Man berechne: Z 2p a) 1 & jxj dx;
0
13
12
Z b)
&1
2005
.13 & x/
20 0
Z dx;
f)
&2
0
1
16
xe &x dx; p sin 4 x dx: p x
j sin xj dx.
Lösungshinweis: Man zerlege das Integrationsintervall in Intervalle, in denen das Argument der Betragsfunktion festes Vorzeichen hat. 4. Man berechne: Z 1=2 1Cx a) dx, ln 1&x 0
Z b)
0
Z
5. Für m; n 2 N0 zeige man:
1
1
0
x dx . p p 1CxC 1&x
x m .1 & x/n dx D
mŠnŠ : .m C n C 1/Š
6. Manche bestimmten Integrale lassen sich mit Kunstgriffen berechnen, ohne dass eine Stammfunktion bekannt ist, z.B. Z1 J ´ 0
ln.1 C x/ dx: 1 C x2
Man substituiere für t 2 Œ0; &=4/ gemäß x D tan t () t D arctan x;
dx 1 D dt 1 C x2
und erhält Z1 0
ln.1 C x/ dx D 1 C x2
Z0=4 ln.1 C tan t/ dt 0
Z0=4 ln D 0
3& p &t 2 cos 4 dt cos t
Z0=4 Z0=4 Z0=4 p 3& ln cos t dt: & t dt & ln cos ln 2 dt C D 4 0
0
0
Abschnitt 5.5 Gliedweise Integration und Differentiation
261
Dabei wurde beim Übergang zur zweiten Zeile cos t C sin t dadurch umgeformt, dass der Sinusterm in einen Kosinusterm (mit zu &=2 komplementärem Argument) verwandelt und dann die Summe der zwei Kosinusterme mittels der Formeln in M(v)[4.4] in ein Produkt übergeführt wurde. Die zwei letzten Integrale stimmen überein, wie man erkennt, indem man für &=4 & t substituiert. Somit folgt Z1 0
& ln.1 C x/ dx D ln 2: 2 1Cx 8
5.5 Gliedweise Integration und Differentiation Die bisherigen Methoden zur Berechnung von Integralen waren überwiegend rechnerischer Natur, also frei von Grenzwerten. Genauso wichtig sind aber Approximationstechniken, allein schon deshalb, weil viele Integrale nicht elementar auswertbar sind. Die grundlegende Frage bei der Annäherung von Integralen ist die: Wenn eine Funktion als Grenzwert einer Funktionenfolge dargestellt ist, wird dann auch das Integral der Funktion Grenzwert der Einzelintegrale sein? Die gleiche Frage besteht natürlich für das Ableiten anstelle des Integrierens. Für beide Probleme wird hier eine Antwort gegeben, wobei es auf die gleichmäßige Konvergenz ankommen wird. Wir betrachten eine Folge .fn / von reellen Funktionen auf einer Menge A , R, d.h. für jedes n 2 N sei eine Funktion fn W A ! R, x 7! fn .x/ gegeben. A. Definition. (i) Die Funktionenfolge .fn / konvergiert (punktweise) gegen die Funktion f W A ! R, wenn gilt: Zu jedem x 2 A und " > 0 existiert ein N D N.x; "/ 2 N derart, dass für alle n > N gilt: jfn .x/ & f .x/j < ". Dies bedeutet also, dass für jeden Punkt x 2 A die Folgenkonvergenz limn!1 fn .x/ D f .x/ stattfindet. Symbole dafür sind: lim fn .x/ D f .x/
n!1
(auf A)
oder
fn .x/ &! f .x/ (für n &! 1): (auf A)
(ii) Die Funktionenfolge .fn / konvergiert gleichmäßig gegen die Funktion f W A ! R, wenn gilt:
262
Kapitel 5 Integralrechnung
Zu jedem " > 0 existiert ein N D N."/ 2 N derart, dass für alle n > N und alle x 2 A gilt: jfn .x/ & f .x/j < ". Symbole dafür sind: lim fn .x/ D f .x/ glm.
n!1
(auf A)
oder
fn .x/ &! f .x/ glm. (auf A)
(für n &! 1).
Manchmal lässt man in dieser Schreibweise das x weg, die Menge A muss aber auf jeden Fall spezifiziert werden (in der Nähe der Formel oder im Kontext). Gleichmäßige Konvergenz ohne Bezug auf eine Menge ist sinnlos! Natürlich folgt aus der gleichmäßigen Konvergenz gegen f die punktweise Konvergenz gegen f : die gleichmäßige Konvergenz ist die stärkere Forderung. Tatsächlich verlangt die punktweise Konvergenz nur die gewöhnliche Konvergenz der Folge .fn .x// individuell für jedes einzelne x. Daher darf das N in (i) von x und " abhängen. Dagegen fordert die gleichmäßige Konvergenz, dass die „Güte“ der Konvergenz nicht von x abhängt: Für jedes " > 0 ist der Unterschied jfn .x/ & f .x/j < " zu bekommen, wenn nur n hinreichend groß gemacht wird, unabhängig von x. Daher darf das N in (ii) nur von " abhängen.
2ε x a
b
Anschaulich bedeutet die gleichmäßige Konvergenz, dass die Graphen der Funktionen fn für alle n > N."/ in einem Streifen der Dicke 2" um den Graphen von f liegen. Soll die gleichmäßige Konvergenz geprüft werden, so kommt als Grenzfunktion nur die in Frage, die sich aus einer möglichen punktweisen Konvergenz ergibt. Diese muss also zuerst ermittelt werden, bevor man an die Überprüfung der Gleichmäßigkeit gehen kann. Dafür formulieren wir zwei einfache Kriterien, die unmittelbar aus der Definition folgen:
263
Abschnitt 5.5 Gliedweise Integration und Differentiation
B. Satz. Sei neben der Funktionenfolge .fn / eine Funktion f W A ! R betrachtet. Dann gilt: (i) Die Funktionenfolge.fn / konvergiert gleichmäßig gegen f , wenn es eine Nullfolge .an / reeller Zahlen gibt, sodass jfn .x/ & f .x/j . an
für alle x 2 A und n 2 N
gilt (Majorantenkriterium für gleichmäßige Konvergenz). (ii) Gibt es ein k > 0, sodass zu jedem n 2 N ein xn 2 A existiert mit jfn .xn / & f .xn /j % k; so konvergiert die Funktionenfolge nicht gleichmäßig gegen f (Minorantenkriterium " für ungleichmäßige Konvergenz). C. Beispiele. (i) Sei fn W Œ0; 1/ ! R die unten links skizzierte stückweise affine und stetige Funktion mit f .0/ D f .1=n/ D f .1/ D 0 und f .1=.2n// D 2n. Dann gilt bei festem x: limn!1 fn .x/ D 0; denn es ist fn .x/ D 0 für n % x1 , wenn x > 0, und fn .x/ D 0, wenn x D 0. Die Grenzfunktion ist also f D 0. Die Konvergenz erfolgt (1) aber nicht gleichmäßig; denn fn 2n D 2n % 2. Es ist hiernach nicht möglich, dass jfn .x/ & f .x/j für hinreichend große n für alle x 2 R beliebig klein wird. y
y 1
2n
1
fn 1
2
3
5 20
x 0
x 0
1
0
1 n
1
1
0
1
(ii) Sei fn W Œ0; 1/ ! R die Potenzfunktion fn .x/ D x n . Hier gilt punktweise nach M[2.1] ( 0 für 0 . x < 1 n lim x D n!1 1 x für x D 1: Die (punktweise) Grenzfunktion f existiert also, die Konvergenz gegen sie ist aber ungleichmäßig. Das sieht man daran, dass z.B. der Streifen der Dicke 1 um den Graphen von f (der " D 1=2 entspricht) von jedem Graphen dieser Funktionen vor der
264
Kapitel 5 Integralrechnung
Stelle 1 verlassen wird; vgl. das Bild oben rechts. Es folgt aber auch aus dem folgenden Satz D. (iii) Eine Funktionenfolge, die wir schon lange kennen, ergibt sich aus der Konvergenz 3 x -n lim fn .x/ D e x mit fn .x/ ´ 1 C ; n!1 n gültig für alle x 2 R; vgl. Abschnitt 2.4. Die einzelnen Folgenglieder fn sind hier sogar Polynome. Danach strebt die Polynomfolge fn punktweise auf ganz R gegen die Exponentialfunktion f D exp. Allerdings ist die Konvergenz auf R nicht gleichmäßig. Denn es gilt fn .n/ D 2n , also f .n/ & fn .n/ D e n & 2n % e & 2 > 0; wobei sich die Abschätzung z.B. aus der geometrischen Summenformel ergibt. Dagegen ist die Konvergenz auf einem Intervall der Gestalt Œ&a; a/ sehr wohl gleichmäßig. Um B(i) anzuwenden, sei für jxj . a mit der Intervallschachtelung von B[2.4] folgende Abschätzung durchgeführt, wobei n > a: /n . x2 1& 1& 2 3 3 1 x -n x -n n .3 D & 1 C . 0 . ex & 1 C 3 x n x -n n n 1& 1& n n . 2/ x 1& 1& x2 1 a2 n D . ( . 3 - : 3 3 x n x n n 1& a n n 1& 1& n n n Dabei wurde beim Übergang zur zweiten Zeile die Bernoullische Ungleichung B[1.3] angewandt. Die zuletzt erhaltene Schranke definiert eine reelle Nullfolge, da der Nenner des großen Bruchs gegen e &a konvergiert. Damit ist das Kriterium B(i) erfüllt. (Die Abhängigkeit dieser Schranke von a stört nicht, da die Definitionsmenge Œ&a; a/ festgehalten ist.) Der Unterschied zwischen punktweiser und gleichmäßiger Konvergenz sei nochmals verdeutlicht, indem die Definitionen in formalisierter Form notiert werden: (puw) (glm)
8 x 2 A; " > 0 9 N > 0
8 n > N W jfn .x/ & f .x/j < "
8 " > 0 9 N > 0 8 n > N; x 2 A W jfn .x/ & f .x/j < ":
Der Index N darf von den Objekten abhängen, die zuvor mit dem Allquantor 8 eingeführt sind, also im ersten Fall der punktweisen Konvergenz von x und ", im zweiten Fall der gleichmäßigen Konvergenz nur von ".
265
Abschnitt 5.5 Gliedweise Integration und Differentiation
D. Satz. Gilt fn ! f gleichmäßig auf A und sind alle fn W A ! R in a 2 A stetig, so ist auch f in a stetig. Beweis. Sei " > 0 gegeben. Wegen der gleichmäßigen Konvergenz gibt es ein N 2 N mit: x 2 A H) jfN .x/ & f .x/j <
" : 3
Wegen der Stetigkeit existiert ein ı > 0 mit: x 2 A \ U.a; ı/ H) jfN .x/ & fN .a/j <
" : 3
Durch „Zusammenspannen“ dieser Aussagen folgt der Schluss: x 2 A \ U.a; ı/ H) jf .x/ & f .a/j . jf .x/ & fN .x/j C jfN .x/ & fN .a/j C jfN .a/ & f .a/j < "; da jeder der drei Summanden < "=3 ist. Das beweist die Stetigkeit von f in a.
"
Bei nur punktweiser Konvergenz trifft Satz D nicht zu, wie Beispiel C(ii) zeigt: Dort sind alle Funktionen fn überall in A ´ Œ0; 1/ stetig, aber die Grenzfunktion f hat in x D 1 einen Sprung der Höhe 1! Ab hier sei in diesem Abschnitt die Definitionsmenge ein Intervall A D Œa; b/ mit a < b. E. Satz (über die gliedweise Integration). Sei .fn / eine Folge stetiger Funktionen fn W Œa; b/ ! R. Gilt lim fn .x/ D f .x/ gleichmäßig auf Œa; b/, so ist f W Œa; b/ ! R stetig (Satz D) und Z lim
n!1 a
b
Z fn .x/ dx D
a
b
n!1
f .x/ dx:
Hinweis: Die Behauptung kann auch so geschrieben werden: / Z b3 .Z b lim fn .x/ dx: fn .x/ dx D lim n!1
a
a
n!1
In dieser Form bedeutet sie die Vertauschbarkeit der Operationen „Limesbildung“ und „Integration“. Man sagt auch, man dürfe das Limeszeichen „in das Integralzeichen hineinziehen“ oder den Grenzübergang „unter dem Integralzeichen durchführen“.
266
Kapitel 5 Integralrechnung
Beweis von E. Es gilt die Vorausabschätzung: ˇZ ˇ ˇZ ˇ Z b ˇ ˇ b ˇ ˇ b ˇ ˇ ˇ ˇ .fn .x/ & f .x// dx ˇ fn .x/ dx & f .x/ dx ˇ D ˇ ˇ ˇ a ˇ ˇ ˇ a a Z b . jfn .x/ & f .x/j dx: a
Gegeben " > 0, wähle ein N D N."/ 2 N derart, dass " für alle n > N; x 2 Œa; b/: jfn .x/ & f .x/j < b&a Dies geht aufgrund der gleichmäßigen Konvergenz. Dann folgt zusammen mit der Vorausabschätzung: ˇZ ˇ Z b ˇ b ˇ " ˇ ˇ D" für alle n > N ; fn .x/ dx & f .x/ dx ˇ < .b & a/ ( ˇ ˇ a ˇ b & a a also die Behauptung.
"
Ohne gleichmäßige Konvergenz ist die Behauptung i. Allg. falsch, selbst wenn die Grenzfunktion stetig ist: F. Beispiel. Bei Beispiel C(i) gilt Z 1 1 1 fn .x/ dx D 2n ( ( D 1; n 2 0
Z aber
0
1
Z f .x/ dx D
1
0
0 dx D 0:
Die Folge der Einzelintegrale konvergiert hier noch, aber nicht gegen das Integral der Grenzfunktion. Weniger einfach zu formulieren ist die Vertauschbarkeit mit dem Differenzieren. Methodisch kann man diese Frage mit dem Hauptsatz der Differential- und Integralrechnung aufs Integrieren zurückspielen. G. Satz (über die gliedweise Differentiation). Sei .fn / eine Folge stetig differenzierbarer Funktionen fn W Œa; b/ ! R mit den Eigenschaften: (i)
Für wenigstens ein x0 2 Œa; b/ existiert lim fn .x0 / 2 R. n!1
(ii) Die Folge der Ableitungen
fn0
konvergiert gleichmäßig auf Œa; b/.
Dann existiert (1)
lim fn .x/ µ f .x/ glm. auf Œa; b/;
n!1
und f ist stetig differenzierbar sowie (2)
lim fn0 .x/ D f 0 .x/ glm. auf Œa; b/:
n!1
267
Abschnitt 5.5 Gliedweise Integration und Differentiation
Hinweis: Auch hier besagt die Behauptung (2) die Vertauschbarkeit der Operationen „Limesbildung“ und „Differentiation“. Beweis von G. Sei f $ W Œa; b/ ! R die Grenzfunktion der Folge .fn0 /: f $ .x/ ´ lim f 0 .x/ glm. auf Œa; b/: n!1
n
Nach Satz D ist f $ von alleine stetig. Nach HDI–3 (H[5.2]) gilt für alle x 2 Œa; b/: Z x (3) fn .x/ D fn .x0 / C fn0 .t / dt: x0
Die rechte Seite ist konvergent laut Satz E, also auch die linke Seite, und zwar gegen Z x (4) f .x/ ´ y0 C f $ .t / dt; wobei y0 ´ lim fn .x0 /: n!1
x0
Hieraus folgt mittels HDI–1 (A[5.2]) die Existenz der Ableitung und f 0 .x/ D f $ .x/. Also ist f stetig differenzierbar, und es gilt (2). Zur Gleichmäßigkeit in (1): Vorausabschätzung durch Subtraktion von (3) und (4): ˇ ˇ Z x ˇ ) ˇ ( 0 $ ˇ jfn .x/ & f .x/j D ˇfn .x0 / & y0 C fn .t / & f .t / dt ˇˇ x0
Z . jfn .x0 / & y0 j C
x0
Z . jfn .x0 / & y0 j C
x
a
b
ˇ 0 ˇ ˇf .t / & f $ .t /ˇ dt n
ˇ 0 ˇ ˇf .t / & f $ .t /ˇ dt: n
Dabei sind in der zweiten Zeile die Integrationsgrenzen zu vertauschen, wenn x < x0 , aber die Endabschätzung bleibt dieselbe. Wähle nun zu " > 0 ein N D N."/ 2 N, sodass " 8n>N jfn .x0 / & y0 j < 2 ˇ 0 ˇ " ˇf .t/ & f $ .t /ˇ < 8 n > N; t 2 Œa; b/: n 2.b & a/ Dann ergibt sich zusammen mit der Vorausabschätzung: " " D" jfn .x/ & f .x/j < C .b & a/ ( 2 2.b & a/ Damit ist alles gezeigt.
8 n > N; x 2 Œa; b/: "
Aus der gleichmäßigen Konvergenz fn ! f folgt i. Allg. nicht die Konvergenz oder gar gleichmäßige Konvergenz fn0 ! f 0 (auch wenn alle Funktionen stetig differenzierbar sind).
268
Kapitel 5 Integralrechnung
H. Beispiel. Sei fn .x/ ´ n1 sin nx, A D Œ0; 2&/. Dann gilt fn .x/ ! 0 µ f .x/, gleichmäßig auf A, da jfn .x/j . 1=n. Aber fn0 .x/ D cos nx konvergiert nicht einmal punktweise gegen 0, z.B. ist ja cos n& D .&1/n . Somit hat die Differentiation eine eher „aufrauende“ Wirkung, wohingegen die Integration „glättend“ wirkt. Einen ähnlichen Effekt der Ableitung hatten wir in V[4.4] konstatiert. Dieses Phänomen wird später unter einem allgemeinen Gesichtspunkt neu beleuchtet. Bezüglich der Integration gibt es im Rahmen des Lebesgue-Integrals bessere Aussagen , die viel weniger als die gleichmäßige Konvergenz voraussetzen, z.B. den Satz über die majorisierte Konvergenz. Diese Fragen werden in Analysis 2 ausführlich behandelt. Uneigentliche Integrale Die Relation zwischen Grenzübergängen und Integration bezog sich bisher auf die Integranden. Die analoge Frage besteht natürlich auch, wenn am Integrationsintervall ein Grenzübergang vorgenommen werden soll. Das führt auf die so genannten uneigentlichen Integrale. Typische Fälle sind unbeschränkte Integrationsintervalle oder beschränkte Integrationsintervalle mit Singularitäten des Integranden an den Endpunkten, z.B. Z a
1
Z f .x/ dx ´ lim
E !1 a
E
Z f .x/ dx
oder
a
b
Z f .x/ dx ´ lim "#0
a
b&"
f .x/ dx;
wenn im ersten Fall f auf Œa; 1Œ und im zweiten Fall f auf Œa; bŒ stetig ist, falls die Grenzwerte der Integrale auf der rechten Seite (eigentlich) existieren. Auch die Diskussion uneigentlicher Integrale erfolgt besser im Rahmen einer allgemeineren Integrationstheorie, worauf wir in Analysis 2 zurückkommen. Aufgaben und Anmerkungen 1. Die nachstehenden Funktionenfolgen seien alle in A ´ RC 0 betrachtet. Sind diese punktweise bzw. gleichmäßig in A konvergent, und was ist ggf. die Grenzfunktion? p n
1 b) fn .x/ ´ , 1 C nx 3 xd) fn .x/ ´ n ( ln 1 C . n a) fn .x/ ´
x,
c) fn .x/ ´
2. Man berechne folgende Grenzwerte: Z Z 1p n b) lim n ( e &x 2 dx, a) lim n!1 0
n!1
0 0
x , 1 C nx
sin x dx. nCx
269
Abschnitt 5.5 Gliedweise Integration und Differentiation
3. Man berechne die folgenden uneigentlichen Integrale: Z 1 Z 1 Z 1 Z 1 dx dx dx &x , d) . , b) a) e dx, c) p p 2 x 1&x 1 & x2 0 0 0 1 4. Es gelte für zwei Funktionenfolgen .fn / und .gn / mit der gemeinsamen Definitionsmenge A lim fn D f
n!1
glm. auf A
und
lim gn D g
n!1
glm. auf A:
Man zeige: a) b)
lim jfn j D jf j glm. auf A.
n!1
lim .fn C gn / D f C g
glm. auf A.
n!1
c) Sind f und g beide beschränkt, so gilt lim .fn ( gn / D f ( g n!1
glm. auf A.
d) Man belege durch ein Beispiel, dass die Aussage in c) falsch wird, wenn eine der Funktionen f; g unbeschränkt ist. 5. Für eine Funktionenfolge .fn / mit fn W A ! R und f W A ! R gelte lim fn D f
n!1
glm. auf A
Man zeige: a) Ist g W B ! R eine Funktion mit g.B/ , A, so gilt: lim fn ı g D f ı g
n!1
glm. auf B:
b) Ist G W Œa; b/ ! R eine stetige Funktion, wobei das Intervall Œa; b/ alle Bildmengen f .A/ und fn .A/ enthält, so gilt lim G ı fn D G ı f
n!1
glm. auf A:
6
Metrische Räume
Nach der kalkülmäßigen Behandlung der Analysis ist es an der Zeit, den begrifflichen Hintergrund zu stärken. Das soll im Rahmen der metrischen Räume geschehen. Diese Räume erlauben eine geometrische Sprache mit universellen Begriffen, die große Teile der modernen Mathematik durchdringen. Es handelt sich um eine Vereinheitlichung vieler Ideen, die zunächst in unterschiedlichem Gewand aufgetreten sind. Wichtig für die Anwendungen ist, dass dabei auch unscharfe Begriffe wie „Ähnlichkeit“ von „Wörtern“ oder „Mustern“ erfasst werden können.
6.1 Grundbegriffe für Mengen Wir betrachten eine beliebige Menge (nichtleere) X, deren Elemente auch Punkte genannt werden, und fragen, wie man die Distanz zwischen je zwei Punkten von X messen kann. Natürlich wird es dafür unterschiedliche Vorstellungen geben. Primär geht es nun nicht darum, eine konkrete Entfernungsdefinition anzugeben, sondern zu sagen, was man wohl von einem vernünftigen Distanzbegriff erwarten sollte. Dazu hat sich folgendes Konzept bewährt: A. Definition. Eine Metrik auf der Menge X ist eine Abbildung d W X ) X ! R, die folgenden Regeln genügt: (D.1)
d.x; y/ D d.y; x/
(D.2)
d.x; y/ > 0 für x ¤ y
(D.3)
d.x; x/ D 0
(D.4)
d.x; z/ . d.x; y/ C d.y; z/
)
Symmetrie positive Definitheit Dreiecksungleichung.
Das Paar .X; d / heißt dann ein metrischer Raum (ebenso X selbst, wenn d aus dem Zusammenhang klar ist). Die Elemente x 2 X werden auch Punkte genannt. Je zwei Punkten x; y 2 X ist also die nichtnegative reelle Zahl d.x; y/ als Entfernung oder Abstand oder auch Distanz zugewiesen. Die Dreiecksungleichung drückt aus, dass der „direkte Weg“ von x nach z nicht länger ist als der „Umweg“ von x über y nach z. Sei jetzt ein metrischer Raum .X; d / gegeben.
271
Abschnitt 6.1 Grundbegriffe für Mengen
B. Lemma (modifizierte Dreiecksungleichung). Für x; y; z 2 X gilt: d.x; z/ % jd.x; y/ & d.y; z/j: Beweis. Aus (D.4): d.x; y/ . d.x; z/ C d.z; y/ folgt mit (D.1): d.x; z/ % d.x; y/ & d.y; z/. Vertauschung von x und z liefert mit (D.1): d.x; z/ % d.y; z/ & d.x; y/. " Zusammen folgt daraus die Behauptung. C . Beispiele. Die folgenden Beispiele sollen einen Eindruck vermitteln von der Reichhaltigkeit dieser Begriffsbildung. Die Metrikaxiome (D.1) bis (D.4) sind dabei ohne Mühe nachzuprüfen. (i) Sei X D R und d.x; y/ D jx & yj; die so genannte Standard-Metrik auf R. Die Metrikaxiome sind unmittelbar aus den Eigenschaften des Betrags klar. Wenn nichts anderes gesagt ist, wird R mit der Standard-Metrik versehen. (ii) Sei X D R2 D f.x1 ; x2 / j x1 ; x2 2 Rg. Für x D .x1 ; x2 / und y D .y1 ; y2 / aus R2 ist p d.x; y/ ´ .y1 & x1 /2 C .y2 & x2 /2 die Euklidische (Standard-)Metrik. Die Metrikaxiome für d sind aus der linearen Algebra oder analytischen Geometrie bekannt.
y
y2
x2
x
x1
(iii) Sei X D Z ) Z, die Menge der ganzzahligen Gitterpunkte in R2 . Für x D .x1 ; x2 / und y D .y1 ; y2 / ist
y1
y
dT .x; y/ ´ jy1 & x1 j C jy2 & x2 j die so genannte Taxifahrer-Metrik. Sie misst die vom Fahrgast zu bezahlende Wegstrecke, wenn das Taxi nur auf den ganzzahlig nummerierten Straßen eines Rechteckgitters fahren darf. Auch hierbei folgen die Metrikaxiome aus den Betragsregeln. (iv)
x
Sei X ´ R2 D „Frankreich“, P ´ .0; 0/ D „Paris“, und für x; y 2 X sei ( d.x; y/; falls x; y auf Gerade durch P dF .x; y/ ´ d.P; x/ C d.P; y/ sonst:
272
Kapitel 6 Metrische Räume
Dabei ist d die Standard-Metrik aus (ii). Man nennt dF die Metrik der französischen Eisenbahn in der Annahme, man müsse in Frankreich – um von x nach y zu kommen – immer zentral über Paris fahren, es sei denn, x; y liegen bereits auf einer geraden Strecke, deren Verlängerung durch Paris geht. Bei der Dreiecksungleichung hat man einige Fälle zu unterscheiden, je nachdem ein Teil der drei Punkte oder alle auf einer Geraden durch P liegen oder nicht. In allen Fällen führt aber die Dreiecksungleichung aus (ii) unmittelbar zum Ziel. (v)
y
x y x P
Wortverstellung: Wir betrachten Wörter x aus 10 Buchstaben: x D x1 : : : x10 2 X D A10 ;
A ´ fa; b; c; : : : ; zg das Alphabet:
Wir definieren ein Verstellungsmaß dV : Sei neben x ein weiteres Wort y D y1 : : : y10 2 X gegeben. Falls eine bijektive Abbildung ' W f1; : : : ; 10g ! f1; : : : ; 10g (eine Permutation) existiert mit yi D x%.i/ für i D 1; : : : ; 10, so sei k die kleinste Fehlstandszahl all dieser ' ’s. (Zur Erinnerung: Die Fehlstandszahl von ' ist die Anzahl aller Paare .i; j / mit i < j und ' .i / > ' .j /.) Dabei gilt k . 9 C 8 C 7 C ( ( ( C 1 D 45, denn diese Schranke ist die höchste Fehlstandszahl, die überhaupt vorkommen kann. In diesem Fall sei dV .x; y/ ´ k. Falls ein solches ' nicht existiert, so sei dV .x; y/ ´ 46. Dann ist dV eine Metrik auf X. Der Beweis wird am Ende dieses Abschnitte erbracht. Das Verstellungsmaß ist ein Maß dafür, wie „ähnlich“ zwei Wörter sind. Dabei braucht es sich nicht um Wörter unseres Alphabets zu handeln. Analog kann man auch vorgehen, um ein quantitatives Maß für die Ähnlichkeit von DNA-Sequenzen in einem genetischen Code zu definieren, etc. D. Satz und Definition. Ist A eine Teilmenge des Raums X mit der Metrik d , so liefert die Einschränkung von d W X ) X ! R auf A ) A eine Metrik für A. Man nennt dann A einen (metrischen) Unterraum von X . Beweis. Die Eigenschaften (D.1) bis (D.4) gelten insbesondere für Elemente von A. " E. Definition. Für a 2 X und r > 0 führt man ein: B.a; r/ ´
fx 2 X j d.x; a/ < rg
der offene Ball
B.a; r/ ´
fx 2 X j d.x; a/ . rg
der abgeschlossene Ball
S.a; r/ ´ fx 2 X j d.x; a/ D rg
die Sphäre
9 > =
um a vom > ; Radius r.
273
Abschnitt 6.1 Grundbegriffe für Mengen
a heißt jeweils Mittelpunkt oder Zentrum. F. Beispiele. (i) Sei X D R mit der StandardMetrik. Dann gilt: d.x; a/ < r () jx & aj < r:
B(a,r)
R
B(a,r)
R
Also ist hier B.a; r/ D /a & r; a C rŒ das offene Intervall der Länge 2r mit Zentrum a. Analog ist B.a; r/ D Œa & r; a C r/ das abgeschlossene Intervall der Länge 2r mit Zentrum a. (ii) Sei X D R2 mit der Standard-Metrik. Die Bälle sind Kreisscheiben (ohne bzw. mit begrenzender Kreislinie), die Sphären sind Kreislinien. Sphäre
Bälle
offen
abgeschlossen
Hinweis: In symbolischen Skizzen werden die Bälle oft als Kreisscheiben wiedergegeben (obwohl sie je nach Metrik auch ganz anders aussehen können). Außerdem ist es manchmal hilfreich, Begrenzungen, die nicht zur Menge gerechnet werden, zu stricheln. G. Satz (Eigenschaften von Bällen). Für r; s 2 RC gilt: (i)
a 2 B.a; r/;
(ii)
aus s . r folgt B.a; s/ , B.a; r/;
(iii) aus b 2 B.a; r/ und s . r & d.a; b/ folgt B.b; s/ , B.a; r/; (iv)
aus d.a; b/ > r C s folgt B.a; r/ \ B.b; s/ D ¿.
274
Kapitel 6 Metrische Räume
b
r
s s
r a
b
a
Zu (iii)
Zu (iv)
Beweis von G. Zu (i), (ii): Dies ist unmittelbar klar aus der Definition; (ii) ist auch ein Spezialfall von (iii). Zu (iii): Dies ergibt sich aus der Schlusskette: x 2 B.b; s/ H) d.x; b/ < s H) d.x; a/ . d.x; b/ C d.b; a/ < s C .r & s/ D r: Zu (iv): Wir zeigen das in der Form: B.a; r/ \ B.b; s/ ¤ ¿ H) d.a; b/ . r C s: Sei x 2 B.a; r/ \ B.b; s/ gewählt. Dann schließen wir so: d.x; a/ . r; d.x; b/ . s H) d.a; b/ . d.a; x/ C d.x; b/ . r C s: Entscheidend ist also immer die Dreiecksungleichung.
"
Die Bälle spielen nun die analoge Rolle wie die Intervalle, die in R als Umgebungen verwendet wurden. Die Definition von Umgebungen mittels Bällen läuft hier völlig analog. Sofort danach werden wir mit diesen Umgebungen Grundbegriffe wie Häufungspunkte, offene und abgeschlossene Mengen usw. formulieren. Anschließend werden viele Beispiele diese Begriffswelt illustrieren. H. Definition. Gegeben sei ein Punkt p 2 X und ein " > 0. Wir nennen (i)
U.p; "/ ´ B.p; "/ die "-Umgebung von p;
(ii) U $ .p; "/ ´ B.p; "/ n fpg die punktierte "-Umgebung von p. I . Definition. Gegeben sei eine Teilmenge A , X und ein Punkt p 2 X. Wir nennen (i)
p inneren Punkt von A, wenn es ein " > 0 gibt mit U.p; "/ , A;
(ii)
p Häufungspunkt von A, wenn für jedes " > 0 gilt: A \ U $ .p; "/ ¤ ¿.
(iii) p isolierten Punkt von A, wenn p zu A gehört, aber nicht Häufungspunkt von A ist.
Abschnitt 6.1 Grundbegriffe für Mengen
275
Innere Punkte von A sind also Punkte von A, bei denen eine ganze "-Umgebung auch noch zu A gehört. Häufungspunkte von A brauchen nicht zu A zu gehören, besitzen aber in beliebiger Nähe Punkte von A, die von ihnen verschieden sind. Ein isolierter Punkt von A gehört immer zu A, ist aber in einer geeigneten Umgebung von a der einzige Punkt von A. Auf R mit der Standard-Metrik stimmen die jetzigen Begriffe des Häufungspunkts bzw. isolierten Punkts mit den früheren in B[3.2] überein. J. Definition. Gegeben sei eine Teilmenge A , X. Wir nennen (i)
A offen, wenn jedes Element von A innerer Punkt von A ist;
(ii)
A abgeschlossen, wenn jeder Häufungspunkt von A Element von A ist;
(ii)
A diskret, wenn alle Punkte von A isoliert sind.
X selbst erfüllt beide Forderungen (i), (ii), ist also sowohl offen wie auch abgeschlossen. Auch die leere Menge ¿ gilt als offen und zugleich abgeschlossen. K. Satz. Für das System T der offenen Mengen von X gilt: (T.1) ¿; X 2 T ; (T.2) aus U; V 2 T folgt U \ V 2 T ; (T.3) Ist .V+ /+2) eine beliebige Familie von Mengen V+ 2 T , so gehört auch die S Vereinigung +2) V+ zu T . Beweis. Zu (T.1): Dies ist unmittelbar klar aus der Definition. Zu (T.2): Man schließt so: Ist p 2 U \ V gegeben, so existieren Umgebungen von p mit U.p; "/ , U und U.p; 1/ , V . Dann folgt wegen G(ii): B.p; min f"; 1g/ , U \ V . Somit besitzt p eine offene Umgebung, die ganz zu U \ V gehört. Zu (T.3): Ist p 2
S
V+ gegeben, so existiert ein 00 2 - mit p 2 V+0 . Dann S existiert ein " > 0 mit U.p; "/ , V+0 . Daraus folgt U.p; "/ , + 2) V+ . " +2)
L. Bemerkungen. (i) Die Eigenschaft (T.2) gilt entsprechend für endlich viele Mengen, wie leicht durch vollständige Induktion zu sehen ist (jedoch i. Allg. nicht für beliebige Mengenfamilien). Somit erhalten wir als Zusammenfassung von (T.2), (T.3): Der Durchschnitt endlich vieler und die Vereinigung beliebig vieler offener Mengen ist jeweils wieder offen.
276
Kapitel 6 Metrische Räume
(ii) Ein System von Teilmengen einer Menge X mit den Eigenschaften (T.1) – (T.3) heißt eine Topologie auf X. Man könnte viele Begriffe wie Umgebung, Grenzwert, Stetigkeit usw. alleine auf ein solches Mengensystem stützen. (Das wird hier nicht ganz so konsequent getan, um etwas näher an der Anschauung zu bleiben.) M. Satz. Für Teilmengen A , X gilt die Äquivalenz: A abgeschlossen () X n A offen: Beweis. In den Fällen A D X und A D ¿ ist die Äquivalenz klar. Sei jetzt also ¿ ¤ A ¤ X. Zu H) : Ist p 2 X nA, also p … A, so ist p nicht Häufungspunkt von A. Also existiert ein " > 0 mit A \ U $ .p; "/ D ¿. Es folgt A \ U.p; "/ D ¿, also U.p; "/ , X n A. Zu (H : Zu zeigen ist der Schluss: p Häufungspunkt von A H) p 2 A. Stattdessen zeigen wir äquivalent: p … A H) p nicht Häufungspunkt von A. Sei also p … A, d.h. p 2 X n A. Dann existiert ein " > 0 mit U.p; "/ , X n A. Dies impliziert A \ U.p; "/ D ¿, also ist p nicht Häufungspunkt von A. " N. Folgerung. Für Teilmengen B , X gilt die Äquivalenz: B offen () X n B abgeschlossen. Beweis. Setze A WD X n B und beachte X n .X n B/ D B.
"
„Offen“ und „abgeschlossen“ sind also nicht etwa logische Gegensätze (X selbst ist sowohl offen wie abgeschlossen, ebenso ¿). Jedoch führt die Komplementbildung die eine Sorte von Teilmengen in die andere über (so genannte Dualität). O. Bemerkung. Mit dieser Dualität folgt aus L(i): Der Durchschnitt beliebig vieler und die Vereinigung endlich vieler abgeschlossener Mengen ist jeweils wieder abgeschlossen.
P. Beispiele. (i)
Jeder offene Ball B.a; r/ ist eine offene Teilmenge von X: Zu p 2 B.a; r/ wähle man " ´ r & d.a; p/ > 0. Dann gilt nach G(iii): U.p; "/ D B.p; "/ , B.a; r/.
277
Abschnitt 6.1 Grundbegriffe für Mengen
(ii)
Jeder abgeschlossene Ball B.a; r/ ist eine abgeschlossene Teilmenge von X: Wir verwenden Satz M und zeigen, dass X n B.a; r/ offen ist: Zu p … B.a; r/ wähle man ein " mit 0 < " < d.a; p/ & r. Dann gilt nach G(iv): B.a; r/ \ B.p; "/ D ¿, also U.p; "/ D B.p; "/ , B.p; "/ , X n B.a; r/.
(iii)
In R sind die Intervalle der Typen ¿; /a; bŒ ; /a; 1Œ ; /&1; bŒ3 ; /&1; 1Œ - D aCb b&a R mit a < b aus R offen im Sinne von J(i). Z.B. ist /a; bŒ D B 2 ; 2 und S /a; 1Œ D 1 iD1 /a; a C iŒ. Analog schließt man in den anderen drei Fällen. Die Intervalle der restlichen Typen aus K[1.1] sind nicht offen, weil Endpunkte keine inneren Punkte sind. Die jetzige Eigenschaft „offen“ fällt also bei Intervallen mit der von K[1.1] zusammen.
(iv)
In R sind die Intervalle der Typen ¿; Œa; b/; Œa; 1Œ ; /&1; b/ ; /&1; 1Œ D R mit a . b aus R abgeschlossen im Sinne von J(ii). Z.B. ist R n Œa; b/ D /&1; aŒ [ /b; 1Œ, also R n Œa; b/ offen, also Œa; b/ abgeschlossen. Analog schließt man in den anderen Fällen. Die Intervalle der restlichen Typen aus K[1.1] sind nicht abgeschlossen, weil ihre Endpunkte Häufungspunkte sind, die nicht zum Intervall gehören. Die jetzige Eigenschaft „abgeschlossen“ fällt also bei Intervallen mit der von K[1.1] zusammen.
(v)
Somit sind in R die Intervalle der Typen Œa; bŒ ; /a; b/ mit a < b aus R weder offen noch abgeschlossen im Sinne der Definition J(ii).
(vi)
In R gilt: \ i n2N
1 1h D f0g nicht offen: & ; n n… „ ƒ‚ offen
Ein Durchschnitt unendlich vieler offener Mengen braucht also nicht offen zu sein. Entsprechend braucht eine Vereinigung unendlich vieler abgeschlossener Mengen nicht abgeschlossen zu sein. (vii) In einem beliebigen metrischen Raum X ist jeder offene Ball als Vereinigung abgeschlossener Bälle darstellbar, sogar von abzählbar vielen. Es gelten nämlich Zwiebeldarstellungen der Art B.a; r/ D
[ 0<%
B.a; %/ D
[n 3 1o 1 - ˇˇ B a; r & ; ˇ n 2 N; n > n r
wie man unmittelbar an den definierenden Ungleichungen verifizieren&kann. Je-& de reelle Zahl aus /0; rŒ liegt ja in einem geeigneten Intervall der Form 0; r & n1 , wenn nur n hinreichend groß gewählt wird.
278
Kapitel 6 Metrische Räume
B(a,r)
Zwiebeldarstellung eines Balls
a
Man sagt, B.a; r/ wird durch die genannten abgeschlossenen Bälle ausgeschöpft. Q. Definition. Gegeben sei eine Teilmenge A , X. Man definiert: (i)
das Innere oder den offenen Kern Aı als Menge der inneren Punkte von A;
(ii)
den Abschluss oder die abgeschlossene Hülle A als Vereinigung von A mit der Menge der Häufungspunkte von A; (iii) den Rand @A ´ A n Aı .
Man nennt A dicht in X, wenn A D X gilt. Das Symbol @ heißt das „runde d“ und wird oft als „del“ ausgesprochen. R. Beispiele. (i) Sei A ein halboffenes Intervall A D Œa; bŒ in X ´ R mit der Standard-Metrik. Dann gilt A D Œa; b/; @A D fa; bg: Aı D /a; bŒ ; Zur ersten Gleichung: Jedenfalls ist /a; bŒ , Aı ; denn zu x 2 /a; bŒ sei definiert
r ´ min fx & a; b & xg, und dann gilt B.x; r/ , /a; bŒ * A. Weiter ist a nicht innerer Punkt von A; denn jeder Ball B.a; %/ D /a & %; a C %Œ enthält Punkte, die nicht zu A gehören, nämlich alle im Intervall /a & %; aŒ.
Zur zweiten Gleichung: Die Häufungspunkte von A sind genau die in Œa; b/, wie in J[3.2] gezeigt wurde. Wegen A * Œa; b/ folgt die Behauptung. Zur dritten Gleichung: Diese ist klar aus den beiden ersten Gleichungen. (ii) Q ist eine dichte Teilmenge von R; denn zu jeder reellen Zahl a und jedem " > 0 gibt es nach L[1.4] eine rationale Zahl in B.a; "/ D /a & "; a C "Œ. Zwischen den Operationen in (i) – (iii) gibt es eine Vielzahl von Beziehungen. Für deren Begründung ist der folgende Hilfssatz äußerst nützlich:
279
Abschnitt 6.1 Grundbegriffe für Mengen
S. Lemma. Für jede Teilmenge A , X gilt: [˚ , (1) U.p; "/ j p 2 X; " > 0; U.p; "/ , A Aı D X n A D .X n A/ı :
(2)
Hieraus folgt rein mengenmäßig: A D X n .X n A/ı ;
(3)
Aı D X n .X n A/:
Die Gleichungen (2) und (3) spiegeln erneut eine Dualität zwischen den beiden Operationen „offener Kern“ und „abgeschlossene Hülle“ wider. Sie können dazu dienen, jeweils die eine Operation auf die andere zurückzuführen. Beweis von S. Zu (1): Dass die linke Seite in der rechten enthalten ist, ist klar. Dass umgekehrt die rechte Seite in der linken enthalten ist, folgt mittels G(iii). Zu (2): Diese Gleichung bestätigt man unmittelbar aufgrund der Definitionen (i) und (ii) in Definition Q. Zu (3): Die erste Gleichung folgt aus (2), indem man das Komplement zu X bildet, die zweite, indem man A durch X n A ersetzt. " Damit ergeben sich beispielsweise die folgenden Aussagen: T. Satz. Seien A; B Teilmengen von X. Dann gilt (i) (ii)
Aı ist offen, A ist abgeschlossen. Es gilt Aı , A sowie: Aı D A genau dann, wenn A offen ist.
(iii) Es gilt A - A sowie: A D A genau dann, wenn A abgeschlossen ist. (iv) Aus A , B folgt Aı , B ı und A , B. Beweis. Der Nachweis für Behauptungen dieser Art ist i. Allg. nicht schwierig, da man lediglich auf die Definitionen zurückgreifen muss. Bündiger kann man argumentieren, wenn man Lemma S mit heranzieht: Aus (1) liest man alle Behauptungen in (i) – (iv) bzgl. der Operation A 7! Aı ab. Mit den Dualitätsformeln (2) und (3) rechnet man dann die Behauptungen nach, die sich auf die Operation A 7! A beziehen. " Da Aı offen und A abgeschlossen ist, folgt aus (ii) und (iii) (4)
Aıı D Aı ;
A D A:
280
Kapitel 6 Metrische Räume
Warnung: Bei Bällen ist i. Allg. B.a; r/ ¤ B.a; r/! Aus B.a; r/ , B.a; r/ folgt zwar (5)
B.a; r/ , B.a; r/ D B.a; r/
(dies ist abgeschlossen), aber nicht die inverse Inklusion. In R und Rn besteht allerdings Gleichheit, wie wir in I(v)[6.4] sehen werden. Jede Teilmenge eines metrischen Raums wird selbst zu einem metrischen Raum, indem man die Metrik einfach restringiert; vgl. D. Wie sich dabei die offenen und abgeschlossenen Mengen verhalten, sagt der folgende Satz. U. Definition und Satz (über Teilmengen). Sollen Eigenschaften, die für einen metrischen Raum X selbst definiert sind, auf eine Teilmenge A , X angewandt werden, so ist dafür A als metrischer Unterraum von X zu betrachten. Das gilt auch für die in den nachstehenden Abschnitten einzuführenden Begriffe. Bezüglich der Offenheit und Abgeschlossenheit kann man feststellen: Die offenen Teilmengen von A sind genau die Durchschnitte von A mit den offenen Teilmengen von X. Ebenso sind die abgeschlossenen Teilmengen von A genau die Durchschnitte von A mit den abgeschlossenen Teilmengen von X. Die offenen Teilmengen des Unterraums A heißen auch relativ offene Mengen oder offen in A. Entsprechend heißen die abgeschlossenen Teilmengen des Unterraums A als relativ abgeschlossene Mengen oder abgeschlossen in A. Die relativ offenen Mengen in A bilden die so genannte Relativ- oder Spurtopologie auf A. Ohne den Zusatz „relativ“ oder „in A“ ist immer die gewöhnliche Eigenschaft bzgl. X gemeint. Beweis. Die Behauptung über die offenen Teilmengen von A ist eine leichte Konsequenz der Tatsache, dass der Ball in A um a 2 A mit Radius r gerade gleich A \ B.a; r/ ist. Die Behauptung über die abgeschlossenen Teilmengen von A folgt dann hieraus per Dualität, d.h. mittels Satz M. " Es besteht also i. Allg. durchaus eine Verschiedenheit zwischen „offen in A“ und „offen in X“ (und analog bei „abgeschlossen“)! Schließlich geben wir noch eine Definition, die nicht topologischer, sondern metrischer Natur ist: V. Definition. Eine Teilmenge A , X heißt beschränkt, wenn A in einem Ball von X enthalten ist. Bei der Standard-Metrik auf R ist dieser Begriff äquivalent mit dem früheren, wie man an G[1.4] sieht.
Abschnitt 6.1 Grundbegriffe für Mengen
281
$ Metrisierung der symmetrischen Gruppe und Verstellungsmaß Wir führen hier den Beweis, dass das Verstellungsmaß dV für Wörter den Metrikaxiomen genügt. Vgl. Beispiel C(v). Im Wesentlichen beruht dies auf einer Metrik für die symmetrische Gruppe Sn , die zunächst behandelt wird. Die Gruppe Sn besteht aus allen bijektiven Abbildungen ' W f1; : : : ; ng ! f1; : : : ; ng mit der Komposition als Verknüpfung. Neutralelement ist die Identität 3. Jedes Element ' 2 Sn heißt eine Permutation (der Ziffern von 1 bis n). Ein Fehlstand von ' ist ein Paar .i; j / mit 1 . i < j . n und '.i/ > '.j /. Die Fehlstandsmenge F% ist die Menge aller Fehlstände von ', und die Fehlstandszahl ˆ.'/ ist ihre Anzahl: ˆ.'/ ´ jF% j. W. Lemma. Bezeichnet ˆ die Fehlstandszahl in der symmetrischen Gruppe Sn , so gilt für alle '; ) 2 Sn : (6)
ˆ.' ı )/ . ˆ.'/ C ˆ.)/:
Beweis. Sei k ´ ˆ.' /; ` ´ ˆ.)/. Die Fehlstandsmenge F%ı' zerfällt in zwei disjunkte Teilmengen: Für ein Paar .i; j / 2 F%ı' gilt entweder ).i/ > ).j /, also .i; j / 2 F' , und somit ist die Anzahl dieser Möglichkeiten höchstens `; oder aber es gilt ).i/ < ).j /, und dann .).i/; ).j // 2 F% , und somit ist die Anzahl dieser Möglichkeiten höchstens k. Insgesamt hat dann F% ı' höchstens ` C k Elemente. " X. Satz. Bezeichnet ˆ die Fehlstandszahl in der symmetrischen Gruppe Sn , so definiert d.'; )/ ´ ˆ.' ı ) &1 /
(7) eine Metrik auf Sn . Beweis.
Zu (D.1) für d : Zu zeigen ist ˆ.' ı ) &1 / D ˆ.) ı ' &1 /. Die Argumente von ˆ sind invers zueinander, also folgt dies aus der Regel ˆ.'/ D ˆ.' &1 /. Diese ist erfüllt; denn es gilt die Äquivalenz: .i; j / 2 F% () .'.j /; ' .i// 2 F% #1 , und die Abbildung .i; j / 7! .'.j /; '.i// bildet f1; : : : ; ng ) f1; : : : ; ng bijektiv auf sich ab. Zu (D.2), (D.3) für d : d.'; )/ % 0 ist klar nach Konstruktion. Da die Identität 3 die einzige Permutation ohne Fehlstände ist, gilt ˆ.' ı ) &1 / D 0 genau für ' ı ) &1 D 3, also genau für ' D ). Zu (D.4) für d : Für '; ); ! 2 Sn folgt unter Verwendung von Lemma W: ˆ.' ı ! &1 / D ˆ..' ı ) &1 / ı .) ı ! &1 // . ˆ.' ı ) &1 / C ˆ.) ı ! &1 /: Hieraus ergibt sich unmittelbar die Dreiecksungleichung für d .
"
282
Kapitel 6 Metrische Räume
Y. Definition und Satz. Das Verstellungsmaß für Wörter aus n Buchstaben, genommen aus dem Alphabet A, sei definiert durch dV .x; y/ ´ min fˆ.' / j ' 2 Sn mit yi D x%.i/ für i D 1; : : : ; ng;
x; y 2 An ;
falls eine solche Permutation existiert (überführbarer Fall), und sonst durch dV .x; y/ ´
1 .n & 1/n C 1: 2
Dann ist dV eine Metrik auf An . Hierbei ist der Summand vor der 1 die höchstmögliche Fehlstandszahl .n & 1/ C .n & 2/C( ( (C1 des ersten Falls. Diese wird erreicht bei der Permutation mit der Werteliste n; n & 1; : : : ; 1. Vgl. E[1.3]. Beweis von Y. Die Metrikaxiome für dV lassen sich analog wie bei der obigen Metrik d auf Sn bestätigen: Für (D.1) beachtet man, dass im überführbaren Fall yi D x%.i/ äquivalent ist mit xj D y% #1 .j / und dass ˆ.'/ D ˆ.' &1 / gilt. Für (D.2), (D.3) beachtet man, dass das minimale ' genau dann die Identität ist, wenn x D y. Schließlich beweist man die Dreiecksungleichung (D.4) für drei paarweise überführbare Wörter x; y; z so: Aus yi D x%.i/ und zj D y' .j / folgt zj D x%.'.j // . Die Ungleichung in W gilt dann für '; ) und natürlich auch für minimale ' und ). Indem man die linke Seite nochmals durch das Minimum ersetzt, das für x; z zuständig ist, ergibt sich dV .x; z/ . dV .x; y/ C dV .y; z/. Für nicht paarweise überführbare x; y; z ist die Dreiecksungleichung immer richtig, da zumindest ein Summand der rechten " Seite gleich 21 .n & 1/n C 1 ist. Aufgaben und Anmerkungen 1. Man bestimme die inneren Punkte, die Häufungspunkte und den Rand folgender Teilmengen von R: ˇ % + [i 1 2 ˇˇ 1 h 3 c) C D : & ˇ n; m 2 N , ; a) A D Q, b) B D m n 2n C 1 2n n2N Welche dieser Mengen sind offen bzw. abgeschlossen bzw. dicht in R? 2. Man bestimme für alle Intervalltypen aus K[1.1] das Innere, den Abschluss sowie den Rand. Insbesondere zeige man, dass bei jedem Intervall die Endpunkte im Sinne von K[1.1] dasselbe sind wie die Randpunkte im Sinne von Q(iii).
Abschnitt 6.1 Grundbegriffe für Mengen
283
3. Man beweise, dass die einzigen Teilmengen von R, die zugleich offen und abgeschlossen sind, die leere Menge ¿ und R selbst sind. Lösungshinweis: Sei A ¤ ¿ eine zugleich offene und abgeschlossene Teilmenge von R. Man wähle ein festes Element a 2 A und zeige, dass die beiden Mengen fb j Œa; bŒ , Ag und fc j Œc; aŒ , Ag nichtleer und unbeschränkt sind. 4. Man verallgemeinere den Satz L[1.4] folgendermaßen: Sei .pn /n2N eine Folge positiver Zahlen mit limn!1 pn D 0. Dann liegt zwischen je zwei verschiedenen reellen Zahlen stets eine Zahl der Form kpn mit k 2 Z und n 2 N. Daraus schließe man, dass die Menge fkpn j k 2 Z; n 2 Ng dicht in R ist. (L[1.4] ist der Spezialfall hiervon für pn ´ 1=n.) Lösungshinweis: Gleiche Prozedur wie in L[1.4]. 5. Gegeben sei eine stetige periodische Funktion f W R ! R, die nicht konstant ist, und es sei p ¤ 0 eine Periode von f . Man beweise: a) Mit p ist auch jedes ganze Vielfache kp; k 2 Z n f0g, Periode von f . b) Sei P die Menge aller positiven Perioden von f . Dann ist p0 ´ inf P positiv und selbst Periode von f . c) Jede Periode p von f ist ein ganzes Vielfaches von p0 . Wegen dieser Eigenschaften heißt p0 die primitive Periode von f . (Eine konstante Funktion gilt ebenfalls als periodisch mit der primitiven Periode 0.) Lösungshinweis: Bei b) nehme man an, p0 sei 0. Dann existiert eine Folge positiver Perioden pn ! 0, und mittels Aufgabe 4 schließe man f D const. Bei c) nehme man an, wenn p > 0 irgendeine Periode von f ist, es sei 1 < ˛ ´ p=p0 … N. Dann wähle man ein n 2 N mit n < ˛ < n C 1 und schließe, dass p & np0 positive Periode von f ist mit p & np0 < p0 , was der Wahl von p0 widerspricht. 6. Die folgenden Aussagen klären, wann eine Stammfunktion einer stetigen periodischen Funktion periodisch ist: Sei f W R ! R stetig und periodisch mit der primitiven Periode p0 > 0. Sei ˆ eine Stammfunktion von f . Dann sind paarweise äquivalent: (i)
ˆ ist periodisch;
(ii)
ˆ ist periodisch mit der primitiven Periode p0 ; Z p0 f .t/ dt D 0. (iii) 0
Lösungshinweis: Man verwende den Hauptsatz der Differential- und Integralrechnung R xCp f .t/ dt. in der Form ˆ.x C p/ & ˆ.x/ D x
284
Kapitel 6 Metrische Räume
7. Es sei X eine nichtleere Menge. Man definiere eine Abbildung d W X ) X ! R durch ( 0 für x D y d.x; y/ ´ 1 für x ¤ y: a) Man beweise: d ist eine Metrik auf X. b) Man bestimme alle offenen und abgeschlossenen Bälle sowie Sphären mit festem Mittelpunkt a 2 X und folgere daraus, dass X ein diskreter Raum ist. c) Man zeige B.a; 1/ ¤ B.a; 1/ und damit @B.a; 1/ ¤ S.a; 1/ sowie B.a; r/ D B.a; r/ für r ¤ 1. 8. Für eine Menge X sei d W X ) X ! R eine Abbildung, sodass für alle x; y; z 2 X gilt d.x; y/ D 0 () x D y d.x; y/ . d.x; z/ C d.z; y/: Man zeige, dass d eine Metrik auf X ist. 9. Unter der symmetrischen Differenz zweier Mengen U; V versteht man die Menge U 4V ´ .U n V / [ .V n U /:
a) Sei N eine beliebige Menge und M die Menge aller endlichen Teilmengen von N . Für U; V 2 M sei eine Distanz definiert durch d.U; V / ´ jU 4V j. Man beweise, dass d eine Metrik auf M ist. b) Für N ´ fn; e; u; j; a; h; rg sei U ´ fj; a; h; rg. Welche Mengen V , N haben von U in dieser Metrik eine Distanz . 1? In den folgenden Aufgaben sei X stets ein metrischer Raum und A; B; : : : seien Teilmengen von X. 10. In Verallgemeinerung der modifizierten Dreiecksungleichung beweise man für x; y; z; w 2 X die Ungleichung jd.x; y/ & d.z; w/j . d.x; z/ C d.y; w/: 11. Man zeige: Der Abschluss A besteht aus allen Punkten p 2 X mit der Eigenschaft, dass jede "-Umgebung von p die Menge A schneidet. Solche Punkte p 2 X werden Berührungspunkte von A genannt. Man mache sich den Unterschied zu den Häufungspunkten klar!
285
Abschnitt 6.1 Grundbegriffe für Mengen
12. Man beweise die Regeln .A \ B/ı D Aı \ B ı ;
A [ B D A [ B:
13. Man beweise die disjunkte Zerlegung $ $ @A [ .X n A/ı : X D Aı [
Die Menge .X nA/ı heißt das Äußere von A. Jeder Punkt von X gehört also entweder zum Inneren oder aber zum Rand oder aber zum Äußeren von A. 14. Man zeige a) A ist genau dann offen, wenn A \ @A D ¿ gilt. b) A ist genau dann abgeschlossen, wenn @A , A gilt. 15. Man beweise @A D A \ .X n A/ und folgere daraus, dass @A stets abgeschlossen ist, sowie @A D @.X n A/. 16. Man beweise a) Aı ist die Vereinigung aller offenen Mengen B mit B , A. Somit ist Aı die größte offene Teilmenge von A. a) A ist der Durchschnitt aller abgeschlossenen Mengen C mit A , C , X. Somit ist A die kleinste abgeschlossene Obermenge von A. c) @A besteht aus allen p 2 X mit der Eigenschaft, dass jede "-Umgebung von p sowohl A wie auch das Komplement X n A schneidet. 17. In der Situation A , B , X beweise man die Implikationen a) A offen in X H) A offen in B; b) A abgeschlossen in X H) A abgeschlossen in B. Umkehren lassen sich diese Schlüsse nicht. Beispiele? 18. Man zeige: @.A [ B/ , @A [ @B;
@.A \ B/ , @A [ @B:
286
6.2
Kapitel 6 Metrische Räume
Grundbegriffe für Abbildungen
Immer wenn man in der Mathematik Räume untersucht, ist es angebracht, auch die zwischen ihnen bestehenden Abbildungen zu studieren. Deren Eigenschaften sollten natürlich die Besonderheiten der betreffenden Raumstrukturen berücksichtigen. Hier wird es hauptsächlich um stetige Abbildungen zwischen metrischen Räumen gehen. Gegeben seien zwei metrische Räume .X; d / und .Y; d /, wobei die Metriken gleich bezeichnet seien (obwohl sie verschieden sein dürfen). Wir studieren als Erstes Abbildungen, die auf Teilmengen von X definiert sind: F W A &! Y
wobei
A , X:
A. Definition. Sei a ein Häufungspunkt von A. Wir nennen F konvergent für x gegen a, wenn es ein b 2 Y gibt mit folgender Eigenschaft: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit 0 < d.x; a/ < ı gilt: d.F .x/; b/ < ". Ist dies der Fall, so heißt b der Grenzwert von F für x gegen a (symbolisch: x ! a), und man schreibt lim F .x/ D b
x!a
oder
F .x/ &! b
(für x &! a):
Man beachte die starke Analogie zur Grenzwertdefinition in E[3.2]. Im Grunde hat man ja lediglich den Abstand ju & vj in R zu ersetzen durch die Abstände d.p; q/ in X bzw. Y . Nach diesem Muster sind viele der folgenden Begriffe gebildet. Falls existent, ist der Grenzwert b eindeutig bestimmt. Dies folgt leicht aus der Dreiecksungleichung: d.b; e b/ . d.b; F .x// C d.F .x/; e b/. Ab jetzt sei A D X, also wird der Abbildungstyp F W X ! Y weiter untersucht. Will man die folgenden Begriffe auf Teilmengen beziehen, so kann man diese als metrische Räume mit der Relativtopologie betrachten. (Bei Definition A ging das nicht, weil a nicht Element von A sein musste.) B. Definition. Die Abbildung F W X ! Y heißt stetig in a 2 X, wenn gilt: Zu jedem " > 0 existiert ein ı D ı."/ > 0, sodass für alle x 2 A mit d.x; a/ < ı gilt: d.F .x/; F .a// < ".
287
Abschnitt 6.2 Grundbegriffe für Abbildungen
Die eingerahmten Bedingungen seien wieder als ."; ı/-Tests bezeichnet. Diese können wie früher mit Hilfe von Umgebungen ausgedrückt werden. Mögliche äquivalente Umformulierungen lauten im Falle des Grenzwertes z.B. 8 " > 0 9 ı > 0 W x 2 A \ U $ .a; ı/ H) F .x/ 2 U.b; "/ bzw. im Fall der Stetigkeit 8 " > 0 9 ı > 0 W x 2 U.a; ı/ H) F .x/ 2 U.F .a/; "/: C. Satz. Gegeben sei die Abbildung F W X ! Y und ein Punkt a 2 X. Dann gilt: (i)
Ist a isolierter Punkt von X, so ist F in a stetig.
(ii) Ist a Häufungspunkt von X, so besteht die Äquivalenz: F stetig in a ()
lim F .x/ D F .a/:
x!a
Beweis. Dieser Satz ist völlig analog zu seinem „konkreten“ Gegenstück C[3.3]. In solchen Fällen ergibt sich der Beweis der jetzigen allgemeinen Fassung aus dem Beweis der konkreten Fassung, indem man dort überall d.u; v/ statt ju & vj schreibt (und natürlich die Bezeichnungen an die neue Situation anpasst). Wir führen dies explizit an dieser Stelle vor, werden aber im weiteren Verlauf dieses Prinzip nur kurz andeuten. Zu (i): Nach Voraussetzung existiert ein ı1 > 0 mit U.a; ı1 / D fag. Zu jedem " > 0 sei ı ´ ı1 gewählt. Dann gilt für d.x; a/ < ı1 : x D a, also 0 D d.F .x/; F .a// < ". Zu (ii): F stetig in a bedeutet: 8 " > 0 9 ı > 0 W x 2 U.a; ı/ H) d.F .x/; F .a// < ": lim F .x/ D F .a/ bedeutet:
x!a
8 " > 0 9 ı > 0 W x 2 U $ .a; ı/ H) d.F .x/; F .a// < ": Da d.F .a/; F .a// < ", verlangen beide Bedingungen dasselbe.
"
Der ."; ı/-Test der Stetigkeit in Definition B ist auch so formulierbar: 8 " > 0 9 ı > 0 W F .U.a; ı// , U.F .a/; "/: Er verlangt also, bei gegebenem " das ı so zu bestimmen, dass die Umgebung U.a; ı/ durch F in die Umgebung U.F .a/; "/ hinein abgebildet wird. Man macht sich das anhand der folgenden Skizze klar:
288
Kapitel 6 Metrische Räume
N
M
a
δ
F
F(a)
ε
gesucht
vorgegeben
Vorgegeben ist also eine „Zieltoleranz“ ", und die Stetigkeit verlangt, eine „Definitionstoleranz“ ı so anzupassen, dass die Zieltoleranz erreicht wird. Das formale und inhaltliche Verständnis der Stetigkeit ist absolut wichtig und zentral für die Analysis! F G D. Satz (Kettenregel der Stetigkeit). Gegeben seien Abbildungen X &&! Y &&! Z zwischen metrischen Räumen X; Y; Z. Ist F stetig in a 2 X und G stetig in F .a/ 2 Y , so ist G ı F stetig in a. Beweis. Wie bei G[3.3], indem man dort überall d.u; v/ statt ju & vj schreibt.
"
E. Definition. Man nennt die Abbildung F W X ! Y stetig, wenn F in jedem a 2 X stetig ist. Das bedeutet also: 8 a 2 X; " > 0 9 ı > 0 8 x 2 X mit d.x; a/ < ıW d.F .x/; F .a// < ": Hierbei darf ı von " und a abhängen: ı D ı."; a/. Eine stärkere Forderung entsteht, wenn man die Abhängigkeit von a fallen lässt: F. Definition. Man nennt die Abbildung F W X ! Y gleichmäßig stetig, wenn zu jedem " > 0 ein ı ´ ı."/ existiert, sodass für alle x; a 2 X mit d.x; a/ < ı gilt: d.F .x/; F .a// < ". Formelmäßig ausgedrückt lautet das: 8 " > 0 9 ı > 0 8 x; a 2 X mit d.x; a/ < ıW d.F .x/; F .a// < ": Dieses ı darf jetzt nur von " abhängen. Natürlich folgt aus der gleichmäßigen Stetigkeit die Stetigkeit, aber i. Allg. nicht umgekehrt. Wann dies doch der Fall ist, wird in Abschnitt 6.5 diskutiert. Eine solche Situation haben wir schon in E[5.1] kennengelernt.
289
Abschnitt 6.2 Grundbegriffe für Abbildungen
G. Satz. Für jede Abbildung F W X ! Y sind äquivalent: (i)
F ist stetig;
(ii)
für jede offene Teilmenge V , Y ist das Urbild F &1 .V / offen in X;
(iii) für jede abgeschlossene Teilmenge C , Y ist das Urbild F &1 .C / abgeschlossen in X. Beweis. Aus (i) folgt (ii): Sei V offen in Y . Um die Offenheit von F &1 .V / zu zeigen, muss zu gegebenem a 2 F &1 .V / eine Umgebung von a konstruiert werden, die ganz in F &1 .V / enthalten ist. Da F .a/ 2 V , existiert eine Umgebung U.F .a/; "/ , V . Wegen der Stetigkeit von F in a existiert eine Umgebung U.a; ı/ mit F .U.a; ı// , U.F .a/; "/ , V . Hieraus folgt U.a; ı/ , F &1 .V /. Aus (ii) folgt (i): Sei a 2 X; " > 0 gegeben. Dann ist U.F .a/; "/ offen in Y ; vgl. P[6.1]. Also ist nach Voraussetzung F &1 .U.F .a/; "// offen in X, also existiert ı > 0 mit Ua; ı/ , F &1 .U.F .a/; "//. Dann gilt F .U.a; ı// , U.F .a/; "/. Somit ist F stetig in a. Äquivalenz von (ii) und (iii): Dies ergibt sich mittels Dualität, nämlich aus M[6.1] und N[6.1] sowie aus der rein mengentheoretischen Gleichung F &1 .Y n W / D X n F &1 .W /; die für alle Teilmengen W , Y zutrifft.
"
H. Bemerkung. Satz G wird sehr oft angewendet, um die Offenheit oder Abgeschlossenheit von Mengen zu erkennen, insbesondere wenn diese durch Gleichungen oder Ungleichungen definiert sind: Ist z.B. f W X ! R stetig und c 2 R gegeben, so haben die folgenden Teilmengen von X die angegebene Eigenschaft: fx 2 X j f .x/ < cg D f &1 ./ & 1; cŒ/ offen fx 2 X j f .x/ . cg D f &1 ./ & 1; c// abgeschlossen fx 2 X j f .x/ D cg D f &1 .fcg/
abgeschlossen;
da sie in der angeschriebenen Weise als Urbilder dargestellt werden können und da /&1; cŒ offen bzw. /&1; c/ sowie fcg abgeschlossen in R sind. Mengen der ersten und zweiten bzw. dritten Zeile werden als Subniveaumengen bzw. als Niveaumengen bezeichnet. Im Zusammenhang mit der ersten Zeile ist Folgendes bemerkenswert: Ist eine strikte Ungleichung f .x0 / < c für einen festen Punkt x0 2 X erfüllt, so auch in einer Umgebung U.x0 ; ı/. Das ist eine weitgehende Variante des Meidungsprinzips.
290
Kapitel 6 Metrische Räume
Eine weitere Verstärkung der gleichmäßigen Stetigkeit ist die Lipschitz-Stetigkeit: I. Definition. Die Abbildung F W X ! Y heißt dehnungsbeschränkt oder Lipschitzstetig oder eine Lipschitz-Abbildung, wenn ein c % 0 existiert, sodass gilt: (1)
d.F .x1 /; F .x2 // . c ( d.x1 ; x2 /
für alle x1 ; x2 2 X:
Das c heißt dann eine Lipschitz-Konstante von F , und (1) wird eine Lipschitz-Bedingung genannt. J. Satz. Ist F W X ! Y Lipschitz-stetig, so ist F W X ! Y erst recht gleichmäßig stetig. Beweis. Wie in P[3.3]: ı."/ ´
" tut es. cC1
"
K. Beispiele. (i)
Die Distanzfunktion dA einer nichtleeren Menge A , X ist dA W X &! R;
dA .x/ ´ inf fd.p; x/ j p 2 Ag:
dA ist Lipschitz-stetig mit der Lipschitz-Konstanten 1, also gleichmäßig stetig: Zu x; y 2 X sei " > 0 vorgegeben. Dann existiert ein q 2 A mit d.y; q/ < dA .y/ C "; vgl. K[2.6]. Also gilt d.x; q/ . d.x; y/ C d.y; q/ < d.x; y/ C dA .y/ C ". Hieraus folgt dA .x/ < d.x; y/ C dA .y/ C ", also für " # 0: dA .x/ . d.x; y/ C dA .y/, d.h. dA .x/ & dA .y/ . d.x; y/. Vertauschung von x; y liefert die Lipschitz-Bedingung jdA .x/ & dA .y/j . d.x; y/. Für eine einelementige Teilmenge A D fpg erhält man speziell die Distanzfunktion von p, auch geschrieben als dp ´ dfpg . Hier gilt einfach dp .x/ D d.p; x/. Statt „Distanzfunktion“ sagt man auch Abstandsfunktion. Mit Bemerkung H kann man leicht folgern, dass jede Sphäre S.p; r/ abgeschlossen ist, da S.p; r/ D fx 2 X j dp .x/ D rg. Ebenso folgt, dass jede einelementige Teilmenge fpg von X abgeschlossen ist, da fpg D fx 2 X j d.x; p/ D 0g. (ii) Für die Reziprokenfunktion R W RC ! R; f .x/ D x1 , gilt: a) Rj Œ1; 1Œ ist gleichmäßig stetig; b) Rj /0; 1/ ist stetig, aber nicht gleichmäßig stetig. Zu a): Für je zwei Punkte x1 ; x2 % 1 gilt ˇ ˇ ˇ1 jx1 & x2 j 1 ˇˇ ˇ . jx1 & x2 j: jR.x1 / & R.x2 /j D ˇ & ˇ D x1 x2 jx1 j ( jx2 j Somit ist Rj Œ1; 1Œ dehnungsbeschränkt mit der Lipschitz-Konstanten 1, also gleichmäßig stetig.
291
Abschnitt 6.2 Grundbegriffe für Abbildungen
Zu b): Die Stetigkeit ergibt sich aus F[3.3]. Sie kann jedoch auf /0; 1/ nicht gleichmäßig sein. Anschaulich am Graphen ist dies klar: Damit sich zwei Funktionswerte höchstens um " unterscheiden, müssen die Argumente immer dichter beieinander gewählt werden, je näher man bei 0 ist.
nicht gleichmäßig stetig
ε (1,1) gleichmäßig stetig
ε δ
δ
Präzise: Das ist schon bei " D 1 der Fall: Wäre bei geeignetem ı1 > 0: jR.x1 / & R.x2 /j . 1 für beliebige x1 ; x2 2 /0; 1/ mit jx1 & x2 j < ı1 , so träfe dies erst recht für ein ı1 < 1 zu, und dann erhielte man leicht einen Widerspruch bei der Wahl x1 ´ ı1 ; x2 ´ ı1 =2; denn es wird jR.x1 / & R.x2 /j D 1=ı1 . In F[6.5] wird ein allgemeiner Satz angegeben, wann aus der Stetigkeit die gleichmäßige Stetigkeit folgt.
Warnung: Spricht man von der Stetigkeit einer Abbildung F W X ! Y bezogen auf eine Teilmenge A * X, so ist eine gewisse Vorsicht angebracht, da zwei verschiedene Bedeutungen (˛) oder (ˇ) möglich sind: (˛) F W X ! Y ist in allen Punkten a 2 A stetig. (ˇ) Die Restriktion F jA W A ! Y ist stetig (bzgl. der Spurtopologie von A). (˛) ist die stärkere Forderung. Denn (˛) impliziert (ˇ), aber die Umkehrung gilt nicht: Die Gauß-Klammer (C[3.1]) ist im Sinne von (ˇ) auf Œ0; 1Œ stetig, nicht aber im Sinne von (˛), da sie im Gesamtverlauf (d.h. als Funktion von R in R) bei 0 und 1 Sprünge aufweist. Andererseits: Ist A offen in X, so sind (˛) und (ˇ) äquivalent. Wenn nichts besonderes vereinbart wird, so ist die Bedeutung (˛) gemeint. Andernfalls muss detailliert gesagt werden, welche Bedeutung gewählt ist. Analoges gilt für die Differenzierbarkeit auf Teilmengen.
292
Kapitel 6 Metrische Räume
$ Beziehungen unter metrischen Räumen und Visualisierung des Unendlichen Für die Beziehungen zwischen metrischen Räumen gibt es mehrere Möglichkeiten. Man kann z.B. auf die Distanz abheben oder auf die weniger starke Struktur der offenen Teilmengen. Dies führt auf folgende Begriffe: L. Definition. Die Abbildung F W X ! Y heißt (i)
isometrisch, wenn für alle x1 ; x2 2 X gilt:
(2)
d.F .x1 /; F .x2 // D d.x1 ; x2 /I
statt „isometrischer Abbildung“ sagt man auch Isometrie; (ii) topologisch, wenn F W X ! Y bijektiv ist und beide Abbildungen F W X ! Y und F &1 W Y ! X stetig sind; statt „topologisch“ sagt man auch homöomorph, statt „topologischer Abbildung“ sagt man auch Homöomorphismus. Eine Isometrie ist von alleine injektiv; denn aus F .x1 / D F .x2 / folgt mittels (2) sofort x1 D x2 . Ist die Abbildung F W X ! Y eine surjektiv Isometrie, so ist sie bijektiv, und die Umkehrabbildung F &1 W Y ! X erfüllt d.F &1 .y1 /; F &1 .y2 // D d.y1 ; y2 / für alle y1 ; y2 2 Y , ist also wieder eine Isometrie. In diesem Fall sind beide Abbildungen stetig, d.h. eine surjektive Isometrie ist stets ein Homöomorphismus. Isometrien sind recht eingeschränkt. Deshalb sind für die Analysis die topologischen Abbildungen sehr viel wichtiger. M. Bemerkungen. (i) Ist F W R ! R eine Isometrie, wobei R als Definitions- und Zielraum mit der Standard-Metrik versehen ist, so ist F entweder von der Form F .x/ D x C c oder F .x/ D &x C c mit konstantem c 2 R: Bildet man G.x/ ´ F .x/ & F .0/, so folgt aus (2) für alle x1 ; x2 2 R: jG.x1 / & G.x2 /j D jx1 & x2 j;
wobei G.0/ D 0;
speziell also jG.x1 /j D jx1 j, sodass G.x1 /=x1 für x1 ¤ 0 stets vom Betrag 1 ist. Hieraus berechnet man weiter 2G.x1 /G.x2 / D G.x1 /2 C G.x2 /2 & .G.x1 / & G.x2 //2 Dx12 C x22 & .x1 & x2 /2 D 2x1 x2 : Division mit G.x1 /2 D x12 liefert G.x2 /=G.x1 / D x2 =x1 , also G.x2 /=x2 D G.x1 /=x1 für x1 ¤ 0, x2 ¤ 0. Somit ist G.x/=x für x ¤ 0 konstant und vom Betrag 1, also entweder G.x/ D x für alle x 2 R oder aber G.x/ D &x für alle x 2 R. Wegen G.x/ ´ F .x/ & F .0/ folgt die Behauptung.
Abschnitt 6.2 Grundbegriffe für Abbildungen
293
(ii) Ist J , R ein Intervall und F W J ! R stetig und streng monoton, so definiert F eine topologische Abbildung von J auf das Bildintervall F .J /. Das ist gerade die Aussage von E[3.6] und F[3.6]. (iii) Ist F W X ! Y injektiv und Y ein metrischer Raum, X aber lediglich als Menge betrachtet, so kann X in eindeutiger Weise so mit einer Metrik versehen werden, dass F eine Isometrie wird. Man setzt einfach für x1 ; x2 2 X d $ .x1 ; x2 / ´ d.F .x1 /; F .x2 // und bestätigt leicht die Metrikeigenschaften für d $ . Man sagt, d $ sei von d durch F induziert. (Wenn X zuvor schon eine Metrik d hatte, so kann man natürlich d $ mit d vergleichen, was durchaus von Interesse sein kann, etwa um die Abweichung von F von der Isometrieeigenschaft zu messen.) N. Definition und Satz. Man nennt zwei metrische Räume X; Y isometrisch, wenn es eine Isometrie F von X auf Y gibt. Die Isometrie zwischen metrischen Räumen hat die Eigenschaften einer Äquivalenzrelation. Man nennt zwei metrische Räume X; Y topologisch äquivalent oder homöomorph, wenn es eine topologische Abbildung F W X ! Y gibt. Die Homöomorphie zwischen metrischen Räumen hat ebenfalls die Eigenschaften einer Äquivalenzrelation. Beweis. Im Fall der Isometrie bestätigt man ohne Mühe die Eigenschaften: Reflexivität: X ist zu X isometrisch (vermöge der identischen Abbildung); Symmetrie: ist X zu Y isometrisch, so auch Y zu X (vermöge der Umkehrabbildung zu einer Isometrie F von X auf Y ); Transitivität: ist X isometrisch zu Y und Y isometrisch zu Z, so ist auch X isometrisch zu Z (vermöge der Komposition zweier Isometrien von X auf Y und von Y auf Z). In allen drei Fällen ist die neue Abbildung ja wiederum isometrisch. Im Fall der Homöomorphie geht dies analog, da Identität sowie Umkehrabbildung und Komposition topologischer Abbildungen wiederum topologische Abbildungen sind. " O. Definition und Satz. Zwei Metriken d und d1 auf ein und derselben Menge X heißen äquivalent, wenn sie die gleiche Topologie erzeugen, d.h. wenn das System der offenen Mengen von X bzgl. d mit dem System der offenen Mengen von X bzgl. d1 übereinstimmt. Dies ist genau dann der Fall, wenn die Identität idX W X ! X topologisch ist (wobei X als Definitionsraum mit der Metrik d und als Zielraum mit der Metrik d1 versehen ist). Beweis. Dies ergibt sich unmittelbar aus der Charakterisierung der Stetigkeit in G(ii). "
294
Kapitel 6 Metrische Räume
P. Satz. Seien X; Y metrische Räume und F W X ! Y eine Bijektion. Dann sind d und die induzierte Metrik d $ auf X genau dann äquivalent, wenn F ein Homöomorphismus ist. Beweis. Der Beweis beruht wesentlich auf der Gleichung (3) F &1 .U.F .a/; 1// D U $ .a; 1/ für alle a 2 X; 1 > 0: Hierin bezieht sich U links auf die gegebene Metrik in Y und U $ rechts auf die Umgebung bzgl. der induzierten Metrik d $ in X. Der Beweis von (3) ergibt sich aus folgender Umformung: F &1 .U.F .a/; 1// D fF &1 .y/ j d.F .a/; y/ < 1g D fx j d.F .a/; F .x// < 1g D fx j d $ .a; x/ < 1g
(setze x D F &1 .y/)
D U $ .a; 1/: 1) Die Stetigkeit von F in a 2 X bedeutet, dass zu jedem " > 0 ein ı > 0 existiert mit F .U.a; ı// , U.F .a/; "/, also äquivalent mit U.a; ı/ , U $ .a; "/: 2) Die Stetigkeit von F &1 in b ´ F .a/ bedeutet, dass zu jedem " > 0 ein ı > 0 existiert mit F &1 .U.b; ı// , U.F &1 .b/; "/, also äquivalent mit U $ .a; ı/ , U.a; "/: Ist nun F als Homöomorphismus vorausgesetzt, so sind F und F &1 beide stetig, und die Äquivalenzen in 1) und 2) beinhalten, dass jede Teilmenge A , X , die bzgl. d $ offen ist, auch bzgl. d offen ist, und umgekehrt. Sind d und d $ äquivalent vorausgesetzt, so ist jede Umgebung U $ .a; "/ nicht nur offen bzgl. d $ , sondern auch bzgl. d , enthält also eine Umgebung U.a; ı/. Somit ist
nach der Äquivalenz in 1) F stetig. Der gleiche Schluss mit vertauschten Rollen von U und U $ zeigt die Stetigkeit von F &1 . "
Q. Beispiel. Auf R betrachten wir neben der Standard-Metrik d.a; b/ ´ ja & bj die Metrik d $ , induziert von der Abbildung F W R ! R mit x : F .x/ ´ 1 C jxj Diese ist stetig und streng monoton wachsend mit dem (offenen) Bildintervall J ´ /&1; 1Œ, also ein Homöomorphismus von R auf J (beide mit der Standard-Metrik bzw. mit deren Einschränkung versehen). Die induzierte Metrik auf R ist somit ˇ ˇ ˇ a b ˇˇ $ ˇ ; & d .a; b/ D jF .a/ & F .b/j D ˇ 1 C jaj 1 C jbj ˇ
295
Abschnitt 6.2 Grundbegriffe für Abbildungen
und diese ist äquivalent mit d . Man beachte, dass die Werte von d $ im Intervall /0; 2Œ liegen, also beschränkt sind. Wir setzen nun F auf die erweiterte reelle Achse R fort, indem wir definieren: F .&1/ ´ &1 und F .1/ ´ C1. Hierdurch wird R bijektiv auf das abgeschlossene Intervall J D Œ&1; 1/ abgebildet. Die durch F induzierte Metrik auf R ist nach wie vor gegeben durch d $ .a; b/ D jF .a/ & F .b/j: Somit ist F eine Isometrie und damit eine topologische Abbildung von R mit der Metrik d $ auf J mit der Standard-Metrik d . Damit erhalten wir in J ein „sichtbares“ topologisches Äquivalent der erweiterten reellen Achse, wobei die Endpunkte ˙1 den beiden Unendlichs ˙1 entsprechen („Visualisierung des Unendlichen“):
-1
0
1
Die Bilder der ganzen Zahlen drängen sich immer enger an &1 und 1 heran, die ganze reelle Achse ist auf den endlichen Bereich von &1 bis 1 „zusammengequetscht“. Die Anordnungsbeziehungen (einschließlich derer für ˙1) bleiben aber erhalten, da F streng monoton ist. Durch die Fortsetzung hat sich d $ .a; b/ für Argumente a; b 2 R nicht verändert, erfüllt nun aber zusätzlich für a 2 R: d $ .a; 1/ D 1 & F .a/;
d $ .a; &1/ D 1 C F .a/;
d $ .&1; 1/ D 2:
Die offenen Mengen in R * R bzgl. d $ stimmen mit den gewöhnlichen offenen Mengen (es sind die bzgl. der Standard-Metrik d ) überein. Die "-Umgebungen von 1 in R bzgl. d $ sind außer den zwei Einzelmengen R (" > 2) und f1g [ R (" D 2) die der Schar f1g [ /D; 1Œ für D 2 R (" < 2), wobei D D F &1 .1 & "/. Man erkennt dies durch Umrechnen der Bedingung d $ .1; x/ < " für x 2 R. Die Mengen dieser Schar koinzidieren mit den früher in J[3.5] definierten Umgebungen von 1. Entsprechendes gilt für die "-Umgebungen von &1 in R. Insbesondere sieht man, dass jede "-Umgebung von ˙1 Punkte mit R gemeinsam hat, dass also R in R dicht liegt. Damit ist die Rolle der beiden uneigentlichen Elemente ˙1 in diesem topologischen Kontext geklärt. Ein weiterer Aspekt wird am Ende von Abschnitt 6.3 hinzugefügt.
296
Kapitel 6 Metrische Räume
Aufgaben und Anmerkungen 1. Sei X ein metrischer Raum, und seien f; g W X ! R Funktionen, die in einem Punkt a 2 X stetig sind. Man zeige: Auch f C g und f ( g sind in a stetig, ebenso f , falls g.a/ ¤ 0. g F G 2. Gegeben seien Abbildungen X &&! Y &&! Z zwischen metrischen Räumen X; Y; Z. Als Varianten der Kettenregel in Satz D zeige man a) Sind F und G gleichmäßig stetig, so auch G ı F . b) Sind F und G Lipschitz-stetig, so auch G ı F . 3. Für jede Teilmenge A eines metrischen Raumes X beweise man A D fx 2 X j dA .x/ D 0g. 4. Sei .X; d / ein metrischer Raum und f W X ! R eine dehnungsbeschränkte Funktion. Man beweise, dass f sublinear wächst, d.h. es gibt einen festen Punkt p 2 X und Konstanten a % 0, b % 0 derart, dass für alle x 2 X gilt: jf .x/j . a ( d.p; x/ C b: 5. Sei F W X ! Y eine Abbildung zwischen metrischen Räumen X, Y , und sei S A+ mit endlicher oder auch .A+ /+ 2) eine Überdeckung von X, d.h. X D +2) nichtendlicher Indexmenge - derart, dass alle Restriktionen F+ ´ F jA+ W A+ ! Y stetig sind. Die Stetigkeit der Restriktion F+ bezieht sich dabei auf A+ als metrischen Unterraum von X. Man beweise die folgenden hinreichenden Kriterien für die Stetigkeit von F : a) Ist die Überdeckung offen, d.h. sind alle Mengen A+ offen, so ist F stetig. b) Ist die Überdeckung abgeschlossen, d.h. sind alle Mengen A+ abgeschlossen und ist sie endlich (d.h. die Indexmenge - endlich), so ist F stetig. Lösungshinweis zu b): Man verwende G(iii). 6. Die Regeln der Aufgabe 5 sind sehr nützlich bei den in der Analysis häufig vorkommenden Klammerdefinitionen. Es soll z.B. eine Abbildung f W R ! R definiert werden durch 8 <min fjx & 3j; 4g für x % 0 f .x/ ´ p : 2 x & 6x C 9 für x . 6: Dann entstehen zwei Fragen: Ist f wohldefiniert, d.h. ist diese Definition widerspruchsfrei? Wenn ja, ist die Funktion f stetig auf ganz R? Zur ersten Frage muss man absichern, dass auf dem Durchschnitt der Einzelmengen A ´ Œ0; 1Œ und B ´ /&1; 6/ die Festsetzungen zum gleiche Ergebnis führen. Der
297
Abschnitt 6.2 Grundbegriffe für Abbildungen
Durchschnitt ist hier A \ B D Œ0; 6/. Der Wert der ersten Festsetzung ist für x 2 Œ0; 6/ gleich jx & 3j, da p dies . 4 ist. Der Wert der zweiten Festsetzung ist generell gleich p x 2 & 6x C 9 D .x & 3/2 D jx & 3j. Somit ist f wohldefiniert. Für die zweite Frage ist Aufgabe 5, Teil b) zuständig: Die Einzelfunktionen sind auf den Einzelmengen A; B stetig (beachte: Minimum und Maximum sind durch den Betrag ausdrückbar), A; B sind abgeschlossen, somit ist f insgesamt wohldefiniert und stetig. 7. $ Sei J , R ein Intervall und f W J ! R stetig und streng monoton. Man zeige, dass f W J ! f .J / ein Homöomorphismus ist, wobei J und f .J / mit der Spurtopologie versehen sind. 8. Sei X ein metrischer Raum und ¿ * A * X. Als innere Distanzfunktion ıA bezeichnet man die Distanzfunktion zum Komplement: ıA ´ dXnA . Wenn sie ein Maximum m ´ max ıA besitzt, so wird die zugehörige Niveaumenge SA ´ fx 2 X j ıA .x/ D mg als die Seele von A bezeichnet. 9. $ Man beweise, dass es zu jedem metrischen Raum .X; d / eine beschränkte Metrik db gibt, die zu d äquivalent ist. Lösungshinweis: Mögliche Konstruktionen sind db .x1 ; x2 / ´ min fd.x1 ; x2 /; 1g
oder
db .x1 ; x2 / ´
d.x1 ; x2 / : 1 C d.x1 ; x2 /
10. $ Sind d und d1 Metriken auf der Menge X und gibt es positive Konstanten ˛; ˇ mit ˛d1 .x1 ; x2 / . d.x1 ; x2 / . ˇd1 .x1 ; x2 / für alle x1 ; x2 2 X; so sind d und d1 äquivalent. Gilt hiervon auch die Umkehrung? 11. $ Viele der hier eingeführten Begriffe hängen nur von der Gesamtheit der offenen Mengen, d.h. von der Topologie, ab. Paradebeispiel ist die Stetigkeit, die laut G(ii) allein durch das System der offenen Mengen in Definitions- und Zielraum bestimmt ist. Solche Begriffe heißen topologisch. Topologische Begriffe für metrische Räume sind äquivalent dadurch gekennzeichnet, dass sie sich beim Übergang zu äquivalenten Metriken nicht verändern. a) Neben der Offenheit von Mengen selbst sind z.B. folgende Begriffe topologisch: Abgeschlossenheit, Häufungspunkt, Abschluss, Inneres, Rand, Dichtheit, Stetigkeit (auch in einem Punkt), Homöomorphie. b) Dagegen sind z.B. folgende Begriffe nicht topologisch: Ball, Sphäre, Beschränktheit, gleichmäßige Stetigkeit, Lipschitz-Stetigkeit, Isometrie. Bei gleicher Topologie können diese von den Metriken abhängen.
298
Kapitel 6 Metrische Räume
12. $ Die Metrisierung der erweiterten reellen Achse R in Beispiel Q hängt nicht sehr stark von der Wahl der dortigen Funktion F ab. Man könnte z.B. auch F .x/ ´
2 arctan x &
verwenden. Ist F W R ! R eine beliebige stetige und streng monoton wachsende Funktion mit F .R/ D J D /&1; 1Œ, so läuft die Konstruktion völlig analog, wobei insbesondere dF$ .x1 ; x2 / ´ d.F .x1 /; F .x2 //
und
F .˙1/ ´ ˙1
zu setzen ist (d die Standard-Metrik auf R). Wird die gleiche Konstruktion mit einer anderen solchen Funktion G W R ! R durchgeführt, so zeige man a) G &1 ı F bildet R topologisch auf R bzw. R topologisch auf R ab. b) d $ und d $ sind auf R bzw. auf R äquivalent. F
G
Lösungshinweis: Für die Äquivalenz von dF$ und dG$ auf R stelle man die Identität von R dar als idR D G &1 ı .G ı F &1 / ı F , wobei rechts natürlich die Fortsetzungen auf R gemeint sind, und diskutiere die Homöomorphie von G ı F &1 bzgl. der StandardMetrik auf J mittels der Restriktion auf J zusammen mit .G ı F &1 /.˙1/ D ˙1. Stetigkeit dieser Identität bzgl. dF$ , dG$ bedeutet gerade, dass diese beiden Metriken auf R äquivalent sind.
6.3 Kompaktheit und Vollständigkeit Kompakte und vollständige Räume sind wichtige Spezies in der Gesamtheit aller metrischen Räume. Einerseits haben sie zahlreiche gute Eigenschaften, die den allgemeinen metrischen Räumen abgehen, andererseits sind viele konkrete Räume kompakt oder zumindest vollständig. Wir wissen schon, dass der reelle Zahlbereich R vollständig ist. Allerdings bezieht sich diese Vollständigkeit auf die Anordnung in R. Sie verlangt, dass die „Lücken“, die eventuell als Suprema beschränkter Teilmengen auftreten könnten, in R gar nicht vorkommen (vgl. die präzise Fassung in Q[1.1]). Für metrische Räume kommt diese Art der Vollständigkeit nicht in Frage, da keine Anordnung vorhanden ist. Stattdessen wird gefordert, dass die „Lücken“, die eventuell als Grenzwerte von Cauchy-Folgen auftreten könnten, tatsächlich gar nicht vorkommen (vgl. die präzise Fassung in Definition K).
299
Abschnitt 6.3 Kompaktheit und Vollständigkeit
Kompakte Mengen sind in der Analysis ein gewisser Ersatz für endliche Mengen. Wir haben die Kompaktheit im Reellen bisher nicht diskutiert, weil R selbst nicht kompakt ist und weil kompakte Teilmengen von R auch mit einfacheren Begriffen beschrieben werden können, nämlich mit „beschränkt“ und „abgeschlossen“. Allgemein geht dies aber nicht, vielmehr muss die Kompaktheit eigenständig definiert werden. Dafür gibt es mehrere Möglichkeiten. Wir starten mit einer Variante für Folgen. Sei .X; d / ein metrischer Raum. Überträgt man die Konvergenzdefinition für reelle Folgen aus E[2.1] mit dem üblichen Rezept (Ersatz von ju & vj durch d.u; v/), so wird man zu folgender Formulierung geführt: A. Definition. Eine Folge .ak / in X heißt konvergent, wenn es ein a 2 X gibt, den so genannten Grenzwert, sodass gilt: lim d.ak ; a/ D 0. Man schreibt dafür k!1
lim ak D a
k!1
oder
ak &! a
(für k &! 1):
Unter Voraussetzung der Existenz ist a wieder eindeutig bestimmt; denn für einen zweiten Grenzwert e a würde gelten: d.a; e a/ . d.a; ak / C d.ak ; e a/ ! 0, also a D e a. Äquivalent kann man die Definition für den Grenzwert limn!1 an D a auch als ."; N /-Test aussprechen: Zu jedem " > 0 existiert ein N 2 N, sodass für alle k > N gilt: ak 2 U.a; "/. Viele topologische Begriffe in metrischen Räumen lassen sich mit Hilfe von Folgen charakterisieren. (Das wird oft als einfacher empfunden als Kennzeichnungen mittels Umgebungen). Z.B. gilt: B. Satz. Ist A , X, so sind äquivalent: (i)
A ist abgeschlossen in X .
(ii) Ist .ak / irgendeine konvergente Folge in A mit dem Grenzwert limk!1 ak D a in X , so folgt a 2 A. Beweis. Zu (i) H) (ii): Angenommen, limk!1 ak D a … A. Dann wäre a Häufungspunkt von A, also wegen (i) a 2 A, Widerspruch! Zu (ii) H) (i): Sei a Häufungspunkt von A. Wähle zu jedem k 2 N ein ak 2 A mit d.ak ; a/ < 1=k. Daraus folgt ak ! a, also nach (ii) a 2 A. " C. Definition. Der metrische Raum X heißt folgenkompakt, wenn jede Folge in X eine Teilfolge besitzt, die in X konvergiert.
300
Kapitel 6 Metrische Räume
D. Beispiel. Jedes Intervall Œa; b/ mit a . b aus R ist folgenkompakt. (Natürlich bezieht sich dies auf Œa; b/ als metrischen Unterraum von R mit der Standard-Metrik.) Diese Aussage ist eine Konsequenz aus dem Satz von Bolzano/Weierstraß E[2.6] und der Erhaltung von Ungleichungen gemäß P[2.1]. Alle Intervalle der anderen Typen sind (soweit ¤ ¿) nicht folgenkompakt! Z.B. ist bei Œa; bŒ W Œa; 1ŒW
1 k ak ´ a C k ak ´ b &
ohne konvergente Teilfolge in
Œa; bŒ Œa; 1Œ :
Im ersten Fall muss k natürlich so groß sein, dass ak > a. Insbesondere ist R selbst nicht folgenkompakt, wie man etwa an der Folge der natürlichen Zahlen sieht. E. Lemma. Sei X folgenkompakt und " > 0 gegeben. Dann existieren endlich viele offene Bälle vom Radius ", die X überdecken, d.h. es gibt ein q 2 N und Bälle B.ai ; "/, i D 1; : : : ; q; mit [q XD B.ai ; "/: iD1 Beweis. Definiere induktiv Punkte a1 ; a2 ; : : : 2 X von gegenseitigem Abstand % " auf folgende Weise: a1 sei irgendwie fest gewählt. Falls a1 ; : : : ; ak 2 X schon definiert sind mit d.ai ; aj / % " für 1 . i < j . k, so sucht man ein akC1 2 X derart, dass d.ai ; akC1 / % " für 1 . i . k gilt. Falls ein solches akC1 existiert, wird es Sk hinzugefügt. Falls ein solches akC1 nicht existiert, so gilt X D iD1 B.ai ; "/, und es wird q D k gesetzt und abgebrochen. Dieses Verfahren muss nach endlich vielen Schritten abbrechen. Sonst gäbe es nämlich eine Folge .ai /i2N in X mit d.ai ; aj / % " für alle i ¤ j aus N. Diese kann aber keine konvergente Teilfolge enthalten. Widerspruch! " F . Lemma. Sei M folgenkompakt. Dann existiert eine Folge .Bk /k2N von Bällen Bk , X mit folgender Eigenschaft: ($) Zu jeder offenen Menge U , M und zu jedem p 2 U gibt es ein Bk mit p 2 Bk , U . Wählt man U D X, so folgt, dass solche Bälle Bk notwendigerweise den Raum X überdecken. Beweis. Nach Lemma E gibt es zu jedem n 2 N eine Darstellung (1)
XD
[q iD1
3 1B ai ; : n
Abschnitt 6.3 Kompaktheit und Vollständigkeit
301
Die endlich vielen ai hierin ändern sich beim Wechsel zu neuem n, ebenso auch ihre Anzahl q. Man nehme nun als die gesuchten Bk alle Bälle, die in den verschiedenen Darstellungen (1) für n D 1; 2; : : : auftreten. Die Gesamtheit dieser Bälle ist nach dem Diagonalverfahren abzählbar, und sie erfüllt die Forderung ($), wie folgendermaßen gezeigt werden kann: Zum gegebenen p 2 U wähle man ein r > 0 mit B.p; r/ , U . Das geht, weil U offen ist. Weiter wähle man ein n 2 N mit 1=n < r=2 und ein ai aus (1) mit p 2 B.ai ; 1=n/. Dann ist B.ai ; 1=n/ , B.p; r/ laut G(iii)[6.1]; es gilt nämlich ai 2 B.p; 1=n/ , B.p; r/ und r r 1 1 < D r & < r & < r & d.ai ; p/: n 2 2 n Also leistet der Ball B.ai ; 1=n/ das Gewünschte.
"
G . Definition. Eine offene Überdeckung von X ist eine Mengenfamilie .U+ /+ 2) derart, dass alle U+ offen in X sind und [ XD U+ + 2) gilt. Die Indexmenge - darf dabei endlich oder abzählbar unendlich oder auch ganz beliebig sein. H. Satz. Sei X folgenkompakt. Dann existiert zu jeder offenen Überdeckung .U+ /+ 2) von X eine endliche Teilüberdeckung, d.h. es gibt endlich viele 01 ; : : : ; 0L 2 - mit [L XD U : `D1 +` Beweis. Man wähle zu jedem p 2 M ein U+ mit p 2 U+ und dann eine der Mene` des Systems von Lemma F, sodass also p 2 B e` , U+ gilt. Die auftretenden gen B e B ` sind Teil eines abzählbaren Systems, bilden also selbst ein abzählbares System e1 ; B e2 ; : : : . Nach Konstruktion wird X von den B e` überdeckt. Tatsächlich gilt beB reits für geeignete endlich viele [L e` : B (2) XD `D1 S e` ¤ ¿ für alle q, so wähle man zu jedem q Wäre nämlich die Differenz X n q`D1 B Sq S e` . Dann gälte xq ; xqC1 ; : : : 2 X n q e` . Dies Differenzen ein xq 2 X n `D1 B B `D1 sind abgeschlossen. Nach Voraussetzung existiert eine konvergente Teilfolge xqn ! Sqn e` . Da dies für jedes n gilt, folgte x0 2 x0 , und nach Satz B ist x0 2 X n `D1 B S e Xn 1 `D1 B ` D ¿, Widerspruch! e` in (2) ein U+ mit B e` , U+ , so gilt erst recht X D Wählt man zu jedem B ` ` SL " `D1 U+` .
302
Kapitel 6 Metrische Räume
I. Definition. Der metrische Raum X heißt kompakt, wenn zu jeder offenen Überdeckung von X eine endliche Teilüberdeckung existiert (Heine/Borelsche Überdeckungseigenschaft). J. Satz. Ein metrischer Raum X ist dann und nur dann kompakt, wenn er folgenkompakt ist. Beweis. „folgenkompakt“ impliziert „kompakt“: Dies ist gerade Satz H. „kompakt“ impliziert „folgenkompakt“: Gegeben sei eine Folge .ak / in X. Angenommen .ak / besäße keine konvergente Teilfolge: Dann wähle man zu jedem p 2 X eine ı-Umgebung U.p; ı/, die nur endlich viele Punkte ak enthält (endlich viele heißt hier: mit endlich vielen Indizes). Diese ı-Umgebungen bildeten eine offene Überdeckung von X. Also würde X durch endlich viele unter diesen überdeckt. Somit enthielte X nur endlich viele Punkte ak , Widerspruch! " Wir haben schon in Beispiel D erkannt, dass R selbst nicht folgenkompakt, also auch nicht kompakt ist. Dagegen trifft auf R eine weniger einschneidende Forderung zu, nämlich die Vollständigkeit. Diese ist im Kontext der metrischen Räume folgendermaßen definiert: K. Definition. (i)
Eine Folge .ak / in X heißt konzentriert oder Cauchy-Folge, wenn gilt: Zu jedem " > 0 existiert ein N D N."/ 2 N, sodaß für alle k; ` > N gilt: d.ak ; a` / < ".
(ii) Der metrische Raum .X; d / heißt vollständig, wenn jede Cauchy-Folge in X einen Grenzwert in X besitzt. Eine konvergente Folge ist stets auch eine Cauchy-Folge. Das ist eine simple Konsequenz der Dreiecksungleichung; vgl. Teil 1) bei H[2.6]. Die Umkehrung gilt i. Allg. nicht. Z.B. ist Q (als metrischer Unterraum von R) nicht p vollständig: Man kann eine Folge .ak / rationaler Zahlen wählen, die in R gegen 2 konvergiert. Diese p Folge ist dann in R konzentriert, also auch in Q, aber in Q nicht konvergent, da 2 irrational ist; vgl. die Ausführungen am Ende von Abschnitt 2.2. Die Vollständigkeit ist eine Abschwächung der Kompaktheit: L. Satz. Ist X kompakt, so ist X auch vollständig.
Abschnitt 6.3 Kompaktheit und Vollständigkeit
303
Beweis. Sei .ak / Cauchy-Folge in X. Es gibt dann eine konvergente Teilfolge akj ! a 2 X. Dann gilt auch ak ! a. Dies folgt aus der Vorausabschätzung d.ak ; a/ . d.ak ; akj / C d.akj ; a/; indem man zunächst den zweiten Term „klein macht“ mit festem j (aufgrund der Konvergenz der Teilfolge) und daraufhin den ersten Term „klein macht“ für alle genügend großen k (aufgrund der Konzentriertheit der Ausgangsfolge). Details exakt wie in G[2.6]. " Hinweis: Die Umkehrung gilt nicht. Gegenbeispiel ist R selbst! Nach H[2.6] ist R vollständig im hier gebrauchten Sinne, aber laut D nicht folgenkompakt, also auch nicht kompakt. Entsprechend der allgemeinen Konvention in U[6.1] beziehen sich bei einer Teilmenge A , X die Eigenschaften „folgenkompakt“, „kompakt“ und „vollständig“ auf A als metrischen Unterraum von X. Explizit formuliert, bedeutet dies z.B. Folgendes: M. Satz. Eine Teilmenge A , X ist genau S dann kompakt, wenn zu jeder Familie .V+ /+ 2) offener Teilmengen in X mit A , +2) V+ endlich viele 0` 2 - existieren SL mit: A , `D1 U+` . Eine solche Familie .V+ /+2) wird natürlich wieder als eine offene Überdeckung von A bezeichnet, und die Bedingung des Satzes sagt in dieser Sprechweise genau wie oben: A ist dann und nur dann kompakt, wenn zu jeder offenen Überdeckung von A eine endliche Teilüberdeckung existiert. Beweis von M. Der Grund ist einfach, dass die offenen Mengen in A genau die Durchschnitte von A mit den offenen Mengen von X sind. " Die Kompaktheit einer Teilmenge A , X hängt allein von deren Relativtopologie ab. Bei der Offenheit und Abgeschlossenheit ist dies anders! Dass eine Teilmenge A , X in X offen ist, wird nicht allein durch die Relativtopologie von A bestimmt, sondern hängt wesentlich von der Art und Weise ab, wie A in X positioniert ist. Das erkennt man schon daran, dass jede Teilmenge A , X in A selbst offen ist, während sie in X nicht offen zu sein braucht. Genauso ist jede Teilmenge A , X in A selbst abgeschlossen, aber nicht notwendig in X. N. Beispiele. (i)
Jede endliche Teilmenge A von X ist kompakt.
304
Kapitel 6 Metrische Räume
(ii) Ist eine Folge .ak /k2N in X konvergent mit Grenzwert a D limk!1 ak 2 X, so ist ihre Bildmenge, zusammen mit dem Grenzwert: A ´ fak j k 2 Ng [ fag kompakt. Liegt a nämlich in einer offenen Menge einer Überdeckung, wie in Satz M beschrieben, so liegen in dieser Menge alle ak bis auf endlich viele, und diese liegen ebenfalls in endlich vielen Mengen der Überdeckung (wieder bezogen auf die Indizes). O. Satz. Für A , X gelten folgende Implikationen: (i)
A kompakt H) A beschränkt;
(ii) A kompakt H) A vollständig H) A abgeschlossen. Beweis. Zu (i): Da A von allen Bällen mit Zentrum in A und Radius 1 überdeckt wird, gibt es endlich viele Bälle mit A , B.a1 ; 1/ [ ( ( ( [ B.aL ; 1/. Diese Vereinigung ist beschränkt: Wähle p 2 X irgendwie. Dann gilt der Schluss: x 2 B.ai ; 1/ H) d.x; p/ . d.x; ai / C d.ai ; p/ . 1 C max d.ai ; p/: 1#i #L
Damit liegt auch A im Ball mit Zentrum p und Radius entsprechend dieser Schranke. Zu (ii), erster Pfeil: Das ist Satz L. Zu (ii), zweiter Pfeil: Mittels der Charakterisierung der Abgeschlossenheit aus Satz B läuft der Nachweis so: Ist .ak / eine Folge in A mit limk!1 ak D a 2 X, so ist .ak / Cauchy-Folge in A, also auch Cauchy-Folge in X und damit konvergent in X, also a 2 X. " P. Satz. (i)
Sei X kompakt. Dann sind die kompakten Teilmengen von X genau die abgeschlossenen Teilmengen von X.
(ii) Sei X vollständig. Dann sind die vollständigen Teilmengen von X genau die abgeschlossenen Teilmengen von X . Beweis. Sei A , X. Nach Satz O gilt: A kompakt A abgeschlossen. Es bleibt zu zeigen:
H)
A vollständig
H)
Zu (i): A abgeschlossen H) A kompakt: Sei eine offene Überdeckung von A gegeS S ben: A , + 2) V+ ; V+ offen in X. Dann ist M D .M n A/ [ + 2) V+ eine offene
305
Abschnitt 6.3 Kompaktheit und Vollständigkeit
Überdeckung von X, also gilt mit endlich vielen 0` : X D .X n A/ [ SL SL X D `D1 V+` . In jedem Fall ist A , `D1 V+` .
SL `D1
V+` oder
Zu (ii): A abgeschlossen H) A vollständig: Sei .ak / Cauchy-Folge in A. Dann ist .ak / auch Cauchy-Folge in X , also existiert limk!1 ak D a 2 X, und nach B folgt a 2 A. " Der folgende Satz liefert eine hinreichende Bedingung, um die Kompaktheit von Teilmengen zu erkennen: Q. Satz. Im metrischen Raum X seien alle abgeschlossenen Bälle B.a; r/ kompakt. Dann gilt für jede Teilmenge A , X die Äquivalenz A kompakt () A beschränkt und abgeschlossen: Beweis. Zu H) : Konsequenz von O. Zu (H : Da die Menge A beschränkt ist, liegt sie in einem Ball: A , B.a; r/. Da A und B.a; r/ abgeschlossen sind, ist A auch in B.a; r/ abgeschlossen. Nach Satz P ist dann A kompakt in B.a; r/, also auch in X. (Die Kompaktheit hängt nur von der Relativtopologie ab.) " Die Voraussetzung ist insbesondere für X D R erfüllt; denn die abgeschlossenen Bälle in R sind abgeschlossene Intervalle, und diese sind nach Beispiel D folgenkompakt, also kompakt. So ergibt sich zusammenfassend über R: R. Folgerung. Die reellen Zahlen bilden einen vollständigen metrischen Raum R. Eine Teilmenge A , R ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. " Wir formulieren noch zwei Charakterisierungen topologischer Begriffe mittels Folgen, da diese oft als angenehmer empfunden werden als die Kennzeichnungen mittels Umgebungen. Von der reellen Situation her sind beide aus Kapitel 3 bekannt: S. Satz. Seien X, Y metrische Räume, F W A ! Y (A , X) eine Abbildung und a ein Häufungspunkt von A. Dann sind äquivalent: (i) (ii)
lim F .x/ existiert in Y .
x!a
Für jede Folge .xn / in A n fag mit lim xn D a existiert lim F .xn / in Y . n!1
n!1
(iii) Für jede Folge .xn / in A n fag mit lim xn D a existiert lim F .xn / in Y , und n!1 n!1 alle diese Grenzwerte sind gleich.
306
Kapitel 6 Metrische Räume
Ist dies erfüllt, so gilt für jede solche Folge .xn /: lim F .x/ D lim F .xn /:
x!a
n!1
Beweis. Es handelt sich um eine bloße Übersetzung von K[3.2] nach dem Rezept: Ersatz von ju & vj durch d.u; v/. " T. Satz. Sei F W X ! Y eine Abbildung zwischen metrischen Räumen und a 2 X. Dann sind äquivalent: (i)
F ist stetig in a.
(ii) Für jede Folge .xn / in X mit xn ! a in X gilt F .xn / ! F .a/ in Y . Beweis. Auch dies ergibt sich durch Übersetzung aus D[3.3].
"
U. Bemerkung. Auch der Begriff des Häufungswerts aus A[2.7] lässt sich ohne weiteres übertragen: Ein b 2 X heißt Häufungswert der Folge .xn / in X, wenn diese eine Teilfolge .x'.k/ / mit limk!1 x'.k/ D b besitzt. Die Definition C lautet damit äquivalent: Der Raum X ist folgenkompakt, wenn jede Folge in X einen Häufungswert in X hat. $ Vervollständigung und Kompaktifizierung Wenn ein metrischer Raum X nicht vollständig ist, so kennt man ein Standardverfahren zur Vervollständigung, d.h. man kann dem Raum auf kanonische Weise Punkte hinzufügen, so dass der entstehende größere Raum vollständig wird. Dazu betrachtet man die Cauchy-Folgen in X als neue selbständige Objekte und baut mit diesen auf folgende Weise einen neuen Raum auf: Zunächst nennt man zwei Cauchy-Folgen , D .xn / und 1 D .yn / äquivalent, wenn die Folge der Distanzen .d.xn ; yn // eine Nullfolge ist. Diese Relation C ist wirklich eine Äquivalenzrelation. Sodann bildet man die Quotientenmenge Xv ´ X=C, also die Gesamtheit aller Äquivalenzklassen von Cauchy-Folgen unter der Relation C. Die Quotientenmenge wird selbst zu einem metrischen Raum, wenn man die Distanz zweier Elemente &.,/, &.1/ 2 Xv durch d.&.,/; &.1// ´ limn!1 d.xn ; yn / definiert (& die kanonische Projektion von X auf Xv ). Dieser Grenzwert existiert in R und erweist sich als unabhängig von den gewählten Repräsentanten. Das wichtigste ist jedoch, dass der neue metrische Raum Xv vollständig ist. Die Punkte des Ausgangsraums X können als Elemente von Xv aufgefasst werden, indem jedem x 2 X die konstante Folge xn D x zugeordnet wird. Insgesamt kommt bei dieser Konstruktion heraus, dass X zu einem dichten metrische Unterraum des vollständigen metrische Raums Xv wird. Dieser Plan soll in Analysis 2 ausgeführt werden. Nach ähnlichem Muster kann auch der Körper der rationalen Zahlen konstruktiv zum Körper der reellen Zahlen erweitert werden.
Abschnitt 6.3 Kompaktheit und Vollständigkeit
307
Bei der analogen Frage der Kompaktifizierung gibt es keine so klare, allgemeine Antwort. Auch hier ist das Ziel natürlich, zu einem nichtkompakten Raum X einen größeren Raum Xk zu finden, der einerseits kompakt ist und andererseits den gegebenen Raum als dichte Teilmenge enthält. Das kann auf viele Arten geschehen, was davon abhängt, wie groß der erweiterte Raum sein soll. Außerdem ist man möglicherweise gezwungen, die Metrik (äquivalent) abzuändern, d.h. X wird eventuell kein metrischer Unterraum von Xk sein können. Dies kann hier nicht in voller Allgemeinheit diskutiert werden. Konkrete Fälle sind demgegenüber sehr gut zu beschreiben, z.B. der Schritt von den reellen Zahlen R zur erweiterten reellen Achse R durch die Hinzunahme zweier uneigentlicher Elemente ˙1, wie in Q[6.2] ausgeführt: Nach Übergang zu einer äquivalenten Metrik auf R wurde R zu einem metrischen Unterraum von R, der in R dicht ist. Da R sich als homöomorph zum kompakten reellen Intervall Œ&1; 1/ erwiesen hat, ist R selbst kompakt. Denn unter Homöomorphismen bleibt die Kompaktheit erhalten, wie man unmittelbar an der Heine/Borel-Charakterisierung der Kompaktheit sehen kann. Aus R entsteht somit durch Hinzunahme zweier neuer Punkte ˙1 ein kompakter Raum R, der R als dichte Menge enthält, wobei R zwar die Relativtopologie von R trägt, aber bzgl. der Standard-Metrik nicht metrischer Unterraum von R ist. Man nennt R die Zweipunktkompaktifizierung von R. Diese hat hier den zusätzlichen Vorteil, dass Ordnungsrelationen erhalten bleiben. Es gibt auch Einpunktkompaktifizierungen, bei denen nur ein einziges uneigentliches Element hinzugefügt wir. Diese sind für den Körper R nicht ganz so üblich wie die eben besprochene Zweipunktkompaktifizierung, werden jedoch standardmäßig für den Körper der komplexen Zahlen gebraucht. Wir kommen hierauf am Ende der Abschnitte 6.4 und 7.3 zurück. Aufgaben und Anmerkungen 1. Man zeige, dass die Vereinigung endliche vieler bzw. der Durchschnitt beliebig vieler kompakter Teilmengen eines metrischen Raumes wieder kompakt ist. 2. Sei X ein metrischer Raum. In der Situation A , B , X beweise man durch direktes Zurückgehen auf die Definition die Äquivalenz: A kompakt in B () A kompakt in X . 3. Sei X ein kompakter metrischer Raum. Man beweise für jede Teilmenge A , X die Äquivalenzen: A abgeschlossen () A kompakt () A vollständig. 4. Sei X ein metrischer Raum und A , X. Man beweise die nachstehenden Folgencharakterisierungen: a) Ein Punkt a 2 X ist dann und nur dann Häufungspunkt von A, wenn es eine Folge .an / in A n fag mit a D lim an gibt. n!1
308
Kapitel 6 Metrische Räume
b) Der Abschluss A besteht aus allen Punkten a 2 X, zu denen es eine Folge .an / in A mit a D lim an gibt. n!1
5. Man gebe ein Beispiel für einen metrischen Raum, in dem ein abgeschlossener Ball existiert, der nicht kompakt ist. 6. Man beweise: Der metrische Raum X ist dann nur dann kompakt, wenn jede absteigende Folge abgeschlossener nichtleerer Teilmengen A1 - A2 - A3 - ( ( ( von X einen nichtleeren Durchschnitt besitzt. 7. Sei .X; d / ein metrischer Raum. Für eine beschränkte, nichtleere Teilmenge A , X wird der Durchmesser diam.A/ definiert als diam.A/ ´ sup fd.x; y/ j x; y 2 M g. Für unbeschränktes A , X setzt man diam.A/ ´ 1. Sei A1 - A2 - A3 - ( ( ( eine absteigende Folge kompakter nichtleerer Teilmengen von X mit T1 limk!1 diam.Ak / D 0. Man zeige: Der Durchschnitt kD1 Ak besteht aus genau einem Punkt (vgl. Aufgabe 6). Dies verallgemeinert das Intervallschachtelungsprinzip B[2.3] auf metrische Räume. 8. Man beweise die so genannte Lebesgue-Eigenschaft: Sei .U+ /+2) eine offene Überdeckung des kompakten metrischen Raumes X. Dann existiert eine Zahl ˛ > 0, sodass jeder offene Ball vom Radius ˛ in wenigstens einem U+ enthalten ist. 9. Man beweise das so genannte Injektivitätslemma: Sei F W X ! Y eine stetige Abbildung zwischen metrischen Räumen und A eine kompakte Teilmenge von X. Weiter sei die Restriktion F jA injektiv, und es gebe zu jedem Punkt a 2 A eine Umgebung Va WD U.a; "a / derart, dass die Restriktion F jVa injektiv ist. Dann existiert eine offene Obermenge U von A, sodass die Restriktion F jU injektiv ist. 10. Man zeige, dass es keine Metrik auf der erweiterten reellen Achse R geben kann, sodass R mit der Standard-Metrik ein metrischer Unterraum von R ist. Bei der Erweiterung von R zu R in Q[6.2] musste man also die Standard-Metrik „verbiegen“. 11. Man beweise: Zwei Metriken d und d1 auf der Menge X sind dann und nur dann äquivalent, wenn für alle Folgen .an / in X und alle a 2 X gilt: d.an ; a/ &! 0 () d1 .an ; a/ &! 0; d.h. wenn die Folgenkonvergenz bzgl. d äquivalent ist mit der Folgenkonvergenz bzgl. d1 . 12. Man zeige: a) Die Kompaktheit ist ein topologischer Begriff, d.h. ist F W X ! Y ein Homöomorphismus zwischen metrischen Räumen und ist X kompakt, so ist auch Y kompakt. (Dies wird in Satz A[6.5] noch verbessert.) b) Die Vollständigkeit ist kein topologischer Begriff, d.h. ist F W X ! Y ein Homöomorphismus zwischen metrischen Räumen und ist X vollständig, so braucht Y nicht vollständig zu sein.
Abschnitt 6.4 Kartesische Produkte
309
Lösungshinweis zu b): Betrachte R und J ´ /&1; 1Œ (beide mit der Standard-Metrik) sowie die topologische Abbildung F W R ! J mit F .x/ ´ x=.1 C jxj/. Dann ist R vollständig, nicht aber F .R/ D J . Z.B. ist xn ´ 1 & .1=n/ eine Cauchy-Folge in J , die aber in J nicht konvergiert. 13. Man zeige in Verallgemeinerung von Lemma G[2.6]: Besitzt eine Cauchy-Folge .an / in einem metrischen Raum X eine konvergente Teilfolge .a'.k/ /, so ist sie selbst konvergent (mit dem gleichen Grenzwert). 14. $ Sei n % 3 eine natürliche Zahl. Man konstruiere einen nichtkompakten metrischen Raum, der durch Hinzunahme von genau n paarweise verschiedenen neuen Elementen zu einem kompakten Raum wird (n-Punkt-Kompaktifizierung). Lösungshinweis: Man nehme n paarweise verschiedene und abgeschlossene Halbgeraden in R2 , die vom Ursprung 0 ausgehen.
6.4 Kartesische Produkte Mit kartesischen Produkten kann man aus gegebenen Räumen auf natürliche Weise neue „höherdimensionale“ Räume erzeugen. Die höhere Dimension ist so zu verstehen, dass die Elemente der Ausgangsräume die Rolle von „Koordinaten“ in einem kartesischen Produkt spielen. Aus der linearen Algebra weiß man z.B., dass der ndimensionale Raum Rn das kartesische Produkt von n Exemplaren der reellen Zahlen R ist. Demgemäß haben die Elemente von Rn , die n-Tupel, jeweils n Koordinaten aus R. Bei einem allgemeinen kartesischen Produkt dürfen allerdings die Koordinaten aus verschiedenen Räumen stammen. Wir behandeln hier kartesische Produkte aus zwei (bzw. endlich vielen) Faktoren. Die Symbole X; X1 ; X2 ; Y; : : : bezeichnen wieder metrische Räume. Es sei daran erinnert, dass das kartesische Produkt X1 )X2 als Menge aus allen Paaren .x1 ; x2 / mit x1 2 X1 und x2 2 X2 besteht. Solche Paare schreiben wir als x D .x1 ; x2 /, y D .y1 ; y2 /, usw. Beim kartesischen Produkt X1 ) X2 bezeichnet man X1 und X2 auch als die Faktoren. Es geht nun darum, solch ein kartesisches Produkt mit einer Metrik zu versehen: A. Satz und Definition. Sind .X1 ; d1 /; .X2 ; d2 / metrische Räume, so ist durch d.x; y/ D d..x1 ; x2 /; .y1 ; y2 // ´ max fd1 .x1 ; y1 /; d2 .x2 ; y2 /g: eine Metrik auf X1 ) X2 definiert. Man nennt d die Maximumsmetrik für X1 ) X2 .
310
Kapitel 6 Metrische Räume
Beweis. Zu den Metrikaxiomen (D.1) – (D.3): Diese sind für das so definierte d unmittelbar klar. Zum Metrikaxiom (D.4): Mit z D .z1 ; z2 / 2 X1 ) X2 hat man für i D 1; 2: di .xi ; zi / . di .xi ; yi / C di .yi ; zi / . d.x; y/ C d.y; z/: Aus Anfang und Ende dieser Kette folgt d.x; z/ . d.x; y/ C d.y; z/.
"
Konvention: Wenn nichts anderes gesagt wird, soll das kartesische Produkt X1 ) X2 stets mit der Maximumsmetrik versehen sein. Wir formulieren sogleich, was diese Metrik für die Konvergenz von Paaren bedeutet. B. Lemma (koordinatenweise Konvergenz). Für eine Folge von Paaren .ak ; bk / in X1 ) X2 und ein Paar .a; b/ in X1 ) X2 gilt genau dann limk!1 .ak ; bk / D .a; b/, wenn limk!1 ak D a und limk!1 bk D b gilt. Beweis. Dies ist unmittelbar klar aus der Gleichung d..ak ; bk /; .a; b// D max fd1 .ak ; a/; d2 .bk ; b/g und der Definition der Folgenkonvergenz in A[6.3].
"
Schreibweise: Für eine Abbildung in ein kartesisches Produkt hinein schreibt man: F W X &! X1 ) X2 x 7&! F .x/ µ .F1 .x/; F2 .x//
kurz
F D .F1 ; F2 /:
F1 W X ! X1 und F2 W X ! X2 sind dann die erste und zweite Komponentenfunktion oder Komponente von F . C. Lemma. Für Abbildungen in kartesische Produkte hinein gilt: F W X &! X1 )X2 ist dann und nur dann stetig in a 2 X , wenn beide Komponentenfunktionen F1 W X ! X1 und F2 W X ! X2 in a stetig sind. Beweis. Auch dies ist unmittelbar klar aus der Gleichung d.F .x/; F .a// D max fd1 .F1 .x/; F1 .a//; d2 .F2 .x/; F2 .a//g und der Definition der Stetigkeit in B[6.2].
"
Warnung: Für Abbildungen aus kartesischen Produkten heraus geht das nicht so glatt!
311
Abschnitt 6.4 Kartesische Produkte
D. Beispiel. Wir betrachten die Abbildung
f W R ) R &! R;
8 < 2xy f .x; y/ ´ x 2 C y 2 : 0
für .x; y/ ¤ .0; 0/ für .x; y/ D .0; 0/.
Dann ist bei jedem festen y die Abbildung x 7! f .x; y/ stetig; denn für y ¤ 0 ist der auftretende Nenner ¤ 0, und für y D 0 ist diese Abbildung konstant D 0. Ebenso ist bei jedem festen x die Abbildung y 7! f .x; y/ stetig.
z
y
x
Aber f selbst ist unstetig in .0; 0/; denn die Vorschaltung der stetigen Abbildung x 7! .x; x/ liefert die Abbildung x 7&! f .x; x/ D
2x 2 D 1 für x ¤ 0; 2x 2
0 7&! f .0; 0/ D 0;
und diese ist in x D 0 offensichtlich unstetig: Die Stetigkeit in jeweils einer Veränderlichen garantiert nicht die stetige Abhängigkeit vom Paar der Veränderlichen! (Etwas Ähnliches werden wir später bei der Differenzierbarkeit konstatieren.) Bei der Graphendarstellung (bei der die Funktionswerte z D f .x; y/ senkrecht nach oben über der .x; y/-Ebene aufgetragen werden) entsteht „über der Diagonalen“ in der .x; y/-Ebene eine „Straße“ auf der Fläche in der konstanten Höhe 1, die in .0; 0/ durch den Funktionswert 0 unstetig unterbrochen ist. Analog, wenn x 7! .x; &x/ vorgeschaltet wird (mit &1 als Höhe).
312
Kapitel 6 Metrische Räume
E. Lemma. Die erste und zweite Projektion P1 W X1 ) X2 &! X1
P2 W X1 ) X2 &! X2
.x1 ; x2 / 7&! x1
.x1 ; x2 / 7&! x2
sind Lipschitz-stetig, ebenso die kanonischen Injektionen J1 W X1 &! X1 ) X2
J2 W X2 &! X1 ) X2
x1 7&! .x1 ; a2 /
x2 7&! .a1 ; x2 /;
wobei a2 2 X2 bzw. a1 2 X1 jeweils fest sind. (Als Lipschitz-Konstante ist in allen vier Fällen die Eins möglich.) Beweis. Auch dies folgt direkt aus der Definition der Maximumsmetrik in A.
"
F . Beispiel. Als ganz konkrete Beispiele für Abbildungen aus einem kartesischen Produkt heraus betrachten wir für R die Körperoperationen „Summe“, „Produkt“ und „Quotient“: s W R ) R ! R, p W R ) R ! R, q W R ) .R n f0g/ ! R mit s.x; y/ ´ x C y;
p.x; y/ ´ xy;
q.x; y/ ´
x : y
Alle drei Abbildungen sind stetig: Bei s und p folgt dies aus den nachstehenden Vorausabschätzungen, bei denen zur Abkürzung + WD d..x; y/; .a; b// D max fjx & aj; jy & bjg gesetzt ist: js.x; y/ & s.a; b/j D j.x C y/ & .a C b/j . jx & aj C jy & bj . 2+ jp.x; y/ & p.a; b/j D jxy & abj D j.x & a/b C .y & b/a C .x & a/.y & b/j . .jaj C jbj/+ C +2 : Bei q genügt wegen der Stetigkeit von p der Nachweis, dass R.x; y/ ´ 1=y auf R ) .R n f0g stetig ist. Dies folgt aber aus der Vorausabschätzung ˇ ˇ ˇ1 1ˇ jy & bj 1 + 1 1 ˇ ˇ. jR.x; y/ & R.a; b/j D ˇ & ˇˇ D (ˇ ( für + . jbj: 2 2 ˇ ˇ 1 y b b b 2 ˇ1 C y & b ˇ ˇ 2 b ˇ Wir haben gerade in Beispiel D gesehen, dass eine Abbildung aus einem kartesischen Produkt heraus unstetig sein kann, obwohl die Abhängigkeit von jeder einzelnen Veränderlichen (bei Festhaltung der anderen) immer stetig ist. Die umgekehrte Richtung ist jedoch in Ordnung:
313
Abschnitt 6.4 Kartesische Produkte
G. Lemma. Für Abbildungen aus kartesischen Produkten heraus gilt: Ist F W X1 ) X2 ! Y stetig und a D .a1 ; a2 / 2 X1 ) X2 fest, so ist die partielle Funktion x1 7! F .x1 ; a2 / von X1 in Y in a1 und die partielle Funktion x2 7! F .a1 ; x2 / von X2 in Y in a2 stetig. Beweis. Die erstgenannte partielle Abbildung ist einfach die Komposition von F mit der kanonischen Injektion x1 7! .x1 ; a2 /, also mit dieser in a1 stetig. Analog für die zweitgenannte partielle Abbildung. " Kompaktheit und Vollständigkeit vererben sich auf das kartesische Produkt X1 ) X2 : H. Satz. (i)
Sind X1 ; X2 kompakt, so ist auch X1 )X2 kompakt (kleiner Satz von Tychonoff).
(ii) Sind X1 ; X2 vollständig, so ist auch X1 ) X2 vollständig. Beweis. Zu (i): Wir zeigen dies in der Variante „folgenkompakt“ (was ja nach J[6.3] mit „kompakt“ äquivalent ist): Sei ..ak ; bk // eine Folge in X1 ) X2 . Dann existiert eine konvergente Teilfolge a'.k/ ! a in X1 und dafür eine Teilfolge b'...k// ! b in X2 . Sodann konvergiert auch a'...k// ! a in X1 . Nach Lemma B ergibt sich: .a'...k// ; b'...k// / ! .a; b/ in X1 ) X2 . Zu (ii): Sei ..ak ; bk // eine Cauchy-Folge in X1 ) X2 . Nach Definition der Maximumsmetrik ist dann .ak / eine Cauchy-Folge in X1 und .bk / eine Cauchy-Folge in X2 . Nach Voraussetzung sind konvergent: ak ! a in X1 und bk ! b in X2 , also besteht nach Lemma B die Konvergenz .ak ; bk / ! .a; b/ in X1 ) X2 . " Die bisherigen Überlegungen gelten analog für kartesische Produkte X1 ) ( ( ( ) XL aus endlich vielen Faktoren anstelle von zweien (es ist nur etwas mehr Schreibarbeit erforderlich). Der Übergang zu beliebig vielen Faktoren wird hier nicht vollzogen. Der eigentliche Satz von Tychonoff bezieht sich gerade auf diesen allgemeinen Fall (Formulierung und Beweis sind dann komplizierter). I. Beispiel. Der n-dimensionalen reelle Raum Rn ist aus der linearen Algebra bekannt. Er besteht aus allen n-Tupeln reeller Zahlen x D .x1 ; : : : ; xn /;
xi 2 R für i D 1; : : : ; n;
ist also das kartesische Produkt Rn D R ) ( ( ( ) R. Wir setzen als bekannt voraus, dass man n-Tupel komponentenweise addieren und mit reellen Zahlen multiplizieren kann: x D .x1 ; : : : ; xn / x C y D .x1 C y1 ; : : : ; xn C yn / H) y D .y1 ; : : : ; yn / * ( x D .* ( x1 ; : : : ; * ( xn /
314
Kapitel 6 Metrische Räume
und dass diese Operationen den Rechenregeln eines reellen Vektorraums genügen. Rn wird nun mit der zugehörigen Maximumsmetrik ausgestattet: dm .x; y/ ´ max fjx1 & y1 j; : : : ; jxn & yn jg ; und wird dadurch zu einem metrischen Raum. Wir wollen diskutieren, wie die Grundelemente (Bälle, Sphären, usw.) hier aussehen, und daraus einige Konsequenzen für den metrischen Raum .Rn ; dm / ziehen. Ein Ball ist bei dieser Metrik ein kartesisches Produkt von Intervallen: Ist a D .a1 ; : : : ; an / das Zentrum, so gilt z.B. im abgeschlossenen Fall
x 2 B.a; r/ () dm .x; a/ . r () jxi & ai j . r
8 i 2 f1; : : : ; ng
() xi 2 Œai & r; ai C r/
r
8 i 2 f1; : : : ; ng;
a
a2 r r
r a1
also (1)
B.a; r/ D Œa1 & r; a1 C r/ ) ( ( ( ) Œan & r; an C r/:
Genauso sieht man im offenen Fall (2)
B.a; r/ D /a1 & r; a1 C rŒ ) ( ( ( ) /an & r; an C rŒ :
Das hat einige Konsequenzen für den Raum .Rn ; dm /: (i) Jeder Ball B.a; r/ * Rn ist kompakt: Folgerung aus dem kleinen Satz von Tychonoff H(i). (ii) Eine Teilmenge von Rn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist: Folgerung aus (i) und Q[6.3].
315
Abschnitt 6.4 Kartesische Produkte
(iii) Jede Sphäre S.a; r/ * Rn ist kompakt. Denn sie ist beschränkt und abgeschlossen; vgl. K(i)[6.2]. (iv)
Rn ist vollständig: Folgerung aus H(ii).
(v) Es gilt B.a; r/ D B.a; r/: Nach (5)[6.1] ist eine Inklusion immer richtig, nämlich B.a; r/ , B.a; r/. Zu beweisen ist also: B.a; r/ , B.a; r/, d.h. S.a; r/ , B.a; r/. Also hat man letztlich zu zeigen: Jedes p 2 S.a; r/ ist Häufungspunkt von B.a; r/. Dazu „marschiert“ man radial vom Zentrum zum gegebenen Sphärenpunkt; vgl. folgendes Bild: p pk a
S(a,r)
B(a,r)
Präzise: Zu p 2 S.a; r/ sei eine Folge .pk /k2N in Rn definiert durch pk ´ p &
1 .p & a/: k
Dann bestehen folgende Schlüsse / . / . / . 1 1 1 .p & a/ ) dm .pk ; a/ D 1 & dm .p; a/ D 1 & r pk & a D 1 & k k k ) pk 2 B.a; r/; p & pk D
1 1 1 .p & a/ ) dm .pk ; p/ D dm .p; a/ D r k k k ) pk ¤ p; pk &! p:
Aus den Resultaten dieser zwei Zeilen folgt, dass p Häufungspunkt von B.a; r/ ist. (vi)
Damit gilt auch @B.a; r/ D S.a; r/: Denn man hat @B.a; r/ D B.a; r/ n B.a; r/ı D B.a; r/ n B.a; r/ D S.a; r/:
(vii) Jede offene nichtleere Teilmenge A , Rn enthält einen Punkt mit rationalen Koordinaten: Zu einem festen Punkt a 2 A sei nämlich ein Ball B.a; r/ , A gewählt. B.a; r/ ist ein kartesisches Produkt von offenen nichtleeren Intervallen der Gestalt (2). In jedem Intervall /ai & r; ai C rŒ gibt es eine rationale Zahl ri . Somit gilt .r1 ; : : : ; rn / 2 B.a; r/ , A.
316
Kapitel 6 Metrische Räume
$ Einpunktkompaktifizierung von R Wir hatten in Q[6.2] die erweiterte reelle Achse R D R [ f1; &1g als einen metrischen Raum erkannt, der zum Intervall Œ&1; 1/ homöomorph ist, wobei die Endpunkte &1 und 1 den beiden Unendlichs &1 und 1 entsprechen. Am Ende von Abschnitt 6.3 hat sich dann gezeigt, dass R eine so genannte Zweipunktkompaktifizierung von R ist, in der R selbst dicht liegt. Man kann die reellen Zahlen aber auch durch Hinzunahme eines uneigentlichen Elements 1 kompaktifizieren: b R ´ R [ f1g; wobei das neue 1 als verschieden von dem bisherigen in R gelten soll. Diese Einpunktkompaktifizierung ist zwar bei den reellen Zahlen etwas unüblich, kann aber als Muster für die später erfolgende Einpunktkompaktifizierung der komplexen Zahlen dienen. Für R geht dies so: Man betrachtet (wieder einmal) die rationale Parametrisierung der punktierten Kreislinie S1 n f.&1; 0/g, wie in N[4.4] beschrieben. Diese definiert eine bijektive Abbildung (3)
F W R &! S1 n f.&1; 0/g
. mit
F .t/ ´
2t 1 & t2 ; 1 C t2 1 C t2
/ :
Bezeichnet d die Euklidische Standard-Metrik auf R2 , so definiert man eine so genannte chordale Metrik dc auf R durch (4)
dc .t; s/ ´ d.F .t/; F .s//;
d.h. dc ist die von F auf R induzierte Metrik. Anschaulich ist dc .t; s/ der Euklidische Abstand der beiden Punkte F .t/; F .s/ auf der Einheitskreislinie, d.h. die Länge der Sehne zwischen diesen beiden Punkten; vgl. das Bild bei N[4.4]. Aus (3) und (4) berechnet man explizit die chordale Metrik auf R als dc .t; s/ ´ p
2jt & sj p 1 C t 2 1 C s2
für t; s 2 R. Die Abbildung F W R &! S1 n f.&1; 0/g ist ein Homöomorphismus. Denn sie ist zunächst bijektiv und stetig (ausweislich der Formel in (3)), aber auch die Umkehrabbildung ist stetig; denn diese wird nach N[4.4] gegeben durch die Restriktion von y .x; y/ 7! 1Cx auf S1 n f.&1; 0/g. Daraus folgt nach P[6.2], dass dc zur Standard-Metrik auf R äquivalent ist.
317
Abschnitt 6.4 Kartesische Produkte
Nun kommt der entscheidende Schritt: Der bisher ausgelassene Punkt .&1; 0/ auf S1 wird jetzt mitbetrachtet, und als sein Urbild unter F wird das neue uneigentliche Element 1 zu R hinzugefügt. Man setzt somit, F und dc erweiternd: F .1/ ´ .&1; 0/ 2 ; dc .t; 1/ ´ d.F .t/; .&1; 0// D p 1 C t2
dc .1; 1/ ´ d..&1; 0/; .&1; 0// D 0;
wobei das vorvorletzte Gleichheitszeichen durch Rechnung mittels (3) zustande R D R [ f1g (mit kommt. Also vermittelt F insgesamt eine Isometrie zwischen b 1 Metrik dc ) und S (mit Metrik d ). Erst recht ist F ein Homöomorphismus von b R auf S1 . Da S1 kompakt ist und S1 n f.&1; 0/g als dichte Teilmenge enthält, trifft das Gleiche für die Urbilder zu: b R ist kompakt und R liegt dicht in b R. Aufgaben und Anmerkungen 1. Man zeige, für die Körperoperationen in R, wie in Beispiel F definiert: a) Die Summe s ist auf ganz R ) R Lipschitz-stetig. b) Produkt und Quotient p und q sind auf jeder kompakten Teilmenge ihrer Definitionsmenge Lipschitz-stetig. 2. Für eine Teilmenge A eines metrischen Raumes X gilt stets A , A, also Aı , .A/ı , jedoch i. Allg. nicht: Aı D .A/ı . a) Man gebe eine Beispiel für eine Teilmenge A * Rn mit Aı * .A/ı . b) Für Bälle B.a; r/ * Rn zeige man, dass stets gilt: B.a; r/ı D . B.a; r/ /ı und deduziere hieraus: @B.a; r/ D S.a; r/. 3. Für eine Teilmenge A eines metrischen Raumes X gilt stets Aı , A, also Aı , A jedoch i. Allg. nicht: Aı D A. Man gebe eine Beispiel für eine Teilmenge A * Rn mit Aı * A. 4. Man zeige für die Maximumsmetrik in X1 ) X1 : B.a1 ; r/ ) B.a2 ; r/ D B..a1 ; a2 /; r/ für a1 2 X1 , a2 2 X2 . 5. Seien A1 , X1 ; A2 , X2 , A , X1 ) X2 . Man beweise: a) Ist A1 offen in X1 und A2 offen in X2 , so ist A1 ) A2 offen in X1 ) X2 . b) A1 ) A2 D A1 ) A2 . c) @.A1 ) A2 / D .A1 ) @A2 / [ .@A1 ) A2 /. d) Ist A offen in X1 ) X2 , so ist P1 .A/ offen in X1 und P2 .A/ offen in X2 .
318
Kapitel 6 Metrische Räume
6. Sind F1 W X1 ! Y1 und F2 W X2 ! Y2 zwei Abbildungen (X1 ; X2 ; Y1 ; Y2 metrische Räume), so ist deren kartesisches Produkt definiert als F1 ) F2 W X1 ) X2 ! Y1 ) Y2 mit .F1 ) F2 /.x1 ; x2 / ´ .F1 .x1 /; F2 .x2 //: Man zeige: F1 ) F2 D .F1 ı P1 ; F2 ı P2 /. Dies reduziert die Stetigkeit dieser neuen Abbildung auf die Lemmata C und E.
6.5 Gleichmäßigkeit Hierbei geht es um Grenzübergänge, in denen „Parameter“ auftauchen, d.h. zusätzliche Variablen. Man möchte klären, wann die „Güte“ der Approximation gleichmäßig ist, d.h. unabhängig von den Parametern. Solche Gleichmäßigkeitsbegriffe haben wir schon in konkreten Situationen kennengelernt, nämlich die gleichmäßige Stetigkeit bei der Einführung des Integrals in E[5.1] und die gleichmäßige Konvergenz beim Grenzübergang „unter dem Integralzeichen“ in E[5.5]. Jetzt werden diese Eigenschaften einheitlich zusammengefasst, wobei weitere interessante Aussagen herauskommen, z.B. ein allgemeines Extremalprinzip. Die Symbole X; Y; : : : bezeichnen wieder metrische Räume. Gleichmäßige Stetigkeit und das allgemeine Extremalprinzip Bei der Stetigkeit einer Abbildung F W X ! Y ist der Parameter die Stelle. Wir hatten dies bereits in F[6.2] formuliert: Gleichmäßige Stetigkeit war demnach die Forderung: 8 " > 0 9 ı > 0 W d.x1 ; x2 / < ı H) d.F .x1 /; F .x2 // < ": Natürlich impliziert die gleichmäßige Stetigkeit die Stetigkeit. Das Ziel ist jetzt die Umkehrung, natürlich unter Zusatzvoraussetzungen (Satz F). Auf dem Weg dahin liegen einige Aussagen, die auch für sich genommen wertvoll sind. A. Satz. Ist F W X ! Y stetig und X kompakt, so ist auch F .X/ kompakt. Beweis. Sei eine offene Überdeckung von F .X/ gegeben: [ F .X/ , V ; V+ alle offen in Y : + 2) + Durch Übergang zum Urbild folgt: - [ 3[ X D F &1 V D F &1 .V+ /; + + 2) + 2)
319
Abschnitt 6.5 Gleichmäßigkeit
wobei die F &1 .V+ / offen in X sind (G[6.2]). Da X kompakt ist, existiert eine endliche SL Teilüberdeckung X D `D1 F &1 .V+` /, also erhält man durch Übergang zum Bild SL eine endliche Teilüberdeckung F .X/ , `D1 V+` . " B. Folgerung. Ist F W X ! Y stetig und bijektiv sowie X kompakt, so ist auch F &1 W Y ! X stetig (und Y kompakt). Beweis. Die Kompaktheit von Y D F .X/ ist klar aus A. Nach G(iii)[6.2] ist zu zeigen: C abgeschlossen in X H) .F &1 /&1 .C / abgeschlossen in Y , also äquivalent, da F bijektiv ist: C abgeschlossen in X H) F .C / abgeschlossen in Y : Dies geht auf dem Weg über die Kompaktheit so: C , X abg.
P(i)[6.3] P(i)[6.3] A H) C kompakt H) F .C / kompakt H) F .C / , Y: abg.
Warum man nicht direkt über die Abgeschlossenheit folgern kann, wird gleich erklärt. " C. Beispiel. In diesem Beweis ist der Weg über die Kompaktheit nicht zu vermeiden, weil die Abgeschlossenheit unter stetigen (bijektiven) Abbildungen i. Allg. nicht erhalten bleibt. Ein Beispiel ist die Funktion f W X ! Y mit X ´ Œ&1; 0/ [ Œ1; 2Œ, Y ´ Œ&1; 1/ und ( x C 1; x 2 Œ&1; 0/ f .x/ ´ x & 2; x 2 Œ1; 2Œ : f ist bijektiv und stetig. Das Intervall Œ1; 2Œ ist abgeschlossen in X (!) aber f .Œ1; 2Œ/ D Œ&1; 0Œ ist nicht abgeschlossen in Y , und f &1 W Y ! X ist unstetig in 0. D. Folgerung (allgemeines Extremalprinzip). Sei f W X ! R stetig und X kompakt. Dann werden inf f .X/ und sup f .X/ als Funktionswerte angenommen. D.h. es existieren Extremalstellen x0 ; x1 aus X und die Extrema f .x0 / D inf f .X/ D min f; X
f .x1 / D sup f .X/ D max f: X
Beweis. f .X/ ist nach Satz A kompakte Teilmenge von R, also nach R[6.3] beschränkt und abgeschlossen. Aus „beschränkt“ folgt: inf f .X/; sup f .X/ 2 R. Aus „abgeschlossen“ folgt: inf f .X /; sup f .X/ 2 f .X/; denn Infimum und Supremum sind generell Elemente oder Häufungspunkte der jeweiligen Menge; vgl. C(iii)[3.2]. " Hinweis: Dies ist eines der wirkungsvollsten allgemeinen Prinzipien!
320
Kapitel 6 Metrische Räume
E. Lemma. Für jeden metrischen Raum .X; d / ist die Funktion d W X ) X ! R Lipschitz-stetig, also gleichmäßig stetig. Beweis. Für .x; y/ 2 X ) X und .a; b/ 2 X ) X kann man abschätzen: jd.x; y/ & d.a; b/j D jd.x; y/ & d.a; y/ C d.a; y/ & d.a; b/j . jd.x; y/ & d.a; y/j C jd.a; y/ & d.a; b/j . d.x; a/ C d.y; b/
(B[6.1])
. 2 ( max fd.x; a/; d.y; b/g D 2 ( d..x; y/; .a; b//: Eine Lipschitz-Konstante für d ist somit 2.
"
F. Folgerung. Ist F W X ! Y stetig und X kompakt, so ist F gleichmäßig stetig. Beweis. Wir betrachten zu gegebenem " > 0 die Größe ı."/ ´ min fd.x; y/ j d.F .x/; F .y// % "g > 0: Das Minimum existiert: Sei nämlich die Funktion f W X ) X ! R definiert durch f .x; y/ ´ d.F .x/; F .y//. Diese ist stetig, da sie Komposition stetiger Abbildungen ist. Man schreibt dazu f .x; y/ D d.F .P1 .x; y//; F .P2 .x; y/// und wendet E[6.4] und Lemma E an. Dann ist die Menge A ´ f.x; y/ 2 X ) X j f .x; y/ % "g abgeschlossen, also kompakt; vgl. H[6.2] und P(i)[6.3]. Schließlich ist d auf X ) X stetig, also auch auf A ) A. Damit wird Folgerung D anwendbar. Hiernach gilt: d.F .x/; F .y// % " H) d.x; y/ % ı."/; also d.x; y/ < ı."/ H) d.F .x/; F .y// < "; und das ist gerade der Test für die gleichmäßige Stetigkeit.
"
Schon bei den reellen Funktionen einer Veränderlichen hatten wir den Begriff des Stetigkeitsmoduls eingeführt. Dieser hat eine sehr nützliche Funktion bei Abschätzungen, z.B. konnte mit seiner Hilfe der Unterschied zwischen einem bestimmten Integral und den zugehörigen Riemann-Summen eingegrenzt werden, ohne die Epsilontik zu bemühen. Vgl. N[5.1] und P[5.1]. Die allgemeine Definition folgt genau dem damaligen konkreten Muster und auch die Grundeigenschaften ergeben sich ganz analog: G. Definition und Satz. Die Abbildung F W X ! Y sei stetig. Zu jedem 1 > 0 ist der Stetigkeitsmodul definiert als ˇ , ˚ x 2 X; d.x; e x // < 1 !F .1/ ´ sup d.F .x/; F .e x // ˇ x; e (er kann 1 sein). Es gilt dann:
321
Abschnitt 6.5 Gleichmäßigkeit
(i)
Für 0 < 11 . 12 gilt !F .11 / . !F .12 /, d.h. !F ist monoton wachsend.
(ii) Die Abbildung F ist genau dann gleichmäßig stetig, wenn lim !F .1/ D 0 ,!0
gilt.
"
Gleichmäßige Konvergenz Wir betrachten nun eine Folge .Fk / von Abbildungen, d.h. für jedes k 2 N sei eine Abbildung gegeben: Fk W M &! Y; x 7&! Fk .x/: Dabei darf M eine beliebige Menge sein (nicht notwendig metrischer Raum). Der Parameter für die Konvergenz der Folge Fk .x/ ist hier wiederum die Stelle x 2 M . D.h. man fragt, ob die Güte der Annäherung an den Grenzwert für k ! 1 unabhängig von x 2 M sein kann. Die folgende Definition wiederholt wörtlich die konkrete Fassung aus A[5.5], nur dass jetzt alles an die allgemeinere Situation angepasst ist: H. Definition. (i) Die Funktionenfolge .Fk / konvergiert (punktweise) gegen die Funktion F W M ! Y , wenn gilt: Zu jedem x 2 M und " > 0 existiert ein N D N.x; "/ 2 N derart, dass für alle k > N gilt: d.Fk .x/; F .x// < ". Dies bedeutet also, dass für jeden Punkt x 2 M die Folgenkonvergenz lim Fk .x/ D k!1
F .x/ stattfindet. Symbole dafür sind: lim Fk .x/ D F .x/
k!1
(auf M )
oder
Fk .x/ &! F .x/ (für k &! 1): (auf M )
(ii) Die Funktionenfolge .Fk / konvergiert gleichmäßig gegen die Funktion F W M ! Y , wenn gilt: Zu jedem " > 0 existiert ein N D N."/ 2 N derart, dass für alle k > N und alle x 2 M gilt: d.Fk .x/; F .x// < ". Symbole dafür sind: lim Fk .x/ D F .x/ glm.
k!1
(auf M )
oder
Fk .x/ &! F .x/ glm. (auf M )
(für k &! 1).
322
Kapitel 6 Metrische Räume
Manchmal lässt man in dieser Schreibweise das x weg, die Menge M muss aber auf jeden Fall spezifiziert werden (in der Nähe der Formel oder im Kontext). Gleichmäßige Konvergenz ohne Bezug auf eine Menge ist sinnlos! Natürlich impliziert die gleichmäßige Konvergenz die punktweise Konvergenz. Ein einfaches hinreichendes Kriterium für die gleichmäßige Konvergenz ist: I. Satz (Majorantenkriterium für gleichmäßige Konvergenz). Gilt mit einer reellen Nullfolge .˛k /: d.Fk .x/; F .x// . ˛k
für alle k 2 N und alle x 2 M ;
so besteht die gleichmäßige Konvergenz Fk .x/ ! F .x/ auf M . Beweis. Der ."; N /-Test für die Folge .˛k / liefert wegen der vorausgesetzten Ungleichung den gleichmäßigen ."; N /-Test für .Fk /. " Hat man keine Kenntnis oder Vermutung der Grenzfunktion, so hilft auch hier ein Cauchy-Kriterium, wenn der Zielraum vollständig ist: J. Satz (Cauchy-Kriterium für gleichmäßige Konvergenz). Sei .Fk / eine Folge von Abbildungen Fk W M ! Y , und sei Y vollständig. Dann sind äquivalent: (i)
Die Folge .Fk / konvergiert gleichmäßig.
(ii) Zu jedem " > 0 existiert ein N D N."/ 2 N derart, dass für alle k; ` > N und alle x 2 M gilt: d.Fk .x/; F` .x// < ". Beweis. Zu (i) H) (ii): Sei die gleichmäßige Konvergenz vorausgesetzt: Fk .x/ ! F .x/ auf M . Dann gilt die Dreiecksungleichung d.Fk .x/; F` .x// . d.Fk .x/; F .x// C d.F .x/; F` .x//: Daraus liest man unmittelbar (ii) ab. Zu (ii) H) (i): Zunächst existiert zu jedem x 2 M individuell der Grenzwert F .x/ ´ limk!1 Fk .x/, da bei festgehaltenem x die Folge .Fk .x// eine CauchyFolge in Y und Y vollständig ist. Sei nun " > 0 vorgegeben und N gemäß (ii) bestimmt. Dann gilt d.Fk .x/; F` .x// < " für alle k; ` > N und x 2 M . Hieraus folgt erneut mittels der Dreiecksungleichung d.Fk .x/; F .x// . d.Fk .x/; F` .x// C d.F` .x/; F .x// < " C d.F` .x/; F .x//
8 k; ` > N; x 2 M:
323
Abschnitt 6.5 Gleichmäßigkeit
Grenzübergang ` ! 1 am Anfang und Ende der Ungleichungskette gibt daraus d.Fk .x/; F .x// . "
8 k > N; x 2 X:
Dies bestätigt den Test für die gleichmäßige Konvergenz.
"
Von jetzt an sei in diesem Abschnitt M D X ein metrischer Raum. K. Satz. Gilt Fk .x/ ! F .x/ gleichmäßig auf X und sind alle Fk in a 2 X stetig, so ist auch die Grenzfunktion F in a stetig. Beweis. Genau wie in D[5.5]. Man hat lediglich das übliche Rezept anzuwenden (d.h. statt ju & vj zu schreiben d.u; v/). " L. Beispiele. Hier sei stets X ein reelles Intervall und Y D R. (i)
Anschauliche Fälle sind in den folgenden Bildern dargestellt: Glm. Konvergenz gegen f
Unglm. Konvergenz gegen stetiges f 3
2
Unglm. Konvergenz gegen unstetiges f
1
ε ε
3
2
1
(ii) Sei X D Œ0; 1/; fk W Œ0; 1/ ! R; fk .x/ D x k . Die Folge dieser Potenzfunktionen auf Œ0; 1/ wurde in C(ii)[5.5] betrachtet. Sie konvergiert punktweise, jedoch nicht gleichmäßig, da die Grenzfunktion bei 1 unstetig ist. (iii) Sei X D Œ0; p/ für ein festes p mit 0 < p < 1; fk W Œ0; p/ ! R; fk .x/ D x k . Diesmal gilt für die Potenzfunktionen auf der verkleinerten Definitionsmenge lim x k D 0
k!1
glm. auf X D Œ0; p/:
Es ist das Majorantenkriterium I anwendbar; denn 0 . x k . p k für alle x 2 X, und .p k / ist eine reelle Nullfolge. Anwendung auf gekoppelte Grenzwerte Wir betrachten eine Folge der Form bk ´ Fk .xk /, d.h. mit k variierende Funktionen werden auf variierende xk angewandt. Man ist dann in der Versuchung, aus den zwei Konvergenzen „xk ! a“ und „Fk ! F “ auf „Fk .xk / ! F .a/“ zu schließen. Das ist i. Allg. aber nicht erlaubt!
324
Kapitel 6 Metrische Räume
M. Beispiel. ( )k Das klassische Gegenbeispiel ist bk ´ 1 & k1 . Hier ist Fk .x/ ´ .1 & x/k und xk ´ k1 . Mit punktweiser Konvergenz auf X ´ Œ0; 1/ ist die Grenzfunktion nach L(ii) ( 0 für 0 < x . 1 lim Fk .x/ D F .x/ ´ und xk ! a ´ 0: k!1 1 für x D 0 Somit ist F .a/ D 1, aber
3 1 1 -k D : lim Fk .xk / D 1 & k e k!1
Unter Zusatzvoraussetzungen ist das obige Wunschdenken aber doch erfüllbar: N. Satz (Entkoppelung von Grenzübergängen). Gegeben sei eine Folge .Fk / von Abbildungen Fk W X ! Y , die alle in a 2 X stetig sind, sowie eine Folge .xk / in X. Dann gilt der Schluss: lim Fk .x/ D F .x/ glm. auf X;
k!1
lim xk D a
k!1
H)
lim Fk .xk / D F .a/:
k!1
Beweis. Es gilt die Vorausabschätzung d.Fk .xk /; F .a// . d.Fk .xk /; F .xk // C d.F .xk /; F .a//: Außerdem ist die Grenzfunktion F nach Satz K in a stetig. Sei " > 0 gegeben. Wegen der gleichmäßigen Konvergenz existiert ein Index N0 2 N, sodass gilt: d.Fk .x/; F .x// < "=2 für alle k > N0 und alle x 2 X. Somit gilt für diese k auch: d.Fk .xk /; F .xk // < "=2. Wegen der Stetigkeit von F in a existiert ein N1 2 N mit: d.F .xk /; F .a// < "=2 für alle k > N1 . Aufgrund der Vorausabschätzung folgt " " d.Fk .xk /; F .a// < C D " für alle k > max fN0 ; N1 g: 2 2 Hierin ist die Behauptung enthalten. " O. Beispiel. Nach Beispiel C(iii)[5.5] gilt 3 x -n D ex lim 1 C n!1 n gleichmäßig auf jedem Intervall der Form X D Œ&a; a/. Ist .xn / eine konvergente reelle Folge, so ergibt sich aus Satz N 3 xn -n lim xn D c H) lim 1 C D ec : n!1 n!1 n Denn man kann a so groß wählen, dass alle Folgenglieder xn in Œ&a; a/ liegen. Für c D 0 war dieser Grenzwert in Lemma S[2.1] mit ganz elementaren Mitteln gewonnen worden. Er resultiert jetzt auf eine systematische Weise.
325
Abschnitt 6.5 Gleichmäßigkeit
$ Der Satz von Dini Aus der punktweisen Konvergenz kann man die gleichmäßige Konvergenz nur dann schließen, wenn man Zusatzvoraussetzungen macht. Ein bekannter Satz in dieser Richtung geht auf Dini zurück. Er befasst sich mit reellwertigen Funktionen, stützt sich nämlich auf Anordnungseigenschaften. P. Satz (von Dini). Sei X ein kompakter metrischer Raum und .fk / eine Folge reellwertiger stetiger Funktionen fk W X ! R mit monotonem Wachstum bzgl. k, d.h. für alle x 2 X und k 2 N gelte: fkC1 .x/ % fk .x/. Konvergiert die Folge .fk / punktweise gegen eine stetige Funktion f W X ! R, so erfolgt diese Konvergenz sogar gleichmäßig. Die gleiche Aussage bleibt richtig, wenn anstelle des monotonen Wachsens das monotone Fallen bzgl. k vorausgesetzt wird, d.h. wenn für alle x 2 X und k 2 N gilt: fkC1 .x/ . fk .x/. Beweis. Zu jedem " > 0 und x 2 X existiert ein N.x/ 2 N, sodass für k % N.x/ gilt: f .x/ & fk .x/ < "=3. Wegen der Stetigkeit von f und fN.x/ existiert eine Umgebung U.x; ı.x// von x derart, dass für alle e x 2 U.x; ı.x// gilt: jf .x/ & f .e x /j < "=3 und jfN.x/ .x/&fN.x/ .e x /j < "=3. Somit gilt für alle e x 2 U.x; ı.x//: f .e x /&fN.x/ .e x/ < ". Das alles ist richtig bei festem x. Variiert man x, so überdecken die Umgebungen U.x; ı.x// den Raum X. Da dieser kompakt ist, gibt es endlich viele Punkte xi , sodass die Umgebungen U.xi ; ı.xi // ebenfalls X überdecken. Sei N das Maximum der N.xi /. Dann gehört jeder Punkt x 2 X zu einer solchen Umgebung U.xi ; ı.xi //. Damit folgt für k % N : f .x/ & fk .x/ . f .x/ & fN .x/ . f .x/ & fN.xi / .x/ < ": Somit ist der Test für die gleichmäßige Konvergenz fk .x/ ! f .x/ erfüllt. Im Fall des monotonen Fallens kann man analog argumentieren oder zur Folge .&fk / übergehen. " Aufgaben und Anmerkungen 1. Man berechne: 3 1 --n 3 1 , a) lim 1 C cos n!1 n n
b)
3 1 -n -n 13 lim 1 C 1C . n!1 n n
2. Zeige, dass die Implikation in Beispiel O auch umgekehrt werden kann, also die Äquivalenz besteht: 3 xn -n lim xn D c () lim 1 C D ec : n!1 n!1 n
326
Kapitel 6 Metrische Räume
3. Sei .Fk / eine Folge von Funktionen Fk W M ! Y , und sei M D A[B. Man zeige: .Fk / konvergiert dann und nur dann gleichmäßig, wenn die Folgen der Restriktionen .Fk jA/ und .Fk jB/ beide gleichmäßig konvergieren. 4. Man zeige im Anschluss an L(ii), dass die Folge der Potenzfunktionen x 7! x k auch auf Œ0; 1Œ nicht gleichmäßig konvergieren kann. S Œ0; p/. Man sieht also, dass die 5. In L(ii) bzw. Aufgabe 4 gilt Œ0; 1Œ D 0
n!1 `!1
`!1 n!1
Lösungshinweis: Als Erstes existiert y ´ limn!1 yn : Sei " > 0 gegeben. Dann gibt es einen Index N mit d.Fm .x/; Fn .x// < "
für alle n; m > N und alle x 2 A:
327
Abschnitt 6.5 Gleichmäßigkeit
Das folgt aus der gleichmäßigen Konvergenz der Fn . Setzt man x D x` , so ergibt sich d.Fm .x` /; Fn .x` // < "
für alle n; m > N und alle `;
also durch Grenzübergang ` ! 1: d.ym ; yn / . "
für alle n; m > N :
Dies zeigt, dass die Folge .yn / die Cauchy-Eigenschaft besitzt, also ihr Grenzwert y ´ limn!1 yn existiert. Zu zeigen bleibt jetzt: F .x` / ! y für ` ! 1. Dazu verwendet man die Vorausabschätzung d.F .x` /; y/ . d.F .x` /; Fn .x` // C d.Fn .x` /; yn / C d.yn ; y/; gültig für alle `; n. Bei gegebenem " > 0 kann man nun so argumentieren: Es gibt ein festes n derart, dass der erste Summand rechts < "=3 wird, und zwar für alle ` (gleichmäßige Konvergenz Fn ! F ) und dass auch der dritte Summand < "=3 ausfällt (Konvergenz yn ! y). Bei diesem festen n existiert ein Index L, sodass der zweite Summand rechts ebenfalls < "=3 wird für alle ` > L (Konvergenz Fn .x` / ! yn für ` ! 1). Insgesamt zeigt also die Vorausabschätzung: d.F .x` /; y/ < " für alle ` > L. Das beweist die Konvergenz F .x` / ! y. 9. Sei A nichtleere Teilmenge des metrischen Raums X und dA ihre Distanzfunktion; vgl. K[6.2]. Falls zu x 2 X ein x $ 2 A existiert mit dA .x/ D d.x; x $ /, so heißt x $ ein Proximum oder ein Fußpunkt von x in A. a) Zeige: Ist A kompakt, so existiert zu jedem x 2 X ein Proximum x $ 2 A. b) Ist ein Proximum, falls existent, immer eindeutig bestimmt? 10. $ Sind A; B nichtleere kompakte Teilmengen des metrischen Raums X, so sei dA .B/ ´ maxy2B dA .y/ und h.A; B/ ´ max fdA .B/; dB .A/g. Man beweise, dass h eine Metrik auf der Menge K.M / aller nichtleeren kompakten Teilmengen von X ist. Man nennt h die Hausdorff-Metrik. 11. Wie verhält sich der Stetigkeitsmodul gegenüber Komposition? Gilt eine Art Kettenregel !GıF . !G ı !F ?
7
Die komplexen Zahlen
Die komplexen Zahlen sind eine Erweiterung der reellen Zahlen. Das Motiv für diese nochmalige Ausdehnung des Zahlbegriffs ist zunächst rein algebraisch: Es gibt ja einfache algebraische Gleichungen (sogar simple quadratische Gleichungen), die keine reellen Lösungen besitzen, z.B. die Gleichung x 2 C1 D 0. Die komplexen Zahlen entstanden aus dem Bedürfnis heraus, solchen Gleichungen eine Lösung zu verschaffen. Später hat sich herausgestellt, dass man mit den komplexen Zahlen eine reichhaltige Analysis aufbauen kann, die sowohl in den Anwendungen wie auch in der Mathematik selbst zu nützlichen und reizvollen Resultaten führt. In diesem Kapitel konstruieren wir die komplexen Zahlen auf algebraischem Wege, entwickeln dann aber recht bald analytische Hilfsmittel wie die komplexe Exponentialfunktion und die Grundlagen für die Konvergenzfragen im komplexen Bereich. Den Abschluss bildet ein Beweis für den so genannten Fundamentalsatz der Algebra, der mit einfachen Hilfsmitteln geführt werden kann.
7.1
Der Körper der komplexen Zahlen
Die einfachste algebraische Gleichung, die keine reellen Lösungen besitzt, ist (1)
x 2 C 1 D 0:
Diese Gleichung ist nicht reell lösbar, da x 2 C 1 für alle x 2 R positiv ist. Man betrachte nun versuchsweise ein „Symbol“ i , für das i 2 C 1 D 0 gilt, und rechne mit diesem sowie mit „Symbolen“ der Form a C bi (a; b 2 R) nach den Körperregeln. Dann gilt i 2 D &1 und weiter .a1 C b1 i/ C .a2 C b2 i/ D .a1 C a2 / C .b1 C b2 /i .a1 C b1 i/ ( .a2 C b2 i/ D a1 a2 C a1 b2 i C b1 a2 i C b1 b2 i 2 D .a1 a2 & b1 b2 / C .a1 b2 C b1 a2 /i a & bi a & bi 1 D D 2 a C bi .a C bi/.a & bi/ a & b2i 2 D
a2
b a & 2 i: 2 Cb a C b2
Obwohl also i nur ein Symbol ist, ergeben sich konkrete Rechenvorschriften. Aufgrund dieses Befundes soll jetzt definiert werden, was i – oder allgemeiner eine komplexe Zahl – sein soll. Die gefundenen Regeln dienen dabei als Leitfaden. Das Ziel
Abschnitt 7.1 Der Körper der komplexen Zahlen
329
ist, einen Körper zu finden, der einerseits R umfasst, und andererseits Lösungen der Gleichung (1) enthält. Wir betrachten die Menge aller Paare z D .a; b/ reeller Zahlen, also die Menge R2 D R ) R D fz j z D .a; b/ mit a; b 2 Rg: Außer der koordinatenweisen Addition zweier Paare z1 D .a1 ; b1 / und z2 D .a2 ; b2 /: (2)
z1 C z2 ´ .a1 ; b1 / C .a2 ; b2 / ´ .a1 C a2 ; b1 C b2 /
definieren wir folgende Multiplikation von z1 und z2 : (3)
z1 ( z2 D .a1 ; b1 / ( .a2 ; b2 / ´ .a1 a2 & b1 b2 ; a1 b2 C b1 a2 /:
(Die Multiplikation von Elementen von R2 mit reellen Zahlen spielt im Augenblick keine Rolle.) A. Satz. Mit den Verknüpfungen (2), (3) bildet R2 einen Körper. Beweis. Es sind die Eigenschaften von Definition A[1.1] zu bestätigen. Zu den dortigen Regeln für die Addition (S.1) - (S.4): Diese sind sehr leicht zu überprüfen; sie sind natürlich auch aus der linearen Algebra (für R2 als Vektorraum) bekannt. Neutralelement bzgl. der Addition ist das Paar .0; 0/ µ 0, Inverses zum Paar .a; b/ ist das Paar &.a; b/ ´ .&a; &b/. Die noch fehlenden reinen Umformungsregeln kann man einfach nachrechnen: Das multiplikative Kommutativgesetz (P.1) ist klar, weil der Ausdruck rechts in (3) bei Vertauschung von 1 und 2 in sich übergeht. Zum multiplikativen Assoziativgesetz (P.2) rechnet man für zk D .ak ; bk /, k D 1; 2; 3 so: .z1 z2 /z3 D .a1 a2 & b1 b2 ; a1 b2 C a2 b1 / ( .a3 b3 / D ..a1 a2 & b1 b2 /a3 & .a1 b2 C a2 b1 /b3 ; .a1 a2 & b1 b2 /b3 C a3 .a1 b2 C a2 b1 // .z1 .z2 z3 / D .a1 ; b1 / ( .a2 a3 & b2 b3 ; a2 b3 C a3 b2 / D .a1 .a2 a3 & b2 b3 / & b1 .a2 b3 C a3 b2 /; a1 .a2 b3 C a3 b2 / C .a2 a3 & b2 b3 /b1 /: Ein Vergleich der beiden Resultate zeigt deren Übereinstimmung. Das Distributivgesetz (D) kann man analog bestätigen. Zum Neutralelement bzgl. der Multiplikation: Soll das Paar .u; v/ neutral sein, so bedeutet dies .a; b/ ( .u; v/ D .a; b/ für alle .a; b/ ¤ .0; 0/; also äquivalent .au & bv; av C bu/ D .a; b/ für alle .a; b/ ¤ .0; 0/:
330
Kapitel 7 Die komplexen Zahlen
Das ist offensichtlich genau dann erfüllt, wenn u D 1 und v D 0 ist (setze speziell a D 1, b D 0). Es gibt also genau ein Neutralelement, nämlich .1; 0/. Zum Inversen bzgl. der Multiplikation: Soll das Paar .u; v/ ¤ .0; 0/ invers zu .a; b/ ¤ .0; 0/ sein, so bedeutet dies .a; b/ ( .u; v/ D .1; 0/; also äquivalent .au & bv; av C bu/ D .1; 0/
oder auch
au & bv D 1 bu C av D 0:
Diese beiden Gleichungen haben die eindeutig bestimmte Lösung uD
a ; a2 C b 2
vD
&b ; a2 C b 2
wie man erkennt, indem man die erste Gleichung mit a, die zweite mit b multipliziert und die Resultate addiert, bzw. indem man die erste Gleichung mit &b, die zweite mit a multipliziert und die Resultate addiert. Da mit .a; b/ ¤ .0; 0/ auch .u; v/ ¤ .0; 0/ ist, existiert zu .a; b/ genau ein multiplikatives Inverses. " Der nächste Schritt ist die „Einbettung“ von R in den so entstandenen Körper R2 . Dazu betrachten wir die speziellen Paare .a; 0/. Für diese gilt .a1 ; 0/ C .a2 ; 0/ D .a1 C a2 ; 0/;
.a1 ; 0/ ( .a2 ; 0/ D .a1 a2 ; 0/
d.h. diese addieren und multiplizieren sich wie die reellen Zahlen, die als erste Koordinaten auftreten. Ferner gilt .a1 ; 0/ D .a2 ; 0/ () a1 D a2 : Wir können daher gefahrlos schreiben (4)
a ´ .a; 0/
und mit diesen speziellen Elementen von R2 rechnen wie mit reellen Zahlen. Die reellen Zahlen erscheinen so in natürlicher Weise eingebettet in R2 . Außerdem kürzen wir ab: (5)
i ´ .0; 1/
und nennen dieses spezielle Paar die imaginäre Einheit. Damit wird i 2 D .0; 1/ ( .0; 1/ D .0 ( 0 & 1 ( 1; 0 ( 1 C 1 ( 0/ D .&1; 0/ D &1:
331
Abschnitt 7.1 Der Körper der komplexen Zahlen
Somit ist auch das dritte Ziel erreicht: Die Gleichung (1) hat in R2 (zumindest) die Lösung i (tatsächlich ist mit i auch &i ´ .0; &1/ Lösung dieser Gleichung). Schließlich erhalten wir folgende Zerlegung eines Paares z D .a; b/: z D .a; b/ D .a; 0/ C .0; b/ D .a; 0/ C .b; 0/ ( .0; 1/ D a C bi: In beiden Fällen kamen zum Schluss die Verabredungen (4) und (5) zum Zuge. Wir fassen zusammen : B. Satz und Definition. Die Menge der Paare reeller Zahlen wird unter Beachtung der Konventionen (4), (5) zu einem Körper C, dessen Elemente eindeutig in der Form (6)
z D a C bi
mit a; b 2 R
geschrieben werden können. In dieser Gestalt kann mit den Elementen von C nach den Körperregeln gerechnet werden, wobei i 2 D &1 gilt. C heißt der Körper der komplexen Zahlen. Dieser enthält den Körper R der reellen Zahlen in Form der Elemente (6) mit b D 0. " Beim analytischen Arbeiten mit komplexen Zahlen tritt die Entstehung aus den Paaren reeller Zahlen in den Hintergrund; man wird z.B. das z in (6) nicht mehr weiter als .a; b/ schreiben, sondern eben als a C bi. Nach wie vor bleibt jedoch die bijektive Entsprechung von .a; b/ 2 R2 mit a C bi 2 C. Das trifft insbesondere für die Beschreibung von Teilmengen, aber auch für die Veranschaulichung zu: Es empfiehlt sich durchaus und ist allgemein üblich, bei der anschaulichen Deutung z als Punkt oder auch Ortsvektor in R2 mit den Koordinaten a; b zu betrachten. Bei den komplexen Zahlen geht die Anordnung, wie man sie von den reellen Zahlen her kennt, verloren. Jedoch bleibt der Betrag erhalten. Das liegt an einigen spezifischen Begriffen, die zur „Grundausstattung“ von C gehören: C. Definition. Für eine komplexe Zahl z D a C bi mit a; b 2 R definiert man: (i)
den Realteil und Imaginärteil: Re z ´ a, Im z ´ b;
die konjugiert komplexe Zahl z ´ a & bi; p (iii) den Betrag jzj ´ a2 C b 2 . (ii)
Die Größen in (ii) und (iii) kann man durch das konjugiert Komplexe ausdrücken, indem man die Gleichungen z D a C bi und z ´ a & bi addiert, subtrahiert bzw. multipliziert. Das ergibt: (7)
Re z D
1 .z C z/; 2
Im z D
1 .z & z/; 2i
jzj D
p
zz:
332
Kapitel 7 Die komplexen Zahlen
Das konjugiert Komplexe lässt Summe und Produkt in C invariant (ist also ein so genannter Körper-Automorphismus), d.h. für alle z; w 2 C gilt: (8)
z C w D z C w;
z ( w D z ( w:
Das kann man leicht nachrechnen, z.B. beim Produkt, wenn w D c C di
mit c; d 2 R
gesetzt wird, so: Einerseits gilt zw D ac & bd C .ad C bc/i; also zw D ac & bd & .ad C bc/i, andererseits ist z ( w D ac & bd & .ad C bc/i („nur b und d ändern das Vorzeichen“). Durch Vergleich folgt die Behauptung. Genau die reellen Zahlen in C werden durch das Konjugieren in sich übergeführt: z 2 R () z D z: Die reellen Vielfachen von i , also die komplexen Zahlen der Form ti mit t 2 R heißen rein imaginär. Als Folgerung aus (8) ergibt sich für einen Quotienten q ´ z=w 2 C mit w ¤ 0, da q ( w D z, also q ( w D z: 3zw
D
z ; w
falls w ¤ 0:
Das Berechnen von Real- und Imaginärteil eines Quotienten geschieht am schnellsten durch „Erweitern mit dem konjugiert Komplexen des Nenners“: zw z zw D D w ww jwj2
falls w ¤ 0:
D. Satz. Für den Betrag in C gelten die Regeln: (i)
jzj > 0 für z ¤ 0, j0j D 0;
(ii)
jz ( wj D jzj ( jwj; ˇzˇ jzj ˇ ˇ für w ¤ 0; (iii) ˇ ˇ D w jwj (iv) (v)
jz C wj . jzj C jwj (Dreiecksungleichung); ˇ ˇ ˇ ˇ jz C wj % ˇjzj & jwjˇ und jz & wj % ˇjzj & jwjˇ (modifizierte Dreiecksungleichungen).
Beweis. (i) ist aus der Definition des Betrags unmittelbar klar. (ii) und (iii) sind einfache Folgerungen aus der dritten Regel in (7).
Abschnitt 7.1 Der Körper der komplexen Zahlen
333
Zu (iv): Für z Cw D 0 ist die Behauptung trivial richtig. Im Falle z Cw ¤ 0 betrachte man den Quotienten ˇ ˇ ˇ ˇ ˇ z ˇ ˇ w ˇ jzj C jwj jzj jwj ˇ ˇ ˇ: ˇ Q´ D C Dˇ C jz C wj jz C wj jz C wj z C w ˇ ˇz C w ˇ Um Q % 1 nachzuweisen, muss man also zeigen: jqjCj1&qj % 1 oder äquivalent j1& qj % 1 & jqj für q 2 C. Im Fall jqj > 1 ist dies klar. Im Fall jqj . 1 liefert Quadrieren und Ausrechnen mittels (7) äquivalent Re q . jqj, und das ist sicher richtig, wie man mi Definition C sieht. Zu (v): Diese Ungleichungen ergeben sich durch Umstellen aus (iv), genau wie in I[1.1]. " Aufgaben und Anmerkungen 1. Man zerlege in Real- und Imaginärteil: a) .1 C 3i /2 ,
b) .1 C 3i/2 ,
d) .3 C i /.9 & 3i /,
e)
c)
.3 C i/ & .2 & i/ , 1Ci
.1 C i/1000 . .1 & i/1001
2. Für eine gegebene komplexe Zahl a Cbi mit a; b 2 R betrachte man die Gleichung z 2 D a C bi und zeige: a) Ist b ¤ 0, so hat die Gleichung in C genau eine Lösung mit positivem Realteil, nämlich p .q qp / p 2 z1 D a2 C b 2 C a C i sign b a2 C b 2 & a : 2 b) Ist b D 0 und a > 0, sop hat die Gleichung in C genau eine Lösung mit positivem Realteil, nämlich z1 D a. c) Ist b D 0 und a < 0, so hat die p Gleichung in C genau eine Lösung mit positivem Imaginärteil, nämlich z1 D i jaj. In allen drei Fällen a) – c) ist die Lösungsgesamtheit die Menge fz1 ; z2 g mit z2 ´ &z1 . d) Ist a D b D 0, so hat die Gleichung in C nur die Lösung z1 D 0. 3. Gegeben seien komplexe Zahlen a; b; c mit a ¤ 0. Man zeige: Die Lösungen der quadratischen Gleichung az 2 C bz C c D 0 in C sind r c b $ b2 ˙ & ; z1;2 D & 2 2a 4a a
334
Kapitel 7 Die komplexen Zahlen
b2 c wobei die Wurzel eine der Lösungen der Gleichung w 2 D 2 & bezeichnet (wel4a a che, ist egal). Lösungshinweis: Man dividiere die Ausgangsgleichung durch a und führe dann quadratische Ergänzung durch nach dem Muster z 2 C 2pz C q D z 2 C 2pz C p 2 & p 2 C q D .z C p/2 & p 2 C q. 4. Für drei komplexe Zahlen gelte a C b C c D 0 und jaj D jbj D jcj. Man beweise hieraus ja & bj D jb & cj D jc & aj. 5. In der Dreiecksungleichung jz C wj . jzj C jwj für z; w 2 C steht dann und nur dann das Gleichheitszeichen, wenn z und w „nichtnegativ proportional“ sind, d.h. wenn es ein * % 0 gibt mit w D *z, oder wenn es ein + % 0 gibt mit z D +w. Lösungshinweis: Man benutze die Argumente aus dem obigen Beweis der Dreiecksungleichung D(iv). 6. Soweit in Kapitel 1 nur davon Gebrauch gemacht wurde, dass R ein Körper ist, der die natürlichen Zahlen enthält, übertragen sich die Ergebnisse aufs Komplexe. Das gilt z.B. für die binomische Formel (5)[1.3] und die geometrische Summenformel (9)[1.3]. Diese lauten also für a; b 2 C, n 2 N und q 2 C mit q ¤ 1: 0 ! n X 1 & q nC1 n n&k k n : .a C b/ D a b ; 1 C q C q2 C ( ( ( C qn D 1&q k kD0
7. $ Zeige: Ist K ein Körper mit R , K , C, so ist K D R oder K D C: „Es gibt keine echten Zwischenkörper zwischen R und C“.
7.2
Komplexe Exponentialfunktion und Polardarstellung
Wir knüpfen an an die Parametrisierung der Einheitskreislinie S1 durch Kosinus und Sinus, wie in O[4.4] beschrieben. Danach kann man die Punkte von S1 in der Form .cos t; sin t/ mit t 2 R erfassen. Aus diesem Paar machen wir jetzt eine komplexe Zahl: A. Definition („Trauung von Kosinus und Sinus“). Für t 2 R sei (1)
e it ´ cos t C i sin t:
Abschnitt 7.2 Komplexe Exponentialfunktion und Polardarstellung
335
Das ist die so genannte Eulersche Relation. Allgemeiner setzt man für s; t 2 R: e sCit ´ e s ( e it D e s .cos t C i sin t/:
(2)
Damit ist die Exponentialfunktion komplett in C hinein fortgesetzt. Man verwendet auch hier die „exp“-Schreibweise: exp.z/ ´ e z
für z 2 C
und nennt die Exponentialfunktion wieder kurz e-Funktion. Es handelt sich wirklich um eine Fortsetzung; denn die rechte Seite von (2) geht für t D 0 in e s über. An dieser Definition sieht man auch, dass e sCit niemals 0 wird. Tatsächlich liest man hieraus ab: je sCit j D e s , also für alle z 2 C je z j D e Re z ¤ 0:
(3) B. Beispiele.
e i (0 D cos 0 C i sin 0 D 1 D e 0
(i)
e i (20 D cos 2& C i sin 2& D 1 & & (iii) e i.0=2/ D cos C i sin D 0 C i ( 1 D i. 2 2 C. Lemma (einfache Konsequenzen). Für z; w 2 C; n 2 Z; t 2 R gilt
(ii)
(i)
e zCw D e z ( e w
(ii)
.e z /n D e nz
(iii) e z D e z (iv)
e it D e &it D
(v)
e zC20 i D e z .
1 ; je it j D 1 e it
Die Gleichung in (i) drückt aus, dass die Exponentialfunktion auch im Komplexen die Summe in das Produkt überführt, genau wie im Reellen. Die Relation (v) besagt, dass die Addition von 2& i zum Argument von exp den Funktionswert nicht verändert. Man sagt, die komplexe e-Funktion hat die (komplexe) Periode 2& i. Beweis von C. Zu (i): Dies ergibt sich durch direktes Nachrechnen aus der Definition (2) mit Hilfe der Additionstheoreme von Kosinus und Sinus F(iv)[4.4]. Im einzelnen: Sei z D s C it, w D u C iv mit s; t; u; v 2 R. Dann gilt einerseits e zCw D e .sCu/Ci.tCv/ D e .sCu/ ( e i.tCv/ D e s e u ( .cos.t C v/ C i sin.t C v//;
336
Kapitel 7 Die komplexen Zahlen
andererseits e z ( e w D e sCi t ( e uCiv D e s e it ( e u e iv D e s e u ( .cos t C i sin t/.cos v C i sin v/ 3 D e s e u .cos t cos v & sin t sin v/ C i.sin t cos v C cos t sin v/ : Die beiden rechten Seiten am Ende stimmen überein, also auch die linken Seiten. Zu (ii) bis (iv): Dies sind Folgerungen aus (i): Durch vollständige Induktion erhält man zunächst (ii) für n 2 N. Weiter folgt aus (i) für w D &z, da e 0 D 1: e &z D 1=e z und daraus (ii) auch für n 2 &N. (iii) sieht man unmittelbar der Definition (2) an. (iv) ergibt sich durch Kombination von (iii) und (ii) für n D &1 und (v) aus (i) und B(ii). " D. Bemerkung. Für z D e it ; t 2 R besagt (ii) speziell .e it /n D e i nt . Wegen (1) ist dies äquivalent mit der für t 2 R und n 2 Z gültigen Gleichung .cos t C i sin t/n D cos nt C i sin nt
(Formeln von Moivre):
Die Übertragung des Polarkoordinatensatzes R[4.4] in die komplexe Schreibweise gibt unmittelbar folgenden: E. Satz. Zu z D x C iy 2 C mit x; y 2 R existiert genau ein r % 0 sowie ein ' 2 R mit z D re i' : Man nennt diese Formel die Polardarstellung in C. Dabei sind r; ' Polarkoordinaten von .x; y/ 2 R2 mit den gleichen Eigenschaften wie in R[4.4]: Es ist r D jzj D
p x2 C y2:
Für z ¤ 0 gilt für den Hauptwert Arg.z/ des Arguments ' 2 /&&; &/ in der geschlitzten Ebene C n fx C iy j x . 0; y D 0g: Arg.z/ D Arg.x; y/ D 2 arctan
y p x C x2 C y2
und in der rechten Halbebene fx C iy j x > 0g: Arg.z/ D Arg.x; y/ D arctan
y : x
Die Formel z D x C iy wird auch als kartesische Darstellung von z bezeichnet.
"
Abschnitt 7.2 Komplexe Exponentialfunktion und Polardarstellung
337
Die kartesische Darstellung eignet sich besonders für die Addition: für z1 D a1 C b1 i und z2 D a2 C b2 i wird ja (4)
z1 C z2 D a1 C a2 C .b1 C b2 /i:
Die Polardarstellung eignet sich besonders für die Multiplikation: für z1 D r1 e '1 , z2 D r2 e '2 wird ja z1 ( z2 D r1 e '1 r2 e '2 D r1 r2 e '1 C'2 :
(5)
F. Bemerkungen. (i) Aus den Moivre-Formeln ergeben sich Darstellungen für cos nt; sin nt; n 2 N, indem man die linke Seite nach der binomischen Formel entwickelt und Real- und Imaginärteile vergleicht. (ii) Da die Abbildung exp W C ! C die Periode 2& i besitzt, kann sie nicht injektiv sein. Tatsächlich ist die 2& i-Periodizität die einzige „Störung“ der Injektivität. Es gilt nämlich für z; w 2 C die Äquivalenz: e z D e w () z & w 2 Z2& i:
(6)
Dies folgt letztlich aus dem Lemma P[4.4]. Betrachtet man zunächst die spezielle Gleichung e z D 1, so ist diese für z D x C iy mit x; y 2 R nach (2) äquivalent zu den beiden reellen Gleichungen e x cos y D 1, e x sin y D 0, also zu e x D 1, cos y D 1, sin y D 0 („quadriere und addiere“). Dies bedeutet aber x D 0 und y 2 Z2&, also z 2 Z2& i. Da die allgemeine Gleichung e z D e w durch Multiplikation mit e &w in e z&w D 1 umgeformt werden kann, folgt die Äquivalenz (6). Insbesondere hat die e-Funktion die komplexen Perioden ˙2& i; ˙4& i; ˙6& i; : : : und keine anderen. (iii) Aus der Eulerschen Relation (1) folgt: e it ´ cos t C i sin t;
e &it ´ cos t & i sin t:
Addition bzw. Subtraktion dieser Formeln gibt unmittelbar cos t D
e i t C e &it ; 2
sin t D
e it & e &it : 2i
Man kann also Kosinus und Sinus umgekehrt als komplexe Linearkombinationen von komplexen Exponentialfunktionen ausdrücken.
338
Kapitel 7 Die komplexen Zahlen
G . Beispiel (Kosinus hyperbolicus und Sinus hyperbolicus). Diese beiden (zunächst im Reellen betrachteten) Funktionen sind motiviert durch die obigen Ausdrücke für Kosinus und Sinus: Es sind die Funktionen cosh W R ! R und sinh W R ! R, definiert durch cosh x ´
e x C e &x ; 2
sinh x ´
e x & e &x : 2
Die Eigenschaften dieser Funktionen kann man ohne große Mühe ableiten, da sie ja vollkommen explizit aus der wohlbekannten (reellen) e-Funktion aufgebaut sind. Es ergibt sich ein Formelapparat, der in großer Analogie zu dem trigonometrischen Formelwerk steht. Eines ist allerdings ganz anders: Diese Funktionen haben keine reellen Periodizitätseigenschaften. Es seien einige Eigenschaften aufgelistet: a) cosh2 & sinh2 D 1;
cosh0 D sinh;
sinh0 D cosh.
b) sinh ist streng monoton wachsend und eine ungerade Funktion sowie sinh 0 D 0. cosh ist für x % 0 streng monoton wachsend und eine gerade Funktion sowie cosh 0 D 1. c) Die Umkehrfunktionen werden mit der Vorsilbe „ar“ bezeichnet. Genauer gilt: arcosh ´ .cosh jŒ0; 1Œ/&1 , arsinh ´ sinh&1 . Man kann diese Funktionen auch mit dem natürlichen Logarithmus ausdrücken: 3 3 p p arsinh y D ln y C y 2 C 1 ; arcosh y D ln y C y 2 & 1 ; indem man die Gleichungen y D cosh x bzw. y D sinh x (per Substitution e x D u) nach x auflöst (es entstehen quadratische Gleichungen). d) Die Folgefunktionen Tangens hyperbolicus und Kotangens hyperbolicus sind definiert als tanh x ´
sinh x ; cosh x
cotanh x ´
cosh x ; sinh x
x ¤ 0;
und ihre Umkehrfunktionen heißen artanh und arcotanh (definiert auf /&1; 1Œ bzw. auf R n Œ&1; 1/). e) Die Rolle von cos und sin zur Parametrisierung des Einheitskreises übertragen sich auf cosh und sinh zur Parametrisierung der Einheitshyperbel H1 ´ f.x; y/ 2 R2 j x 2 & y 2 D 1; x > 0g; dergestalt dass zu jedem .x; y/ 2 H1 genau ein t 2 R existiert mit x D cosh t; y D sinh t. Die Funktionen cosh; sinh, tanh und cotanh werden deswegen als Hyperbelfunktionen bezeichnet.
339
Abschnitt 7.2 Komplexe Exponentialfunktion und Polardarstellung
Standardveranschaulichung Da eine komplexe Zahl z D a C bi (mit a; b 2 R) einfach ein anders geschriebenes Paar reeller Zahlen ist, kann man z wie gewohnt in der Zahlenebene veranschaulichen, und zwar entweder durch den Punkt .a; b/ oder den (vom Ursprung ausgehenden) Ortsvektor .a; b/. In diesem Zusammenhang spricht man von der Gaußschen Zahlenebene. Neben der kartesischen Darstellung z D a C bi kann man wahlweise die Polardarstellung z D re i' verwenden. Bei der anschaulichen Deutung, die wir jetzt beschreiben, werden einige Begriffe verwendet, die erst später präzisiert werden können. Diese dürfen zwar zur Veranschaulichung dienen, sind aber vorläufig nicht als Beweismittel zugelassen. In der Gaußschen Zahlenebene heißt die 1-Achse die reelle Achse, da sie von allen z D a 2 R gebildet wird, und die 2-Achse imaginäre Achse, da sie von allen z D bi gebildet wird. Weil jzj die Euklidische Länge des Ortsvektors z ist, stellt sich die Einheitskreislinie S1 wirklich auch als Kreis mit Mittelpunkt 0 und Radius 1 dar. imaginäre Achse z = a+bi
bi = |z|
i
S1 sin
ϕ
ϕ 0
r
cos
ϕ
1
a
reelle Achse
Das Argument ' von z ¤ 0 mit ' 2 Œ0; 2&Œ veranschaulicht man durch die Bogenlänge auf S1 , gemessen vom Punkt 1 im Gegenuhrzeigersinn (= „mathematisch positiven Drehsinn“) bis zum Schnittpunkt der durch z bestimmten Halbgeraden mit S1 . (Gerade auch für die Bogenlänge ist die obige Vorsichtsmaßnahme zu beachten. Die Bogenlänge ist hiermit noch nicht als exakter mathematischer Begriff eingeführt. Das ist erst mit Hilfe weiterer Begriffsbildungen möglich, die wir in Abschnitt 9.1 besprechen werden.) Demgemäß wird ' auch als orientierter Winkel von z gegen 1 bezeichnet. Die Veranschaulichung von Addition und Multiplikation liest man aus (4) und (5) ab:
340
Kapitel 7 Die komplexen Zahlen
Im Im
|z1 | . | z2 |
ϕ1+ϕ2
z1 + z2 z2
ϕ2 |z2 | |z1 |
z1 Re
ϕ1 Re
Die Summe wird mit der Parallelogramm-Regel für die zugehörigen Ortsvektoren gebildet, beim Produkt multiplizieren sich die Beträge, und es addieren sich die Argumente.
Im
Der Übergang von z zum konjugiert Komplexen z bedeutet Spiegelung an der reellen Achse.
z = a + bi
Re z = a - bi
Aufgaben und Anmerkungen 1. Aus den Formeln von Moivre (Bemerkung D) leite man durch Entwicklung der linken Seite nach der binomischen Formel Gleichungen für cos nt und sin nt für n D 2; 3; 4; 5 her. 2. In der geometrischen Summenformel (Aufgabe 6[7.1]) setze man q ´ re it für r % 0 und t 2 R und gewinne so durch Trennung von Real- und Imaginärteil die Gleichungen 1 C r cos t C r 2 cos 2t C ( ( ( C r n cos nt D
1 & r cos t & r nC1 cos .n C 1/t C r nC2 cos nt 1 & 2r cos t C r 2
r sin t C r 2 sin 2t C ( ( ( C r n sin nt D
r sin t & r nC1 sin .n C 1/t C r nC2 sin nt 1 & 2r cos t C r 2
Abschnitt 7.2 Komplexe Exponentialfunktion und Polardarstellung
341
für n 2 N, falls der Nenner rechts ¤ 0 ist. Im Fall r D 1 spezialisiere man dies unter Verwendung der trigonometrischen Formeln aus M[4.4] zu 3 1t sin n C 1 2 C cos t C cos 2t C ( ( ( C cos nt D t 2 2 sin 2 nC1 sin t sin nt 2 sin t C sin 2t C ( ( ( C sin nt D ; t sin 2 gültig für alle t 2 R mit t … Z2&. 3. Punktmengen in R2 lassen sich reell durch Relationen für die kartesischen Koordinaten x; y von .x; y/ 2 R2 oder komplex und äquivalent durch Relationen für z D x C iy 2 C beschreiben. Man zeige z.B. a) Eine reelle Geradengleichung 2˛x C 2ˇy D % mit .˛; ˇ/ ¤ .0; 0/ geht für z ´ x C iy über in mit a ´ ˛ C iˇ.
&az & az C % D 0
b) Eine Kreislinie mit Mittelpunkt a 2 C und Radius r > 0 wird komplex durch jz & aj D r beschrieben. Quadrieren und Entwickeln liefert aus dieser Gleichung äquivalent mit % ´ aa & r 2 .
zz & az & az C % D 0
c) Als gemeinsame Gleichungsform für Geraden und Kreislinien erhält man somit 0zz & az & az C % D 0; wobei 0; % 2 R und a 2 C Konstanten sind. Diese sind allerdings nicht frei wählbar; denn im Fall 0 D 0 muss, damit eine Gerade dargestellt wird, a ¤ 0 sein, und im Fall 0 ¤ 0 muss, damit eine Kreislinie dargestellt wird, jaj2 &%0 > 0 sein. Im zweiten Fall ist dann der Radius p jaj2 & %0 rD : j0j 4. Die Abbildung f W C n f0g, definiert durch 1 ; z hat als Bildmenge A WD Cnf0g, kann somit als Selbstabbildung f W A ! A aufgefasst werden und ist als solche bijektiv (und ihre eigene Inverse). f .z/ ´
342
Kapitel 7 Die komplexen Zahlen
a) Man zeige: f bildet Kreise oder Geraden in Kreise oder Geraden ab, soweit sie in A liegen (wobei es vorkommen kann, dass Geraden in Kreise und Kreise in Geraden übergehen). Lösungshinweis: Man verwende die gemeinsame Gleichungsform für Geraden und Kreise aus Aufgabe 3 c) und stelle fest, dass die Bildpunkte w D f .z/ jeweils wieder eine solche Gleichung erfüllen. b) Man berechne die Bilder der Geraden Re z D ˛ D const. bzw. der Geraden Re z D ˇ D const. (vgl. das Bild).
f f(z) = 1/z
Wenn in der Urbildebene mit den ganzzahligen Gitterlinien ein Schachbrettmuster verbunden wird, so veranschauliche man das entsprechende „krummlinige Schachbrettmuster“ in der Bildebene durch Ausmalen einiger entsprechender krummliniger Maschen. & 5. $ Für n 2 N und t 2 R n Z gilt n n cot nt D
n&1 X kD0
7.3
3 k& cot t C : n
Konvergenz bei komplexen Zahlen
Um Konvergenzfragen der komplexen Zahlen zu studieren, fassen wir den Körper C als metrischen Raum auf. Als solcher ist er zunächst das Gleiche wie R2 D R ) R mit der Maximumsmetrik dm gemäß I[6.4]. Diese ist gegeben durch: z D x C iy;
x; y 2 R
w D u C iv;
u; v 2 R
H)
dm .z; w/ ´ max fjx & uj; jy & vjg:
343
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
Tatsächlich arbeitet man in C lieber mit der Euklidischen Standard-Metrik d , wie sie in C(ii)[6.1] für R2 definiert war. Man kann sie jetzt durch den komplexen Betrag ausdrücken p p d.z; w/ ´ jz & wj D .x & u/2 C .y & v/2 : jzj ´ x 2 C y 2 ; Hieraus folgen unmittelbar die Metrikaxiome für d , insbesondere die Dreiecksungleichung; denn man hat für je drei komplexe Zahlen: d.z1 ; z3 / D jz1 & z3 j D j.z1 & z2 / C .z2 & z3 /j . jz1 & z2 j C jz2 & z3 j D d.z1 ; z2 / C d.z2 ; z3 /: Glücklicherweise führen beide Metriken zu den gleichen Konvergenzbegriffen, und das liegt an Folgendem: Zunächst kann man abschätzen: max fjxj; jyjg . jzj D
p p x 2 C y 2 . 2 max fjxj; jyjg;
indem man den Quadratausdruck dadurch verkleinert, dass das kleinere von x 2 ; y 2 weggelassen wird, bzw. dadurch vergrößert, dass beide durch ihr Maximum ersetzt werden. Hieraus folgt durch Anwendung auf die Differenz z & w: (1)
dm .z; w/ . d.z; w/ .
p
2 dm .z; w/:
An diesen gegenseitigen Abschätzungen sieht man schon, dass aus Bedingungen der Gestalt dm .z; w/ < 1 leicht entsprechende Ungleichungen für d folgen (und umgekehrt), wobei lediglich die Schranke durch ein festes Vielfaches ersetzt wird. Da in den grundlegenden Definitionen für Konvergenz nur solche Bedingungen vorkommen, macht es im Ergebnis keinen Unterschied, welche der beiden Metriken zur Formulierung verwendet wird. Das gilt auch für die topologischen Grundbegriffe. Die gegenseitigen Abschätzungen (1) drücken nämlich so genannte Ballinklusionen in R2 (und damit in C) aus. Darunter versteht man Folgendes: Die Bälle der Maximumsmetrik sind Quadrate (I[6.4]), die Bälle der Standard-Metrik sind Kreisscheiben.
β
r
r
a
α Ball in der Maximumsmetrik
β
r
r
a
α Ball in der Euklidischen Metrik
344
Kapitel 7 Die komplexen Zahlen
Ist a 2 C das Zentrum der betrachteten Bälle, so ergibt sich aus (1) für r > 0: p d.z; a/ < r H) dm .z; a/ < r H) d.z; a/ < 2 r: Dies besagt: Jede Kreisscheibe ist in dem umbeschriebenen Quadrat enthalten; jedes Quadrat wird umfasst von der umbeschriebenen Kreisscheibe (jeweils mit gleichem Zentrum). Ist also ein „Maximumsball“ in einer Menge A ent- β halten, so auch der „Euklidische“-Ball mit gleichem Zentrum und gleichem Radius, und ist ein „Euklidischer“-Ball in A enthalten, so auch der „Maximumsball“ mit gleichem Zentrum und mit p durch 2 dividiertem Radius. (Im Bild ist a D .˛; ˇ/.)
r √2 r
r
a
α
Daraus folgt, dass eine Menge A , C genau dann bzgl. der Maximumsmetrik offen ist, wenn sie bzgl. der Euklidischen Metrik offen ist. Ähnlich haben wir oben die Gleichwertigkeit der Konvergenzbegriffe bzgl. der beiden Metriken überlegt. Unter Beachtung der Resultate (i) bis (iv) in I[6.4] können wir zusammenfassen: A. Satz. Die Maximumsmetrik bzw. die Euklidische Standard-Metrik führen auf C zu den gleichen topologischen Begriffen (Offenheit, Abgeschlossenheit, Häufungspunkt, Abschluss, Inneres, Rand, Dichtheit, Kompaktheit von Teilmengen, Konvergenz von Folgen, Grenzwert und Stetigkeit von Abbildungen). Dasselbe gilt für die zugehörigen gleichmäßigen Varianten, die Beschränktheit und Vollständigkeit von Teilmengen und die Cauchy-Eigenschaft von Folgen. Insbesondere haben wir bzgl. beider Metriken: (i)
Für die Folgenkonvergenz gilt die Äquivalenz: zn ! a
(ii)
()
Re .zn / ! Re .a/;
Im .zn / ! Im .a/:
Die abgeschlossenen Bälle und die Sphären in C sind kompakt.
(iii) Eine Teilmenge von C ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist. (iv)
C ist vollständig.
"
Auch die Grundlagen der Differential- und Integralrechnung wollen wir, soweit es nach den obigen Prinzipien geht, übertragen. Wir hatten bisher betrachtet Funktionen des Typs (2)
f W A &! R;
mit A , R
345
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
und wollen jetzt auch Funktionen studieren der Art (3)
f W A &! C;
mit A , R:
Ist f von diesem neuen Typ, so definieren Real- und Imaginärteil ihrer Werte zwei reelle Funktionen u; v W A ! R: (4)
f .t/ D u.t/ C iv.t / 8 t 2 A; kurz: u D Re .f /; v D Im .f / oder f D u C iv:
Umgekehrt kann man aus zwei solchen Funktionen u; v immer eine komplexwertige Funktion f D u C iv aufbauen. Übrigens ist der Typ (2) ein Spezialfall des Typs (3), nämlich der für v D 0. Wir beschränken uns zunächst auf reelle Definitionsmengen A, und zwar wegen der in Beispiel D[6.4] geschilderten Problematik: Abbildungen aus einem kartesischen Produkt heraus (das wäre hier R ) R oder eben C) sind danach nicht so einfach „komponentenweise“ zu behandeln. Eine durchgreifende Diskussion dieser Typen wird erst bei den Funktionen mehrerer Veränderlicher ab Kapitel 9 möglich sein. Wir listen nun einige Eigenschaften der Funktionen f der Gestalt (4) auf. Das Leitmotiv ist die komponentenweise Behandlung, d.h. die Zurückführung auf die Eigenschaften von Real- und Imaginärteil u und v. B . Satz und Definition (weitere Übertragungen). gilt:
Für Funktionen der Art (4)
(i)
f stetig in a 2 A: () gleicher ."; ı/-Test wie in A[3.3] () u; v stetig in a.
(ii)
f differenzierbar in a 2 A mit Ableitung f 0 .a/: () gleiche Definition wie in A[4.1] () u; v differenzierbar in a und f 0 .a/ D u0 .a/ C iv 0 .a/.
(iii) Die Ableitungsregeln übertragen sich sinngemäß unter entsprechenden Voraussetzungen, z.B. die Summen- und Produktregel: .f C g/0 .a/ D f 0 .a/ C g 0 .a/;
.fg/0 .a/ D f 0 .a/g.a/ C f .a/g 0 .a/
sowie die Kettenregel, diese allerdings nur bei Vorschaltung einer rein reellen Funktion ' W B ! A (B; A , R): .f ı '/0 .b/ D f 0 .'.b// ( ' 0 .b/: (iv)
Für stetiges f W Œ˛; ˇ/ ! C; f D u C iv, setzt man Z ˇ Z ˇ Z ˇ v.t/ dt: u.t / dt C i f .t/ dt ´ ˛
˛
˛
346
Kapitel 7 Die komplexen Zahlen
Auch die formalen Integrationsregeln bleiben unter entsprechenden Voraussetzungen erhalten, insbesondere der Hauptsatz der Differential- und Integralrechnung in den drei Fassungen von Abschnitt 5.2 sowie die Produktintegration und die Substitutionsregel aus Abschnitt 5.3, wobei die transformierende Funktion vom rein reellen Typ sein muss (wie oben bei der Kettenregel). Man beachte, dass die Regeln für die Differentiation und Integration von Produkten die Homogenitätsregeln gegenüber komplexen Vielfachen beinhalten. Z.B. gilt für eine stetige Funktion f W Œ˛; ˇ/ ! C und c 2 C Z ˇ Z ˇ c ( f .t/ dt D c ( f .t/ dt: ˛
˛
Beweis von B. Wenn wir sagen, die Regeln übertragen sich, so ist damit gemeint, dass die Regeln erhalten bleiben einschließlich der Beweise. Natürlich sind die entsprechenden Ersetzungen vorzunehmen, insbesondere der reelle Betrag durch den komplexen Betrag zu ersetzen. Das soll nun nicht alles wiederholt werden. Aber nachdem klar ist, dass die involvierten Grenzübergänge komponentenweise (an Real- und Imaginärteil) vorgenommen werden dürfen, ist alles auch einfach durch Rechnung zu bestätigen. Das geht dann z.B. bei der Kettenregel in (iii) so (wobei gleichzeitig ausformuliert ist, was mit „entsprechenden Voraussetzungen“ gemeint ist): Die betrachteten Funktionen sind zum einen ' W B ! R und zum anderen f W A ! C mit '.B/ , A. Es sei ' in b 2 B und f in a ´ '.b/ differenzierbar, also f 0 .a/ D u0 .a/ C iv 0 .a/. Die Komposition ist f ı ' D .u ı '/ C i.v ı '/. Da auf die reellen Kompositionen u ı ' und v ı ' die gewöhnliche Kettenregel B[4.2] anwendbar ist, folgt .f ı '/0 .b/ D .u ı '/0 .b/ C i.v ı '/0 .b/ D .u0 .'.b//' 0 .b/ C i.v 0 .'.b//' 0 .b/ D .u0 .'.b// C iv 0 .'.b///' 0 .b/ D f 0 .'.b//' 0 .b/; einschließlich der Differenzierbarkeit von f ı ' in b.
"
Die Übertragung gelingt nicht immer auf diesem Routineweg. So bleibt die Dreiecksungleichung für Integrale für den komplexen Betrag zwar erhalten, sie folgt jedoch nicht durch bloße Übersetzung aus der reellen Variante. C. Lemma. Ist f W Œ˛; ˇ/ ! C stetig, so gilt die Dreiecksungleichung ˇ Z ˇZ ˇ ˇ ˇ ˇ ˇ ˇ jf .t/j dt: f .t/ dt ˇ . ˇ ˇ ˇ ˛ ˛
347
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
Beweis. Im Beweis seien die Integranden argumentfrei geschrieben. Wir setzen Z ˇ c´ f: ˛
Im Fall c D 0 ist die Behauptung trivial richtig. Im Fall c ¤ 0 betrachte man die Größe Z ˇ Z ˇˇ ˇ ˇf ˇ 1 ˇ ˇ: Q´ jf j D ˇcˇ jcj ˛ ˛ Die Behauptung ist dann Q % 1. Um dies nachzuweisen, beachtet man, dass Rˇ f ˛ c D 1 gilt. Man muss also für stetiges g W Œ˛; ˇ/ ! C die Implikation nachweisen: Z Z ˇ
˛
g D 1 H)
ˇ
˛
jgj % 1:
Setzt man g D u C iv (mit reellen Funktionen u; v), so gilt nach Voraussetzung Rˇ ˛ u D 1, also wird ˇZ ˇ Z ˇ Z ˇp Z ˇ ˇ ˇ ˇ ˇ ˇ u2 C v 2 % juj % ˇ uˇ D 1: jgj D ˇ ˇ ˛ ˛ ˛ ˛ Dabei wurde zum Schluss die Dreiecksungleichung für reelle Integrale verwendet. " Warnung: Die Übertragung reeller Prinzipien auf C ist problematisch, wenn im Reellen von der Anordnung Gebrauch gemacht wurde. Die Anordnung ist eine typisch reelle Relation, die nicht sinnvoll aufs Komplexe ausgedehnt werden kann. So gibt es z.B. keinen Zwischen- oder Mittelwertsatz für komplexwertige Funktionen in der gewohnten Form. Nun folgen einige einfache Eigenschaften für den allgemeineren Funktionentyp (5)
f W B &! C;
B offene Teilmenge von C:
Was Grenzwerte in C und Stetigkeit betrifft, so ist hier nichts Neues zu erklären, da sich diese Begriffe denen für metrische Räume unterordnen. Darüber hinaus existieren aber Besonderheiten, die untersucht werden müssen. Eine solche Besonderheit sind die uneigentlichen Grenzübergänge. Diese hängen im Reellen stark an der Anordnung, müssen also für C modifiziert werden. Das Grundmuster ist dasselbe wie in den Definitionen A, C, F von Abschnitt 3.5. Der wichtigste Unterschied ist der, dass zu C nur ein uneigentliches Element 1 hinzugefügt wird: b C ´ C [ f1g: Dadurch gestaltet sich die Situation im Komplexen eher einfacher, weil es nicht mehr ganz so viele Kombinationen gibt. Man nennt b C die erweiterte komplexe Ebene.
348
Kapitel 7 Die komplexen Zahlen
D. Definition (uneigentliche Grenzübergänge im Komplexen). Es sei f eine Funktion vom Typ (5) sowie b; c 2 C. (i)
Ist b Häufungspunkt von B, so wird definiert
lim f .z/ D 1 W () 8 E > 0 9 ı > 0 8 z 2 A mit 0 < jz&bj < ı W jf .z/j > E:
z!b
(ii)
Ist B nicht beschränkt, so wird definiert: lim f .z/ D c W () 8 " > 0 9 D > 0 8 z 2 A mit jzj > D W jf .z/ & cj < "
z!1
lim f .z/ D 1 W () 8 E 2 R 9 D > 0 8 z 2 A mit jzj > D W jf .z/j > E:
z!1
E. Beispiel. Es gilt lim
z!0
1 D 1; z
lim
z!1
1 D 0; z
lim z 3 D 1:
z!1
Man bestätigt sehr leicht durch einfache Ungleichungen, dass die voranstehenden Definitionen erfüllt sind: So wird für z ¤ 0: j1=zj > E, falls jzj < 1=E (also tut es ı ´ 1=E); für z ¤ 0: j1=zj > ", falls jzj > 1=" (also tut es D ´ 1="); jz 3 j > E, falls jzj > max fE; 1g (also tut es D ´ max fE; 1g). Die uneigentlichen Grenzübergänge können wie in G(ii)[3.5] durch Reziprokenbildung auf die Nullkonvergenz zurückgeführt werden, wobei die Begründung fast genauso verläuft: (6) (7) (8)
1 D0 z!b z!b f .z/ . / 1 Dc lim f .z/ D c () lim f z!1 w!0 w lim f .z/ D 1 () lim
1 . / D0 z!0 1 f w
lim f .z/ D 1 () lim
z!1
Korrespondierend werden analog zu (6)[3.5] einige Regeln zwischen Unendlich und den komplexen Zahlen verabredet: Für alle a 2 C sei: &.1/ D 1; (9)
j1j D 1
aC1D1Ca D1
a ( 1 D 1 ( a D 1 für a ¤ 0 a D 0; 1
1 D 1: 0
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
Dagegen sind Kombinationen wie 0 ( 1,
349
1 und 1 ˙ 1 nicht definiert. 1
Nun wollen wir uns mit einigen Eigenschaften der komplexen e-Funktion beschäftigen. Sie ist von der Gestalt (5) mit B D C, lässt sich aber vom zuvor betrachten Typ her erschließen: F. Lemma. Sei A , R und 0 W A ! C in a 2 A differenzierbar. Dann ist e + W A ! C ebenfalls in a differenzierbar, und es gilt .e + /0 .a/ D e +.a/ ( 0 0 .a/: Beweis. Die Kettenregel in B(iii) ist hier nicht zuständig, da die komplexe Exponentialfunktion i. Allg. komplexe Argumente hat. Schreibt man wieder 0 D uCiv mit reellen Funktionen u; v, so wird e + D e u .cos vC i sin v/, und es sind mit 0 auch u; v in a differenzierbar, also auch e + . Die Ableitung berechnet man als .e + /0 .a/ D e u.a/ u0 .a/.cos v.a/ C i sin v.a// C e u.a/ .& sin v.a/ ( v 0 .a/ C i cos v.a/ ( v 0 .a// D e u.a/ .cos v.a/ C i sin v.a//.u0 .a/ C iv 0 .a/ D e +.a/ ( 0 0 .a/; wie behauptet.
"
G. Folgerung. (i)
Ist 0 W Œ˛; ˇ/ ! C stetig differenzierbar, so gilt Z ˇ e +.t / 0 0 .t/ dt: e +.ˇ / & e +.˛/ D ˛
(ii) Für z1 ; z2 2 C gilt e min fRe z1 ;Re z2 g ( jz1 & z2 j . je z1 & e z2 j . e max fRe z1 ;Re z2 g ( jz1 & z2 j: Beweis. Zu (i): Dies folgt sofort aus der Ableitungsregel von F: .e + /0 .t / D e +.t / ( 0 0 .t / durch Integration über Œ˛; ˇ/ mittels des Hauptsatzes der Differential- und Integralrechnung. Zu (ii): Man verbindet z1 ; z2 geradlinig, d.h. man definiert die Abbildung 0 W Œ0; 1/ ! C durch 0.t/ ´ z1 C t.z2 & z1 /. Diese hat die (konstante) Ableitung 0 0 .t/ D z2 & z1 und erfüllt 0.0/ D z1 und 0.1/ D z2 . Damit folgt aus (i) Z 1 z2 z1 e +.t / .z2 & z1 / dt: e &e D 0
350
Kapitel 7 Die komplexen Zahlen
Übergang zum Betrag, Anwendung der Dreiecksungleichung und von (3)[7.2] liefert hieraus die Behauptung, da Re 0.t/ D Re .z1 C t.z2 & z1 // D .1 & t/Re z1 C t Re z2 , was für t 2 Œ0; 1/ im abgeschlossenen Intervall mit Endpunkten Re z1 und Re z2 liegt. " H. Satz. Die komplexe e-Funktion exp W C ! C ist auf jeder Halbebene fz 2 C j Re z . ˇg Lipschitz-stetig mit der Lipschitz-Konstanten e ˇ . Somit ist exp W C ! C insgesamt stetig. Beweis. Aus der oberen Abschätzung in G(ii) folgt für z1 ; z2 in dieser Halbebene je z1 & e z2 j . e ˇ ( jz1 & z2 j: Wegen d.z; w/ D jz & wj ist das die Behauptung.
"
Man beachte die Analogie der Aussagen G(ii) und H mit den entsprechenden reellen Aussagen in A[3.7] und B(ii)[3.7]! Die obige Definition der komplexen e-Funktion in A[7.2] („Trauung von Kosinus und Sinus“) hat ihren Reiz, fällt aber etwas vom Himmel (wie so manches Wunder). Dass diese Definition gerechtfertigt war, zeigt sich aber jetzt an folgender Kennzeichnung: I. Satz. Sei a 2 C fest. Dann existiert genau eine nicht identisch verschwindende Funktion f W R ! C mit: (F) (D)
f .t C s/ D f .t/ ( f .s/
für alle t; s 2 R
f ist in 0 differenzierbar und f 0 .0/ D a:
Diese Funktion ist f .t/ D e at . Für a ¤ 0 folgt aus f 0 .0/ D a automatisch, dass f nicht identisch null ist. Beweis von I. Existenz: Mittels C(i)[7.2] und Lemma F folgt leicht, dass e at alle Forderungen erfüllt. Eindeutigkeit: Sei f ¤ 0 beliebig mit (F), (D). Aus (F) folgt für s D 0: f .t/ D f .t/ ( f .0/. Nach Voraussetzung gibt es mindestens ein t 2 R mit f .t/ ¤ 0. Somit ist f .0/ D 1. Nun folgt aus der Differenzierbarkeit in 0 die Differenzierbarkeit überall. Dazu bildet man den Differenzenquotienten bei t 2 R und rechnet mit Hilfe von (F) um: f .t C h/ & f .t/ f .t/f .h/ & f .t/ f .h/ & 1 f .h/ & f .0/ D D ( f .t/ D ( f .t/: h h h h
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
351
Hieraus folgt mittels (D): f .t C h/ & f .t/ D f 0 .0/ ( f .t/ D a ( f .t/: h h!0 lim
Also ist f in t differenzierbar und f 0 .t / D af .t/. Damit folgt weiter wie in I(ii)[4.3] .e &at f .t//0 D e &at ( .&a/ ( f .t/ C e &at f 0 .t / D e &at ( .&a/ ( f .t/ C e &at ( af .t/ D 0; also e &at f .t/ D const. D 1 (setze t D 0). Dies impliziert f .t/ D e at .
"
Für einen Beweis von Satz I mittels Potenzreihen vgl. Kneser[2004]. Holomorphie Eine für komplexe Funktionen spezifische Regularitätseigenschaft ist die Holomorphie. Die folgende Definition ist motiviert durch die obige Kettenregel für die komplexe e-Funktion. Es handelt sich um eine vorläufige Erklärung, die es erlaubt, mit diesem Begriff umzugehen, ohne die Feinheiten der mehrdimensionalen Analysis zu bemühen. Trotz ihrer Vorläufigkeit wird sich diese Definition später als die endgültig richtige herausstellen. Nach wie vor geht es hier um Funktionen mit echt komplexer Definitionsmenge des Typs (5). J. Definition. Die Funktion f W B ! C (5) heißt holomorph oder analytisch, wenn e W B ! C gibt, sodass für alle stetig differenzierbaren es eine stetige Funktion f Funktionen 0 W Œ˛; ˇ/ ! B die Komposition f ı 0 W Œ˛; ˇ/ ! C differenzierbar ist mit der Ableitung (10)
e.0.t// ( 0 0 .t / für alle t 2 Œ˛; ˇ/: .f ı 0/0 .t/ D f
Aufgrund der Gleichung (10) ist dann f ı 0 sogar stetig differenzierbar. K. Beispiele. (i) Die komplexe e-Funktion exp W C ! C ist nach Lemma F holomorph; hierbei e.z/ D e z . ist f e existie(ii) Die Konjugation f W C ! C, f .z/ ´ z, ist nicht holomorph: Würde f ren, so wäre speziell für 0.t/ ´ a C tb mit festen a; b 2 C, da f .a C tb/ D a C t b: e.a C bt/ ( b; bD f e.a/ ( b. Dies wäre also für alle a; b 2 C richtig, was also speziell für t D 0: b D f e.a/ D 1, somit b D b offensichtlich unmöglich ist: Setzt man b D 1, dann folgte f für alle b 2 C, also &i D i , Widerspruch!
352
Kapitel 7 Die komplexen Zahlen
L. Lemma. Ist f W B ! C holomorph, so ist f stetig. Beweis. Das Argument ist ungefähr das gleiche wie bei G(ii). Um die Stetigkeit von f in a 2 B zu zeigen, wähle man einen Ball B.a; r/ * B. Ist z 2 B.a; r/ gegeben, so verbinde man a mit z geradlinig durch 0 W Œ0; 1/ ! B.a; r/ mit 0.t/ ´ a C t.z & a/. e.0.t//0 0 .t / folgt durch Dann gilt 0.0/ D a, 0.1/ D z, und aus .f ı 0/0 .t / D f Integration Z 1 e.0.t// ( .z & a/dt; f .z/ & f .a/ D f 0
also
e.%/j: jf .z/ & f .a/j . jz & aj ( max j f /2B.a;r/
Aus dieser Vorausabschätzung liest man die Stetigkeit von f in a ab.
"
e eindeutig bestimmt. Man erkennt das, indem man Ist die Definition J erfüllt, so ist f e die komplexe Abein 0 mit nullstellenfreier Ableitung 0 0 wählt. Man nennt dann f 0 e leitung von f und schreibt f µ f . Die definierende Gleichung (10) nimmt also endgültig die Gestalt der Kettenregel an: (11) kurz
.f ı 0/0 .t / D f 0 .0.t // ( 0 0 .t / für alle t 2 Œ˛; ˇ/; .f ı 0/0 D .f 0 ı 0/ ( 0 0 :
M. Beispiele. (i) Die Identität f W C ! C, f .z/ ´ z, ist holomorph mit der Ableitung f 0 .z/ D 1. Denn f ı 0 D 0 und 0 0 D 1 ( 0 0 . (ii) Eine konstante Funktion, definiert auf einer offenen Menge B , C, ist holomorph mit der Ableitung 0. (iii) Für die Exponentialfunktion gilt nach K(i) wie im Reellen: exp0 D exp. (iv) Ist f W B ! C holomorph mit der Ableitung f 0 W B ! C und C , B offene Teilmenge, so ist auch f jC W C ! C holomorph mit der Ableitung f 0 jC W C ! C. Man braucht ja speziell nur die Abbildungen 0 mit Bild in C zu betrachten. N. Bemerkung (zur Koinzidenz). Sei f W B ! C wie oben holomorph und B \R ¤ ¿. Dann ist B \ R offen in R. Ist nämlich a 2 B \ R gegeben, so wird R von jedem Ball B.a; r/ , B im Intervall /a & r; a C rŒ geschnitten. Die Restriktion f jB \ R bildet dann B \ R in C hinein ab, und es gilt .f jB \ R/0 .a/ D f 0 .a/, wobei links die Ableitung im Sinne von B(ii) steht und rechts die Auswertung der komplexen Ableitung. Dies folgt unmittelbar aus (11), indem man dort als 0 die identische Abbildung von /a & r; a C rŒ wählt. Dann wird nämlich f j /a & r; a C rŒ D f ı 0 und 0 0 D 1.
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
353
Durch reine Rechnung folgt nun die Gültigkeit vertrauter Regeln: O. Satz (Rechenregeln für die komplexe Ableitung). Sind die Funktionen f; g W B ! C und h W C ! C holomorph mit f .B/ , C , so sind auch f C g; f ( g; h ı f W B ! C holomorph, und es gilt für alle z 2 B .f C g/0 .z/ D f 0 .z/ C g 0 .z/ .f ( g/0 .z/ D f 0 .z/g.z/ C f .z/g 0 .z/ .h ı f /0 .z/ D h 0 .f .z// ( f 0 .z/: Auch die in B0 ´ B n g &1 .0/ definierte Funktion f =g W B0 ! C ist holomorph mit .
f g
/0
.z/ D
f 0 .z/g.z/ & f .z/g 0 .z/ : g.z/2
Beweis. In allen Fällen ergibt sich der Beweis aus den entsprechenden Regeln für reelle Argumente, zusammen mit der Definitionsgleichung (11). Wegen der Stetigkeit von g ist B0 offen. Als Muster seien die Produkt- und Kettenregel überprüft: Zur Produktregel: Es gilt ..f ( g/ ı 0/0 .t / D ..f ı 0/ ( .g ı 0//0 .t / D .f ı 0/0 .t /.g ı 0/.t/ C .f ı 0/.t/.g ı 0/0 .t / D f 0 .0.t //0 0 .t/.g ı 0/.t / C .f ı 0/.t/g 0 .0.t //0 0 .t / D .f 0 g C g 0 f /.0.t //0 0 .t /: Zur Kettenregel: Es gilt ..h ı f / ı 0/0 .t / D .h ı .f ı 0//0 .t/ D h0 ..f ı 0/.t //.f ı 0/0 .t / D h0 .f .0.t ///f 0 .0.t //0 0 .t /: Daraus folgen nach Definition J die Behauptungen.
"
Aus der Produktregel ergibt sich z.B. mittels vollständiger Induktion, dass die komplexe Potenzfunktion z 7! z n (mit festem n 2 N) die komplexe Ableitung z 7! nz n&1 besitzt. Mit diesen Feststellungen ist die tiefere Bedeutung der holomorphen Funktionen bei weitem noch nicht ausgeschöpft. Wir werden in den folgenden Kapiteln noch manche der interessanten Eigenschaften dieser Funktionen ans Tageslicht bringen. Der endgültige Ausbau der Holomorphietheorie erfolgt in dem weiterführenden Gebiet der Funktionentheorie.
354
Kapitel 7 Die komplexen Zahlen
$ Einpunktkompaktifizierung von C Mit R2 ist auch C vollständig, aber nicht kompakt. Jedoch kann die erweiterte komplexe Ebene b C D C [ f1g zu einem kompakten Raum gemacht werden (Einpunktkompaktifizierung von C). Die Konstruktion verläuft völlig analog zur Einpunktkompaktifizierung von R, die am Schluss von Abschnitt 6.4 beschrieben wurde: An die Stelle der Einheitskreislinie tritt jetzt die Euklidische Einheitssphäre ˇ , ˚ S2 ´ .X; Y; Z/ 2 R3 ˇ j.X; Y; Z/j D 1 ; wobei die senkrechten Striche die Euklidische Norm bezeichnen: p j.X; Y; Z/j ´ X 2 C Y 2 C Z 2 : Die zugehörige Distanz in R3 ist für P D .X; Y; Z/ und Q D .U; V; W / gegeben durch p d.P; Q/ ´ jP & Qj D .X & U /2 C .Y & V /2 C .Z & W /2 : Diese definiert wirklich eine Metrik auf R3 , die Euklidische Standard-Metrik, die aber zur Maximumsmetrik äquivalent ist. Als beschränkte und abgeschlossene Teilmenge von R3 ist S2 kompakt. An die Stelle der Abbildung (3)[6.4] tritt nun (12) 2
F W C &! S n f.0; 0; 1/g
mit
.
F .z/ ´
/ 2x 2y jzj2 & 1 ; ; ; jzj2 C 1 jzj2 C 1 jzj2 C 1
wobei z D x C iy mit x; y 2 R gesetzt ist. Die Analogie zu (3)[6.4] ist bis auf eine leichte Permutation der Koordinaten und einen Vorzeichenwechsel evident. Geometrisch erhält man F .z/ aus z D x C iy, indem man den Punkt .x; y; 0/ der .x; y/Ebene des R3 mit dem Nordpol N ´ .0; 0; 1/ 2 S2 geradlinig verbindet. F .z/ ist dann der Schnittpunkt der Verbindungsgeraden mit S2 (so genannte stereographische Projektion aus dem Nordpol). Man bestätigt, dass die Bildpunkte von F tatsächlich auf S2 liegen, ja dass F sogar einen Homöomorphismus von C auf die punktierte Sphäre S2 n fN g vermittelt. Die Stetigkeit der Umkehrabbildung F &1 W S2 n fN g ! C ergibt sich dabei aus deren expliziten Darstellung als Restriktion von .X; Y; Z/ 7&!
X C iY 1&Z
auf S2 n fN g. Nun definiert man in weiterer Analogie zum reellen Fall eine so genannte chordale Metrik dc auf C durch dc .z; w/ ´ d.F .z/; F .w//;
355
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
d.h. dc ist die von F auf C induzierte Metrik. Hierbei ist dc .z; w/ nichts anderes als die Euklidische Distanz der beiden Punkte F .z/; F .w/, d.h. die Länge der Sehne zwischen diesen beiden Sphärenpunkten. Explizit ergibt sich 2jz & wj : dc .z; w/ ´ p p 1 C jzj2 1 C jwj2 Nach P[6.2] ist dc zur Euklidischen Standard-Metrik auf C äquivalent. Der entscheidende Schritt verläuft nun so: Der bisher ausgelassene Punkt N D .0; 0; 1/ auf S2 wird jetzt mitbetrachtet, und als sein Urbild unter F wird das uneigentliche Element 1 zu C hinzugefügt. Man setzt somit, F und dc erweiternd: F .1/ ´ N (13)
dc .z; 1/ ´ d.F .z/; N / D p
2 1 C jzj2
;
dc .1; 1/ ´ d.N; N / D 0;
wobei das vorvorletzte Gleichheitszeichen durch explizite Rechnung zustande kommt. C D C [ f1g (mit Metrik Dann vermittelt F insgesamt eine Isometrie zwischen b dc ) und S2 (mit Metrik d ). Erst recht ist F ein Homöomorphismus von b C auf S2 . 2 2 Da S kompakt ist und S n fN g als dichte Teilmenge enthält, trifft das Gleiche für die Urbilder zu: b C ist kompakt und C liegt dicht in b C . Man nennt S2 als Bild der erb weiterten komplexen Ebene C unter F die Riemannsche Zahlenkugel. Jeder Punkt der Riemannschen Zahlenkugel S2 repräsentiert eine komplexe Zahl, jedoch mit einer Ausnahme: der Punkt N D .0; 0; 1/ repräsentiert 1. In einem anschaulich vergröberten Bild kann man sagen: Die Riemannsche Zahlenkugel ist gepflastert mit komplexen Zahlen bzw. genau an einer Stelle, N , mit 1. P. Bemerkung (Bälle mit Mittelpunkt 1). Die chordale Metrik dc auf b C ist durch die Zahl 2 nach oben beschränkt. Ein offener Ball Bc .1; R/ bzgl. der chordalen Metrik mit Radius R < 2 enthält außer dem Mittelpunkt 1 die komplexen Zahlen z mit 2 < R: p jzj2 C 1 Vgl. (13). Dies rechnet sich um zu jzj >
r
4 & 1: R2
Diese Bälle mit Mittelpunkt 1 sind also die Komplemente der abgeschlossenen Euklidischen Bälle mit Zentrum 0. (Für R D 2 ist Bc .1; 2/ D b C n f0g, für R > 2 ist Bc .1; R/ D b C .) Hieraus folgt durch Vergleich mit Definition D, dass die dort definierten uneigentlichen Grenzübergänge dieselben sind wie die bzgl. der chordalen Metrik in b C.
356
Kapitel 7 Die komplexen Zahlen
Die Entsprechung der erweiterten komplexen Ebene mit der Riemannschen Zahlenkugel geht noch deutlich über das Topologische hinaus. Z.B. ist die stereographische Projektion F auf den eigentlichen Punkten „winkeltreu“. Dies und weitere Einzelheiten (auch der obigen Argumente) müssen wir allerdings auf später verschieben, bis die erforderlichen Hilfsmittel aus der mehrdimensionalen Analysis und Geometrie zur Verfügung stehen. Aufgaben und Anmerkungen 1. Die Dreiecksungleichung C für das Integral einer stetigen Funktion f W Œ˛; ˇ/ ! C geht genau dann in eine Gleichung über: ˇZ ˇ Z ˇ ˇ ˇ ˇ ˇ ˇ f .t/ dt ˇ D jf .t/j dt; ˇ ˇ ˛ ˇ ˛ wenn f von der Form ist f D c ( p mit einer Konstanten c 2 C und einer nichtnegativen stetigen Funktion p W Œ˛; ˇ/ ! RC 0. Lösungshinweis: Man benutze die Argumente im Beweis von C sowie die reelle Version K[5.2]. 2. Man zeige: lim e z existiert nicht. z!1
3. Für Funktionen des Typs f W A ! C mit A , R bzw. f W B ! R mit B , C können uneigentliche Grenzübergänge betrachtet werden, bei denen R zu R und C zu b C erweitert wird („gemischter Fall“). Man formuliere entsprechende Definitionen und zeige z.B. a) b) c)
lim e at D 1 und lim e at D 0 falls a 2 C mit Re a > 0;
t !1
lim e
t !1
t !&1
at
existiert nicht falls a 2 C mit Re a D 0; Im a ¤ 0 (jedoch falls a D 0).
lim e jzj D 1;
z!1
lim e &jzj D 0.
z!1
4. Die Funktion f W C ! C sei holomorph. Man beweise: a) Ist f 0 D 0, so ist f konstant. b) Hat f nur reelle Werte, so ist f 0 D 0, also f konstant. c) Ist neben f W C ! C auch g W C ! C holomorph und gilt: f .x/ D g.x/ für alle x 2 R, so folgt: f .z/ D g.z/ für alle z 2 C (Permanenzprinzip für holomorphe Funktionen auf C). 5. Die Funktionen Kosinus und Sinus können nach C fortgesetzt werden, indem man die Formeln aus F(iii)[7.2] übernimmt, d.h. für z 2 C setzt cos z ´
e iz C e &iz ; 2
sin z ´
e iz & e &iz : 2i
357
Abschnitt 7.3 Konvergenz bei komplexen Zahlen
Man zeige, dass die so definierten Funktionen cos; sin W C ! C holomorph sind und ihre komplexen Ableitungen die Gleichungen cos0 D & sin;
sin0 D cos
erfüllen. Welche der Grundeigenschaften des reellen Kosinus und Sinus bleiben erhalten? Gilt z.B. der trigonometrische Pythagoras cos2 z C sin2 z D 1 für alle z 2 C? 6. Analog behandle man die komplexen Fortsetzungen der hyperbolischen Funktionen, die entsprechend G[7.2] für z 2 C durch cosh z ´
e z C e &z ; 2
sinh z ´
e z & e &z 2
definiert sind. Eigentlich stellen diese im Komplexen nichts wesentlich Neues dar; denn es gilt ja cosh.iz/ D cos z; sinh.iz/ D i ( sin z: 7. Die Funktion f W R ! C sei stetig und erfülle für alle t; s 2 R die Funktionalgleichung f .t C s/ D f .t/ C f .s/: Man beweise: Es gibt eine Konstante c 2 C mit f .t/ D c ( t. Lösungshinweis: Man zeige der Reihe nach f .nt/ D nf .t / für n 2 N, f .rt/ D rf .t/ für r 2 Q und t 2 R. Daraus folgere man mit Hilfe der Stetigkeit: f .st/ D sf .t / für t; s 2 R. 8. Die Funktion f W C ! C sei holomorph, nicht identisch null und erfülle für alle z; w 2 C die Funktionalgleichung f .z C w/ D f .z/ ( f .w/: Man beweise: Es gibt eine Konstante c 2 C mit: f .z/ D e cz für alle z 2 C. Lösungshinweis: Man definiere bei (zunächst) festem z 2 C die Funktion g W R ! C durch g.t/ ´ f .tz/ und wende auf sie Satz I an. 9. Gegeben seien komplexe Zahlen z D x Ciy und w D uCiv mit x; y; u; v 2 R. a) Man definiert das Skalarprodukt hz; wi und die Determinante Œz; w/ durch hz; wi ´ xu C yv;
Œz; w/ ´ xv & yu:
(Das sind die gleichen Definitionen wie in der linearen Algebra.) Zeige: hz; wi D Re .zw/;
Œz; w/ D Im .zw/:
358
Kapitel 7 Die komplexen Zahlen
b) Sind z ¤ 0 und w ¤ 0, so ist der orientierte Winkel ! bzw. der (unorientierte) Winkel ' zwischen z und w definiert durch cos ! D
hz; wi ; jzj ( jwj
bzw. cos ' D
sin ! D
Œz; w/ ; jzj ( jwj
hz; wi ; jzj ( jwj
! 2 /&&; &/
' 2 Œ0; &/:
Man schreibt ! µ ^0 .z; w/ bzw. ' µ ^.z; w/. Man zeige: ^0 .z; w/ D Arg.zw/ D Arg
3w z
;
^.z; w/ D j^0 .z; w/j:
10. $ Für die stereographische Projektion F (12) gilt F .z/ D
jzj2 & 1 2 .x; y; 0/ C 2 N: C1 jzj C 1
jzj2
Da die Summe der Koeffizienten rechts gleich 1 ist, deduziere man, dass die zwei Punkte .x; y; 0/ und F .z/ stets auf einer Geraden durch N liegen. Zusammen mit den Eigenschaften: F .z/ 2 S2 und F .z/ ¤ N charakterisiert dies die Abbildung F .
7.4
Komplexe Polynome
Neben der Exponentialfunktion bilden die komplexen Polynome eine weitere Klasse von konkreten Abbildungen des Typs C ! C. Die Grundlagen gestalten sich genau wie bei den reellen Polynomen in Abschnitt 3.1, sodass wir sie nur zu referieren brauchen. Ein Polynom P über C ist eine Funktion P W C ! C mit einer Funktionsvorschrift der Gestalt: (1)
P .z/ D cn z n C cn&1 z n&1 C ( ( ( C c1 z C c0 :
Dabei sind n 2 N0 und cn ; : : : ; c0 2 C gegebene Konstanten. Ist n > 0 und cn ¤ 0, so sieht man, dass P auf C nicht beschränkt ist; denn es gilt ähnlich wie in (2)[3.1] (2)
jP .z/j Q %1& n jcn j ( jzj jzj
für jzj % 1;
wobei Q ´
jcn&1 j C ( ( ( C jc0 j : jcn j
Abschnitt 7.4 Komplexe Polynome
359
Hieraus folgt für die möglichen Nullstellen % 2 C von P wie bei J[3.1] die Abschätzung % + jcn&1 j C ( ( ( C jc0 j : j%j . max 1; jcn j Insbesondere kann nicht jede komplexe Zahl Nullstelle von P sein. Daraus ergeben sich dann die Identitätssätze wie in K[3.1], wobei in der Formulierung jetzt einfach z 2 C anstelle von x 2 R zu lesen ist. Die Identitätssätze sind die Grundlage für die Methode des Koeffizientenvergleichs, die hier analog wie bei reellen Polynomen besteht. Insbesondere sind die Koeffizienten cj und das n in (1) allein durch die Zuordnung P bestimmt, falls cn ¤ 0. Man nennt dann n den Grad des Polynoms P und schreibt deg.P / ´ n, wobei die Gradregeln analog zu L[3.1] erhalten bleiben. Auch die Abspaltung einer Nullstelle wie bei (9)[3.1] und die Faktorisierung anhand der Gesamtheit der Nullstellen gestaltet sich wie dort. Speziell besitzt ein Polynom vom Grad n % 1 höchstens n Nullstellen in C. Tatsächlich ist die Existenz von Nullstellen im Komplexen dramatisch einfacher als im Reellen, weil sich der Kofaktor in e in (11)[3.1] stets als eine komplexe Konstante erweist. Im der Art des dortigen Q Komplexen zerfällt also ein Polynom immer. Diese Tatsache ist allerdings nicht durch Übertragung der einfachen algebraischen Argumente, die bis hierher möglich waren, zu erhalten. Er ist eine Konsequenz des Fundamentalsatzes der Algebra, der besagt, dass jedes komplexe Polynom vom Grad % 1 eine Nullstelle in C besitzt. Dieser Satz war jahrhundertelang offen, bis er 1799 vom 22-jährigen Gauß in seiner Doktorarbeit bewiesen wurde. Heutzutage kann man ihn sehr elegant mittels holomorpher Funktionen begründen. Einen elementareren Beweis mit den bisher entwickelten Hilfsmitteln werden wir gleich im Anschluss vorstellen. Die eben genannte Konsequenz des Fundamentalsatzes der Algebra sei jedoch gleich hier festgehalten: A. Satz. Sei P ein Polynom über C vom Grad n % 1 mit den paarweise verschiedenen komplexen Nullstellen a1 ; : : : ; ak und dem Leitkoeffizienten c. Dann besteht eine Faktorisierung der Gestalt P .z/ D c ( .z & a1 /&1 ( ( ( .z & ak /&k mit natürlichen Zahlen (1 ; : : : ; (k der Summe (1 C ( ( ( C (k D n. Hierin ist (j jeweils die Vielfachheit von aj als Nullstelle von P (j D 1; : : : ; k). Man sagt dafür auch, dass jedes Polynom über C vom Grad n % 1 vollständig in Potenzen von Linearfaktoren zerfällt. Die Kenntnis einer solchen Faktorisierung ist äquivalent mit der Kenntnis aller komplexen Nullstellen von P einschließlich der Vielfachheiten (wobei c dann der Leitkoeffizient von P ist). Beweis von A (unter Verwendung des Fundamentalsatzes der Algebra). Man führt eine vollständige Induktion nach dem Grad n durch.
360
Kapitel 7 Die komplexen Zahlen
Induktionsanfang: Für n D 1 ist die Behauptung klar, denn P .z/ D cz Cb kann in der Form P .z/ D c.z & a/ mit a WD &b=c geschrieben werden, und a ist offensichtlich die einzige Nullstelle (und hat die Vielfachheit 1). Induktionsschluss: Ist das Polynom P vom Grad nC1 % 2 gegeben, so besitzt es nach dem Fundamentalsatz der Algebra eine Nullstelle a 2 C mit einer Vielfachheit ( 2 N. Dann kann nach dem gleichen Argument wie im Reellen die zugehörige Potenz des Linearfaktors abgespalten werden: P .z/ D .z & a/& P $ .z/; wobei der Kofaktor P $ ein Polynom vom Grad m ´ .n C 1/ & ( ist mit P .a/ ¤ 0. Nach Induktionsvoraussetzung besitzt dieser eine Faktorisierung der Gestalt P $ .z/ D c.z & a1 /&1 ( ( ( .z & a` /&` mit paarweise verschiedenen a1 ; : : : ; a` 2 C und (1 ; : : : ; (` 2 N, wobei (1 C ( ( ( C (` D m gilt. Setzt man k WD ` C 1, ak ´ a, (k D (, so folgt zusammengenommen P .z/ D c ( .z & a1 /&1 ( ( ( .z & ak /&k
mit (1 C ( ( ( C (k D n C 1:
Durch Vergleich des höchsten Koeffizienten folgt, dass c der Leitkoeffizient von P ist. Weiter verschwindet der jeweilige Kofaktor von .z & aj /&j an der Stelle aj nicht, sodass aj wirklich Nullstelle von P der Vielfachheit (j ist (j D 1; : : : ; k). " Aus reeller Sicht ist es von Bedeutung, dass man ein reelles Polynom (5)[3.1]: (3) P .x/ D an x n C an&1 x n&1 C ( ( ( C a1 x C a0 ;
aj 2 R
für j D 0; : : : ; n
auch als komplexes Polynom mit reellen Koeffizienten auffassen kann: (4) P .z/ D an z n C an&1 z n&1 C ( ( ( C a1 z C a0 ;
aj 2 R
für j D 0; : : : ; n:
Bei solchen Polynomen treten die Nullstellen immer in Paaren konjugiert komplexer Zahlen auf: B. Lemma. Ist b 2 C Nullstelle eine Polynoms P mit reellen Koeffizienten der Vielfachheit (, so ist auch b Nullstelle des Polynoms P mit der gleichen Vielfachheit (. Beweis. Mittels der Darstellung (4) berechnet man für alle z 2 C: P .z/ D
n X kD0
ak z k D
n X
ak z k D
kD0
n X
ak z k D P .z/:
kD0
Nach Voraussetzung gilt für alle z 2 C mit einem Polynom Q$ P .z/ D .z & b/& ( Q$ .z/;
Q$ .b/ ¤ 0:
361
Abschnitt 7.4 Komplexe Polynome
Aus beidem zusammen folgt P .z/ D P .z/ D .z & b/& ( Q$ .z/ D .z & b/& ( Q$ .z/: Dabei ist R.z/ ´ Q$ .z/ wiederum ein Polynom, was man durch eine ähnliche Rechnung wie zu Beginn des Beweises sieht. Außerdem gilt: R.b/ D Q$ .b/ ¤ 0. Somit ist b Nullstelle von P der Vielfachheit (. " Für ein solches reelles Polynom P vom Grad n % 1 kann man nun mittels Satz A folgendermaßen weiter argumentieren: Es seien a1 ; : : : ; ar 2 R die paarweise verschiedenen reellen Nullstellen und b1 ; b 1 ; : : : ; bs ; b s 2 C n R die paarweise verschiedenen „echt“ komplexen Nullstellen von P . Dann hat die vollständige Ausfaktorisierung nach A die Gestalt (5) P .z/ D c (.z &a1 /n1 ( ( ( .z &ar /nr (.z &b1 /m1 .z &b 1 /m1 ( ( ( .z &bs /ms .z &b s /ms mit reellem Leitkoeffizienten c und entsprechenden Vielfachheiten der Summe n1 C ( ( ( C nr C 2m1 C ( ( ( C 2ms D n: Je zwei zusammengehörende Linearfaktoren der letzten Sorte lassen sich „reell“ zusammenfassen nach dem Muster .z & b/.z & b/ D .z 2 C 2pz C q/ wobei
2p ´ &b & b 2 R;
q ´ bb 2 RC :
„Reell“ bedeutet, dass in der Zusammenfassung die Koeffizienten 2p; q reell werden. Dabei gilt 1 1 1 q & p 2 D bb & .b C b/2 D & .b & b/2 D jb & bj2 > 0; 4 4 4 eine Bedingung an die reellen Koeffizienten, die garantiert, dass das quadratische Polynom z 2 C 2pz C q keine reellen Nullstellen besitzt. Wird dies in die Faktorisierung (5) entsprechend für alle konjugiert komplexen Nullstellenpaare eingebracht, so geht diese über in P .z/ D c ( .z & a1 /n1 ( ( ( .z & ar /nr ( .z 2 C 2p1 z C q1 /m1 ( ( ( .z 2 C 2ps z C qs /ms oder für reelle z D x (6) P .x/ D c (.x &a1 /n1 ( ( ( .x &ar /nr (.x 2 C2p1 x Cq1 /m1 ( ( ( .x 2 C2ps x Cqs /ms mit rein reellen Faktoren und (7)
qj & pj2 > 0 für j D 1; : : : ; s:
Die Darstellung (6) ist die reelle Faktorisierung eines reellen Polynoms P .
362
Kapitel 7 Die komplexen Zahlen
C. Beispiel. Man bestimme alle Nullstellen des Polynoms: P .x/ ´ 3x 4 & 7x 3 C 6x 2 C 2x & 4 sowie seine reelle Faktorisierung. Lösung: Zunächst versucht man es mit einer rationalen Nullstellensuche nach dem Lemma von Gauß O[3.1]: Soll der gekürzte Bruch pq mit p ¤ 0 in Z und q 2 N Nullstelle sein, so gibt es dafür höchstens folgende Möglichkeiten: p D ˙1; ˙2; ˙4
(die Teiler von 4)
q D 1; 3
(die positiven Teiler von 3).
Also kommen als rationale Nullstellen höchstens in Betracht: p 1 2 4 D ˙1; ˙ ; ˙2; ˙ ; ˙4; ˙ : q 3 3 3 Durch die Probe findet man, dass davon lediglich & 23 und 1 Nullstellen sind. Somit ( ) ist P .x/ durch x C 32 .x & 1/ teilbar, und das Divisionsverfahren ergibt: 3 2P .x/ D x C .x & 1/.3x 2 & 6x C 6/ D .3x C 2/.x & 1/.x 2 & 2x C 2/: 3 Die restlichen Nullstellen „stecken“ in der letzten Klammer. Tatsächlich hat diese nach der üblichen Formel für quadratische Gleichungen die Nullstellen 1 ˙ i . Somit liefert die letzte Zeile bereits die gewünschte reelle Faktorisierung, und die Nullstellen von P sind genau: & 32 ; 1; 1 C i; 1 & i: D. Bemerkung (Polynome vom Grad 1). Hat das Polynom P den Grad 1, so ist es von der Gestalt (8)
P .z/ D az C b
mit a; b 2 C; a ¤ 0:
Der einfachste Spezialfall ist jaj D 1, b D 0. Dann hat a die Form a D e i˛ mit ˛ 2 R. Man nennt die Abbildung von C in sich mit z 7! D˛ .z/ D e i˛ z die Drehung von C um den Winkel ˛. Setzt man z D x C iy und w D u C iv mit reellen x; y; u; v, so ist die Relation w D D˛ .z/ äquivalent mit u C iv D .cos ˛ C i sin ˛/.x C iy/, was durch Vergleich von Real- und Imaginärteil auf u D cos ˛ ( x & sin ˛ ( y v D sin ˛ ( x C cos ˛ ( y führt. Die somit definierten Drehungen entsprechen also den eigentlichen Drehungen, wie sie in der analytischen Geometrie betrachtet werden.
363
Abschnitt 7.4 Komplexe Polynome
Ein allgemeines Polynom (8) vom Grad 1 kann in der Form P .z/ D %e i˛ z C b
mit % > 0; ˛ 2 R; b 2 C
geschrieben werden. Als Abbildung von C in sich ist dann P eine Drehung D˛ , gefolgt von einer Streckung mit dem Faktor % > 0 (z 7! %z) und anschließender Translation mit b (z 7! z C b). Eine solche Komposition wird als Ähnlichkeit oder Homothetie bezeichnet. Komplexe Wurzeln Durch die Konstruktion der komplexen Zahlen ist viel mehr erreicht worden, als man ursprünglich wollte. Es hat nicht nur die Gleichung z 2 C 1 D 0 eine Lösung bekommen, sondern jede algebraische Gleichung (mit Koeffizienten in C). Das ist die Aussage des Fundamentalsatzes der Algebra. Als Vorstufe hierzu kann man die Existenz komplexer Wurzeln ansehen, der wir uns jetzt zuwenden. Es geht dabei um Gleichungen der Gestalt z n D w0
(9)
mit festem Grad n 2 N und gegebener rechter Seite w0 2 C. E. Satz und Definition. Ist w0 D r0 exp.i'0 / eine Polardarstellung von w0 , so hat die Gleichung (9) genau die Lösungen / . p '0 C 2k& n (10) zk ´ r0 exp i ; k D 0; : : : ; n & 1: n Ist w0 ¤ 0, so sind diese paarweise verschieden (also in der Anzahl n vorhanden). Ist w0 D 0, so sind diese alle gleich 0: die Gleichung z n D 0 hat nur die eine Lösung 0. Die zk in (10) nennt man die (komplexen) n-ten Wurzeln aus w0 . Beweis. Der Fall w0 D 0 ist nach der Nullteilerfreiheit, die in jedem Körper besteht, klar. Sei also jetzt w0 ¤ 0, somit r0 > 0. Die Unbekannte z sei ebenfalls in der Polardarstellung z D r exp.i'/ angesetzt. Dann ist (9) schrittweise äquivalent mit folgenden Zeilen: r n exp.i n'/ D r0 exp.i'0 / r n D r0 ; r n D r0 ; (11)
rD
p n r0 ;
exp.i n'/ D exp.i'0 /
n' & '0 D 2k& für ein k 2 Z 'D
'0 C 2k& für ein k 2 Z: n
364
Kapitel 7 Die komplexen Zahlen
Dabei wird (6)[7.2] verwendet. Zwei solche '-Werte wie in (11), etwa ' für k und e ' Q liefern genau dann die gleiche Lösung z D r exp.i'/ D r exp.i e ' /, wenn gilt: für k, '&e ' D 2g& für ein g 2 Z, also k& 2.k & e k/& '0 C 2k& '0 C 2 e & D D 2g&; n n n d.h. k&e k D g ( n für ein g 2 Z:
(12)
Sei M D f0; 1; : : : ; n&1g die Menge der in (10) genannten k-Werte. Zwei verschiedekj . n & 1), liefern also ne k; e k 2 M erfüllen die Bedingung (12) nicht (da 0 < jk & e verschiedene Lösungen. Dagegen gibt es zu jedem k 2 Z n M ein e k 2 M , das (12) erfüllt ( e k ist der „Rest“ der Division k=n), sodass also k und e k die gleiche Lösung liefern. Daraus folgt die Behauptung. " F. Beispiel. Für w0 D 1 handelt es sich um die Gleichung z n D 1. Hier ist r0 D 1, '0 D 0, also zk aus (10) gegeben durch / . 2k& 2k& 2k& D cos zk D exp i C i ( sin : n n n Diese n komplexen Zahlen nennt man die n-ten Einheitswurzeln. In der Standardveranschaulichung liegen diese Punkte auf dem Einheitskreis S1 mit Winkeln 2k0 gegen n z0 D 1,
Im z2 = i S1
z3
z1
z4 = -1
z0 = 1 Re
z5
z7 z6 = -i
365
Abschnitt 7.4 Komplexe Polynome
d.h. sie bilden die Ecken des gleichseitigen (= regulären) S1 einbeschriebenen n-Ecks, das 1 als Ecke enthält (das Bild zeigt den Fall n D 8). Daher heißt z n D 1 die Kreisteilungsgleichung. Mit ihrer Hilfe hat Gauß als Achtzehnjähriger bewiesen, dass das reguläre Siebzehneck mit Zirkel und Lineal konstruierbar ist, und er hat später alle solchermaßen konstruierbaren regulären n-Ecke bestimmt.
Rationale Funktionen Eine rationale Funktion F über C hat eine Funktionsvorschrift der Form (13)
F .z/ ´
P .z/ ; Q.z/
P; Q Polynome:
Die größtmögliche Definitionsmenge in C ist B ´ C n Q&1 .0/ (natürlich sei Q nicht das Nullpolynom, weil für dieses die Definitionsmenge von F leer wäre). Da Q nur endlich viele Nullstellen hat, ist F überall in C bis auf endlich viele isolierte Stellen definiert. Da die Identität z 7! z holomorph ist, folgt nach den Regeln O[7.3]: G. Lemma. Ein Polynom ist in ganz C holomorph. Eine rationale Funktion ist in ihrer (offenen) Definitionsmenge holomorph. " H. Beispiel. Durch vollständige Induktion erhält man die folgenden Ausdrücke für die komplexen Ableitungen ganzzahliger Potenzen der Identität im Fall p 2 N bzw. q 2 &N: f W C &! C; f .z/ ´ z p H) f 0 .z/ D pz p&1 g W C n f0g &! C;
g.z/ ´ z q H) g 0 .z/ D qz q&1 :
Über die Teilbarkeit von Polynomen und die Darstellungsmöglichkeiten rationaler Funktionen gilt Analoges wie im reellen Fall. Insbesondere besteht die Division mit Rest M[3.1] samt dem Divisionsalgorithmus genauso weiter, nur dass eben die Koeffizienten jetzt komplexe Zahlen sein dürfen. Aufgaben und Anmerkungen
) ( 1. Sei n % 3 eine natürliche Zahl. Zeige: exp i 20 ist unter allen n-ten Einheitsn wurzeln bestimmt als die einzige mit größtmöglichem Realteil < 1 und positivem Imaginärteil. 2. Beweise
p p p / . 2& 5&1 10 C 2 5 D Ci exp i 5 4 4
366
Kapitel 7 Die komplexen Zahlen
und schließe daraus 2& cos D 5
p
5&1 ; 4
2& sin D 5
p p 10 C 2 5 : 4
Lösungshinweis: Man behandle die Gleichung z 5 D 1 durch Abspalten der Nullstelle 1: z 5 & 1 D .z & 1/.z 4 C z 3 C z 2 C z C 1/; Durchdividieren von z 4 C z 3 C z 2 C z C 1 D 0 mit z 2 : / / . . 1 2 1 zC &1D0 C zC z z und Substituieren von w ´ z C z1 ; schließlich Anwenden von Aufgabe 1. 3. Analog zeige man
p . / 2& 1 3 exp i D& Ci : 3 2 2
4. Man untersuche die angegebenen Folgen in C auf Konvergenz und bestimme im Falle der Divergenz alle Häufungswerte: 0 p !n / . 1Ci 3 1Ci n a) cn D , b) cn D . 2 2 5. Man übertrage die Aufgaben 9 und 10 aus Abschnitt 3.1 entsprechend ins Komplexe. Man wird feststellen, dass alles sinngemäß erhalten bleibt! 6. Sei P ein komplexes Polynom mit der Eigenschaft: x 2 R H) P .x/ 2 R. Man beweise, dass alle Koeffizienten von P reell sind. Lösungshinweis: Man betrachte neben P das Polynom PR , das aus P entsteht, indem man alle Koeffizienten durch ihre Realteile ersetzt, und wende auf P und PR das Permanenzprinzip aus Aufgabe 4[7.3] an. 7. Man zeige (unter Verwendung des Fundamentalsatz der Algebra), dass zwei Polynome P und Q über C dann und nur dann keine gemeinsame Nullstelle haben, wenn sie teilerfremd sind. 8. Man beweise folgende komplexe Variante von Aufgabe 5[3.5]: Gegeben sei eine rationale Funktion F D P =Q wie in (13). Für ein b 2 C sei Q.b/ D 0. Die Stelle b gehört also nicht zur Definitionsmenge von F , liegt aber in deren Abschluss. Analog zu (10)[3.1] besitzen P und Q Faktorisierungen der Gestalt P .z/ D .z & b/k P $ .z/;
Q.z/ D .z & b/` Q$ .z/;
Abschnitt 7.5
$ Der Fundamentalsatz der Algebra nach Argand
367
wobei k 2 N0 und ` 2 N die entsprechenden Vielfachheiten sind. Bei P ist der Fall k D 0 (d.h. P .b/ ¤ 0) zugelassen. Stets ist P $ .b/ ¤ 0 und Q$ .b/ ¤ 0. Dann gilt: 8 ˆ 0 für k > ` ˆ ˆ < $ P .b/ lim F .z/ D für k D ` ˆ z!b Q$ .b/ ˆ ˆ :1 für k < `. In den Fällen k % ` kann also F in b stetig fortgesetzt werden. 9. Man beweise folgende komplexe Variante von Satz I[3.5]: Gegeben sei eine rationale Funktion F D P =Q wie in (13), wobei P .z/ ´ an z n C ( ( ( C a0 und Q.z/ ´ bm z m C ( ( ( C b0 mit an ¤ 0, bm ¤ 0 und n; m 2 N0 . Dann gilt: 8 ˆ 0 für m > n ˆ ˆ < an lim F .z/ D für m D n z!1 ˆ bn ˆ ˆ :1 für m < n. 10. Sei P ein Polynom vom Grad % 1 und T ein größter gemeinsamer Teiler von P und P 0 . Man zeige: a) Ist a eine Nullstelle von P der Vielfachheit ( % 1, so ist a eine Nullstelle von P 0 der Vielfachheit ( & 1 und auch eine Nullstelle von T der Vielfachheit ( & 1. b) Man bilde nun den Kofaktor zu T , also das Polynom T $ mit P D T T $ (z.B. mit dem Divisionsalgorithmus, angewandt auf P =T ) und zeige: Das Polynom T $
hat die gleichen Nullstellen wie P , aber alle von der Vielfachheit 1. Da T ohne Kenntnis der Nullstellen von P; P 0 mit dem Euklidischen Algorithmus berechenbar ist, so auch T $ . Hat man zur Ermittlung von T den Euklidischen Algorithmus verwendet, so kann man das Polynom T $ aus den dabei auftretenden Polynomen berechnen; vgl. Aufgabe 10[3.1].
7.5
$ Der Fundamentalsatz der Algebra nach Argand
Dieser Satz sagt aus, dass jedes (nichtkonstante) Polynom mit komplexen Koeffizienten wenigstens eine komplexe Nullstelle besitzt. Der erste Beweis dieses Satzes wurde von Gauß im Alter von 22 Jahren erbracht. Wir stellen hier eine andere, besonders elementare Beweisanordnung vor, die auf Argand zurückgeht. Ein rein algebraischer Beweis wird nicht möglich sein, da es ja Körper gibt, deren Polynome keine Nullstellen in dem Körper haben (z.B. R und Q). Tatsächlich macht jeder Beweis dieses
368
Kapitel 7 Die komplexen Zahlen
Satzes, so auch der folgende, zumindest von der Stetigkeit Gebrauch. Ein Polynom P W C ! C ist natürlich stetig; das ergibt sich z.B. daraus, dass P holomorph ist (G[7.4] und L[7.3]) oder durch Berechnung seines Real- und Imaginärteils und Anwendung von B(i)[7.3]. A. Satz (Fundamentalsatz der Algebra). Für jedes Polynom P W C ! C vom Grad n % 1 mit komplexen Koeffizienten: P .z/ D c0 C c1 z C ( ( ( C cn z n ;
cj 2 C für j D 0; : : : ; n;
existiert ein z0 2 C mit P .z0 / D 0. Beweis. Die Idee besteht darin, eine Minimalstelle der reellwertigen Betragsfunktion z 7! jP .z/j in C zu suchen und nachzuweisen, dass eine solche Minimalstelle sogar Nullstelle von P ist. Als Komposition von P mit dem Betrag ist die Betragsfunktion wiederum stetig. Weiter ist jP .z/j in C nicht beschränkt. Dies folgt leicht aus der Abschätzung (2)[7.4]. Aus diesen beiden Tatsachen schließen wir auf ein Minimum von jP .z/j in C: Sei m zunächst das Infimum von jP .z/j: ˇ ˚ , m ´ inf jP .z/j ˇ z 2 C : Dann existiert ˚ ˇ ein r >,0 mit: jP .z/j % mC1 für alle jzj % r. Nun ist die Kreisscheibe B.r/ ´ z ˇ jzj . r beschränkt und abgeschlossen, also kompakt, sodass auf ihr nach dem allgemeinen Extremalprinzip D[6.5] eine Minimalstelle z0 2 B.r/ existiert: jP .z0 /j . jP .z/j für alle z 2 B.r/. Da außerhalb B.r/ der Wert jP .z/j % m C 1 ist, gilt sogar m D jP .z0 /j . jP .z/j für alle z 2 C: Nun beweisen wir die Hauptsache: P .z0 / D 0. Ohne Einschränkung dürfen wir hierfür z0 D 0 annehmen (sonst kann man anstelle von P das Polynom Q.z/ ´ P .z C z0 / betrachten). Angenommen, es wäre P .0/ D c0 ¤ 0: Dann sei ck der Koeffizient mit niedrigstem Index k % 1, der ¤ 0 ist, sodass also (1)
P .z/ D c0 C ck z k C z kC1 H.z/
mit einem nicht näher interessierenden neuen Polynom H gilt. Wir betrachten die Hilfsgleichung aus dem „Anfangsstück“ von (1): c0 C ck z k D 0. Diese hat genau k Lösungen, nämlich die komplexen k-ten Wurzeln aus &c0 =ck . Wir greifen irgendeine dieser Wurzeln, etwa z1 , heraus, so dass also z1k D &
c0 ck
Abschnitt 7.5
$ Der Fundamentalsatz der Algebra nach Argand
369
gilt, und verfolgen das Verhalten von P längs der Geraden ftz1 j t 2 Rg: 0 ! kC1 z P .tz1 / D c0 C ck t k z1k C t kC1 z1kC1 H.tz1 / D c0 1 & t k C t kC1 1 H.tz1 / : c0 Die angegebene Gestalt dieser Funktion legt es nahe, dass für kleine t auch Werte vom Betrag < jc0 j angenommen werden. Tatsächlich kann man P .tz1 / für t 2 Œ0; 1/ folgendermaßen abschätzen, wenn man beachtet, dass wegen der Stetigkeit der reellen Funktion t 7! jH.tz1 /j auf Œ0; 1/ eine Konstante 0 > 0 existiert, sodass ˇ ˇ ˇ z kC1 ˇ ˇ 1 ˇ H.tz1 /ˇ . 0 für t 2 Œ0; 1/: ˇ ˇ ˇ c0 Damit folgt für t 2 Œ0; 1/: 3 3 jP .tz1 /j . jc0 j ( 1 & t k C 0 t kC1 D jc0 j 1 & t k .1 & 0 t/ : Die letzte große Klammer wird < 1 für 0 < t < 1=0, also gilt insgesamt: % + 1 ; jP .tz1 /j < jc0 j für 0 < t < min 1; 0 im Widersprach dazu, dass jP .0/j D jc0 j das Minimum aller jP .z/j ist.
"
Aufgaben und Anmerkungen 1. Zeige: Ein Polynom P vom Grad n % 1 ist als Abbildung P W C ! C stets surjektiv und genau dann injektiv, wenn n D 1 ist.
8
Weiterführung der Analysis
Dieses Kapitel dient der Entwicklung feinerer analytischer Werkzeuge wie der TaylorFormel und der Potenzreihen. Dazu kommen Anwendungen auf die Extrema von reellen Funktionen und die Konvexität. Gemeinsame Basis für viele dieser Aspekte sind die höheren Ableitungen, in denen sich subtilere Eigenschaften widerspiegeln als eben nur in den Ableitungen selber. Zunehmend einbezogen in die analytischen Entwicklungen werden nun auch die komplexen Zahlen. Diese sind von großer Bedeutung in der gesamten Mathematik, insbesondere auch in der Analysis. Darüber hinaus gibt es interessante Wechselbeziehungen zwischen dem reellen und komplexen Bereich, wie man schon am Nullstellenproblem für Polynome sehen kann. Manche der zukünftigen Themen sind eher reell orientiert, andere eher komplex. Natürlich wird man jeweils den adäquaten Gesichtspunkt hervorheben. Wir beginnen dieses Kapitel mit der Behandlung von Reihen, die eine besonders effektive Ausgestaltung der Folgen darstellen.
8.1
Reihen
Reihen sind Folgen, deren Elemente sukzessive Summen sind. Wenn eine Zahl dadurch entsteht, dass zum Vorhandenen immer wieder etwas hinzuaddiert wird, so handelt es sich um die Erzeugung dieser Zahl durch eine Reihe. Ein noch anschaulicheres Bild ist das eines Sees, zu dem schrittweise immer wieder ein neues Quantum Wasser hinzugegeben (oder auch aus ihm weggenommen) wird. Wenn die Beiträge rasch genug klein werden, wird sich ein stabiler Zustand herausbilden, sodass sich die Wassermenge des Sees nur noch beliebig wenig von einem festen Volumen unterscheidet. Dann wird man von Konvergenz sprechen. Es folgt die Präzisierung. Um den reellen und komplexen Fall nicht getrennt behandeln zu müssen, bezeichnen wir den verwendeten Körper mit K. Dieser ist also entweder R oder C. A. Definition. Ist eine Folge .ak /k2N in K gegeben, so ist die Reihe (1)
1 X kD1
ak D a1 C a2 C ( ( (
371
Abschnitt 8.1 Reihen
dasselbe wie die Folge .sn /n2N der Teilsummen (2)
sn ´
n X
ak D a1 C a2 C ( ( ( C an :
kD1
Die ak heißen die Glieder der Reihe. Wenn der Grenzwert der Teilsummen limn!1 sn µ s in K existiert, so heißt die Reihe (1) konvergent, und man schreibt: 1 X
(3)
ak D a1 C a2 C ( ( ( D s:
kD1
In diesem Fall wird s die Summe oder der Grenzwert (kurz auch der Wert) der Reihe genannt. Existiert ein solcher Grenzwert s nicht, so heißt die Reihe (1) divergent. Das Anschreiben von (3) (mit s 2 K) soll beinhalten, dass die Reihe konvergiert und den Grenzwert s hat. Die Indexmenge N kann genauso verallgemeinert werden wie bei Folgen in Abschnitt 2.1. Oft zählt man von 0 an, betrachtet also eine Reihe a0 C a1 C ( ( ( . Im Allgemeinen verwenden wir die Indizierung mit den natürlichen Zahlen. Die Modifikationen für andere Indexmengen sind leicht und offensichtlich. Eine endliche Summe b1 C ( ( ( C bn ordnet sich dem Reihenbegriff unter: Man kann sie als (konvergente) Reihe b1 C ( ( ( C bn C 0 C 0 C ( ( ( auffassen. Die Teilsummen brauchen nicht notwendig nach der Vorschrift (2) gebildet zu werden. Effektiver und anschaulicher ist ihre rekursive Erzeugung durch das Schema (4)
s1 ´ a1 ;
snC1 ´ sn C anC1 ;
n D 1; 2; : : :
Damit ist man in der eingangs beschriebenen Situation: „es wird zu dem Vorhandenen schrittweise immer wieder etwas hinzuaddiert“. B. Beispiele. (i)
Gegeben sei die Reihe
1 X kD1
1 1 1 1 D C C C (((. k ( .k C 1/ 1(2 2(3 3(4
Die Teilsummen sind: sn D
n X kD1
1 : k.k C 1/
In diesem Fall hat man Glück; denn die Teilsummen sind explizit berechenbar: Man schreibt die Reihenglieder als 1 1 1 D & : k ( .k C 1/ k kC1
372
Kapitel 8 Weiterführung der Analysis
Dann wird . sn D
1 1 & 1 2
/
"
. C
1 1 & 2 3 "
/
. C
"
1 1 & 3 4
/
. C ((( C
"
"
1 1 & n nC1
/ D
1 1 & : 1 nC1
"
Die markierten Terme heben sich gegenseitig weg; es handelt sich um eine Teleskopsumme. So verbleibt nur der erste Teil der ersten Klammer und der zweite Teil der letzten Klammer, und an dieser Darstellung von sn kann man unmittelbar den Grenzwert ablesen: sn D 1 &
1 nC1
H)
lim sn D 1:
n!1
Somit ist die Reihe konvergent und 1 X kD1
(ii)
Geometrische Reihe:
1 X
1 D 1: k ( .k C 1/
qk D 1 C q C q2 C ( ( ( .
kD0
Dabei ist die Zahl q 2 K fest gegeben; man nennt sie den Quotienten. Auch hier sind die Teilsummen explizit darstellbar, nämlich mit der geometrischen Summenformel D[1.3]: sn D 1 C q C q 2 C ( ( ( C q n D
1 & q nC1 1&q
für q ¤ 1:
1&0 Nach M(i)[2.1] und K[2.1] folgt für jqj < 1: sn ! , also gilt inklusive Konver1&q genz 1 X kD0
qk D
1 1&q
für jqj < 1:
Die zitierten Begründungen bestehen komplex genau wie im Reellen.
373
Abschnitt 8.1 Reihen
(iii) Harmonische Reihe: 1 X 1 1 1 D 1 C C C ((( : k 2 3
kD1
Hier sind die Teilsummen zwar nicht explizit bestimmbar, jedoch abschätzbar mittels Integralen. Denn es ist 1 % k
kC1 Z
k
dx ; x
da für x 2 Œk; k C 1/ gilt:
k
D 1
k + 1
x
1 1 % . Daraus folgt: k x
1 1 sn D 1 C C ( ( ( C % 2 n nC1 Z
1 x
Z2 1
dx C x
Z3 2
dx C ((( C x
nC1 Z
n
dx x
ˇnC1 ˇ dx D ln.n C 1/: D ln x ˇˇ x 1
Die Teilsummen sind also nach oben nicht beschränkt, da ln.n C 1/ für n ! 1 bestimmt gegen 1 divergiert. Somit ist 1 X 1 k
divergent:
kD1
Die Teilsummen wachsen hier „über alle Grenzen“ jedoch außerordentlich schleppend. Um z.B. sn > 10 zu erreichen, muss man mehr als zwölftausend Glieder aufsummieren! Die Annäherung an einen Grenzwert in K kann nur erfolgen, wenn die Reihenglieder selbst gegen null konvergieren: C. Satz (notwendiges Konvergenzkriterium). P Ist die Reihe 1 kD1 ak konvergent, so folgt limk!1 ak D 0. Beweis. Der Beweis beruht ganz einfach auf der rekursiven Erzeugung der Teilsummen (4) bzw. deren „Umkehrung“ durch anC1 D snC1 & sn ;
n D 1; 2; : : : :
374
Kapitel 8 Weiterführung der Analysis
Hieraus folgt unmittelbar mit den Rechenregeln für konvergente Folgen in K[2.1]: limn!1 anC1 D s & s D 0. " Warnung: Die Bedingung, dass die Glieder eine Nullfolge bilden, ist nicht hinreichend für die Reihenkonvergenz, wie man am obigen Beispiel der harmonischen Reihe sieht. D. Beispiel. Die geometrische Reihe .q k / keine Nullfolge ist.
P1
kD0
q k ist divergent, falls jqj % 1, da dann
E. Bemerkung. Die rekursive Erzeugung der Teilsummen aus den Gliedern s1 D a1 ;
snC1 D sn C anC1 ;
n D 1; 2; : : :
ist äquivalent zur Gewinnung der Glieder aus den Teilsummen: a1 D s1 ;
anC1 D snC1 & sn ;
n D 1; 2; : : : :
Hat man also eine Folge .sn /n2N in K vorgegeben, so gibt es genau eine Reihe mit den sn als Teilsummen, nämlich diejenige mit den gerade berechneten Gliedern ak : Folgen und Reihen und ihre Konvergenz sind in K ineinander umrechenbar. Für Bereiche, die keine additive Struktur besitzen, ist dies anders. Z.B sind Folgen in einem metrischen Raum nach wie vor sinnvoll, Reihen existieren i. Allg. aber gar nicht. Alle Konvergenzeigenschaften aus Kapitel 2 für Folgen können natürlich auf die Teilsummen sn angewandt werden. Dies trifft auch für die komplexen Analoga zu, soweit nicht die Anordnung von R betroffen ist. So ergeben sich die folgenden Sätze F und G unmittelbar aus den früheren Überlegungen: F. Satz (Rechenregeln für Reihen). Für Reihen und Grenzwerte a; b in K gelten die Schlüsse: 1 X
(i)
ak D a;
kD1
bk D b H)
kD1 1 X
(ii)
1 X
ak D a;
1 X
.ak C bk / D a C b
kD1
c 2 K H)
kD1
1 X
cak D ca:
kD1
Für Reihen und Grenzwerte a; b in R gilt der Schluss: (iii)
1 X kD1
ak D a;
1 X kD1
bk D b;
ak . bk für alle k 2 N H) a . b:
375
Abschnitt 8.1 Reihen
Beweis. Übertragung von K[2.1] und P[2.1].
"
In operativer Schreibweise lauten (i) und (ii) 1 X
.an C bn / D
nD1
1 X nD1
an C
1 X
1 X
bn ;
nD1
can D c
nD1
1 X
an ;
nD1
vorausgesetzt die Einzelwerte rechts existieren jeweils. G. Satz (Cauchy-Kriterium). Die Reihe Folgendes zutrifft:
P1
kD1
ak konvergiert genau dann, wenn
jedem "ˇ > 0 existiert ein N D N."/ 2 N, sodass für alle q % p > N gilt: ˇZu ˇ ˇPq ˇ kDp ak ˇ < ": Beweis. Übertragung von H[2.6] und I[2.6].
"
H. Bemerkungen. (i) Unterscheiden sich zwei Reihen nur in einem festen Anfangsstück, so ist ihr Konvergenz- bzw. Divergenzverhalten dasselbe. Wohl aber kann der Wert der Reihen — im Falle der Konvergenz — verschieden sein! Z.B. gilt im Falle der Konvergenz für festes n 2 N 1 n 1 X X X ak D ak C ak ; kD1
kD1
kDnC1
wie man unmittelbar an den entsprechenden Teilsummen erkennt. Der erste Bestandteil rechts ist die Teilsumme sn der Ausgangsreihe, der zweite wird als zugehöriger Fehler oder Reihenrest rn bezeichnet. Der Fehler ist das, was man zur Teilsumme sn hinzuaddieren muss, um den Reihenwert zu erhalten. (Wegen der vorausgesetzten Konvergenz gilt rn ! 0 für n ! 1.) Der Begriff des Reihenrests hat nur dann einen Sinn als Element von K, wenn die Reihe konvergiert. (ii)
Zwischen endlichen Summen und Reihen a1 C a2 C ( ( ( C an ;
a1 C a2 C ( ( (
besteht eine gewisse (jedoch nicht durchgängige) Analogie. Man kann fragen, ob Operationen, die für endliche Summen erlaubt sind, auch für Reihen gelten. Das ist unterschiedlich zu beantworten. Aufgrund des additiven Kommutativgesetzes im Körper K darf man in einer endlichen Summe sinnvoll Klammern setzen. (Tatsächlich ist eine endliche Summe von mehr als zwei Summanden geradezu definiert durch sinnvolle sukzessive Beklammerungen von jeweils nur zwei Körperelementen.) In einer konvergenten Reihe darf man ebenfalls
376
Kapitel 8 Weiterführung der Analysis
beliebig Klammern setzen, ohne das Konvergenzverhalten oder den Reihenwert zu verändern (wobei die Klammern jeweils endlich viele aufeinander folgende Glieder umfassen). Z.B. gilt für die geometrische Reihe mit q D &1=3 / . / . 1 1 1 1 1 1 1 1 1 1 1& C & C & C & C C( ( ( : C& ( ( ( D 1C & C & 3 9 27 81 243 3 9 27 81 243 Die Teilsummen der beklammerten Reihe bilden nämlich eine Teilfolge der Teilsummen der Ausgangsreihe. Klammern wegzulassen ist jedoch i. Allg. nicht erlaubt. Z.B. gilt .1 & 1/ C .1 & 1/ C ( ( ( D 0, aber natürlich ist 1 & 1 C 1 & 1 C & ( ( ( nicht konvergent, weil die Glieder keine Nullfolge bilden. Bei endlichen Summanden darf man als Folge des Kommutativgesetzes die Summanden permutieren. Bezieht sich eine solche Permutation nur auf endlich viele Glieder einer konvergenten Reihe, so passiert ähnlich wie bei (i) gar nichts: Konvergenz und Reihenwert bleiben unverändert. Bezieht sich die Permutation auf unendlich viele Glieder, so kann alles mögliche geschehen, je nachdem, wie die Reihe beschaffen ist. Diese Problematik wird im kleinen Umordnungssatz O[8.8] und im Riemannschen Umordnungssatz S[8.8] behandelt werden. Konvention: Manchmal verwendet man statt der ausführlichen Bezeichnung P P einer Reihe durch das Summenzeichen (1) die Schreibweise k ak oder sogar ak , und zwar auch dann, wenn die Indizes nicht bei 1 starten. Das ist bei bloßen Konvergenzfragen gerechtfertigt, da es dabei nicht auf ein Anfangsstück der Reihe ankommt; vgl. Bemerkung H(i). Als Nächstes seien zwei Fälle diskutiert, die sich nur aufs Reelle beziehen, da von der Anordnung Gebrauch gemacht wird. I. Definition. Eine alternierende Reihe in R hat die Gestalt (5)
a1 & a2 C a3 & C ( ( (
mit ak % 0 für alle k 2 N:
Auch a1 & a2 C a3 & C ( ( ( mit den Vorzeichenbedingungen: ak . 0 kann als alternierende Reihe bezeichnet werden, lässt sich aber leicht auf den obigen Typ zurückführen, nämlich mit F(ii) für c D &1. Wir behandeln nur die obige Variante (5), um Fallunterscheidungen zu vermeiden. J. Satz (Leibniz-Kriterium). Die alternierende Reihe (5) konvergiert, falls .ak /k2N eine monoton fallende Nullfolge ist. Beweis. Die Teilsummen sn geben Anlass zu einer Intervallschachtelung:
377
Abschnitt 8.1 Reihen
s
s4
s2
...
...
s3
s1
Es wird immer weniger subtrahiert, als vorher addiert wurde, bzw. immer weniger addiert, als vorher subtrahiert wurde. Wir zeigen präzise: .Œs2m ; s2m&1 //m2N ist eine Intervallschachtelung: Zunächst erkennt man die folgenden drei Punkte: ' .s2m /m%1 ist monoton wachsend: Aus s2.mC1/ D s2mC2 D s2m C a2mC1 & a2mC2 % s2m : ƒ‚ … „ %0
' .s2m&1 /m%1 ist monoton fallend: Aus s.2mC1/&1 D s2mC1 D s2m&1 &a2m C a2mC1 . s2m&1 : ƒ‚ … „ .0 ' s2m&1 & s2m D a2m &! 0. Sei nun s ´ limm!1 s2m D limm!1 s2m&1 der gemeinsame Grenzwert der Intervallenden (B[2.3]). Dann gilt: s2m . s . s2mC1 . s2m&1 , also (6)
0 . s & s2m . s2mC1 & s2m D a2mC1 0 D s & s . s2m&1 & s . s2m&1 & s2m D a2m :
Es folgt js & sn j ! 0 (für n ! 1).
"
J. Zusatz. Ist s die Reihensumme, so gilt für den Fehler s & sn die Abschätzung: (7)
0 . s & s2m . a2mC1 ;
&a2m . s & s2m&1 . 0
für alle m 2 N:
Ist .an /n%1 streng monoton fallende Nullfolge, so steht in (7) statt „.“ überall „<“. Beweis. (7) ist klar aus (6). Bei strenger Monotonie stehen an den entsprechenden Stellen im Beweis strikte Ungleichungen. " Bei reellen Reihen ohne Vorzeichenwechsel der Glieder ist die Konvergenz im Prinzip sehr einfach. Mit Rücksicht auf F(ii) können wir wieder alle Glieder als % 0 annehmen:
378
Kapitel 8 Weiterführung der Analysis
P K. Satz. Eine Reihe ak in R mit lauter nichtnegativen Gliedern ak % 0 konvergiert genau dann, wenn ihre Teilsummen nach oben beschränkt sind. Beweis. Wegen ak % 0 ist snC1 D sn C anC1 % sn , also sind die Teilsummen sn monoton wachsend. Die Behauptung folgt damit unmittelbar aus N[2.1]. " Auf diesen Satz kann man die Konvergenz einer großen Klasse von Reihen in K zurückführen. Sei also jetzt wieder K einer der beiden Körper R oder C. P P L. Definition. Die Reihe ak in K heißt absolut konvergent, wenn die Reihe jak j in R konvergiert. P M. Satz. Ist die Reihe 1 kD1 ak absolut konvergent, so ist sie erst recht konvergent und es gilt die Dreiecksungleichung: ˇ1 ˇ 1 ˇX ˇ X ˇ ˇ ak ˇ . jak j: ˇ ˇ ˇ kD1
kD1
Beweis. Man beachtet die Dreiecksungleichung für endliche Summen in der Form ˇ ˇ ˇ X ˇX q ˇ ˇ q ˇ. ˇ jan j a (8) n ˇ ˇ ˇkDp ˇ nDp P1 für q % p % 1. Daraus folgt sofort die Konvergenz P1 von kD1 ak nach dem Cauchys n die Teilsummen von Kriterium G. Seien sn die Teilsummen von kD1 ak µ s, e P 1 ja j µ e s. Dann gilt js j . e s laut (8) für p D 1; q D n, also jsj . e s. " n n kD1 k P N. Satz (Majorantenkriterium für Reihen). Sei 1 kD1 bk eine konvergente P Reihe in R mit nichtnegativen Gliedern bk % 0. Gilt für die Glieder einer Reihe 1 kD1 ak in K jak j . bk für alle k 2 N; P1 so ist kD1 ak absolut konvergent und ˇ ˇ1 1 1 ˇX ˇ X X ˇ ˇ bk : jak j . ak ˇ . ˇ ˇ ˇ Unter diesen Voraussetzungen nennt man Beweis. Es gilt und M.
Pn
kD1
jak j .
kD1
kD1
kD1
Pn
kD1
P1
kD1
bk eine Majorante für
P1
kD1
ak .
bk . Hieraus folgt die Behauptung nach K "
379
Abschnitt 8.1 Reihen
O. Beispiele. (i) Die alternierende harmonische Reihe 1 & 21 C 13 & 41 C & ( ( ( ist nach dem Leibniz-Kriterium J konvergent, jedoch nicht absolut konvergent, da die harmonische Reihe selbst divergiert; vgl. B(iii). Offensichtlich heben sich im alternierenden Fall durch die abwechselnden Vorzeichen die absolut zu großen Beiträge der nicht-alternierenden Variante teilweise gegenseitig auf, sodass Konvergenz zustande kommt. Der Wert der alternierenden harmonischen Reihe kann man mit den augenblicklichen Hilfsmitteln noch nicht bestimmt werden. Das wird erst in K[8.5] möglich sein. (ii) Die Reihe 1&
1 X 1 1 1 .&1/kC1 2 C & C((( D 4 9 k kD1
ist absolut konvergent. Denn aus Beispiel B(i) kann man eine konvergente Majorante ableiten: ˇ ˇ ˇ .&1/kC1 ˇ 1 1 ˇ ˇ für k % 2: ˇ ˇD 2 . 2 ˇ k ˇ k k.k & 1/ Die geometrische Reihe als Majorante führt auf folgende Kriterien. Wir formulieren sie in etwas gedrängter Form, um die Parallelität der Argumente zur Konvergenz und Divergenz auch optisch hervorzuheben. P. Satz (Wurzelkriterium). Gegeben sei die Reihe 9 q 2 R W lim k!1 w 2
p k jak j D q < 1
p 9 q 2 R W lim k jak j D q < 1 k!1 w 2 ( p k jak j . q1 < 1 9 q1 2 R; k1 2 N W 8 k % k1 w 2 X ak absolut konvergent:
X
ak in K. Dann gilt:
9 q 2 R [ f1g W lim k!1 w 2
p k
jak j D q > 1
p 9 q 2 R [ f1g W lim k jak j D q > 1 k!1 w 2 ) p 9 unendlich W k jak j % 1 viele k 2 N w 2 X ak divergent:
In beiden Fällen – vor und nach dem senkrechten Strich – handelt es sich um hinreichende Bedingungen für absolute Konvergenz bzw. für Divergenz. Die Bedingungen
380
Kapitel 8 Weiterführung der Analysis
sind „hierarchisch“ geordnet, angedeutet durch die Implikationspfeile. Man kann sich aussuchen, welche der Bedingungen man im Einzelfall nehmen will, um die Entscheidung über die letzte Zeile zu treffen. Wenn der Limes superior in den zweiten Zeilen als ungünstig erscheinen sollte, so bleiben immer noch die zwei anderen hinreichenden Bedingungen, die bei konkreten Reihen oftmals sehr nützlich sind. Beweis von P. Wir konzentrieren uns auf die linke Hälfte: Zum ersten Pfeil: Dieser folgt aus E[2.7]. Zum zweiten Pfeil: Dieser folgt aus C[2.7]; jedes q1 2 /q; 1Œ tut es. Direkt von der ersten zur dritten Zeile: Wenn man den Begriff des Limes superior ganz vermeiden will, so geht dieser Weg ganz einfach mit dem Meidungsprinzip J[2.1]. p k jak j . q1 < 1 folgt jak j . q1k , und daraus ergibt sich, dass Zum dritten Pfeil: Aus P k q1 eine konvergente Majorante ab k1 ist. Ebenso leicht überlegt man die rechte Hälfte. Die letzte Implikation folgt einfach daraus, dass unter der genannten Voraussetzung die Glieder keine Nullfolge bilden. " Q. Satz (Quotientenkriterium). Gegeben sei die Reihe alle k 2 N. Dann gilt: ˇ ˇ ˇ akC1 ˇ ˇDq<1 9 q 2 R [ f1g W lim ˇˇ ak ˇ k!1 w 2 ˇ ˇ ˇ akC1 ˇ ˇDq<1 ˇ 9 q 2 R [ f1g W lim ˇ ak ˇ k!1 w 2 ˇ ˇ ˇ akC1 ˇ ˇ . q1 < 1 8 k % k1 9 q1 2 R; k1 2 N W ˇˇ ak ˇ w 2 X ak absolut konvergent:
X
ak in K mit: ak ¤ 0 für
ˇ ˇ ˇ akC1 ˇ ˇ ˇDq>1 9 q 2 R W lim ˇ ak ˇ k!1 w 2 ˇ ˇ ˇ akC1 ˇ ˇDq>1 9 q 2 R W lim ˇˇ ak ˇ k!1 w 2 ˇ ˇ ˇ akC1 ˇ ˇ % 1 8 k % k1 9 k1 2 N W ˇˇ ak ˇ w 2 X ak divergent:
Beweis. Die Argumente für die ersten Pfeile verlaufen wie oben beim Wurzelkriterium. Der dritte Pfeil rechts ist klar, da ab k1 alle jak j % jak1 j sind. Zum dritten Pfeil links: Die Voraussetzung impliziert, dass für alle k % k1 gilt: jakC1 j . q1 jak j, wobei ohne Einschränkung q1 > 0 angenommen werden kann.
381
Abschnitt 8.1 Reihen
Durch vollständige Induktion ergibt sich hieraus jak j . q1k&n1 jak1 j für diese k. Also hat man als Majorante ab k1 : 1 X
q1k&k1 jak1 j
kDk1
D
1 jak1 j X
q1k1
q1k ;
kDk1
die wegen 0 < q1 < 1 konvergiert.
"
R. Bemerkungen. (i) Etwas störend in der Formulierung des Quotientenkriteriums ist die Voraussetzung, dass alle Glieder ¤ 0 sein sollen. Man kann aber die vorletzte Zeile links in Q nennerfrei formulieren als: „Es gibt ein q1 2 Œ0; 1Œ und ein k1 2 N, sodass für k % k1 gilt: jakC1 j . q1 jak j“. Dann folgt hieraus ebenfalls die absolute Konvergenz der Reihe. Tatsächlich wird im Beweis nur diese nennerfreie Voraussetzung verwendet. (ii) Fasst man jeweils die nebeneinander stehenden Zeilen im Wurzel- und Quotientenkriteriums zusammen, so gelangt man zu äquivalenten aber etwas bündigeren Formulierungen. Z.B. gilt nach der ersten Zeile im Wurzelkriterium P lim
p k
k!1
jak j
X < 1 H) jak j >
absolut konvergent divergent,
vorausgesetzt, der Grenzwert links existiert in R [ f1g. Analog kann man die zweite Zeile in P und die erste Zeile in Q zusammenfassen. (iii) Jenseits aller Kriterien ist die einfachste Bedingung für Divergenz in Satz C enthalten: Bildet die Folge der Glieder keine Nullfolge, so ist die Reihe mit Sicherheit divergent. S. Beispiele. Ist beim Wurzel- oder Quotientenkriterium (in den ersten beiden Zeilen) q D 1, so ist keine Entscheidung möglich. Die harmonische Reihe 1C
1 1 C C ((( 2 3
ist divergent, und es gilt nach K[3.7]:
ˇ ˇ ˇ akC1 ˇ k ˇ ˇ ˇ a ˇ D k C 1 &! 1: k p Hieran sieht man auch, dass weder die Bedingung k jak j < 1 noch die Bedingung jakC1 =ak j < 1 zur Konvergenz hinreichen. p k
1 jak j D p &! 1; k k
Die Reihe 1C
1 1 C 2 C ((( 2 2 3
382
Kapitel 8 Weiterführung der Analysis
ist konvergent, und es gilt ebenfalls ˇ . ˇ /2 ˇ akC1 ˇ k ˇD ˇ &! 1: ˇ a ˇ kC1 k
. / p 1 2 1 k D jak j D p &! 1; p k k k k2
T. Satz (Integralkriterium). Die Funktion f W Œ1; 1Œ ! R sei stetig und monoton fallend, und es gelte f .x/ % 0 für alle x % 1. Dann besteht die Äquivalenz: 1 X
Z f .k/ konvergent
()
kD1
lim
n
n!1 1
f .x/ dx existiert in R:
Ist eine der beiden Aussagen erfüllt, so gelten die Abschätzungen: Z
n
lim
n!1 1
f .x/ dx .
1 X
Z f .k/ . f .1/ C lim
n
n!1 1
kD1
f .x/ dx:
Beweis. Wegen der Monotonie gilt: f .kC1/ . f .x/ . f .k/ 8 x 2 Œk; kC1/; also folgt durch Integration über das Intervall Œk; k C 1/: Z f .k C 1/ .
k
kC1
f(x)
f . f .k/; k
somit durch Aufaddieren:
(9)
snC1 & f .1/ D
n X kD1
Z f .k C 1/ .
1
nC1
f .
n X
k + 1
x
f .k/ D sn :
kD1
(R n ) Sowohl die Folge .sn / der Teilsummen wie auch die Folge 1 f der Integralwerte ist monoton wachsend, da stets f .x/ % 0. Aus derR Abschätzung (9) liest man unn mittelbar die Äquivalenz ab: sn beschränkt () 1 f beschränkt. Also folgt die behauptete Äquivalenz aus dem Hauptsatz über monoton wachsende Folgen N[2.1]. Die Ungleichungen zwischen den Grenzwerten ergeben sich aus (9) durch Grenzübergang n ! 1. "
383
Abschnitt 8.1 Reihen
U. Beispiele. (i)
Ist
X
2k cosk
1 konvergent oder divergent? k
Lösung: Wegen der Potenzen versucht man es mit dem Wurzelkriterium: ˇ ˇ p ˇ 1 ˇˇ k ˇ jak j D 2 ( ˇcos ˇ &! 2 ( 1 D 2 > 1: k Somit ist die Reihe divergent. X 1 (ii) Ist k k sink konvergent oder divergent? 2k Lösung: Wegen der Potenzen versucht man es wiederum mit dem Wurzelkriterium: ˇ ˇ ˇ ˇˇ sin 1 ˇˇ ˇ p ˇ 1 ˇˇ ˇ k 2k ˇˇ ( 1 &! 1 ( 1 D 1 < 1: jak j D k ( ˇˇsin Dˇ ˇ 1 ˇ 2 ˇ 2k 2 2 ˇ ˇ 2k Dabei wurde der Differenzenquotient des Sinus bei 0 verwendet (G[4.4]). Somit ist die Reihe absolut konvergent. X ck (iii) Für welche c 2 C konvergiert die Reihe ? kŠ Lösung: Bei Fakultäten ist es oft besser, das Quotientenkriterium zu verwenden. Für c ¤ 0 gilt: ˇ ˇ ˇ akC1 ˇ jcjkC1 kŠ jcj ˇ ˇ ˇ a ˇ D .k C 1/Šjcjk D k C 1 &! 0: k Somit konvergiert die Reihe für jedes c 2 C absolut. Insbesondere ist für alle c 2 C: ck D 0: k!1 kŠ lim
(iv)
Für welche ˛ 2 R konvergiert die Reihe
1 X 1 ? k˛
kD1
Lösung: Für ˛ D 1 entsteht die harmonische Reihe, und diese ist divergent. Da für ˛ < 1 gilt: k1˛ % k1 , divergiert die Reihe für ˛ < 1 erst recht. Für ˛ > 1 versagen sowohl Wurzel- wie Quotientenkriterium (es ist jeweils q D 1), aber das Integralkriterium hilft: Z 1
k
dx D x˛
Z 1
k
x
&˛
1
x &˛C1 dx D &˛ C 1
'k 1
D
k 1&˛ 1 1 & &! 0 C : 1&˛ 1&˛ ˛&1
384
Kapitel 8 Weiterführung der Analysis
Die Reihe divergiert also für ˛ . 1, und sie konvergiert für ˛ > 1. Im zweiten Fall definiert sie die so genannte Riemannsche Zetafunktion: % W /1; 1Œ &! R;
%.˛/ ´
1 X 1 : k˛
kD1
$ Nochmals die Dezimaldarstellung Eine schöne Anwendung der Reihenlehre, besonders der geometrischen Reihe, bezieht sich auf die Dezimalbruch-Entwicklung der reellen Zahlen. Ohne wesentliche Einschränkung sei die gegebene Zahl a aus dem Intervall Œ0; 1Œ. Wir hatten in Abschnitt 2.8 gesehen, dass ein solches a eine Dezimaldarstellung a D 0; k1 k2 k3 : : : besitzt; vgl. (3)[2.8]. Aus dieser Formel folgt nach (6)[2.8] und (1)[2.8], dass für
an ´ k1 ( 10&1 C k2 ( 10&2 C ( ( ( C kn ( 10&n
gilt:
a D lim an : n!1
Offensichtlich sind die an die Teilsummen einer Reihe, sodass wir jetzt schreiben können: (10)
a D 0; k1 k2 k3 : : : D
1 X
k` ( 10&` ;
`D1
einschließlich der (absoluten) Konvergenz. Die Ziffern k` bilden eine Folge in f0; : : : ; 9g, wobei alle solche Folgen vorkommen bis auf die mit „Neunerschwanz“. Die Zuordnung „reelle Zahl in Œ0; 1Œ 7! Dezimaldarstellung“ ist in dieser Konstellation bijektiv; vgl. Satz C[2.8]. Jetzt können wir auch die Frage der periodischen Dezimalbrüche klären: V. Satz und Definition (Rationalitätskriterium). Die reelle Zahl a 2 Œ0; 1Œ ist dann und nur dann rational, wenn ihre Dezimaldarstellung (10) periodisch ist, d.h. von der Gestalt (11a)
a D 0; k1 : : : kv kvC1 : : : kvCp kvC1 : : : kvCp : : :
mit v 2 N0 und p 2 N. Hierin ist k1 : : : kv die Vorperiode, die auch nicht vorhanden sein kann (nämlich für v D 0), und kvC1 : : : kvCp ist die Periode, bestehend aus dem „Ziffernpaket“ kvC1 : : : kvCp , das sich nach der Position v ständig wiederholt. Man schreibt statt (11a) auch (11b)
a D 0; k1 : : : kv kvC1 : : : kvCp :
385
Abschnitt 8.1 Reihen
Beweis. 1) Sei die Dezimaldarstellung von der Form (11a) vorausgesetzt. Dann kann a hieraus explizit rekonstruiert werden: Nach (10) gilt aD
v X
k` 10&` C
`D1
1 X
k` 10&` :
`DvC1
Hierin ist v X
( ) k` 10&` D k1 10&1 C ( ( ( C kv 10&v D 10&v k1 10v&1 C ( ( ( C kv 100
`D1
D 10&v ( k1 : : : kv ; worin k1 : : : kv in nahe liegender Weise die Dezimaldarstellung einer natürlichen Zahl (oder 0) bezeichnet. Analog ist 1 X
( ) k` 10&` D kvC1 10&.vC1/ C ( ( ( C kvCp 10&.vCp/
`DvC1
also wird mit
( ) C kvC1 10&.vCpC1/ C ( ( ( C kvCp 10&.vC2p/ C ( ( ( ; , ´ kvC1 10&.vC1/ C ( ( ( C kvCp 10&.vCp/
nach der geometrischen Reihe 1 X
kvCp 10&.vCp/ D , C , ( 10&p C , ( 10&2p C ( ( ( D , (
`DvC1
Hierbei ist wie zuvor
1 : 1 & 10&p
, D 10&.vCp/ ( kvC1 : : : kvCp
mit kvC1 : : : kvCp 2 N. Zusammengenommen, ergibt sich 10&.vCp/ ( kvC1 : : : kvCp 1 & 10&p 10&v ( k1 : : : kv C p ( kvC1 : : : kvCp : 10 & 1
a D 10&v ( k1 : : : kv C D 10&v
Diese Formel zeigt, dass a rational ist. 2) Sei umgekehrt a als rational vorausgesetzt. Um die Periodizität der Dezimaldarstellung nachzuweisen stützt man sich auf die rekursive Bestimmung der Ziffern k1 ; k2 ; : : : aus Bemerkung D(ii)[2.8]: Es sei aD
p q
mit
p; q 2 N0 ;
0 . p < q:
386
Kapitel 8 Weiterführung der Analysis
Aus dem dortigen Rekursionsschema sieht man, dass alle Zahlen rn rational sind mit Nenner q und durch 10 teilbarem Zähler. Wegen 0 . rn < 10 können die rn nur die Werte 10.q & 1/ 10 20 ; ; :::; 0; q q q annehmen. In der Folge r1 ; r2 ; : : : müssen also an zwei verschiedenen Positionen einmal gleiche Werte stehen, etwa rvC1 D rvCpC1 für ein v 2 N0 und ein p 2 N. Dann gilt auch kvC1 D kvCpC1 , und die Rekursion zeigt, dass sich diese Gleichheiten auf alle nachfolgenden Indizes übertragen: rvC1C` D rvCpC1C` und kvC1C` D kvCpC1C` für ` 2 N. Hieraus folgt a D 0; k1 : : : kv kvC1 : : : kvCp ; sodass a wirklich eine periodische Dezimaldarstellung besitzt.
"
Die Endformel des Beweisteils 1) liefert noch den V. Zusatz. Die Umwandlung einer periodischen Dezimaldarstellung in eine rationale Zahl kann mit der Formel 0; k1 : : : kv kvC1 : : : kvCp D
1 kvC1 : : : kvCp k1 : : : kv C v ( v 10 10 10p & 1
bewerkstelligt werden.
"
Dabei ist, wie gesagt, für irgendwelche Ziffern kj k1 : : : k` ´ k1 ( 10`&1 C ( ( ( C k` ( 100 : W. Beispiel. Es gilt 1 234 427 19 C ( D ; 100 100 999 2220 19 1 234 4227 0; 0190234 D C ( D : 1000 1000 9999 222200 0; 19234 D
Im ersten Fall ist v D 2 und p D 3, im zweiten v D 3 und p D 4
Aufgaben und Anmerkungen 1. Man untersuche die folgenden Reihen auf Konvergenz und absolute Konvergenz:
387
Abschnitt 8.1 Reihen 1 X
a)
kD1 1 X
d)
kD2 1 X
1 X kŠ2 b) , .2k/Š
1 , k2 & k & 1
c)
kD1
1 3 -k X p k 3&1 , e)
1 , k ln k
kC1 .&1/k p , g) 2k k kD1
h)
kD1 1 X kD1
1 X
.&1/k
kD1
f)
2 C .&1/k , k
1 X
1 , p 2 k C 1 kD1
.&1/k ln k . k
2. Für welche a 2 R bzw. a 2 C konvergiert die Reihe vergenzfall soll der Reihenwert bestimmt werden.
1 3 X
ak & ak&1 ? Im Kon-
kD1
3. Eine alternierende Reihe, deren Glieder eine nicht monotone Nullfolge bilden, kann a) konvergieren oder auch b) divergieren. Man zeige dies an folgenden Beispielen: a) b)
3 1 1 1 1 & C 2 & 2 C 2 & C(((; 4 42 3 6 5 1 1 1 1 1 1 & 2 C & 2 C & 2 C &((( 2 2 3 3 4 4
4. Eine Reihe mit positiven, gegen null konvergierenden Gliedern, die divergiert und explizit bestimmbare Teilsummen sn hat, ist 1 X kD1
p
1
1 1 1 p Dp p Cp p Cp p C ((( : 0C 1 1C 2 2C 3 k&1C k
Man verifiziere die genannten Eigenschaften und berechne insbesondere die Teilsummen explizit. Für welches n ist erstmalig sn > 100? 5. Man beweise oder widerlege die folgenden Aussagen: a)
1 X
ak konvergent H)
kD1
b)
1 X
1 X
ak2 konvergent.
kD1
ak absolut konvergent H)
kD1
1 X
ak2 absolut konvergent.
kD1
6. Es seien P und Q reelle Polynome mit deg.P / D p 2 N0 und deg.Q/ D p C 1. Konvergieren die Reihen a)
1 X P .k/ , Q.k/
kDk0
b)
1 X kDk0
.&1/k
P .k/ , Q.k/
wobei k0 2 N so gewählt sei, dass für k % k0 gilt: Q.k/ ¤ 0?
388
Kapitel 8 Weiterführung der Analysis
7. Sei .Œ˛k ; ˇk //k2N eine Intervallschachtelung mit ˇ1 % 0 und limk!1 ˛k D limk!1 ˇk µ '. Man zeige: a) Es existiert genau eine alternierende Reihe a1 & a2 C a3 & C ( ( ( , für deren Teilsummen sn gilt Œs2m ; s2m&1 / D Œ˛m ; ˇm /, m D 1; 2; : : : . b) Die ak dieser alternierenden Reihe bilden eine monoton fallende Nullfolge, und es gilt a1 & a2 C a3 & C ( ( ( D ': Eine solche alternierende Reihe ist also grob gesprochen das Gleiche wie eine Intervallschachtelung. So, wie die konvergenten Folgen den konvergenten Reihen (im Sinne von Bemerkung E) entsprechen, korrespondieren Intervallschachtelungen im Wesentlichen mit den alternierenden Reihen mit den im Leibniz-Kriterium J genannten Eigenschaften.
8.2 Funktionenreihen Wie bei den Folgen gibt es auch bei den Reihen solche, deren Glieder von einer zusätzlichen Variablen abhängen. Das allgemeine Konzept für derartige Folgen wurde in Abschnitt 6.5 entwickelt. Im Falle der Reihen werden die dortigen Prinzipien jetzt einfach auf die Teilsummen angewandt. Bei dieser Übertragung nehmen wir gleichzeitig die Verallgemeinerung auf komplexwertige Funktionen vor. Es bezeichne wie im vorangehenden Abschnitt K den Körper R oder C. Gegeben sei eine Folge .fk /k2N von Abbildungen fk W M ! K. Dabei darf M eine beliebige Menge sein. A. Definition. Eine Funktionenreihe mit den Gliedern fk hat die Gestalt ($)
1 X
fk D f1 C f2 C ( ( ( :
kD1
Die Folge .gn /n2N ihrer Teilsummen ist definiert durch gn ´ f1 C ( ( ( C fn . Diese sind ebenfalls Abbildungen des Typs gn W M &! K. (i) Die Funktionenreihe ($) konvergiert (punktweise) gegen die Funktion f W M ! K, wenn die Folge .gn /n2N der Teilsummen P punktweise gegen f konvergiert. Dies bedeutet also, dass für alle p 2 M gilt: 1 kD1 fk .p/ D f .p/. Symbol dafür ist auch 1 X
fk D f;
kD1
und man sagt, die Funktion f werde durch die links stehende Reihe dargestellt.
Abschnitt 8.2 Funktionenreihen
389
(ii) Die Funktionenreihe ($) konvergiert gleichmäßig gegen die Funktion f W M ! K, wenn die Folge .gn /n2N der Teilsummen gleichmäßig gegen f konvergiert. Symbol dafür ist 1 X fk D f (glm. auf M ) kD1
(oder auch das Gleiche mit Argumentbesetzung auf beiden Seiten der Gleichung). Wie generell bei der gleichmäßigen Konvergenz ist die Spezifikation der Menge unerlässlich. Die gleichmäßige Konvergenz ist wieder die stärkere Forderung. Wenn man die Grenzfunktion f weder kennt noch vermutet, so verbleibt in beiden Fällen das Cauchy-Kriterium zur Konvergenzprüfung, natürlich angewandt auf die Folge der Teilsummen. Da die Distanz zweier Teilsummen im Falle m > n so geschrieben werden kann: ˇ ˇ ˇ X ˇ ˇ m ˇ ˇ jgn & gm j D ˇ fk ˇˇ ˇkDnC1 ˇ bedeutet dies z.B. im zweiten Fall: B. Satz (Cauchy-Kriterium für gleichmäßige Konvergenz von Funktionenreihen). Die Funktionenreihe ($) konvergiert dann und nur dann gleichmäßig auf M , wenn zu jedem " > 0 ein N D N."/ 2 N existiert derart, dass für alle n; m mit m > n > N und alle p 2 M gilt ˇ ˇ ˇ ˇ X m ˇ ˇ ˇ fk .p/ˇˇ < ": ˇ ˇ ˇkDnC1 " Eine wichtige und oft gebrauchte Folgerung hieraus ist: C. Satz (Majorantenkriterium von Weierstraß für gleichmäßige Konvergenz von Funktionenreihen). Zur Funktionenreihe ($) existiere eine konvergente Majorante, P 0 mit konstanten reellen Gliedern 0k % 0 derart, d.h. eine konvergente Reihe 1 kD1 k dass für alle k 2 N und alle p 2 M gilt: jfk .p/j . 0k . Dann konvergiert ($) gleichmäßig auf M gegen eine Funktion f W M ! K. Beweis. Die Teilsummen der Majorante seien mit sn bezeichnet. Man überprüft leicht das obige Cauchy-Kriterium: Für m > n und p 2 M gilt nämlich ˇ ˇ ˇ ˇ X m m X X ˇ ˇ m ˇ fk .p/ˇˇ . jfk .p/j . 0k D sm & sn : (1) jgm .p/ & gn .p/j D ˇ ˇ kDnC1 ˇkDnC1 kDnC1
390
Kapitel 8 Weiterführung der Analysis
Hieraus liest man ab: Die Cauchy-Eigenschaft von .sm / impliziert die von Satz B. " P1 P Anwendung auf 1 kD1 fk .p/ liefert den kD1 jfk .p/j anstelle von C. Zusatz. Auch
P1
kD1
jfk j konvergiert gleichmäßig auf M .
"
Aus der mittleren Abschätzung in (1) folgt zusammen mit Satz B auch ohne Bezugnahme auf eine Majorante: P D. Satz und Definition. P Konvergiert die Reihe jfk j gleichmäßig auf M , so konvergiert auch P die Reihe fk gleichmäßig auf M . Man sagt unter dieser Voraussetzung: Die Reihe fk konvergiert absolut-gleichmäßig. " Eine Funktionenreihe, die die Voraussetzungen des Majorantenkriteriums C erfüllt, konvergiert also absolut-gleichmäßig. E. Beispiele. (i)
Konvergiert die Reihe
1 X sin kx auf R gleichmäßig? k2
kD1
ˇLösung: ˇ Hier ist M ´PR und K ´ R. Es gilt für alle x 2 R und k 2 N: ˇ sin kx ˇ 1 ˇ k 2 ˇ . k12 . Somit ist kD1 k12 eine konvergente Majorante, also konvergiert die Ausgangsreihe absolut-gleichmäßig in R. (ii) In der Theorie der „elliptischen Funktionen“ tritt folgende Reihe auf 1 X
2
q k cos kx;
kD1
mit q 2 C vom Betrag jqj < 1=15 und x 2 R. Man kläre die Konvergenz bzw. gleichmäßige Konvergenz diese Reihe für .q; x/ 2 B.0; 1=15/ ) R, wobei B.0; 1=15/ der Euklidische Ball um 0 2 C vom Radius 1=15 ist. Lösung: Hier ist M ´ B.0; 1=15/ ) R und K ´ C. Da in M gilt . /k ˇ ˇ 2 1 2 ˇ ˇ k ; ˇq cos kx ˇ . jqjk . jqjk . 15 ( 1 )k P ist die geometrische Reihe 1 eine konvergente Majorante, also konvergiert kD1 15 die Ausgangsreihe absolut-gleichmäßig in M . Die explizite Bestimmung der Reihensumme ist in vielen Fällen nicht möglich. Es geht dann darum, Existenz und Eigenschaften der Grenzfunktion ohne solche Kenntnis herauszufinden. Dazu dienen gerade Sätze wie das Cauchy- und Majorantenkriterium oder Aussagen über gliedweise Operationen. Ähnlich wie bei den Integralen
391
Abschnitt 8.2 Funktionenreihen
(H[5.4]) können Funktionenreihen Anlass zur Einführung neuer Grundfunktionen geben, wie z.B. bei der Riemannschen Zetafunktion in U(iv)[8.1]. Die Frage der gliedweisen Integration bzw. Differentiation erledigt sich einfach durch Anwendung der früheren Sätze auf die Teilsummen. Dabei ist klar, dass die Integration bzw. die Ableitung einer jeden Teilsumme summandenweise erfolgt, wie sich unmittelbar aus den Grundeigenschaften dieser Operationen ergibt. Ebenso ist klar, dass sich die Stetigkeit oder stetige Differenzierbarkeit der Glieder auf die Teilsummen überträgt. Vgl. hierzu die Sätze E, G und D in Abschnitt 5.5. Gleichzeitig sieht man an deren Beweisen, dass nur vom Betrag Gebrauch gemacht wird, aber nicht von der Anordnung von R. Die Situation überträgt sich also auch auf komplexwertige Funktionen, die auf einem kompakten Intervall definiert sind. (Bei nichtkompakten Intervallen kann man die Aussagen zumindest auf kompakte Teilintervalle anwenden.) Konvention: Hier und in Zukunft wird statt „Funktionenreihe“ oft auch einfach „Reihe“ gesagt. In den meisten Fällen erkennt man ja an der Bauart der Reihe, ob ihre Glieder von zusätzlichen Variablen (außer dem Summationsindex) abhängen – es sich also um eine Funktionenreihe handelt – oder nicht – also eine Reihe „mit konstanten Gliedern“ vorliegt. Aufgaben und Anmerkungen 1. Man bestimme möglichst große Mengen M , R, auf denen die Reihe 1 X kD1
1 1 C .kx/2
gleichmäßig konvergiert. a) Stellt diese Reihe auf der punktierten reellen Achse Rnf0g eine stetige Funktion dar? b) Darf man diese Reihe über ein Intervall Œa; b/ mit 0 < a < b gliedweise integrieren und so das Ergebnis Z
b a
0
1 X
kD1
1 1 C .kx/2
! dx D
1 X k.b & a/ 1 arctan k 1 C k 2 ab
kD1
erhalten? c) Darf man diese Reihe auf der punktierten reellen Achse gliedweise differenzieren?
392
Kapitel 8 Weiterführung der Analysis
2. Analoge Aufgabe im Komplexen: Man bestimme möglichst große Teilmengen M der rechten Halbebene fz 2 C j Re .z/ > 0g, auf denen die Reihe 1 X kD1
1 1 C k2z
gleichmäßig konvergiert. Stellt diese auf der rechten Halbebene eine stetige Funktion dar? 3. Eine Reihe kann natürlich gleichmäßig konvergieren ohne absolut konvergent zu sein. Man studiere hierzu die Reihe 1 X .&1/k 1 C kx 2
kD1
auf möglichst großen Teilmengen M , R. Ist dort die Reihe absolut konvergent? Stellt diese Reihe auf der punktierten reellen Achse R n f0g eine stetige Funktion dar? Darf man die Reihe über ein Intervall Œa; b/ mit 0 < a < b gliedweise integrieren bzw. auf der punktierten reellen Achse gliedweise differenzieren? 4. In Beispiel U(iv)[8.1] war die Riemannsche Zetafunktion % W /1; 1Œ ! R durch die Reihe 1 X 1 %.t/ ´ kt kD1
definiert worden. Man zeige: a) Diese Reihe konvergiert in jedem Intervall Œ˛; 1Œ mit ˛ > 1 absolut-gleichmäßig. Daraus folgt, dass die Zetafunktion auf dem ganzen Definitionsintervall /1; 1Œ stetig ist. b) $ Die Zetafunktion ist auf /1; 1Œ stetig differenzierbar, und es gilt dort 1 X ln k % .t / ´ & kt 0
kD1
mit absolut-gleichmäßiger Konvergenz der Reihe auf jedem Intervall Œ˛; 1Œ mit ˛ > 1. 5. $ Der Satz von Dini P[6.5] kann in folgender „Reihenvariante“ ausgesprochen werden: Sei X ein kompakter metrischer Raum und (2)
1 X
fk D f
kD1
eine konvergente Funktionenreihe mit stetigen nichtnegativen Gliedern fk W X ! RC 0 und stetiger Summe f W X ! R. Dann erfolgt die Konvergenz in (2) gleichmäßig.
393
Abschnitt 8.2 Funktionenreihen
6. $ In dieser Aufgabe wird eine stetige, nirgends differenzierbare Funktion f W R ! R konstruiert. Das Grundprinzip ist die „Vervielfältigung des Zackens“ der Betragsfunktion mittels einer Reihe. a) Als Erstes sei die Betragsfunktion g.x/ D jxj vom Intervall Œ&1=2; 1=2/ mit der Periode 1 auf ganz R fortgesetzt, d.h. so, dass g.x C 1/ D g.x/ für alle x 2 R gilt. Eine Darstellung dieser Fortsetzung ist ˇ h 1 iˇˇ ˇ g W R &! R; g.x/ ´ ˇx & x C ˇ: 2 Denn dieser Ausdruck stimmt auf Œ&1=2; 1=2/ mit jxj überein und erfüllt: g.x C 1/ D g.x/ für alle x 2 R; vgl. Aufgabe 11[4.4]. Man skizziere den Graph von g. Die Funktion g ist auf ganz R stetig, erfüllt 0 . g.x/ .
1 ; 2
und genau in den Punkten von Z=2 hat g „Zacken“, ist also dort nicht differenzierbar. b) Diese „Singularitäten“ werden nun „verdichtet“ und gleichzeitig die „Amplituden“ gedämpft, indem man definiert: gj .x/ ´
1 g.2j x/: 2j
Für jedes j 2 N0 ist dann die Funktion gj W R ! R stetig, erfüllt 0 . gj .x/ .
1 2j C1
und ist in den Punkten von Z=2j C1 nicht differenzierbar. c) Man überlege: Für a D k=2n und b D .k C 1/=2n , k 2 N0 , hat der Differenzenquotient gj .b/ & gj .b/ b&a den Wert 1 oder &1 für j < n und den Wert 0 für j % n. d) Die gewünschte Funktion ist jetzt gegeben durch die Reihe f .x/ ´
1 X
gj .x/:
j D0
Diese hat nach b) eine konvergente, von x unabhängige Majorante, ist also gleichmäßig konvergent und stellt eine stetige Funktion f W R ! R dar. Um die Nichtdifferenzierbarkeit von f an einer beliebigen Stelle a 2 R zu beweisen,
394
Kapitel 8 Weiterführung der Analysis
verwende man Aufgabe 3 b)[4.1], indem man zwei Folgen an und bn in Z=2n mit bn & an D 1=2n und an . a . bn wählt, den Quotienten f .bn / & f .an / bn & an mit der obigen Reihe darstellt und mittels c) nachweist, dass dieser abwechselnd eine gerade oder ungerade ganze Zahl ist.
8.3
Höhere Ableitungen und die Taylor-Entwicklung
Die Ableitung, wie sie bisher definiert und gebraucht wurde, spiegelt die Approximation einer Funktion durch ein Polynom der Ordnung . 1 wider. Geometrisch drückt sich das in der Annäherung durch die Tangente, analytisch z.B. durch den Mittelwertsatz aus. Höhere Ableitungen erfüllen einen ähnlichen Zweck in verfeinerter Form, insofern die gegebene Funktion durch eine Polynom höherer Ordnung besser approximiert werden kann als durch eine affine Funktion. Der präzise Ausdruck für diese Art von Annäherung ist die Taylor-Formel. Wir steuern rasch auf diese Approximationsfrage zu. Die hier betrachteten Funktionen sind zunächst vom Typ f W A ! R mit A , R. Generell soll die Definitionsmenge A keine isolierten Punkte enthalten. Im weiteren Verlauf wird dann A ein Intervall sein. Zum Schluss wird erklärt, wie die wesentlichen Ergebnisse auf komplexwertige Funktionen f W A ! C ausgedehnt werden können. Höhere Ableitungen f 00 ; f 000 ; : : : ergeben sich durch sukzessives Differenzieren, soweit dies möglich ist: A. Definition. Gegeben sei eine Stelle a 2 A. Damit f 00 .a/ erklärt werden kann, ist als Voraussetzung erforderlich, dass die Ableitung f 0 .x/ für alle x in einer "Umgebung von a (geschnitten mit A) existiert und in a differenzierbar ist. Dann setzt man f 00 .a/ ´ .f 0 /0 .a/ und nennt dies die zweite Ableitung von f in a. Man schreibt auch f 00 .a/ µ f .2/ .a/. Entsprechend sind höhere Ableitungen f 000 .a/ D f .3/ .a/; f .4/ .a/; : : : induktiv definierbar: Damit f .nC1/ .a/ für n 2 N mit n % 2 erklärt werden kann, ist als Voraussetzung erforderlich, dass f .n/ .x/ in einer "-Umgebung von a (geschnitten mit A) existiert und in a differenzierbar ist. Dann setzt man f .nC1/ .a/ ´ .f .n/ /0 .a/:
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
395
Die nullte Ableitung ist die Funktion selbst: f µ f .0/ . Die Ableitung f 0 .a/ bzw. f 0 heißt (im Falle der Existenz) auch die erste Ableitung, geschrieben als f .1/ statt f 0 . Existiert f .n/ .x/ für jedes x 2 A, so ist dadurch eine Funktion f .n/ W A ! R definiert. Im Fall der Existenz heißt f .n/ .a/ bzw. f .n/ die n-te Ableitung . Gelesen werden die Symbole f 0 ; f 00 ; f 000 als „f Strich“, „f zwei Strich“, „f drei Strich“. 5=2 B. Beispiel. Sei A ´ RC . Dann existiert f 0 .x/ D 25 x 3=2 für alle 0 und f .x/ ´ x x 2 A. Weiter existiert f 00 .x/ D 52 ( 32 x 1=2 für alle x 2 A. Aber f 000 .x/ D 25 ( 32 ( 21 x &1=2 existiert nur für x > 0 in A; denn die Quadratwurzelfunktion ist in 0 zwar noch stetig, aber nicht mehr differenzierbar.
C. Definition. Existiert f .n/ W A ! R für ein n 2 N, so heißt f n-mal differenzierbar. Ist außerdem f .n/ W A ! R stetig, so heißt f n-mal stetig differenzierbar oder von der Klasse C n oder eine C n -Funktion. Man definiert die Funktionenmenge C n .A/ ´ ff W A ! R j f n-mal stetig differenzierbarg: Ist f für alle n 2 N stetig differenzierbar, so heißt f von der Klasse C 1 oder eine C 1 -Funktion, und man definiert die Funktionenmenge C 1 .A/ ´ ff W A ! R j f für alle n 2 N stetig differenzierbarg: Manchmal werden in dem Symbol C n .A/ die Klammern um A weggelassen. Ist von vornherein klar, dass die Definitionsmenge gleich A ist, so schreibt man statt f 2 C n .A/ etwas einfacher f 2 C n . Existiert f .n/ W A ! R, so ist f .n&1/ W A ! R stetig (D[4.1]). Also ist in der vorangehenden Definition von C 1 .A/ in der Klammer rechts „stetig differenzierbar“ äquivalent ersetzbar durch „differenzierbar“. D. Beispiele. (i) Anknüpfend an das obige Beispiel B kann man feststellen, dass f in A von der Klasse C 2 ist, aber nicht von der Klasse C 3 . Es ist also f 2 C 2 .A/, aber f … C 3 .A/. Jedoch gilt für die Einschränkung f jRC 2 C 1 .RC /. (ii) Jedes Polynom ist auf ganz R von der Klasse C 1 ebenso die Funktionen exp, cos, sin, arctan. Bei den Umkehrfunktionen trifft dies dagegen nur mit eventuellen Einschränkungen zu, da diese nicht durchgängig definiert sein können und in den Bildpunkten der Nullstellen der Ableitung nicht differenzierbar sind. Z.B. ist ln 2 C 1 .RC /, jedoch arcsin 2 C 0 Œ&1; 1/, aber nur arcsin j /&1; 1Œ 2 C 1 .
396
Kapitel 8 Weiterführung der Analysis
(iii) Eine rationale Funktion ist in ihrer Definitionsmenge (d.h. außerhalb der Nullstellen des Nennerpolynoms) von der Klasse C 1 . E. Definition. Für zwei Funktionen f; g W A ! R und a 2 A und n 2 N0 mögen f .n/ .a/ und g .n/ .a/ existieren. Man sagt, f und g stimmen in a in n-ter Ordnung überein, wenn gilt: f .a/ D g.a/;
f 0 .a/ D g 0 .a/;
f 00 .a/ D g 00 .a/;
:::;
f .n/ .a/ D g .n/ .a/:
Das ist natürlich eine Äquivalenzrelation in der Gesamtheit der Funktionen, die die Voraussetzungen bzgl. der Existenz der n-ten Ableitungen erfüllen. Wir werden sehen, dass die Übereinstimmung genügend vieler Ableitungen an einer festen Stelle die Funktionen zwingen kann, auch in einer Umgebung der Stelle nicht allzu stark voneinander abzuweichen! F. Lemma. Existiert f .n/ .a/, so gibt es genau ein Polynom P vom Grad . n, sodass f und P in a in n-ter Ordnung übereinstimmen. Beweis. Es ist günstig, das gesuchte Polynom in der umentwickelten Form (8)[3.1] mit Zentrum a anzusetzen, natürlich mit unbestimmten Koeffizienten ck . Dann folgt durch sukzessives Differenzieren: P .x/ D c0 C c1 .x & a/ C c2 .x & a/2 C c3 .x & a/3 C ( ( ( C cn .x & a/n P 0 .x/ D c1 ( 1 C c2 ( 2.x & a/ C c3 ( 3.x & a/2 C ( ( ( C cn ( n.x & a/n&1 P 00 .x/ D c2 ( 2 C c3 ( 3 ( 2.x & a/ C ( ( ( C cn ( n ( .n & 1/.x & a/n&2 P 000 .x/ D c3 ( 3 ( 2 C ( ( ( C cn ( n ( .n & 1/ ( .n & 2/.x & a/n&3 :: : P .n/ .x/ D cn ( n ( .n & 1/ ( .n & 2/ ( ( ( 1: Daraus ergibt sich: P .k/ .a/ D ck ( kŠ für 0 . k . n;
P .nC1/ D 0:
Also wird für 0 . k . n: P .k/ .a/ D f .k/ .a/ () ck ( kŠ D f .k/ .a/ () ck D Es ergeben sich eindeutig bestimmte Koeffizienten!
f .k/ .a/ : kŠ "
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
397
F. Definition (als Zusatz). Dieses eindeutig bestimmte Polynom Tn .x/ ´ f .a/ C
f 0 .a/ f 00 .a/ f .n/ .a/ .x & a/ C .x & a/2 C ( ( ( C .x & a/n 1Š 2Š nŠ
heißt das n-te Taylor-Polynom von f mit Zentrum a. (Manchmal schreibt man Tn .f; x/ anstelle von Tn .x/, um die Funktion f zu spezifizieren.) Nachdem das Polynom Tn .x/ hinsichtlich seiner Ableitungen gut mit der Funktion f übereinstimmt, erhebt sich naturgemäß die Frage, ob dieses Polynom vielleicht auch sonst eine gute Annäherung an f darstellt. Präziser gefragt, wie groß ist der Unterschied oder Fehler (1)
Rn .x/ ´ f .x/ & Tn .x/‹
Da (2)
f .x/ D Tn .x/ C Rn .x/
heißt Rn .x/ auch das Restglied. Diese Frage hat zwei Aspekte, da Rn .x/ von zwei Objekten abhängt, nämlich von x und n: Wird der Fehler bei festem n klein, wenn x nahe bei a liegt? Wird der Fehler bei festem x klein, wenn immer mehr Ableitungen zur Übereinstimmung gebracht werden, d.h. wenn n gegen 1 geht? Wir untersuchen das der Reihe nach. Die betrachtete Funktion sei dabei auf einem Intervall mit nichtleerem Inneren definiert. Zur bequemen Schreibweise sei ein neues Intervallsymbol eingeführt, nämlich für ˛; ˇ 2 R gesetzt: ( Œ˛; ˇ/ für ˛ . ˇ j˛; ˇj ´ Œˇ; ˛/ für ˛ > ˇ Sei n zunächst fest. G. Satz (Taylor-Formel). Sei f 2 C nC1 .J /, J , R ein Intervall mit J ı ¤ ¿ und n 2 N0 . Dann gilt für a; x 2 J die Identität (3) f .x/ D f .a/C
f 00 .a/ f .n/ .a/ f 0 .a/ .x&a/C .x&a/2 C( ( (C .x&a/n CRn .x/; 1Š 2Š nŠ
wobei (4)
1 Rn .x/ D nŠ
Z a
x
.x & t/n f .nC1/ .t / dt
(Integral-Restglied):
398
Kapitel 8 Weiterführung der Analysis
Der Ausdruck (4) stellt das Restglied in Gestalt eines Integrals dar. Man spricht kurz vom Integral-Restglied. Zwar ist Rn .x/ unabhängig von einer bestimmten Darstellung durch (1) oder (2) für n-mal differenzierbare Funktionen erklärt, brauchbare Informationen über Rn .x/ lassen sich aber nur bei zusätzlichen Informationen gewinnen, hier also durch die Kenntnis einer stetigen .n C 1/-ten Ableitung. Wir werden gleich anhand von Beispielen sehen, dass sich die Fehlergröße über eine solche Darstellung sehr effektiv abschätzen lässt. Beweis von G. Mehrfache Produktintegration liefert: Z x f .x/ D f .a/ C f 0 .t / dt a
Z D f .a/ C
a
x
1 ( f 0 .t / dt
ˇx ˇ D f .a/ C .t & x/f .t /ˇ
Z
0
t Da
D f .a/ C .x & a/f 0 .a/ &
&
Z
x a
x a
.t & x/f 00 .t/ dt
.t & x/f 00 .t/ dt
Z x ˇx 1 1 ˇ 2 00 C .t & x/2 f 000 .t/ dt D f .a/ C .x & a/f .a/ & .t & x/ f .t /ˇ t Da 2 2 a Z x 1 1 .t & x/2 f 000 .t / dt D f .a/ C .x & a/f 0 .a/ C .x & a/2 f 00 .a/ C 2 2 a :: : 0
1 1 D f .a/ C .x & a/f 0 .a/ C .x & a/2 f 00 .a/ C ( ( ( C .x & a/n f .n/ .a/ 2 nŠ Z 1 x .x & t/n f .nC1/ .t / dt: C nŠ a Dieser Beweis kommt offensichtlich in Gang durch den Hauptsatz der Differentialund Integralrechnung und wird letzten Endes durch eine geschickte Ausgestaltung dieses Hauptsatzes zu Ende geführt. Beim Übergang von Zeile 2 zu Zeile 3 wird als Stammfunktion der (konstanten) Funktion 1 nicht t 7! t , sondern t 7! t & x gewählt (x ist bei der Integration fest). " G. Zusatz. (i) (5)
Es gilt die Restgliedabschätzung jRn .x/j .
jx & ajnC1 ( max jf .nC1/ j: .n C 1/Š ja;xj
399
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
(ii) Es gibt eine Stelle c 2 ja; xj, sodaß Rn .x/ D
(6)
.x & a/nC1 ( f .nC1/ .c/ .n C 1/Š
(Lagrange-Restglied):
Wie beim Mittelwertsatz C[4.3] lässt sich die Zwischenstelle c in (ii) schreiben als c D a C 2 ( .x & a/ mit einem 2 2 Œ0; 1/. Dabei kann c sowohl von a und x wie auch von n abhängen. Beweis des Zusatzes. Für x D a sind die Behauptungen trivial richtig. Sei nun zunächst a < x. Zu (i): Man schätzt das Integral-Restglied ab: Z Z ˇ ˇ ˇ ˇ 1 x 1 x n ˇ nC1 ˇ jRn .x/j . .t / dt . .x & t/ f .x & t/n dt ( max ˇf nC1 ˇ : nŠ a nŠ a Œa; x/ Die Substitution x & t D u im Integral gibt Z x Z 0 Z n n .x & t / dt D u .&du/ D a
x&a
0
x&a
un du D
.x & a/nC1 : nC1
Daraus folgt die Behauptung. Zu (ii): Sei
m ´ min f .nC1/ ; Œa;x*
M ´ max f .nC1/ : Œa;x*
Die gleiche Abschätzungsweise wie in (i) liefert: .x & a/nC1 .x & a/nC1 m . Rn .x/ . M: .n C 1/Š .n C 1/Š Da f .nC1/ jede Vorgabe in Œm; M / als Wert annimmt (D[3.4]), folgt (ii). Der Fall a > x verläuft analog mit kleinen Änderungen.
"
H. Folgerung. Eine n-mal differenzierbare Funktion f W J ! R (J Intervall, n 2 N) ist dann und nur dann Restriktion eines Polynoms vom Grad . n & 1 auf J , wenn f .n/ D 0 gilt. Beweis. Ist f Restriktion eines Polynoms vom Grad . n & 1, so folgt wie im Beweis von F durch sukzessives Differenzieren: f .n/ D 0. Ist umgekehrt f .n/ D 0 vorausgesetzt, so ist f von der Klasse C 1 , und es verschwindet das Restglied Rn&1 für irgendein fest gewähltes a 2 J , wie man an der Integral- oder Lagrange-Gestalt sieht. Nach der Taylor-Formel ist dann f auf J das .n & 1/-te Taylor-Polynom. "
400
Kapitel 8 Weiterführung der Analysis
Die Taylor-Formel ist ein gutes Hilfsmittel, um aus Informationen an der festen Stelle a (hier: f .a/; f 0 .a/; : : : ; f n .a/), also punktalen Eigenschaften, Informationen in einer Umgebung, also lokale Eigenschaften, zu gewinnen. Ist z.B. jf .nC1/ j im Intervall J klein, so trifft dies erst recht für das Restglied zu, da laut (i) noch der Nenner .n C 1/Š hinzukommt sowie der Faktor jx & ajnC1 , der für x ! a rasch klein wird. Hinweis: Generell kann man in der Analysis Eigenschaften oft nach folgenden Gesichtspunkten unterscheiden: Wir nennen eine Eigenschaft ' punktal, wenn sie der einzelnen Stelle zukommt; ' infinitesimal, wenn sie Ableitungen der einzelnen Stelle zukommt; ' lokal, wenn zum einzelnen Punkt eine Umgebung existiert, der sie zukommt; ' global, wenn sie sich auf die Gesamtheit aller Punkte bezieht. Zum Beispiel sind in f .a/; f 0 .a/; : : : ; f n .a/ punktale (und bei n % 1 zugleich infinitesimale) Eigenschaften ausgedrückt. Ein globaler Satz ist z.B. das allgemeine Extremalprinzip von D[6.5]. Um die Chancen für die Approximation nach Taylor weiter zu verbessern, lassen wir nun n ! 1 laufen: I. Definition. Sei f 2 C 1 .J /, J Intervall in R. Zu a 2 J heißt 1 X f .k/ .a/ .x & a/k kŠ
kD0
die Taylor-Reihe oder Taylor-Entwicklung von f mit Zentrum a. Dies ist zunächst eine formale Definition. Die Hauptfragen, die damit verbunden sind, lauten natürlich: (a)
Für welche x konvergiert die Taylor-Reihe? (Konvergenzproblem)
(b) Für welche dieser x ist der Reihenwert gleich dem Funktionswert f .x/? (Darstellungsproblem) Das Konvergenzproblem werden wir im Abschnitt 8.5 ausführlich behandeln. Das eigentlich interessierende Darstellungsproblem kann man (wenigstens im Prinzip) gut angehen, da man den Unterschied zwischen den Teilsummen und dem Funktionswert f .x/ nach Satz G kennt. Es gilt ja f .x/ D Tn .x/ C Rn .x/;
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
401
wobei der erste Summand rechts die Teilsumme der Taylor-Reihe, nämlich das n-te Taylor-Polynom, ist und der zweite das Restglied, das man in Integralform oder in Mittelwertgestalt kennt und abschätzen kann. Hieraus folgt schon mal ganz einfach: J. Lemma. Für das Darstellungsproblem gilt die Äquivalenz: 1 X f .k/ .a/ f .x/ D .x & a/k kŠ
()
kD0
lim Rn .x/ D 0:
n!1
"
Eine hinreichende Bedingung gibt: K. Satz. Existiert in der Situation von Definition I eine stetige Funktion g W J ! R und eine Konstante C % 0 mit jf .n/ .x/j . g.x/C n
für alle n 2 N0 ; x 2 J ;
so besteht die Darstellung f .x/ D
1 X f .k/ .a/ .x & a/k kŠ
für alle x 2 J :
kD0
Beweis. Nach (5) und der Voraussetzung gilt jRn .x/j .
jx & ajnC1 jx & ajnC1 max jf .nC1/ j . max g ( C nC1 : .n C 1/Š ja;xj .n C 1/Š ja;xj
Bezeichnet man das letzte Maximum, das wegen der Stetigkeit von g in R existiert (aber von x abhängt), mit g1 .x/, so folgt hieraus jRn .x/j .
.jx & ajC /nC1 ( g1 .x/: .n C 1/Š
Nach U(iii)[8.1] konvergiert die erhaltene Schranke für n ! 1 gegen 0, also gilt erst recht limn!1 Rn .x/ D 0. " L. Beispiele. (i) Sei f .x/ ´ e x , J ´ R, a ´ 0. Hier sind alle Ableitungen gleich: f .k/ .x/ D e x . Also sind in Satz K brauchbar: g.x/ ´ e x , C D 1. Wegen f .k/ .0/ D e 0 D 1 folgt die so genannte Exponentialreihe ex D 1 C
x x2 x3 C C C ((( ; 1Š 2Š 3Š
402
Kapitel 8 Weiterführung der Analysis
gültig für alle x 2 R. Speziell für x D 1; &1 ergibt sich: e D1C
1 1 1 1 C C C C ((( 1Š 2Š 3Š 4Š
1 1 1 1 1 1 1 1 D e &1 D 1 & C & C & C ( ( ( D & C & C((( : e 1Š 2Š 3Š 4Š 2Š 3Š 4Š Die Verrechnung der ersten beiden Reihenglieder ist möglich wegen der freien Klammersetzung (H[8.1]). Die Konvergenz der obigen Reihen für e und 1=e ist ausgezeichnet, und es sind auch leicht Fehlerabschätzungen möglich, nämlich mittels (5) oder, noch einfacher bei der letzten Reihe, mittels des Leibniz-Kriteriums J[8.1], da die Glieder betragsmäßig streng monoton fallen. In diesem Fall ergibt sich ˇ . /ˇ ˇ1 1 1 1 .&1/n ˇˇ ˇ < & C &((( C für n % 2: (7) 0<ˇ & ˇ e 2Š 3Š nŠ .n C 1/Š Bei n D 16 z.B. folgen hieraus die nachstehenden Schranken: 2; 7182 8182 8459 00 < e < 2; 7182 8182 8459 05; also wird mit 12 gültigen Dezimalen nach dem Komma: e D 2;7182 8182 8459 : : : : Verwendet man die erste Reihe für e selbst, so hat man zunächst aus (5) (und da nach B[2.4] e < 3 ist) . / 1 1 1 3 1 0 < e & 1 C C C C ((( C < für n % 0: 1Š 2Š 3Š nŠ .n C 1/Š Bei n D 16 sind auch hier die ersten 12 Dezimalen nach dem Komma gesichert. Insgesamt ist die Numerik nun viel besser als in B[2.4]! (ii) Sei f .x/ ´ cos x, J ´ R, a ´ 0. Hier ist cos.0/ x D cos x;
cos0 x D & sin x;
cos000 x D sin x;
cos.4/ x D cos x; : : :
cos00 x D & cos x;
Die Ableitungen sind durch 1 beschränkt, d.h. in Satz K tun es g.x/ ´ 1; C D 1. Die Ableitungen wiederholen sich nach den angeschriebenen Ordnungen, und das Gleiche gilt für ihre Werte am Zentrum a D 0: 1;
0;
& 1;
0;
1;
::::
403
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
Analog geht es beim Sinus, und man erhält wiederum für alle x 2 R:
cos x D 1 &
x4 x6 x2 C & C &((( ; 2Š 4Š 6Š
sin x D x &
x5 x7 x3 C & C &((( : 3Š 5Š 7Š
Im Folgenden sind einige Taylor-Polynome der Sinusfunktion skizziert: T1 = T2
y
T5 = T6
T9 = T10
1
x
0 1
2
3
4
5
6 sin
-1 T3 = T4
T7 = T8
T11 = T12
Man erkennt, dass der Sinus mit wachsender Ordnung des Taylor-Polynoms immer besser approximiert wird.
M. Folgerung (Irrationalität von e). Die Eulersche Zahl e ist irrational. Beweis. Der folgende Beweis geht auf Fourier zurück: Wäre e D pq mit p; q 2 N, so können wir p % 2 annehmen (notfalls durch Erweitern zu erreichen). Aus (7) ergäbe sich dann für n D p ˇ /ˇ . ˇq 1 1 .&1/p ˇˇ 1 & C &((( C 0 < ˇˇ & ˇ < .p C 1/Š ; p 2Š 3Š pŠ also durch Multiplikation mit pŠ ˇ ˇ . / ˇ ˇ 1 1 1 .&1/p 0 < ˇˇq ( .p & 1/Š & ( pŠˇˇ < & C &((( C < 1: 2Š 3Š pŠ pC1 Dies enthält einen Widerspruch, da der zweite Term eine ganze Zahl ist.
"
N. Beispiel. Die Taylor-Reihe einer C 1 -Funktion kann für alle x konvergieren, ohne die Funktion darzustellen! Definiere f W R ! R als:
404
8 / . ˆ <exp & 1 x2 f .x/ ´ ˆ :0
Kapitel 8 Weiterführung der Analysis
1
für x ¤ 0 für x D 0:
x -3
-2
-1
1
2
3
Diese Funktion ist in C 1 .R/, und es gilt f .k/ .0/ D 0 für alle k 2 N0 . Also hat ihre Taylor-Reihe mit Zentrum 0 lauter Koeffizienten 0, somit die Summe 0 für alle x 2 R, jedoch ist f .x/ > 0 für x ¤ 0! Spitzname für f : flache Wanne. Die C 1 -Eigenschaft von f überlegt man so: Außerhalb des Nullpunktes sieht man durch sukzessives Differenzieren, dass f .k/ die Gestalt hat / . 1 .k/ f .x/ D Rk .x/ ( exp & 2 ; x ¤ 0; x wobei Rk eine rationale Funktion ist. Daraus folgt aber limx!0 f .k/ .x/ D 0. Zunächst gilt nämlich . / 1 &n lim x exp & 2 D 0 für n 2 N; x!0 x wie man durch die Substitution t D 1=x 2 mittels J(iii)[3.7] erkennt. Spaltet man von Rk .x/ die im Nenner auftretende Potenz von x ab, so ergibt sich limx!0 Rk .x/ ( exp.&1=x 2 / D 0. Es folgt dann induktiv die Differenzierbarkeit von f .k/ für k 2 N0 mittels H[4.3] sowie f .k/ .0/ D 0. Die Taylor-Entwicklung einer gegebenen Funktion kann im Prinzip anhand von Satz G diskutiert werden. Allerdings müssen dazu alle Ableitungen der Funktion und ihr Wachstum bekannt sein. Das ist in praktischen Fällen nicht immer der Fall, da formelmäßig gegebene Funktionen oftmals Ableitungen besitzen, die mit wachsender Ordnung nicht mehr überblickbar sind. Für solche Fälle gibt es weitere Verfahren, die wir im Zusammenhang mit Potenzreihen in Abschnitt 8.5 besprechen werden. Komplexe Funktionen einer reellen Veränderlichen Die meisten Ergebnisse dieses Abschnitts lassen sich genauso für Funktionen des Typs f W A ! C bzw. f W J ! C gewinnen, wobei (wie bisher) A , R bzw. J ein Intervall in R ist. Weder in der Formulierung noch in den Beweisen sind dazu wesentliche Änderungen vorzunehmen. Ausnahmen hiervon sind die Zwischenwertvarianten,
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
405
da diese die Anordnung in der Zielmenge benutzen. Insbesondere bleibt die TaylorFormel mit dem Integralrestglied vollständig erhalten und ebenso die Restgliedabschätzung gemäß (5), jedoch nicht das Lagrange-Restglied. Eine wichtige Anwendung dieser Erweiterung ist die folgende Reihendarstellung der allgemeinen Exponentialfunktion: O. Satz. Für alle z 2 C gilt ez D 1 C
1 X z2 z3 z zk C C C ((( D : 1Š 2Š 3Š kŠ kD0
Beweis. Wir halten zunächst z 2 C fest und berechnen die Taylor-Reihe von f W R ! C mit f .t/ ´ e zt . Das Zentrum sei a ´ 0. Die sukzessiven Ableitungen von f existieren und berechnen sich nach der Regel in F[7.3] leicht als f .k/ .t/ D e zt ( z k . Insbesondere gilt am Zentrum f .k/ .0/ D z k , sodass die Taylor-Reihe von f lautet: 1C
z2 2 z tC t C ((( : 1Š 2Š
Tatsächlich stellt sie für alle t 2 R den Funktionswert f .t/ dar. Dies folgt aus dem obigen Kriterium K; denn es gilt jf .k/ .t /j D je zt ( z k j . je zt j ( jzjk , sodass dieses Kriterium mit der stetigen Funktion g.t/ ´ je zt j und der Konstanten C ´ jzj erfüllt ist. Aus der so bewiesenen Darstellung e zt D 1 C
z z2 2 tC t C ((( ; 1Š 2Š
folgt die Behauptung, indem man t D 1 setzt.
t 2R "
P. Bemerkung. Spezialisiert man in der Darstellung von Satz O das z zu z D ix für x 2 R, so folgt: 1 X .ix/k ix e D : kŠ kD0
Trennung von Real- und Imaginärteil links und rechts ergäbe nochmals die TaylorReihen für cos x; sin x mit dem gleichen Ergebnis wie oben in Beispiel L(ii). Schreibweisen: Die höheren Ableitungen werden auch folgendermaßen bezeichnet: ˇ d nf d n f ˇˇ dn d nf .n/ .n/ ; f µ .a/ µ µ f f .a/ µ dx n dx n ˇa dx n dx n und (mit einer gewissen Vorsicht): .f .x//.n/ ´ f .n/ .x/.
406
Kapitel 8 Weiterführung der Analysis
Aufgaben und Anmerkungen 1. Analog zu L(ii) leite man die Taylor-Entwicklungen der Hyperbelfunktionen G[7.2] mit Zentrum a D 0 her und beweise ihre Gültigkeit für alle x 2 R: cosh x D 1 C
x4 x6 x2 C C C ((( ; 2Š 4Š 6Š
sinh x D x C
x3 x5 x7 C C C ((( : 3Š 5Š 7Š
2. Man bestimme zu den folgenden Funktionen mit den angegebenen Zentren a jeweils die Taylor-Reihe und stelle fest, wo die Taylor-Reihe die Funktion darstellt: a) f .x/ D x 4 & 4x 3 C 8x 2 & 8x C 3, a D 1; b) f .x/ D cos2 x, a D 0; c) f .x/ D e x , a D 3; d) f .x/ D
1 , a D &1; x
e) f .x/ D
1 , a D 0; i Cx
f)
i &x , a D 0. i Cx
f .x/ D
3. Für welche positiven x genügen die Kosinus- und Sinusreihen aus Beispiel L(ii) den Voraussetzungen des Leibniz-Kriteriums? 4. Für eine differenzierbare Funktion f W Œ&˛; ˛/ ! C (mit ˛ > 0) zeige man: a) Ist f gerade, so ist f 0 ungerade. b) Ist f ungerade, so ist f 0 gerade. Gilt hiervon jeweils die Umkehrung? Ist f von der Klasse C 1 , so zeige man: c) Ist f gerade, so kommen in der Taylor-Reihe von f mit Zentrum 0 nur gerade Potenzen der Variablen vor. d) Ist f ungerade, so kommen in der Taylor-Reihe von f mit Zentrum 0 nur ungerade Potenzen der Variablen vor. Es ist hierbei nicht erforderlich, dass die Taylor-Reihe konvergiert oder die Funktion darstellt!
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
407
5. Um aus cos x und sin x approximativ x zu berechnen (für kleine jxj), wurden folgende Näherungsausdrücke erfunden: x/
3 sin x µ C.x/ 2 C cos x
x / sin x (
(Formel von Cusanus)
14 C cos x µ N.x/ 9 C 6 cos x
(Formel von Newton):
Die präzise Formel ist natürlich (für jxj < &=2) x D arctan
sin x µ E.x/: cos x
a) In welcher Ordnung stimmen E und C bzw. E und N bei a D 0 überein? Welche der beiden Näherungsformeln ist somit als die bessere zu bezeichnen? b) Man zeige für jxj . &=4: jx & C.x/j . 2 ( 10&3 ;
jx & N.x/j . 10&4 :
Lösungshinweis zu b): Man untersuche die Monotonie der beiden Differenzfunktionen. 6. Zeige für alle x 2 R und n 2 N0 : ˇ ˇ . 2 2nC2 4 2n /ˇ ˇ ˇcos x & 1 & x C x & C ( ( ( C .&1/n x ˇ . jxj ˇ 2Š 4Š .2n/Š ˇ .2n C 2/Š ˇ ˇ . 5 2nC1 /ˇ 3 2nC3 ˇ ˇsin x & x & x C x & C ( ( ( C .&1/n x ˇ . jxj ; ˇ ˇ 3Š 5Š .2n C 1/Š .2n C 3/Š wobei das Vorzeichen der Differenz jeweils gleich .&1/nC1 ist. 7. Für z 2 C mit Re .z/ . 0 und n 2 N beweise man: ˇ ˇ . nC1 2 n /ˇ ˇ z ˇe & 1 C z C z C ( ( ( C z ˇ . jzj : ˇ ˇ 1Š 2Š nŠ .n C 1/Š Lösungshinweis: Man arbeite mit der gleichen Hilfsfunktion wie bei Satz O. 8. Man verallgemeinere das Kriterium von Satz K folgendermaßen: In der Situation von Definition I gebe es eine stetige Funktion g W J ! R sowie eine reelle Folge .Cn /n%0 , sodass für alle n und x 2 J gilt jf .n/ .x/j . g.x/ ( Cn
mit
lim
n!1
Cn jx & ajn D 0: nŠ
Dann konvergiert die Taylor-Reihe von f mit Zentrum a in J und stellt dort f dar.
408
Kapitel 8 Weiterführung der Analysis
9. Eine Umformulierung der Taylor-Formel in Satz G entsteht, indem man wie beim Mittelwertsatz x D a C h setzt. Die Voraussetzungen seien wie in G, insbesondere sei a 2 J fest. Der Zuwachs h variiert natürlich so, dass x D a C h im Intervall J bleibt (d.h. h läuft im „parallel verschobenen“ Intervall Ja ´ J & fag). Dann gilt (8)
f .a C h/ D f .a/ C
wobei (9)
hnC1 Rn .h/ D nŠ
(10)
Rn .h/ D
Z 0
f 00 .a/ 2 f .n/ .a/ n f 0 .a/ hC h C ((( C h C Rn .h/; 1Š 2Š nŠ
1
.1 & )/n f .nC1/ .a C )h/ d )
hnC1 f .nC1/ .a C 2h/ .n C 1/Š
(Integral-Restglied) (Lagrange-Restglied)
mit geeignetem 2 2 Œ0; 1/, das von n; a; x abhängen darf. Mittels (9) folgt weiter: Es gibt genau eine stetige Funktion rn W Ja ! R, sodass für alle h 2 Ja gilt; n X f .k/ .a/ k rn .h/ nC1 f .a C h/ D h C h : kŠ .n C 1/Š kD0
Es ist rn .0/ D f .nC1/ .a/. 10. $ In einer Umgebung von a 2 R sei die reelle Funktion f von der Klasse C nC1 , also f 2 C nC1 .U.a; ı// mit ı > 0 und n % 1. Zu jedem h mit jhj < ı sei ein 2.h/ 2 Œ0; 1/ so bestimmt, dass die Taylor-Formel mit Lagrange-Restglied gilt: f .a C h/ D
n&1 X f .k/ .a/ k f .n/ .a C 2.h/h/ n h C h : kŠ nŠ
kD0
Man beweise: Ist f .nC1/ .a/ ¤ 0, so gilt lim 2.h/ D
h!0
1 : nC1
11. $ Die Funktion f W R ! R sei n-mal differenzierbar (n % 1), und mit festem 2D
1 nC1
gelte für alle x; h 2 R: n&1 X f .k/ .x/ k f .n/ .x C 2h/ n f .x C h/ D h C h : kŠ nŠ kD0
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
409
Zeige: Dann ist f ein Polynom vom Grad . n C 1. Lösungshinweis: Man beweise zunächst, dass f von der Klasse C 1 ist und leite sodann für F ´ f .n/ die Identität F .x Ch/&F .x/ D hF 0 .x Ch/ her. Diese impliziert, dass F affin ist. 12. Es seien die gleichen Annahmen und Bezeichnungen wie bei Aufgabe 9 getroffen. Dann gibt es eine weitere Restglieddarstellung, in der nochmals ein „gewöhnlicher“ Taylor-Term der Ordnung n C 1 absepariert ist. Dazu schreibe man f .a C h/ D
nC1 X kD0
mit
f .k/ .a/ k enC1 .h/ h CR kŠ
.nC1/ .a/ nC1 enC1 .h/ D Rn .h/ & f h R .n C 1/Š
und folgere hieraus lim
h!0
enC1 .h/ R D 0; hnC1
f .nC1/ .a/ Rn .h/ D : .n C 1/Š h!0 hnC1
also
lim
Das Ergebnis kann mittels der Landau-Symbolik (Aufgabe 6[3.5]) so geschrieben werden: f .a C h/ D f .a/ C
f 0 .a/ f .nC1/ .a/ nC1 h C ((( C h C o.hnC1 / 1Š .n C 1/Š
Lösungshinweis zum ersten Teil: Man stelle
f .nC1/ .a/ „künstlich“ als Integral dar. .n C 1/Š
13. Die Legendre-Polynome Pn W R ! R sind definiert durch Pn .x/ ´
1 2n nŠ
dn .x 2 & 1/n ; dx n
n 2 N0 :
Man zeige: a) Pn ist ein Polynom vom Grad n. b) Es gilt Z
1
&1
Pn .x/Pm .x/ dx D 0 Z
1 &1
.Pn .x//2 dx D
.h &! 0/:
2 2n C 1
für n ¤ m aus N0 für n aus N0 :
410
Kapitel 8 Weiterführung der Analysis
c) Pn hat n einfache Nullstellen im Intervall /&1; 1Œ. 14. Mit der folgenden Aussage kann man Funktionen der Gestalt „Polynom mal Sinus“ in geschlossener Form integrieren: Sei g ein Polynom und r ¤ 0 eine reelle Zahl. Man bilde das neue Polynom G´
g .4/ g g 00 & 3 C 5 & C((( : r r r
(Die Summe bricht ab, da die höheren Ableitungen eines Polynoms jenseits des Grades verschwinden.) Man zeige: Z x 1 g.t/ sin rt dt D G 0 .x/ sin rx & G.x/ cos rx C G.0/; r 0 speziell für r ´ & und x ´ 1 G´
Z
g g 00 g .4/ & 3 C 5 & C((( W & & &
0
1
g.t/ sin & t dt D G.0/ C G.1/:
15. Seien f; g; h W A ! R in a 2 A n-mal differenzierbar (für ein n 2 N). Man zeige mittels vollständiger Induktion: a) Die Funktion f C g ist in a n-mal differenzierbar, und es gilt .f C g/.n/ .a/ D f .n/ .a/ C g .n/ .a/: b) Die Funktion f ( g ist in a n-mal differenzierbar, und es gilt die so genannte Leibniz-Regel: 0 ! n X n .n&k/ .n/ f .a/ ( g .k/ .a/: .f ( g/ .a/ D k kD0
c) Ist g.a/ ¤ 0, so ist die reziproke Funktion 1=g in a n-mal differenzierbar (und dann aufgrund von b) auch f =g). d) Im Falle g.a/ ¤ 0 zeige man mittels b): f und h=g stimmen dann und nur dann in a in n-ter Ordnung überein, wenn f ( g und h dies tun. 16. Wiederum mittels vollständiger Induktion beweise man für n 2 N: a) Gegeben seien Funktionen f W A &! R;
g W B &! R
mit
f .A/ , B:
Ist f in a 2 A n-mal differenzierbar und g in b ´ f .a/ n-mal differenzierbar, so ist g ı f in a n-mal differenzierbar. Für n D 2 berechne man explizit .g ı f /00 .a/.
Abschnitt 8.3 Höhere Ableitungen und die Taylor-Entwicklung
411
b) Für die Funktion f W A ! R sei vorausgesetzt: (i) f ist injektiv; (ii) f ist in a 2 A n-mal differenzierbar und f 0 .a/ ¤ 0; (iii) die Umkehrfunktion f &1 W f .A/ ! A ist in b ´ f .a/ stetig. Dann ist f &1 in b n-mal differenzierbar. Für n D 2 berechne man explizit .f &1 /00 .b/. 17. $ In dieser Aufgabe wird die Irrationalität von & bewiesen. Für das Polynom g.x/ ´
x n .1 & x/n nŠ
zeige man: a) g .k/ .0/ D .&1/k g .k/ .1/ 2 Z für alle k 2 N0 . b) Wird zu g nach der Vorschrift von Aufgabe 14 das Polynom G gebildet, d.h. G´ so gilt:
Z
1 0
g g 00 g .4/ & 3 C 5 & C((( ; & & &
g.t/ sin & t dt D G.0/ C G.1/:
Damit beweise man: Die Kreiszahl & ist nicht Quadratwurzel einer rationalen Zahl. Insbesondere ist & selbst irrational. Lösungshinweis: Angenommen, es wäre & 2 D ab mit a; b 2 N. Dann folgt aus der letzten Integralformel Z 1 &an g.t/ sin & t dt D &an G.0/ C &an G.1/: 0
R1 Mittels a) folgere man: &an G.0/; &an G.1/ 2 Z, also 0 &an g.t/ sin & t dt 2 Z. Andererseits zeige man Z 1 &an g.t/ sin & t dt D 0; lim n!1 0
also für genügend große n: 0<
Z 0
1
&an g.t/ sin & t dt < 1;
Widerspruch! Dieser Beweis beruht auf Arbeiten von Niven[1947] und Iwamoto[1949]. Der historisch erste Beweis für die Irrationalität von & geht auf Lambert zurück.
412
Kapitel 8 Weiterführung der Analysis
18. Über die in M und Aufgabe 17 gezeigte Irrationalität von e und & hinausgehend gilt: Beide Zahlen sind transzendent, d.h. nicht Nullstellen von Polynomen mit ganzzahligen Koeffizienten. Diese Transzendenzbeweise sind wesentlich umfänglicher; sie wurden erstmals erbracht von Hermite für e (1873) und von Lindemann für & (1882). Aus der Transzendenz von & kann man folgern, dass & nicht mittels Zirkel und Lineal aus der Einheitsstrecke konstruiert werden kann. 19. Es gibt weitere Darstellungen des Restglieds in der Taylor-Formel, die mit schwächeren Voraussetzungen auskommen, dafür aber nicht die Allgemeinheit der Integraldarstellung erreichen. (Das Integral-Restglied lässt sich auf vektorwertige Abbildungen verallgemeinern, was für die Varianten mit einer Zwischenstelle 2 nicht zutrifft). Folgende Variante stammt von Schlömilch: Sei f W Œa; b/ ! R auf dem ganzen Intervall .n & 1/-mal stetig differenzierbar und auf /a; bŒ n-mal differenzierbar (n 2 N). Zu vorgegebenem p 2 N sei K 2 R so gewählt, dass (11)
f .b/ D
n&1 X
f .k/ .a/
kD0
.b & a/p .b & a/k C ( K: kŠ p
Nun bilde man die Hilfsfunktion '.x/ ´ f .b/ &
n&1 X
f .k/ .x/
kD0
.b & x/k .b & x/p & ( K: kŠ p
Diese ist auf Œa; b/ stetig, auf /a; bŒ differenzierbar und erfüllt '.b/ D 0, aber auch '.a/ D 0 (wegen der Wahl von K). Nach dem Satz von Rolle B[4.3] existiert ein c 2 /a; bŒ mit ' 0 .c/ D 0. Die Berechnung von ' 0 auf /a; bŒ ergibt allgemein ' 0 .x/ D &f .n/ .x/
.b & x/n&1 C .b & x/p&1 K: .n & 1/Š
Somit führt die Bedingung ' 0 .c/ D 0 auf K D f .n/ .c/
.b & c/n&p : .n & 1/Š
Mit der Darstellung c D a C 2.b & a/ gibt dies zusammen mit (11) das Resultat (12)
f .b/ D
n&1 X kD0
f .k/ .a/
.b & a/n .1 & 2/n&p .b & a/k C f .n/ .a C 2.b & a// kŠ p.n & 1/Š
mit einem 2 2 /0; 1Œ, das i. Allg. von a; b; n; p abhängen wird. Der letzte Summand in (12) ist das Schlömilch-Restglied. Für p D n so ergibt sich wieder das LagrangeRestglied, für p D 1 das so genannte Cauchy-Restglied: f .n/ .a C 2.b & a//
.b & a/n .1 & 2/n&1 : .n & 1/Š
413
Abschnitt 8.4 Extrema
8.4 Extrema Die Diskussion der Maxima und Minima reeller Funktionen ist ein klassisches Anwendungsgebiet der Differentialrechnung, insbesondere auch der höheren Ableitungen. Die Taylor-Formel ist dafür ein sehr geeignetes Werkzeug, da sie aus dem Verhalten von Ableitungen an einer festen Stelle Auskunft geben kann über die Beschaffenheit der Funktion in einer Umgebung. Dieser Abschnitt ist naturgemäß rein reell orientiert. Denn Extrema komplexwertiger oder vektorwertiger Funktionen gibt es nicht, weil die Zielmengen nicht angeordnet sind. Wir betrachten eine reelle Funktion f W J ! R, definiert auf einem Intervall J , R mit nichtleerem Inneren. A. Definition. (i) Ein a 2 J heißt lokale oder relative Minimalstelle, wenn eine Umgebung U.a; ı/ existiert, sodass für alle x 2 J \ U.a; ı/ gilt (m)
f .x/ % f .a/I
der Funktionswert f .a/ heißt dann ein lokales oder relatives Minimum von f . (ii) Ein a 2 J heißt (absolute) Minimalstelle, wenn (m) für alle x 2 J gilt; der Funktionswert f .a/ heißt dann das (absolute) Minimum von f . Entsprechende Definitionen hat man für Maximalstellen und Maxima, wobei lediglich die Ungleichung (m) durch (M)
f .x/ . f .a/
ersetzt wird. Der Oberbegriff für „Maximum“ und „Minimum“ ist Extremum. Der Oberbegriff für „Maximal-“ und „Minimal-“ ist Extremal-. Es kann mehrere relative oder absolute Extremalstellen geben und auch mehrere relative Extrema, aber höchstens ein absolutes Minimum und höchstens ein absolutes Maximum. Natürlich ist jede absolute Extremalstelle auch eine relative Extremalstelle, aber nicht notwendig umgekehrt. Wohlbekannt aus A[4.3] ist das folgende Kriterium:
414
Kapitel 8 Weiterführung der Analysis
B. Satz (notwendige Bedingung für innere Extrema). Ist f W J ! R differenzier" bar und a lokale Extremalstelle im Inneren J ı , so gilt f 0 .a/ D 0. C. Satz (hinreichende Bedingungen für Extrema). (i) Am linken Rand: Sei J D Œ˛; ˇŒ mit ˇ 2 R [ f1g sowie f W J ! R differenzierbar in ˛ mit f 0 .˛/ ¤ 0. Gilt f 0 .˛/ > 0, so ist ˛ eine lokale Minimalstelle von f ; gilt f 0 .˛/ < 0, so ist ˛ eine lokale Maximalstelle von f . (ii) Am rechten Rand: Sei J D /˛; ˇ/ mit ˛ 2 R [ f&1g sowie f W J ! R differenzierbar in ˇ mit f 0 .ˇ/ ¤ 0. Gilt f 0 .ˇ/ > 0, so ist ˛ eine lokale Maximalstelle von f ; gilt f 0 .ˇ/ < 0, so ist ˛ eine lokale Minimalstelle von f . (iii) Generell: Sei f W J ! R von der Klasse C n für ein gerades n % 2. Für ein a 2 J sei f 0 .a/ D f 00 .a/ D ( ( ( D f .n&1/ .a/ D 0; f .n/ .a/ ¤ 0: Gilt f .n/ .a/ > 0, so ist a eine lokale Minimalstelle von f ; gilt f .n/ .a/ < 0, so ist a eine lokale Maximalstelle von f . Beweis. Zu (i) und (ii): Anschaulich ist dies klar (vgl. obiges Bild). Präzise: Sei z.B. (i) mit f 0 .˛/ > 0 diskutiert: Wegen lim
x!˛
f .x/ & f .˛/ D f 0 .˛/ x&˛
existiert nach dem Meidungsprinzip ein ı > 0 mit Œ˛; ˛ C ı/ , J derart, dass für x 2 /˛; ˛ C ıŒ gilt f .x/ & f .˛/ > 0: x&˛ Somit ist f .x/&f .˛/ > 0 in J \U $ .˛; ı/. – Entsprechend schließt man bei f 0 .˛/ < 0 bzw. bei (ii). Zu (iii): Nach der Taylor-Formel mit Lagrange-Restglied (6)[8.3] gilt für x 2 J : (1)
f .x/ D f .a/ C
f .n/ .c/ .x & a/n nŠ
mit einem c zwischen a und x. Da die Funktion x 7! f .n/ .x/=f .n/ .a/ stetig (mit Wert 1 in a) ist, existiert nach dem Meidungsprinzip eine Umgebung U.a; ı/ mit: signf .n/ .x/ D signf .n/ .a/ ¤ 0 für alle x 2 U.a; ı/\J . Damit folgt die Behauptung aus (1): Das Vorzeichen von f .x/ & f .a/ ist in U.a; ı/ \ J das gleiche wie das von f .n/ .a/ ( .x & a/n . "
415
Abschnitt 8.4 Extrema
D. Bemerkungen. (i) Bei Satz C handelt es sich in allen Fällen um strikte Extrema, d.h. f .x/ D f .a/ gilt in einer geeigneten Umgebung U.a; ı/ nur für x D a. Unstrikte Extrema lassen sich also mit diesem Satz nicht behandeln; wohl aber gilt auch für sie Satz B. (ii) Durch die gleiche Schlussweise wie bei Satz C(iii) folgt für innere Stellen: Sei f W J ! R von der Klasse C n für ein ungerades n % 3. Ist für ein a 2 J ı : f 0 .a/ D f 00 .a/ D ( ( ( D f .n&1/ .a/ D 0; f .n/ .a/ ¤ 0; so ist a nicht lokale Extremalstelle von f ; vielmehr hat f .x/ & f .a/ auf den beiden Seiten von a nahe a unterschiedliche Vorzeichen. (iii) Relative und absolute Extrema können auch an Stellen vorliegen, wo die obigen Differenzierbarkeitsvoraussetzungen nicht erfüllt sind. Man ist dann gezwungen, auf andere Weise vorzugehen, z.B. durch direkte Überprüfung der Bedingung (m) bzw. (M). Bei einer stetigen Funktion, die auf einer kompakten Teilmenge von R definiert ist, existieren nach dem allgemeinen Extremalprinzip stets absolute Extrema. Leider gibt dieses Prinzip keine Auskunft darüber, wo diese angenommen werden.
Aufgaben und Anmerkungen 1. Wie bei Satz C(iii) zeige man für Extrema am linken Rand: Sei J D Œ˛; ˇŒ mit ˇ 2 R [ f1g sowie f W J ! R von der Klasse C n für ein ungerades n % 3. Gilt f 0 .˛/ D f 00 .˛/ D ( ( ( D f .n&1/ .˛/ D 0; f .n/ .˛/ ¤ 0; so ist ˛ eine lokale Minimalstelle von f , falls f .n/ .a/ > 0, bzw. eine lokale Maximalstelle von f , falls f .n/ .a/ < 0. – Wie lautet das entsprechende Kriterium für Extrema am rechten Rand? Vorbemerkung für die folgenden Aufgaben: Wenn es heißt: „man bestimme die (relativen) Extrema. . . “, so sollen natürlich die (relativen) Extremalstellen mit angegeben und auch gesagt werden, um welche Sorte von Extrema es sich handelt. Nicht vergessen werden dürfen auch die eventuell vorhanden (relativen) Extremalstellen, an denen die benötigten Ableitungen nicht existieren. 2. Man bestimme die relativen Extrema der Funktionen f; g W R ! R: a) f .x/ ´ 3x 5 & 5x 3 ,
b) g.x/ ´ 2 sin x C sin.2x/ .
3. Man bestimme alle relativen Extrema folgender Funktionen sowie Supremum und Infimum ihrer Bildmengen:
416
Kapitel 8 Weiterführung der Analysis
(
a) f W Œ0; 1/ ! R, b) g W R ! R, ' 1 3 c) h W 0; & ! R, 2
x 2 cos.ln.x 2 // für x 2 /0; 1/ 0 für x D 0 q p p g.x/ ´ jxj C jxj & jxj
f .x/ ´
h.x/ D e &x cos x.
4. Man bestimme die relativen und absoluten Extrema der Funktion 1 ' 3& 3 f .x/ ´ sin .1 C sin x/ ; f W 0; & &! R: 3 2
8.5 Potenzreihen Potenzreihen sind Funktionenreihen, die in gewisser Weise Verallgemeinerungen der Polynome sind und ähnliche Vorteile bieten wie z.B. die verhältnismäßig leichte Berechenbarkeit und die Gültigkeit von Identitätssätzen. Potenzreihen spielen außerdem in der komplexen Analysis eine grundlegende Rolle. In Gestalt der Taylor-Reihen sind Potenzreihen bereits in Abschnitt 8.3 aufgetreten, dort allerdings mit reellen Argumenten. Als Anwendungen ergeben sich in diesem Abschnitt weitere TaylorEntwicklungen, insbesondere für den natürlichen Logarithmus, die Arkusfunktionen und die allgemeine Potenzfunktion. Wir betrachten Potenzreihen nun gleich mit komplexen Argumenten. Dieser Abschnitt ist also primär komplex orientiert, jedoch sind die reellen Varianten darin voll enthalten. Bälle bzw. Sphären in C beziehen sich hier auf den komplexen Betrag, sind also Kreisscheiben bzw. Kreislinien. Sie seien mit B.a; r/, B.a; r/ bzw. S.a; r/ bezeichnet. Ist das Zentrum a speziell in R, so stimmt der Durchschnitt B.a; r/ \ R mit dem reellen Intervall /a & r; a C rŒ, also mit der reellen Umgebung U.a; r/, überein. Analog ist dann B.a; r/ \ R D Œa & r; a C r/. A. Definition. Eine Potenzreihe ist eine Funktionenreihe der Gestalt (PR)
1 X
ck .z & a/k :
kD0
Die ck 2 C heißen die Koeffizienten, a 2 C das Zentrum (dies alles ist fest gegeben). Die Variable ist z 2 C. Für a 2 R und z D x 2 R spricht man von einer reellen Potenzreihe. Grundfragen sind die folgenden:
417
Abschnitt 8.5 Potenzreihen
' Für welche z konvergiert eine Potenzreihe? ' Welche Eigenschaften hat ihr Wert als Funktion von z? Wir behandeln gleich die erste Frage. Während bei beliebigen Funktionenreihen sehr unterschiedliche Variablenbereiche zur Konvergenz vorkommen, sind diese bei Potenzreihen geometrisch sehr einfach, nämlich Kreisscheiben um das Zentrum – allerdings mit Ausnahmen auf dem Rande. Für z D a herrscht natürlich immer Konvergenz (gegen c0 ). B. Lemma. Gilt für ein % > 0: limk!1 ck %k D 0, so konvergiert die Potenzreihe (PR) für jz & aj < % punktweise absolut. Beweis. Man findet eine (punktweise) Majorante, indem man für die z mit jz & aj < % schreibt: . / jz & aj k jz & aj jck .z & a/k j D jck %k j ( ; wobei q ´ < 1: % % Der erste Faktor ist beschränkt, etwa . C , wie aus der vorausgesetzten Konvergenz P k folgt (I(i)[2.1]). Somit hat (PR) für jz & aj < % die konvergente Majorante 1 kD0 C q (Vielfaches einer geometrischen Reihe), und die Konvergenz folgt aus N[8.1]. " Nun vergrößert man sinnvollerweise das %, soweit es geht, und gelangt dadurch zum Konvergenzradius: C. Satz und Definition. Setzt man (1)
ˇ , ˚ r ´ sup % % 0 ˇ cn %n &! 0 ;
so gilt: (i) Für jedes % mit 0 . % < r konvergiert die Potenzreihe (PR) absolut-gleichmäßig für jz&aj . % (und erst recht für jz&aj < %). Somit konvergiert sie punktweise absolut für jz & aj < r und stellt dort eine stetige Funktion f dar: (2)
f .z/ ´
1 X
ck .z & a/k ;
jz & aj < r:
kD0
(ii) Für jz & aj > r konvergiert die Potenzreihe (PR) nicht. ˇ , ˚ r heißt Konvergenzradius und B.a; r/ ´ z 2 ˚C ˇ jz &ˇ aj < r Konvergenzkreis , (-scheibe). Bei reellen Potenzreihen ist U.a; r/ D x 2 R ˇ jx & aj < r das Konvergenzintervall.
418
Kapitel 8 Weiterführung der Analysis
Für das Supremum in (1) ist die Erweiterung in (1)[1.4] zu berücksichtigen, d.h. es kann r D 1 sein. In diesem Fall entfällt (ii), und B.a; r/ ist als ganz C bzw. im reellen Fall als ganz R zu lesen. Ist r D 0, so konvergiert die Potenzreihe (PR) nur für z D a, und B.a; r/ bzw. U.a; r/ ist als ¿ zu lesen. Beweis. Zu (i): Ist r D 0, so existiert kein % > 0 mit limk!1 ck %k D 0. Also kann (PR) für jz & aj > 0 nicht konvergieren (C[8.1]). Für z D a herrscht natürlich Konvergenz zur Summe c0 . Sei nun r > 0 und 0 . % < r. Nach (1) existiert ein %$ mit % < %$ . r und lim ck %$ k D 0. Dann gilt für jz & aj . %: k!1
jck .z & a/k j . jck j%k ; P und nach Lemma B konvergiert die Reihe k!1 jck j%k . Diese ist also eine konvergente, von z unabhängige Majorante von (PR) für jz & aj . %. Somit konvergiert (PR) für jz & aj . % absolut-gleichmäßig (C[8.2]). Aufgrund der Ausschöpfung S B.a; %/ folgt die absolute Konvergenz und die Stetigkeit der B.a; r/ D 0<%
"
Für jz & aj D r 2 RC ist keine universelle Konvergenzaussage möglich, d.h. auf dem Rande des Konvergenzkreises hängt es individuell von der Potenzreihe ab, an welchen Punkten sie konvergiert bzw. divergiert. außen keine Konvergenz
C
hier Konvergenz absolut-gleichmäßig
R a-r
a r
a-ρ
ρ Konvergenz unterschiedlich
a+r
a
a+ρ
hier Konvergenz punktweise und absolut im Inneren
Konvergenzkreis und Konvergenzintervall von Potenzreihen
419
Abschnitt 8.5 Potenzreihen
D. Beispiele. Es kann sein: (i)
r D0 z.B. bei
1 X
k k
k z
kD0
(ii)
oder r D 1 1 X zk z.B. bei kk
. / 1 k k k beachte: jk z j D .kjzj/ > 1 für z ¤ 0 und k > jzj ˇ ˇ . / ! ˇ zk ˇ jzj k 1 ˇ ˇ beachte: ˇ k ˇ D . k für k > 2jzj ˇk ˇ k 2
0
kD0
(iii) oder etwa r D 1 1 X zk D z.B. bei
1 (geometrische Reihe). 1&z kD0 Hier herrscht Konvergenz für jzj < 1, Divergenz für jzj % 1.
E. Bemerkung. Ein positiver Konvergenzradius r 2 RC ist natürlich auch dadurch eindeutig festgelegt, dass die Potenzreihe (PR) für jz & aj < r konvergiert und für jz & aj > r divergiert. Entsprechend besagt r D 0 bzw. r D 1 äquivalent, dass (PR) nur für z D a bzw. für alle z 2 C konvergiert. Die Formel (1) zur Bestimmung des Konvergenzradius r ist theoretisch einfach und überzeugend. Jedoch ist die faktische Berechnung von r mit Formeln wie (1) oft mit Schwierigkeiten verbunden, da es keine routinemäßigen Verfahren zur Supremumsermittlung gibt. Praktikablere Methoden ergeben sich aus dem Wurzel- und Quotientenkriterium von Abschnitt 8.1. Dazu setzt man für die gegebene Potenzreihe (PR) ak ´ ck .z & a/k ;
k D 0; 1; 2; : : :
und wendet diese Kriterien auf die ak an. Hierbei wird: ˇ ˇ ˇ ˇ p p ˇ akC1 ˇ ˇ ckC1 ˇ k k ˇ ˇ ˇ ˇ jak j D jck j ( jz & aj; ˇ a ˇ D ˇ c ˇ ( jz & aj: k k p Existiert der Grenzwert ! ´ limk!1 k jck j in R [ f1g und ist z ¤ a, so herrscht nach P[8.1] Konvergenz von (PR) für ! ( jz & aj < 1 und Divergenz für ! ( jz & aj > 1; vgl. auch R(ii)[8.1]. Der Konvergenzradius r ist also r D 1=!, wobei ggf. 1=0 ´ 1 und 1=1 ´ 0 zu setzen ist (entsprechend der Konvention (6)[3.5]). Existiert der Grenzwert ˇ ´ limk!1 jckC1 =ck j in R [ f1g, so ist der Konvergenzradius r nach dem gleichen Argument r D 1=ˇ. Dabei ist allerdings vorauszusetzen, dass die ck ¤ 0 sind. Das beweist die folgenden Standardberechnungen für den Konvergenzradius:
420
Kapitel 8 Weiterführung der Analysis
F. Satz. Für den Konvergenzradius r der Potenzreihe (PR) gilt: p (i) Existiert der Grenzwert ! ´ limk!1 k jck j in R [ f1g, so gilt r D !1 (Wurzelkriterium). ˇ ˇ ˇ ck ˇ (ii) Ist ck ¤ 0 für alle k und existiert der Grenzwert + ´ limk!1 ˇ ckC1 ˇ in R [ f1g, so gilt r D + (Quotientenkriterium). " G. Bemerkungen. (i) Wie immer bei Fragen der Konvergenz kommt es auf ein festes Anfangsstück nicht an. Die Voraussetzung in F(ii) über das Nichtverschwinden der ck braucht also nur ab einem festen Index k0 erfüllt zu sein. (ii) Es kommt häufig vor, dass unendlich viele Koeffizienten ck verschwinden. In solchen Fällen ist der obige Satz nicht direkt anwendbar. Meistens kann man aber die Reihe dann mit einer anderen Indexkopplung zwischen Koeffizienten und Exponenten aufschreiben, und statt des fertigen Satzes die Methode seines Beweises verwenden. Tauchen z.B. in der Potenzreihe nur gerade Exponenten auf, so hat diese mit neuer Nummerierung die Gestalt 1 X dk .z & a/2k : kD0
Dann gilt mit der neuen Setzung ak ´ dk .z & a/2k z.B. für die Wurzelvariante p p k jak j D k jdk j ( jz & aj2 : p Existiert nun der Grenzwert w ´ limk!1 k jdk j in R [ f1g und ist z ¤ a, so 2 2 herrscht Konvergenz für w ( jz p& aj < 1 und Divergenz für w ( jz & aj > 1, d.h. der Konvergenzradius ist r D 1= w. Wir werden am Ende dieses Abschnitts sehen, dass jede konvergente Potenzreihe eine holomorphe Funktion definiert. Eine Vorstufe dazu ist folgendes Lemma: H. Lemma. Hat die Potenzreihe (PR)
1 X
ck .z & a/k
den Konvergenzradius r;
kD0
so hat auch die formale Ableitung (PR’)
1 X kD1
ck k.z & a/k&1
den Konvergenzradius r:
421
Abschnitt 8.5 Potenzreihen
Beweis. Sei r 0 der Konvergenzradius von (PR’). Man betrachtet anstelle von (PR’) das (z & a)-fache 1 X
(PR$ )
ck k.z & a/k :
kD1
Diese Potenzreihe hat den gleichen Konvergenzradius r 0 wie (PR’). Denn für z ¤ a sind beide Reihen nach F(ii)[8.1] zugleich konvergent oder aber zugleich divergent, und für z D a trifft dies sowieso zu. Seien nun die nach (1) zuständigen Mengen so bezeichnet: M ´ f% % 0 j ck %k &! 0g; also r D sup M M $ ´ f% % 0 j ck k%k &! 0g; also r 0 D sup M $ : Dann gilt für % % 0: 1) Aus ck k%k ! 0 folgt ck %k ! 0. Denn die zweite Folge ist das 1=n-fache der ersten. Somit ist M $ , M , also r 0 . r. Vgl. M[1.4] (was trivialerweise auch für nach oben unbeschränkte Mengen richtig ist). 2) Aus ck %k ! 0 und 0 . %$ < % folgt ck k%$k D ck %k ( k.%$ =%/k ! 0. Denn k.%$ =%/k ist Nullfolge nach J(iii)[3.7]. Aus % 2 M folgt somit Œ0; %Œ , M $ , also
% . r 0 (dies ist trivial richtig, wenn % D 0). Daher ist M , Œ0; r 0 /, also r . r 0 . Dies geht nur für r > 0, aber für r D 0 folgt r 0 D 0 bereits aus 1). Insgesamt ist damit gezeigt: r D r 0 .
"
Als Anwendung auf reelle Potenzreihen erhalten wir hieraus zunächst I. Satz (gliedweise Integration und Differentiation von Potenzreihen). Für eine reelle Potenzreihe mit Konvergenzradius r 2 RC [ f1g und die durch sie definierte Funktion (3)
f .x/ ´
1 X
ck .x & a/k
für jx & aj < r D Konvergenzradius
ck .x & a/kC1 kC1
für jx & aj < r D Konvergenzradius
ck k.x & a/k&1
für jx & aj < r D Konvergenzradius:
kD0
gilt: Z (4) (5)
a
x
f .t/ dt D
1 X kD0
f 0 .x/ D
1 X kD1
422
Kapitel 8 Weiterführung der Analysis
Beweis. Dass die Konvergenzradien der beiden Reihen in (4) und (5) gleich r sind, folgt aus Lemma H. Beschränkt man sich zunächst auf jx & aj < % mit einem positiven % < r, so hat man gleichmäßige Konvergenz bei (3) nach C(i) und bei (5) zusätzlich nach Lemma H, sodass man gliedweise integrieren und differenzieren darf; vgl. die Sätze E[5.5] und G[5.5]. Die Gültigkeit von (4), (5) für jx & aj < r folgt wiederum durch AusschöpS fung: U.a; r/ D 0<%
ck D
f .k/ .a/ ; kŠ
k D 0; 1; 2; : : : :
Beweis. Man kann die gliedweise Differentiation (5) sukzessive anwenden: f 0 .x/ D 00
f .x/ D :: :
1 X kD1 1 X kD2
ck k.x & a/k&1
H)
f 0 .a/ D c1 ( 1
ck k.k & 1/.x & a/k&2
H)
f 00 .a/ D c2 ( 2 ( 1 :: : :
Alle diese Potenzreihen haben den gleichen Konvergenzradius r. Die Auswertung bei a rechts entsteht jeweils aus dem ersten Term der Reihe. Offensichtlich ist f .k/ .a/ D ck (kŠ, also gilt (6), und damit hat die Taylor-Reihe von f nach I[8.3] die Koeffizienten ck . " Die Taylor-Reihe einer durch eine Potenzreihe gegebenen Funktion ist also (bei festem Zentrum) eindeutig festgelegt und kann somit auch anders als durch die Vorschrift von I[8.3] bestimmt werden. In vielen Fällen kann man aus vorhandenen Taylor-Reihen neue gewinnen, indem man sowohl die algebraischen Regeln aus F(i)(ii)[8.1] gliedweise durchführt wie auch die Operationen des Differenzierens und Integrierens aus Satz I. Hilfreich sind manchmal auch Substitutionen für die Variable, soweit dadurch wieder Potenzreihen entstehen. Es folgen einige Beispiele, von denen das erste hauptsächlich zur Illustrierung dieser Methoden dient und die weiteren zur Gewinnung einiger fundamentaler Taylor-Reihen. J. Beispiel. Die Funktion sei f .x/ ´ cosh.x 2 / definiert auf R. Es soll die TaylorEntwicklung mit Zentrum a D 0 aufgestellt und die Darstellung von f durch sie diskutiert werden.
423
Abschnitt 8.5 Potenzreihen
Lösung: Man wird nicht versuchen, die sukzessiven Ableitungen f k .0/ zu berechnen, obwohl dies im Prinzip möglich wäre. Stattdessen beachtet man die Definition cosh u D 12 .e u C e &u / und kombiniert alles aus der bekannten Exponentialreihe L(ii)[8.3], aufgeschrieben für u als Variable: 1 X uk exp.u/ D : kŠ kD0
Substitution von u D x 2 bzw. u D &x 2 ergibt zunächst 1 X .x 2 /k exp.x / D ; kŠ 2
kD0
1 X .&x 2 /k exp.&x / D : kŠ 2
kD0
Das sind wiederum Potenzreihen mit Zentrum 0, die für alle x 2 R konvergieren und die jeweilige Funktion darstellen; beide haben also den Konvergenzradius 1. Gliedweise Addition und anschließende Multiplikation mit 1=2 liefert dann, da sich die Glieder mit ungeradem Index herausheben: cosh.x 2 / D
1 X x 2k ; kŠ
kD0
gültig für alle x 2 R. Konvergenzradius ist also wiederum 1. Da diese Reihe eine Potenzreihe mit Zentrum 0 ist, ist sie die gewünschte Taylor-Reihe. Hierdurch hat man also die Berechnung der höheren Ableitungen und die Diskussion des Restglieds gespart! K. Beispiel. Aus der geometrischen Reihe kann man durch Operationen für Reihen z.B. die Taylor-Entwicklungen des natürlichen Logarithmus und des Arkustangens gewinnen. Wir gehen aus von der geometrischen Reihe, und zwar gleich mit dem „elementaren Restglied“ aus D[1.3]: 1 q nC1 D 1 C q C q2 C ( ( ( C qn C 1&q 1&q
für q ¤ 1:
Die Substitution q D &t bzw. dann der Ersatz von t durch t 2 ergibt: (7) (8)
t nC1 1 D 1 & t C t 2 & C ( ( ( C .&1/n t n C .&1/nC1 ; 1Ct 1Ct 2nC2 1 2 4 n 2n nC1 t D 1 & t C t & C ( ( ( C .&1/ t C .&1/ 1 C t2 1 C t2
für t ¤ &1 für t 2 R
424
Kapitel 8 Weiterführung der Analysis
Integration von (7) von 0 bis x > &1 ergibt der Reihe nach: Z x nC1 ˇx h nC1 ix t2 t3 t ˇ nC1 n t ln.1 C t/ˇ D t & C .&1/ C & C ( ( ( C .&1/ dt 0 2 3 nC1 0 0 1Ct ln.1 C x/ D x &
Z x nC1 x2 x3 x nC1 t C & C ( ( ( C .&1/n C .&1/nC1 dt : 2 3 nC1 0 1Ct „ ƒ‚ … µ rn
Die Abschätzung des Endterms rn gestaltet sich je nach Lage von x unterschiedlich. Für 0 . x . 1 gilt: Z jrn j D
x 0
t nC1 dt . 1Ct
Z
x 0
t nC1 dt D
x nC2 &! 0: nC2
Für &1 < x < 0 gilt: ˇ Z jxj nC1 ˇZ x nC1 ˇ ˇ ) t ˇ dt ˇˇ D d) jrn j D ˇ 1&) 0 1Ct 0 Z jxj nC1 ) 1 jxjnC2 . d) D &! 0: 1 & jxj 1 & jxj n C 2 0 Dabei wurde im ersten Integral substituiert: t D &). Der Grenzübergang bezieht sich in beiden Fällen natürlich auf n ! 1. Insgesamt ergibt sich:
ln.1 C x/ D x &
x3 x2 C & C((( 2 3
für &1 < x . 1:
Die rechts stehende Reihe heißt die Logarithmus-Reihe. Sie ist die Taylor-Reihe der Funktion x 7! ln.1 C x/ mit Zentrum 0, und sie stellt diese Funktion in der angegebenen Menge /&1; 1/ dar. Die Reihe konvergiert nicht für x D &1 (wofür sie in das Negative der harmonische Reihe übergeht); ihr Konvergenzradius ist also gleich 1. Auch die Funktion x 7! ln.1 C x/ besitzt für x # &1 keinen eigentlichen Grenzwert. Dagegen ergibt sich für x D 1 ohne weiteres die schöne Summendarstellung: ln 2 D 1 &
1 1 1 C & C &((( : 2 3 4
425
Abschnitt 8.5 Potenzreihen
Integration von (8) von 0 bis x 2 R ergibt der Reihe nach: Z x 2nC2 ˇx h t t5 t 2nC1 ix t3 ˇ arctan t ˇ D t & C .&1/nC1 C & C ( ( ( C .&1/n dt 2 0 3 5 2n C 1 0 0 1Ct arctan x D x &
Z x 2nC2 x5 x 2nC1 t x3 dt : C & C ( ( ( C .&1/n C .&1/nC1 3 5 2n C 1 1 C t2 0 ƒ‚ … „ µ rn
Hier läuft die Abschätzung des Endterms rn für &1 . x . 1 so: Z jrn j D
0
jxj
t 2nC2 dt . 1 C t2
Z 0
jxj
t 2nC2 dt D
jxj2nC3 &! 0: 2n C 3
Also wird arctan x D x &
x5 x3 C & C((( 3 5
für &1 . x . 1.
Die rechts stehende Potenzreihe heißt die Arkustangens-Reihe. Sie hat ebenfalls das Zentrum 0 und den Konvergenzradius 1, wie aus dem Quotientenkriterium F(ii) folgt. Die Reihe stellt aber diesmal die Funktion arctan auf dem ganzen abgeschlossenen Intervall Œ&1; 1/ dar (und ist insbesondere die Taylor-Reihe dieser Funktion mit Zentrum 0). Speziell für x D 1 ergibt sich die so genannte Leibniz-Reihe 1 1 1 & D 1 & C & C &((( ; 4 3 5 7 ein für Mathematiker ästhetischer Genuss, da durch sie die wundersame irrationale Zahl & durch eine einfache Reihe aus rationalen Zahlen aufgebaut wird. Das Vorgehen in diesem Beispiel ist insofern elementar, als von der Taylor-Formel selbst gar kein Gebrauch gemacht wurde. Auch Aussagen über gliedweise Integration oder gleichmäßige Konvergenz sind hierbei entbehrlich. L. Beispiel. Wir leiten die binomische Reihe her, d.h. die Taylor-Reihe der Funktion f .x/ D .1 C x/p ;
p 2 R n N0 fest;
mit Zentrum a D 0:
Wäre der Exponent p 2 N, so handelte es sich um eine natürliche Potenz von 1Cx, die mit der binomischen Formel C[1.3] entwickelt werden könnte. Was wir vorhaben, ist also eine Verallgemeinerung der binomischen Formel auf beliebige reelle Exponenten.
426
Kapitel 8 Weiterführung der Analysis
Allgemeine reelle Potenzen werden gemäß F[3.7] auf die natürliche Exponentialfunktion und den natürlichen Logarithmus zurückgeführt. Hier handelt es sich es also um die Funktion f W /&1; 1Œ ! R mit f .x/ D e p ln.1Cx/ . Sukzessive Ableitungen sind nach H(iv)[4.2] f .x/ D .1 C x/p ;
f .0/ D 1
f 0 .x/ D p ( .1 C x/p&1 ; f 00 .x/ D p ( .p & 1/ ( .1 C x/p&2 ; :: : Offensichtlich gilt (vollständige Induktion):
f 0 .0/ D p f 00 .0/ D p ( .p & 1/ :: :
f .k/ .0/ D p ( .p & 1/ ( ( ( .p & k C 1/: Somit lautet die Taylor-Reihe: 1 1 X X f .k/ .0/ k p ( .p & 1/ ( ( ( .p & k C 1/ k x D x : kŠ kŠ kD0
kD0
Die Koeffizienten
p ( .p & 1/ ( ( ( .p & k C 1/ kŠ werden in Analogie zur binomischen Formel verallgemeinerte Binomialkoeffizienten genannt und auch entsprechend bezeichnet: 0 ! 0 ! p ( .p & 1/ ( ( ( .p & k C 1/ p p (9) ´ für k 2 N; ´ 1: k kŠ 0 ck ´
Der Konvergenzradius der Taylor-Reihe lässt sich wieder mittels der Quotientenformel in F(ii) berechnen: ˇ ˇ ˇ ˇ ˇ ck ˇ ˇ p ( .p & 1/ ( ( ( .p & k C 1/ ˇ .k C 1/Š ˇ ˇDˇ ˇ D k C 1 &! 1I ˇc ˇ ˇ kŠ p ( .p & 1/ ( ( ( .p & k/ ˇ jp & kj kC1 er ist also gleich 1. Damit ist jedoch in keiner Weise gesagt, dass die Funktion durch die Taylor-Reihe dargestellt wird. Zur Lösung des Darstellungsproblems verwenden wir nicht das Restglied, sondern definieren eine neue Funktion durch die erhaltene Reihe 0 ! 1 X p k e x ; für jxj < 1; f .x/ ´ k kD0
e in /&1; 1Œ auf folgendem Wege: f erfüllt die „Differentiund identifizieren f mit f algleichung“ .1 C x/f 0 .x/ D p ( .1 C x/p D p ( f .x/:
427
Abschnitt 8.5 Potenzreihen
e; denn man berechnet nach Genau die gleiche Differentialgleichung erfüllt auch f Satz I in /&1; 1Œ gliedweise: ! 0 0 ! 1 1 X X p p k&1 0 e .k C 1/x k ; kx D f .x/ D kC1 k kD0
kD1
wobei eine einfache Indextransformation vorgenommen wurde. Nun gilt 0 ! p ( .p & 1/ ( ( ( .p & k/ p .k C 1/ D .k C 1/ .k C 1/Š kC1 0 ! p&1 .p & 1/ ( .p & 2/ ( ( ( .p & k/ Dp( ; Dp( kŠ k also
! 0 1 X p&1 k x : f .x/ D p ( k e0
kD0
Multiplikation mit 1 C x ergibt, wobei nach F[8.1] gliedweise gerechnet werden kann: 01 0 ! 0 ! ! 1 X p&1 X p & 1 e0 .x/ D p ( .1 C x/ f xk C x kC1 k k kD0 kD0 0 ! ! ! 01 0 1 X X p&1 p & 1 xk xk C Dp( k&1 k kD1 kD0 0 0 ! 0 ! /! . 1 X p&1 p&1 Dp( 1C C : k k&1 kD1
Dabei wurde im ersten Schritt wieder eine einfache Indextransformation durchgeführt. Nun gilt wie in (6)[1.3] 0 ! 0 ! 0 ! p&1 p&1 p C D k k&1 k mit genau der gleichen Begründung. Es wird also 0 ! 1 X p k e0 .x/ D p ( e.x/: .1 C x/ f x Dp( f k kD0
e0 .x/ D p ( f e.x/ Mit den beiden Gleichungen .1 C x/f 0 .x/ D p ( f .x/ und .1 C x/ f e folgt nun für den Quotienten g.x/ ´ f .x/=f .x/, der in /&1; 1Œ wohldefiniert und
428
Kapitel 8 Weiterführung der Analysis
C 1 ist (da der Nenner dort keine Nullstelle besitzt): e0 .x/ & f e.x/f 0 .x/ f .x/ f D g 0 .x/ D .f .x//2
f .x/
p e e.x/ p f .x/ f .x/ & f 1Cx 1Cx D 0: .f .x//2
e.0/ D 1 ist die Konstante D 1, also Also ist g.x/ D const. und wegen f .0/ D f e g.x/ D 1 und damit f .x/ D f .x/ für alle x 2 /&1; 1Œ. Damit resultiert die binomische Reihe für reelle Exponenten p 2 R n N0 : 0 ! 1 X p k .1 C x/p D x k
für &1 < x < 1;
kD0
wobei der Konvergenzradius gleich 1 ist. Für p 2 N0 besteht die Darstellung ebenfalls: Die Reihe bricht ab und geht in die binomische Formel für .1 C x/p über (mit Konvergenzradius 1). M. Beispiel. Für p D & 21 spezialisiert sich die binomischen Reihe zu: 0 ! 1 X & 12 k 1 1 1(3 2 1(3(5 3 x D 1& xC D x & x C& ( ( ( für &1 < x < 1 p 2 2(4 2(4(6 k 1Cx kD0
mit Konvergenzradius 1. Die Ersetzung von x durch &x 2 ergibt daraus 0 ! 1 X & 21 1 .&1/k x 2k D p k 1 & x2 kD0
D1C
1 2 1(3 4 1(3(5 6 x C x C x C ((( 2 2(4 2(4(6
für &1 < x < 1
ebenfalls mit Konvergenzradius 1. Integration von 0 bis x liefert die ArkussinusReihe: arcsin x D x C
1 ( 3 x5 1 ( 3 ( 5 x7 1 x3 C C C ::: 2 3 2(4 5 2(4(6 7
für &1 < x < 1
wiederum mit Konvergenzradius 1. Die nächsten zwei Aussagen stellen starke Analogien von Potenzreihen und Polynomen heraus. Sie bestehen allgemein für komplexe Potenzreihen und die durch sie dargestellten Funktionen.
429
Abschnitt 8.5 Potenzreihen
N. Satz (Nullstellenalternative für Potenzreihen). Sei % > 0 und f .z/ D
1 X
ck .z & a/k
konvergent für jz & aj < %
kD0
sowie f .a/ D c0 D 0. Dann gilt entweder (i) oder (ii): (i)
Alle Koeffizienten ck sind null. In diesem Fall ist f .z/ D 0 für jz & aj < %.
(ii) Es gibt einen kleinsten Index m 2 N mit cm ¤ 0, d.h. c0 D c1 D ( ( ( D cm&1 D 0; In diesem Fall gilt
cm ¤ 0:
f .z/ D .z & a/m ( f $ .z/;
wobei f $ .z/ darstellbar ist durch eine Potenzreihe mit Zentrum a, die für jz & aj < % konvergiert und f $ .a/ ¤ 0 erfüllt. Eine geeignete Potenz des Linearfaktors z & a ist somit als Faktor abspaltbar und zwar so, dass der Kofaktor das a nicht mehr als Nullstelle besitzt. Der Exponent m heißt dann die Vielfachheit oder Multiplizität der Nullstelle a. Ferner ist a isoliert in der Nullstellenmenge von f . Die positive Zahl % kann gleich dem Konvergenzradius r sein, muss es aber nicht, d.h. es ist % . r erlaubt. Beweis von N. Die formulierte Alternative ist unmittelbar klar. – Bei (ii) spezialisiert sich die vorausgesetzte Potenzreihe für jz & aj < % zu f .z/ D cm .z & a/m C cmC1 .z & a/mC1 C ( ( ( D .z & a/m ( f $ .z/ mit
f $ .z/ ´ cm C cmC1 .z & a/ C ( ( ( :
Offensichtlich gilt f $ .a/ D cm ¤ 0. Wegen f .z/ D .z & a/m ( f $ .z/ konvergiert die Reihe für f $ .z/ mit der für f .z/ (und umgekehrt). Das Zentrum a ist isolierte Nullstelle, da in einer geeigneten punktierten Umgebung von a gilt: z & a ¤ 0 und f $ .z/ ¤ 0, das zweite wegen der Stetigkeit von f $ in a und aufgrund des Meidungsprinzips. " O. Folgerung. Sei % > 0. (i)
Gilt f .z/ D
1 X
ck .z & a/k
konvergent für jz & aj < %
kD0
und existiert eine Folge von Nullstellen aj ¤ a von f mit limj !1 aj D a, so sind alle Koeffizienten ck D 0, also f .z/ D 0 für jz & aj < %.
430
Kapitel 8 Weiterführung der Analysis
(ii) Identitätssatz: Gilt f .z/ ´
1 X kD0
k
ck .z&a/ ;
g.z/ ´
1 X
dk .z&a/k ; beide konvergent für jz & aj < %
kD0
und existiert eine Folge aj ¤ a mit limj !1 aj D a, sodass f .aj / D g.aj / für alle j gilt, so ist ck D dk für alle k 2 N0 , also f .z/ D g.z/ für jz & aj < %. Beweis. Zu (i): Aufgrund der Stetigkeit ist a selbst Nullstelle von f , aber wegen der gemachten Voraussetzung ist a nicht isoliert in der Nullstellenmenge von f . Somit ist nur die Alternative N(i) möglich. Zu (ii): Anwendung von (i) auf f .z/ & g.z/.
"
Man kann den Teil (i) kurz auch so aussprechen: Häufen sich die Nullstellen der Potenzreihe f .z/ im Zentrum a, so ist die Reihe identisch null. Das gilt natürlich speziell auch für reelle Potenzreihen. Warnung: Für C 1 -Funktionen, die nicht durch Potenzreihen dargestellt werden, treffen die Schlüsse aus Folgerung O nicht zu. P. Beispiel. Die Funktion f W R ! R mit f .0/ D 0 und / . 1 1 für x ¤ 0 f .x/ D exp & 2 ( sin x x ist beliebig oft differenzierbar, wie man ähnlich wie bei N[8.3] erkennt. Ihre Null1 stellenmenge ist f0g [ Z0 . Für diese ist 0 ein Häufungspunkt. Jedoch ist f in keiner Nullpunktsumgebung identisch null. y
x
431
Abschnitt 8.5 Potenzreihen
Das Bild zeigt den Graphen dieser Funktion, der zwischen der „flachen Wanne“ und ihrem Spiegelbild hin- und herpendelt, aber um 0 herum kräftig „niedergebügelt“ wird. Q. Bemerkung (alternative Methode zur Grenzwertbestimmung). Es geht hier nochmals um Grenzwerte für Quotienten f .x/=g.x/, für die in Abschnitt 4.5 die Regel von de l’Hospital aufgestellt wurde. Bei Anwendung dieser Regel kommt es vor, dass sehr oft differenziert werden muss. Spalten bei eigentlicher Grenzwertstelle a Zähler und Nenner Potenzen des Linearfaktors x & a ab, so kann man sich dieses häufige Differenzieren ersparen, indem man folgendermaßen vorgeht: Sei a Nullstelle von Zähler und Nenner und seien folgende Faktorisierungen bekannt: f .x/ D .x & a/k ( f $ .x/;
lim f $ .x/ 2 R n f0g;
k 2 N fest
lim g $ .x/ 2 R n f0g;
p 2 N fest:
x!a
g.x/ D .x & a/p ( g $ .x/;
x!a
Dann schreibt man $ .x & a/k ( f $ .x/ f .x/ k&p f .x/ D D .x & a/ : g.x/ .x & a/p ( g $ .x/ g $ .x/ $ .x/ ablesbar, da limx!a fg $ .x/ in R n f0g existiert und das Verhalten von .x & a/ bekannt ist. Übrigens kann man genauso vorgehen, wenn k; p keine natürlichen Zahlen sind (jedoch aus RC sind). f .x/ g.x/ k&p
Daraus ist dann limx!a
Bei Polynomen kann eine Faktorisierung, wie sie hier gebraucht wird, auf elementarem Wege hergestellt werden. Dies war im Zusammenhang mit der Umentwicklung (8)[3.1] diskutiert worden. Bei Potenzreihen ist die Möglichkeit zur Faktorisierung in Satz N diskutiert. R. Beispiel. Das Beispiel in F(i)[4.5] kann mit dieser Methode folgendermaßen behandelt werden:
lim
x!0
x
e &1&x D lim x!0 x.e x & 1/
D lim
x!0
x2 x3 C C ((( 2Š 3Š . / x x2 x C C ((( 1Š 2Š x 1 C C ((( 2Š 3Š D x 1 C C ((( 1Š 2Š
1 2Š 1 1Š
D
1 : 2
432
Kapitel 8 Weiterführung der Analysis
S. Bemerkung. Die Leibniz-Reihe für & in Beispiel K ist sehr reizvoll, aber wegen der langsamen Konvergenz numerisch ungünstig. Bessere Darstellungen für & ergeben sich durch geeignete Kombinationen aus der Arkustangensreihe, z.B. die mittels der Machinschen Formel. Diese lautet: & D 16 arctan
1 1 1 16 X .&1/k 1 4 X .&1/k 1 1 & 4 arctan D & k 5 239 5 2k C 1 25 239 2k C 1 57121k kD0
kD0
Hieraus ergibt sich mit wenigen Anfangsgliedern der Reihe: & D 3;1415 9265 3589 : : : : Der geniale indische Mathematiker Ramanujan hat noch viel rascher konvergierende &-Darstellungen gefunden. Die Machinsche Formel beweist man mit dem Additionstheorem des arctan folgendermaßen: Nach der Verdopplungsformel in 4.4 gilt zunächst 2 arctan
1 D arctan 5
2 5 1 1& 25
D arctan
5 12
und bei nochmaliger Anwendung 5 1 D arctan 4 arctan D 2 arctan 5 12
10 12 25 1& 144
D arctan
120 : 119
Mit dem Additionstheorem des arctan in (F)[4.4] folgt weiter 120 120 & & D arctan C arctan.&1/ D arctan arctan 119 4 119
120 &1 1 119 : D arctan 239 120 1C 119
Nach geringfügiger Umstellung ist dies die Behauptung. Eine klassische Formel zur Bestimmung des Konvergenzradius, die ebenso wie (2) an keine Zusatzvoraussetzung gebunden ist, wird in folgendem Satz angegeben: T. Satz (Wurzelkriterium). Für den Konvergenzradius r der Potenzreihe (PR) gilt: rD
1 : p lim k jck j
k!1
433
Abschnitt 8.5 Potenzreihen
Beweis. Der Beweis läuft nach der gleichen Methode wie vor Satz F, nur dass im Wurzelkriterium statt der „Limes-Versionen“ die „Limes superior-Versionen“ herangezogen werden. Der Vollständigkeit halber hier die ausführliche Fassung: Mit ak ´ ck .z & a/k ;
k D 0; 1; 2; : : : p p p gilt k jak j D k jck j(jz &aj. Der Limes superior * ´ limk!1 k jck j existiert immer in RC 0 [ f1g und ebenso der Limes superior p lim . k jck j ( jz & aj/ D * ( jz & aj; k!1
falls z ¤ a, da ja alle Folgenglieder mit dem gemeinsamen Faktor jz & aj > 0 multipliziert sind. Nach P[8.1] herrscht Konvergenz von (PR) für * ( jz & aj < 1 und Divergenz für * ( jz & aj > 1. Also ist der Konvergenzradius r D 1=*, wobei im Sonderfall * D 0 immer Konvergenz besteht, also r D 1 ist, und im Sonderfall * D 1 nur für jz & aj D 0 Konvergenz herrscht, also r D 0 ist. " Wie gesagt, in den Kriterien F und T ist ggf. 1=0 ´ 1 und 1=1 ´ 0 zu setzen (entsprechend der Konvention (6)[3.5]). Die Darstellungen des Konvergenzradius r in den Sätzen C und T funktionieren theoretisch immer, sind aber manchmal unpraktisch. Die Darstellungen des Konvergenzradius r in Satz F sind zwar praktisch, funktionieren aber nicht immer, nämlich dann nicht, wenn die genannten Limites nicht existieren (obwohl r selbst stets existiert). Zwischen Potenzreihen und holomorphen Funktionen besteht ein äußerst bemerkenswerter Zusammenhang, von dem wir mit den augenblicklichen Hilfsmitteln die eine „Hälfte“ behandeln können: U. Satz. Gegeben sei eine Potenzreihe mit Konvergenzradius r 2 RC [ f1g und die durch sie im Inneren des Konvergenzkreises dargestellte Funktion f .z/ D
1 X
ck .z & a/k ;
jz & aj < r:
kD0
Dann ist f W B.a; r/ ! C holomorph. Beweis. Nach der Holomorphiedefinition in J[7.3] muss eine stetige Funktion g W B.a; r/ ! C gefunden werden, sodass für alle stetig differenzierbaren Funktionen 0 W Œ˛; ˇ/ ! B.a; r/ die Komposition f ı 0 W Œ˛; ˇ/ ! C differenzierbar ist mit der Ableitung (10)
.f ı 0/0 .t / D g.0.t// ( 0 0 .t/ für alle t 2 Œ˛; ˇ/:
434
Kapitel 8 Weiterführung der Analysis
Aus Lemma H ist zu vermuten, dass die formale Ableitung der gegebenen Reihe diese Rolle spielen wird: (11)
g.z/ ´
1 X
ck k.z & a/k&1 ;
jz & aj < r:
kD1
Das wird sich folgendermaßen bewahrheiten: Für eine Funktion 0 wie oben ist die Komposition f ı 0 gegeben durch f .0.t// D
1 X
ck .0.t / & a/k ;
kD0
und ihre Differenzierbarkeit ist gesichert, wenn die Reihe der Ableitungen gleichmäßig konvergiert; vgl. Satz G[5.5]. Diese Reihe ist (12)
1 X
ck k.0.t/ & a/k&1 ( 0 0 .t/ D g.0.t// ( 0 0 .t /;
kD1
also zumindest konvergent. Tatsächlich ist (12) im Intervall Œ˛; ˇ/ gleichmäßig konvergent. Das liegt daran, dass j0.t/ & aj auf diesem Intervall ein Maximum < r besitzt. Das Bild 0.Œ˛; ˇ// ist deshalb in einem Ball B.a; %/ mit % < r enthalten, und auf einem solchen Ball ist die Konvergenz der Reihe (11) gleichmäßig. Das trifft dann auch für den ersten Faktor in (12) zu und ebenso für (12) selbst, da 0 0 .t / auf Œ˛; ˇ/ beschränkt ist. Nunmehr folgt (10) aus (12). " Ergänzend ergibt sich: U. Zusatz. Die komplexe Ableitung von f ist identisch mit der formalen Ableitung:
f 0 .z/ D
1 X
ck k.z & a/k&1 ;
jz & aj < r:
"
kD1
Potenzreihen stellen hiernach holomorphe Funktionen dar. Umgekehrt kann jede holomorphe Funktion lokal durch eine Potenzreihe dargestellt werden. Das ist ein grundlegender Satz, dessen Beweis aber einige einfache Tatsachen aus der mehrdimensionalen Analysis erfordert. Wir kommen darauf in Abschnitt 9.3 zurück. Aufgaben und Anmerkungen 1. Man bestimme die Konvergenzradien der folgenden Potenzreihen:
435
Abschnitt 8.5 Potenzreihen
a)
1 X
1 X 2k .z C i/k ; b) kŠ
k
k.z & 2/ ;
kD0
d)
1 X
kD0
k .z
.&1/
kD1
C 3/2kC1 ; e) k
1 X kD1
i
2 1 X zk c) ; kŠ
kD0
2 1 X kk zk k .z C 1 C i/ ; e) : kŠ .kŠ/Š
k2
kD1
2. Man beweise, dass die geometrische Reihe
1 X
x k im offenen Intervall /&1; 1Œ zwar
kD0
absolut konvergiert, jedoch nicht gleichmäßig.
3. Die Potenzreihe (PR) habe den Konvergenzradius r 2 RC 0 [ f1g, und es sei n o ˇ M0 ´ % % 0 ˇ .ck %k / ist Nullfolge n o ˇ Mb ´ % % 0 ˇ .ck %k / ist beschränkt ˇ 1 + % ˇX Mc ´ % % 0 ˇˇ ck %k ist konvergent : kD0
Man beweise: a) Mc , M0 , Mb . b) Jede dieser drei Mengen ist gleich Œ0; rŒ oder gleich Œ0; r/ (wobei die zweite Möglichkeit bei r D 1 ausscheidet). c) Es gilt
r D sup M0 D sup Mb D sup Mc :
d) Man benenne eine Potenzreihe mit Mc ¤ M0 . e) Man benenne eine Potenzreihe mit M0 ¤ Mb . f)
Gibt es eine Potenzreihe mit Mc ¤ M0 und M0 ¤ Mb ?
4. Man entwickle die auf R definierte Funktion Z x f .x/ ´ sin.2x/ C exp.&t 2 / dt 0
in ihre Taylor-Reihe mit Zentrum 0 und diskutiere Konvergenz und Darstellung. 5. Es seien a; b; p reelle Zahlen mit &a < b < a. Man beweise 0 ! 1 X p p&k k p (13) .a C b/ D a b k kD0
436
Kapitel 8 Weiterführung der Analysis
einschließlich der absoluten Konvergenz der Reihe. Die Gleichung (13) hat formal die gleiche Gestalt wie die binomische Formel (5)[1.3] (nur dass die dortige Summe durch eine (Reihe ersetzt ist), und sie geht in diese über, ) wenn p D n eine natürliche Zahl ist, da kn D 0 für k > n. 6. Man zeige für p 2 RC : Z1
kD0
0
7. Man zeige in R
1 X dt .&1/k D : 1 C tp pk C 1
e e & .1 C x/1=x D x!0 x 2 lim
und folgere daraus die asymptotische Äquivalenz / . 1 y e .y ! 1/: e& 1C Š y 2y 8. Sei % > 0 und f .z/ D
1 X
ck z k konvergent für jzj < %.
kD0
a) Gilt ck % 0 für alle k 2 N0 , so zeige man: jf .z/j . f .jzj/ für alle jzj < %: b) Damit beweise man für z 2 C und n 2 N die Abschätzung / . ˇ 3 jzj n z -n ˇˇ ˇ z jzj ˇ.e & 1C ˇe & 1 C n n und schließe daraus
e z D lim
n!1
3
1C
z -n : n
c) Erfolgt diese Konvergenz in jeder Kreisscheibe B.a; r/ * C gleichmäßig? Vgl. hierzu Beispiel C(iii)[5.5] und (in einem allgemeineren Zusammenhang) Lemma D[8.9]. p 9. Betrachte die Funktion f W RC ! R mit f .x/ ´ cos x. a) Ist f von der Klasse C 1 ? b) Ist f zu einer holomorphen Funktion f W C ! C fortsetzbar?
437
Abschnitt 8.6 Konvexe Funktionen
10. Gleiche Aufgabe wie 9 für die Funktion g W RC ! R mit p sin x g.x/ ´ p : x 11. Für Polynome P; Q gelten die Identitätssätze in folgender verschärfter Form: a) Sei deg.P / . n 2 N0 und N eine natürliche Zahl mit N > n. Gibt es N paarweise verschiedene Stellen z1 ; : : : ; zN in C mit P .zj / D 0 für j D 1; : : : ; N , so folgt P D 0. b) Sei N eine natürliche Zahl mit N > max fdeg.P /; deg.Q/g. Gibt es N paarweise verschiedene Stellen z1 ; : : : ; zN in C mit P .zj / D Q.zj / für j D 1; : : : ; N , so folgt P D Q. 12. Die binomische Reihe in Beispiel L kann mit feineren Hilfsmitteln auch˚auf demˇ ˇ Rand des , Konvergenzintervalls /&1; 1Œ bzw. im Komplexen auf dem Rand z 2 C jzj D 1 des Konvergenzkreises diskutiert werden. Das vollständige Ergebnis findet man z.B. bei Knopp[1996], Nr. 170 und Nr. 247.
8.6 Konvexe Funktionen Wir betrachten Funktionen f W J ! R, definiert auf einem Intervall J mit nichtleerem Inneren. Eine solche Funktion wird man konvex nennen, wenn ihr Graph zwischen je zwei Punkten „nach unten gewölbt“ ist, d.h. niemals oberhalb der Sehne verläuft; vgl. das nächste Bild. Die präzise Definition folgt sogleich. Die Theorie der konvexen Funktionen hat fruchtbare Anwendungen z.B. bei Ungleichungen und in der Praxis, etwa in der konvexen Optimierung. Da Größenvergleiche von Funktionswerten vorgenommen werden, ist dieser Abschnitt reell orientiert.
f
f(x2) f(x1)+t(f(x2)-f(x1)) f(x1)
x x1
x1+t(x2-x1) x2
438
Kapitel 8 Weiterführung der Analysis
A. Definition. Die Funktion f W J ! R heißt konvex, wenn gilt: (1)
f ..1 & t/x1 C tx2 / . .1 & t/f .x1 / C tf .x2 / für alle x1 < x2 aus J und t 2 /0; 1Œ:
Gilt in (1) stets % statt ., so heißt f konkav. (Das ist äquivalent damit, dass &f konvex ist.) Die Sehne ist dabei in etwas ungewöhnlicher Form dargestellt, indem dem Zwischenpunkt x ´ x1 C t.x2 & x1 / D .1 & t/x1 C tx2 auf der x-Achse der Punkt .x; y/ 2 R2 mit der zweiten Koordinate y ´ f .x1 / C t.f .x2 & f .x1 / D .1 & t/f .x1 / C tf .x2 / zugeordnet wird. (Hierdurch ist ausgedrückt, dass das Teilverhältnis t unter einer affinen Abbildung invariant ist.) Eliminiert man t aus diesen Gleichungen für x und y, so erhält man die übliche Geradengleichung durch zwei Punkte: y & f .x1 / D aus der umgekehrt mit t ´
x&x1 x2 &x1
f .x2 / & f .x1 / .x & x1 /; x2 & x1
die obigen Darstellungen für x; y folgen.
B. Lemma. Äquivalent mit (1) ist das monotone Wachsen des Differenzenquotienten: (2)
f .x2 / & f .x/ f .x/ & f .x1 / . x & x1 x2 & x
für alle x1 < x < x2 aus J :
Beweis. Setze in (1) x ´ .1 & t /x1 C tx2 . Dann wird: (3)
x2 & x D .1 & t/.x2 & x1 /;
x & x1 D t.x2 & x1 /:
Damit erhält man für x1 < x < x2 in J die folgende Äquivalenzkette: (1) () f .x/ . .1 & t/f .x1 / C tf .x2 / () f .x/ & f .x1 / . t.f .x2 / & f .x1 // () f .x/ & f .x1 / . t.f .x2 / & f .x/ C f .x/ & f .x1 // () .1 & t/.f .x/ & f .x1 // . t.f .x2 / & f .x// ()
f .x2 / & f .x/ f .x/ & f .x1 / . : x & x1 x2 & x
Dabei wurde beim letzten Schritt mit dividiert) und (3) angewendet.
x2 &x1 .x&x1 /.x2 &x/
> 0 durchmultipliziert (bzw. durch"
Das folgende Bild veranschaulicht das monotone Wachstum des Differenzenquotienten:
439
Abschnitt 8.6 Konvexe Funktionen
f
x x1
x
x2
Im differenzierbaren Fall entspricht dem monotonen Wachsen des Differenzenquotienten das monotone Wachsen der Ableitung: C. Satz. Ist f W J ! R differenzierbar, so gilt die Äquivalenz: f konvex () f 0 monoton wachsend: Beweis. Wir stützen uns auf Lemma B. Zu H) : Macht man in (2) die Grenzübergänge x # x1 bzw. x " x2 , so folgt f 0 .x1 / .
f .x2 / & f .x1 / . f 0 .x2 /: x2 & x1
Zu (H : Nach dem Mittelwertsatz gilt: f .x/ & f .x1 / D f 0 .c1 / x & x1
für ein c1 2 /x1 ; xŒ
f .x2 / & f .x/ D f 0 .c2 / x2 & x
für ein c2 2 /x; x2 Œ:
Wegen f 0 .c1 / . f 0 .c2 / folgt die Monotonie des Differenzenquotienten. D. Folgerung. Ist f W J ! R zweimal differenzierbar, so gilt die Äquivalenz: f konvex () für alle x 2 J W f 00 .x/ % 0:
"
440
Kapitel 8 Weiterführung der Analysis
Beweis. Kombination von C mit E(i)[4.3].
"
Ein weiterer Bezug zu Ungleichungen wird folgendermaßen hergestellt. Dabei werden keine Differenzierbarkeitsannahmen gemacht. E. Satz. Äquivalent mit der Konvexität ist: Für alle n 2 N; x1 ; : : : ; xn 2 J und t1 ; : : : ; tn 2 Œ0; 1/ mit t1 C ( ( ( C tn D 1 gilt f .t1 x1 C ( ( ( C tn xn / . t1 f .x1 / C ( ( ( C tn f .xn /: Man kann t1 x1 C ( ( ( C tn xn als „Schwerpunkt“ der Punkte xi auf der x-Achse mit den „Gewichten“ ti deuten und analog t1 f .x1 / C ( ( ( C tn f .xn / als Schwerpunkt der Punkte f .xi / auf der y-Achse mit den gleichen Gewichten. Die obige Bedingung besagt dann, dass das Bild des Schwerpunkts unterhalb des Schwerpunkts der Bilder liegt oder mit diesem zusammenfällt. Beweis von E. Die Bedingung ist hinreichend: Wende sie speziell für n D 2 an und setze t2 D t. Die Bedingung ist notwendig: Im Fall n D 2 folgt sie aus (1) mit t1 ´ 1 & t; t2 ´ t: f .t1 x1 C t2 x2 / . t1 f .x1 / C t2 f .x2 / zunächst für x1 < x2 und t1 ; t2 2 /0; 1Œ mit t1 C t2 D 1. Dies ist jedoch trivial richtig für x1 D x2 oder t1 D 0 oder t2 D 0, aber auch für x1 > x2 wegen der Symmetrie der Ausdrücke. Für n % 2 macht man eine vollständige Induktion mit dem folgenden Induktionsschluss von n auf n C 1: Es ist also t1 C ( ( ( C tnC1 D 1 vorausgesetzt. O.B.d.A. sei s ´ t1 C ( ( ( C tn ¤ 0. (Für s D 0 wird t1 D ( ( ( D tn D 0, also tnC1 D 1, und die Behauptung ist trivial.) Nun schätzt man ab: f .t1 x1 C ( ( ( C tnC1 xnC1 / D . . / / t1 tn Df s x1 C ( ( ( C xn C tnC1 xnC1 s s . / tn t1 x1 C ( ( ( C xn C tnC1 f .xnC1 / . sf s s . / t1 tn .s f .x1 / C ( ( ( C f .xn / C tnC1 f .xnC1 / s s
.s C tnC1 D 1/ (IA) (IV)
D t1 f .x1 / C ( ( ( C tn f .xn / C tnC1 f .xnC1 /: Dabei weisen die Abkürzungen (IA) bzw. (IV) auf den Induktionsanfang bzw. die Induktionsvoraussetzung hin. Gleichzeitig ergibt sich, dass alle hier vorkommenden Argumente von f wieder in J liegen. "
441
Abschnitt 8.6 Konvexe Funktionen
F. Beispiele. (i) Sei f .x/ ´ e x ; J ´ R. Wegen f 00 .x/ D e x > 0 ist f konvex. Somit gilt nach E für n 2 N: e t1 x1 ( ( ( e tn xn D e t1 x1 C(((Ctn xn . t1 e x1 C ( ( ( C tn e xn : für alle x1 ; : : : ; xn 2 R und t1 ; : : : ; tn 2 Œ0; 1/ mit t1 C ( ( ( C tn D 1. Setzt man e xi µ yi so folgt hieraus (4)
y1t1 ( ( ( yntn . t1 y1 C ( ( ( C tn yn
für alle y1 ; : : : ; yn 2 RC und t1 ; : : : ; tn 2 Œ0; 1/ mit t1 C ( ( ( C tn D 1. Durch Spezialisierung ergeben sich aus (4) weitere häufig gebrauchte Ungleichungen. (ii)
Setzt man in (4): t1 ´ ( ( ( ´ tn ´ n1 , so ergibt sich y1 C ( ( ( C yn p n y1 ( ( ( yn . n
für alle y1 ; : : : ; yn 2 RC . Die linke Seite ist das so genannte geometrische Mittel der Zahlen y1 ; : : : ; yn , die rechte Seite ihr arithmetisches Mittel. Das geometrische Mittel positiver reeller Zahlen ist also stets höchstens gleich dem arithmetischen Mittel. Diese Beziehung heißt die Ungleichung vom geometrischen und arithmetischen Mittel. (iii) Setzt man in (4): n ´ 2, y1 ´ ˛, y2 ´ ˇ sowie t1 ´ sich: (5)
˛ 1=p ( ˇ 1=q .
1 ,t p 2
´
1 , q
so ergibt
ˇ ˛ C p q
für alle ˛; ˇ 2 RC 0 und p > 1, q > 1 mit 1 1 C D 1: p q Zwei solche reellen Zahlen p; q heißen konjugiert. (Z.B. ist p D 2 zu sich selbst konjugiert, da 1=2 C 1=2 D 1, oder p D 3 zu q D 3=2 konjugiert, da 1=3 C 2=3 D 1.) (iv) Seien nun .˛1 ; : : : ; ˛n /, .ˇ1 ; : : : ; ˇn / 2 Rn zwei n-Tupel mit nichtnegativen Komponenten und den Summenbedingungen ˛1p C ( ( ( C ˛np D ˇ1q C ( ( ( C ˇnq D 1 sowie p; q konjugiert wie in (iii). Wendet man (5) auf ˛kp ; ˇkq anstelle von ˛; ˇ an und summiert über k, so folgt n X kD1
˛k ˇk .
1 1 C D 1: p q
442
Kapitel 8 Weiterführung der Analysis
Erfüllen zwei n-Tupel a D .a1 ; : : : ; an /, b D .b1 ; : : : ; bn / mit nichtnegativen Komponenten anstelle der Summenbedingung nur a ¤ 0 und b ¤ 0, so kann man sie „auf 1 normieren“, d.h. übergehen zu ˛k ´ . p X kD1
ak akp
/1=p ;
ˇk ´ . q X
bk
kD1
bkq
/1=q :
Für die ˛k ; ˇk sind dann die Summenbedingungen erfüllt. So erhält man /1=p . X .X /1=q n n n X ak bk . akp ( bkq kD1
kD1
kD1
für alle ak ; bk 2 RC 0 und alle konjugierten p > 1; q > 1. Die Fälle a D 0 oder b D 0 sind hier mit eingeschlossen, da für sie die Ungleichung trivial ist. Erfüllen die ak ; bk keine Vorzeichenbedingung, so kann man zu den Beträgen übergehen und erhält dann die folgende Hölder-Ungleichung für je zwei n-Tupel in Rn und konjugierte p > 1, q > 1: ˇ .X ˇX /1=p . X /1=q n n ˇ ˇ n p q ˇ ˇ a b . ja j ( jb j ; k kˇ k k ˇ kD1
kD1
kD1
wobei die links eigentlich auftretende Summe nochmals mit der Dreiecksungleichung nach unten abgeschätzt wurde. Für p D q D 2 ergibt sich speziell die Cauchy/Schwarz-Ungleichung ˇ .X ˇX /1=2 /1=2 . X n n ˇ ˇ n 2 2 ˇ ˇ : ( b . a a b k kˇ k k ˇ kD1
kD1
kD1
Mit den aus der linearen Algebra bekannten Bildungen ha; bi ´
n X
ak bk
kD1
jaj ´ ha; ai1=2
(Skalarprodukt) v u n uX Dt a2 kD1
k
(Euklidische Standard-Norm)
schreibt sich die Cauchy/Schwarz-Ungleichung als (6)
j ha; bi j . jaj ( jbj:
443
Abschnitt 8.6 Konvexe Funktionen
Mit den offensichtlichen Linearitätseigenschaften dieser Größen ergibt sich hieraus ja C bj2 D ha C b; a C bi D ha; ai C 2 ha; bi C hb; bi . jaj2 C 2jaj ( jbj C jbj2 D .jaj C jbj/2 ; also die Dreiecksungleichung für die Euklidische Standard-Norm: (7)
ja C bj . jaj C jbj:
G. Bemerkung. Der in der linearen Algebra übliche Beweis für die Cauchy/SchwarzUngleichung (6) läuft so: Da die Ungleichung für a D 0 oder b D 0 mit Gleichheit erfüllt ist, kann o.B.d.A. a ¤ 0 und b ¤ 0 angenommen werden, ja sogar jaj D jbj D 1, weil die Ungleichung bei Umnormierung von a oder b auf beiden Seiten den gleichen Faktor aufnimmt. Im Fall jaj D jbj D 1 berechnet man: ja & ha; bi bj2 D 1 & ha; bi2 . Hieraus folgt j ha; bi j . 1 und j ha; bi j D 1 genau für a D ha; bi b. So erkennt man, dass die Cauchy/Schwarz-Ungleichung (6) generell richtig ist und in ihr genau dann das Gleichheitszeichen steht, wenn a ein Vielfaches von b oder b ein Vielfaches von a ist (lineare Abhängigkeit der beiden n-Tupel a; b).
Aufgaben und Anmerkungen 1. In der Dreiecksungleichung (7) für die Euklidische Standard-Norm steht dann und nur dann das Gleichheitszeichen, wenn a und b nichtnegativ proportional sind, d.h. wenn a ein nichtnegatives Vielfaches von b ist oder b ein nichtnegatives Vielfaches von a. Lösungshinweis: Man verwende die gleiche Rechnung wie beim obigen Beweis von (7) und die Gleichheitsdiskussion in der Cauchy/Schwarz-Ungleichung in Bemerkung G. Ein anderer Beweis ist in der folgenden Aufgabe 2 als Spezialfall enthalten. 2. Seien u1 ; : : : ; uk Elemente des Raumes Rn , der wie oben mit der Euklidischen Standard-Norm und dem zugehörige Skalarprodukt versehen sei. a) Durch vollständige Induktion folgere man aus (7) die allgemeine Abschätzungsregel ˇ X ˇX k ˇ ˇ k ˇ ˇ jui j: ui ˇ . ˇ i D1
i D1
b) Um hierin das Eintreten der Gleichheit herauszufinden, ist es gut, die Differenz der beiden Seiten abzuschätzen. Das geschieht unter der Voraussetzung, dass nicht alle ui gleich null sind. Man zeige nämlich (alle Indizes entstammen dem
444
Kapitel 8 Weiterführung der Analysis
Bereich f1; : : : ; kg): X
ˇX ˇ ˇ ˇ jui j & ˇ ui ˇ D
i
i
2
X( ˝ ˛) jui j ( juj j & ui ; uj i<j
X
ˇX ˇ ˇ ˇ jui j C ˇ ui ˇ
i
i
und folgere daraus X( ˝ ˛) jui j ( juj j & ui ; uj 0.
i <j
X
.
jui j
X
ˇX ˇ ˇ ˇ jui j & ˇ ui ˇ
i
i
i
2 .
X( ˝ ˛) jui j ( juj j & ui ; uj i<j
X
jui j
:
i
c) Mit b) beweise man: In der Abschätzungsregel von a) steht genau dann das Gleichheitszeichen, wenn alle ui nichtnegativ proportional zu einem festen Element von Rn sind, d.h. wenn es ein c 2 Rn und Zahlen *1 % 0; : : : ; *k % 0 gibt, sodass ui D *i c für alle i 2 f1; : : : ; kg gilt. 3. Man zeige, dass folgende Funktionen konvex sind: a) f W RC ! R; f .x/ ´ x p
für p . 0 oder p % 1
b) f W R ! R;
f .x/ ´ x 2p
für p 2 N0
c) f W RC ! R;
f .x/ ´ &x p
für p 2 Œ0; 1/
d) f W RC ! R;
f .x/ ´ & ln x:
4. Man zerlege die Definitionsmenge der folgenden Funktionen in möglichst große Intervalle, auf denen die Funktion konvex bzw. konkav ist: a) f W R ! R; f .x/ ´ sin x i & &h b) f W & ; ! R; f .x/ ´ tan x 2 2 1 c) f W R ! R; f .x/ ´ 1 C x2 d) f W R ! R; e) f W RC 0 ! R;
2
f .x/ ´ e &x =2 p p f .x/ ´ 1 C x & x
445
Abschnitt 8.6 Konvexe Funktionen
Warum werden die Trennpunkte solcher Intervalle Stellen mit f 00 .x/ D 0 sein? Punkte x der Definitionsmenge mit f 00 .x/ D 0 heißen deshalb Wendepunkte von f . 5. Eine Funktion ist dann und nur dann konvex und konkav, wenn sie affin ist. 6. Ist eine Funktion f W J ! R gegeben, so seien die Differenzenquotienten so bezeichnet: .ıf /.x1 ; x2 / ´
f .x2 / & f .x1 / x2 & x1
für x1 ¤ x2 aus J :
Für x1 < x < x2 aus J besteht folgende Relation zwischen den drei möglichen Differenzenquotienten: .ıf /.x1 ; x2 / D t.ıf /.x1 ; x/ C .1 & t/.ıf /.x; x2 /;
(8)
wobei t das Teilverhältnis
t´
x & x1 2 /0; 1Œ x2 & x1
bezeichnet. Sei nun f konvex. a) Das monotone Wachsen des Differenzenquotienten aus Lemma B lautet hiermit: Für x1 < x < x2 aus J gilt: .ıf /.x1 ; x/ . .ıf /.x; x2 /: b) Für x1 < x < x2 aus J zeige man weiter mittels (8): .ıf /.x1 ; x/ . .ıf /.x1 ; x2 / . .ıf /.x; x2 /: Der Differenzenquotient ıf ist also bei dieser Konstellation monoton wachsend im ersten Argument und ebenso monoton wachsend im zweiten Argument (jeweils unter Festhaltung des anderen Arguments). 7. Sei f W J ! R konvex. a) f ist auf jedem kompakten Teilintervall von J nach oben beschränkt. Genauer gilt für a < b aus J sup f .Œa; b// . max ff .a/; f .b/g: b) f ist an jeder Stelle a im Inneren J ı rechts- und linksseitig differenzierbar, und es gilt für x1 < a < x2 in J : .ıf /.x1 ; a/ . f&0 .a/ . fC0 .a/ . .ıf /.a; x2 /:
446
Kapitel 8 Weiterführung der Analysis
c) Ist a 2 J ı , so liegt der Graph von f nie unterhalb der Geraden durch a mit den Steigungen f&0 .a/ und fC0 .a/, d.h. für alle x 2 J gilt f .x/ % f .a/ C f&0 .a/.x & a/ f .x/ % f .a/ C fC0 .a/.x & a/: Daraus folgt, dass f in jedem beschränkten Teilintervall von J nach unten beschränkt ist. d) Sind a < b zwei Punkte aus dem Inneren J ı , so ist f auf Œa; b/ Lipschitz-stetig; denn es gilt für a . x1 < x2 . b: fC0 .a/ . .ıf /.x1 ; x2 / . f&0 .b/: Somit ist f im ganzen Inneren J ı stetig. e) Man gebe eine konvexe Funktion f W Œ0; 1/ ! R an, die an den beiden Stellen 0; 1 unstetig ist. f)
Die Menge der Stellen in J , an denen f nicht differenzierbar ist, ist abzählbar. Lösungshinweis: Man ordne Stelle a* 2 J ı , an der f nicht differenzierbar & jeder 0 ist, das nichtleere Intervall f& .a/; fC0 .a/ zu. Je zwei solche Intervalle, etwa für a < b, sind wegen der Ungleichung in d) disjunkt. Nach dem gleichen Schluss wie bei H[3.6] folgt, dass es höchstens abzählbar viele solche Stellen gibt. Hinzu kommen allenfalls noch die beiden Endpunkte von J , falls sie zu J gehören. Insgesamt gilt an allen anderen Stellen f&0 .x/ D fC0 .x/. An diesen ist f differenzierbar.
8. Sei f W J ! R konvex. a) Jede relative Minimalstelle a 2 J von f ist eine absolute Minimalstelle von f . b) $ Existiert mindestens eine Minimalstelle a 2 J von f , so ist die Minimalmenge M ´ fx 2 J j f .x/ D f .a/g ein Intervall (enthalten in J ).
9. Sei f W J ! R konvex. a) Es gilt das so genannte Maximumprinzip: Besitzt f eine Maximalstelle a im Inneren J ı , so ist f konstant. Eventuelle Maxima einer nichtkonstanten konvexen Funktionen können also höchstens in den Randpunkten des Definitionsintervalls angenommen werden (soweit diese zu J gehören). Lösungshinweis: Aufgabe 7c). b) Sind a < c < b in J und liegen die drei Punkte .a; f .a/, .c; f .c/, .b; f .b/ des Graphen auf einer Geraden, so liegt der ganze Graph von f über Œa; b/ auf dieser Geraden. D.h. aus f .c/ D f .a/ C
f .b/ & f .a/ .c & a/ b&a
447
Abschnitt 8.6 Konvexe Funktionen
folgt
f .b/ & f .a/ .x & a/ für a . x . b: b&a Lösungshinweis: Definiere eine Hilfsfunktion durch / . f .b/ & f .a/ .x & a/ : h.x/ ´ f .x/ & f .a/ C b&a f .x/ D f .a/ C
Diese ist auf J definiert und wiederum konvex, und es gilt h.a/ D h.b/ D h.c/ D 0. Auf die Restriktion hjŒa; b/ kann das Maximumprinzip angewendet werden und liefert hjŒa; b/ D 0. 10. Eine konvexe Funktion f W J ! R ist monoton fallend oder monoton wachsend, oder J kann in zwei Teilintervalle zerlegt werden, sodass f im linken Teil monoton fällt und im rechten Teil monoton wächst. Die Trennstelle ist also eine Minimalstelle von f . 11. Sei f W J ! R konvex. a) Die Funktionen f&0 ; fC0 W J ı ! R sind monoton wachsend; vgl. Aufgabe 7 b) und d). Es sei a 2 R [ f&1g bzw. b 2 R [ f1g der linke bzw. rechte Endpunkt von J . Somit existieren nach D[3.6] oder H[3.6] die Grenzwerte lim f&0 .x/; lim fC0 .x/ 2 R [ f&1g;
x#a
x#a
lim f&0 .x/; lim fC0 .x/ 2 R [ f1g:
x"b
x"b
b) $ Ist a 2 J (und damit a 2 R) bzw. b 2 J (und damit b 2 R), so gilt f .a/ % lim f .x/ x#a
bzw.
f .b/ % lim f .x/ x"b
einschließlich der Existenz des Grenzwertes in R. Somit lässt sich eine konvexe Funktion f W J ! R durch Abänderung der Funktionswerte in den zu J gehörenden Endpunkten von J in eine (dann wiederum konvexe) und stetige Funktion f W J ! R verwandeln, wobei die Werte in J ı beibehalten werden. 12. Steht in (1) statt . (bzw. %) stets das echte Zeichen < (bzw. >), so nennt man die Funktion f streng konvex (bzw. streng konkav). a) Man diskutiere die Analoga der Aussagen C und D für die strengen Varianten, wobei E[4.3] samt Zusatz herangezogen werden sollte. b) Die Funktion f .x/ D e x kann hiermit als streng konvex nachgewiesen werden. Man gehe nun die Beispiele in F erneut durch und gewinne aus dieser strengen Konvexität Verschärfungen der resultierenden Ungleichungen.
448
Kapitel 8 Weiterführung der Analysis
13. Sei f W J ! R differenzierbar. Man beweise die Äquivalenz von (i) und (ii) (i)
f ist konvex.
(ii) Für alle a und alle x in J gilt f .x/ % f .a/ C f 0 .a/.x & a/; d.h. der Graph von f liegt nie unterhalb der Tangente. 14. Ist f W J ! R konvex, so gilt speziell (9)
f
3 x C x - f .x / C f .x / 1 2 1 2 . 2 2
für alle x1 ; x2 2 J :
Wird umgekehrt für f dies vorausgesetzt, so beweise man hieraus die Ungleichung von Jensen: 3 x C ( ( ( C x - f .x / C ( ( ( C f .x / 1 n 1 n . f n n für alle n 2 N und alle x1 ; : : : ; xn 2 J sowie die Eigenschaft f ..1 & t/x1 C tx2 / . .1 & t/f .x1 / C tf .x2 / für alle x1 ; x2 2 J und alle rationalen t 2 Œ0; 1/. Ist f außerdem stetig, so zeige man, dass f konvex ist. 15. $ Hat f W J ! R die Eigenschaft (9) und ist f in einem Teilintervall von J mit mehr als einem Punkt beschränkt, so ist f stetig und konvex.
8.7 $ Stammfunktionen rationaler Funktionen und weiterer Typen Für rationale Funktionen gibt es einen formelmäßigen Algorithmus zur Integration, der immer wirkt, sobald man über gewisse Ausgangsdaten verfügt. Der Kern der Sache ist die so genannte Partialbruchzerlegung, ein Verfahren rein algebraischer Natur. Obwohl wir nur reelle rationale Funktionen betrachten, führt der Weg teilweise durch komplexes Gebiet. (Das ist der Grund, warum dieses Verfahren nicht an früherer Stelle beschrieben wurde.) Mit rationalen Funktionen sind weitere Integrale algorithmisch zugänglich, z.B. rationale Verbindungen von trigonometrischen Funktionen oder Wurzelausdrücke einfacher rationalen Funktionen. Die entsprechenden Verfahren werden hier ebenfalls beschrieben.
Abschnitt 8.7
$ Stammfunktionen rationaler Funktionen und weiterer Typen
449
Allerdings darf man nicht erwarten, dass die formelmäßige Integralberechnung unbegrenzt ausgedehnt werden kann. Bereits einfache elementare Ausdrücke besitzen Stammfunktionen, die nichtpmehr durch elementare Funktionen dargestellt werden können, z.B. exp.x 2 / oder 1 C x 4 . Eventuell definieren die zugehörigen Stammfunktionen (die ja bei Stetigkeit durchaus existieren) neue wichtige Funktionstypen. Das ist z.B. bei den Quadratwurzeln aus Polynomen dritten oder vierten Grades der Fall, deren unbestimmte Integrale per Inversion auf die elliptischen Funktionen führen. Rationale Funktionen Die gegebenen rationalen Funktionen werden hier für die reelle Variable x betrachtet, und ihre Zähler und Nennerpolynome sollen nur reelle Koeffizienten besitzen. Die Integration solcher rationaler Funktionen startet mit gewissen Urformen. Später wird der allgemeine Fall auf die Urformen zurückgeführt. A. Satz (Integrale der Urformen). Es bestehen folgende Stammfunktionen, wobei die Gültigkeitsintervalle so gewählt sein müssen, dass sie keine Nullstellen des Nenners enthalten: Z dx (1) D ln jx & aj C c x&a Z 1 1 dx (2) D& C c für n D 2; 3; : : : : n .x & a/ n & 1 .x & a/n&1 (Q) Beim Integral
Z x2
dx C 2px C q
hat man die Unterfälle (Q.1) – (Q.3) zu unterscheiden: (Q.1) p 2 & q D 0: Hier gilt x 2 C 2px C q D .x C p/2 ; d.h. der Nenner hat die doppelte Nullstelle &p; dieser Typ reduziert sich auf (2) für n D 2. (Q.2) p 2 & q > 0: Der Nenner hat zwei verschiedene reelle Nullstellen p a1;2 D &p ˙ p 2 & q und dementsprechend die Faktorisierung x 2 C 2px C q D .x & a1 / ( .x & a2 /:
450
Kapitel 8 Weiterführung der Analysis
Man macht den Ansatz (eine spezielle Partialbruchzerlegung): 1 A1 1 A2 D D C : x 2 C 2px C q .x & a1 /.x & a2 / x & a1 x & a2 Dann sind die Konstanten A1 ; A2 2 R bestimmbar durch Multiplikation mit dem Hauptnenner und Koeffizientenvergleich. Es ergibt sich: Z dx (3) D A1 ( ln jx & a1 j C A2 ( ln jx & a2 j C c: 2 x C 2px C q (Q.3) p 2 & q < 0: Der Nenner hat keine reelle Nullstelle. Quadratische Ergänzung liefert hier: / .. / xCp 2 2 2 2 2 x C 2px C q D .x C p/ C q & p D .q & p / p C1 : q & p2 Mit der Substitution
xCp yDp q & p2
lässt sich der Arkustangenstyp E(ix)[5.4] erreichen, und es folgt: Z 1 dx xCp (4) Dp arctan p C c: 2 x C 2px C q q & p2 q & p2 (D) Beim folgenden „mit x multiplizierten Typ“ führt eine Umrechnung auf Typ (Q) zurück: Z Z xCp&p x dx D dx 2 2 x C 2px C q x C 2px C q Z Z &p dx 1 2.x C p/ dx C D 2 x 2 C 2px C q x 2 C 2px C q Z 1 dx D ln jx 2 C 2px C qj & p ( : 2 2 x C 2px C q (QN) Beim „potenzierten Typ“ entsprechend (Q) kann der Exponent durch die nachstehende Rekursionsformel jeweils um 1 erniedrigt werden, wobei q & p 2 ¤ 0 und n D 2; 3; : : : angenommen ist, da sonst (2) oder Typ (Q) vorliegt: Z 1 xCp dx D ( 2 2 n 2 .x C 2px C q/ 2.n & 1/.q & p / .x C 2px C q/n&1 (5) Z 2n & 3 dx C ( : 2 2 2.n & 1/.q & p / .x C 2px C q/n&1
Abschnitt 8.7
$ Stammfunktionen rationaler Funktionen und weiterer Typen
451
(DN) Beim „potenzierten Typ“ entsprechend (D) führt die folgende Umformung auf Typ (QN) zurück, wobei n D 2; 3; : : :: Z x 1 1 dx D & ( .x 2 C 2px C q/n 2.n & 1/ .x 2 C 2px C q/n&1 (6) Z dx &p( : 2 .x C 2px C q/n Beweis. Die meisten Begründungen sind mit angegeben. Die Partialbruchzerlegung beim Typ (Q.2) wird gleich generell behandelt. Die Formeln (5) und (6) bestätigt man durch Differenzieren beider Seiten. " Der folgende Satz sagt, wie man reelle rationale Funktionen auf die Urformen zurückführen kann. B. Satz (Zurückführung auf die Urformen). Eine beliebige rationale Funktion hat die Gestalt P .x/ ; B.x/ D Q.x/ wobei P; Q Polynome sind mit Q ¤ 0. Es wird nach folgenden Fallunterscheidungen vorgegangen: (i) deg.P / % deg.Q/: Man setzt den Divisionsalgorithmus M[3.1] für Polynome an und erhält: P .x/ R.x/ D G.x/ C ; Q.x/ Q.x/
deg.R/ < deg.Q/
mit neuen Polynomen G; R. Da G unmittelbar integriert werden kann, reduziert man damit auf den nächsten Fall. (ii) deg.P / < deg.Q/ µ n: Man kann nur weitermachen, wenn die Faktorisierung des Nenners gemäß (5)[7.4] bekannt ist: (7) Q.x/ D c(.x&a1 /n1 ( ( ( .x&ar /nr (.x&b1 /m1 .x&b 1 /m1 ( ( ( .x&bs /ms .x&b s /ms ; wobei a1 ; : : : ; ar 2 R die paarweise verschiedenen reellen und b1 ; b 1 ; : : : ; bs ; b s 2 C n R die paarweise verschiedenen echt komplexen Nullstellen von Q sind (mit den entsprechenden Vielfachheiten, die im Exponenten auftreten) sowie c der reelle Leitkoeffizient. Mit den dort definierten reellen Konstanten 2p% ´ &b% & b % 2 R;
q% ´ b% b % 2 RC ;
' D 1; : : : ; s;
schreibt sich (7) als (8) Q.x/ D c (.x &a1 /n1 ( ( ( .x &ar /nr (.x 2 C2p1 x Cq1 /m1 ( ( ( .x 2 C2ps x Cqs /ms ;
452
Kapitel 8 Weiterführung der Analysis
Mit den Daten aus der Faktorisierung (8)erfolgt nun der Ansatz der Partialbruchzerlegung: P .x/ D Q.x/
A11 A1n1 C ((( C x & a1 .x & a1 /n1 C :: : C Ar1 Arnr C ((( C x & ar .x & ar /nr B11 x C C11 B1m1 x C C1m1 C 2 C ((( C 2 x C 2p1 x C q1 .x C 2p1 x C q1 /m1
C (9)
C :: : C C
Bs1 x C Cs1 Bsm x C Csms : C ((( C 2 s x 2 C 2ps x C qs .x C 2ps x C qs /ms
Hierin sind alle mit großen Buchstaben auf der rechten Seite bezeichneten Größen zunächst unbekannte reelle Konstanten. Man nennt die Ausdrücke auf der rechten Seite Partialbrüche. Die Bestimmung dieser Konstanten geschieht durch Multiplikation von (9) mit dem Hauptnenner Q.x/ und Koeffizientenvergleich der resultierenden Polynomidentität. So entsteht für diese Konstanten ein lineares Gleichungssystem. Dieses ist eindeutig lösbar. Beweis. Der Nachweis, dass dies allgemein möglich ist, gestaltet sich recht aufwendig und erfordert Hilfsmittel, die uns zu weit von der Analysis wegführen würden. Daher erfolgt hier ausnahmsweise keine Beweisführung. In jedem konkreten Fall ist der Beweis jedoch erbracht, wenn das entstehende lineare Gleichungssystem eindeutig lösbar ist (oder auch durch die Probe). " Die Hürde, welche die Götter vor die Partialbruchzerlegung gesetzt haben, ist die Bestimmung der Nullstellen des Nennerpolynoms einschließlich ihrer Vielfachheiten. Die Verfahren dafür sind spärlich gesät. Bei ganzzahligen Koeffizienten kommt man manchmal mit dem Lemma von Gauß O[3.1] weiter. Sobald man eine Nullstelle gefunden hat, kann man mit dem Divisionsalgorithmus den Grad um 1 erniedrigen. Numerisch kann man zwar die reellen und komplexen Nullstellen beliebig genau berechnen, kritisch in der Numerik ist aber die Frage der Vielfachheiten.
Abschnitt 8.7
$ Stammfunktionen rationaler Funktionen und weiterer Typen
453
C. Beispiel. Berechne das Integral Z 5 x C 2x 4 C x 3 C x 2 C 2x C 2 J ´ dx: x3 C 1 Lösung: 1. Schritt: Divisionsverfahren: Da der Zählergrad % dem Nennergrad ist, kann man ein Polynom abdividieren. Der Divisionsalgorithmus ergibt .x 5 C 2x 4 C x 3 C x 2 C 2x C 2/ W .x 3 C 1/ D x 2 C 2x C 1 C
x3
1 : C1
2. Schritt: Faktorisierung des Nennerpolynoms: Dieses ist x 3 C 1. Offensichtlich hat es die Nullstelle x1 D &1. Zugehöriger Linearfaktor ist x&x1 D xC1. Das Abspalten dieses Linearfaktors mit dem Divisionsalgorithmus ergibt x 3 C 1 D .x C 1/ ( .x 2 & x C 1/: Der Kofaktorqx 2 & x C 1 hat als Polynom zweiten Grades die nichtreellen Nullstellen x2;3 D
1 2
˙
1 4
& 1, also ist die reelle Faktorisierung von x 3 C 1 bereits erledigt.
3. Schritt: Ansatz der Partialbruchzerlegung: A Bx C C 1 D C 2 3 x C1 xC1 x &xC1
ˇ ˇ ˇ ( .x 3 C 1/ ˇ
1 D A.x 2 & x C 1/ C .Bx C C /.x C 1/ 1 D A.x 2 & x C 1/ C Bx 2 C Bx C C x C C 1 D .A C B/x 2 C .&A C B C C /x C A C C: Koeffizientenvergleich führt auf das lineare Gleichungssystem: A C B &A C B A
C C C C
D 0 D 0 D 1:
Die Auflösung liefert eindeutig: AD
1 ; 3
BD&
1 ; 3
C D
2 ; 3
und die Probe stimmt. Somit lautet die Partialbruchzerlegung: x3
1 1 1 x&2 1 D & : 2 C1 3 xC1 3 x &xC1
454
Kapitel 8 Weiterführung der Analysis
4. Schritt: Urformen anwenden: Nach Schritt 1 gilt:
Z
.x 2 C 2x C 1/ dx D
1 3 x C x 2 C x C c: 3
Nach Schritt 3 gilt: Z 1 dx D ln jx C 1j C c xC1 Z
Z 2x & 1 & 3 1 x&2 dx D dx 2 x &xC1 2 x2 & x C 1 Z Z 2x & 1 dx 3 1 D dx & 2 2 2 x &xC1 2 x &xC1 1 x& 1 3 1 D ln jx 2 & x C 1j & r arctan r 2 C c: 2 2 3 3 4 4
5. Schritt: Zusammensetzung: J D
1 3 1 1 1 2x & 1 C c: x C x 2 C x C ln jx C 1j & ln.x 2 & x C 1/ C p arctan p 3 3 6 3 3
Das Nennerpolynom hat die einzige reelle Nullstelle &1. Deshalb sind die beiden Gültigkeitsbereiche für die gewonnene Integralformel /&1; &1Œ und /&1; 1; Œ. „Über die Singularität bei x D &1 kann nicht hinwegintegriert werden.“ Die Betragszeichen beim ersten ln-Term müssen stehen bleiben, die beim zweiten ln-Term können entfallen, da x 2 & x C 1 für reelle x stets positiv ist. D. Bemerkung. Es gibt auch eine komplexe Partialbruchzerlegung für komplexe rationale Funktionen. Diese hat die gleiche Gestalt wie (9), nur dass die Terme der zweiten Sorte mit den quadratischen Nennern entfallen und stattdessen bei den Termen der ersten Sorte alle komplexen Nullstellen zu berücksichtigen sind. Insofern ist die äußere Gestalt der komplexen Partialbruchzerlegung eher einfacher als die obige reelle Variante. Funktionen von Kosinus und Sinus Hier handelt es sich um Integranden, die in rationaler Weise aus cos x und sin x aufgebaut sind: Z (10) R.cos x; sin x/ dx:
Abschnitt 8.7
$ Stammfunktionen rationaler Funktionen und weiterer Typen
455
Dabei ist R eine reelle rationale Funktion von zwei Veränderlichen ,; 1 der Gestalt (11)
R.,; 1/ D
P .,; 1/ ; Q.,; 1/
wobei P; Q Polynome in ,; 1 sind, d.h. von der Bauart P .,; 1/ D
n X m X
aij , i 1j ;
Q.,; 1/ D
iD0 j D0
n X m X
bk` , k 1`
kD0 `D0
mit reellen Koeffizienten aij ; bk` . Natürlich sei Q ¤ 0, d.h. es verschwinden nicht alle bk` . Hier hilft eine Substitution, die wir aus der transzendenten Parametrisierung der Einheitskreislinie kennen. Vgl. N[4.4] und (7)[4.4]. E. Satz (Universalsubstitution). Zur Behandlung des Integraltyps (10) verwendet man die Substitution x () x D 2 arctan t: t D tan 2 Diese vermittelt eine bijektive Zuordnung zwischen den t 2 R und den x 2 /&&; &Œ, die in beiden Richtungen von der Klasse C 1 ist. Die Funktion tan x2 dient also dazu, cos x und sin x in rationaler Weise zu parametrisieren, und dasselbe gilt dann auch noch für die Ableitung: cos x D
1 & t2 ; 1 C t2
sin x D
2t 1 C t2
1 2 dt dx D2( ; dx D : 2 dt 1Ct 1 C t2 Damit geht das Integral (10) über in / Z . 2t dt 1 & t2 ; ; ( 2 R 2 2 1Ct 1Ct 1 C t2 also in ein Integral einer rationalen Funktion von t . (Wie immer bei Anwendung der Transformationsformel für unbestimmte Integrale muss die Substitution nach Ausführung des neuen Integrals rückgängig gemacht werden.) " F. Beispiel. Z
Z
2 dt 1 C t2
Z
2 D dt D 1 & t 2 C 2t 2t 1 & t2 C 1 C t2 1 C t2 ˇ ˇ p x ˇ ˇ ˇ ˇ p p p ˇ ˇ ˇ ˇ tan C . 2 & 1/ 2 ˇ t C . 2 & 1/ ˇ 2 ˇ ˇ 2 D ln ˇ ln ˇ p ˇCc D ˇ C c: p ˇ t & . 2 C 1/ ˇ ˇ tan x & . 2 C 1/ ˇ 2 2 ˇ ˇ 2
dx D cos x C sin x
456
Kapitel 8 Weiterführung der Analysis
Dabei wurde die Integration der rationalen Funktion von t mit eine Urform durchge2 führt, nämlich mit Typ (Q.2) aus Satz p A, da das Nennerpolynom 1 & t C 2t zwei verschiedene reelle Nullstellen 1 ˙ 2 besitzt. Wie gesagt, nach Ausführung des neuen Integrals muss resubstituiert werden. Das ist zwar in der Schreibweise nicht immer sichtbar, muss aber „im Kopf“ behalten werden. Die Nullstellen des Nenners cos x C sin x sind &&=4 C k& für k 2 Z. Die erzielte Stammfunktion ist als nur in den offenen Intervallen zwischen je zwei solchen aufeinander folgenden Nullstellen gültig. Bei der Berechnung zugehöriger bestimmter Integrale ist das zu beachten. Man kann aber dann entweder die Stammfunktion für x oder die für t verwenden, natürlich bei t mit den richtig transformierten Grenzen. Z.B. ist Z0=2 0
ˇ ˇ30=2 p x ˇ ˇ p ˇ tan C . 2 & 1/ ˇ p 2 dx 6 2 ˇ ˇ7 2 D4 ln ˇ 2/; ln.3 C 2 D ˇ 5 p ˇ tan x & . 2 C 1/ ˇ cos x C sin x 2 2 ˇ ˇ 2 0 2
p
aber mit dem gleichen Ergebnis auch Z0=2 0
dx D cos x C sin x
p p ˇ' ˇ p 2 2 ˇˇ t C . 2 & 1/ ˇˇ 1 2/; D ln.3 C 2 lnˇ p 2 2 t & . 2 C 1/ ˇ 0
1p
da dem x-Intervall Œ0; &=2/ das t -Intervall Œ0; 1/ entspricht. Will man nur ein bestimmtes Integral berechnen, so reicht die Stammfunktion bzgl. der neuen Variablen und die Umrechnung der Grenzen auf diese, wie in D[5.3] und G[5.3] dargelegt.
Funktionen mit Quadratwurzeln aus quadratischen Polynomen Der allgemeinste Typ hat die Bauart Z (12)
R.x;
p a C 2bx C cx 2 / dx;
c ¤ 0; ac & b 2 ¤ 0;
wobei R eine rationale Funktion von zwei Veränderlichen wie in (11) ist und a; b; c reelle Konstanten mit den angeschriebenen Nebenbedingungen sind. (Die erste sichert, dass der Radikand wirklich x 2 enthält; die zweite schließt den Fall aus, dass der Radikand zwei zusammenfallende reelle Nullstellen hat, also konstant proportional zum Quadrat einer affinen Funktion ist.) Durch quadratische Ergänzung des Radikanden kann sein Anteil vom Grad 1 „wegtransformiert“ werden. Das motiviert, dass man zunächst wieder einfache Urformen wie in den folgenden Beispielen betrachten sollte.
Abschnitt 8.7
$ Stammfunktionen rationaler Funktionen und weiterer Typen
457
G. Beispiele. (i)
a D 1; b D 0; c D &1: Das Integral ist dann Z p J1 ´ R.x; 1 & x 2 / dx;
wobei pdie Wurzel nur für jxj . 1 sinnvoll ist. Die Idee ist nun folgende: Die Größen x und 1 & x 2 µ y sollten durch rationale Funktionen parametrisiert werden. Es gilt x 2 C y 2 D 1, d.h. der Punkt .x; y/ liegt auf der Einheitskreislinie S1 . Solche Punkte lassen sich in der Tat nach Lemma N[4.4] rational durch einen Parameter t erfassen (bis auf den Punkt .&1; 0/). Das motiviert die Substitution: r 1 & t2 1&x xD () t D : 2 1Ct 1Cx Diese vermittelt eine bijektive Beziehung zwischen den t 2 Œ0; 1Œ und den x 2 /&1; 1/, die in der Richtung t 7! x von der Klasse C 1 (allerdings monoton fallend) ist. Aufgrund der Beziehungen p 1 & x2 D
2t ; 1 C t2
dx 4t D& dt .1 C t 2 /2
entsteht aus J1 ein Integral einer rationalen Funktion von t . (ii) a D &1; b D 0; c D 1: Das Integral ist dann Z p J2 ´ R.x; x 2 & 1/ dx; wobei die Wurzel nur für jxj % 1 sinnvoll ist. Eine analoge Motivierung wie bei (i) wäre auch hier möglich (statt der Kreislinie x 2 C y 2 D 1 hätte man die Hyperbel x 2 & y 2 D 1 rational zu parametrisieren). Im Ergebnis substituiert man hier wie folgt: r 1 C t2 x&1 () t D : xD 2 1&t xC1 Diese Formeln vermitteln eine bijektive Beziehung zwischen den t 2 Œ0; 1Œ und den x 2 Œ1; 1Œ bzw. den t 2 /1; 1Œ und den x 2 /&1; &1Œ. Die erste ist in der Richtung t 7! x von der Klasse C 1 , die zweite in beiden Richtungen. Aufgrund der Beziehungen p 2t dx 4t x2 & 1 D 2 ; D ; jt & 1j dt .1 & t 2 /2 die beide Fälle abdecken, entsteht aus J2 jeweils ein Integral einer rationalen Funktion von t.
458
Kapitel 8 Weiterführung der Analysis
(iii) a D 1; b D 0; c D 1: Das Integral ist dann Z p J3 ´ R.x; x 2 C 1/ dx; wobei diesmal die Wurzel für alle x 2 R sinnvoll ist. Eine gute Substitution ist hier (wieder motivierbar über eine rationale Parametrisierung der Hyperbel &x 2 C y 2 D 1): p t2 & 1 () t D x C x 2 C 1: xD 2t Diese stellt eine bijektive Beziehung her zwischen den t 2 RC und den x 2 R, die in beiden Richtungen C 1 ist. Wegen p
x2 C 1 D
t2 C 1 ; 2t
dx t2 C 1 D dt 2t 2
führt sie das Integral J3 in ein Integral einer rationalen Funktion von t über. Die Urformen sind nun leicht vom beliebigen Fall aus erreichbar: H. Satz. Das Integral (12) kann vermöge der quadratischen Ergänzung / .3 b -2 ac & b 2 a C 2bx C cx 2 D c x C C c c2 und dadurch möglicher affiner Substitution in eine der Urformen und damit schließlich in ein Integral einer rationalen Funktion transformiert werden. Beweis. Ist z.B. c > 0 und ac&b 2 < 0, so setzt man die obige quadratische Ergänzung fort mit der Formel 0. ! -/2 3 2 jac & b j c b a C 2bx C cx 2 D c &1 xC p c2 c jac & b 2 j . / b 2 & ac 3 b C cx -2 D &1 : p c b 2 & ac Die richtige affine Substitution ist also b C cx : ,Dp b 2 & ac Analog verfährt man mit geringfügigen Abänderungen in den Fällen c > 0, ac & b 2 > 0 und c < 0, ac & b 2 < 0. Der Fall c < 0, ac & b 2 > 0 kann nicht vorkommen, da dann der Radikand stets negativ wäre. "
Abschnitt 8.7
$ Stammfunktionen rationaler Funktionen und weiterer Typen
459
I. Bemerkung. Bei den obigen Urformen in G kann man auch andere Substitutionen anwenden, z.B. Z p für R.x; 1 & x 2 / dx W x D cos t Z p für R.x; x 2 & 1/ dx W x D cosh t Z p für R.x; x 2 C 1/ dx W x D sinh t: Im ersten Fall gelangt man damit zu einer rationalen Funktion von Kosinus und Sinus, die mit der Universalsubstitution von Satz E weiter behandelt werden kann. Im zweiten und dritten Fall ist der neue Integrand letztlich eine rationale Funktion von e t , die mit der weiteren Substitution , D e t auf eine rationale Funktion von , führt. Ob diese Substitutionsvarianten insgesamt einfacher sind, lässt sich nur im Einzelfall entscheiden. Unter den genannten Voraussetzungen führen die Methoden der obigen Sätze immer zum Ziel, jedoch kann man gelegentlich auch anders und schneller vorgehen. Die universellen Verfahren wird man also nur als letzte Möglichkeit in Betracht ziehen. Die folgenden Beispiele sollen das illustrieren: J. Beispiele. (i) Kommt die Ableitung einer möglichen Substitutionsfunktion als Faktor im Integranden vor, so sollte man als Erstes diese Substitution in Betracht ziehen. Denn ein Integrand der Form f .h.x//h0 .x/ dx geht durch die Substitution t D h.x/ in den Integranden h.t / dt über. Natürlich muss dabei sichergestellt sein, dass die Voraussetzungen der Transformationsformel D[5.3] erfüllt sind. Einfache Beispiele sind Z Z Z sin x dt tan x dx D dx D & D & ln jtj C c D & ln j cos xj C c; cos x t wobei t D cos x substituiert wurde, oder Z Z dx D dt D t C c D tan x C c; cos2 x wobei t D tan x substituiert wurde, was nahe liegt, da die Ableitung von tan x gleich 1= cos2 x ist. (ii) Integranden mit trigonometrischen Funktionen lassen sich oft mit den zahlreichen Umformungsmöglichkeiten dieser Funktionen behandeln. Z.B. können Produkte
460
Kapitel 8 Weiterführung der Analysis
von Kosinus und Sinus (auch mit proportional veränderten Argumenten) in Summen verwandelt werden, die einfach zu integrieren sind. Das geschieht aufgrund der Formeln aus M(iv)[4.4], die mit leichten Abänderungen in folgende Ausdrücke mit reellen Konstanten ˛; ˇ übergehen: 2 cos ˛x cos ˇx D cos.˛ C ˇ/x C cos.˛ & ˇ/x 2 sin ˛x sin ˇx D cos.˛ & ˇ/x & cos.˛ C ˇ/x 2 cos ˛x sin ˇx D sin.˛ C ˇ/x & sin.˛ & ˇ/x: Als Spezialfälle hiervon erhält man die folgenden oft gebrauchten bestimmten Integrale: Z 20 Z 20 cos kx cos `x dx D sin kx sin `x dx D &ık` für k; ` 2 N 0
Z
0
0
20
cos kx sin `x dx D 0
für k; ` 2 N0 :
Dabei ist ık` das sog Kronecker-Symbol, definiert durch ( 1 für k D ` ık` D 0 für k ¤ `: Soweit bei den Integralen 0 herauskommt, spricht man von den Orthogonalitätsrelationen der trigonometrischen Funktionen. (iii) Integranden mit hyperbolischen Funktionen lassen sich mit ähnlichen Verfahren wie bei den trigonometrischen Funktionen behandeln, da der „hyperbolische Formelapparat“ weitgehende Analogien mit dem der trigonometrischen Funktionen besitzt Solche Integranden sind natürlich immer auch durch die Exponentialfunktion e x ausdrückbar. Aufgaben und Anmerkungen 1. Man berechne folgende Integrale: Z
Z
x3 C x2 C x C 1 dx; .x 2 C x C 1/2 / Z . 1&x 3 dx; c) x Z 1 C x2 dx; e) .x & 1/2 .x C 2/
a)
b) Z
3x 2 C 4 dx; x 3 C x 2 & 8x & 12
x2 & 1 dx; .x & 1/.x & 2/.x & 3/ Z 3 x -3 f) dx: 1&x
d)
Abschnitt 8.8
$ Spezielle Konvergenzkriterien für Reihen
Z 2. Für n D 0; 1; 2; 3; 4 berechne man die Integrale
461 xn dx: 1 C x4
3. Man berechne folgende Integrale (für 0 < j˛j < &=2 bzw. a ¤ 0): Z Z Z cos2 x 1 & tan x a) dx; b) dx; c) tanh x dx; sin x 1 C tan x Z0=2 d) 0
dx ; 2 C sin x
Z0=2 e) 0
4. Man berechne folgende Integrale: Z p Z dx 2 a) x & 2x & 1, b) , p x x2 C 1
8.8
Za
dx dx; 1 C cos ˛ cos x
f) 0
Z c)
dx : 1 C cosh a cosh x p
1 & x2 dx. p 1 C 1 & x2 1&
$ Spezielle Konvergenzkriterien für Reihen
Die Darstellung von Zahlen oder Funktionen durch Reihen ist ein grundlegendes Werkzeug der Analysis. Oftmals werden neue Objekte erst dann konkret zugänglich, wenn sie durch eine Reihe erfasst werden können. Man hat daher viele Hilfsmittel zur Handhabung von Reihen und zur Untersuchung ihrer Konvergenz entwickelt. Einige dieser Methoden, die über das bisher Gesagte hinausgehen, werden hier vorgestellt. Hilfsmittel sind gewisse Umformungen und Abschätzungen der Teilsummen, die teils spezieller Natur sind teils aber auch prinzipielle Bedeutung haben, wie z.B. die Abelsche partielle Summation. Soweit es sich um absolute Konvergenz handelt, lassen sich viele Dinge auf den vektorwertigen Fall übertragen. Diese werden wir später in dem entsprechenden Zusammenhang behandeln. Bei den Reihen mit reellen Gliedern kann und wird natürlich spezifisch von der Anordnung Gebrauch gemacht werden. A. Satz (Cauchysche Verdichtung). Die Glieder der Reihe 1 X
ak D a1 C a2 C a3 C a4 C ( ( (
kD1
seien reell, nichtnegativ und monoton fallend. Eine solche Reihe ist dann und nur dann konvergent, wenn die verdichtete Reihe 1 X kD0
konvergiert.
2k a2k D a1 C 2a2 C 4a4 C 8a8 C ( ( (
462
Kapitel 8 Weiterführung der Analysis
Beweis. Beide Richtungen beruhen darauf, geeignete „Pakete“ innerhalb der Teilsummen zu bilden, nämlich solche „von Zweierpotenz zu Zweierpotenz“. Da die Glieder in jedem Fall % 0 sind, reicht für die Konvergenz die Beschränktheit der Teilsummen (Satz K[8.1]). 1) Sei die Konvergenz der verdichteten Reihe vorausgesetzt. Dass die Teilsummen der Ausgangsreihe beschränkt sind, ergibt sich aus folgender Zusammenfassung für 2` % n a1 C a2 C ( ( ( C an . a1 C .a2 C a3 / C .a4 C a5 C a6 C a7 / C ( ( ( C .a2` C ( ( ( C a2`C1 &1 / . a1 C 2a2 C 4a4 C ( ( ( C 2` a2` 2) Sei die Konvergenz der Ausgangsreihe vorausgesetzt: 1 X
ak D s 2 R:
kD1
Dann gilt s % a1 C a2 C .a3 C a4 / C .a5 C a6 C a7 C a8 / C ( ( ( C .a2n#1 C1 C ( ( ( C a2n / %
1 a1 C a2 C 2a4 C 4a8 C ( ( ( C 2n&1 a2n ; 2
also folgt für die Teilsummen der verdichteten Reihe a1 C 2a2 C 4a4 C 8a8 C ( ( ( C 2n a2n . 2s: Somit sind diese Teilsummen beschränkt.
"
B. Beispiel. Hiermit erkennt man leicht die Konvergenz der Reihe 1 X 1 ; k˛
kD1
für ˛ > 1, die in Beispiel U(iv)[8.1] mit Hilfe des Integralkriteriums behandelt wurde. Die verdichtete Reihe lautet 1 X kD0
2k
1 X ( 1&˛ )k 1 : D 2 k˛ 2 kD0
Diese ist eine geometrische Reihe mit Quotient 21&˛ < 1, also konvergent.
Abschnitt 8.8
$ Spezielle Konvergenzkriterien für Reihen
C. Satz (Kriterium von Raabe). Vorgelegt sei die Reihe dern. (i)
463 P
ak mit komplexen Glie-
Gibt es eine Konstante ˇ > 1 und einen Index k0 2 N mit ˇ ˇ ˇ akC1 ˇ ˇ . 1 & ˇ für k % k0 ak ¤ 0; ˇˇ ak ˇ k
so ist die Reihe absolut konvergent. (ii) Gibt es einen Index k0 2 N mit ˇ ˇ ˇ akC1 ˇ ˇ%1& 1 ˇ ak ¤ 0; ˇ ak ˇ k
für k % k0 ;
so ist die Reihe nicht absolut konvergent (also insbesondere divergent, wenn alle ak > 0 oder alle ak < 0 sind). Beweis. Sei ˛k ´ jak j gesetzt. Zu (i): Aus der Voraussetzung folgt durch Umrechnung für k % k0 : 0 < .ˇ & 1/˛k . .k & 1/˛k & k˛kC1 : Somit ist die Folge der .k & 1/˛k ab k0 positiv und monoton fallend, also konvergent. Durch Summation über k ergibt sich für alle n > k0 .ˇ & 1/
n X
˛k . .k0 & 1/˛k0 & n˛nC1 ;
kDk0
weil sich fast alle Terme herausheben (Teleskopsumme!). Da die rechte Seite für n ! 1 konvergiert, ist sie nach oben beschränkt, also gilt dies auch für die linke Seite, und es folgt die absolute Konvergenz, wie behauptet. Zu (ii): Aus der Voraussetzung folgt durch Umrechnen für k % k0 : k˛kC1 % .k & 1/˛k : Somit ist die Folge der .k & 1/˛k ab k0 positiv und monoton wachsend, also ab einem gewissen Index k1 % k0 durch eine positive Schranke c nach unten beschränkt, somit ˛k %
c k&1
für k % k1 :
Da die harmonische Reihe divergiert, tut es aufgrund dieser Abschätzung auch die Reihe über die ˛k D jak j. " In der Zusammenschau mit dem Quotientenkriterium Q[8.1] erkennt man, dass das Kriterium von Raabe auch dann noch eine Entscheidung bringen kann, wenn die
464
Kapitel 8 Weiterführung der Analysis
Quotienten jakC1 j=jak j gegen 1 konvergieren, nämlich dann, wenn diese Konvergenz nicht allzu schnell erfolgt, eben so, dass diese Quotienten durch eine Größe der Bauart 1 & ˇ=k nach oben beschränkt sind (mit einem ˇ > 1). Abelsche partielle Summation Es gibt ein „diskretes“ Analogon zur Produktintegration, das sich auf endliche Summen statt auf Integrale bezieht und in mancherlei Hinsicht nützlich ist. Es lautet: D. Lemma (Abelsche partielle Summation). Gegeben seien Elemente a1 ; : : : ; an und b1 ; : : : ; bn ; bnC1 in C. Die Teilsummen der ak sind Ak ´ a1 C ( ( ( C ak ; Dann gilt
n X
ak bk D An bnC1 &
kD1
n X
k D 1; : : : ; n:
Ak .bkC1 & bk /:
kD1
Die linke Seite ist unabhängig von der Größe bnC1 , also ist diese – wenn nur a1 ; : : : ; an und b1 ; : : : ; bn gegeben sind – noch frei wählbar (z.B. als 0). Beweis von D. Setzt man noch A0 ´ 0, so kann man rückwärts die ak aus den Ak bestimmen: ak D Ak & Ak&1 (man erinnere sich an die „Kontoüberlegung“ nach I[5.2]!). Damit folgt n X kD1
ak bk C
n X
Ak .bkC1 & bk / D
n X
.Ak & Ak&1 /bk C
D
n X
Ak .bkC1 & bk /
kD1
kD1
kD1
n X
.Ak bkC1 & Ak&1 bk /:
kD1
In der letzten Summe hebt sich das meiste heraus; es verbleibt lediglich An bnC1 & A0 b1 D An bnC1 (Teleskopsumme!). Hieraus folgt die Behauptung. " Aus dieser Formel ergeben sich auf einen Schlag nützliche Folgerungen: E. Folgerung. Gegeben sei eine „Produktreihe“ und die Teilsummen der ersten Faktoren: 1 k X X ak bk ; Ak ´ aj ; j D1
kD1
wobei die ak und bk komplex sein dürfen. Aus der Konvergenz der Folge: An bnC1
und
der Reihe:
n X kD1
Ak .bkC1 & bk /
Abschnitt 8.8
$ Spezielle Konvergenzkriterien für Reihen
folgt dann die Konvergenz von
1 X
465
ak bk .
"
kD1
Spezialfälle hiervon sind: F. Folgerung. Gegeben sei eine Reihe
P
ak mit komplexen Gliedern und eine reelle Folge .bn /. P (i) Es gilt das Abelsche Kriterium: Konvergiert die Reihe P ak , und ist die Folge .bn / monoton und beschränkt, so konvergiert auch die Reihe ak bk . P (ii) Es gilt das Dirichletsche Kriterium: Hat die Reihe ak beschränkte TeilsumP men und konvergiert die Folge .bn / monoton gegen 0, so konvergiert die Reihe ak bk . Beweis. Zu (i): Die Voraussetzungen implizieren, dass die Folgen .An / und .bn / konvergieren und dass demgemäß auch die „Teleskopreihe“ mit den Gliedern bkC1 &bk konvergiert. Diese Reihenkonvergenz ist sogar absolut, da die Differenzen wegen der Monotonie stets % 0 oder stets . 0 sind. Dann konvergiert auch die Reihe mit den Gliedern Ak .bkC1 & bk / absolut, sodass Folgerung E angewandt werden kann. Zu (ii): Aus den Voraussetzungen folgt, dass .An bnC1 / eine Nullfolge ist, und genau wie bei (i) sieht man, dass die Reihe über die Ak .bkC1 & bk / absolut konvergiert. " G. Beispiele. (i) Ist die Reihe die Reihen X ak k
;
P
ak konvergent, so sind es nach dem Abelschen Kriterium auch
X ak ; ln k
XkC1 k
ak ;
Xp k kak ;
X.
1 1C k
/k
ak I
denn die hinzugefügten Faktoren sind jeweils beschränkt und von einem gewissen Index an monoton. P (ii) Die Reihe .&1/k hat beschränkte Teilsummen. Ist also P .bn / eine monotone Nullfolge, so ist nach dem Dirichletschen Kriterium die Reihe .&1/k bk konvergent. Das ist genau das Leibniz-Kriterium J[8.1], das hiermit anders bewiesen ist. Produktbildung von Reihen Neben der Konvergenz ist die Handhabung von (konvergenten) Reihen ein bedeutsamer Aspekt. Dazu gehört insbesondere die Reihenmultiplikation. (Die Reihenaddition war schon in Satz F[8.1] behandelt worden.)
466
Kapitel 8 Weiterführung der Analysis
Sind a0 ; a1 ; a2 ; : : : bzw. b0 ; b1 ; b2 ; : : : die Glieder zweier Reihen, so kann man die paarweisen Produkte in einem beidseitig unendlichen Schema angeordnet denken: a0 b0 a1 b0 a2 b0 :: :
(1)
a0 b1 a1 b1 a2 b1 :: :
a0 b2 a1 b2 a2 b2 :: :
::: ::: :::
Man wird vermuten, dass das Produkt der beiden Reihenwerte „irgendwie“ additiv aus diesen paarweisen Produkten aufgebaut werden kann, so wie es ja bei endlichen Summen der Fall ist. Unter günstigen Umständen ist das auch richtig, wobei wir zunächst eine konkrete Anordnung für die Addition behandeln, nämlich die nach den 45ı -Schrägzeilen dieses Schemas. Das ist, zusammen mit dem Indexbeginn bei 0, eine besonders übersichtliche und viel gebrauchte Konstellation: H. Satz (Cauchy-Produkt). Sind die Reihen mit komplexen Gliedern A´
1 X
aj ;
B´
j D0
1 X
bk
kD0
absolut konvergent und werden Größen cp definiert durch X cp ´ aj bk ; p D 0; 1; 2 : : : ; j CkDp
so gilt AB D
.X 1
/ .X / X 1 1 aj ( bk D cp
j D0
kD0
pD0
einschließlich der absoluten Konvergenz der Reihe ganz rechts. Diese heißt das CauchyProdukt der beiden Ausgangsreihen. Beweis. Sei ˛´
1 X j D0
jaj j;
ˇ´
1 X
jbk j;
ˆ.x/ ´
kD0
X
jaj j ( jbk j;
0#j;k#x
das letzte für jedes x % 0. Dabei soll die Schreibweise 0 . j; k . x bedeuten, dass C beide Indizes j; k im Intervall Œ0; x/ liegen. Die Funktion ˆ W RC 0 ! R0 ist monoton wachsend und nach oben beschränkt; denn für n ´ Œx/ gilt ˆ.x/ D ˆ.n/ D
.X n j D0
/ .X / n jbk j . ˛ˇ; jaj j ( kD0
Abschnitt 8.8
$ Spezielle Konvergenzkriterien für Reihen
467
also einschließlich der Existenz (2)
lim ˆ.x/ . ˛ˇ:
x!1
Hiermit besteht folgende Vorausabschätzung: ˇ ˇ. X /. X / X n n 3nˇ ˇ n ˇ ˇ a b & c : (3) j p ˇ . ˆ.n/ & ˆ k ˇ 2 pD0 j D0
kD0
Tatsächlich gilt, startend mit der linken Seite: ˇ ˇ ˇ n ˇ X ˇ ˇ X X ˇ ˇ ˇ aj bk & cp ˇ D ˇ ˇ ˇ ˇ ˇ 0#j;k#n
pD0
0#j;k#n; j Ck>n
X
.
ˇ ˇ ˇ aj bk ˇ ˇ
jaj j ( jbk j
0#j;k#n; j Ck>n
X
.
X
jaj j ( jbk j &
0#j;k#n
jaj j ( jbk j;
0#j;k#n=2
wobei die letzte Ungleichung daraus resultiert, dass im Fall j C k > n mindestens ein Summand j oder k größer als n=2 sein muss. Aus (3) folgt für n ! 1 wegen (2) die Behauptung: lim
n!1
n X
cp D AB.
"
pD0
Das Cauchy-Produkt tritt in natürlicher Weise auf, wenn die beiden Reihen Potenzreihen mit dem gleichen Zentrum a sind. Die Konvergenzradien seien rf bzw. rg aus RC [ f1g. Dann gilt mit absoluter Konvergenz f .z/ D
1 X
aj .z & a/j ;
jz & aj < rf
bk .z & a/k ;
jz & aj < rg ;
j D0
(4) g.z/ D
1 X kD0
und falls r ´ min frf ; rg g gewählt ist, lautet das Cauchy-Produkt nach Satz H (5a)
f .z/g.z/ D
1 X
cp .z & a/p ;
jzj < r
pD0
ebenfalls mit absoluter Konvergenz, wobei X aj bk ; (5b) cp ´ j CkDp
p D 0; 1; 2 : : :
468
Kapitel 8 Weiterführung der Analysis
(Die Bedeutung der aj , bk und cp hat sich zwar gewandelt, aber die Berechnungsvorschrift für die cp ist sinnigerweise die gleiche geblieben.) Wir halten fest: I. Folgerung. Das Cauchy-Produkt (5) zweier Potenzreihen (4) hat einen Konvergenzradius % min frf ; rg g und stellt für jz & aj < min frf ; rg g das Produkt f .z/g.z/ dar. " Besseren Aufschluss über den Konvergenzradius und eine eventuell darüber hinausgehende Darstellbarkeit des Produkts f .z/g.z/ erhält man über die Holomorphie; vgl. Abschnitt 9.3. Mit dem Hilfsmittel des Cauchy-Produkts kann man die Stetigkeit von Potenzreihen in denjenigen Punkten des Konvergenzkreises diskutieren, in denen die Potenzreihe konvergiert. Wir behandeln das zunächst in einer speziellen Fassung, die auf den reellen Fall zugeschnitten ist, und können dann auf den allgemeinen Fall „transformieren“: J. Satz (Abelscher Grenzwertsatz, reell). Gegeben sei eine reelle Potenzreihe mit Zentrum 0 und Konvergenzradius 1 sowie die im offenen Intervall /&1; 1Œ dargestellte Funktion: f .x/ D
1 X
ak x k ;
jxj < 1:
kD0
Ist die Reihe (6)
s´
1 X
ak
kD0
konvergent, so gilt
lim f .x/ D s:
x"1
Die Koeffizienten ak dürfen sehr wohl auch komplexe Zahlen sein, jedoch wird die Variable x auf reelle Werte (in /&1; 1Œ) eingeschränkt. Beweis von J. Die Teilsummen der Reihe (6) seien sn ´ a0 C a1 C ( ( ( C an : Die Hauptidee ist, dass diese sn beim Cauchy-Produkt der Ausgangsreihe mit der geometrischen Reihe auftreten: 1 1 X 1 X k sk x k ; ak x D 1&x kD0
kD0
jxj < 1:
Abschnitt 8.8
$ Spezielle Konvergenzkriterien für Reihen
469
Insbesondere ist die Potenzreihe mit den Koeffizienten sk für jxj < 1 absolut konvergent. (Das ist das einzige, was aus der Folgerung I gebraucht wird.) Durchmultiplizieren mit 1 & x ergibt 1 X
1 X
ak x k D .1 & x/
kD0
sk x k
kD0 1 X
1 D .1 & x/
jxj < 1: xk
kD0
Hiervon kann die erste Gleichung auch direkt durch Ausmultiplizieren der rechten Seite bestätigt werden, während die zweite Gleichung unmittelbar aus der geometrischen Reihe folgt. Multipliziert man die zweite Gleichung mit s und subtrahiert die erste, so folgt s & f .x/ D .1 & x/
1 X
.s & sk /x k ;
jxj < 1:
kD0
Die Behauptung ist, dass dies für x " 1 gegen 0 konvergiert. Das ist von der rechten Seite her nahe liegend, da 1 & x dann betragsmäßig „klein“ wird und ebenso die Differenzen s & sk zumindest für „große“ k. Das muss allerdings genau austariert werden. Dazu werde die letzte Reihe mit einem beliebigen Zwischenindex m aufgespalten und gleichzeitig eine Abschätzung für x % 0 vorgenommen: js & f .x/j . .1 & x/
m X
1 X
k
js & sk jx C .1 & x/
kD0
js & sk jx k ;
0 . x < 1:
kDmC1
Dies impliziert die Vorausabschätzung (7)
js & f .x/j . .1 & x/
m X
js & sk j C max js & sk j; k>m
kD0
wenn man beachtet, dass .1&x/ . 1 ist.
P1
kDmC1
0 . x < 1;
x k wiederum nach der geometrischen Reihe
An (7) kann nun der nötige ."; ı/-Test verifiziert werden: Zu gegebenem " > 0 sei m so gewählt, dass maxk>m js & sk j < "=2 wird (das geht unabhängig von x). Bei diesem festen m kann dann 1 & x kleiner als " ı."/ ´ m X js & sk j 2 kD0
gemacht werden, sodass also für x 2 Œ0; 1Œ mit 1 & x < ı."/ tatsächlich js & f .x/j kleiner als "=2 C "=2 D " wird. "
470
Kapitel 8 Weiterführung der Analysis
K. Beispiele. (i) In Beispiel K[8.5] hatten wir die Taylor-Reihen der Funktionen x 7! ln.1 C x/ und x 7! arctan x mit Zentrum 0 und Konvergenzradius 1 aufgestellt und aus elementaren Restgliedabschätzungen auch das Verhalten in den Randpunkten des Konvergenzintervalls diskutieren können. Wenn man diese Darstellungen nur für &1 < x < 1 gekannt hätte, so könnte man jetzt mit Satz J auch das Randverhalten finden. Denn beide Reihen gehen für x D 1 in konvergente Reihen mit alternierenden Vorzeichen über. Also ergäbe der Abelsche Grenzwertsatz dafür erneut die dortigen Gleichungen für ln 2 und &=4. (ii) Im Fall der Arkussinus-Reihe arcsin x D x C
1 x3 1 ( 3 x5 1 ( 3 ( 5 x7 C C C ::: 2 3 2(4 5 2(4(6 7
für x 2 /&1; 1Œ;
die in Beispiel M[8.5] hergeleitet wurde, liefert Satz J jetzt das Randverhalten, z.B. bei x D 1: Diese Reihe hat ja für 0 < x . 1 nur positive Glieder und ihre Teilsummen sn .x/ sind zunächst für 0 < x < 1 nach oben beschränkt, da sn .x/ < arcsin x < arcsin 1. Da sn bei festem n ebenso wie arcsin in 1 stetig ist, folgt hieraus durch Grenzübergang x " 1: sn .1/ . arcsin 1. Somit konvergiert die augenblickliche Reihe auch für x D 1 und hat den Wert limx"1 arcsin x D arcsin 1. Das Entsprechende gilt auch für x D &1, da arcsin eine ungerade Funktion ist (oder wegen der gleich folgenden Variante L). Die obige arcsin-Darstellung gilt also im ganzen abgeschlossenen Intervall Œ&1; 1/, insbesondere ist 1 1 1(3 1 1(3(5 1 & D1C C C C ::: 2 2 3 2(4 5 2(4(6 7 L. Satz (Abelscher Grenzwertsatz, komplex). Gegeben sei eine Potenzreihe mit Zentrum a 2 C und Konvergenzradius r 2 RC sowie die in der offenen Kreisscheibe B.a; r/ dargestellte Funktion: f .z/ D
1 X
ak .z & a/k ;
z 2 B.a; r/:
kD0
Ist für ein z0 auf dem Konvergenzkreis S.a; r/ die Reihe s´
1 X
ak .z0 & a/k
kD0
konvergent, so gilt
lim f .a C x.z0 & a// D s:
x"1
Abschnitt 8.8
$ Spezielle Konvergenzkriterien für Reihen
471
Die reelle Variable x durchläuft dabei das Intervall /&1; 1Œ, wobei für den Grenzübergang x " 1 natürlich nur die Werte mit 0 . x < 1 von Bedeutung sind, d.h. man nähert sich mit a C x.z0 & a/ der Stelle z0 „radial“ vom Inneren der Konvergenzkreisscheibe her. Beweis von L. Man betrachte die reelle Potenzreihe 1 X ak .z0 & a/k x k ; x 2 /&1; 1Œ : g.x/ ´ kD0
Diese geht durch die Substitution z D a C x.z0 & a/ aus der gegebenen Potenzreihe hervor und liefert speziell für 0 . x < 1 die Werte von f auf der geraden Strecke von a nach z0 (den Endpunkt ausgenommen): f .a C x.z0 & a// D g.x/. Die Potenzreihe für g.x/ hat den Konvergenzradius 1, da bei dieser Zuordnung zwischen x und z die Äquivalenz besteht: jz & aj < r () jxj < 1. Der Grenzwertsatz J, angewandt auf g, liefert dann vermöge dieser Zuordnung den behaupteten Grenzwertsatz für f . " M. Bemerkung. Diese komplexe Variante des Abelschen Grenzwertsatzes kann nochmals erweitert werden: Man darf sich der Stelle 1 in einem Winkelraum mit Spitze 1 nähern, wenn dieser (abgesehen von 1) ganz im Inneren der Einheitskreisscheibe liegt. Vgl. Knopp[1996], Nr. 233. Bericht über die Umordnung von Reihen Schon bei der Reihenmultiplikation hatten wir gesehen, dass doppelt indizierte Größen auftreten, sodass zur „Aufsummierung“ eine bestimmte Art und Weise der Anordnung vorgeschrieben werden muss (oben war das das Cauchy-Produkt). Dann erhebt sich generell die Frage, ob auch andere „Summierungsweisen“ möglich sind und ob die Resultate vielleicht davon unabhängig sind. Bei endlichen Summen ist das natürlich der Fall. Bei Reihen ist das Problem der Anordnung jedoch nichttrivial und muss gesondert diskutiert werden. Beweise sollen hier ausnahmsweise nicht geführt werden, teils weil die Ergebnisse später in einem allgemeineren Zusammenhang von alleine herauskommen, teils auch deswegen, weil die Resultate nicht weiter gebraucht werden. Trotzdem ist es gut zu wissen, dass es so etwas gibt und wo man (bei Interesse oder Bedarf) ausführliche Information findet. Wir betrachten zunächst folgende Situation: Gegeben sei ein beidseitig unendliches Schema von reellen oder komplexen Zahlen (wobei die Nummerierung jetzt bei 1 beginnen soll):
(8)
c11 c21 c31 :: :
c12 c22 c32 :: :
c13 c23 c33 :: :
::: ::: :::
472
Kapitel 8 Weiterführung der Analysis
Wir sprechen kurz von einer unendlichen Matrix und nennen die waagrechten Reihen wie in der linearen Algebra Zeilen und die senkrechten Reihen Spalten. Man kann dann versuchen, jede Zeile aufzusummieren, d.h. jeweils die Reihe über die Elemente einer Zeile zu bilden und anschließend die Ergebnisse, falls existent, wiederum in Form einer Reihe zu addieren. Kurz: Man kann eventuell zuerst die „Zeilensummen“ bilden und anschließend die „Summe“ der Zeilensummen. Analog gelingt es vielleicht, die „Spaltensummen“ zu berechnen und anschließend die „Summe“ der Spaltensummen. All dies ist natürlich an gewisse Voraussetzungen gebunden. Unter günstigen Umständen wird man erwarten, gleiche Ergebnisse nach der „Zeilenmethode“ wie bei der „Spaltenmethode“ zu erhalten. Tatsächlich ist Folgendes richtig: N . Satz (großer Umordnungssatz). Gegeben sei eine unendliche Matrix .cj k /.j;k/2N)N von komplexen Zahlen, d.h. eine Abbildung N ) N ! C, .j; k/ 7! cj k . Es gebe ein K 2 R derart, dass für alle endlichen Teilmengen S * N ) N gilt: X
jcj k j . K:
.j;k/2S
Die unendliche Matrix heißt dann absolut summierbar. Unter dieser Voraussetzung gilt / X / 1 .X 1 .X 1 1 X U ´ cj k D cj k j D1 kD1
kD1 j D1
einschließlich der absoluten Konvergenz der vorkommenden Reihen. Dieser gemeinsame Wert entsteht auch, indem die Elemente der Matrix irgendwie hintereinander aufgeschrieben und darüber die Reihe gebildet wird, die dann ebenfalls absolut konvergiert. Genauer: Ist ' W N ! N)N eine Durchnummerierung von N)N, so gilt auch: U D
1 X
c'.`/ ;
`D1
einschließlich der absoluten Konvergenz dieser Reihe.
"
Dieser Satz ist Spezialfall eines viel umfassenderen Vertauschbarkeitssatzes (des Satzes von Fubini), der im Rahmen der mehrdimensionalen Integralrechnung in Analysis 2 bewiesen wird. Unter der Voraussetzung dieses Satzes ist auch die unendliche Matrix der Beträge
$ Spezielle Konvergenzkriterien für Reihen
Abschnitt 8.8
473
jcj k j absolut summierbar, sodass automatisch auch die Reihen 1 X
sj
mit sj ´
j D1 1 X
1 X
jcj k j
kD1
zk
mit zk ´
j D1
1 X
jcj k j
j D1
konvergieren. Ein Spezialfall des großen Umordnungssatzes ist das „Kommutativgesetz“ für absolut konvergente (einfach indizierte) Reihen: P O . Folgerung (kleiner Umordnungssatz). Ist die Reihe 1 kD1 ak mit komplexen Gliedern absolut konvergent und ' W N ! N eine P bijektive Abbildung (eine so genannte Permutation von N), so ist auch die Reihe 1 kD1 a%.k/ absolut konvergent, und es gilt 1 1 X X a% .k/ : ak D Die Reihe
P1
kD1
kD1
kD1
a%.k/ nennt man eine Umordnung der Reihe
P1
kD1
ak .
Beweis. Um aus der Folge der Glieder ein zweifach indiziertes Schema zu machen und so den kleinen Umordnungssatz auf den großen zurückzuführen, schreibt man in die j -te Zeile lauter Nullen, bis auf den Platz mit der Nummer ' .j /, an dem a%.j / stehen soll. Dann kommt jedes Glied der Ausgangsreihe genau einmal in jeder Zeile und genau einmal in jeder Spalte vor („genau einmal“ bezieht sich auf den Index). Die so entstehende unendliche Matrix ist wegen der vorausgesetzten absoluten Konvergenz absolut summierbar. konPabsolut P Nach Satz N gibt dann die „Zeilensummation“ die 1 vergente Reihe 1 kD1 ak , und kD1 a% .k/ , die „Spaltensummation“ aber die Reihe beide haben den gleichen Wert. " In stärker formalisierter Form wird dieser Beweis in Analysis 2 erneut geführt (V[11.9]). P. Beispiel. Man mache sich die Überführung in eine unendliche Matrix an einem Beispiel klar, etwa wenn die umgeordnete Reihe startet mit a3 C a7 C a2 C a1 C ( ( ( Dann beginnt das zugeordnete Schema so: 0 0 0 a1 :: :
0 0 a2 0 :: :
a3 0 0 0 :: :
0 0 0 0 0 0 0 a7 0 0 0 0 0 0 0 0 :: :: :: :: : : : :
0 ::: 0 ::: 0 ::: 0 ::: :: :
474
Kapitel 8 Weiterführung der Analysis
Die Umordnungssätze können speziell auf das Produkt zweier absolut konvergenter Reihen angewandt werden. Dadurch wird der Satz H deutlich verallgemeinert: Q. Folgerung. Die Reihen mit komplexen Gliedern A´
1 X
aj ;
B´
j D0
1 X
bk
kD0
seien absolut konvergent. Dann konvergiert die Reihe über die paarweisen Produkte der Matrix (1) in irgendeiner Reihenfolge absolut gegen AB. Das heißt: Werden die paarweisen Produkte mit +j k ´ aj bk bezeichnet und ist ' W N0 ! N0 ) N0 eine Durchnummerierung von N0 ) N0 , so gilt AB ´
1 X
+'.p/ ;
pD0
einschließlich der absoluten Konvergenz der rechten Seite. Beweis. Aus der absoluten Konvergenz der beiden Ausgangsreihen folgt die absolute Summierbarkeit der Matrix (1), wie man dem Beweis von Satz H entnehmen kann: Ist S eine endliche Teilmenge von N0 ) N0 , so gibt es ein ` 2 N0 mit S , f0; 1; : : : ; `g2 . Mit den dortigen Bezeichnungen gilt dann X
jaj bk j . ˆ.`/ . ˛ˇ:
.j;k/2S
Damit P1 konvergieren nach dem großen Umordnungssatz alle Reihen der Gestalt pD0 +'.p/ absolut gegen dieselbe Zahl C , speziell die dem Cauchy-Produkt entsprechende: C D a0 b0 C a0 b1 C a1 b0 C a0 b2 C a1 b1 C a2 b0 C ( ( ( : Das Cauchy-Produkt entsteht hieraus durch Klammersetzung und konvergiert nach H gegen AB. Somit ist C D AB. " Der Begriff der absoluten Summierbarkeit ist nicht auf solche doppelt indizierten Schemata beschränkt. Man kann ihn für beliebige Zahlenfolgen formulieren: Die FolP a absolut ge .ak /k2N in R oder C heißt absolut summierbar, wenn die Reihe 1 k kD1 konvergiert. Äquivalent damit ist, dass eine Konstante K % 0 existiert, sodass für jede endliche Teilmenge S * N gilt: X k2S
jak j . K:
Abschnitt 8.8
$ Spezielle Konvergenzkriterien für Reihen
475
Da diese Eigenschaft gegenüber Permutation der Indexmenge N invariant ist, macht die absolute Summierbarkeit auch Sinn für beliebige abzählbare Teilmengen von R oder C. Absolut konvergente Reihen sind nach dem kleinen Umordnungssatz unempfindlich gegenüber Umordnung, und zwar sowohl hinsichtlich der absoluten P1Konvergenz wie auch bezüglich des Reihenwerts. Eine konvergente Reihe s D kD1 ak heißt nun unbedingt konvergent, wenn für jede Permutation ' W N ! N auch die Reihe P1 a konvergiert und zwar gegen s. Der kleine Umordnungssatz besagt in die%.k/ kD1 ser Terminologie: Jede absolut konvergente Reihe ist auch unbedingt konvergent. Im Reellen gilt hiervon auch die Umkehrung: R. Satz. Eine Reihe mit reellen Gliedern ist dann und nur dann absolut konvergent, wenn sie unbedingt konvergent ist. " Konvergente Reihen, die nicht unbedingt konvergieren, werden bedingt konvergent genannt. Typisches Beispiel ist die alternierende harmonische Reihe ln 2 D 1 &
1 1 1 C & C &((( : 2 3 4
Solche Reihen zeigen bereits im reellen Fall ein recht chaotisches Verhalten gegenüber Permutation. Es gilt nämlich: S. Satz (Riemannscher Umordnungssatz). Ist eine Reihe mit reellen Gliedern nur bedingt konvergent, so können aus ihr passende Umordnungen erzeugt werden, die (i)
gegen eine vorgeschriebene Zahl t 2 R konvergieren oder
(ii)
gegen 1 oder &1 bestimmt divergieren oder
(iii) überhaupt divergieren.
"
Die Behauptungen dieses Berichtsteils werden entweder später in einem allgemeineren Zusammenhang bewiesen (wie bei N und O), oder der Leser findet die Beweise in der Spezialliteratur über Reihen (wie bei R und S), von der insbesondere die „Bibel“ dieses Gebiets zu nennen ist: Knopp[1996]. Das gilt auch für die folgenden Aufgaben. Aufgaben und Anmerkungen 1. Es besteht die folgende Verallgemeinerung des Cauchyschen Verdichtungssatzes: Die Glieder der Reihe 1 X kD1
ak D a1 C a2 C a3 C a4 C ( ( (
476
Kapitel 8 Weiterführung der Analysis
seien reell, nichtnegativ und monoton fallend. Weiter sei .gk /k2N eine streng monoton wachsende Folge natürlicher Zahlen und M > 0 eine Konstante, sodass für alle k % 2 gilt gkC1 & gk . M.gk & gk&1 /: Dann sind die beiden Reihen 1 X
ak
und
kD1
1 X
.gkC1 & gk /agk
kD1
entweder beide konvergent oder beide divergent. 2. Zwei konvergente, jedoch nicht absolut konvergente Reihen können konvergente aber auch nicht konvergente Cauchy-Produkte besitzen. Man zeige nämlich: a) Das Cauchy-Produkt der Reihe ln 2 D 1 &
1 1 1 C & C &((( 2 3 4
mit sich selbst ist konvergent. b) Das Cauchy-Produkt der Reihe 1 1 1 1 & p C p & p C &((( 2 3 4 mit sich selbst ist divergent. 3. Bezüglich der Multiplikation von nicht absolut konvergenten Reihen mit komplexen Gliedern gilt: P P P a) Satz von Abel: Sind die drei Reihen aj , bk und cp (Cauchy-Produkt) konvergent und A; B; C ihre Werte, so ist AB D C . Lösungshinweis: Man arbeite mit dem Grenzwertsatz von Abel. P P b) Satz von Mertens: Ist die Reihe aj absolut bk P konvergent und die Reihe konvergent, so ist auch das Cauchy-Produkt cp konvergent.
8.9 $ Andere Zugänge zu den elementaren Funktionen Die Exponentialfunktion und die trigonometrische Funktionen hatten wir frühzeitig und mit einfachen Hilfsmitteln eingeführt. Alle ihre Eigenschaften ergaben sich mühelos als Konsequenzen aus gewissen Grundeigenschaften, die meistenteils recht einleuchtend waren. Jedoch sind die Existenzbeweise auf dieser elementaren Ebene nicht
Abschnitt 8.9
$ Andere Zugänge zu den elementaren Funktionen
477
ganz trivial zu führen, werden aber für das konkrete Umgehen mit den Funktionen auch gar nicht gebraucht. Ist man bereit, etwas höhere Hilfsmittel zu investieren, so lassen sich die Existenzfragen einfacher behandeln. Solche alternativen Vorgehensweisen seien hier vorgestellt. Diese mögen eleganter erscheinen, als die Methoden in den Abschnitten 2.4, 2.5 und 4.4. Die dortigen Verfahren haben aber ihren eigenen Reiz, und vor allem erlauben sie einen schnellen Einstieg und ein frühes Vertrautwerden mit so wichtigen Objekten wie e x , cos x, sin x, e und &. Zur Exponentialfunktion Sind die Grundlagen über Potenzreihen bekannt, so kann man eine Funktion E W R ! R einführen durch die Reihe (1)
E.x/ ´
1 X xj
jŠ
j D0
D1CxC
x2 x3 C C ((( : 2Š 3Š
Diese hat den Konvergenzradius 1, wie man leicht mit dem Quotientenkriterium F[8.5] erkennt: .j C 1/Š D lim j C 1 D 1: r D lim j !1 j !1 jŠ Die Funktion E besitzt die erforderlichen Grundeigenschaften: A. Satz. Für die Funktion E W R ! R (1) gilt: (EF)
E.x C y/ D E.x/ ( E.y/
für alle x; y 2 R
(EP)
E.x/ > 0
für alle x 2 R
(EU)
E.x/ % 1 C x
für alle x 2 R:
Beweis. Zu (EF): Diese Funktionalgleichung wird mittels des Cauchy-Produkts H[8.8] bewiesen. Hiernach gilt E.x/E.y/ D
.X 1 j D0
xj jŠ
/ .X / X 1 1 yk ( D cp ; kŠ pD0 kD0
wobei die cp folgendermaßen definiert sind und gleich umgeformt werden: 0 ! p X xj yk 1 X pŠ j k 1 X p p&k k 1 D x y D x y D .x C y/p : cp D j Š kŠ pŠ j ŠkŠ pŠ pŠ k j CkDp
j CkDp
kD0
478
Kapitel 8 Weiterführung der Analysis
Kombination dieser zwei Formelzeilen liefert sofort die Behauptung. Zu (EP): Für x % 0 ist offensichtlich E.x/ % 1, speziell E.0/ D 1. Nach (EF) gilt weiter E.x/E.&x/ D E.0/ D 1, also auch E.&x/ > 0. Zu (EU): Um die „Dominanz“ der geraden Potenzen in (1) auszunutzen, schreibt man E.x/ D .1 C x/ C
x4 x2 .3 C x/ C .5 C x/ C ( ( ( : 3Š 5Š
Hieraus folgt E.x/ % 1 C x für x % &3. Das gilt aber erst recht für x < &3, denn dafür ist E.x/ > 0 und 1 C x < 0. " Aus (EF) und (EU) kann man nun eine Fülle weiterer Eigenschaften ableiten, wie dies in Abschnitt 2.4 zu Beginn beim Eindeutigkeitsbeweis geschehen ist. Insbesondere ergibt sich die Übereinstimmung mit der Darstellung / . x n (2) E.x/ D lim 1 C für alle x 2 R: n!1 n Der Existenzbeweis von dort entfällt beim jetzigen Aufbau, da die Definition (1) die Existenz bereits enthält. „Bezahlen“ muss man diese Einsparung natürlich mit den Grundkenntnissen über Potenzreihen, die zuvor bereitgestellt sein müssen. Wenn man den Aufwand der beiden Methoden vergleicht, so muss man sagen, dass der elementare Zugang in Abschnitt 2.4 insgesamt etwas günstiger abschneidet. Außerdem ist die „multiplikative“ Darstellung in Gestalt von (2) bzw. C[2.4] leichter zu motivieren, als die „additive“ Darstellung in Form von (1), nämlich durch den Zusammenhang mit Wachstumsvorgängen (z.B. mit der Zinseszinsrechnung, wie am Ende von Abschnitt 2.4 beschrieben). Zum Arkustangens Wird die Differential- und Integralrechnung vorausgesetzt, so kann man den Arkustangens einführen als Funktion A W R ! R mit Z x dt (3) A.x/ ´ : 1 C t2 0 Diese Funktion erfüllt nämlich die Grundregeln, wie sie in Abschnitt 2.5 aufgestellt waren: B. Satz. Für die Funktion A W R ! R (3) gilt: 3 xCy (AF) D A.x/ C A.y/ für alle x; y 2 R mit xy < 1 A 1 & xy (AU)
x . A.x/ . x p 1 C x2
für alle x % 0:
Abschnitt 8.9
$ Andere Zugänge zu den elementaren Funktionen
479
Beweis. Zu (AF): Man betrachtet den Ausdruck mit dem „komplizierten“ Argument zunächst als Funktion von x bei festem y D b: xCb 1#xb Z 3 xCb dt ˆ.x/ ´ A D : 1 & xb 1 C t2 0
Diese Funktion ist wegen xb < 1 definiert in einem Intervall, nämlich für b > 0 im Intervall fx 2 R j x < 1=bg, für b < 0 im Intervall fx 2 R j x > 1=bg und für b D 0 auf ganz R. Die Ableitung berechnet man nach dem Hauptsatz der Differential- und Integralrechnung und der Kettenregel als 1 .1 & xb/ ( 1 C .x C b/ ( b 3 x C b -2 ( .1 & xb/2 1C 1 & xb 1 C b2 1 C b2 D D : .1 & xb/2 C .x C b/2 .1 C b 2 /.1 C x 2 /
ˆ0 .x/ D
Somit ist ˆ0 .x/ D A0 .x/, also ˆ.x/ & A.x/ D const., und wegen ˆ.0/ & A.0/ D A.b/ & 0 ist die Konstante gleich A.b/, also ˆ.x/ & A.x/ D A.b/ im jeweiligen Intervall. Mit b D y entsteht die Behauptung. Zu (AU): Offensichtlich gilt 1 1 . 1: . 2 3=2 1 C t2 .1 C t / Hieraus folgt durch Integration von 0 bis x % 0 p
x 1 C x2
. A.x/ . x;
da 1=.1 C t 2 /3=2 die Stammfunktion t=.1 C t 2 /1=2 besitzt. " p Schreibt man .1 C t 2 /3=2 als .1 C t 2 / 1 C t 2 , so sieht man, dass hierzu keineswegs allgemeine Potenzen erklärt sein müssen: die Quadratwurzelfunktion reicht aus. Aus (AF) und (AU) kann man die weiteren Eigenschaften der Arkustangensfunktion ableiten, wobei es jetzt viel einfacher ist als in Abschnitt 2.5, weil die dortigen Beweise zur Eindeutigkeit und Existenz nun nicht mehr nötig sind. Die Existenz ergibt sich ja schon aus der Definition (3), und die Eindeutigkeit aus den Argumenten zu Beginn des Abschnitts 4.4. Nach Satz A(i)[4.4] folgt allein aus den Grundeigenschaften (AF) und (AU) die Differenzierbarkeit von A sowie die Ableitungsformel A0 .x/ D
1 ; 1 C x2
480
Kapitel 8 Weiterführung der Analysis
sodass A wegen A.0/ D 0 zwangsläufig durch den Ausdruck in (3) gegeben ist. Der weitere Ausbau der trigonometrischen Funktionen Kosinus und Sinus kann dann direkt wie in Abschnitt 4.4 gestartet werden. Bei den trigonometrischen Funktionen fällt der Aufwand bei der jetzigen Methode deutlich geringer aus als bei dem gänzlich elementaren Aufbau in 4.4. Aber das hat auch hier seinen Preis. Man braucht für den jetzigen Zugang nicht nur die Differentialrechnung, sondern auch die Integralrechnung, die zuvor entwickelt sein muss. Komplexe Vereinheitlichung Die bisherigen Alternativen arbeiten rein im Reellen, ebenso wie die elementaren Methoden der Abschnitte 2.4 und 2.5. Erlaubt man den Durchgang durchs Komplexe, so stellt es sich heraus, dass die Exponentialfunktion und die trigonometrischen Funktionen eine innige Einheit bilden. Das ist dann gewissermaßen der „ultimative“ Weg zu diesen Funktionen. Dieser Zugang ist so schön, dass er dem Leser nicht vorenthalten werden soll. Ein Wermutstropfen für den Anfänger ist natürlich die Verwendung komplexer Zahlen und der Grenzübergänge für diese, insbesondere der komplexen Potenzreihen. All das muss zuvor bekannt sein. Man geht auf folgende Weise vor: Zunächst erklärt man die obige Funktion E auch komplex als Abbildung E W C ! C durch die Potenzreihe (4)
E.z/ ´
1 X zj j D0
jŠ
D1CzC
z2 z3 C C ((( ; 2Š 3Š
z 2 C:
Wie oben ist natürlich auch hier der Konvergenzradius r D 1, und das CauchyProdukt liefert genau wie bei Satz A die Funktionalgleichung E.z C w/ D E.z/ ( E.w/
für alle z; w 2 C:
Wegen E.0/ D 1 ist speziell E.z/E.&z/ D E.0/ D 1 also stets E.z/ ¤ 0 und E.&z/ D
1 : E.z/
Außerdem folgt aus der Potenzreihendarstellung, da das Konjugieren eine stetige Operation ist und die Koeffizienten reell sind: E.z/ D
1 X zj j D0
jŠ
D
1 X zj j D0
jŠ
D E.z/:
Durch gliedweises Differenzieren der Potenzreihe (4) ergibt sich E 0 .z/ D 1 C
3z 2 2z C C ( ( ( D E.z/; 2Š 3Š
Abschnitt 8.9
$ Andere Zugänge zu den elementaren Funktionen
481
d.h. E reproduziert sich beim komplexen Ableiten, und nach der komplexen Kettenregel gilt für jede C 1 -Abbildung 0 W J ! C (J ein Intervall): .E ı 0/0 .t / D E 0 .0.t // ( 0 0 .t /: Vgl. (11)[7.3] und Satz U[8.5]. Für reelle Argumente z D s 2 R stimmt E.s/ natürlich mit dem obigen E.s/ 2 R überein. Für rein imaginäre Argumente z D it, t 2 R, ist E.it/ D E.&it/ D 1=E.it/, also jE.it/j D 1: Kosinus und Sinus sind in diesem Aufbau als Funktionen von R in R definierbar durch (5)
C.t/ ´ Re .E.it//;
S.t/ ´ Im .E.it//;
und es folgt sogleich C.t/2 C S.t/2 D 1;
C.0/ D 1;
S.0/ D 0
sowie wegen E.it/ D E.&it/, dass C eine gerade und S eine ungerade Funktion ist. Aus E.it/ D C.t/ C iS.t/ ergibt sich, da die Ableitung der linken Seite nach t gleich E.it/ ( i ist: C 0 .t/ C iS 0 .t / D i.C.t/ C iS.t//, also C 0 .t / D &S.t/;
S 0 .t / D C.t/:
Damit ist der Anschluss an die Grundeigenschaften von Kosinus und Sinus in (2)[4.4] erreicht, und man kann von da ab die Eigenschaften dieser Funktionen so entwickeln, wie dort beschrieben. Allerdings ist bei der augenblicklichen Vorgehensweise der Arkustangens und der Tangens zunächst nicht vorhanden und damit auch nicht die damalige Erklärung von &. Die Definition von & kann hier aber so erfolgen: C. Satz und Definition. Die Funktion C W R ! R (5) hat eine kleinste positive Nullstelle, genannt &=2: & ´ min ft > 0 j C.t/ D 0g: 2 Beweis. Durch einen Widerspruchsbeweis erkennt man zunächst, dass C überhaupt eine positive Nullstelle besitzt. Angenommen, C wäre ohne jede Nullstelle in RC , also – da C eine gerade Funktion und C.0/ D 1 ist – in ganz R. Nach dem Zwischenwertsatz folgte dann aus C.0/ > 0 sogar C.t/ > 0 in R. Wegen S 0 D C wäre S streng monoton wachsend und wegen S.0/ D 0: S.t/ > 0 in RC . Nun wähle man ein t0 2 RC fest. Dann gälte für t > t0 nach dem Mittelwertsatz für eine Stelle ) 2 /t0 ; tŒ: C.t/ & C.t0 / D .t & t0 /C 0 .)/ D &.t & t0 /S.)/ < &.t & t0 /S.t0 /;
482
Kapitel 8 Weiterführung der Analysis
also
C.t/ < C.t0 / & .t & t0 /S.)/:
Dies implizierte C.t/ < 0 für hinreichend große t > 0, Widerspruch! Somit ist die Nullstellenmenge von C in RC nicht leer, und dann ihr Infimum selbst Nullstelle wegen der Stetigkeit von C . Dieses Infimum ist nicht 0, da C.0/ D 1, also ist es die kleinste positive Nullstelle von C . " Dieser Beweis hätte auch in Abschnitt 4.4 so geführt werden können. Nun kann man wie dort weiter vorgehen, und zwar in folgender Anordnung: D, E (ohne die Existenz, die ja hier schon feststeht), F (wobei das meiste schon bekannt ist und die Additionstheoreme direkt aus E.i.˛ C ˇ// D E.i˛/E.iˇ/ abgelesen werden können), G, I (wobei nur S.&=2/ D 1 gezeigt werden muss), J (bis auf (iii)). Der Punkt J(iii)[4.4] wird hier ersetzt durch die Definition T .t / ´
S.t/ C.t/
für t …
& C Z&: 2
Ab K[4.4] wird dann alles beibehalten, insbesondere auch die Beziehungen zum Einheitskreis. Die Dinge in Abschnitt 7.2 sind beim vorliegenden Aufbau zum großen Teil direkt ersichtlich oder Übertragungen vom Reellen ins Komplexe. Selbstverständlich wird man auch hier ab einem geeigneten Zeitpunkt die klassischen Bezeichnungen gebrauchen: E.z/ µ e z µ exp z sowie C.t/ µ cos t;
S.t/ µ sin t;
T .t/ µ tan t;
C.t/ µ cot t: S.t/
Die Taylor-Entwicklungen von Kosinus und Sinus mit Zentrum 0 ergeben sich nun aus (4) durch die Substitution z D it und Trennung von Real- und Imaginärteil entsprechend (5) als cos t D
1 X
.&1/k
kD0
t 2k ; .2k/Š
sin t D
1 X kD0
.&1/k
t 2kC1 .2k C 1/Š
mit Konvergenz und Darstellung in ganz R (in Übereinstimmung mit L(ii)[8.3]). Bei der obigen rein reellen Behandlung von E.x/ ergab sich die Übereinstimmung der additiven und multiplikativen Darstellung, (2), indirekt über den Eindeutigkeitsbeweis bei Satz A[2.4]. Das kann man auch über eine direkte Abschätzung zeigen, die ganz allgemein sowohl reell wie auch komplex besteht:
Abschnitt 8.9
$ Andere Zugänge zu den elementaren Funktionen
483
D. Lemma. Für alle z 2 C und n 2 N gilt ˇ /n ˇ . 2 n ˇ ˇ ˇ1 C z C z C ( ( ( C z & 1 C z ˇ . 1 jzj2 e jzj : ˇ 1Š 2Š nŠ n ˇ n Beweis. Zunächst hat man nach der binomischen Formel: 0 ! 0 ! 0 ! 0 ! / . n z2 z n n z n z3 n zn C 1C D1 C C C ( ( ( C n 2 n2 1 n 3 n3 n nn n ( .n & 1/ z 2 n ( .n & 1/ ( .n & 3/ z 3 nz C C n 1Š n2 2Š n3 3Š n n ( .n & 1/ ( ( ( 1 z C ((( C nn nŠ z z2 z3 zn D 1 C cn1 ( C cn2 C cn3 C ( ( ( C cnn 1Š 2Š 3Š nŠ D1 C
mit
. /. / . / 1 2 k&1 cnk ´ 1 ( 1 & 1& ((( 1 & ; n n n
1 . k . n:
Für die fragliche Differenz ergibt sich hieraus . / zn z3 zn z z2 z n z2 1C C C( ( (C & 1C D .1&cn2 / C.1&cn3 / C( ( (C.1&cnn / : 1Š 2Š nŠ n 2Š 3Š nŠ Die neuen Koeffizienten lassen sich so abschätzen / . / . .k & 1/2 .k & 1/2 k & 1 k&1 .1& 1& D ; 0 . 1 & cnk . 1 & 1 & n n n wobei zum Schluss die Bernoullische Ungleichung (B[1.3]) verwendet wurde. Damit wird ˇ . /n ˇ X n 2 n ˇ ˇ .k & 1/2 jzjk ˇ1 C z C z C ( ( ( C z & 1 C z ˇ . ˇ 1Š 2Š nŠ n ˇ n kŠ kD2
1
.
1 2 X .k & 1/2 jzjk&2 jzj n k.k & 1/ .k & 2/Š kD2
. wie behauptet. Hieraus folgt unmittelbar:
1 2 jzj jzj e ; n "
484
Kapitel 8 Weiterführung der Analysis
E. Satz. Für alle z 2 C gilt . / 1 X z n zk e D D lim 1 C : n!1 kŠ n z
kD0
Beide Darstellungen konvergieren gleichmäßig in jeder Kreisscheibe B.0; r/ * C mit r 2 RC . " Aufgaben und Anmerkungen 1. Man zeige anhand der Taylor-Entwicklung: cos 2 < 0 und schließe daraus, dass die Kosinusfunktion eine kleinste positive Nullstelle (< 2) besitzt. Lösungshinweis: Man fasse in der Taylor-Entwicklung des Kosinus Glieder analog zusammen wie beim obigen Beweis von (EU) bei Satz A. 2. Man beweise allein aus der Potenzreihe (4) für z 2 C und n 2 N: ˇ ˇ . nC1 2 n /ˇ ˇ z ˇe & 1 C z C z C ( ( ( C z ˇ . jzj e jzj ˇ 1Š 2Š nŠ ˇ .n C 1/Š sowie, falls n C 2 > jzj: ˇ ˇ . nC1 2 n /ˇ ˇ z nC2 ˇe & 1 C z C z C ( ( ( C z ˇ . jzj : ˇ ˇ 1Š 2Š nŠ .n C 1/Š n C 2 & jzj
9
Elementare Analysis im Rn
Die meisten Effekte unterliegen mehreren Einwirkungen. Das gilt im täglichen Leben und auch in der Wissenschaft. Die Steuern, die eine Familie zu zahlen hat, hängen vom Einkommen der beiden Eltern und von der Zahl der Kinder ab. Der Druck in einem Gasbehälter ist eine Funktion der Gasmenge und der Temperatur. Das Volumen eines Autoreifens wird bestimmt durch inneren und äußeren Durchmesser und die Breite des Reifens. Oft kommen noch weitere Einflüsse hinzu. Andererseits gibt es auch Funktionen von einer Veränderlichen, die mehrere Zahlenwerte zugleich liefern, z.B. die beiden geographischen Koordinaten eines fahrenden Autos in Abhängigkeit von der Zeit. Diese Beispiele zeigen schon, dass Funktionen von mehreren Veränderlichen untersucht werden sollten, um das verschiedene Zusammenwirken der Veränderlichen zu verstehen oder um z.B. Maxima und Minima festzustellen. In diesem abschließenden Kapitel des ersten Bandes studieren wir Aspekte solcher mehrdimensionaler Abhängigkeiten, die direkt von den Funktionen einer Veränderlichen her zugänglich sind. Begriffe dieser Art sind z.B. die Bogenlänge von Kurven oder die partiellen Ableitungen. Im zweiten Band werden diese Gesichtspunkte neu aufgenommen, und zwar im allgemeinen Rahmen der normierten Vektorräume. Der Lebensraum der Analysis mehrerer Veränderlicher ist der Rn , die Menge der nTupel reeller Zahlen. Solche n-Tupel werden meistens als Spalten aufgefasst, z.B. 1 x1 B C x ´ @ ::: A ; 0
xn
1 y1 B C y ´ @ ::: A : 0
yn
Rn ist ein reeller Vektorraum unter den komponentenweisen Operationen 1 0 1 0 1 x1 C y1 y1 x1 C B B C B C :: x C y D @ ::: A C @ ::: A ´ @ A; : 0
xn
yn
xn C yn
1 1 0 *x1 x1 C B B C *x D * @ ::: A ´ @ ::: A ; * 2 R: 0
xn
*xn
Die Schreibweise der n-Tupel als Spalten ist nicht streng fixiert; man kann sie auch als Zeilen schreiben, wie wir das bei den kartesischen Produkten oder z.B. im R2 schon getan haben, wo die Elemente mit .a; b/ bezeichnet wurden. Im Zusammenhang mit dem Matrizenkalkül ist allerdings die Spaltenversion vereinbart. Statt *x D * ( x schreibt man auch x* D x ( *. Für Grenzprozesse in Rn wird zunächst die Maximumsmetrik dm verwendet, dann aber auch die Euklidische Standard-Metrik d . Beide entstehen aus einer Norm,
Kapitel 9 Elementare Analysis im Rn
486
nämlich aus den folgenden Ausdrücken jxjm und jxj: jxjm ´ max fjx1 j; : : : ; jxn jg W jxj ´
dm .x; y/ ´ jx & yjm
p jx1 j2 C ( ( ( C jxn j2 W
d.x; y/ ´ jx & yj:
Im Fall der Maximumsmetrik ist sehr leicht an dem Ausdruck für dm zu erkennen, dass die Metrikaxiome erfüllt sind. Die Dreiecksungleichung ist zunächst in der Gestalt ersichtlich: jx C yjm . jxjm C jyjm , und hieraus folgt dm .x; z/ D jx & zjm D j.x & y/ C .y & z/jm . jx & yjm C jy & zjm D dm .x; y/ C dm .y; z/: Im Fall der Euklidischen Standard-Metrik gilt das Gleiche, wobei genau wie eben aus der Dreiecksungleichung in der Variante (7)[8.6] die allgemeine Gestalt d.x; z/ . d.x; y/ C d.y; z/ folgt. Wie bei R2 in 7.3 sind beide Normen gegeneinander abschätzbar: jxjm . jxj . p njxjm , indem man den Quadratausdruck in jxj dadurch verkleinert, dass man nur die größte der Zahlen x12 ; : : : ; xn2 beibehält, bzw. dadurch vergrößert, dass alle durch ihr Maximum ersetzt werden. Dann folgt weiter durch Anwendung auf die Differenz x & y: (1)
dm .x; y/ . d.x; y/ .
p ndm .x; y/
mit der in Abschnitt 7.3 beschriebenen Konsequenz, dass die Konvergenzbegriffe unabhängig davon sind, welche der beiden Metriken man zu ihrer Formulierung verwendet. Wir kommen später im Rahmen der normierten Vektorräume auf diese Dinge ausführlich zurück (wobei die Notation für diverse Normen stärker systematisiert wird). Für die augenblicklichen Zwecke reichen die eben genannten Tatsachen. Als Distanz wird in diesem Kapitel meistens die Euklidische Standard-Metrik benutzt.
9.1 Abbildungen vom Wegtypus Ein typisches Beispiel für solche Abbildungen ist die Bewegung eines Punktes im Raum in Abhängigkeit von der Zeit. Deshalb nennt man die unabhängige Veränderliche häufig t , obwohl diese auch eine andere Bedeutung haben kann. Die präzise
487
Abschnitt 9.1 Abbildungen vom Wegtypus
mathematische Darstellung ist natürlich unabhängig von möglichen Deutungen und verläuft so: Sei J Intervall in R. Wir betrachten eine Abbildung des Typs: 0 W J &! Rn
1 01 .t / C B t& 7 ! 0.t/ D @ ::: A : 0
0n .t /
Wie gesagt, physikalisch beschreibt dies die „Wanderung eines Punktes“ im Rn in Abhängigkeit von der „Zeit“ t. Mathematisch handelt es sich um mehrere Funktionen 01 ; : : : ; 0n einer reellen Veränderlichen t , zusammengefasst zu einem n-Tupel. Das Intervall J soll natürlich nicht leer sein und bei Differenzierbarkeitsfragen innere Punkte besitzen. A. Definition. Ein Weg im Rn ist eine stetige Abbildung 0 W J ! Rn . Er hat die Eigenschaft „stetig“ oder „differenzierbar“ oder „von der Klasse C 1 “ usw. wenn alle 0i jeweils diese Eigenschaft haben. Entsprechend sind Differenzieren und Integrieren „komponentenweise“ erklärt: 0Z ˇ 1 0 0 1 0 1 .t / 01 .t / dt C B Z ˇ B C B ˛ C B C B C :: 0 0 .t / D B ::: C ; 0.t/ dt ´ B C für Œ˛; ˇ/ , J : : BZ C @ A ˛ @ ˇ A 0 0 n .t / 0n .t / dt ˛
Ist das Definitionsintervall kompakt, also der Weg von der Form 0 W Œa; b/ ! Rn , so heißt 0.a/ sein Anfangspunkt und 0.b/ sein Endpunkt. Man nennt dann 0 auch einen Weg von 0.a/ nach 0.b/. Die Komponenten in der letzten Spalte sind natürlich gewöhnliche Integrale, wie sie in Abschnitt 5.1 eingeführt wurden. Wir bezeichnen solche Integrale zur besseren UnRˇ terscheidung jetzt auch als skalare Integrale und entsprechend ˛ 0.t/ dt als vektorielles Integral. B. Beispiele. (i) Sei n D 2. Ein Kreis (besser: Kreislinie) mit Radius r > 0 und Mittelpunkt 0 2 R2 entsteht als Bild des Wegs: / . r cos t 2 : 0 W Œ0; 2&Œ &! R ; 0.t / ´ r sin t Das Bild ist also
˚ , 0 .Œ0; 2&Œ/ D .x; y/ 2 R2 j x 2 C y 2 D r 2 :
Kapitel 9 Elementare Analysis im Rn
488
γ(t)
Die Abbildung 0 W Œ0; 2&Œ ! 0 .Œ0; 2&Œ/ ist nach O[4.4] bijektiv. Sie entspricht der transzendenten Parametrisierung der Einheitskreislinie S1 , gestreckt mit dem Faktor r.
r 0
(ii) Sei n D 3. Eine Schraubenlinie oder Helix wird beschrieben durch 1 0 r cos t 0 W R &! R3 ; 0.t / ´ @ r sin t A ; pt r > 0; p > 0 fest. Sie wickelt sich um einen Zylinder vom Radius r mit der 3Achse als Achse, indem die Projektion von 0.t/ auf einem Kreis in der (1,2)-Ebene wandert, während gleichzeitig die „Höhe“ (die dritte Koordinate von 0.t/) proportional zu t ansteigt: „Parkhausauffahrt“.
x
x3
t = 2π
x1
t=0
x2
(iii) Sei n 2 N beliebig. Die gerade Strecke zwischen zwei Punkten A; B 2 Rn wird beschrieben durch 0 W Œ0; 1/ ! Rn ; (1)
0.t/ ´ A C t.B & A/ D .1 & t/A C tB:
Für t D 0 ergibt sich der Anfangspunkt A, für t D 1 der Endpunkt B. Genauer gesagt, ist die gerade Strecke oder das Segment zwischen A und B definiert als die Bildmenge des Wegs (1). Wir beleuchten zunächst die beiden grundlegenden Operationen des Differenzierens und Integrierens und gehen dann zum Begriff der Bogenlänge über: C. Definition und Satz. Ist 0 W J ! Rn in t0 2 J differenzierbar, so heißt 0 0 .t0 / der Tangentialvektor von 0 in t0 . Es gilt: (2)
0 0 .t0 / D lim
t !t0
0.t/ & 0.t0 / : t & t0
/&+i .t0 / 0/ Beweis. Der Vektor +.t/&+.t hat offensichtlich die Komponenten +i .t t&t . Wegen t&t0 0 der komponentenweisen Grenzübergänge folgt daraus die Behauptung (2). "
489
Abschnitt 9.1 Abbildungen vom Wegtypus
Anschauliche Deutung:
γ(t)
Nach (2) ist 0 0 .t0 / der Grenzwert von „Sekantenvektoren“, dividiert durch t & t0 . Physikalische Deutung: 0 0 .t0 / ist der Geschwindigkeitsvektor, j0 0 .t0 /j die Geschwindigkeit.
γ(t0)
γ'(t0)
0
0/ C. Zusatz. Ist 0 0 .t0 / ¤ 0, so nennt man den Weg in t0 regulär und bezeichnet j++ 0 .t .t0 /j 0 als den Tangenteneinheitsvektor von 0 in t0 . Ist 0 .t / ¤ 0 für alle t 2 J , so heißt 0 regulär schlechthin.
Von den Rechenregeln zur Ableitung bleibt das meiste erhalten, z.B. die Summenund Produktregel sowie die Kettenregel, soweit die involvierten Operationen sinnvoll sind: Sind 0; ! W J ! Rn sowie f W J ! R und ' W e J ! J (e J ein Intervall) differenzierbar, so gilt dasselbe für 0 C !, f ( 0 und 0 ı ', und es ist .0 C !/0 D 0 0 C ! 0 ;
.f ( 0/0 D f 0 ( 0 C f ( 0 0 ;
.0 ı '/0 D .0 0 ı '/ ( ' 0 :
Die Produktregel gilt auch für das Skalarprodukt: ˝ ˛ ˝ ˛ .h0; !i/0 D 0 0 ; ! C 0; ! 0 : All dies folgt rein rechnerisch aus der komponentenweisen Definition der Ableitung (ohne jegliche Grenzprozesse). Die letzte Regel impliziert speziell .j0j2 /0 D .h0; 0i/0 D 2 h0; 0 0 i und damit, falls 0 nicht null wird: j0j0 D
h0; 0 0 i : j0j
Auch beim Integral übertragen sich die meisten Regeln unmittelbar aufgrund der komponentenweisen Definition, insbesondere die Zerlegungsregel, die Linearität und die Normierung. Dagegen ist die positive Semidefinitheit für n % 2 sinnlos, da Rn nicht angeordnet ist; vgl. den Beginn des Abschnitts 5.1. Auch der Hauptsatz der Differential- und Integralrechnung bleibt in den drei Versionen von Abschnitt 5.2 erhalten, wie man direkt an der obigen Definition A erkennt. Nichttrivial sind die damaligen Konsequenzen aus der positiven Definitheit, insbesondere die Abschätzungsregel. Diese wird hier folgendermaßen behandelt:
Kapitel 9 Elementare Analysis im Rn
490
D. Satz (Dreiecksungleichung für vektorielle Integrale). Für jede stetige Abbildung 0 W Œa; b/ ! Rn gilt: ˇZ ˇ Z ˇ b ˇ b ˇ ˇ (3) 0.t/ dt ˇ . j0.t/j dt: ˇ ˇ a ˇ a Beweis. Ein möglicher Beweis stützt sich auf Riemann-Summen. Jedoch kann auf diesem Wege nicht die Gleichheit diskutiert werden. Wir bevorzugen deshalb das folgende Vorgehen: Für jedes u 2 Rn gilt (der Kürze halber in argumentfreier Notation): ˇ* Z ˇ Z +ˇ ˇZ Z b Z b ˇ ˇ b ˇ ˇ b b ˇ ˇ ˇ ˇ j0j: 0 ˇDˇ jhu; 0ij . juj ( j0 j D juj ( hu; 0iˇ . ˇ u; ˇ ˇ a ˇ ˇ a a a a Dabei wurden die Regeln für skalare Integrale und bei der letzten Abschätzung die Cauchy/Schwarz-Ungleichung in Rn verwendet; vgl. G[8.6]. Spezialisiert man nun u Rb zu u0 ´ a 0, so folgt ˇZ ˇ Z Z b Z b ˇ b ˇ b ˇ ˇ 2 (4) ju0 j D hu0 ; u0 i D ˇ jhu0 ; 0ij . ju0 j(j0 j D ju0 j( j0j: hu0 ; 0iˇ . ˇ a ˇ a a a Anfang und Ende dieser Kette liefern, falls ju0 j ¤ 0: ju0 j . richtig, falls ju0 j D 0. Dies ist die Behauptung.
Rb a
j0 j, und das ist trivial "
D. Zusatz. Die Dreiecksungleichung (3) geht genau dann in eine Gleichung über: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ j0.t/j dt; 0.t/ dt ˇ D (5) ˇ ˇ ˇ a a wenn 0 von der Form ist 0 D p ( c mit einer nichtnegativen stetigen Funktion p W n Œa; b/ ! RC 0 und einem konstanten Element c 2 R . Beweis. Ist 0 von der genannten Form, so ist (5) offensichtlich richtig. Sei nun umgekehrt (5) vorausgesetzt. Es werden die Bezeichnungen aus dem vorhergehenden Beweis beibehalten. Im Fall u0 D 0 folgt aus (5): 0 D 0, sodass die Behauptung mit p D 0 und c D 0 erfüllt ist. Im Fall u0 ¤ 0 folgt aus (5), dass in (4) an der Stelle der beiden Kleinergleichzeichen jeweils das Gleichheitszeichen steht. Aus der Gleichheit bei der zweiten Position ergibt sich Z b .ju0 j ( j0j & j hu0 ; 0i j/ D 0: a
491
Abschnitt 9.1 Abbildungen vom Wegtypus
Da der Integrand nach der Cauchy/Schwarz-Ungleichung nichtnegativ ist, muss er gleich null sein. Daraus folgt nach der Gleichheitsdiskussion der Cauchy/SchwarzUngleichung in G[8.6]: 0 D q ( u0 mit einer reellen Funktion q W Œa; b/ ! R, deren Stetigkeit wegen u0 ¤ 0 aus der Stetigkeit von 0 ˇfolgt.ˇDurch Einsetzen von 0 D q(u0 Rb ˇR b ˇ folgt aus der Gleichheit bei der ersten Position: ˇ a q ˇ D a jqj. Nach der „skalaren Gleichheitsdiskussion“ in K[5.2] ist dann q stets nichtnegativ oder stets nichtpositiv. Wegen 0 D q ( u0 folgt damit die Behauptung mit p ´ q und c ´ u0 im ersten Fall und p ´ &q und c ´ &u0 im zweiten Fall. " E. Folgerung. Sei 0 W Œa; b/ ! Rn stetig differenzierbar und t0 2 Œa; b/. Dann gilt: j0.b/ & 0.a/j . max j0 0 .t/j ( .b & a/
(6)
t2Œa;b*
(7) j0.b/ & 0.a/ & 0 0 .t0 /.b & a/j . max j0 0 .t/ & 0 0 .t0 /j ( .b & a/ t2Œa;b*
3 j0.b/ & 0.a/j % j0 0 .t0 /j & max j0 0 .t / & 0 0 .t0 /j ( .b & a/:
(8)
t2Œa;b*
Die erste Abschätzung ersetzt den Mittelwertsatz der Differentialrechnung, der für vektorwertige Abbildungen nicht mehr in der gewohnten Form gültig ist. Man nennt sie den Schrankensatz oder den Satz vom endlichen Zuwachs. Beweis von E. Zu (6): Dies ergibt sich ganz leicht durch eine Kombination des Hauptsatzes der Differential- und Integralrechnung mit der Dreiecksungleichung: ˇ Z ˇZ ˇ ˇ b b ˇ ˇ j0 0 .t/j dt 0 0 .t / dt ˇ . j0.b/ & 0.a/j D ˇ ˇ ˇ a a Z b 0 . max j0 .t /j ( dt D max j0 0 .t/j ( .b & a/: t 2Œa;b*
a
t2Œa;b*
Zu (7): Wendet man (6) auf g.t/ ´ 0.t/ & 0 0 .t0 /t anstelle 0.t/ an, so ergibt sich jg.b/ & g.a/j . max j0 0 .t / & 0 0 .t0 /j ( .b & a/: t 2Œa;b*
Das ist die Behauptung, da g.b/ & g.a/ D 0.b/ & 0.a/ & 0 0 .t0 /.b & a/. Zu (8): Mit der modifizierten Dreiecksungleichung gilt zunächst j0.b/ & 0.a/j D j0 0 .t0 /.b & a/ C 0.b/ & 0.a/ & 0 0 .t0 /.b & a/j % j0 0 .t0 /.b & a/j & j0.b/ & 0.a/ & 0 0 .t0 /.b & a/j:
Kapitel 9 Elementare Analysis im Rn
492
Wendet man nun auf den letzten Term (7) an, so folgt die Behauptung.
"
Bogenlänge Die Bogenlänge soll die Länge eines Weges messen. Handwerklich erhält man diese Länge, indem man einen Faden entlang der Bildmenge des Weges legt, den Faden (ohne Dehnung) gerade streckt und dann seine Länge feststellt. Mathematisch nähert man die Bildmenge des Weges durch Streckenzüge an, deren Ecken auf der Bildmenge liegen. Jeder solche Streckenzug besitzt eine elementargeometrische Länge, nämlich die Summe der Längen seiner Seiten.
γ(b) γ(tj)
γ(tj-1) γ(a) Daran muss sich ein Grenzprozeß anschließen, um den Weg immer feiner durch solche Streckenzüge anzunähern. Da die Hinzunahme eines weiteren Eckpunkts auf der Bildmenge die Länge des Streckenzugs nicht verkleinert, reicht es in diesem Fall, zum Supremum der Längen aller einbeschriebenen Streckenzüge überzugehen. Spezielle Unterteilungen sind zwar möglich, aber zur Definitionen nicht erforderlich. Statt „Streckenzug“ sagt man auch Polygonzug. Somit lautet die endgültige Definition wie folgt: F . Definition. Gegeben sei ein Weg 0 W Œa; b/ ! Rn . Ist Z eine Zerlegung des Intervalls Œa; b/: (9)
Z D ft0 ; t1 ; : : : ; tk g mit a D t0 < t1 < ( ( ( < tn D b;
so definiert man die zugehörige Länge des einbeschriebenen Polygonzugs als P .0; Z/ ´
k X j D1
j0.tj / & 0.tj &1 /j:
493
Abschnitt 9.1 Abbildungen vom Wegtypus
Der Weg 0 heißt rektifizierbar, wenn die Größen P .0; Z/, genommen über alle Zerlegungen Z von Œa; b/, nach oben beschränkt sind. Die Bogenlänge von 0 ist dann definiert als das Supremum: ˇ ˚ , Lba .0 / ´ sup P .0; Z/ ˇ Z Zerlegung von Œa; b/ : Man schreibt auch kürzer P .Z/ statt P .0; Z/, wenn klar ist, um welchen Weg es sich handelt, und L.0/ statt Lba .0/, wenn klar ist, was das (kompakte) Definitionsintervall von 0 ist. Hat ein Weg ein beliebiges Definitionsintervall, 0 W J ! Rn , und ist für ein ˇ ˇ Teilintervall Œ˛; ˇ/ , J die Restriktion 0 Œ˛; ˇ/ rektifizierbar, so schreibt man statt ˇ Lˇ˛ .0 ˇŒ˛; ˇ// kürzer Lˇ˛ .0/. Im C 1 -Fall kann das Supremum durch das Integral über die Geschwindigkeit j0 0 .t /j ersetzt werden, was natürlich eine große Erleichterung darstellt. Statt dieses begrifflich zu beweisen, wollen wir die Differenz zwischen den Polygonzuglängen und diesem Integral konkret abschätzen. Das geschieht mittels des Feinheitsmaßes und des Stetigkeitsmoduls, an deren Definition erinnert sei: Für eine Zerlegung Z wie in (9) ist das Feinheitsmaß ı.Z/ einfach das Maximum der Intervall-Längen tj & tj &1 für j D 1; : : : ; k; vgl. P[5.1]. Der Stetigkeitsmodul von 0 ist für jedes 1 > 0 gegeben durch ˇ , ˚ (10) !+ .1/ ´ sup j0.t/ & 0.s/j ˇ t; s 2 Œa; b/; jt & sj < 1 : Wegen der gleichmäßigen Stetigkeit von 0 existiert dieses Supremum in R. Auch könnte man (ebenfalls wegen der Stetigkeit) die Bedingung jt &sj < 1 ohne Änderung von !+ .1/ durch jt & sj . 1 ersetzen. Vgl. G[6.5]. G. Lemma. Sei 0 W Œa; b/ ! Rn ein stetig differenzierbarer Weg und Z eine Zerlegung des Intervalls Œa; b/ mit dem Feinheitsmaß ıZ . Dann gilt Z b 3 j0 0 .t /j dt &P .0; Z/ . !j+ 0 j .ıZ /C!+ 0 .ıZ / (.b &a/ . 2!+ 0 .ıZ /(.b &a/: 0. a
Insbesondere ist 0 rektifizierbar. Zu beachten ist, dass in dieses Lemma nicht der Stetigkeitsmodul von 0 selbst, sondern der von 0 0 und j0 0 j eingeht. Beweis von G. Einerseits gilt, wenn man wieder Funktionsdifferenzen mit dem Hauptsatz der Differential- und Integralrechnung ausdrückt: ˇ k ˇ Z tj k X X ˇ ˇ 0 ˇ 0 .t/ dt ˇˇ j0.tj / & 0.tj &1 /j D P .0; Z/ D ˇ j D1
j D1
.
k Z X j D1
tj tj #1
j0 0 .t /j dt D
Z a
b
tj #1
j0 0 .t /j dt:
Kapitel 9 Elementare Analysis im Rn
494
Insbesondere ist P .0; Z/ nach oben beschränkt und damit 0 rektifizierbar. Andererseits gilt unter Verwendung von (8) 3 j0.tj / & 0.tj &1 /j % j0 0 .tj &1 /j & max
t 2Œtj #1 ;tj *
j0 0 .t / & 0 0 .tj &1 /j ( .tj & tj &1 /
( ) % j0 0 .tj &1 /j & !+ 0 .ıZ / ( .tj & tj &1 /; also P .0; Z/ %
k X
j0 0 .tj &1 /j ( .tj & tj &1 / & !+ 0 .ıZ / ( .b & a/
j D1
und damit Z a
b
j0 0 .t /j dt & P .0; Z/ .
k Z X j D1
&
tj tj #1
k X
j0 0 .t /j dt
j0 0 .tj &1 /j ( .tj & tj &1 / C !+ 0 .ıZ / ( .b & a/
j D1
D
k Z X j D1
tj tj #1
( 0 ) j0 .t/j & j0 0 .tj &1 /j dt C !+ 0 .ıZ / ( .b & a/
. !j+ 0 j .ıZ / ( .b & a/ C !+ 0 .ıZ / ( .b & a/: ˇ ˇ Schließlich gilt wegen ˇj0 0 .t /j & j0 0 .s/jˇ . j0 0 .t / & 0 0 .s/j: !j+ 0 j .1/ . !+ 0 .1/; womit alles bewiesen ist.
"
H. Satz. Jeder stetig differenzierbare Weg 0 W Œa; b/ ! Rn ist rektifizierbar, und seine Bogenlänge ist gegeben durch Z b b j0 0 .t /j dt: La .0 / D a
Ist .ZN /N 2N eine Folge von Zerlegungen des Intervalls Œa; b/, deren Feinheitsmaße gegen null konvergieren: limN !1 ıZN D 0, so folgt limN !1 P .0; ZN / D Lba .0 / mit der Fehlerabschätzung ) ( 0 . Lba .0/ & P .0; ZN / . !j+ 0 j .ıZN / C !+ 0 .ıZN / ( .b & a/ . 2!+ 0 .ıZN / ( .b & a/:
495
Abschnitt 9.1 Abbildungen vom Wegtypus
Beweis. Nach der ersten Ungleichung in Lemma G wissen wir bereits, dass für jede Zerlegung Z von Œa; b/ gilt Z P .0; Z/ .
b
a
j0 0 .t /j dt:
Durch Übergang zum Supremum folgt hieraus Lba .0 /
Z .
b a
j0 0 .t /j dt:
Zum Nachweis der inversen Ungleichung sei ein " > 0 vorgegeben. Dann kann durch passende Wahl von Z der letzte Term in der Ungleichungskette von Lemma G kleiner als " gemacht werden. Denn es gilt wegen der gleichmäsigen Stetigkeit von 0 0 (11)
lim !+ 0 .1/ D 0: ,#0
Rb Für eine solche Zerlegung Z gilt dann nach G: P .0; Z/ > a j0 0 .t /j dt & ". Hieraus Rb folgt für das Supremum: Lba .0 / > a j0 0 .t /j dt & " und daraus: Lba .0 / Rb % a j0 0 .t /j dt durch Grenzübergang " # 0. Der Rest der Behauptung ergibt sich unmittelbar aus den Ungleichungen von Lemma G, wenn man diese für Z D ZN spezialisiert und Gleichung (11) beachtet. " I. Beispiele. (i) Die Funktion f W Œa; b/ ! R, x 7! f .x/ sei C 1 . Der zugehörige y Weg ist / . t ; a . t . b: 0.t/ ´ f .t/
γ(t) =
( tf(t) )
Somit ist die Bogenlänge dieses Weges: Lba .0 /
Z D
p 1 C .f 0 .t //2 dt
b
p 1 C .f 0 .x//2 dx:
a
Z D
b
a
a
x=t
b
x
(ii) Einheitskreislinie, exakt einmal durchlaufen, vgl. O[4.4] (einschließlich Zusatz):
Kapitel 9 Elementare Analysis im Rn
496
2
0 W Œ0; 2&Œ &! R ; t 0
y
γ(t)
j0 0 .) /j d )
. / & sin t 0 0 .t / D cos t 0
2
2
t
sin t
Lt0 .0 / D
Z
. / cos t 0.t / ´ : sin t
γ(0) cos t
x
2
j0 .t /j D sin t C cos t D 1 Lt0 .0 / D
Z 0
t
1 d ) D t:
( t) Dies ist die erste Stelle im exakten Aufbau, wo die Variable t in cos eine inhaltliche sin t Bedeutung bekommt, nämlich als Bogenlänge des Kreiswegs 0jŒ0; t /. ( ) Die Gesamtbogenlänge bei Fortsetzung von 0 auf Œ0; 2&/ durch 0.2&/ ´ 10 (wobei dies der einziger Punkt ist, der zweimal erreicht wird) hat den Wert Z 20 20 L0 D 1 d ) D 2&: 0
Dies ist die erste Stelle im exakten Aufbau, wo die Zahl & eine inhaltliche Bedeutung bekommt, nämlich als halben Umfang der Einheitskreislinie. (iii) Für das Segment zwischen zwei Punkten A; B 2 Rn galt nach Beispiel B(iii) die Darstellung 0.t/ ´ A C t .B & A/ D .1 & t/A C tB für 0 . t . 1. Wegen 0 0 .t/ D B & A folgt für seine Bogenlänge Z 1 1 jB & Aj dt D jB & Aj: L0 .0 / D 0
Es herrscht hier also Koinzidenz zwischen dem Abstand der Endpunkte und der Bogenlänge des Segments dazwischen. J. Bemerkung. In praktischen Anwendungen wird der Gesamtumfang der Einheitskreislinie oftmals nicht als Gesamtbogenlänge 2& gemessen, sondern mit einer anderen Einheit als 360 Grad. Für Teile des Kreisumfangs hat man dann neben dem Bogenmaß t das dazu proportionale Gradmaß mit der Umrechnungsformel Gradmaß von t ´
180 ( t: &
Dieses wird durch einen hochgestellten Kreis bezeichnet. Z.B. ist das Gradmaß von t D &=2 gleich 90ı .
497
Abschnitt 9.1 Abbildungen vom Wegtypus
K . Bemerkung. Die Ungleichungen (U)[2.5], die ursprünglich den Arkustangens festzulegen halfen, schreiben sich auf den Tangens so um:
1 C tan2 t
. t . tan t
h &h : für t 2 0; 2
y
Man hat dazu in D[2.5] zu setzen: a D tan t . Mittels F(iii)[4.4] und J(iii)[4.4] (und da cos t dafür positiv ist), lautet dies äquivalent: h &h sin t . t . tan t für t 2 0; : 2 In der anschaulichen Deutung sagt dies, dass die Bogenlänge t des Kreiswegs 0 jŒ0; t / durch diejenigen Streckenlängen nach unten bzw. oben beschränkt ist, die in dem rechts stehendem Bild hervorgehoben sind. Die Bezeichnung ist wie in I(ii) gewählt.
tan t
tan t
sin t
p
t x
Zu den Polarkoordinaten Bei der Einführung der Polarkoordinaten r; ' in R[4.4] galt Folgendes: Zu jedem Paar .x; y/ in R2 gibt es ein r % 0 und ein ' 2 R, sodass x D rpcos ', y D r sin '. Dabei ist r eindeutig bestimmt als Euklidische Distanz r D x 2 C y 2 von .x; y/ vom Ursprung .0; 0/. Das Argument ' ist nur für .x; y/ ¤ .0; 0/ und dann nur bis auf ganze Vielfache von 2& eindeutig bestimmt. Die Strecke von .0; 0/ nach .x; y/, d.h. der Weg + 7! + ( .x; y/, + 2 Œ0; 1/; wird als Fahrstrahl oder Radiusvektor von .x; y/ bezeichnet. Schneidet man im Fall r > 0 den Fahrstrahl bzw. seine Fortsetzung für + > 1 mit der Einheitskreislinie, so ergibt sich der Punkt
p.x; y/ ´
3x y ; D .cos '; sin '/: r r
Zur eindeutigen Festlegung von ' sei nun das Intervall Œ0; 2&Œ gewählt (im Gegensatz zum Hauptwert in R[4.4], der sich auf das Intervall /&&; &/ bezieht). Dann hat ' genau wie in Beispiel I(ii) die Bedeutung der Bogenlänge auf der Einheitskreislinie, gemessen vom Punkt .1; 0/ bis zum Punkt p.x; y/ entlang des Kreisweges 0jŒ0; '/. Damit sind die Polarkoordinaten endgültig gedeutet.
Kapitel 9 Elementare Analysis im Rn
498
y
(x,y) r p(x,y)
ϕ (0,0)
(1,0)
x
Legt man wie in R[4.4] den Hauptwert ' 2 /&&; &/ zugrunde, so erhält man im Wesentlichen die gleiche Deutung, nur dass ' für y < 0 mit dem Negativen der entsprechenden Bogenlänge übereinstimmt. Außerdem besteht hier generell für .x; y/ ¤ .0; 0/ Koinzidenz von ' mit dem orientierten Winkel zwischen den Vektoren u ´ .1; 0/ und v ´ .x; y/, wie ein Vergleich mit der Definition in der linearen Algebra zeigt. L . Definition. Ein Weg 0 W Œa; b/ ! Rn heißt geschlossen, wenn Anfangs- und Endpunkt zusammenfallen: 0.a/ D 0.b/. Ist der Weg 0 W Œa; b/ ! Rn von der Klasse C r für ein r 2 N0 [ f1g, so nennt man ihn C r -geschlossen, wenn 0 .k/ .a/ D 0 .k/ .b/ für alle k . r gilt. $ Zur geometrischen Analysis Wir beschreiben noch einige Situationen, die in besonderem Maße durch die räumliche Anschauung motiviert sind. Es handelt sich also um Anfangsgründe der geometrischen Analysis. Diese wird in weiterführenden Vorlesungen zur Differentialgeometrie gepflegt und besitzt zahlreiche Anwendungen, z.B. in der Physik und der Computergraphik. Das Integral der Geschwindigkeit verhält sich bei Zerlegung des Definitionsintervalls additiv, sodass man bei der Berechnung von Bogenlängen auch stückweise vorgehen kann. Tatsächlich ist die Additivität auch ohne Differenzierbarkeit gewährleistet: M. Satz. Sei 0 W Œa; b/ ! Rn stetig und ein c 2 /a; bŒ gegeben. Dann sind äquivalent:
499
Abschnitt 9.1 Abbildungen vom Wegtypus
(i)
0 ist rektifizierbar;
ˇ ˇ (ii) die Restriktionen 0 ˇŒa; c/ und 0 ˇŒc; b/ sind beide rektifizierbar. Ist (i) oder (ii) erfüllt, so gilt Lba .0 / D Lca .0 / C Lbc .0 /. Beweis. 1) Sei 0 als rektifizierbar vorausgesetzt. Um die Rektifizierbarkeit der beiden Restriktionen zu beweisen, sei Z 0 bzw. Z 00 eine Zerlegung von Œa; c/ bzw. Œc; b/ (vgl. das folgende linke Bild). Dann ist die Vereinigung Z 0 [ Z 00 eine Zerlegung von Œa; b/. Aufgrund der Definition der Polygonzuglängen gilt P .Z 0 [ Z 00 / D P .Z 0 / C P .Z 00 /. Wegen Lba .0/ % P .Z 0 [ Z 00 / folgt Lba .0 / % P .Z 0 / C P .Z 00 /: Isoliert man P .Z 0 / auf der linken Seite dieser Ungleichung, so sieht man, dass P .Z 0 / ˇ 0 für alle Z nach oben beschränkt, also 0 ˇŒa; c/ rektifizierbar ist. Durch Übergang zum Supremum bzgl. der Z 0 folgt Lca .0/ . Lba .0 / & P .Z 00 /, also Lba .0 / % Lca .0 / C P .Z 00 /:
ˇ Mit dem gleichen Schluss bzgl. P .Z 00 / folgt hieraus die Rektifizierbarkeit von 0 ˇŒc; b/ sowie Lba .0 / % Lca .0/ C Lbc .0 /:
γ(b)
γ(b) γ(Z'')
γ(Z')
γ(a)
γ(c)
γ(c) γ(a)
ˇ ˇ 2) Seien umgekehrt 0 ˇŒa; c/ und 0 ˇŒc; b/ als rektifizierbar vorausgesetzt. Um die Rektifizierbarkeit von 0 zu beweisen, sei Z eine Zerlegung von Œa; b/. Dann erhält man e ´ Z [fcg von Œa; b/ und aus dieser durch Hinzunahme von c eine neue Zerlegung Z 0 e e e 00 ´ Z e \ Œc; b/ eine Zerlegung Z ´ Z \ Œa; c/ von Œa; c/ bzw. eine Zerlegung Z von Œc; b/ (vgl. das obige rechte Bild). Es gilt dann (wie generell bei Hinzunahme eines e was man erkennt, indem man die Dreiecksungleichung Teilpunkts): P .Z/ . P . Z/,
Kapitel 9 Elementare Analysis im Rn
500
e 0 und des zweiten Punkts von Z e 00 auf die Bilder von c, des vorletzten Punkts von Z anwendet. Somit ist e D P. Z e0/ C P . Z e 00 /; P .Z/ . P . Z/ wobei die letzte Gleichheit wie bei 1) gerechtfertigt ist. Hieraus folgt P .Z/ . Lca .0/ C Lbc .0 /; sodass P .Z/ nach oben beschränkt, also 0 rektifizierbar ist. Durch Übergang zum Supremum bzgl. Z ergibt sich weiter Lba .0 / . Lca .0 / C Lbc .0 /: 3) Nimmt man die Schlussungleichungen von 1) und 2) zusammen, so folgt endgültig die Behauptung. " N. Bemerkung (Parameterinvarianz der Bogenlänge). So wie die Bogenlänge eingeführt wurde, ist sie zunächst einem Weg 0 W Œa; b/ ! Rn zugeordnet, d.h. einer Abbildung, während sie doch eigentlich ein Maß für eine Punktmenge 0.Œa; b// einschließlich einer bestimmten Abfolge ihrer Punkte sein sollte. Tatsächlich ist das schon gewährleistet, wenn man neben der „nackten“ Punktmenge 0.Œa; b// noch die Aufeinanderfolge ihrer Punkte berücksichtigt. Das soll präzise Folgendes bedeuten: Betrachtet man außer der stetigen Abbildung 0 W Œa; b/ ! Rn eine zweite, e 0 W Œe a; e b/ ! Rn , mit gleichen Anfangs- und Endpunkten e 0 .e a/ D 0.a/, e 0 .e b/ D 0.b/ und gleichem Bild e 0 .Œe a; e b// D 0.Œa; b//, so werden die Punkte dieses Bildes durch e 0 .e t / bzw. 0.t/ in gleicher Reihenfolge durchlaufen, wenn es eine surjektive, streng monoton wachsende Abbildung ' W Œe a; e b/ ! Œa; b/ gibt mit: e 0 .e t/ D 0.'.e t// für e e e alle t 2 Œe a; b/. Dies impliziert '.e a/ D a und '. b/ D b, weil sonst ' nicht surjektiv wäre. Auch gilt dann automatisch das Entsprechende für die Umkehrabbildung ' &1 W Œa; b/ ! Œe a; e b/, insbesondere 0.t/ D e 0 .' &1 .t // für alle t 2 Œa; b/. In dieser Situation sind nun wirklich 0 und e 0 gleichzeitig rektifizierbar oder gleichzeib .e 0 / D Lba .0/. D.h. es kommt nur auf tig nicht rektifizierbar, und im ersten Fall gilt: Le e a die Reihenfolge der Punkte auf dem Bild 0.Œa; b// an, nicht aber darauf, wie schnell oder langsam (oder überhaupt nach welchem „Zeitgesetz“) diese Punkte durchlaufen werden. Zum Nachweis dieser Unabhängigkeit sei Folgendes überlegt: Ist e D fe Z t 0; : : : ; e t k g mit
e aDe t0 < ( ( ( < e tk D e b
e eine Zerlegung von Œa; b/, die mit den eine Zerlegung von Œe a; e b/, so ist Z ´ '. Z/ Bildpunkten tj ´ '.e tj /, j D 0; : : : ; k geschrieben werden kann als Z D ft0 ; : : : ; tk g mit a D t0 < ( ( ( < tk D b:
501
Abschnitt 9.1 Abbildungen vom Wegtypus
Nun gilt e 0 .e tj / D 0.'.e tj // D 0.tj /, also e D P .e 0 ; Z/
k k X ˇ X ˇ ˇe 0 .e tj / & e 0 .e tj &1 /ˇ D j0.tj / & 0.tj &1 /j D P .0; Z/: j D1
j D1
e nach oben beschränkt, d.h. mit 0 auch e Daher ist mit P .0; Z/ auch P .e 0 ; Z/ 0 rektifib b e e e zierbar, und für jede Zerlegung Z von Œe a; b/ gilt P .e 0 ; Z/ . La .0 /, also Le .e 0/ . e a b La .0/. Durch Rollentausch von 0 und e 0 folgt, dass mit e 0 auch 0 rektifizierbar ist e b b .e 0 /, also schließlich die Gleichheit der beiden Bogenlängen, wie sowie La .0 / . Le a behauptet. Übrigens ist ' dann von selbst stetig, da eine surjektive monotone Abbildung von einem Intervall auf ein anderes von alleine stetig ist; vgl. H(iv)[3.6]. Die Stetigkeit von ' wird im obigen Nachweis allerdings gar nicht gebraucht. Diese Unabhängigkeit der Bogenlänge bleibt auch noch erhalten, wenn die Punkte des Bildes von 0 in umgekehrter Reihenfolge durchlaufen werden. Das soll heißen: Ist 4 W Œe a; e b/ ! Œa; b/ surjektiv und streng monoton fallend, so gilt für e 0 ´ 0 ı 4, dass 0 und e 0 gleichzeitig rektifizierbar oder nicht rektifizierbar sind und im ersten Fall b wieder Le .e 0 / D Lba .0 /. Der Nachweis hierfür geht analog wie oben, wobei natürlich e a die Punkte der Bildzerlegung in umgekehrter Reihenfolge aufzuschreiben sind und die e entsprechend umzuordnen ist. Summe P .e 0 ; Z/ So wie hier sind manche Eigenschaften eines Weges 0 gar nicht durch die Abbildung 0 insgesamt bestimmt, sondern nur abhängig von einem Teil der in ihr steckenden Information (im Idealfall nur von der Bildmenge von 0 ). Solche „Invarianzen“ werden durch die folgende Begriffe beschreibbar: O. Definition. Ist 0 W J ! Rn ein Weg und ' W e J ! J eine stetige bijektive Abe e bildung (J; J Intervalle), so heißt e 0 ´ 0 ı ' W J ! Rn eine Umparametrisierung von 0 (mit der Parametertransformation '). Nach Satz A[3.6] ist ' entweder streng monoton wachsend oder aber streng monoton fallend. Je nachdem spricht man genauer von einer sinntreuen oder orientierungstreuen bzw. sinnumkehrenden oder orientierungsumkehrenden Umparametrisierung. Ist ' nur stetig, surjektiv und monoton, was eben auch vorkommt, so sollte man dafür eine andere Terminologie verwenden, also etwa statt „Umparametrisierung“ sagen: Neuparametrisierung. Was in der obigen Bemerkung N herauskam, kann demnach bezeichnet werden als die Invarianz der Bogenlänge gegenüber beliebigen Umparametrisierungen. Man geht oft noch einen Schritt weiter, indem man Wege, die auseinander durch Parametertransformation hervorgehen, in einer Klasse zusammenfasst und eine solche
Kapitel 9 Elementare Analysis im Rn
502
Klasse als Kurve bezeichnet. Je nachdem, welche Sorte von Parametertransformationen zugelassen werden, erhält man verschiedene Kurvenbegriffe. Z.B. ist eine orientierte (reguläre) C r -Kurve mit r % 1 eine Klasse von (regulären) C r -Wegen, die aus einem festen (regulären) C r -Weg durch Anwendung aller orientierungstreuen (regulären) Parametertransformationen der Klasse C r hervorgehen, usw. Wir wollen hier solche Klassenbildungen nicht weiter betonen, achten aber darauf, in welchem Ausmaß Eigenschaften von Wegen gegenüber Parametertransformation invariant sind. Natürlich werden Begriffe, die einen hohen Invarianzgrad aufweisen, wie z.B. die Bogenlänge, von besonderer Bedeutung sein. P. Bemerkung (stückweise differenzierbare Wege). Die Berechnung der Bogenlänge mittels Integration kann auf Wege ausgedehnt werden, die nur stückweise stetig differenzierbar sind. Ein Weg 0 W Œa; b/ ! Rn ist stückweise von der Klasse C r mit r % 1, wenn es ˇeine Zerlegung Z D fa0 ; a1 ; : : : ; ak g von Œa; b/ gibt derart, dass alle Restriktionen 0 ˇŒaj &1 ; aj / (j D 1; : : : ; k) von der Klasse C r sind. 0 selbst ist dabei nach wie vor überall stetig. Ein solcher Weg ist aufgrund der Additivität der Bogenlänge (Satz M) rektifizierbar, und seine Bogenlänge ist gegeben durch das Integral über die stückweise stetige Funktion j0 0 j: Lba .0 / D
Z a
b
j0 0 .t/j dt D
k Z X
aj
j D1 aj #1
j0 0 .t /j dt:
Wegen der Parameterinvarianz kann bei dieser Rechnung jede einzelne Restriktion für sich genommen umparametrisiert werden, wenn dies günstiger erscheint. Die Bogenlänge eines Weges, der stückweise von der Klasse C r ist, setzt sich also additiv zusammen aus den Bogenlängen seiner „Teilwege“ der Klasse C r . Insbesondere lässt sich ein Polygonzug ! auffassen als ein Weg, der in dieser Bezeichnungsweise nicht nur stückweise von der Klasse C 1 ist, sondern stückweise affin, d.h. stückweise parametrisiert durch eine Abbildung der Form t 7! cj ( t C dj . Da diese durch Parametertransformation auf die Form ) 7! .1 & )/Aj &1 C )Aj &1 , gebracht werden kann, wobei Aj &1 ; Aj die Endpunkte der j -ten Restriktion sind, folgt aufgrund von B(iii) k X L.0/ D jAj & Aj &1 jI j D1
d.h. die Bogenlänge des Polygonzugs ! koinzidiert mit der Summe der elementargeometrischen Seitenlängen. Dies gilt insbesondere für einen Polygonzug, der einem Weg 0 im Sinne von Definition F einbeschrieben ist. Der Stetigkeitsmodul einer Funktion hängt eng mit dem Differenzenquotienten und so auch mit der Ableitung zusammen. Davon haben wir schon an früherer Stelle Gebrauch gemacht, als es darum ging, den Unterschied zwischen einem bestimmten Integral und den Riemannschen Näherungssummen abzuschätzen; vgl. Q[5.1]. Im jetzigen
503
Abschnitt 9.1 Abbildungen vom Wegtypus
Fall einer vektoriellen Abbildung 0 W Œa; b/ ! Rn von der Klasse C 1 gilt wegen (10) und (6) !+ .1/ . maxŒa;b* j0 0 j ( 1. Entsprechendes gilt auch eine Differentiationsordnung höher. Insbesondere kann in der Ungleichung von Lemma G die Schranke durch die zweite Ableitung abgeschätzt werden, wenn diese existiert und stetig ist: (12)
0 . Lba .0 / & P .0; Z/ . 2 max j0 00 j ( ıZ ( .b & a/: Œa;b*
Solche Fehlerabschätzungen sind in der Praxis von Nutzen, da Integrale oder Bogenlängen oft nicht exakt berechnet werden können. $ Die Rolle der Krümmung Der Einfluss der zweiten Ableitung wird in der geometrischen Analysis durch die Krümmung ausgedrückt. Deren allgemeine Definition lautet: Q. Definition. Ist 0 W J ! Rn ein regulärer Weg der Klasse C 2 , so ist die Krümmung ~ W J ! R definiert durch q j0 0 j2 ( j0 00 j2 & h0 0 ; 0 00 i2 ~´ : j0 0 j3 Der Ausdruck ist relativ kompliziert gebaut, hat aber seinen guten Sinn. Zunächst ist der Radikand aufgrund der Cauchy/Schwarz-Ungleichung % 0. Außerdem kann man nachrechnen, dass ~ in der Gesamtheit dieser Wege gegenüber Parametertransformationen der Klasse C 2 invariant ist. (j0 00 j selbst hat diese Invarianzeigenschaft nicht.) Die endgültige Rechtfertigung dieser Definition ergibt sich allerdings erst aus der Bedeutung von ~.t/ als Kehrwert des Radiuses eines Kreises, der den gegebenen Weg im Punkt 0.t/ besonders gut berührt, des so genannten Schmiegkreises. Hierauf soll an dieser Stelle aber nicht weiter eingegangen werden. Näheres erfährt man in der Differentialgeometrie. Der Krümmungsausdruck vereinfacht sich deutlich, wenn der Tangentialvektor überall die Länge 1 hat; denn aus j0 0 j D 1 folgt ~ D j0 00 j: Man erkennt dies durch Differenzieren der Gleichung h0 0 ; 0 0 i D 1. Dies ergibt h0 0 ; 0 00 i D 0, d.h. in diesem Fall steht der Vektor 0 00 .t / stets senkrecht auf dem Tangentialvektor 0 0 .t /. Man nennt dann 0 00 .t / den Krümmungsvektor, da seine Länge gleich der Krümmung ~.t/ ist. Diese ist also die Geschwindigkeit des Tangentialvektors längs des Weges. (Das gilt aber nur im Falle j0 0 j D 1.)
Kapitel 9 Elementare Analysis im Rn
504
R. Definition. Ein Weg 0 W J ! Rn der Klasse C 1 heißt normal oder auf Bogenlänge bezogen, wenn j0 0 j D 1 gilt. Der zweite Name rührt daher, dass im Falle j0 0 j D 1 für je zwei Stellen t < s in J gilt: Lst .0 / D s & t, d.h. die Differenz der Parameterwerte ist zugleich die Bogenlänge dazwischen. Übrigens folgt aus dieser letzten Bedingung rückwärts wieder j0 0 j D 1, wie man unmittelbar mit dem Hauptsatz der Differential- und Integralrechnung erkennt. An die Stelle der Ungleichung (12) tritt für einen normalen C 2 -Weg 0 W Œa; b/ ! Rn die Abschätzung (13)
0 . Lba .0 / & P .0; Z/ . max ~ ( ıZ ( .b & a/ Œa;b*
ohne den Faktor 2! Denn man kann in diesem Fall auf die mittlere Schranke in Lemma G zurückgreifen, da !j+ 0 j wegen der Konstanz von j0 0 j verschwindet. Die Annahme der Normalität ist nicht so einschränkend, wie es auf den ersten Blick erscheint. Man kann sie nämlich unter Voraussetzung der Regularität stets durch eine Umparametrisierung erreichen: S. Satz. Zu jedem regulären Weg 0 W Œa; b/ ! Rn der Klasse C r mit r % 1 und der Bogenlänge * ´ Lba .0/ existiert eine Parametertransformation ' W Œ0; */ ! Œa; b/ der Klasse C r mit '.0/ D a; '.*/ D b derart, dass e 0 ´ 0 ı ' W Œ0; */ ! Rn normal r und wiederum von der Klasse C ist. Beweis. Anschaulich gesprochen, hat man lediglich die Bogenlänge, gemessen von a aus, zur Parametrisierung der Wegpunkte zu verwenden. Präzise geht dies so: Sei 4 W Œa; b/ ! Œ0; */ die Bogenlängenfunktion, 4.t/ ´ Lta .0/, hier gegeben durch das Integral Z 4.t/ ´
t
a
j0 0 .)/j d );
wobei für t D a sinnvollerweise Laa .0/ ´ 0 gesetzt ist. Dann gilt nach dem Hauptsatz der Differential- und Integralrechnung: 4 0 .t / D j0 0 .t /j, insbesondere ist 4 von der Klasse C r und 4 0 .t / > 0 in Œa; b/. Daher ist 4 streng monoton wachsend und surjektiv. Die inverse Funktion ' ´ 4 &1 W Œ0; */ ! Œa; b/ ist nach dem Umkehrsatz J[4.3] differenzierbar mit der Ableitung ' 0 .s/ D
1 1 D 0 : 4 0 .'.s// j0 .'.s//j
Somit ist ' in Œ0; */ von der Klasse C r , und dort gilt weiter nach der Kettenregel .0 ı '/0 .s/ D 0 0 .'.s//' 0 .s/ D
0 0 .'.s// : j0 0 .'.s//j
Abschnitt 9.1 Abbildungen vom Wegtypus
505
Dann ist e 0 ´ 0 ı ' W Œ0; */ ! Rn normal und von der Klasse C r .
"
Aufgaben und Anmerkungen 1. Für Abbildungen des Typs 0 W Œa; b/ ! Rn gilt der Mittelwertsatz nicht mehr in der Gestalt von C[4.3], wenn n % 2 ist. a) Im Fall n D 2 sei 0 W Œa; b/ ! R2 stetig und im Inneren /a; bŒ differenzierbar. Dann existiert ein c 2 /a; bŒ und ein % 2 R mit 0.b/ & 0.a/ D % ( 0 0 .c/; b&a d.h. anschaulich: Irgendwo auf dem Weg stellt sich die Tangente parallel zur Sehne. Lösungshinweis: Im Fall 0.b/ ¤ 0.a/ ergänze man den Vektor 0.b/ & 0.a/ durch einen Vektor v 2 R2 zu einer Basis von R2 und stelle 0.t/ in dieser Basis dar. Durch ein geeignetes Beispiel zeige man, dass % i. Allg. nicht als 1 gewählt werden kann. Lässt sich durch Umparametrisieren des Wegs erreichen, dass % D 1 wird? b) Im Fall n % 3 gilt der Mittelwertsatz nicht einmal mehr in der Fassung von a). Man zeige nämlich bei der Schraubenlinie B(ii) in R3 : Es gibt kein t 2 R, sodass 0.2&/ & 0.0/ ein Vielfaches von 0 0 .t / ist. Anschaulich: Kein Tangentialvektor der Schraubenlinie ist parallel zur Achse. Wie folgt daraus das Entsprechende im Fall n % 4? 2. Das Integral einer stetigen vektoriellen Funktion 0 W Œa; b/ ! Rn kann wie im skalaren Fall durch Riemann-Summen beliebig genau approximiert werden. Man zeige nämlich mit den gleiche Schlüssen wie bei P[5.1] für jede Zerlegung Z D fa0 ; : : : ; ak g von Œa; b/ und für jede Wahl von Zwischenstellen 2j 2 Œaj &1 ; aj / für j D 1; : : : ; k: ˇZ ˇ ˇ ˇ
a
b
0.t/ dt &
k X j D1
ˇ ˇ f .2j / ( .aj & aj &1 /ˇˇ . !+ .ıZ / ( .b & a/;
wobei wieder ıZ das Feinheitsmaß von Z und ! den Stetigkeitsmodul bezeichnet.
506
Kapitel 9 Elementare Analysis im Rn
3. Die berühmte Doppelhelix der Mikrobiologie besteht in der Hauptsache aus zwei Schraubenlinien, die um den Winkel von 180ı gegeneinander versetzt sind, Vgl. nebenstehendes Bild. Die horizontalen „Brücken“ zwischen gleich hohen Punkten der beiden Schraubenlinien sind geradlinig und dienen zur Aufnahme der genetischen „Buchstaben“, die dann sukzessive in großer Anzahl entlang der gemeinsamen Achse der Schraubenlinien aufgereiht sind. Natürlich ist das ein prinzipielles Bild zum räumlichen Verständnis dieser Grundstruktur des Lebens. Die tatsächlichen Verhältnisse sind komplizierter. 4. $ Bei einem injektiven Weg mit kompaktem Definitionsintervall 0 W Œa; b/ ! Rn ist die Gesamtheit der Umparametrisierungen allein durch die Bildmenge 0.Œa; b// bestimmt. Man zeige nämlich mittels B[6.5]: Sind 0 W Œa; b/ ! Rn und e 0 W Œe a; e b/ ! n e R injektive Wege mit gleichem Bild 0.Œa; b// D e 0 .Œe a; b//, so existiert eine stetige bijektive Abbildung ' W Œe a; e b/ ! Œa; b/ mit e 0 D 0 ı '. Damit ist klar, dass für solche Wege alles, was invariant gegenüber Parametertransformation ist, allein durch die Bildmenge des Weges bestimmt ist. Die Bildmenge eines injektiven Weges mit kompaktem Definitionsintervall wird ein Jordanbogen genannt. 5. $ Ist 0 W J ! Rn ein injektiver Weg und das Definitionsintervall J nicht kompakt (sowie n % 2), so ist die Umkehrabbildung 0 &1 W 0.J / ! J nicht notwendig stetig. Vgl. Aufgabe 7[6.5]. 6. $ Es sei 0 W J ! Rn ein regulärer Weg der Klasse C r für ein r 2 N und e 0 D0ı ' W e J ! Rn eine Umparametrisierung von 0 vermöge der Parametertransformation 'W e J ! J . Man beweise: Ist e 0 von der Klasse C r , so ist auch ' von der Klasse C r . Ist außerdem e 0 regulär, so auch '. Parametertransformationen zwischen regulären C r -Wegen haben also von alleine die Eigenschaften, von der Klasse C r und regulär zu sein. Lösungshinweis: Um die Abbildungseigenschaften von ' nahe einem Punkt e t0 2 e J herauszufinden, sei der Punkt t0 ´ '.e t 0 / betrachtet und ein Index i gewählt mit 0i 0 .t0 / ¤ 0. Dann hat 0i 0 auf einem geeigneten Intervall J0 mit t0 2 J0 , J keine Nullstellen, und die Restriktion 0i jJ0 vermittelt eine bijektive Abbildung von J0 auf das Intervall 0i .J0 /, die in beiden Richtungen von der Klasse C r ist (Aufgabe 16[8.3]). Weiter ist e J 0 ´ ' &1 .J0 / ein e t 0 enthaltendes Teilintervall von e J . Aus &1 e e e 0 i D 0i ı ' folgere man 'j J 0 D .0i jJ0 / ı .e 0 i j J 0 / und schließe hieraus auf die C r -Eigenschaft von '. 7. $ Wege, die nur stückweise von einer Klasse C r (mit einem r 2 N [ f1g) sind, können an den „Ecken“ abgerundet werden, was für manche Approximationszwecke
507
Abschnitt 9.1 Abbildungen vom Wegtypus
nützlich ist. In vielen Fällen genügt schon eine „Ausglättung“ der Parameter, die die Bildmenge nicht verändert. Dies soll am Fall, dass nur eine „Ecke“ vorhanden ist, präzisiertˇwerden: Seiˇ0 W Œa; b/ ! Rn ein Weg und c 2 /a; bŒ, und es seien die Restriktionen 0 ˇŒa; c/ und 0 ˇŒc; b/ von der Klasse C r . (Die zugehörige Zerlegung entsprechend Bemerkung P ist also fa; c; bg.) Man beweise: Dann existiert eine Parametertransformation ' W Œa; b/ ! Œa; b/ der Klasse C 1 mit '.a/ D a und '.b/ D b derart, dass die Umparametrisierung e 0 ´ 0 ı ' von der Klasse C r ist (auf ganz Œa; b/). Lösungshinweis: Durch Abwandlung der flachen Wanne (N[8.3]) konstruiere man ' als streng monoton wachsende C 1 Funktion ' W Œa; b/ ! Œa; b/ mit '.a/ D a und '.b/ D b und 0 D ' 0 .c/ D ' 00 .c/ D ( ( ( : Dann ist die Komposition e 0 ´ 0 ı ' in ganz Œa; b/ von der Klasse C r , da ihre rechtsund linksseitigen Ableitungen in c bis zur Ordnung r alle null sind. Anschaulich: In der neuen Parametrisierung werden die Punkte von 0.Œa; b// D e 0 .Œa; b// so durchlaufen, dass zum Zeitpunkt c ein „momentaner Stillstand“ herrscht. 8. Man berechne die Bogenlängen der zu folgenden Funktionen f W R ! R gehörenden Wege jeweils von x D 0 bis x D X > 0: a) f .x/ ´ px 2 (p > 0 fest),
b) f .x/ ´ cosh x,
c) f .x/ ´ sinh x.
In der Klasse der Kegelschnitte lässt sich die Bogenlänge nur dann durch elementare Funktionen ausdrücken, wenn es sich um Kreise wie in B(i) oder Parabeln wie in wie in a) handelt, nicht jedoch bei Ellipsen oder Hyperbeln. 9. $ Die Möglichkeit zur Umparametrisierung auf Bogenlänge besteht auch für beliebige Definitionsintervalle. Man zeige nämlich durch Abwandlung des Beweises zu Satz S: Zu jedem regulären Weg 0 W J ! Rn (J Intervall) der Klasse C r mit r % 1 existiert eine streng monoton wachsende surjektive Funktion ' W e J ! J (e J Interr vall) der Klasse C derart, dass e 0 ´ 0 ı ' normal und wiederum von der Klasse C r ist. 10. Man berechne die Bogenlänge der Schraubenlinie 0 aus Beispiel B(ii) zwischen den Parameterwerten t D 0 und t D T , also LT0 .0 / für T > 0. $ Weiter berechne man a) die Krümmung; b) eine normale Umparametrisierung von 0; c) den Krümmungsvektor. 11. $ Im Fall eines regulären C 2 -Wegs 0 W J ! Rn ist neben der Familie der Tangenteneinheitsvektoren V W J ! Rn , V ´ 0 0 = j0 0 j, auch die Familie der Krümmungsvektoren H W J ! Rn durch H ´ V 0 = j0 0 j definiert.
Kapitel 9 Elementare Analysis im Rn
508
a) Man beweise hV; H i D 0, d.h. der Krümmungsvektor ist stets orthogonal zum Tangenteneinheitsvektor und natürlich auch zum Tangentialvektor. b) Man berechne
.
00 j0 0 j
/0
D
j0 0 j2 ( 0 00 & h0 0 ; 0 00 i ( 0 0 j0 0 j3
und folgere daraus für die Krümmung ~ die Darstellung ~ D jH j. Die Krümmung ist also die Geschwindigkeit jV 0 j des Tangenteneinheitsvektors dividiert durch die Geschwindigkeit j0 0 j von 0 selbst. c) Ist 0 zusätzlich normal, so koinzidiert die obige Definition des Krümmungsvektors mit der vor Definition R. Tatsächlich ist die obige Definition invariant gegenüber Parameterwechseln. 12. Ein Weg in R2 ist in Polarkoordinaten beschrieben , wenn eine nichtnegative Funktion ' 7! r.'/, auf einem Intervall J gegeben ist. Der zu betrachtende Weg 0 W J ! R2 ist dann kraft Definition: . / r.'/ cos ' 0.'/ ´ : r.'/ sin ' Hierdurch wird jedem Winkel ' gegenüber der 1-Achse des R2 der Punkt mit Polarkoordinaten r.'/; ' zugeordnet. Das Definitionsintervall J für ' darf dabei ruhig auch länger als 2& sein, und r.'/ darf auch null werden. Wichtig ist nur, dass 0, wie oben gegeben, stetig bzw. von einer bestimmten Klasse differenzierbar ist. Man beweise: Ist die Funktion r von der Klasse C 1 , so auch 0 und für ein Teilintervall Œa; b/ , J ist die Bogenlänge gegeben durch Lba .0/
Z ´
b a
p .r.'//2 C .r 0 .'//2 d':
13. Vor allem spiralförmige Wege lassen sich in Polarkoordinaten gut beschreiben. Man behandle die folgenden Beispiele, in denen jeweils die Funktion ' 7! r.'/, ihr Definitionsintervall J und ggf. das Teilintervall Œa; b/ zur Bogenlängenberechnung angegeben sind: a) r.'/ ´ k' (k D const. > 0), J ´ R, a ´ 0; b > 0; die so genannten Archimedischen Spiralen. k & & (k D const. > 0), J ´ RC , 0 < a < ; b ´ ; die so genannten ' 2 2 hyperbolischen Spiralen.
b) r.'/ ´
c) r.'/ ´ r0 e k' (r0 D const. > 0, k D const.), J ´ R; die so genannten logarithmischen Spiralen.
509
Abschnitt 9.1 Abbildungen vom Wegtypus
Archimedische Spirale
Hyperbolische Spirale
Logarithmische Spirale
14. Oftmals kommt es vor, dass eine Punktmengen vorgegeben ist und gefragt wird, ob es einen (evtl. injektiven) Weg gibt, der die Punktmenge als Bild besitzt. Als Beispiel in R2 sei folgende Menge betrachtet ˇ (p ) ˚ (p ) , A ´ .x; y/ 2 R2 ˇ 3 x 2 C 3 y 2 D 1 ; wobei die dritten Wurzeln im Sinne von (7)[3.7] gemeint sind. A wird eine Sternkurve oder Asteroide genannt. a) Man finde einen injektiven Weg 0 W Œ0; 2&Œ ! R2 derart, dass zu jedem Punkt .x; y/ 2 A ein y t 2 Œ0; 2&Œ existiert mit 0.t/ D 1 .x; y/. (Wäre A die Einheitskreislinie, so wäre die entsprechende Frage durch O[4.4] beantwortet.) x
Lösungshinweis: Man versuche nicht, Polarkoordinaten zu verwenden, sondern wende O[4.4] auf die (p ) Quadratsummengleichung (p ) 3 x 2 C 3 y 2 D 1 an. Das führt auf den Weg 0.t/ D .cos3 t; sin3 t/;
1 Sternkurve (Asteroide)
t 2 Œ0; 2&Œ :
b) Man berechne die Bogenlänge des Weges, der durch stetige Fortsetzung von 0 auf das abgeschlossene Intervall Œ0; 2&/ entsteht. c) Ist 0 regulär bzw. an welchen Stellen t ist die Regularität verletzt? Das Bild zeigt, dass dort die Sternkurve Spitzen entwickelt, obwohl ihre Parametrisierung durch 0 von der Klasse C 1 ist. Der Weg 0 ist also nur „stückweise regulär“. 15. Der Weg 0 W Œa; b/ ! Rn sei von der Klasse C 2 . Man zeige: (14)
0 . Lba .0/ & j0.b/ & 0.a/j . 2 max j0 00 j ( .b & a/2 : Œa;b*
Kapitel 9 Elementare Analysis im Rn
510 $ Ist 0 zusätzlich regulär, so gilt (15)
0 . Lba .0 / & j0.b/ & 0.a/j . max ~ ( Lba .0/2 : Œa;b*
Lösungshinweis: Man spezialisiere (12) bzw. (13) auf die Zerlegung Z D fa; bg. Hinweis: Aus der speziellen Natur der Euklidischen Metrik kann man weitere Abschätzungen der Differenz Lba .0 / & j0.b/ & 0.a/j gewinnen. Je nach Größe von j0 00 j, ~ und Lba .0/ sind diese günstiger oder auch ungünstiger als (14) bzw. (15). Wir kommen darauf in Analysis 2 zurück (Aufgabe 7[11.2]). 16. Gerade Strecken als kürzeste Verbindungen. Sei 0 W Œa; b/ ! Rn ein rektifizierbarer Weg mit 0.a/ ¤ 0.b/. Es gilt dann j0.b/ & 0.a/j . Lba .0/. a) Mittels des Zusatzes zu D zeige man: Ist 0 von der Klasse C 1 , so gilt dann und nur dann j0.b/ & 0.a/j D Lba .0 /, wenn es eine monoton wachsende Funktion ' W Œa; b/ ! Œ0; 1/ gibt, sodass für alle t 2 Œa; b/ gilt: 0.t/ D 0.a/ C '.t/ ( .0.b/ & 0.a//. Die Funktion ' ist dann von selbst von der Klasse C 1 , also 0 eine C 1 Neuparametrisierung des Segments von 0.a/ nach 0.b/. Das besagt: Die gerade Strecke von 0.a/ nach 0.b/ ist die eindeutig bestimmte kürzeste Verbindung unter allen C 1 -Wegen von 0.a/ nach 0.b/. b) $ Man beweise das Gleiche ohne Annahmen über die Differenzierbarkeit: Genau
dann gilt j0.b/ & 0.a/j D Lba .0 /, wenn es eine monoton wachsende Funktion ' W Œa; b/ ! Œ0; 1/ gibt, sodass für alle t 2 Œa; b/ gilt: 0.t/ D 0.a/ C '.t/ ( .0.b/ & 0.a//. Die Funktion ' ist dann von selbst stetig, und 0 ist eine Neuparametrisierung des Segments von 0.a/ nach 0.b/. Das besagt: Die gerade Strecke von 0.a/ nach 0.b/ ist die eindeutig bestimmte kürzeste Verbindung unter allen rektifizierbaren Wegen von 0.a/ nach 0.b/.
In beiden Fällen a) und b) gilt bei Erfülltsein '.t/ D
Lta .0 / ; j0.b/ & 0.a/j
speziell '.a/ D 0 und '.b/ D 1. Man behandle diesbezüglich auch den Sonderfall 0.a/ D 0.b/. 17. Ist 0 W Œa; b/ ! Rn ein rektifizierbarer Weg, so gilt ˇ ˇ Lb .0/ % ˇj0.b/j & j0.a/jˇ: a
Hierin steht genau dann das Gleichheitszeichen, wenn 0 die Gestalt hat 0.t/ D %.t/ ( c mit festem c 2 Rn und monotoner Funktion % W Œa; b/ ! RC 0. 18. Es gibt Wege 0 W Œa; b/ ! Rn , sogar differenzierbare, die nicht rektifizierbar sind: Dazu zeige man:
511
Abschnitt 9.1 Abbildungen vom Wegtypus
a) Die Funktion f W Œ0; 1/ ! R mit f .x/ ´ x sin
1 x
für x ¤ 0;
f .0/ ´ 0
ist stetig. Der zugehörige Weg 0 W Œ0; 1/ ! R2 , 0.t/ ´ .t; f .t //, ist jedoch nicht rektifizierbar. b) $ Die Funktion f W Œ0; 1/ ! R mit 3 1für x ¤ 0; f .0/ ´ 0 f .x/ ´ x 2 sin exp x ist differenzierbar, jedoch nicht stetig differenzierbar. Der zugehörige Weg 0 W Œ0; 1/ ! R2 , 0.t/ ´ .t; f .t //, ist dann ebenfalls differenzierbar, aber nicht stetig differenzierbar, und 0 ist nicht rektifizierbar. 19. Man zeige: Für jeden rektifizierbaren Weg 0 W Œa; b/ ! Rn ist die Bogenlängenfunktion * W Œa; b/ ! R, *.t/ ´ Lta .0 /, stetig. Lösungshinweis: Für a . t < b, jede Zerlegung Z D ft; t1 ; : : : ; tN g von Œt; b/ und jedes s 2 /t; t1 Œ beweise man zunächst die Abschätzung ˇ Lst .0/ . Lbt .0 / & P .0 ˇŒt; b/; Z/ C j0.t/ & 0.s/j: Daraus folgere man die rechtsseitige Stetigkeit von * in Œa; bŒ. Analog für die linksseitige Stetigkeit. 20. Ein Weg 0 W J ! Rn heißt Lipschitz-stetig oder dehnungsbeschränkt, wenn eine Konstante * % 0 existiert derart, dass für alle t; s 2 J gilt: j0.t/ & 0.s/j . *jt & sj. Das * wird dann als Lipschitz-Konstante von 0 bezeichnet. Man zeige: Ein Lipschitz-stetiger Weg 0 W Œa; b/ ! Rn ist stets rektifizierbar. 21. Der Fall n D 1 ist im ganzen Abschnitt zugelassen, wenn auch die geometrische Aufmerksamkeit eher auf den höherdimensionalen Fall gerichtet ist. Natürlich wird R1 D R gesetzt. Die reellen Zahlen bilden selbst einen Euklidischen „Raum“ mit dem Skalarprodukt .,; 1/ 7! , ( 1 für ,; 1 2 R und der zugehörigen Norm , 7! j,j, die mit dem gewöhnlichen Betrag zusammenfällt. Ein Weg 0 W Œa; b/ ! R ist dasselbe wie eine stetige Abbildung von Œa; b/ in R. Ist er rektifizierbar, so sagt man auch, er sei von beschränkter Variation. Dies bedeutet ja, dass die Größen k X P .0; Z/ D j0.tj / & 0.tj &1 /j; j D1
genommen über alle Zerlegungen Z von Œa; b/, eine feste obere Schranke besitzen. Die Bogenlänge von 0 wird dann auch die totale Variation von 0 genannt und so bezeichnet: Vab .0 / ´ Lba .0/ D sup P .0; Z/: Z
Kapitel 9 Elementare Analysis im Rn
512
Statt des Wortes „Variation“ wird auch das Wort Schwankung gebraucht. Alle Aussagen dieses Abschnitts, die für allgemeines n gemacht wurden, gelten speziell auch in diesem Fall n D 1; lediglich die Namengebung ist, historisch bedingt, etwas anders! Darüber hinaus zeige man, dass ein Weg 0 W Œa; b/ ! Rn dann und nur dann rektifizierbar ist, wenn seine n Komponentenfunktionen 01 ; : : : ; 0n alle von beschränkter Variation sind. Welche Ungleichungen ergeben sich daraus zwischen Lba .0 / einerseits und den totalen Variationen Vab .01 /; : : : ; Vab .0n / andererseits? Hinweis: Der Begriff der Variation kann analog auf unstetige Funktionen ausgedehnt werden. 22. $ Zeige: Jede Funktion f W Œa; b/ ! R von beschränkter Variation lässt sich als Differenz f D f1 & f2 zweier monoton wachsender Funktionen f1 ; f2 darstellen. Ist f stetig, so sind auch f1 ; f2 stetig wählbar. Lösungshinweis: Betrachte die Identität f .x/ D Vax .f / & .Vax .f / & f .x// und im stetigen Fall Aufgabe 19. Vgl. auch Aufgabe 8[5.2].
9.2
Funktionen vom Skalartypus
Die vektoriellen Funktionen einer Veränderlichen (Abschnitt 9.1) haben einen Gegentyp, bei dem eine einzige reelle Größe von mehreren Variablen abhängt. Beispiele hierfür gibt es viele. Einige wurden zu Beginn dieses Kapitels genannt. So hängt etwa der Druck in einem Gasbehälter von der Menge des Gases und der Temperatur ab. Es handelt sich dabei um eine skalare Funktion von zwei Veränderlichen. Allgemein geht es hier um reelle (= skalare) Funktionen von n reellen Veränderlichen. Eine solche Funktion ist von der Art (1)
f W A &! R;
A , Rn
x D .x1 ; : : : ; xn / 7&! f .x1 ; : : : ; xn / D f .x/:
Jedem n-Tupel einer Teilmenge A des Rn wird eine reelle Zahl zugeordnet. Wie hier werden die n-Tupel, die als Argumentlisten vorkommen, meistens als Zeilen geschrieben. Zur Veranschaulichung einer solchen Funktion f gibt es folgende Möglichkeiten, die graphisch etwa so aussehen (für n D 2):
513
Abschnitt 9.2 Funktionen vom Skalartypus z
(x,y,f(x,y)) G
c3 c2 c1
y x
A
(x,y)
Das linke Bild zeigt die Linien konstanter Werte, wie sie z.B als Isobaren in einer Wetterkarte oder als Höhenlinien in einer Geländekarte üblich sind. Die „Linien“ können in Wirklichkeit auch ganze Bereiche sein, z.B. in einer Geländekarte bei einem Hochplateau oder einem See. Allgemein handelt es sich bei einer Funktion (1) um die Niveaumengen. Das sind die Mengen ˇ , ˚ c D const. 2 R: x 2 A ˇ f .x/ D c D f &1 .c/; Zu jedem c 2 R ist dies also der Teil der Definitionsmenge A, auf dem f den konstanten Wert c annimmt. (Kommt c nicht im Bild von f vor, so ist die zugehörige Niveaumenge natürlich leer und als solche uninteressant.) Das rechte Bild ist eine Graphendarstellung einer skalaren Funktion von zwei Veränderlichen x; y mit einem Rechteck A als Definitionsmenge. Über jedem Punkt der Definitionsmenge wird in Richtung einer weiteren Koordinatenachse z der Wert der Funktion aufgetragen. Man muss dafür in einen Raum mit einer um 1 höheren Dimension gehen. Allgemein ist der Graph einer Funktion (1) definiert als die Menge ˇ , ˚ .x1 ; : : : ; xn ; xnC1 / 2 RnC1 ˇ .x1 ; : : : ; xn / 2 A; xnC1 D f .x1 ; : : : ; xn / : Die Stetigkeit braucht bei diesem Funktionentyp nicht neu formuliert zu werden, da A und R metrische Räume sind, sodass die entsprechenden Begriffe aus Kapitel 6 zuständig sind. Neu dagegen ist die Differenzierbarkeit. Diese wird uns noch öfter beschäftigen. Hier wird zunächst ein Konzept entwickelt, das unmittelbar auf dem eindimensionalen Fall beruht. Dabei werden alle Variablen bis auf eine festgehalten und nach dem „Änderungsverhalten“ der Funktionswerte in Abhängigkeit von dieser einen Variablen gefragt. A. Definition. Gegeben sei ein Punkt a D .a1 ; : : : ; an / im Inneren Aı von A und ein fester Index i 2 f1; : : : ; ng. Die partielle Ableitung von f in a nach der i -ten Variablen ist
Kapitel 9 Elementare Analysis im Rn
514
i ^ f .a1 ; : : : ; ai C h; : : : ; an / & f .a1 ; : : : ; ai ; : : : ; an / .@i f /.a/ ´ lim ; h h!0 falls dieser Limes in R existiert. Dies ist die gewöhnliche Ableitung der Funktion i ^ , 7! f .a1 ; : : : ; , ; : : : ; an / in ai : Es werden also alle Variable xj festgehalten (D aj ) bis auf die i -te xi . Ist dies für alle i 2 f1; : : : ; ng erfüllt, so heißt f in a partiell differenzierbar. Ist es bei festem i für alle a in einer Teilmenge Ai , A erfüllt, so hat man eine neue Funktion, die i -te partielle Ableitung: @i f W Ai &! R. Der „Aufsatz“ bei den obigen Formeln dient der Markierung der Position in der Argumentliste. Das Symbol @ heißt das „runde d“ und wird oft als „del“ ausgesprochen. Klassischerweise gibt es weitere Symbole für partielle Ableitungen, nämlich bezogen auf die feste Stelle ˇ @f ˇˇ @f µ fxi .a/ µ fi .a/ .a/ µ .@i f /.a/ µ @xi @xi ˇa und als Funktion (definiert auf Ai ): @f µ fxi µ fi : @xi p B. Beispiel. Sei f .x1 ; : : : ; xn / D jxj D .x1 /2 C ( ( ( C .xn /2 . Hier ist: @i f µ
.@i f /.x/ D
1 xi 1 (p : ( 2xi D 2 2 2 jxj .x1 / C ( ( ( C .xn /
Es ist A D Rn , jedoch A1 D ( ( ( D An D A n f.0; : : : ; 0/g. Rein rechnerisch wird einfach nach der betreffenden Variablen unter Konstanthaltung der anderen differenziert. Anschaulich ist die partielle Ableitung die Steigung des Funktionsverlaufs bei Veränderung der betreffenden Variablen unter Festhaltung der anderen.
z
y x
515
Abschnitt 9.2 Funktionen vom Skalartypus
C. Definition (höhere partielle Ableitungen). Diese sind nach dem gleichen „induktiven“ Muster wie bei einer Veränderlichen definierbar; vgl. A[8.3]. Dabei kann beim jeweils nächsten Schritt auch nach einer anderen Veränderlichen als der zuvor partiell differenziert werden, immer vorausgesetzt die vorhandene Funktion ist bereits existent und nach der neu gewählten Variablen partiell differenzierbar. Die Symbolik startet wie folgt: (2)
.@k @i f /.a/ ´ .@k .@i f //.a/
2. Ordnung
(3)
.@` @k @i f /.a/ ´ .@` .@k @i f //.a/ :: :
3. Ordnung
Die Voraussetzungen zur Existenz sind, dass a im Inneren von A liegt und bei (2), dass @i f in einer Umgebung von a existiert und in a nach der k-ten Variablen partiell differenzierbar ist; entsprechend bei (3), dass @k @i f in einer Umgebung von a existiert und in a nach der `-ten Variablen partiell differenzierbar ist; usw. Bei i D k schreibt man auch @k @k µ @2k , usw. Bei den anderen Schreibweisen erfolgt die Symbolik nach folgendem Muster @` @k @i f µ
@3 f µ fxi xk x` µ fik` @x` @xk @xi
und z.B. @` @2k f µ
@3 f ; @x` @xk2
(Reihenfolge!)
usw.
Die partielle Ableitung nullter Ordnung ist wieder f selbst. Die Symbole mit den @-Operatoren werden von rechts nach links abgearbeitet, die mit den Indizes umgekehrt von links nach rechts. Z.B. heißt @k @i f : leite zuerst nach xi ab, dann das Ergebnis nach xk , und fxi xk sagt genau dasselbe! Bei der Auswertung an einer Stelle a wird entweder die übliche Argumentklammer verwendet oder bei den Bruchstrich-Varianten der senkrechte Strich mit a als Index. Man beachte, dass in einen Ausdruck der Form fxi xk .x1 ; : : : ; xn / für die x1 ; : : : ; xn in der Argumentklammer etwas substituiert werden darf, nicht jedoch für xi ; xk im Index von f . Konvention zur Bezeichnung: Im Raum R2 bzw. R3 werden die Koordinaten klassischerweise nicht x1 ; x2 bzw. x1 ; x2 ; x3 genannt, sondern x; y bzw. x; y; z. Das steht etwas in Konflikt mit unserer allgemeinen Bezeichnung eines Elements von Rn durch x. Wir wollen das so regeln, dass wir die Verwendung von x; y; z als Koordinaten durch den Hinweis in klassischer Symbolik o.ä. signalisieren. Die Paare bzw. Tripel selbst müssen dann natürlich anders genannt werden (z.B. u D .x; y/ oder v D .x; y; z/ etc.), was im Einzelnen verabredet werden kann.
Kapitel 9 Elementare Analysis im Rn
516
D. Beispiel. Mit klassischen Koordinatennamen sei die Funktion f W A D R2 ! R definiert durch f .x; y/ D e xy C x & y 3 . Die partiellen Ableitungen bis zur zweiten Ordnung sind dann: fx .x; y/ D e xy y C 1;
fy .x; y/ D e xy x & 3y 2
fxx .x; y/ D e xy y 2 ;
fxy .x; y/ D e xy xy C e xy
fyx .x; y/ D e xy yx C e xy ;
fyy .x; y/ D e xy x 2 & 6y:
Hier ist A1 D A2 D A D R2 . In diesem Beispiel beobachtet man die „Symmetrie der gemischten Ableitungen“: fxy D fyx . Dies gilt viel allgemeiner, wie wir jetzt beweisen werden. E. Satz (von H.A. Schwarz). Sei A Teilmenge von R2 mit (klassischer Koordinatenbezeichnung), .a; b/ ein innerer Punkt von A und f W A ! R eine reelle Funktion. Existieren in einer Umgebung U von .a; b/ mit U , A die partiellen Ableitungen fx ; fy ; fxy und ist fxy in .a; b/ stetig, so existiert auch fyx .a; b/, und es gilt fxy .a; b/ D fyx .a; b/: Beweis. O.B.d.A. sei U ein Ball in der Maximumsmetrik mit Zentrum .a; b/, also ein (offenes) Quadrat mit Mittelpunkt .a; b/. Wir betrachten für je vier Punkte .x; y/; .x C h; y/; .x; y C k/; .x C h; y C k/ 2 U den Ausdruck C ´ f .x C h; y C k/ & f .x C h; y/ & f .x; y C k/ C f .x; y/: Bei festem y und k sei gesetzt: '.x/ ´ f .x; y C k/ & f .x; y/: Dann ist nach dem Mittelwertsatz C D '.x C h/ & '.x/ D h' 0 .x C 2h/
mit einem 2 2 /0; 1Œ:
Hierbei ist erneut nach dem Mittelwertsatz ' 0 .x/ D fx .x; y C k/ & fx .x; y/ D kfxy .x; y C 2 k/
mit einem 2 2 /0; 1Œ:
Natürlich hängen 2; 2 von x; y; h; k ab. Eingesetzt ergibt sich (4)
C D hkfxy .x C 2h; y C 2 k/:
Speziell für .x; y/ D .a; b/ wird dies zu (5)
( ) C $ ´ hkfxy .a C 2h; b C 2 k/ D hk fxy .a; b/ C R.h; k/ ;
517
Abschnitt 9.2 Funktionen vom Skalartypus
wobei wegen der Stetigkeit von fxy in .a; b/ gilt (6)
lim
.h;k/!.0;0/
R.h; k/ D 0:
Nun ist die Größe C $ auch anders darstellbar, da sie aus C durch die Spezialisierung .x; y/ D .a; b/ entsteht: C $ D ' $ .a C h/ & ' $ .a/ mit ' $ .x/ ´ f .x; b C k/ & f .x; b/: Hieraus folgt für k ¤ 0: C$ ' $ .a C h/ ' $ .a/ D & mit: k k k ' $ .a/ ' $ .a C h/ D fy .a; b/; lim D fy .a C h; b/: lim k k k!0 k!0 Vergleich mit (5) ergibt jetzt für k ¤ 0: ( ) ' $ .a C h/ ' $ .a/ & D h fxy .a; b/ C R.h; k/ : k k Ist hierin auch h ¤ 0, so folgt durch Isolieren von R.h; k/, dass der Grenzwert R$ .h/ ´ lim R.h; k/ k!0
existiert, sowie (7)
( ) fy .a C h; b/ & fy .a; b/ D h fxy .a; b/ C R$ .h/ :
Wenn wir wüssten, dass (8)
lim R$ .h/ D 0
h!0
gilt, so wären wir fertig; denn aus (7) folgt dann durch Division mit h und Grenzübergang h ! 0: fyx .a; b/ D fxy .a; b/ einschließlich der Existenz der linken Seite. Tatsächlich ist (8) erfüllt: Zu gegebenem " > 0 existiert nach (6) ein ı > 0 derart, dass die Implikation gilt: max fjhj; jkjg < ı H) jR.h; k/j < ". Damit gilt aber auch jhj < ı H) jR$ .h/j . ", wie man durch Antithese erkennt. Das beweist (8). " F. Definition. Ist r 2 N0 , A offen in Rn und sind alle partiellen Ableitungen der Funktion f W A ! Rn der Ordnungen . r existent und stetig in A, so heißt f r-mal stetig partiell differenzierbar oder von der Klasse C r oder eine C r -Funktion. Die Gesamtheit dieser Funktionen wird C r .A/ genannt. Diese Bezeichnungen werden mit
Kapitel 9 Elementare Analysis im Rn
518
1 anstelle von r gebraucht, wenn alle partiellen Ableitungen von f jeder beliebigen Ordnung r 2 N0 existieren und stetig sind. Somit ist \1 C 1 .A/ D C r .A/: rD0 Ist von vornherein klar, dass die Definitionsmenge einer Funktion f gleich A ist, so schreibt man statt f 2 C r .A/ auch einfacher f 2 C r . Manchmal werden in dem Symbol C r .A/ die Klammern um A weggelassen. Ist f W A ! R in der offenen Menge A von der Klasse C 2 und ist n % 2, so sind die Voraussetzungen von Satz E an jeder Stelle und für jedes Paar von Veränderlichen erfüllt, wenn die anderen Variablen festgehalten werden. Dies impliziert, dass auch in dieser Situation die gemischten Ableitungen unabhängig von der Reihenfolge der Differentiationen sind: @i @j f D @j @i f für i ¤ j in f1; : : : ; ng (und natürlich trivial auch für i D j ). Durch vollständige Induktion ergibt sich hieraus ganz allgemein: G. Folgerung. Ist A offen in Rn und f W A ! R von der Klasse C r für ein r % 2, so sind die partiellen Ableitungen bis zur Ordnung r einschließlich unabhängig von der Reihenfolge der Differentiationen: @i1 ( ( ( @is f D @i# .1/ ( ( ( @i# .s/ f für alle s . r, alle i1 ; : : : ; is 2 f1; : : : ; ng und alle Permutationen ' 2 Ss .
"
Parameterintegrale In dieser Diskussion betrachten wir Funktionen von zwei Veränderlichen. Die inhaltliche Fragestellung ist: Enthält der Integrand eines bestimmten Integrals eine zusätzlichen Variable p, einen so genannten Parameter, wie hängt dann der Wert des Integrals von diesem ab? Ein solches Parameterintegral hat die Gestalt Z (9)
F .p/ ´
a
b
f .t; p/ dt:
Hierin sei f gegeben als Funktion (10)
f W Œa; b/ ) J .t; p/
&!
R
7&!
f .t; p/;
wobei J ein beliebiges Intervall mit nichtleerem Inneren ist. Das Integrationsintervall ist also Œa; b/, während der Parameter p das Intervall J durchlaufen darf. Bei jedem festem p sei die Funktion t 7! f .t; p/ stetig, sodass das Integral F .p/ existiert.
519
Abschnitt 9.2 Funktionen vom Skalartypus
Sein Wert hängt natürlich i. Allg. von p ab. Typische Fragen sind: Ist F stetig? Unter welchen Umständen ist F differenzierbar? Natürlich könnte man im Einzelfall das Integral mit variablem p berechnen und hinterher diese Abhängigkeiten klären. Eine prinzipielle Antwort ist folgende: H. Satz. Ist die Funktion f (10) stetig, so definiert das Parameterintegral (9) eine stetige Funktion F W J ! R. Besitzt die Funktion f außerdem eine stetige partielle Ableitung nach dem Parameter: fp W Œa; b/ ) J &! R; so ist F stetig differenzierbar, und es gilt die so genannte Leibniz-Regel Z b 0 F .p/ ´ fp .t; p/ dt: a
Kurz gesagt: Man darf unter dem Integralzeichen differenzieren. Die partielle Ableitung fp passt nicht vollständig in das Konzept von Definition A, da z.B. im Falle J D Œc; d / ein Punkt .t; c/ nicht innerer Punkt von Œa; b/ ) Œc; d / ist. Aber die gleiche Definition funktioniert hier dennoch, da die Differenzierbarkeit bei einer Veränderlichen auch am Rande des Definitionsintervalls sinnvoll ist. Beweis von H. Zunächst sei J als kompaktes Intervall Œc; d / angenommen. Zur Stetigkeit von F : Für zwei Argumente p0 und p0 C k in Œc; d / gilt Z b ( ) F .p0 C k/ & F .p0 / D f .t; p0 C k/ & f .t; p0 / dt; a
also
Z jF .p0 C k/ & F .p0 /j .
Hierin gilt
a
b
jf .t; p0 C k/ & f .t; p0 /j dt:
jf .t; p0 C k/ & f .t; p0 /j . !f .jkj/;
wobei ! den Stetigkeitsmodul bezeichnet. Somit erhalten wir die Vorausabschätzung jF .p0 C k/ & F .p0 /j . !f .jkj/ ( .b & a/; die die Stetigkeit von F in p0 impliziert. Zur Differenzierbarkeit von F : Für die gleichen Argumentstellen gilt Z b Z b ( ) f .t; p0 Ck/&f .t; p0 /&k(fp .t; p0 / dt: F .p0 Ck/&F .p0 /&k( fp .t; p0 / dt D a
a
Kapitel 9 Elementare Analysis im Rn
520
Zur Abschätzung des Integranden ist E[9.1] ein gutes Hilfsmittel. Nach (7)[9.1] gilt nämlich (mit t0 ´ a) ˇ ˇ ˇ ˇ ˇf .t; p0 C k/ & f .t; p0 / & k ( fp .t; p0 /ˇ . max ˇfp .t; p0 C 2 k/ & fp .t; p0 /ˇ ( jkj -2Œ0;1*
. !fp .jkj/ ( jkj: Zusammen mit der voranstehenden Gleichung folgt hieraus für k ¤ 0 die Vorausabschätzung ˇ ˇ Z b ˇ ˇ F .p0 C k/ & F .p0 / ˇ & fp .t; p0 / dt ˇˇ . !fp .jkj/ ( .b & a/: ˇ k a Diese zeigt, dass die Ableitung von F in p0 existiert und den behaupteten Wert hat. In beiden Fällen verwendet man natürlich, dass der Stetigkeitsmodul zusammen mit seinem Argument gegen null konvergiert; vgl. G(ii)[6.5]. Ist nun J beliebig, so ist F auf jedem kompakten Teilintervall Œc; d / , J im ersten Fall stetig bzw. im zweiten Fall stetig differenzierbar. Daraus folgen aber leicht die gleichen Eigenschaften für das ganze Intervall J selbst. " Abgesehen von der grundsätzlichen Bedeutung sind diese Sätze ein nützliches Hilfsmittel, um Integrale auszuwerten oder abzuschätzen, wenn keine Stammfunktionen bekannt sind, z.B. in folgender Situation: I. Beispiel (Gaußsches Fehlerintegral). Wir betrachten das Parameterintegral Z1 &.1 C t 2 /x 2 e F .x/ ´ dt 1 C t2 0
für x % 0. Es ist also J ´ RC 0 , und der Parameter heißt x statt p. Der Integrand 2
e &.1 C t /x f .t; x/ ´ 1 C t2
2
erfüllt die Voraussetzungen von Satz H; denn die partielle Ableitung 2 2 fx .t; x/ D &2xe &.1 C t /x
ist ebenso wie f selbst in Œ0; 1/ ) RC 0 stetig. Nach der Leibniz-Regel folgt für die Ableitung, die gleich mittels einer einfachen Variablensubstitution umgeformt werde: Z 1 Z 1 2 2 2 2 2 e &t x dt &2xe &.1 C t /x dt D &2xe &x F 0 .x/ D 0
D &2e &x
2
0
Z
x 0
2
e &) d ):
521
Abschnitt 9.2 Funktionen vom Skalartypus
Da rechts ebenfalls eine Ableitung erscheint, ergibt sich hieraus mit einer Konstanten c .Z x /2 2 F .x/ D & e &) d ) Cc; 0
und die Spezialisierung für x D 0 liefert wegen Z 1 & dt F .0/ D D arctan 1 D 2 4 0 1Ct c D &=4, also
& F .x/ D & 4
.Z
x 0
2 e &) d )
/2
:
Aus der Definition von F .x/ erkennt man unmittelbar die Abschätzung Z 1 2 2 & dt D e &x ; 0 . F .x/ . e &x 2 4 0 1Ct also wird 0.
& & 4
.Z
x
0
2
e &) d )
/2
.
& &x 2 e 4
und schließlich durch Anwendung der Regel a2 & b 2 D .a & b/.a C b/ p
(11)
& 0. & 2
Z
x
0
2 e &) d ) .
p & &x 2 e : 2
Hieraus folgt nach dem Einschnürungsprinzip p Z x 2 & &) : e d) D lim x!1 0 2 Das schreibt man auch in der Form Z (12)
0
1
2
e &) d ) D
p & : 2
Hierin ist die linke Seite ein uneigentliches Integral; denn es entsteht aus dem vorhergehenden bestimmten Integral durch einen Grenzübergang am Integrationsintervall. Das uneigentliche Integral (12) heißt das Gaußsche Fehlerintegral. Es spielt in der Wahrscheinlichkeitstheorie eine wichtige Rolle, ebenso wie die in H(ii)[5.4] definierte Gaußsche Fehlerfunktion erf. Für diese ist damit der Grenzwert lim erf.x/ D 1
x!1
Kapitel 9 Elementare Analysis im Rn
522
gefunden. Wie gesagt, die Methode der Stammfunktion versagt hier; denn man kann zeigen, dass exp.&) 2 / keine Stammfunktion in elementarer Gestalt besitzt. Eine ganz andere Herleitung der Abschätzung (11) und des Fehlerintegrals (12) wird in Analysis 2 erfolgen. In Analysis 2 werden wir auch die Voraussetzungen von Satz H weiter abschwächen und dadurch den Anwendungsbereich der Leibniz-Regel deutlich erweitern. J. Bemerkung (zum Zwischenwertsatz von Darboux). $ Ein „geometrischer“ Beweis dieses Satzes, der in M[4.3] formuliert ist, kann folgendermaßen geführt werden: Ist f W Œa; b/ ! R die gegebene differenzierbare Funktion, so betrachte man ihre Differenzenquotienten, und zwar als Funktion von zwei Veränderlichen: 8 < f .x/ & f .y/ ; falls x ¤ y x&y ˆ W Œa; b/ ) Œa; b/ ! R; ˆ.x; y/ ´ : 0 f .x/; falls x D y. ˆ hat die speziellen Werte ˆ.a; a/ D f 0 .a/ und ˆ.b; b/ D f 0 .b/, ist im Allg. aber nur stetig außerhalb der Diagonalen . ´ f.x; y/ 2 R2 j x D yg. Nun betrachte man einen Weg 0 W Œ0; 1/ ! Œa; b/ ) Œa; b/ von .a; a/ nach .b; b/, der ansonsten . meidet (also mit 01 .t / ¤ 02 .t / für 0 < t < 1) und der in den Randpunkten differenzierbar ist, jedoch so, dass 0 0 .0/ und 0 0 .1/ nicht proportional zu .1; 1/ sind. Solche Wege gibt es in großer Zahl; zum Beispiel ist der Polygonzug von .a; a/ nach .b; b/ über .a; b/ in geeigneter Parametrisierung ein solcher Weg. Dann ist die Komposition ˆ ı 0 W Œ0; 1/ ! R stetig. Für t 2 /0; 1Œ ist dies unmittelbar klar, und für t D 0 oder t D 1 liefert die Regel von de l’Hospital A[4.5]: lim t #0 ˆ ı 0.t/ D f 0 .a/, lim t"1 ˆ ı 0.t/ D f 0 .b/. Nach dem Zwischenwertsatz, angewandt auf ˆ ı 0 , ist jede Zahl zwischen f 0 .a/ und f 0 .b/ ein Funktionswert von ˆ ı 0, und ein solcher ist nach dem gewöhnlichen Mittelwertsatz gleich einem Wert der Ableitung f 0 . (Nimmt man als 0 den o.g. Polygonzug, so braucht man die Regel von de l’Hospital gar nicht, da die zuletzt genannten Limites direkt berechnet werden können.)
Aufgaben und Anmerkungen 1. Die Funktion f .x; y/ ´ x y werde auf dem „ersten Quadranten“ Q ´ f.x; y/ 2 R2 j x % 0; y % 0g betrachtet: f W Q ! R. Man zeige: a) f ist in allen Punkten .x; y/ ¤ .0; 0/ stetig. b) f ist in .0; 0/ unstetig, und kann dort auch nicht stetig ergänzt werden.
523
Abschnitt 9.2 Funktionen vom Skalartypus
2. Man berechne alle partiellen Ableitungen der Funktion f .x; y/ ´ sin.xy/ für .x; y/ 2 R2 bis zur zweiten Ordnung. Ist f von der Klasse C 1 ? 1Cx 2 2 3. Man p untersuche, an welchen Punkten von R die Funktion f .x; y/ ´ y 2x 2 C y 2 , .x; y/ 2 R2 , (einmal) partiell differenzierbar ist und berechne dort ihre ersten partiellen Ableitungen.
4. Man differenziere die folgenden Funktionen einmal partiell nach allen ihren Veränderlichen: a) g.x; y; a; b/ D a sin x C b cos y p b) h.x1 ; x2 / D exp.x1 & x2 / c) '.x; y; z/ D
p p 1Cz 2 1 C x2 C y2 .
5. Gegeben ist die Funktion f .x; y; z/ D x 2 C 4x y z C sin.xz/. a) Was ist die maximale Definitionsmenge A in R3 ? b) Man berechne alle partiellen Ableitungen erster und zweiter Ordnung von f . Existieren diese in ganz A? 6. Die Funktion f W R2 ! R sei definiert durch 8 2 2 <xy x & y f .x; y/ ´ x2 C y2 : 0
für .x; y/ ¤ .0; 0/ für .x; y/ D .0; 0/:
Man zeige: a) f ist überall (auch im Ursprung .0; 0/) stetig. b) Die partiellen Ableitungen fx , fy sind überall existent und stetig. c) Die partiellen Ableitungen fxy , fyx sind überall existent, aber im Ursprung nicht mehr stetig. d) Es gilt fxy .0; 0/ D &1, fyx .0; 0/ D 1. Lösungshinweis: Es ist nützlich, in R2 neben den kartesischen Koordinaten x; y auch Polarkoordinaten r; ' zu verwenden. Der Grenzübergang .x; y/ ! .0; 0/ wird dann durch r ! 0 ausgedrückt, da r gerade die Distanz zum Ursprung ist.
Kapitel 9 Elementare Analysis im Rn
524
$ Holomorphie
9.3
Wir kommen nun auf die Frage der Holomorphie zurück, da jetzt die nötigen (relativ einfachen) Hilfsmittel der mehrdimensionalen Analysis zur Verfügung stehen. Dieser Abschnitt ist primär komplex orientiert. Bälle bzw. Sphären bzgl. des komplexen Betrags werden wie in Abschnitt 8.5 mit B.a; r/, B.a; r/ bzw. S.a; r/ bezeichnet (es sind natürlich Kreisscheiben bzw. Kreislinien). Es geht hier um Funktionen des Typs f W A &! C;
A offene Teilmenge von C:
Eine solche Funktion hieß holomorph, wenn es eine stetige Funktion f 0 W A ! C gibt, sodass für alle stetig differenzierbaren Wege 0 W Œ˛; ˇ/ ! B die Komposition f ı 0 W Œ˛; ˇ/ ! C differenzierbar ist mit der Ableitung .f ı 0/0 D .f 0 ı 0/ ( 0 0 ; vgl. J[7.3]. Dort hatten wir auch überlegt, dass die Funktion f 0 im Falle der Existenz eindeutig bestimmt ist, und wir hatten sie die komplexe Ableitung von f genannt. Diese Definition über eine „Kettenregel“ war mehr formaler Natur. Wir wollen jetzt herausarbeiten, was die Holomorphie inhaltlich bedeutet. Einen Fingerzeig dazu gibt das Resultat U[8.5], wonach jede durch eine Potenzreihe dargestellte Funktion holomorph ist. Davon gilt erstaunlicherweise (zumindest lokal) die Umkehrung, und das ist das Hauptergebnis dieses Abschnitts (Satz D). Wir starten mit der Berechnung eines gewissen Integrals: A. Lemma. Für a 2 C mit jaj < 1 gilt Z 20 e it dt D 2&: e it & a 0 Beweis. Der Integrand lässt sich nach leichter Umformung in eine geometrische Reihe entwickeln: 1 X e it 1 ak e &ikt : D D e it & a 1 & ae &it kD0
Die Reihe konvergiert bzgl. t 2 Œ0; 2&/ gleichmäßig; denn sie hat wegen jak e &ikt j D jajk die konvergente, von t unabhängige Majorante mit den Gliedern jajk . Gliedweise Integration ist also erlaubt und liefert Z (1)
0
20
Z 20 1 X e it k dt D e &ikt dt: a e it & a 0 kD0
Die Integrale rechts sind alle null, bis auf das für k D 0: Z 0
20
e 0 dt D 2&;
Z 0
20
e &ikt
ˇ20 e &ikt ˇˇ dt D ˇ D 0 für k 2 N: &ik ˇ 0
Abschnitt 9.3
$ Holomorphie
525
Somit folgt die Behauptung aus (1).
"
Entscheidend ist nun, dass die Funktionswerte einer holomorphen Funktion durch ein Parameterintegral über eine Kreislinie darstellbar sind. Zur Parametrisierung der Kreislinie S.c; r/ wird der Weg 0.t / ´ c C re it
0 W Œ0; 2&/ ! C; verwendet.
B. Satz (Cauchysche Integralformel). Sei f W A ! C holomorph und die Kreisscheibe B.c; r/ in A enthalten. Dann gilt für alle b 2 B.c; r/ 1 f .b/ D 2& i
Z 0
20
f .0.t// 0 0 .t / dt: 0.t/ & b
Beweis. Man betrachte bei festem b das folgende Integral mit s 2 Œ0; 1/ als Parameter Z F .s/ ´
20 0
f ..1 & s/b C s0.t // 0 0 .t / dt: 0.t/ & b
Das Argument von f im Integranden ist eine Art Verbindung zwischen der festen Stelle b und dem variablen Punkt 0.t/ auf der Kreislinie. Die Ableitung F 0 .s/ ist nach der Leibniz-Regel H[9.2] (angewandt auf Real- und Imaginärteil) berechenbar. Denn der Integrand ist für .t; s/ 2 Œ0; 2&/ ) Œ0; 1/ stetig, und seine partielle Ableitung nach s ist f 0 ..1 & s/b C s0.t //.0.t / & b/ 0 0 .t / D f 0 ..1 & s/b C s0.t//0 0 .t /; 0.t/ & b also wiederum für .t; s/ 2 Œ0; 2&/ ) Œ0; 1/ stetig. Man benutzt dabei, dass mit b und 0.t/ auch .1 & s/a C s0.t / in der Kreisscheibe B.c; r/ liegt. Es folgt für s 2 Œ0; 1/ F 0 .s/ ´
Z 0
20
f 0 ..1 & s/b C s0 0 .t //0 0 .t / dt:
Ist nun s 2 /0; 1/, so ist der neue Integrand im Wesentlichen eine Ableitung nach t: f 0 ..1 & s/b C s0.t//0 0 .t / D
) 1 d ( t 7&! f ..1 & s/b C s0.t // ; s dt
also gilt für diese s nach dem Hauptsatz der Differential- und Integralrechnung F 0 .s/ D 0;
Kapitel 9 Elementare Analysis im Rn
526
da f ..1 & s/b C s0.t // für t D 0 und t D 2& die gleichen Werte annimmt. Wegen der Stetigkeit von F 0 auf Œ0; 1/ ist dort insgesamt F 0 D 0, also F konstant. Für s D 0 ergibt sich mittels Lemma A der Wert Z 20 Z 20 f .b/ re it i 0 F .0/ D 0 .t / dt D f .b/ dt 0.t/ & b c C re it & b 0 0 Z 20 e it D f .b/ ( 2& iI D if .b/ b&c 0 e it & r denn der Bruch .b & c/=r hat einen Betrag < 1. Für s D 1 ist der Wert Z 20 f .0.t// 0 0 .t/ dt: F .1/ D 0.t/ & b 0 Wegen F .0/ D F .1/ folgt die Behauptung.
"
Die Cauchysche Integralformel wird häufig mit b als Variable z geschrieben. Unter den Voraussetzungen von Satz B gilt dann für alle z 2 B.c; r/: Z 20 1 f .0.t// 0 (2) f .z/ D 0 .t/ dt; 2& i 0 0.t/ & z wobei 0 die obige Parametrisierung von S.c; r/ ist. Für Integrale der hier auftretenden Bauart hat man eine abkürzende Schreibweise, die jetzt eingeführt werde: C. Definition. Ist g W A ! C eine stetige Funktion und 0 W Œ˛; ˇ/ ! A ein C 1 -Weg in A, so heißt das Integral Z Z ˇ 0 g.0.t//0 .t / dt µ g.%/ d % +
˛
das (komplexe) Kurvenintegral von g längs 0, und man verwendet dafür auch die rechts stehende Schreibweise. Wir werden an dieser Stelle keinen eigenen Kalkül für solche Kurvenintegrale starten, sondern sie lediglich als Sprech- und Schreibweise für diesen Typ von Integralen verwenden. (Später in Analysis 3 werden allgemeinere Kurvenintegrale im Rn systematisch diskutiert.) Die Cauchysche Integralformel (2) schreibt sich damit kürzer als (3)
f .z/ D
1 2& i
Z +
f .%/ d %: %&z
Abschnitt 9.3
$ Holomorphie
527
Diese Darstellung der Funktionswerte durch ein Integral hat weitreichende Konsequenzen. Die erste ist, dass die Variable z in dem Integral als Parameter in einer sehr einfachen Art und Weise erscheint. Dies hat zur Folge, dass man den Integranden in eine geometrische Reihe entwickeln und anschließen gliedweise Integration durchführen kann. Und das führt dann in der Tat zu der angestrebten Potenzreihenentwicklung. Wir schreiben die Umformung für den Integranden in der Form von (3) auf, bedenken aber, dass eigentlich % D 0.t/ zu setzen ist. Natürlich muss dafür gesorgt werden, dass die geometrische Reihe konvergiert. Das ist so zu erreichen: 1 1 1 1 D D ( z %&z .% & c/ & .z & c/ %&c 1& &c %&c . / 1 1 X .z & c/k 1 X z&c k D D : %&c %&c .% & c/kC1 kD0
kD0
ˇ ˇ ˇ ˇ < 1, d.h. jz & cj < j% & cj D r, was für z 2 B.c; r/ Hier besteht Konvergenz für ˇ z&c /&c ˇ erfüllt ist. Auch wenn % D 0.t/ gesetzt wird, besteht gleichmäßige Konvergenz bzgl. t 2 Œ0; 2&/, da die geometrische Reihe mit Quotient jz & cj=r < 1 eine von t unabhängige Majorante ist. Die gleichmäßige Konvergenz bleibt auch erhalten, wenn nach dem Einsetzen von % D 0.t/ noch mit f .0.t//0 0 .t / durchmultipliziert wird, da dies für t 2 Œ0; 2&/ beschränkt ist. Somit kann gliedweise integriert werden, und das liefert unter den Voraussetzungen von Satz B f .z/ D
1 Z 1 X f .%/ d % ( .z & c/k kC1 2& i .% & c/ +
für z 2 B.c; r/
kD0
einschließlich der Konvergenz. Nun wird man noch versuchen, r möglichst groß zu wählen. Dazu „bläst“ man die konzentrischen Kreise um c so weit auf, bis sie an den Rand von A stoßen.
A
ρ c
Das führt zu einem „größten“ Radius %, präzise definiert durch (4)
% ´ sup fr > 0 j B.c; r/ * Ag;
Kapitel 9 Elementare Analysis im Rn
528
wobei auch % D 1 möglich und erlaubt ist. Dann kann die bisherige Überlegung für jedes positive r < % durchgeführt werden. Zusammengefasst ergibt sich so: D. Satz. Ist f W A ! C holomorph, c ein Punkt in A und % 2 R [ f1g definiert durch (4), so gilt die konvergente Potenzreihenentwicklung (5)
f .z/ D
1 X
ak .z & c/k
für jz & cj < %
kD0
mit 1 ak ´ 2& i
(6)
Z +
f .%/ d% .% & c/kC1
für k 2 N0 ;
wobei 0 die Parametrisierung irgendeiner Kreislinie S.c; r/ mit 0 < r < % ist. Beweis. Bis auf die letzte Behauptung ist alles vorab gezeigt worden. Natürlich muss man, um die Entwicklung für ein z mit jz & cj < r1 < % zu sichern, zunächst eine Kreislinie S.c; r/ mit r1 < r < % wählen. Die Koeffizienten ak sind jedoch nach dem Identitätssatz für Potenzreihen O[8.5] eindeutig bestimmt, hängen also gar nicht von r ab, solange r < % bleibt. " Der Konvergenzradius der Potenzreihe in (5) ist natürlich % %. Als Nächstes klären wir den Zusammenhang zwischen der komplexen Ableitung und dem Grenzwert komplexer Differenzenquotienten: E. Satz. Die Funktion f W A ! C ist dann und nur dann holomorph, wenn für jedes c 2 A der Grenzwert f .z/ & f .c/ g.c/ ´ lim 2C z!c z&c existiert und die Funktion g W A ! C stetig ist. In diesem Fall gilt g D f 0 . Beweis. 1) Sei f als holomorph vorausgesetzt. Zu c 2 A existiert nach Satz D eine Umgebung B.c; r/, in der f durch eine konvergente Potenzreihe dargestellt wird: f .z/ D
1 X
ak .z & c/k
für jz & cj < r:
kD0
Hieraus folgt in B.c; r/ f .z/ & f .c/ D f .z/ & a0 D
1 X kD1
k
ak .z & c/ D .z & c/ (
1 X kD1
ak .z & c/k&1
Abschnitt 9.3
also für z ¤ c
$ Holomorphie
529
1 X f .z/ & f .c/ ak .z & c/k&1 : D z&c kD1
Die Reihe auf der rechten Seite stellt als Potenzreihe eine stetige Funktion dar, also existiert ihr Grenzwert speziell für z ! c (und ist gleich a1 ). Dasselbe gilt dann auch für den Grenzwert des Differenzenquotienten auf der linken Seite. 2) Sei vorausgesetzt, dass der Grenzwert g.c/ des Differenzenquotienten stets existiert und stetig von c 2 A abhängt. Um die Holomorphie von f nachzuweisen, sei 0 W Œ˛; ˇ/ ! A ein C 1 -Weg in A. Es muss die Ableitung der Komposition f ı0 berechnet werden. Dies funktioniert genauso wie bei der reellen Kettenregel in B[4.2] (ohne dies zu wiederholen), und das Ergebnis ist: .f ı0/0 .t / D g.0.t//0 0 .t/ für t 2 Œ˛; ˇ/. Somit existiert f 0 .z/ im Sinne von J[7.3] und (11)[7.3] und ist gleich g.z/, also stetig von z 2 A abhängig. " Diese Aussage zeigt insbesondere, dass die komplexe Ableitung im Falle der Existenz punktweise definierbar ist durch einen Grenzübergang, der sich auf die feste Stelle bezieht. Ihr Wert ist also eine infinitesimale Größe: f .z C h/ & f .z/ : h h!0
f 0 .z/ D lim
Dabei ist wichtig, dass der Grenzübergang h ! 0 im Sinne der komplexen Konvergenz durchgeführt wird. Um die Holomorphie einer Funktion f zu überprüfen kann man also jetzt so vorgehen, dass man die Existenz dieses Grenzwertes für jede Stelle z in der Definitionsmenge sichert und nachweist, dass er außerdem stetig von der Stelle abhängt. Die komplexe Differenzierbarkeit setzt sich auf die Ableitung und damit auf alle Ableitungen fort. Das ist ein starker Gegensatz zu den Verhältnissen im Reellen, wo ja aus der einmaligen Differenzierbarkeit keineswegs die zweimalige oder gar höhergradige Differenzierbarkeit folgt. Hier in C gilt jedoch: F. Satz. Ist f W A ! C holomorph, so existieren auch alle komplexen Ableitungen beliebiger Ordnung f 0 W A ! C, f 00 ´ .f 0 /0 W A ! C, f 000 ´ .f 00 /0 W A ! C, : : : und sind selbst wieder holomorph. Beweis. Es reicht natürlich, die Holomorphie von f 0 nachzuweisen. Dann ergibt sich das Weitere durch vollständige Induktion. Ist f holomorph, so wird f in einer Umgebung einer jeden Stelle c 2 A durch eine Potenzreihe mit Zentrum c dargestellt (Satz D). Dort stimmt die komplexe Ableitung mit der formalen Ableitung der Potenzreihe überein (Satz U[8.5]). Somit ist dort die
Kapitel 9 Elementare Analysis im Rn
530
komplexe Ableitung holomorph (Satz U[8.5] und Zusatz). Da die Holomorphie infinitesimal ausgedrückt werden kann, zeigt dies, dass die komplexe Ableitung in ganz A holomorph ist. " G. Folgerung. Die Funktion f W A ! C ist dann und nur dann holomorph, wenn zu jedem Punkt c 2 A eine Umgebung B.c; r/ , A existiert, in der f durch eine Potenzreihe mit Zentrum c dargestellt wird: f .z/ D
1 X
ak .z & c/k ;
jz & cj < r:
kD0
Ist dies der Fall, so können die Koeffizienten ak wie im Reellen durch ak D
f .k/.c/ kŠ
für k 2 N0
berechnet werden (komplexe Taylor-Entwicklung). Ist außerdem B.c; r/ * A, so ist diese Koeffizientenberechnung alternativ möglich durch die Integralformeln aus Satz D: Z 1 f .%/ ak ´ d % für k 2 N0 ; 2& i + .% & c/kC1 wobei 0 die Parametrisierung der Kreislinie S.c; r/ ist. Beweis. Dass die Koeffizienten durch die sukzessiven Ableitungen in c bestimmt werden können, ergibt sich wörtlich genau wie im Reellen (Zusatz I[8.5]). Der Rest folgt, wie gesagt, aus Satz D. " Wenn die darstellende Potenzreihe um c wie oben bei Satz D mit der Cauchyschen Integralformel erzeugt wird, so hat sie automatisch einen Konvergenzradius % %, wobei % im Sinne von (4) der größte Radius der in A hineinpassenden Kreisscheiben um c ist. Das ist ein großer Vorteil gegenüber der Taylor-Entwicklung: Man kann die Mindestgröße des Konvergenzradius gewissermaßen „geometrisch sehen“. Ist die Funktion auf eine offene Obermenge von A holomorph fortsetzbar, so kann es sein, dass die Konvergenzmenge der Potenzreihe sich noch vergrößert; % ist bei gegebenem A nur eine untere Schranke für den Konvergenzradius. Der Fall % D 1 ist besonders günstig. Hier ist A D C. Eine holomorphe Funktion f W C ! C wird als ganze Funktion bezeichnet. (Natürlich ist dann B.c; %/ als C zu lesen.) Auf den ersten Blick scheint sich die Cauchysche Integralformel (3) „in den Schwanz zu beißen“, da ja die Funktion f auf beiden Seiten auftaucht. Tatsächlich spielen aber in dem Integral auf der rechten Seite nur die Funktionswerte f .%/ auf dem Randkreis S.c; r/ eine Rolle, während die linke Seite alle Funktionswerte f .z/ im Inneren
Abschnitt 9.3
$ Holomorphie
531
B.c; r/ betrifft. Mit anderen Worten: Durch die Cauchysche Integralformel werden die Funktionswerte der holomorphen Funktion f im ganzen Inneren der Kreisscheibe durch die Funktionswerte allein auf dem Rande der Kreisscheibe ausgedrückt. Stimmen also die Werte zweier holomorpher Funktionen auf dem Rand überein, so stimmen sie auch im ganzen Inneren überein. Das bezieht sich wie gesagt auf die Situation einer Kreisscheibe, deren Abschluss B.c; r/ in der Holomorphiemenge A enthalten ist. Später in Analysis 3 wird sich das auf allgemeinere kompakte Bereiche (mit guter Randstruktur) verallgemeinern lassen. Diese Tatsachen, ebenso wie der Identitätssatz O[8.5] unterstreichen die starke Bindung, die die Funktionswerte einer holomorphen Funktion untereinander haben. H. Definition und Satz. Die Gesamtheit der holomorphen Funktionen f W A ! C sei mit H.A/ bezeichnet. (Wenn von vornherein klar ist, dass f die Definitionsmenge A hat, so schreibt man statt f 2 H.A/ kürzer f 2 H.) Nach O[7.3] gehören mit f und g auch f C g und f ( g zu H.A/ und, falls g keine Nullstellen besitzt, auch f =g. " Reelle Holomorphie Im Reellen kann die hochgradige Regularität, die in der Holomorphie steckt, nicht anhand der Ableitung und deren Stetigkeit ausgedrückt werden. Stattdessen nimmt man als Muster zur Übertragung die Eigenschaft aus dem ersten Teil von Folgerung G. Sei jetzt g eine Funktion des Typs g W M &! C;
M offene Teilmenge von R:
I. Definition. Die Funktion g W M ! C heißt (reell) holomorph oder auch (reell) analytisch, wenn zu jedem Punkt c 2 M eine Umgebung U.c; r/ , M existiert, in der g durch eine reelle Potenzreihe mit Zentrum c dargestellt wird: g.x/ D
1 X
ak .x & c/k ;
jx & cj < r:
kD0
Ist dies erfüllt, so ist die Reihe rechts natürlich die Taylor-Reihe von g mit Zentrum c, d.h. ihre Koeffizienten sind gegeben durch ak D
g .k/ .c/ kŠ
für k 2 N0 ;
wobei rechts die Ableitungen im Sinne der reellen Differenzierbarkeit stehen (wiewohl g und auch die Koeffizienten komplexwertig sein dürfen).
Kapitel 9 Elementare Analysis im Rn
532
Ist f W A ! C (komplex) holomorph und der Durchschnitt mit der reellen Achse nichtleer: M ´ A \ R ¤ ¿, so ist die Restriktion f jM W M ! C reell analytisch. Denn eine f lokal darstellende Potenzreihe mit Zentrum c 2 M liefert sofort eine lokale Potenzreihendarstellung von f jM mit gleichem Zentrum c, indem sie auf reelle Argumente beschränkt wird. Umgekehrt liefert jede reelle Potenzreihe eine komplexe Potenzreihe mit gleichem Konvergenzradius, indem das reelle Argument x durch das komplexe Argument z ersetzt wird. Somit kann jede reell analytische Funktion lokal holomorph komplex fortgesetzt werden. Dies impliziert das folgende Analogon zu H: J. Definition und Satz. Die Gesamtheit der reell analytischen Funktionen g W M ! C wird mit C ! .M / oder C ! M bezeichnet. (Wenn von vornherein klar ist, dass f die Definitionsmenge M hat, so schreibt man statt f 2 C ! .M / kürzer f 2 C ! .) Mit g und h gehören auch g C h und g ( h zu C ! .M / und, falls h keine Nullstellen besitzt, auch g= h. " Wegen der beliebig hohen Differenzierbarkeit einer Potenzreihe gilt natürlich C ! .M / * C 1 .M /: Die Umkehrung ist nicht richtig. Es gibt sehr wohl C 1 -Funktionen, die nicht analytisch sind, z.B. die flache Wanne aus N[8.3]. Auf weitere Eigenschaften der holomorphen Funktionen kommen wir zurück, sobald die Hilfsmittel dafür entwickelt sind. Dazu gehören insbesondere die Funktionen mehrerer Veränderlicher, die beim nächsten Anlauf in Analysis 2 in einem allgemeineren Rahmen studiert werden. Ein schönes Ergebnis über komplexe Funktionen ist z.B. der Satz von Goursat, der besagt, dass eine Funktion f W A ! C schon dann holomorph ist, wenn für jeder Stelle c 2 A der Grenzwert lim
z!c
f .z/ & f .c/ 2C z&c
existiert. Man braucht nicht zu fordern, dass dieser Grenzwert stetig von c abhängt. Aufgaben und Anmerkungen 1. Man berechne die folgenden komplexen Kurvenintegrale allein aus der Definition C heraus (also ohne Verwendung von Integralsätzen): Z j%j d %, wenn 0 einer der drei folgenden Wege von &i nach i ist: a) +
a1) das Segment zwischen diesen beiden Punkte; a2) die „rechte Hälfte“ der Einheitskreislinie;
Abschnitt 9.3
$ Holomorphie
533
a3) die „linke Hälfte“ der Einheitskreislinie. Gemeint ist natürlich jeweils eine injektive C 1 -Parametrisierung dieser Mengen. Z b) Re % d %, wenn 0 einer der drei folgenden Wege von &1 nach 1 ist: +
b1) das Segment zwischen diesen beiden Punkte; b2) die „obere Hälfte“ der Einheitskreislinie; b3) die „untere Hälfte“ der Einheitskreislinie. Z c) % 2 d %, wenn 0 einer der drei folgenden Wege von 0 nach & ist: +
c1) das Segment zwischen diesen beiden Punkte; c2) die „Sinuslinie“ mit der Parametrisierung 0.t/ ´ t C i sin t , 0 . t . &; c3) der „Parabelbogen“ mit der Parametrisierung 0.t/ ´ t C it.& & t/, 0 . t . &. 2. Gegeben sei eine Funktion f W A ! C und eine holomorphe Funktion F W A ! C mit F 0 D f . Dann ist auch f holomorph, und F heißt eine komplexe Stammfunktion von f . In diesem Fall gilt für jeden C 1 -Weg 0 W Œ˛; ˇ/ ! A: Z f .%/ d % D F .0.ˇ// & F .0.˛//; +
speziell für geschlossenes 0
Z +
f .%/ d % D 0:
3. Ist f W B.c; r/ ! C holomorph, so existiert eine komplexe Stammfunktion F W B.c; r/ ! C von f , und folglich gilt für jeden geschlossenen C 1 -Weg 0 in B.c; r/: Z f .%/ d % D 0: +
Dies ist der so genannte Cauchysche Integralsatz für Kreisscheiben. Lösungshinweis: Man konstruiere F aus der Taylor-Entwicklung von f mit Zentrum c. 4. Man berechne die folgenden komplexen Kurvenintegrale mit Hilfe von Integralsätzen: Z d% a) für eine Konstante a ¤ 0 in C, wenn 0 die Kreislinie mit der Parame+ % &a trisierung 0.t/ ´ re it , 0 . t . 2&, ist: a1) im Fall r < jaj;
Kapitel 9 Elementare Analysis im Rn
534
a2) im Fall r > jaj. Z d% , wenn 0 die Kreislinie mit der Parametrisierung 0.t/ ´ re it , 0 . t . b) 2 + 1C% 2&, ist: b1) im Fall r < 1; b2) im Fall r > 1. Lösungshinweis: Man setze eine komplexe Partialbruchzerlegung der Gestalt 1 A B D C 1 C %2 %&i %Ci an und reduziere damit die Lösung auf den Teil a). 5. Der Radius %, definiert durch (4) kann äquivalent festgelegt werden durch % ´ sup fr > 0 j B.c; r/ * Ag oder auch durch den Wert der inneren Distanzfunktion % D ıA .c/, falls A ¤ C (Aufgabe 8[6.2]). 6. Es seien z1 ; : : : ; zN paarweise verschiedene Punkte in C in der endlichen Anzahl N % 1. Die Funktion f W A ! C mit der Definitionsmenge A ´ Cnfz1 ; : : : ; zN g sei holomorph, aber nicht auf eine Obermenge von A holomorph fortsetzbar. Für c 2 A ist der Konvergenzradius r der Taylor-Reihe von f mit Zentrum c gegeben durch r D min fjc & z1 j; : : : ; jc & zN jg: 7. Neben den komplexen Kurvenintegralen im Sinne der Definition C gibt es auch noch den Typ Z Z ˇ 0 g.0.t//j0 .t /j dt µ g.%/ jd %j +
˛
unter den gleichen Voraussetzungen wie dort. Man kann ein solches Integral als Integral nach der Bogenlänge bezeichnen, da speziell für g ´ 1 die Bogenlänge von 0 herauskommt. a) Es gilt die Abschätzungsregel ˇ Z ˇZ ˇ ˇ ˇ g.%/ d % ˇ . jg.%/j jd %j: ˇ ˇ +
+
b) Beide Integrale sind invariant gegenüber C 1 -Neuparametrisierung mit monoton wachsender Parametertransformation (O[9.1]).
Abschnitt 9.3
$ Holomorphie
535
c) Aufgrund dieser Invarianz sind beide Integraltypen auch für Wege, die stückweise von der Klasse C 1 sind, sinnvoll. Die meisten Aussagen, die für beliebige C 1 Wege richtig sind, können deswegen direkt auf die stückweise Variante übertragen werden. Vgl. Bemerkung P[9.1] und Aufgabe 7[9.1]. 8. Man berechne die Integrale aus Aufgabe 1, die entstehen, indem „d %“ durch „jd %j“ ersetzt wird. 9. Komplexer Logarithmus. Die komplexe Exponentialfunktion exp W C ! C ist holomorph, also eine ganze Funktion; vgl. K(i)[7.3]. Ihre Taylor-Entwicklung mit Zentrum c D 0 lautet nach O[8.3] 1 X zk e D kŠ z
kD0
mit dem Konvergenzradius r D 1. Da die Funktion exp die komplexe Periode 2& i hat, kann sie nicht injektiv sein. Um sie „injektiv zu machen“, muss sie auf eine geeignete Teilmenge eingeschränkt werden. Dazu betrachte man den Streifen K ´ fz D x C iy j x 2 R; y 2 /&&; &/g bzw. den offenen Streifen K ı ´ fz D x C iy j x 2 R; y 2 /&&; &Œg sowie die punktierte Ebene C n f0g und die geschlitzte Ebene S ´ C n fz D x j x . 0g und zeige: a) Das Bild von C unter exp ist die punktierte Ebene: exp.C/ D C n f0g. b) exp bildet K bijektiv auf die punktierte Ebene C n f0g ab. c) exp bildet K ı bijektiv auf die geschlitzte Ebene S ab. d) Die Umkehrabbildung von exp jK W K ! C n f0g definiert den Hauptwert des komplexen Logarithmus: Log WD .exp jK/&1 W C n f0g &! K: Dieser ist gegeben durch Log w D ln jwj C i Arg.w/ für w 2 C n f0g; speziell gilt für x > 0: Log x D ln x. e) Die Restriktion von Log auf die geschlitzte Ebene S ist holomorph mit der Ableitung 1 für w 2 S: Log0 w D w Lösungshinweis: Einen gegebenen C 1 -Weg 0 W J ! S stelle man in Polarkoordinaten durch 0.t/ D R.t/e iˆ.t/ mit C 1 -Funktionen R W J ! RC , ˆ W J ! /&&; &Œ (ˆ.t/ ´ Arg.0.t //) dar, berechne damit .Log ı 0/0 D
00 0
und wende hierauf die Definition der Holomorphie in J[7.3] an.
Kapitel 9 Elementare Analysis im Rn
536 f)
Die Taylor-Entwicklung von Log mit Zentrum c D 1 lautet (wie im Reellen) 1 X
Log w D
kD1
.&1/k&1
.w & 1/k k
für jw & 1j < 1
mit Konvergenzradius 1. Vgl. K[8.5]. g) Bei gegebenem w 2 C n f0g sind alle Lösungen der Gleichung e z D w gegeben durch z D Log w C 2k& i; k 2 Z: 10. Man zeige mittels Aufgabe 2, dass die holomorphe Kehrwertfunktion R W C n f0g ! C, R.z/ ´ 1=z, in der punktierten Ebene C n f0g keine komplexe Stammfunktion besitzt (wohl aber nach Aufgabe 9 in der geschlitzten Ebene S, nämlich F .z/ D Log z). R Lösungshinweis: Berechne + d// für die Parametrisierung 0.t/ D e it , 0 . t . 2&, der Einheitskreislinie. 11. Die Funktion f W B.0; r/ ! C sei holomorph, wobei r 2 RC [ f1g. Man zeige: a) Ist f eine gerade Funktion, d.h. f .&z/ D f .z/ für alle z 2 B.0; r/, so gibt es genau eine holomorphe Funktion g W B.0; r 2 / ! C mit: f .z/ D g.z 2 / für alle z 2 B.0; r/. b) Ist f eine ungerade Funktion, d.h. f .&z/ D &f .z/ für alle z 2 B.0; r/, so gibt es genau eine holomorphe Funktion g W B.0; r 2 / ! C mit: f .z/ D zg.z 2 / für alle z 2 B.0; r/. c) Gelten entsprechende Aussagen auch für reell analytische Funktionen f W /&r; rŒ ! C? d) $ Gelten entsprechende Aussagen für (genügend oft) stetig differenzierbare Funktionen f W /&r; rŒ ! R?
12. Wertet man die Cauchysche Integralformel unter den Voraussetzungen von Satz B speziell für den Mittelpunkt c der Kreislinie aus, so ergibt sich Z 20 1 f .c C re it / dt: f .c/ D 2& 0 Das ist die so genannte Mittelwerteigenschaft holomorpher Funktionen: Der Funktionswert im Zentrum einer Kreisscheibe ist das arithmetische Mittel (im Sinne der Integralrechnung) aller Funktionswerte auf dem Randkreis. 13. Ist f W C ! C eine ganze Funktion und gilt mit reellen Konstanten C % 0, m % 0: jf .z/j . C ( jzjm für alle z 2 C, so ist f ein Polynom vom Grad . m. Für m D 0 nennt man dies den Satz von Liouville.
Abschnitt 9.3
$ Holomorphie
537
Lösungshinweis: Man entwickle f in die Taylor-Reihe mit Zentrum c D 0 und behandle deren Koeffizienten in der Integraldarstellung (6). In diese kann man die vorausgesetzte Ungleichung einbringen und erhält durch Grenzübergang r ! 1: ak D 0 für k > m. 14. Mit dem Satz von Liouville (Aufgabe 13) kann der Fundamentalsatz der Algebra erneut und sehr kurz bewiesen werden: Angenommen ein Polynom P W C ! C vom Grad % 1 hätte keine Nullstelle in C. Dann wäre 1=P eine ganze Funktion und ferner beschränkt, da limz!1 1=P .z/ D 0. Daraus würde folgen: 1=P .z/ D const., also P .z/ D const., im Widerspruch zur Annahme. 15. Unter den Voraussetzungen von Satz B gilt die Integralformel (3) auch für die k-te Ableitung, da diese mit f holomorph ist: f
.k/
1 .z/ D 2& i
Z +
f .k/ .%/ d %: %&z
Daraus folgere man mittels sukzessiver Produktintegrationen Z f .%/ kŠ d %: f .k/ .z/ D 2& i + .% & z/kC1 16. Die holomorphe Funktion f W B.a; r/ ! C sei durch eine Potenzreihe mit Konvergenzradius r 2 RC [ f1g definiert: (7)
f .z/ ´
1 X
aj .z & a/j ;
jz & aj < r:
j D0
Ist b ein fester Punkt in B.a; r/, so lässt sich f in eine Potenzreihe mit Zentrum b entwickeln, deren Konvergenzradius s % r & jb & aj ist und die f in B.b; r & jb & aj/ darstellt (Satz D). Denn die Kreisscheibe B.b; r & jb & aj/ ist offensichtlich die größte mit Zentrum b, die in B.a; r/ hineinpasst (vgl. das folgende linke Bild).
b
b
a
a r
R
r
Kapitel 9 Elementare Analysis im Rn
538
Die Koeffizienten dieser Umentwicklung lassen sich auf zwei Arten bestimmen: a) Man setzt in (7): z &a D .z &b/C.b &a/, entwickelt .z &a/j nach Potenzen von z & b entsprechend der binomischen Formel und vertauscht formal die Reihenbil( ) dungen, wobei man sinnvollerweise beachtet, dass kj für k > j verschwindet. Das liefert 0 ! .X / 1 j j &k k f .z/ D aj .b & a/ .z & b/ k j D0 kD0 0 ! / 1 .X 1 X j j &k .b & a/ .z & b/k D aj k kD0 j D0 0 ! / 1 .X 1 X kC` ` akC` .b & a/ .z & b/k : D k 1 X
kD0 `D0
Hier wurde zuletzt die Indextransformation ` D j & k für die „innere“ Reihe vorgenommen. Um die Vertauschung der Reihenbildungen zu rechtfertigen, benötigt man einen entsprechenden Umordnungssatz (N[8.8]), der unter der Voraussetzung jz & bj < r & jb & aj tatsächlich die Gültigkeit dieser Rechnung sichert. b) Ohne Rückgriff auf die Umordnung kann man mit den augenblicklichen Hilfsmitteln folgendermaßen vorgehen: Dass die Funktion in B.b; r & jb & aj/ mit Zentrum b entwickelt werden kann, ist nach Satz D klar. Es geht allein um die Berechnung der Koeffizienten bk in f .z/ ´
1 X
bk .z & b/k ;
jz & bj < r & jb & aj:
kD0
Dazu sei - die Parametrisierung einer Kreislinie S.a; R/ mit jb & aj < R < r (vgl. das obige rechte Bild). Dann gilt nach Satz B, angewandt auf f .k/ f .k/ .b/ D
1 2& i
Z )
f .k/ .Z/ dZ: Z&b
Damit ist die Umrechnung der Koeffizienten von den aj in die bk nicht schwierig: Aufgrund der geometrischen Reihe 1
X .b & a/` 1 D ; Z&b .Z & a/`C1 `D0
für
jb & aj < jZ & aj
Abschnitt 9.3
$ Holomorphie
539
folgt f .k/ .b/ D
1 2& i
1 D 2& i
Z )
f .k/ .Z/
1 X .b & a/` dZ .Z & a/`C1 `D0
1 X
.b & a/
`D0
`
Z
)
f .k/ .Z/ dZ: .Z & a/`C1
Die Begründung ist genau wie oben bei den Überlegungen zu Satz D. Nach Aufgabe 15, angewandt auf f .k/ anstelle f , ist f
.kC`/
`Š .a/ D 2& i
Also wird f .k/ .b/ D
Z )
f .k/ .Z/ dZ: .Z & a/`C1
1 X 1 .b & a/` f .kC`/ .a/ `Š `D0
und damit
0 ! 1 1 X X kC` f .k/ .b/ .kC`/ ` 1 D f .a/ D .b & a/ akC` .b & a/` : bk D kŠ kŠ`Š k `D0
`D0
Das Ergebnis ist dasselbe wie bei a). Das muss auch so sein, da die Koeffizienten der Taylor-Entwicklung durch die Funktion eindeutig bestimmt sind. Man ergänze die (wenigen noch fehlenden) Einzelheiten dieser Argumentation! Der Konvergenzradius s der Umentwicklung kann größer als r & jb & aj sein (falls r ¤ 1). In diesem Fall lässt sich die Funktion von B.a; r/ auf die echt umfassende Menge B.a; r/ [ B.b; s/ holomorph fortsetzen. Die Iteration dieses Prozesses, die so genannte analytische Fortsetzung führt auf den Begriff der Riemannschen Fläche, was aber erst in weiterführenden Vorlesungen diskutiert werden kann. Bei reellen Potenzreihen treffen die Resultate genauso zu, der Beweis kann aber im Fall b) nicht rein reell geführt werden, da man in R nicht über Kreislinien integrieren kann; man muss „übers Komplexe gehen“. Bei rein reellen Koeffizienten und nur reellen Zentren sind die Koeffizienten der Umentwicklung wieder reell, wie man an der obigen Formel für die bk sieht. 17. Diese Aufgabe knüpft an Aufgabe 16 an. Man betrachte die Funktion f W A ! C 1 mit f .z/ ´ 1Cz auf der Menge A ´ C n f&1g. Sie ist dort holomorph, und ihre Taylor-Entwicklung mit Zentrum a ´ 0 lautet f .z/ D
1 X
.&1/k z k ;
kD0
a D 0; r D 1 (Konvergenzradius)
Kapitel 9 Elementare Analysis im Rn
540
1 2
lautet
1 ; 2
sD
Man zeige: Die Umentwicklung mit Zentrum b ´ f .z/ D
1 X kD0
.&1/k
3 2 -kC1 3 3
z&
1 -k ; 2
bD
3 (Konvergenzradius): 2
Lösungshinweis: Man kann natürlich f .k/ .b/ ausrechnen und damit die Taylor-Reihe von f mit Zentrum b ansetzen. Eleganter ist es, wie oben vorzugehen und zu schreiben 1 1 1 D D ( 1Cz 1 C b C .z & b/ 1Cb
1 z&b 1C 1Cb
sowie den letzten Bruch in eine geometrische Reihe zu entwickeln. Den Konvergenzradius der Umentwicklung kann man mittels Aufgabe 6 ohne Rechnung vorhersagen. In diesem Beispiel hat die Umentwicklung einen deutlich größeren Konvergenzradius als r & jb & aj D b, nämlich s D 1 C b. Tatsächlich ist hier sogar B.b; s/ 0 B.a; r/ (Skizze!).
Literatur Zur Logik und Mengenlehre P.R. Halmos[1976]: Naive Mengenlehre: Vandenhoeck & Ruprecht R. Walter[1999]: Grundbegriffe der Mengenlehre, URL-Adresse: http://www.mathematik.uni-dortmund.de/lsvii/Preprints/mengen.pdf Zur linearen Algebra W. Greub[1976]: Lineare Algebra: Springer E. Sperner[1963]: Einführung in die analytische Geometrie und Algebra, Teil 1: Vandenhoeck & Ruprecht R. Walter[1996]: Einführung in die lineare Algebra: Vieweg R. Walter[1993]: Lineare Algebra und analytische Geometrie: Vieweg Allgemeine Parallel-Literatur M. Barner/F. Flohr[1996/2000]: Analysis: de Gruyter; I: 2000, II: 1996 C. Blatter[1974/1980]: Analysis: Springer; 1: 1980, 2: 1979, 3: 1974 O. Forster[1989/2006]: Analysis: Vieweg; 1: 2006, 2: 2005, 3: 1989 H. Heuser[2003/2004]: Lehrbuch der Analysis: Teubner; I: 2003, II: 2004 W. Kaballo[1997/2000]: Einführung in die Analysis: Spektrum; I: 2000, II: 1997, III: 1999 K. Königsberger[2004/2004]: Analysis: Springer; 1: 2004, 2: 2004 W. Maak[1969]: Differential- und Integralrechnung: Vandenhoeck & Ruprecht
542
Literatur
Weiterführende Literatur J. Dieudonné[1976/1987]: Grundzüge der modernen Analysis: Vieweg; 1: 1985, 2: 1987, 3: 1976, 4: 1976, 5/6: 1979, 7: 1982, 8: 1983, 9: 1987 S. Lang[1983]: Real Analysis: Addison-Wesley Spezialliteratur und Originalarbeiten O. Deiser[2005]: Der Multiplikationssatz der Mengenlehre, Jahresb. DMV 107, 88109 P. Dombrowski[1999]: Wege in euklidischen Ebenen: Springer H.D. Ebbinghaus et al.[1992]: Zahlen: Springer D. Hilbert[1999]: Grundlagen der Geometrie: Teubner A. Hurwitz[1911]: Über die Einführung der elementaren transzendenten Funktionen in der algebraischen Analysis, Math. Annalen 70, 33-47 Y. Iwamoto[1949]: A proof that & 2 is irrational, Osaka Inst. Tech. 1, 147-148 M. Kneser[2004]: Ein etwas anderer Zugang zur Exponentialfunktion, Mathem. Sem. ber. 51, 225-229 K. Knopp[1996]: Theorie und Anwendung der unendlichen Reihen: Springer W. Kühnel[2005]: Differentialgeometrie: Vieweg H. Minkowski[1925]: Geometrie der Zahlen I. Niven[1947]: A simple proof that & is irrational, Bull. AMS 53, 509 O. Perron[1951]: Algebra II: de Gruyter H. Reckziegel/M. Kriener/K. Pawel[1998]: Elementare Differentialgeometrie mit Maple: Vieweg W. Rinow[1961]: Die innere Geometrie der metrischen Räume: Springer H. Weyl[1966]: Algebraische Zahlentheorie: Bibliographisches Institut A. Wiles[1995]: Modular elliptic curves and Fermat’s Last Theorem, Ann. Math. (2) 141, 443-551
Wichtige Symbole Die Ordnung erfolgt nach den Seitenzahlen des ersten Auftretens.
Kapitel 1 1
aCb
Summe zweier Zahlen
1
a ( b D ab
Produkt zweier Zahlen
1
0
Null
1
&a
additives Inverses
2
1
Eins
2
a&1
multiplikatives Inverses
4
b&a
Differenz
4
2
Zwei
5
1 b , , a a a2
Quadrat
6
<
kleiner
6
>
größer
8
.
kleiner gleich
8
%
größer gleich
9
jaj
Betrag
11
Œa; b/, /a; bŒ, Œa; bŒ, /a; b/
Intervalle
12
sup M
Supremum
13
R
Menge der reellen Zahlen
16
N
Menge der natürlichen Zahlen
18
N.p/
Abschnitt von N
18
jM j
Anzahl
21
N0
Menge f0; 1; 2; : : :g
21
Z
Menge der ganzen Zahlen
5
Quotienten
544
Wichtige Symbole
21
Q
Menge der rationalen Zahlen
21
Z.p; q/, Z.p; 1/, Z.&1; q/ C
22
R ,
23
nŠ
23
n
24
a
n X
RC 0,
...
Abschnitte von Z Vorzeicheneinschränkungen von R, Z, . . . Fakultät Potenz
n Y
aj ,
j D1
25
Z& 0,
X
aj
Summe, Produkt
j D1
Summe (Variante)
j 2J
26
0 ! n k
Binomialkoeffizient
32
max M
Maximum
32
min M
Minimum
38
&M
gespiegelte Menge
38
inf M
Infimum
39
Œa/
das Größteganze
41
$ A [ B
disjunkte Vereinigung (A [ B mit A \ B D ¿)
Kapitel 2 49
n 7! an , .an /n2N , .an /, an
Folge
49
a1 ; a2 ; a3 ; : : :
Folge
51
Grenzwert einer Folge
63
lim an D a, an ! a (für n ! 1) n!1 p x
72
exp.a/
Exponentialfunktion
73
e
Eulersche Zahl x
Quadratwurzel
73
e
81
arctan
Arkustangens
81
&
Kreiszahl
88
lim an
n!1
e-Funktion
Limes superior
545
Wichtige Symbole
89 97
lim an
Limes inferior
n!1
k1 : : : kn ;k&1 k&2 : : :
Dezimalbruch-Entwicklung
Kapitel 3 101
sign x
Signumsfunktion
102
Œx/
Größteganze-Funktion Gauß-Klammer
102
Gf
Graph einer Funktion
103
jf j, f C g, f ( g,
103
fg, f =g
Kurzformen
106
deg.P /
Polynomgrad
116
U.a; ı/
Umgebung
116
U $ .a; ı/
punktierte Umgebung
117
x!a
x gegen a
lim f .x/ D b, f .x/ ! b (für x ! a)
Grenzwert einer Funktion
lim f .x/,
eingeschränkter Grenzübergang
lim f .x/, lim f .x/
rechtsseitiger, linksseitiger Grenzwert
min f , max f
Minimum, Maximum
117 124 124 135
f g
Operationen für Funktionen
x!a x!c x2C x#c
Œa;b*
oder
x"c
Œa;b*
138
sup f , inf f ,max f , min f
Supremum, Infimum, Maximum, Minimum
139
sup f , sup f .x/, . . .
Supremum (Varianten), . . .
lim f .x/ D ˙1,
uneigentliche Grenzwerte
lim f .x/ D b, lim f .x/ D ˙1,
uneigentliche Grenzwerte
lim an D ˙1, lim an D ˙1
uneigentliche Grenzwerte
lim f .x/ D b, lim f .x/ D ˙1
uneigentliche Grenzwerte
141 142 143 143
X
X
X
X
x2X
x!a
x!1 n!1
x!&1
x!1
n!1
x!&1
147
˙1
Unendlich
147
R
erweiterte reelle Achse
546
Wichtige Symbole
147
&.˙1/, j ˙ 1j, a ˙ 1, . . .
Operationen für ˙1
148
U.˙1; D/, U .˙1; D/
Umgebungen von ˙1
150
f .x/ Š g.x/ .für x ! ˛/
asymptotisch gleich
151
o, O
Landau-Symbole
160
ln
natürlicher Logarithmus
162 162
$
p q
a , ap=q p q
a
Potenz mit rationalem Exponenten allgemeine Wurzel
a
t
allgemeine Potenz
162
a
bc
mehrfache Potenz
163
loga b
allgemeiner Logarithmus
163
log10 b
dekadischer Logarithmus
162
Kapitel 4 168
f 0 .a/
Ableitung
172
fC0 .a/ f&0 .a/ &1
rechtsseitige Ableitung
172 176
linksseitige Ableitung
f 1 , 1=f f
Umkehrfunktion
192
tan
Tangens
194
cos, sin
Kosinus, Sinus
201
S1
Einheitskreis
204
Arg.x; y/
Hauptwert des WinkelArguments
206
arccos, arcsin, arctan, arccot
zyklometrische Funktionen
176
Kehrwertfunktion
Kapitel 5 Z 228
a
b
f
Integral
547
Wichtige Symbole
Z 231
b a
Z dx,
b
a
dx , f .x/
Z
b a
g.x/ dx , f .x/
Zb Integral (Varianten) a
231
Of
Ordinatenmenge
232
!f .1/
Stetigkeitsmodul
233
ıZ
Feinheitsmaß
253
ˇb ˇb h ib h ib ˇ ˇ ˆ.x/ˇ , ˆ.x/ˇ , ˆ.x/ , ˆ.x/ a xDa a xDa Z a f .x/ dx b Z f .x/ dx
259
erf.x/
Fehlerfunktion
259
Si.x/
Integralsinus
240 247
261 261 262 262
lim fn .x/ D f .x/
Funktionsdifferenz orientiertes Integral unbestimmtes Integral
punktweise Konvergenz
n!1
fn .x/ ! f .x/ (für n ! 1)
punktweise Konvergenz
lim fn .x/ D f .x/ glm.
gleichmäßige Konvergenz
n!1
fn .x/ ! f .x/ glm. (für n ! 1)
gleichmäßige Konvergenz
Kapitel 6 Bälle und Sphäre
278
B.a; r/, B.a; r/, S.a; r/ Aı
278
A
abgeschlossene Hülle
278
@A
Rand
281
Sn
symmetrische Gruppe
281
ˆ.'/
Fehlstandszahl
272
286 293 299
lim F .x/ D b, F .x/ ! b
x!a
Inneres
(für x ! a)
d $ .x1 ; x2 / lim ak D a, an ! a (für n ! 1)
k!1
Grenzwert einer Abbildung induzierte Metrik Grenzwert einer Folge
309
X1 ) X2
kartesisches Produkt
312
P1 , P2
Projektionen zu X1 ) X2
548
Wichtige Symbole
312
J1 , J2
kanonische Injektionen zu X1 ) X2
316
dc .t; s/
chordale Metrik (reell)
320
!F .1/
Stetigkeitsmodul
321 321 321
lim Fk .x/ D F .x/
k!1
Fk .x/ ! F .x/ (für k ! 1) lim Fk .x/ D F .x/ glm.
k!1
punktweise Konvergenz punktweise Konvergenz gleichmäßige Konvergenz
321
Fk .x/ ! F .x/ glm. (für k ! 1)
gleichmäßige Konvergenz
330
i
imaginäre Einheit
Kapitel 7 331
Re z, Im z
Realteil, Imaginärteil
331
z
konjugiert Komplexes
331
jzj
Betrag in C
335
e sCit , exp.z/, e z
e-Funktion in C
336
Arg.z/
Hauptwert des WinkelArguments in C
338
cosh x, sinh x
Kosinus, Sinus hyperbolicus
338
arcosh y, arsinh y
Umkehrungen von cosh x, sinh x
338
tanh x, cotanh x
Tangens, Kotangens hyperbolicus
338
artanh y, arcotanh y
Umkehrungen von tanh x, cotanh x
342
dm .z; w/
Maximumsmetrik in C
343
d.z; w/
Euklidische Metrik in C
lim f .z/ D 1
uneigentlich Grenzwert in C
348 348
z!b
lim f .z/ D c, lim f .z/ D 1
z!1
z!1
uneigentliche Grenzwerte in C
348
&.1/, j1j, a C 1, . . .
Operationen für 1 in C
352
f0
komplexe Ableitung
549
Wichtige Symbole
354
S2
Euklidische Einheitssphäre
354
dc .z; w/
chordale Metrik (komplex)
356
cos z, sin z
Kosinus, Sinus in C
357
cosh z, sinh z
Kosinus, Sinus hyperbolicus in C
357
hz; wi, Œz; w/
Skalarprodukt, Determinante in C
358
^0 .z; w/, ^.z; w/
Winkel in C
Kapitel 8 370
1 X
ak , a1 C a2 C ( ( (
kD1
376
X
ak ,
X
Reihe
ak
Reihe (Varianten)
k
384
%.˛/
Riemannsche Zetafunktion
384
0; k1 : : : kv kvC1 : : : kvCp
periodische Dezimaldarstellung
388 389
1 X kD1 1 X
fk f1 C f2 C ( ( (
Funktionenreihe
fk D f (glm.)
Funktionenreihe, gleichmäßige Konvergenz
kD1
394
f .0/ , f 0 , f 00 , f 000 , f .n/ n
n
1
höhere Ableitungen 1
395
C .A/, C A, C .A/, C A
Mengen stetig differenzierbarer Funktionen
397
Tn .x/
Taylor-Polynom
397
Rn .x/
Restglied
397
j˛; ˇj
Intervall (Variante)
400
1 X kD0
f .k/ .a/ .x & a/k kŠ
Taylor-Reihe
409
enC1 .h/ R
Restglied (Variante)
409
Pn .x/
Legendre-Polynome
550 416 416
Wichtige Symbole
B.a; r/, B.a; r/, S.a; r/ 1 X
ck .z & a/k
Kreisscheibe, Kreislinie in C Potenzreihe
kD0
426
0 ! p k
442
ha; bi, jaj
Skalarprodukt, Euklidische Norm in Rn
445
.ıf /.x1 ; x2 /
Differenzenquotient
allgemeiner Binomialkoeffizient
Kapitel 9 486
jxjm , dm .x; y/
Maximumsnorm, Maximumsmetrik in Rn
486
jxj, d.x; y/
Euklidische Norm, Euklidische Metrik in Rn
488
0 0 .t0 /
Tangentialvektor
492
P .0; Z/
Polygonzuglänge
493
Lba .0 /
Bogenlänge
503
~
Krümmung
511
Vab .0/
totale Variation
514
.@i f /.a/
partielle Ableitung
515
@f , fxi , fi @xi .@k @i f /.a/, .@` @k @i f /.a/, . . .
515
@` @k @i f ,
514
@i f ,
@3 f , fxi xk x` , fi k` @x` @xk @xi
partielle Ableitung (Varianten) höhere partielle Ableitungen höhere partielle Ableitungen (Varianten)
Sachregister Symbole ."; N /-Test, 51, 84 ."; ı/-Test, 117, 126, 287
A abbrechende Dezimalbruch-Entwicklung, 93 Abel Satz von, 476 Abel, Niels Henrik (1802-1829), 108, 464, 465, 468, 470, 476 Abelsche Gruppe, 15 Abelsche partielle Summation, 464 Abelscher Grenzwertsatz, 468, 470 Abelsches Kriterium, 465 abgeschlossen, 275 abgeschlossen in, 280 abgeschlossene Hülle, 278 abgeschlossener Ball, 273 abgeschlossenes Intervall, 11 Ableitung, 167, 168, 177 erste, 395 höhere, 394 höhere partielle, 515 komplexe, 352 linksseitige, 172 n-te, 395 nullte, 395 partielle, 513, 514 rechtsseitige, 172 zweite, 394 Ableitungsregeln, 173 Abschätzung, 9 Abschätzungsregel, 226 Abschluss, 278 Abschnitt, 18 absolut konvergent, 378
absolut summierbar, 472 absolut-gleichmäßig, 390 Absolutbetrag, 9 absolute Maximalstelle, 413 absolute Minimalstelle, 413 absolutes Maximum, 413 absolutes Minimum, 413 abspaltbar, 429 abspalten, 107 Abstand, 270 Abstandsfunktion, 290 abzählbar, 40 abzählbar unendlich, 40 Achse imaginäre, 339 reelle, 339 reelle punktierte, 391 Addition, 2 Monotonie der, 6 Additionstheorem der e-Funktion, 73 des Arkustangens, 190 des Kosinus, 196 des Sinus, 196 des Tangens, 208 Additivität des Integrals, 221, 226 affine Funktion, 106 ägyptische Tripel, 211 Ähnlichkeit, 363 algebraische Gleichung, 108 Algorithmus Euklidischer, 114 allgemeine Potenz, 162 alternierende harmonische Reihe, 379 alternierende Reihe, 376
552 analytisch, 351 reell, 531 analytische Fortsetzung, 539 Anfangspunkt, 487, 488 angenommen, 39 angeordneter Körper, 6 annehmen, 135 Anordnungseigenschaft, 6 Anteil ganzer, 109 gebrochener, 109 konstanter, 171 linearer, 171 Anzahl, 18 Approximation, 51 Approximationssatz von Weierstraß, 107 äquidistante Zerlegung, 235 äquivalent, 306 äquivalente Metriken, 293 Archimedes von Syrakus (287? - 212 v. Ch.), 37, 508 Archimedische Eigenschaft, 37 Archimedische Spirale, 508 Argand, Jean Robert (1768-1822), 367 Argument, 204 argumentweise Definition, 103 arithmetische Summe, 31, 36 arithmetische Summenformel, 31 arithmetisches Mittel, 15, 65, 441 Arkuskosinus, 206 Arkuskotangens, 206 Arkussinus, 206 Arkussinus-Reihe, 428 Arkustangens, 75, 81, 206 Arkustangens-Reihe, 425 Assoziativgesetz, 1, 2, 15 assoziiert, 114 Asteroide, 509 asymptotisch gleich, 150 asymptotisch proportional, 150 auf Bogenlänge bezogen, 504 aufgehen, 109 aufzählende Mengenschreibweise, 40
Sachregister
Aufzählung, 40 Ausdruck unbestimmter, 217 ausschöpfen, 278 Ausschöpfung, 153 Äußeres, 285
B Ball
abgeschlossener, 273 offener, 273 Basis, 24, 163 bedingt konvergent, 475 beliebig wenig, 51, 117 Bernoulli, Jakob (1654-1705), 26 Bernoullische Ungleichung, 26 Berührungspunkt, 284 beschränkt, 50, 99, 280 nach oben, 11, 50, 99 nach unten, 38, 50, 99 beschränkte Schwankung, 512 beschränkte Variation, 511 bestimmen, 22 bestimmte Divergenz, 143, 144 bestimmtes Integral, 220, 230, 253 Bestimmungsgleichung, 3, 103 Betrag, 9, 331 Binomialkoeffizient, 26 verallgemeinerter, 426 binomische Formel, 26, 334 binomische Reihe, 428 Bogenlänge, 493 Bogenlängenfunktion, 504 Bogenmaß, 496 Bolzano, Bernard (1781-1848), 84, 87 Bolzano/Weierstraß Satz von, 84, 87 Borel, Emile (1871-1956), 302 Bruch, 5 Bruchrechnung Regeln der, 14
Sachregister
C 1
C -Funktion, 395 C n -Funktion, 395 C r -Funktion, 517 Cauchy, Augustin Louis (1789-1857), 82, 85, 123, 322, 375, 389, 412, 442, 461, 466, 525, 533 Cauchy-Folge, 84, 302 Cauchy-Kriterium, 82, 85, 322, 375, 389 Cauchy-Produkt, 466 Cauchy-Restglied, 412 Cauchy/Schwarz-Ungleichung, 442 Cauchysche Integralformel, 525 Cauchyscher Integralsatz, 533 chordale Metrik, 354 Cusanus, Nicolaus (1401-1464), 407
D Darboux, Gaston (1842-1917), 186, 522 darstellen, 388 Darstellung g-adische, 98 kartesische, 336 Darstellungsproblem, 400 de l’Hospital Regel von, 213, 214 de l’Hospital, Guillaume François Antoine de (1661-1704), 212– 214 Definitheit positive, 270 Definition argumentweise, 103 dehnungsbeschränkt, 132, 290 dekadischer Logarithmus, 163 Determinante, 357 Dezimalbruch, 92 Dezimalbruch-Entwicklung, 93 abbrechende, 93 Dezimaldarstellung, 92, 96, 384 periodische, 384
553 Diagonalverfahren, 43 dicht, 278 Differential, 231 Differentialgleichung, 185 Differentialquotient, 178 Differentialrechnung, 167 Differenz, 4 symmetrische, 284 Differenzenquotient, 167 differenzierbar, 168, 177 n-mal, 395 partiell, 514 Differenzierbarkeit, 167 Dini Satz von, 325, 392 Dini, Ulisse (1845-1918), 325, 392 Dirichlet, Peter Gustav Lejeune (18051859), 103, 465 Dirichlet-Funktion, 103 Dirichletsches Kriterium, 465 diskret, 116, 275 Distanz, 270 Distanzfunktion innere, 297 Distributivgesetz, 2 divergent, 51, 118, 371 Divergenz bestimmte, 143, 144 Division, 5 Division mit Rest, 109 Divisionsalgorithmus, 109 Doppelhelix, 506 doppelte Nullstelle, 107 Doppeltes, 4 Drehung, 362 Dreiecksungleichung, 9, 35, 36, 230, 270, 332, 346, 378, 443 des Integrals, 221 modifizierte, 10, 271, 332 Dualität, 276, 279 Dualitätsformel, 279 Dualsystem, 98 durch, 5
554 Durchmesser, 308 Durchnummerierung, 18, 40 von N ) N, 66
E e-Funktion, 73, 335 Ebene geschlitzte, 535 punktierte, 535 echter Vorzeichenwechsel, 138 Eigenschaft Archimedische, 37 eindeutig lösbar, 104 Eindeutigkeitsproblem, 105 einelementig, 32 einfache Nullstelle, 107 eingeschränkter Grenzübergang, 124 Einheit imaginäre, 330 Einheitshyperbel, 338 Einheitskreis, 189, 201 Einheitssphäre Euklidische, 354 Einheitswurzel, 364 Einpunktkompaktifizierung, 316, 354 Eins, 3 Einschnürung, 125 Einsersummen, 18 Element größtes, 32 kleinstes, 32 elementare Funktion, 476 elementarsymmetrische Funktion, 113 elliptische Funktion, 449 endliche Menge, 18 endliche Teilüberdeckung, 301 Endpunkt, 487, 488 linker, 11 rechter, 11 uneigentlicher, 149 Entfernung, 270 Epsilontik, 53 Erfüllungsmenge, 17
Sachregister
Ergänzung quadratische, 334 erste Ableitung, 395 erste Komponentenfunktion, 310 erste Projektion, 312 erster Mittelwertsatz der Differentialrechnung, 214 Erweitern, 14 erweiterte komplexe Ebene, 347 erweiterte reelle Achse, 148 Euklid (ca. 300 v. Chr.), 64, 114 Euklidische Einheitssphäre, 354 Euklidische Metrik, 271 Euklidische Norm, 354 Euklidische Standard-Metrik, 271, 354 Euklidischer Algorithmus, 114 Euler, Leonhard (1707-1783), 73, 335 Eulersche Relation, 335 Eulersche Zahl, 73 Exaktheit, 45 Existenzproblem, 105 existieren, 32, 42, 51, 118, 143 uneigentlich, 144 Exponent, 24, 163 Exponentialfunktion, 68, 159, 163 komplexe, 334 natürliche, 72 Exponentialreihe, 401 exponentielles Wachstum, 184 Extremal-, 413 Extremum, 32, 135, 179, 413 striktes, 415
F Fahrstrahl, 497 Faktor, 3, 309 Faktorisierung, 108, 431 reelle, 361 Fakultät, 23 Fehler, 375 Fehlerabschätzung, 54 Fehlerfunktion, 259 Gaußsche, 521
555
Sachregister
Fehlerintegral Gaußsches, 520, 521 Fehlstand, 281 Fehlstandsmenge, 281 Fehlstandszahl, 281 Feinheitsmaß, 233 Fermat, Pierre de (1601-1665), 212 Fermats letzter Satz, 212 Fläche Riemannsche, 539 flache Wanne, 404 Flächeninhalt, 231, 235 Folge, 49 folgenkompakt, 299 formale Ableitung, 420 Formel binomische, 26, 334 Machinsche, 432 zur Durchnummerierung von N ) N, 66 Formeln indische, 212 von Moivre, 336 Fortsetzung analytische, 539 periodische, 192, 211 Fourier, Jean-Baptiste-Joseph (1768-1830), 403 französische Eisenbahn Metrik, 272 Fubini Satz von, 472 Fubini, Guido (1897-1943), 472 Fundamentalsatz der Algebra, 368 Funktion affine, 106 elementare, 476 elementarsymmetrische, 113 elliptische, 449 ganze, 530 gerade, 100, 536 klassische, 74 konvexe, 437
lineare, 106 partielle, 313 rationale, 448 reelle, 99 transformierende, 247 trigonometrische, 189, 199 ungerade, 100, 536 zyklometrische, 206 Funktionalgleichung, 69 Funktionenreihe, 388 Fußpunkt, 327
G g-adische Darstellung, 98 ganze Funktion, 530 ganze Zahl, 21 ganzer Anteil, 109 ganzzahlig, 111 Gauß Lemma von, 111 Gauß, Carl Friedrich (1777-1855), 31, 111, 359, 365, 367 Gauß-Klammer, 102 Gaußsche Fehlerfunktion, 521 Gaußsche Zahlenebene, 339 Gaußsches Fehlerintegral, 520, 521 gebrochener Anteil, 109 gegen, 51, 118 gehen, 51, 118 geometrische Reihe, 372 geometrische Summe, 30 geometrische Summenformel, 30, 334 geometrisches Mittel, 65, 441 gerade, 64 gerade Funktion, 100, 536 gerade Strecke, 488 geschlitzte Ebene, 535 geschlossener Weg, 498 Gesetz, 3 gespiegelte Menge, 38 Gitterpunkt, 271 gleich asymptotisch, 150
556 gleichmäßig konvergieren, 261, 321, 389 gleichmäßige Stetigkeit, 224 Gleichmäßigkeit, 318 Gleichung algebraische, 108 Glieder, 49, 371, 388 gliedweise Integration, 261 global, 400 Goursat, Eduard (1858-1936), 532 Grad, 106, 359 Gradmaß, 496 Graph, 102, 513 Grenzübergang eingeschränkter, 124 Grenze obere, 231 untere, 231 Grenzwert, 51, 116, 117, 286, 299, 371 linksseitiger, 124 rechtsseitiger, 124 Grenzwerte Vertauschbarkeit, 326 Grenzwertsatz Abelscher, 468, 470 groß-O, 151 größer, 6 größer gleich, 8 großer Umordnungssatz, 472 größte untere Schranke, 38 Größteganze, 39 Größteganze-Funktion, 102 größter gemeinsamer Teiler, 115 größtes Element, 32 Grundzahl, 98 Gruppe, 15 Abelsche, 15 kommutative, 15 symmetrische, 281
H Halbebene rechte, 392
Sachregister
Halbierungsmethode, 87 Halbierungsverfahren, 137 halboffenes Intervall, 11 Halbwinkelformeln, 200 harmonische Reihe, 373 Häufungspunkt, 116, 148, 274 Häufungswert, 88, 306 Hauptaxiom der reellen Zahlen, 13 Hauptsatz der Differential- und Integralrechnung, 237, 238, 240, 241 Hauptwert, 204, 535 Hausdorff, Felix (1868-1942), 327 Hausdorff-Metrik, 327 HDI, 238 HDI–1, 238 HDI–2, 240 HDI–3, 241 hebbare Unstetigkeit, 130 Heine, Heinrich Eduard (1821-1881), 302 Heine/Borelsche Überdeckungseigenschaft, 302 Helix, 488 Hermite, Charles (1822-1901), 412 Heron von Alexandria (ca. 130 n. Chr.), 62 Heron-Verfahren, 62 Hexadezimalsystem, 98 Hilbert, David (1862-1943), 37 hinreichend groß, 51 hinreichend nahe, 117 hoch, 3, 24 Hochzahl, 163 höhere Ableitung, 394 höhere partielle Ableitung, 515 Hölder, Otto (1859-1937), 442 Hölder-Ungleichung, 442 holomorph, 351 reell, 531 holomorphe Funktion Mittelwerteigenschaft, 536 Homogenität
Sachregister
des Integrals, 226 Homogenität des Integrals, 221 homöomorph, 292, 293 Homöomorphismus, 292 Homothetie, 363 Horner, William (1756-1837), 113 Horner-Schema, 113 Hülle abgeschlossene, 278 Hurwitz, Adolf (1859-1919), 76, 82 Hyperbelfunktion, 338 hyperbolische Spirale, 508
I Identität, 3 Identitätssatz, 105, 359 Identitätssatz für Potenzreihen, 430 imaginäre Achse, 339 imaginäre Einheit, 330 Imaginärteil, 331 in Polarkoordinaten beschrieben, 508 Index, 49 Indexmenge, 26, 49 Indexschreibweise, 40 Indextransformation, 25 indische Formeln, 212 Induktion vollständige, 17 Induktionsanfang, 17 Induktionsprinzip, 15, 23 Induktionsschluss, 17 Induktionsschritt, 17 Induktionsverankerung, 17 Induktionsvoraussetzung, 17 induktiv, 16 induziert, 293 Infimum, 38 infinitesimal, 400 Injektion kanonische, 312 injektiv lokal, 158 Injektivität, 152
557 Injektivitätslemma, 308 innere Distanzfunktion, 297 innerer Punkt, 274 Inneres, 278 Integral Additivität, 221, 226 bestimmtes, 220, 230, 253 Dreiecksungleichung, 221 Homogenität, 221, 226 Linearität, 221, 226 Monotonie, 221 nach der Bogenlänge, 534 Normierung, 221, 226 orientiertes, 247 skalares, 487 unbestimmtes, 253 uneigentliches, 268 vektorielles, 487 Integral-Restglied, 397 Integralapproximation, 231 Integralformel Cauchysche, 525 Integralformelmethode, 243 Integralkriterium, 382 Integralrechnung, 220 Integralsatz Cauchyscher, 533 Integralsinus, 259 Integrand, 231 Integration gliedweise, 261 Integration durch Substitution, 247 Intervall, 11 abgeschlossenes, 11 halboffenes, 11 offenes, 11 Intervallschachtelung, 66 Inverses, 1, 2, 15 irrationale Zahl, 21 Irrationalität von &, p 411 von 2, 64 von e, 403
558 isolierter Punkt, 116 Isometrie, 292 isometrisch, 292, 293 Iteration, 20 Iwamoto, Yosikazu, 411
J Jensen Ungleichung von, 448 Jensen, Johann Ludwig (1859-1925), 448 Jordan, Camille (1838-1922), 506 Jordanbogen, 506
K kanonische Injektion, 312 kartesische Darstellung, 336 kartesisches Produkt, 309, 318 Kehrwert, 5 Kehrwertfunktion, 169 Kern offener, 278 Klammern setzen, 376 Klasse, 395, 517 klassische Funktion, 74 Symbolik, 515 klein-o, 151 kleiner, 6 kleiner gleich, 8 kleiner Umordnungssatz, 473 kleinste obere Schranke, 12 kleinstes Element, 32 Koeffizient, 106, 416 Koeffizientenvergleich, 106, 359 Kofaktor, 107, 109 Kombination, 34 kommutative Gruppe, 15 Kommutativgesetz, 1, 2 kompakt, 302 Kompaktheit, 298 Kompaktifizierung, 306, 307
Sachregister
kompatibel, 55 komplexe Ableitung, 352 komplexe Ebene erweiterte, 347 komplexe Exponentialfunktion, 334 komplexe Partialbruchzerlegung, 454 komplexe Polardarstellung, 334 komplexe Stammfunktion, 533 komplexe Taylor-Entwicklung, 530 komplexe Zahl, 328, 331 komplexer Logarithmus, 535 komplexes Kurvenintegral, 526 Komponente, 310 Komponentenfunktion, 310 erste, 310 zweite, 310 konjugiert, 441 konjugiert komplexe, 331 konkav, 438 konstanter Anteil, 171 konstantes Glied, 106 Konstanzkriterium, 181, 188 konvergent, 51, 117, 286, 371 absolut, 378 bedingt, 475 unbedingt, 475 Konvergenz, 143 uneigentliche, 141 Konvergenzintervall, 417 Konvergenzkreis, 417 Konvergenzkreisscheibe, 417 Konvergenzkriterium, 373, 461 Konvergenzproblem, 400 Konvergenzradius, 417 konvergieren, 51, 118 gleichmäßig, 261, 321, 389 punktweise, 261, 321, 388 konvex, 438 konvexe Funktion, 437 konzentriert, 84, 302 Körper, 1 angeordneter, 6 Körper der komplexen Zahlen, 331
Sachregister
Körperaxiome, 1 Kosinus, 194 Kosinus hyperbolicus, 338 Kotangens, 199 Kotangens hyperbolicus, 338 Kreis, 487 Kreisfunktion, 203 Kreislinie, 487 Kreisteilungsgleichung, 365 Kreisweg, 496 Kriterium Abelsches, 465 Dirichletsches, 465 Kriterium von Cauchy, 82 Kriterium von Raabe, 463 Kronecker, Leopold (1823-1891), 460 Kronecker-Symbol, 460 Krümmung, 503 Krümmungsvektor, 507 Kurve, 502 Kurvenintegral komplexes, 526 Kürzen, 14
L Lagrange, Joseph-Louis (1736-1813), 399 Lagrange-Restglied, 399 Lambert, Johann Heinrich (1728-1777), 411 Landau, Edmund (1877-1938), 151 Landau-Symbolik, 151 Länge eines einbeschriebenen Polygonzugs, 492 eines Intervalls, 11 langsamer, 150 Laufbereich, 24 Laufindex, 24 Lebesgue, Henri (1875-1941), 308 Lebesgue-Eigenschaft, 308 Legendre, Adrien-Marie (1752-1833), 409
559 Legendre-Polynom, 409 Leibniz, Gottfried Wilhelm (16461716), 376, 410, 425, 519 Leibniz-Kriterium, 376 Leibniz-Regel, 410, 519 Leibniz-Reihe, 425 Leitkoeffizient, 106 Lemma, 8 Lemma von Gauß, 111 Limes, 52 Limes inferior, 88, 89, 143 Limes superior, 88, 143 Lindemann, Ferdinand von (18521939), 412 lineare Funktion, 106 linearer Anteil, 171 Linearfaktor, 107, 108, 429 Linearität des Integrals, 226 Linearität des Integrals, 221 linker Endpunkt, 11 linker Randpunkt, 11 linksseitig stetig, 128 linksseitige Ableitung, 172 linksseitiger Grenzwert, 124 Liouville Satz von, 536 Liouville, Joseph (1809-1882), 536 Lipschitz, Rudolf (1832-1903), 132 Lipschitz-Abbildung, 290 Lipschitz-Bedingung, 132, 290 Lipschitz-Konstante, 132, 290, 511 Lipschitz-stetig, 132, 290, 511 Logarithmieren, 160 logarithmische Spirale, 508 Logarithmus, 159, 163 dekadischer, 163 komplexer, 535 natürlicher, 160 Logarithmus-Reihe, 424 lokal, 400 lokal injektiv, 158
560 lokale Maximalstelle, 413 lokale Minimalstelle, 413 lokales Maximum, 413 lokales Minimum, 413 lösbar eindeutig, 104 mehrdeutig, 104 Lösung, 3, 103
M Machinsche Formel, 432 Majorante, 378, 389 Majorantenkriterium für Folgen, 54 für Funktionen, 125 für gleichmäßige Konvergenz, 263, 322 für Reihen, 378 Majorantenkriterium von Weierstraß, 389 mal, 3 mathematische Naturkonstante, 2 Matrix unendliche, 472 Maximalstelle, 135, 413 absolute, 413 lokale, 413 relative, 413 Maximum, 32, 135, 413 absolutes, 413 lokales, 413 relatives, 413 Maximumprinzip, 446 Maximumsmetrik, 309 mehrdeutig lösbar, 104 mehrfache Nullstelle, 107 Meidungsprinzip, 289 Menge endliche, 18 gespiegelte, 38 Mengenschreibweise aufzählende, 40 Mertens Satz von, 476
Sachregister
Mertens, Franz Carl Joseph (18401927), 476 Metrik, 270 chordale, 354 Euklidische, 271 Metrik der französischen Eisenbahn, 272 Metriken äquivalente, 293 metrischer Raum, 270 metrischer Unterraum, 272 Minimalmenge, 446 Minimalstelle, 135, 413 absolute, 413 lokale, 413 relative, 413 Minimum, 32, 135, 413 absolutes, 413 lokales, 413 relatives, 413 Minkowski, Hermann (1864-1909), 46 Minorantenkriterium für ungleichmäßige Konvergenz, 263 minus, 3 Mittel arithmetisches, 15, 441 geometrisches, 441 Mittelpunkt, 137, 273 Mittelwerteigenschaft holomorpher Funktionen, 536 Mittelwertsatz erster (der Differentialrechnung), 214 verallgemeinerter, 213 zweiter (der Differentialrechnung), 214 Mittelwertsatz der Differentialrechnung, 179, 180, 183 modifizierte Dreiecksungleichung, 10, 271 modulierte Sinusfunktion, 209 Moivre, Abraham de (1667-1754), 336
561
Sachregister
Moivre, Formeln von, 336 Monom, 106 monoton, 50, 100 monoton fallend, 50, 100 monoton wachsend, 50, 100 Monotonie, 152 der Addition, 6 der Multiplikation, 6 des Integrals, 221 Monotoniekriterium, 182 Multiplikation, 3 Monotonie der, 6 Multiplikationssatz der Mengenlehre, 47 Multiplizität, 107, 429
Normierung, 226 Normierung des Integrals, 221, 226 Null, 3 Nullfolge, 51 Nullpolynom, 106 Nullstelle, 104 doppelte, 107 einfache, 107 mehrfache, 107 Nullstellenmenge, 104 Nullstellenproblem, 104 nullte Ableitung, 395 Nullteilerfreiheit, 4
N
o.B.d.A, 33 obere Schranke, 11 Obersumme, 234 offen, 275 offen in, 280 offene Überdeckung, 301, 303 offener Ball, 273 offener Kern, 278 offener Streifen, 535 offenes Intervall, 11 ohne Beschränkung der Allgemeinheit, 33 operative Schreibweise, 56 Ordinatenmenge, 231 orientierter Winkel, 358 orientiertes Integral, 247 orientierungstreue Umparametrisierung, 501 Orthogonalitätsrelation, 460
n-mal differenzierbar, 395 n-mal stetig differenzierbar, 395 n-Punkt-Kompaktifizierung, 309 n-te Ableitung, 395 nach oben beschränkt, 11, 50, 99 nach unten beschränkt, 38, 50, 99 Nachfolger, 17 Naturkonstante mathematische, 2 natürliche Exponentialfunktion, 72 natürliche Zahl, 15, 16 natürlicher Logarithmus, 160 negativ, 6 Nenner, 5 Neuparametrisierung, 501 Neutralelement, 1, 2, 15 Newton, Isaac (1642-1727), 407 nichtnegativ, 9 nichtpositiv, 9 Niveaumenge, 289 Niven, Ivan, 411 Nordpol, 354 Norm Euklidische, 354 normal, 504 normiert, 106
O
P Parameter, 518 Parameterintegral, 518 Parametertransformation, 501 Parametrisierung rationale von S1 , 201 transzendente von S1 , 203
562 Partialbruch, 452 Partialbruchzerlegung, 450 komplexe, 454 partiell differenzierbar, 514 partielle Ableitung, 513, 514 partielle Funktion, 313 partielle Summation Abelsche, 464 Pascal, Blaise (1623-1662), 29 Periode, 209, 335, 384 primitive, 283 periodisch, 209 periodische Dezimaldarstellung, 384 periodische Fortsetzung, 192, 211 Periodizität, 209 Permanenzprinzip, 356 Permutation, 34, 272, 281, 473 plus, 3 Polardarstellung, 336 komplexe, 334 Polarkoordinaten, 204, 205 Polygonzug, 502 Polynom, 100, 358 positiv, 6 positive Definitheit, 270 positive Semidefinitheit, 221 Potenz, 23, 24, 159 allgemeine, 162 Potenzfunktion, 101, 163 Potenzreihe, 416 reelle, 416 Potenzreihen Identitätssatz, 430 primitive Periode, 283 Probe, 5 Produkt, 1, 103 kartesisches, 309, 318 Wallissches, 251 Produktdarstellung, 108 Produktintegration, 245, 246 Produktzeichen, 24 Projektion, 312 erste, 312
Sachregister
stereographische, 354 zweite, 312 proportional asymptotisch, 150 Proximum, 327 Puffereigenschaft, 86, 89 Punkt, 270 innerer, 274 isolierter, 116 punktal, 400 punktierte Ebene, 535 punktierte reelle Achse, 391 punktierte Sphäre, 354 punktierte Umgebung, 116, 148 Punktrechnung, 3 punktweise konvergieren, 261, 321, 388 pythagoräisches Tripel, 211 Pythagoras trigonometrischer, 196
Q Quadrat, 5 quadratische Ergänzung, 334 Quadraturformel, 234 Quadratwurzel, 62 Quadratwurzelfunktion, 63, 102 Quadrieren, 5 Quotient, 5, 30, 103, 372 Quotientenkriterium, 61, 420
R r-mal stetig partiell differenzierbar, 517 Raabe Kriterium von, 463 Raabe, Josef Ludwig (1801-1859), 463 Radikand, 63, 163 Radius, 273 Radiusvektor, 497 Ramanujan, Srinivasa (1887-1920), 432 Rand, 278
563
Sachregister
Randpunkt, 11 linker, 11 rechter, 11 uneigentlicher, 149 rationale Funktion, 101, 365, 448 rationale Parametrisierung von S1 , 201 rationale Zahl, 21 Raum metrischer, 270 Realteil, 331 Rechenregeln für Grenzwerte, 55, 121, 374 rechte Halbebene, 392 rechter Endpunkt, 11 rechter Randpunkt, 11 rechtsseitig stetig, 128 rechtsseitige Ableitung, 172 rechtsseitiger Grenzwert, 124 reduziert, 109 reell analytisch, 531 reell holomorph, 531 reelle Achse, 339 erweiterte, 148 reelle Faktorisierung, 361 reelle Funktion, 99 reelle Potenzreihe, 416 reelle Zahl, 1 reelle Zahlen Hauptaxiom, 13 reelle Zahlenfolge, 49 Regel, 3 Regel von de l’Hospital, 213, 214 Regeln der Bruchrechnung, 14 regulär, 489 Reihe, 370 alternierende, 376 alternierende harmonische, 379 binomische, 428 geometrische, 372 harmonische, 373 verdichtete, 461 Reihenaddition, 465
Reihenmultiplikation, 465 Reihenrest, 375 rein imaginär, 332 Reißverschlusssystem, 41 rektifizierbar, 493 Rekursionsschema, 20 Rekursionsschritt, 20 Relation Eulersche, 335 relativ abgeschlossen, 280 relativ offen, 280 relative Maximalstelle, 413 relative Minimalstelle, 413 relatives Maximum, 413 relatives Minimum, 413 Relativtopologie, 280 Rest, 109 Restglied, 171, 397 Integralform, 397 Restglied von Lagrange, 399 Restgliedabschätzung, 398 Reziprokes, 5 Riemann, Bernhard (1826-1866), 231, 233, 355, 384, 475, 539 Riemann-Summe, 233 Riemannsche Fläche, 539 Riemannsche Zahlenkugel, 355 Riemannsche Zetafunktion, 384 Riemannscher Umordnungssatz, 475 Ringschluss, 120 Rolle Satz von, 180 Rolle, Michel (1652-1719), 180
S Satz vom endlichen Zuwachs, 491 Satz von Abel, 476 Bolzano/Weierstraß, 84, 87 Dini, 325, 392 Fubini, 472 Goursat, 532
564 Liouville, 536 Mertens, 476 Rolle, 180 Schwarz, 516 Tychonoff, 313 Schlömilch, Oscar Xaver (1823-1901), 412 Schlömilch-Restglied, 412 schneller, 150 Schranke größte untere, 38 kleinste obere, 12 obere, 11 untere, 38 Schrankensatz, 491 Schraubenlinie, 488 Schreibweise operative, 56 Schubfachprinzip, 19 Schwankung beschränkte, 512 Schwarz Satz von, 516 Schwarz, Hermann Amandus (1843-1821), 442, 516 Seele, 297 Segment, 488 Semidefinitheit positive, 221 sich zusammenziehen, 67 Signumsfunktion, 101 sinntreue Umparametrisierung, 501 sinnumkehrende Umparametrisierung, 501 Sinus, 194 Sinus hyperbolicus, 338 Sinusfunktion modulierte, 209 Sinusoid, 207 skalares Integral, 487 Skalarprodukt, 357 Skalartypus, 512 Spalte, 472
Sachregister
Sphäre, 273 punktierte, 354 spiegelbildlich, 38 spiegelsymmetrisch, 38 Spiegelung, 38 Spiegelung an der reellen Achse, 340 Spiegelungseigenschaft, 29 Spirale Archimedische, 508 hyperbolische, 508 logarithmische, 508 Spitzenstelle, 83 Sprungstelle, 128 Spurtopologie, 280 stückweise Cr , 502 stetig, 235 Stammfunktion, 239 komplexe, 533 Standard-Abschätzung, 230 Standard-Metrik, 271 Euklidische, 271, 354 Stellenzahl, 96 stereographische Projektion, 354 Sternkurve, 509 stetig, 126, 129, 288 linksseitig, 128 rechtsseitig, 128 stetig differenzierbar, 241 n-mal, 395 stetig partiell differenzierbar r-mal, 517 stetige Verzinsung, 75 Stetigkeit, 126 gleichmäßige, 224 Stetigkeitsmodul, 232, 320, 493 streben, 51, 118 Strecke gerade, 488 Streckung, 363 Streifen, 535 offener, 535 streng konkav, 447
Sachregister
streng konvex, 447 streng monoton, 50, 100 streng monoton fallend, 50, 100 streng monoton wachsend, 50, 100 Strenge, 45 Strichrechnung, 3 striktes Extremum, 415 sublinear, 296 Subniveaumenge, 289 Substitution, 104 Substitutionsprinzip, 149 Subtraktion, 5 Summand, 3 Summe, 1, 103, 371 arithmetische, 31, 36 geometrische, 30 Summenformel arithmetische, 31 geometrische, 30, 334 Summenzeichen, 24 summierbar absolut, 472 Supremum, 12 Symbolik klassische, 515 symmetrische Differenz, 284 symmetrische Gruppe, 281
T Tangens, 192 Tangens hyperbolicus, 338 Tangensfunktion, 192 Tangenteneinheitsvektor, 489 Tangentialvektor, 488 Taxifahrer-Metrik, 271 Taylor, Brook (1685-1731), 397, 400 Taylor-Entwicklung, 394, 400 komplexe, 530 Taylor-Formel, 397 Taylor-Polynom, 397 Taylor-Reihe, 400 Teilüberdeckung endliche, 301
565 teilbar, 109 Teilbarkeit, 109 Teiler, 109 größter gemeinsamer, 115 teilerfremd, 109 Teilfolge, 82 Teilintegration, 246 Teilintervall, 225 Teilpunkte, 225 Teilsumme, 371, 464 Teleskopsumme, 32 Topologie, 276 topologisch, 292, 297 topologisch äquivalent, 293 totale Variation, 511 Transformationsformel, 245, 247 transformierende Funktion, 247 Transitivität, 6 Translation, 363 transzendent, 412 transzendente Parametrisierung von S1 , 203 Trapezregel, 237 Trauung von Kosinus und Sinus, 334 Treppenfunktion, 225 Trichotomie, 6 trigonometrische Funktion, 189, 199 trigonometrischer Pythagoras, 196 Tripel ägyptisches, 211 pythagoräisches, 211 Tschebyscheff, Pafnuti Lwowitsch (1821-1894), 211 Tschebyscheff-Polynom, 211 Tupel, 313 Tychonoff Satz von, 313 Tychonoff, Andrei Nikolayevich (19061993), 313
566
U über, 26 überabzählbar, 40 Überdeckung offene, 301, 303 Überdeckungseigenschaft Heine/Borelsche, 302 übereinstimmen, 396 Umentwicklung, 107, 538 Umgebung, 116, 148, 274 punktierte, 116, 148 Umordnung, 473 Umordnungssatz großer, 472 kleiner, 473 Riemannscher, 475 Umparametrisierung, 501 orientierungstreue, 501 orientierungsumkehrende, 501 sinntreue, 501 sinnumkehrende, 501 unbedingt konvergent, 475 unbestimmter Ausdruck, 217 unbestimmtes Integral, 253 uneigentlich existieren, 144 uneigentliche Konvergenz, 141 uneigentlicher Endpunkt, 149 uneigentlicher Randpunkt, 149 uneigentliches Integral, 268 unendlich, 22 Unendlich, 42 unendliche Matrix, 472 ungerade, 64 ungerade Funktion, 100, 536 Ungleichung, 9 Bernoullische, 26 Youngsche, 252 Ungleichung vom arithmetischen und geometrischen Mittel, 65, 441 Ungleichung von Jensen, 448 unorientierter Winkel, 358 Unstetigkeit hebbare, 130
Sachregister
untere Grenze, 231 untere Schranke, 38 Unterraum metrischer, 272 Untersumme, 234
V Variation beschränkte, 511 totale, 511 vektorielles Integral, 487 verallgemeinerter Binomialkoeffizient, 426 verallgemeinerter Mittelwertsatz, 213 verdichtete Reihe, 461 Verdopplungsformel des Arkustangens, 190 des Kosinus, 200 des Sinus, 200 Vermehrungsgeschwindigkeit, 184 Vermehrungsrate, 184 verschwinden, 3 Verstellungsmaß, 272 Vertauschbarkeit von Grenzwerten, 326 Vervollständigung, 306 Verzinsung stetige, 75 Vielfachheit, 107, 429 Vieta Wurzelsatz von, 113 Vieta (=Viète), François (1540-1603), 113 vollständig bei angeordneten Körpern, 13 bei metrischen Räumen, 302 vollständige Induktion, 17 Vollständigkeit, 11, 37, 298 Vorausabschätzung, 52 Vorperiode, 384 Vorzeichenregeln, 6 Vorzeichenwechsel, 138 echter, 138
Sachregister
W Wachstum exponentielles, 184 Wachstumsgesetz, 184 Wallis, John (1616-1703), 251 Wallissches Produkt, 251 Weg, 487 geschlossener, 498 zugehöriger, 495 Wegtypus, 486 Weierstraß Approximationssatz von, 107 Weierstraß, Karl (1815-1897), 84, 87, 107, 389 Wendepunkt, 445 Wert, 371 Widerspruchsbeweis, 7 Winkel, 358 orientierter, 358 unorientierter, 358 Winkelargument, 204 Winkelfunktion, 199 Winkelhalbierende, 161 Wohlordnungssatz in N, 19 Wortverstellung, 272 Wurzel, 61, 63, 162 Wurzelkriterium, 420, 432 Wurzelsatz von Vieta, 113 Wurzeltrick, 64
Y Young, William Henry (1863-1942), 252 Youngsche Ungleichung, 252
Z Zahl
Eulersche, 73 ganze, 21 irrationale, 21 komplexe, 328 natürliche, 15, 16 rationale, 21
567 reelle, 1 Zahlenfolge reelle, 49 Zahlenkugel Riemannsche, 355 Zähler, 5 Zahlgerade, 45 Zahlmengen, 1 Zeile, 472 Zentrum, 107, 273, 397, 400, 416 zerfallen, 359 zerfallend, 108 Zerlegung, 225 äquidistante, 235 Zerlegungsregel, 221, 226 Zerlegungssumme, 233 Zetafunktion Riemannsche, 384 Ziffer, 92 Zinseszins, 74 zugehöriger Weg, 495 Zuwachs, 408 Zwei, 4 zweielementig, 33 Zweipunktkompaktifizierung, 307 zweite Ableitung, 394 zweite Komponentenfunktion, 310 zweite Projektion, 312 zweiter Mittelwertsatz der Differentialrechnung, 214 Zwiebeldarstellung, 277 zwischen, 6 Zwischenbehauptung, 7 Zwischenbeweis, 7 Zwischenstelle, 399 Zwischenwertsatz, 135 Zwischenwertsatz von Darboux, 186, 522 zyklometrische Funktion, 206